Está en la página 1de 244

Woodcock-Johnson® III

Manual técnico
Kevin S. McGrew Richard W. Woodcock

Traducción
Leandro Wolfson

Corrección de textos
Ana F. Muñoz-Sandoval Alicia Marshall
Copyright © 2005 by The Riverside Publishing Company. All rights reserved. No part of this work may be reproduced
or transmitted in any form or by any means, electronic or mechanical, including photocopying and recording or by any
information storage or retrieval system without the prior written permission of The Riverside Publishing Company
unless such copying is expressly permitted by federal copyright law. Address inquiries to Permissions Department,
The Riverside Publishing Company, 425 Spring Lake Drive, Itasca, IL 60143-2079.

Printed in the United States of America.

Copyright © 2005 por The Riverside Publishing Company. Todos los derechos reservados. Ninguna parte de esta
publicación ni de los materiales que la acompañan puede ser copiada o reproducida ni tampoco depositada en ningún
sistema de procesamiento de información; tampoco puede ser transmitida por medio de radiodifusión o ningún otro
circuito cerrado, en ninguna forma o ningún método, mecánico, electrónico u óptico, al menos que haya sido
autorizado por escrito por el editor. Dichos permisos pueden ser dirigidos a Permissions Department, The Riverside
Publishing Company, 425 Spring Lake Drive, Itasca, IL 60143-2079, EE.UU.

Impreso en los Estados Unidos de Norte América.

Compuscore, WJ III, el logo de WJ III, WJ-R y Woodcock-Johnson son marcas registradas de Houghton Mifflin
Company. Woodcock-Muñoz es una marca de Houghton Mifflin Company. Todas las otras marcas registradas son
propiedad intelectual de sus autores.

El fragmento en la página 10 fue traducido por John B. Carroll, Human Cognitive Abilities: A survey of factor-analytic
studies, pág. 62. Copyright © Cambridge University Press, 1993. Impreso con permiso.

Para notas bibliográficas o para citar las baterías:


ƒ Para citar la Batería III en forma completa, utilice:
Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005). Batería III Woodcock-Muñoz.
Itasca, IL: Riverside Publishing.
ƒ Para citar las Pruebas de aprovechamiento, utilice:
Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005). Batería III Woodcock-Muñoz:
Pruebas de aprovechamiento. Itasca, IL: Riverside Publishing.
ƒ Para citar las Pruebas habilidades cognitivas, utilice:
Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005). Batería III Woodcock-Muñoz:
Pruebas de habilidades cognitivas. Itasca, IL: Riverside Publishing.
ƒ Para citar este manual en español, utilice:
McGrew, K. S. y Woodcock, R. W. (2005). Manual técnico (L. Wolfson, Trans.). Woodcock-Johnson III. Itasca, IL:
Riverside Publishing. (La edición original fue publicada en 2001)
ƒ Para citar el software del programa de calificación, utilice:
Schrank, F. A. y Woodcock, R. W. (2005). Batería III Compuscore and Profiles Program (Version 1.0) [Computer
software]. Batería III Woodcock-Muñoz. Itasca, IL: Riverside Publishing.

Estas pruebas no pueden ser usadas en ningún programa que opere bajo estatutos o reglamentos que requieren la
revelación al público, incluidos los padres del examinando, del contenido y/o de las respuestas correctas de algún ítem
específico de una prueba o subprueba. Cualquiera de estos usos está prohibido por la ley de propiedad intelectual.

Para información técnica, llame en los Estados Unidos al teléfono 800.323.9540 o consulte nuestro sitio web en
www.woodcock-munoz.com
Sobre la traducción de los manuales
Durante el desarrollo de la Batería-R publicada en 1996, se dio por sentado que la mayoría de los usuarios eran
profesionales bilingües de los Estados Unidos. Por esta razón, los Manuales del examinador (para las baterías
cognitivas y de aprovechamiento) y el Manual técnico se publicaron en idioma inglés solamente. Desde entonces,
numerosos usuarios de países hispanohablantes han expresado gran interés en obtener estos materiales en español.
En vista de ello, la Batería III se presenta ahora acompañada de los manuales en dicha lengua.

No obstante lo anterior, los examinadores que prefieran consultar los manuales en inglés de la batería
Woodcock-Johnson® III (WJ III®) sólo necesitan contactar directamente con la compañía editora para obtenerlos.

Se advierte a los usuarios de los manuales en español que éstos son una mera traducción de los manuales
originales en inglés, con las adaptaciones necesarias, y que, por lo tanto, ofrecen muy pocas variantes, puesto que
en todo momento se ha tratado de respetar el trabajo de los autores. El lector podrá advertir algunas pequeñas
modificaciones o referencias a ítemes o figuras específicas que facilitan su comprensión y aplicación a la versión en
español de las pruebas. Por el mismo motivo, la mayoría de las referencias a la batería WJ III en los manuales en
inglés aparecen ahora en esta versión en español como la WJ III y la Batería III.

Teniendo en consideración el amplio uso de los manuales entre una mayoría de profesionales de Estados
Unidos, los acrónimos y siglas se han mantenido en inglés (con la debida aclaración “por sus siglas en inglés” al
ser mencionados, al menos por primera vez). Asimismo, acompañan a los manuales un listado de dichas siglas y
acrónimos en inglés y español. Por los mismos motivos, se ha optado por utilizar, como en inglés, la coma para los
miles y el punto para los decimales, según el uso en México, Puerto Rico y República Dominicana, entre otros
países hispanohablantes. También se incluye con las baterías el folleto Assessment Service Bulletin (ASB, por sus
siglas en inglés) (Schrank et al., 2005) [Folleto de servicio para el evaluador], en el que se detallan los estudios que
atañen directamente al desarrollo y búsqueda de datos de la Batería III Woodcock-Muñoz™ (Muñoz-Sandoval,
Woodcock, McGrew y Mather, 2005a).

Se espera que las modificaciones introducidas contribuyan a facilitar una mayor comprensión entre los
usuarios de la Batería III no sólo de los Estados Unidos sino también de los países hispanohablantes. Deseamos
recalcar una vez más que la versión en español de los manuales es una mera traducción con adaptaciones de los
manuales originales en inglés. Debemos aclarar que, en vista de ello, fue necesario tomarse ciertas licencias y
libertades al realizarse la corrección de los textos de la traducción, en beneficio, en última instancia, de quienes
utilizarán estos materiales y las pruebas en español.

iii
About the Translation of the Manuals
When the Batería-R was developed for publication in 1996, the Examiner’s Manuals (Cognitive and Achievement)
and the Technical Manual were published in English because it was believed that users would be bilingual
professionals from the United States. Since that time, users from Spanish-speaking countries have expressed an
interest in having these materials in Spanish. For this reason, the Batería III manuals are now published in Spanish.
Users who would prefer the English manuals of the Woodcock-Johnson III (WJ III) may obtain them directly from
the publisher.

The primary goal for the Spanish manuals was to translate the English authors’ original work. Minor
modifications and references to specific items or figures were added to help the user understand the link to the
Spanish version of the tests. Both English and Spanish batteries are referenced in this manual; therefore, “la WJ III
y la Batería III” appears after most references.

Taking into account the wide range of manual users among U.S. professionals, the acronyms were kept in
English (with the notation “por sus siglas en inglés [according to the English acronyms]” when each first appears in
the text). For those users who see the acronym outside the manuals, a list of the acronyms in English and Spanish
appears in Appendix G of this Technical Manual. The English numbering system was kept (using commas in
numbers of 1,000 or more and periods for decimal fractions) to follow the numbering style of several Spanish-
speaking countries including Mexico, Puerto Rico, and the Dominican Republic. Included with the batteries is the
Overview and Technical Supplement in the form of an Assessment Service Bulletin (ASB) (Schrank et al., 2005).
This publication presents the research that directly corresponds to the development and standardization of the
Batería III Woodcock-Muñoz (Muñoz-Sandoval et al., 2005a).

We hope that this translation/adaptation will contribute to the understanding of the Batería III, not only in
the United States but also in Spanish-speaking countries. We would like to emphasize that the Spanish manuals are
a translation of the English manuals and that minor adaptations were made only when absolutely necessary for the
benefit of those who will be using the Batería III in the Spanish language.

iv
Sobre los autores de la WJ III y la Batería III
Ana Muñoz-Sandoval
La Dra. Ana F. Muñoz-Sandoval es directora adjunta de Measurement/Learning/Consultants,
LLC. Desde 1987, ha estado a cargo de la adaptación al español de diversas pruebas, incluidos el
Woodcock-Muñoz Language Survey–Revised, el Woodcock Language Proficiency Battery–Revised
(Spanish Form), la Batería Woodcock-Muñoz: Pruebas de habilidad cognitiva-Revisada y la Batería
Woodcock-Muñoz: Pruebas de aprovechamiento-Revisada. La Dra. Muñoz-Sandoval se cuenta entre
los autores de la Bilingual Verbal Ability Tests. Asimismo, ha sido invitada a presentar numerosos
talleres sobre evaluación en la Argentina, el Brasil, Costa Rica y México.

Se educó y recibió la habilitación para ejercer la docencia en la ciudad de Mendoza, Argentina,


donde residió hasta antes de radicarse en los Estados Unidos en 1970. También ha pasado parte de
su vida en el extranjero, entre otros países, en Italia, India, Nepal, Paquistán y Sudáfrica. La Dra.
Muñoz-Sandoval estudió alemán en 1979 y 1980 en la Tribhuvan University en Katmandú, Nepal,
y en el Instituto Goethe-de Poona, India. En 1982 obtuvo una licenciatura en Antropología y en
1984, una maestría en Administración de Personal de Servicios Estudiantiles, otorgada por la State
University College at Buffalo en Nueva York. En 1992 se doctoró en Educación Intercultural e
Internacional en la University of Southern California. Desde 1982 a 1984, la Dra. Muñoz-Sandoval
desarrolló e implementó un manual de idioma español con cintas magnetofónicas para las
estudiantes hispanohablantes del sexo femenino que solicitaban servicios médicos de la clínica para
estudiantes de Buffalo. Posteriormente, prestó servicios como trabajadora social bilingüe en el
Centro Comunitario Puertorriqueño/Chicano de Buffalo, Nueva York. Desde 1986 hasta 1988, la
Dra. Muñoz-Sandoval dictó cátedra de español en la University of Arizona y en la University of
Southern California, desde 1989 hasta 1991.

Richard W. Woodcock
Richard W. Woodcock tiene amplios antecedentes en los campos de la educación y la psicología.
Ha desempeñado una variedad de actividades profesionales, como maestro de escuela primaria,
psicólogo educativo, director de educación especial y profesor universitario. Entre 1957 y 1961,
el Dr. Woodcock fue profesor auxiliar de Psicología y director de la Reading Clinic en la Western
Oregon University. Entre 1961 y 1963 fue profesor adjunto de Educación Especial en la
University of Northern Colorado. Entre 1963 y 1968 actuó en el George Peabody College de la
Vanderbilt University en calidad de profesor investigador de Educación Especial, científico
principal y director interino del Instituto de Retardo Mental y Desarrollo Intelectual. Una de sus
responsabilidades en este cargo fue dirigir, de 1965 a 1968, el Proyecto Reading llevado a cabo en
Peabody, Chicago y Detroit. A continuación de ello se desempeñó, entre 1968 y 1972, como jefe
de redacción y director de investigaciones del Servicio Norteamericano de Orientación. A partir de
1972 fue director de Measurement/Learning/Consultants, LLC, entidad dedicada a la investigación
y desarrollo de pruebas, de la que es fundador. De 1985 a 1988, el Dr. Woodcock fue profesor
visitante en la División de Educación Especial y Rehabilitación de la University of Arizona, y de
1988 a 1991 cumplió la misma función en el Departamento de Psicología de la University of
Southern California. Entre 1993 y 1998 fue profesor investigador de Psicología en la University
of Virginia.

v
El Dr. Woodcock recibió su primer título universitario en Psicología, su licenciatura en
Educación Especial y su doctorado en Psicoeducación y Estadística en la University of Oregon. Es
integrante del claustro de posgrado del doctorado de Neuropsicología en la Facultad de Medicina
de la Tufts University.

Entre sus publicaciones cabe mencionar las siguientes: Colorado Braille Battery; Peabody
Rebus Reading Program; Goldman-Fristoe-Woodcock Auditory Skills Test Battery; Woodcock
Reading Mastery Tests–Revised; Woodcock-Johnson Psycho-Educational Battery–Revised;
Batería Woodcock-Muñoz: Pruebas de habilidad cognitiva-Revisada; Batería Woodcock-Muñoz:
Pruebas de aprovechamiento-Revisada; Woodcock Language Proficiency Battery–Revised, en
inglés y en español; Scales of Independent Behavior–Revised; Woodcock-Muñoz Language
Survey, en inglés y en español; y Woodcock-McGrew-Werder Mini-Battery of Achievement.

Kevin S. McGrew
Kevin S. McGrew es director del Instituto de Psicometría Aplicada (Institute for Applied
Psychometrics, IAP), LLC, organización de investigaciones fundada en 1998. Obtuvo el doctorado
de Psicología Educativa (Educación Especial) en la University of Minnesota. Entre 1989 y 2000
fue profesor del Departamento de Psicología Aplicada en la St. Cloud State University, St. Cloud,
Minnesota. Durante ese mismo período actuó como investigador principal en colaboración con el
Instituto de Integración Comunitaria. Durante tres años fue investigador principal y miembro del
equipo directivo del Centro Nacional de Resultados Educativos (National Center on Educational
Outcomes, NCEO) de la University of Minnesota. También se desempeñó como asesor en
mediciones para el Instituto de Investigaciones Stanford, trabajando en el diseño de dos grandes
estudios de investigación patrocinados por el gobierno nacional de Estados Unidos: el Estudio
Longitudinal Elemental de Educación Especial y el Estudio Longitudinal Nacional de la
Transición-2. Durante diez años desarrolló su actividad profesional de psicólogo educativo en
Iowa y Minnesota.

El Dr. McGrew ha dirigido investigaciones y publicado numerosos artículos en los campos


de la inteligencia, la evaluación psicoeducativa, la competencia personal, el comportamiento
adaptativo, la adaptación de individuos discapacitados a la comunidad, la evaluación centrada en
la familia y el uso de indicadores educativos en las investigaciones normativas para la educación
especial. Ha publicado tres libros sobre la interpretación de las baterías de pruebas de inteligencia:
Clinical Interpretation of the Woodcock-Johnson Tests of Cognitive Ability–Revised, The
Intelligence Test Desk Reference: Gf-Gc Cross-Battery Assessment y The Wechsler Intelligence
Scales and Gf-Gc Theory: A Contemporary Approach to Interpretation. Además, es coautor
de WJ-R® Technical Manual, de Subtest Norms for the WJ/SIB Assessment System, de
Woodcock-McGrew-Werder Mini-Battery of Achievement y de Sharpe-McNear-McGrew Braille
Assessment Inventory.

Nancy Mather
Nancy Mather es profesora adjunta en el Departamento de Educación Especial, Rehabilitación y
Psicología Educativa de la University of Arizona. Obtuvo la licenciatura sobre trastornos de la
conducta y el doctorado en discapacidades del aprendizaje en la University of Arizona. En esa
misma universidad completó sus estudios de posgrado bajo la tutoría del Dr. Samuel Kirk. La Dra.
Mather colaboró con el Dr. Richard Woodcock en diversos aspectos del desarrollo de las pruebas
para la Woodcock-Johnson Psycho-Educational Battery–Revised y ha sido coautora del Manual
del examinador de WJ-R Tests of Achievement y de WJ-R Tests of Cognitive Ability. Ha
desempeñado funciones como docente en discapacidades del aprendizaje, especialista en
diagnóstico, profesora universitaria y asesora educativa.

vi
La Dra. Mather ha realizado investigaciones en el campo del desarrollo de la lectura y la
escritura, ha publicado numerosos artículos y lleva a cabo seminarios sobre evaluación e
instrucción en diversos lugares de Estados Unidos. Escribió dos libros sobre la interpretación y
aplicación de las baterías WJ-R: Instructional Guide to the Woodcock-Johnson Psycho-Educational
Battery–Revised y Woodcock-Johnson Psycho-Educational Battery–Revised: Recommendations
and Reports. Es también coautora de Mather-Woodcock Group Writing Tests y de otros dos libros:
Informal Assessment and Instruction in Written Language: A Practitioner’s Guide for Students
With Learning Disabilities y Overcoming Underachieving: An Action Guide to Helping Your Child
Succeed in School.

vii
Reconocimientos
El desarrollo y la estandarización de las baterías Woodcock-Johnson III se lograron gracias al esfuerzo de numerosas
personas. Son más de doscientas cincuenta las que efectuaron aportes sustanciales en diversos aspectos y sería
imposible prestar el debido reconocimiento a todas ellas. Confiamos en que todas estas personas sabrán discernir cuál
fue su respectiva contribución y se sentirán orgullosas por el resultado obtenido. Hubo, sin embargo, unas pocas
personas cuya contribución ha sido tan importante que ni siquiera una mención especial parece adecuada como
expresión de las repercusiones que tuvo su labor en las WJ III.

Los consejos y aportes del Dr. John Horn (University of Southern California) y del Dr. John Carroll
(University of North Carolina) permitieron establecer los fundamentos teóricos de las WJ III. Los estudios que ellos
realizaron a lo largo de toda su vida sobre la estructura del intelecto humano gravitaron en el contenido y estructura de
estas amplias baterías diagnósticas. Consecuentemente, en las décadas venideras serán miles los especialistas en
evaluación que habrán de recibir la influencia de su pensamiento y sus investigaciones.

El Dr. Fredrick Schrank fue responsable de la supervisión del proyecto durante los cinco años que duró su
desarrollo. Además de brindar su apoyo a los autores y al resto de los participantes en el proyecto, fue el principal
responsable de la creación de la prueba de Planeamiento y de la “Lista de observaciones durante la prueba”. Es autor,
asimismo, de muchas partes del Manual técnico y del Manual del examinador de la WJ III COG.

La Dra. Laurie Ford (University of South Carolina) dedicó dos años enteros al proyecto, principalmente en la
supervisión y coordinación de los múltiples estudios de validez. Además, la Dra. Ford participó en diversas etapas del
desarrollo de las pruebas y colaboró en la elaboración de los Manuales del examinador. Ella brindó su asesoramiento a
investigadores de estudios de validez entre los cuales se encuentran algunos de los profesionales más respetados de la
psicología y la educación especial: Dr. John Kranzler (University of Florida); Dra. Dawn Flanagan (St. John’s
University); Dr. Timothy Keith y Dr. Mark Fugate (Alfred University); Dra. LeAdelle Phelps (University at
Buffalo–State University of New York); Dra. Mary E. Tusing (University of Wisconsin–Stout); Dra. Deborah Rhein y
Dr. Nalan Babur (University of Arizona); Dra. Candace Bos (University of Texas–Austin); Dra. Janet Lerner y Dr.
David Yasutake (Northeastern Illinois University); Sue Norton (Palomar College); Dr. Steve McCallum y Scott
Hooper (University of Tennessee); Dr. David McIntosh (Ball State University); Dr. Mardis Dunham (Murray State
University); Dra. Noel Gregg y Dra. Cheri Hoy (University of Georgia); Dr. Jeffrey Braden (University of
Wisconsin–Madison); Dr. Alexis Grosofsky (Beloit College); James Hiramoto (University of California–Berkeley);
Dra. Barbara Vesley (St. Cloud State University); Dra. Terri Teague, Susan League, Wendy Waithe Simmons y
Kathryn North (University of South Carolina); Dra. Nancy Jackson (University of Iowa); Dra. Susan Wilczynski
(University of Southern Mississippi) y Dra. Lisa Bischoff (Indiana State University).

Mary Ruef (Measurement/Learning/Consultants, LLC) coordinó la capacitación y práctica posterior de la


administración de las pruebas para más de doscientos asistentes de investigación en todo Estados Unidos y Canadá;
también tuvo a su cargo el procesamiento de los protocolos de las pruebas como fase previa al ingreso y procesamiento
de los datos, y participó en numerosos aspectos del desarrollo de los ítemes y las pruebas, así como en la preparación
de los materiales para llevar a cabo éstas. Entre los principales supervisores de investigación que trabajaron bajo su
dirección debe mencionarse a la Dra. Criselda Alvarado, Jessica Sund, Melanie Bartels Graw, Debra Margolias,
Alexandra Phillips, Krista Smart, el Dr. Joseph Racklin y Ryan Kinstedt.

La calidad técnica de los datos y de los análisis de datos de las baterías WJ III ha estado garantizada gracias a
la colaboración del Dr. Jack McArdle (University of Virginia), el Dr. Mark Davidson (University of Minnesota) y el
Dr. Timothy Keith (Alfred University). La adaptación de los datos a las normas no habría sido posible sin la ayuda de
Jeff Evans y de David Dailey.

Varios profesionales han colaborado en la preparación de los Manuales del examinador. Además de los ya
mencionados, la Dra. Lynne Jaffe y la Dra. Jan Smith (Arizona School for the Deaf and the Blind) [Escuela de Arizona
para sordos y no videntes] contribuyeron a las secciones del manual que se ocupan de las adaptaciones que deben

ix
realizarse cuando se administran las pruebas a alumnos que padecen determinadas discapacidades. Barbara Wendling
brindó una ayuda inestimable en el desarrollo del material para la capacitación y la preparación de los dos Manuales
del examinador, además de contribuir a aclarar las instrucciones para el examinador en algunas de las pruebas.

Debemos expresar nuestra especial gratitud a todos los distritos escolares, escuelas, universidades y otras sedes
que participaron en el desarrollo de los ítemes y en las fases de normalización del proyecto. Por último, no queremos
dejar de manifestar nuestro aprecio más sincero a las más de nueve mil personas que se ofrecieron como sujetos para
los estudios de estandarización y validez, dedicando a este proyecto su valioso tiempo.

RWW
KSM
NM

x
Índice
Sobre la traducción de los manuales ___________________________________ iii
About the Translation of the Manuals___________________________________ iv
Sobre los autores de la WJ III y la Batería III v
Reconocimientos ix

Capítulo 1: Panorama general de la WJ III y la Batería III 1


Abarcatividad de la WJ III y la Batería III 1
Utilidad diagnóstica de la WJ III y la Batería III 2

Capítulo 2: Desarrollo, estandarización y normalización 8


Criterios de diseño 9
Fundamentos teóricos y de investigación 10
Calidad técnica 12
Amplia aplicabilidad 14
Reducción del tiempo de administración de las pruebas 15
Facilidad de administración 15
Estandarización 16
Características generales de la muestra normativa 16
Procedimiento de normalización 20
Muestreo en tres etapas 22
Elaboración de las normas 25
Estadísticos descriptivos de las pruebas y compuestos 25
Ponderación de los sujetos 25
Cálculo de las puntuaciones de los compuestos con
ponderaciones diferenciadas _________________________________ 26
Puntuaciones de la Habilidad intelectual general 26
Puntuaciones del Aprovechamiento predicho 26
Cálculo de las puntuaciones equivalentes al grado y la edad 27
Cálculo de las normas sobre percentiles y puntuación estándar 27
Normas de discrepancia de la WJ III 29
Cálculo de las normas de discrepancia habilidad/
aprovechamiento 29
Cálculo de las normas de discrepancia intra-cognitiva,
intra-aprovechamiento e intra-individual 30
Ventajas de las normas de discrepancia de la WJ III 30

Capítulo 3: Confiabilidad 32
Error de medición y confiabilidad 32
Error de medición 33
Coeficientes de confiabilidad 34
Confiabilidad de las pruebas 35

xi
Confiabilidad de los compuestos 36
Confiabilidad test-retest: pruebas de tiempo 37
Confiabilidad test-retest: intervalos de retest ampliados 37
Estudios de confiabilidad entre calificadores 40
Equivalencia de las formas alternativas de una prueba 45
Resumen del capítulo 47

Capítulo 4: Validez 48
Evidencia basada en el contenido de la prueba 49
Evidencia basada en las pautas de desarrollo 50
Evidencia de desarrollo de siete compuestos de factores cognitivos 55
Evidencia de desarrollo de nueve compuestos de aprovechamiento 56
Evidencia de desarrollo de las habilidades estrechas 58
Evidencia basada en la estructura interna 60
Métodos de la estructura interna y especificación de los modelos 62
Evidencia de estructura interna del modelo CHC de factores amplios 65
Evidencia de estructura interna del modelo CHC de factores
amplios/estrechos 66
Evidencia de intercorrelaciones en los compuestos 68
Evidencia basada en las relaciones con otras variables 68
Muestras de estudios especiales 68
Corolarios de las muestras de estudios especiales 82
Evidencia sobre la imparcialidad de las pruebas 99
Análisis en el nivel del ítem: análisis del funcionamiento diferencial
del ítem (DIF) 99
Análisis en el nivel de las pruebas: invariancia de la estructura de los
factores en los distintos grupos 103
Resumen del capítulo 103

Referencias bibliográficas 107

Apéndice A: Estadísticos descriptivos y de confiabilidad de las pruebas 111


Cuadro A-1. Estadísticos descriptivos y de confiabilidad de las
pruebas – Pruebas de habilidades cognitivas de la WJ III 111
Cuadro A-2. Estadísticos descriptivos y de confiabilidad de las
pruebas – Pruebas de aprovechamiento de la WJ III 120

Apéndice B: Estadísticos descriptivos y de confiabilidad de los compuestos 133


Cuadro B-1. Estadísticos descriptivos y de confiabilidad de los
compuestos – Pruebas de habilidades cognitivas de la WJ III 133
Cuadro B-2. Estadísticos descriptivos y de confiabilidad de los
compuestos – Pruebas de aprovechamiento de la WJ III 145

xii
Apéndice C: Ponderaciones de la Habilidad intelectual general (GIA) 155
Cuadro C. Habilidad intelectual general (GIA) Ponderaciones
promedio (suavizadas) de g por grupo etario técnico 155

Apéndice D: Intercorrelaciones entre las puntuaciones de las pruebas 157


Cuadro D-1. Intercorrelaciones entre las puntuaciones de las
pruebas – 2-3 años de edad 157
Cuadro D-2. Intercorrelaciones entre las puntuaciones de las
pruebas – 4-5 años de edad 158
Cuadro D-3. Intercorrelaciones entre las puntuaciones de las
pruebas – 6-8 años de edad 160
Cuadro D-4. Intercorrelaciones entre las puntuaciones de las
pruebas – 9-13 años de edad 163
Cuadro D-5. Intercorrelaciones entre las puntuaciones de las
pruebas – 14-19 años de edad 166
Cuadro D-6. Intercorrelaciones entre las puntuaciones de las
pruebas – 20-39 años de edad 169
Cuadro D-7. Intercorrelaciones entre las puntuaciones de las
pruebas – 40 o más años de edad 172

Apéndice E: Intercorrelaciones entre las puntuaciones de los compuestos 175


Cuadro E-1. Intercorrelaciones entre las puntuaciones de los
compuestos – 2-3 años de edad 175
Cuadro E-2. Intercorrelaciones entre las puntuaciones de los
compuestos – 4-5 años de edad 176
Cuadro E-3. Intercorrelaciones entre las puntuaciones de los
compuestos – 6-8 años de edad 177
Cuadro E-4. Intercorrelaciones entre las puntuaciones de los
compuestos – 9-13 años de edad 180
Cuadro E-5. Intercorrelaciones entre las puntuaciones de los
compuestos – 14-19 años de edad 183
Cuadro E-6. Intercorrelaciones entre las puntuaciones de los
compuestos – 20-39 años de edad 186
Cuadro E-7. Intercorrelaciones entre las puntuaciones de los
compuestos – 40 o más años de edad 189

Apéndice F: Resultados de los análisis factoriales confirmatorios (CFA) 193


Cuadro F-1. Modelo CFA de factores amplios – 6 años hasta la edad adulta 193
Cuadro F-2. Modelo CFA de factores amplios/estrechos, para todas las edades 195
Cuadro F-3. Comparación del ajuste del modelo de factores amplios CHC
de la WJ III con otros modelos en la muestra normativa de 6 años hasta
la edad adulta 199
Cuadro F-4. Modelo CFA de factores amplios – 6-8 años de edad 200
Cuadro F-5. Modelo CFA de factores amplios – 9-13 años de edad 202
Cuadro F-6. Modelo CFA de factores amplios – 14-19 años de edad 204
Cuadro F-7. Modelo CFA de factores amplios – 20-39 años de edad 206

xiii
Cuadro F-8. Modelo CFA de factores amplios – 40 o más años de edad 208
Cuadro F-9. Comparación del ajuste del modelo CHC de factores amplios
de la WJ III con otros dos modelos de ajuste óptimo en cinco muestras
normativas de la WJ III basadas en la edad 210

Apéndice G: Glosario de términos: español/inglés e inglés/español 211

xiv
Cuadros
Cuadro 1-1. Definiciones de los términos fundamentales empleados en el Capítulo 1 2
Cuadro 1-2. Organización de las pruebas de la WJ III y la Batería III 3
Cuadro 1-3. Capacidades de interpretación de las Pruebas de habilidades cognitivas
y Pruebas de aprovechamiento 4
Cuadro 1-4. Capacidades de interpretación ampliadas mediante el uso conjunto de
Pruebas de habilidades cognitivas y Pruebas de aprovechamiento 4
Cuadro 1-5. Procedimientos para el cálculo de la discrepancia con las WJ III
(lo mismo aplica a su versión en español) ________________________ 5
Cuadro 1-6. Compuestos agrupados de acuerdo con cuatro opciones de discrepancia
intra-individual 6
Cuadro 1-7. Compuestos agrupados de acuerdo con dos opciones de discrepancia
intra-cognitiva 7
Cuadro 1-8. Compuestos agrupados de acuerdo con dos opciones de discrepancia
intra-aprovechamiento 7
Cuadro 1-9. Medidas que pueden utilizarse como criterio en los tres procedimientos
de discrepancia habilidad/aprovechamiento 7
Cuadro 2-1. Definiciones de los términos fundamentales empleados en el Capítulo 2 8
Cuadro 2-2. Habilidades amplias y estrechas medidas por la WJ III COG y la
WJ III ACH 12
Cuadro 2-3. Distribución de la muestra normativa por edad y grado 17
Cuadro 2-4. Distribución de las variables de muestreo de la población de Estados
Unidos y en la muestra normativa de la WJ III – Preescolares ________ 18
Cuadro 2-5. Distribución de las variables de muestreo de la población de Estados
Unidos y en la muestra normativa de la WJ III – Grados K a 12o 19
Cuadro 2-6. Distribución de las variables de muestreo de la población de Estados
Unidos y en la muestra normativa de la WJ III – Estudiantes
universitarios en programas de 2-4 años 20
Cuadro 2-7. Distribución de las variables de muestreo de la población de Estados
Unidos y en la muestra normativa de la WJ III – Adultos 21
Cuadro 2-8. Clasificación de los estados por región y subdivisión según la Oficina
del Censo de Estados Unidos 23
Cuadro 3-1. Definiciones de los términos fundamentales empleados en el Capítulo 3 32
Cuadro 3-2. Datos de confiabilidad seleccionados de la Prueba 4: Integración
de sonidos de la WJ III COG 35
Cuadro 3-3. Bandas de confianza de ±1 SEM para valores selecionados de la
confiabilidad y del tamaño de la muestra 36
Cuadro 3-4. Estadísticos descriptivos y confiabilidades test-retest para las pruebas
de tiempo de las WJ III 38
Cuadro 3-5. Correlaciones test-retest según edad e intervalo de retest 39
Cuadro 3-6. Distribución de los sujetos del Cuadro 3-5 por edad e intervalo de retest 41
Cuadro 3-7. Correlaciones test-retest a un año para pruebas y compuestos
seleccionados de la WJ III ACH 41

xv
Cuadro 3-8. Confiabilidad entre calificadores para la prueba Muestras de redacción 43
Cuadro 3-9. Confiabilidad entre calificadores para la prueba Fluidez en la escritura 44
Cuadro 3-10. Confiabilidad entre calificadores para Escritura a mano 44
Cuadro 3-11. Correlaciones seleccionadas entre las puntuaciones de las Formas
A y B de Comprensión de textos 47
Cuadro 4-1. Definiciones de los términos fundamentales empleados en el Capítulo 4 48
Cuadro 4-2. Construcción teórica y contenido de la WJ III COG 51
Cuadro 4-3. Construcción teórica y contenido de la WJ III ACH 53
Cuadro 4-4. Pruebas de investigación adicionales de la WJ III incluidas en los
análisis de su validez interna y estudios especiales 61
Cuadro 4-5. Estadísticos descriptivos y correlaciones entre compuestos seleccionados
de la WJ III COG, compuestos de la WPPSI-R y compuestos de la
DAS, para una muestra de preescolares (estudio de Ford, Teague
y Tusing) 70
Cuadro 4-6. Estadísticos descriptivos y correlaciones entre compuestos seleccionados
de la WJ III COG y compuestos y puntuaciones de compuestos de
la SB-IV, para una muestra de preescolares (estudio de Phelps y Ford) __ 71
Cuadro 4-7. Estadísticos descriptivos y correlaciones entre los compuestos de la
WJ III COG y la escala WISC-III, para los grados 3 a 5 (estudio
de Phelps) 73
Cuadro 4-8. Estadísticos descriptivos y correlaciones entre puntuaciones de
compuestos seleccionados de la WJ III COG y de compuestos
de la DAS, para los grados 3 a 5 (estudio de McIntosh y Dunham) 74
Cuadro 4-9. Correlaciones entre compuestos seleccionados de la WJ III COG y
la escala CAS, para los grados 3 a 6 (estudio de Flanagan, Kranzler
y Keith) 75
Cuadro 4-10. Estadísticos descriptivos y correlaciones entre compuestos de la WJ III
ACH con compuestos y subpruebas de la WIAT y la KTEA, para los
grados 1 a 8 (estudio de Ford, Simmons y North) 76
Cuadro 4-11. Correlaciones entre compuestos seleccionados de la WJ III COG y las
escalas UNIT, C-TONI y Leiter-R, para los grados K a 8 (estudio de
McCallum y Hooper) _________________________________________ 77
Cuadro 4-12. Estadísticos descriptivos y correlaciones entre pruebas seleccionadas
de la WJ III COG, compuestos de la WJ III ACH y compuestos de
la TOVA y del BASC, para los grados 1 a 6 (estudio de Vesley) 78
Cuadro 4-13. Medias, desvíos estándar y pruebas t para una muestra de escolares con
ADHD (estudio de Lerner y Yasutake) 80
Cuadro 4-14. Estadísticos descriptivos y correlaciones entre los compuestos de la
WJ III COG y las escalas WAIS-III y KAIT, para estudiantes
universitarios (estudio de Gregg y Hoy) 81
Cuadro 4-15. Estadísticos descriptivos, correlaciones y resultados de la regresión para
compuestos seleccionados de la WJ III COG, la WAIS y las subpruebas
de la KAIT en la predicción del aprovechamiento en matemáticas
(estudio de Norton) __________________________________________ 83

xvi
Cuadro 4-16. Análisis factorial exploratorio de pruebas seleccionadas de la WJ III
COG y la WJ III ACH, pruebas de investigación de la WJ III y
subpruebas de la WISC-III – Pautas de factor oblicuo (estudio
de Vesley) 87
Cuadro 4-17. Análisis factorial exploratorio de pruebas seleccionadas de la WJ III
COG y la WJ III ACH, subpruebas de la WAIS-III y subpruebas de la
KAIT – Pautas de factor oblicuo (estudio de Norton) 88
Cuadro 4-18. Correlaciones entre las cuatro opciones principales de habilidades de
la WJ III y los compuestos de aprovechamiento de la WJ III ACH 89
Cuadro 4-19. Correlaciones entre los compuestos de la WJ III COG y la WJ III ACH,
y la escala WISC-III, para los grados 3 a 5 (estudio de Phelps) 92
Cuadro 4-20. Correlaciones entre los compuestos de la WJ III COG, de la DAS y
de la WPPSI-R con pruebas y compuestos seleccionados de la
WJ III ACH, para una muestra de preescolares (estudio de Ford,
Teague y Tusing) 93
Cuadro 4-21. Correlaciones entre los compuestos de la WJ III COG, la WAIS-III
y la KAIT con los compuestos de la WJ III ACH, la escala
OWLS, los compuestos de la WRAT3 y los compuestos de la
prueba NDRT (estudio de Gregg y Hoy) 94
Cuadro 4-22. Medias, desvíos estándar y pruebas t de los compuestos de la WJ III
para grupos de estudiantes universitarios con y sin discapacidad de
aprendizaje (LD) (estudio de Gregg y Hoy) 98
Cuadro 4-23. WJ III ítemes con diferencia de dificultad prácticamente significativas,
según tipo de comparación 102

xvii
Figuras
Figura 2-1. Relación de la WJ III con la teoría CHC. 11
Figura 2-2. Localidades que actuaron como sede para la normalización de la WJ III.__ 17
Figura 2-3. Tipos y dimensiones de las localidades utilizadas en el muestreo durante
la Etapa 1. 24
Figura 2-4. Ejemplo de curva suavizada para la Prueba 1: Identificación de letras y
palabras de la WJ III ACH. 28
Figura 3-1. Relación entre el error de medición y la habilidad W en toda la amplitud
de la Prueba 1: Identificación de letras y palabras de la WJ III ACH. 34
Figura 3-2. Gráfico de las dificultades W para 45 ítemes de las Formas A y B de
la Prueba 5: Cálculo de la WJ III ACH. 45
Figura 3-3. Comparación de las ojivas de puntuación en bruto/habilidad W en las
Formas A y B de la Prueba 5: Cálculo de la WJ III ACH. 46
Figura 3-4. Comparación de los errores estándar por niveles de habilidad W en las
Formas A y B de la Prueba 5: Cálculo de la WJ III ACH. 46
Figura 4-1. Siete curvas de desarrollo de los factores de la WJ III COG según
la edad. 55
Figura 4-2. Nueve curvas de desarrollo de los compuestos de la WJ III ACH según
la edad. ___________________________________________________ 56
Figura 4-3. Nueve compuestos de la WJ III ACH y Comprensión-conocimiento (Gc)._ 57
Figura 4-4. Ejemplos de curvas de desarrollo de diversas habilidades estrechas,
agrupadas según la habilidad amplia CHC correspondiente. 59
Figura 4-5. Modelo hipotético de la WJ III basado en nueve factores amplios CHC
y en g._____________________________________________________ 63
Figura 4-6. Modelo hipotético de la WJ III basado en tres niveles de factores: g, los
factores amplios CHC y las habilidades CHC estrechas. 64
Figura 4-7. Dificultades de los ítemes de las WJ III según el género
(masculino/femenino)._______________________________________ 100
Figura 4-8. Diferencias entre los ítemes – Blancos/No blancos. 101

xviii
Capítulo 1

Panorama general de la WJ III y la Batería III


Las baterías de pruebas conocidas como Woodcock-Johnson® III (WJ III®) (Woodcock, McGrew y Mather, 2001a)
consisten en dos baterías diferentes conormalizadas: las WJ III Tests of Cognitive Abilities (WJ III COG) (Woodcock,
McGrew y Mather, 2001c), WJ III Tests of Achievement (WJ III ACH) (Woodcock, McGrew y Mather, 2001b) y
1
WJ III Diagnostic Supplement to the Tests of Cognitive Abilities (Woodcock, McGrew, Mather y Schrank, 2003) . En
su conjunto, tanto en inglés como en español, estas baterías constituyen un abarcativo sistema dirigido a una amplia
gama de edades, que mide la habilidad intelectual general (g), determinadas habilidades cognitivas, el lenguaje oral y
el aprovechamiento académico. Los datos normativos para las pruebas en inglés se basan en una sola muestra de
individuos a los que se administraron tanto las pruebas cognitivas como las de aprovechamiento. Este procedimiento
de conormalización permite que las dos baterías funcionen como un sistema unitario de diagnóstico, preciso y válido,
para evaluar las destrezas específicas de un área con las habilidades cognitivas relacionadas, así como las
discrepancias tradicionales habilidad/aprovechamiento.
En este capítulo se brinda un panorama general de las pruebas, compuestos y cálculos de discrepancias que
2
pueden obtenerse mediante el uso de la WJ III y la Batería III . En los capítulos siguientes se ofrece información
acerca del desarrollo de las pruebas, su estandarización, normalización, confiabilidad y validez. En los manuales para
el examinador correspondientes a cada batería se hallará información detallada sobre la administración, puntuación e
interpretación de las pruebas. En el Cuadro 1-1 se hallarán las definiciones de algunos términos importantes utilizados
en este capítulo.

Abarcatividad de la WJ III y la Batería III


Las pruebas de la WJ III y la Batería III han sido diseñadas para facilitar una amplia gama de evaluaciones ajustadas y
abarcativas. Según cual sea el propósito de la evaluación, cada una de las baterías cognitivas y de aprovechamiento
puede usarse sola, ya sea en formato estándar o extendido, o bien en combinación con pruebas y compuestos
procedentes de la otra batería. Las pruebas, compuestos, factores y escalas de estas baterías suministran medidas más
precisas y una cobertura más amplia de las habilidades cognitivas que las que pueden encontrarse en cualquier otro
sistema de evaluación psicológica y educativa.

En el Cuadro 1-2 se enumeran las 20 pruebas cognitivas y 22 pruebas de aprovechamiento incluidas en la WJ III y
la Batería III. En este cuadro, las pruebas cognitivas han sido divididas en tres categorías que mantienen una relación
causal con el rendimiento cognitivo: la habilidad verbal, la habilidad para pensar y la eficiencia cognitiva. Además, las
pruebas cognitivas han sido divididas de acuerdo con siete factores amplios Gf-Gc de habilidad cognitiva. Por su parte,
las Pruebas de aprovechamiento han sido divididas de acuerdo con cinco áreas curriculares principales: lectura,
lenguaje oral, matemáticas, lenguaje escrito o redacción y conocimientos académicos, y en grupos adicionales que
corresponden a las áreas suplementarias. Además, las Pruebas de aprovechamiento se han organizado en compuestos
funcionales útiles para ciertos propósitos interpretativos.

El Cuadro 1-3 detalla la capacidad interpretativa de las pruebas de habilidades cognitivas y de aprovechamiento
cuando las baterías son utilizadas de modo independiente. En la columna de la izquierda se enumeran las principales
escalas, factores, compuestos o discrepancias que pueden derivarse de la administración de las Pruebas de habilidades
cognitivas. Esta información es importante para medir las habilidades intelectuales, el aprovechamiento predicho y las
discrepancias intra-cognitivas que pudieran existir. En la columna de la derecha se enumeran los compuestos y

1
La WJ III Diagnostic Supplement to the Tests of Cognitive Abilities no habia sido editada al momento de publicarse el Technical Manual.
2
Las versiones en español son las siguientes: la Batería III Woodcock-Muñoz™: Pruebas de habilidades cognitivas (Batería III COG) (Muñoz-Sandoval,
Woodcock, McGrew y Mather, 2005c), la Batería III Woodcock-Muñoz: Pruebas de aprovechamiento (Batería III APROV) (Muñoz-Sandoval, Woodcock,
McGrew y Mather 2005b) y la Batería III Woodcock-Muñoz: Suplemento diagnóstico para las pruebas de habilidades cognitivas (Batería III SD)
(Muñoz-Sandoval, Woodcock, McGrew, Mather y Schrank, 2005).

1
Panorama general de la WJ III y la Batería III
Cuadro 1-1.
Definiciones de los términos fundamentales empleados en el Capítulo 1

Término Definición

Batería Conjunto de subpruebas y/o de pruebas que habitualmente (aunque esto no es indispensable) se
proveen y/o se conormalizan juntas.

Compuesto Conjunto de dos o más pruebas que, después de combinar sus puntuaciones, pueden
interpretarse con puntuaciones derivadas. El compuesto puede representar: (1) una construcción
teórica bien definida y delimitada (v. gr., un factor o habilidad bien replicados), o (2) una colección
lógica de pruebas que incluye una mezcla compleja de ellas (v. gr., Amplia atención, Destrezas
académicas).

Discrepancia La diferencia entre la puntuación efectiva que obtiene un sujeto y cierta puntuación predicha para
ese mismo sujeto. La puntuación predicha puede ser el promedio correspondiente a un grupo de
personas bien definido (como las de la misma edad o del mismo grado escolar), o bien un
conjunto bien definido de otras puntuaciones del sujeto (o sea, las puntuaciones de un grupo de
compuestos en una de las opciones de puntuación de la discrepancia intra-individual, con
excepción de la puntuación de interés de dicho grupo).

Factor Construcción teórica habitualmente bien definida y delimitada, que se basa en una red de
evidencia de validez interna y externa, como la evidencia estructural, la evidencia de desarrollo, la
evidencia genética, y/o la evidencia neuro-cognitiva (Horn y Noll, 1997).

Normas de discrepancia Diferencias normalizadas entre la puntuación predictora y la puntuación criterio. Para un individuo
dado, las diferencias entre estas dos puntuaciones se evalúan comparándolas con la distribución
de las puntuaciones discrepantes de la muestra normalizada. La significación de una discrepancia
dada se determina de acuerdo con su tasa de incidencia en la muestra normalizada de una
prueba o batería.

Prueba Conjunto de ítemes o grupo de subpruebas que permiten interpretar las puntuaciones derivadas.

Subprueba Conjunto de ítemes que pueden puntuarse y acoplarse con otras subpruebas, pero que por sí
mismos no permiten interpretar las puntuaciones derivadas, como el grado equivalente o el rango
percentil.

discrepancias que pueden obtenerse mediante las Pruebas de aprovechamiento. Esta información es importante para
determinar el nivel educativo y la presencia de discrepancias intra-aprovechamiento.

Uno de los rasgos más destacados de este sistema de baterías es que las normas para las Pruebas de habilidades
cognitivas y para las Pruebas de aprovechamiento se basan en datos procedentes de la misma muestra de individuos.
Ello permite realizar comparaciones directas de las puntuaciones de un sujeto y entre diversos sujetos con un grado de
exactitud que no es dable alcanzar cuando se comparan puntuaciones provenientes de pruebas normalizadas por
separado. Además de brindar las discrepancias habilidad/aprovechamiento, la conormalización posibilita a los
examinadores evaluar en forma conjunta las destrezas de aprovechamiento específicas de un área así como las
habilidades cognitivas vinculadas con tales destrezas (procedimiento que se denomina Discrepancia intra-individual).
En el Cuadro 1-4 se detallan las capacidades ampliadas de interpretación de las Pruebas de habilidades cognitivas y
las Pruebas de aprovechamiento cuando se utiliza estas baterías en forma conjunta.

Utilidad diagnóstica de la WJ III y la Batería III


Las WJ III está diseñada a fin de proporcionar los métodos más válidos para la determinación de los aspectos positivos
y débiles de un individuo basándose en las normas de discrepancia efectivas. Estas normas sólo pueden derivar de
datos conormalizados si se utilizan los mismos sujetos en la muestra de conormalización. Como todas las pruebas han
sido conormalizadas, es posible establecer comparaciones entre la habilidad intelectual general (g) de un sujeto, sus
habilidades cognitivas específicas, su lenguaje oral y su aprovechamiento, así como comparaciones con otros sujetos
para medir estas mismas categorías, con mayor exactitud y validez de lo que sería posible comparando las
puntuaciones provenientes de instrumentos que han sido conormalizados por separado. A diferencia de otros
2
Panorama general de la WJ III y la Batería III
métodos, en las WJ III el procedimiento para averiguar la discrepancia efectiva con la norma no es afectado por
el fenómeno de la regresión hacia la media, que debe ser estimada y corregida cuando se determina la discrepancia
habilidad/aprovechamiento.

La información suministrada por las WJ III (o su versión en español) es especialmente apropiada para documentar
la índole de dos tipos principales de discrepancias y diferenciarlas: la discrepancia intra-habilidad y la discrepancia
habilidad/aprovechamiento. El Cuadro 1-5 sintetiza los procedimientos de averiguación de discrepancias incluidos en
estas baterías de pruebas.

Cuadro 1-2.
Organización de las pruebas de la WJ III y la Batería III
PRUEBAS DE HABILIDADES COGNITIVAS

Categoría/Factor Batería estándar Batería extendida

Habilidad verbal
Comprensión-conocimiento (Gc) Prueba 1: Comprensión verbal Prueba 11: Información general

Habilidad para pensar


Recuperación a largo plazo (Glr) Prueba 2: Aprendizaje visual-auditivo Prueba 12: Fluidez de recuperación
Percepción visual-espacial (Gv) Prueba 3: Relaciones espaciales Prueba 13: Reconocimiento de dibujos
Procesamiento auditivo (Ga) Prueba 4: Integración de sonidos Prueba 14: Atención auditiva
Razonamiento fluido (Gf) Prueba 5: Formación de conceptos Prueba 15: Análisis-Síntesis

Eficiencia cognitiva
Rapidez en el procesamiento (Gs) Prueba 6: Pareo visual Prueba 16: Rapidez en la decisión
Memoria a corto plazo (Gsm) Prueba 7: Inversión de números Prueba 17: Memoria para palabras

Factores suplementarias
(Ga, Gs, Gsm, Gf, Glr) Prueba 8: Palabras incompletas Prueba 18: Rapidez en la identificación de
Prueba 9: Memoria de trabajo auditiva dibujos
Prueba 10: Memoria diferida – Aprendizaje Prueba 19: Planeamiento
visual-auditivo Prueba 20: Cancelación de pares

PRUEBAS DE APROVECHAMIENTO
a a
Area curricular Batería estándar Batería extendida

Lectura (Grw)
Destrezas básicas en lectura Prueba 1: Identificación de letras y palabras Prueba 13: Análisis de palabras
Fluidez en lectura Prueba 2: Fluidez en la lectura
Comprensión de lectura Prueba 9: Comprensión de textos Prueba 17: Vocabulario de lectura
Lenguaje oral (Gc)
Expresión oral Prueba 3: Rememoración de cuentos Prueba 14: Vocabulario sobre dibujos
Comprensión auditiva Prueba 4: Comprensión de indicaciones Prueba 15: Comprensión oral
Matemáticas (Gq)
Destrezas en cálculos matemáticos Prueba 5: Cálculo
Fluidez en matemáticas Prueba 6: Fluidez en matemáticas
Razonamiento en matemáticas Prueba 10: Problemas aplicados Prueba 18: Conceptos cuantitativos
Lenguaje escrito (Grw)
Destrezas básicas en escritura Prueba 7: Ortografía Prueba 16: Corrección de textos
Fluidez en redacción Prueba 8: Fluidez en la escritura
Expresión escrita Prueba 11: Muestras de redacción
Conocimiento (Gc)
Prueba 19: Conocimientos académicos
Áreas Suplementarias (Glr, Grw, Ga)
Prueba 12: Memoria diferida – Rememoración Prueba 20: Análisis de sonidos
de cuentos Prueba 21: Discernimiento de sonidos
H: Escala de legibilidad de la escritura Prueba 22: Puntuación y mayúsculas
a
En la WJ III de aprovechamiento hay dos formas: A y B, mientras que en la Batería III se ha edito solo una forma.

3
Panorama general de la WJ III y la Batería III
Cuadro 1-3.
Capacidades de interpretación de las Pruebas de habilidades cognitivas y Pruebas de aprovechamiento

Medidas obtenidas de las Medidas obtenidas de las


Pruebas de habilidades cognitivas Pruebas de aprovechamiento

Habilidad intelectual general (g) Aprovechamiento total

Compuestos de rendimiento cognitivo Lenguaje oral


Habilidad verbal Lenguaje oral
Habilidad para pensar Expresión oral
Eficiencia cognitiva Comprensión auditiva

Factores cognitivos Lectura


Comprensión-conocimiento (Gc) Amplia lectura
Recuperación a largo plazo (Glr) Destrezas básicas en lectura
Percepción visual-espacial (Gv) Comprensión de lectura
Procesamiento auditivo (Ga)
Razonamiento fluido (Gf) Matemáticas
Rapidez en el procesamiento (Gs) Amplias matemáticas
Memoria a corto plazo (Gsm) Destrezas en cálculos matemáticos
Razonamiento en matemáticas
Compuestos clínicos
Percepción fonémica Lenguaje escrito
Memoria de trabajo Amplio lenguaje escrito
Amplia atención Destrezas básicas en escritura
Fluidez cognitiva Expresión escrita
Procesos de ejecución
Otros compuestos
Discrepancias intra-cognitivas Conocimientos académicos
Conocimiento de fonemas/grafemas
Aprovechamiento predicho Destrezas académicas
Fluidez académica
Aplicaciones académicas

Discrepancias intra-aprovechamiento

Discrepancias habilidad para el lenguaje oral/


aprovechamiento

Cuadro 1-4.
Capacidades de interpretación ampliadas mediante el uso conjunto de Pruebas de habilidades cognitivas y Pruebas
de aprovechamiento
Discrepancias/compuestos obtenidos mediante la combinación de
Pruebas de habilidades cognitivas y Pruebas de aprovechamiento

Discrepancias intra-individuales (destrezas de aprovechamiento con habilidades cognitivas)


Discrepancias aprovechamiento predicho/aprovechamiento
Discrepancias habilidad intelectual/aprovechamiento
Otros compuestos
Memoria diferida
Conocimientos

4
Panorama general de la WJ III y la Batería III
Cuadro 1-5.
Procedimientos para el cálculo de la discrepancia con las WJ III (lo mismo aplica a su versión en español)
Procedimientos de discrepancia
Intra-habilidad
Discrepancia intra-cognitiva
Discrepancia intra-aprovechamiento
Discrepancia intra-individual

Habilidad/aprovechamiento
Discrepancia aprovechamiento predicho/aprovechamiento
Discrepancia habilidad intelectual/aprovechamiento
Discrepancia habilidad para el lenguaje oral/aprovechamiento

El procedimiento para averiguar las Discrepancias intra-individuales con las dos baterías (cognitiva y de
aprovechamiento) facilita el análisis simultáneo de las destrezas de aprovechamiento específicas de un área y de las
habilidades cognitivas relacionadas (por ejemplo, el Conocimiento de fonemas/grafemas [APROV] y la Percepción
fonémica [COG]). Este procedimiento es particularmente útil para la identificación temprana de los niños con
problemas de aprendizaje y la intervención subsiguiente. Según la amplitud y profundidad de la evaluación, puede
llevárselo a cabo mediante distintas combinaciones de compuestos de las Pruebas de habilidades cognitivas y las
Pruebas de aprovechamiento. En el Cuadro 1-6 se determinan los compuestos específicos que deben administrarse a
fin de completar los cálculos referidos a las Discrepancias intra-individuales.

Para obtener esta información, puede recurrirse a cuatro combinaciones de las Baterías estándar y extendida de
las Pruebas de habilidades cognitivas y Pruebas de aprovechamiento. Para cada una de estas combinaciones, deben
administrarse todas las pruebas que figuran en el Libro de pruebas estándar o de las estándar y las extendidas (salvo las
pruebas suplementarias). Con el fin de calcular las Discrepancias intra-individuales no es necesario administrar la
Prueba 8: Palabras incompletas de la batería cognitiva. Sin embargo, si se la administra, es posible evaluar la
Percepción fonémica mediante el procedimiento de la Discrepancia intra-individual–Extendida. Análogamente, cuando
se administra la Prueba 9: Memoria de trabajo auditiva, puede evaluarse mediante este mismo procedimiento la
Memoria de trabajo.

Las Discrepancias intra-cognitivas pueden calcularse utilizando las Pruebas 1 a 7 (estándar) o las Pruebas 1 a 7 y
11 a 17 (extendida) de la batería cognitiva. Cuando se administran solamente las Pruebas 1 a 7, tales discrepancias se
calculan sobre la base de tres categorías amplias de funciones cognitivas: habilidad verbal, habilidad para pensar y
eficiencia cognitiva. Cuando se emplean tanto las Pruebas 1 a 7 como 11 a 17, se calculan sobre la base de siete
factores Gf-Gc. La Percepción fonémica y la Memoria de trabajo pueden evaluarse asimismo con el procedimiento
para la Discrepancia intra-cognitiva–Extendida. El Cuadro 1-7 muestra los dos grupos de compuestos utilizados para el
cálculo de estas Discrepancias intra-cognitivas.

También las Discrepancias intra-aprovechamiento pueden calcularse de dos maneras. Cuando se administran las
Pruebas 1 a 11 de la batería de aprovechamiento (estándar), las Discrepancias intra-aprovechamiento se basan en
cuatro áreas curriculares amplias: lectura, matemáticas, lenguaje oral y lenguaje escrito. En cambio, cuando se
administran las Pruebas de aprovechamiento 1 a 11 (estándar) y 13 a 19 (extendida), se basan en nueve áreas de
rendimiento académico: Destrezas básicas en lectura, Comprensión de lectura, Destrezas en cálculos matemáticos,
Razonamiento en matemáticas, Destrezas básicas en escritura, Expresión escrita, Expresión oral, Comprensión
auditiva y Conocimientos académicos. En el Cuadro 1-8 se presentan los dos grupos de compuestos utilizados para
calcular las Discrepancias intra-aprovechamiento.

La WJ III ACH y la Batería III APROV incluyen también un procedimiento para el cálculo de la Discrepancia
habilidad para el lenguaje oral/aprovechamiento, el cual recurre al compuesto de cuatro pruebas sobre Lenguaje
Oral–Extendida a fin de predecir el rendimiento en uno o más de los compuestos de aprovechamiento que se enumeran
en la primera columna del Cuadro 1-9.

5
Panorama general de la WJ III y la Batería III
Cuadro 1-6.
Compuestos agrupados de acuerdo con cuatro opciones de discrepancia intra-individual

DISCREPANCIAS INTRA-INDIVIDUALES

APROV estándar/COG estándar APROV extendida/COG estándar

Habilidad verbal Habilidad verbal


Habilidad para pensar Habilidad para pensar
Eficiencia cognitiva Eficiencia cognitiva
Amplia lectura Destrezas básicas en lectura
Amplias matemáticas Comprensión de lectura
Amplio lenguaje escrito Destrezas en cálculos matemáticos
Lenguaje oral–Estándar Razonamiento en matemáticas
Destrezas básicas en escritura
Expresión escrita
Expresión oral
Comprensión auditiva
Conocimientos académicos
APROV estándar/COG extendida APROV extendida/COG extendida

Comprensión-conocimiento (Gc) Comprensión-conocimiento (Gc)


Recuperación a largo plazo (Glr) Recuperación a largo plazo (Glr)
Percepción visual-espacial (Gv) Percepción visual-espacial (Gv)
Procesamiento auditivo (Ga) Procesamiento auditivo (Ga)
Razonamiento fluido (Gf) Razonamiento fluido (Gf)
Rapidez en el procesamiento (Gs) Rapidez en el procesamiento (Gs)
Memoria a corto plazo (Gsm) Memoria a corto plazo (Gsm)
a a
{Percepción fonémica} {Percepción fonémica}
b b
{Memoria de trabajo} {Memoria de trabajo}
Amplia lectura Destrezas básicas en lectura
Amplias matemáticas Comprensión de lectura
Amplio lenguaje escrito Destrezas en cálculos matemáticas
Lenguaje oral–Estándar Razonamiento en matemáticas
Destrezas básicas en escritura
Expresión escrita
Expresión oral
Comprensión auditiva
Conocimientos académicos
a
La Percepción fonémica no es necesaria para el cálculo de las Discrepancias intra-individuales. La puntuación de Percepción fonémica no se
incluye en la categoría “Otros” calculada para los demás compuestos. La puntuación de Percepción fonémica se compara con la misma
puntuación de la categoría “Otros” como Procesamiento auditivo (Ga).
b
Memoria de trabajo no es necesaria para el cálculo de las Discrepancias intra-individuales. La puntuación de Memoria de trabajo no se incluye en
la categoría “Otros” calculada para los demás compuestos. La puntuación de Memoria de trabajo se compara con la misma puntuación de la
categoría “Otros” como Memoria a corto plazo (Gsm).

Las Discrepancias habilidad/aprovechamiento pueden calcularse utilizando ya sea el método del aprovechamiento
predicho o la puntuación en Habilidad intelectual general (g). Para calcular cualquiera de estas medidas deben
administrarse las Pruebas 1 a 7 de la batería cognitiva. (La Habilidad intelectual general–Extendida se basa en las
Pruebas 1 a 7 y 11 a 17 de la batería cognitiva.) El método de predicción del aprovechamiento se emplea para predecir
el rendimiento inmediato del sujeto en cada una de las áreas de aprovechamiento. Los examinadores pueden optar,
asimismo, por la puntuación en Habilidad intelectual general para calcular las discrepancias basándose en la
puntuación de inteligencia general del individuo, o g. En la segunda columna del Cuadro 1-9 se enumeran los
compuestos de aprovechamiento que pueden utilizarse si se adopta este último procedimiento. Como sucede con el
procedimiento para el cálculo de la Discrepancia habilidad para el lenguaje oral/aprovechamiento, sólo es menester
administrar las pruebas que miden las áreas de aprovechamiento que interesen en cada caso específico.

6
Panorama general de la WJ III y la Batería III
Cuadro 1-7.
Compuestos agrupados de acuerdo con dos opciones de discrepancia intra-cognitiva
DISCREPANCIAS INTRA-COGNITIVAS

Estándar Extendida
Habilidad verbal Comprensión-conocimiento (Gc)
Habilidad para pensar Recuperación a largo plazo (Glr)
Eficiencia cognitiva Percepción visual-espacial (Gv)
Procesamiento auditivo (Ga)
Razonamiento fluido (Gf)
Rapidez en el procesamiento (Gs)
Memoria a corto plazo (Gsm)
{Percepción fonémica}a
{Memoria de trabajo}b
a
La Percepción fonémica no es necesaria para el cálculo de las Discrepancias intra-individuales. La puntuación de Percepción fonémica no se incluye en la categoría
“Otros” calculada para los demás compuestos. La puntuación de Percepción fonémica se compara con la misma puntuación de la categoría “Otros” como
Procesamiento auditivo (Ga).
b
Memoria de trabajo no es necesaria para el cálculo de las Discrepancias intra-individuales. La puntuación de Memoria de trabajo no se incluye en la categoría “Otros”
calculada para los demás compuestos. La puntuación de Memoria de trabajo se compara con la misma puntuación de la categoría “Otros” como Memoria a corto plazo (Gsm).

Cuadro 1-8.
Compuestos agrupados de acuerdo con dos opciones de discrepancia intra-aprovechamiento
DISCREPANCIAS INTRA-APROVECHAMIENTO

Estándar Extendida
Amplia lectura Destrezas básicas en lectura
Amplias matemáticas Comprensión de lectura
Amplio lenguaje escrito Destrezas en cálculos matemáticos
Lenguaje oral–Estándar Razonamiento en matemáticas
Destrezas básicas en escritura
Expresión escrita
Expresión oral
Comprensión auditiva
Conocimientos académicos

Cuadro 1-9.
Medidas que pueden utilizarse como criterio en los tres procedimientos de discrepancia habilidad/aprovechamiento
Medidas de aprovechamiento que pueden utilizarse en los
Medidas de aprovechamiento que pueden utilizarse en el
procedimientos de discrepancia aprovechamiento
procedimiento de discrepancia habilidad para el lenguaje
predicho/aprovechamiento y habilidad
oral/aprovechamiento
intelectual/aprovechamiento
Amplia lectura Amplia lectura
Destrezas básicas en lectura Destrezas básicas en lectura
Comprensión de lectura Comprensión de lectura
Amplias matemáticas Amplias matemáticas
Destrezas en cálculos matemáticos Destrezas en cálculos matemáticos
Razonamiento en matemáticas Razonamiento en matemáticas
Amplio lenguaje escrito Amplio lenguaje escrito
Destrezas básicas en escritura Destrezas básicas en escritura
Expresión escrita Expresión escrita
Conocimientos académicos Lenguaje oral–Estándar
Lenguaje oral–Extendida
Expresión oral
Comprensión auditiva
Conocimientos académicos

7
Panorama general de la WJ III y la Batería III
Capítulo 2

Desarrollo, estandarización y normalización


En este capítulo se ofrece información acerca del desarrollo de las baterías Woodcock-Johnson III (WJ III) (Woodcock,
McGrew y Mather, 2001a)1. Además de analizar los criterios básicos aplicados en su diseño, el capítulo documenta los
procedimientos de estandarización utilizados para la WJ III, incluida la descripción de la muestra de normalización y de
los procedimientos de muestreo. Contiene, asimismo, información sobre los procedimientos utilizados para preparar las
normas de la WJ III. Los Apéndices A y B que se encuentran al final del volumen brindan los estadísticos descriptivos
de la muestra de normalización de la WJ III correspondientes a todas las pruebas y compuestos de pruebas. Por último,
en este capítulo se esbozan también los procedimientos seguidos en el cálculo de las puntuaciones equivalentes al grado
y la edad, el percentil y las normas estándar de las puntuaciones, así como en el cálculo de las normas de las
discrepancias habilidad/aprovechamiento, intra-cognitiva, intra-aprovechamiento e intra-individual. En el Cuadro 2-1
se definen algunos términos fundamentales para que el lector se guíe mejor con la información que se le brinda en
este capítulo.

Cuadro 2-1.
Definiciones de los términos fundamentales empleados en el Capítulo 2
Término Definición

Desvío estándar de la Desvío estándar de las puntuaciones predichas. El error estándar de estimación puede emplearse
estimación para determinar la significación estadística de la puntuación de discrepancia de un sujeto.

Diferencia W Puntuación que se obtiene restando del W de referencia la puntuación W del sujeto. Esta medida
se toma como base para determinar las puntuaciones derivadas, como el Indice de proficiencia
relativa (RPI, por sus siglas en inglés) o una puntuación estándar.

Discrepancia del SD Puntuación z que indica el número de unidades del desvío estándar a que se encuentra la
discrepancia de un individuo respecto del promedio de las discrepancias para los individuos con
igual puntuación de habilidad en el grupo normativo respectivo, (SD son las siglas en inglés de
standard deviation [desviación estándar]).

Escala W Transformación matemática de la escala logits de Rasch. La dificultad del ítem y las habilidades
personales se miden en una escala común. Cuando la habilidad y la dificultad de la tarea se
consideran en una misma escala, la diferencia en unidades W entre ambas posee una
probabilidad conocida de ser una respuesta correcta.

Estadísticos descriptivos Parámetros utilizados para describir las características de una muestra de individuos como grupo.
Los dos estadísticos descriptivos más corrientes son la media y el desvío estándar. Otros
estadísticos a los que puede recurrirse son las puntuaciones mínima y máxima, la mediana, la
asimetría y la curtosis.

Estandarización Proceso seguido para investigar, establecer y documentar los procedimientos exactos que adopta
un examinador cuando administra, califica e interpreta una prueba. La normalización es uno de los
aspectos del proceso total de estandarización.

Normalización Proceso por el cual se obtienen los datos de una muestra de sujetos. Estos datos son luego
analizados con el fin de preparar normas que se utilizarán para comparar y evaluar el desempeño
de una persona. La mayoría de las normas se basan en datos extraídos de una sección
transversal equilibrada de la población en cuestión. El problema más importante en la elaboración
de un plan de muestreo es determinar las variables de la población pertinente y su representación
proporcional en el plan general.

1
Gran parte de la información de este capítulo sobre el desarrollo, estandarización y normalización de la WJ III aplica a sus versiones en español. Para mayor
información sobre el desarrollo y normalización de la Batería III Woodcock-Muñoz (Muñoz-Sandoval, Woodcock, McGrew y Mather, 2005a), el lector puede
remitirse al Assessment Service Bulletin (ASB, por sus siglas en inglés) (Schrank et al., 2005) [Folleto de servicio para el evaluador].
8
Desarrollo, estandarización y normalización
Cuadro 2-1. (cont.)
Definiciones de los términos fundamentales empleados en el Capítulo 2
Término Definición

Percentil de la discrepancia Puntuación que indica el porcentaje de individuos con igual puntuación en una habilidad en el
respectivo grupo normativo cuyo rendimiento fue igual o inferior al del sujeto.

Ponderación Procedimiento estadístico utilizado para asegurar que los datos normativos reflejen la distribución
exacta de las variables normativas en la población norteamericana. En la mayoría de los
conjuntos de datos, no se ponderan los sujetos ni las pruebas, lo cual significa que cada persona
o prueba del conjunto contribuye de igual manera a las puntuaciones de la suma de los individuos
o de las pruebas. En otras ocasiones, ciertos individuos o pruebas de un conjunto pueden pesar
más o menos que otros, en cuyo caso se les asigna una ponderación para que su contribución al
total sea proporcionada.

Puntuación W Transformación de puntuaciones en bruto en una escala Rasch con unidades de intervalos
iguales.

Teoría CHC Teoría de las habilidades cognitivas de Cattell, Horn y Carroll es una combinación de otras dos
teorías similares sobre el contenido y la estructura de las habilidades cognitivas humanas (J. B.
Carroll y J. L. Horn, comunicación personal, julio de 1999): la teoría Gf-Gc (Cattell, 1941; Horn,
1965) y la teoría de los tres estratos de Carroll (1993). La taxonomía establecida por la teoría CHC
es el marco de referencia más amplio que existe para comprender la estructura de las habilidades
cognitivas humanas y el que cuenta con mayor sustento empírico.

Teoría de los tres estratos Esta teoría propone que la mejor forma de describir la estructura de las habilidades cognitivas
humanas es mediante un modelo de tres estratos (Carroll, 1993). El primer estrato incluye
alrededor de 70 factores estrechos que son muy semejantes a los descriptos por la teoría Gf-Gc.
El segundo estrato comprende ocho habilidades amplias que se corresponden aproximadamente
con las de la teoría Gf-Gc. La teoría de los tres estratos supone la existencia de un factor general
de inteligencia denominado g, por encima de los dos estratos inferiores.

Teoría Gf-Gc Basada en investigaciones llevadas a cabo en los últimos 30 ó 40 años por Cattell, Horn y otros,
esta conceptualización de la inteligencia se funda en una serie de 9 a 10 factores amplios que, a
su vez, abarcan alrededor de 70 factores estrechos. Las habilidades amplias son factores de
segundo orden y guardan íntima correspondencia con las habilidades del segundo estrato de
Carroll. Las habilidades estrechas son factores de primer orden y guardan íntima correspondencia
con las habilidades del primer estrato de Carroll. La teoría Gf-Gc no presupone la presencia de un
único factor del tercer estrato o inteligencia general.

W de referencia Mediana de las puntuaciones W para una prueba o compuesto de pruebas obtenidas por los
sujetos de la muestra normativa para una edad o grado determinados.

La WJ III (COG y ACH) se caracterizan por el hecho de que todas las puntuaciones de un sujeto se obtienen mediante
algoritmos para la calificación computarizada que representan matemáticamente los resultados de los procedimientos
empleados en el cálculo de las normas. El programa de computación WJ III Compuscore® and Profiles (Schrank y
Woodcock, 2001) elimina los errores asociados a la calificación manual y permite otras opciones interpretativas. Aunque
las puntuaciones son transparentes para el usuario, se utilizaron ecuaciones a fin de derivar las incluidas en los cuadros de
las normas impresas de la Woodcock-Johnson Psycho-Educational Battery–Revised (WJ-R®) (Woodcock y Johnson,
1989b). En la WJ III, los algoritmos para la calificación computarizada del programa Compuscore and Profiles reemplazan
a los libros impresos con normas para las pruebas, ya que cumplen la misma función.

Criterios de diseño
La WJ III están basadas en las actuales teorías e investigaciones sobre la estructura de las habilidades cognitivas
humanas. A lo largo de toda la evolución de la WJ III y de la realización de los estudios vinculados con ellas, se hizo
especial hincapié en la calidad técnica. El propósito es que la WJ III tengan vasta aplicación, desde el nivel preescolar
hasta la tercera edad, para la evaluación total o focalizada de la habilidad intelectual general, las habilidades cognitivas
específicas, el lenguaje oral y el aprovechamiento. En cuanto a su función, la WJ III fueron diseñadas con el objeto de
simplificar la administración de las pruebas y reducir el tiempo que ella demanda.
9
Desarrollo, estandarización y normalización
Fundamentos teóricos y de investigación

La WJ III tienen sus fundamentos teóricos en la teoría de las habilidades cognitivas de Cattell, Horn y Carroll (teoría
CHC). El desarrollo de estas baterías estuvo presidido por dos grandes corrientes de investigación empírica sobre la
estructura de las habilidades cognitivas humanas.

La primera fuente importante tuvo como origen primordial los estudios psicométricos de análisis factorial de
Raymond Cattell y John Horn. Históricamente, a este conjunto de investigaciones se las llamó teoría Gf-Gc (Horn, 1988,
1991; Woodcock, 1990, 1994). La sigla Gf-Gc identifica las habilidades intelectuales fluidas (Gf) y cristalizadas (Gc).
Estos dos tipos de habilidades intelectuales fueron diferenciadas por Cattell (1941, 1943, 1950). Más adelante, Horn
(1965) suministró pruebas de que era posible identificar otras amplias habilidades cognitivas, como las que ahora se
denominan memoria a corto plazo (Gsm), recuperación a largo plazo (Glr), rapidez en el procesamiento (Gs) y
percepción visual-espacial (Gv). Horn y Stankov (1982) añadieron a esta nomenclatura el procesamiento auditivo (Ga).
En 1989 se publicó el WJ-R con el título WJ-R Tests of Cognitive Ability (Woodcock y Johnson, 1989a) e incluyó estas
siete habilidades cognitivas como factores. Estudios posteriores de Horn (1988, 1989) llevaron a incorporar al modelo
Gf-Gc la habilidad cuantitativa (Gq) y más tarde Woodcock (1998) identificó una habilidad separada para la lectura y
escritura (Grw).

La segunda fuente importante es el análisis subsiguiente que realizó John Carroll de las investigaciones de análisis
factorial existentes hasta entonces, y que lo llevó a formular su teoría de los tres estratos (Carroll, 1993, 1998). Los
análisis de Carroll abarcaron un amplio espectro de estudios estructurales independientes sobre las habilidades
cognitivas humanas. Recuperó y volvió a someter a análisis factorial los datos procedentes de 461 de las principales
pruebas psicométricas efectuadas con posterioridad a 1925. Tomó cuatro de sus conjuntos de datos de los datos de
normalización para la primera edición de Woodcock-Johnson Psycho-Educational Battery (Woodcock y Johnson, 1977).
Utilizando un análisis factorial exploratorio, Carroll formuló la tesis de que las habilidades cognitivas humanas podían
conceptualizarse en forma jerárquica. Encontró 69 habilidades estrechas o específicas y consideró que ellas constituían
el Estrato I. Estas habilidades se agrupaban en varias amplias categorías de habilidad cognitiva (Estrato II) que
denominó Inteligencia fluida, Inteligencia cristalizada, Memoria general y aprendizaje, Amplia percepción visual,
Amplia percepción auditiva, Amplia habilidad de recuperación, Amplia rapidez cognitiva y Rapidez en el
procesamiento. En la cúspide de su modelo (Estrato III), Carroll colocó un factor general al que designó como
Inteligencia general, o g.

Las similitudes entre estas fuentes de conocimiento independientes dieron sustento a la teoría CHC combinada. Las
habilidades estrechas que Carroll clasificó en su Estrato I son semejantes a las habilidades primarias del Factor común
bien reproducido (Well-Replicated Common Factor, WERCOF, por sus siglas en inglés) analizadas por Horn (1991) en
el WJ-R Technical Manual (McGrew, Werder y Woodcock, 1991). Las habilidades del Estrato II de Carroll son muy
similares a las habilidades Gf-Gc identificadas en las fuentes de Cattell y Horn. Carroll (1993) afirmó que el modelo
Gf-Gc era el mejor de todos los existentes sobre la estructura del intelecto humano.

El modelo Cattel-Horn, tal como fue sintetizado por Horn (1985, 1988), es un auténtico modelo jerárquico que
abarca todos los dominios principales del funcionamiento intelectual. Si bien aún falta completar numerosos
detalles mediante investigaciones ulteriores, parece ser entre los modelos existentes el que ofrece el enfoque mejor
fundado y más razonable para elaborar una teoría aceptable de la estructura de las habilidades cognitivas. La
principal reserva que yo haría sobre él es que parece no suministrar un factor g de tercer orden que dé cuenta de las
correlaciones entre los amplios factores de segundo orden. (página 62)

La teoría CHC sirvió como proyecto de base para la WJ III (ver la Figura 2-1), que son un modelo de medición de
dicha teoría. Los 8,818 sujetos de la muestra de normalización de la WJ III constituyen la base de datos más amplia,
proveniente de una sola fuente, utilizada para corroborar la teoría CHC. Datos procedentes de otros 775 sujetos de
estudios de validez, a quienes se les administraron las 42 pruebas de la WJ III junto con otras baterías de inteligencia

10
Desarrollo, estandarización y normalización
Modelo Gf-Gc de
Cattell-Horn
Amplias habilidades
(Estrato II)
___________________________
· Inteligencia cristalizada (Gc)
· Conocimientos cuantitativos (Gq)
· Habilidad para la lectura y
escritura (Grw)
Pruebas estructurales · Inteligencia fluida (Gf) Sirve como Batería psicoeducativa
(principalmente estudios proyecto para...
psicométricos mediante
· Percepción visual-espacial (Gv)
· Procesamiento auditivo (Ga)
Woodcock-Johnson–
Llevó a...
análisis factorial) · Recuperación a largo plazo (Glr) Pruebas de Revisada
· Memoria a corto plazo (Gsm) validez
corroboran...
(WJ-R)
· Rapidez en el procesamiento
(Gs)
___________________________
· numerosas habilidades
estrechas (WERCOF)

Teoría de las habilidades


cognitivas de Cattell,
Horn y Carroll

Modelo de tres estratos de


Carroll
Habilidades amplias
(Estrato II) Sirve como Pruebas de
___________________________ proyecto para... validez corroboran...
· Inteligencia cristalizada
· Inteligencia fluida
Síntesis de Caroll (1993) · Percepción visual amplia
de las investigaciones · Percepción auditiva amplia
sobre habilidades Llevó a... · Habilidad de recuperación
cognitivas mediante amplia
análisis factorial · Memoria general y
aprendizaje
Woodcock-Johnson III
· Rapidez cognitiva amplia (WJ III)
· Rapidez en el procesamiento
___________________________
· numerosas habilidades
estrechas (Estrato I) y
habilidad general g (Estrato III)

Figura 2-1.
Relación de la WJ III con la teoría CHC.

y aprovechamiento ya publicadas, no sólo brindaron evidencia de la validez de la construcción teórica para la WJ III,
sino que además proporcionaron información relativa a la composición de los factores CHC de otras baterías.

Los criterios empleados en el diseño de la WJ III pusieron el acento en dar la mayor amplitud práctica para los
factores del Estrato II, o factores CHC. La gran amplitud de medición de cada factor apunta a ofrecer una mayor
generalización (validez) de las puntuaciones de los factores CHC a otras situaciones. Para la mayoría de los factores,
cada compuesto amplio CHC se compone de dos habilidades estrechas o del Estrato I, cualitativamente diferentes entre
sí. Por ejemplo, en la WJ III Tests of Cognitive Abilities (WJ III COG) (Woodcock, McGrew y Mather, 2001c), el
compuesto Glr incluye una medida de la memoria asociativa (Prueba 2: Aprendizaje visual-auditivo) y una medida de la
fluidez ideativa (Prueba 12: Fluidez de recuperación); al mismo tiempo, el compuesto Gv incluye una medida de la
visualización (Prueba 3: Relaciones espaciales) y una de la memoria visual (Prueba 13: Reconocimiento de dibujos). La
WJ III Tests of Achievement (WJ III ACH) (Woodcock, McGrew y Mather, 2001b) también abarcan con mayor amplitud
las habilidades estrechas. Por ejemplo, la WJ III ACH incluyen nuevas medidas de la rapidez de lectura (Prueba 2:
Fluidez en la lectura) y de la facilidad para el manejo de números (Prueba 6: Fluidez en matemáticas). Las
WJ III ACH incorporan nuevas medidas de otras habilidades estrechas, entre ellas la habilidad auditiva (Prueba 3:
Rememoración de cuentos y Prueba 4: Comprensión de indicaciones) y la codificación fonética (Prueba 20: Análisis de

11
Desarrollo, estandarización y normalización
sonidos y Prueba 21: Discernimiento de sonidos). En el Cuadro 2-2 se enumeran las amplias habilidades CHC y las
habilidades estrechas del Estrato I que se miden con la WJ III.

Calidad técnica
Las pruebas y compuestos de la WJ III han sido cuidadosamente elaborados a fin de asegurar una elevada calidad
técnica (Woodcock, 1992). El desarrollo de las pruebas, la calibración de los ítemes, el escalamiento, la composición de
los compuestos, la interpretación y la validación se llevaron a cabo utilizando el modelo logístico de un solo parámetro
de Rasch (Rasch, 1960; Woodcock, 1999; Wright y Stone, 1979), análisis de correlación relacionados con un criterio,
análisis de regresión múltiple por pasos, y análisis factoriales exploratorios y confirmatorios (Jöreskog y Sörbom, 1989).

Cuadro 2-2.
Habilidades amplias y estrechas medidas por la WJ III COG y la WJ III ACH
PRUEBAS DE HABILIDADES COGNITIVAS DE LA WJ III

Batería estándar Batería extendida


Factor CHC amplio Principales habilidades estrechas Principales habilidades estrechas
Comprensión-conocimiento (Gc) Prueba 1: Comprensión verbal Prueba 11: Información general
Conocimiento léxico Información general (verbal)
Desarrollo del lenguaje

Recuperación a largo plazo (Glr) Prueba 2: Aprendizaje visual-auditivo Prueba 12: Fluidez de recuperación
Memoria asociativa Fluidez ideativa
Prueba 10: Memoria diferida –
Aprendizaje visual-auditivo
Memoria asociativa

Percepción visual-espacial (Gv) Prueba 3: Relaciones espaciales Prueba 13: Reconocimiento de figuras
Visualización Memoria visual
Relaciones espaciales Prueba 19: Planeamiento
Alcance de la percepción visual
Razonamiento secuencial general

Procesamiento auditivo (Ga) Prueba 4: Integración de sonidos Prueba 14: Atención auditiva
Codificación fonética: síntesis Discriminación de sonidos del
Prueba 8: Palabras incompletas habla
Codificación fonética: análisis Resistencia a la distorsión de
los estímulos auditivos

Razonamiento fluido (Gf) Prueba 5: Formación de conceptos Prueba 15: Análisis-Síntesis


Inducción Razonamiento secuencial general
Prueba 19: Planeamiento
Alcance de la percepción visual
Razonamiento secuencial general

Rapidez en el procesamiento (Gs) Prueba 6: Pareo visual Prueba 16: Rapidez en la decisión
Rapidez perceptual Rapidez para el procesamiento
semántico
Prueba 18: Rapidez en la identificación
de dibujos
Facilidad de identificación
Prueba 20: Cancelación de pares
Atención y concentración

Memoria a corto plazo (Gsm) Prueba 7: Inversión de números Prueba 17: Memoria para palabras
Memoria de trabajo Alcance de la memoria
Prueba 9: Memoria de trabajo auditiva
Memoria de trabajo

12
Desarrollo, estandarización y normalización
Cuadro 2-2. (cont.)
Habilidades amplias y estrechas medidas por la WJ III COG y la WJ III ACH
PRUEBAS DE APROVECHAMIENTO DE LA WJ III

Batería estándar Batería extendida


Factor CHC amplio Principales habilidades estrechas Principales habilidades estrechas
Lectura-escritura (Grw) Prueba 1: Identificación de letras y palabras Prueba 13: Análisis de palabras
Decodificación de la lectura Decodificación de la lectura
Prueba 2: Fluidez en la lectura Decodificación fonética:
Rapidez de lectura análisis y síntesis
Prueba 9: Comprensión de textos Prueba 17: Vocabulario de lectura
Comprensión de lectura Comprensión del lenguaje
Comprensión del lenguaje verbal verbal (impreso)
(impreso) Conocimiento léxico
Prueba 7: Ortografía Prueba 16: Corrección de textos
Habilidad para la escritura de Desarrollo del lenguaje
palabras Uso del lenguaje
Prueba 8: Fluidez en la escritura Prueba 22: Puntuación y mayúsculas
Rapidez de escritura Uso del lenguaje
Prueba 11: Muestras de redacción
Habilidad para la escritura

Matemáticas (Gq) Prueba 5: Cálculo Prueba 18: Conceptos cuantitativos


Aprovechamiento en matemáticas Conocimientos matemáticos
Prueba 6: Fluidez en matemáticas Razonamiento cuantitativo
Aprovechamiento en matemáticas
Facilidad numérica
Prueba 10: Problemas aplicados
Razonamiento cuantitativo
Aprovechamiento en matemáticas
Conocimientos matemáticos

Comprensión-conocimiento (Gc) Prueba 3: Rememoración de cuentos Prueba 14: Vocabulario sobre dibujos
Desarrollo del lenguaje Desarrollo del lenguaje
Habilidad auditiva Conocimiento léxico
Prueba 4: Comprensión de indicaciones Prueba 15: Comprensión oral
Habilidad auditiva Habilidad auditiva
Desarrollo del lenguaje Prueba 19: Conocimientos académicos
Información general
Información científica
Información cultural
Aprovechamiento en geografía
\

Procesamiento auditivo (Ga) Prueba 13: Análisis de palabras


Decodificación de la lectura
Decodificación fonética:
análisis
Decodificación fonética:
síntesis
Prueba 20: Análisis de sonidos
Habilidad para la escritura
Decodificación fonética:
análisis
Prueba 21: Discernimiento de sonidos
Decodificación fonética:
análisis
Decodificación fonética:
síntesis

Recuperación a largo plazo (Glr) Prueba 12: Memoria diferida –


Rememoración de cuentos
Memoria significativa

13
Desarrollo, estandarización y normalización
La WJ III incorporan la escala W, que constituye una transformación y aplicación del modelo de medición de Rasch
(Woodcock y Dahl, 1971). La escala W de cada prueba está centrada en un valor igual a 500 para el rendimiento
promedio aproximado de niños de 10 años (10-0). La mayoría de las puntuaciones de los compuestos de la WJ III son
las puntuaciones W promedio (media aritmética) de las pruebas incluidas en cada compuesto. La escala W emplea un
mismo conjunto de números para expresar la dificultad de un ítem y la habilidad personal. Consecuentemente, dicha
escala suministra una base científica muy precisa para obtener información predictiva fundada en la diferencia entre la
habilidad personal y la dificultad del ítem en una escala común. Puede encontrarse más información acerca de la
aplicación del modelo de Rasch en el WJ-R Technical Manual (McGrew et al., 1991).

Los criterios técnicos adoptados para la selección de los ítemes fueron rigurosos. Los ítemes elegidos debían
ajustarse al modelo de Rasch y también a otros criterios. A fin de obtener una progresión uniforme de las dificultades de
las pruebas, los ítemes fueron seleccionados de modo que reflejaran una diferencia promedio de dificultad entre los
ítemes de 3 a 4 puntos en la escala W. La selección de los ítemes con este nivel de densidad en cada escala contribuye a
asegurar que los niveles de error estándar sean adecuados para que las discriminaciones resulten confiables.

Las dos partes que integran la WJ III (las Pruebas de habilidades cognitivas y las Pruebas de aprovechamiento)
fueron conormalizadas, condición necesaria para la creación de las normas de discrepancia. Estas últimas sólo pueden
proceder de datos conormalizados, utilizando los mismos sujetos en una muestra normalizada única. Dado que todas las
pruebas de la WJ III están conormalizadas, las comparaciones entre las puntuaciones de un individuo en habilidad
cognitiva y en aprovechamiento pueden realizarse con mayor precisión y validez que si se compararan puntuaciones
provenientes de instrumentos normalizados por separado.

La normalización a lo largo del año (Zachary y Gorsuch, 1985; Woodcock, 1987) generó datos normativos en 10
puntos para cada grado. Este procedimiento origina normas basadas en datos que se recogen en forma continua a lo largo
del año lectivo, en lugar de basarse en datos recogidos en uno o dos momentos del año (v. gr., el otoño y la primavera),
entre los cuales deben hacerse luego interpolaciones para obtener los puntos intermedios. Hay normas especiales para
los estudiantes de programas universitarios de dos y cuatro años de duración, así como para los estudiantes del primer
año de la licenciatura. Las normas basadas en la edad se suministran en forma mensual desde la edad de 24 meses hasta
los 19 años y en forma anual entre los 20 años y los 90 años o más. Se estableció el número de ítemes y la densidad
media del ítem en cada prueba de manera de obtener, en general, una confiabilidad de 0.80 o más. Para los compuestos
se estableció como objetivo una confiabilidad de 0.90 o más.

La WJ III ofrecen puntuaciones para habilidades cognitivas y áreas de aprovechamiento académico bien
diferenciadas y cuenta con el aval de las investigaciones mediante análisis factorial que se mencionan en este manual. La
puntuación de cada compuesto consta de por lo menos dos mediciones estrechas diferentes para cada una de las siete
habilidades cognitivas amplias, y de tres a cuatro mediciones estrechas diferentes para cada una de las cinco habilidades
de aprovechamiento amplias. Las cargas de los factores de la prueba son elevadas y brindan evidencias sustanciales de
una estructura simple.

Amplia aplicabilidad

Si bien una de las principales aplicaciones de la WJ III es la población en edad escolar, un objetivo fundamental del
diseño fue conservar un rango de medición que abarcase desde los 2 años de edad hasta la tercera edad. Este objetivo se
alcanzó durante el desarrollo de las baterías; la WJ III ofrecen, pues, normas para esa amplia gama de edades, con el
agregado de normas separadas para los estudiantes universitarios.

Tradicionalmente, el proceso psicoeducativo de evaluación ha exigido a los examinadores reunir una colección de
pruebas para evaluar una variedad de funciones. El empleo de un conjunto de pruebas separadas, que por lo común
tienen normas provenientes de diferentes fechas y sujetos, genera grandes problemas para la comparación de las
puntuaciones entre las pruebas (Salvia y Ysseldyke, 1988). Las puntuaciones discrepantes de distintas pruebas pueden
revelar más sobre las diferencias existentes entre las normas de éstas que sobre las diferencias intra-individuales. Las
WJ III, en cambio, miden un amplio espectro de habilidades cognitivas y de aprovechamiento con un único conjunto de

14
Desarrollo, estandarización y normalización
instrumentos. Las 42 pruebas de la WJ III permiten una evaluación exhaustiva dentro de cada una de las tres áreas
amplias, pese a lo cual integran todas esas facetas proporcionando normas comunes.

Se han agregado nuevos compuestos a la WJ III con el objeto de aumentar su amplitud y profundidad. La WJ III
COG incluyen dos opciones para puntuar la Habilidad intelectual general (GIA, por sus siglas en inglés). La WJ III son
las únicas pruebas de inteligencia que brindan una medición del componente primero-principal de la inteligencia
general, o g. También se puede obtener una medida de la Habilidad intelectual breve (BIA, por sus siglas en inglés),
basada en tres pruebas. La WJ III COG contienen, además, varios compuestos que representan las funciones cognitivas
amplias de Habilidad verbal, Habilidad para pensar y Eficiencia cognitiva. Los usuarios de la WJ III COG pueden
contar asimismo con varios compuestos nuevos de utilidad clínica, como son la Percepción fonemica, Memoria de
trabajo, Amplia atención, Fluidez cognitiva y Procesos de ejecución. La WJ III ACH han sido ampliadas a fin de incluir
varias mediciones del lenguaje oral, como la Expresión oral y la Comprensión auditiva. Por añadidura, la
WJ III ACH incluyen una puntuación del Aprovechamiento total y un nuevo compuesto sobre Conocimiento de
fonemas/grafemas.

Reducción del tiempo de administración de las pruebas

La WJ III (y sus versiones en español) han sido diseñadas para reducir el tiempo de administración de las pruebas
centrándolas en el nivel de habilidad de cada sujeto y administrando únicamente las pruebas y los ítemes necesarios. Al
igual que en muchas pruebas que se administran en forma individual, la WJ III aplican reglas de nivel básico y máximo
para limitar la gama de dificultad de los ítemes que deben administrarse. Si no se requiere una evaluación exhaustiva, el
examinador puede administrar solamente aquellas pruebas que le proporcionen la información deseada.

En todas las pruebas de la WJ III, los ítemes están ordenados según su dificultad, desde los más sencillos hasta los
más difíciles. Cada prueba contiene ítemes que alcanzan un grado extremo de dificultad. Mediante las reglas de nivel
básico y máximo, las pruebas reducen al mínimo la cantidad de ítemes que deben administrarse y, de ese modo,
consiguen que la reacción del sujeto ante las pruebas sea más favorable. Ciertas pruebas incluyen tablas en las que se
sugieren puntos de partida, para ayudar al examinador a comenzar cada prueba en el nivel de dificultad apropiado.

A menos que se desee obtener un panorama exhaustivo, quienes administran la WJ III deben regirse por el principio
de la administración selectiva. La sección introductoria de los Libros de pruebas contiene una tabla de selección que
indica cuáles pruebas deben administrarse a fin de obtener determinadas mediciones. La aplicación escrupulosa del
principio de la administración selectiva da por resultado una mayor eficiencia y ahorra mucho tiempo en innumerables
situaciones. Tal como sucede en cualquier evaluación apropiada, el examinador debe formular primero las preguntas que
desea responder con su evaluación y, luego, amoldar esta última a tales preguntas. Las tablas de selección de la WJ III
facilitan el proceso de correspondencia entre las preguntas y el proceso de evaluación.

Facilidad de administración

La WJ III fueron diseñadas para una administración cómoda de las pruebas sin necesidad de recurrir a materiales
incomódos. Las pruebas se acomodan en forma de caballetes especialmente diseñados, más pequeños que los utilizados
en la WJ-R. Cada Libro de pruebas puede utilizarse fácilmente como caballete portátil y luego de la administración de las
pruebas plegarse hasta adquirir el tamaño y forma de un libro para su traslado. El caballete que emplea el examinador le
permite a éste registrar las respuestas en el Protocolo de pruebas fuera de la vista del sujeto. Se realizó un particular
esfuerzo para crear pruebas que midieran todos los aspectos de la cognición y el aprovechamiento sin emplear elementos
de manipulación directa, ni siquiera con los niños más pequeños. A tal fin, se crearon pruebas singulares y materiales
pictóricos coloridos (que se despliegan en la parte del Libro de pruebas que corresponde al sujeto). (Los elementos de
manipulación directa utilizadas en la mayoría de las otras pruebas actúan primordialmente como dispositivos para el
estímulo y/o la respuesta, y no miden los factores cognitivos singulares per se.)

Además, la WJ III incorporan ciertas características especiales para simplificar al máximo el aprendizaje de los
procedimientos de administración y calificación, y aumentar la exactitud y grado de estandarización de cada prueba
administrada. En primer lugar, los procedimientos empleados en las pruebas no le exigen al examinador adoptar
15
Desarrollo, estandarización y normalización
decisiones complicadas en materia de administración o calificación. En cada prueba se brindan, página por página,
instrucciones concretas sobre la forma de administrar cada una, y las palabras exactas que deben enunciarse al darse las
indicaciones que aparecen impresas en negrita y en color azul en la página del examinador. Para determinadas
ocasiones, cuando el examinador tal vez deba explicar mejor las instrucciones al sujeto, se suministran notas aclaratorias
especiales. Para todos los ítemes se suministra una guía sobre las respuestas correctas y para algunos también sobre las
incorrectas. Por otra parte, muchos ítemes incluyen preguntas que el examinador debe formular literalmente si el sujeto
da ciertas respuestas que no es posible considerar correctas si no se cuenta con mayor información. En muchas páginas
hay, asimismo, recuadros con indicaciones suplementarias, que deben seguirse si el sujeto no logra responder o lo hace
de una manera particular. A lo largo de los materiales de prueba, se intercalan advertencias para que el examinador esté
atento a los errores más comunes de administración, calificación y uso incorrecto del material. Una segunda
característica destacable es que, a fin de asegurar una presentación estandarizada de ciertas pruebas, las instrucciones se
dan en forma oral mediante pruebas grabadas.

También se han creado materiales de capacitación especiales para enseñar a los examinadores los procedimientos
de administración y estandarización, los cuales contienen instrucciones y ejercicios prácticos.

Estandarización
La adecuada selección y medición de la muestra normativa es una de las etapas más difíciles y decisivas del desarrollo
de una prueba. La validez de las normas de una prueba depende del grado en que la muestra normativa sea
representativa de la población con la cual se compararán los resultados obtenidos en dicha prueba por los sujetos, así
como del cuidado con que se recojan los datos a partir de la muestra.

Los datos para elaborar las normas de la WJ III fueron reunidos a partir de una gran muestra representativa de la
población total de Estados Unidos, la cual estaba compuesta por 8,818 sujetos. Los asistentes de investigación fueron muy
bien capacitados y cuidadosamente supervisados. A todos los sujetos se les administraron pruebas tanto de las WJ III COG
como de la WJ III ACH, de manera tal que los datos normativos para ambas variantes se basan en una muestra común.

Características generales de la muestra normativa

Los datos normativos para la WJ III fueron recogidos de 8,818 sujetos pertenecientes a más de un centenar de
localidades norteamericanas geográficamente diferentes (ver la Figura 2-2). La muestra preescolar (niños de 2 a 5 años
de edad no inscriptos en un jardín de infantes [kindergarten]) estaba integrada por 1,143 sujetos. La muestra que
abarcaba desde el jardín de infantes hasta el 12o grado estaba integrada por 4,783 sujetos. La muestra universitaria
estaba integrada por 1,165 estudiantes del ciclo universitario básico (undergraduate students) y del ciclo superior
(graduate students). La muestra de adultos estaba integrada por 1,843 sujetos. En el Cuadro 2-3 se exhibe la distribución
de la muestra normativa por edad y grado. La mayor densidad de sujetos en la población de edad escolar refleja la
necesidad de contar con una mayor concentración de datos durante el período en que las habilidades medidas por la
WJ III experimentan el mayor índice de crecimiento.

La muestra normativa se seleccionó de modo que fuese representativa, dentro de ciertas limitaciones prácticas, de la
población estadounidense entre los 24 meses y los 90 o más años de edad. Los sujetos fueron seleccionados en forma
aleatoria con un diseño de muestreo estratificado en el que se controlaron las siguientes variables, correspondientes a
diez tipos de comunidades y sujetos:

Región censal: Nordeste, Medio Oeste, Sur, Oeste


Dimensión de la localidad: ciudad central (> 50,000 habitantes) y alrededores; localidad importante (10,000-
49,999 habitantes) y zona rural circundante; localidad menor (< 10,000 habitantes) y zona rural circundante
Sexo o género: masculino, femenino
Raza y etnias: blanca, negra, indígenas americanos, asiáticos y polinesios
Origen latinoamericano (hispanos): latinoamericano, no latinoamericano
Tipo de escuela (primaria, secundaria): pública, privada, enseñanza en el hogar

16
Desarrollo, estandarización y normalización
MEDIO OESTE
NORDESTE

OESTE

SUR

Figura 2-2.
Localidades que actuaron como sede para la normalización de la WJ III.

Cuadro 2-3.
Distribución de la muestra normativa por edad y grado
Edad Cantidad Grado Cantidad

2 259 Jardín de infantes 304


3 310 1 343
4 394 2 365
5 373 3 500
6 313 4 582
7 345 5 563
8 437 6 366
9 541 7 338
10 591 8 328
11 431 9 286
12 353 10 290
13 325 11 276
14 292 12 242
15 304
16 306 Ciclo universitario básico
17 249 13 280
18 281 14 249
19 209 15 205
20 a 29 1,011 16 233
30 a 39 411 17+ (Ciclo universitario 198
40 a 49 385 superior)
50 a 59 231
60 a 69 152
70 a 79 168
80+ 147
Total 8,818 Total 5,948

17
Desarrollo, estandarización y normalización
Tipo y duración de la enseñanza superior/universitaria: programa universitario de dos años, programa
universitario de cuatro años (licenciatura, ciclo universitario superior (maestría); pública, privada
Educación del adulto: escuela primaria incompleta (menos del 9o grado), escuela secundaria incompleta, escuela
secundaria completa, 1 a 3 años de enseñanza universitaria, ciclo universitario completo (4 años), licenciatura
o títulos superiores
Situación ocupacional del adulto: empleado, desocupado, no pertenece a la población económicamente activa
Tipo de ocupación del adulto que pertenece a la población económicamente activa: profesional/directivo;
técnico/ventas/administrativo; servicios (incluidas las Fuerzas Armadas y la policía); actividades
agropecuarias/silvicultura/pesca; instrumentos de precisión/oficios especializados/reparaciones;
operario/obrero industrial/trabajador no calificado

Los Cuadros 2-4 a 2-7 presentan las variables de la muestra y su distribución tanto en la población estadounidense
(según las proyecciones del censo del año 2000) como en la muestra normativa de la WJ III. Esta información corresponde
a los niveles principales de la muestra normativa (preescolar, jardín de infantes hasta el 12o grado, estudiante universitario y
adulto). No todas las variables eran relevantes en todos los niveles de la muestra normativa. Por ejemplo, la información
ocupacional sólo se aplicó a la muestra de adultos, y el tipo y duración de la enseñanza universitaria.

Cuadro 2-4.
Distribución de las variables de muestreo de la población de Estados Unidos y en la muestra normativa de la WJ III – Preescolares

Porcentaje de
la población de Cantidad Cantidad Porcentaje del Ponderación
Variable de muestreo EE. UU. objetivo obtenida objetivo del sujeto

Región censal
Nordeste 19.0 132 246 186.4 0.880
Medio Oeste 23.1 161 179 111.2 1.475
Sur 35.5 248 528 212.9 0.770
Oeste 22.4 156 190 121.8 1.346
Dimensión de la localidad
Ciudad central y alrededores 64.6 450 748 166.2 0.987
Localidad importante y zona 17.5 122 189 154.9 1.059
rural circundante
Localidad menor y zona rural 17.9 125 206 164.8 0.995
circundante
Sexo
Masculino 51.2 357 567 158.8 1.033
Femenino 48.8 340 576 169.4 0.968
Raza
Blanca 77.8 543 836 154.0 1.065
Negra 16.2 114 251 220.2 0.745
Indígena americana 1.0 7 9 128.6 1.275
Asiática y polinesia 4.7 33 47 142.4 1.151
Origen latinoamericano
(hispano)
Sí 16.4 114 135 118.4 1.385
No 83.6 583 1,008 172.9 0.948
Nivel de instrucción del padre
< Escuela secundaria 12.9 90 121 134.4 1.045
Escuela secundaria 60.8 424 496 117.0 1.201
> Escuela secundaria 26.3 183 362 197.8 0.710
No disponible — — 164 — —
Nivel de instrucción de la madre
< Escuela secundaria 11.8 82 124 151.2 1.029
Escuela secundaria 62.4 435 575 132.2 1.177
> Escuela secundaria 25.9 180 386 214.4 0.725
No disponible — — 58 — —

18
Desarrollo, estandarización y normalización
Cuadro 2-5.
Distribución de las variables de muestreo de la población de Estados Unidos y en la muestra normativa de la WJ III – Grados
K a 12o

Porcentaje de
la población de Cantidad Cantidad Porcentaje % Ponderación
EE.UU. objetivo obtenida del objetivo del sujeto
Variable de muestreo

Región censal
Nordeste 19.0 552 1,138 206.2 0.797
Medio Oeste 23.1 673 1,041 154.7 1.062
Sur 35.5 1,035 1,476 142.6 1.152
Oeste 22.4 651 1,129 173.4 0.948

Dimensión de la localidad
Ciudad central y alrededores 60.6 1,763 2,776 157.5 1.044
Localidad importante y zona 19.3 563 907 161.1 1.020
rural circundante
Localidad menor y zona rural 20.1 585 1,101 188.2 0.873
circundante

Sexo
Masculino 51.2 1,490 2,431 163.2 1.007
Femenino 48.8 1,421 2,353 165.6 0.992

Raza
Blanca 78.6 2,288 3,759 164.3 1.000
Negra 15.7 456 687 150.7 1.091
Indígena americana 1.2 35 96 274.3 0.599
Asiática y polinesia 4.5 132 242 183.3 0.896

Origen latinoamericano (hispano)


Sí 14.9 434 570 131.3 1.250
No 85.1 2,477 4,214 170.1 0.966

Nivel de instrucción del padre


< Escuela secundaria 14.0 408 534 130.9 1.198
Escuela secundaria 60.1 1,748 2,730 156.2 1.004
> Escuela secundaria 25.9 754 1,300 172.4 0.909
No disponible — — 220 — —

Nivel de instrucción de la madre


< Escuela secundaria 12.2 356 439 123.3 1.272
Escuela secundaria 61.7 1,796 2,933 163.3 0.960
> Escuela secundaria 26.1 760 1,193 157.0 0.999
No disponible — — 219 — —

Tipo de establecimiento escolar


Público 87.4 2,545 4,155 163.3 1.006
Privado 11.1 322 575 178.6 0.920
Hogar 1.5 44 54 122.7 1.339

19
Desarrollo, estandarización y normalización
Cuadro 2-6.
Distribución de las variables de muestreo de la población de Estados Unidos y en la muestra normativa de la WJ III –
Estudiantes universitarios en programas de 2-4 años
Porcentaje de
Cantidad Cantidad Porcentaje % Ponderación
la población de
objetivo obtenida del objetivo del sujeto
Variable de muestreo EE. UU.

Región censal
Nordeste 19.0 160 189 118.1 1.172
Medio Oeste 23.1 194 216 111.3 1.244
Sur 35.5 299 507 169.6 0.817
Oeste 22.4 188 253 134.6 1.029

Sexo
Masculino 44.3 373 462 123.9 1.118
Femenino 55.7 468 703 150.2 0.922

Raza
Blanca 80.6 678 966 142.5 0.972
Negra 12.3 104 138 132.7 1.044
Indígena americano 1.0 8 13 162.5 0.852
Asiático y polinesio 6.1 51 48 94.1 1.472

Origen latinoamericano
Sí 8.2 69 96 139.1 0.995
No 91.8 772 1,069 138.5 1.000

Tipo de establecimiento escolar


Público 78.1 657 836 127.2 1.088
Privado 21.9 184 329 178.8 0.775

Enseñanza universitaria
Dos años 15.3 129 190 147.3 0.940
Cuatro años 84.6 712 975 136.9 1.011

Se estableció como objetivo de la muestra normativa que abarcara 6,000 individuos; luego se aplicaron cocientes
correspondientes a las variables geográficas y personales a fin de establecer una muestra representativa para todo el país.
Si una vez alcanzado ese objetivo en una comunidad se disponía de asistentes de investigación capacitados, se procuraba
obtener datos adicionales con el fin de mejorar los conjuntos de datos disponibles para los análisis estadísticos
complejos (v. gr., regresión múltiple, análisis factorial confirmatorio). Si para una variable cualquiera se superaba dicho
objetivo, se aplicaban ponderaciones para los sujetos antes de calcular las normas, con el objeto de corregir cualquier
efecto de sobrerrepresentación. Los subconjuntos de la muestra normativa que representaban a las poblaciones cuyo
porcentaje dentro de la población norteamericana total era pequeño, como las de los indígenas americanos, fueron
sobremuestrados en forma sistemática, a fin de asegurar que su contribución a las normas generales fuese más precisa.

Procedimiento de normalización
El objetivo de todo procedimiento normalizador debe ser obtener datos representativos correctos sobre la población que
interesa. La validez de una prueba puede verse muy comprometida si se incluyen datos obtenidos en condiciones
deficientes o por personas que no han sido apropiadamente capacitadas y supervisadas. Estos problemas se convierten en
un verdadero peligro cuando, en el transcurso del proceso de recolección de los datos normativos, los individuos
responsables del desarrollo de la prueba delegan demasiadas responsabilidades en otras personas. El procedimiento
utilizado para la normalización de la WJ III fue diseñado de modo tal de reducir al mínimo tales amenazas a la validez.

Los datos normativos para la WJ III fueron reunidos por equipos de examinadores bien adiestrados y que estaban
bajo la supervisión directa de un integrante del personal del proyecto. Todos los examinadores fueron empleados por el
proyecto en calidad de asistentes de investigación; no se solicitó a los establecimientos de enseñanza que suministraran

20
Desarrollo, estandarización y normalización
Cuadro 2-7.
Distribución de las variables de muestreo de la población de Estados Unidos y en la muestra normativa de la WJ III – Adultos
Porcentaje de
Cantidad Cantidad Porcentaje % Ponderación
la población de
objetivo obtenida del objetivo del sujeto
Variable de muestreo EE. UU.

Región censal
Nordeste 19.0 294 453 154.1 0.771
Medio Oeste 23.1 359 399 111.1 1.068
Sur 35.5 552 596 108.0 1.100
Oeste 22.4 347 395 113.8 1.043

Dimensión de la localidad
Ciudad central y alrededores 64.3 998 1,157 115.9 1.024
Localidad importante y zona 17.7 274 241 88.0 1.350
rural circundante
Localidad menor y zona rural 18.0 280 445 158.9 0.747
circundante

Sexo
Masculino 47.9 743 777 104.6 1.136
Femenino 52.1 809 1, 066 131.8 0.901

Raza
Blanca 83.6 1,298 1, 561 120.3 0.987
Negra 11.7 182 210 115.4 1.029
Indígena americano 0.8 12 23 191.7 0.620
Asiático y polinesio 3.9 60 49 81.7 1.454

Origen latinoamericano
Sí 10.0 155 174 112.3 1.058
No 90.0 1,397 1, 669 119.5 0.994

Nivel de instrucción
< 9o grado 8.9 139 108 77.7 1.528
< Escuela secundaria 14.0 218 226 103.7 1.145
Escuela secundaria 32.5 505 484 95.8 1.239
Uno a tres años de 24.1 376 452 120.2 0.985
enseñanza universitaria
Ciclo universitario completo 13.7 213 358 168.1 0.707
(cuatro años)
Licenciatura o superior 6.5 102 190 186.3 0.637

Situación ocupacional
Empleado 64.2 996 1, 089 109.3 1.081
Desocupado 4.1 64 167 260.9 0.452
No pertenece a la población 31.7 492 578 117.5 1.006
económicamente activa
No disponible — — 9 — —

Tipo de ocupación
Profesional/directivo 28.1 299 456 152.5 0.971
Técnico/ventas/administrativo 29.9 318 480 150.9 0.981
Servicios 13.5 143 295 206.3 0.718
Actividades agropecuarias/ 2.9 31 53 171.0 0.866
silvicultura/pesca
Instrumentos de precisión/ 10.8 115 130 113.0 1.310
oficios especializados/
reparaciones
Operario/obrero industrial/ 14.4 154 156 101.3 1.462
trabajador no calificado

21
Desarrollo, estandarización y normalización
su propio personal para la administración de las pruebas ni que propusieran casos de sujetos posibles, aunque sí se
requirieron recomendaciones, tanto de los directores de escuelas como del personal administrativo, sobre personas que
pudieran actuar como asistentes de investigación. Aproximadamente 224 asistentes de investigación fueron
capacitados y participaron en la normalización de la WJ III en todo el país.

Los datos para la muestra escolar fueron recogidos en forma continua entre septiembre de 1996 y mayo de 1999;
los correspondientes a estudiantes universitarios fueron recogidos entre septiembre de 1996 y marzo de 1999; los de
preescolares (2 a 5 años de edad) y adultos fueron recogidos entre septiembre de 1996 y agosto de 1999.

Muestreo en tres etapas

El objetivo del procedimiento de muestreo era identificar y seleccionar una muestra que se correspondiera,
aproximadamente, con la distribución de la población norteamericana en lo que respecta a diversas variables geográficas
y personales. Puesto que alcanzar dicho objetivo mediante un muestreo puramente aleatorio hubiese sido muy poco
práctico, para la normalización de la WJ III en todo el país se adoptó un diseño de muestra estratificada en tres etapas.
Tales etapas fueron: muestreo de las localidades (Etapa 1), muestreo de los establecimientos de enseñanza para los
sujetos en edad escolar (Etapa 2) y muestreo de los sujetos (Etapa 3).

En la selección de los sujetos en edad escolar y de algunos preescolares se aplicaron las tres etapas; en la de los
adultos y algunos preescolares, sólo las Etapas 1 y 3. Como es característico de todo estudio importante de normalización,
en cada etapa se utilizaron distintos procedimientos de muestreo. A continuación describiremos los procedimientos
empleados para obtener una muestra representativa mediante las tres etapas y en cada una de ellas por separado.

Etapa 1: Muestreo de localidades. En la primera etapa, el objetivo fue obtener una muestra de localidades de todo
Estados Unidos que fuese representativa de la distribución de la población en el país, según la división de las regiones
establecida en el censo y las características de urbanización y socioeconómicas de cada localidad.

La Oficina del Censo, dependiente de la Secretaría de Comercio de Estados Unidos, divide el país en cuatro
regiones censales, que a su vez son subdivididas en nueve. En el Cuadro 2-8 se indican estas regiones y subdivisiones,
así como los estados incluidos en cada una. Uno de los objetivos del plan de muestreo era obtener una representación
proporcional en cada una de las cuatro regiones censales principales. Por otra parte, también se pretendía, mediante el
muestreo de las nueve subdivisiones, alcanzar una representación aproximada más refinada de todas ellas. Con el fin de
lograr este objetivo, se obtuvieron datos normativos de 27 de los 50 estados del país. Estos 27 estados figuran con
asterisco en el Cuadro 2-8.

La selección de localidades fue guiada, además, por el requisito de que la muestra debía ser proporcional respecto
del tipo de localidad (las localidades habían sido clasificadas, como ya dijimos, en “Ciudad central y alrededores”,
“Localidad importante y zona rural circundante” o “Localidad menor y zona rural circundante”). Se definió como
“Ciudad central” toda zona que tuviera una población de 50,000 habitantes como mínimo, radicada en una o más
ciudades; los “alrededores” incluyen las localidades de cualquier tamaño adyacentes a la ciudad central. Se definió la
“Localidad importante” como aquella que tuviera una población inferior a 50,000 pero superior a 10,000 habitantes; en
el caso típico, estas localidades se hallaban a por lo menos 75 kilómetros de distancia de una ciudad central. Se definió
como “Localidad menor” a cualquier localidad y/o zona geográfica cuya población fuese inferior a 10,000 habitantes y
que, en el caso típico, se hallase a una distancia de por lo menos 75 kilómetros de una ciudad central. La Figura 2-3
ilustra los distintos tipos y tamaños de localidades que se tuvieron en cuenta en la Etapa 1. Fueron seleccionadas de
manera de asegurar que la proporción de sujetos de la muestra se correspondiese en forma aproximada con las
características urbanas y no urbanas de Estados Unidos.

La selección de localidades se basó en las características de distribución geográfica, tipo de localidad y


características socioeconómicas de cada una. Dado que el equipo directivo del proyecto necesitaba la autorización de las
autoridades escolares para someter a las pruebas a los niños en edad escolar, el próximo paso fue conseguir dicha
autorización. En cada localidad preseleccionada, un miembro directivo del proyecto tomó contacto con la autoridad
apropiada del sistema escolar a fin de obtenerla.
22
Desarrollo, estandarización y normalización
Cuadro 2-8.
Clasificación de los estados por región y subdivisión según la Oficina del Censo de Estados Unidos
Región/Subdivisión Estado Región/Subdivisión Estado

Nordeste Sur (cont.)


a a
Nueva Inglaterra Maine Central Sur Este Kentucky
New Hampshire Tennesseea
Vermont Alabamaa
Massachusettsa Mississippia
Rhode Island
Connecticuta Central Sur Oeste Arkansas
Louisiana
Atlántico Medio Nueva Yorka Oklahomaa
Nueva Jersey Texasa
Pensilvaniaa
Medio Oeste Oeste
a a
Central Norte Este Ohio Zona Montañosa Montana
Indianaa Idaho
Illinoisa Wyoming
a
Michigan Colorado
Wisconsina Nuevo México
a
Arizona
Central Norte Oeste Minnesotaa Utah
Iowa Nevada
Missouri
a
Dakota del Norte Costa del Pacífico Washington
Dakota del Sur Oregona
Nebraska Californiaa
Kansasa Alaskaa
Hawai
Sur
Atlántico Sur Delaware
Maryland
Distrito de Columbia
Virginia
Virginia Occidental
Carolina del Norte
Carolina del Sura
Georgiaa
Floridaa
a
Estados representados en la muestra normativa.

Etapa 2: Muestreo de establecimientos de enseñanza. Una vez que las autoridades de un sistema escolar
aceptaban participar, un miembro del personal del proyecto mantenía una reunión con el director o administrador
apropiado y tomaba las medidas para instrumentar la Etapa 2. En los sistemas escolares pequeños, se administraban las
pruebas en todos los establecimientos de enseñanza; en los de mayor tamaño, se escogía un subconjunto apropiado. La
pauta general para la selección del conjunto de establecimientos era que los alumnos que podían ser seleccionados
representasen una sección transversal de la comunidad escolar en su totalidad. En algunas comunidades, fue posible
determinar una cantidad específica de establecimientos con alumnos que constituían una sección transversal
representativa, pero en la mayoría fue menester seleccionar primero un conjunto de establecimientos a fin de contar con
una muestra representativa general. Con el fin de que la representación de la comunidad fuese más precisa, se incluyeron
en la muestra normativa las escuelas religiosas y privadas.

Etapa 3: Muestreo de los sujetos que concurrían a establecimientos de enseñanza. Luego de la selección de los
establecimientos, un miembro del personal del proyecto tomaba contacto con el director de la escuela a fin de explicarle
el proyecto y analizar con él las medidas y planes para la administración de las pruebas. El muestreo de los sujetos se
basaba en una cuota por cada grado. Dentro de cada grado, la solicitud de participación de los sujetos se disponía en
forma totalmente aleatoria. En el caso típico, se obtenía la lista de alumnos del grado existente en los archivos del
establecimiento y luego, utilizando una tabla de números aleatorios, se solicitaba la participación para constituir el grupo
de sujetos potenciales. Según las características del establecimiento, esa solicitud se extendía a un número de sujetos
23
Desarrollo, estandarización y normalización
Zona rural circundante

Localidad menor
(Población < 10,000)

Ciudad central
(Población > 50,000)

Alrededores

Localidad importante
(Población 10,000-49,999)

Zona rural circundante

Figura 2-3.
Tipos y dimensiones de las localidades utilizadas en el muestreo durante la Etapa 1.

que era de 4 a 10 veces superior, aproximadamente, a la cuota requerida. Se incluyo a los alumnos discapacitados en la
medida en que asistieran, al menos en jornada parcial, a clases regulares. Se excluyó de la muestra normativa a todos los
sujetos que tuvieran menos de un año de experiencia en clases regulares dictadas en lengua inglesa. Los sujetos que
recibían instrucción en su hogar representaron el 1.5% de la muestra de escolares y en la mayoría de los casos se los
localizó a través de las asociaciones cooperadoras de cada escuela.

Para todos los sujetos de menos de 18 años de edad se solicitó la autorización de los padres o tutores haciéndoles
llegar un formulario al hogar. Se requería la respuesta inmediata al formulario, en el cual el progenitor debía indicar si
daba o no su autorización para que su hijo o hija fuese sometido a las pruebas. Los padres debían suministrar la siguiente
información: nombre del alumno, fecha de nacimiento, grado (edad para los preescolares), sexo, raza, si era o no de
origen latinoamericano (hispanos), lugar de nacimiento, nivel de instrucción alcanzado por cada progenitor que vivía en
el hogar, ocupación actual del padre, ocupación actual de la madre, teléfono del hogar y código postal.

Selección de los preescolares. La selección de los sujetos en edad preescolar se basó en cuotas tendientes a obtener
una distribución representativa de los niños de 2, 3 y 4 años, así como de los de 5 años que no asistían al jardín de
infantes (kindergarten). Tales cuotas se basaron en la educación y ocupación de los padres, la región geográfica, el tipo
de localidad, el sexo, la raza y el origen latinoamericano. Aunque no existe información confiable sobre la cantidad de
niños de 2 a 5 años que asisten a guarderías o son cuidados en hogares particulares o en otros centros de enseñanza, se
procuró incluir en la muestra todas estas modalidades.

Selección de los estudiantes universitarios. La selección de los estudiantes de programas universitarios de dos
años o de cuatro años, así como de los estudiantes universitarios superiores (maestría), se basó en cuotas establecidas
según el año de estudios, sexo, raza y origen latinoamericano (hispanos). La participación de los estudiantes se solicitó a
través de carteles colocados en los establecimientos educacionales y, en ocasiones, a través de docentes o miembros del
personal del proyecto que hacían breves exposiciones informativas ante una clase. Se solicitó a los sujetos que
proporcionasen información sobre el nivel del curso en que estaban inscriptos y las materias o carreras en que las se
estaban especializando.

24
Desarrollo, estandarización y normalización
Selección de sujetos adultos. También la selección de los sujetos adultos se basó en cuotas que variaban según que
el sujeto residiera en una ciudad central, los alrededores o una zona no urbanizada, y tomó en cuenta la edad, situación
ocupacional, tipo de ocupación (si estaba empleado), sexo y raza. La información correspondiente al máximo nivel de
instrucción alcanzado y a la ocupación actual se obtenía directamente de cada sujeto.

Elaboración de las normas


Se resumieron, para cada prueba y compuesto de pruebas, los datos correspondientes a los 8,818 sujetos de la muestra
normativa. Se aplicaron ponderaciones individuales para cada sujeto de manera tal que la distribución de los datos de las
WJ III fuese exactamente proporcional a la distribución de la población estadounidense y, a partir de allí, se calcularon
las normas de puntuación. En esta sección se explicarán los procedimientos y cálculos empleados en la preparación de
las normas y los datos de discrepancia procedentes del programa Compuscore and Profiles.

Estadísticos descriptivos de las pruebas y compuestos


En el Apéndice A se presentan los estadísticos descriptivos y la confiabilidad de las pruebas de las baterías WJ III COG
y WJ III ACH. Salvo para la “Escala de legibilidad de la escritura mano”, las medias no ponderadas y desvíos estándar
que se suministran en la tabla están medidos en unidades de la escala W, o puntuaciones W. En el Apéndice B se
presentan estos mismos estadísticos para los compuestos cognitivos y de aprovechamiento de la WJ III. Esta tabla
incluye las medias no ponderadas, desvíos estándar, confiabilidad, error estándar de medición de las puntuaciones W
y error estándar de medición de las puntuaciones estándar para cada nivel de edad.

Ponderación de los sujetos


Si bien la distribución de los sujetos de la muestra normativa era aproximadamente igual a la de la población de Estados
Unidos, durante el análisis de los datos se aplicaron ponderaciones a cada sujeto a fin de obtener una distribución de los
datos de la WJ III que fuese exactamente proporcional a las variables de la muestra de localidades e individuos. Con este
ajuste se eliminaron los posibles sesgos resultantes si en cada categoría del diseño del muestreo se hubiese tenido una
representación aproximada pero no proporcional. A cada sujeto de la muestra normativa se le asignó una ponderación
basada en la contribución de dicho sujeto a la base de datos. Si el sujeto pertenecía a cualquier subcategoría que tuviese
en la muestra normativa un porcentaje mayor que la proporción de dicha subcategoría en la población de Estados
Unidos, se le asignaba una ponderación menor de 1.0; si pertenecía a una subcategoría que tuviese un porcentaje menor
en la muestra que en la población de Estados Unidos, se le asignaba una ponderación mayor de 1.0. Las ponderaciones
se calcularon con la siguiente fórmula:

Porcentaje de la población de Estados Unidos


Ponderación = Porcentaje de la muestra
2.1

Los Cuadros 2-4 a 2-7 incluyen las ponderaciones obtenidas aplicando esta fórmula a las variables de la muestra.
La contribución de cada sujeto de la muestra normativa a las normas es proporcional al producto de las ponderaciones
correspondientes a dicho sujeto. Por ejemplo, los sujetos de menos de 20 años de edad y que no recibían instrucción
universitaria contribuyeron a las normas en forma proporcional según el producto de cinco ponderaciones: región,
tamaño de la localidad, sexo, raza y origen latinoamericano (hispanos). En cambio, para los sujetos que asistían a un
establecimiento universitario su contribución proporcional a las normas era el producto de seis ponderaciones: región,
sexo, raza, origen latinoamericano (hispanos), subvención de sus estudios universitarios y tipo de establecimiento
universitario. Toda vez que los datos de un sujeto se empleaban para calcular las normas, la contribución de dicho sujeto
al cálculo era función de la ponderación obtenida (en lugar de computar al sujeto como 1.0). Los Cuadros 2-4 a 2-7
indican que el reajuste de la contribución de aquellas categorías que tenían un número mayor de sujetos en la muestra
(oversampled categories) permitió obtener una distribución de los datos normativos que se correspondía con la
distribución de la población estadounidense en lo tocante a las 10 variables normativas.

25
Desarrollo, estandarización y normalización
Cálculo de las puntuaciones de los compuestos con ponderaciones diferenciadas

Las puntuaciones de los compuestos de Habilidad intelectual general (GIA) y Aprovechamiento predicho son
puntuaciones con ponderaciones diferenciadas, similares a las de los compuestos de Amplia habilidad cognitiva
(BCA, por sus siglas en inglés) y de Aptitud académica incluidos en la Woodcock-Johnson Psycho-Educational Battery
(Woodcock y Johnson, 1977). Mediante los métodos del componente principal (PC, por sus siglas en inglés) y de la
regresión múltiple se obtuvieron las ponderaciones diferenciadas en las pruebas que contribuyen a la GIA y el
Aprovechamiento predicho en toda la gama de la muestra normativa. Luego se calcularon, para las puntuaciones de
estos compuestos, las normas de edad y de grado, de acuerdo con los procedimientos descriptos en este capítulo. Estas
ponderaciones diferenciadas son las utilizadas en el programa Compuscore and Profiles para calcular las puntuaciones
de GIA y Aprovechamiento predicho de sujetos individuales.

Puntuaciones de la Habilidad intelectual general


Las dos puntuaciones de la GIA (GIA-Std y GIA-Ext) que aparecen en las WJ III son puntuaciones de inteligencia
general (g); corresponden al primer componente principal obtenido de los análisis del componene principal (PC). El
análisis del PC determina el primer componente (semejante a un factor en el análisis factorial) estableciendo la
combinación de pruebas mejor ponderada que da cuenta de la porción más amplia de la variancia en un conjunto de
pruebas. El empleo de ponderaciones basadas en el análisis del PC implica que todas las ponderaciones de las
subpruebas son óptimas. Por el contrario, en las escalas de inteligencia de Wechsler o en las WJ-R, todas las subpruebas
tiene iguales ponderaciones, Además, si al prescribir las distintas ponderaciones de cada prueba se toman como base los
análisis del PC de medidas cognitivas se obtiene la mejor estimación estadística de la inteligencia general.

Para calcular la puntuación g del compuesto GIA-Std, el primer paso consistió en tomar el primer componente
principal de la matriz de variancia/covariancia de las siete pruebas GIA-Std en 25 grupos etarios. Luego se graficaron las
cargas PC para cada prueba y en cada muestra de acuerdo con la mediana de las edades de la muestra. Todo el conjunto
de cargas PC correspondientes a cada una de las siete pruebas fueron suavizadas individualmente mediante los
procedimientos de ajuste de curvas polinómicas a fin de obtener el mejor ajuste para los parámetros de la muestra. Las
cargas PC suavizadas de cada prueba fueron transformadas a continuación en ponderaciones de componentes –o sea,
ponderaciones proporcionales a las cargas PC (como función del valor PC característico [eigenvalue]). Por último, estas
ponderaciones diferenciadas g fueron utilizadas para calcular las puntuaciones de los compuestos GIA-Std para todos los
sujetos de la muestra normativa. El mismo procedimiento se empleó para calcular la puntuación g de los compuestos
GIA-Ext mediante las siete pruebas adicionales de la batería extendida.

En el Apéndice C se presentan las ponderaciones GIA promedio por grupo etario técnico. Si se repasan las
ponderaciones del Cuadro C, se pone de relieve que las ponderaciones de las distintas pruebas no varían mucho en
función de la edad, Por ejemplo, las ponderaciones GIA-Std para Aprendizaje visual-auditivo van de 0.16 a 0.17. En
general, en cada grupo etario las pruebas que miden Gc (Comprensión verbal e Información general) y Gf (Formación
de conceptos y Análisis-Síntesis) son las que presentan las mayores ponderaciones, y esto concuerda con las
investigaciones existentes sobre g realizadas mediante análisis factorial (Carroll, 1993).

Puntuaciones del Aprovechamiento predicho


Una función importante de la WJ III es que permite determinar el rendimiento previsto de una persona en cuatro áreas de
aprovechamiento (Lectura, Matemáticas, Lenguaje escrito y Conocimiento), así como establecer comparaciones del
aprovechamiento predicho y el real en tales áreas. Las puntuaciones del Aprovechamiento predicho están destinadas a
proporcionar la mejor predicción posible del aprovechamiento previsto de un sujeto. El cálculo de las ponderaciones
diferenciadas para obtener las puntuaciones de Aprovechamiento predicho es muy semejante al que se realiza para obtener
las ponderaciones de g mediante el análisis PC, salvo que en lugar del análisis PC se emplea la regresión múltiple.

26
Desarrollo, estandarización y normalización
Las técnicas de regresión múltiple han sido creadas para brindar ponderaciones para un conjunto de variables
predictoras que, cuando se combinan en una medida compuesta ponderada de manera lineal, dan cuenta de la mayor
porción posible de la variancia de la variable dependiente o criterio. En el caso de las puntuaciones de Aprovechamiento
predicho de la WJ III, se emplearon técnicas de regresión múltiple a fin de determinar la combinación ponderada óptima
de siete pruebas cognitivas estándar, las que mejor predecían cada uno de los respectivos compuestos de
aprovechamiento de la WJ III –o sea, las que daban cuenta de la mayor porción de la variancia en cada uno de ellos. Se
aplicaron modelos completos de regresión para cada uno de los 25 grupos etarios, utilizando como variables
independientes (predictoras) los siete primeras pruebas de la WJ III COG y como variables dependientes (criterios) cada
uno de los compuestos de aprovechamiento (v. gr., Destrezas básicas en lectura). Luego se graficaron las ponderaciones
de regresión correspondientes a cada prueba para cada grupo etario y se suavizó la curva de un modo similar al descripto
para las ponderaciones de g en la GIA. Finalmente se calcularon las puntuaciones ponderadas de Aprovechamiento
predicho para todos los sujetos de la muestra normativa y estas puntuaciones fueron empleadas para el cálculo de las
normas de discrepancia habilidad/aprovechamiento (que describiremos más adelante en este mismo capítulo). Mediante
este procedimiento se obtienen puntuaciones de Aprovechamiento predicho que dan cuenta de las diferencias, vinculadas
con el desarrollo, entre las habilidades cognitivas y las áreas de aprovechamiento, y que permiten efectuar una
predicción óptima en cada dominio de aprovechamiento.

Cálculo de las puntuaciones equivalentes al grado y la edad


Los algoritmos para las puntuaciones de la WJ III equivalente al grado se obtuvieron del siguiente modo:
1. Se administraron pruebas a muestras representativas de alumnos todos los meses durante un ciclo lectivo
completo.
2. Para cada submuestra sucesiva de 50 sujetos ordenados por grado se calculó la mediana de las puntuaciones
W. Dichas medianas representan el percentil 50 o una puntuación estándar de 100 (M = 100; SD = 15) en
cada muestra.
3. Se graficó todo el conjunto de medianas de las puntuaciones W y se suavizaron las curvas aplicando los
procedimientos de ajuste de polinomios a fin de obtener el mejor ajuste.
4. Las ecuaciones polinómicas que generaron las curvas finales suavizadas equivalentes al grado para cada
prueba y compuesto se tomaron como algoritmos de calificación equivalente al grado y se las incluyó en el
software del programa de calificación.
La Figura 2-4 muestra la curva suavizada para la Prueba 1: Identificación de letras y palabras de la WJ III ACH.
Se puede apreciar la suavización o normalización de los saltos que pega la curva de uno a otro grado, característicos de
las cifras estadísticas derivadas de una muestra. La curva así graficada brinda mejores estimaciones de los equivalentes
para al grado de la población, al eliminar los saltos del error del muestreo. En la figura puede apreciarse que para
Identificación de letras y palabras, puntuaciones W de 400 y 450 representarían equivalentes al grado de 1.3 y 2.4,
respectivamente. La ecuación correspondiente a la curva suavizada de equivalentes para el grado que presenta la
Figura 2-4 es la base del algoritmo de calificación de los equivalentes al grado para Identificación de letras y palabras
utilizado en el programa Compuscore and Profiles.
Las ecuaciones y algoritmos para la calificación de los equivalentes para la edad se obtuvieron mediante los
mismos procedimientos empleados en el desarrollo de las ecuaciones y algoritmos para la calificación de los
equivalentes a grado. En lugar de extraer submuestras según el grado, los sujetos fueron seleccionados de acuerdo con la
edad, y luego se graficaron y suavizaron las medianas de las puntuaciones para cada grupo sucesivo de 50 sujetos.

Cálculo de las normas sobre percentiles y puntuación estándar


Como en la WJ-R (Woodcock y Johnson, 1989b), en la WJ III las puntuaciones estándar se calcularon mediante un
procedimiento especial que combina ciertas características de las transformaciones lineales y de área de la distribución
de las puntuaciones (McGrew et al., 1991). Las normas sobre percentiles y puntuación estándar para la WJ III se
elaboraron como sigue:

27
Desarrollo, estandarización y normalización
Grado
Figura 2-4.
Ejemplo de curva suavizada para la Prueba 1: Identificación de letras y palabras de la WJ III ACH.

1. El algoritmo matemático que generó los equivalentes a la edad y al grado suavizados para cada prueba y
compuesto también genera la puntuación W promedio (mediana) para los individuos de determinada edad y/o
grado en el programa Compuscore and Profiles. Por ejemplo, la ecuación/algoritmo que representa
matemáticamente la curva polinómica de la figura 2-4 indica que el alumno promedio (percentil 50) del grado
3.0 obtendría una puntuación W de 472.5 en Identificación de letras y palabras. A las puntuaciones normativas
para la edad y el grado generadas por los algoritmos de calificación en la WJ III se las denomina puntuaciones
W de referencia.
2. Como en el procedimiento ya descripto para el cálculo de los equivalentes a la edad y al grado y de las
puntuaciones W de referencia, se calcularon los percentiles 10 y 90 de cada submuestra de 50 sujetos
(seleccionados por edad o grado). Se calculó luego la diferencia entre la mediana (W de referencia) y el percentil
10, y se dividió el resultado por 1.28 a fin de estimar el desvío estándar que produciría el percentil 10 obtenido
en una distribución normal. El mismo procedimiento se siguió con la diferencia entre la mediana y el percentil
90, a fin de obtener una estimación del desvío estándar que produciría el percentil 90 obtenido en una
distribución normal. Se estimaron diferentes desvíos estándar para la distribución por encima y por debajo de la
mediana. Este método permite que la asimetría de una distribución se refleje en las tablas normativas.
3. Se graficó por edad y grado el conjunto total de desvíos estándar estimados para el percentil 10. A continuación,
estas curvas fueron suavizadas mediante la técnica de ajuste con curvas polinómicas. Igual procedimiento se
siguió para los desvíos estándar basados en los percentiles 90. Las ecuaciones matemáticas correspondientes a
cada conjunto de desvíos estándar suavizados se incorporaron como algoritmos de la calificación al programa
Compuscore and Profiles.
4. Para cada comparación normativa (basada en la edad o el grado) correspondiente a cada prueba y compuesto, se
calcula, mediante los algoritmos matemáticos representativos de las ecuaciones correspondientes a las
puntuaciones W de referencia y los desvíos estándar basados en los percentiles 10 y 90, el rango percentil y las
correspondientes puntuaciones estándar para cada puntuación obtenida. Por ejemplo, en la Figura 2-4 se advierte
que el algoritmo de la puntuación W de referencia para la Prueba 1: Identificación de letras y palabras de la
WJ III ACH revela que el alumno promedio (percentil 50) del grado 3.0 obtendría una puntuación W de 472.5.
Si dicho alumno obtuviese en Identificación de letras y palabras una puntuación en bruto de 30, ella produciría
una puntuación W de 430.76, la que está 41.69 unidades W por debajo del promedio (W de referencia) de 472.5.
Por otra parte, el algoritmo de la puntuación del desvío estándar para el percentil 10 (utilizado a raíz de que el
alumno se encuentra por debajo del promedio de los alumnos del grado 3.0) indica que el desvío estándar de las
puntuaciones en Identificación de letras y palabras para el grado 3.0 es de 32.53 unidades W. Por lo tanto, el
28
Desarrollo, estandarización y normalización
alumno se halla a 1.28 unidades de desvío estándar (z = 41.69 - 32.53 = 1.28) por debajo del promedio, valor
que puede convertirse en una puntuación estándar redondeada de 81 (100 - [1.28 × 15] = 80.8), en cuyo caso la
escala de puntuación estándar se basa en una media de 100 y un desvío estándar de 15.

Normas de discrepancia de la WJ III

Una de las ventajas de la conormalización de la WJ III COG y la WJ III ACH es la posibilidad de calcular las
puntuaciones de discrepancia para cada individuo de la muestra normativa y usar esa información para preparar normas
de discrepancia. Por ejemplo, la puntuación predicha de lectura de cada integrante de la muestra normativa se restó de su
puntuación de Comprensión de lectura y así se obtuvo una puntuación de discrepancia para esta área. En la práctica
clínica, se determina la significación estadística de toda discrepancia identificada comparándola con la distribución de
las discrepancias en la muestra normativa.

La distribución de las discrepancias en la muestra normativa proporciona los datos necesarios para calcular las
puntuaciones del desvío estándar de discrepancia (DISCREPANCY SD, por sus siglas en inglés) y del rango percentil de
discrepancia (DISCREPANCY PR, por sus siglas en inglés). En el programa Compuscore and Profiles, estas cifras se
identifican como DISCREPANCY SD y DISCREPANCY PR. La discrepancia del SD es una puntuación estandarizada
z que representa la cantidad de unidades del desvío estándar a que se encuentra la puntuación de discrepancia de un
sujeto de la puntuación de discrepancia promedio para todos los individuos que tengan su misma puntuación en
habilidad y que pertenezcan al mismo grupo etario o nivel de grado en la muestra normativa. El percentil de la
discrepancia comunica esta información como el porcentaje de individuos similares de la muestra normativa que tienen
una discrepancia igual o mayor.

La WJ III proporcionan dos series de datos sobre la discrepancia: las discrepancias habilidad/aprovechamiento
y las discrepancias intra-habilidad. A su vez, estas últimas incluyen discrepancias intra-cognitivas, discrepancias
intra-aprovechamiento y discrepancias intra-individuales (o sea, discrepancias dentro de las baterías cognitivas y de
aprovechamiento, y entre ellas).

Cálculo de las normas de discrepancia habilidad/aprovechamiento


En toda evaluación psicoeducativa, suele requerirse de los profesionales que utilicen pruebas de inteligencia o aptitud
para predecir el aprovechamiento del sujeto en un área específica de contenido o determinen la presencia y gravedad de
una discapacidad para la lectura, las matemáticas o el lenguaje. La WJ III permiten que los directivos escolares elijan
como base para el cálculo de la discrepancia habilidad/aprovechamiento ya sea el Aprovechamiento predicho, la
Habilidad intelectual general (g) o la Habilidad para el lenguaje oral. Los tres enfoques son sólidos desde el punto de
vista técnico, pero sus respectivos propósitos varían. El procedimiento preferido en psicometría es el método del
aprovechamiento predicho, que tiene la más alta correspondencia con el aprovechamiento aunque no lo mida
específicamente. No obstante, hay planes educativos estaduales o municipales que pueden exigir a este fin el empleo de
una puntuación de la inteligencia general, en cuyo caso debe escogerse como medida de la habilidad la puntuación en
Habilidad intelectual general. Algunos profesionales, sobre todo los dedicados al área de la lectura, se inclinan por una
medida del lenguaje oral, en cuyo caso debe escogerse la Habilidad para el lenguaje oral.

Los algoritmos de calificación para las discrepancias habilidad/aprovechamiento de la WJ III se obtuvieron merced
al uso de un método de regresión semejante al descripto para las discrepancias de la WJ-R (McGrew et al., 1991). Para
cada compuesto de aprovechamiento de cada sujeto de la muestra normativa se calcularon puntuaciones estándar de su
aprovechamiento predicho a través de una ecuación de regresión polinómica que incluía la puntuación de la habilidad de
cada uno. Con este paso se corregía la regresión hacia la media, como es indispensable hacer cuando una variable es
predicha a partir de otra variable o conjunto de variables correlacionadas de manera imperfecta. También se incluyeron
en la ecuación de regresión las variables de edad (o grado) a fin de dar cuenta de las diferencias de desarrollo en la
relación entre las medidas de la habilidad y del aprovechamiento.

Para todos los sujetos de la muestra normativa de la WJ III se obtuvieron puntuaciones de discrepancia habilidad/
aprovechamiento reales restando de sus puntuaciones estándar de aprovechamiento las puntuaciones estándar predichas.
29
Desarrollo, estandarización y normalización
(Esta sustracción da como resultado un valor negativo si la puntuación de aprovechamiento es inferior a la puntuación de
habilidad y un valor positivo si la puntuación de aprovechamiento es superior.) Por último, se calculó, por edad o por
grado, el desvío estándar de estas distribuciones de las puntuaciones de discrepancia habilidad/aprovechamiento basadas
en la norma (lo que a menudo se denomina el error estándar de la estimación). Dicho desvío estándar se utilizó para
determinar la significación estadística de la puntuación de discrepancia de un sujeto cuando difería de la puntuación de
discrepancia media de otros individuos con la misma habilidad y de igual edad o grado.

Este procedimiento se siguió para cada una de las combinaciones de las medidas de habilidad (Aprovechamiento
predicho, Habilidad intelectual general o Lenguaje oral) y cada compuesto de aprovechamiento (v. gr., Amplia lectura,
Destrezas básicas en escritura o Razonamiento en matemáticas).

Cálculo de las normas de discrepancia intra-cognitiva, intra-aprovechamiento e intra-individual


Los pasos seguidos para calcular las normas de discrepancia intra-cognitiva, intra-aprovechamiento e intra-individual de
las WJ III son semejantes a los descriptos para las normas de discrepancia habilidad/aprovechamiento. La principal
diferencia consiste en el uso de una puntuación promedio propia de cada individuo, tomada de un conjunto definido de
“otras” áreas cognitivas o de aprovechamiento, como puntuación predicha.

En el caso de las normas de discrepancia intra-cognitiva para la WJ III COG estándar, la medida utilizada para
obtener las puntuaciones estándar predichas para cada una de las tres puntuaciones de los compuestos está dada por el
promedio de los otros dos compuestos. Por ejemplo, el promedio de las puntuaciones de un individuo en los compuestos
Habilidad para pensar y Eficiencia cognitiva se utiliza para predecir la puntuación del compuesto Habilidad verbal. En
el caso de las normas de discrepancia intra-cognitiva para la batería WJ III COG extendida, la medida que actúa como
predictor es la puntuación promedio de los otros seis factores cognitivos. Por ejemplo, la puntuación estándar efectiva
para la Recuperación a largo plazo (Glr) se compara con las puntuaciones estándar promedio de Memoria a corto plazo
(Gsm), Rapidez en el procesamiento (Gs), Procesamiento auditivo (Ga), Percepción visual-espacial (Gv),
Comprensión-conocimiento (Gc) y Razonamiento fluido (Gf).

Para calcular las normas de discrepancia intra-aprovechamiento de la batería WJ III ACH estándar, se toma como
predictor el rendimiento promedio del sujeto de la muestra normativa en los otros tres compuestos amplios de
aprovechamiento. Por ejemplo, la puntuación de Amplia lectura se compara con el promedio de las puntuaciones de
Amplias matemáticas, Amplio lenguaje escrito y Lenguaje oral. Las normas de discrepancia intra-aprovechamiento de la
batería WJ III ACH extendida para cada uno de los nueve compuestos de aprovechamiento (Destrezas básicas en
lectura, Comprensión de lectura, Destrezas en cálculos matemáticos, Razonamiento en matemáticas, Destrezas básicas
en escritura, Expresión escrita, Expresión oral, Comprensión auditiva, Conocimientos académicos) se basan en la
comparación de cada compuesto de aprovechamiento con una puntuación predicha basada en el promedio de las otras
ocho puntuaciones.

Procedimientos semejantes se siguieron para el cálculo de las normas de discrepancia intra-individual, En las cuatro
variantes de combinaciones (cognitiva estándar y aprovechamiento estándar: 7 comparaciones; cognitiva extendida y
aprovechamiento estándar: 11 comparaciones; cognitiva estándar y aprovechamiento extendida: 12 comparaciones;
cognitiva extendida y aprovechamiento extendida: 16 comparaciones), cada puntuación del compuesto fue comparada
con su correspondiente puntuación predicha basada en el promedio de los otros compuestos cognitivos y de
aprovechamiento.

Ventajas de las normas de discrepancia de la WJ III


Cuando los examinadores no utilizan un instrumento conormalizado con normas de discrepancia, deben estimar la
magnitud de la regresión apelando a una ecuación de regresión o a un cuadro basado en ésta. Lo típico es que estas
ecuaciones se deriven a partir de unos pocos coeficientes de correlación y de muestras de tamaño reducido. En cambio,
el procedimiento empleado en la WJ III se funda en una gran muestra representativa de todo Estados Unidos e integrada
por 8,818 sujetos a quienes se les administraron tanto las baterías de habilidades cognitivas como de aprovechamiento.
30
Desarrollo, estandarización y normalización
Por otra parte, dado que todas las pruebas de la WJ III están conormalizadas, las puntuaciones de discrepancia no
contienen errores provenientes de las diferencias desconocidas que existen cuando se utilizan dos pruebas basadas en
diferentes muestras normativas.

Otra ventaja de las normas de discrepancia de la WJ III es que los examinadores pueden evaluar la significación de
una discrepancia en la población examinando ya sea el rango percentil de la discrepancia (DISCREPANCY PR) o la
diferencia entre la puntuación de aprovechamiento y la del aprovechamiento predicho en cuanto al error estándar de las
unidades estimadas (DISCREPANCY SD). Esta característica permite que el profesional, distrito escolar o estado defina
un criterio de significación en función, ora del error estándar de la estimación, ora del percentil de la discrepancia. El
error estándar de la estimación permite que el criterio se defina en función de la distancia que separa la puntuación de un
sujeto de la puntuación promedio para el subgrupo de la muestra normativa (igual edad o grado) con el cual se realiza la
comparación. El rango percentil de la discrepancia permite que el criterio se defina en función del porcentaje de la
población que se considera que posee una discrepancia grave.

31
Desarrollo, estandarización y normalización
Capítulo 3

Confiabilidad
En este capítulo se brinda información sobre la confiabilidad de las puntuaciones derivadas de las baterías
Woodcock-Johnson III (WJ III) (Woodcock, McGrew y Mather, 2001a)1. Luego de repasar algunos conceptos básicos
vinculados con el error de medición y la confiabilidad, se presentan resultados de los estudios de confiabilidad,
incluidos los relativos a la confiabilidad de las pruebas y compuestos de las WJ III. Se proporciona información acerca
de los procedimientos seguidos para obtener estos resultados. En el Cuadro 3-1 se definen algunos términos
fundamentales que ayudarán al lector a comprender mejor lo que se expone en este capítulo.

Error de medición y confiabilidad


La confiabilidad de una prueba puede definirse como el cociente de la variancia de la puntuación verdadera y la
variancia de la puntuación observada:

3.1

donde r11 es la confiabilidad de una prueba, SD2T la variancia de las puntuaciones verdaderas y SD2x la variancia de las
puntuaciones observadas.

La variancia de las puntuaciones verdaderas es la diferencia entre la variancia de las puntuaciones observadas y la
variancia de los errores de puntuación:

3.2

donde SEM2 es la variancia de los errores de puntuación (o el cuadrado del error estándar de medición).

Cuadro 3-1.
Definiciones de los términos fundamentales empleados en el Capítulo 3
Término Definición

Coeficiente de confiabilidad Índice de la precisión con la que se estima la posicion relativa dentro de un grupo. Un alto
coeficiente de confiabilidad puede deberse a la precisión de las puntuaciones (errores
estándar de medición pequeños) y/o a la gran variabilidad de las puntuaciones de una
prueba en un grupo (desvío estándar alto).

Confiabilidad entre calificadores Correlación con la cual se estima el nivel de congruencia entre calificadores
independientes que evalúan las respuestas de un sujeto.

Correlación test-retest Correlación entre dos administraciones de una misma prueba. Si el tiempo transcurrido
entre una y otra administración es breve, esta correlacion puede confundirse con los
efectos prácticos; si es prolongado, la correlación puede confundirse con una variacion
real en la característica medida.

Error estándar de medición (SEM) Índice de la precisión de las puntuaciones de una prueba. Las puntuaciones más precisas
tienen SEM (por sus siglas en inglés [Standard Error of Measurement]) relativamente más
pequeños que las menos precisas.

1
Gran parte de la información de este capítulo sobre la confiabilidad de la WJ III aplica a sus versiones en español. Para la confiabilidad de la pruebas y
compuestos sobre la versíon en español (Batería III Woodcock-Muñoz) (Muñoz-Sandoval, Woodcock, McGrew y Mather, 2005a) el lector puede remitirse al
Assessment Service Bulletin (ASB, por sus siglas en inglés) (Schrank et al., 2005) [Folleto de servicio para el evaluador].
32
Confiabilidad
Si se sustituye en la Ecuación 3.1, ésta puede expresarse como:

3.3

Esta última fórmula ofrece una expresión de la confiabilidad de una prueba que utiliza los estadísticos de la
variancia de la puntuación observada y la variancia del error de puntuación. Aplicándola a los errores de puntuación de
Rasch para los sujetos de la muestra normativa, se obtuvieron las confiabilidades de las pruebas de tiempo y de las
pruebas con sistemas de puntuación múltiple de que se da cuenta en el Apéndice A. Para calcular las confiabilidades de
todas las demás pruebas se utilizó el método de la división bipartita para la confiabilidad de la coherencia interna.

Error de medición
La raíz cuadrada de la variancia del error es el error estándar de medición (SEM). El SEM, que es el desvío estándar de
las diferencias entre las puntuaciones observadas y las verdaderas, es utilizado frecuentemente como un índice de la
precisión de las puntuaciones. La precisión de una puntuación indica la exactitud con que se puede ubicar la
puntuación verdadera en una escala.

Los errores de medición de las pruebas pueden derivarse de una fórmula tradicional que relaciona el coeficiente
de confiabilidad y el desvío estándar de un conjunto de datos:

3.4

donde SEM y SDx se computan en unidades de la escala W. Los valores del SEM son estadísticos del grupo y pueden
interpretarse como SEM promedio para las puntuaciones individuales de una edad o grado determinados. Los SEM
también pueden derivarse de un conjunto de datos mediante la siguiente fórmula:

EE
3.5

Los procedimientos del análisis de Rasch que sustentan la escala W ofrecen una estimación única del SEM
correspondiente a la puntuación de la habilidad de una persona asociada a una puntuación en bruto. Por añadidura, el
uso del modelo de Rasch y de la escala W facilita la comparación de los valores del SEM en una escala común a través
de todas las pruebas y niveles. Por ejemplo, si el SEM para la Prueba X y para una edad de 5 años es 6.0, y el SEM
para la Prueba Y y una edad de 8 años es 3.0, puede decirse que las puntuaciones de la Prueba Y para los 8 años tienen
el doble de precisión que las de la Prueba X para los 5 años. Dada una prueba de densidad uniforme (intervalos iguales
entre los ítemes en la escala de dificultad W), las estimaciones del SEM, expresadas en unidades W, son menores en la
región central de la prueba y mayores en sus extremos. En cualquier región de una prueba, el valor exacto del SEM es
función de la cantidad de ítemes (k) y de la densidad (d) de los ítemes en dicha región.

La Figura 3-1 ilustra la relación típica entre el error de medición y la habilidad en toda la amplitud de una prueba
en la escala W. Los puntos que se observan en la figura representan puntuaciones en bruto que comienzan en (W =
264.46) y llegan a 76 (W = 588.7). Repárese en que el error de medición aumenta rápidamente de magnitud a medida
que nos aproximamos a los extremos de la prueba, y que entre los valores W de la habilidad de 33.9 (puntuación en
bruto = 6) y 567.68 (puntuación en bruto = 72), las puntuaciones en bruto se hallan separadas por intervalos casi
idénticos. Esta equidistancia entre los valores W de dificultad es consecuencia de utilizar, en toda la amplitud de una
prueba, una distancia relativamente uniforme entre los ítemes con respecto a la dificultad W. Cuando los ítemes
presentan esta uniformidad, la relación entre las puntuaciones en bruto y las puntuaciones W de la habilidad será
33
Confiabilidad
Habilidad W
Nota: Los números que están junto a los puntos indican la puntuación en bruto.

Figura 3-1.
Relación entre el error de medición y la habilidad W en toda la amplitud de la Prueba 1: Identificación de letras y palabras
de la WJ III ACH.

aproximadamente lineal, salvo en los extremos superior e inferior de la curva. Esto es particularmente válido para
pruebas de gran amplitud, como las de las WJ III. La Figura 3-1 pone también de manifiesto que la escala del error de
medición está relacionada en forma directa con la escala de habilidad de toda la prueba. Este fenómeno es contrario a
la expresión de los SEM en la métrica de las puntuaciones en bruto, en cuyo caso los SEM de las puntuaciones en bruto
son, paradójicamente, menores al principio y al final de la prueba, aunque la medición se caracteriza por errores
mayores en los extremos.

Coeficientes de confiabilidad
El coeficiente de confiabilidad puede considerarse un índice de la precisión de la posición relativa dentro de un grupo,
más que de la precisión de las puntuaciones subyacentes. Al evaluar el coeficiente de confiabilidad de una prueba, el
valor obtenido puede ser bajo por dos motivos. En primer lugar, las puntuaciones tal vez sean relativamente
imprecisas, como se refleja en el valor comparativamente grande del SEM. En segundo lugar, la variancia de las
puntuaciones de la prueba en un grupo puede ser limitada, como se refleja en un desvío estándar comparativamente
pequeño. A la inversa, un coeficiente de confiabilidad alto puede obedecer a la gran precisión de las puntuaciones
(SEM reducido) y/o a una mayor variabilidad de las puntuaciones dentro del grupo (SD grande).

Si la amplitud de las puntuaciones del grupo en la característica que se mide es limitada, puede ocurrir que en una
prueba determinada se obtengan puntuaciones de gran precisión, lo cual se refleja en un SEM pequeño, pero sea escasa
la precisión de las posiciones relativas en el grupo. Se presenta una amplitud limitada de las puntuaciones y un bajo r11
resultante si el grupo seleccionado para el análisis de confiabilidad tiene una limitada amplitud de puntuaciones, o si la
característica que se mide presenta una limitada variabilidad en esa población en ese nivel particular (v. gr., en un
grupo que tenga mayoritariamente puntuaciones cero o de valores muy bajos, o que tenga mayoritariamente
puntuaciones perfectas o de valores muy altos).

Sostener que una prueba es poco confiable (o sea, deficiente) si el coeficiente de confiabilidad es bajo a raíz de
que el desvío estándar es pequeño, es lo mismo que concluir que una determinada vara de medida es poco confiable
como instrumento de medición porque todo lo que uno mide con ella tiene aproximadamente un metro de largo. El
Cuadro 3-2 ilustra este punto para las WJ III. En él se consignan el SEM, el SD y el r11 para las edades de 8 años y de
50 a 59 años en la prueba de Integración de sonidos. Nótese que el coeficiente de confiabilidad de esta prueba es
relativamente bajo para la edad de 8 años (.82) si se lo compara con el correspondiente a los 50 a 59 años (.93). Un
examen atento del Cuadro 3-2 revela que la precisión de las puntuaciones de la prueba, tal como la indican los SEM, es
más o menos la misma para ambas edades (5.13 y 5.29, respectivamente). La diferencia de los coeficientes de
confiabilidad se debe a que en las edades 50 a 59 la amplitud de la habilidad (SD) en esta prueba es mayor (19.37) que
a los 8 años (12.13). La prueba en sí es tan precisa a los 8 años como a los 50 a 59 años; la aparente precisión de las
posiciones relativas no es tan buena a los 8 años porque a esa edad la amplitud de las diferencias individuales en la
población es menor. Por lo tanto, el coeficiente de confiabilidad relativamente bajo a los 8 años depende de la muestra
utilizada y no de la prueba.
34
Confiabilidad
Cuadro 3-2.
Datos de confiabilidad seleccionados de la Prueba 4: Integración de sonidos de la WJ III COGa
EDAD
Estadístico 8 50-59
SEM 5.13 5.29
SD 12.13 19.37
r11 .82 .93
Nota: Los SEM y SD se expresan en unidades de la escala W.
a
En algunos países hispanohablantes (Argentina, Cuba, España), el punto indica los miles y la coma los decimales. Sin embargo, en estos
manuales se ha utilizado la coma para los miles y el punto para los decimales, según el uso en México, Puerto Rico, República Dominicana, entre
otros países.

Confiabilidad de las pruebas


Se calcularon los estadísticos de confiabilidad para todas las pruebas de las WJ III en toda la amplitud de las
aplicaciones que se desea darles y para todos los sujetos de la muestra normativa a quienes se administraron las
pruebas en cada grupo etario técnico.2 Para todas las pruebas, menos las de tiempo y las de ítemes con múltiples
puntos, la confiabilidad se calculó mediante el método de la división bipartita.3 Para el cálculo de los coeficientes de la
división bipartita se emplearon datos procedentes de los ítemes impares y pares de la prueba. Los niveles básicos y
máximos aplicados en el estudio de calibración-normalización fueron lo bastante rigurosos como para que la
probabilidad de fallar en un ítem por debajo del nivel básico, o de sobrepasar el nivel máximo, fuese muy baja. En
consecuencia, todas las respuestas a un ítem que estuvieran por debajo del nivel básico de un sujeto se consideraron
correctas y todas las que estuvieran por encima del nivel máximo se consideraron incorrectas. Todos los coeficientes
del método de la división bipartita fueron corregidos según la extensión de la prueba publicada mediante la fórmula de
corrección de Spearman-Brown.

Dado que el método de la división bipartita era inapropiado para ciertas pruebas, en el caso de las pruebas de
tiempo o rapidez de las WJ III (Pareo visual, Fluidez de recuperación, Rapidez en la decisión, Rapidez en la
identificación de dibujos, Cancelación de pares, Fluidez en la lectura, Fluidez en matemáticas y Fluidez en la
escritura), así como de aquellas que tienen ítemes con puntuaciones de múltiples puntos (Relaciones espaciales,
Fluidez de recuperación, Reconocimiento de dibujos, Planeamiento, Rememoración de cuentos, Memoria
diferida – Rememoración de cuentos, Muestras de redacción y Análisis de sonidos), la confiabilidad se calculó
mediante procedimientos del análisis de Rasch. Los procedimientos de Rasch que sustentan la escala W suministran
una singular estimación del error estándar de medición para la puntuación de habilidad asociada con cada
puntuación original de cada integrante de la muestra normativa. Si se cuenta con los errores individuales (SEM) de
todos los sujetos que completaron una prueba, es posible calcular directamente la confiabilidad de ésta mediante la
Ecuación 3.3. Primero se calcula la variancia de la puntuación observada (SDx2) y la variancia del error de puntuación
(SEM 2) para todos los sujetos de la muestra normativa, y luego se obtiene la confiabilidad introduciendo directamente
estos valores en la Ecuación 3.3.

2
Hasta los 19 años, el grupo etario técnico incluye a todos los sujetos que tienen la misma edad en años. Por ejemplo, los sujetos cuya edad es 11.2 y 11.9 forman
parte del grupo etario técnico de 11 años. En cambio, para las personas adultas, el grupo etario técnico abarca al conjunto de adultos cuya edad oscila dentro de un
intervalo de 20 años (v. gr., 20-39 años, 40-59 años, etc.)
3
Los métodos de confiabilidad de coherencia interna se basan en la premisa de que la correlación promedio entre los ítemes de una prueba es igual a la correlación
promedio entre los ítemes de las formas hipotéticas alternativas de esa misma prueba creadas dividiéndola en dos pruebas menores (v. gr., una basada en los
ítemes impares, la otra en los ítemes pares). Esta premisa no se cumple cuando las pruebas contienen ítemes que generan una gama de puntuaciones distintas. La
división de la prueba en dos partes iguales puede generar pruebas que ya no sean equivalentes –una de ellas puede contener ítemes con puntuaciones máximas
muy superiores a las del otro conjunto de ítemes.

35
Confiabilidad
En el Apéndice A se indican los coeficientes de confiabilidad (r11) y los errores estándar de medición (SEM)
obtenidos por medio del procedimiento que acabamos de señalar. Los SEM se expresan tanto en unidades de la escala
W como en unidades de puntuación estándar (SS). Los cuadros del Apéndice A incluyen, asimismo, la media y el
desvío estándar en escala W de las pruebas.

El error estándar del coeficiente de confiabilidad indica dentro de qué banda de confianza se hallaría
presuntamente el coeficiente de confiabilidad verdadero. En el Cuadro 3-3 se indica la banda de confianza del 68%
para varias magnitudes habituales de la confiabilidad y tamaños de muestra. Estas bandas de confianza se
determinaron transformando primero los valores de la confiabilidad en valores z' de Fisher mediante tablas estadísticas
corrientes. Los errores estándar de los valores z' se calcularon con la siguiente ecuación:

DEz´ = 3.6

Una vez determinadas las bandas de confianza para los valores z', volvió a convertírselos a fin de obtener la escala
de confiabilidad del Cuadro 3-3.

Si se examinan las medianas de las confiabilidades para cada prueba que se dan en el Apéndice A, puede
establecerse en qué medida la confiabilidad de cada prueba se halla en el nivel deseado de .80 o más. De las 42
medianas de las confiabilidades de pruebas examinadas, 38 son de .80 o más y 11 son de .90 o más. Si bien estas son
confiabilidades altas para pruebas individuales, las puntuaciones recomendadas para su interpretación son las de los
compuestos, particularmente cuando se deben tomar decisiones importantes sobre un individuo. Dichas puntuaciones
se basan en la combinación de dos o más pruebas, y, por ende, poseen un grado de confiabilidad siempre superior.

Cuadro 3-3.
Bandas de confianza de ±1 SEM para valores selecionados de la confiabilidad y del tamaño de la muestra
TAMAÑO DE LA MUESTRA
Confiabilidad 100 200 300
.800 .760-.835 .773-.824 .782-.815
.900 .879-.918 .886-.912 .890-.909
.950 .939-.959 .942-.957 .945-.954

Confiabilidad de los compuestos


La confiabilidad de las puntuaciones compuestas ponderadas puede calcularse mediante la siguiente ecuación
(Mosier, 1943):

3.7

donde rcc es la confiabilidad de un compuesto; wj, la ponderación asignada a la prueba j; wk, la ponderación asignada a
la prueba k; SDj, el desvío estándar de la prueba j; SDk, el desvío estándar de la prueba k; rjj, la confiabilidad de la
prueba j; y rjk, la correlación entre las pruebas j y k. La Ecuación 3.7 fue utilizada para calcular las confiabilidades de
los compuestos Aprovechamiento predicho y Habilidad intelectual general, que tienen ponderaciones diferenciadas en
las WJ III.

36
Confiabilidad
Las confiabilidades de los compuestos de las WJ III que tienen igual ponderación se calcularon merced a una
simplificación de la Ecuación 3.7, ya que en tal caso todos los términos w asumen el valor de 1. En consecuencia, la
Ecuación 3.7 adopta la siguiente forma simplificada:

3.8

La relación existente entre la confiabilidad del compuesto, el desvío estándar y el error estándar de medición es
la siguiente:

3.9

donde SEMc es el error estándar de medición para dicho compuesto y SD el desvío estándar del mismo. Repárese en
que la Ecuación 3.9 es semejante a la Ecuación 3.3.

En el Apéndice B se dan las medias, los desvíos estándar, las confiabilidades de las puntuaciones del compuesto
y los errores estándar de medición de los compuestos para todos sus usos previstos y para todos los grupos etarios
técnicos. Los valores del SEM se expresan en unidades W y en unidades de puntuación estándar (SS). Si se examina
la mediana de las confiabilidades de cada compuesto se podrá comprobar que la mayoría de ellas tienen un valor de
.90 o más.

Confiabilidad test-retest: pruebas de tiempo


Se llevó a cabo un estudio especial de test-retest con las ocho pruebas de tiempo, que miden la rapidez4, de las WJ III
(Pareo visual, Rapidez en la decisión, Fluidez de recuperación, Rapidez en la identificación de dibujos, Cancelación
de pares, Fluidez en la lectura, Fluidez en matemáticas y Fluidez en la escritura). Estas ocho pruebas fueron
administradas en orden balanceado a 165 sujetos de tres muestras de diferentes edades. Dado que habitualmente los
estudios de test-retest tradicionales generan estimaciones confusas de la confiabilidad de una prueba, ya que no toman
en cuenta la estabilidad de las características del sujeto (McGrew, Werder y Woodcock, 1991), en este estudio el
intervalo de retest se fijó en un día, con el objeto de reducir al mínimo (aunque no se pudiera eliminar por completo)
los cambios en las puntuaciones de la prueba debidos a los cambios sobrevenidos en los estados anímicos o rasgos de
los sujetos. El Cuadro 3-4 contiene los estadísticos descriptivos y la confiabilidad test-retest de las pruebas de tiempo.

En general, las confiabilidades para las pruebas de tiempo que figuran en el Cuadro 3-4 son inferiores a las que
aparecen para esas mismas pruebas en el Apéndice A. Por ejemplo, la mediana de las confiabilidades (calculadas
según las puntuaciones de error de Rasch) para Fluidez de recuperación es en el Apéndice A de .97, en tanto que en el
Cuadro 3-4 los valores oscilan entre .81 y .85. Debe considerarse que las cifras del Apéndice A y del Cuadro 3-4
constituyen la confiabilidad máxima y mínima, respectivamente, de las ocho pruebas de tiempo de las WJ III.

Confiabilidad test-retest: intervalos de retest ampliados


En esta sección describiremos dos estudios de test-retest. El primero da cuenta de las correlaciones test-retest de 15
pruebas cognitivas y de aprovechamiento con intervalos de retest que van de menos de un año a diez años. El segundo
se refiere a las correlaciones test-retest de 17 pruebas de aprovechamiento y 12 compuestos de aprovechamiento, con
un intervalo de retest de un año en todos los casos.

4
En inglés se las designa como “Speeded Tests”. Son las pruebas que se realizan bajo la presión de un tiempo límite.

37
Confiabilidad
Cuadro 3-4.
Estadísticos descriptivos y confiabilidades test-retest para las pruebas de tiempo de las WJ III
7-11 AÑOS
Media Desvío estándar
Prueba n Test Retest Test Retest r12
Pareo visual 59 482.24 487.00 25.02 25.70 .87
Rapidez en la decisión 55 491.21 510.75 20.55 22.89 .80
Fluidez de recuperación 59 499.38 501.21 3.80 3.61 .81
Rapidez en la identificación de dibujos 59 485.88 490.15 23.66 29.37 .78
Cancelación de pares 59 495.73 501.64 9.05 10.50 .84
Fluidez en la lectura 30 479.12 478.76 34.24 36.17 .94
Fluidez en matemáticas 59 495.56 496.45 7.7 8.64 .95
Fluidez en la escritura 57 485.67 489.40 14.28 14.47 .76

14-17 AÑOS
Media Desvío estándar
Prueba n Test Retest Test Retest r12
Pareo visual 50 545.06 553.05 18.12 21.96 .76
Rapidez en la decisión 48 531.88 557.96 17.82 20.01 .73
Fluidez de recuperación 51 505.76 506.90 2.94 2.70 .85
Rapidez en la identificación de dibujos 52 535.41 550.46 25.16 28.89 .78
Cancelación de pares 50 520.95 528.32 9.50 10.29 .78
Fluidez en la lectura 28 532.60 545.18 34.28 38.36 .80
Fluidez en matemáticas 52 518.33 521.80 9.01 10.19 .89
Fluidez en la escritura 51 540.95 546.06 15.70 14.93 .84

26-79 AÑOS
Media Desvío estándar
Prueba n Test Retest Test Retest r12
Pareo visual 54 538.36 542.49 19.09 20.83 .70
Rapidez en la decisión 54 516.45 529.54 16.22 18.18 .73
Fluidez de recuperación 54 506.81 507.91 3.21 3.02 .82
Rapidez en la identificación de dibujos 53 548.90 562.82 32.84 33.78 .86
Cancelación de pares 52 512.33 517.83 9.33 9.40 .69
Fluidez en la lectura 23 560.63 570.83 45.14 57.07 .94
Fluidez en matemáticas 53 520.33 524.21 12.46 12.12 .96
Fluidez en la escritura 53 539.53 542.81 17.87 15.86 .87

Nota: Las edades medias, en meses, para los tres grupos etarios son 11.57 (SD = 8.87), 191.58 (SD = 11.1) y 687.11 (SD = 136.74),
respectivamente.

38
Confiabilidad
En el Cuadro 3-5 aparecen las correlaciones test-retest para cuatro grupos etarios y tres intervalos test-retest. En
este estudio se administraron diversas pruebas tomadas de la WJ III Tests of Achievement (WJ III ACH) (Woodcock,
McGrew y Mather, 2001b) y de la WJ III Tests of Cognitive Abilities (WJ III COG) (Woodcock, McGrew y Mather,
2001c). Dos de las mediciones efectuadas no son versiones exactas de las pruebas de las WJ III. La de Sinónimos/
Antónimos incluye las subpruebas B y C de la prueba Comprensión verbal de las WJ III; la de Ortografía, Puntuación
y mayúsculas es una combinación de dos pruebas de la WJ III ACH. En el Cuadro 3-6 se presenta la distribución de la
muestra total de 1,196 sujetos por edad e intervalo de retest.
Los resultados del segundo estudio se basaron en una muestra de 457 sujetos de 4 a 17 años, con un intervalo de
retest de un año. El Cuadro 3-7 da cuenta de las correlaciones test-retest para las 17 pruebas y los 12 compuestos de
aprovechamiento de la WJ III ACH.

En el Cuadro 3-5 se aprecia que la mediana de las confiabilidades para toda la amplitud de las pruebas de
Conocimientos adquiridos oscila entre .78 y .96, con una mediana de .88. Para las pruebas de Habilidades para pensar
(mediana = .73) y de Eficiencia cognitiva (mediana = .78) las confiabilidades fueron algo menores, como era previsible
teniendo en cuenta que se trata de rasgos menos estables a lo largo del tiempo. La mediana de la confiabilidad de retest
para las 29 cifras de confiabilidad de todas las edades incluidas en el Cuadro 3-7 fue de .94. Estas correlaciones
test-retest, que abarcan sujetos de distinto nivel de desarrollo y diferentes intervalos de retest, avalan la confiabilidad
de las mediciones correspondientes a los intervalos de retest más prolongados, sea cual fuere la prueba administrada.

Cuadro 3-5.
Correlaciones test-retest según edad e intervalo de retest
EDAD DE LA PRIMERA ADMINISTRACIONa
Intervalo de retest
Prueba (en años) 2a7 8 a 18 19 a 44 45 a 95 Mediana
Conocimientos adquiridos
Sinónimos/Antónimos <1 — .94 .91 .92 .92
1a2 .83 .91 .89 .90 .90
3 a 10 .75 .85 .85 .90 .85
Conocimientos académicos <1 .96 .98 .91 .96 .96
1a2 .87 .94 .89 .92 .90
3 a 10 .88 .89 .90 .88 .88
Identificación de letras y <1 .96 .95 .90 .95 .95
palabras
1a2 .91 .88 .79 .93 .90
3 a 10 .87 .88 .87 .90 .88
Comprensión de textos <1 — .91 .84 .85 .85
1a2 .75 .80 .62 .87 .78
3 a 10 .59 .80 .79 .82 .80
Problemas aplicados <1 .90 .92 .84 .88 .89
1a2 .85 .86 .88 .84 .86
3 a 10 .90 .81 .84 .80 .82
Ortografía/Puntuación y <1 .85 .95 .83 .90 .88
mayúsculas
1a2 .84 .92 .84 .93 .88
3 a 10 .89 .92 .88 .93 .88
a
Las correlaciones fueron corregidas por edad e intervalo de retest dentro de cada casillero de edad por intervalo.

39
Confiabilidad
Cuadro 3-5. (cont.)
Correlaciones test-retest según edad e intervalo de retest
EDAD DE LA PRIMERA ADMINISTRACIONa
Intervalo de retest
Prueba (en años) 2a7 8 a 18 19 a 44 45 a 95 Mediana
Habilidades para pensar
Memoria para nombres
<1 .84 .62 .71 .66 .68
1a2 .71 .74 .73 .79 .74
3 a 10 .42 .64 .66 .63 .64
Integración visual <1 .86 .76 .67 .82 .79
1a2 .82 .76 .73 .88 .79
3 a 10 .73 .61 .70 .82 .72
Palabras incompletas <1 .75 .71 .67 .77 .73
1a2 .76 .62 .64 .71 .68
3 a 10 .77 .66 .74 .74 .74
Formación de conceptos <1 — .69 .77 .88 .77
1a2 .82 .76 .66 .74 .75
3 a 10 .35 .55 .69 .68 .62
Análisis-Síntesis <1 — .69 .83 .86 .83
1a2 .70 .69 .56 .86 .70
3 a 10 .59 .44 .63 .67 .61
Eficiencia cognitiva
Pareo visual
<1 — .86 .80 .94 .86
1a2 .80 .89 .78 .87 .84
3 a 10 .73 .71 .83 .87 .78
Tachar <1 — .88 .81 .81 .81
1a2 .80 .83 .78 .84 .82
3 a 10 .47 .71 .80 .81 .76
Memoria para palabras <1 — .77 .61 .71 .71
1a2 .57 .63 .72 .53 .60
3 a 10 .77 .62 .66 .46 .64
Memoria para frases <1 .81 .87 .75 .74 .78
1a2 .80 .84 .77 .61 .78
3 a 10 .78 .77 .76 .75 .76
a
Las correlaciones fueron corregidas por edad e intervalo de retest dentro de cada casillero de edad por intervalo.

Estudios de confiabilidad entre calificadores


Pruebas que requieren escritura, Muestras de redacción, Fluidez en la escritura y la medición de Escritura a mano,
exigen una evaluación subjetiva de las respuestas. Los estudios de confiabilidad entre calificadores llevados a cabo
para ello fueron realizados y comunicados durante el proceso de estandarización de la Woodcock-Johnson
Psycho-Educational Battery–Revised (WJ-R) (Woodcock y Johnson, 1989b; McGrew et al., 1991). Aquí volvemos
a referirnos a dichos estudios con el objeto de avalar las características de confiabilidad entre calificadores de las
versiones de estas medidas que se presentan en las WJ III (las medidas no se han modificado respecto de WJ-R).

40
Confiabilidad
Cuadro 3-6.
Distribución de los sujetos del Cuadro 3-5 por edad e intervalo de retest
EDAD EN LA PRIMERA ADMINISTRACION

Intervalo de retest (en años) 2a7 8 a 18 19 a 44 45 a 95 Total de sujetos


Menos de 1 52 68 86 38 244
1a2 114 158 96 73 441
3 a 10 69 139 147 156 511
Total de sujetos 235 365 329 267 1196

Cuadro 3-7.
Correlaciones test-retest a un año para pruebas y compuestos seleccionados de la WJ III ACH
EDAD EN LA PRIMERA ADMINISTRACIONa
Todas las
Prueba/Compuesto Estadístico 4a7 8 a 10 11 a 13 14 a 17 edades
Prueba
Identificación de letras y
n 106 145 104 98 453
palabras
r12 .92 .85 .84 .83 .95
Fluidez en la lectura n 39 101 81 74 295
r12 .59 .78 .70 .79 .88
Comprensión de textos n 105 145 104 98 452
r12 .89 .86 .76 .73 .92
Análisis de palabras n 104 145 96 90 435
r12 .79 .81 .73 .63 .83
Vocabulario de lectura n 71 103 88 72 334
r12 .84 .74 .76 .67 .89
Cálculo n 95 145 101 95 436
r12 .87 .83 .81 .76 .94
Fluidez en matemáticas n 80 143 101 95 419
r12 .75 .86 .89 .92 .95
Problemas aplicados n 106 143 102 98 449
r12 .92 .85 .88 .89 .96
Ortografía n 106 145 102 96 449
r12 .91 .88 .75 .91 .95
Fluidez en la escritura n 53 138 95 92 378
r12 .65 .77 .75 .70 .88
Muestras de redacción n 92 144 100 94 430
r12 .82 .65 .73 .76 .88
Corrección de textos n 78 135 94 93 400
r12 .72 .75 .63 .63 .85
Puntuación y mayúsculas n 52 137 93 91 373
r12 .80 .86 .83 .85 .92
Escritura a mano n 87 144 99 94 424
r12 .67 .69 .64 .60 .69
Rememoración de cuentos n 91 133 96 95 415
r12 .69 .53 .58 .62 .70
Comprensión oral n 104 144 102 97 447
r12 .82 .74 .84 .82 .88
Conocimientos académicos n 106 143 103 98 450
r12 .84 .83 .85 .88 .94
a
Las correlaciones han sido corregidas por edad dentro de cada nivel de edad.

41
Confiabilidad
Cuadro 3-7. (cont.)
Correlaciones test-retest a un año para pruebas y compuestos seleccionados de las WJ III ACH
EDAD EN LA PRIMERA ADMINISTRACIONa
Todas las
Prueba/Compuesto Estadístico 4a7 8 a 10 11 a 13 14 a 17 edades
Compuesto
Aprovechamiento total
n 49 133 90 90 362
r12 .96 .97 .95 .96 .99
Destrezas académicas n 95 145 101 95 436
r12 .95 .92 .90 .91 .98
Fluidez académica n 50 136 92 91 369
r12 .74 .90 .86 .88 .95
Aplicaciones académicas n 93 142 100 94 429
r12 .94 .90 .90 .91 .97
Amplia lectura n 105 145 104 98 452
r12 .92 .93 .89 .90 .97
Destrezas básicas en n 104 145 96 90 435
lectura
r12 .92 .90 .86 .82 .95
Comprensión de lectura n 74 103 88 72 337
r12 .92 .88 .85 .81 .95
Amplias matemáticas n 80 141 98 94 413
r12 .94 .92 .92 .91 .98
Destrezas en cálculos n 80 143 99 94 416
matemáticos
r12 .89 .89 .86 .82 .96
Amplio lenguaje escrito n 52 137 93 91 373
r12 .92 .90 .87 .90 .97
Destrezas básicas en n 79 135 93 91 398
escritura
r12 .87 .89 .80 .82 .94
Expresión escrita n 52 137 93 91 373
r12 .83 .83 .82 .79 .93
a
Las correlaciones han sido corregidas por edad dentro de cada nivel de edad.

El Cuadro 3-8 da cuenta de los resultados de tres estudios de intercalificación para la prueba Muestras de
redacción. Para los Estudios 1 y 2 se dan las medias y desvíos estándar de las puntuaciones en bruto, y para el
Estudio 3, las puntuaciones W. El Estudio 1 se basa en datos de una selección aleatoria de sujetos pertenecientes a
los grados 2, 9 y 16 de la muestra normativa de las WJ-R. Este estudio empleó las reglas y criterios de calificación
desarrollados para la prueba Muestras de redacción. Todos los calificadores tenían experiencia anterior en la
calificación de pruebas de redacción o habían recibido una breve capacitación y práctica de aproximadamente dos
horas de duración. Entre los seis calificadores que evaluaron las pruebas independientemente en los tres niveles de
grado se observó una intercorrelación típica de alrededor de .90. (Adviértase que estas intercorrelaciones reflejan un
acuerdo entre los calificadores que evaluaron los protocolos completos de cada sujeto.) Dado que el número de ítemes
evaluados para cada sujeto en este estudio era inferior a los 15 ítemes que suelen presentarse en la administración de
una prueba estándar, la mediana de las correlaciones entre calificadores se corrigió por extensión utilizando la fórmula
de Spearman-Brown. En el Estudio 1 no se intentó estimar en cuánto mejoraba la confiabilidad entre calificadores si se
hacía que dos de ellos evaluasen conjuntamente al mismo sujeto.

42
Confiabilidad
Cuadro 3-8.
Confiabilidad entre calificadores para la prueba Muestras de redacción
CONFIABILIDAD ENTRE CALIFICADORES
CONFIABILIDAD ENTRE CALIFICADORES INDEPENDIENTES
POR CONSENSO DE PARES

Mediana de las Mediana de las


Mediana correlaciones Cantidad de Mediana correlaciones
Cantidad de Cantidad de las corregida por pares de de las corregida por
Nivel n calificadores de ítemes Media SD correlaciones extensión calificadores Media SD correlaciones extensión

Estudio 1
Grado 2 19 6 11 8.2 3.5 .91 .93 — — — — —
Grado 9 20 6 13 18.8 4.7 .89 .90 — — — — —
Grado 16 18 6 13 17.1 4.5 .88 .90 — — — — —
Estudio 2
Grado 3 21 6 6 13.4 6.0 .98 .99 3 13.3 6.0 .99 1.00
Secundaria 14 6 7 12.4 3.1 .92 .97 3 12.4 3.1 .95 .98
y universitaria
Estudio 3
Muestra con 47 4 15 502.3 8.3 .93 — — — — — —
discapacidades
de aprendizaje

En el Estudio 2, al que se refiere el Cuadro 3-8, calificadores capacitados evaluaron protocolos elegidos al azar de
alumnos primarios de tercer grado y de estudiantes secundarios y universitarios. Entre los seis calificadores que
evaluaron en forma independiente el mismo conjunto de pruebas en los dos niveles se obtuvo una intercorrelación
típica de alrededor de .98. Ello indica que calificadores que hayan recibido capacitación y que trabajen solos pueden
evaluar la prueba Muestras de redacción con una adecuada confiabilidad. No está demostrado que el hecho de que un
par de calificadores capacitados evalúe conjuntamente las pruebas mejore en forma significativa la confiabilidad, no
obstante lo cual, esta práctica es muy aconsejable cuando los calificadores están aprendiendo a evaluar la prueba
Muestras de redacción.

El Estudio 3 (ver el Cuadro 3-8) se basa en datos de 47 sujetos con discapacidades de aprendizaje (Mather, Vogel,
Spodak y McGrew, 1991). A cada sujeto se le administró la Forma A de la prueba Muestras de redacción y cuatro
calificadores capacitados evaluaron de modo independiente los 47 protocolos. La mediana de las intercorrelaciones
entre ellos fue de .93. Los resultados del estudio vienen a corroborar que los calificadores que hayan sido capacitados
pueden evaluar en forma confiable la prueba Muestras de redacción aunque trabajen por separado.

El Cuadro 3-9 informa acerca de los resultados de un estudio de confiabilidad entre calificadores realizado en
cuatro niveles (grado 3, grado 7, estudiantes universitarios y adultos) con datos provenientes de la prueba Fluidez en la
escritura. Se extrajeron al azar los protocolos de 35 sujetos en cada nivel de los datos normativos y se dispuso que tres
calificadores independientes evaluasen la producción de cada sujeto. La primera calificación provino de un integrante
del personal del proyecto capacitado durante el proceso de estandarización; las otras dos fueron asignadas
posteriormente de modo independiente por sendos calificadores. Entre las tres calificaciones de la producción de un
sujeto en cada uno de los cuatro niveles se observó una intercorrelación típica de .98. Estos resultados sugieren que
la prueba Fluidez en la escritura puede ser puntuada en forma confiable por un calificador que trabaje solo que haya
sido capacitado.

43
Confiabilidad
Cuadro 3-9.
Confiabilidad entre calificadores para la prueba Fluidez en la escritura
Mediana de las
confiabilidades
entre
Nivel Calificador n M SD calificadores
Grado 3 Normativo 35 11.8 4.6
Calificador 1 35 11.4 4.4 .98
Calificador 2 35 11.5 4.4
Grado 7 Normativo 35 22.0 4.4
Calificador 1 35 21.6 4.5 .98
Calificador 2 35 21.7 4.4
Universitarios Normativo 35 28.1 4.7
Calificador 1 35 27.3 5.0 .96
Calificador 2 35 27.5 4.9
Adultos Normativo 35 26.6 5.9
Calificador 1 35 26.2 5.8 .99
Calificador 2 35 26.0 5.7

El Cuadro 3-10 muestra los resultados de un estudio de confiabilidad entre calificadores realizado con los
resultados de datos de Escritura a mano provenientes de una muestra seleccionada al azar de sujetos normativos en
cuatro niveles (grado 3, grado 7, universitarios y adultos). Se obtuvieron tres calificaciones independiente para cada
sujeto. La primera fue asignada por un integrante del personal del proyecto durante el proceso de estandarización de la
calificación, y las otras dos fueron asignadas luego de modo independiente por dos calificadores experimentados. Entre
las tres calificaciones de la producción de un sujeto en cada uno de los cuatro niveles se observó una intercorrelación
típica de .78, lo cual indica que la Escritura a mano se caracteriza por una menor confiabilidad entre calificadores que
Muestras de redacción o Fluidez en la escritura. Aunque no existen datos que documenten el efecto positivo de sumar
el concurso de dos calificadores, en lo posible la Escritura a mano debería ser evaluada en forma conjunta por dos de
ellos, pues así podría mejorar significativamente la confiabilidad de las puntuaciones asignadas a esta prueba.

Cuadro 3-10.
Confiabilidad entre calificadores para Escritura a mano
Mediana de las
confiabilidades
entre
Nivel Calificador n M SD calificadores
Grado 3 Normativo 35 3.49 1.27
Calificador 1 35 3.10 1.30
.75
Calificador 2 35 3.64 1.39
Grado 7 Normativo 35 4.29 1.54
Calificador 1 35 4.11 1.12
.81
Calificador 2 35 4.33 1.53
Universitarios Normativo 30 5.67 1.47
Calificador 1 30 5.20 1.43
.85
Calificador 2 30 5.30 1.76
Adultos Normativo 39 5.74 1.43
Calificador 1 39 5.49 1.54
.71
Calificador 2 39 5.18 1.70

44
Confiabilidad
Equivalencia de las formas alternativas de una prueba
La cuestión fundamental en la evaluación de formas alternativas de una misma prueba es saber si las puntuaciones de
las distintas formas miden en esencia la misma construcción teórica, con niveles semejantes de confiabilidad y de error
de medición. Dada la gran cantidad de pruebas que componen la WJ III ACH, aquí sólo presentaremos algunos
ejemplos que abonan la equivalencia de las Formas A y B. La elaboración de estas formas alternativas de las Pruebas
de aprovechamiento se basó en el método global en espiral. A partir de los ítemes más sencillos de un banco de ítemes,
éstos fueron asignados alternadamente a una u otra forma. En el caso típico, los bancos incluían de 100 a 400 ítemes y
contenían datos de 10,000 a 15,000 sujetos.

La asignación de los ítemes tuvo dos objetivos. El primero era obtener un gradiente de dificultad de alrededor de
tres ítemes por una variación de diez unidades W de dificultad. Si se dispusiera de un número suficiente de ítemes, en
los extremos inferior y superior de la escala de dificultad, el gradiente aumentaría a cuatro o cinco ítemes. El segundo
objetivo era ofrecer una combinación pareja de contenido en ambas formas. Por ejemplo, la prueba Conocimientos
académicos se divide en tres subpruebas (Ciencia, Estudios sociales y Humanidades), que se distribuyeron de modo
parejo entre las Formas A y B. La cobertura equivalente de las dos formas es ilustrada, además, por la selección de los
ítemes de cada subprueba. Por ejemplo, los ítemes de la subprueba Humanidades miden aspectos de la literatura, las
artes plásticas y la música. Al seleccionar los ítemes, se estableció una correspondencia en la asignación de los tres
tipos de ítemes a cada forma. A medida que se seleccionaban ítemes de dificultad creciente, se mantuvo la distribución
de los ítemes de literatura, artes plásticas y música en las dos formas.

La Figura 3-2 evidencia las ventajas del uso del método global en espiral para los bancos de ítemes. En ella se
grafica el nivel de dificultad de los 45 ítemes de la Prueba 5: Cálculo de la WJ III ACH en las Formas A y B,
respectivamente. Se pone de manifiesto una clara tendencia lineal (r = .99), la cual indica que la amplitud y densidad
de la habilidad W medida es similar en ambas formas de la prueba.
Dificultidades del ítem en la Forma B

Dificultades del ítem en la Forma A

Figura 3-2.
Gráfico de las dificultades W para 45 ítemes de las Formas A y B de la Prueba 5: Cálculo de la WJ III ACH.

45
Confiabilidad
En la Figura 3-3 se comparan las ojivas de puntuación en bruto/habilidad W en las Formas A y B. Puede apreciarse
que las dos ojivas son casi idénticas en toda la amplitud de valores de habilidad, lo cual permite interpretar que las
diferentes formas miden la misma construcción teórica subyacente.

Las formas alternativas de una prueba pueden evaluarse, asimismo, examinando si sus errores estándar son
comparables. La Figura 3-4 presenta los errores estándar (por nivel de la habilidad W) para las dos formas de la prueba
Cálculo. Si se examinan los errores estándar asociados con el rasgo medido en dicha prueba, se observa que la Forma
A y la Forma B son comparables en toda la amplitud de la escala de la característica subyacente.

Por último, la prueba Comprensión de textos brinda nueva evidencia en favor del desarrollo de formas alternativas en la
WJ III. Se correlacionaron, para las Formas A y B de dicha prueba, las puntuaciones W de Rasch. El Cuadro 3-11 presenta
las correlaciones de las dos formas para grupos etarios técnicos seleccionados. La mediana de las correlaciones de las dos
formas fue de .85 en toda la amplitud de los 11 grupos de edades, y la mayoría de las correlaciones iban de .85 a .96.
Puntuación en bruto

Habilidad W

Figura 3-3.
Comparación de las ojivas de puntuación en bruto/habilidad W en las Formas A y B de la Prueba 5: Cálculo de la WJ III ACH.

Habilidad W

Figura 3-4.
Comparación de los errores estándar por niveles de habilidad W en las Formas A y B de la Prueba 5: Cálculo de la WJ III ACH.

46
Confiabilidad
Cuadro 3-11.
Correlaciones seleccionadas entre las puntuaciones de las Formas A y B de Comprensión de textos
EDAD

Estadístico 5 7 9 11 13 15 17 20-29 40-49 60-69 85+

rab .96 .92 .87 .84 .85 .80 .85 .84 .89 .84 .92
n 204 337 413 381 311 302 245 900 369 141 177

La similitudes en las dificultades de los ítemes, en las ojivas de las respuestas y en los errores estándar por nivel de
habilidad para ambas formas de la prueba Cálculo, así como las fuertes correlaciones entre las formas alternativas para
la prueba Comprensión de textos, evidencia que las puntuaciones de las Formas A y B miden las mismas
construcciones teóricas con niveles semejantes de confiabilidad y de error de medición.

Resumen del capítulo


No existe un método único o universal para cuantificar la confiabilidad de una prueba. En este capítulo se han
presentado diversas técnicas de estimación de la confiabilidad utilizadas en las WJ III. Tal como se reconoce en la
publicación Standards for Educational and Psychological Testing [Normas para la administración de pruebas
psicopedagógicas] (American Educational Research Association, American Psychological Association y National
Council on Measurement in Education [AERA, APA, NCME, respectivamente, por sus siglas en inglés], 1999), el
error estándar de medición (SEM) es, en general, el índice más útil de la confiabilidad de una puntuación con fines
interpretativos. En las WJ III, los SEM se dan en los Apéndices A y B de cada prueba y compuesto para cada edad y
grado. Además, el programa WJ III Compuscore and Profiles (Schrank y Woodcock, 2001) proporciona las bandas de
SEM para las puntuaciones estándar. Esta información ayuda a los examinadores a conocer la precisión relativa de
cada puntuación de una prueba.

Se ofrecen las confiabilidades de coherencia interna para todas las pruebas y compuestos, salvo para las pruebas de
tiempo y para las de puntuación múltiple. Para estas excepciones, las confiabilidades se calcularon a partir de los SEM
basados en Rasch. En este capítulo hemos brindado información acerca de la equivalencia de las formas alternativas, la
confiabilidad test-retest para las pruebas de tiempo y la confiabilidad entre calificadores en las pruebas Muestras de
redacción, Fluidez en la escritura y la medición de Escritura a mano a fin de contribuir a un mejor uso e
interpretación de la WJ III por parte de los examinadores.

Las características de las WJ III en materia de confiabilidad satisfacen o superan las normas básicas para la
ubicación de los individuos y las decisiones de programación. Cuando se deben adoptar decisiones importantes, el plan
de interpretación de las WJ III pone el acento en el principio de la interpretación de los compuestos. La mayoría de las
medianas de confiabilidad de los compuestos que se han documentado son de .90 o más. En ciertos casos, pueden
utilizarse, a los fines de tomar una decisión, puntuaciones de pruebas individuales, corroboradas por información
proveniente de otras fuentes. La mayoría de las medianas de confiabilidad de las pruebas documentadas son de .80
o más y algunas de .90 o más.

47
Confiabilidad
Capítulo 4

Validez
La validez de una prueba es el grado en que la teoría y la evidencia empírica sustentan su uso y su interpretación. Las
principales construcciones teóricas y mediciones obtenidas con las Woodcock-Johnson III (WJ III) (Woodcock,
McGrew y Mather, 2001a) derivan de la teoría de las habilidades cognitivas de Cattell, Horn y Carroll (teoría CHC).
En el Capítulo 2 del presente manual hemos dado una síntesis de esta teoría. La interpretación de las mediciones de la
habilidad intelectual general (g), las habilidades cognitivas específicas, el lenguaje oral y el aprovechamiento obtenidas
con las WJ III y que derivan de la teoría CHC se sustentan en datos empíricos procedentes de 8,818 sujetos de la
muestra normativa y de otros 775 sujetos que participaron en estudios de validez.1

En este capítulo presentaremos cuatro fuentes de evidencias de validez, correspondientes a las siguientes
categorías: (a) contenido de las pruebas; (b) pautas de desarrollo de las puntuaciones; (c) estructura interna, y (d)
relaciones con otras variables externas.2 Este marco de referencia de la validez, basado en cuatro fuentes, sintetiza
otros marcos de referencia ya establecidos que detallan de la necesidad de contar con evidencias de validez sustantivas,
externas e internas. (Benson, 1998; Cronbach, 1971; Cronbach y Meehl, 1955; Loevinger, 1957; Messick, 1989;
Nunnally, 1978). Por último, en el presente capítulo se presentan evidencias relacionadas con la imparcialidad de las
pruebas. En el Cuadro 4-1 se definen algunos términos fundamentales para que el lector pueda comprender mejor la
información contenida en este capítulo.

Cuadro 4-1.
Definiciones de los términos fundamentales empleados en el Capítulo 4
Término Definición
Análisis factorial confirmatorio Procedimiento de reducción de los datos por el cual se ponen a prueba determinadas
(CFA, por sus siglas en inglés) hipótesis teóricas acerca de la cantidad de factores, las cargas de los factores, la relación
entre las pruebas y los factores subyacentes, y la relación entre los factores.

Análisis factorial exploratorio Procedimiento de reducción de datos para examinar la estructura factorial subyacente de un
conjunto de datos sin especificar previamente la cantidad de factores, la relación entre las
pruebas y los factores subyacentes, las cargas de los factores o la relación entre los factores.

Curva de crecimiento Graficación de la edad por habilidad que muestra la relación entre el monto de dicha
habilidad que tiene un sujeto en diferentes niveles de edad.

Evidencia de validez externa Grado en el cual las puntuaciones compuestas de una prueba se relacionan con medidas
derivadas de otras construcciones teóricas y/o de otras características de los sujetos de
un modo coherente con las expectativas teóricas de la construcción propuesta.

Evidencia de validez interna Grado en el cual las relaciones entre los ítemes o elementos componentes de una prueba
utilizada para operacionalizar una construcción teórica propuesta se ajusta a ésta.

Evidencia de validez sustantiva Grado en el cual los ítemes y las pruebas se consideran relevantes y representativos con
respecto a la construcción teórica propuesta.

1
Gran parte de la información de este capítulo sobre la validez de la WJ III aplica a la Batería III. Para mayor información sobre la validez de la Batería III, el
lector debe remitirse al Assessment Service Bulletin (ASB, por sus siglas en inglés), (Schrank et al., 2005) [Folleto de servicio para el evaluador].
2
Importa señalar que para muchas de las pruebas de la WJ III que aparecieron originalmente en Woodcock-Johnson Psycho-Educational Battery (WJ) (Woodcock
y Johnson, 1977) y en Woodcock-Johnson Psycho-Educational Battery–Revised (WJ-R) (Woodcock y Johnson, 1989b) ya se ha informado de gran cantidad de
evidencias de validez. Con respecto a las pruebas actuales que integran la WJ III, en esas dos ediciones se expusieron evidencias de validez para siete pruebas de
aprovechamiento (Identificación de letras y palabras, Análisis de palabras, Comprensión de textos, Vocabulario sobre dibujos, Cálculo, Problemas aplicados,
Corrección de textos) y para siete pruebas cognitivas (Aprendizaje visual-auditivo, Relaciones espaciales, Integración de sonidos, Formación de conceptos,
Análisis-Síntesis, Pareo visual, Inversión de números), todas las cuales se mantuvieron prácticamente iguales a lo largo de las distintas revisiones. Otras tres
pruebas (Comprensión verbal, Conceptos cuantitativos, Conocimientos académicos) tenían una forma diferente en las dos ediciones anteriores. Tres pruebas de
aprovechamiento (Fluidez en la escritura, Muestras de redacción, Comprensión oral/auditiva) y tres cognitivas (Reconocimiento de dibujos, Memoria para
palabras, Palabras incompletas) ya figuraban en la WJ-R. Tanto Woodcock (1978) como McGrew, Werder y Woodcock (1991) dieron cuenta de esta evidencia
de validez conexa.

48
Validez
Cuadro 4-1. (cont.)
Definiciones de los términos fundamentales empleados en el Capítulo 4
Término Definición

Funcionamiento diferenciado Propiedad estadística del ítem de una prueba según la cual los sujetos de distintos grupos
del ítem que obtienen la misma puntuación total tienen puntuaciones promedio diferentes en un ítem.

Habilidad amplia Habilidad general que pertenece al dominio amplio de la conducta y refleja un grado
moderado de especialización. Habilidad que influye en una variedad de conductas dentro
de un dominio amplio, como se refleja en la variación de las cargas de los factores
estrechos en el factor amplio.

Habilidad estrecha Habilidad que refleja una mayor especialización dentro de un dominio amplio específico de
habilidades.

Índice de la bondad del ajuste Índice estadístico que señala en qué medida una estructura factorial propuesta representa
las relaciones subyacentes entre las variables en un conjunto de datos específico.

Representación de la construcción Grado en el cual la medida de una prueba o compuesto representa adecuadamente los
teórica aspectos principales de una construcción teórica.

Sesgo Error sistemático en la puntuación de una prueba o ítem debido a factores no relacionados
con la construcción teórica propuesta, que hace que los ítemes de una prueba presenten
una dificultad diferente para distintos grupos de sujetos.

Variancia relevante para la Grado en el cual las puntuaciones de una prueba o compuesto miden los procesos
construcción teórica fundamentales relevantes para la construcción teórica propuesta y no elementos de otras
construcciones teóricas.

Evidencia basada en el contenido de la prueba


La validez de contenido o sustantiva de las pruebas de la WJ III se aseguró estableciendo el contenido de las pruebas y
compuestos de acuerdo con la teoría CHC, en especial para lasWoodcock-Johnson III Tests of Cognitive Abilities
(WJ III COG) (Woodcock, McGrew y Mather, 2001c). En el diseño y revisión de las pruebas de la WJ III, una
consideración esencial fue la representación de la construcción teórica. En el caso de la Woodcock-Johnson III Tests of
Achievement (WJ III ACH), (Woodcock, McGrew y Mather, 2001b), el contenido de las pruebas y compuestos se diseñó,
además, de modo de abarcar las áreas curriculares fundamentales, así como las áreas de competencia y aprovechamiento
en lenguaje oral que establecen las leyes nacionales de Estados Unidos. Tanto el formato organizativo como el plan de
interpretación de la WJ III estuvieron destinados a lograr la máxima amplitud y profundidad de contenido en cada área de
habilidad cognitiva amplia y de aprovechamiento.

Un concepto importante de la teoría CHC es la distinción que establece entre las habilidades amplias y estrechas.
Cada prueba de la WJ III tiene como propósito ser una medida única de una de las habilidades estrechas. Dado que un
objetivo esencial de la WJ III fue aumentar la variancia relevante para la construcción teórica (Benson, 1998; Messick,
1995), todas las pruebas fueron diseñadas o revisadas con el fin de disminuir las fuentes de variancia irrelevantes para la
habilidad estrecha medida en cada prueba. Con el objeto de aumentar la amplitud, se elaboraron compuestos que
abarcaban dos o más habilidades estrechas cualitativamente distintas. El uso de los compuestos reduce al mínimo el
peligro inherente a generalizar lo que ocurre con un único aspecto estrecho de una conducta aplicándolo a una habilidad
multifacética amplia. El principio de la interpretación de los compuestos se adoptó para mejorar la validez del contenido
de las medidas correspondientes a habilidades amplias como lectura, razonamiento fluido o inteligencia general. El
Capítulo 5 del Manual del examinador tanto de la Woodcock-Johnson III Tests of Cognitive Abilities (Mather y
Woodcock, 2001b) como de la Woodcock-Johnson III Tests of Achievement (Mather y Woodcock, 2001a) brindan las
interpretaciones recomendadas para las puntuaciones obtenidas mediante las WJ III COG y las WJ III ACH.

49
Validez
En el Cuadro 4-2 se describen las habilidades amplias y estrechas de la teoría CHC medidas por cada prueba de la
WJ III COG, y en el Cuadro 4-3 se da esta misma información para la WJ III ACH. Estos cuadros incluyen breves
descripciones del contenido de las pruebas, la naturaleza de los estímulos empleados, las actividades que cada prueba
requiere cumplir y la modalidad de la respuesta. En el Capítulo 2 del Manual del examinador tanto de la WJ III COG
como de la WJ III ACH se suministran descripciones detalladas del contenido de las pruebas y compuestos, así como
evidencia sobre la validez de dicho contenido. Sugerimos a los usuarios de las pruebas que acudan a dichos capítulos
para encontrar más pormenores acerca de los fundamentos racionales del diseño de diversas pruebas y compuestos, y
que examinen los ítemes de cada prueba en el Libro de pruebas de la WJ III.

Los ítemes de las pruebas se desarrollaron con el aporte de especialistas ajenos al proyecto, entre ellos docentes y
psicólogos de amplia experiencia profesional. El objetivo general del desarrollo de cada ítem fue medir en forma
adecuada la habilidad estrecha, o construcción teórica, identificada en las especificaciones que se derivaron de la teoría
CHC. Los alcances y la secuencia de los ítemes de los Libros de pruebas proporcionan una evidencia importante sobre
la validez del contenido de cada prueba. En cada una, los ítemes se diseñaron a fin de captar aspectos importantes de la
construcción teórica subyacente y abarcar una amplia gama de dificultades. Con el fin de que todos los ítemes de una
prueba midiesen la misma habilidad estrecha o rasgo, en el proceso de selección de los ítemes se emplearon criterios
de ajuste muy rigurosos, basados en el modelo de Rasch. Este proceso ayudó, además, a evitar que se escogieran
ítemes que midiesen procesos ajenos a la construcción teórica pertinente.

Como parte del desarrollo de cada ítem se realizaron evaluaciones del sesgo y la sensibilidad. Nueve evaluadores
examinaron todos los ítemes de la WJ III para identificar cualquier problema que pudiese afectar la sensibilidad de las
mujeres, los discapacitados y las minorías lingüísticas o culturales. Se tomaron en cuenta los comentarios de todos los
evaluadores. En el caso típico, si se consideraba que un ítem podía ser fuente de sesgo, se lo revisaba o eliminaba.

Las 20 pruebas de la WJ III COG se desarrollaron para ofrecer una muestra representativa del complejo conjunto
de habilidades que, según la teoría CHC, constituyen la habilidad intelectual. En el Capítulo 2 del Manual del
examinador de la WJ III COG se establece que las funciones cognitivas incluidas en la prueba son representativas de
los factores definidos por la teoría CHC. Así pues, los ítemes cognitivos fueron seleccionados con vistas a que
representasen las principales habilidades de la teoría CHC y el continuo del funcionamiento cognitivo total, desde los
procesos inferiores hasta el pensamiento y el razonamiento de nivel superior.

Las 22 pruebas de la WJ III ACH se desarrollaron para representar los aspectos principales relativos al lenguaje
oral y al aprovechamiento académico. A tal fin, las pruebas incluyen el aprovechamiento en lectura, matemáticas y
lenguaje escrito, así como en el lenguaje oral y los conocimientos curriculares. La especificación del contenido del
ítem en cada prueba se basó fundamentalmente en el principio de suministrar una amplia muestra de aprovechamiento,
más que una evaluación en profundidad de un área relativamente estrecha. Por ejemplo, la Prueba 19: Conocimientos
académicos abarca cuestiones de ciencias naturales, ciencias sociales y humanidades de diverso nivel de dificultad y
que incluyen en cada subárea una amplia gama de contenidos.

Evidencia basada en las pautas de desarrollo


Un examen de los estadísticos que aparecen en los Apéndices A y B revela que todas las pruebas y compuestos
presentan cambios promedio en las puntuaciones que son congruentes con el crecimiento y declinación de las
habilidades cognitivas y de aprovechamiento a lo largo de la vida. Los estadísticos descriptivos de dichos apéndices
muestran pautas de desarrollo y declinación congruentes con las que suelen presentarse en las muestras normativas
representativas que abarcan la mayor parte del período de vida.

Una de las evidencias de que existen habilidades singulares es la existencia de curvas de desarrollo divergentes
(Carroll, 1983, 1993). En las Figuras 4-1 y 4-2 se ilustran las curvas de crecimiento, de los 5 a los 90 años, de las
principales medidas de habilidad y aprovechamiento de la WJ III. Estas curvas muestran que las habilidades singulares
medidas por la WJ III siguen diversas trayectorias de desarrollo entre la niñez y la tercera edad. Los ejemplos se
elaboraron utilizando como punto de partida la edad de 5 años 0 mes (5-0), y restando en cada prueba la
50
Validez
Cuadro 4-2.
Construcción teórica y contenido de la WJ III COG
Factor amplio CHC
primario Requerimiento de la
Prueba Habilidad CHC estrecha Estímulos prueba Respuesta
Prueba 1: Comprensión Comprensión- Visuales (figuras) Identificación de objetos; Oral (palabra)
verbal conocimiento (Gc) Auditivos (palabras) conocimiento de
Conocimiento antónimos y sinónimos;
léxico completamiento de
Desarrollo del analogías verbales
lenguaje
Prueba 2: Aprendizaje Recuperación a largo Visuales (rebuses)- Aprendizaje y Oral (frases)
visual-auditivo plazo (Glr) Auditivos (palabras) en rememoración de
Memoria asociativa la situación de representaciones
aprendizaje; Visuales pictográficas de palabras
(rebuses) en la
situación de
reconocimiento
Prueba 3: Relaciones Pensamiento visual- Visuales (dibujos) Identificación del Oral (letras) o motriz
espaciales espacial (Gv) subconjunto de piezas (señalamiento)
Visualización necesarias para
Relaciones completar una figura
espaciales
Prueba 4: Integración Procesamiento auditivo Auditivos (fonemas) Síntesis de sonidos del Oral (palabra)
de sonidos (Ga) lenguaje (fonemas)
Codificación fonética:
síntesis
Prueba 5: Formación Razonamiento fluido (Gf) Visuales (dibujos) Identificación, Oral (palabras)
de conceptos Inducción clasificación y
determinación de reglas
Prueba 6: Pareo visual Rapidez en el Visuales (números) Localización y Motriz (señalamiento)
procesamiento (Gs) señalamiento rápidos de
Rapidez perceptual números idénticos en un
conjunto definido de
números
Prueba 7: Inversión de Memoria a corto plazo Auditivos (números) Mantenimiento de una Oral (números)
números (Gsm) serie de números en la
Memoria de trabajo conciencia inmediata
mientras se invierte su
secuencia
Prueba 8: Palabras Procesamiento auditivo Auditivos (palabras) Identificación de Oral (palabra)
incompletas (Ga) palabras con fonemas
Codificación fonética: faltantes
análisis
Prueba 9: Memoria de Memoria a corto plazo Auditivos (palabras, Mantenimiento de un Oral (palabras,
trabajo auditiva (Gsm) números) conjunto heterogéneo de números)
Memoria de trabajo números y palabras en
la conciencia inmediata
mientras se los reordena
en dos secuencias
Prueba 10: Memoria Recuperación a largo Visuales (rebuses) en Rememoración y Oral (frases)
diferida – Aprendizaje plazo (Glr) la situación de reaprendizaje de
visual-auditivo Memoria asociativa reconocimiento; representaciones
Visuales-Auditivos en pictográficas de palabras,
la situación de de media hora a ocho
reaprendizaje días después

51
Validez
Cuadro 4-2. (cont.)
Construcción teórica y contenido de la WJ III COG
Factor amplio CHC
primario Requerimiento de la
Prueba Habilidad CHC estrecha Estímulos prueba Respuesta
Prueba 11: Información Comprensión- Auditivos (preguntas) Identificación del lugar Oral (frases)
general conocimiento (Gc) en que se encuentran
Información general los objetos y de lo que
(verbal) suele hacerse con ellos
Prueba 12: Fluidez de Recuperación a largo Auditivos (sólo Mención de la mayor Oral (palabras)
recuperación plazo (Glr) indicaciones) cantidad posible de
Fluidez ideativa ejemplos de una
determinada categoría
Prueba 13: Pensamiento visual- Visuales (figuras) Identificación de un Oral (palabras) o
Reconocimiento de espacial (Gv) subconjunto de figuras motriz (señalamiento)
dibujos Memoria visual presentadas
previamente dentro de
un campo de figuras que
distraen
Prueba 14: Atención Procesamiento auditivo Auditivos (palabras) Identificación de Motriz (señalamiento)
auditiva (Ga) palabras presentadas en
Discriminación de forma oral en medio de
sonidos del habla un ruido de fondo cada
Resistencia a la vez más intenso
distorsión de los
estímulos auditivos
Prueba 15: Análisis- Razonamiento fluido (Gf) Visuales (dibujos) Análisis de Oral (palabras)
Síntesis Razonamiento rompecabezas
secuencial (mediante formulaciones
(deductivo) simbólicas) para
general determinar los
componentes faltantes
Prueba 16: Rapidez en Rapidez en el Visuales (figuras) Localización y Motriz (señalamiento)
la decisión procesamiento (Gs) señalamiento de las dos
Rapidez para el figuras conceptualmente
procesamiento más similares en una fila
semántico de ellas
Prueba 17: Memoria Memoria a corto plazo Auditivos (palabras) Reproducción de una Oral (palabras)
para palabras (Gsm) lista de palabras
Alcance de la desvinculadas entre sí
memoria en su secuencia correcta

Prueba 18: Rapidez en Rapidez en el Visuales (figuras) Reconocimiento de Oral (palabras)


la identificación de procesamiento (Gs) objetos y posterior
dibujos Facilidad de recuperación y
identificación enunciación rápida de
sus nombres
Prueba 19: Pensamiento visual- Visuales (dibujos) Trazado de una figura Motriz (trazado)
Planeamiento espacial (Gv) y sin levantar el lápiz del
Razonamiento fluido (Gf) papel y sin volver a
Alcance de la trazar ninguna línea
percepción visual
Razonamiento
secuencial general
Prueba 20: Cancelación Rapidez en el Visuales (figuras) Identificación y Motriz (señalamiento)
de pares procesamiento (Gs) señalamiento rápidos de
Atención y las unidades de una
concentración pauta repetida

52
Validez
Cuadro 4-3.
Construcción teórica y contenido de la WJ III ACH
Area curricular Requerimiento de
Prueba Habilidad CHC estrecha Estímulos la prueba Respuesta

Prueba 1: Identificación Lectura Visuales (texto) Identificación de letras y Oral (nombre de una
de letras y palabras Decodificación de palabras impresas letra, palabra)
la lectura
Prueba 2: Fluidez en la Lectura Visuales (texto) Lectura rápida de Motriz (señalamiento)
lectura Rapidez de lectura enunciados impresos y
respuesta sobre si son
verdaderos o falsos (“Sí”
o “No”)
Prueba 3: Expresión oral Auditivos (texto) Escucha y Oral (fragmento)
Rememoración de Desarrollo del rememoración de
cuentos lenguaje detalles de relatos orales
Habilidad auditiva
Memoria significativa
Prueba 4: Comprensión Comprensión auditiva Auditivos (texto) Escucha de una Motriz (señalamiento)
de indicaciones Habilidad auditiva secuencia de
Desarrollo del indicaciones y
lenguaje cumplimiento de éstas
Prueba 5: Cálculo Matemáticas Visuales (números) Realización de varios Motriz (escritura)
Aprovechamiento en cálculos matemáticos
matemáticas
Fluidez numérica
Prueba 6: Fluidez en Matemáticas Visuales (números) Suma, resta y Motriz (escritura)
matemáticas Aprovechamiento en multiplicación rápidas
matemáticas
Prueba 7: Ortografía Ortografía de palabras Auditivos (palabras) Ortografía de palabras Motriz (escritura)
Habilidad para la presentadas oralmente
ortografía
Prueba 8: Fluidez en la Escritura Visuales (palabras con Formulación y redacción Motriz (escritura)
escritura Rapidez de escritura figura) rápidas de oraciones
simples
Prueba 9: Comprensión Lectura Visuales (texto) Identificación de una Oral (palabra)
de textos Comprensión de palabra fundamental
lectura faltante por el contexto
Comprensión de de un texto
lenguaje verbal
(impreso)
Prueba 10: Problemas Matemáticas Auditivos (preguntas); Realización de cálculos Oral
aplicados Razonamiento Visuales (números, matemáticos como
cuantitativo texto) respuesta a problemas
Aprovechamiento en presentados oralmente
matemáticas
Conocimientos
matemáticos
Prueba 11: Muestras de Escritura Auditivos; Visuales Redacción de Motriz (escritura)
redacción Habilidad para la (texto) enunciados significativos
escritura para un propósito dado
Prueba 12: Memoria Recuperación a largo Auditivos (frases) Rememoración de Oral (fragmento)
diferida – plazo (Glr) elementos de un relato
Rememoración Memoria significativa presentado en forma
de cuentos oral con anterioridad

53
Validez
Cuadro 4-3. (cont.)
Construcción teórica y contenido de la WJ III ACH
Area curricular Requerimiento de
Prueba Habilidad CHC estrecha Estímulos la prueba Respuesta
Prueba 13: Análisis de Lectura Visuales (palabra) Lectura oral de grupos Oral (palabra)
palabras Decodificación de la fónicos regulares que no
lectura componen una palabra
Codificación fonética del lenguaje corriente
Análisis y síntesis

Prueba 14: Vocabulario Expresión oral Visuales (figura) Identificación de objetos Oral (palabra)
sobre dibujos Desarrollo del
lenguaje
Conocimiento léxico

Prueba 15: Comprensión auditiva Auditivos (texto) Identificación de una Oral (palabra)
Comprensión oral Habilidad auditiva palabra fundamental
faltante en un fragmento
presentado oralmente
Prueba 16: Corrección Destrezas en escritura Visuales (texto) Identificación y Oral
de textos Desarrollo del corrección oral de
lenguaje errores en un texto
Uso del lenguaje escrito

Prueba 17: Vocabulario Lectura Visuales (palabra) Lectura de palabras y Oral (palabra)
de lectura Comprensión de mención de su
lenguaje verbal significado correcto
(impreso)
Conocimiento léxico

Prueba 18: Conceptos Matemáticas Auditivos (pregunta); Identificación de Oral (palabra)


cuantitativos Conocimientos Visuales (números, términos y fórmulas
matemáticos texto) matemáticos;
Razonamiento identificación de pautas
cuantitativo numéricas

Prueba 19: General Auditivos (pregunta); Respuesta a preguntas Oral (palabra,


Conocimientos Información general Visuales (texto, figura) sobre ciencia, estudios oraciones)
académicos Ciencia sociales y humanidades
Información cultural
Geografía

Prueba 20: Análisis de Ortografía Auditivos (letra, Ortografía de Motriz (escritura)


sonidos Habilidad para la palabra) combinaciones de letras
ortografía que forman pautas
Codificación fonética regulares en la lengua
Análisis y síntesis inglesa escrita

Prueba 21: Lectura Auditivos (pregunta, Enunciación de palabras Oral (palabra)


Discernimiento de Codificación fonética palabra) que rimen con otras;
sonidos eliminación, reemplazo e
inversión de partes de
palabras para crear
nuevas palabras

Prueba 22: Puntuación Escritura Auditivos (pregunta); Aplicación de las reglas Motriz (escritura)
y mayúsculas Uso del lenguaje Visuales (letras, de puntuación y de uso
palabras) de mayúsculas

54
Validez
puntuación de referencia W para la edad 5-0 de todas las demás puntuaciones de referencia W hasta los 90 años o más.
Mediante este procedimiento se obtuvieron curvas de crecimiento o desarollo que empezaban todas ellas en el cero
asignado común. Se eligió la edad 5-0 como punto de partida a raíz de que todas las pruebas y compuestos de la WJ III
tienen puntuaciones W de referencia normativas para esa edad o más. Todas estas curvas se basan en los datos de los
mismos sujetos para una edad determinada.
Si bien los gráficos presentados en las Figuras 4-1 y 4-2 se conocen como curvas de desarrollo, debe hacerse una
advertencia: estas curvas no se basan en datos longitudinales sino en secciones transversales. Lo que describen no es la
progresión de los sujetos a lo largo del tiempo, sino el aumento y declinación de la mediana de los rendimientos de
todas las edades en la población general en el momento en que se normalizaron la WJ III.

Evidencia de desarrollo de siete compuestos de factores cognitivos


La Figura 4-1 presenta las curvas de desarrollo de los siete compuestos de factores cognitivos. El patrón de crecimiento y
declinación de estas siete habilidades difiere en forma marcada. El compuesto Recuperación a largo plazo (Glr) revela
menos cambios en el desarrollo que cualquiera de las demás habilidades. La curva Glr es típica de ciertas pruebas de
habilidades cognitivas en las que el rendimiento se basa en una habilidad de procesamiento que es poco influida por la
capacitación y el aprendizaje formales. La curva de crecimiento de Glr (ver también las curvas de Ga y Gv) es congruente
con las habilidades que se desarrollan en función de experiencias de aprendizaje informales e indirectas, y que se modifican
relativamente poco con la edad. En contraste, la curva de crecimiento del compuesto Comprensión-conocimiento (Gc) es un
ejemplo de una prueba en la cual el aprendizaje logrado en el pasado de modo directo y más formalizado constituye un factor
importante. El ritmo de cambio en el desarrollo de Comprensión-conocimiento entre los 5 y los 90 años es mucho mayor que
el observado en Recuperación a largo plazo (Glr). En términos generales, entre los 5 y los 90 años la habilidad W cambia
aproximadamente cuatro veces más en el compuesto Gc que en el compuesto Glr.
Diferencia de W respecto de los 5 años

VIENEN LAS FIGURAS 4-1 y 4-2

Edad (en años)


Figura 4-1.
Siete curvas de desarrollo de los factores de la WJ III COG según la edad.

55
Validez
Destrezas básicas en lectura (BRS)

Destrezas básicas en escritura (BWS)


Diferencia de W respecto de los 5 años Razonamiento en matemáticas (MR)

Comprensión de lectura (LC)


Conocimientos académicos (AK)

Cálculos matemáticos (MC)


Expresión escrita (WE)

Comprensión auditiva (LC)

Expresión oral (OE)

Edad (en años)

Figura 4-2.
Nueve curvas de desarrollo de los compuestos de la WJ III ACH según la edad.

Repárese, asimismo, en el abrupto aumento de la Rapidez en el procesamiento (Gs). Esta habilidad alcanza entre
los 25 y los 30 años una asíntota pronunciada y luego declina en forma progresiva y constante en todas las edades.
También la Memoria a corto plazo (Gsm) y el Razonamiento fluido (Gf) alcanzan su mayor nivel alrededor de los
25 años y declinan a lo largo de la vida, aunque esta declinación no es tan pronunciada como la de la Rapidez en el
procesamiento (Gs). En contraste, Comprensión-conocimiento (Gc) no llega a su asíntota hasta los 50 ó 60 años.

Si se comparan las curvas de Comprensión-conocimiento (Gc) y de Razonamiento fluido (Gf) se aprecia que las
pruebas correspondientes a estas habilidades también presentan diferentes ritmos de declinación: la primera tiene un
ritmo de declinación más rápido en los sujetos de más edad que la segunda.

Evidencia de desarrollo de nueve compuestos de aprovechamiento

La Figura 4-2 exhibe las curvas de desarrollo de nueve compuestos de la WJ III ACH. Un examen atento de estas
curvas muestra algunas pautas de desarrollo interesantes. Nótense las similitudes y diferencias entre las curvas
correspondientes al lenguaje oral (Comprensión auditiva, Expresión oral) y las restantes curvas representativas de las
áreas tradicionales de formación académica. Lo típico es que la Comprensión auditiva y la Expresión oral no se
enseñen en las escuelas. Sin embargo, es indiscutible que estas habilidades son resultado del aprendizaje. Al parecer,
los individuos aumentan su habilidad de comprensión auditiva hasta los 25 años aproximadamente, momento en el
cual la habilidad alcanza un pico y comienza una leve declinación. Por el contrario, continúan desarrollando sus
habilidades para la expresión oral hasta los 65 años aproximadamente, aunque a un ritmo menor de crecimiento. Estas
habilidades también declinan gradualmente luego de alcanzar su pico a los 65 años.

56
Validez
Según muestra la Figura 4-2, las habilidades para la lectura, las matemáticas, la escritura y los conocimientos
académicos aumentan a lo largo del ciclo de la escolaridad tradicional. Una vez aprendidas, estas habilidades no tienen
una rápida declinación en edades subsiguientes, sino que se conservan. La curva para el razonamiento en matemáticas
es la que muestra la declinación más veloz. En el caso de muchos adultos, esto se relaciona probablemente con la
menor necesidad de practicar esta habilidad en su vida ulterior.

La Figura 4-3 reproduce las nueve curvas de crecimiento de los compuestos de aprovechamiento y les agrega la
curva de Comprensión-conocimiento (Gc) a fin de facilitar las comparaciones. Adviértase que las curvas de lectura,
escritura y matemáticas son notoriamente distintas de las del compuesto Gc de la WJ III COG. Este fenómeno sugiere
que la Comprensión-conocimiento (a la que a veces se denomina inteligencia cristalizada) no equivale al
aprovechamiento de las destrezas académicas básicas (Cattell, 1971).

La Figura 4-3 muestra curvas similares a las que se presentan en el WJ-R Technical Manual (McGrew et al.,
1991). La principal diferencia entre las curvas que aparecen aquí y en la WJ-R corresponde al factor de la Memoria a
corto plazo (Gsm). En la WJ-R, este factor designaba una única habilidad estrecha (alcance de la memoria), en tanto
que en la WJ III incluye una prueba de Memoria de trabajo. Consecuentemente, la curva de desarrollo de Gsm no es la
misma en la WJ-R y la WJ III; en estas últimas hay un aumento y declinación mucho mayores de la Memoria a corto
plazo, que puede atribuirse al agregado de la medición de la Memoria de trabajo.
Diferencia de W respecto de los 5 años

Edad (en años)

Figura 4-3.
Nueve compuestos de la WJ III ACH y Comprensión-conocimiento (Gc).

57
Validez
Evidencia de desarrollo de las habilidades estrechas

La existencia de pautas diferenciadas de crecimiento y declinación entre las distintas habilidades estrechas es una
evidencia de su validez. La Figura 4-4 contiene seis ejemplos de curvas de crecimiento de habilidades estrechas
incluidas en los estudios de validez interna que se mencionan más adelante en este mismo capítulo.3 Cada gráfico
contiene dos o más habilidades estrechas que integran un compuesto de habilidad amplia en las WJ III.

La Figura 4-4a es un modelo de los factores estrechos de la Memoria a corto plazo (Gsm): alcance de la memoria
y memoria de trabajo. La curva del alcance de la memoria es muy similar a la curva Gsm que se presenta en el WJ-R
Technical Manual (McGrew et al., 1991), debido a que el compuesto Gsm de las WJ-R estaba integrado por dos
pruebas que medían una misma habilidad estrecha, el alcance de la memoria. Nótense las diferencias de aumento y
declinación del alcance de la memoria y de la memoria de trabajo. A diferencia de lo que ocurre con las habilidades del
alcance de la memoria, los individuos muestran un mayor aumento de su habilidad para retener información en la
conciencia inmediata mientras realizan alguna operación mental relacionada con tal información.

Hay dos habilidades estrechas de Comprensión-conocimiento (Gc) que también exhiben pautas de desarrollo
diferenciadas, como muestra la Figura 4-4b. El aumento de la información general y del desarrollo del lenguaje/
conocimiento léxico es comparativamente importante hasta alrededor de los 30 años de edad; por el contrario, la
habilidad auditiva no aumenta de la misma manera. La información general y el desarrollo del lenguaje/conocimiento
léxico no empiezan a declinar hasta los 60 años o más, en tanto que la habilidad auditiva ya muestra cierta merma
antes de esa edad.

La Figura 4-4c muestra las curvas correspondientes a tres habilidades estrechas de Recuperación a largo plazo
(Glr). Repárese en el aumento y declinación de la facilidad de identificación, en comparación con la memoria
asociativa; la habilidad para realizar tareas de aprendizaje asociadas no se modifica mucho a lo largo de la vida. En
cambio, los individuos mejoran hasta alrededor de los 30 años su habilidad para recuperar y enunciar los nombres de
objetos o conceptos. La memoria significativa (habilidad para rememorar información que implica establecer
relaciones significativas) parece declinar más que la facilidad de identificación o la memoria asociativa. El individuo
promedio de 85 años tiene menos habilidad para rememorar un conjunto de ítemes entre los cuales existe una relación
significativa (v. gr., un cuento dotado de sentido o una argumentación) que el niño promedio de 5 años.

La Figura 4-4d revela que las habilidades para la decodificación de la lectura (habilidad general para el
reconocimiento y la decodificación de palabras) crecen y se conservan en mayor medida durante toda la vida que las
habilidades para la comprensión de lectura (para comprender frases y oraciones durante el proceso de la lectura). La
Figura 4-4e demuestra que las destrezas básicas para la escritura, como la ortografía y la corrección de textos, crecen a
mayor ritmo que la habilidad para escribir con claridad, buena organización y correctas estructuras oracionales
(habilidad para la escritura). La Figura 4-4 nos indica que las pautas de desarrollo del razonamiento cuantitativo (la
habilidad para razonar mediante conceptos que implican propiedades y relaciones matemáticas) y del aprovechamiento
en matemáticas (medido) son distintas.

La existencia de pautas de desarrollo singulares para muchas de las habilidades estrechas es una forma de
evidencia de validez que, si se pretende fundamentar la validez de las habilidades estrechas, debe combinarse con la
información relativa al contenido de las pruebas y la evidencia de validez interna y externa (presentada más adelante
en este mismo capítulo).

3
Las puntuaciones de los factores estrechos utilizadas en el trazado de las curvas de crecimiento se obtuvieron promediando las dos pruebas que mostraban las
cargas más altas de factores en los modelos factoriales confirmatorios de las normas de la WJ III que incluían factores amplios y estrechos. Para obtener estas
puntuaciones de habilidades estrechas se emplearon las siguientes pruebas: MS = Memoria para palabras (WJ III), Memoria para frases (WJ III, investigación);
MW = Inversión de números (WJ III), Memoria de trabajo auditiva (WJ III); LD/VL = Comprensión verbal (WJ III), Vocabulario sobre dibujos (WJ III); NA =
Fluidez de recuperación (WJ III), Rapidez en la identificación de dibujos (WJ III); MA = Aprendizaje visual-auditivo (WJ III), Memoria para nombres (WJ III,
investigación); MM = Rememoración de cuentos (WJ III), Memoria diferida – Rememoración de cuentos (WJ III); RD = Identificación de letras y palabras
(WJ III), Análisis de palabras (WJ III); RC = Comprensión de textos (WJ III), Vocabulario de lectura (WJ III); WA = Muestras de redacción (WJ III), Fluidez en
la escritura (WJ III); BWS = Ortografía (WJ III), Corrección de textos (WJ III); RQ = Razonamiento numérico (WJ III, investigación), Problemas aplicados
(WJ III); A3 = Cálculo (WJ III), Fluidez en matemáticas (WJ III).
58
Validez
(a) Memoria a corto plazo (Gsm) (b) Comprensión-conocimiento (Gc)
Diferencia de W respecto de los 5 años

Diferencia de W respecto de los 5 años


Información general (K0/K2)
Memoria de trabajo (MW)

Desarrollo del lenguaje/Desarrollo léxico (LD/VL)

Alcance de la memoria (MS)


Habilidad auditiva (LS)

Edad (en años) Edad (en años)

(c) Recuperación a largo plazo (Glr) (d) Lectura (Grw)


Diferencia de W respecto de los 5 años

Diferencia de W respecto de los 5 años


Decodificación de lectura (RD)

Comprensión de lectura (RC)


Habilidad para nombrar
(NA)
Memoria asociativa (MA)
Memoria significativa (MM)

Edad (en años) Edad (en años)

(e) Escritura (Grw) (f) Razonamiento cuantitativo/Razonamiento fluido (Gq/Gf)


Diferencia de W respecto de los 5 años

Diferencia de W respecto de los 5 años

Destrezas básicas para Razonamiento cuantitativo


la escritura (BWS) (RQ)

Habilidad para la escritura


(WA)

Aprovechamiento en
matemáticas (A3)

Edad (en años) Edad (en años)


Figura 4-4.
Ejemplos de curvas de desarrollo de diversas habilidades estrechas, agrupadas según la habilidad amplia CHC
correspondiente.

59
Validez
Evidencia basada en la estructura interna
El principal indicador de la validez de la estructura interna de las pruebas educativas y psicológicas es el grado en que la
relación entre las puntuaciones de la prueba y de sus componentes se ajusta a la relación establecida por una determinada
construcción teórica (American Educational Research Association, American Psychological Association y National
Council on Measurement in Education [AERA, APA y NCME respectivamente, por sus siglas en inglés], 1999). Los
datos primarios para evaluar la validez de las estructuras internas de la WJ III son los cuadros de intercorrelaciones entre
las pruebas presentadas en el Apéndice D. Estos cuadros dan las correlaciones entre las pruebas de la WJ III en cinco
amplios niveles de edades. En el Apéndice E se presentan cuadros similares para las intercorrelaciones de los compuestos.

La validez de la estructura interna se pone de manifiesto cuando las pruebas que miden habilidades semejantes tienen
entre sí mayor correlación que con las pruebas que miden habilidades diferentes. Por ejemplo, en el Apéndice D se aprecia
que las medidas Gc de Comprensión verbal, Información general, Vocabulario sobre dibujos y Conocimientos académicos
tienen una alta correlación recíproca (.70 a .80), pero su correlación con las pruebas Gv de Relaciones espaciales y
Reconocimiento de dibujos es mucho menor (.20 a .40). Esta pauta de correlaciones observada proporciona evidencia
convergente de que las pruebas Gc miden habilidades o construcciones teóricas similares y evidencia discriminativa de
que las pruebas Gv miden habilidades o construcciones teóricas distintas. Los mismos principios se aplican para evaluar la
validez estructural de los compuestos de que da cuenta el Apéndice E.

Aunque sería posible determinar gráficamente si las pautas de correlaciones de pruebas de las matrices descriptas en
el Apéndice D suministran evidencia convergente y discriminativa sobre la estructura de la teoría CHC empleada en la
WJ III COG, lo habitual es que esta determinación se realice empíricamente mediante el análisis factorial. Se llevaron a
cabo una serie de análisis factoriales confirmatorios (CFA) a fin de establecer si las pautas de las correlaciones entre las
pruebas de la WJ III sustentan una gran correspondencia entre la estructura organizativa de la WJ III y la teoría CHC
descripta en el Capítulo 2. También se efectuaron comparaciones con otros modelos a fin de corroborar el utilizado.

Los análisis actuales de la estructura interna de los factores de la WJ III tienen la ventaja de que se basan en amplios
análisis factoriales exploratorios y confirmatorios de los datos normativos de la WJ y la WJ-R que sirven de base a la
estructura de factores amplios Gf-Gc de la WJ-R (McGrew et al., 1991). Como el diseño de las WJ III extendió y mejoró
la estructura de las habilidades amplias Gf-Gc, previamente convalidada, se utilizaron casi con exclusividad CFA.

Durante las primeras etapas de recolección de datos se realizaron una serie de CFA preliminares. Para ello se utilizó el
programa de computación Amos™ 4.0 (Arbuckle y Wothke, 1999). Todos los análisis emplearon estimaciones de máxima
probabilidad de las puntuaciones estándar basadas en la edad.4 (En Keith, 1997, puede hallarse un panorama general sobre el
uso de los CFA y del programa Amos en la evaluación de la validez de la estructura interna de las baterías de pruebas
psicoeducativas.) El objetivo primordial de estos análisis preliminares era establecer cuál era la carga de los factores CHC en
las pruebas nuevas o revisadas. Este paso decisivo, que también incluyó un análisis del contenido lógico y psicológico de las
pruebas, dio por resultado la modificación de un pequeño número de pruebas y la eliminación de algunas nuevas que no
demostraron poseer una validez adecuada. Luego de reunir datos sobre aproximadamente 3,900 sujetos de una muestra
normativa, se realizó otra serie de CFA. En ese momento se estableció la relación existente entre las pruebas de la WJ III y
los factores amplios, y se conservó el modelo organizativo de las WJ III sin grandes ajustes ulteriores.

Además de las pruebas de la WJ III COG y de la WJ III ACH, en los CFA finales basados en las normas (así como
en ciertos estudios de validez especiales que serán descriptos más adelante en este mismo capítulo) se incluyeron ocho
medidas adicionales de habilidades cognitivas. Estas pruebas, a las que se denominó “Pruebas WJ III de investigación”, se
incluyeron a fin de identificar mejor los factores CHC amplios y estrechos. El Cuadro 4-4 suministra la nómina.

4
Las puntuaciones estándar basadas en la edad que se utilizaron en estos análisis, así como en todos los demás estudios de validez de que se informa en este libro,
eran puntuaciones estándar especiales de investigación derivadas de la transformación mediante la puntuación z simple de las puntuaciones W en cada uno de los
26 grupos etarios. Estas puntuaciones estándar difieren de las registradas en la publicación final, en las que se empleó un procedimiento más elaborado para
calcular las medianas y desvíos estándar utilizados para el cálculo de las puntuaciones estándar con gradaciones más finas de las categorías de edad. Los
procedimientos son los ya descriptos en el Capítulo 2. En los análisis actuales, las puntuaciones estándar de investigación fueron utilizadas para suprimir la
variancia de la edad.

60
Validez
Cuadro 4-4.
Pruebas de investigación adicionales de la WJ III incluidas en los análisis de su validez interna y estudios especiales
Habilidad
Prueba amplia Habilidad estrecha Descripción
Memoria para nombres Glr Memoria asociativa (MA) Mide la habilidad para aprender la
asociación entre estímulos auditivos y
visuales poco familiares (asociación
visual-auditiva). La tarea exige aprender
los nombres de una serie de seres
espaciales. Se trata de una prueba “de
aprendizaje”, en la que se proporciona al
sujeto una realimentación correctiva.
Memoria diferida – Memoria Glr Memoria asociativa (MA) Mide la habilidad para recordar (después
para nombres de un período que va de 30 minutos a 8
días) los seres espaciales presentados en
“Memoria para nombres”.
Integración visual Gv Rapidez de integración (CS) Mide la habilidad para nombrar un dibujo
o figura de un objeto simple representado
mediante líneas incompletas. La prueba
exige que el sujeto combine visualmente
las líneas en una totalidad dotada de
sentido.
Configuración de sonidos Ga Discriminación general de Mide la habilidad para indicar si pares de
sonidos (U3) pautas sonoras complejas son iguales o
Resistencia a la distorsión del diferentes. Las pautas sonoras, que se
estímulo auditivo (UR) presentan mediante una grabación,
pueden diferir en su tono, ritmo o sonidos
que la integran.
Memoria para frases Gsm Alcance de la memoria (MS) Mide la habilidad para recordar y repetir
palabras, frases y oraciones simples que
se presentan auditivamente mediante una
grabación.
Tachar Gs Rapidez perceptual (P) Mide la habilidad para explorar y comparar
rápidamente información visual. El sujeto
debe parear los cinco dibujos de una
hilera de 19 que son idénticos al primero y
al último dibujo de la hilera. Se le da un
plazo de 3 minutos para que complete la
mayor cantidad posible de hileras.
Rotación de bloques Gv Visualización (VZ) Mide la habilidad para reconocer en una
Relaciones espaciales (SR) hilera de cinco diseños geométricos o
series de bloques tridimensionales los dos
que son idénticos a un diseño geométrico
dado, aunque han sufrido una rotación y
se presentan desde una perspectiva
visual diferente.
Razonamiento numérico Gf Razonamiento cuantitativo (RQ) Mide la habilidad para identificar el
principio cuantitativo en que se basa una
secuencia de números de una matriz o
serie numérica y luego aplicarlo a fin de
dar el número faltante en la matriz o serie.

61
Validez
Métodos de la estructura interna y especificación de los modelos

Se realizaron dos tipos principales de análisis factoriales confirmatorios definitivos. El primer CFA se centró en
modelos que incluían (además de un factor g) nueve factores CHC amplios. En la Figura 4-5 se presenta este modelo
de factores amplios. El segundo tipo de análisis incluyó tres niveles de factores: g, factores CHC amplios y habilidades
CHC estrechas; se expone en la Figura 4-6. Estos modelos grafican visualmente, según el formato estándar de un
diagrama de sendero, la correspondencia supuesta a manera de hipótesis entre las pruebas de las WJ III y los factores
CHC amplios y estrechos. En los Cuadros F-1 y F-2 del Apéndice F se presentan los resultados de los CFA para
sujetos de 6 años en adelante, correspondientes a los modelos de medición de las Figuras 4-5 y 4-6, respectivamente.

La evaluación del ajuste del modelo exige examinar las cargas de factores que aparecen en los cuadros F-1 y F-2
así como los estadísticos de ajuste del modelo, en particular con relación a otros modelos posibles. El Cuadro F-3 del
Apéndice F expone tres series de estadísticos de ajuste (el chi cuadrado, el error cuadrático medio de aproximación
[Root Mean Square Error of Approximation, RMSEA, por sus siglas en inglés] y el Criterio de Información de Akaike
[Akaike Information Criterion, AIC, por sus siglas en inglés]) para evaluar el modelo amplio (Figura 4-5). Si bien el
cuadro incluye el estadístico chi cuadrado, lo habitual es que éste no sea considerado una prueba de inferencia
estadística sino más bien una medida de la bondad del ajuste, con la cual pueden compararse distintos modelos
(Bynner y Romney, 1985; Jöreskog y Sörbom, 1989). Los modelos más admisibles y de mejor ajuste son los que
tienen valores de chi cuadrado pequeños en relación con los grados de libertad. También se da para cada modelo el
criterio RMSEA (MacCallum, Browne y Sugawara, 1996), que permite determinar si debe rechazarse la hipótesis nula
de un ajuste estrecho del modelo a los datos. Lo característico es que valores RMSEA iguales o menores a .05 indiquen
un buen ajuste. Por último, se ofrece el AIC, un índice útil para comparar modelos que no sean necesariamente
anidados, con el fin de cotejar entre sí los modelos rivales, en cuyo caso valores inferiores del AIC indican un mejor
ajuste.

Los datos provenientes de los CFA no confirman un modelo: lo único que hacen es no impugnarlo. Por lo tanto,
es decisivo comparar los estadísticos de ajuste del modelo WJ III COG de siete factores (Figura 4-5) con los
estadísticos de ajuste de otros modelos.5 Además del modelo nulo (ningún factor presente) y del que incluye sólo la
inteligencia general (g), se evaluaron otros cuatro modelos. Partiendo de las síntesis recientes generadas por los
estudios sobre los CFA basados en la teoría CHC (Flanagan, McGrew y Ortiz, 2000; McGrew, 1997; McGrew y
Flanagan, 1998; Woodcock, 1990), se especificaron dos modelos Gf-Gc de cuatro factores a fin de aproximarse a la
estructura organizativa de la inteligencia implícita en la última edición de la Wechsler Adult Intelligence Scale–Third
Edition (WAIS-III) (Wechsler, 1997) (Gc = Verbal; Gsm = Memoria de trabajo; Gs = Rapidez en el procesamiento;
Gv + Gf = Organización perceptual) y a la Stanford-Binet Intelligence Scale–Fourth Edition (SB-IV) (Thorndike,
Hagen y Sattler, 1986) (Gc = Razonamiento verbal; Gsm = Memoria a corto plazo; Gq = Razonamiento cuantitativo;
Gv + Gf = Razonamiento visual abstracto). Se especificó, además, un modelo representativo de la teoría dicotómica
original Gf-Gc (como la que sustenta la Kaufman Adolescent and Adult Intelligence Test, KAIT (Kaufman y Kaufman,
1993). Por último, se especificó un modelo no correspondiente a la teoría CHC sino basado en el modelo no
correspondiente a la teoría CHC sino basado en el modelo de inteligencia llamado Planeamiento, Atención, Sucesivo,
Simultáneo (Planning, Attention, Successive, Simultaneous, [PASS, por sus siglas en inglés]) (Das, Naglieri y Kirby,
1994). La especificación del modelo PASS se basó en un reexamen de la definición de sus construcciones teóricas, la
comparación entre las pruebas del Das Naglieri Cognitive Assessment System (CAS), basadas en el PASS (Naglieri y
Das, 1997a), y las pruebas de la WJ III y la interpretación sugerida por el PASS de las baterías de inteligencia
tradicionales (p. ej., las de Wechsler), efectuada por Das et al. (1994) y por Kaufman (1994). A fin de evaluar
adecuadamente cada modelo, se inspeccionaron los resultados de cada primer modelo CFA y se introdujeron
posteriores mejoras en cada uno agregando o suprimiendo parámetros dentro del marco del modelo teórico subyacente.

5
Como la mayoría de los modelos de la inteligencia no incluyen pruebas de aprovechamiento, se excluyeron de los modelos de comparación (entre ellos el
representado en la Figura 4-5) las pruebas de la WJ III ACH. Por tal motivo, el modelo WJ III se redujo en estos análisis de nueve a siete factores.
62
Validez
Formación de Análisis- Razonamiento
conceptos Síntesis numérico

Rotación de bloques Problemas aplicados

Relaciones espaciales Cálculo

Integración visual
Fluidez en matemáticas

Reconocimiento de dibujos
Conceptos cuantitativos

Planeamiento
Ortografía

Pareo visual
Corrección de textos

Tachar Escritura a
mano
Rapidez en la decisión
Fluidez en la escritura
Cancelación de pares

Muestras de redacción

Rapidez en la identificación
de dibujos Análisis de sonidos

Fluidez de recuperación
Fluidez en la lectura

Rememoración de cuentos
Comprensión
de textos
Memoria diferida –
Rememoración de
cuentos Vocabulario de lectura

Aprendizaje visual-
auditivo Identificación de
letras y palabras
Memoria diferida –
Aprendizaje
visual-auditivo Análisis de palabras
Memoria para nombres
Comprensión verbal
Memoria diferida – Memoria
para nombres
Vocabulario sobre
dibujos

Palabras incompletas Información general

Conocimientos
Integración de sonidos académicos

Discernimiento de sonidos Comprensión oral

Atención auditiva Comprensión de


indicaciones

Configuración de sonidos

Memoria de Inversión de Memoria para Memoria para


trabajo auditiva números palabras frases

Nota: Las pruebas de la WJ III se indican en negrita; las pruebas de investigación de la WJ III en letra común. Los óvalos corresponden a los
factores amplios CHC y a g. Se han omitido los residuos.

Figura 4-5.
Modelo hipotético de la WJ III basado en nueve factores amplios CHC y en g.
63
Validez
Formación de Análisis- Razonamiento
conceptos Síntesis numérico

Rotación de bloques Problemas aplicados


VZ/SR
Relaciones espaciales Cálculo

Integración visual Fluidez en matemáticas

Reconocimiento de dibujos Conceptos cuantitativos

Planeamiento
Ortografía

Pareo visual Corrección de textos

Tachar Escritura a
mano

Rapidez en la decisión
Fluidez en la escritura

Cancelación de pares
Muestras de redacción

Rapidez en la identificación Análisis de sonidos


de dibujos

Fluidez de recuperación Fluidez en la lectura

Rememoración de cuentos Comprensión


de textos
Memoria diferida –
Rememoración de Vocabulario de lectura
cuentos

Aprendizaje visual-
Identificación de
auditivo
letras y palabras
Memoria diferida –
Aprendizaje
visual-auditivo Análisis de palabras

Memoria para nombres


Comprensión verbal
Memoria diferida – Memoria
para nombres Vocabulario sobre
dibujos

Palabras incompletas Información general

Conocimientos
Integración de sonidos académicos

Discernimiento de sonidos Comprensión oral

Atención auditiva Comprensión de


indicaciones
Configuración de sonidos

Memoria de Inversión de Memoria para Memoria para


trabajo auditiva números palabras frases

Nota: Las pruebas de la WJ III se indican en negrita; las pruebas de investigación de la WJ III, en letra común. Los óvalos corresponden a
los factores amplios CHC y a g; los círculos, a los factores CHC estrechos. Se han omitido los residuos.

Figura 4-6.
Modelo hipotético de la WJ III basado en tres niveles de factores: g, los factores amplios CHC y las habilidades CHC
estrechas.
64
Validez
Evidencia de estructura interna del modelo CHC de factores amplios

Un repaso de los estadísticos de ajuste presentados en el Cuadro F-3 del Apéndice F revela que el modelo CHC de la
WJ III COG ofrece, en todos los índices de ajuste, la explicación más admisible para los datos estandarizados. Si bien
el error cuadrático medio de aproximación (Root Mean Square Error of Approximation [RMSEA]) del modelo WJ III
es algo superior a .05, sigue siendo el menor de los RMSEA computados, y dada la complejidad del modelo que se
evalúa, cabe interpretar que indica que los datos ofrecen un ajuste estrecho al modelo. La comparación con otros
modelos más simples de la inteligencia –ya sea los basados en la hipótesis de estructuras organizativas CHC truncadas
(como las escalas KAIT, SB-IV y WAIS-III) o en otros modelos de la inteligencia (el PASS)– revela que estos últimos
constituyen descripciones menos admisibles de las relaciones entre las habilidades medidas por la WJ III.

La magnitud de las cargas de factores de las diversas pruebas en el Cuadro F-1 del Apéndice F proporciona
información y evidencias de validez importantes para interpretar las pruebas y compuestos de la WJ III. Por ejemplo,
las cargas significativas para Comprensión verbal (.92) e Información general (.88) sustentan la interpretación de estas
pruebas como indicadoras de la habilidad amplia Gc. Otro ejemplo es el factor Gf, con respecto al cual tanto Análisis-
Síntesis (.73) como Formación de conceptos (.76) demostraron tener cargas de factores significativas. Estos dos
ejemplos (Gf y Gc), que se reiteran en el caso de otros factores del Cuadro F-1, no sólo sustentan la interpretación de
las pruebas individuales, sino que también apoyan la combinación de pruebas específicas en compuestos para
representar determinados factores CHC. Casi todas las pruebas de la WJ III COG cargan en un único factor, lo cual nos
indica que las pruebas cognitivas han reducido al mínimo la gravitación de la variancia irrelevante para la construcción
teórica. La minimización de las variancias irrelevantes para la construcción teórica aumenta el grado de confianza con
que pueden interpretarse las puntuaciones de los compuestos cognitivos de la WJ III como indicadores válidos de sus
respectivas habilidades.

A la inversa, muchas de las pruebas de aprovechamiento demuestran tener cargas sobre más de un factor. Por
ejemplo, las tres pruebas de fluidez académica (Fluidez en la lectura, Fluidez en la escritura y Fluidez en
matemáticas) exhiben cargas significativas de los factores en sus respectivos factores de aprovechamiento (Grw o Gq)
así como en el factor Gs amplio. Esto indica que las tareas de fluidez académica miden tanto el nivel como el ritmo del
aprovechamiento. Otro ejemplo es la prueba de Análisis de palabras, que exhibe cargas de los factores en Grw (.67) y
Ga (.13). Este resultado sugiere que, además de medir un aspecto importante de la lectura, las habilidades auditivas
(con toda probabilidad la percepción fonémica) influyen en el rendimiento del sujeto en Análisis de palabras. En el
caso de las pruebas de aprovechamiento, factorialmente complejas, algunas de las cargas de factores secundarias en
factores cognitivos pueden reflejar influencias causales.

Finalmente, las correlaciones residuales de que da cuenta el Cuadro F-1 del Apéndice F representan fuentes de
variancia común entre pruebas que no se explican por los factores CHC amplios. En ciertos casos, estos residuos
reflejan una variancia de contenido común (v. gr., tanto Comprensión verbal como Vocabulario sobre dibujos incluyen
ítemes que implican conocimiento léxico), una variancia de método (v. gr., el formato de la prueba de memoria
diferida) o una variancia de habilidad estrecha (v. gr., tanto Fluidez de recuperación como Rapidez en la identificación
de dibujos miden distintos aspectos de la facilidad de identificación).

La validez de la construcción teórica de los compuestos de la WJ III COG no depende necesariamente de las dos
pruebas combinadas que ponen de manifiesto altas cargas de factores (> .70). En rigor, las altas cargas de factores de
una prueba pueden ser un contraindicador de la amplitud del factor. Cuando se realiza una muestra apropiada de los
indicadores de diferentes aspectos de un cierto dominio teórico, un factor cuyas cargas de factores son todas
moderadas puede, en verdad, generalizarse a criterios más externos. En la literatura sobre confiabilidad, a este
fenómeno suele denominárselo “paradoja de la atenuación” (Boyle, 1991; Clark y Watson, 1995; Loevinger, 1954).
Esta paradoja establece que si las correlaciones entre los ítemes de una prueba son demasiado altas, tal vez sea
homogénea y confiable, pero también puede haberse vuelto tan limitada en contenido que quede comprometida su
validez. El mismo principio es aplicable a la correlación de los indicadores del factor de la prueba, donde la
maximización de la magnitud absoluta de los índices de homogeneidad de los factores (v. gr., las cargas de los
factores) puede tener lugar a expensas de la amplitud y validez de éstos. En otras palabras, puede tenerse un factor
65
Validez
estrecho con indicadores de prueba que revelan habilidades similares, en lugar de un factor que represente más
adecuadamente distintos aspectos del dominio teórico. En el caso del factor Gv, las cargas moderadas de los factores
(de .40 a .67) se deben a que las cinco pruebas miden diversos aspectos de Gv (Relaciones espaciales, las relaciones
espaciales; Reconocimiento de dibujos, la memoria visual; Planeamiento, el alcance de la percepción visual;
Integración visual, la rapidez de integración; Rotación de bloques, la visualización). Un factor Gv con dos pruebas,
cada una de las cuales mide la memoria visual, puede producir un compuesto con dos cargas de factores muy altas,
pero el compuesto representará una construcción teórica mucho más estrecha (la memoria visual, que es sólo un
aspecto de Gv), cuya capacidad de generalización es limitada.

Evidencia de estructura interna del modelo CHC de factores amplios: hallazgos sobre el desarrollo. El
modelo de factores amplios CHC de la WJ III representado en la Figura 4-5 fue evaluado además en cinco muestras de
edades diferenciadas (años 6 a 8, 9 a 13, 14 a 19, 20 a 39 y más de 40). En cada muestra se aplicó el modelo original y
luego se realizaron ajustes (se agregaron o suprimieron parámetros) según indicara el examen de los índices y residuos
de modificación del programa Amos. Los Cuadros F-4 a F-8 del Apéndice F resumen los resultados de cada análisis.
La inspeccción de estos resultados brinda información importante sobre la interpretación de una prueba en todo el ciclo
de vida. Por ejemplo, la prueba Comprensión verbal carga siempre entre .87 y .95 en el factor Gc en todos los grupos
etarios. Así pues, dicha prueba es un indicador válido de Gc para toda edad. En contraste, las habilidades requeridas
para tener un buen rendimiento en Problemas aplicados parece cambiar con la edad. En la muestra de 6 a 8 años, esta
prueba exhibió cargas significativas en Gq (.38) y Gf (.50), lo cual indica que las habilidades más notorias eran las del
razonamiento fluido (Gf). En las muestras subsiguientes, el desempeño en Problemas aplicados se fue diferenciando
más, con el agregado de las habilidades Gc. En las muestras de las cuatro edades posteriores, la carga de Gf para
Problemas aplicados fue disminuyendo sistemáticamente al aumentar la edad (.37, .25, .16 y .18), en tanto que las de
Gc aumentaron, también en forma sistemática (.12, .19, .23 y .23). Estos hallazgos sugieren que a menor edad, el
rendimiento en dicha prueba exige más habilidades de razonamiento fluido (Gf) (junto con Gq), mientras que al
aumentar la edad Gf se torna menos importante, y cobra creciente importancia, además del acopio de conocimientos
cuantitativos adquiridos (Gq), el de conocimientos verbales generales (Gc). En líneas generales, la interpretación según
la teoría CHC de la mayoría de las pruebas de la WJ III es relativamente invariable en toda la gama de edades.

A fin de evaluar la validez del modelo CHC amplio de la WJ III en cada una de las cinco muestras, se comparó el
modelo final para cada grupo etario con el mejor de dos modelos de ajuste alternativos para toda la muestra (ver el
Cuadro F-3 del Apéndice F). Los estadísticos de ajuste para estas comparaciones se presentan en el Cuadro F-9. Los
valores de chi cuadrado, RMSEA y AIC para el modelo WJ III fueron inferiores en todas las comparaciones, lo cual
sugiere que dicho modelo era más admisible. Estos hallazgos vienen en apoyo del uso del modelo CHC de factores
amplios de las WJ III desde la edad de 6 años hasta la tercera edad.

Evidencia de estructura interna del modelo CHC de factores amplios/estrechos

El modelo expuesto en la Figura 4-6 es el primer intento de especificar y evaluar un modelo de tres estratos para una
batería psicológica y de aprovechamiento de gran alcance. El modelo CHC de factores amplios/estrechos difiere del
modelo CHC de factores amplios de la Figura 4-5 por el agregado de los 17 factores siguientes de habilidades
estrechas propuestos: Visualización/Relaciones espaciales (VZ/SR), Rapidez perceptual (P), Facilidad de
identificación (NA), Memoria significativa (MM), Memoria asociativa (MA), Codificación fonética (PC), Memoria de
trabajo (MW), Alcance de la memoria (MS), Habilidad auditiva (LS), Información general (K0/K2), Desarrollo del
lenguaje/Conocimiento léxico (LD/VL), Decodificación de la lectura (RD), Comprensión de lectura (RC), Habilidad
para la escritura (WA), Destrezas básicas en escritura (BWS), Aprovechamiento en matemáticas (A3) y Razonamiento
cuantitativo (RQ).

Los fundamentos de los 17 factores estrechos derivan de análisis de contenido teóricos y lógicos (McGrew, 1997;
McGrew y Flanagan, 1998; Flanagan et al., 2000) de las pruebas así como de las clasificaciones CHC de las pruebas
WJ-R y similares. El Cuadro F-2 del Apéndice F presenta los resultados de los CFA de este modelo desde los 6 años
hasta la edad adulta. El chi cuadrado de 22,348.80 (df = 1,115) produce un RMSEA de .05 (.050 a .051; intervalo de
confianza del 90%). Este RMSEA indica que la hipótesis de que el modelo se ajusta estrechamente a los datos
es aceptable.
66
Validez
Aunque se encuentren factores estrechos con muy altas cargas de factores (que a menudo se aproximan a 1.0) en
su respectivo factor amplio (v. gr., LS = .96, K0/K2 = .97, LD/VL = .98 en Gc), para admitir la verosimilitud del factor
estrecho en el modelo debe contarse con evidencia adicional, no proveniente del análisis factorial. En el caso de Gc, la
Figura 4-4b sugiere que el factor Habilidad auditiva (LS) tiene una pauta de desarrollo muy distinta que la de
Información general (K0/K2) y la de Desarrollo del lenguaje/Conocimientos léxicos (LD/LV). Así, aunque LS (.96)
muestra poseer una carga de factores casi idéntica cuando se lo compara con K0/K2 (.97) y con LD/VL (.98), la
evidencia de desarrollo indica que estos factores no representan la misma construcción teórica. Por otra parte, los
análisis de validez del contenido (ver los Cuadros 4-2 y 4-3) sugieren que probablemente las pruebas que contribuyen a
estos tres factores Gc estrechos miden distintas porciones del dominio del factor Gc. Este ejemplo de integración de
tres tipos diferentes de evidencia de validez (o sea, de contenido, de desarrollo y de estructura interna) es congruente
con recomendaciones recientes en el sentido de que para evaluar la validez de una interpretación derivada de una
prueba o batería, se emplee una integración coherente de múltiples fuentes de evidencia (AERA et al., 1999). Sobre la
base de la evidencia de validez de contenido (Cuadros 4-2 y 4-3), de desarrollo (Figuras 4-1 a 4-4) y estructural
(Apéndice F) presentada en este capítulo, el modelo CHC de factores amplios/estrechos de la WJ III expuesto en la
Figura 4-6 parece constituir una interpretación admisible y válida de la estructura de la WJ III.

La comparación de los resultados de los AFC en el Cuadro F-1 del Apéndice F con los del Cuadro F-2 revela
varias diferencias importantes, las cuales influyen en la interpretación de las siguientes pruebas de la WJ III:
Fluidez de recuperación y Rapidez en la identificación dibujos: El modelo de factores amplios/estrechos aboga
por que se interpreten estas dos pruebas como indicadoras de Glr (cargas de factores en Facilidad de
identificación de .64 y .53), y no como medidas primarias de Gs (.33 y .44) e indicadores débiles de Glr (.33 y
.18) en el modelo de factores amplios.
Rememoración de cuentos: El modelo de factores amplios/estrechos aboga porque se interprete esta prueba
como una medida de Glr; más específicamente como una fuerte (.71) medida de Memoria significativa (MM)
dentro de Glr, así como una medida de un aspecto de Gc (Habilidad auditiva = .23). En cambio, debe
interpretársela como una prueba débil de Glr (.11) y una medida fuerte de Gc (.57) en el modelo de factores
amplios.
Rapidez en la decisión: En el modelo de factores amplios esta prueba es interpretada fundamentalmente como
una medida fuerte (.71) de Gs. En el modelo de factores amplios/estrechos, se la interpreta como una medida
más compleja, que puede requerir tanto Gs (.55) como Glr (Facilidad de identificación = .22).
Fluidez en la lectura: El modelo de factores amplios/estrechos sugiere que amén de medir aspectos de Grw
(.41) y de Gs (.31), esta prueba puede medir la Facilidad de identificación (.22) una habilidad de Glr.
Análisis-Síntesis: Tanto el modelo de factores amplios como el de factores amplios/estrechos abogan por que
se interprete esta prueba como una medida fuerte de Gf. Sin embargo, el modelo más complejo determina que
además de Gf (Secuencia general de razonamiento = .46), una parte del razonamiento involucrado en Análisis-
Síntesis es cuantitativo (RQ = .30), o sea, otro aspecto de Gf.
Problemas aplicados: En el modelo de factores amplios, se considera que esta prueba es una medida mixta de
Gq (.48) y Gf (.32), donde la gravitación de Gq es comparativamente mayor. En el modelo de factores
amplios/estrechos, se deja de lado esta interpretación y en cambio se sugiere que el componente de
razonamiento (RQ = .60) es mayor que el del componente Gq (Aprovechamiento en matemáticas, A3 = .30).
Conceptos cuantitativos: La interpretación de esta prueba pasa de considerarla principalmente Gf (.64) y, en
menor medida, Gq (.28) en el modelo de factores amplios, a considerarla sólo Gq (.91) en el modelo de
factores amplios/estrechos.

67
Validez
La especificación y evaluación de modelos de factores amplios/estrechos (como el que muestra la Figura 4-6)
brinda información sobre la estructura de factores y la validez de la WJ III. Por ejemplo, este modelo indica que
Fluidez de recuperación es una medida válida de un aspecto de Glr. Además, los CFA llevados a cabo tanto en el nivel
de las habilidades amplias como en el de las estrechas arrojan nueva luz sobre la estructura teórica de la inteligencia.
Esto es particularmente cierto cuando los CFA se integran con múltiples fuentes de evidencia de validez. Sería
provechoso realizar investigaciones ulteriores sobre la WJ III, sobre todo en distintos niveles de desarrollo e
incluyendo medidas adicionales de otras habilidades CHC estrechas.

Evidencia de intercorrelaciones en los compuestos


El Apéndice E da cuenta de las intercorrelaciones entre los compuestos de la WJ III COG y la WJ III ACH para las
cinco amplias muestras de edades diferenciadas. Como ocurre con las intercorrelaciones entre las pruebas, se supone
que las correlaciones serán mayores entre compuestos vinculados entre sí que entre los que no lo están. Por ejemplo, el
Cuadro E-5 (14 a 19 años) indica que la correlación entre los compuestos de Destrezas básicas en lectura y
Comprensión de lectura es .68, en tanto que su correlación con Destrezas en cálculos matemáticos es .52 y su
correlación con Rapidez en el procesamiento (Gs) es aun menor (.40). En el caso de los compuestos de
aprovechamiento, el repaso de las intercorrelaciones entre las cinco muestras revela una pauta congruente de mayores
correlaciones entre los compuestos del mismo dominio (evidencia convergente) y de menores correlaciones entre los
de dominios diferentes (evidencia discriminativa).
Por el contrario, la gama de intercorrelaciones de los compuestos cognitivos (típicamente .20 a .60) es inferior a la
correspondiente a los compuestos principales de aprovechamiento, lo cual viene en apoyo de la interpretación de que
los compuestos de la WJ III COG miden habilidades cognitivas diferenciadas. Por último, importa advertir que la
mayoría de las altas correlaciones (dentro de la amplitud .70 a .90) sobre las que informa el Apéndice E corresponden a
compuestos que tienen pruebas en común. Por ejemplo, en el Cuadro E-5 se observa que la correlación entre el
compuesto Habilidad intelectual breve (BIA, por sus siglas en inglés) y el de la Habilidad intelectual
general–Estándar (GIA-Std) es .92, lo cual refleja el hecho de que las tres pruebas de la BIA (Comprensión verbal,
Formación de conceptos y Pareo visual) también han sido incluidas en el GIA-Std. Análogamente, para la misma
gama de edades, el compuesto de Destrezas académicas comparte una prueba con los compuestos Amplia lectura,
Amplias matemáticas y Amplio lenguaje escrito. Por ello, es natural que Destrezas académicas tenga correlaciones
comparativamente altas con los otros tres compuestos de aprovechamiento (.78, .79 y .84, respectivamente).

Evidencia basada en las relaciones con otras variables


Las condiciones necesarias y suficientes de la validez de una construcción teórica se satisfacen cuando ciertas medidas
estructuralmente válidas demuestran mantener relaciones previstas, convergentes y divergentes, con medidas de
construcciones teóricas que son externas respecto de las medidas focales (Benson, 1998; Benson y Hagtvet, 1996). En
esta sección informaremos sobre una serie de análisis en los que se examinó la relación entre las puntuaciones de las
pruebas y compuestos de la WJ III con diversas variables de criterio externas. Entre los tipos de evidencia de validez
externa de que nos ocuparemos están la validez concurrente de: (a) la WJ III COG con otras baterías de pruebas
cognitivas o especializadas que incluyen medidas de construcciones teóricas semejantes; (b) la WJ III COG y las
medidas de aprovechamiento escolar; (c) la WJ III ACH y las baterías de pruebas de aprovechamiento que miden
construcciones teóricas semejantes; y (d) la relación entre las puntuaciones de la WJ III y la pertenencia a ciertos
grupos (individuos con discapacidades para el aprendizaje e individuos que padecen trastornos por déficit de
atención/hiperactividad (Attention-Deficit/Hyperactivity Disorder, [ADHD, por sus siglas en inglés]).

Muestras de estudios especiales


Se administraron a varias muestras de validez especiales distintas baterías de pruebas a fin de obtener evidencias de
validez externa. A continuación se describirán brevemente tales muestras. A menos que se aclare lo contrario, en todos
los estudios la unidad primaria de análisis fue la puntuación del compuesto o puntuación compuesta. Los cuadros que
acompañan la descripción de cada muestra contienen información adicional a la que se hará referencia en los análisis
de validez que siguen.

68
Validez
Muestra normal de preescolares de Ford, Teague y Tusing. Este estudio fue realizado bajo la dirección de Laurie
Ford y Terri Teague (University of South Carolina) y de Mary Beth Tusing (University of Wisconsin–Stout); colaboró
con ellos Susan League (University of South Carolina). La muestra constaba de 202 niños cuyas edades iban de 1 año y 9
meses a 6 años y 3 meses (M = 52.7 meses, SD = 12.6). Los sujetos, seleccionados al azar, asistían a guarderías públicas
y privadas, establecimientos preescolares y centros de aprendizaje temprano, o bien no formaban parte de ningún
programa formal de cuidado o educación de niños. Los participantes provenían de regiones rurales, suburbanas y urbanas
del estado de Carolina del Sur.

Las medias y desvíos estándar presentados en el Cuadro 4-5 indican que la muestra se hallaba encuadrada dentro de
la amplitud promedio de la habilidad intelectual general. Los niños que participaron en el estudio completaron todas las
pruebas de la WJ III COG y la WJ III ACH apropiadas para preescolares.

Además, a todos los sujetos se les administró la Wechsler Preschool and Primary Scale of Intelligence–Revised
(WPPSI-R) (Wechsler, 1989) y la Differential Ability Scales (DAS) (Elliott, 1990). Todas las pruebas fueron
administradas en forma balanceada en varias sesiones. La WPPSI-R es una batería de administración individual que
evalúa una variedad de habilidades cognitivas. Se la considera una medida confiable y válida de la habilidad cognitiva
general, o inteligencia, para niños desde 3 años hasta 7 años y 3 meses. Se analizaron los cocientes de inteligencia de las
escalas verbal, de ejecución y completa. La DAS es también una batería de administración individual destinada a evaluar
diversas habilidades cognitivas de niños desde 2 años y 6 meses hasta 7 años y 11 meses. Permite obtener una puntuación
de Habilidad conceptual global (Global Conceptual Ability, [GCA, por sus siglas en inglés]) para todos los intervalos de
edades, y puntuaciones de los compuestos Habilidad verbal y Habilidad no verbal para niños de 3 años y 6 meses o
mayores. Fueron analizadas las puntuaciones de los tres compuestos.

Muestra normal de preescolares de Phelps y Ford. Este estudio de preescolares fue llevado a cabo por LeAdelle
Phelps (University at Buffalo–State University of Nueva York) y Laurie Ford (University of South Carolina);
colaboraron con la investigación Lisa Bischoff (Indiana State University) y Susan Wilczynski (University of Southern
Mississippi). La edad de los niños iba desde 3 años y 0 mes a 5 años y 10 meses (M = 4 años y 9 meses, SD = 9.6). Los
sujetos fueron seleccionados al azar entre guarderías y establecimientos preescolares públicos y privados de Hattiesburg
(Mississippi), Terre Haute (Indiana) y Buffalo (Nueva York). El Cuadro 4-6 muestra las medias y desvíos estándar de las
medidas reportadas. La muestra se encontraba, en general, dentro del intervalo promedio de habilidad intelectual general.
Los sujetos completaron todas las pruebas de la WJ III COG apropiadas para preescolares.

Además, todos los participantes completaron la Stanford-Binet Intelligence Scale–Fourth Edition (SB-IV)
(Thorndike et al., 1986). Las baterías fueron administradas en orden balanceado en varias sesiones de evaluación. La
SB-IV es una batería de administración individual destinada a evaluar las habilidades cognitivas según un marco
jerárquico en tres niveles. Abarca desde los 2 hasta los 23 años y permite obtener una puntuación compuesta y
puntuaciones de las áreas de Razonamiento verbal, Razonamiento abstracto/visual, Razonamiento cuantitativo y
Memoria a corto plazo para preescolares. El estudio incluyó pruebas apropiadas para preescolares y se analizaron las
puntuaciones compuestas y de área resultantes. En general, se estima que la SB-IV constituye una medida confiable y
válida de la inteligencia.

69
Validez
Cuadro 4-5.
Estadísticos descriptivos y correlaciones entre compuestos seleccionados de la WJ III COG, compuestos de la WPPSI-R y
compuestos de la DAS, para una muestra de preescolares (estudio de Ford, Teague y Tusing)
PUNTUACIONES COMPUESTAS Y
PUNTUACIONES COMPUESTAS Y DE COMPUESTOS DE LA
DE COMPUESTOS DE LA DAS WPPSI-R

Habilidad IQ de
conceptual Habilidad Habilidad escala IQ de
Medida N M SD general verbal no verbal completa IQ verbal ejecución
Habilidad intelectual general
de la WJ III
Escala extendida 116 93.4 12.7 .73 .64 .65 .74 .68 .67
Escala estándar 133 92.9 12.3 .67 .57 .58 .73 .66 .67
Habilidad intelectual
abreviada 138 90.2 13.1 .67 .53 .63 .67 .60 .62
Compuestos cognitivos de
la WJ III
Habilidad verbal–Ext 147 97.1 10.9 .66 .69 .54 .72 .70 .62
Habilidad verbal–Est 149 97.0 11.5 .63 .64 .51 .72 .69 .62
Habilidad para pensar–
Ext 124 96.3 12.7 .68 .60 .60 .68 .60 .63
Habilidad para pensar–
Est 155 97.7 12.5 .63 .57 .57 .64 .56 .60
Eficiencia cognitiva–Ext 139 89.7 14.1 .56 .43 .54 .61 .55 .56
Eficiencia cognitiva–Est 147 88.1 14.0 .53 .38 .51 .58 .52 .54
Comprensión-
conocimiento (Gc) 147 97.1 10.9 .66 .69 .54 .72 .70 .62
Conocimiento (Gc) 170 97.0 12.1 .57 .60 .43 .57 .57 .48
Recuperación a largo
plazo (Glr) 149 98.5 13.6 .56 .51 .53 .57 .51 .54
Percepción fonémica
(Gv) 166 96.6 12.8 .55 .50 .47 .53 .45 .53
Procesamiento auditivo
(Ga) 150 94.5 12.6 .53 .48 .47 .54 .52 .47
Discernimiento de
fonemas (Ga) 174 94.5 13.9 .46 .45 .38 .49 .48 .43
Razonamiento fluido (Gf) 148 99.0 11.1 .45 .36 .40 .43 .35 .42
Rapidez en el
procesamiento (Gs) 159 86.5 13.4 .56 .38 .56 .54 .45 .55
Fluidez cognitiva (Gs) 159 98.4 11.5 .57 .45 .54 .48 .40 .49
Memoria a corto plazo
(Gsm) 156 97.3 13.6 .43 .41 .38 .52 .51 .43
N — — — 165 166 166 171 171 171
Media — — — 96.8 95.1 99.0 95.1 94.9 96.8
Desvío estándar — — — 15.9 16.3 15.8 14.3 13.9 14.3
Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima
y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
70
Validez
Cuadro 4-6.
Estadísticos descriptivos y correlaciones entre compuestos seleccionados de la WJ III COG y compuestos y puntuaciones de
compuestos de la SB-IV, para una muestra de preescolares (estudio de Phelps y Ford)
PUNTUACIONES COMPUESTAS Y DE LOS COMPUESTOS DE LA SB-IV

Puntuación Razonamiento
compuesta Razonamiento abstracto- Razonamiento Memoria a
Medida N M SD de la prueba verbal visual cuantitativo corto plazo

Habilidad intelectual general


de la WJ III .44
25 94.0 13.5 .71 .67 .03 .66
Escala extendida
28 95.3 14.5 .76 .76 .48 .25 .69
Escala estándar
Habilidad intelectual
abreviada 32 93.3 15.3 .60 .68 .32 .08 .55
Compuestos cognitivos de la
WJ III
Habilidad verbal–Ext 32 98.7 11.9 .63 .65 .30 .37 .57
Habilidad verbal–Est 32 101.2 10.4 .50 .60 .32 .08 .48
Habilidad para pensar –
Ext 27 94.8 16.4 .73 .62 .44 .39 .56
Habilidad para pensar–
Est 28 97.6 15.1 .69 .67 .37 .39 .55
Eficiencia cognitiva–Ext 30 90.8 14.1 .60 .61 .39 .02 .61
Eficiencia cognitiva–Est 32 89.2 14.3 .62 .66 .40 .08 .60
Comprensión-
conocimiento (Gc) 32 98.7 11.9 .63 .65 .30 .37 .57
Conocimiento (Gc) 32 87.9 9.0 .61 .61 .32 .40 .55
Recuperación a largo
plazo (Glr) 32 94.7 16.0 .69 .57 .57 .46 .38
Percepción fonémica
(Gv) 27 94.2 16.9 .67 .50 .60 .22 .47
Procesamiento auditivo
(Ga) 32 91.0 17.1 .50 .42 .02 .45 .47
Discernimiento de
fonemas (Ga) 32 95.4 16.0 .53 .49 .00 .48 .55
Razonamiento fluido (Gf) 32 101.4 14.6 .63 .62 .36 .26 .56
Rapidez en el
procesamiento (Gs) 30 88.4 13.8 .44 .56 .24 -.20 .45
Fluidez cognitiva (Gs) 29 98.9 13.2 .42 .39 .28 .12 .37
Memoria a corto plazo
(Gsm) 32 97.2 15.0 .64 .53 .45 .32 .62
Memoria de trabajo (Gsm) 32 95.8 12.0 .59 .57 .42 .11 .64
N — — — 32 32 32 32 32
Media — — — 99.2 104.4 96.8 97.2 100.1
Desvío estándar — — — 12.64 12.0 14.7 15.1 14.5

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades.
Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el momento en
que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de edad, mientras
que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y por debajo de la
mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

71
Validez
Muestra normal de los grados 3 a 5 de Phelps. Este estudio para escolares fue realizado bajo la dirección de
LeAdelle Phelps (University at Buffalo–State University of Nueva York). El grupo consistió en una muestra de 150
alumnos de los grados 3 a 5, seleccionados al azar, de tres escuelas primarias públicas de un único distrito escolar
suburbano de la ciudad de Buffalo, estado de Nueva York. La edad de los niños iba de 8 años y 3 meses a 12 años y 4
meses (M = 117.5 meses, SD = 10.7).

El examen de las medias y desvíos estándar de las medidas incluidas en el Cuadro 4-7 indica que esta muestra se
mantenía, en general, dentro del promedio en cuanto a habilidad intelectual general. La amplitud de los desvíos estándar
para la mayoría de los compuestos cognitivos (sobre todo en el intervalo de 11 a 13) indica que la muestra tenía una
habilidad moderadamente limitada. Los niños de este estudio completaron todas las pruebas de las WJ III COG que dan
la GIA y los compuestos de factores cognitivos, así como todas las pruebas de las WJ III ACH que generan los
compuestos de aprovechamiento tanto de la Batería estándar como de la extendida.

Además, se administró a todos los sujetos la Wechsler Intelligence Scale for Children–Third Edition (WISC-III)
(Wechsler, 1991). Esta batería, de administración individual, evalúa una variedad de habilidades cognitivas y se la
considera una medida confiable y válida de la inteligencia cognitiva general para niños de 6 años a 16 años y 11 meses.
Se analizaron los cocientes de inteligencia derivados de las escalas verbal, de ejecución y completa, así como índices de
los factores Comprensión verbal, Organización perceptual, Rapidez en el procesamiento y Capacidad de concentración.
Las pruebas de la WJ III y de la WISC-III se administraron en orden balanceado en varias sesiones.

Muestra normal de los grados 3 a 5 de McIntosh y Dunham. Este estudio de 130 alumnos de escuelas primarias
fue realizado por David E. McIntosh (Ball State University) y Mardis Dunham (University of Kentucky). Los alumnos de
los grados 3 a 5 fueron seleccionados al azar en escuelas primarias públicas (91%) y privadas (9%) de la zona centro-sur
del estado de Kentucky y del área metropolitana de la ciudad de Albany, estado de Nueva York. Los niños tenían desde 8
años y 3 meses hasta 12 años y 3 meses (M = 120.6 meses, SD = 10.6).

Las medias y desvíos estándar presentados en el Cuadro 4-8 indican que esta muestra se hallaba entre la amplitud
término medio superior a término medio en cuanto a la habilidad intelectual general. La amplitud de los desvíos estándar
para la mayoría de los compuestos cognitivos (típicamente en la amplitud de 13 a 15) indica que la muestra presentaba
sólo una leve restricción de la amplitud. Los niños completaron pruebas escogidas de la WJ III COG que produjeron la
GIA y compuestos escogidos de factores cognitivos.

Además, a todos los sujetos se les administró la DAS en orden balanceado a lo largo de varias sesiones. La DAS es
una batería de administración individual que evalúa una variedad de habilidades cognitivas en niños de 6 años a 17 años y
11 meses. Produce una puntuación de la GCA así como puntuaciones de los compuestos Habilidad verbal, Razonamiento
no verbal y Habilidad espacial, todas las cuales fueron analizadas.

Muestra normal de los grados 3 a 6 de Flanagan, Kranzler y Keith. Dawn Flanagan (St. John’s University), John
Kranzler (University of Florida) y Timothy Keith (Alfred University) investigaron la relación entre pruebas escogidas de
la WJ III COG y el Das·Naglieri Cognitive Assessment System (CAS) (Naglieri y Das, 1997b). La muestra consistía en
155 alumnos de escuelas primarias de los grados 3 a 6. Se los seleccionó al azar en escuelas públicas de la ciudad de
Nueva York y de Gainesville, estado de Florida, y tenían desde 8 años y 3 meses hasta 12 años y 4 meses (M = 117.5
meses, SD = 10.7).
Las medias y desvíos estándar presentados en el Cuadro 4-9 indican que la muestra estaba dentro de la amplitud
promedio de la habilidad intelectual general. Los desvíos estándar de la mayoría de los compuestos cognitivos muestran
una amplitud bastante representativa (de 12 a 16) del talento dentro de la muestra. En este estudio, los niños completaron
pruebas escogidas de la WJ III COG para determinar las puntuaciones en el compuesto Habilidad intelectual breve, así
como en los compuestos Recuperación a largo plazo (Glr), Procesamiento auditivo (Ga), Percepción fonémica (Ga),
Razonamiento fluido (Gf), Rapidez en el procesamiento (Gs) y Fluidez cognitiva (Gs).
También se administró a los sujetos la CAS, una batería de inteligencia de administración individual para utilizar con
niños desde 5 años hasta 17 años 11 meses, cuya estructura se basa en la teoría PASS del procesamiento cognitivo.

72
Validez
Cuadro 4-7.
Estadísticos descriptivos y correlaciones entre los compuestos de la WJ III COG y la escala WISC-III, para los grados 3 a 5
(estudio de Phelps)
a
WISC-III

Medida N M SD FSIQ VIQ PIQ VC PO PS FFD


Habilidad intelectual general de
la WJ III
Escala extendida 148 103.1 10.8 .76 .72 .56 .67 .52 .43 .66
Escala estándar 150 101.5 10.9 .71 .66 .54 .58 .51 .43 .66
Habilidad intelectual abreviada 150 102.4 11.3 .69 .62 .55 .56 .48 .53 .60
Compuestos cognitivos de la
WJ III
Habilidad verbal–Ext 150 105.3 11.2 .73 .79 .42 .78 .41 .28 .46
Habilidad verbal–Est 150 103.9 12.6 .68 .73 .40 .71 .39 .26 .46
Habilidad para pensar–
Ext 150 99.6 10.7 .57 .50 .47 .43 .47 .28 .50
Habilidad para pensar –
Est 150 98.8 11.0 .58 .50 .48 .43 .51 .25 .48
Eficiencia cognitiva–Ext 148 101.9 11.7 .55 .47 .45 .41 .37 .49 .62
Eficiencia cognitiva–Est 150 102.1 11.9 .44 .36 .40 .28 .30 .52 .60
Comprensión-
conocimiento (Gc) 150 105.3 11.2 .73 .79 .42 .78 .41 .28 .46
Conocimiento (Gc) 150 104.9 10.9 .71 .76 .43 .75 .42 .25 .45
Recuperación a largo
plazo (Glr) 150 101.1 11.3 .52 .50 .38 .45 .40 .12 .38
Percepción fonémica
(Gv) 150 97.2 12.6 .22 .15 .23 .10 .23 .10 .17
Procesamiento auditivo
(Ga) 150 97.8 13.4 .21 .16 .20 .10 .19 .22 .25
Discernimiento de
fonemas (Ga) 150 96.0 15.1 .17 .18 .10 .17 .10 .13 .22
Razonamiento fluido (Gf) 150 102.1 10.4 .58 .53 .45 .49 .46 .26 .51
Rapidez en el
procesamiento (Gs) 148 101.4 13.1 .43 .29 .45 .23 .33 .59 .39
Fluidez cognitiva (Gs) 148 100.9 10.8 .27 .24 .22 .20 .12 .41 .25
Memoria a corto plazo
(Gsm) 150 101.4 12.3 .42 .44 .26 .41 .24 .18 .58
Memoria de trabajo (Gsm) 150 101.6 11.7 .40 .38 .28 .32 .23 .31 .57
Media — — — 106.7 107.6 104.9 107.4 103.6 108.5 106.6
Desvío estándar — — — 12.4 13.5 13.1 13.7 13.5 14.6 13.9

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades.
Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el momento en
que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de edad, mientras
que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y por debajo de la
mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
a
Tamaño de la muestra de la WISC-III = 150. Abreviaturas de la WISC-III: FSIQ = IQ de escala completa; VIQ = IQ verbal; PIQ = IQ de ejecución;
VC = Índice de comprensión verbal; PO = Índice de organización perceptual; PS = Índice de rapidez en el procesamiento; FFD = Índice de capacidad de
concentración.

73
Validez
Cuadro 4-8.
Estadísticos descriptivos y correlaciones entre puntuaciones de compuestos seleccionados de la WJ III COG y de compuestos
de la DAS, para los grados 3 a 5 (estudio de McIntosh y Dunham)
a
PUNTUACIONES COMPUESTAS Y DE LOS COMPUESTOS DE LA DAS

Habilidad
conceptual Habilidad Razonamiento Habilidad
Medida N M SD general Verbal no verbal espacial
Habilidad intelectual general de
la WJ III
Escala extendida 122 105.4 13.3 .76 .65 .65 .49
Escala estándar 122 105.1 13.1 .76 .61 .65 .54
Habilidad intelectual abreviada 130 106.2 13.5 .70 .60 .59 .46
Compuestos cognitivos de la
WJ III
Habilidad verbal–Est 130 105.7 13.1 .68 .71 .55 .32
Habilidad para pensar–
Est 122 102.3 13.5 .69 .50 .64 .50
Eficiencia cognitiva–Ext 128 105.8 14.2 .51 .41 .41 .38
Eficiencia cognitiva–Est 130 104.6 14.6 .41 .30 .35 .34
Percepción visual-
espacial (Gv) 123 94.5 17.2 .27 .16 .29 .19
Procesamiento auditivo
(Ga) 129 98.1 13.6 .48 .34 .41 .39
Discernimiento de
fonemas (Ga) 129 101.0 13.7 .53 .42 .45 .38
Razonamiento fluido (Gf) 130 106.1 13.3 .72 .55 .67 .47
Rapidez en el
procesamiento (Gs) 128 104.7 14.8 .43 .32 .31 .40
Memoria a corto plazo
(Gsm) 130 104.4 13.7 .40 .35 .36 .24
Memoria de trabajo (Gsm) 130 103.1 14.7 .48 .39 .39 .34
Media — — — 109.2 106.3 109.6 107.2
Desvío estándar — — — 13.7 15.7 13.9 13.6

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades.
Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el momento en
que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de edad, mientras
que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y por debajo de la
mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
a
Tamaño de la muestra de la DAS = 130.

Se analizaron las puntuaciones de los compuestos Planeamiento, Atención, Procesamiento simultáneo y Procesamiento
sucesivo, así como la puntuación de la escala completa CAS. Las pruebas de la WJ III y CAS se administraron en forma
balanceada a lo largo de varias sesiones. Se informa sobre otros análisis de estos mismos datos en Keith, Kranzler y
Flanagan (2001), Kranzler, Keith y Flanagan (2000a) y Kranzler, Keith y Flanagan (2000b).

Muestra normal de los grados 1 a 8 de Ford, Simmons y North. Este estudio para niños en edad escolar fue
conducido por Laurie Ford, Wendy Simmons y Kathryn North (University of South Carolina). La muestra consistió en 52
alumnos de los grados 1 a 8 que fueron seleccionados al azar en escuelas primarias públicas y privadas de la ciudad de
Columbia, estado de Carolina del Sur. Los participantes tenían entre 5 años y 11 meses, y 14 años (M = 117.3 meses,
SD = 23.9).

Las medias y desvíos estándar presentados en el Cuadro 4-10 indican que la muestra funcionaba dentro de la
amplitud término medio superior a término medio en la mayoría de las áreas de aprovechamiento académico. La

74
Validez
Cuadro 4-9.
Correlaciones entre compuestos seleccionados de la WJ III COG y la escala CAS, para los grados 3 a 6 (estudio de Flanagan,
Kransler y Keith)
COMPUESTOS COGNITIVOS DE LAS WJ III

Recupera- Procesa- Percep-


Habilidad ción a miento ción Razona- Rapidez en Fluidez
intelectual largo auditivo fonémica miento el procesa- cognitiva
Medida N M SD breve (BIA) plazo (Glr) (Ga) (Ga) fluido (Gf) miento (Gs) (Gs)
Sistema de evaluación cognitiva
Puntuación de escala
completa de la CAS 144 102.8 12.4 .70 .51 .49 .42 .53 .60 .57
Planeamiento 145 99.4 14.0 .61 .46 .34 .25 .38 .57 .45
Atención 144 102.6 13.6 .52 .38 .30 .29 .28 .54 .46
Procesamiento simultáneo 145 100.8 16.1 .63 .50 .45 .46 .54 .39 .37
Procesamiento sucesivo 144 103.5 12.2 .39 .31 .36 .35 .34 .16 .17

N — — — 155 155 154 155 155 155 151


Media — — — 97.7 100.7 90.3 97.1 96.1 99.3 99.6
Desvío estándar — — — 13.4 12.1 15.4 14.8 14.6 12.9 11.8

Nota: Las puntuaciones estándar de las WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades.
Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en las WJ III, que no estaban disponibles en el momento en
que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de edad, mientras
que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y por debajo de la
mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

amplitud de los desvíos estándar para la mayoría de las puntuaciones de compuestos (típicamente en la amplitud 11 a 13)
indica que la muestra se hallaba algo limitada en términos de los niveles de destreza académica alcanzados. En las
tareas que demandaban escritura, la dispersión de las puntuaciones era mayor. En este estudio, los niños completaron todas
las pruebas de la WJ III ACH que producen compuestos de aprovechamiento en la Batería estándar y en la extendida.
También se administraron las pruebas denominadas Kaufman Test of Educational Achievement (KTEA) (Kaufman y
Kaufman, 1985) y Wechsler Individual Achievement Test (WIAT) (Wechsler, 1992). Las tres baterías de
aprovechamiento se administraron en forma balanceada a lo largo de varias sesiones de evaluación. La KTEA es una
medida de aprovechamiento escolar de administración individual para niños de 6 a 18 años. La forma completa contiene
cinco subpruebas: Decodificación de la lectura, Comprensión de lectura, Aplicaciones matemáticas, Cálculo matemático
y Ortografía. En el estudio se analizaron todas las subpruebas y el compuesto de la batería. La KTEA suele considerarse
una medida confiable y válida de las destrezas académicas apuntadas. La WIAT es una batería de administración
individual destinada a medir el aprovechamiento académico en los dominios de Lectura básica, Comprensión de lectura,
Operaciones numéricas, Razonamiento en matemáticas, Ortografía, Expresión escrita, Comprensión auditiva y
Expresión oral. También se determinan cuatro puntuaciones compuestas: Lectura, Matemáticas, Escritura y Lenguaje.
Se analizaron cada subprueba, los compuestos mencionados y el compuesto de Aprovechamiento total. La WIAT suele
considerarse una medida confiable y válida de las áreas académicas apuntadas. Está destinada a niños de 5 a 19 años.

Muestra normal de los grados K a 8 de McCallum y Hooper. Este estudio para escolares fue conducido por
Steven McCallum y Scott Hooper (University of Tennessee) y apuntó a examinar la relación entre compuestos y pruebas
escogidos de la WJ III COG que miden habilidades cognitivas en forma no verbal. La muestra constaba de 100 alumnos
desde el jardín de infantes (kindergarten) hasta el 8o grado, seleccionados al azar en nueve escuelas públicas y privadas
pertenecientes a zonas rurales y suburbanas de la región oriental del estado de Tennessee. La edad de los niños iba desde
6 años y 1 mes hasta 13 años (M = 126.2 meses, SD = 25).

75
Validez
Cuadro 4-10.
Estadísticos descriptivos y correlaciones entre compuestos de la WJ III ACH con compuestos y subpruebas de la WIAT y la
KTEA, para los grados 1 a 8 (estudio de Ford, Simmons y North)
a
PRUEBA DE APROVECHAMIENTO EDUCATIVO DE KAUFMAN
Medida N M SD BCP RCP RD RC MCP MC MA S
Compuestos de aprovechamiento de
las WJ III
Aprovechamiento total 41 99.9 15.3 .79 .75 .69 .66 .67 .56 .59 .77
Amplia lectura 52 95.9 11.8 .73 .76 .67 .65 .45 .36 .43 .70
Destrezas básicas en lectura 43 94.6 13.3 .58 .66 .66 .44 .18 .21 .17 .66
Comprensión de lectura 44 102.0 11.6 .75 .81 .74 .62 .49 .54 .41 .60
Amplias matemáticas 41 102.5 11.7 .70 .61 .60 .54 .66 .65 .52 .61
Destrezas en el cálculos matemáticos 41 103.1 12.1 .61 .49 .56 .37 .60 .67 .40 .58
Razonamiento en matemáticas 44 101.7 11.9 .58 .53 .54 .43 .41 .49 .29 .52
Lenguaje escrito amplio 52 112.1 15.4 .67 .60 .58 .48 .52 .47 .43 .67
Destrezas básicas en escritura 44 103.9 13.4 .70 .74 .68 .56 .38 .34 .35 .77
Expresión escrita 52 114.8 19.4 .57 .51 .48 .42 .48 .45 .38 .57
Comprensión auditiva 43 105.5 11.1 .50 .57 .43 .49 .34 .25 .39 .39
Lenguaje oral–Est 51 108.2 13.6 .47 .46 .31 .46 .36 .25 .40 .33
Destrezas académicas 52 99.4 11.1 .70 .69 .70 .53 .45 .41 .41 .64
Fluidez académica 41 103.7 16.7 .61 .54 .46 .49 .56 .49 .49 .62
Aplicaciones académicas 52 103.4 10.4 .77 .75 .71 .63 .54 .51 .45 .67
Conocimientos académicos 44 101.5 13.3 .54 .67 .49 .54 .34 .27 .37 .38
N — — — 50 50 50 50 50 50 50 50
Media — — — 102.9 104.4 106.4 102.0 103.3 103.8 101.8 110.0
— — — 12.7 12.9 11.9 14.5 15.9 13.8 16.4 16.0
Desvío estándar
a
Abreviaturas de la KTEA: BCP = Compuesto de la batería; RCP = Compuesto de Lectura; RD = Decodificación de lectura; RC = Comprensión de lectura; MCP = Compuesto
de Matemáticas; MC = Cálculo matemático; MA = Aplicaciones matemáticas; S = Ortografía.

PRUEBA DE APROVECHAMIENTO INDIVIDUAL DE WECHSLERb


Medida N M SD TAch RCP BR RC MCP NO MR WCP WE S LCP LC OE
Compuestos de
aprovechamiento de las WJ III
Aprovechamiento total 41 99.9 15.3 .65 .67 .62 .69 .58 .45 .59 .58 .55 .55 .46 .53 .49
Amplia lectura 52 95.9 11.8 .65 .67 .63 .68 .41 .25 .50 .56 .53 .52 .50 .53 .43
Destrezas básicas en lectura 43 94.6 13.3 .67 .82 .82 .68 .50 .32 .54 .60 .55 .70 .33 .37 .36
Comprensión en lectura 44 102.0 11.6 .79 .78 .70 .79 .66 .58 .56 .71 .67 .59 .45 .53 .44
Amplias matemáticas 41 102.5 11.7 .64 .64 .54 .68 .70 .57 .66 .48 .45 .49 .37 .37 .42
Destrezas en el cálculos
matemáticas 41 103.1 12.1 .53 .57 .44 .64 .69 .59 .60 .43 .36 .49 .20 .24 .31
Razonamiento matemático 44 101.7 11.9 .63 .58 .55 .53 .56 .38 .60 .62 .51 .50 .36 .23 .39
Lenguaje escrito amplio 52 112.1 15.4 .49 .59 .57 .55 .47 .45 .40 .47 .47 .52 .25 .25 .30
Destrezas básicas en escritura 44 103.9 13.4 .72 .79 .80 .70 .58 .42 .62 .69 .57 .77 .41 .33 .45
Expresión escrita 52 114.8 19.4 .42 .49 .45 .49 .42 .45 .33 .31 .31 .42 .25 .26 .29
Comprensión auditiva 43 105.5 11.1 .58 .52 .41 .59 .41 .27 .45 .44 .54 .39 .56 .55 .45
Lenguaje oral–Est 51 108.2 13.6 .47 .36 .26 .46 .31 .19 .37 .33 .39 .31 .55 .43 .51
Destrezas académicas 52 99.4 11.1 .66 .77 .72 .74 .54 .37 .56 .55 .56 .59 .36 .37 .36
Fluidez académica 41 103.7 16.7 .44 .46 .39 .50 .39 .30 .44 .41 .39 .35 .35 .42 .36
Aplicaciones académicas 52 103.4 10.4 .68 .68 .63 .66 .58 .51 .50 .51 .51 .56 .39 .34 .42
Conocimientos académicos 44 101.5 13.3 .69 .51 .45 .54 .42 .24 .51 .34 .41 .38 .70 .58 .65
N — — — 47 47 48 47 48 48 48 35 35 48 48 48 48
Media — — — 108.1 105.1 106.7 103.2 106.8 105.7 106.8 104.9 103.6 107.8 108.4 99.7 114.0
Desvío estándar — — — 13.4 13.8 13.6 12.9 11.7 12.8 11.3 17.3 17.6 14.2 17.2 14.9 14.1

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una transformación simple de
puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones especiales de investigación fue eliminar de las
puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades. Dichas puntuaciones estándar de investigación difieren de las
puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la
media y el desvío estándar promedio en cada nivel de edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del
desvío estándar (por encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
b
Abreviaturas de la WIAT: TAch = Compuesto de Aprovechamiento total; RCP = Compuesto de Lectura; BR = Lectura básica; RC = Comprensión de lectura; MCP =
Compuesto de Matemáticas; NO = Operaciones numéricas; MR = Razonamiento en matemáticas; WCP = Compuesto de escritura; WE = Expresión escrita; S = Ortografía;
LCP = Compuesto de lenguaje; LC = Comprensión auditiva; OE = Expresión oral.
76
Validez
Las medias y desvíos estándar presentados en el Cuadro 4-11 indican que la muestra tenía una habilidad intelectual
general promedio. La amplitud de los desvíos estándar para la mayoría de los compuestos cognitivos (típicamente en la
amplitud 12 a 15) indica que la muestra presentaba una amplitud moderadamente restringida de talento. En este estudio,
los niños completaron pruebas escogidas de la WJ III COG que no requerían una respuesta verbal. Se analizaron los
resultados de los compuestos Razonamiento fluido (Gf) y Percepción visual-espacial (Gv).

Los sujetos completaron asimismo la prueba Universal Nonverbal Intelligence Test (UNIT) (Bracken y McCallum,
1998), la Comprehensive Test of Nonverbal Intelligence (C-TONI) (Hammill, Pearson y Wiederholt, 1996) y subpruebas
seleccionadas de la Leiter International Performance Scale–Revised Edition (Leiter-R) (Roid y Miller, 1997). Estas
baterías se administraron en forma balanceada a lo largo de varias sesiones. La UNIT está destinada a medir la habilidad
cognitiva general a través de una administración y un formato de respuesta no verbales. La batería se aplica
individualmente y permite obtener un Cociente de inteligencia para la escala completa así como un Cociente de
memoria, un Cociente de razonamiento, un Cociente simbólico y un Cociente no simbólico, todos los cuales fueron
analizados en el estudio. La UNIT suele considerarse una medida confiable y válida de las áreas apuntadas para niños de
5 años a 17 años y 11 meses. La C-TONI es una medida de razonamiento no verbal para individuos de 6 años a 90 años y
11 meses, de administración individual. Se la considera confiable y válida para los dominios definidos. En este estudio, el
Cociente de inteligencia no verbal general –que es una mezcla de razonamiento analógico, clasificación en categorías y
secuencia general de razonamiento– fue analizado en un pequeño subconjunto de la muestra total. La Leiter-R es una
batería de administración individual destinada a medir la inteligencia en forma no verbal. En este estudio se analizó la
puntuación compuesta IQ, que mide el razonamiento fluido y la visualización. La Leiter-R se correlaciona bien con otras
medidas de la inteligencia general y se la aplica desde los 2 años hasta los 20 años y 11 meses.
Muestra normal de Vesley para niños con discapacidad de aprendizaje y ADHD de los grados 1 a 6. Este
estudio fue realizado por Barbara Vesley (St. Cloud State University) con 90 alumnos de escuela primaria provenientes
principalmente de escuelas públicas de zonas rurales de Brainerd, estado de Minnesota. Según la descripción del
Cuadro 4-11.
Correlaciones entre compuestos seleccionados de la WJ III COG y las escalas UNIT, C-TONI y Leiter-R, para los grados K a 8
(estudio de McCallum y Hooper)
COMPUESTOS DE LA WJ III COG
Percepción
visual-espacial Razonamiento
Medida N M SD (Gv) fluido (Gf)
Prueba de inteligencia no verbal universal
Cociente de memoria (MQ) 53 100.8 12.8 .58 .44
Cociente de razonamiento (RQ) 53 106.1 15.1 .67 .47
Cociente simbólico (SQ) 53 100.3 14.6 .62 .37
Cociente no simbólico (NQ) 53 106.8 14.0 .62 .51
IQ de escala completa (FSIQ) 99 102.4 15.4 .61 .44
Prueba exhaustiva de inteligencia no verbal
IQ no verbal 26 99.5 12.5 .58 .44
Escala de ejecución internacional de Leiter-R
IQ compuesto 94 97.9 14.3 .48 .51
N — — — 99 99
Media — — — 104.7 100.3
Desvío estándar — — — 12.3 10.8

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por
encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

77
Validez
distrito escolar, los sujetos eran: (a) alumnos regulares (n = 31); (b) alumnos con una discapacidad de aprendizaje
(learning disability [LD, por sus siglas en inglés]) (n = 29), o (c) alumnos a quienes un médico les había diagnosticado
trastorno por déficit de atención/hiperactividad (ADHD) (n = 30). Tenían de 5 años y 11 meses a 12 años y 8 meses
(M = 9 años y 9 meses, SD = 1 año y 6 meses) y pertenecían a los grados 1 a 6 (M = 3.4, SD = 1.5). Un análisis de
variancia simple indicó que los tres grupos no diferían entre sí en cuanto a su edad cronológica (F = 0.021, df = 2.87,
p = 0.081).

Las medias y desvíos estándar presentados en el Cuadro 4-12 indican que la muestra total tenía una habilidad
intelectual general entre inferior al término medio y término medio. Los desvíos estándar de que da cuenta el cuadro se
hallan, en general, dentro de la amplitud 12 a 15, lo cual sugiere una leve restricción en la muestra. En este estudio los
participantes completaron 15 pruebas escogidas de la WJ III COG, 9 de la WJ III ACH y 3 pruebas de investigación de la
WJ III. Las principales unidades de análisis fueron las pruebas (no los compuestos) de la WJ III.

Cuadro 4-12.
Estadísticos descriptivos y correlaciones entre pruebas seleccionadas de la WJ III COG, compuestos de la WJ III ACH y
compuestos de la TOVA y del BASC, para los grados 1 a 6 (estudio de Vesley)

Compuesto de las Problemas escolares


Medida N M SD TOVA del BASC
Pruebas cognitivas de las WJ III
Información general 90 100.7 11.5 .15 -.19
+
Relaciones espaciales 87 97.8 15.0 .21 -.26
Planeamiento 90 98.4 12.3 .23 -.06
Integración de sonidos 90 94.8 13.9 -.01 .09
Palabras incompletas 90 95.8 14.6 -.06 .01
Atención auditiva 90 91.9 13.3 -.09 -.03
Formación de conceptos 90 94.5 13.4 .34* -.45*
Pareo visual 90 90.2 15.2 .33* -.50*
+
Rapidez en la decisión 90 94.5 14.7 .24 -.35*
+
Rapidez en la identificación de dibujos 90 89.0 12.5 .12 -.28
Inversión de números 90 93.7 15.9 .04 -.37+
Memoria para palabras 90 91.5 15.4 .09 -.29+
Memoria de trabajo auditiva 90 88.2 14.9 .16 -.37*
Compuestos de aprovechamiento de las WJ III
Amplia lectura 83 77.7 14.6 .17 -.54*
+
Amplias matemáticas 87 70.4 12.5 .27 -.38*
N — — — 88 84
Media — — — 87.4 57.4
Desvío estándar — — — 22.7 10.9

Nota: Se creó una puntuación compuesta especial para el TOVA promediando las puntuaciones estándar de los errores de comisión, errores de
omisión, tiempo de respuesta correcta y variabilidad del tiempo de respuesta. En el caso del BASC, las puntuaciones T más altas indican mayores
problemas de conducta. Por lo tanto, si la correlación es negativa, ello indica que un rendimiento inferior en la prueba está asociado a mayores niveles
de problemas escolares reportados. Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de
investigación, derivadas de una transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del
cálculo de estas puntuaciones especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las
correlaciones en una gran amplitud de edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la
WJ III, que no estaban disponibles en el momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el
desvío estándar promedio en cada nivel de edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos
estimaciones singulares del desvío estándar (por encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el
Capítulo 2).
+ p < 0.05 (antes de la corrección de Bonferroni)
* p < 0.05 (después de la corrección de Bonferroni)

78
Validez
Además de la WJ III, se administraron la WISC-III y las Test of Variables of Attention (TOVA) (Greenberg, 1998).
Las tres baterías se administraron en forma balanceada a lo largo de varias sesiones. Por otra parte, los padres y maestros
de los alumnos completaron las escalas de calificación del Behavioral Assessment System for Children (BASC)
(Reynolds y Kamphaus, 1992). La TOVA es una prueba clásica de rendimiento continuo que suele emplearse para la
detección y tratamiento de problemas de atención y concentración. Las tareas, de administración individual, se presentan
visualmente en una computadora. Los sujetos emiten una respuesta motriz cuando se les presenta un estímulo objetivo, y
deben inhibir la respuesta si lo que se les presenta es un elemento de distracción. La TOVA suministra una medida de la
rapidez y precisión del sujeto en el procesamiento de la información visual. Se obtienen una variedad de puntuaciones,
como puntuaciones estándar por errores de comisión, errores de omisión, tiempo de respuesta correcta y variabilidad del
tiempo de respuesta. Promediando las cuatro puntuaciones estándar se obtiene una puntuación TOVA compuesta, que fue
incluida en los análisis de Vesley. El BASC es un sistema de calificación de la conducta completado por los padres y
maestros, quienes deben observar formalmente la conducta y funcionamiento emocional de los niños. Se obtiene una
variedad de puntuaciones en las escalas Clínica y Adaptativa, así como cuatro puntuaciones compuestas generales. En el
estudio se analizaron las puntuaciones T de la escala de problemas escolares del maestro, la cual suministra indicadores
de la atención y el nivel de aprendizaje.
Muestra de escolares con ADHD de Lerner y Yasutake. Janet Lerner y David Yasutake (Northeastern Illinois
University) investigaron el uso de la WJ III con niños y adolescentes a quienes se había diagnosticado ADHD. Los 48
participantes habían sido identificados por médicos de cabecera o bien pertenecían a la organización de lucha contra el
ADHD de Chicago y su zona aledaña. Un médico había diagnosticado el ADHD en todos los sujetos. La muestra tenía
una gran amplitud de edades, que iban de los 6 años y 9 meses a los 17 años y 8 meses (M = 11 años y 11 meses,
SD = 2 años y 6 meses). Se administraron 18 pruebas de la WJ III COG y 8 de la WJ III ACH. Las unidades de análisis
fueron las pruebas. En el Cuadro 4-13 figuran las medias, desvíos estándar y pruebas t de una muestra.
Muestra de estudiantes universitarios normales y con discapacidades de aprendizaje de Gregg y Hoy. Noel
Gregg y Cheri Hoy (University of Georgia) realizaron un estudio con 200 estudiantes de la Universidad de Georgia, a la
mitad de los cuales se les había diagnosticado una discapacidad específica de aprendizaje en el UGA’s Regent Center for
Learning Disorders, en tanto que la otra mitad se ofreció a participar en forma voluntaria. Todos los estudiantes cursaban
estudios para obtener el primer título universitario [bachelor's degree] que abarcan cuatro años de estudio (M = 15.9
niveles de grado, SD = 1.2 niveles de grado). Sus edades oscilaban entre los 18 años y 5 meses, y los 53 años y 0 mes
(M = 22 años y 10 meses, SD = 4 años y 9 meses). Las dos muestras eran semejantes en cuanto a la edad (t[202]) = 0.62,
p = 0.54).
Las medias y desvíos estándar de las puntuaciones compuestas para las medidas presentadas en el Cuadro 4-14
indican que la muestra total operaba dentro de la amplitud término medio superior a término medio de habilidad
intelectual general. La amplitud de los desvíos estándar para las puntuaciones compuestas de toda la escala era
aproximadamente 11 a 12, lo cual nos dice que la muestra era moderadamente restringida en cuanto al talento si se la
compara con la población general. En este estudio, los estudiantes completaron pruebas escogidas de la WJ III
COG y la WJ III ACH que producen GIA y compuestos de factores cognitivos así como algunos compuestos de
aprovechamiento.
También se les administró una gama de medidas de habilidad cognitiva y de aprovechamiento habitualmente
empleadas con estudiantes universitarios. Aquí se comunican los resultados obtenidos con la WAIS-III, la KAIT, la Oral
and Written Language Scales (OWLS) (Carrow-Woolfolk, 1995), la Wide Range Achievement Test–Third Edition
(WRAT3) (Wilkinson, 1993) y la Nelson-Denny Reading Test (NDRT) (Brown, Fishco y Hanna, 1993). No a todos los
estudiantes se les administraron todas las pruebas. La WAIS-III es una batería de administración individual que evalúa
una variedad de habilidades cognitivas y genera cocientes de inteligencia para las escalas verbal, de ejecución y completa,
así como índices correspondientes a los factores Comprensión verbal, Organización perceptual, Rapidez en el
procesamiento y Memoria de trabajo. En el estudio fueron analizadas todas estas puntuaciones. La WAIS-III es
considerada, en general, como una medida confiable y válida de la inteligencia cognitiva general para personas de 16 a 89
años. La KAIT es una batería de administración individual que evalúa una variedad de habilidades cognitivas y produce
un IQ compuesto global así como puntuaciones de orden menor para las escalas de Inteligencia fluida e

79
Validez
Cuadro 4-13.
Medias, desvíos estándar y pruebas t para una muestra de escolares con ADHD (estudio de Lerner y Yasutake)
Nivel .05 Nivel .05
Prueba N M SD (no corregido) (Ajuste de Bonferroni)
Pruebas cognitivas de las WJ III
Comprensión verbal (Gc) 39 96.7 16.7
Aprendizaje visual-auditivo (Glr) 45 95.4 23.9
Fluidez de recuperación (Glr) 43 96.5 14.6
Relaciones espaciales (Gv) 35 97.5 16.5
Reconocimiento de dibujos (Gv) 39 92.2 15.6
Planeamiento (Gv) 43 91.8 22.3
Integración de sonidos (Ga) 45 94.3 14.6
Palabras incompletas (Ga) 45 102.4 18.8
Atención auditiva (Ga) 46 79.6 15.9
Formación de conceptos (Gf) 46 98.7 16.1
Análisis-Síntesis (Gf) 47 98.5 16.9
Pareo visual (Gs) 46 96.2 14.1
Rapidez en la decisión (Gs) 44 100.3 15.0
Rapidez en la identificación de dibujos (Gs) 45 96.6 9.9
Inversión de números (Gsm) 41 94.9 17.2
Memoria de trabajo auditiva (Gsm) 41 97.1 14.1
Memoria para palabras (Gsm) 46 93.9 16.2
Pruebas de aprovechamiento de las WJ III
Comprensión oral (Gc) 40 91.28 11.68
Rememoración de cuentos (Glr) 40 96.62 17.49
Identificación de letras y palabras (Grw) 40 94.07 24.88
Comprensión de textos (Grw) 39 71.85 28.92
Cálculo (Gq) 39 70.87 19.64
Fluidez en matemáticas (Gq) 38 96.50 16.09
Ortografía (Grw) 39 91.38 18.92
Muestras de redacción (Grw) 36 91.64 18.93

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por
encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

Inteligencia cristalizada. Es considerada, en general, como una medida confiable y válida de las habilidades cognitivas para
individuos de 11 a 85 años. La OWLS es una batería destinada a evaluar el lenguaje escrito, así como el lenguaje receptivo
y expresivo, de sujetos de 3 a 21 años. Proporciona puntuaciones estándar para Comprensión auditiva, Expresión oral y
Expresión escrita, así como para compuestos de Lenguaje oral, todas las cuales fueron analizadas en este estudio. Para esta
investigación, la OWLS fue administrada en forma individual. Su grado de confiabilidad es importante y se estableció su
adecuada validez concurrente con otras escalas de lenguaje. La WRAT3 es una medida breve de destrezas académicas
básicas para sujetos de 5 años hasta la edad adulta, que se administra en forma individual. En este estudio se analizaron las
puntuaciones de las subpruebas de Lectura (decodificación básica) y de Ortografía (escritura tomada del dictado). La
NDRT es una encuesta de lectura para estudiantes secundarios y universitarios, y para adultos. En este estudio se administró
individualmente la Parte II de la prueba, obteniendo una puntuación de comprensión de lectura.
80
Validez
Cuadro 4-14.
Estadísticos descriptivos y correlaciones entre los compuestos de la WJ III COG y las escalas WAIS-III y KAIT, para estudiantes
universitarios (estudio de Gregg y Hoy)
a b
WAIS-III KAIT
Medida N M SD FSIQ VIQ PIQ VCI POI PSI WMI CIS Gc Gf
Habilidad intelectual general de las
WJ III
Escala estándar 137 104.0 10.4 .67 .66 .51 .52 .50 .46 .70 .75 .64 .69
Habilidad intelectual abreviada 177 101.1 10.0 .62 .57 .51 .48 .43 .49 .53 .68 .58 .62
Compuestos cognitivos de las
WJ III
Habilidad para pensar–Ext 148 105.3 9.1 .59 .52 .49 .45 .51 .39 .49 .64 .46 .67
Habilidad para pensar–Est 157 104.8 10.8 .57 .53 .47 .45 .49 .39 .50 .67 .51 .68
Eficiencia cognitiva–Ext 205 98.9 11.5 .45 .43 .35 .24 .28 .53 .65 .52 .40 .51
Eficiencia cognitiva–Est 205 98.4 12.3 .39 .37 .30 .18 .21 .47 .63 .48 .34 .49
Comprensión verbal (Gc) 179 102.9 10.8 .72 .71 .54 .65 .55 .25 .37 .68 .66 .53
Recuperación a largo plazo (Glr) 202 106.5 11.6 .38 .31 .36 .20 .37 .23 .36 .58 .39 .64
Pensamiento visual-espacial (Gv) 151 104.2 10.7 .43 .30 .45 .33 .50 .29 .24 .42 .32 .42
Procesamiento auditivo (Ga) 205 100.0 13.0 .39 .38 .29 .31 .26 .39 .44 .44 .33 .44
Percepción fonémica (Ga) 205 102.9 12.5 .40 .38 .29 .34 .25 .34 .41 .48 .40 .43
Razonamiento fluido (Gf) 205 103.3 9.3 .60 .56 .48 .46 .53 .22 .39 .54 .40 .55
Rapidez en el procesamiento (Gs) 205 97.3 11.1 .37 .27 .39 .19 .26 .60 .42 .43 .32 .44
Fluidez cognitiva (Gs) 205 93.4 10.9 .36 .28 .36 .15 .22 .51 .30 .24 .16 .27
Memoria a corto plazo (Gsm) 206 101.1 13.1 .33 .40 .16 .18 .18 .25 .60 .41 .32 .39
Memoria de trabajo (Gsm) 206 100.3 13.9 .45 .48 .29 .25 .27 .30 .67 .52 .38 .52
N — — — 153 153 153 152 151 149 150 151 151 151
Media — — — 112.5 112.8 110.2 112.9 111.2 103.7 104.6 107.6 106.2 107.5
Desvío estándar — — — 12.0 11.9 13.4 14.5 14.3 12.9 11.5 10.5 10.8 11.3

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones especiales de
investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de edades. Dichas
puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el momento en que se
realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de edad, mientras que las
puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y por debajo de la mediana),
aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
a
Abreviaturas de la WAIS-III: FSIQ = IQ de escala completa; VIQ = IQ verbal; PIQ = IQ de ejecución; VCI = Índice de comprensión verbal; POI = Índice de
organización perceptual; PSI = Índice de rapidez en el procesamiento; WMI = Índice de memoria de trabajo
b
Abreviaturas de la KAIT: CIS = Escala de inteligencia compuesta; Gc = Escala cristalizada; Gf = Escala fluida

Muestra de establecimientos universitarios comunitarios de Norton. En este estudio se examinó la relación entre
diversas habilidades cognitivas y el aprovechamiento en matemáticas. Participaron en él estudiantes adultos que
concurrían a universidades o establecimientos universitarios comunitarios de California. La investigación fue dirigida por
Suzann Norton (Palomar College, San Marcos, California) en colaboración con Laurie Ford (University of South
Carolina) y Christine Voll (Alameda, California). Los 50 participantes tenían desde 16 años y 0 mes de edad hasta 51
años y 9 meses (M = 27 años y 8 meses, SD = 8 años y 11 meses).

Los participantes completaron ocho pruebas de la WJ III COG (Análisis-Síntesis, Formación de conceptos,
Reconocimiento de dibujos, Relaciones espaciales, Pareo visual, Rapidez en la decisión, Aprendizaje visual-auditivo y
Planeamiento), cinco pruebas de investigación de la WJ III (Tachar, Memoria para nombres, Integración visual,
Rotación de bloques y Razonamiento numérico) y dos pruebas de la WJ III ACH (Cálculo y Problemas aplicados). El
carácter selectivo del estudio tuvo como consecuencia que todos los análisis se completaran a nivel de las pruebas (no de
los compuestos o puntuaciones compuestas).

81
Validez
Además, todos los participantes completaron un conjunto seleccionado de subpruebas de la KAIT y de la
WAIS-III. Todas las baterías se administraron en forma balanceada a lo largo de varias sesiones. A continuación
describiremos brevemente las subpruebas específicas de la KAIT y de la WAIS-III que fueron empleadas.

Pasos lógicos [KAIT Logical Steps]: Se le presentan visual y oralmente al sujeto ciertas premisas lógicas y
luego debe responder a una pregunta haciendo uso de ellas.

Códigos enigmáticos [KAIT Mystery Codes]: Para realizar esta tarea, el sujeto estudia unos códigos vinculados
a una serie de figuras y luego debe determinar el código correspondiente a un nuevo estímulo figurativo.

Aprendizaje rebus [KAIT Rebus Learning]: El sujeto debe aprender la palabra o concepto asociados a un
dibujo y luego “leer” las frases u oraciones que los dibujos componen.

Memoria para el diseño de bloques [KAIT Memory for Block Designs]: En esta tarea se le presenta
brevemente al sujeto un diseño abstracto impreso y se le solicita que lo copie de memoria utilizando seis
bloques de madera de dos colores distintos.

Aritmética [WAIS-III Arithmetic]: Se presentan oralmente tareas de razonamiento numérico y de


aritmética, y el sujeto debe dar una respuesta oral en un plazo determinado.

Codificación de símbolos y dígitos [WAIS-III Digit Symbol-Coding]: Se le presenta al sujeto una clave de
nueve combinaciones de símbolos y números. Debe copiar, dentro de un plazo determinado, la mayor
cantidad de símbolos correspondientes a números dados que pueda.

Diseño de bloques [WAIS-III Block Design]: Se le muestra al sujeto un dibujo bidimensional en dos
colores de un diseño abstracto. Con el estímulo todavía presente, debe crear dentro de un plazo determinado
un diseño tridimensional idéntico utilizando bloques rojos y blancos.

Razonamiento con matrices [WAIS-III Matrix Reasoning]: En esta subprueba se presentan diversas
matrices de colores, a cada una de las cuales le falta una parte. El sujeto debe escoger la parte faltante
correcta entre cinco posibles opciones.

Búsqueda de símbolos [WAIS-III Symbol Search]: Para cada ítem, el sujeto estudia dos símbolos y luego
debe determinar si alguno de ellos está incluido en una serie de cinco símbolos. Tiene un tiempo limitado
para completar los 60 ítemes.

Armado de objetos [WAIS-III Object Assembly]: El sujeto debe armar hasta cinco rompecabezas diferentes
que forman objetos comunes. Se le fija un tiempo para completar cada rompecabezas.

El examen de las medias y desvíos estándar de las medidas de que da cuenta el Cuadro 4-15 indica que la muestra se
desempeñó, en general, en la amplitud término medio inferior a término medio en las medidas cognitivas, y
significativamente por debajo del promedio en algunas medidas de aprovechamiento. Los desvíos estándar de la mayoría
de las medidas superaron un desvío estándar (SD = 15), lo cual sugiere que la muestra presentaba una considerable
variabilidad en cuanto a sus habilidades cognitivas y académicas.

Corolarios de las muestras de estudios especiales


Validez concurrente de los compuestos de habilidad intelectual general de la WJ III: relación con las puntuaciones
compuestas de otras baterías de inteligencia
En esta sección se presentan las correlaciones concurrentes entre los compuestos de GIA de la WJ III y otras
puntuaciones validadas de escala completa. Las muestras de las que se derivaron estas correlaciones fueron reunidas
tomando una amplia gama de edades y establecimientos de enseñanza. Las diversas muestras permiten comparar las

82
Validez
Cuadro 4-15.
Estadísticos descriptivos, correlaciones y resultados de la regresión para compuestos seleccionados de la WJ III COG, la WAIS
y las subpruebas de la KAIT a en la predicción del aprovechamiento en matemáticas (estudio de Norton)
Coeficiente
de regresión Error
Medida N M SD r estandarizado estándar t
Pruebas cognitivas de la WJ III
Análisis-Síntesis (Gf) 51 101.7 11.9 .66 .36 .10 3.76*
Formación de conceptos (Gf) 57 97.7 11.5 .70 .41 .10 4.18*
Reconocimiento de dibujos (Gv) 50 94.1 10.4 -.05 — — —
Relaciones espaciales (Gv) 50 99.1 12.3 .44 — — —
Planeamiento (Gv) 50 103.3 15.7 .07 — — —
Pareo visual (Gs) 55 97.9 11.1 .47 — — —
Rapidez en la decisión (Gs) 50 96.9 11.1 .13 — — —
Aprendizaje visual-auditivo (Glr) 56 98.1 14.9 .48 — — —
Prueba de inteligencia para adolescentes y
adultos de Kaufman
Pasos lógicos (Gf) 50 10.6 3.5 .62 — — —
Códigos enigmáticos (Gf) 50 10.8 2.5 .59 .22 .10 2.28**
Memoria para el diseño de bloques (Gv) 50 10.8 3.4 .48 — — —
Aprendizaje de rebuses (Glr) 50 10.1 2.6 .40 — — —
Escala de inteligencia para adultos de
Wechsler-Tercera edición
Razonamiento con matrices (Gf) 50 11.3 2.8 .56 — — —
Diseño de bloques (Gv) 50 11.5 3.0 .53 — — —
Armado de objetos (Gv) 50 10.6 3.3 .30 — — —
Codificación de símbolos y dígitos (Gs) 49 10.8 2.9 .29 — — —
Búsqueda de símbolos (Gs) 50 10.7 2.6 .32 — — —
Aritmética (Gq) 48 10.9 2.9 .65 — — —
2 2
Nota: F = 33.17*; R = 0.66; R ajustado = 0.64. Se calculó un compuesto especial de matemáticas a partir del promedio de las pruebas Cálculo,
Problemas aplicados y Conceptos cuantitativos de las WJ III (N = 49, M = 92.6 SD = 12.2). Esta variable compuesta fue la variable independiente en
este estudio. Las puntuaciones estándar de las WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de
una transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas
puntuaciones especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran
amplitud de edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en las WJ III, que no estaban
disponibles en el momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio
en cada nivel de edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío
estándar (por encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
a
Los títulos de las pruebas en español son una traducción. Las traducciones de otros países pueden variar a las aquí incluidas.
* p < 0.001
** p < 0.05

puntuaciones de GIA de las WJ III con las tres escalas de Wechsler (o sea, la WPPSI-R, la WISC-III y la WAIS-III; ver
los Cuadros 4-5, 4-7 y 4-14), la versión para preescolares de la DAS (Cuadro 4-5), la KAIT (Cuadro 4-14) y la SB-IV
(Cuadro 4-6). En general, los compuestos GIA-Std y GIA-Ext presentaron congruentemente correlaciones del orden de
0.70 entre las diversas muestras e instrumentos de medición utilizados. Las correlaciones de este orden de magnitud son
semejantes a las que se han comunicado entre las puntuaciones compuestas globales de las principales baterías de
inteligencia, así como a las de la WJ-R (McGrew et al., 1991), y avalan la interpretación de que las puntuaciones GIA de
la WJ III son medidas válidas de la habilidad intelectual general.

Las correlaciones de GIA-Std y GIA-Ext con las puntuaciones de escala completa de la WPPSI-R y la WISC-III
estuvieron congruentemente entre 0.71 y 0.76. La correlación entre la GIA-Std y la WAIS-III fue algo menor (0.67), pero
fue calculada sobre una muestra con restricciones significativas en cuanto a la amplitud de la habilidad, condición
83
Validez
ésta que típicamente subestima la correlación con la población. Las siete correlaciones GIA con las puntuaciones de
escala completa de la SB-IV, la DAS y la KAIT estuvieron entre 0.71 y 0.76 –amplitud similar a las comunicadas para
las escalas de Wechsler. Importa señalar que en todas las muestras, ya sea el compuesto GIA o la puntuación de escala
completa de la batería criterio exhibieron una restricción de leve a moderada de las amplitudes (desvíos estándar
inferiores a 15). Este fenómeno sugiere que las correlaciones anteriores subestiman, en todo caso, las correlaciones de
validez de la población para los compuestos GIA de la WJ III.

En los cuadros de los estudios especiales se informa sobre ocho correlaciones (que van de 0.60 a 0.70) entre el
compuesto BIA de la WJ III y la puntuación de escala completa de CAS, DAS, SB-IV, WPPSI-R, WISC-III y
WAIS-III. Aunque la relación no es tan fuerte como con otros compuestos, como la GIA-Est o la GIA-Ext, estas
correlaciones permiten afirmar que el compuesto BIA de la WJ III es una medida de selección válida de la habilidad
intelectual general.

Validez concurrente de los compuestos cognitivos de la WJ III: relación con puntuaciones compuestas de otras
baterías de inteligencia
Los Cuadros 4-5 a 4-11 permiten examinar la correlación de los compuestos cognitivos de la WJ III con otros
compuestos cognitivos, definidos en forma similar, de otras baterías de inteligencia. Las pautas específicas de
correlación presentadas (en el marco de Habilidad verbal, Habilidad para pensar y Eficiencia cognitiva) ofrecen
evidencia de validez convergente y discriminativa en apoyo de los compuestos cognitivos de la WJ III.

Los compuestos de la WJ III Habilidad verbal–Extendida, Habilidad verbal–Estándar, Comprensión-conocimiento


(Gc) y Conocimiento (Gc) tienen correlaciones de entre 0.71 y 0.79 con los índices IQ verbal y Comprensión verbal de la
WISC-III, y de entre 0.57 y 0.70 con el IQ verbal de la WPPSI-R. La prueba Comprensión verbal de la WJ III se
correlacionó en niveles semejantes con el IQ verbal (0.71) y con el índice de Comprensión verbal (0.65) de la WAIS-III,
así como con la puntuación de Inteligencia cristalizada de la KAIT (0.66). En comparación, las correlaciones entre estas
medidas verbales de la WJ III y sus respectivas medidas no verbales fueron siempre inferiores en todas las muestras. Por
ejemplo, las medidas verbales de la WJ III tuvieron correlaciones de 0.30 a 0.50 con los índices no verbales de la
WISC-III. La magnitud relativa de las correlaciones WJ III verbales/Gc con las puntuaciones verbales/Gc de la Wechsler
y la KAIT, así como la pauta congruente de validez convergente y discriminativa, brinda fuerte apoyo a la interpretación
de que las medidas de Habilidad verbal, Comprensión-conocimiento, Comprensión verbal y Conocimiento de la WJ III
son válidas como representación de las habilidades de conocimiento y comprensión verbales (Gc). Esta conclusión se ve
corroborada por las correlaciones relativamente mayores (0.60 a 0.71) entre los compuestos Habilidad verbal,
Comprensión-conocimiento, Comprensión verbal y Conocimiento con el compuesto de Habilidad verbal de la DAS,
como también por las correlaciones de 0.60 a 0.65 con Razonamiento verbal de la SB-IV.

Dado que los compuestos Habilidad para pensar–Estándar y Habilidad para pensar–Extendida de la WJ III son
medidas compuestas de múltiples habilidades CHC (Glr, Gv, Ga,Gf), era previsible que estos compuestos funcionasen
en forma parecida al índice de inteligencia general (g), presentando las mayores correlaciones con otras medidas
basadas en una combinación de múltiples habilidades (puntuaciones de escala completa). Esta suposición se vio
confirmada, ya que dichos compuestos tuvieron las mayores correlaciones (en cada estudio) con el IQ de escala
completa de la WISC-III (0.57 y 0.58), el IQ de escala completa de la WPPSI-R (0.68 y 0.64), el IQ de escala
completa de la WAIS-III (0.59 y 0.57), la Escala de inteligencia compuesta de la KAIT (0.64 y 0.67), la Habilidad
conceptual general de la DAS (0.63 a 0.69) y el Compuesto de pruebas de la SB-IV (0.73 y 0.69).

La interpretación de las pautas de validez convergente y discriminativa de las correlaciones de los compuestos Glr,
Gv, Ga y Gf de la WJ III se ve dificultada por el hecho de que la mayoría de los compuestos de otras baterías de
inteligencia no proporcionan medidas de estas habilidades, o bien ofrecen compuestos que constituyen combinaciones
factorialmente complejas de múltiples habilidades Gf-Gc. En el dominio de Percepción visual-espacial (Gv), las
mejores medidas criterio disponibles son los compuestos semejantes a Gv de las pruebas de Wechsler (índices IQ de
ejecución y Organización perceptual; ver Cuadros 4-5 y 4-7), el compuesto Razonamiento abstracto/visual de la
SB-IV (Cuadro 4-6), el compuesto Habilidad espacial de la DAS (Cuadro 4-8) y, a raíz de sus estímulos no verbales y
el formato de administración de la prueba, las diversas puntuaciones de la UNIT, C-TONI y Leiter-R de que da cuenta

84
Validez
el Cuadro 4-11 (Flanagan et al., 2000; McGrew y Flanagan, 1998). Muchos de estos compuestos externos están
también mezclados con habilidades Gf, pero dentro del presente conjunto de estudios de validez son los mejores
criterios disponibles para el compuesto Percepción visual-espacial de la WJ III.

El sustento de la interpretación Gv del compuesto Percepción visual-espacial de la WJ III es evidente, sobre todo,
en las correlaciones relativamente superiores (dentro de un mismo estudio) con el índice de Organización perceptual
de la WAIS-III (0.50), el compuesto Razonamiento abstracto/visual de la SB-IV (0.60), el IQ de ejecución de la
WPPSI-R (0.53) y las siete medidas de C-TONI, Leiter-R y UNIT (0.48 a 0.67). El compuesto Percepción
visual-espacial de la WJ III tuvo la más alta correlación con el índice de Organización perceptual de la WISC-III,
aunque en términos absolutos su magnitud (0.23) no es muy alta, y ello puede deberse a las restricciones o a la
amplitud de puntuaciones de ambas medidas. En su conjunto, la pauta de validez convergente y discriminativa del
compuesto Percepción visual-espacial de la WJ III, aun cuando se complica por el uso de medidas externas de Gv que
no son óptimas (o sea, que no son factorialmente puras), avala la interpretación de que dicho compuesto es una medida
de Gv. Sin embargo, la magnitud absoluta de las correlaciones concurrentes sugiere que puede medir distintos
elementos componentes de Gv cuando se lo compara con puntuaciones semejantes a Gv de otras baterías (para mayor
información al respecto, ver Flanagan et al., 2000, y McGrew y Flanagan, 1998).6

La interpretación de las correlaciones del compuesto Razonamiento fluido (Gf) de la WJ III padece el mismo
problema de contaminación de criterios externos, pese a lo cual la evidencia favorable es clara. Dicho compuesto tuvo
una correlación de 0.55 con el compuesto Inteligencia fluida de la KAIT (en comparación con 0.40 para el compuesto
Inteligencia cristalizada), hallazgo congruente con el hecho de que aproximadamente la mitad del contenido del
compuesto Inteligencia fluida de la KAIT mide habilidades Gf. Además, el compuesto Razonamiento fluido de la
WJ III tuvo la mayor correlación (dentro del mismo estudio) con las siguientes puntuaciones compuestas, todas las
cuales incluyen por lo menos un buen indicador de Gf: índice de Organización perceptual de la WAIS-III (0.53;
Cuadro 4-14); Habilidad para el razonamiento no verbal de la DAS (0.67; Cuadro 4-8); Habilidad no verbal de la
DAS (0.40; Cuadro 4-5); Procesamiento simultáneo de la CAS (0.54; Cuadro 4-9), y las puntuaciones no verbales de
C-TONI, Leiter-R y UNIT (0.37 a 0.51; Cuadro 4-11). En general, las correlaciones con medidas externas que
incluyen por lo menos un buen indicador de Gf permiten interpretar que el compuesto Razonamiento fluido de la
WJ III es una buena medida de Gf.

La interpretación de la validez concurrente de Recuperación a largo plazo (Glr), Procesamiento auditivo (Ga) y
Percepción fonémica (Ga) se ve obstaculizada por la ausencia de medidas similares en las demás baterías de
inteligencia, ninguna de la cuales incluye medidas de Ga. De ahí que para la evaluación de la validez de los
compuestos Ga de la WJ III sean más importantes otras fuentes de evidencia de validez (de contenido, de desarrollo y
estructural). La escala de Inteligencia fluida de la KAIT incluye un indicador de Glr (la prueba Aprendizaje de
rebuses); el compuesto Recuperación a largo plazo de la WJ III mostró tener la más alta correlación (0.64) con esta
escala Gf, como se aprecia en el Cuadro 4-14.

Los factores amplios Eficiencia cognitiva–Estándar y Eficiencia cognitiva–Extendida de la WJ III, así como los
subcomponentes Gs y Gm de dichos factores, demostraron congruentemente una fuerte validez convergente y
discriminativa. Dentro de los estudios que suministraron medidas compuestas externas de la rapidez en el procesamiento
(Gs) y/o de la memoria a corto plazo o la memoria de trabajo (Gsm) (Cuadros 4-7 y 4-14), los compuestos de Eficiencia
cognitiva de la WJ III fueron los que presentaron la mayor correlación con los índices de Rapidez en el procesamiento
de Wechsler (WISC-III PSI r = 0.52 y 0.49; WAIS-III PSI r = 0.53 y 0.47) y con el índice Memoria de trabajo/
Capacidad de concentración (WISC-III FFD r = 0.60 y 0.62); WAIS-III WMI r = 0.65 a 0.63). Los factores Gs de la
WJ III (Rapidez en el procesamiento y Fluidez cognitiva) estuvieron muy fuertemente relacionados con los PSI de
Wechsler (WISC-III PSI r = 0.59 y 0.41; WAIS-III PSI r = 0.60 y 0.51). Lo interesante es que estos dos compuestos
Gs de la WJ III también presentaron correlaciones significativas con los compuestos Planeamiento (0.57 y 0.45) y
Atención (0.54 y 0.46) de la CAS (Cuadro 4-9), medidas muy vinculadas al tiempo y que, según se ha sugerido, miden
primordialmente Gs (Keith et al., 2001; Kranzler et al., 2000a; Kranzler et al., 2000b).

6
A menos que se indique lo contrario, la interpretación de las habilidades Gf-Gc medidas por compuestos externos de otras baterías de inteligencia se basa en los
análisis y comentarios de Flanagan et al., 2000 y de McGrew y Flanagan, 1998.
85
Validez
Tres estudios (ver los Cuadros 4-6, 4-7 y 4-14) contenían medidas compuestas que incluyen uno o más indicadores
de la memoria a corto plazo y/o la memoria de trabajo. Los compuestos Gsm de la WJ III (Memoria a corto plazo y
Memoria de trabajo) fueron los más fuertemente relacionados con el compuesto Memoria a corto plazo de la SB-IV
(0.62 y 0.64), el índice WMI de la WAIS-III (0.60 y 0.67) y el índice FFD de la WISC-III (0.58 y 0.57). La evidencia
de validez convergente y discriminativa de que damos cuenta avala la interpretación de los compuestos mencionados
de la WJ III como medidas de las habilidades Gsm, así como de los compuestos Rapidez en el procesamiento y Fluidez
cognitiva de las WJ III como medidas de las habilidades Gs.

Validez concurrente de pruebas escogidas de habilidades cognitivas de la WJ III: relación con medidas de la
Atención y con pruebas escogidas de la WISC-III, la WAIS-III y la KAIT
Los particulares problemas de investigación abordados en los estudios de Vesley y Norton dieron por resultado análisis
que sólo pudieron examinar la validez concurrente de determinadas pruebas de la WJ III COG en el nivel de las
pruebas, no de los compuestos. En lugar de presentar grandes matrices de intercorrelación de las pruebas, se emplearon
en ambas muestras análisis factoriales exploratorios (modelo del factor común con rotación oblicua) a fin de identificar
los factores que contribuyen a la validez concurrente de las pruebas WJ III incluidas en cada estudio.

El Cuadro 4-12 presenta las correlaciones simples entre trece pruebas de la WJ III COG, dos compuestos de las
WJ III ACH y dos medidas criterio de atención (las escalas de calificación de Problemas escolares de TOVA y de
BASC). Las correlaciones significativas (baja a moderada) con las escalas TOBA y BASC para Formación de
conceptos, Pareo visual y Rapidez en la decisión sugieren que estas medidas pueden ser más sensibles para detectar la
atención focalizada y la concentración que las demás pruebas de la WJ III incluidas en el análisis. También se
advirtieron correlaciones bajas (pero significativas) con la escala BASC de Problemas escolares en Rapidez en la
identificación de dibujos, Inversión de números, Memoria para palabras y Memoria de trabajo auditiva. Salvo la
prueba de Formación de conceptos (que mide tanto la formación de conceptos [Gf] como las funciones de ejecución),
todas las pruebas que presentan correlaciones significativas con las medidas criterio de la atención miden Gs o Gsm.
Más adelante, en este mismo capítulo, brindaremos información adicional sobre las pruebas WJ III que puede resultar
útil para realizar inferencias acerca de los procesos de atención.

El Cuadro 4-16 presenta los análisis factoriales exploratorios con las pruebas WISC-III realizados en la muestra de
Vesley. La pauta y magnitud de las cargas de los factores para la WJ III correspondientes a aquellos factores que
también son medidos por la WISC-III constituyen una fuerte evidencia de validez para interpretar de acuerdo con la
teoría CHC las pruebas Información general (Gc = 0.73), Relaciones espaciales (Gv = 0.69), Memoria para palabras
(Gsm = 0.89), Pareo visual (Gs = 0.75), Rapidez en la decisión (Gs = 0.63), Fluidez en matemáticas (Gs = 0.41,
Gq/Gf = 0.37) y Problemas aplicados (Gq/Gf = 0.44). El hecho de que la evidencia sea más débil para Formación de
conceptos (Gq/Gf = 0.31) y Aprendizaje visual-auditivo (Gq/Gf = 0.38) muy probablemente derive de la ausencia en el
análisis de otros indicadores fuertes de Gf y de memoria asociativa (Glr). Esta condición, sumada a los numerosos
indicadores de Gq, lleva a que estos dos indicadores se entremezclen en el factor mixto Gq/Gf. La aparición de los
factores separados Grw, Facilidad de identificación (Glr) y Ga es congruente con los resultados de los CFA que ya
hemos examinado en este capítulo. Un hallazgo interesante, y que necesita ulterior investigación, es que en un análisis
factorial conjunto con una batería de pruebas con fuertes indicadores Gv, la prueba Planeamiento de la WJ III no cargó
sobre el factor Gv, como lo hizo en los estudios confirmatorios normativos, sino que obró a modo de prueba “solitaria”
con su propio factor, no suficientemente identificado.

Los análisis factoriales exploratorios de Norton (Cuadro 4-17) con pruebas seleccionadas Gq/Gf, Gs, Glr y Gv de
las WAIS-III y KAIT demostraron que la prueba Planeamiento de la WJ III fue la de mayor carga (0.86) en un factor
fuerte de visualización o relaciones espaciales (Gv), también definido en las pruebas Armado de objetos (0.61) y
Diseño de bloques (0.50) de la WAIS-III. En cambio, la prueba Relaciones espaciales de la WJ III cargó sobre un
segundo factor Gv (0.65) junto con la prueba Integración visual (0.84) de la WJ-R y, en menor medida, con Armado de
objetos (0.41) –tal vez estas dos pruebas detecten la rapidez de integración (RI). Las cargas de los factores apoyan

86
Validez
Cuadro 4-16.
Análisis factorial exploratorio de pruebas seleccionadas de la WJ III COG y la WJ III ACH, pruebas de investigación de la
WJ III y subpruebas de la WISC-III – Pautas de factor oblicuo (estudio de Vesley)
FACTOR
Glr Planea-
Medida Grw Gc Gv (NA) Gsm Ga Gs Gq/Gf miento
Ortografía de palabras (WJ III) .76 — — — — — — — —
Identificación de letras y palabras
(WJ III) .76 — — — — — — — —
Comprensión de textos (WJ III) .76 — — — — — — — —
Muestras de redacción (WJ III) .66 — — — — — — — —
Análisis de sonidos (WJ III) .57 — — — — .26 — — —
Fluidez en la lectura (WJ III) .48 — — — — — .43 — —
Cálculo (WJ III) .32 — — — — — — — —
Vocabulario (WISC-III) — .75 — — — — — — —
Información general (WJ III) — .73 — — — — — — —
Similitudes (WISC-III) — .70 — — — — — — —
Información (WISC-III) — .58 — — — — — — —
Ordenamiento de figuras (WISC-III) — .47 .31 — — — — — —
Comprensión (WISC-III) — .42 — — — — — — —
Completamiento de figuras (WISC-III) — .30 — — — — — — —
Relaciones espaciales (WJ III) — — .69 — — — — — —
Diseño de bloques (WISC-III) — — .67 — — — — — —
Armado de objetos (WISC-III) — — .65 — — — — — —
Integración visual (WJ III) — — .30 — — — — — —
Fluidez de recuperación (WJ III) — — — .60 — — — — —
Rapidez en la identificación de
dibujos (WJ III) — — — .59 — — — — —
Memoria para palabras (WJ III) — — — — .89 — — — —
Alcance de dígitos (WISC-III) — — — — .61 — — — —
Memoria de trabajo auditiva (WJ III) — — — — .28 — — — —
Integración de sonidos (WJ III) — — — — — .96 — — —
Atención auditiva (WJ III) — — — — — .33 — — —
Palabras incompletas (WJ III) — — — — — .28 — — —
Pareo visual (WJ III) — — — — — — .75 — —
Rapidez en la decisión (WJ III) — — — — — — .63 — —
Búsqueda de símbolos (WISC-III) — — — — — — .59 — —
Fluidez en matemáticas (WJ III) — — — — — — .41 .37 —
Tachar (WJ III) — — — — — — .44 .34 —
Codificar (WISC-III) — — — — — — .49 — —
Razonamiento numérico (WJ III) — — — — — — — .75 —
Inversión de números (WJ III) — — — — .20 — — .57 —
Problemas aplicados (WJ III) — — — — — — — .44 —
Aritmética (WISC-III) — — — — — — — .42 —
Aprendizaje visual-auditivo (WJ III) — — — — — — — .38 —
Formación de conceptos (WJ III) — — — — — — — .31 —
Configuración de sonidos (WJ III) — — — — — — — .37 —
Planeamiento (WJ III) — — — — — — — — .44

Nota: N = 90. Las cargas de los factores inferiores a .40 fueron omitidas. Las cargas de los factores en itálica representan la mayor carga de los
factores para una prueba que no tenía ninguna carga mayor que .39, o bien la siguiente carga máxima de los factores de una prueba en un factor
determinado. Se indican con negrita las pruebas de la WJ III publicadas.

87
Validez
Cuadro 4-17.
Análisis factorial exploratorio de pruebas seleccionadas de la WJ III COG y la WJ III ACH, subpruebas de la WAIS-IIIa y
subpruebas de la KAIT – Pautas de factor oblicuo (estudio de Norton)
FACTOR
Medida Gq/Gf Gs Glr Gv-1 Gv-2
Razonamiento numérico (WJ III) .88 — — — —
Cálculo (WJ III) .79 — — — —
Problemas aplicados (WJ III) .74 — — — —
Aritmética (WAIS-III) .70 — — — —
Análisis-Síntesis (WJ III) .69 — — — —
Razonamiento con matrices (WAIS-III) .66 — — — —
Formación de conceptos (WJ III) .64 — — — —
Pasos lógicos (KAIT) .54 — — — —
Codificación de símbolos y dígitos (WAIS-III) .85 — — —
Pareo visual (WJ III) — .72 — — —
Búsqueda de símbolos (WAIS-III) — .69 — — —
Rapidez en la decisión (WJ III) — .61 — — —
Tachar (WJ III) .40 .58 — — —
Reconocimiento de dibujos (WJ III) — — .89 — —
Memoria para nombres (WJ III) — — .79 — —
Aprendizaje de rebuses (KAIT) — — .62 — —
Aprendizaje visual-auditivo (WJ III) — — .59 — —
Planeamiento (WJ III) — — — .86 —
Armado de objetos (WAIS-III) — — — .61 .41
Diseño de bloques (WAIS-III) — — — .50 —
Integración visual (WJ III) — — — — .84
Relaciones espaciales (WJ III) .44 — — — .65
Memoria para diseño de bloques (KAIT) .41 — — .40 —
Rotación de bloques (WJ III) — — — — —
Códigos enigmáticos (KAIT) — — — — —

Nota: N = 57. Se indican en negrita las pruebas de las WJ III publicadas. Las cargas de los factores inferiores a .40 fueron omitidas.
a
Los títilos de las pruebas en español son una traducción y pueden haber variaciones de las aquí incluidas.

la interpretación según la teoría CHC de las pruebas de Cálculo (Gq/Gf = 0.79), Problemas aplicados (Gq/Gf = 0.74),
Análisis-Síntesis (Gq/Gf = 0.69), Formación de conceptos (Gq/Gf = 0.64), Pareo visual (Gs = 0.72), Rapidez en la
decisión (Gs = 0.61) y Aprendizaje visual-auditivo (Glr = 0.59) de la WJ III. La carga de Reconocimiento de dibujos
en el factor Glr (0.89), aunque muy alta, no es del todo incompatible con los resultados de análisis factoriales
confirmatorios normativos ya presentados. En el marco de las medidas validadas independientes de memoria
asociativa (Glr de la prueba Aprendizaje de rebuses de la KAIT), este hallazgo sugiere que Reconocimiento de dibujos
puede invocar algunas habilidades de memoria asociativa y/o que el formato de memoria asociativa de la KAIT, así
como las pruebas de memoria asociativa de la WJ-R/WJ III, puede exigir ciertas habilidades de memoria visual (MV).

88
Validez
Validez concurrente de los compuestos de habilidades de la WJ III: relación con las medidas de
aprovechamiento de la muestra normativa
El Cuadro 4-18 nos informa acerca de las correlaciones entre cuatro opciones de predictores de habilidad de la
WJ III (Aprovechamiento predicho, GIA-Std, GIA-Ext y Lenguaje oral–Ext) y 14 compuestos de criterios de
aprovechamiento en cinco muestras normativas amplias de las WJ III. Las correlaciones para la opción de
Aprovechamiento predicho (PA, por sus siglas en inglés) vinculan las medidas de aprovechamiento con la ecuación de
predicción PA de ponderación óptima para dicho dominio. El repaso de las correlaciones expuestas en el Cuadro 4-18
permite extraer varias conclusiones.

Cuadro 4-18.
Correlaciones entre las cuatro opciones principales de habilidades de la WJ III y los compuestos de aprovechamiento de la
WJ III ACH
EDAD
6 a 8 años 9 a 13 años
Aprov. Leng. Aprov. Leng.
Compuesto pred. GIA-Std GIA-Ext oral pred. GIA-Std GIA-Ext oral
Lectura
Amplia lectura .75 .70 .72 .62 .75 .70 .73 .64
(485) (485) (530) (214) (1,087) (1,087) (1,087) (204)
Destrezas básicas en lectura .72 .69 .70 .62 .67 .64 .65 .57
(821) (801) (530) (204) (1,726) (1,726) (1,197) (204)
Comprensión de lectura .73 .68 .71 .67 .73 .68 .71 .68
(799) (799) (530) (204) (1,489) (1,489) (1,197) (204)
Matemáticas
Amplias matemáticas .72 .68 .70 .55 .71 .67 .69 .54
(700) (700) (530) (204) (1,726) (1,726) (1,197) (204)
Destrezas en el cálculos .67 .60 .62 .46 .67 .58 .60 .42
matemáticos (700) (700) (530) (204) (1,726) (1,726) (1,197) (204)
Razonamiento en matemáticos .73 .71 .73 .60 .74 .72 .73 .60
(694) (694) (530) (204) (1,277) (1,277) (1,197) (204)
Lenguaje escrito
Amplio lenguaje escrito .71 .66 .69 .56 .72 .67 .70 .58
(629) (629) (530) (204) (1,726) (1,726) (1,197) (204)
Destrezas básicas en escritura .68 .63 .66 .54 .71 .67 .69 .58
(748) (748) (530) (204) (1,503) (1,503) (1,197) (204)
Expresión escrita .69 .64 .67 .55 .68 .63 .66 .54
(629) (629) (530) (204) (1,726) (1,726) (1,197) (204)
Lengua y conocimientos
Lenguaje oral–Ext .68 .75 .78 — .65 .74 .77 —
(204) (204) (204) — (488) (488) (488) —
Lenguaje oral–Est .67 .71 .73 — .64 .68 .71 —
(204) (204) (204) — (488) (488) (488) —
Expresión oral .55 .62 .65 — .53 .64 .67 —
(821) (821) (530) — (1,726) (1,726) (1,197) —
Comprensión auditiva .67 .72 .75 — .62 .68 .71 —
(204) (204) (204) — (488) (488) (488) —
Conocimientos académicos .74 .66 .69 .73 .78 .68 .72 .75
(821) (821) (530) (204) (1,726) (1,726) (1,197) (204)

Nota: Las cifras entre paréntesis indican el tamaño de la muestra.

89
Validez
Cuadro 4-18. (cont.)
Correlaciones entre las cuatro opciones principales de habilidades de la WJ III y los compuestos de aprovechamiento de la
WJ III ACH
EDAD
14 a 19 años 20 a 39 años 40 años y más
Aprov. GIA- GIA- Leng. Aprov. GIA- GIA- Leng. Aprov. GIA- GIA- Leng.
Compuesto pred. Std Ext oral pred. Std Ext oral pred. Std Ext oral
Lectura
Amplia lectura .78 .74 .77 .68 .85 .81 .84 .76 .88 .84 .86 .80
(993) (993) (811) (448) (809) (809) (754) (343) (612) (612) (506) (278)
Destrezas básicas en .71 .68 .70 .61 .79 .76 .78 .75 .81 .76 .78 .74
lectura (1,383) (1,383) (811) (448) (1,147) (1,147) (754) (343) (840) (840) (506) (278)
.76 .69 .73 .72 .82 .76 .79 .81 .87 .80 .82 .83
Comprensión de lectura (1,053) (1,053) (811) (448) (827) (827) (754) (343) (698) (690) (506) (278)
Matemáticas
Amplias matemáticas .71 .67 .68 .58 .77 .75 .76 .67 .83 .81 .82 .74
(1,383) (1,383) (811) (448) (1,245) (1,245) (754) (343) (863) (863) (506) (278)
Destrezas en cálculos .66 .59 .61 .48 .72 .69 .69 .57 .78 .76 .57 .66
matemáticos (1,383) (1,383) (811) (448) (1,245) (1,245) (754) (343) (863) (863) (506) (278)
Razonamiento en matemáticos .74 .71 .73 .65 .79 .77 .78 .73 .85 .81 .83 .77
(1,094) (1,094) (811) (448) (934) (934) (754) (343) (662) (662) (506) (278)
Lenguaje escrito
Amplio lenguaje escrito .76 .73 .75 .63 .83 .81 .83 .73 .85 .83 .84 .76
(1,383) (1,383) (811) (448) (1,251) (1,251) (754) (343) (863) (863) (506) (278)
Destrezas básicas en .71 .66 .68 .58 .81 .77 .79 .74 .83 .78 .80 .75
escritura (1,168) (1,168) (811) (448) (904) (904) (754) (343) (654) (654) (506) (278)
Expresión escrita .72 .70 .72 .61 .80 .78 .80 .69 .83 .81 .83 .74
(1,383) (1,383) (811) (448) (1,251) (1,251) (754) (343) (863) (863) (506) (278)
Lengua y conocimientos
Lenguaje oral–Ext .69 .73 .76 — .77 .80 .83 — .79 .81 .83 —
(448) (448) (448) — (343) (343) (343) — (278) (278) (278) —
Lenguaje oral–Est .69 .76 .80 — .77 .82 .86 — .78 .84 .87 —
(448) (448) (448) — (343) (343) (343) — (278) (278) (278) —
Expresión oral .58 .66 .70 — .67 .73 .77 — .69 .75 .78 —
(1,383) (1,383) (811) — (1,251) (1,251) (754) — (863) (863) (506) —
Comprensión auditiva .67 .72 .75 — .77 .81 .83 — .78 .82 .83 —
(448) (448) (448) — (343) (343) (343) — (278) (278) (278) —
Conocimientos académicos .82 .70 .75 .77 .87 .77 .80 .84 .88 .79 .82 .85
(1,383) (1,383) (811) (448) (1,201) (1,201) (754) (343) (863) (863) (506) (278)

Nota: Las cifras entre paréntesis indican el tamaño de la muestra.

En primer lugar, la opción PA ofrece la predicción más fuerte de lectura, matemáticas, lenguaje escrito y
conocimientos académicos en todos los niveles de desarrollo. En segundo lugar, los compuestos GIA-Std y GIA-Ext
constituyen la segunda predicción en orden de importancia de lectura, matemáticas y lenguaje escrito. En tercer lugar,
si se exceptúa la predicción de los conocimientos académicos, el compuesto Lenguaje oral es congruentemente el
predictor más débil del aprovechamiento escolar, si se lo compara con las opciones GIA y PA de la batería cognitiva.
No obstante, la magnitud absoluta de las correlaciones de aprovechamiento en Lenguaje oral se compara
favorablemente con las correlaciones habilidad/aprovechamiento que se han dado a conocer entre algunas de las
principales baterías de inteligencia y el aprovechamiento escolar.

En cuanto a la predicción de los compuestos de lenguaje (Lenguaje oral, Expresión oral y Comprensión auditiva),
los compuestos GIA son congruentemente predictores mejores que la opción PA. Esto era previsible, si se tienen en
cuenta las diferencias conceptuales y de diseño entre estos dos tipos de predictores. Los compuestos GIA están
destinados a representar la construcción teórica de la inteligencia general (g), por lo cual incluyen pruebas Gc
(Comprensión verbal, Información general), dado que Gc es un componente importante de g. Como consecuencia de
ello, los compuestos GIA comparten contenido con los compuestos Lenguaje oral, Expresión oral y Comprensión
90
Validez
auditiva, todos ellos cargados de Gc, y por lo tanto brindarán puntuaciones apenas superiores. En cambio, el PA ha
sido diseñado, mediante ponderaciones de regresión múltiple, para predecir el aprovechamiento sin incluir contenidos
compartidos con el criterio. En el caso del PA para las medidas de aprovechamiento del lenguaje, la prueba de
Comprensión verbal (Gc) tiene su ponderación fijada en cero, condición ésta que pone en desventaja a PA cuando su
capacidad predictiva se compara con la de las opciones GIA. Estas diferencias entre las opciones PA y GIA en materia
de predicción subrayan la importancia de decidir qué opción de predictor de habilidades WJ III se utilizará para
determinar las discrepancias habilidad/aprovechamiento.

Validez concurrente de los compuestos de habilidad y las medidas de aprovechamiento de las WJ III:
comparación con otras baterías de inteligencia importantes
Las correlaciones entre las medidas de GIA obtenidas con la WJ III, Aprovechamiento predicho y Lenguaje oral, que
aparecen en el Cuadro 4-18, son las mejores estimaciones de la correlación de estos predictores de habilidades con el
aprovechamiento escolar. En los Cuadros 4-19 a 4-21 se da cuenta de otras correlaciones de estas medidas de habilidad
con las pruebas de aprovechamiento de la WJ III, así como con otras medidas independientes del aprovechamiento
desde las muestras de preescolares hasta las de universitarios. Lo que es aun más importante, las correlaciones
establecidas en estos tres cuadros permiten comparar en forma directa la eficiencia relativa de la predicción del
aprovechamiento con las opciones para habilidades de la WJ III, y las puntuaciones de escala completa de otras
importantes baterías, como las tres pruebas de Wechsler, la KAIT y la DAS.

Los resultados expuestos en el Cuadro 4-19 indican congruentemente que la GIA de la WJ III y las medidas de
Aprovechamiento predicho tienen una mayor correlación con el aprovechamiento escolar real que las puntuaciones
FSIQ de la WISC-III en todos los dominios, salvo en Conocimientos académicos y Expresión oral. En lo tocante al
Aprovechamiento total, tres compuestos de lectura, tres de matemáticas y tres de lenguaje escrito –las medidas PA
(mediana de las r = 0.68; amplitud = 0.56 a 0.74), GIA-Ext (mediana de las r = 0.67; amplitud = 0.49 a 0.75) y
GIA-Std (mediana de las r = 0.63; amplitud = 0.49 a 0.75) de la WJ III tuvieron congruentemente mayor relación con
el aprovechamiento escolar que la FSIQ de la WISC-III (mediana de las r = 0.50; amplitud = 0.42 a 0.60). También el
compuesto BIA de la WJ III demostró tener mayores correlaciones con el aprovechamiento escolar (mediana de las
r = 0.61; amplitud = 0.54 a 0.72) que la FSIQ de la WISC-III. Conclusiones semejantes se extraen respecto de la
predicción de los compuestos especiales de aprovechamiento, Conocimiento de fonemas/grafemas, Destrezas
académicas, Fluidez académica y Aplicaciones académicas.

Las altas correlaciones entre el índice FFD de la WISC-III y todas las medidas de aprovechamiento fueron
inesperadas y, al parecer, obedecen a características específicas de la muestra. Este índice de Wechsler nunca se
recomendó para su uso en predicciones habilidad-aprovechamiento, de modo tal que estos hallazgos resultan en este
contexto más enigmáticos que informativos. Si bien sería factible examinar y comentar la relación existente entre todas
las medidas cognitivas y de aprovechamiento de la WJ III, no se lo aconseja a raíz del pequeño tamaño de la muestra.
Las mejores estimaciones para examinar todas las correlaciones cognitivas y de aprovechamiento de las WJ III se
presentan en el Cuadro 4-18 y en los Apéndices D y E. Esto es válido, asimismo, para la interpretación de los estudios
que siguen.

Las conclusiones establecidas para la WISC-III se repiten en la comparación entre la WJ III y la WPPSI-R y DAS
en una muestra de preescolares (Cuadro 4-20). En cinco pruebas de aprovechamiento de la WJ III sobre lectura,
matemáticas y escritura, la mediana de las correlaciones entre GIA-Ext y GIA-Std de las WJ III con el aprovechamiento
(0.52 y 0.47, respectivamente) fueron superiores a la mediana de las correlaciones de Habilidad conceptual general de
la DAS y a los IQ de escala completa de la WPPSI-R (0.41 y 0.37, respectivamente). Es interesante señalar que, pese a
la ventaja de la DAS y la WPPSI-R en materia de lenguaje (ambas contienen un 50% aproximadamente de medidas
verbales o de lenguaje [Gc]), los compuestos GIA de la WJ III, que sólo contienen un 14% de Gc, fueron predictores
iguales o, en algunos casos, mejores, de los compuestos de aprovechamiento en lenguaje.

91
Validez
La capacidad predictiva comparativamente mayor de los compuestos de habilidades de la WJ III se hace extensiva
a la población universitaria, como informa el Cuadro 4-21. Cuando la comparación se refería al aprovechamiento
escolar o académico, medido ya sea por cinco compuestos de las WJ III ACH (todos menos Expresión oral), las
pruebas de Lectura y Ortografía de la WRAT3, la escala de Expresión escrita de la OWLS o la puntuación de
comprensión de lectura de la NDRT, las puntuaciones PA (mediana de las r = 0.56; amplitud = 0.42 a 0.68) y GIA-Std
(mediana de las r = 0.56; amplitud = 0.47 a 0.64) de la WJ III fueron mejores predictores de las

Cuadro 4-19.
Correlaciones entre los compuestos de la WJ III COG y la WJ III ACH, y la escala WISC-III, para los grados 3 a 5 (estudio de Phelps)
a
COMPUESTOS DE APROVECHAMIENTO DE LA WJ III
Tach BR BRS RC BM MCS MR BWL BWS WE P/G AS AF AA AK OE
Aprovechamiento predicho — .73 .65 .76 .74 .67 .69 .60 .59 .56 — — — — .70 .45
Habilidad intelectual abreviada .75 .72 .62 .71 .65 .61 .61 .57 .54 .54 .52 .67 .63 .70 .56 .51
Compuestos de las WJ III
Habilidad intelectual general–Ext .76 .70 .64 .73 .70 .61 .71 .57 .56 .53 .58 .68 .59 .76 .64 .61
Habilidad intelectual general–Est .75 .69 .63 .74 .71 .63 .68 .54 .57 .49 .59 .69 .54 .76 .60 .54
Habilidad verbal–Ext .66 .65 .56 .69 .58 .50 .61 .47 .49 .43 .48 .60 .49 .66 .74 .78
Habilidad verbal–Est .62 .61 .54 .68 .57 .47 .59 .45 .47 .39 .48 .59 .42 .66 .70 .79
Habilidad para pensar–Ext .52 .46 .48 .54 .54 .44 .54 .38 .42 .35 .50 .50 .33 .59 .40 .42
Habilidad para pensar–Est .52 .46 .48 .55 .55 .47 .52 .34 .41 .30 .51 .51 .31 .57 .42 .36
Eficiencia cognitiva–Ext .67 .61 .53 .54 .57 .52 .54 .55 .46 .53 .45 .55 .62 .58 .42 .34
Eficiencia cognitiva–Est .63 .58 .48 .54 .57 .57 .48 .50 .47 .48 .40 .55 .57 .55 .33 .23
Comprensión-conocimiento(Gc) .66 .65 .56 .69 .58 .50 .61 .47 .49 .43 .48 .60 .49 .66 .74 .78
Conocimiento (Gc) .64 .64 .53 .64 .58 .48 .61 .44 .46 .41 .44 .56 .49 .64 .91 .67
Recuperación a largo plazo (Glr) .45 .41 .36 .50 .44 .35 .49 .34 .41 .29 .35 .42 .27 .53 .48 .45
Percepción visual-espacial (Gv) .21 .19 .25 .24 .27 .22 .22 .12 .21 .09 .26 .26 .08 .24 .10 .17
Procesamiento auditivo (Ga) .19 .14 .19 .19 .20 .17 .16 .18 .17 .18 .27 .16 .13 .22 .10 .14
Percepción fonémica (Ga) .24 .22 .22 .24 .22 .20 .16 .18 .16 .17 .26 .22 .17 .24 .16 .16
Razonamiento fluido (Gf) .53 .48 .46 .54 .54 .45 .57 .37 .38 .34 .44 .49 .36 .58 .43 .41
Rapidez en el procesamiento (Gs) .55 .53 .39 .43 .42 .46 .36 .49 .40 .49 .27 .45 .59 .42 .26 .22
Fluidez cognitiva (Gs) .43 .49 .35 .35 .22 .27 .18 .39 .28 .42 .27 .31 .54 .28 .20 .23
Memoria a corto plazo (Gsm) .48 .42 .42 .41 .46 .36 .49 .35 .32 .34 .43 .41 .36 .49 .41 .31
Memoria de trabajo (Gsm) .55 .50 .45 .51 .53 .47 .49 .40 .42 .36 .46 .49 .42 .54 .36 .29
Escala de inteligencia para
niños de Wechsler-Tercera
edición
IQ de escala completa .60 .58 .49 .60 .55 .46 .59 .46 .44 .42 .41 .52 .48 .61 .64 .53
IQ verbal .64 .61 .53 .64 .55 .49 .57 .51 .46 .45 .46 .58 .49 .63 .66 .60
IQ de ejecución .37 .36 .29 .36 .38 .29 .43 .25 .28 .25 .22 .29 .31 .40 .41 .28
Índice de comprensión verbal .53 .54 .46 .59 .44 .38 .48 .41 .38 .37 .39 .48 .40 .54 .64 .61
Índice de organización perceptual .30 .28 .27 .32 .35 .24 .42 .18 .26 .17 .23 .25 .21 .36 .40 .30
Índice de rapidez de
procesamiento .41 .41 .27 .32 .30 .32 .23 .38 .30 .33 .19 .34 .43 .31 .19 .16
Índice de capacidad de
concentración .71 .60 .62 .55 .67 .58 .64 .62 .55 .55 .59 .68 .56 .66 .43 .28
N 147 150 150 150 148 148 150 149 149 149 150 150 147 150 150 150
Media 103.6 97.2 94.6 103.9 106.9 105.7 104.9 113.7 104.4 119.7 102.5 97.6 109.8 106.3 104.4 105.0
Desvío estándar 13.1 11.5 11.2 11.5 11.6 11.5 12.4 11.9 11.5 13.5 11.1 10.5 12.7 10.7 11.8 13.3

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y
por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).
a
Abreviaturas de los compuestos de aprovechamiento de las WJ III: TAch = Aprovechamiento total; BR = Amplia lectura; BRS = Destrezas básicas en
lectura; RC = Comprensión de lectura; BM = Amplias matemáticas; MCS = Destrezas en cálculos matemáticos; MR = Razonamiento en matemáticas;
BWL = Amplio lenguaje escrito; BWS = Destrezas básicas en escritura; WE = Expresión escrita; P/G = Conocimiento de fonemas/grafemas; AS =
Destrezas académicas; AF = Fluidez académica; AA = Aplicaciones académicas; AK = Conocimientos académicos; OE = Expresión oral.

92
Validez
Cuadro 4-20.
Correlaciones entre los compuestos de la WJ III COG, de la DAS y de la WPPSI-R con pruebas y compuestos seleccionados
de la WJ III ACH, para una muestra de preescolares (estudio de Ford, Teague y Tusing)
PRUEBAS Y COMPUESTOS DE APROVECHAMIENTO DE LA WJ III
Identificación Análisis
de letras y Comprensión de Problemas Orto- Expresión Comprensión Lenguaje Lenguaje
Medida palabras de textos palabras aplicados grafía oral auditiva oral–Ext oral–Est
Habilidad intelectual general de
las WJ III
Escala extendida .62 .27 .52 .57 .48 .71 .70 .79 .76
Escala estándar .62 .27 .49 .47 .47 .69 .71 .79 .71
Habilidad intelectual abreviada .59 .25 .49 .49 .51 .66 .68 .75 .70
Compuestos cognitivos de las
WJ III
Habilidad verbal–Ext .43 .27 .42 .49 .30 .84 .68 .83 .73
Habilidad verbal–Est .46 .16 .40 .38 .28 .86 .70 .86 .71
Habilidad para pensar–Ext .55 .22 .47 .54 .44 .65 .66 .74 .73
Habilidad para pensar–Est .58 .23 .47 .45 .43 .63 .62 .70 .66
Eficiencia cognitiva–Ext .61 .17 .45 .36 .52 .54 .65 .66 .63
Eficiencia cognitiva–Est .57 .18 .43 .35 .47 .50 .62 .61 .58
Comprensión-conocimiento (Gc) .43 .27 .42 .49 .30 .84 .68 .83 .73
Conocimiento (Gc) .27 .56 .26 .71 .18 .65 .41 .57 .54
Recuperación a largo plazo (Glr) .52 .21 .46 .43 .36 .57 .50 .59 .55
Percepción visual-espacial (Gv) .39 .20 .36 .39 .31 .47 .42 .45 .42
Procesamiento auditivo (Ga) .42 .05 .32 .33 .35 .53 .68 .72 .72
Percepción fonémica (Ga) .37 .06 .36 .27 .28 .50 .56 .62 .62
Razonamiento fluido (Gf) .46 .16 .37 .38 .33 .45 .47 .49 .46
Rapidez en procesamiento (Gs) .55 .17 .42 .32 .52 .48 .55 .56 .56
Fluidez cognitiva (Gs) .55 .16 .32 .49 .44 .51 .42 .49 .48
Memoria a corto plazo (Gsm) .49 .09 .37 .22 .38 .45 .58 .58 .55
Escalas de habilidades
diferenciadas
Habilidad conceptual general .49 .25 .41 .43 .31 .70 .57 .69 .67
Habilidad verbal .39 .28 .36 .43 .16 .73 .56 .70 .64
Habilidad no verbal .47 .17 .38 .32 .32 .56 .44 .52 .53
Escala de inteligencia para
preescolares y alumnos
primarios de Wechsler-revisada
IQ de escala completa .48 .19 .37 .39 .33 .73 .65 .77 .70
IQ verbal .40 .17 .35 .38 .22 .70 .65 .74 .68
IQ de ejecución .47 .19 .32 .35 .38 .63 .53 .64 .59
N 157 134 150 194 192 188 140 138 140
Media 90.5 94.0 99.0 94.6 100.4 97.2 90.1 92.0 91.7
Desvío estándar 12.3 14.1 13.3 14.4 12.7 13.0 11.5 12.0 13.1

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima y
por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

93
Validez
Cuadro 4-21.
Correlaciones entre los compuestos de la WJ III COG, la WAIS-III y la KAIT con los compuestos de la WJ III ACH, la escala
OWLS, los compuestos de la WRAT3 y los compuestos de la prueba NDRT (estudio de Gregg y Hoy)
COMPUESTOS DE APROVECHAMIENTO DE LA WJ III

Destrezas Destrezas Conocimiento


Lectura básicas en básicas en Expresión de fonemas/ Fluidez
Medida amplia lectura escritura oral grafemas académica
Aprovechamiento predicho .66 .62 .63 .42 — —
Habilidad intelectual abreviada .55 .54 .60 .51 .54 .51
Habilidad intelectual general de la
WJ III
Escala estándar .56 .56 .62 .47 .63 .48
Compuestos cognitivos de la
WJ III
Habilidad para pensar–Ext .35 .40 .43 .35 .45 .26
Habilidad para pensar–Est .38 .45 .45 .38 .52 .29
Eficiencia cognitiva–Ext .62 .52 .54 .23 .52 .55
Eficiencia cognitiva–Est .60 .53 .56 .16 .55 .55
Comprensión verbal (Gc) .32 .34 .40 .82 .33 .27
Recuperación a largo plazo (Glr) .27 .23 .31 .33 .27 .23
Percepción visual-espacial (Gv) .19 .18 .25 .29 .29 .16
Procesamiento auditivo (Ga) .42 .49 .41 .23 .51 .35
Percepción fonémica (Ga) .44 .52 .45 .26 .56 .35
Razonamiento fluido (Gf) .22 .30 .31 .32 .32 .18
Rapidez en el procesamiento (Gs) .55 .37 .49 .21 .36 .52
Fluidez cognitiva (Gs) .39 .15 .27 .26 .12 .33
Memoria a corto plazo (Gsm) .45 .44 .39 .16 .46 .37
Memoria de trabajo (Gsm) .50 .46 .49 .23 .49 .45
Escala de inteligencia para adultos
de Wechsler-Tercera edición
IQ de escala completa .35 .39 .38 .61 .40 .27
IQ verbal .42 .43 .40 .60 .41 .37
IQ de ejecución .17 .23 .25 .45 .27 .09
Índice de comprensión verbal .25 .31 .31 .60 .29 .19
Índice de organización perceptual .07 .18 .15 .48 .23 .00
Índice de rapidez de
procesamiento .47 .29 .37 .19 .31 .49
Índice de memoria de trabajo .52 .51 .54 .25 .51 .51
Prueba de inteligencia para
adolescentes y adultos de Kaufman
Escala compuesta de inteligencia .57 .53 .51 .55 .53 .49
Escala cristalizada .56 .51 .50 .52 .51 .50
Escala fluida .42 .40 .39 .44 .40 .35
N 206 185 200 182 185 205
Media 94.7 92.2 95.9 101.7 98.5 103.6
Desvío estándar 12.4 12.9 14.0 11.0 12.8 13.3

94
Validez
Cuadro 4-21. (cont.)
Correlaciones entre los compuestos de la WJ III COG, la WAIS-III y la KAIT con los compuestos de la WJ III ACH, la escala
OWLS, los compuestos de la WRAT3 y los compuestos de la prueba NDRT (estudio de Gregg y Hoy)
OWLS WRAT3 NDRT

Comprensión Expresión Comprensión Expresión Comprensión Orto- Comprensión


Medida de lectura oral oral escrita del lenguaje Lectura grafía de lectura
Aprovechamiento predicho .56 .58 .66 .52 .54 .60 .49 .68
Habilidad intelectual abreviada .54 .60 .65 .39 .52 .51 .44 .63
Habilidad intelectual general de la
WJ III
Escala estándar .56 .62 .69 .49 .64 .61 .47 .61
Compuestos cognitivos de la
WJ III
Habilidad para pensar–Ext .48 .48 .57 .30 .48 .44 .29 .37
Habilidad para pensar–Est .54 .53 .62 .28 .54 .51 .36 .42
Eficiencia cognitiva–Ext .36 .38 .43 .44 .30 .45 .44 .50
Eficiencia cognitiva–Est .33 .38 .41 .48 .33 .50 .43 .48
Comprensión verbal (Gc) .55 .53 .61 .23 .43 .38 .29 .52
Recuperación a largo plazo (Glr) .40 .38 .45 .43 .47 .31 .22 .26
Percepción visual-espacial (Gv) .31 .31 .38 .26 .33 .24 .20 .16
Procesamiento auditivo (Ga) .40 .43 .46 .31 .38 .44 .32 .42
Percepción fonémica (Ga) .39 .45 .48 .35 .38 .48 .38 .41
Razonamiento fluido (Gf) .48 .47 .53 .25 .50 .30 .18 .30
Rapidez en el procesamiento (Gs) .28 .36 .37 .32 .24 .37 .40 .49
Fluidez cognitiva (Gs) .21 .21 .25 .17 .17 .15 .18 .26
Memoria a corto plazo (Gsm) .30 .26 .32 .36 .22 .36 .31 .33
Memoria de trabajo (Gsm) .37 .38 .44 .46 .37 .37 .34 .40
Escala de inteligencia para adultos
de Wechsler-Tercera edición
IQ de escala completa .56 .52 .60 .36 .56 .43 .27 .47
IQ verbal .54 .56 .62 .31 .53 .47 .26 .57
IQ de ejecución .42 .34 .42 .30 .41 .28 .20 .23
Índice de comprensión verbal .42 .47 .50 .15 .35 .35 .22 .45
Índice de organización perceptual .40 .31 .39 .28 .41 .19 .13 .10
Índice de rapidez de
procesamiento .27 .32 .35 .19 .13 .33 .34 .49
Índice de memoria de trabajo .40 .43 .47 .48 .40 .49 .41 .47
Prueba de inteligencia para
adolescentes y adultos de Kaufman
Escala compuesta de inteligencia .66 .68 .75 .47 .70 .58 .37 .59
Escala cristalizada .56 .62 .66 .34 .57 .56 .38 .60
Escala fluida .58 .57 .64 .46 .64 .44 .27 .42
N 204 204 203 102 96 204 204 191
Media 102.8 117.9 111.5 93.2 97.6 107.6 104.5 219.1
Desvío estándar 13.8 19.3 16.6 13.4 13.0 9.6 13.7 23.9

Nota: Las puntuaciones estándar de las WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en las WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel de
edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por encima
y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2).

95
Validez
hacer, empero, una advertencia. Aproximadamente la mitad de esta muestra se clasificó como portadora de una
discapacidad de aprendizaje, y la confianza que suele depositarse en las escalas de Wechsler puede haber influido en
esto. Los efectos de preselección de la muestra –que se presentan cuando una medida se utiliza para preseleccionar una
muestra y luego el instrumento de preselección se compara con otra medida– pueden distorsionar en forma
significativa la comparación de los estadísticos de la muestra para las diferentes medidas. Los resultados actuales
requieren una ulterior intervalidación.

Ya sea por el efecto de preselección de la WAIS-III, ya porque su contenido de Gf-Gc común con la WJ III es
mayor, lo cierto es que previsiblemente la Escala de inteligencia compuesta de la KAIT probó tener correlaciones con
los mismos compuestos de aprovechamiento (mediana de las r = 0.53; amplitud = 0.37 a 0.57) en un nivel que se
aproximaba más estrechamente a los informados para los compuestos de la WJ III COG. Dado su 50% de contenido de
Comprensión verbal (Gc), las puntuaciones de escala completa de la KAIT y la WAIS-III fueron iguales o mayores
que la predicción del criterio para lenguaje oral.

En consonancia con los resultados de las muestras normales y con discapacidad de aprendizaje de Gregg y Hoy,
los obtenidos con la pequeña muestra de la universidad comunitaria de Norton avalaron la conclusión de que las WJ III
poseen mayores capacidades predictivas para el aprovechamiento en matemáticas que otras medidas similares ya sea
de la WAIS-III o de la KAIT. Los resultados a nivel de las pruebas de que da cuenta el Cuadro 4-15 revelan que, de
todas las medidas administradas, las pruebas con mayor correlación respecto del aprovechamiento en matemáticas
fueron las de inteligencia fluida (Gf) de las diversas baterías. Las mayores correlaciones de pruebas individuales con el
aprovechamiento en matemáticas se dieron en Análisis-Síntesis (0.66) y Formación de conceptos (0.70) de la WJ III,
las pruebas Pasos lógicos (0.62) y Códigos enigmáticos (0.59) de la KAIT, y la prueba Razonamiento matricial de la
WAIS-III (0.56). La correlación para Aritmética de la WAIS-III fue de 0.65, lo cual refleja una inapropiada
contaminación entre el predictor y el criterio, y por consiguiente esta prueba no ha sido incluida en los análisis e
interpretación subsiguientes. Lo que es más importante, luego de realizar la regresión por pasos a fin de predecir el
aprovechamiento en matemáticas, las dos primeras pruebas en ingresar al modelo fueron Análisis-Síntesis y Formación
de conceptos de las WJ III, seguidas por los Códigos enigmáticos de la KAIT. Además, las dos pruebas Gf de la
WJ III presentaron los mayores coeficientes de regresión estandarizados (Formación de conceptos = 0.41;
Análisis-Síntesis = 0.36). Ninguna de las pruebas de la WAIS-III contribuyeron a la predicción del aprovechamiento
en matemáticas mejor que las de Análisis-Síntesis y Formación de conceptos de la WJ III y, en menor medida, la de
Códigos enigmáticos de la KAIT (0.22).

Validez concurrente de los compuestos de aprovechamiento de la WJ III: relación con las puntuaciones
compuestas de otras baterías de aprovechamiento
La magnitud y pautas de las correlaciones entre los compuestos de aprovechamiento de la WJ III ACH, la WIAT y la
KTEA (ver el Cuadro 4-10) suministran evidencia favorable sobre la validez concurrente de la WJ III ACH. No
obstante, es muy probable que muchas de las correlaciones que figuran en el Cuadro 4-10 subestimen las correlaciones
de la población, a raíz de las restricciones en cuanto a la amplitud reflejadas en varios desvíos estándar.

En el nivel de puntuación más amplio, el compuesto Aprovechamiento total de la WJ III tuvo una fuerte
correlación con las puntuaciones compuestas de las baterías WIAT (0.65) y KTEA (0.79). En lectura, las correlaciones
entre los tres compuestos de la WJ III y los tres de la WIAT y la KTEA se mantuvieron, típicamente, entre 0.60 y 0.70,
con medianas de 0.70 (WIAT) y 0.66 (KTEA). El compuesto Amplia lectura de la WJ III tuvo una correlación
significativa con las puntuaciones de compuestos totales de Lectura de la WIAT (0.67) y la KTEA (0.76). En el caso
de las correlaciones WJ III/WIAT, las puntuaciones de compuestos que medían los mismos campos conceptuales
(Destrezas básicas en lectura, Comprensión de lectura) demostraron poseer gran validez convergente y discriminativa.
Las puntuaciones de los compuestos Destrezas básicas en lectura y Comprensión de lectura tuvieron correlaciones
altas, de 0.82 y 0.79, en tanto que las correlaciones entre dominios fueron notablemente inferiores (0.70 y 0.68). Para
las correlaciones de lectura WJ III/KTEA, la cifra de 0.62 entre los compuestos de comprensión de las pruebas fue
fuerte y congruente con el dominio.

96
Validez
Las correlaciones entre los compuestos de la WJ III, la WIAT y la KTEA referentes a matemáticas sustentaron,
asimismo, la interpretación de los compuestos de matemáticas de la WJ III como medidas válidas del aprovechamiento
en esta materia. El compuesto Amplias matemáticas de la WJ III tuvo correlaciones de 0.70 y 0.66 con los compuestos
de Matemáticas de la WIAT y la KTEA, respectivamente. Destrezas en cálculos matemáticos de la WJ III también
tuvo una alta correlación con Cálculos matemáticos de la KTEA (0.67) y una no tan alta con Aplicaciones matemáticas
de la KTEA (0.40).

Las correlaciones WJ III/WIAT en lenguaje escrito fueron menores que las de lectura y matemáticas, lo cual muy
probablemente refleje los diferentes enfoques utilizados para medir las destrezas en estos dominios. El compuesto
Amplio lenguaje escrito de la WJ III tuvo una correlación de 0.47 con la puntuación compuesta para Escritura de la
WIAT. La correlación más alta entre WJ III/WIAT y WJ III/KTEA en lo tocante al lenguaje escrito (0.77) fue la
observada entre el compuesto Destrezas básicas en escritura de la WJ III y las pruebas de escritura de las otras dos
baterías, hallazgo que refleja la inclusión de la prueba Ortografía en el compuesto mencionado. Las correlaciones
relativamente bajas (0.31 a 0.42) entre Expresión escrita de la WJ III y de la WIAT indica que tal vez no sea razonable
interpretar ambas pruebas como medidas de los mismos aspectos de la expresión escrita.

Por último, la correlación de 0.55 entre las puntuaciones de Comprensión auditiva de lasWJ III y de la WIAT, si
bien proporciona una importante evidencia de validez concurrente, sugiere que las dos baterías de aprovechamiento
administran medidas operacionalizadas levemente distintas entre sí de la construcción teórica Comprensión auditiva.
El Cuadro 4-10 presenta otras correlaciones para compuestos especiales de la WJ III y puntuaciones de la WIAT y la
KTEA, resultados que, en general, vienen en apoyo de la validez concurrente de los compuestos de la WJ III ACH.

Relación entre la WJ III COG y la clasificación de los miembros de los grupos


Tres estudios especiales analizaron la relación entre la WJ III y la clasificación de los integrantes del grupo como
normales, afectados por una discapacidad de aprendizaje (LD) o por un síndrome de ADHD.

En primer término, el estudio llevado a cabo por Gregg y Hoy con universitarios incluyó una división de los
alumnos entre los que tenían o no tenían LD. Se realizaron comparaciones de la puntuación media de unos y otros
(pruebas t) en 16 compuestos de la WJ III COG y seis de la WJ III ACH. Aun después de aplicar el método de ajuste
de Bonferroni para controlar la tasa global de error, los resultados expuestos en el Cuadro 4-22 muestran que 19 de las
22 pruebas t fueron significativas en el nivel de 0.05. Ello indica que los compuestos de la WJ III COG y la WJ III
ACH no revelan diferencias significativas entre los estudiantes universitarios con o sin LD, hallazgo que promueve el
uso de las WJ III para clasificar a los sujetos que padezcan o no tal déficit.

La muestra de ADHD de Lerner y Yasutake, si bien fue pequeña y de índole exploratoria, indica que ciertas
pruebas de la WJ III pueden ser útiles para identificar a los estudiantes con ADHD. Según se desprende del Cuadro
4-13, al comparar con la población general (prueba t de una muestra), once pruebas de la WJ III fueron
significativamente diferentes de la medida de 100, y cuatro de ellas mantuvieron dicho nivel de significación luego de
aplicar el ajuste de Bonferroni. El hecho de que los sujetos con ADHD tuvieran puntuaciones significativamente
menores (ajustadas según Bonferroni) en dos de las pruebas de lectura de la WJ III (Identificación de letras y palabras
y Comprensión de textos) no fue inesperado, dados los problemas de rendimiento escolar que suele tener este grupo. El
rendimiento significativamente inferior en la prueba de Comprensión oral (que mide la habilidad auditiva) es
congruente, asimismo, con las características del ADHD. El hallazgo más llamativo fue el pobre desempeño de los
sujetos con ADHD en la prueba Atención auditiva (M = 79.6), que es de atención auditiva selectiva. Esto sugiere que
dicha prueba puede brindar frutos promisorios si se la emplea para identificar a los individuos que padecen ADHD.
También es notable la posible utilidad diagnóstica de las pruebas que exigen prestar gran atención a los estímulos
auditivos (Integración de sonidos y Memoria para palabras), nombrar objetos con rapidez (Rapidez en la
identificación de dibujos) y planificar las acciones (Planeamiento), aunque estas pruebas sólo fueron significativas en
el nivel, no corregido, de 0.05.

97
Validez
Cuadro 4-22.
Medias, desvíos estándar y pruebas t de los compuestos de la WJ III para grupos de estudiantes universitarios con y sin
discapacidad de aprendizaje (LD) (estudio de Gregg y Hoy)
Ejemplos
Con LD Sin LD
Medida N M SD N M SD M Diff. t df p
Habilidad intelectual abreviada 84 95.5 9.3 91 106.3 7.8 -10.8 -8.3 162.5 .0001
Compuestos cognitivos de las WJ III
Habilidad intelectual general–Est 52 96.8 9.6 84 108.6 8.1 -11.8 -7.4 95.3 .0001
Habilidad para pensar–Ext 52 100.3 9.0 95 108.2 7.9 -7.9 -5.3 94.5 .0001
Habilidad para pensar–Est 60 98.7 10.7 96 108.8 8.9 -10.2 -6.2 108.5 .0001
Eficiencia cognitiva–Ext 100 93.6 10.6 103 104.0 10.0 -10.4 -7.2 199.7 .0001
Eficiencia cognitiva–Est 100 92.4 11.5 103 104.3 10.1 -11.8 -7.8 195.6 .0001
Comprensión verbal (Gc) 86 99.1 9.9 91 106.4 10.5 -7.3 -4.8 175.0 .0001
Recuperación a largo plazo (Glr) 100 104.1 11.6 100 109.1 11.3 -5.0 -3.1 197.9 .0479
Percepción visual-espacial (Gv) 54 100.8 10.9 96 106.2 10.1 -5.4 -3.0 103.5 .0721
Procesamiento auditivo (Ga) 100 94.2 11.9 103 105.8 11.3 -11.7 -7.2 199.5 .0001
Percepción fonémica (Ga) 100 97.2 11.2 103 108.5 11.1 -11.3 -7.2 200.8 .0001
Razonamiento fluido (Gf) 100 100.7 10.2 103 105.7 7.8 -5.0 -3.9 186.1 .0027
Rapidez en el procesamiento (Gs) 100 92.7 11.0 103 101.9 9.2 -9.2 -6.5 192.8 .0001
Fluidez cognitiva (Gs) 100 91.6 11.9 103 95.0 9.6 -3.4 -2.3 190.0 .5658
Memoria a corto plazo (Gsm) 101 96.8 12.8 103 105.1 12.2 -8.3 -4.8 201.2 .0001
Memoria de trabajo (Gsm) 101 94.7 13.5 103 105.7 12.1 -11.1 -6.2 198.6 .0001
Compuestos de aprovechamiento de
las WJ III
Amplia lectura 101 86.5 10.0 103 102.4 8.8 -15.8 -12.0 197.7 .0001
Destrezas básicas en lectura 80 84.3 13.4 103 98.2 8.5 -14.0 -8.1 126.9 .0001
Destrezas básicas en escritura 95 86.5 12.9 103 104.3 8.4 -17.8 -11.4 159.0 .0001
Expresión oral 86 99.3 10.8 94 103.9 10.9 -4.6 -2.8 176.8 .1144
Conocimiento de fonemas/grafemas 80 90.8 14.0 103 104.3 7.9 -13.5 -7.7 117.5 .0001
Fluidez académica 100 94.7 10.9 103 112.0 9.3 -17.3 -12.2 194.5 .0001

Nota: Las puntuaciones estándar de la WJ III que presenta este cuadro son puntuaciones estándar especiales de investigación, derivadas de una
transformación simple de puntuación z de las puntuaciones W en cada uno de los 26 grupos etarios. El propósito del cálculo de estas puntuaciones
especiales de investigación fue eliminar de las puntuaciones W la variancia de edad para poder calcular las correlaciones en una gran amplitud de
edades. Dichas puntuaciones estándar de investigación difieren de las puntuaciones finales publicadas en la WJ III, que no estaban disponibles en el
momento en que se realizó este estudio. Las puntuaciones estándar de investigación utilizan la media y el desvío estándar promedio en cada nivel
de edad, mientras que las puntuaciones publicadas utilizan la mediana de las puntuaciones y dos estimaciones singulares del desvío estándar (por
encima y por debajo de la mediana), aplicando un procedimiento de normalización continuo (ver el Capítulo 2)

Finalmente, se realizó un análisis funcional discriminativo por pasos con las muestras de individuos normales, con
LD y con ADHD en edad de concurrir a la escuela primaria. El análisis incluyó las quince pruebas de la WJ III COG y
las doce subpruebas de la WISC-III enumeradas en el Cuadro 4-22, así como los compuestos de Amplia lectura y de
Amplias matemáticas de la WJ III ACH. Amén del compuesto Amplia lectura, sólo cinco pruebas contribuyeron en
grado significativo a las dos funciones discriminativas canónicas importantes (correlaciones canónicas de 0.66 y 0.50)
con las cuales se puede clasificar correctamente al 64% de los sujetos (al 59% de ellos con una clasificación
jacksoniana). Esto representa, aproximadamente, una duplicación de la exactitud con que se hace dicha clasificación al
azar (33%). Además de la prueba de Alcances de dígitos de la WISC-III (Gsm/alcance de la memoria), también
contribuyeron a la clasificación correcta de los sujetos como normales, con LD o con ADHD las pruebas Ga (Palabras
incompletas/codificación fonética), las Gf (Formación de conceptos/aprendizaje de conceptos) y las Glr (Aprendizaje
visual-auditivo/memoria asociativa, Rapidez en la identificación de dibujos/Facilidad de identificación) de las WJ III.
98
Validez
La primera función significativa tuvo un alto coeficiente estandarizado en el compuesto Amplia lectura de la
WJ III (0.90) y cargas menores o negativas en todas las demás variables (Alcance de dígitos = 0.48; Formación de
conceptos = 0.11; Palabras incompletas = -0.12; Aprendizaje visual-auditivo = -0.13; Fluidez de recuperación =
-0.51). Por lo tanto, el aprovechamiento en lectura fue la característica más significativa que permitió discriminar entre
estos tres grupos. La carga negativa de -0.51 para Fluidez de recuperación –medida de una habilidad que tiene un
vínculo notorio con las discapacidades para la lectura (en especial para la recuperación rápida de palabras)– señala que
la primera función significativa clasifica a los sujetos como normales, LD o ADHD basándose fundamentalmente en
una pauta donde coexisten una lectura insuficiente con una gran fluidez de recuperación, o una lectura muy buena con
una fluidez de recuperación insuficiente. Esta interpretación resulta clara en el orden de las puntuaciones medias
canónicas del grupo normal (0.64), el de ADHD (0.38) y el de LD (-1.38).

Los coeficientes estandarizados del estudio de Vesley revelan que la información más importante en materia de
clasificación de la segunda función proviene principalmente del rendimiento en las pruebas cognitivas de las WJ III
(Formación de conceptos = -0.75; Palabras incompletas = -0.70; Fluidez de recuperación = -0.47; Aprendizaje
visual-auditivo = 0.56; Amplia lectura = 0.31; Alcance de dígitos de la WISC-III = -0.12). El orden de la puntuación
media canónica del grupo en esta función (ADHD = 0.71; LD = -0.12; normales = -0.59), que se basa primordialmente
en grandes ponderaciones negativas de las pruebas de la WJ III COG (sobre todo de Formación de conceptos y
Palabras incompletas), sugiere que los sujetos que padecen ADHD son los más extremos en esta combinación de
variables cognitivas.

Evidencia sobre la imparcialidad de las pruebas


La evaluación de la imparcialidad de las pruebas es compleja y multifacética. En Standards for Educational and
Psychological Testing (AERA et al., 1999) se afirma que “es imposible alcanzar una imparcialidad absoluta con todos
los examinandos” (pág. 73). Aquí describiremos dos tipos de análisis de los sesgos de las WJ III, uno centrado en el
nivel del ítem y el otro en el nivel de la agregación de ítemes (o sea, la prueba). Ya hemos debatido antes un tercer tipo
de control de la imparcialidad del ítem, basado en el examen, realizado por especialistas, de los sesgos y de la
sensibilidad de los grupos que pueden ser afectados.

Análisis en el nivel del ítem: análisis del funcionamiento diferencial del ítem (DIF)
A fin de abordar los problemas vinculados con la imparcialidad de la WJ III para todos los grupos raciales, étnicos y
genéricos, se realizaron análisis estadísticos del funcionamiento de los ítemes en las comparaciones de los grupos
pertinentes, mediante procedimientos coherentes con el modelo utilizado para desarrollar la prueba (métodos basados
en la “teoría de la respuesta al ítem” o IRT, por sus siglas en inglés). Los análisis del funcionamiento diferencial del
ítem (DIF, por sus siglas en inglés) se llevaron a cabo con el modelo IRT de Rasch.

Se efectuaron calibraciones sobre la dificultad de los ítemes y se compararon estas cifras para distintos grupos.
Este proceso parte de la base de que si los dos grupos que se comparan provienen de la misma población de
habilidades latentes, las dificultades de los ítemes deberían ser iguales. Sin embargo, si para individuos del mismo
nivel de habilidad las dificultades son diferentes, los grupos respectivos podrían diferir en cuanto a su grado de
familiaridad o de experiencia con el contenido del ítem. Se llega a la conclusión de que las medidas son equivalentes si
las curvas de características del ítem (ICIs, por sus siglas en inglés) –o sea, las curvas que describen matemáticamente
la probabilidad de que individuos con igual habilidad latente den una respuesta correcta al ítem– no difieren en función
de la condición del miembro del grupo.

Las comparaciones grupales que resultaron de interés fueron: varones/mujeres, blancos/no blancos y
latinoamericanos o hispanos/no latinoamericanos. Los grupos de referencia eran de hombres blancos y no
latinoamericanos. El tamaño promedio de las muestras en los ítemes para los cuales se realizaron los análisis que se
exponen a continuación fue: mujeres n = 2,275; varones n = 2,030; blancos n = 3,457; no blancos, n = 849;
latinoamericanos n = 455; no latinoamericanos n = 3,849. Estos análisis se centraron en las pruebas pertenecientes a
aquellos dominios en que había más posibilidades de sesgo debido a la influencia del lenguaje y el aprovechamiento.
99
Validez
Incluyeron 189 ítemes normativos de las pruebas Comprensión-Conocimiento (Gc) de la WJ III COG y de la prueba
Conocimientos académico (Gc) de la WJ III ACH. Los ítemes normativos de estas pruebas se combinaron con un gran
conjunto único de ítemes que medían el vocabulario, el desarrollo del lenguaje general, la información general, y
conocimientos culturales generales y curriculares.

A fin de evaluar el DIF (funcionamiento diferencial del ítem), primero se calibraron los ítemes de cada grupo en
forma separada mediante WINSTEPS (Linacre y Wright, 1998). Se calcularon las correlaciones y diferencias para los
pares de dificultades del ítem correspondiente a las comparaciones que interesaban, y luego se construyeron gráficos
para los pares de dificultad del ítem y los estadísticos de la diferencia.

Todas las correlaciones entre pares de dificultades de los ítemes fueron iguales o superiores a 0.99. Los gráficos de
los pares de ítemes reflejan esta alta asociación. Por ejemplo, la Figura 4-7 grafica la dificultad de los pares de ítemes
para varones y mujeres; resulta clara la gran correlación entre estos índices. Sólo para unos pocos ítemes de extrema
dificultad hubo algunas pequeñas desviaciones respecto de esta relación lineal. Los gráficos de la dificultad de los
ítemes para el grupo de referencia según las diferencias de dificultad describen con mayor claridad todavía estas
diferencias para los ítemes de dificultad extrema. Por ejemplo, la Figura 4-8 muestra las diferencias de dificultad de los
ítemes para personas blancas o no blancas, según la dificultad de los ítemes para el grupo de las personas blancas. Ella
indica que varios ítemes tuvieron diferencias relativamente grandes en favor del grupo de referencia y uno de los
ítemes tuvo una gran diferencia en favor del grupo focal. Sin embargo, muestra también que la mayoría de las
diferencias importantes correspondían a ítemes cuyos valores se hallaban en los extremos de la escala de dificultad.

En los análisis DIF, un ítem debe mostrar diferencias estadística y prácticamente significativas entre los grupos de
comparación. En este estudio, se estableció una diferencia de dificultad absoluta de 4.6 o más en la escala W para
identificar aquellos ítemes cuyas diferencias prácticas fueran lo bastante importantes como para justificar un examen
ulterior. Este valor W correspondía a un valor logit de 0.5 utilizado en varios estudios de sesgos de los ítemes
realizados con el modelo de Rasch (Draba, 1977; Scheuneman y Subhiyah, 1998). El Cuadro 4-23 presenta los ítemes
identificados junto a las dificultades del grupo, los errores estándar asociados y las diferencias de dificultad.
Dificultades del ítem – Mujeres

Dificultades del ítem – Varones

Figura 4-7.
Dificultades de los ítemes de las WJ III según el género (masculino/femenino).

100
Validez
El Cuadro 4-23 gira en torno de la diferencia de dificultad de los ítemes, que aparece en la columna situada en el
medio del cuadro. Un valor positivo indica que el ítem favorecía al grupo focal, o sea, era más fácil para éste que para
el grupo de referencia. Un valor negativo sugiere que el ítem era más difícil para el grupo focal que para el grupo de
referencia. La indagación del sesgo contrario a los grupos focales permitió refinar los ítemes con valores negativos.

Una posible causa de estas diferencias es el tamaño pequeño de las muestras, ya que los valores de dificultad,
particularmente para los ítemes extremadamente fáciles o difíciles, no pueden estimarse con igual precisión con
muestras pequeñas. Cabe señalar que la comparación latinoamericanos/no latinoamericanos en la mayoría de los
ítemes del Cuadro 4-23 era la que tenía asimismo el grupo focal más pequeño (latinoamericanos n = 455). En cambio,
la comparación varones/mujeres tenía la menor cantidad de ítemes en el Cuadro 4-23 y el grupo focal de mayor
tamaño (mujeres n = 2,275). Como consecuencia de ello, tal vez algunas de las diferencias del Cuadro 4-23 no sean
estadísticamente significativas si se toman en cuenta los errores estándar.

Los errores estándar del Cuadro 4-23 ayudan a evaluar la significación estadística de las diferencias. Para estimar
esta última, primero deben construirse bandas de confianza en torno de cada dificultad del grupo, sumando o restando
dos errores estándar a cada estimación. Si las bandas de confianza (de 95%) de los dos grupos se superponen, la
diferencia no es estadísticamente significativa en el nivel 0.05. El Cuadro 4-23 indica cuáles fueron las diferencias
estadísticamente significativas (las no marcadas con tres asteriscos): sólo cuatro ítemes de la comparación
latinoamericanos/no latinoamericanos y un ítem de la comparación blancos/no blancos satisfacen los criterios de
significación tanto estadística como práctica.

Como en estos análisis las escalas de los ítemes de las pruebas Vocabulario oral, Vocabulario sobre dibujos,
Analogías verbales, Información general, Ciencia, Estudios sociales y Humanidades fueron realizadas al mismo
tiempo, un factor de estas diferencias de dificultad de los ítemes podría ser la multidimensionalidad de la variable
pareada. En consecuencia, se realizaron análisis de seguimiento en los que se examinaron los ítemes en tres grupos
más pequeños y unidimensionales. El primer grupo estuvo compuesto de los ítemes de Vocabulario oral, Vocabulario
sobre dibujos y Analogías verbales. El segundo analizó los ítemes de Información general – ¿Dónde? e Información
general – ¿Qué?. El tercer grupo comprendió los ítemes de las subpruebas de Ciencia, Estudios sociales y
Humanidades. También en estos análisis los ítemes del Cuadro 4-23 exhibieron diferencias de dificultad absolutas de
4.6 o más. Por lo tanto, el funcionamiento diferencial de los ítemes que presenta el Cuadro 4-23 no parece vinculado
con la multidimensionalidad de la variable pareada.
Dificultad de los ítemes – Blancos

Diferencias de dificultad de los ítemes – Blancos/No blancos

Figura 4-8.
Diferencias entre los ítemes – Blancos/No blancos.

101
Validez
Cuadro 4-23.
WJ III ítemes con diferencia de dificultad prácticamente significativas, según tipo de comparación
ERRORES ESTANDAR DE
DIFICULTADES DEL ÍTEM
DIFICULTAD
Diferencia de
Grupo de dificultad del Grupo de
b
Comparación e ítema referencia Grupo focal ítem referencia Grupo focal
Latinoamericanos/No latinoamericanos
c
Vocabulario sobre dibujos 2 415.36 406.40 +8.96 1.53 5.23
Vocabulario sobre dibujos 11 484.89 489.70 -4.81 .43 1.08
c
Vocabulario sobre dibujos 20 576.70 588.05 -11.35 1.09 6.53
Analogías verbales 14 565.54 559.56 +5.98c .79 2.62
Información general – ¿Dónde? 2 446.89 455.51 -8.62 .81 1.73
c
Información general – ¿Qué? 3 444.53 449.87 -5.34 .86 1.93
Información general – ¿Qué? 5 452.29 457.64 -5.35 .72 1.68
c
Información general – ¿Qué? 6 443.23 448.86 -5.63 .89 1.98
c
Ciencia 3 426.01 431.11 -5.10 1.24 2.98
c
Estudios sociales 1 417.36 424.19 -6.83 1.52 3.47
c
Estudios sociales 2 421.36 416.23 +5.13 1.40 4.19
Estudios sociales 3 421.77 432.79 -11.02 1.38 2.84
c
Estudios sociales 4 435.55 441.32 -5.77 1.03 2.37
Blancos/No blancos
c
Vocabulario sobre dibujos 21 572.94 577.67 -4.73 1.00 2.68
c
Ciencia 2 403.15 389.17 +13.98 2.48 7.45
c
Ciencia 4 415.45 422.55 -7.10 1.80 2.60
Estudios sociales 2 418.38 427.32 -8.94 1.61 2.34
Varones/Mujeres
Ningún ítem
a
Las cifras de los ítemes de la prueba no corresponden a la prueba publicada.
b
(+) favorece al grupo focal; (-) perjudica al grupo focal
c
La diferencia de dificultad del ítem es menor que dos errores estándar del grupo focal.

La comisión creada para el estudio del sesgo ya había señalado el contenido del Ítem 11 (en Vocabulario sobre
dibujos en el Cuadro 4-23) dentro de los cinco ítemes estadística y prácticamente significativos, motivo por el cual se
lo eliminó del conjunto de ítemes. Además, algunos ítemes tenían un vocabulario que podía resultar poco corriente
para ciertos miembros del grupo focal. Por ejemplo, algunos miembros del grupo focal latinoamericano estaban
aprendiendo la lengua inglesa y tal vez no estuvieran familiarizados con el vocabulario que se juzgó corriente para las
personas cuya primera lengua era el inglés, fuesen o no latinoamericanas. Sin embargo, como los cuatro ítemes
restantes no fueron señalados por la comisión aludida, podrían resultar estadísticamente significativos a raíz del
aumento del índice de error que suele darse cuando se realizan tantas pruebas estadísticas (189 ítemes multiplicados
por tres tipos de comparaciones) con el mismo conjunto de datos.

La identificación de apenas unos pocos resultados DIF significativos en un gran conjunto de ítemes que
representan los dominios en los que es más probable que exista sesgo para ciertos grupos, junto a la selección y
descarte de ítemes por el grupo de especialistas, sugiere que los procesos y procedimientos ya descriptos en el
desarrollo de las pruebas de las WJ III reducen al mínimo el sesgo de las pruebas en función del género, la raza o el
hecho de que los sujetos sean o no latinoamericanos.

102
Validez
Análisis en el nivel de las pruebas: invariancia de la estructura de los factores en los
distintos grupos

Si bien el análisis DIF y otros tipos de análisis del sesgo de los ítemes son decisivos y muy informativos durante el
proceso de desarrollo de una prueba, la mayoría de las investigaciones y usos prácticos de las puntuaciones tienen
lugar en el nivel agregado, o sea, el de las puntuaciones de la prueba. De acuerdo con Waller, Thompson y Wenk
(2000), “lo más importante es saber si los ítemes de prueba dan puntuaciones sesgadas una vez que han sido agregados
para formar escalas” (pág. 142). Por otra parte, incluso las escalas que tal vez contengan ítemes sesgados pueden
constituir estimaciones no sesgadas de las habilidades de un individuo (Waller et al., 2000). Consecuentemente, es
importante saber en qué medida se considera que las pruebas de las WJ III miden las mismas construcciones teóricas
en diferentes grupos.

Partiendo de la sugerencia de Horn, McArdle y Mason (1983) según la cual la prueba más realista y recomendable
de la invariancia de la estructura de los factores es la “invariancia de la configuración” –pruebas que cargan los
mismos factores en distintos grupos– se realizaron tres CFAs de grupo múltiple (basados en el modelo de factores
amplios expuesto en la Figura 4-5) para grupos de varones/mujeres, blancos/no blancos y latinoamericanos/ no
latinoamericanos tomados de las muestras de estandarización (seis años o más). Se especificó el mismo modelo de
factores para ambos subgrupos (p. ej., blancos y no blancos), con iguales factores y la misma pauta en cuanto a las
cargas de factores. Un análisis de esta índole permite averiguar la invariancia de la configuración de varios grupos.

Utilizando para evaluar cada análisis el estadístico de ajuste RMSEA (con un intervalo de confianza de 90%), se
comprobó que el modelo de factores amplios de la WJ III constituía un buen ajuste, tanto en el análisis de
varones/mujeres (RMSEA = 0.39; 0.39 a 0.40), como en el de blancos/no blancos (RMSEA = 0.39; 0.38 a 0.39) y en el
de latinoamericanos/no latinoamericanos (RMSEA = 0.41; 0.41 a 0.42). Estos resultados concuerdan con la conclusión
de Carroll (1993), quien opina que el modelo teórico CHC es en gran medida invariante para el género y la raza. Estos
análisis señalan que la operacionalización de este modelo por parte de la WJ III refleja bien dicha invariancia de las
medidas y es, por ende, una estructura organizativa “imparcial” para todos los grupos evaluados. Estos modelos
multigrupales sugieren que las WJ III miden las mismas construcciones teóricas para varones y mujeres, para
participantes blancos y no blancos, y para los que son o no de origen latinoamericano. Por supuesto, es preciso realizar
otros análisis más restrictivos de la invariancia (que exijan, por ejemplo, que las cargas de factores de la prueba sea
igual en todos los grupos), los que brindarán información más pormenorizada acerca de ciertos aspectos específicos de
la invariancia (v. gr., la imparcialidad) de las pruebas de la WJ III en diferentes grupos.

Resumen del capítulo


La validez constituye el elemento más importante que debe tenerse en cuenta en el desarrollo, evaluación e interpretación
de una prueba. En este capítulo se han presentado diversas fuentes de evidencia de validez empíricamente sólidas a fin de
que los evaluadores las examinen. El propósito de esta información es que se la utilice junto con otras fuentes de
información sobre la validez, entre las cuales cabe mencionar la información disponible sobre la teoría CHC, el examen
del alcance y secuencia de los ítemes de cada prueba en el manual correspondiente, las descripciones del contenido de las
pruebas y compuestos tal como aparecen en el Capítulo 2 de los dos Manuales del examinador de la WJ III, y las
interpretaciones recomendadas en el Capítulo 5 de ambos Manuales (COG y APROV). En su conjunto, estas fuentes
pueden ayudar a los evaluadores profesionales a cerciorarse de la validez de la WJ III basándose en el contenido de las
pruebas, las pautas de desarrollo, la estructura interna y las relaciones con otras medidas.

La validez de contenido se abordó detallando un esquema fundamental de revisión del contenido de las pruebas y
compuestos según la teoría CHC. En la WJ III COG, se prestó particular atención al distingo, formalizado en la teoría
CHC, entre las habilidades amplias y las estrechas. Cada prueba de la WJ III COG fue diseñada como medida primaria
de una habilidad estrecha (o habilidad del Estrato I en la teoría CHC). A fin de asegurar que todos los ítemes de una
prueba midieran la misma habilidad o rasgo estrechos, durante el proceso de selección de los ítemes se aplicaron
criterios de ajuste rigurosos, basados en el modelo de Rasch. Cada compuesto de la WJ III COG fue diseñado con el

103
Validez
objeto de aumentar la amplitud de la medición proporcionando dos habilidades estrechas cualitativamente diferentes
subsumidas en una habilidad amplia, tal como las define la teoría CHC. También en la WJ III ACH se crearon a partir
de la teoría CHC, pero para aumentar la aplicabilidad de la WJ III ACH, al contenido de las pruebas y compuestos se
le sumaron las áreas curriculares y dominios más importantes según las leyes del país.

En las Figuras 4-1 a 4-4 se presentaron pautas pictográficas de crecimiento y declinación de las habilidades
amplias y las áreas de aprovechamiento académico a fin de establecer la singularidad de cada una de las puntuaciones
de factores primarios o compuestos. Estos diagramas representativos de secciones transversales muestran cambios
promedio en las puntuaciones que son congruentes con las pautas de crecimiento y declinación de las habilidades a lo
largo de la vida. También se dieron ejemplos de distintas pautas de crecimiento y declinación de las habilidades
estrechas, las cuales fundamentan la singularidad y validez de varias de éstas.

La evidencia de la estructura interna, o validez de la construcción teórica, puede sintetizarse muy bien en dos
modelos de análisis factoriales confirmatorios (CFA). La mejor manera de describir la amplitud de las habilidades
medidas por la WJ III COG es mediante un modelo que incluya a g y a siete factores amplios (Gc, Gf, Ga, Glr, Gv, Gs,
Gsm). Dicho modelo brindó el mejor ajuste entre los diversos modelos probados para la WJ III COG, según lo
demuestra el error cuadrático medio de aproximación (RMSEA) de los distintos modelos. Los demás modelos fueron
menos eficaces para establecer la relación entre toda la gama de habilidades medidas. Al analizar los datos de las
baterías cognitivas y de aprovechamiento combinadas, se comprobó que el ajuste más plausible era el de un modelo
expandido, que incluye a g y nueve factores amplios (a los anteriores se les suman Gq y Grw), además de la
especificación de varias habilidades estrechas. Este modelo expandido demuestra que la relación entre todas las
pruebas de la WJ III se ajusta a los estratos de habilidades estrechas, habilidades amplias y habilidad intelectual
general derivados de la teoría CHC. Con pocas excepciones, la estructura factorial CHC de las WJ III permanece sin
cambios a lo largo de toda la vida.

Los análisis factoriales confirmatorios (CFA) demostraron algo importante: casi todas las pruebas de la WJ III
COG cargan únicamente en un factor. Esta pauta indica que las pruebas cognitivas han reducido al mínimo la
influencia de la variancia irrelevante para la construcción teórica. Esta interpretación se ve ratificada por el examen de
las intercorrelaciones de los compuestos cognitivos que se presentan en el Apéndice E de este manual. Una baja
correlación entre compuestos indica que éstos miden habilidades disímiles. Las intercorrelaciones entre los compuestos
cognitivos van de bajas a moderadas (en el caso típico, de 0.20 a 0.60), lo cual evidencia que las habilidades cognitivas
amplias, aunque están relacionadas unas con otras, son diferentes entre sí. En contraste, la WJ III ACH es
factorialmente compleja, como lo demuestran las cargas de factores en el modelo CFA expandido, interpretación
corroborada por la pauta de intercorrelaciones entre las pruebas y compuestos de aprovechamiento de que dan cuenta
los Apéndices D y E. La amplitud típica de las correlaciones para los compuestos de aprovechamiento que no tienen
pruebas en común es 0.50 a 0.70. Muchas pruebas de aprovechamiento presentan cargas de factores cognitivos
secundarios en los CFA, las cuales tal vez indiquen influencias causales y pueden suministrar una información
importante para las futuras interpretaciones.

Varios estudios especiales mencionados en este capítulo señalan que las pruebas y compuestos de la WJ III se
correlacionan bien con otras pruebas que miden construcciones teóricas semejantes. Las puntuaciones de la Habilidad
intelectual general (GIA-Std y GIA-Ext) tuvieron congruentemente correlaciones del orden de 0.70 en todas las
muestras con las puntuaciones compuestas o de escala completa de la Wechsler Preschool and Primary Scales of
Intelligence–Revised (WPPSI-R) (Wechsler, 1989), la Wechsler Intelligence Scale for Children–Third Edition (WISC-III)
(Wechsler, 1991), la Differential Ability Scales (DAS) (Elliott, 1990), la Kaufman Adolescent and Adult Intelligence Test
(KAIT) (Kaufman y Kaufman, 1993) y la Stanford-Binet Intelligence Scales–Fourth Edition (SB-IV) (Thorndike et al.,
1986). Las correlaciones de esta amplitud (en el orden de 0.70) son similares a las que comunican otras publicaciones y
manuales de pruebas entre las puntuaciones compuestas o de escala completa de las demás baterías de inteligencia
importantes. Estas correlaciones permiten sostener que las puntuaciones del primer componente principal (g) de la GIA de
la WJ III constituyen medidas válidas de la habilidad intelectual general. Para ratificar su uso como medida de selección
de la habilidad intelectual, la puntuación de la Habilidad intelectual breve (GIA) tuvo correlaciones que fueron de 0.60 a
0.70 con la WPPSI-R, la WISC-III, la Wechsler Adult Intelligence Scale–Third Edition (WAIS-III) (Wechsler, 1997), la
DAS, el Das·Naglieri Cognitive Assessment System (CAS) (Naglieri y Das, 1997b) y las SB-IV.
104
Validez
Con respecto a la WJ III ACH, la pauta y magnitud de las correlaciones indican que miden destrezas y habilidades
académicas similares a las que miden otras pruebas de aprovechamiento. El Aprovechamiento total de la WJ III tuvo una
correlación de 0.65 con la puntuación compuesta de Aprovechamiento total de la Wechsler Individual Achievement Test
(WIAT) (Wechsler, 1992), y de 0.79 con la puntuación compuesta de la batería Kaufman Test of Educational
Achievement (KTEA) (Kaufman y Kaufman, 1985). Si se comparan las puntuaciones de un área académica particular, las
correlaciones son a menudo mayores. Por ejemplo, el compuesto de Comprensión de lectura de la WJ III tuvo una
correlación de 0.79 con Comprensión de lectura de la WIAT y de 0.81 con la puntuación compuesta para Lectura de la
KTEA.

Los estudiantes con discapacidades de aprendizaje obtuvieron resultados diferenciados en los compuestos
cognitivos y de aprovechamiento de la WJ III, lo cual apoya el uso de lasWJ III como instrumento para identificar a
este tipo de estudiantes. Algunas pruebas de las WJ III demostraron tener utilidad potencial como instrumentos de
diagnóstico, entre ellas Palabras incompletas, Formación de conceptos, Aprendizaje visual-auditivo y Rapidez en la
identificación de dibujos. Análogamente, algunas medidas cognitivas y de aprovechamiento probaron ser útiles para
identificar a los escolares con ADHD. Entre las pruebas particularmente sensibles a los efectos del ADHD están
Atención auditiva y Comprensión oral, y otras son promisorias en cuanto a suministrar información diagnóstica para la
identificación del ADHD, como Integración de sonidos, Memoria para palabras, Rapidez en la identificación de
dibujos y Planeamiento. Sin embargo, de ninguna de estas medidas puede afirmarse que sea una prueba decisiva para
clasificar a los alumnos con discapacidades de aprendizaje o con ADHD. En lugar de ello, la pauta general de los
aspectos positivos y débiles del individuo en lo que respecta a las habilidades amplias CHC y las áreas de
aprovechamiento (tal como se evidencia en un análisis de la discrepancia intra-individual) debe sumarse, para tomar
decisiones diagnósticas y de clasificación, a otros datos que no derivan de pruebas de este tipo.

Las pruebas de la WJ III se crearon con vistas a reducir al mínimo (dentro de lo factible) el sesgo de la prueba en
función del género, la raza o el origen latinoamericano de los sujetos. Como parte del desarrollo de los ítemes,
especialistas recomendados llevaron a cabo exámenes de sesgo y sensibilidad. En ellos se señalaron, para ser
posteriormente modificados o eliminados (sobre todo si posteriores análisis del sesgo estadístico corroboraban la
opinión del especialista), los ítemes potencialmente sensibles para las mujeres, las personas con discapacidades y las
minorías culturales y lingüísticas. A fin de abordar las cuestiones referidas a la imparcialidad de la WJ III para todos
los grupos raciales, étnicos y de género, se realizaron análisis estadísticos del funcionamiento de los ítemes en
comparaciones con los grupos relevantes, utilizando procedimientos congruentes con el modelo de Rasch. Se
estudiaron, en particular, las pruebas de Comprensión-conocimiento (Gc), debido a que la mayoría de los ítemes
señalados en los exámenes de sesgo y sensibilidad pertenecían a ellas. Subsiguientes análisis sólo pudieron identificar
unos pocos ítemes en los que había diferencias entre los grupos, de los cuales uno solo había sido previamente
señalado por los especialistas. Este ítem fue eliminado de la WJ III. (Los restantes tal vez resultaron estadísticamente
significativos debido sólo al índice de error que suele presentarse cuando se realizan muchas comparaciones
estadísticas con el mismo conjunto de datos.) Lo importante es saber si las puntuaciones generales de las pruebas están
sesgadas en contra de algún grupo en particular. Un estudio de la invariancia de la estructura de los factores, aplicado a
los grupos de varones/mujeres, blancos/no blancos y latinoamericanos/no latinoamericanos mencionados en este
capítulo, indica que las puntuaciones no están sesgadas en contra de los miembros de tales grupos. Vale decir, las
pruebas de la WJ III parecen medir las mismas construcciones teóricas cognitivas y de aprovechamiento en todos los
grupos raciales, étnicos y de género.

Los procedimientos seguidos para desarrollar y validar la WJ III han dado origen a un sistema de diagnóstico que
puede utilizarse con confianza en una variedad de situaciones. Durante todo el desarrollo y diseño de los estudios
conexos, se respetaron escrupulosamente las normas establecidas para las pruebas en Standards for Educational and
Psychological Testing (AERA et al., 1999), poniendo particular empeño en brindar los tipos principales de evidencia
de validez y de suministrar medidas imparciales e insesgadas de las habilidades y el aprovechamiento de cada
individuo.

105
Validez
Referencias bibliográficas
American Educational Research Association (AERA), American Psychological Association (APA) y National Council on Measurement in
Education (NCME). (1999). Standards for educational and psychological testing. Washington, DC: AERA.

Arbuckle, J. L. y Wothke, W. (1999). Amos 4.0. [Computer software and manual]. Chicago: SPSS, Inc.

Benson, J. (1998). Developing a strong program of construct validation: A test anxiety example. Educational Measurement: Issues and
Practice 17(1), 10-22.

Benson, J. y Hagtvet, K. A. (1996). The interplay between design, data analysis and theory in the measurement of coping. En M. Zeidner y
N. Endler (Eds.) Handbook of coping: Theory, research, applications (págs. 83-106). New York: John Wiley.

Boyle, G. J. (1991). Does item homogeneity indicate internal consistency of item redundancy in psychometric scales? Personality and
Individual Differences, 12(3), 291-294.

Bracken, B. A. y McCallum, R. S. (1998). Universal Nonverbal Intelligence Test. Itasca, IL: Riverside Publishing.

Brown, J. I., Fishco, V. V. y Hanna, G. S. (1993). Nelson-Denny Reading Test. Itasca, IL: Riverside Publishing.

Bynner, J. y Romney, D. M. (1985). LISREL for beginners. Canadian Psychology, 26, 43-49.

Carroll, J. B. (1983). Studying individual differences in cognitive abilities: Through and beyond factor analysis. En R. F. Dillon (Ed.),
Individual differences in cognition (Vol. 1, págs. 1-33). New York: Academic Press.

Carroll, J. B. (1993). Human cognitive abilities: A survey of factor-analytic studies. New York: Cambridge University Press.

Carroll, J. B. (1998). Human cognitive abilities: A critique. En J. J. McArdle y R. W. Woodcock (Eds.), Human cognitive abilities in theory
and practice (págs. 5-24). Mahwah, NJ: Lawrence Erlbaum.

Carrow-Woolfolk, E. (1995). Oral and Written Language Scales. Circle Pines, MN: American Guidance Service.

Cattell, R. B. (1941). Some theoretical issues in adult intelligence testing. Psychological Bulletin, 38, 592.

Cattell, R. B. (1943). The measurement of adult intelligence. Psychological Bulletin, 40, 153-193.

Cattell, R. B. (1950). Personality: A systematic theoretical and factual study. New York: McGraw-Hill.

Cattell, R. B. (1971). Abilities: Their structure, growth, and action. Boston: Houghton Mifflin.

Clark, L. A. y Watson, D. (1995). Constructing validity: Basic issues in objective scale development. Psychological Assessment, 7(3), 309-319.

Cronbach, L. (1971). Construct validation after thirty years. En R. Linn (Ed.), Intelligence: Measurement, theory, and public policy.
Proceedings of a Symposium in Honor of Lloyd G. Humphreys (págs. 147-167). Urbana, IL: University of Illinois Press.

Cronbach, L. J. y Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.

Das, J. P., Naglieri, J. A. y Kirby, J. R. (1994). Assessment of cognitive processes: The PASS theory of intelligence. Needham Heights, MA:
Allyn & Bacon.

Draba, R. E. (1977). The identification and interpretation of item bias (Research Memorandum No. 25). Chicago: Statistical Laboratory,
Department of Education, University of Chicago.

Elliott, C. D. (1990). Differential Ability Scales. San Antonio, TX: Harcourt Assessment, Inc.

Flanagan, D. P., McGrew, K. S. y Ortiz, S. O. (2000). The Wechsler Intelligence Scales and Gf-Gc theory: A contemporary approach to
interpretation. Boston: Allyn & Bacon.
107
Referencias bibliográficas
Greenberg, L. M. (1998). Test of Variables of Attention. Los Alamitos, CA: Universal Attention Disorders, Inc.

Hammill, D. D., Pearson, N. A. y Wiederholt, J. L. (1996). Comprehensive Test of Nonverbal Intelligence. Austin, TX: Pro-Ed.

Horn, J. L. (1965). Fluid and crystallized intelligence. Unpublished doctoral dissertation, University of Illinois, Urbana-Champaign.

Horn, J. L. (1985). Remodeling old models of intelligence. En B. B. Wolman (Ed.), Handbook of intelligence (págs. 267-300). New York:
John Wiley.

Horn, J. L. (1988). Thinking about human abilities. En J. R. Nesselroade y R. B. Cattell (Eds.), Handbook of multivariate experimental
psychology (2nd ed., págs. 645-865). New York: Academic Press.

Horn, J. L. (1989). Models for intelligence. En R. Linn (Ed.), Intelligence: Measurement, theory, and public policy (págs. 29-73). Urbana, IL:
University of Illinois Press.

Horn, J. L. (1991). Measurement of intellectual capabilities: A review of theory. En K. S. McGrew, J. K. Werder y R. W. Woodcock, WJ-R
technical manual (págs. 197-232). Itasca, IL: Riverside Publishing.

Horn, J. L., McArdle, J. y Mason, R. (1983). When is invariance not invariant: A practical scientist’s look at the ethereal concept of factor
invariance. The Southern Psychologist, 1(4), 179-188.

Horn, J. L. y Noll, J. (1997). Human cognitive capabilities: Gf-Gc theory. En D. P. Flanagan, J. L. Genshaft y P. L. Harrison (Eds.),
Contemporary intellectual assessment: Theories, tests, and issues (págs. 53-91). New York: Guilford Publications.

Horn, J. L. y Stankov, L. (1982). Auditory and visual factors of intelligence. Intelligence, 6, 165-185.

Jöreskog, K. G. y Sörbom, D. (1989). LISREL VII: A guide to the program and applications (2nd ed.). Chicago: SPSS, Inc.

Kaufman, A. S. (1994). Intelligent testing with the WISC-III. New York: John Wiley.

Kaufman, A. S. y Kaufman, N. L. (1985). Kaufman Test of Educational Achievement. Circle Pines, MN: American Guidance Service.

Kaufman, A. S. y Kaufman, N. L. (1993). Kaufman Adolescent and Adult Intelligence Test. Circle Pines, MN: American Guidance Service.

Keith, T. Z. (1997). Using confirmatory factor analysis to aid in understanding the constructs measured by intelligence tests. En D. P.
Flanagan, J. L. Genshaft y P. L. Harrison, Contemporary intellectual assessment: Theories, tests, and issues (págs. 373-402). New York:
Guilford Publications.

Keith, T. Z., Kranzler, J. H. y Flanagan, D. P. (2001). What does the cognitive assessment system (CAS) measure? Joint confirmatory factor
analysis of the CAS and the Woodcock-Johnson tests of cognitive ability (3rd Ed.). School Psychology Review, 30(1), 89-119.

Kranzler, J. H., Keith, T. Z. y Flanagan, D. P. (2000a). Independent examination of the factor structure of the cognitive assessment system (CAS):
Further evidence challenging the construct validity of the CAS. Journal of Psychoeducational Assessment, 18(2), 143-159.

Kranzler, J. H., Keith, T. Z. y Flanagan, D. P. (2000b, March). Joint confirmatory factor analysis of the Cognitive Assessment System.
Investigación presentada durante la conferencia anual de la National Association of School Psychologists, New Orleans, LA.

Linacre, J. M. y Wright, B. D. (1998). A user’s guide to WINSTEPS: Rasch-model computer programs. Chicago: MESA Press.

Loevinger, J. (1954). The attenuation paradox in test theory. Psychological Bulletin, 51(5), 493-504.

Loevinger, J. (1957). Objective tests as instruments of psychological theory. Psychological Reports, 3, 635-694.

MacCallum, R. C., Browne, M. W. y Sugawara, H. M. (1996). Power analysis and determination of sample size for covariance structure
modeling. Psychological Methods, 1(2), 130-149.

Mather, N., Vogel, S. A., Spodak, R. B. y McGrew, K. S. (1991). Use of the Woodcock-Johnson–Revised writing tests with students with
learning disabilities. Journal of Psychoeducational Assessment 9, 296-307.
108
Referencias bibliográficas
Mather, N. y Woodcock, R. W. (2001a). Examiner’s Manual. Woodcock-Johnson III Tests of Achievement. Itasca, IL: Riverside Publishing.

Mather, N. y Woodcock, R. W. (2001b). Examiner’s Manual. Woodcock-Johnson III Tests of Cognitive Abilities. Itasca, IL: Riverside
Publishing.

McGrew, K. S. (1997). Analysis of the major intelligence batteries according to a proposed comprehensive Gf-Gc framework. En D. P.
Flanagan, J. L. Genshaft y P. L. Harrison (Eds.), Contemporary intellectual assessment: Theories, tests, and issues (págs. 151-180). New
York: Guilford Publications.

McGrew, K. S. y Flanagan, D. P. (1998). The intelligence test desk reference (ITDR): Gf-Gc cross-battery assessment. Boston: Allyn &
Bacon.

McGrew, K. S., Werder, J. K. y Woodcock, R. W. (1991). WJ-R Technical Manual. Itasca, IL: Riverside Publishing.

Messick, S. (1989). Validity. En R. Linn (Ed.), Educational Measurement (3rd ed., págs. 13l-104). Washington, DC: American Council on
Education.

Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons’ responses and performances as scientific
inquiry into score meaning. American Psychologist, 50, 741-749.

Mosier, C. I. (1943). On the reliability of a weighted composite. Psychometrika, 8, 161-168.

Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005a). Batería III Woodcock-Muñoz. Itasca, IL: Riverside
Publishing.

Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005b). Batería III Woodcock-Muñoz: Pruebas de
aprovechamiento. Itasca, IL: Riverside Publishing.

Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S. y Mather, N. (2005c). Batería III Woodcock-Muñoz: Pruebas de habilidades
cognitivas. Itasca, IL: Riverside Publishing.

Muñoz-Sandoval, A. F., Woodcock, R. W., McGrew, K. S., Mather, N. y Schrank, F. A. (2005). Batería III Woodcock-Muñoz: Suplemento
diagnóstico para las pruebas de habilidades cognitivas. Itasca, IL: Riverside Publishing.

Naglieri, J. A. y Das, J. P. (1997a). Das • Naglieri Cognitive Assessment System: Interpretive handbook. Itasca, IL: Riverside Publishing.

Naglieri, J. A. y Das, J. P. (1997b). Cognitive Assessment System. Itasca, IL: Riverside Publishing.

Nunnally, J. S. (1978). Psychometric theory. New York: McGraw-Hill.

Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenhagen, Denmark: Danish Institute for Educational
Research.

Reynolds, C. R. y Kamphaus, R. W. (1992). Behavior Assessment System for Children. Circle Pines, MN: American Guidance Service.

Roid, G. H. y Miller, L. J. (1997). Leiter International Performance Scale–Revised. Wood Dale, IL: Stoelting.

Salvia, J. y Ysseldyke, J. E. (1988). Assessment in special and remedial education (5th ed.). Boston: Houghton Mifflin.

Scheuneman, J. D. y Subhiyah, R. G. (1998). Evidence for the validity of a Rasch model technique for identifying differential item
functioning. Journal of Outcome Measurement, 2(1), 33-42.

Schrank, F. A., McGrew, K. S., Ruef, M. L., Alvarado, C. G., Muñoz-Sandoval, A. F. y Woodcock., R. W. (2005). Overview and
technical supplement (Batería III Woodcock-Muñoz Assessment Service Bulletin No. 1). Itasca, IL: Riverside Publishing.

Schrank, F. A. y Woodcock, R. W. (2001). WJ III Compuscore and Profiles Program (Version 1.0) [Computer software].
Woodcock-Johnson III. Itasca, IL: Riverside Publishing.

Thorndike, R. L., Hagen, E. P. y Sattler, J. M. (1986). Standford-Binet Intelligence Scale–Fourth Edition. Itasca, IL: Riverside Publishing.
109
Referencias bibliográficas
Waller, N. G., Thompson, J. S. y Wenk, E. (2000). Using IRT to separate measurement bias from true group differences on homogeneous
and heterogeneous scales: An illustration using the MMPI. Psychological Methods, 5(1), 125-146.

Wechsler, D. (1989). Wechsler Preschool and Primary Scale of Intelligence–Revised. San Antonio, TX: Harcourt Assessment, Inc.

Wechsler, D. (1991). Wechsler Intelligence Scale for Children–Third Edition. San Antonio, TX: Harcourt Assessment, Inc.

Wechsler, D. (1992). Wechsler Individual Achievement Test. San Antonio, TX: Harcourt Assessment, Inc.

Wechsler, D. (1997). Wechsler Adult Intelligence Scale–Third Edition. San Antonio, TX: Harcourt Assessment, Inc.

Wilkinson, G. S. (1993). Wide Range Achievement Test–Third Edition. Wilmington, DE: Wide Range.

Woodcock, R. W. (1978). Development and standardization of the Woodcock-Johnson Psycho-Educational Battery. Itasca, IL: Riverside
Publishing.

Woodcock, R. W. (1987). Woodcock Reading Mastery Tests–Revised. Circle Pines, MN: American Guidance Service.

Woodcock, R. W. (1990). Theoretical foundations of the WJ-R measures of cognitive ability. Journal of Psychoeducational Assessment, 8,
231-258.

Woodcock, R. W. (1992, April). Rasch technology and test engineering. Trabajo presentado, por invitación, en la conferencia anual de la
American Educational Research Association, San Francisco.

Woodcock, R. W. (1994). Measures of fluid and crystallized theory of intelligence. En R. J. Sternberg (Ed.), Encyclopedia of human
intelligence (págs. 452-456). New York: Macmillan.

Woodcock, R. W. (1998). Extending Gf-Gc theory into practice. En J. J. McArdle y R. W. Woodcock (Eds.), Human cognitive abilities in
theory and practice (págs. 137-156). Mahwah, NJ: Lawrence Erlbaum.

Woodcock, R. W. (1999). What can Rasch-based scores convey about a person’s test performance? En S. E. Embretson y S. L. Hershberger
(Eds.), The new rules of measurement: What every psychologist and educator should know (págs. 105-128). Mahwah, NJ: Lawrence
Erlbaum.

Woodcock, R. W. y Dahl, M. N. (1971). A common scale for the measurement of person ability and test item difficulty (AGS Paper No. 10).
Circle Pines, MN: American Guidance Service.

Woodcock, R. W. y Johnson, M. B. (1977). Woodcock-Johnson Psycho-Educational Battery. Itasca, IL: Riverside Publishing.

Woodcock, R. W. y Johnson, M. B. (1989a). WJ-R Tests of Cognitive Ability. Itasca, IL: Riverside Publishing.

Woodcock, R. W. y Johnson, M. B. (1989b). Woodcock-Johnson Psycho-Educational Battery–Revised. Itasca, IL: Riverside Publishing.

Woodcock, R. W., McGrew, K. S. y Mather, N. (2001a). Woodcock-Johnson III. Itasca, IL: Riverside Publishing.

Woodcock, R. W., McGrew, K. S. y Mather, N. (2001b). Woodcock-Johnson III Tests of Achievement. Itasca, IL: Riverside Publishing.

Woodcock, R. W., McGrew, K. S. y Mather, N. (2001c). Woodcock-Johnson III Tests of Cognitive Abilities. Itasca, IL: Riverside Publishing.

Woodcock, R. W., McGrew, K. S., Mather, N. y Schrank, F. A. (2003). Woodcock-Johnson III Diagnostic Supplement to the Tests of
Cognitive Abilities. Itasca, IL: Riverside Publishing.

Wright, B. D. y Stone, M. H. (1979). Best test design. Chicago: MESA Press.

Zachary, R. A. y Gorsuch, R. L. (1985). Continuous norming: Implications for the WAIS-R. Journal of Clinical Psychology, 41(1), 86-94.

110
Referencias bibliográficas
Apéndice A
Cuadro A-1.
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Prueba 1: Comprensión n 127 95 367 341 352 336 379 452 487
verbal
M 430.57 440.36 450.28 458.87 471.17 481.57 491.64 497.09 502.73
SD 11.32 9.55 11.86 12.84 14.71 13.49 13.03 13.92 14.51
r11 0.93 0.88 0.89 0.89 0.90 0.90 0.88 0.89 0.90
SEM (W) 2.99 3.31 3.93 4.26 4.65 4.27 4.51 4.62 4.59
SEM (SS) 3.97 5.20 4.97 4.97 4.74 4.74 5.20 4.97 4.74
Prueba 2: Aprendizaje visual- n — 289 364 347 286 297 389 475 505
auditivo
M — 482.44 481.92 483.35 488.77 494.25 497.50 499.81 500.71
SD — 5.43 6.65 5.87 7.81 7.77 7.66 8.44 8.38
r11 — 0.87 0.85 0.85 0.86 0.88 0.86 0.84 0.86
SEM (W) — 1.98 2.55 2.30 2.88 2.68 2.87 3.36 3.15
SEM (SS) — 5.47 5.75 5.87 5.53 5.17 5.61 5.96 5.63
Prueba 3: Relaciones n 113 264 345 316 244 253 324 383 411
espaciales
M 440.54 457.98 474.17 482.98 490.01 493.21 497.59 499.14 500.87
SD 13.15 17.45 16.18 13.91 10.25 9.48 10.08 10.38 10.71
r11 0.75 0.92 0.92 0.90 0.83 0.78 0.81 0.81 0.81
SEM (W) 6.59 4.90 4.59 4.30 4.23 4.49 4.35 4.51 4.61
SEM (SS) 7.51 4.21 4.26 4.64 6.20 7.11 6.47 6.51 6.45
Prueba 4: Integración de n 150 255 376 351 424 440 432 475 501
sonidos
M 439.45 454.21 465.90 475.78 484.95 494.64 497.61 499.01 500.82
SD 15.45 17.91 17.24 14.31 12.75 12.42 13.11 13.20 13.56
r11 0.92 0.93 0.90 0.90 0.85 0.81 0.82 0.83 0.84
SEM (W) 4.37 4.75 5.34 4.56 4.85 5.36 5.54 5.42 5.40
SEM (SS) 4.24 3.98 4.65 4.78 5.71 6.47 6.34 6.15 5.98
Prueba 5: Formación de n 232 285 358 341 341 325 400 494 522
conceptos
M 427.88 437.98 449.25 460.44 473.31 483.52 493.29 497.14 502.54
SD 11.01 16.31 19.08 18.23 17.59 19.58 17.58 17.22 17.02
r11 0.75 0.86 0.94 0.94 0.94 0.96 0.94 0.95 0.94
SEM (W) 5.55 6.15 4.75 4.61 4.31 3.96 4.16 3.85 4.30
SEM (SS) 7.56 5.65 3.73 3.79 3.67 3.04 3.55 3.35 3.79
Prueba 6: Pareo visual n — 278 363 324 425 441 436 477 508
M — 348.47 378.24 410.85 436.87 458.16 480.76 493.72 505.90
SD — 30.82 31.72 29.20 21.96 20.90 20.02 20.80 20.67
r11 — 0.93 0.95 0.93 0.93 0.92 0.91 0.90 0.89
SEM (W) — 7.99 7.09 7.79 5.77 5.86 6.10 6.46 6.84
SEM (SS) — 3.89 3.35 4.00 3.94 4.21 4.57 4.66 4.97

111
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Prueba 1: Comprensión n 372 298 266 261 277 272 224 261 206
verbal
M 508.64 513.15 516.93 520.82 523.37 525.99 529.62 530.98 537.41
SD 15.24 15.15 16.77 17.01 17.15 16.51 14.99 16.56 16.65
r11 0.90 0.90 0.92 0.93 0.93 0.91 0.92 0.92 0.92
SEM (W) 4.82 4.79 4.74 4.50 4.54 4.95 4.24 4.69 4.71
SEM (SS) 4.74 4.74 4.24 3.97 3.97 4.50 4.24 4.24 4.24
Prueba 2: Aprendizaje visual- n 379 300 268 262 276 275 223 280 230
auditivo
M 502.22 504.37 504.36 507.15 506.39 507.42 508.20 509.12 511.54
SD 7.88 8.47 8.63 9.72 9.16 10.37 9.25 10.82 11.65
r11 0.85 0.86 0.85 0.87 0.89 0.86 0.86 0.85 0.90
SEM (W) 3.08 3.16 3.30 3.56 3.01 3.89 3.50 4.15 3.61
SEM (SS) 5.87 5.59 5.73 5.49 4.93 5.63 5.67 5.75 4.65
Prueba 3: Relaciones n 323 266 241 239 245 251 207 255 186
espaciales
M 502.92 504.04 505.99 506.38 508.93 510.43 510.83 508.75 510.54
SD 9.86 10.60 11.25 11.58 12.26 10.90 10.96 12.18 12.57
r11 0.75 0.80 0.79 0.81 0.81 0.71 0.68 0.81 0.80
SEM (W) 4.89 4.76 5.11 5.09 5.36 5.87 6.19 5.26 5.66
SEM (SS) 7.43 6.73 6.82 6.59 6.56 8.07 8.48 6.47 6.75
Prueba 4: Integración de n 370 300 266 259 277 273 225 282 234
sonidos
M 504.32 507.26 510.78 512.00 513.55 515.61 516.95 519.35 522.54
SD 14.22 15.45 15.79 16.92 16.86 16.75 17.69 16.20 17.74
r11 0.84 0.86 0.86 0.88 0.89 0.87 0.87 0.88 0.89
SEM (W) 5.69 5.77 5.81 5.77 5.67 6.09 6.38 5.60 5.96
SEM (SS) 6.00 5.61 5.52 5.12 5.04 5.46 5.41 5.19 5.04
Prueba 5: Formación de n 389 314 278 265 276 274 225 286 237
conceptos
M 506.46 509.81 510.70 515.21 515.93 519.29 518.58 518.86 521.93
SD 16.79 17.52 17.47 19.66 17.00 18.18 17.07 18.51 18.75
r11 0.94 0.93 0.94 0.95 0.94 0.95 0.95 0.94 0.94
SEM (W) 4.08 4.60 4.28 4.44 4.27 4.26 3.93 4.61 4.63
SEM (SS) 3.64 3.94 3.67 3.39 3.76 3.52 3.45 3.73 3.70
Prueba 6: Pareo visual n 378 301 267 265 291 281 227 288 238
M 515.27 522.09 531.86 536.28 541.18 550.27 549.07 555.05 555.85
SD 17.95 21.07 20.77 22.54 23.97 23.50 23.60 26.85 24.67
r11 0.84 0.88 0.86 0.87 0.89 0.87 0.88 0.90 0.88
SEM (W) 7.13 7.35 7.64 7.97 8.06 8.39 8.32 8.55 8.59
SEM (SS) 5.96 5.24 5.52 5.30 5.04 5.36 5.29 4.78 5.22

112
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Prueba 1: Comprensión n 973 403 374 229 148 165 141
verbal
M 538.58 538.09 542.57 547.75 542.09 535.72 526.27
SD 18.80 23.57 22.91 19.25 21.55 18.90 24.81
r11 0.93 0.95 0.96 0.95 0.96 0.96 0.95 0.92
SEM (W) 4.98 5.27 4.58 4.31 4.31 3.78 5.55
SEM (SS) 3.97 3.35 3.00 3.35 3.00 3.00 3.35
Prueba 2: Aprendizaje visual- n 1082 408 374 232 149 163 137
auditivo
M 510.73 507.32 503.74 502.87 498.62 490.64 489.71
SD 11.85 11.97 10.35 10.47 8.69 7.07 8.90
r11 0.91 0.93 0.91 0.92 0.91 0.86 0.89 0.86
SEM (W) 3.56 3.14 3.16 2.94 2.58 2.69 2.97
SEM (SS) 4.50 3.94 4.57 4.22 4.45 5.71 5.00
Prueba 3: Relaciones n 902 349 329 202 125 120 87
espaciales
M 511.49 510.02 506.72 505.16 503.78 497.77 495.66
SD 12.78 12.48 13.05 13.78 13.91 11.45 10.60
r11 0.80 0.80 0.87 0.87 0.90 0.81 0.85 0.81
SEM (W) 5.78 5.55 4.64 4.92 4.50 4.96 4.12
SEM (SS) 6.78 6.67 5.34 5.36 4.85 6.50 5.83
Prueba 4: Integración de n 1053 393 370 227 145 162 135
sonidos
M 523.91 519.19 511.98 508.21 497.27 485.75 474.85
SD 18.64 23.58 22.66 21.14 23.68 18.96 20.98
r11 0.91 0.93 0.94 0.93 0.94 0.92 0.90 0.89
SEM (W) 5.64 6.39 5.43 5.77 5.72 5.21 6.50
SEM (SS) 4.54 4.07 3.59 4.10 3.63 4.13 4.65
Prueba 5: Formación de n 1091 411 374 228 144 160 120
conceptos
M 523.01 516.46 511.96 510.75 504.00 490.57 479.74
SD 17.17 18.76 19.73 20.97 22.18 21.45 22.91
r11 0.94 0.95 0.95 0.96 0.96 0.97 0.96 0.94
SEM (W) 4.34 4.07 4.37 4.40 4.27 4.01 4.41
SEM (SS) 3.79 3.25 3.32 3.15 2.89 2.81 2.89
Prueba 6: Pareo visual n 1095 409 377 231 143 162 127
M 557.70 547.66 538.41 527.71 523.57 506.50 486.47
SD 28.91 27.38 31.39 31.61 25.58 29.08 31.54
r11 0.91 0.91 0.93 0.94 0.92 0.94 0.96 0.91
SEM (W) 8.90 8.35 8.52 7.61 7.41 6.93 6.41
SEM (SS) 4.62 4.57 4.07 3.61 4.34 3.58 3.05

113
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Prueba 7: Inversión de n — 67 323 320 267 278 351 400 445
números
M — 408.52 422.62 443.72 464.26 479.32 491.47 495.70 502.94
SD — 10.55 23.94 29.41 25.66 21.75 20.77 20.46 22.36
r11 — 0.92 0.93 0.92 0.89 0.84 0.86 0.84 0.88
SEM (W) — 2.89 6.31 8.31 8.46 8.74 7.85 8.10 7.86
SEM (SS) — 4.12 3.95 4.24 4.94 6.03 5.67 5.94 5.27
Prueba 8: Palabras n 235 276 349 338 413 428 414 446 477
incompletas
M 451.46 467.29 478.80 485.33 489.92 492.40 497.36 498.85 501.05
SD 15.89 15.92 12.28 9.84 9.50 9.84 8.84 9.28 9.12
r11 0.92 0.89 0.86 0.83 0.82 0.82 0.74 0.77 0.81
SEM (W) 4.48 5.18 4.63 4.02 4.03 4.20 4.55 4.49 4.02
SEM (SS) 4.23 4.88 5.66 6.13 6.36 6.40 7.72 7.25 6.61
Prueba 9: Memoria de trabajo n — — 134 188 290 288 312 358 373
auditiva
M — — 454.59 463.22 472.36 482.54 491.90 496.53 503.22
SD — — 14.17 17.47 16.78 15.54 16.40 14.48 15.60
r11 — — 0.96 0.93 0.92 0.90 0.90 0.89 0.87
SEM (W) — — 2.97 4.78 4.78 4.99 5.26 4.85 5.58
SEM (SS) — — 3.15 4.11 4.27 4.81 4.81 5.02 5.37
Prueba 10: Memoria diferida – n — — 33 77 155 195 219 206 259
Aprendizaje visual-auditivo
M — — 483.68 486.10 489.53 494.47 497.14 499.05 500.07
SD — — 6.96 5.87 7.48 7.29 7.16 7.64 7.34
r11 — — 0.97 0.95 0.93 0.95 0.91 0.92 0.92
SEM (W) — — 1.21 1.29 1.98 1.58 2.12 2.15 2.05
SEM (SS) — — 2.60 3.29 3.97 3.25 4.45 4.22 4.19
Batería extendida
Prueba 11: Información n 155 288 361 330 417 422 407 423 439
general
M 426.30 444.11 455.74 461.67 473.83 482.05 491.14 496.36 503.16
SD 18.07 17.14 16.59 14.74 13.09 13.47 13.12 13.33 13.55
r11 0.93 0.88 0.86 0.88 0.82 0.84 0.88 0.87 0.87
SEM (W) 4.82 5.94 6.21 5.11 5.56 5.39 4.54 4.81 4.88
SEM (SS) 4.00 5.20 5.61 5.20 6.36 6.00 5.20 5.41 5.41
Prueba 12: Fluidez de n 116 264 342 311 251 261 337 403 419
recuperación
M 475.38 480.95 486.60 490.79 494.07 496.29 498.64 500.05 501.25
SD 9.40 8.11 6.90 5.62 4.11 3.90 3.49 3.58 3.44
r11 0.70 0.76 0.82 0.81 0.79 0.80 0.78 0.81 0.81
SEM (W) 5.19 3.95 2.96 2.42 1.89 1.75 1.62 1.55 1.49
SEM (SS) 8.28 7.32 6.44 6.45 6.90 6.74 6.96 6.49 6.48
Prueba 13: Reconocimiento n 115 251 336 301 240 230 300 372 404
de dibujos
M 451.92 462.77 474.98 481.18 487.85 492.47 496.71 498.97 501.02
SD 19.49 19.25 15.75 14.46 12.39 10.65 10.35 10.25 11.14
r11 0.78 0.82 0.80 0.78 0.71 0.61 0.62 0.67 0.72
SEM (W) 9.20 8.20 7.11 6.84 6.64 6.68 6.38 5.89 5.89
SEM (SS) 7.08 6.39 6.77 7.09 8.04 9.41 9.24 8.62 7.93

114
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Prueba 7: Inversión de n 350 279 252 252 265 266 220 257 191
números
M 507.45 513.29 514.95 519.44 521.33 527.11 526.03 528.79 532.13
SD 20.74 21.63 22.86 22.34 22.84 21.94 21.89 24.38 25.16
r11 0.85 0.87 0.86 0.87 0.86 0.88 0.86 0.87 0.86
SEM (W) 8.12 7.93 8.60 7.99 8.43 7.51 8.10 8.77 9.49
SEM (SS) 5.87 5.50 5.64 5.37 5.54 5.14 5.55 5.39 5.66
Prueba 8: Palabras n 342 269 235 226 222 218 183 242 209
incompletas
M 502.69 502.19 504.29 504.38 506.99 508.24 507.68 508.97 509.54
SD 7.94 8.46 8.57 10.44 8.80 9.27 8.23 8.67 9.15
r11 0.75 0.77 0.78 0.77 0.77 0.80 0.76 0.77 0.73
SEM (W) 3.96 4.05 3.99 5.00 4.23 4.16 4.04 4.18 4.78
SEM (SS) 7.48 7.19 6.98 7.19 7.22 6.73 7.36 7.23 7.84
Prueba 9: Memoria de trabajo n 253 180 165 172 179 174 146 146 77
auditiva
M 507.29 511.72 515.97 520.14 519.14 525.19 524.83 526.14 532.79
SD 15.78 15.51 14.76 18.87 17.24 16.60 14.58 15.98 16.10
r11 0.86 0.84 0.84 0.90 0.86 0.89 0.80 0.86 0.88
SEM (W) 6.01 6.24 5.87 5.88 6.43 5.58 6.60 5.96 5.48
SEM (SS) 5.71 6.04 5.96 4.67 5.59 5.04 6.79 5.59 5.11
Prueba 10: Memoria diferida – n 230 205 193 193 200 191 163 164 97
Aprendizaje visual-auditivo
M 501.04 503.11 503.21 505.74 505.08 505.72 506.33 507.36 509.61
SD 7.02 7.54 7.61 8.95 8.02 8.93 7.83 9.15 9.48
r11 0.92 0.99 0.94 0.95 0.91 0.92 0.89 0.89 0.94
SEM (W) 1.97 0.79 1.90 2.06 2.42 2.49 2.57 3.01 2.34
SEM (SS) 4.22 1.57 3.73 3.45 4.52 4.19 4.93 4.93 3.70
Batería extendida
Prueba 11: Información n 342 274 252 248 264 262 217 256 187
general
M 510.62 515.25 519.31 522.55 526.80 530.23 533.05 533.58 539.21
SD 14.43 14.41 16.03 17.95 16.46 15.36 14.50 17.25 15.64
r11 0.87 0.89 0.89 0.92 0.91 0.89 0.88 0.91 0.90
SEM (W) 5.20 4.78 5.32 5.08 4.94 5.09 5.02 5.18 4.94
SEM (SS) 5.41 4.97 4.97 4.24 4.50 4.97 5.20 4.50 4.74
Prueba 12: Fluidez de n 322 262 243 243 253 249 210 248 180
recuperación
M 502.37 503.05 503.72 504.51 504.57 505.57 505.73 506.44 507.12
SD 3.17 3.42 3.65 3.65 3.38 3.39 3.31 3.40 3.16
r11 0.79 0.83 0.86 0.87 0.84 0.85 0.85 0.86 0.85
SEM (W) 1.44 1.41 1.39 1.34 1.35 1.30 1.29 1.27 1.24
SEM (SS) 6.81 6.19 5.70 5.48 5.98 5.76 5.87 5.61 5.87
Prueba 13: Reconocimiento n 291 219 202 201 214 204 170 171 115
de dibujos
M 501.93 503.61 504.77 507.53 508.89 507.80 509.16 510.79 512.27
SD 10.94 11.93 12.80 12.57 11.79 12.64 11.07 11.83 11.13
r11 0.70 0.75 0.76 0.77 0.71 0.78 0.72 0.74 0.71
SEM (W) 5.99 6.01 6.28 6.03 6.34 5.88 5.87 6.07 5.96
SEM (SS) 8.21 7.55 7.36 7.20 8.07 6.97 7.95 7.70 8.03

115
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Prueba 7: Inversión de n 909 351 329 201 131 121 92
números
M 535.63 524.94 524.20 522.84 519.38 515.01 503.29
SD 23.54 27.24 27.82 22.92 27.97 24.19 30.93
r11 0.87 0.90 0.91 0.86 0.92 0.90 0.91 0.87
SEM (W) 8.53 8.41 8.20 8.60 7.76 7.59 9.31
SEM (SS) 5.43 4.63 4.42 5.63 4.16 4.70 4.51
Prueba 8: Palabras n 942 335 316 199 130 146 127
incompletas
M 512.17 511.58 509.61 506.95 502.55 496.69 488.91
SD 10.39 13.81 12.38 13.71 12.96 12.63 15.80
r11 0.79 0.90 0.87 0.90 0.90 0.87 0.92 0.81
SEM (W) 4.72 4.43 4.50 4.40 4.18 4.63 4.40
SEM (SS) 6.81 4.81 5.46 4.81 4.83 5.50 4.17
Prueba 9: Memoria de trabajo n 500 229 220 128 79 73 41
auditiva
M 531.96 527.26 523.53 525.30 514.70 500.81 482.97
SD 15.82 17.06 17.89 17.36 19.49 19.86 23.52
r11 0.80 0.83 0.84 0.80 0.89 0.87 0.94 0.87
SEM (W) 7.13 7.03 7.07 7.78 6.49 7.10 5.57
SEM (SS) 6.76 6.18 5.92 6.72 5.00 5.37 3.55
Prueba 10: Memoria diferida – n 486 256 247 136 84 64 25
Aprendizaje visual-auditivo
M 508.47 505.20 502.13 499.77 494.82 486.19 482.90
SD 9.91 10.42 8.67 9.19 7.15 7.30 8.52
r11 0.92 0.94 0.94 0.92 0.97 0.98 0.97 0.94
SEM (W) 2.87 2.53 2.12 2.65 1.32 0.95 1.55
SEM (SS) 4.35 3.64 3.67 4.32 2.77 1.96 2.72
Batería extendida
Prueba 11: Información n 830 358 339 208 140 130 109
general
M 542.81 543.61 548.69 552.88 549.44 542.02 535.88
SD 19.27 25.47 25.61 20.87 25.40 24.00 25.79
r11 0.92 0.95 0.96 0.93 0.95 0.94 0.94 0.89
SEM (W) 5.45 5.69 5.12 5.52 5.68 5.88 6.32
SEM (SS) 4.24 3.35 3.00 3.97 3.35 3.67 3.67
Prueba 12: Fluidez de n 869 336 319 197 124 120 94
recuperación
M 507.40 506.91 506.40 506.43 504.53 502.72 498.65
SD 3.56 4.09 4.70 3.94 5.21 4.92 5.74
r11 0.88 0.91 0.92 0.90 0.93 0.91 0.91 0.85
SEM (W) 1.23 1.25 1.30 1.27 1.39 1.45 1.68
SEM (SS) 5.16 4.60 4.15 4.85 4.00 4.43 4.40
Prueba 13: Reconocimiento n 644 297 281 157 102 86 56
de dibujos
M 511.14 508.68 506.85 505.95 503.60 499.22 492.82
SD 12.97 12.24 12.98 13.30 12.59 11.12 15.23
r11 0.78 0.76 0.79 0.79 0.79 0.69 0.85 0.76
SEM (W) 6.04 5.93 5.96 6.11 5.78 6.17 5.95
SEM (SS) 6.98 7.27 6.89 6.89 6.88 8.33 5.86

116
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería extendida
Prueba 14: Atención auditiva n — 192 283 238 141 143 246 340 336
M — 463.04 472.97 480.33 490.45 495.54 497.65 498.48 500.00
SD — 16.21 13.92 12.80 10.11 9.19 7.72 7.94 9.29
r11 — 0.95 0.95 0.93 0.86 0.90 0.86 0.89 0.88
SEM (W) — 3.51 3.02 3.39 3.84 2.95 2.86 2.67 3.18
SEM (SS) — 3.25 3.25 3.97 5.69 4.81 5.55 5.04 5.13
Prueba 15: Análisis-Síntesis n — — 349 307 272 243 318 396 437
M — — 443.14 453.89 470.22 484.41 494.74 497.55 502.28
SD — — 12.97 18.17 18.87 17.13 14.18 14.45 14.73
r11 — — 0.89 0.94 0.93 0.92 0.89 0.89 0.88
SEM (W) — — 4.34 4.37 4.96 4.78 4.66 4.86 5.02
SEM (SS) — — 5.02 3.61 3.94 4.19 4.93 5.04 5.11
Prueba 16: Rapidez en la n — 167 258 298 408 416 416 461 487
decisión
M — 424.41 434.82 448.26 464.80 476.47 489.63 495.74 503.98
SD — 10.58 15.04 17.36 16.64 15.00 14.04 15.86 16.42
r11 — 0.79 0.78 0.89 0.90 0.88 0.84 0.86 0.86
SEM (W) — 4.85 6.99 5.75 5.22 5.23 5.58 5.84 6.15
SEM (SS) — 6.87 6.97 4.97 4.70 5.23 5.96 5.52 5.62
Prueba 17: Memoria para n 155 278 375 356 398 374 430 476 506
palabras
M 411.41 432.28 450.98 464.26 477.38 484.80 495.75 498.82 501.79
SD 28.23 25.17 25.65 23.58 22.71 21.70 21.19 19.63 23.15
r11 0.94 0.90 0.88 0.82 0.80 0.78 0.79 0.72 0.77
SEM (W) 6.99 8.06 8.87 10.03 10.04 10.26 9.68 10.37 11.01
SEM (SS) 3.72 4.80 5.19 6.38 6.63 7.09 6.86 7.93 7.13
Prueba 18: Rapidez en la n 206 273 340 270 255 291 328 374 402
identificación de dibujos
M 384.78 412.03 437.12 452.94 468.00 477.50 488.30 496.41 503.16
SD 18.66 26.03 27.37 27.18 26.88 29.71 24.18 23.27 28.78
r11 0.91 0.98 0.98 0.98 0.98 0.98 0.97 0.97 0.98
SEM (W) 5.48 3.59 3.54 3.70 3.82 4.00 4.17 4.34 4.48
SEM (SS) 4.41 2.07 1.94 2.04 2.13 2.02 2.59 2.80 2.34
Prueba 19: Planeamiento n — — 96 135 167 184 269 386 382
M — — 488.47 494.27 495.80 497.40 498.84 499.28 500.13
SD — — 8.02 5.47 4.86 4.97 3.54 3.44 2.76
r11 — — 0.64 0.63 0.67 0.75 0.69 0.77 0.75
SEM (W) — — 4.81 3.33 2.79 2.49 1.97 1.65 1.38
SEM (SS) — — 9.00 9.12 8.62 7.50 8.35 7.19 7.50
Prueba 20: Cancelación de n — — — 37 63 70 94 114 125
pares
M — — — 453.89 462.61 475.38 484.58 492.45 500.00
SD — — — 18.63 13.70 9.75 12.06 11.34 14.51
r11 — — — 0.83 0.81 0.82 0.79 0.70 0.65
SEM (W) — — — 7.73 6.01 4.16 5.48 6.19 8.63
SEM (SS) — — — 6.22 6.58 6.40 6.82 8.19 8.92

117
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería extendida
Prueba 14: Atención auditiva n 231 148 142 137 145 153 123 147 106
M 502.67 503.08 505.16 504.87 507.31 506.21 506.05 506.52 506.90
SD 7.86 7.37 6.98 8.19 7.16 6.46 6.08 7.01 6.97
r11 0.90 0.87 0.87 0.90 0.88 0.83 0.86 0.86 0.86
SEM (W) 2.49 2.71 2.56 2.65 2.52 2.66 2.31 2.67 2.57
SEM (SS) 4.74 5.51 5.51 4.86 5.28 6.18 5.69 5.71 5.53
Prueba 15: Análisis-Síntesis n 311 231 213 208 214 205 172 172 113
M 506.38 507.23 509.06 511.71 513.19 516.63 516.48 517.38 521.15
SD 15.22 15.09 14.94 16.58 15.31 15.28 13.86 14.69 12.64
r11 0.91 0.90 0.89 0.92 0.89 0.89 0.87 0.87 0.81
SEM (W) 4.69 4.77 4.86 4.63 5.10 5.04 4.98 5.28 5.45
SEM (SS) 4.62 4.74 4.88 4.19 5.00 4.95 5.39 5.39 6.47
Prueba 16: Rapidez en la n 359 271 250 252 279 268 216 258 192
decisión
M 509.50 515.95 520.35 523.52 528.45 531.33 532.40 535.63 535.00
SD 16.33 16.74 20.02 19.90 19.55 19.25 20.25 22.16 20.71
r11 0.85 0.84 0.88 0.88 0.86 0.85 0.87 0.88 0.87
SEM (W) 6.37 6.64 6.91 6.82 7.26 7.45 7.40 7.75 7.59
SEM (SS) 5.85 5.95 5.17 5.14 5.57 5.80 5.48 5.24 5.49
Prueba 17: Memoria para n 377 301 267 262 277 275 227 284 234
palabras
M 508.49 511.06 515.82 519.12 521.70 521.46 522.95 525.22 525.85
SD 21.62 23.50 24.24 26.08 22.52 22.36 23.93 24.52 24.46
r11 0.74 0.77 0.80 0.86 0.73 0.74 0.78 0.74 0.80
SEM (W) 11.09 11.37 10.76 9.79 11.71 11.37 11.29 12.38 10.81
SEM (SS) 7.69 7.26 6.66 5.63 7.80 7.63 7.08 7.58 6.63
Prueba 18: Rapidez en la n 271 198 183 186 207 191 150 181 124
identificación de dibujos
M 506.85 514.73 524.90 533.31 536.63 542.01 544.46 551.76 556.07
SD 24.31 29.68 30.65 31.24 32.29 31.69 33.42 33.88 32.02
r11 0.96 0.97 0.97 0.97 0.97 0.97 0.97 0.97 0.96
SEM (W) 4.56 4.73 5.12 5.22 5.24 5.57 5.50 5.98 6.16
SEM (SS) 2.81 2.39 2.50 2.51 2.43 2.63 2.47 2.65 2.89
Prueba 19: Planeamiento n 274 218 194 198 204 209 175 185 102
M 500.27 500.95 501.14 501.88 501.90 502.72 502.53 502.53 503.08
SD 2.75 3.66 2.63 2.99 2.79 4.02 2.80 4.11 2.80
r11 0.78 0.77 0.72 0.75 0.77 0.71 0.71 0.77 0.66
SEM (W) 1.29 1.76 1.39 1.49 1.34 2.16 1.51 1.97 1.63
SEM (SS) 7.04 7.19 7.94 7.50 7.19 8.08 8.08 7.19 8.75
Prueba 20: Cancelación de n 115 99 108 95 112 125 94 114 82
pares
M 504.75 510.51 518.12 519.08 527.56 529.66 531.16 531.97 533.56
SD 13.16 14.62 13.59 14.31 17.43 17.69 15.93 19.57 17.36
r11 0.83 0.80 0.79 0.80 0.81 0.80 0.80 0.82 0.81
SEM (W) 5.50 6.52 6.23 6.40 7.60 7.91 7.12 8.30 7.57
SEM (SS) 6.27 6.69 6.87 6.71 6.54 6.71 6.71 6.36 6.54

118
Apéndice A
Cuadro A-1. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de habilidades cognitivas de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería extendida
Prueba 14: Atención auditiva n 565 189 199 121 73 65 48
M 507.04 504.78 503.41 500.93 497.35 492.00 478.90
SD 7.90 7.94 8.90 8.08 12.92 9.87 13.41
r11 0.89 0.83 0.86 0.91 0.93 0.87 0.95 0.88
SEM (W) 2.57 3.27 3.30 2.43 3.47 3.53 3.06
SEM (SS) 4.88 6.18 5.55 4.50 4.02 5.37 3.42
Prueba 15: Análisis-Síntesis n 661 299 282 156 100 86 56
M 519.69 513.76 511.97 508.74 502.29 491.17 481.26
SD 15.70 20.12 19.58 19.71 20.43 21.48 22.14
r11 0.89 0.95 0.94 0.95 0.94 0.94 0.95 0.90
SEM (W) 5.16 4.59 4.91 4.58 5.00 5.13 4.85
SEM (SS) 4.93 3.42 3.76 3.49 3.67 3.58 3.29
Prueba 16: Rapidez en la n 933 359 344 208 126 121 81
decisión
M 532.89 526.26 520.75 512.22 502.72 491.01 473.60
SD 21.00 22.69 20.89 21.11 17.47 18.42 19.24
r11 0.87 0.90 0.89 0.90 0.88 0.90 0.92 0.87
SEM (W) 7.57 7.17 6.93 6.52 6.10 5.70 5.40
SEM (SS) 5.41 4.74 4.98 4.64 5.23 4.64 4.21
Prueba 17: Memoria para n 1070 401 373 229 151 162 143
palabras
M 524.64 515.24 513.80 511.03 506.18 500.70 483.98
SD 24.31 25.90 26.25 28.17 31.10 31.20 36.37
r11 0.78 0.84 0.85 0.85 0.88 0.87 0.89 0.80
SEM (W) 11.32 10.22 10.11 10.82 10.79 11.15 12.10
SEM (SS) 6.98 5.92 5.78 5.76 5.20 5.36 4.99
Prueba 18: Rapidez en la n 633 243 240 133 83 79 44
identificación de dibujos
M 554.73 555.91 553.40 547.02 533.89 518.51 494.13
SD 33.58 35.50 38.07 31.46 42.55 33.19 34.05
r11 0.97 0.97 0.97 0.97 0.98 0.98 0.98 0.97
SEM (W) 5.98 6.24 6.13 5.51 5.51 4.81 4.35
SEM (SS) 2.67 2.64 2.42 2.63 1.94 2.17 1.91
Prueba 19: Planeamiento n 514 264 237 153 97 94 55
M 503.14 502.83 503.45 502.48 502.29 501.28 500.38
SD 3.69 3.54 4.48 4.74 2.61 2.40 4.08
r11 0.74 0.75 0.71 0.82 0.68 0.74 0.84 0.74
SEM (W) 1.88 1.77 2.41 2.01 1.48 1.22 1.63
SEM (SS) 7.65 7.50 8.08 6.36 8.49 7.65 6.00
Prueba 20: Cancelación de n 283 86 78 74 37 40 26
pares
M 529.38 529.21 518.74 506.83 504.58 494.64 482.72
SD 21.04 20.67 14.71 22.17 14.63 15.23 22.15
r11 0.80 0.83 0.85 0.90 0.61 0.88 0.85 0.81
SEM (W) 9.50 8.52 5.70 7.09 9.08 5.36 8.49
SEM (SS) 6.77 6.18 5.81 4.80 9.31 5.28 5.75

119
Apéndice A
Cuadro A-2.
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Prueba 1: Identificación de n 45 139 333 335 319 373 422 420 478
letras y palabras
M 292.81 308.97 327.23 353.54 395.36 445.36 477.11 494.58 504.70
SD 23.65 21.53 27.54 34.18 37.67 38.90 34.49 29.39 28.44
r11 0.98 0.97 0.98 0.99 0.98 0.97 0.96 0.94 0.93
SEM (W) 2.96 3.54 3.69 4.12 5.79 6.54 6.53 7.47 7.69
SEM (SS) 1.88 2.47 2.01 1.81 2.31 2.52 2.84 3.81 4.06
Prueba 2: Fluidez en la n — — — — 93 183 209 223 241
lectura
M — — — — 441.12 459.01 480.20 494.19 508.01
SD — — — — 22.33 23.56 24.15 22.45 28.98
r11 — — — — 0.89 0.89 0.89 0.89 0.90
SEM (W) — — — — 7.46 7.86 7.92 7.38 9.38
SEM (SS) — — — — 5.01 5.01 4.92 4.93 4.85
Prueba 3: Rememoración de n 187 255 324 322 306 312 379 446 489
cuentos
M 474.23 480.77 484.77 488.07 492.91 493.96 496.98 499.84 502.31
SD 4.59 6.84 7.25 6.77 6.10 6.61 6.97 5.66 5.24
r11 0.56 0.75 0.79 0.77 0.81 0.83 0.79 0.87 0.88
SEM (W) 3.05 3.45 3.32 3.28 2.66 2.71 3.19 2.06 1.83
SEM (SS) 9.96 7.57 6.87 7.27 6.54 6.15 6.86 5.47 5.25
Prueba 4: Comprensión de n 156 121 116 125 51 80 73 93 105
indicaciones
M 408.47 426.40 440.95 454.78 476.41 483.45 490.84 499.92 500.07
SD 20.48 17.86 15.28 15.49 15.41 15.19 15.15 11.64 12.91
r11 0.83 0.85 0.83 0.87 0.85 0.85 0.88 0.80 0.82
SEM (W) 8.46 6.95 6.39 5.63 5.93 5.98 5.32 5.24 5.50
SEM (SS) 6.20 5.83 6.27 5.45 5.78 5.90 5.27 6.75 6.39
Prueba 5: Cálculo n — — — 204 295 338 383 419 477
M — — — 421.01 443.51 464.76 481.71 494.46 504.82
SD — — — 20.47 21.64 18.12 16.75 17.18 15.98
r11 — — — 0.97 0.96 0.87 0.80 0.86 0.85
SEM (W) — — — 3.40 4.34 6.63 7.56 6.48 6.17
SEM (SS) — — — 2.49 3.01 5.49 6.77 5.66 5.79
Prueba 6: Fluidez en n — — — — — 324 376 416 468
matemáticas
M — — — — — 487.80 493.69 497.70 502.02
SD — — — — — 5.47 6.17 6.95 8.43
r11 — — — — — 0.66 0.77 0.81 0.87
SEM (W) — — — — — 3.20 2.97 3.00 3.05
SEM (SS) — — — — — 8.78 7.21 6.47 5.44

120
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Prueba 1: Identificación de n 392 343 314 299 322 310 246 277 282
letras y palabras
M 514.67 523.16 528.45 533.71 538.31 547.31 546.90 550.94 559.42
SD 24.48 25.84 24.48 27.77 24.44 23.19 24.83 25.51 24.63
r11 0.90 0.90 0.89 0.95 0.90 0.88 0.91 0.89 0.90
SEM (W) 7.63 8.00 8.24 6.14 7.67 8.12 7.53 8.57 7.95
SEM (SS) 4.68 4.64 5.05 3.31 4.71 5.25 4.55 5.04 4.84
Prueba 2: Fluidez en la n 217 215 191 176 175 179 154 173 136
lectura
M 516.00 524.42 541.27 553.49 562.91 585.21 580.19 587.06 600.73
SD 31.26 37.76 42.34 51.08 50.28 54.48 61.00 61.51 67.68
r11 0.87 0.90 0.90 0.94 0.90 0.90 0.94 0.90 0.90
SEM (W) 11.27 12.12 13.55 12.51 16.04 17.37 14.94 19.58 21.52
SEM (SS) 5.41 4.82 4.80 3.67 4.79 4.78 3.67 4.77 4.77
Prueba 3: Rememoración de n 384 331 307 285 303 297 242 271 198
cuentos
M 501.89 502.49 502.58 504.24 504.97 504.99 505.44 505.78 507.73
SD 5.91 5.32 6.14 5.23 5.87 6.15 5.88 5.44 6.29
r11 0.88 0.87 0.89 0.86 0.88 0.88 0.87 0.88 0.87
SEM (W) 2.07 1.95 2.05 1.95 2.00 2.12 2.13 1.91 2.27
SEM (SS) 5.25 5.51 5.01 5.60 5.12 5.18 5.44 5.25 5.41
Prueba 4: Comprensión de n 94 102 94 70 73 74 59 89 83
indicaciones
M 502.87 505.85 508.80 508.98 512.81 513.62 514.72 514.84 515.63
SD 10.03 10.67 11.23 16.49 12.08 9.83 11.21 13.62 13.95
r11 0.73 0.77 0.74 0.85 0.73 0.62 0.62 0.72 0.73
SEM (W) 5.23 5.07 5.69 6.34 6.27 6.07 6.93 7.23 7.23
SEM (SS) 7.82 7.13 7.60 5.76 7.79 9.27 9.27 7.96 7.77
Prueba 5: Cálculo n 391 341 313 288 306 306 246 277 197
M 512.85 519.30 526.45 530.17 531.27 536.74 536.09 539.48 543.45
SD 17.11 17.02 16.94 15.91 18.61 19.11 19.01 19.48 19.88
r11 0.87 0.84 0.86 0.83 0.84 0.83 0.85 0.82 0.87
SEM (W) 6.07 6.71 6.38 6.54 7.38 7.77 7.46 8.16 7.26
SEM (SS) 5.32 5.91 5.65 6.16 5.95 6.10 5.89 6.29 5.48
Prueba 6: Fluidez en n 384 338 304 283 305 302 241 273 187
matemáticas
M 506.19 508.98 512.49 515.94 518.20 522.44 522.15 523.88 525.74
SD 9.07 9.46 10.91 10.81 10.74 11.71 11.27 11.08 11.81
r11 0.88 0.89 0.91 0.90 0.89 0.91 0.90 0.89 0.89
SEM (W) 3.12 3.17 3.30 3.45 3.48 3.61 3.60 3.67 3.94
SEM (SS) 5.15 5.03 4.54 4.79 4.86 4.62 4.79 4.97 5.01

121
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Prueba 1: Identificación de n 1089 401 373 224 146 165 139
letras y palabras
M 564.35 556.05 558.43 561.80 552.32 554.12 546.76
SD 26.36 34.74 39.17 32.52 47.99 28.77 37.91
r11 0.91 0.94 0.97 0.93 0.98 0.92 0.96 0.94
SEM (W) 7.94 8.27 6.98 8.61 6.92 8.36 7.29
SEM (SS) 4.52 3.57 2.67 3.97 2.16 4.36 2.88
Prueba 2: Fluidez en la n 572 237 217 139 82 89 85
lectura
M 605.28 584.74 587.99 573.48 577.49 556.37 521.55
SD 66.06 66.34 70.53 63.41 63.56 50.67 42.44
r11 0.91 0.90 0.88 0.90 0.93 0.92 0.90 0.90
SEM (W) 19.82 21.10 24.43 20.17 16.82 14.33 13.57
SEM (SS) 4.50 4.77 5.20 4.77 3.97 4.24 4.80
Prueba 3: Rememoración de n 941 384 357 221 141 159 128
cuentos
M 507.44 505.13 503.96 503.05 500.23 498.58 496.40
SD 6.48 6.64 6.47 6.86 5.33 5.19 6.35
r11 0.88 0.90 0.89 0.90 0.89 0.84 0.86 0.87
SEM (W) 2.25 2.12 2.11 2.17 1.80 2.11 2.40
SEM (SS) 5.21 4.79 4.89 4.73 5.06 6.09 5.66
Prueba 4: Comprensión de n 267 76 81 56 26 55 60
indicaciones
M 514.85 501.65 499.87 502.72 502.72 488.57 485.01
SD 15.01 21.78 21.57 17.03 15.09 21.21 17.45
r11 0.77 0.91 0.92 0.88 0.85 0.93 0.90 0.83
SEM (W) 7.19 6.50 6.26 5.91 5.77 5.54 5.56
SEM (SS) 7.18 4.48 4.36 5.20 5.74 3.92 4.78
Prueba 5: Cálculo n 900 403 369 224 141 162 127
M 542.85 530.35 532.61 528.13 526.22 515.95 513.16
SD 20.90 20.17 22.10 19.93 17.21 20.63 22.91
r11 0.85 0.89 0.90 0.89 0.81 0.93 0.93 0.86
SEM (W) 8.17 6.76 6.94 6.46 7.41 5.60 6.02
SEM (SS) 5.86 5.03 4.71 4.86 6.46 4.07 3.94
Prueba 6: Fluidez en n 857 388 359 221 139 155 117
matemáticas
M 528.58 523.46 524.44 517.97 514.99 509.54 503.58
SD 12.06 13.05 13.29 12.17 10.85 11.08 9.81
r11 0.88 0.92 0.92 0.92 0.91 0.92 0.90 0.90
SEM (W) 4.10 3.76 3.72 3.47 3.28 3.19 3.10
SEM (SS) 5.10 4.33 4.20 4.27 4.54 4.31 4.74

122
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Prueba 7: Ortografía n 220 262 328 337 298 337 382 419 478
M 307.40 339.46 376.54 405.83 436.45 468.16 486.34 495.49 502.60
SD 24.27 29.06 32.83 28.06 27.59 23.77 19.84 19.13 18.92
r11 0.82 0.77 0.90 0.90 0.92 0.91 0.88 0.89 0.89
SEM (W) 10.36 13.84 10.50 8.75 7.62 7.19 6.76 6.40 6.29
SEM (SS) 6.40 7.14 4.80 4.68 4.14 4.54 5.11 5.02 4.99
Prueba 8: Fluidez en la n — — — — — 274 355 373 449
escritura
M — — — — — 473.52 486.85 496.00 503.27
SD — — — — — 12.63 14.82 16.08 16.76
r11 — — — — — 0.78 0.89 0.90 0.90
SEM (W) — — — — — 5.95 5.02 5.05 5.22
SEM (SS) — — — — — 7.07 5.08 4.71 4.67
Prueba 9: Comprensión de n 150 205 277 323 318 345 383 419 477
textos
M 368.04 386.32 396.16 404.39 437.08 469.80 489.15 497.02 502.56
SD 21.75 28.21 26.08 29.13 30.42 27.38 21.89 17.96 16.99
r11 0.91 0.95 0.94 0.96 0.96 0.96 0.92 0.91 0.89
SEM (W) 6.38 6.36 6.25 5.81 5.84 5.70 6.38 5.25 5.55
SEM (SS) 4.40 3.38 3.59 2.99 2.88 3.12 4.37 4.38 4.90
Prueba 10: Problemas n 236 272 337 339 297 338 382 419 475
aplicados
M 349.59 375.14 399.16 415.53 440.79 462.01 483.72 493.94 505.32
SD 24.60 26.80 25.53 24.13 19.22 22.85 22.33 24.37 22.50
r11 0.92 0.92 0.94 0.92 0.88 0.91 0.93 0.93 0.91
SEM (W) 7.00 7.65 6.43 6.64 6.76 6.85 6.06 6.64 6.69
SEM (SS) 4.27 4.28 3.78 4.12 5.28 4.49 4.07 4.08 4.46
Prueba 11: Muestras de n — — — 188 292 335 383 418 473
redacción
M — — — 450.18 467.94 486.76 495.93 499.10 500.96
SD — — — 20.99 20.30 12.53 10.39 7.92 7.29
r11 — — — 0.70 0.88 0.89 0.88 0.84 0.84
SEM (W) — — — 11.50 6.98 4.08 3.66 3.19 2.93
SEM (SS) — — — 8.22 5.15 4.88 5.28 6.03 6.03
Prueba 12: Memoria diferida – n — 60 85 52 61 61 76 91 96
Rememoración de cuentos
M — 482.03 484.78 487.99 492.21 493.00 495.20 497.93 500.52
SD — 5.98 7.01 5.90 5.98 6.49 6.53 5.06 4.53
r11 — 0.60 0.61 0.69 0.78 0.75 0.76 0.74 0.80
SEM (W) — 3.80 4.39 3.26 2.80 3.26 3.18 2.57 2.02
SEM (SS) — 9.53 9.39 8.30 7.02 7.54 7.32 7.62 6.68

123
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Prueba 7: Ortografía n 391 341 313 290 306 305 242 268 196
M 507.55 514.32 519.82 522.37 526.26 532.35 531.50 535.53 541.93
SD 17.36 18.65 18.88 19.66 20.42 18.84 19.69 19.08 19.11
r11 0.87 0.89 0.89 0.92 0.90 0.87 0.89 0.89 0.88
SEM (W) 6.29 6.24 6.30 5.67 6.41 6.69 6.51 6.44 6.70
SEM (SS) 5.44 5.02 5.01 4.33 4.71 5.33 4.96 5.06 5.26
Prueba 8: Fluidez en la n 371 326 305 276 295 299 243 272 195
escritura
M 510.52 516.85 522.97 526.94 531.39 533.88 534.61 536.11 540.57
SD 16.34 16.72 17.67 18.14 17.92 18.16 18.85 18.09 17.52
r11 0.89 0.88 0.87 0.86 0.81 0.84 0.85 0.81 0.81
SEM (W) 5.54 5.81 6.28 6.77 7.82 7.24 7.23 7.94 7.55
SEM (SS) 5.08 5.21 5.33 5.60 6.54 5.98 5.75 6.58 6.46
Prueba 9: Comprensión de n 392 343 315 298 322 310 245 277 282
textos
M 506.70 511.78 515.09 517.00 519.32 523.18 523.86 524.90 527.22
SD 14.66 14.63 15.57 16.36 15.81 15.21 14.30 15.99 15.73
r11 0.83 0.80 0.83 0.86 0.79 0.73 0.78 0.78 0.75
SEM (W) 5.97 6.46 6.46 6.16 7.20 7.95 6.70 7.44 7.87
SEM (SS) 6.11 6.63 6.23 5.65 6.84 7.84 7.02 6.98 7.50
Prueba 10: Problemas n 389 341 314 292 307 307 246 300 227
aplicados
M 514.44 520.39 522.34 529.47 532.31 541.35 541.59 542.03 548.18
SD 20.73 22.77 24.95 25.29 26.06 27.20 24.73 26.22 25.07
r11 0.91 0.92 0.92 0.95 0.93 0.92 0.93 0.93 0.92
SEM (W) 6.30 6.40 6.88 5.86 7.05 7.50 6.52 7.02 6.96
SEM (SS) 4.56 4.22 4.14 3.48 4.06 4.14 3.95 4.02 4.16
Prueba 11: Muestras de n 389 341 313 286 306 301 246 274 193
redacción
M 503.41 505.16 506.67 508.45 508.75 510.82 510.54 511.64 513.43
SD 6.75 7.02 7.41 7.07 7.06 6.70 6.33 6.59 6.58
r11 0.84 0.86 0.87 0.84 0.87 0.84 0.83 0.85 0.83
SEM (W) 2.71 2.67 2.66 2.79 2.53 2.68 2.59 2.53 2.72
SEM (SS) 6.02 5.71 5.39 5.91 5.38 6.01 6.13 5.77 6.19
Prueba 12: Memoria diferida – n 97 89 99 96 107 120 92 97 58
Rememoración de cuentos
M 499.37 500.39 501.03 501.46 502.58 502.59 502.41 503.64 504.90
SD 5.38 5.21 5.50 4.93 5.55 5.75 5.74 4.92 5.54
r11 0.79 0.81 0.83 0.83 0.87 0.88 0.84 0.84 0.88
SEM (W) 2.49 2.26 2.28 2.01 1.99 2.02 2.28 1.99 1.90
SEM (SS) 6.93 6.51 6.22 6.12 5.39 5.28 5.97 6.07 5.16

124
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Prueba 7: Ortografía n 961 394 365 222 140 163 126
M 545.68 535.62 539.71 538.47 534.64 530.45 525.61
SD 22.09 28.25 32.22 28.38 28.65 25.20 27.35
r11 0.91 0.95 0.95 0.95 0.95 0.94 0.95 0.90
SEM (W) 6.66 6.40 7.03 6.53 6.51 6.25 6.37
SEM (SS) 4.52 3.40 3.27 3.45 3.41 3.72 3.49
Prueba 8: Fluidez en la n 963 387 349 214 135 142 100
escritura
M 537.15 529.49 527.08 521.92 519.30 507.37 498.36
SD 19.16 22.19 23.11 22.87 22.97 20.70 22.24
r11 0.86 0.90 0.92 0.92 0.92 0.92 0.93 0.88
SEM (W) 7.19 6.85 6.57 6.39 6.51 5.70 5.72
SEM (SS) 5.63 4.63 4.26 4.19 4.25 4.13 3.86
Prueba 9: Comprensión de n 1088 403 371 224 147 165 135
textos
M 527.28 525.07 527.08 528.46 522.71 519.96 511.28
SD 17.05 21.28 22.37 19.33 23.64 19.21 24.30
r11 0.75 0.88 0.91 0.82 0.91 0.83 0.92 0.88
SEM (W) 8.45 7.26 6.74 8.18 6.98 7.82 6.66
SEM (SS) 7.44 5.12 4.52 6.34 4.43 6.11 4.11
Prueba 10: Problemas n 1007 405 371 225 145 163 124
aplicados
M 548.21 541.72 544.00 545.70 540.94 532.56 523.99
SD 25.69 26.41 27.12 25.23 28.34 28.24 33.48
r11 0.93 0.94 0.94 0.95 0.96 0.95 0.96 0.93
SEM (W) 7.02 6.53 6.44 5.88 5.43 6.38 6.52
SEM (SS) 4.10 3.71 3.56 3.49 2.87 3.39 2.92
Prueba 11: Muestras de n 877 393 364 214 135 155 113
redacción
M 513.22 510.38 510.87 511.57 509.32 506.41 502.86
SD 7.56 9.96 9.88 8.08 9.16 8.06 11.20
r11 0.87 0.93 0.93 0.89 0.91 0.89 0.94 0.87
SEM (W) 2.73 2.69 2.66 2.65 2.67 2.73 2.79
SEM (SS) 5.42 4.04 4.04 4.92 4.38 5.08 3.74
Prueba 12: Memoria diferida – n 227 85 77 72 41 41 38
Rememoración de cuentos
M 504.49 502.17 500.83 499.07 496.38 493.93 490.76
SD 5.97 5.82 6.17 6.79 5.47 6.15 6.34
r11 0.87 0.88 0.82 0.81 0.75 0.51 0.41 0.81
SEM (W) 2.15 2.01 2.59 2.97 2.73 4.29 4.87
SEM (SS) 5.41 5.19 6.29 6.56 7.49 10.46 11.53

125
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería extendida
Prueba 13: Análisis de n — — 296 322 372 401 394 380 432
palabras
M — — 373.71 396.15 436.31 474.51 490.81 497.64 502.06
SD — — 24.10 30.60 35.62 29.50 25.98 23.49 23.33
r11 — — 0.93 0.94 0.94 0.92 0.92 0.89 0.88
SEM (W) — — 6.48 7.18 8.60 8.40 7.50 7.87 8.04
SEM (SS) — — 4.04 3.52 3.62 4.27 4.33 5.03 5.17
Prueba 14: Vocabulario sobre n 248 308 391 358 358 337 381 452 491
dibujos
M 418.59 445.34 460.63 468.21 478.45 484.95 492.16 496.77 502.86
SD 25.17 19.36 17.46 16.70 15.51 14.99 16.21 16.51 18.09
r11 0.93 0.84 0.81 0.76 0.70 0.71 0.73 0.77 0.80
SEM (W) 6.88 7.85 7.70 8.20 8.43 8.11 8.41 7.95 8.15
SEM (SS) 4.10 6.08 6.61 7.36 8.15 8.12 7.78 7.23 6.76
Prueba 15: Comprensión oral n 235 258 323 331 303 313 356 382 437
M 432.79 443.67 451.05 459.77 472.12 482.81 491.72 497.00 503.79
SD 14.27 16.28 16.81 16.35 16.20 16.35 17.74 17.72 17.14
r 0.91 0.90 0.88 0.85 0.82 0.78 0.83 0.80 0.78
11
SEM (W) 4.17 5.26 5.74 6.38 6.81 7.59 7.34 8.02 8.12
SEM (SS) 4.38 4.85 5.12 5.85 6.31 6.96 6.20 6.79 7.11
Prueba 16: Corrección de n — — — — 206 251 291 312 374
textos
M — — — — 434.91 459.81 482.45 493.22 507.42
SD — — — — 15.62 25.21 23.57 21.26 23.86
r11 — — — — 0.96 0.96 0.94 0.90 0.94
SEM (W) — — — — 3.16 4.72 5.98 6.61 5.62
SEM (SS) — — — — 3.03 2.81 3.81 4.67 3.53
Prueba 17: Vocabulario de n — — — 155 231 264 305 307 364
lectura
M — — — 443.91 455.61 476.25 490.28 496.56 501.78
SD — — — 14.93 17.90 19.64 17.18 15.78 15.17
r11 — — — 0.96 0.92 0.93 0.90 0.88 0.84
SEM (W) — — — 2.99 5.06 5.20 5.43 5.47 6.07
SEM (SS) — — — 3.00 4.24 3.97 4.74 5.20 6.00
Prueba 18: Conceptos n 157 216 282 153 207 218 269 266 328
cuantitativos
M 396.07 415.42 434.11 437.67 455.58 472.09 489.23 497.03 502.06
SD 18.92 21.29 21.98 18.27 16.31 18.33 14.81 14.42 16.14
r11 0.87 0.86 0.89 0.93 0.92 0.88 0.87 0.86 0.89
SEM (W) 6.82 7.97 7.29 4.83 4.61 6.35 5.34 5.40 5.35
SEM (SS) 5.41 5.61 4.97 3.97 4.24 5.20 5.41 5.61 4.97

126
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería extendida
Prueba 13: Análisis de n 365 314 297 277 299 297 234 219 194
palabras
M 505.91 511.54 514.17 515.67 518.11 521.63 520.00 521.22 527.27
SD 22.32 21.93 20.71 23.44 20.42 17.52 19.56 18.85 17.09
r11 0.86 0.85 0.81 0.90 0.80 0.78 0.79 0.82 0.87
SEM (W) 8.47 8.63 9.01 7.48 9.08 8.30 8.90 7.92 6.20
SEM (SS) 5.69 5.90 6.53 4.79 6.67 7.11 6.83 6.30 5.45
Prueba 14: Vocabulario sobre n 374 299 267 261 277 275 226 262 208
dibujos
M 508.48 512.64 517.58 520.64 524.10 526.59 530.70 531.69 537.40
SD 18.64 18.35 18.34 20.92 21.34 18.83 18.34 19.03 18.83
r11 0.79 0.77 0.74 0.81 0.85 0.76 0.80 0.81 0.80
SEM (W) 8.49 8.81 9.30 9.09 8.38 9.22 8.28 8.31 8.33
SEM (SS) 6.83 7.20 7.61 6.52 5.89 7.35 6.77 6.55 6.64
Prueba 15: Comprensión oral n 374 321 301 282 291 296 240 215 117
M 508.43 511.84 513.53 516.31 518.82 521.15 523.06 522.49 523.41
SD 17.02 16.84 20.35 21.20 17.77 19.52 17.05 19.03 19.61
r11 0.76 0.66 0.86 0.86 0.78 0.81 0.69 0.81 0.77
SEM (W) 8.41 9.86 7.54 8.02 8.27 8.46 9.55 8.21 9.39
SEM (SS) 7.41 8.78 5.56 5.68 6.98 6.50 8.40 6.47 7.19
Prueba 16: Corrección de n 307 257 253 227 239 231 190 181 100
textos
M 514.89 520.57 523.07 527.32 527.90 533.36 534.92 537.94 540.56
SD 21.34 21.53 21.07 19.89 21.17 19.96 21.22 20.55 19.28
r11 0.93 0.92 0.91 0.85 0.88 0.87 0.83 0.81 0.84
SEM (W) 5.66 6.23 6.42 7.66 7.23 7.17 8.68 8.85 7.73
SEM (SS) 3.98 4.34 4.57 5.77 5.12 5.39 6.14 6.46 6.02
Prueba 17: Vocabulario de n 297 255 237 209 212 204 162 161 96
lectura
M 507.01 511.78 515.41 520.10 522.57 527.19 529.89 532.43 538.35
SD 14.89 15.33 16.32 17.30 18.43 17.66 17.30 19.02 18.57
r11 0.82 0.84 0.85 0.88 0.89 0.84 0.88 0.87 0.87
SEM (W) 6.32 6.13 6.32 5.99 6.11 7.06 5.99 6.86 6.70
SEM (SS) 6.36 6.00 5.81 5.20 4.97 6.00 5.20 5.41 5.41
Prueba 18: Conceptos n 256 219 208 194 209 201 165 194 131
cuantitativos
M 511.15 519.30 523.98 528.17 529.86 535.21 536.91 539.61 543.92
SD 15.85 18.56 19.67 19.77 18.47 19.53 18.39 19.30 18.73
r11 0.90 0.90 0.90 0.93 0.91 0.90 0.90 0.91 0.91
SEM (W) 5.01 5.87 6.22 5.23 5.54 6.18 5.81 5.79 5.62
SEM (SS) 4.74 4.74 4.74 3.97 4.50 4.74 4.74 4.50 4.50

127
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería extendida
Prueba 13: Análisis de n 807 340 319 195 127 115 84
palabras
M 526.31 521.30 521.10 520.66 517.58 517.02 515.80
SD 17.82 23.60 23.70 23.15 29.74 24.28 29.28
r11 0.83 0.87 0.87 0.88 0.91 0.85 0.93 0.87
SEM (W) 7.27 8.46 8.47 8.00 8.67 9.43 7.75
SEM (SS) 6.12 5.38 5.36 5.19 4.37 5.82 3.97
Prueba 14: Vocabulario sobre n 982 405 377 231 149 167 142
dibujos
M 539.97 543.90 550.37 556.12 552.28 546.20 526.94
SD 21.83 27.00 28.12 24.53 32.50 30.75 38.19
r11 0.83 0.90 0.90 0.85 0.92 0.90 0.90 0.81
SEM (W) 8.98 8.38 9.11 9.60 9.26 9.81 12.37
SEM (SS) 6.17 4.65 4.86 5.87 4.27 4.79 4.86
Prueba 15: Comprensión oral n 688 339 320 199 131 128 100
M 527.98 525.77 527.91 529.08 525.18 516.60 506.93
SD 22.01 28.63 30.59 26.01 25.78 24.50 27.79
r11 0.86 0.93 0.94 0.89 0.89 0.88 0.91 0.85
SEM (W) 8.28 7.64 7.58 8.76 8.57 8.47 8.15
SEM (SS) 5.64 4.00 3.71 5.05 4.99 5.19 4.40
Prueba 16: Corrección de n 614 290 271 148 97 86 52
textos
M 539.78 537.75 540.04 546.35 539.93 537.78 519.33
SD 22.36 28.53 28.25 24.26 26.30 25.70 30.79
r11 0.89 0.95 0.94 0.85 0.90 0.87 0.93 0.90
SEM (W) 7.46 6.26 7.00 9.49 8.34 9.29 8.25
SEM (SS) 5.00 3.29 3.72 5.87 4.76 5.42 4.02
Prueba 17: Vocabulario de n 535 290 260 153 99 106 81
lectura
M 539.05 538.81 541.24 546.51 545.26 534.65 526.38
SD 22.91 25.21 28.37 24.76 24.50 25.17 26.18
r11 0.91 0.92 0.94 0.92 0.90 0.92 0.92 0.90
SEM (W) 6.87 7.13 6.95 7.00 7.75 7.12 7.41
SEM (SS) 4.50 4.24 3.67 4.24 4.74 4.24 4.24
Prueba 18: Conceptos n 639 295 278 151 96 86 51
cuantitativos
M 540.87 531.73 533.79 533.92 525.84 515.51 502.50
SD 19.24 23.40 23.21 20.69 18.68 24.53 23.60
r11 0.92 0.94 0.94 0.94 0.94 0.96 0.95 0.91
SEM (W) 5.44 5.73 5.68 5.07 4.58 4.91 5.28
SEM (SS) 4.24 3.67 3.67 3.67 3.67 3.00 3.35

128
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 2 3 4 5 6 7 8 9 10
Batería extendida
Prueba 19: Conocimientos n 240 273 333 329 289 316 366 385 447
académicos
M 404.12 428.42 444.24 453.16 471.06 480.69 489.71 496.52 503.05
SD 20.71 18.53 17.96 18.86 13.99 14.38 13.73 14.30 14.53
r11 0.94 0.93 0.92 0.92 0.82 0.84 0.82 0.85 0.84
SEM (W) 5.07 4.90 5.08 5.33 5.94 5.75 5.83 5.54 5.81
SEM (SS) 3.67 3.97 4.24 4.24 6.36 6.00 6.36 5.81 6.00
Prueba 20: Análisis de n — — — — 126 142 199 226 239
sonidos
M — — — — 474.05 488.23 496.96 500.44 503.09
SD — — — — 20.75 14.01 10.47 9.71 10.32
r11 — — — — 0.81 0.81 0.77 0.73 0.76
SEM (W) — — — — 9.02 6.03 4.99 5.04 5.03
SEM (SS) — — — — 6.52 6.45 7.15 7.79 7.30
Prueba 21: Discernimiento de n — — 76 114 190 173 128 103 93
Sonidos
M — — 433.57 454.09 471.85 483.90 495.05 499.37 500.96
SD — — 16.30 17.65 17.20 16.90 11.97 12.64 13.05
r11 — — 0.71 0.85 0.93 0.93 0.86 0.86 0.84
SEM (W) — — 8.74 6.72 4.69 4.41 4.46 4.76 5.23
SEM (SS) — — 8.04 5.71 4.09 3.92 5.59 5.64 6.01
Prueba 22: Puntuación y n — — — — 129 274 353 373 445
mayúsculas
M — — — — 462.20 476.85 489.68 497.84 503.22
SD — — — — 13.51 13.52 13.25 11.91 13.09
r11 — — — — 0.57 0.67 0.76 0.75 0.80
SEM (W) — — — — 8.87 7.74 6.53 5.95 5.86
SEM (SS) — — — — 9.85 8.59 7.40 7.49 6.71
E: Escala de legibilidad de la n — — — 177 279 311 323 337 386
escritura a mano
M — — — 22.12 31.22 42.22 47.77 52.05 55.44
SD — — — 19.99 19.19 18.55 16.85 15.28 16.37
a
r — — — — — — — — —
a
Ver el Cuadro 3-10 del texto principal.

129
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 11 12 13 14 15 16 17 18 19
Batería extendida
Prueba 19: Conocimientos n 372 326 310 285 299 300 244 270 185
académicos
M 510.42 514.98 520.10 524.61 527.72 533.54 534.69 536.51 542.87
SD 14.70 16.68 17.51 20.48 18.83 18.26 17.18 16.84 18.02
r11 0.84 0.87 0.88 0.92 0.90 0.90 0.89 0.88 0.90
SEM (W) 5.88 6.01 6.07 5.79 5.95 5.78 5.70 5.83 5.70
SEM (SS) 6.00 5.41 5.20 4.24 4.74 4.74 4.97 5.20 4.74
Prueba 20: Análisis de n 181 136 128 121 134 148 123 176 153
sonidos
M 505.29 507.61 509.89 511.24 512.34 514.75 515.27 515.70 518.55
SD 10.94 10.65 10.33 10.09 11.04 10.70 11.63 12.88 9.91
r11 0.77 0.74 0.72 0.69 0.72 0.68 0.70 0.74 0.58
SEM (W) 5.21 5.41 5.48 5.58 5.85 6.02 6.38 6.59 6.43
SEM (SS) 7.15 7.62 7.96 8.29 7.96 8.44 8.22 7.68 9.74
Prueba 21: Discernimiento de n 99 98 105 83 104 119 94 135 129
sonidos
M 501.59 505.69 508.24 509.27 508.29 511.84 513.56 515.02 519.73
SD 11.40 13.32 13.38 13.09 10.93 12.39 12.43 14.92 14.16
r11 0.82 0.81 0.80 0.77 0.69 0.73 0.71 0.76 0.67
SEM (W) 4.84 5.83 6.04 6.30 6.04 6.43 6.70 7.35 8.08
SEM (SS) 6.37 6.57 6.77 7.22 8.29 7.78 8.09 7.39 8.56
Prueba 22: Puntuación y n 370 325 303 274 295 296 237 265 182
mayúsculas
M 508.10 513.26 517.64 520.67 523.73 527.58 527.62 530.30 534.47
SD 11.59 12.29 12.18 12.26 12.42 12.08 12.53 12.18 12.26
r11 0.76 0.79 0.78 0.78 0.79 0.77 0.79 0.77 0.77
SEM (W) 5.65 5.70 5.67 5.71 5.68 5.76 5.76 5.80 5.93
SEM (SS) 7.32 6.95 6.98 6.99 6.86 7.15 6.90 7.14 7.26
E: Escala de legibilidad de la n 356 329 306 278 302 299 245 273 191
escritura a mano
M 56.85 59.56 62.21 63.24 62.32 65.20 63.45 67.44 66.60
SD 16.74 16.28 16.51 16.11 17.44 16.81 17.20 15.75 16.05
a
r — — — — — — — — —
a
Ver el Cuadro 3-10 del texto principal.

130
Apéndice A
Cuadro A-2. (cont.)
Estadísticos descriptivos y de confiabilidad de las pruebas – Pruebas de aprovechamiento de la WJ III

EDAD
Prueba Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería extendida
Prueba 19: Conocimientos n 833 368 341 211 146 168 142
académicos
M 544.49 543.90 547.95 549.25 540.73 530.57 520.35
SD 18.64 19.55 20.31 20.38 23.59 24.78 27.56
r11 0.89 0.91 0.91 0.91 0.94 0.94 0.95 0.90
SEM (W) 6.18 5.87 6.09 6.11 5.78 6.07 6.16
SEM (SS) 4.97 4.50 4.50 4.50 3.67 3.67 3.35
Prueba 20: Análisis de n 683 194 186 109 63 63 44
sonidos
M 520.26 515.34 513.81 510.01 508.63 506.36 491.32
SD 10.98 13.32 12.73 14.47 13.99 13.91 21.29
r11 0.64 0.78 0.78 0.83 0.82 0.82 0.86 0.76
SEM (W) 6.59 6.23 5.98 6.03 5.92 5.95 7.94
SEM (SS) 9.00 7.02 7.04 6.24 6.35 6.42 5.60
Prueba 21: Discernimiento de n 446 112 112 89 55 85 73
sonidos
M 519.10 514.01 511.42 508.19 501.45 494.54 491.14
SD 14.33 15.73 16.05 16.97 17.18 20.26 17.78
r11 0.68 0.79 0.81 0.86 0.91 0.92 0.92 0.81
SEM (W) 8.08 7.21 7.01 6.35 5.21 5.57 5.16
SEM (SS) 8.46 6.87 6.55 5.61 4.55 4.13 4.35
Prueba 22: Puntuación y n 840 377 347 212 132 142 98
mayúsculas
M 535.15 528.99 531.31 529.64 527.05 521.45 516.59
SD 13.62 18.06 17.46 16.66 16.85 15.39 17.23
r11 0.81 0.89 0.88 0.88 0.88 0.86 0.89 0.79
SEM (W) 5.99 5.96 5.98 5.88 5.86 5.74 5.74
SEM (SS) 6.60 4.95 5.13 5.30 5.22 5.59 5.00
E: Escala de legibilidad de la n 871 390 362 214 134 155 113
escritura a mano
M 65.79 64.67 64.34 63.88 64.54 59.39 56.55
SD 15.50 15.74 15.88 16.94 16.82 18.14 17.10
a
r — — — — — — — —
a
Ver el Cuadro 3-10 del texto principal.

131
Apéndice A
Apéndice B
Cuadro B-1.
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Habilidad intelectual general– n — 54 256 259 218 226 304 352 387
Estándar
M — 429.21 444.36 459.50 472.98 483.44 492.77 497.54 502.81
SD — 9.84 13.53 12.36 10.39 10.01 10.16 9.44 10.22
rcc — 0.96 0.97 0.97 0.97 0.96 0.96 0.96 0.96
SEM (W) — 1.97 2.34 2.14 1.80 2.00 2.03 1.89 2.04
SEM (SS) — 3.00 2.60 2.60 2.60 3.00 3.00 3.00 3.00
Habilidad intelectual breve n — 222 323 301 317 299 375 450 485
M — 409.88 426.26 443.67 460.92 475.14 489.28 496.56 504.21
SD — 16.15 17.18 16.01 13.32 13.80 12.72 12.99 13.45
rcc — 0.94 0.96 0.94 0.96 0.96 0.95 0.95 0.95
SEM (W) — 3.96 3.44 3.92 2.66 2.76 2.84 2.91 3.01
SEM (SS) — 3.67 3.00 3.67 3.00 3.00 3.35 3.35 3.35
Habilidad verbal–Estándar n 127 95 367 341 352 336 379 452 487
M 430.57 440.36 450.28 458.87 471.17 481.57 491.64 497.09 502.73
SD 11.32 9.55 11.86 12.84 14.71 13.49 13.03 13.92 14.51
rcc 0.93 0.88 0.89 0.89 0.90 0.90 0.88 0.89 0.90
SEM (W) 2.99 3.31 3.93 4.26 4.65 4.27 4.51 4.62 4.59
SEM (SS) 3.97 5.20 4.97 4.97 4.74 4.74 5.20 4.97 4.74
Habilidad para pensar– n — 289 310 299 235 249 321 376 404
Estándar
M — 470.87 477.10 480.82 486.37 492.68 497.71 499.57 501.92
SD — 11.74 7.04 8.22 7.98 8.55 8.03 8.09 9.19
rcc — 0.95 0.96 0.96 0.95 0.94 0.93 0.93 0.94
SEM (W) — 2.62 1.41 1.64 1.78 2.09 2.12 2.14 2.25
SEM (SS) — 3.35 3.00 3.00 3.35 3.67 3.97 3.97 3.67
Eficiencia cognitiva–Estándar n — 66 300 290 257 275 351 400 445
M — 368.73 376.34 400.82 428.52 451.51 468.85 485.99 494.42
SD — 21.09 15.11 24.25 24.46 19.61 17.47 17.57 16.90
rcc — 0.93 0.95 0.93 0.93 0.91 0.92 0.90 0.92
SEM (W) — 5.58 3.38 6.42 6.47 5.88 4.94 5.55 4.78
SEM (SS) — 3.97 3.35 3.97 3.97 4.50 4.24 4.74 4.24
Percepción fonémica n 145 260 336 327 403 425 411 445 473
M 445.85 460.74 472.29 480.93 487.55 493.59 497.61 499.08 501.07
SD 14.62 14.40 12.82 9.78 9.05 9.25 9.02 9.40 9.36
rcc 0.90 0.94 0.92 0.91 0.88 0.86 0.84 0.86 0.87
SEM (W) 4.62 3.53 3.63 2.93 3.14 3.46 3.61 3.52 3.38
SEM (SS) 4.74 3.67 4.24 4.50 5.20 5.61 6.00 5.61 5.41

133
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Habilidad intelectual general– n 311 260 237 234 243 247 201 219 152
Estándar
M 506.76 510.77 513.67 516.54 518.97 522.38 523.11 523.49 527.33
SD 9.91 10.34 11.71 12.22 11.94 11.91 10.83 12.51 13.41
rcc 0.96 0.96 0.97 0.97 0.97 0.97 0.96 0.97 0.97
SEM (W) 1.98 2.07 2.03 2.12 2.07 2.06 2.17 2.17 2.32
SEM (SS) 3.00 3.00 2.60 2.60 2.60 2.60 3.00 2.60 2.60
Habilidad intelectual breve n 370 298 266 259 276 272 223 260 206
M 510.42 515.93 519.78 524.76 526.58 531.76 532.59 535.29 539.65
SD 12.71 13.87 14.64 15.59 15.24 15.43 14.79 15.60 15.55
rcc 0.94 0.94 0.95 0.96 0.95 0.94 0.95 0.95 0.95
SEM (W) 3.11 3.40 3.27 3.12 3.41 3.78 3.31 3.49 3.48
SEM (SS) 3.67 3.67 3.35 3.00 3.35 3.67 3.35 3.35 3.35
Habilidad verbal–Estándar n 372 298 266 261 277 272 224 261 206
M 508.64 513.15 516.93 520.82 523.37 525.99 529.62 530.98 537.41
SD 15.24 15.15 16.77 17.01 17.15 16.51 14.99 16.56 16.65
rcc 0.90 0.90 0.92 0.93 0.93 0.91 0.92 0.92 0.92
SEM (W) 4.82 4.79 4.74 4.50 4.54 4.95 4.24 4.69 4.71
SEM (SS) 4.74 4.74 4.24 3.97 3.97 4.50 4.24 4.24 4.24
Habilidad para pensar– n 318 264 240 236 243 250 203 245 180
Estándar
M 504.61 506.96 508.89 511.41 511.15 514.17 514.78 514.66 518.67
SD 8.77 9.60 9.96 10.27 10.40 10.17 9.89 10.29 10.36
rcc 0.93 0.94 0.95 0.96 0.95 0.94 0.93 0.95 0.96
SEM (W) 2.32 2.35 2.23 2.05 2.33 2.49 2.62 2.30 2.07
SEM (SS) 3.97 3.67 3.35 3.00 3.35 3.67 3.97 3.35 3.00
Eficiencia cognitiva–Estándar n 348 278 252 251 265 266 219 257 192
M 504.91 511.39 518.28 523.54 528.07 531.60 538.70 537.82 541.32
SD 17.97 15.86 16.49 18.40 18.48 19.49 19.09 18.70 22.00
rcc 0.89 0.90 0.90 0.91 0.91 0.91 0.90 0.92 0.91
SEM (W) 5.96 5.01 5.21 5.52 5.54 5.85 6.04 5.29 6.60
SEM (SS) 4.97 4.74 4.74 4.50 4.50 4.50 4.74 4.24 4.50
Percepción fonémica n 334 268 234 225 222 216 182 240 210
M 503.60 504.84 507.63 508.59 510.79 512.81 512.36 514.92 516.19
SD 8.93 10.08 10.37 11.82 11.20 11.09 11.31 11.11 11.59
rcc 0.86 0.88 0.88 0.89 0.90 0.89 0.88 0.90 0.89
SEM (W) 3.34 3.49 3.59 3.92 3.54 3.68 3.92 3.51 3.84
SEM (SS) 5.61 5.20 5.20 4.97 4.74 4.97 5.20 4.74 4.97

134
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Habilidad intelectual general– n 747 318 302 188 114 113 68
Estándar
M 528.58 522.60 520.18 517.34 512.76 502.66 494.37
SD 13.63 16.70 16.05 15.15 13.85 13.91 15.72
rcc 0.97 0.98 0.98 0.98 0.98 0.98 0.98 0.97
SEM (W) 2.36 2.36 2.27 2.14 1.96 1.97 2.22
SEM (SS) 2.60 2.12 2.12 2.12 2.12 2.12 2.12
Habilidad intelectual breve n 968 399 368 223 137 157 112
M 540.29 534.16 532.24 530.73 524.95 514.02 500.62
SD 17.62 19.41 20.29 18.73 16.56 16.34 20.59
rcc 0.96 0.96 0.97 0.97 0.97 0.98 0.98 0.95
SEM (W) 3.52 3.88 3.51 3.24 2.87 2.31 2.91
SEM (SS) 3.00 3.00 2.60 2.60 2.60 2.12 2.12
Habilidad verbal–Estándar n 973 403 374 229 148 165 141
M 538.58 538.09 542.57 547.75 542.09 535.72 526.27
SD 18.80 23.57 22.91 19.25 21.55 18.90 24.81
rcc 0.93 0.95 0.96 0.95 0.96 0.96 0.95 0.92
SEM (W) 4.98 5.27 4.58 4.31 4.31 3.78 5.55
SEM (SS) 3.97 3.35 3.00 3.35 3.00 3.00 3.35
Habilidad para pensar– n 858 332 314 196 117 115 71
Estándar
M 518.88 516.03 511.78 509.92 504.48 495.48 491.47
SD 10.60 11.87 10.54 10.69 10.93 8.77 10.51
rcc 0.96 0.97 0.97 0.97 0.97 0.96 0.96 0.95
SEM (W) 2.12 2.06 1.83 1.85 1.89 1.75 2.10
SEM (SS) 3.00 2.60 2.60 2.60 2.60 3.00 3.00
Eficiencia cognitiva–Estándar n 907 348 326 200 129 120 82
M 543.84 546.91 536.12 532.09 525.89 522.42 511.55
SD 20.81 22.42 23.70 26.15 23.79 21.70 22.41
rcc 0.92 0.94 0.95 0.94 0.94 0.95 0.95 0.92
SEM (W) 5.88 5.49 5.30 6.41 5.83 4.85 5.01
SEM (SS) 4.24 3.67 3.35 3.67 3.67 3.35 3.35
Percepción fonémica n 930 331 312 196 125 145 119
M 518.49 516.24 512.15 507.71 500.25 491.17 482.44
SD 12.73 16.20 15.61 15.69 16.93 14.04 16.01
rcc 0.92 0.95 0.94 0.95 0.96 0.94 0.94 0.90
SEM (W) 3.60 3.62 3.82 3.51 3.39 3.44 3.92
SEM (SS) 4.24 3.35 3.67 3.35 3.00 3.67 3.67

135
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Memoria de trabajo n — — 129 183 161 187 243 292 328
M — — 439.59 454.37 467.86 480.80 492.17 496.27 503.54
SD — — 16.33 19.81 17.19 15.79 15.55 13.84 16.25
rcc — — 0.96 0.94 0.92 0.90 0.90 0.89 0.91
SEM (W) — — 3.27 4.85 4.86 4.99 4.92 4.59 4.88
SEM (SS) — — 3.00 3.67 4.24 4.74 4.74 4.97 4.50
Batería extendida
Habilidad intelectual general– n — — 209 214 161 174 220 233 276
Extendida
M — — 464.26 469.70 476.80 486.11 494.46 497.87 502.38
SD — — 6.77 8.73 7.52 8.17 8.12 7.89 9.50
rcc — — 0.98 0.98 0.98 0.98 0.97 0.97 0.97
SEM (W) — — 0.96 1.23 1.06 1.16 1.41 1.37 1.65
SEM (SS) — — 2.12 2.12 2.12 2.12 2.60 2.60 2.60
Habilidad verbal–Extendida n 127 95 347 321 337 314 352 398 420
M 434.10 442.66 453.11 460.04 472.36 481.46 490.82 496.09 502.53
SD 12.07 12.82 12.83 12.46 12.46 12.42 12.19 12.53 13.10
rcc 0.92 0.92 0.92 0.93 0.92 0.92 0.93 0.93 0.94
SEM (W) 3.41 3.63 3.63 3.30 3.52 3.51 3.23 3.32 3.21
SEM (SS) 4.24 4.24 4.24 3.97 4.24 4.24 3.97 3.97 3.67
Habilidad para pensar– n — — 263 249 170 180 223 236 281
Extendida
M — — 477.07 481.06 485.80 492.45 497.33 499.22 501.52
SD — — 6.25 6.48 6.09 6.66 5.83 6.07 6.92
rcc — — 0.97 0.97 0.96 0.95 0.94 0.94 0.95
SEM (W) — — 1.08 1.12 1.22 1.49 1.43 1.49 1.55
SEM (SS) — — 2.60 2.60 3.00 3.35 3.67 3.67 3.35
Eficiencia cognitiva– n — — 238 264 248 265 343 393 439
Extendida
M — — 423.69 443.92 461.74 474.84 489.25 495.94 503.94
SD — — 17.73 17.59 14.89 14.13 13.62 13.14 15.02
rcc — — 0.94 0.94 0.93 0.92 0.92 0.91 0.93
SEM (W) — — 4.34 4.31 3.94 4.00 3.85 3.94 3.97
SEM (SS) — — 3.67 3.67 3.97 4.24 4.24 4.50 3.97
Comprensión-conocimiento n 127 95 347 321 337 314 352 398 420
(Gc)
M 434.10 442.66 453.11 460.04 472.36 481.46 490.82 496.09 502.53
SD 12.07 12.82 12.83 12.46 12.46 12.42 12.19 12.53 13.10
rcc 0.92 0.92 0.92 0.93 0.92 0.92 0.93 0.93 0.94
SEM (W) 3.41 3.63 3.63 3.30 3.52 3.51 3.23 3.32 3.21
SEM (SS) 4.24 4.24 4.24 3.97 4.24 4.24 3.97 3.97 3.67

136
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Memoria de trabajo n 236 180 163 172 179 174 145 145 77
M 507.85 512.14 515.68 519.82 520.22 526.39 525.75 528.12 534.88
SD 15.79 15.82 16.81 18.26 16.54 17.64 15.60 17.86 15.77
rcc 0.89 0.90 0.90 0.93 0.90 0.92 0.89 0.91 0.91
SEM (W) 5.24 5.00 5.32 4.83 5.23 4.99 5.17 5.36 4.73
SEM (SS) 4.97 4.74 4.74 3.97 4.74 4.24 4.97 4.50 4.50
Batería extendida
Habilidad intelectual general– n 221 195 177 180 192 180 152 159 95
Extendida
M 507.03 510.77 513.99 517.37 518.50 522.03 522.69 524.20 529.20
SD 8.90 9.51 10.10 10.35 11.15 9.98 10.08 10.37 8.93
rcc 0.97 0.97 0.98 0.98 0.98 0.98 0.97 0.98 0.98
SEM (W) 1.54 1.65 1.43 1.46 1.58 1.41 1.75 1.47 1.26
SEM (SS) 2.60 2.60 2.12 2.12 2.12 2.12 2.60 2.12 2.12
Habilidad verbal–Extendida n 336 269 251 248 264 260 216 230 156
M 509.17 513.88 517.83 521.53 525.31 528.38 531.10 531.63 538.10
SD 13.86 14.21 15.63 16.74 16.10 15.35 14.23 15.95 15.17
rcc 0.94 0.94 0.95 0.96 0.96 0.95 0.95 0.95 0.95
SEM (W) 3.40 3.48 3.50 3.35 3.22 3.43 3.18 3.57 3.39
SEM (SS) 3.67 3.67 3.35 3.00 3.00 3.35 3.35 3.35 3.35
Habilidad para pensar– n 224 199 180 184 192 184 152 161 102
Extendida
M 503.51 505.49 507.41 509.41 509.72 511.82 512.23 512.51 516.22
SD 6.32 7.23 7.32 7.70 7.79 7.32 7.08 7.62 6.77
rcc 0.95 0.95 0.96 0.97 0.96 0.96 0.95 0.96 0.96
SEM (W) 1.41 1.62 1.46 1.33 1.56 1.46 1.58 1.52 1.35
SEM (SS) 3.35 3.35 3.00 2.60 3.00 3.00 3.35 3.00 3.00
Eficiencia cognitiva– n 337 268 247 244 263 261 216 254 184
Extendida
M 510.57 516.61 520.85 524.87 528.64 532.69 532.92 535.54 537.37
SD 12.95 13.66 15.80 16.43 16.18 15.38 15.26 18.26 16.33
rcc 0.90 0.91 0.93 0.94 0.92 0.92 0.92 0.93 0.93
SEM (W) 4.10 4.10 4.18 4.02 4.58 4.35 4.32 4.83 4.32
SEM (SS) 4.74 4.50 3.97 3.67 4.24 4.24 4.24 3.97 3.97
Comprensión-conocimiento n 336 269 251 248 264 260 216 230 156
(Gc)
M 509.17 513.88 517.83 521.53 525.31 528.38 531.10 531.63 538.10
SD 13.86 14.21 15.63 16.74 16.10 15.35 14.23 15.95 15.17
rcc 0.94 0.94 0.95 0.96 0.96 0.95 0.95 0.95 0.95
SEM (W) 3.40 3.48 3.50 3.35 3.22 3.43 3.18 3.57 3.39
SEM (SS) 3.67 3.67 3.35 3.00 3.00 3.35 3.35 3.35 3.35

137
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Memoria de trabajo n 498 228 213 128 79 73 39
M 534.33 527.67 526.46 525.47 517.03 507.46 495.91
SD 16.94 18.32 18.83 16.51 22.02 17.90 19.91
rcc 0.90 0.92 0.93 0.89 0.94 0.93 0.94 0.91
SEM (W) 5.36 5.18 4.98 5.47 5.39 4.74 4.88
SEM (SS) 4.74 4.24 3.97 4.97 3.67 3.97 3.67
Batería extendida
Habilidad intelectual general– n 489 249 245 140 83 79 45
Extendida
M 528.47 525.21 524.14 522.05 517.77 509.75 506.36
SD 10.48 10.86 10.29 9.52 9.39 9.02 12.40
rcc 0.98 0.99 0.99 0.99 0.99 0.99 0.99 0.98
SEM (W) 1.48 1.09 1.03 0.95 0.94 0.90 1.24
SEM (SS) 2.12 1.50 1.50 1.50 1.50 1.50 1.50
Habilidad verbal–Extendida n 730 349 328 205 138 128 103
M 540.65 540.43 545.30 548.55 543.52 537.06 529.24
SD 18.47 23.96 23.83 20.57 24.79 22.62 24.51
rcc 0.96 0.97 0.98 0.97 0.98 0.97 0.97 0.95
SEM (W) 3.69 4.15 3.37 3.56 3.51 3.92 4.25
SEM (SS) 3.00 2.60 2.12 2.60 2.12 2.60 2.60
Habilidad para pensar– n 571 259 248 145 83 79 47
Extendida
M 515.38 513.14 510.51 508.44 504.34 497.20 493.16
SD 7.57 8.49 7.97 7.72 7.37 6.82 8.87
rcc 0.96 0.98 0.98 0.98 0.98 0.97 0.98 0.96
SEM (W) 1.51 1.20 1.13 1.09 1.04 1.18 1.25
SEM (SS) 3.00 2.12 2.12 2.12 2.12 2.60 2.12
Eficiencia cognitiva– n 887 335 320 195 123 114 70
Extendida
M 538.03 528.76 525.32 518.80 513.74 504.55 488.86
SD 17.92 19.55 21.01 20.18 18.74 17.95 20.64
rcc 0.94 0.95 0.96 0.96 0.95 0.95 0.96 0.93
SEM (W) 4.39 4.37 4.20 4.04 4.19 4.01 4.13
SEM (SS) 3.67 3.35 3.00 3.00 3.35 3.35 3.00
Comprensión-conocimiento n 730 349 328 205 138 128 103
(Gc)
M 540.65 540.43 545.30 548.55 543.52 537.06 529.24
SD 18.47 23.96 23.83 20.57 24.79 22.62 24.51
rcc 0.96 0.97 0.98 0.97 0.98 0.97 0.97 0.95
SEM (W) 3.69 4.15 3.37 3.56 3.51 3.92 4.25
SEM (SS) 3.00 2.60 2.12 2.60 2.12 2.60 2.60

138
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería extendida
Recuperación a largo plazo n 110 179 321 304 246 260 337 403 417
(Glr)
M 457.58 484.18 486.63 487.96 491.65 495.52 498.05 500.04 501.01
SD 9.27 1.69 3.72 4.00 4.15 4.75 4.39 5.04 4.96
rcc 0.70 0.88 0.88 0.87 0.87 0.89 0.87 0.86 0.87
SEM (W) 5.08 0.59 1.29 1.44 1.50 1.57 1.58 1.89 1.79
SEM (SS) 8.22 5.20 5.20 5.41 5.41 4.97 5.41 5.61 5.41
Percepción visual-espacial n 100 133 309 275 186 187 250 294 343
(Gv)
M 445.98 460.04 474.72 482.41 489.26 493.02 497.26 498.96 501.02
SD 13.58 15.34 12.63 11.35 7.65 7.18 7.95 8.07 8.58
rcc 0.83 0.90 0.89 0.87 0.76 0.70 0.77 0.78 0.80
SEM (W) 5.60 4.85 4.19 4.09 3.75 3.93 3.81 3.78 3.84
SEM (SS) 6.18 4.74 4.97 5.41 7.35 8.22 7.19 7.04 6.71
Procesamiento auditivo (Ga) n — 192 281 236 136 143 244 338 332
M — 458.73 469.56 477.72 487.54 494.37 497.04 498.53 499.94
SD — 13.87 12.96 11.34 10.07 7.95 8.29 8.24 8.85
rcc — 0.96 0.94 0.93 0.88 0.87 0.86 0.88 0.88
SEM (W) — 2.77 3.18 3.00 3.49 2.87 3.10 2.85 3.06
SEM (SS) — 3.00 3.67 3.97 5.20 5.41 5.61 5.20 5.20
Razonamiento fluido (Gf) n 232 285 329 294 269 242 317 395 435
M 427.88 437.98 446.61 457.17 472.28 484.67 494.58 497.79 502.80
SD 11.01 16.31 13.64 16.23 15.58 15.92 13.58 13.65 13.99
rcc 0.75 0.86 0.95 0.96 0.96 0.96 0.95 0.95 0.94
SEM (W) 5.55 6.15 3.05 3.25 3.12 3.18 3.04 3.05 3.43
SEM (SS) 7.56 5.65 3.35 3.00 3.00 3.00 3.35 3.35 3.67
Rapidez en el procesamiento n — 167 249 275 399 415 416 461 486
(Gs)
M — 391.20 408.69 431.49 451.28 467.11 485.23 494.77 505.14
SD — 20.10 21.59 19.88 16.56 15.85 14.98 16.10 16.25
rcc — 0.83 0.93 0.94 0.95 0.94 0.92 0.92 0.92
SEM (W) — 8.29 5.71 4.87 3.70 3.88 4.24 4.55 4.60
SEM (SS) — 6.18 3.97 3.67 3.35 3.67 4.24 4.24 4.24
Memoria a corto plazo (Gsm) n 155 67 316 319 267 278 351 400 445
M 411.41 423.49 436.40 453.89 470.83 482.56 493.79 497.10 502.50
SD 28.23 15.38 20.21 22.13 19.41 18.08 17.41 15.92 19.31
rcc 0.94 0.91 0.93 0.91 0.88 0.86 0.87 0.83 0.88
SEM (W) 6.99 4.62 5.35 6.64 6.73 6.76 6.28 6.56 6.69
SEM (SS) 3.72 4.50 3.97 4.50 5.20 5.61 5.41 6.18 5.20

139
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 11 12 13 14 15 16 17 18 19
Batería extendida
Recuperación a largo plazo n 322 260 242 243 252 249 209 243 175
(Glr)
M 502.25 503.64 504.09 505.82 505.60 506.61 507.06 507.83 509.98
SD 4.38 5.09 5.08 5.59 5.29 5.80 5.34 5.81 5.81
rcc 0.86 0.88 0.87 0.90 0.90 0.88 0.88 0.87 0.91
SEM (W) 1.64 1.76 1.83 1.77 1.67 2.01 1.85 2.09 1.74
SEM (SS) 5.61 5.20 5.41 4.74 4.74 5.20 5.20 5.41 4.50
Percepción visual-espacial n 258 206 188 192 196 189 158 167 110
(Gv)
M 502.32 504.12 505.75 507.15 508.60 509.41 510.36 510.07 511.54
SD 7.60 8.67 9.30 9.75 9.55 9.07 8.68 9.59 9.39
rcc 0.74 0.80 0.81 0.84 0.81 0.79 0.76 0.82 0.81
SEM (W) 3.88 3.88 4.06 3.90 4.16 4.16 4.25 4.07 4.09
SEM (SS) 7.65 6.71 6.54 6.00 6.54 6.87 7.35 6.36 6.54
Procesamiento auditivo (Ga) n 228 146 140 135 145 152 122 146 106
M 502.80 505.11 507.87 507.63 510.01 510.22 511.98 511.65 514.98
SD 8.92 9.67 9.46 10.05 10.03 9.76 9.43 10.24 10.43
rcc 0.88 0.89 0.89 0.91 0.91 0.89 0.89 0.91 0.90
SEM (W) 3.09 3.21 3.14 3.02 3.01 3.24 3.13 3.07 3.30
SEM (SS) 5.20 4.97 4.97 4.50 4.50 4.97 4.97 4.50 4.74
Razonamiento fluido (Gf) n 310 231 213 208 213 204 169 171 112
M 507.04 509.14 510.09 514.08 514.49 518.20 518.13 518.44 522.79
SD 14.10 14.36 14.61 15.97 14.48 15.11 13.46 14.06 12.93
rcc 0.95 0.95 0.95 0.96 0.95 0.95 0.94 0.94 0.93
SEM (W) 3.15 3.21 3.27 3.19 3.24 3.38 3.30 3.44 3.42
SEM (SS) 3.35 3.35 3.35 3.00 3.35 3.35 3.67 3.67 3.97
Rapidez en el procesamiento n 357 270 249 251 279 268 216 258 193
(Gs)
M 512.31 519.66 526.17 530.11 535.09 540.78 541.01 544.72 545.30
SD 15.01 16.07 18.09 18.65 19.15 18.81 18.37 21.97 19.18
rcc 0.90 0.91 0.92 0.92 0.92 0.91 0.91 0.93 0.92
SEM (W) 4.75 4.82 5.12 5.28 5.42 5.64 5.51 5.81 5.43
SEM (SS) 4.74 4.50 4.24 4.24 4.24 4.50 4.50 3.97 4.24
Memoria a corto plazo (Gsm) n 348 278 252 252 265 266 220 257 191
M 508.13 512.92 515.72 519.49 521.95 524.52 524.61 526.50 528.71
SD 17.46 18.57 19.60 20.66 19.45 19.06 19.24 21.12 20.83
rcc 0.85 0.87 0.88 0.91 0.86 0.87 0.87 0.87 0.89
SEM (W) 6.76 6.69 6.79 6.20 7.28 6.87 6.94 7.61 6.91
SEM (SS) 5.81 5.41 5.20 4.50 5.61 5.41 5.41 5.41 4.97

140
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería extendida
Recuperación a largo plazo n 860 334 308 196 121 117 89
(Glr)
M 509.22 507.63 505.72 505.10 502.32 497.18 495.59
SD 6.40 6.53 5.68 5.83 5.20 4.56 5.30
rcc 0.92 0.94 0.93 0.93 0.93 0.89 0.91 0.88
SEM (W) 1.81 1.60 1.50 1.54 1.38 1.51 1.59
SEM (SS) 4.24 3.67 3.97 3.97 3.97 4.97 4.50
Percepción visual-espacial n 622 284 270 153 91 83 52
(Gv)
M 511.49 509.59 507.19 506.29 504.54 499.37 494.98
SD 10.08 9.95 10.38 10.51 8.10 7.49 10.03
rcc 0.84 0.83 0.87 0.86 0.87 0.79 0.88 0.81
SEM (W) 4.03 4.10 3.74 3.93 2.92 3.43 3.47
SEM (SS) 6.00 6.18 5.41 5.61 5.41 6.87 5.20
Procesamiento auditivo (Ga) n 563 183 197 121 73 65 48
M 515.41 512.13 507.76 504.43 498.22 490.52 478.01
SD 11.38 14.52 14.08 13.08 14.57 12.19 15.77
rcc 0.93 0.94 0.94 0.94 0.95 0.93 0.94 0.91
SEM (W) 3.01 3.56 3.45 3.20 3.26 3.23 3.86
SEM (SS) 3.97 3.67 3.67 3.67 3.35 3.97 3.67
Razonamiento fluido (Gf) n 657 299 280 154 99 86 53
M 521.72 515.07 512.57 510.70 504.84 493.55 482.80
SD 14.61 18.06 17.76 17.07 16.80 17.36 20.23
rcc 0.95 0.97 0.97 0.97 0.97 0.97 0.97 0.95
SEM (W) 3.27 3.13 3.08 2.96 2.91 3.01 3.50
SEM (SS) 3.35 2.60 2.60 2.60 2.60 2.60 2.60
Rapidez en el procesamiento n 930 356 337 208 126 121 77
(Gs)
M 545.42 537.06 530.44 520.13 513.39 500.00 479.88
SD 22.06 22.75 23.04 23.97 19.33 20.41 23.12
rcc 0.93 0.94 0.95 0.95 0.94 0.96 0.97 0.93
SEM (W) 5.84 5.57 5.15 5.36 4.74 4.08 4.00
SEM (SS) 3.97 3.67 3.35 3.35 3.67 3.00 2.60
Memoria a corto plazo (Gsm) n 909 348 329 201 131 120 90
M 530.26 520.65 519.67 517.17 513.23 508.55 494.29
SD 20.31 22.75 22.98 22.07 24.92 22.32 26.49
rcc 0.88 0.92 0.92 0.90 0.93 0.91 0.92 0.88
SEM (W) 7.03 6.44 6.50 6.98 6.59 6.70 7.49
SEM (SS) 5.20 4.24 4.24 4.74 3.97 4.50 4.24

141
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería extendida
Amplia atención n — — 120 136 78 94 155 197 225
M — — 448.55 459.67 471.67 480.53 491.17 496.01 501.61
SD — — 11.52 13.27 12.16 11.36 10.35 9.41 11.45
rcc — — 0.97 0.95 0.94 0.92 0.92 0.90 0.92
SEM (W) — — 2.00 2.97 2.98 3.21 2.93 2.98 3.24
SEM (SS) — — 2.60 3.35 3.67 4.24 4.24 4.74 4.24
Fluidez cognitiva n — 152 245 240 171 198 262 322 338
M — 440.78 454.18 464.70 475.25 483.60 492.36 496.98 502.30
SD — 11.25 12.31 12.64 12.15 12.90 10.41 11.21 13.68
rcc — 0.97 0.95 0.96 0.97 0.97 0.95 0.95 0.96
SEM (W) — 1.95 2.75 2.53 2.10 2.23 2.33 2.51 2.74
SEM (SS) — 2.60 3.35 3.00 2.60 2.60 3.35 3.35 3.00
Procesos de ejecución n — — 93 135 166 184 269 385 379
M — — 458.83 469.28 476.33 485.19 492.50 495.92 500.27
SD — — 11.09 9.97 9.18 8.99 8.52 9.23 9.07
rcc — — 0.91 0.92 0.92 0.95 0.93 0.93 0.91
SEM (W) — — 3.33 2.82 2.60 2.01 2.25 2.44 2.72
SEM (SS) — — 4.50 4.24 4.24 3.35 3.97 3.97 4.50
Memoria diferida n — — — 52 61 61 76 91 96
M — — — 487.64 490.58 494.09 496.97 499.28 500.22
SD — — — 6.50 6.86 6.32 6.04 6.22 6.18
rcc — — — 0.86 0.91 0.90 0.88 0.90 0.91
SEM (W) — — — 2.43 2.06 2.00 2.09 1.97 1.86
SEM (SS) — — — 5.61 4.50 4.74 5.20 4.74 4.50
Conocimiento n 152 261 324 306 260 253 321 323 368
M 415.29 436.47 449.93 457.16 472.41 481.34 490.61 496.42 503.25
SD 17.97 15.63 15.69 14.96 12.41 12.82 12.49 12.75 12.94
rcc 0.96 0.94 0.94 0.94 0.89 0.90 0.91 0.92 0.92
SEM (W) 3.59 3.83 3.84 3.66 4.12 4.05 3.75 3.61 3.66
SEM (SS) 3.00 3.67 3.67 3.67 4.97 4.74 4.50 4.24 4.24
Percepción fonémica–3 n — — 76 114 190 173 128 103 93
M — — 456.13 470.30 481.48 489.31 493.93 497.42 500.38
SD — — 12.47 11.41 11.76 9.37 9.27 8.56 9.07
rcc — — 0.90 0.92 0.94 0.92 0.90 0.90 0.90
SEM (W) — — 3.94 3.23 2.88 2.65 2.93 2.71 2.87
SEM (SS) — — 4.74 4.24 3.67 4.24 4.74 4.74 4.74

142
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 11 12 13 14 15 16 17 18 19
Batería extendida
Amplia atención n 144 87 80 83 83 82 70 75 45
M 505.39 507.38 513.12 516.89 517.03 521.98 523.70 524.21 527.42
SD 9.07 9.87 11.06 10.95 12.69 11.58 10.12 11.20 11.76
rcc 0.91 0.91 0.92 0.94 0.92 0.93 0.91 0.92 0.92
SEM (W) 2.72 2.96 3.13 2.68 3.59 3.06 3.04 3.17 3.33
SEM (SS) 4.50 4.50 4.24 3.67 4.24 3.97 4.50 4.24 4.24
Fluidez cognitiva n 244 193 180 178 191 180 148 180 124
M 506.45 511.40 516.11 520.66 523.22 526.73 527.49 531.79 533.35
SD 10.87 13.60 14.53 15.38 15.63 15.11 15.74 15.74 14.77
rcc 0.94 0.96 0.96 0.96 0.96 0.96 0.96 0.96 0.95
SEM (W) 2.66 2.72 2.91 3.08 3.13 3.02 3.15 3.15 3.30
SEM (SS) 3.67 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.35
Procesos de ejecución n 274 218 193 197 203 208 174 185 102
M 502.88 507.07 509.08 512.29 513.63 515.68 516.75 517.00 519.37
SD 9.15 9.55 9.35 9.05 9.22 9.60 8.74 10.39 10.03
rcc 0.93 0.93 0.93 0.94 0.93 0.93 0.93 0.93 0.93
SEM (W) 2.42 2.53 2.47 2.22 2.44 2.54 2.31 2.75 2.65
SEM (SS) 3.97 3.97 3.97 3.67 3.97 3.97 3.97 3.97 3.97
Memoria diferida n 97 89 99 96 107 120 92 97 58
M 501.06 502.30 502.65 504.13 504.55 504.34 505.43 506.17 508.82
SD 6.16 5.94 6.99 7.43 6.97 7.23 6.77 7.14 8.01
rcc 0.90 0.94 0.93 0.94 0.92 0.94 0.90 0.91 0.95
SEM (W) 1.95 1.46 1.85 1.82 1.97 1.77 2.14 2.14 1.79
SEM (SS) 4.74 3.67 3.97 3.67 4.24 3.67 4.74 4.50 3.35
Conocimiento n 308 259 247 240 257 258 213 229 150
M 510.67 515.19 519.42 523.65 527.00 531.96 533.89 534.99 541.62
SD 13.55 14.86 16.14 18.58 16.61 16.28 14.87 15.85 14.66
rcc 0.92 0.93 0.94 0.96 0.95 0.94 0.94 0.94 0.94
SEM (W) 3.83 3.93 3.95 3.72 3.71 3.99 3.64 3.88 3.59
SEM (SS) 4.24 3.97 3.67 3.00 3.35 3.67 3.67 3.67 3.67
Percepción fonémica–3 n 99 98 105 83 104 119 94 135 129
M 500.21 504.28 506.33 505.78 510.03 512.76 511.43 514.80 517.32
SD 9.43 10.33 10.05 11.96 9.34 10.35 9.61 12.08 10.58
rcc 0.89 0.90 0.91 0.91 0.90 0.90 0.90 0.90 0.87
SEM (W) 3.13 3.27 3.02 3.59 2.95 3.27 3.04 3.82 3.81
SEM (SS) 4.97 4.74 4.50 4.50 4.74 4.74 4.74 4.74 5.41

143
Apéndice B
Cuadro B-1. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de habilidades cognitivas de la WJ III

EDAD
Compuesto Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería extendida
Amplia atención n 326 107 117 64 41 32 24
M 527.28 523.54 520.78 517.73 513.91 503.40 487.76
SD 11.15 11.71 13.52 10.34 10.91 11.91 13.00
rcc 0.92 0.94 0.95 0.92 0.95 0.94 0.96 0.92
SEM (W) 3.15 2.87 3.02 2.92 2.44 2.92 2.60
SEM (SS) 4.24 3.67 3.35 4.24 3.35 3.67 3.00
Fluidez cognitiva n 625 238 234 130 82 78 43
M 532.16 530.30 528.60 523.55 514.24 504.55 490.04
SD 15.57 16.54 16.29 14.46 19.36 14.22 15.86
rcc 0.96 0.96 0.97 0.96 0.98 0.97 0.98 0.96
SEM (W) 3.11 3.31 2.82 2.89 2.74 2.46 2.24
SEM (SS) 3.00 3.00 2.60 3.00 2.12 2.60 2.12
Procesos de ejecución n 510 262 230 152 95 94 54
M 517.75 514.60 512.56 508.30 504.44 495.52 489.96
SD 10.51 9.94 10.38 11.46 10.31 9.42 12.30
rcc 0.92 0.94 0.95 0.96 0.94 0.96 0.95 0.93
SEM (W) 2.97 2.43 2.32 2.29 2.53 1.88 2.75
SEM (SS) 4.24 3.67 3.35 3.00 3.67 3.00 3.35
Memoria diferida n 227 85 77 72 41 41 38
M 507.65 504.00 502.41 501.50 497.99 492.01 491.65
SD 7.41 7.78 7.54 6.57 7.92 8.93 6.51
rcc 0.93 0.95 0.93 0.92 0.92 0.86 0.83 0.92
SEM (W) 1.96 1.74 2.00 1.86 2.24 3.34 2.68
SEM (SS) 3.97 3.35 3.97 4.24 4.24 5.61 6.18
Conocimiento n 683 326 304 193 137 130 103
M 544.73 546.28 551.10 551.95 545.49 537.40 529.76
SD 16.60 18.15 18.07 19.01 23.98 23.56 24.86
rcc 0.95 0.96 0.97 0.96 0.97 0.97 0.97 0.94
SEM (W) 3.71 3.63 3.13 3.80 4.15 4.08 4.31
SEM (SS) 3.35 3.00 2.60 3.00 2.60 2.60 2.60
Percepción fonémica–3 n 446 112 112 89 55 85 73
M 518.15 512.47 509.72 505.18 499.69 491.46 485.14
SD 11.66 14.27 14.34 13.60 16.13 13.50 15.78
rcc 0.90 0.95 0.94 0.95 0.96 0.95 0.96 0.90
SEM (W) 3.69 3.19 3.51 3.04 3.23 3.02 3.16
SEM (SS) 4.74 3.35 3.67 3.35 3.00 3.35 3.00

144
Apéndice B
Cuadro B-2.
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de aprovechamiento de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
Aprovechamiento total n — — — 136 79 216 255 275 319
M — — — 458.82 462.70 473.32 486.18 497.40 505.93
SD — — — 11.56 10.71 13.42 13.92 11.76 13.14
rcc — — — 0.93 0.96 0.97 0.98 0.98 0.98
SEM (W) — — — 3.06 2.14 2.32 1.97 1.66 1.86
SEM (SS) — — — 3.97 3.00 2.60 2.12 2.12 2.12

Lenguaje oral–Est
a n 156 121 116 123 50 79 73 93 104
M 448.54 457.82 463.07 470.54 483.92 490.55 492.42 500.27 501.56
SD 6.90 8.59 10.17 8.10 10.05 9.26 10.68 7.98 6.79
rcc 0.85 0.87 0.87 0.88 0.88 0.90 0.91 0.87 0.88
SEM (W) 2.67 3.10 3.67 2.81 3.48 2.93 3.20 2.88 2.35
SEM (SS) 5.81 5.41 5.41 5.20 5.20 4.74 4.50 5.41 5.20
Amplia lectura n — — — 55 118 239 267 285 332
M — — — 423.71 444.69 462.94 482.43 496.75 507.95
SD — — — 29.28 21.28 24.23 22.52 17.98 19.87
rcc — — — 0.86 0.92 0.95 0.95 0.95 0.95
SEM (W) — — — 10.96 6.02 5.42 5.04 4.02 4.44
SEM (SS) — — — 5.61 4.24 3.35 3.35 3.35 3.35
Amplias matemáticas n — — — 118 252 324 375 416 465
M — — — 444.52 457.87 471.84 486.29 495.46 504.17
SD — — — 13.33 11.63 13.31 12.94 13.93 13.31
rcc — — — 0.96 0.95 0.94 0.93 0.95 0.94
SEM (W) — — — 2.67 2.60 3.26 3.42 3.12 3.26
SEM (SS) — — — 3.00 3.35 3.67 3.97 3.35 3.67
Amplio lenguaje escrito n — — — — 129 274 354 373 445
M — — — — 466.08 478.76 490.45 497.61 502.60
SD — — — — 12.37 11.98 11.98 10.85 12.17
rcc — — — — 0.94 0.94 0.94 0.94 0.94
SEM (W) — — — — 3.03 2.94 2.94 2.66 2.98
SEM (SS) — — — — 3.67 3.67 3.67 3.67 3.67
Destrezas académicas n — 135 46 203 294 337 381 419 477
M — 326.89 380.86 394.71 425.36 459.30 481.72 494.84 504.08
SD — 19.07 22.37 23.57 26.23 23.50 20.52 18.84 18.19
rcc — 0.98 0.97 0.98 0.98 0.97 0.96 0.96 0.96
SEM (W) — 2.70 3.88 3.33 3.71 4.07 4.10 3.77 3.64
SEM (SS) — 2.12 2.60 2.12 2.12 2.60 3.00 3.00 3.00
a
Est: por falta de espacio la palabra “estándar” queda abreviada

145
Apéndice B
Cuadro B-2. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de aprovechamiento de la WJ III

EDAD
Compuesto Estadístico 11 12 13 14 15 16 17 18 19
Batería estándar
Aprovechamiento total n 299 288 260 248 265 268 210 245 166
M 510.51 515.34 522.44 527.22 530.65 537.96 537.46 540.60 544.69
SD 12.77 14.38 14.42 15.36 16.18 15.91 16.66 16.08 17.30
rcc 0.96 0.97 0.97 0.98 0.97 0.97 0.98 0.97 0.96
SEM (W) 2.55 2.49 2.50 2.17 2.80 2.76 2.36 2.78 3.46
SEM (SS) 3.00 2.60 2.60 2.12 2.60 2.60 2.12 2.60 3.00

Lenguaje oral–Est
b n 94 101 94 70 73 72 59 89 81
M 501.85 504.68 505.12 508.60 509.79 509.46 511.46 510.89 514.56
SD 7.24 7.02 7.99 7.04 7.06 7.36 7.24 6.31 6.76
rcc 0.84 0.86 0.85 0.90 0.85 0.78 0.77 0.82 0.83
SEM (W) 2.90 2.63 3.10 2.23 2.74 3.45 3.47 2.68 2.79
SEM (SS) 6.00 5.61 5.81 4.74 5.81 7.04 7.19 6.36 6.18
Amplia lectura n 305 300 270 256 271 277 218 253 177
M 512.75 519.09 529.08 535.95 540.88 552.68 551.12 554.56 562.35
SD 19.43 22.25 22.30 25.36 26.24 25.36 28.76 29.31 30.01
rcc 0.92 0.93 0.93 0.96 0.93 0.93 0.95 0.93 0.92
SEM (W) 5.49 5.89 5.90 5.07 6.94 6.71 6.43 7.76 8.49
SEM (SS) 4.24 3.97 3.97 3.00 3.97 3.97 3.35 3.97 4.24
Amplias matemáticas n 382 338 304 282 305 302 241 273 187
M 511.22 516.33 520.34 525.57 527.26 533.50 533.35 535.46 539.47
SD 13.33 13.79 15.06 13.77 15.84 16.52 15.63 15.85 15.50
rcc 0.95 0.94 0.95 0.96 0.95 0.95 0.95 0.94 0.95
SEM (W) 2.98 3.38 3.37 2.75 3.54 3.69 3.50 3.88 3.47
SEM (SS) 3.35 3.67 3.35 3.00 3.35 3.35 3.35 3.67 3.35
Amplio lenguaje escrito n 370 325 303 274 295 297 238 265 182
M 507.27 512.12 516.61 519.46 522.36 525.66 525.73 528.11 531.87
SD 11.07 11.68 11.87 11.76 12.09 11.85 12.08 11.86 11.79
rcc 0.93 0.94 0.94 0.94 0.92 0.92 0.93 0.92 0.91
SEM (W) 2.93 2.86 2.91 2.88 3.42 3.35 3.20 3.36 3.54
SEM (SS) 3.97 3.67 3.67 3.67 4.24 4.24 3.97 4.24 4.50
Destrezas académicas n 391 341 312 287 306 304 240 267 188
M 511.71 518.91 524.80 529.24 532.04 538.89 538.77 542.84 548.34
SD 16.28 16.85 17.18 15.95 17.57 16.22 17.09 16.70 17.21
rcc 0.94 0.94 0.95 0.96 0.94 0.93 0.95 0.94 0.94
SEM (W) 3.99 4.13 3.84 3.19 4.30 4.29 3.82 4.09 4.22
SEM (SS) 3.67 3.67 3.35 3.00 3.67 3.97 3.35 3.67 3.67
b
Ext: por falta de espacio la palabra “extendida” queda abreviada

146
Apéndice B
Cuadro B-2. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de aprovechamiento de la WJ III

EDAD
Compuesto Estadístico 20-29 30-39 40-49 50-59 60-69 70-79 80+ Mediana
Batería estándar
Aprovechamiento total n 746 324 310 195 114 120 77
M 546.02 537.19 539.60 537.44 537.14 529.32 520.95
SD 17.58 23.13 22.94 19.79 18.21 16.40 16.78
r 0.97 0.98 0.98 0.98 0.98 0.98 0.98 0.98
cc
SEM (W) 3.05 3.27 3.24 2.80 2.57 2.32 2.37
SEM (SS) 2.60 2.12 2.12 2.12 2.12 2.12 2.12
Lenguaje oral–Est n 264 76 79 56 25 54 53
M 511.77 507.95 505.97 501.55 500.49 493.49 491.89
SD 8.31 7.55 9.87 12.44 9.62 13.13 11.85
rcc 0.86 0.94 0.94 0.92 0.89 0.94 0.92 0.87
SEM (W) 3.11 1.85 2.42 3.52 3.19 3.22 3.35
SEM (SS) 5.61 3.67 3.67 4.24 4.97 3.67 4.24
Amplia lectura n 785 339 328 202 121 135 101
M 565.58 554.07 556.87 553.74 555.87 545.93 530.29
SD 30.78 37.59 38.85 33.93 31.10 26.18 24.66
rcc 0.93 0.95 0.95 0.94 0.97 0.94 0.94 0.94
SEM (W) 8.14 8.41 8.69 8.31 5.39 6.41 6.04
SEM (SS) 3.97 3.35 3.35 3.67 2.60 3.67 3.67
Amplias matemáticas n 855 386 357 220 138 155 112
M 540.50 531.95 534.27 530.86 528.37 520.11 515.21
SD 15.85 17.14 17.59 16.48 13.80 17.10 16.44
rcc 0.95 0.96 0.96 0.96 0.96 0.97 0.97 0.95
SEM (W) 3.54 3.43 3.52 3.30 2.76 2.96 2.85
SEM (SS) 3.35 3.00 3.00 3.00 3.00 2.60 2.60
Amplio lenguaje escrito n 845 379 347 212 134 142 99
M 531.69 525.46 526.94 524.50 521.66 515.21 509.70
SD 13.13 17.31 17.05 16.48 16.53 14.90 16.63
rcc 0.94 0.97 0.97 0.97 0.96 0.96 0.97 0.94
SEM (W) 3.22 3.00 2.95 2.86 3.31 2.98 2.88
SEM (SS) 3.67 2.60 2.60 2.60 3.00 3.00 2.60
Destrezas académicas n 857 390 364 221 137 161 123
M 550.55 540.46 544.37 542.98 540.09 533.89 529.36
SD 18.99 23.92 24.83 23.05 22.96 20.85 25.50
rcc 0.95 0.97 0.98 0.97 0.98 0.97 0.98 0.96
SEM (W) 4.25 4.14 3.51 3.99 3.25 3.61 3.61
SEM (SS) 3.35 2.60 2.12 2.60 2.12 2.60 2.12

147
Apéndice B
Cuadro B-2. (cont.)
Estadísticos descriptivos y de confiabilidad de los compuestos – Pruebas de aprovechamiento de la WJ III

EDAD
Compuesto Estadístico 2 3 4 5 6 7 8 9 10
Batería estándar
F