Está en la página 1de 190

1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES

PROGRAMA DE PSICOLOGA

401517 CURSO DE PSICOMETRA

MELISSA JUDITH ORTIZ BARRERO (Director Nacional)

CLAUDIA ANDREA PAREDES Acreditadora

Bogot, D.C. 2010

NDICE I. Protocolo Ficha Tcnica Introduccin Justificacin Intencionalidades formativas Unidades didcticas Contexto terico Metodologa Sistema de Evaluacin Recursos Tecnolgicos Glosario de Trminos II. Gua Didctica Presentacin Fases del Aprendizaje Tcnicas e Instrumentos para la Objetivacin del Aprendizaje Portafolio de Desempeo Personal y Grupal Descripcin de Actividades III. Modulo Unidad 1. Historia y conceptos bsicos de la psicometra Captulo 1. Historia de la psicometra Leccin 1. Antecedentes y formas rudimentarias de las pruebas psicolgicas Leccin 2. Era de los instrumentos de bronce Leccin 3. pruebas Estudio de las diferencias individuales e importancia de las 5 5 6 7 8 14 15 16 18 19 22 25 25 25 26 27 28 32

Leccin 4. Influencia de las primeras investigaciones sobre inteligencia Leccin 5. Consolidacin institucional de la psicometra

Captulo 2. La psicometra y su mtodo Leccin 6. Definicin de la psicometra Leccin 7. Vertiente prctica de la psicometra Leccin 8. Definiciones y objetivo de la psicometra Leccin 9. El mtodo de la psicometra Leccin 10. La teora de los test Captulo 3. Desarrollo de las pruebas y metodologa estadstica de la psicometra Leccin 11. Confiabilidad Leccin 12. Validez Leccin 13. Conceptos estadsticos, normas y estandarizacin parte i Leccin 14. Conceptos estadsticos, normas y estandarizacin parte ii Leccin 15. Construccin de pruebas Unidad 2. Aproximacin al uso de las pruebas psicolgicas Captulo 4. Las pruebas y su proceso de aplicacin TEMA 2A Y 2B Leccin 16. Definicin de una prueba Leccin 17. Tipos y usos de las pruebas (obtencin) Leccin 18. Procesos de aplicacin estandarizados Leccin 19. Procesos de aplicacin deseables Leccin 20. Influencias del evaluador y del evaluado Captulo 5. Pruebas de personalidad Leccin 21. Medicin de la personalidad Leccin 22. MMPI Leccin 23. 16pf Leccin 24. Test de Rorschach Leccin 25. Casa-Arbol-Persona (H-T-P) Captulo 6. Pruebas de inteligencia y otras pruebas de las funciones cognitivas

Leccin 26. Wisc Leccin 27. Barsit Leccin 28. Test de aptitudes diferenciales (DAT) o matrices progresivas de Raven Leccin 29. Test guestaltico visomotor de Bender (p.405) Leccin 30. Minimental

I. PROTOCOLO

Ficha Tcnica Nombre del curso: Palabras clave: Institucin: Ciudad: Autor del Protocolo: Psicometra Validez, Confiabilidad, Pruebas psicogicas, medicin, variables Universidad Nacional Abierta y a Distancia -UNAD. Bogot Colombia Melissa Ortiz B. 2010

Ao:

Unidad es Acadmicas: 2 Campo de formacin: Disciplinar

rea del conocimiento: Ciencias Sociales y Humanidades Crditos acadmicos: Tipo de curso: Dos (2) Terico prctico. Estudiantes de pregrado del programa de psicologa de la Universidad Nacional Abierta y a Distancia -UNAD-. Los estudiantes evalan las capacidades mentales haciendo uso de diversos mtodos, tcnicas y pruebas de evaluacin.

Destinatarios:

Competencia general de aprendizaje:

Metodologa de oferta: A distancia. (Campus Virtual) Formato de circulacin: Denominacin de las unidades didcticas: Documentos impresos, Web. 1. Historia y conceptos bsicos de la Psicometra 2. Aproximacin al uso de las pruebas psicolgicas

Introduccin

Las intencionalidades formativas de este curso van dirigidas principalmente al desarrollo de competencias cognoscitivas y prcticas en el orden del analizar, explicar los fundamentos conceptuales y metodolgicos sobre los que se construye la psicometra y los principales instrumentos de medicin de eventos psicolgicos.

Sus unidades didcticas abarcan los temas de la historia de la psicometra, sus presupuestos bsicos tericos y metodolgicos y la comprensin y uso de algunos instrumentos que miden o evalan diferentes caractersticas psicolgicas de los individuos, entre ellos estn la prueba Rorschach, el MMPI, el 16 PF y el WISC-R.

El rea temtica abordar el estudio de los principios de la medicin y evaluacin en la disciplina de la psicologa y de los fenmenos psquicos que son determinantes en el comportamiento humano, en tanto que la psicometra es un rea de la psicologa cuya finalidad intrnseca consiste en aportar soluciones al problema de la medida en cualquier proceso de investigacin del comportamiento. Es adems un campo metodolgico que incluye teoras, mtodos y usos de la medicin psicolgica en aspectos conceptuales e instrumentales.

La metodologa enseanza - aprendizaje de este curso se adelantar utilizando las estrategias de tipo interactivo desarrolladas por la UNAD, propias de la Educacin a Distancia. Los procesos de evaluacin requerirn del estudiante su disposicin investigativa y participativa, se promover la discusin y la proposicin.

Los documentos que el estudiante se encargar de leer para llevar a buen trmino el curso sern principalmente escritos que se encuentran en las revistas electrnicas cientficas de psicologa (medicin y psicometra). La participacin y el trabajo activo tanto del estudiante como del tutor permitirn que el curso cumpla las metas propuestas.

Al ser un curso diseado para estudiantes de educacin a distancia, hace nfasis en la autogestin formativa mediada sincrnica y asincrnica, proponiendo interacciones entre tutor y estudiante y de los estudiantes entre s. Constituye dos crditos acadmicos equivalentes a 96 horas de estudio, distribuidas de la siguiente manera: Estudio independiente: 64 Acompaamiento y seguimiento tutorial: 32 El campo de formacin corresponde al rea bsica disciplinar dentro de los crditos obligatorios del plan de estudios. El curso es conducente a la autogestin estudiantil de los conocimientos metodolgicos y conceptuales tericos necesarios para la comprensin y desarrollo de habilidades en medicin de variables psicolgicas. A travs del curso se prepara al estudiante para reflexionar crticamente en torno a la utilidad de la medicin y la evaluacin de las habilidades y destrezas cognoscitivas adems de los riesgos y desventajas que pueden generar. Justificacin

La psicometra es una herramienta indispensable para las actividades relacionadas con la psicologa principalmente en el campo de la evaluacin y el diagnstico, permitiendo niveles altos y objetivos de medicin del comportamiento humano. Una de las dificultades que debe afrontar el psiclogo, en cualquiera de sus reas de desempeo, es precisamente la evaluacin, puesto que el hombre con su diversidad en todos los aspectos hace que la cuantificacin del comportamiento sea compleja.

La formacin en psicometra provee a los estudiantes la posibilidad de acercarse a la medicin de eventos psicolgicos; forma al estudiante en los paradigmas

particulares de resolucin de problemas psicolgicos, instalndolo en los procesos de comprensin y uso tcnico de pruebas propias de esta ciencia. Algunas preguntas que guiarn este curso son las que siguen:

Cul ha sido el curso histrico que ha permitido el desarrollo de pruebas o test de medicin de eventos psicolgicos?

Qu significan en la medicin los conceptos de validez y confiabilidad? Qu pruebas se utilizan con mayor frecuencia en psicologa y que fenmenos psicolgicos miden?

Para resolver estos y otros cuestionamientos, el presente curso acadmico abarcara dos elementos centrales de la psicometra: la historia, los elementos metodolgicos y conceptuales para la construccin de test y la segunda parte estar dirigida a la comprensin y manejo de algunas pruebas de uso tradicional en diferentes reas de la psicologa.

Intencionalidades Formativas Propsitos de formacin 1. Explicar los conceptos fundamentales sobre los que se construye la psicometra como estrategia cuantitativa de la psicologa, valindose de las principales teoras y modelos psicolgicos y estadsticos que la ha abordado. 2. Valorar los aportes tericos de las diferentes escuelas psicolgicas a la comprensin de la medicin, partiendo de criterios cientficos y experimentales. 3. Demostrar la existencia e importancia de los procesos psicolgicos y su posibilidad de cuantificarlos. 4. Hacer una aproximacin metodolgica y conceptual sobre las capacidades cuantitativas y cualitativas de algunas pruebas que se han utilizado para medir diferentes caractersticas psicolgicas, a travs de ejercicios y aplicaciones y calificacin de algunos instrumentos de alta tradicin en la psicologa cientfica.

5. Contribuir a la mejora de hbitos de indagacin y pesquisa sistemtica travs del desarrollo de competencias de investigacin formativa mediante el conocimiento de protocolos y pruebas psicomtricas. 6. Generar en el estudiante una actitud critica, a travs del fomento de la discusin y el trabajo colaborativo en redes de comunidad acadmica en psicometra, a partir de la seleccin y valoracin de las diferentes pruebas que aporta la psicologa y otras formas de abordaje de la medicin del comportamiento. 7. Potenciar los procesos de autoaprendizaje del estudiante a travs del desarrollo de estrategias de autogestin formativa, a partir de la interaccin con medios y mediaciones incluidos escenarios virtuales, coherentes con la estructura epistemolgica y metodolgica de la medicin en psicologa. 8. Desarrollar capacidades de medicin y evaluacin psicolgica, a travs del entrenamiento en el uso de algunas pruebas y estrategias que permitan una aproximacin del estudiante a los problemas de desarrollo y consolidacin de la psicometra. Los propsitos expuestos se pueden globalizar en la siguiente sntesis: Contribuir al desarrollo del espritu investigativo del estudiante en el rea de Psicometra, a partir del anlisis de los elementos centrales de los mtodos y aproximaciones tericas, mediante la organizacin y seleccin de actividades que perfilen el autoaprendizaje y la discusin con sus pares y el docente gua. Objetivos de aprendizaje Que el estudiante adquiera los conocimientos necesarios y suficientes que permitan la comprensin de los aportes de la psicometra al desarrollo y estudio del comportamiento (lase personalidad, actitud, aptitud, inteligencia,

competencia, etc.), mediante el estudio de las diferentes teoras y modelos psicolgicos y que la explican.

10

Que el estudiante describa, relacione y comparare los aportes tericos y metodolgicos que han permitido el desarrollo de la medicin en psicologa, a travs de ejercicios de aplicacin de pruebas psicomtricas.

Que el estudiante comprenda la importancia de la medicin, mediante el estudio y aplicacin a situaciones donde se requiera la cuantificacin del

comportamiento.

Que los estudiantes adquieran las destrezas necesarias para la formulacin y resolucin de problemas de investigacin psicomtrica.

Capacitar a los alumnos para comprender y analizar crticamente la bibliografa relacionada con cualquiera de los campos de la Psicometra.

Que los alumnos conozcan y sepan utilizar adecuadamente los principales esquemas procedimentales para la medicin de variables psicolgicas.

Dotar a los alumnos de herramientas para que generen sus propios criterios con la finalidad de que puedan realizar juicios crticos en relacin con la calidad y adecuacin de los diferentes instrumentos de medida que habrn de utilizar en el desempeo de su labor como profesionales.

Motivar positivamente a los alumnos hacia la Metodologa de las Ciencias del Comportamiento en general y respecto a los problemas propios de la Psicometra en particular.

Promover actitudes favorables a la investigacin cientfica y al mtodo cientfico como una forma de enfrentarse a los problemas psicolgicos.

11

Competencias Teniendo en cuenta las fases del aprendizaje (reconocimiento, profundizacin y transferencia), se desarrollarn entonces, competencias de tipo cognoscitivo, prctico y afectivo que permitirn la apropiacin e interiorizacin del conocimiento. Las competencias que se presentan a continuacin procuran vincular e integrar los diferentes elementos tericos y metodolgicos de los diferentes contenidos del presente curso y que el estudiante desarrollar a lo largo del aprendizaje meditico sobre el que est basada su didctica:

Tener como meta de actuacin la calidad del trabajo realizado (es decir, no slo trabajar de modo eficaz sino tambin del mejor modo posible).

Inters por la investigacin y creacin de nuevos datos en Psicologa, tanto como receptor o evaluador de las innovaciones, como usuario o como generador de las mismas.

Conocer y cumplir la normativa tica propia de la profesin y de la investigacin psicolgica y respetar los derechos de consultantes y usuarios de los servicios psicolgicos.

Tener la capacidad de valorar los procedimientos utilizados para obtener datos psicolgicos relevantes as como para valorar la pertinencia de los informes resultantes de la investigacin y evaluacin psicolgicas.

Transferencia y uso flexible del conocimiento.

Habilidad para transferir el conocimiento acadmico a las diferentes situaciones reales.

12

Saber aplicar distintos mtodos de medicin, evaluacin y diagnstico en los mbitos aplicados de la Psicologa.

Conocer y respetar la diversidad psicolgica, las creencias y valores de otros grupos humanos.

Tener inters y respeto por las aportaciones de otros campos a la Psicologa y de sta a ellos.

Manejo de informtica e Internet como usuario. Saber planificar y realizar una bsqueda bibliogrfica o de referencias tanto en bases de datos informatizadas como en bibliotecas y hemerotecas.

Conocer y utilizar adecuadamente los conceptos cientficos propios de la Psicologa.

Saber comunicar resultados psicolgicos de forma oral adecuando la presentacin al destinatario/s de la misma.

Saber analizar, sintetizar y resumir la informacin procedente de textos cientficos y profesionales relacionados con la psicologa.

Identificar la conducta o el proceso psicolgico objeto de estudio, as como las conductas o procesos vinculados y la estrategia para evaluarlos o medirlos.

Metas Al finalizar el curso el estudiante estar en capacidad de: Reconocer los mtodos y tcnicas que se han usado en psicometra usando como estrategia el desarrollo de ejercicios aplicados.

13

Reconocer algunos hitos histricos del estudio de la medicin psicolgica a partir de la lectura de los textos asignados al curso.

Esbozar mediante mapas conceptuales, los componentes medulares de las diferentes herramientas estadsticas que cuantifican el comportamiento.

Analizar los conceptos y categoras fundamentales de las pruebas psicolgicas, usando como estrategia la comunicacin interactiva (Chat) con sus compaeros de curso y el tutor.

A travs del trabajo grupal, aplicar los conceptos bsicos de la medicin psicolgica para explicar y predecir el comportamiento en diferentes campos de la accin humana.

14

UNIDADES DIDCTICAS

Unidad Unidad 1. Historia Y Conceptos Bsicos De La Psicometra

Captulo Captulo 1. Histora De La Psicometra

Leccin

Leccin 1. Antecedentes Y Formas Rudimentarias De Las Pruebas Psicolgicas Leccin 2. Estudio De Las Diferencias Individuales E Importancia De Las Pruebas Leccin 3. Era De Los Instrumentos De Bronce Leccin 4. Influencia De Las Primeras Investigaciones Sobre Inteligencia Leccin 5. Consolidacin Institucional De La Psicometra

Captulo 2. La Psicometra Y Su Mtodo

Leccin 6. Definicin De La Psicometra Leccin 7. Vertiente Prctica De La Psicometra Leccin 8. Definiciones Y Objetivo De La Psicometra Leccin 9. El Mtodo De La Psicometra Leccin 10. La Teora De Los Test

Captulo 3. Desarrollo De Las Pruebas Y Metodologa Estadistica De La Psicometra

Leccin 11. Confiabilidad (Completar) Leccin 12. Validez (Completar) Leccin 13. Conceptos Estadisticos, Normas Y Estandarizacin Parte I Leccin 14. Conceptos Estadisticos, Normas Y Estandarizacin Parte Ii Leccin 15. Construccin De Pruebas

15

Unidad 2. Aproximacin Al Uso De Las Pruebas Psicolgicas

Captulo 4. Las Pruebas Y Su Proceso De Aplicacin

Leccin 16. Definicin De Una Prueba Leccin 17. Tipos Y Usos De Las Pruebas (Obtencin) Leccin 18. Procesos De Aplicacin Estandarizados Leccin 19. Procesos De Aplicacin Deseables Leccin 20. Influencias Del Evaluador Y Del Evaluado

Captulo 5. Pruebas De Personalidad

Leccin 21. Medicin De La Personalidad Leccin 22. Mmpi Leccin 23. 16pf Leccin 24. Test De Rorschach Leccin 25. Casa-Arbol-Persona (H-T-P)

Captulo 6. Pruebas De Inteligencia Y Otras Pruebas De Las Funciones Cognitivas

Leccin 26. Wisc Leccin 27. Barsit Leccin 28. Test De Aptitudes Diferenciales (Dat) O Matrices Progresivas De Raven Leccin 29. Test Guestaltico Visomotor De Bender (P.405) Leccin 30. Minimental

16

Descripcin de las unidades didcticas A partir de la concepcin epistemolgica para el autoaprendizaje de la psicometra se ha seleccionado las palabras claves: psicometra, medicin personalidad, inteligencia, validez, confiabilidad, etc, como base para el diseo de las unidades didcticas indispensables en el presente curso. Unidad 1 Historia y Conceptos Bsicos de la Psicometra La unidad introduce al estudiante en el desarrollo histrico de la psicometra, sus aproximaciones y autores ms influyentes y el proceso cientfico por el cual la medicin adquiere importancia y reconsolida principalmente con el uso de test y de herramientas estadsticas. Unidad 2 Aproximacin al Uso de Pruebas Estandarizadas Presenta las caractersticas de cuatro pruebas de gran reconocimiento en la psicologa y con el acompaamiento del tutor se espera que los estudiantes logren entrenarse en su uso e interpretacin de resultados. Contexto Terico La Psicometra es la ciencia de la medida de los aspectos "psicolgicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas acumuladas en esta disciplina estn diseadas para definirlos de manera fiable antes de cuantificarlos. Los crticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas.

17

Los primeros trabajos de psicometra se desarrollaron para medir la inteligencia. Posteriormente, la teora psicomtrica se ha aplicado a la medida de otros aspectos como la personalidad, las actitudes, las creencias, el rendimiento acadmico y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes bloques: teora de los test, que hace referencia a la construccin, validacin y aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de escalas psicofsicas y psicolgicas. A su vez, la teora de los test se divide en dos ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems. Los conceptos clave de la teora clsica de los tests son: confiabilidad (fiabilidad) y validez. "Confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, confiabilidad y validez, admiten un tratamiento matemtico (estadstico). La consistencia interna puede calcularse por correlacin entre distintos tests. Los mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo del test-retest y mtodo de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrn aceptado como vlida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Metodologa

Este curso se desarrollar de manera virtual, con el acompaamiento del tutor y el trabajo orientado a travs del Protocolo, la Gua de Actividades y el Protocolo. Para

18

cada Unidad Didctica se desarrollarn actividades tanto individuales como colaborativas que den cuenta de las competencias y metas a desarrollar. Tambin se generarn espacios de discusin y participacin a travs de foros virtuales que sern sealados en la Gua de Actividades. Con esto no slo se pretende un aprendizaje memorstico de los conceptos ms relevantes y caractersticos de la Psicometra, sino que tambin se procurar la consolidacin de un sentido crtico y proponente que facilite la aplicacin de estos conceptos y sus mtodos de abordaje a situaciones donde el actuar y el criterio del psiclogo sea determinante, elemento bsico de las intencionalidades formativas del curso. Fase de reconocimiento hace referencia a la confrontacin de los contenidos del curso con los conocimientos y experiencias previas, identificando nuevos conceptos a adquirir. Fase de profundizacin se refiere al conjunto de actividades orientadas a precisar las nociones, procedimientos y estado del arte en los campos de la medicin psicolgica. Fase de transferencia integra los aprendizajes mediante una recontextualizacin, resignificacin y aplicacin autnoma a situaciones problmicas de naturaleza terica o prctica, generando competencias para el futuro desempeo

interdisciplinario y transdisciplinario en el campo profesional. El proceso general se complementa y refuerza con procesos de autoevaluacin, coevaluacin y heteroevaluacin, articulados con sistemas de interactividad pedaggica para socializacin de logros del estudio independiente, en pequeos grupos colaborativos y tutora individual. El proceso final se refuerza con la retroalimentacin sobre los logros sustentados en los procesos evaluativos a nivel formativo.

19

Sistema de Evaluacin La evaluacin se concibe como un proceso continuo orientado a verificar las competencias logradas en concordancia con los objetivos del curso acadmico de Psicometra. El proceso de evaluacin se guiar por el modelo institucional y se ejecutar con base en los siguientes momentos: autoevaluacin, coevaluacin y heteroevaluacin Autoevaluacin: La realiza el estudiante al inicio y al final de cada fase de aprendizaje con el fin de identificar las debilidades o vacos cognoscitivos, como sus logros o dominios en el abordaje de la medicin psicolgica. La autoevaluacin se entiende como una oportunidad para hacer la revisin y reflexin autocrtica de los procesos, aprendizajes y productos que esta llevando a cabo el estudiante. Tiene por objeto que el estudiante juzgue objetiva y constructivamente sus propios esfuerzos, resultados y productos con base en las metas trazadas por l mismo. Con esta se espera identificar los progresos alcanzados por el estudiante y las necesidades, aspiraciones y metas para aprendizajes futuros. Coevaluacin: Es un proceso de trabajo colaborativo de los estudiantes en el cual socializan el resultado de sus construcciones personales de conocimiento y reciben la realimentacin de sus compaeros, sustentan sus puntos de vista, asimilan nuevos enfoques y ajustan sus planteamientos con el enriquecimiento conceptual logrado en el dialogo de saberes. Los momentos de coevaluacin integran la orientacin pedaggica de la gua de actividades y la autorregulacin del aprendizaje por parte del estudiante. Heteroevaluacin: Es una evaluacin sumativa coordinada a nivel nacional en cuanto a fechas y contenidos, adems de la revisin y realimentacin por parte del tutor sobre las construcciones cognitivas registradas sistemticamente en el portafolio de desempeo personal.

20

El tutor enfoca la heteroevaluacin como un anlisis de logros a partir del acompaamiento a los estudiantes en sus procesos de aprendizaje evidenciados en resultados participativos en listas de correo, foros, mural electrnico, laboratorios y dems eventos tericos o prcticos con productos de conocimiento destinados a registro en el portafolio de desempeo personal. Ms el resultado del examen final. La distribucin porcentual de notas asignadas en los procesos evaluativos es la siguiente: Valores de notas por actividades Resultados o productos de las actividades de aprendizaje consignados en el PDP y PDG segn fases de aprendizaje. Fase de reconocimiento: 10% de la nota Fase de profundizacin: 30% de la nota Fase de transferencia: 20% de la nota Total: 60% de la nota definitiva Valor: 40% de la nota definitiva Prueba objetiva Evaluacin final nacional

Recursos Tecnolgicos Las actividades estn centradas en el estudiante como autogestor de los procesos de aprendizaje, por lo cual se establece una sinergia de medios y mediaciones. Los recursos que el estudiante aprovechar son los siguientes:

El computador como herramienta informtica para estudio con CD ROM, con informaciones visuales, auditivas y de texto escrito.

21

El computador como canal electrnico hacia links hipertextuales en ambientes virtuales de autoaprendizaje, tiles para gestin de conocimiento actualizado.

Sistemas y plataformas tecnolgicas institucionales para videoconferencias y audioconferencias.

Protocolo acadmico, gua de actividades de aprendizaje, mdulo, fuentes hipertextuales de consulta, para estudio temtico y orientacin pedaggica.

Programacin de eventos de socializacin y trabajo colaborativo y sesiones de asesora.

Eventos de prcticas de laboratorio de carcter obligatorio en el curso. Interacciones programadas en aula virtual.

Una presentacin sistematizada de estos recursos interactivos se puede visualizar en la grfica Recursos:

22

Fuentes Documentales Adems de los recursos didcticos como material impreso y ayudas audiovisuales incluidas como parte de las unidades didcticas de este curso, se seala en cada una de ellas una serie de fuentes documentales hipertextuales que permiten profundizar con suficiencia y calidad las construcciones conceptuales definidas en los objetivos y metas de aprendizaje.

23

GLOSARIO DE TRMINOS Psicometra: rea de la psicologa cientfica que se encarga de la medida de los aspectos "psicolgicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas acumuladas en esta disciplina estn diseadas para definirlos de manera fiable antes de cuantificarlos. Los crticos argumentan que tales definiciones y cuantificaciones son imposibles y que las mediciones a menudo son tergiversadas. Inteligencia: Es la capacidad evolutiva por la cual el individuo es capaz de tomar decisiones dependiendo de su entorno, y mejorar sus condiciones de

supervivencia, como individuo, como grupo o como especie. Esta definicin se basa en que no vivimos para pensar, sino que pensamos para vivir. Evolutivamente hablando, los seres ms simples reaccionan ante el medio por programacin gentica, miedos y afinidades instintivas. Un pequeo cambio en estos instintos supone muchas generaciones. Para que la adaptacin al medio sea ms rpida son los propios individuos los que han de reprogramar sus comportamientos, aprendiendo del medio y reaccionando en consecuencia, esto es, con inteligencia. Habilidad: Grado de competencia de un sujeto concreto frente a un objetivo determinado. Es decir, en el momento en el que se ha alcanzado el objetivo propuesto en la habilidad, se considera que sta se ha logrado a pesar de que este objetivo se haya conseguido de una forma poco depurada y econmica. Se considera a la habilidad como a una aptitud innata o desarrollada o varias de estas, y al grado de mejora que se consiga a estas mediante la prctica, se le denomina talento.

24

Personalidad: Conjunto dinmico de caractersticas emocionales, de pensamiento y de conducta que son nicas a cada persona. Hay diversas aproximaciones tericas a la personalidad en psicologa, cada una proponiendo una relacin distinta entre la personalidad y otros constructos psicolgicos, sobre cmo se desarrolla la personalidad o cmo sta interacta con los sucesos. Se puede definir como la suma total de las formas en que un individuo reacciona y se relaciona con los dems; son los rasgos mensurables que exhibe una persona. 16PF: Sixteen Personality Factors" de Raymond Catell. El 16PF es una prueba estructurada comnmente utilizada y favorecida, por diversos investigadores alrededor del mundo, como instrumento para la medida y comprensin de la personalidad. Es el resultado de ms de cuarenta aos de investigacin emprica por el psiclogo Raymond B. Cattell, quien redujo 4504 rasgos de personalidad a 16 rasgos bsicos, mediante anlisis factorial. La prueba se basa en la medida independiente de varios factores psicolgicos. Ha sido debidamente validada y revisada, y al presente existen varias formas (A, B, C, D & E) que facilitan la aplicabilidad de la prueba a los diferentes intereses especficos de investigacin. MMPI: Inventario Multifasico de Personalidad de Minnesota (S.R. Hathaway y J.C. Mckiney, USA.) Cuestionario de Personalidad encaminado a la bsqueda de trastornos psicolgicos, formado por 566 tems a los que hay que responder V o F. Tiene tres grupos de escalas y mide 19 variables. Tiene en cuenta la validez interna de las respuestas del sujeto. WISC R: Escala de Inteligencia (Revisada) de David Wechsler para Nios. Test de Rorscharch: Test de personalidad Proyectivo (H. Rorscharch). Evala aspectos profundos de la personalidad. Contiene diez lminas con manchas de tinta inestructuradas susceptibles de diversas interpretaciones. Su aplicacin requiere conocimientos psicolgicos amplios y una amplia experiencia.

25

Test Psicolgico: Una situacin experimental estandarizada que sirve de estmulo a un comportamiento. Tal comportamiento se evala por una comparacin estadstica, respecto a otros individuos colocados en la misma situacin, lo que permite clasificar al sujeto examinado, ya sea cuantitativamente, ya sea tipolgicamente (Pierre Pichot, "Los test mentales", Editorial Paids. Buenos Aires. 1960 Teora de los tests: Los contenidos de la psicometra se articulan,

fundamentalmente, en dos grandes bloques: teora de los test, que hace referencia a la construccin, validacin y aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de escalas psicofsicas y psicolgicas. La teora de los test se divide en dos ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems. Los conceptos clave de la teora clsica de los tests son: fiabilidad y validez. "Fiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades, fiabilidad y validez, admiten un tratamiento matemtico.

26

GUA DIDCTICA Presentacin La gua de actividades del curso de Psicometra explicita la configuracin de las situaciones didcticas, mediante la planificacin de actividades que permitan el logro de metas de aprendizaje en las diversas fases del aprendizaje, con un sentido crtico del cambio entre situaciones de entrada y de salida. FASES DEL APRENDIZAJE Fase de Reconocimiento Corresponde a la interaccin entre los conocimientos previos y las nuevas conceptualizaciones del curso. Las actividades se enmarcan en situaciones didcticas que para la fase de reconocimiento, por unidad, pueden corresponder a las siguientes posibilidades de situaciones didcticas: Actividad de induccin al curso, con acompaamiento tutorial en grupo. Medio para la interactividad: Videoconferencia Estudio independiente, individual o en pequeo grupo: identifica conceptos conocidos y conceptos nuevos que necesitan posterior profundizacin. Tutora sincrnica o asincrnica en grupo de curso sobre cada unidad temtica. Medio para la interactividad: lista de distribucin en aula virtual o mural. Tutora sincrnica o asincrnica individual: asesora para aclarar dudas en el proceso de aprendizaje con el fin de seleccionar lneas apropiadas de identificacin de conceptos para trabajar en su reconceptualizacin. Tutora a pequeos grupos colaborativos para mejorar la estrategia de estudio.

27

Autoevaluacin y coevaluacin formativa. Elaboracin de portafolio. Fase de Profundizacin Corresponde al desarrollo de actividades de aprendizaje que permiten analizar, reconceptualizar y resignificar los conceptos encontrados en la fase de reconocimiento. Fase de Transferencia Se orienta a aplicar el conocimiento a situaciones problmicas, toma de decisiones e interacciones con otros campos disciplinares. Segn cada caso particular de las temticas de las unidades, en estas fases pueden aparecer todas o slo algunas de las situaciones didcticas referenciadas en la fase de reconocimiento TCNICAS E INSTRUMENTOS PARA LA OBJETIVACIN DEL APRENDIZAJE En situaciones didcticas grupales El estudiante y el tutor (cuando participa sincrnicamente en apoyo pedaggico de la actividad), cumplirn el encuentro en fechas especificadas en la programacin acadmica semestral previamente comunicada y socializada en la agenda de aula virtual, y aplicarn como instrumento un formato que registre la actividad colectiva, en el marco de objetivos explcitos y de resultados participativamente calificados. La tcnica de apoyo pedaggico puede consistir, a nivel nacional, en videoconferencia, combinacin de mural digital (previamente diseado y

enriquecido participativamente) con foro virtual dentro de das especficamente asignados.

28

El instrumento incorporar en las conclusiones del encuentro, apreciaciones sobre: logros, funcionalidad de la tcnica grupal desarrollada, sugerencias de

mejoramiento. En otros casos, se diligenciarn informes grupales a partir de guas de prcticas o laboratorios, formatos grupales sobre solucin de situaciones problmicas asignadas para trabajo colaborativo dentro de cada unidad temtica o como resultado de la participacin en procesos de investigacin formativa, formatos de coevaluacin para el caso de trabajo grupal colaborativo, etc. En caso de estudio independiente individual El estudiante aplicar como instrumento, formatos de informe para registro de sus logros en la construccin de conocimiento, los cuales tendrn una insercin oportuna en el portafolio del curso. Los protocolos especficos pueden ser: formularios diligenciados, mapas

conceptuales complementados o modificados, guas diligenciadas, ensayos elaborados como soporte de la reflexin y resignificacin conceptual, etc. Este tipo de protocolos incluirn informes autoevaluativos, donde el estudiante explicitar su nivel de desempeo previo o situacin cognitiva de entrada y el nivel de logro alcanzado, conjuntamente con una prospectiva de profundizacin o actualizacin del conocimiento. PORTAFOLIO DE DESEMPEO PERSONAL (PDP) Y GRUPAL (PDG) La evidencia del trabajo acadmico del estudiante es el portafolio de desempeo personal, en el cual deben recopilarse de manera organizada los logros de aprendizaje y sus soportes o productos intelectuales. Los contenidos mnimos que deben aparecer en el PDP y PDG son los siguientes:

Formatos de encuentro grupal: objetivos, logros, funcionalidad de las tcnicas aplicadas, conclusiones y sugerencias de mejoramiento.

29

Informes de construccin y recontextualizacin cognitiva independiente: conceptualizaciones, mapas conceptuales o ideogramas similares, ensayos disciplinares, resmenes de lecturas, etc.

Informes de estudio colaborativo: socializacin y foro grupal crtico sobre formulacin de situacin problmica, diseos metodolgicos, resultados o logros, crtica o coevaluacin de procesos y logros, informes de prcticas o laboratorios, etc.

Otros: documentales didcticos, videos, audio, publicaciones u otros soportes, socializadas y conducentes a valoracin heteroevaluativa en el centro regional. DESCRIPCIN DE ACTIVIDADES

Las actividades de reconocimiento se manejan simultneamente para las unidades del curso, mediante una lectura de identificacin de los contenidos,

correlacionndolos con los conocimientos y experiencias previas de los estudiantes y las nociones nuevas que debe profundizar posteriormente. En las actividades de profundizacin, el estudiante hace nfasis en interiorizar los aspectos de conocimiento en que se encontr deficitario durante la fase de reconocimiento. Para orientarlo en esta fase el tutor debe prescribir actividades especficas destinadas a optimizar el proceso con relacin a las metas de aprendizaje.

30

UNIDAD I. HISTORIA Y CONCEPTOS BSICOS DE LA PSICOMETRA Captulo 1. Historia de la Psicometra La revisin de los antecedentes histricos y de la evolucin de la medicin en psicologa, ofrece una perspectiva til para comprender la Psicometra actual. Para algunos autores, la historia de los tests mentales es tal vez uno de los mejores ejemplos de la existencia de una interaccin entre las demandas sociales y la evolucin de una disciplina cientfica. La historia de la medicin psicolgica ha estado marcada por la interrelacin entre la evolucin interna de la Psicometra y de la Psicologa con el deseo de responder a las demandas sociales de cada momento histrico, reflejando un mayor acento en las aplicaciones prcticas que en el desarrollo terico.

Este apartado pretende esbozar el entorno intelectual y social en el que nace la Psicologa moderna y con ella la Psicometra. A continuacin, slo se aborda una de las dos lneas de trabajo que ms trascendencia han tenido para la evolucin de la Psicometra: el estudio de las diferencias individuales; para la otra lnea: la Psicofsica, se puede recurrir a la bibliografa complementaria del tema. Por ltimo, se sealan los acontecimientos que han marcado la consolidacin de la disciplina.

Leccin 1. Antecedentes y formas rudimentarias de las pruebas psicolgicas

Conocer la historia de las pruebas psicolgicas es de gran importancia, los mayores avances se comenzaron a dar durante la ltima parte del siglo XIX y la poca anterior a la primera guerra mundial, pero el uso extendido de las pruebas es un fenmeno del siglo XX. Sin embargo existen datos histricos que muestran que las formas rudimentarias de las pruebas psicolgicas datan aproximadamente del ao 2200 a. C., en China cuando el emperador hizo que se examinaran a sus oficiales de gobierno cada tercer ao para determinar su idoneidad para el cargo y por siglos se continuaron haciendo estas pruebas modificndose y perfeccionndose hasta introducirse

31

exmenes por escrito durante la dinasta Han (200 d. C.). Ninguno de estos procedimientos de seleccin fue validado. El comienzo de las pruebas psicolgicas como tal se ha ubicado en la investigacin experimental sobre las diferencias individuales que inici en Alemania y Gran Bretaa terminado el siglo XIX siendo sus primeros representantes Wilhelm Wundt, Francis Galln y James McKeen Cattell. Pero las pruebas psicolgicas le deben su comienzo tanto a la primera psiquiatra como a los laboratorios de psicologa experimental. De hecho, el examen de los enfermos mentales aproximadamente a mediados del siglo XIX result en e! desarrollo de muchas de las primeras pruebas (Bondy, 1974), las cuales mostraban la ausencia de estandarizacin y, en consecuencia, se relegaron al olvido. Sin embargo, influyeron en la determinacin del curso de las pruebas psicolgicas, de modo que es importante mencionar algunos avances psiquitricos de esta poca. En 1885, el mdico alemn Hubert von Grashey desarroll el antecedente del cilindro mnemnico como un medio para examinar a pacientes con lesin cerebral. Se les mostraban a los sujetos palabras, smbolos o ilustraciones a travs de una ranura en una hoja de papel que se mova lentamente sobre los estmulos, muchos pacientes podan reconocer los estmulos completos, pero no identificarlos cuando se mostraban a travs de la ranura en movimiento. Poco despus, e! psiquiatra alemn Conrad Rieger desarroll una batera de pruebas excesivamente ambiciosa para la deteccin del dao cerebral, la cual requera ms de 100 horas para su aplicacin, por lo que pronto cay su aceptacin. En resumen, la psiquiatra inicial contribuy al movimiento de las pruebas mentales al mostrar que los procedimientos estandarizados pueden ayudar a revelar la naturaleza y grado de los sntomas en pacientes con enfermedades mentales y con lesin cerebral.

Leccin 2.Era de los instrumentos de bronce La psicologa experimental floreci a finales del siglo XIX en la Europa continental y Gran Bretaa. Por primera vez en la historia, los psiclogos se alejaron de los mtodos totalmente subjetivos e introspectivos que se haban seguido de manera

32

tan infructuosa en siglos anteriores. En lugar de ello, las capacidades humanas se sometieron a prueba en laboratorios. Los investigadores utilizaron procedimientos objetivos que tenan posibilidad de replicarse. Lejos quedaron los das en que laboratorios rivales tenan grandes discusiones acerca del "pensamiento sin imgenes", donde un grupo afirmaba que exista, mientras otro deca que tal acontecimiento mental era imposible. Aunque el nuevo nfasis en los mtodos objetivos y las cantidades medibles era una gran mejora sobre el mentalismo generalmente estril que le precedi, la nueva psicologa experimental era, en s misma, un callejn sin salida, al menos en cuanto a pruebas psicolgicas se refiere. El problema estaba en que los primeros psiclogos experimentales confundieron los simples procesos sensoriales con la inteligencia. Utilizaron diversos instrumentos de bronce para medir umbrales sensoriales y tiempos de reaccin, pensando que dichas capacidades eran esenciales para la inteligencia. De aqu que en ocasiones se llame a este periodo la era de los Instrumentos de Bronce de las pruebas psicolgicas. A pesar del falso comienzo de los primeros experimentalistas, al menos proporcionaron una metodologa apropiada a la psicologa. Pioneros como Wundt, Galton, Cattell y Wissler mostraron que era posible exponer a la mente al escrutinio y la medicin cientficos.ste fue un cambio decisivo en las suposiciones axiomticas de la psicologa, un cambio que ha permanecido hasta la actualidad. La mayor parte de las fuentes le atribuyen a Wilhelm Wundt (1832-1920) la fundacin del primer laboratorio psicolgico en 1879 en Leipzig, Alemania. Es menos sabido que este investigador llevaba aos midiendo procesos mentales, al menos desde 1862, cuando experiment con su medidor del pensamiento (Diamond, 1980). Este instrumento era un pndulo calibrado con agujas que sobresalan a cada lado. El pndulo oscilaba de un lado a otro, golpeando campanas con las agujas. La tarea del observador consista en tomar nota de la posicin del pndulo cuando las campanas sonaban. Por supuesto, Wundt poda ajustar de antemano las agujas y, por tanto, conocer la posicin precisa del pndulo cuando tocaba cada campana. Wundt consideraba que la diferencia entre la posicin observada del pndulo y la posicin real poda proporcionar un medio para

33

determinar la velocidad de pensamiento del observador Este anlisis de los informes de tiempos en telescopio parece simplista segn normas actuales, y pasa por alto la posible contribucin de factores como la atencin, motivacin y retroa-limentacin autocorrectora de los ensayos anteriores. En su lado positivo, ste fue al menos un anlisis emprico que buscaba explicar las diferencias individuales, en vez de tratar de deshacerse de ellas por medio de explicaciones. Y sa es la relevancia para las prcticas actuales en cuanto a pruebas psicolgicas. A pesar de lo rudimentario, Wundt midi los procesos mentales y reconoci a regaadientes las diferencias individuales. Primera batera de pruebas

Sir Francis Galton (1822-1911) fue el pionero de la nueva psicologa experimental en la Gran Bretaa del siglo XIX. Estaba obsesionado con la medicin y su carrera intelectual parece haberse visto dominada por la creencia de que poda medirse casi cualquier cosa. Sus intentos por medir el intelecto a travs del tiempo de reaccin y de tareas de discriminacin sensorial son muy conocidos. Sin embargo, para apreciar sus amplios intereses, el lector debera estar enterado de que Galton tambin dise tcnicas para medir la belleza, la personalidad, el nivel de aburrimiento de una lectura y la eficacia de la oracin, por nombrar slo unas cuantas. Pero finalmente Galton demostr una y otra vez que las diferencias individuales no slo existen, sino que se pueden medir de manera objetiva, el tom prestados los lentos procedimientos psicofisicos practicados por Wundt y otros investigadores en el continente europeo, y los adapt a una serie de medidas sensorio-motoras simples y rpidas. As, continu con la tradicin de los instrumentos de bronce en las pruebas mentales, pero con una importante diferencia: sus procedimientos fueron ms adecuados para la oportuna recoleccin de datos de cientos, si no es que miles, de sujetos. Debido a sus esfuerzos para disear medidas viables de las diferencias individuales, en general, los historiadores de las pruebas psicolgicas consideran a Galton como el padre de las pruebas mentales. En ltima instancia, los intentos simplistas de Galton por estimar el intelecto con medidas de tiempo de reaccin y discriminacin sensorial resultaron infructuosos.

34

Sin embargo, proporcion un enorme mpetu al movimiento de evaluacin al demostrar que podan disearse pruebas objetivas y obtenerse puntuaciones significativas a travs de procedimientos estandarizados Pruebas de bronce en EUA

James McKeen Cattell (1860-1944) estudi la nueva psicologa experimental tanto con Wundt como con Galton, antes de establecerse en la Columbia University. Despus de tener correspondencia con Galton durante algunos aos, Cattell obtuvo una beca de dos aos en Cambridge, de modo que pudiera continuar con el estudio de las diferencias individuales. Cattell abri su propio laboratorio de investigacin y desarroll una serie de pruebas que eran principalmente extensiones y adiciones a la batera de Galton. Cattell (1890) invent el trmino prueba mental en su famoso artculo intitulado "Mental Tests and Measurements ". Este artculo describa su programa de investigacin, detallando 10 pruebas mentales que l propona para su utilizacin con el pblico en general. Estas pruebas eran con toda claridad elaboraciones perfeccionadas de la tradicin de Galton. En 1891, Cattell acept un puesto en la Columbia University, que en aquel entonces era la universidad ms grande de EUA. Su posterior influencia sobre la psicologa estadounidense super en mucho a sus resultados cientficos individuales y se expres en gran parte a travs de sus numerosos e influyentes alumnos (Boring, 1950). Entre sus muchos y famosos estudiantes de doctorado y los aos en que obtuvieron sus ttulos se encuentran E. L. Thorndike( 1898), quien realiz contribuciones monumentales a la teora del aprendizaje y a la psicologa educativa; R. S. Woodworth (1899), quien fue el autor del muy popular e influyente Experimental Psychology (1938); y E. K. Strong (1911), cuyo Vocational Interest Blank revisado desde entonces todava tiene amplio uso. Peio entre los alumnos de Cattell, probablemente fue Clark Wissler (1901) quien tuvo la mayor influencia en la historia inicial de las pruebas psicolgicas. Wissler quiso relacionar los resultados de las pruebas mentales elaboradas con el desempeo acadmico de 300 estudiantes universitarios esperando que la prueba mental fuera un predictor del desempeo acadmico, pero los resultados de Wissler

35

(1901) mostraron que virtualmente no haba una tendencia a que las puntuaciones de una prueba mental se correlacionaran con el rendimiento acadmico. Por ejemplo, la posicin dentro de la clase se correlacion en .16 con la memoria de listas de nmeros, -.08 con la fortaleza en el dinammetro, .02 con c! nombrado du colores y -.02 con el tiempo de reaccin. La correlacin ms alta (.16) fue estadsticamente significativa debido al gran tamao de la muestra. Sin embargo, una correlacin tan pequea lleva consigo muy poca utilidad predictiva. Este tipo de resultados provocaron en los experimentalistas un alejamiento del enfoque de los instrumentos de bronce lo cual fue una evolucin deseable en la historia de las pruebas psicolgicas y con ello se facilit el camino para la aceptacin inmediata de las medidas ms sensatas y tiles como las de Binet para los procesos mentales superiores.

Leccin 3. Estudio de las diferencias individuales e importancia de las pruebas Debemos advertir de una doble simplificacin. Primera, dejar a un lado, por razones de tiempo, la Psicofsica que impide lograr una visin comprehensiva de la historia de la medicin en Psicologa; segunda, reducir la historia del estudio de las diferencias individuales a la historia de los tests psicolgicos y presentarla recurriendo a las aportaciones de algunas figuras clave. La ltima es reduccionista pero difcil de evitar: gran parte de la Psicometra actual no se puede comprender

36

sin atender a los antecedentes y orgenes histricos de los tests psicolgicos y de la medida de la inteligencia.

El rpido progreso econmico y social en la Europa de finales del siglo XIX plante la necesidad de evaluar las capacidades y conocimientos de los individuos en contextos educativos, laborales, etc. Si la Filosofa y la Fisiologa fueron las disciplinas que ms influyeron en el trabajo de los primeros psicofsicos, el impacto ms dramtico sobre el estudio de las diferencias individuales vino de la Biologa. Al tiempo que Fechnner presentaba sus trabajos, Darwin (1809-1882) present su teora en La Evolucin de las Especies (1859) y su aplicacin al estudio del hombre en El origen del hombre y la seleccin en relacin al sexo (1871). Darwin defendi que la inteligencia y el sentido moral tambin se haban ido perfeccionando de manera gradual a travs de la seleccin natural. Al defender esta idea Darwin no haca sino reflejar la visin cientfica y la opinin popular dominante en la Inglaterra del siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras ingls de clase media era el pico de la evolucin humana (Rust y Golombok, 1989).

No es exagerado afirmar que las necesidades de la evaluacin educativa fueron las primeras demandas sociales con un impacto significativo y duradero en la evolucin del estudio de las diferencias individuales y, por ende, de la Psicometra. Los intentos por medir la inteligencia como respuesta a esas demandas caminan de la mano de los desarrollos metodolgicos durante este periodo.

Thorndike (1997) seala el movimiento hacia la educacin obligatoria en Francia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarrollos crticos que propiciaron la medida de la inteligencia. La llegada por primera vez a las escuelas de nios cuyos padres no haban recibido una educacin o, como en el caso americano, cuya lengua materna no era el ingls, gener una heterogeneidad en la poblacin de alumnos como antes no se haba conocido. La exposicin de estos nios a un currculo antiguo, diseado para un grupo selecto

37

de estudiantes, trajo como resultado niveles dramticos de fracaso escolar prximos al 50%. Este fracaso fue visto como una prdida de recursos en un tiempo en que eran limitados, de forma que se plante la necesidad de destinar los recursos a quienes ms se pudieran beneficiar, el medio: la evaluacin de la inteligencia. Este es el contexto en el que se debe situar la obra de Binet.

Los pioneros de la Psicologa llevaban aos intentando una formulacin aceptable de la inteligencia. Segn Rust y Golombok (1989) los primeros autores tenan unas definiciones de la inteligencia que no iban ms all de lo que podra ser la psicologa popular del maestro comn de escuela. Se reconoca la diferencia entre una persona educada y una persona inteligente, entendiendo esta ltima como una persona "educable", con un origen esencialmente gentico y receptora ideal de los recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educacin normal.

Entre los pioneros en el estudio de las diferencias individuales destaca el considerado por muchos autores, como el fundador de la Psicometra: Francis Galton. Primo de Darwin, inici sus investigaciones llevado por el objetivo de mostrar el componente hereditario del "genio". Para ello reuni el primer banco con los datos de personas relacionadas y no relacionadas. Influido por el

asociacionismo de Locke y llevado por sus observaciones de que las personas con deficiencias mentales presentaban una peor ejecucin a la hora de discriminar sensaciones de fro, calor, dolor, etc., pens que la discriminacin sensorial poda ser el medio para cuantificar el intelecto de una persona. Sus aportaciones propiamente metodolgicas abarcan la formulacin de las bases de procedimientos estadsticos, como el coeficiente de correlacin desarrollado por K. Pearson (1857-1936), las intuiciones sobre la forma de "campana", como imagen para describir la distribucin de puntuaciones en un test, as como las primeras

38

aplicaciones de las escalas de "rating" y los mtodos de cuestionario (Anastasi y Urbina, 1997).

J. M. Catell (1860-1944) trabajo con Wundt, con quin comparti el inters por los fenmenos perceptivos y sensomotores, y el rigor en el control de las condiciones en que se realizaban las observaciones, pero de quin se distanci ante el despreci del experimentalista alemn por las diferencias individuales. Ms tarde trabajo con Galton e inici en Estados Unidos el estudio de las diferencias individuales. Acu el trmino "test mental" en un artculo publicado en 1890 en la revista Mind bajo el ttulo Mental test and measurements. Asumi la idea de Galton sobre la posibilidad de medir las funciones intelectuales por medio de tests de discriminacin sensorial y tiempo de reaccin. Sin embargo, los primeros estudios que se realizaron para evaluar este tipo de tests ofrecieron resultados desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de unos tests a otros y prcticamente ninguna relacin con estimaciones

independientes del nivel intelectual realizadas por los profesores. Por el contrario, Ebbinghaus, apuntando ya un cambio de enfoque, haba obtenido con un test de terminacin de frases una correspondencia clara con el rendimiento acadmico de los nios.

Pero sin duda, la consolidacin social de la medicin psicolgica vino de la obra del francs Alfred Binet (1857-1911) cuya influencia en el desarrollo de la teora de los tests perdura en la actualidad. Binet a finales de los aos noventa del siglo XIX critic la aproximacin de Galton y Cattell con el argumento de que para medir procesos mentales complejos era necesario observar la ejecucin de los individuos en actos mentales complejos, rechazando la idea de que fuese necesaria una mayor precisin para la que no haba instrumentos disponibles, ya que las diferencias individuales eran mayores respecto a los procesos superiores que en cuanto a la discriminacin sensorial.

39

Tras las aportaciones de Binet, los mayores desarrollos en la medicin de las diferencias individuales hay que buscarlos en un rea y lugar diferente. El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya traduccin y adaptacin recibieron el beneplcito de la audiencia mdica, al venir a cubrir la necesidad de una medida estandarizada y objetiva para el diagnstico de la subnormalidad. Sin embargo, fue rpidamente desplazada por la revisin y adaptacin psicomtricamente ms slida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la Primera Guerra Mundial, un comit encabezado por R. M. Yerkes detecta la necesidad de clasificar de forma rpida al milln y medio de reclutas con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance metodolgico: los primeros tests de inteligencia de administracin grupal y no verbales, para evaluar a los reclutas analfabetos o que no tenan como lengua materna el ingls. En este contexto hay que situar las contribuciones de A. S. Otis, por la introduccin del formato de eleccin mltiple y otros formatos de puntuacin objetiva. Impulsado por las necesidades militares aparece tambin el primer test estandarizado para la evaluacin de variables de personalidad: el Pe rsonal Data Sheet de R. S. Woodworth, un instrumento pensado para la deteccin de personas con inestabilidad emocional.

Importancia de las pruebas

Las pruebas se utilizan en casi todos los pases con propsitos de orientacin psicolgica, seleccin y asignacin, los contextos de aplicacin son diversos como por ejemplo en colegios, universidades, servicio pblico, centros de orientacin psicolgica, industrias, clnicas y hospitales. Prcticamente desde que se ingresa al sistema escolar, se comienzan a tomar pruebas. La mayora de las personas han tomado un gran nmero de pruebas y no les han dado mayor importancia. Pero es posible observar que para la edad de pensionarse, el destino una persona sin saberlo ha sido moldeado por las pruebas que ha presentado a lo largo de su vida.

40

Los resultados de las pruebas psicolgicas pueden alterar profundamente el futuro de una persona. As, el haber sido admitido en una universidad y no en otra, ser aceptado en un empleo y rechazado en otro, ser diagnosticado con depresin o un trastorno de personalidad, que no se encuentre ningn trastorno, todas estas decisiones dependen del criterio o interpretacin de individuos expertos con poder de decisin.

Leccin 4. Influencia de las primeras investigaciones sobre inteligencia

En 1896, Binet y su ayudante en la Sorbona, Victor Henri, publicaron una revisin fundamental de los trabajos alemanes y estadounidenses sobre diferencias individuales. En este artculo, que posee gran importancia histrica, discutieron que la inteligencia poda medirse mejor a travs de los procesos psicolgicos superiores que con procesos sensoriales elementales, como el tiempo de reaccin, despus de varios inicios en falso, Binet y Simn llegaron en un momento dado al sencillo formato de sus escalas de 1905, que se analizan ms adelante.'* El carcter de la escala de 1905 le debe mucho a una prueba anterior elaborada por el Dr. Blin (1902) y a su alumno M. Damaye. Estos investigadores haban intentado mejorar el diagnstico del retraso mental a travs del uso de una batera de evaluacin en 20 reas como lenguaje hablado, conocimiento de las partes del cuerpo, obediencia a rdenes simples; nombrado de objetos comunes y capacidad para leer, escribir y hacer clculos aritmticos sencillos. Binet critic la escala por considerarla demasiado subjetiva, por tener reactivos que reflejaban la educacin formal y por utilizar un formato de s o no en muchas preguntas (DuBois, 1970). Pero se mostr sumamente impresionado por la idea de utilizar una batera de pruebas, una caracterstica que adopt en sus escalas de 1905 En 1904, el ministro de Educacin Pblica en Pars (Minister of Public Instructiva)

41

estableci una comisin para decidir sobre las medidas educativas que deberan emprenderse con aquellos nios que no podan beneficiarse de la educacin regularla comisin concluy que deberan utilizarse exmenes mdicos y educativos para identificar a aquellos nios que no podan aprender a ti uves de mtodos regulares. Lo que es ms, se determin que se debera retirar a estos nios de las clases regulares y darles instruccin especial, adecuada a su habilidad intelectual ms limitada. Este fue el principio de las clases de educacin especial. Era evidente la necesidad de un medio para seleccionar los nios para tal asignacin especial y se le solicit a Binet y a su colaborador Simn que desarrollaran una herramienta prctica dirigida nicamente u dicho propsito. As surgi la primera escala formal para evaluar la inteligencia de los nios. Existen cuatro maneras en que la escala de 1905 difera con respecto a aqullas construidas antes: 1. No afirmaba medir precisamente ninguna facultad en particular. Ms bien, se diriga a evaluar el desarrollo mental general del nio con un grupo heterogneo de tareas. As, la meta no era la medicin, sino la clasificacin. 2. Era una prueba breve y prctica. Tomaba menos de una hora para su aplicacin y requera pocos elementos en cuanto a equipo. 3. Meda de manera directa lo que Binet y Simn consideraban como el factor esencial de la inteligencia el juicio prctico en lugar de perder el tiempo con capacidades de menor nivel que implicaran elementos sensoriales, motores o perceptuales. As, miran una perspectiva prctica de la inteligencia. 4. Los reactivos estaban distribuidos segn su nivel aproximado de dificultad, en vez de en funcin del contenido. Se realiz una estandarizacin preliminar con 50 nios normales cuyas edades iban de 3 a 11 aos y tambin con varios nios subnormales y con retraso. Las 30 pruebas en la escala de 1905 iban de las pruebas sensoriales abiertamente simples, a las abstracciones verbales bastante complejas., As, la escala era apropiada para evaluar la gama completa de la inteligencia desde el retraso mental grave hasta los niveles superiores de la inteligencia dotada. Un punto interesante que con frecuencia pasan por alto los alumnos de psicologa

42

en la actualidad, es que Binet y Simn no ofrecieron en su escala de 1905 un mtodo preciso para llegar a una puntuacin total. Sera bueno recordar que su propsito era la clasificacin, no la medicin, y que su motivacin era completamente humanitaria, es decir, la de identificar a aquellos nios que necesitaban asignarse a educacin especial. Segn normas contemporneas, es difcil aceptar la confusin inherente a dicho enfoque, pero ello puede reflejar una inclinacin moderna hacia la cuantificacin ms que una debilidad por parte de la escala de 1905. De hecho, su escala fue popular entre los educadores en Pars. Incluso en ausencia de una cuantificacin precisa, el enfoque fue exitoso en la seleccin de candidatos para clases especiales. En 1908, Binet y Simn publicaron una revisin de la escala de 1905. En la escala anterior, ms de la mitad de los reactivos haban sido diseados para los individuos con retraso muy notable; sin embargo, las principales decisiones diagnsticas implicaban a nios mayores y a personas con un intelecto limtrofe. Para remediar este desequilibrio, se abandon la mayor parte de los reactivos muy simples y se aadieron nuevos al extremo superior de la escala. La principal innovacin de la escala de 1908 era la introduccin del concepto de nivel mental. Las pruebas se haban estandarizado con crea de 300 nios normales entre 3 y 13 aos de edad. Esto permiti que Binet y Simn ordenaran las pruebas segn el nivel de edad en el que por lo comn se aprobaban. Cualesquiera reactivos que aprobaran de 80 a 90% de los nios de tres aos, se asignaba al nivel de 3 aos hasta los 13. En 1911 apareci una tercera revisin de las escalas Binet-Sirnon. Ahora, cada nivel de edad tena exactamente cinco pruebas. La escala tambin se extendi hasta el rango adulto. Binet introdujo nuevos mtodos de calificacin que concedan una quinta parte de un ao por cada subprueba aprobada por encima del nivel basal. En sus escritos, Binet enfatiz en gran medida que no debera tomarse demasiado en serio el nivel mental exacto del nio como una medida absoluta de la inteligencia.

Sin embargo, la idea de obtener un nivel mental fue un desarrollo monumental que

43

habra de influir el carcter de las pruebas de inteligencia a lo largo del siglo XX. Despus de unos cuantos meses, lo que Binet llam nivel mental se traduca como edad mental. Y los examinadores en todas partes, incluyendo Binet mismo, comparaban la edad mental de un nio con su edad cronolgica. As, un nio de nueve aos que funcionaba al nivel el mental (o edad mental) de un nio de seis aos, tena un retraso de tres aos.

En 1916, Terman y sus colaboradores en Stanford revisaron las escalas BinetSimon y produjeron la Stanford-Binet, una exitosa prueba. Terman sugiri multiplicar el Cociente de Inteligencia por 100 para eliminar las fracciones; tambin fue la primera persona en utilizar la abreviatura CI. As naci uno de los conceptos ms populares y polmicos de la historia de la psicologa. Binet muri en 1911, antes de que el CI se generalizara en las pruebas estadounidenses.

44

Leccin 5. Consolidacin institucional de la Psicometra De forma paralela a los avances tericos y las aplicaciones prcticas, se fue produciendo la consolidacin institucional de la Psicologa y, claro est, de la propia Psicometra. Esta consolidacin se refleja en la creacin de asociaciones profesionales, de publicaciones especializadas para la comunicacin entre profesionales y de empresas privadas dedicadas desde el inicio al floreciente negocio de la evaluacin psicolgica.

J. Jastrow habla sobre los tests en la primera convencin de la American Psychological Association (APA) en 1892. La APA form en 1895 un comit especializado en la nueva tecnologa de los tests. En 1899 Kilpatrick, presidente de la APA, realiz un llamamiento a los psiclogos para que elaborarn tests de tal naturaleza que "... pudieran ser aplicados tanto a nios como adultos, que fueran de tal forma que todas las personas tuvieran las mismas oportunidades de mostrar las capacidades examinadas, y que en aras de la economa del tiempo fueran diseados de forma que se pudieran administrar a una clase o escuela de una vez" (Thorndike, 1997, pg. 6). Impulsado por la figura clave de Terman el uso de los tests de inteligencia en las escuelas creci rpidamente. El propio Terman calcul que en el periodo entre 1920 y 1921 ms de dos millones de nios haban respondido a un test de inteligencia. El uso de test tambin se extendi al mundo laboral como prueba su incorporacin a las prcticas de seleccin de la administracin americana.

Cattell fund la Psychological Corporation para la produccin industrial de tests en 1922. En 1947 se funda el Educational Testing Service (ETS) institucin sin animo de lucro que no slo se ha encargado de la produccin de tests estandarizados de rendimiento y tests de aptitud acadmica, sino que desde su constitucin, ha contribuido a la formacin y prctica profesional de influyentes psicmetras. Desde 1975, el ETS edita en formato CD-ROM el proyecto ERIC donde con una

45

periodicidad anual se recoge la informacin disponible sobre tests, escalamiento y medicin psicolgica y educativa.

Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde entonces publica trabajos matemticos relacionados con la Biologa y la Psicologa. Thorndike funda en Estados Unidos en 1936 la publicacin Psychometrika, revista de referencia para la Psicometra desde sus inicios. Desde entonces, la aparicin de revistas relacionadas con la medicin psicolgica ha sido continua. Como muestra se pueden citar el Educational and Psychological Measurement (1941), el British Journal of Statistical Psychology (ahora con el nombre de British Jorunal of Statistical and Mathematical Psychology) (1947), el Journal of Mathematical Psychology y el Journal of Educational Measurement (1964), el Multivariate Behavioral Research y el Aplied Psychological Measurement (1977), el Applied Measurement in Education (1988), etc.

Un acontecimiento que se ha convertido en referente obligado para todos los profesionales es la publicacin por las asociaciones profesionales ms relevantes de las guas tcnicas y ticas de la medicin psicolgica y educativa. Las recomendaciones elaboradas por la APA son, sin duda, las que han tenido y tienen una mayor influencia.

Entonces La psicometra es la ciencia de la medida de los aspectos "psicolgicos" de una persona, tales como conocimiento, habilidades, capacidades, o personalidad. La medida de estos aspectos es difcil, y gran parte de la investigacin y tcnicas acumuladas en esta disciplina estn diseadas para definirlos de manera fiable antes de cuantificarlos. Los primeros trabajos de psicometra se desarrollaron para medir la inteligencia. Posteriormente, la teora psicomtrica se ha aplicado a la

46

medida de otros aspectos como la personalidad, actitudes y creencias, rendimiento acadmico, y en campos relacionados con la salud y la calidad de vida. Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes bloques: teora de los test, que hace referencia a la construccin, validacin y aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de escalas psicofsicas y psicolgicas. A su vez, la teora de los test se divide en dos ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems. Los conceptos clave de la teora clsica de los tests son: confiabilidad y validez. "confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo que realmente se pretende medir. Ambas propiedades admiten un tratamiento matemtico. La consistencia interna puede calcularse por correlacin entre distintos tests. Los mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo del test-retest y mtodo de las dos mitades. La validez puede calcularse correlacionando las mediciones con las de una medida patrn aceptada como vlida. Se distinguen los siguientes aspectos: validez de contenido, validez predictiva y validez de constructo. Complemente y discuta con el profesor el artculo anexo La medicin de lo Psicolgico (que se encuentra en la siguiente pgina

http://www.psicothema.com/pdf/138.pdf)

Capitulo 2. La Psicometra y su Mtodo Leccin 6. Definicin de psicometra Disciplina implicada directamente en la medicin psicolgica, con una doble vertiente:

47

terica : supone la fundamentacin terica de la medida

48

prctica: supone la construccin, evaluacin y aplicacin de instrumentos de medida para evaluar o medir las caractersticas psicolgicas de inters.

Ms adelante se seguir ampliando el concepto de Psicometra, explicaremos a continuacin algunos aspectos de la vertiente prctica de la psicometra. Se sugiere a los estudiantes hacer la bsqueda por Internet de la vertiente terica de la psicometra (pueden tambin buscar en la red con la palabra clave psicolog a matemtica). Leccin 7. Vertiente prctica de la psicometra Fase de Construccin de un Instrumento de Medida En esta fase del proceso habra que cubrir las siguientes etapas:

Delimitacin y operativizacin de la variable psicolgica que se desea medir Confeccin de los tems Determinacin del valor escalar de los tems Confeccin de la prueba

Esta fase subsumira lo que tradicionalmente se entiende al hablar de escalamiento, el escalamiento de estmulos psicolgicos Una vez completada la fase de construccin se pasara a la de la evaluacin del instrumento construido para, finalmente, concluir con la administracin efectiva del instrumento a un sujeto (o grupo de sujetos) en la fase de aplicacin. Fase de Evaluacin de un Instrumento de Medida La fase de evaluacin del instrumento de medida es absolutamente crucial ya que todas las medidas obtenidas al aplicar una prueba contienen error. La consideracin del error de medida inherente a toda medicin psicolgica hace necesario:

49

un planteamiento explcito acerca de hasta qu punto la medida obtenida en un momento determinado proporciona una estimacin adecuada del nivel real en que posee el sujeto la caracterstica psicolgica que supuestamente se est evaluando. Por tanto, la consideracin del error de medida exige el recurso a una teora de los tests que d cuenta del mismo y proporcione una estimacin del rasgo o caracterstica evaluada.

la evaluacin de la calidad de los instrumentos de medida, es decir, determinar si stos cumplen o no los criterios mtricos de calidad que todo instrumento de medida debe de satisfacer para poder ser utilizado con garanta como un instrumento cientfico.

Esto supone que habr que estudiar confiabilidad y validez de la prueba y proceder al anlisis de los tems de la misma. Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaramos a la tercera fase del proceso: su aplicacin a un sujeto o a una muestra de sujetos. Fase de Aplicacin de un Instrumento de Medida Una vez construida y evaluada positiva o favorablemente la prueba, nos enfrentaramos a la tercera fase del proceso: su aplicacin a un sujeto o a una muestra de sujetos. El objetivo de esta fase es obtener una medida de cada sujeto o grupo en el rasgo o caracterstica evaluada por la prueba, determinar el valor escalar de cada sujeto o grupo de sujetos, viendo la posicin que stos ocupan en el continuo que representa la caracterstica o rasgo evaluado con el instrumento de medida. En particular, los contenidos del programa vinculados con esta fase son:

la interpretacin de las puntuaciones del test

50

la equiparacin de las puntuaciones del test. La Psicometra y la Teora de los Tests

La finalidad de este tema es presentar la Psicometra e introducir uno de sus contenidos ms importantes: la Teora de Tests. Intentar definir un concepto complejo como el de "Psicometra", al igual que ocurre con la denominacin de cualquier disciplina cientfica, es una tarea difcil, razn por la que, al contrario de lo que se podra pensar, no abundan las definiciones explcitas. Bajo la palabra "Psicometra" pueden convivir contenidos, enfoques, objetivos y hasta concepciones diferentes sobre la ciencia y la funcin social de la Psicologa. Por todo ello, tal vez la nica estrategia til para abordar una delimitacin conceptual comprehensiva y lo ms exacta posible de la Psicometra sea recorrer desde una perspectiva histrica la evolucin de la medicin psicolgica, esbozar un anlisis de la naturaleza del "objeto" de la medicin psicolgica, describir el mtodo psicomtrico, presentar los contenidos de la

Psicometra y, a pesar de las dificultades ... no resistir la tentacin final de proponer una definicin propia de la Psicometra. Leccin 8. Definiciones y objetivo de la Psicometra

En este apartado se aborda el significado de la denominacin de la disciplina y se sealan los elementos comunes de las definiciones propuestas por diferentes autores.

El trmino "Psicometra" es el ms extendido y general para hacer referencia a la medicin psicolgica. Su significado popular y la etimologa de la palabra apuntan en la misma direccin: la disciplina que se encarga de la medicin en Psicologa. De hecho, los diccionarios de uso ms comn como el de la Real Academia de la Lengua o el de Mara Moliner tambin coinciden en su significado: la medida de los fenmenos psquicos.

51

Para avanzar en el camino hacia una delimitacin conceptual de la disciplina es necesario detenerse en las definiciones explcitas que, desde la propia Psicologa, se han propuesto para la Psicometra. Sealar los puntos comunes y las diferencias de matiz entre ellas pueden ayudar a entender el alcance de la disciplina.

La Psicometra se ocupa de todas las medidas en el campo psicolgico, habindose desarrollado a travs de dos ramas principales: los mtodos psicofsicos y la teora de los tests. Tambin se define a la Psicometra como la metodologa encargada del desarrollo y utilizacin de las tcnicas de medicin en todos los mbitos de la psicologa.

Muiz (1998) define la Psicometra como "... el conjunto de mtodos, tcnicas y teoras implicadas en la medicin de variables psicolgicas... lo especfico de la Psicometra sera su nfasis y especializacin en aquellas propiedades mtricas exigibles a las mediciones psicolgicas independientemente del campo sustantivo de aplicacin y de los instrumentos utilizados".

La definicin de Martnez-Aras (1984) introduce un matiz que apunta hacia la relacin entre la Psicometra y la Psicologa Matemtica. Para la autora, la Psicometra "... aglutina todo el conjunto de modelos formales que posibilitan la medicin de variables psicolgicas, centrndose en las condiciones que permiten llevar a cabo todo proceso de medicin en psicologa".

No resulta difcil entresacar los elementos comunes de las definiciones anteriores. La Psicometra es una disciplina metodolgica, sin un contenido psicolgico propio, pero con un campo sustantivo: la teora de la medicin en sentido amplio. Muiz (1998) afirma que el trabajo psicomtrico tiene como finalidad construir y utilizar adecuadamente los tests y las escalas, de tal modo que se garantice su fiabilidad, validez y aplicacin adecuada.

52

El objeto de la medicin en Psicologa Al presentar las definiciones explcitas de la Psicometra elaboradas por diferentes autores, se entresacaron sus elementos comunes: disciplina metodolgica, sin contenido psicolgico propio, pero con un dominio sustantivo: la teora de la medicin psicolgica en un sentido amplio. La definicin de Muiz (1998) seala adems, el rasgo definitorio de la preocupacin psicomtrica por la medida: las condiciones mtricas exigibles a todas medicin. Sin embargo, hay otra fuente de singularidad en la preocupacin psicomtrica por las condiciones mtricas de la medicin que no es posible soslayar: la que viene impuesta por la peculiaridad de los objetos psicolgicos de medicin. A diferencia de las variables fsicas, las variables psicolgicas no se pueden observar de manera directa. No quiere esto decir, que en psicologa no se midan conductas directamente observables, cuya cuantificacin se suele obtener a travs de alguno de sus parmetros: duracin, frecuencia, intensidad, etc., sino que, incluso en estos casos, la conductas observables se interpretan como indicios o resultado de variables inobservables ms complejas. Atributos como "autoestima", "habilidad lectora", "razonamiento analgico", etc., son variables inobservables que slo es posible medir por medio de los comportamientos observables a los que den lugar. Hay un amplio consenso sobre el trmino con el que referirse de forma genrica a los objetos de medicin: constructos. El trmino "constructo" se ha hecho familiar en el campo de la medicin psicolgica desde su utilizacin en el artculo de L. Cronbach y P. E. Meehl titulado "Construct validity in Psychological Test" (1955). Cronbach y Meehl (1955) entendieron por constructo un instrumento intelectual para organizar la experiencia en categoras. Crocker y Algina (1986) lo definen como "... productos de la imaginacin informada de los cientficos sociales qu intentan desarrollar teoras para explicar el comportamiento humano" (pg. 4).

53

Crocker y Algina (1986) ilustran el proceso de elaboracin de constructos insistiendo en su papel de "etiqueta" para resumir comportamiento y remarcan la importancia de establecer alguna regla de correspondencia entre el constructo y los comportamientos observables que son sus indicadores legtimos. La dificultad a la hora de encontrar la conexin "legtima" entre el constructo y sus indicadores comportamentales es valorada como uno de los lastres que impide el desarrollo de la medida psicolgica. Lord y Novick (1968) fijaron la definicin obligatoria de los constructos como requisito previo para su medicin. La definicin de los constructos se debe abordar a dos niveles:

Definicin operacional o semntica. Consiste en enumerar la serie de comportamientos indicadores que engloba el constructo. Dichos comportamientos son considerados los indicadores empricos del constructo objeto de la medicin. La importancia de la definicin operacional es evidente: debe conectar la etiqueta verbal con los datos observables.

Definicin conceptual o sintctica. Recoge la teora sobre el constructo objeto de la medicin. Se trata de un discurso conceptual en el que se hacen explcitas las relaciones del constructo objeto de la medicin con otros constructos y/o indicadores empricos de otros constructos con los que el objeto de la medicin est relacionado.

La definicin de los constructos a los dos niveles anteriores es el primer paso inexcusable a la hora de iniciar cualquier medicin. El supuesto sobre la estabilidad de los constructos

La medicin psicolgica asume, o al menos tiene en cuenta, algunos supuestos sobre la naturaleza del objeto de la medicin, es decir, sobre la naturaleza de los

54

constructos. Sin duda, el supuesto comn a la prctica totalidad de los modelos de medicin es el de la estabilidad de la variable.

Numerosos estudiosos de la medicin psicolgica defienden la idea de que las diferentes versiones de la teora de los tests (e. g., la teora clsica, la teora de la generalizabilidad y la teora de respuesta al tem) estn elaboradas para hacer inferencias con el mismo "esqueleto": la tendencia de las personas a comportarse de manera prescrita en situaciones prescritas a partir de sus repuestas a un conjunto de tareas predeterminadas. Por ejemplo, la perspectiva tradicional para medir la inteligencia responde a este esquema inferencial: empleo de tests estandarizados, compuesto por tems o tareas predeterminadas, aplicados bajo condiciones estandarizadas y con la pretensin de predecir el rendimiento futuro de las personas en situaciones igualmente "estandarizadas": la escuela, el trabajo, el ejercito, etc., En definitiva, los modelos de medida se han elaborado bajo el supuesto de estabilidad de la variable.

El supuesto de estabilidad est siendo amenazado por las perspectivas ms recientes sobre la evaluacin psicolgica, es decir, por la necesidad de extender el "paradigma metodolgico tradicional" para responder, por ejemplo, a las inferencias que el paradigma cognitivo plantea sobre las personas: las formas de uso y adquisicin de conocimientos y habilidades, en definitiva, para modelar el cambio. La polmica sobre el objeto de la medicin

La cuestin sobre la naturaleza del objeto no ha estado exenta de debate a lo largo de la historia de la medicin psicolgica como reflejo de las discusiones sobre el propio objeto de estudio de la psicologa. Resulta difcil evitar plantearse preguntas como las lanzadas por Meli (1990): "Cuntos atributos latentes o rasgos subyacentes existen?... en qu medida son estables o evolucionan? son comunes a todas las personas?" (pg. 37).

55

Rust y Golombok (1989) defienden que la discusin sobre el objeto de medicin ha dividido a la Psicometra en dos escuelas: la Psicometra del rasgo y la Psicometra funcional. Spearman (1904, 1907) da carta de naturaleza a la Psicometra de los rasgos al plantear que la esencia de la tarea de la medida mental es identificar rasgos a travs de las tendencias de los individuos a comportarse de formas prescritas en situaciones prescritas. El fuerte carcter hereditario atribuido por los pioneros de la medida mental a los rasgos aparece suavizado en la definicin de Messick (1989): "Un rasgo es una caracterstica relativamente estable de una persona un atributo, proceso duradero o disposicin que se manifiesta consistentemente en algn grado a pesar de variaciones considerables en el rango de contextos y circunstancias" (pg. 15). Por el contrario, la Psicometra funcional defiende como un principio de partida que ningn rasgo o variable psicolgica interviniente es relevante. Plantea que dado que es posible definir y medir directamente los comportamientos a los que supuestamente conducen los rasgos, el papel de estos es redundante.

Rust y Golombok (1989) contrastan la preeminencia de la Psicometra funcional en la evaluacin educativa, con la de la Psicometra de los rasgos para la evaluacin clnica; y proponen resolver el enfrentamiento atendiendo a los procesos de toma de decisin que realizan los clientes de la evaluacin y de la seleccin psicomtrica: las decisiones se realizan resumiendo la medicin en trminos de rasgos que reflejan lo que denominan "la psicologa popular humana" ("don de gentes", "genio", "liderazgo", etc.). Leccin 9. El mtodo de la Psicometra

Meli (1990) plantea que la conexin entre la Psicometra y la psicologa matemtica, permite considerar el mtodo de la Psicometra desde una doble vertiente: por un lado, en tanto que la teora psicomtrica se refiera a contenidos

56

empricos, el mtodo no es otro que el mtodo cientfico propio de toda ciencia emprica; y por otro lado, el componente matemtico de los modelos formales de medicin, sujeta a la teora psicomtrica, como a la psicologa matemtica, a los criterios formales de las matemticas.

La relacin entre la psicologa matemtica y la Psicometra ha llevado a algunos autores a defender que el mtodo de la Psicometra es el de la psicologa matemtica. El esquema elaborado por Jez (1989) es la referencia obligada a la hora de presentar el mtodo de la psicologa matemtica. De manera resumida, dos son las caractersticas distintivas del mtodo de la psicologa matemtica: a) la presentacin formal, generalmente en trminos matemticos, del componente terico; y b) el recurso a procedimientos deductivos basados en la lgica o a procedimientos de simulacin a la hora de derivar las consecuencias del modelo matemtico.

Mencin especial merece la simulacin, por la preponderancia que est adquiriendo en Psicometra. El papel metodolgico de la simulacin no resulta fcil de establecer. Muchos campos de la Psicometra la utilizan como tcnica de obtencin de datos, cuando el problema de investigacin hace imposible contrastar el modelo con datos empricos. Este es el caso cuando se pretende descubrir las propiedades y caractersticas de ndices estadsticos, mtodos de estimacin, potencia de contrastes, etc. Adems, la simulacin preserva tambin el estatus de mtodo en cuanto generadora de conocimiento.

El anlisis del mtodo no puede obviar el papel instrumental de la Psicometra como herramienta metodolgica para la contrastacin emprica de las teoras psicolgicas. La aplicacin del mtodo cientfico en psicologa obliga a que la Psicometra desempee un papel activo en diferentes momentos del proceso. Arnau (1989) articula las relaciones entre el plano terico y emprico del mtodo cientfico en tres niveles: el nivel terico-conceptual, que abarca desde el

57

planteamiento del problema hasta la formulacin de hiptesis empricamente contrastables; el nivel tcnico-metodolgico que abarca el plan de investigacin y la estrategia de recogida de datos; y el nivel estadstico-analtico, donde se realiza la modelizacin estadstica de los datos y las inferencias sobre las hiptesis sometidas a contrastacin. La generalizacin de los resultados hace retornar la aplicacin del mtodo al nivel terico-conceptual con lo que se cierra el ciclo. La Psicometra acompaa a la aplicacin del mtodo en cada uno de los tres niveles.

El nivel terico conceptual recoge a teora que contextualiza el problema de investigacin. La teora debe incluir la definicin operacional y "sintctica" de los constructos implicados en las hiptesis. A su vez, la teora condiciona la eleccin del modelo de escalamiento y, por tanto, de las condiciones mtricas que se exigirn a las mediciones. La red nomolgica desempea adems un papel crucial durante la elaboracin de tests para determinar la utilidad de las puntuaciones obtenidas.

El nivel tcnico metodolgico implica la construccin o seleccin de los instrumentos de medida idneos para la medicin de los constructos de inters. La Psicometra debe guiar el proceso de elaboracin de instrumentos, teniendo en cuenta la teora psicolgica y el modelo de medida seleccionados en el nivel terico-conceptual.

Dentro del nivel estadstico analtico, las propiedades mtricas de las mediciones valoradas en el nivel anterior, condicionarn la modelizacin estadstica de los datos y la elaboracin de proposiciones a partir de los resultados. Por ejemplo, la informacin sobre la fiabilidad y validez de las mediciones, condicionar la generalizacin de los resultados en el regreso del proceso de investigacin al nivel terico conceptual.

58

Los contenidos de la Psicometra Hay un consenso amplio en la disciplina sobre cuales son los contenidos propios de la Psicometra. Las diferencias entre las propuestas de los autores responden a las distintas tradiciones de investigacin de las que procedan o a diferencias en las estrategias de estudio de una misma temtica. Si se unen las diferentes versiones de la teora de los tests bajo una denominacin comn, se obtiene la divisin en tres grandes grupos de los contenidos psicomtricos: teora de la medicin, escalamiento y teora de los tests. Los dos primeros contenidos han sido o sern objeto de un tema en el programa de la asignatura. La teora de los tests es introducida en el siguiente apartado. Leccin 10. La teora de los tests La teora de los tests puede verse como un esquema conceptual formalizado para hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la toma de decisiones que impliquen el constructo objeto de la medicin. La teora de los tests proporciona los fundamentos para la elaboracin y uso de los tests, aportando adems las herramientas para examinar las propiedades mtricas de las mediciones obtenidas con ellos.

La definicin de test no ha variado de forma significativa conforme evolucionaba la teora de los tests. Valgan como muestra las definiciones de Anastasi o Lord. Para Anastasi (1968), un test psicolgico es esencialmente una medida objetiva y tipificada de una muestra de conducta; para Lord (1980) un test psicolgico o educativo es un instrumento para obtener una muestra de conducta (pg. 3). La definicin de Yela (1996) expresa en trminos ms generales la finalidad de los tests como un reactivo que aplicado a un sujeto revela y da testimonio de la ndole o grado de su instruccin, aptitud o manera de ser (pg. 249). (definicin de test)

59

La mayora de los profesionales de la medicin psicolgica coinciden en que las caractersticas definitorias de un test psicolgico son:

Procedimiento o instrumento estandarizado. Los tests plantean a las personas evaluadas una serie de tareas previamente determinadas, a las que deben responder siguiendo unas instrucciones fijadas de antemano y, de forma habitual, en un contexto controlado.

Obtencin de muestras de conducta. Los tests estn diseados para la obtencin de los comportamientos reveladores del constructo objeto de la medicin.

Asignacin numrica. Los tests deben permitir la cuantificacin objetiva de acuerdo con unas reglas establecidas.

Dispone de informacin sobre la calidad de las mediciones. Los autores de los tests y, en algunas circunstancias, los usuarios deben aportar informacin tcnica sobre la precisin y relevancia para el objetivo de la evaluacin de las mediciones aportadas por el test.

Se han elaborado diversas clasificaciones de los tests utilizando diferentes criterios. Crocker y Algina (1986) ofrecen una clasificacin til de los tests atendiendo al carcter general de la tarea que deben realizar las personas: tests de ejecucin ptima, en los que se instruye a la persona para que conteste lo mejor que pueda (incluira los tests de inteligencia, aptitudes y rendimiento); y tests de ejecucin tpica, que demandan de la persona informacin sobre sus actitudes, sentimientos, intereses, etc., donde se incluiran los cuestionarios e inventarios de personalidad.

60

Las definiciones de Anastasi y Lord utilizan la expresin muestras de conducta que sintetiza la finalidad ltima de la teora de los tests. Crocker y Algina (1986) enumeran los problemas por los que la medida psicolgica est contaminada por el error:

Ausencia de aproximaciones nicas a la medicin de la mayora de los constructos. El problema reside bsicamente en las diferencias en las definiciones operacionales de la mayora de las variables psicolgicas, lo cual suele conducir a procedimientos diferentes de medida y distintas conclusiones sobre la evaluacin de una misma persona.

Muestreo limitado del comportamiento. Las mediciones suelen basarse en un nmero limitado de comportamientos, obtenidos en un muestreo reducido de situaciones y momentos temporales. As, determinar, por ejemplo, el nmero de tems y la variedad de los contenidos de un test es uno de los problemas habituales en la elaboracin de los procedimientos de medida.

Presencia inevitable de los errores de medida. Las limitaciones muestrales en la obtencin de los comportamientos indicadores obliga a estimar el grado de error presente de forma inevitable en cualquier medicin.

Evolucin de las teoras psicolgicas. Al ser los constructos herramientas conceptuales para la elaboracin de teoras, el significado de las mediciones siempre estar sujeto a la evolucin de la teora de la que forma parte, dependiendo de la obtencin de evidencias que la confirmen o modifiquen.

La finalidad de la teora de los tests es aportar soluciones para minimizar el impacto de estos problemas sobre la medicin psicolgica (Martnez-Arias, 1995).

61

La imposibilidad de observar de forma directa la mayora de las variables psicolgicas obliga a considerar la teora de los tests como una maquinaria conceptual para la inferencia psicomtrica. En qu consiste la inferencia psicomtrica? La elaboracin de tems debe reflejar la definicin operacional y sintctica del constructo objeto de la medicin (Lord y Novick, 1968). El papel de los tems es el de provocar que las respuestas de las personas en una situacin estandarizada, reflejen la conductas que en situaciones espontneas, se consideraran los indicadores conductuales del constructo. La cuantificacin se produce cuando a travs de un procedimiento de escalamiento se asignan valores cuantitativos a los patrones de repuesta de las personas en el test. Sobre la inferencia, desde el valor cuantitativo o puntuacin resumen de la ejecucin de la persona hasta el constructo, pueden incidir diferentes fuentes de variabilidad no deseada, por no relacionada con el constructo objeto de la medicin, que pueden amenazar la correccin de la inferencia: fuentes de variabilidad aleatoria, que tradicionalmente se agrupan bajo la denominacin general de fiabilidad; y fuentes de variacin sistemtica, agrupadas bajo la etiqueta de validez. El objeti vo principal de la teora de los tests es estudiar este proceso de inferencia y aportar procedimientos para realizarla (Crocker y Algina, 1986). Este objetivo ha hecho que bajo la denominacin teora de los tests tengan cabida contenidos tan diversos como: construccin de tests, elaboracin de tems, anlisis de tems, mtodos de puntuacin e interpretacin de las puntuaciones y, de forma preponderante, el anlisis de la fiabilidad y validez de las medidas aportadas por los tests.

La teora de los tests suele dividirse en dos grandes ramas: la teora clsica de los tests y la teora de respuesta a los tems. La cita de Hambleton y van der Linden (1982) expresa con toda claridad esta divisin: Las teoras de los tests pueden dividirse en dos grandes categoras. La primera es la teora clsica de los tests, que parte de la concepcin de Spearman de la puntuacin observada en el test como compuesta de un componente verdadero y otro de error... Importantes hitos en esta larga y venerable tradicin son Theory of mental tests de Gulliksen (1950) y

62

Statistical theories of mental test scores de Lord y Novick (1968)... La segunda es la teora de respuesta al tem, o teora del rasgo latente, como se ha llamado hasta hace poco. Actualmente la teora de respuesta al tem esta teniendo un mayor impacto en el campo de los tests (pg. 373). Complemente este apartado con la lectura anexa Los Test (http://www.psicothema.com/pdf/660.pdf)

63

Captulo 3.Desarrollo de las Pruebas y Metodologa Estadstica de la Psicometra

Criterios de calidad en la construccin de test

Utilice como gua la siguiente pgina web: http://www.uned.es/psico-3-psicometria/ En ella encontrar la explicacin de conceptos y tcnicas importantes para la construccin de pruebas tales como los de Validez y Confiabilidad (fiabilidad), que se encuentran a continuacin. Adems encontrar ejercicios (plantillas) que podr resolver. Leccin 11. Confiabilidad

DEFINICIN: Criterio de calidad relacionado con la precisin de las medidas obtenidas con un test y que proporciona informacin acerca de: la estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y formas paralelas) la consistencia interna del test (alpha y dos mitades)

FRMULA GENERAL:

64

PROCEDIMIENTOS EMPRICOS PARA ESTIMAR EL COEFICIENTE DE FIABILIDAD: TEST-RETEST:

FORMAS PARALELAS:

BASADOS EN LA DIVISIN DEL TEST EN DOS MITADES: PARALELAS: Frmula de Spearman-Brown

ESTRICTA O ESENCIALMENTE TAU-EQUIVALENTES:

Frmula de Rulon:

65

Frmula de

Guttman/Flanagan: BASADOS EN LA COVARIANZA DE LOS ITEMS:

Coeficiente alpha:

KR 20:

KR 21:

FACTORES DE LOS QUE DEPENDE LA FIABILIDAD: LONGITUD DEL TEST: Frmula de Spearman-Brown

VARIABILIDAD DE LA MUESTRA:

66

Leccin12. Validez

DEFINICIN: Criterio de calidad relacionado con la adecuacin de las puntuaciones del test para el objetivo que suscit su aplicacin. TIPOS DE VALIDEZ: VALIDEZ DE CONTENIDO: Trata de garantizar que el test constituye una muestra adecuada y representativa del contenido que ste pretende evaluar. Modo de evaluacin: Recurso a expertos VALIDEZ DE CONSTRUCTO: Trata de garantizar la existencia de un constructo psicolgico que subyaga y d sentido y significado a las puntuaciones del test. Modo de evaluacin: Anlisis factorial

67

Matriz multimtodo-multirrasgo VALIDEZ PREDICTIVA: Trata de garantizar la eficacia del test para pronosticar una variable de inters. FIABILIDAD:

LONGITUD DEL TEST:

VARIABILIDAD DE LA MUESTRA: Para el caso de dos variables:

68

FRMULA GENERAL DEL COEFICIENTE DE VALIDEZ:

DERIVADOS DEL COEFICIENTE DE VALIDEZ:

Leccin 13. Conceptos estadsticos, normas y estandarizacin parte i

Por lo general, el resultado inicial de las pruebas es una puntuacin natural como el nmero total de afirmaciones de personalidad refrendadas en una direccin en particular o el nmero total de problemas resueltos correctamente, quiz con a adicin de puntos bonificados por las soluciones rpidas. En la mayor parte de los casos, sta puntuacin inicial es intil en s misma.^'ara que los resultados de prueba tengan significado, los examinadores deben ser capaces de convertir la puntuacin inicial a alguna forma de puntuacin derivada que se base en la comparacin con un grupo normativo o de estandarizacin. Gran parte de las pruebas se interpreta al comparar los resultados individuales con el desempeo del grupo normativo; las pruebas referidas a criterio, que se analizan ms adelante, constituyen una excepcin.

69

Un grupo normativo consiste en una muestra de personas examinadas que son representativas de la poblacin hacia la cual se dirige la prueba. Considrese una prueba del conocimiento de vocabulario, diseada para utilizarse con futuros estudiantes universitarios de primer grado. En este caso, podran recolectarse los resultados del desempeo de una muestra grande, heterognea y nacional de dichas personas, con propsitos de estandarizacin. E! objetivo esencial de !;i estandarizacin de una prueba consiste en determinar la distribucin de las puntuaciones naturales en un grupo normativo, de modo que quienes desarrollan la prueba tengan la posibilidad de publicar las puntuaciones derivadas conocidas como normas. Como se analizar ms adelante, las normas s encuentran en muchas variedades; por ejemplo, rangos percentiles, equivalentes por edad, equivalentes de nado o puntuaciones estndar. En jVM^al. i.is normas indican la posicin que Tiene (Jln individuo denlio ]- !a prueba, en relacin con el desempeo de otras personas de la misma edad, grado escolar, sexo y otras variables. Para ser efectivas, las normas deben obtenerse con gran cuidado y construirse segn los preceptos ya conocidos que se analizan despus; lo que es ms, pueden volverse anticuadas en slo unos cuantos aos, de modo que la regla, ms que la excepcin, debe ser el establecimiento peridico de nuevas normas. El tema de las normas se enfoca de manera indirecta, ya que el propsito es hacer un anlisis sobre las puntuaciones naturales y despus se revisan los conceptos estadsticos esenciales para una comprensin de las normas.

Puntuaciones naturales

El nivel ms bsico de informacin proporcionada por una prueba psicolgica es la puntuacin natural. Por ejemplo, en una prueba de personalidad, con frecuencia la puntuacin natural es el nmero de preguntas respondidas en la direccin codificada para una escala especfica. En las pruebas de capacidad, por lo comn la puntuacin natural se integra del nmero de problemas respondidos de manera correcta, al que con frecuencia se le suman los puntos bonificados por el desempeo rpido. As, el resultado inicial de la prueba es casi siempre una suma

70

numrica, como 17 de 44 reactivos totales respondidos en la direccin codificada en una escala de depresin, o 29 de 55 puntos de puntuacin natural obtenidos en la subes-cala de Diseo con Cubos de una prueba de inteligencia. Sin embargo, debera ser obvio para el lector que las puntuaciones naturales, por s solas carecen absolutamente de significado. Por ejemplo, de qu sirve conocer que una persona resolvi de manera correcta 12 de 20 preguntas de razonamiento abstracto? Qu significado tiene que un examinando haya respondido en la direccin codificad;: a 19 de 33 preguntas de verdadero-falso de una escala de disp"si:'in Incluso es difcil pensar sobre dichas preguntas sin recurrir a comparaciones de una variedad u otra. Se desea saber la manera en que otras personas han respondido a estas pruebas, si las puntuaciones observadas son altas o bajas en comparacin con un grupo representativo de sujetos. En el caso de pruebas de capacidad, se tiene curiosidad de saber si las preguntas fueron fciles o difciles, en especial en relacin con la edad del sujeto. De hecho, parece casi trivial que una puntuacin natural adquiera significado principalmente en relacin con las normas, un marco de referencia establecido de manera independiente que se deriva de una muestra de estandarizacin. Posteriormente .se ampliar ms acerca de la derivacin y el uso de las normas. Por ahora bastar con saber que las normas se establecen de modo emprico, a travs de la aplicacin de la prueba a una nuestra grande y representativa de personas. Despus se compara la puntuacin del examinado con la distribucin de puntuaciones obtenidas por la muestra de estandarizacin. As, se determina, a partir de las normas, si una puntuacin obtenida es baja, promedio o alta La gran parte de las pruebas psicolgicas se interpreta a travs de la consulta de normas; como ya se seal, estos instrumentos se denominan pruebas referidas a la norma. Sin embargo, se recuerda al lector que existen otros tipos de instrumentos. En particular, las pruebas referidas a criterio ayudan a determinar si una persona puede alcanzar un criterio objetivamente definido, como la suma de pares de nmeros de dos dgitos con una precisin de 97%. En el caso de las pruebas referidas a criterio, las normas no son esenciales. Al final de este tema se explicarn con ms detalle

71

estas pruebas. Existen diferentes tipos de normas, pero stas tienen una caracterstica en comn: cada una incorpora un resumen estadstico de un enorme conjunto de puntuaciones. As, para comprenderlas, el lector necesita dominar la estadstica descriptiva elemental. En este punto se hace un modesto parntesis para revisar los conceptos estadsticos esenciales.

Conceptos estadsticos especiales

Supngase por el momento que se tiene acceso una prueba de vocabulario de alto nivel, apropiada para examinar las habilidades verbales de profesores universitarios y otros profesionales (Gregory y Gernert, 1990). La prueba es un cuestionario de opcin mltiple con 30 palabras difciles como firmamento, paradisiaco y melifluo. Una profesora toma la prueba y elige la alternativa correcta para 17 de las 30 palabras. Pregunta cmo se compara su calificacin con otras personas con el mismo nivel acadmico. Cmo podra responderse a su pregunta? Una manera de responder a la interrogante consistira en darle una lista de las puntuaciones naturales de la muestra preliminar de estandarizacin con 100 profesores representativos de su universidad. Sin embargo, incluso con esta muestra normativa relativamente pequea (lo tpico son miles de individuos), la lista de puntuaciones de prueba es un despliegue excesivo. Cuando se nos confronta con un conjunto de datos cuantitativos, la tendencia humana natural es la de resumir, condensar y organizar dichos datos en patrones significativos. Por ejemplo, en la evaluacin del significado de la puntuacin de vocabulario de la profesora, el lector podra calcular la puntuacin promedio de toda la muestra o establecer la posicin relativa de la puntuacin de la profesora.

Distribucin de frecuencias

Una manera simple y til de resumir los datos consiste en tabular una distribucin de frecuencias , la cual se prepara al especificar un pequeo nmero de intervalos de clase de igual tamao y despus determinar cuntas puntuaciones caen dentro

72

de cada intervalo. La suma de las frecuencias de todos los intervalos ser igual a N, el nmero total de puntuaciones en la muestra. No existe una regla simple para determinar el tamao de los intervalos; ste, obviamente, depende del nmero de intervalos deseado. Es comn que la distribucin de frecuencias tenga entre 5 y 15 intervalos de clase. El cuadro indica que un profesor obtuvo una calificacin de 4, 5 o 6; 8 profesores obtuvieron 7, 8 o 9, y as sucesivamente. Un histograrna proporciona una representacin grfica de la misma informacin contenida en la distribucin de frecuencias. El eje horizontal representa las puntuaciones agrupadas en intervalos de clase, mientras el eje vertical representa el nmero de puntuaciones que caen dentro de cada intervalo de clase. En un histograrna, la altura de una columna indica el nmero de puntuaciones que ocurren dentro de ese intervalo. Un polgono de frecuencias es similar a un histograrna, excepto que la frecuencia de los intervalos de clase se representa con puntos en lugar de columnas. Despus, los puntos independientes se unen por medio de lneas rectas.
Distribucin de frecuencia de las puntuaciones de 100 profesores en una prueba de vocabulario
Intervalo de clase
4-6 7-9

Frecuencia 1
8 12 21 24 21 7 5 1

10-12 13-15 16-18 19-21 22-24 25-27 28-30

W=100

73

Medidas de tendencia central

Se puede establecer una sola puntuacin representativa de las 100 puntuaciones de vocabulario en nuestra muestra? La media (X) o promedio aritmtico es una de dichas puntuaciones. Se calcula sumando todas las puntuaciones y dividindolas entre N, el nmero de puntuaciones. Otro ndice til de tendencia central es la mediana, la puntuacin que se encuentra a la mitad cuando se han ordenado todas las puntuaciones. Si el nmero de puntuaciones es par, la mediana es el promedio de las dos puntuaciones a la mitad. En cualquier caso, la mediana es el punto que divide en dos la distribucin, de modo que la mitad de los casos se encuentren por encima de ella y la mitad por debajo. Por ltimo, la moda es simplemente la puntuacin que ocurre con mayor frecuencia. Si dos puntuaciones tienen la mayor frecuencia de ocurrencia, se dice que la distribucin es bimodal. La media es sensible a los valores extremos y puede ser engaosa si una distribucin tiene pocas puntuaciones inusualmente altas o bajas. Considrese el caso extremo donde nueve personas ganan $10 000.00 y una dcima persona gana $910 000.00. El ingreso promedio para este grupo de personas sera de $100 000; sin embargo, este nivel de ingresos no es tpico de nadie dentro del grupo. La mediana del ingreso, colocada en $10 000, es mucho ms representativa. Por supuesto, ste es un ejemplo extremo, pero ilustra un punto en general: si una distribucin est sesgada (es decir, es asimtrica), la mediana es un mejor ndice de la tendencia central que la meda. Medidas de variabilidad

Dos o ms distribuciones de puntuaciones de prueba pueden tener la misma media y, sin embargo, es posible que difieran en gran medida en el grado de dispersin de las puntuaciones con respecto a la media. Para describir el grado de dispersin, es necesario un ndice estadstico que exprese la variabilidad de las puntuaciones en una distribucin. El ndice estadstico de variabilidad que se utiliza con mayor frecuencia en un grupo

74

de puntuaciones es la desviacin estndar, simbolizada o/y abreviada DE. Desde un punto de vista conceptual, el lector necesita saber que la DE refleja el grado de dispersin en un grupo de puntuaciones. Si stas se encuentran agrupadas estrechamente cerca de un valor central, la Ol es pequea. De hecho, en el caso extremo donde todas las puntuaciones son idnticas, la DE es exactamente cero. A medida que un grupo de puntuaciones se dispersa ms, la DE se vuelve ms grande. Como lo sugiere el nombre, ia varianza es una medida de variabilidad. Sin embargo, en general, los psiclogos prefieren informar la desviacin estndar, que se calcula obteniendo la raz cuadrada de la varianza. Por supuesto, la varianza y la desviacin estndar transmiten informacin intercambiable una se puede calcular a partir de la otra, al elevar al cuadrado (la desviacin estndar para obtener la varianza) u obtener la raz cuadrada (de la varianza para obtener la desviacin estndar). Sm embargo, !a desviacin estndar es la medida preferida de varianza en las pruebas psicolgicas, debido a su relevancia directo para la distribucin normal. Distribucin normal

Los psiclogos prefieren una distribucin normal de puntuaciones de prueba, aun cuando muchas otras distribuciones son tericamente posibles. Por ejemplo, dentro de la esfera de posibilidades se encuentra la distribucin rectangular de puntuaciones de prueba -un nmero igual de resultados en cada intervalo de clase. De hecho, muchos legos podran incluso preferir una distribucin rectangular de puntuaciones de prueba, basados en la premisa equitativa de que las diferencias individuales seran por ello menos pronunciadas. Por ejemplo, una mayor proporcin de personas obtendra puntuaciones en el rango superior si las pruebas psicolgicas se conformaran a una distribucin rectangular de puntuaciones, en vez de a una distribucin normal.

75

Entonces, por qu los psiclogos prefieren una distribucin normal de puntuaciones, aun hasta el punto de seleccionar reactivos de prueba que ayuden a producir este tipo de distribucin en la muestra de estandarizacin? Existen varias razones para ello, incluyendo las consideraciones estadsticas y los dalos empricos. Aqu se har un breve parntesis para explicar la fascinacin psicomtrica con las distribuciones normales. Una razn por la que los psiclogos prefieren las distribuciones normales es que la curva normal tiene caractersticas matemticas tiles que forman la base para varios tipos de investigacin estadstica. Supngase que se tiene inters en determinar si los CI promedio de dos grupos de personas fueron significativamente diferentes. Sera apropiado utilizar una estadstica inferencial como la prueba / para la diferencia entre medias. Sin embargo, muchas estadsticas inferenciales se basan en la suposicin de que la poblacin subyacente de puntuaciones se distribuye de manera normal, o muy cercano a ello. As, a fin de facilitar el uso de estadsticas inferenciales, los psiclogos prefieren que las puntuaciones de prueba en la poblacin normal sigan una distribucin normal o casi normal. Otra base para preferir la distribucin normal es su precisin matemtica. Dado que la distribucin normal se define de manera precisa en trminos matemticos, es posible calcular con gran exactitud el rea bajo las diferentes regiones de la curva. As, una propiedad til de las distribuciones normales es que el porcentaje de casos que caen dentro de un cierto rango o ms all de un cierto valor se conoce de manera exacta. Una tercera base para preferir una distribucin normal de las puntuaciones de prueba es que, con frecuencia, la curva normal surge de manera espontnea en la naturaleza. Transformacin de las puntuaciones naturales

Darle sentido a los resultados de prueba es, en gran medida, una cuestin de transformar las puntuaciones naturales en formas ms interpretables y tiles de

76

informacin. En el anlisis anterior acerca de las distribuciones normales, se insinuaron las transformaciones al mostrar la manera en que el conocimiento sobre la media y la desviacin estndar de dichas distribuciones pueden ayudar a determinar la posicin relativa de una puntuacin individual. En esta seccin se continuar con este tema de una manera ms directa, al presentar los requisitos formales para varios tipos de transformaciones de las puntuaciones naturales Percentiles y rangos percentiles Un percentil expresa el porcentaje de personas dentro de la muestra de estandarizacin que obtuvieron puntuaciones por debajo de una puntuacin natural especfica. Se advierte al lector que no debe confundir los percentiles con el porcentaje de respuestas correctas. Recurdese que un perccntil indica slo cmo se compara a un individuo con la muestra de estandarizacin y no transmite el porcentaje de preguntas respondidas de manera correcta. Es posible que, en una prueba difcil, una puntuacin natural de 50% de respuestas correctas podra traducirse a un percenlil 90, 95 o incluso 100. A la inversa, en una prueba fcil, una puntuacin natural de 95% de respuestas correctas podra traducirse a un percentil 5, 10o 20. Los percenliles tambin pueden concebirse como ltigos en un grupo de 100 sujetos representativos, donde I es el rango inferior y 100 el superior. Obsrvese que los rangos percentiles son el reverso completo de los procedimientos comunes de clasificacin por rangos. Un rango percentil (RP) de I se encuentra en el extremo inferior de la muestra, mientras que un RP de 99 se encuentra cerca del tope.

Puntuacin estndar Aunque los percentiles son el tipo ms popular de puntuacin transformada, las puntuaciones estndar ejemplifican las propiedades psicom-tricas ms deseables. Una puntuacin estndar utiliza la desviacin estndar de la distribucin total de puntuaciones naturales como la unidad fundamental de medida. La puntuacin estndar expresa la distancia de la media en unidades de desviacin estndar. Por ejemplo, una puntuacin natural que se encuentra exactamente a una desviacin estndar por encima de la media se convierte en una puntuacin estndar de +1.00.

77

Una puntuacin natural que se encuentra exactamente a la mitad de una desviacin estndar por debajo de la media, se convierte en una puntuacin estndar de -0.50. As, una puntuacin estndar no slo expresa la magnitud de la desviacin con respecto a la media, sino tambin la direccin de esa desviacin (positiva o negativa). El clculo de la puntuacin estndar de un individuo (tambin llamada puntuacin z) es sencillo: se resta la puntuacin natural de la persona examinada a la media del grupo normativo y despus se divide esta diferencia entre !a desviacin estndar del grupo normativo. La puntuacin estndar posee la propiedad psicomtrica deseable de conservar las magnitudes relativas de distancia entre los valores sucesivos, encontradas entre las puntuaciones naturales originales. Esto se debe a que la distribucin de las puntuaciones estndar tiene la misma forma que la distribucin de las puntuaciones naturales. Como consecuencia, el uso de las puntuaciones estndar no distorsiona la escala de medida subyacente.

Puntuaciones T y otras puntuaciones estandarizadas

Muchos psiclogos y educadores aprecian las propiedades psicomtricas de las puntuaciones estndar, pero consideran las fracciones decimales y los signos positivos y negativos (p. ej., z = -2.32) como distracciones innecesarias. En respuesta a estas preocupaciones, los especialistas en pruebas han diseado cierto nmero de variaciones para las puntuaciones estndar que colectivamente se conocen como puntuaciones estandarizadas. Desde un punto de vista conceptual, las puntuaciones estandarizadas son idnticas a las puntuaciones estndar. Ambas contienen exactamente la misma informacin. No se afecta la forma de la distribucin de puntuaciones y la relacin entre las puntuaciones estndar y estandarizadas siempre se traza como una lnea recta. Sin embargo, las puntuaciones estandarizadas siempre se expresan como nmeros enteros positivos (no existen fracciones decimales ni signos negativos), de modo que muchos usuarios de prueba prefieren representar los resultados en esta forma.

78

Las puntuaciones estandarizadas eliminan las fracciones y los signos negativos al producir valores diferentes a cero para la media y 1.00 para la desviacin estndar de las puntuaciones transformadas. La media de las puntuaciones transformadas puede establecerse en cualquier valor conveniente como 100 o 500 y la desviacin estndar en, digamos, 15 o 100. El punto importante acerca de las puntuaciones estandarizadas es que se puede transformar cualquier distribucin a una escala preferida con media y desviacin estndar predeterminadas. Un tipo muy conocido de puntuacin estandarizada es la puntuacin T, que tiene una media de 50 y desviacin estndar de 10. Las escalas en puntuacin T son especialmente comunes en las pruebas de personalidad. Por ejemplo, en el MMP1, cada escala clnica (como Depresin, Paranoia) se convierte a una medida comn, donde 50 es la puntuacin promedio y 10 es la desviacin estndar de la muestra normativa. Las puntuaciones estandarizadas se pueden adaptar para producir cualquier media y desviacin estandr. Sin embargo, para eliminar las puntuaciones estandarizadas negativas, la media preseleccionada debe ser cuanto menos 5 veces tan grande como la DE. En la prctica, quienes desarrollan pruebas dependen de unos cuantos valores preferidos para las medias y desviaciones estndar de las puntuaciones estandarizadas.

Leccin 14. Conceptos estadsticos, normas y estandarizacin parte ii

Seleccin de un grupo normativo

Cuando se elige un grupo normativo, quienes desarrollan pruebas se esfuerzan por obtener una muestra representativa de la poblacin para la cual se dise la prueba (Petersen, Kolen y Hoover, 1989). En teora, obtener un grupo normativo representativo es simple y sencillo. Considrese una prueba de rendimiento escolar diseada para nios de sexto grado de primaria en EUA. La poblacin relacionada la constituyen todos los nios en sexto grado, de costa a costa del pas y en Alaska

79

y Hawai. Se puede obtener una muestra representativa de estos individuos potenciales a travs de un muestreo aleatorio por computadora de

aproximadamente 10 000 nios, entre los millones de nios elegibles. Cada uno tendra igual probabilidad de ser elegido para realizar la prueba; es decir, la estrategia de seleccin sera un simple muestreo aleatorio. Los resultados de dicho muestreo constituiran una fuente ideal para los datos normativos. Con una muestra aleatoria amplia, es casi seguro que la diversidad de antecedentes tnicos, clases sociales, localizaciones geogrficas y entornos urbanos contra rurales tendran una representacin proporcional en la muestra. En el mundo real, obtener muestras normativas nunca es tan sencillo y definitivo como el caso hipottico anterior. Los investigadores no tienen una lista completa de todos los nios de sexto grado en el pas y, aunque la tuvieran, quienes desarrollan pruebas no podran obligar a lodos los nios seleccionados a! azar a que participaran en la estandarizacin de una prueba. Tambin surgen asuntos relacionados con el costo. Debe pagarse a los psicmetras para que apliquen la prueba al grupo normativo. Los autores de la prueba pueden optar por unos cuantos cientos de personas representativas en vez de utilizar un nmero mayor. Para ayudar a asegurar que los grupos normativos de menor tamao sean verdaderamente representativos de la poblacin para la cual se dise la prueba, los autores de la misma utilizan un muestreo aleatorio estratificado. Este enfoque consiste en estratificar, o clasificar, a la poblacin blanco en cuanto a variables antecedentes (como edad, sexo, raza, clase social, nivel educativo) y despus seleccionar al azar un porcentaje apropiado de personas dentro de cada estrato. Por ejemplo, si 12% de la poblacin relacionada es afroestadounidense, entonces quien desarrolla la prueba elige los sujetos de manera aleatoria, pero con la restriccin de que 12% del grupo normativo debe ser tambin afroestadounidense. En la prctica, muy pocos creadores de pruebas reproducen completamente el muestreo aleatorio o el muestreo aleatorio estratificado en el proceso de seleccin del grupo normativo. Lo que es ms tpico es un esfuerzo de buena fe por elegir una muestra diversa y representativa de escuelas fuertes y dbiles; vecindarios minoritarios y blancos; ciudades grandes y pequeas y comunidades del norte, este,

80

centro y sur. Si esta muestra engloba entonces aproximadamente el mismo porcentaje de minoras, habitantes de las ciudades, familias de clase alta y baja que el censo nacional, entonces los autores de la prueba se sienten seguros de que el grupo es representativo. Existe una importante leccin en las incertidumbres, concesiones y aspectos prcticos de la seleccin del grupo normativo; a saber, que las normas de pruebas psicolgicas no son absolutas, universales o intemporales. Son relativas a una poca histrica y a la poblacin normativa particular de la cual se derivaron. Se ilustrar la naturaleza efmera de las estadsticas normativas en una seccin posterior cuando se muestre cmo una importante prueba de CI en cuyas normas se estableci un promedio nacional de 100 puntos en 1974, produjo un promedio nacional de 107 en 1988. Incluso las normas que se seleccionan con gran cuidado y se basan en muestras grandes pueden volverse obsoletas en el curso de un decenio y en ocasiones menos.

Normas por edad y grado escolar

A medida que uno crece, se cambia de manera calculable, ya sea para mejorar o empeorar. Esto es obviamente cierto en la infancia, cuando las habilidades intelectuales mejoran visiblemente de un mes a otro. En la edad adulta, el cambio personal es lento, pero aun se puede discernir. Por ejemplo, se espera que los adultos muestren un nivel ms maduro de vocabulario con cada decenio que transcurre (Gregory y Gernert, 1990). Una norma por edad representa el nivel de desempeo en la prueba para cada grupo independiente segn la edad dentro de la muestra normativa. El propsito de las normas por edad es el de facilitar las comparaciones entre individuos de la misma edad. Con las normas por edad, el desempeo de una persona se interpreta en relacin con los sujetos dentro de la estandarizacin que tienen la misma edad. El rango de edades para un grupo normativo por edad puede variar de un mes a un decenio o ms, segn el grado en que el desempeo en la prueba depende de los aos de vida. Para caractersticas que cambian con rapidez como las capacidades intelectuales durante la infancia los creadores de pruebas podran informar normas independientes de prueba

81

para grupos de edad definidos de manera estrecha; por ejemplo, intervalos de cuatro meses. Eso permite que, por decir, el examinador compare los resultados de prueba de un nio que tiene cinco aos, dos meses de edad (edad 5-2) con la muestra normativa de nios que van de los 5-0 a los 5-4 aos. En contraste, las caractersticas adultas cambian de manera ms lenta y podra ser suficiente con informar datos normativos para intervalos de edad de 5 o 10 aos. Las normas segn el grado escolar son conceptualmente similares a las normas por edad. Una norma por grado representa el nivel de desempeo en pruebas para cada grado escolar dentro de la muestra normativa. Las normas por grado se utilizan poco en el caso de pruebas de capacidad. Sin embargo, stas son especialmente tiles en entornos educativos, cuando se presentan los niveles de rendimiento de los nios en edad escolar. Dado que el rendimiento acadmico en muchas reas de contenido depende en gran medida de la exposicin al currculo de materias segn el grado escolar, la comparacin de un estudiante contra una muestra normativa del mismo grado es ms apropiada que emplear comparaciones basadas en la edad.

Pruebas referidas a criterio

Una alternativa a las pruebas referidas a la norma, es las pruebas referidas a criterio (Frechtling, 1989; Glaser, 1963; Popham, 1978; Berk, 1984). Mientras que las primeras utilizan una muestra representativa de personas como su marco de referencia interpretativo, una prueba referida a criterio compara los logros de un individuo examinado con un rea bien definida de contenido. Por ejemplo, el desempeo de la persona que se somete a prueba podra presentarse como un nivel especfico de habilidad en aritmtica (suma correctamente 2 nmeros de 3 dgitos en 100% de las ocasiones, pero slo tiene 70% de precisin cuando suma 3 nmeros de 3 dgitos). Las pruebas referidas a criterio representan un cambio fundamental en perspectiva. El cen tro de atencin se coloca en aquello que el examinado puede hacer, ms que en comparaciones con los niveles de desempeo de otros individuos. As, las

82

pruebas referidas a criterio iden tincan el dominio (o falta de dominio) absoluto de la persona examinada en relacin con conductas especficas. En general, estas pruebas se han utilizado en entornos escolares para ayudar a los maestros dentro del saln de clase a determinar qu se debe ensear y tambin para evaluar los efectos precisos de los esfuerzos de enseanza del currculo escolar. Las pruebas referidas a criterio son ms adecuadas para examinar las habilidades acadmicas bsicas (p. ej., nivel de lectura, habilidades de clculo aritmtico) en ambientes educativos. Sin embargo, estos tipos de instrumentos son sumamente inapropiados para examinar capacidades de nivel superior, debido a que es difcil formular objetivos especficos para dichas reas de contenido. Considrese un caso en particular: cmo se desarrollara una prueba referida a criterio para examinar la pericia en programacin de computadora;'.' Sera difcil proponer conductas especficas que pudieran poseer todos los expertos en programacin de computadoras y, por tanto, sera casi imposible construir una prueba referida a criterio para esta habilidad de alto nivel. Berk (1984) analiza los problemas tcnicos en la construccin y evaluacin de este tipo de pruebas.

Leccin 15. Construccin de pruebas

Un autor de pruebas debe elegir estrategias y materiales y despus tomar decisiones continuas de investigacin que afectarn la calidad de su instrumento en germinacin. El propsito de esta seccin consiste en analizar el proceso mediante el cual los psicmetras creen pruebas vlidas. Aunque se examinarn muchas cuestiones independientes, a todas las vincula un tema en comn: las pruebas vlidas simplemente no aparecen en escena en plena madurez surgen de manera lenta de un proceso evolutivo. En este tema se enfatizarn los aspectos bsicos del desarrollo de pruebas. La construccin de pruebas consta de seis etapas entrelazadas: Definicin de la prueba. Seleccin de un mtodo de escalamiento. Construccin de los reactivos.

83

Examen de los reactivos. Revisin de la prueba. Publicacin de la prueba.

La definicin de la prueba consiste en la delimitacin de su alcance y propsito, los cuales deben conocerse antes de que el autor pueda proseguir con su construccin. La seleccin de un mtodo de escalamiento es un proceso en el que se establecen las reglas mediante las cuales se asignan nmeros a los resultados de la prueba. La construccin de los reactivos es tanto un arte como una ciencia y es aqu donde puede requerirse la creatividad del autor. Una vez que se tiene disponible una versin preliminar de la prueba, los autores en general la aplican a una muestra de tamao modesto de individuos, a fin de reunir los datos iniciales sobre las caractersticas de los reactivos. El examen de stos implica una variedad de procedimientos estadsticos conocidos como anlisis de reactivos, cuyo propsito consiste en determinar cules reactivos deben conservarse, revisarse y eliminarse. Con base en el anlisis de reactivos y en otras fuentes de informacin, se revisa la prueba. Si las revisiones son sustanciales, es posible que se requieran nuevos reactivos y prepruebas adicionales con nuevos individuos. As, la construccin de pruebas implica un circuito de realimentacin donde se podran producir 2, 3 y 4 bosquejos de un instrumento. La publicacin de la prueba es el paso final. Adems de difundir los materiales de una prueba, el autor debe producir un manual fcil de comprender para el usuario. A continuacin se examinarn con ms detalle cada uno de estos pasos.

Definicin de la prueba

A fin de construir una nueva prueba, el autor debe tener una idea clara de aquello que ha de medir y de cmo difiere sta de los instrumentos existentes. Dado que la existencia de las pruebas psicolgicas est a punto de entrar en su segundo siglo y ya que se han publicado miles de pruebas para este momento, es claro que la responsabilidad de probar que un instrument es diferente y mejor que los existentes depende del autor.

84

Considrese la sobrecogedora tarea que enfrenta un autor de pruebas que propone otro instrumento de inteligencia general. Con docenas de dichos instrumentos en existencia, cmo es posible que uno nuevo haga una contribucin til al campo? La respuesta es que la investigacin contempornea aumenta de manera continua la comprensin acerca de la inteligencia e impulsa a buscar nuevas maneras y ms tiles de medir este constructo multifactico. Seleccin de un mtodo de escalamiento El propsito inmediato del examen psicolgico es asignar nmeros a las respuestas en una prueba de modo que pueda juzgarse que la persona examinada tiene una mayor o menor cantidad de la caracterstica medida. Las reglas mediante las cuales se asignan nmeros a las respuestas definen el mtodo de escalamiento. Los autores de pruebas seleccionan un mtodo de este tipo que se adecu en forma ptima a la manera en que han conceptuado el rasgo o rasgos medidos por su prueba. Ningn mtodo de escalamiento es uniformemente mejor que otros. En el caso de algunos rasgos, la clasificacin ordinal de parte de jueces expertos podra ser el mejor enfoque de medicin; en el caso de otros, la medicin escalar compleja de los datos de auiointorme puede producir las medidas ms vlidas. No obstante, antes de revisar los mtodos de escalamiento seleccionados, es necesario que se presente un concepto relacionado, los niveles de medicin.

Niveles de medicin

Todos los nmeros extrados de los instrumentos de medicin de cualquier tipo pueden colocarse dentro de una de cuatro categoras jerrquicas: nominal, ordinal, de intervalo o de razn. Cada categora define un nivel de medicin; el orden que se lista es de menos a ms informativo. En las escalas nominales, los nmeros sirven slo como nombres de categoras. Por ejemplo, cuando se obtienen datos para un estudio demogrfico, un investigador podra codificar a los varones como "1" y a las mujeres como "2". Vase que los nmeros son arbitrarios y no designan si hay "ms" o "menos" de una cosa. En las escalas nominales, los nmeros son slo una forma simplificada de

85

denominacin. Las escalas ordinales constituyen una forma de ordenacin o clasificacin. Si se le pidiera a profesores universitarios que clasificaran cuatro automviles en cuanto a cul preferiran poseer, el orden preterido podra ser "1" Cadillac, "2" Chevrolet, "3" Volkswagen, "4" Hyundai. Obsrvese en este caso que los nmeros no son intercambiables. Una clasificacin de "1" es "ms" que una clasificacin de "2" y as sucesivamente. El "ms" se refiere al orden de preferencia. Sin embargo, las escalas ordinales no proporcionan informacin sobre la fortaleza relativa de las clasificaciones. En este ejemplo hipottico no se puede saber si los profesores universitarios tienen una fuerte preferencia por los Cadillac por encima de los Chevrolet o slo hay una diferencia marginal en su preferencia. Una escala de intervalo proporciona informacin acerca de clasificacin, pero tambin provee una medida para estimar las diferencias entre clasificaciones, para construir una escala de intervalo se podra pedir a los profesores universitarios que calificaran en una escala de I a 100 qu tanto les gustara poseer los cuatro automviles antes citados. Supngase que las calificaciones promedio van como sigue: Cadillac, 90; Chevrolet, 70; Volkswagen, 60; Hyundai, 50. A partir de esta informacin se puede inferir que la preferencia por un Cadillac es mucho ms fuerte que por un Chevrolet que, a su vez, tiene una preferencia levemente ms fuerte que el Volkswagen. Ms importante an es que tambin puede suponerse que los intervalos entre los puntos en esta escala son aproximadamente iguales: La diferencia ende la preferencia de los profesores por un Chevrolet y un Volkswagen (10 puntos) es ms o menos la misma que existe entre un Volkswagen y un Hyundai (tambin 10 puntos). En pocas palabras, las escalas de intervalo se basan en la suposicin de unidades o intervalos de igual tamao para la escala subyacente. Una escala de razn tiene todas las caractersticas de una escala de intervalo, pero tambin posee un punto cero conceptualmente significativo, en el que existe ausencia total de la caracterstica medida. Las escalas de razn son poco comunes en la medicin psicolgica. Considrese si existe algn sentido significativo en el que pueda pensarse que una persona tiene cero inteligencia. No, en realidad. Lo mismo ocurre con la mayor parle de los constructos en psicologa, os punios cero significativos simplemente no existen. Sin

86

embargo, unas cuantas medidas fsicas que emplean los psiclogos califican para escalas de razn. Por ejemplo, la estatura y el peso alcanzan esa calificacin y quiz tambin algunas medidas fisiolgicas. Los niveles de medicin son relevantes para la construccin de pruebas debido a que los procedimientos estadsticos paramtricos ms poderosos y tiles (p. ej., rae Pearson, anlisis de varianza, regresin mltiple) deberan utilizarse slo para puntuaciones obtenidas de medidas que satisfacen los criterios de las escalas de intervalo o de razn. Para las escalas que slo son nominales u ordinales deben emplearse procedimientos estadsticos no paramtricos menos poderosos (p. ej., j cuadrada, correlacin por rangos, pruebas de mediana).

Mtodos representativos

Clasificaciones de expertos

Supngase que se desea medir la profundidad del coma en los pacientes que han sufrido un traumatismo craneal reciente que ios ha dejado inconscientes. Una escala de profundidad del coma sera muy importante para la prediccin del curso de la mejora, debido a que es bien conocido que un periodo extenso de inconsciencia ofrece un pronstico pobre de recuperacin. Adems, el personal de rehabilitacin tiene la necesidad prctica de saber si un paciente est en coma profundo o se encuentra en un estado parcialmente comunicativo de conciencia con somnolencia. Un enfoque de la medicin con una escala de la profundidad del coma consistira en depender de las clasificaciones de expertos en cuanto a aspectos conductuales. Por ejemplo, se le puede pedir a un panel de neurlogos que enumere las conductas asociadas con los diferentes niveles de conciencia. Despus de que stos han presentado una gran lisia de conductas diagnsticas, los autores de la prueba preferiblemente expertos en traumatismos craneales clasificaran las conductas indicadoras en un continuo de conciencia que vaya desde el coma profundo hasta la orientacin bsica. Teasdale y Jennett (1974) utilizaron justo este enfoque y

87

produjeron la Glasgow Coma Scale (Escala de Coma de Glasgow). Instrumentos similares a ste se emplean de manera amplia en hospitales para la evaluacin de lesiones por traumatismo craneal. La Glasgow Coma Scale se califica al observar al paciente y asignar el mximo nivel de funcionamiento en cada una de las tres subes-calas. En cada una se supone que el paciente presenta todos los niveles de conducta por debajo del nivel calificado. As, desde un punto de vista psicomtrico, esta escala consiste de tres subescalas (ojos, respuesta verbal y respuesta motora) cada una de las cuales produce una clasificacin ordinal de conducta. Si se asignan nmeros a las clasificaciones (p. ej., para ojos abiertos una codificacin de "no" = 1; "ante el dolor" = 2 y as sucesivamente), entonces pueden sumarse los nmeros para el nivel calificado en cada subescala, lo cual produce una puntuacin mxima posible de 14 puntos. La puntuacin total en la Glasgow Coma Scale predice la recuperacin posterior con un grado muy alto de precisin. Mtodo de intervalos de aparicin balanceada

A principios de este siglo, L. L. Thurstone (1929) propuso un mtodo para construir escalas al nivel de intervalo a partir de afirmaciones de actitud. Su mtodo de intervalos de aparicin balanceada todava se utiliza en la actualidad, lo cual hace que Thurstone sea uno de los gigantes de la teora psicomtrica. La metodologa en s para construir intervalos de aparicin balanceada es un tanto estadsticamente compleja y abrumadora, pero la lgica subyacente es fcil de explicar (Ghiselli, Campbell y Zedeck, 1981). Para ilustrar este mtodo, se resumen los pasos implicados en la construccin de una escala de actitudes hacia la membresa a una iglesia. 1. Se obtienen tantas afirmaciones posibles de falso-verdadero que reflejen una variedad de actitudes positivas y negativas hacia la iglesia. Dos ejemplos extremos podran ser: "Siento que los servicios religiosos me dan inspiracin y me ayudan a dar lo mejor de m mismo durante la siguiente semana". "Pienso que las iglesias buscan imponer gran cantidad de dogmas anticuados y supersticiones medievales". Por supuesto, tambin se reuniran muchos reactivos moderados. 2. A continuacin, se le pide a un nmero aproximado de 10 jueces expertos que

88

califiquen

estas

afirmaciones

para

determinar

el

grado

de

favorabilidad/desfavorabilidad hacia la actitud. Los jueces deben ser calificados para esa tarea; podra utilizarse a ministros para una escala de actitud hacia la membresa a una iglesia. En general, se pide a cada juez que clasifique cada afirmacin en categoras de 1 a 11 que vayan desde "extremadamente favorable" hasta "extremadamente desfavorable. Se le dice a los jueces que hagan a un lado sus propios prejuicios y que consideren las 11 categoras como equidistantes. 3. Despus de que los jueces han terminado con el proceso de evaluacin, se determina la calificacin media de favorabilidad (de 1 a 11) y la desviacin estndar para cada reactivo. Por ejemplo, 10 jueces pueden haber dado una calificacin promedio de favorabilidad de 9.2 al primer reactivo antes enunciado; pero es probable que las calificaciones difieran de un juez a otro, como se refleja en una desviacin estndar de 1.1 para este reactivo. 4. Debido a que la desviacin estndar en la calificacin de favorabilidad de un reactivo refleja ambigedad, los reactivos con desviaciones estndar grandes se descartan. Por lo general, se eligen aproximadamente 20 a 30 reactivos, de modo que las afirmaciones cubran el rango de la dimensin (favorable a desfavorable). Se supone que las diferencias entre reactivos en la escala final satisfacen las propiedades de una escala de intervalo. 5. Se pide a las personas que contesten la escala de actitud que marquen todas las afirmaciones con las que concuerdan. Su calificacin se determina al promediar los valores de escala de los reactivos respaldados.

- Mtodo de escalamiento absoluto

Thurstone (1925) tambin desarroll el mtodo de escalamiento absoluto, un procedimiento para obtener una medida de la dificultad absoluta de los reactivos con base en los resultados de diferentes grupos de personas examinadas de diferentes edades. La metodologa para determinar la dificultad individual de los reactivos en un escalamiento absoluto es bastante compleja, aunque la fundamentacin subyacente no es tan difcil de comprender. En esencia, se aplica

89

un conjunto de reactivos comunes de prueba a dos o ms grupos de diferentes edades. La dificultad relativa de stos sirve como fundamento para realizar una serie de comparaciones entrelazadas para todos los reactivos y todos los grupos por edad. Un grupo por edad sirve como grupo base. La dificultad de los reactivos se mide en unidades comunes como unidades de capacidad en desviacin estndar para el grupo base. El mtodo de escalamiento absoluto se utiliza ampliamente en pruebas de rendimiento y aptitud (STEP, 1980; Donlon, 1984). Thurstone (1925) ilustr el mtodo de escalamiento absoluto con datos de prueba de 3 000 escolares en las 65 preguntas de la prueba Binet original. Con la media de inteligencia de los nios de 3 aos, 6 meses de edad en la prueba Binet como punto cero y la desviacin estndar de su inteligencia como unidad de medicin, construy una escala que iba de -2 a + 10 y despus localiz cada una de las 65 preguntas en esa escala. Thurstone (1925) encontr que la escala "hace surgir de manera bastante sorprendente el hecho de que las preguntas se encuentran agrupadas de manera indebida en ciertos rangos de dificultad y son ms bien escasas en otros". Un autor moderno de pruebas utilizara este tipo de anlisis como base para eliminar reactivos redundantes (en el sentido de que miden el mismo nivel de dificultad) y aadira otros que analicen los rangos superiores (e inferiores) de dificultad. Escalas Likert

Likert (1932) propuso un mtodo sencillo y directo para asignar una escala a las actitudes, el cual tiene amplia utilizacin hoy da. Una escala Likert le presenta a la persona evaluada cinco respuestas ordenadas en un continuo de

acuerdo/desacuerdo o aprobacin/desaprobacin. Por ejemplo, un reactivo en una escala para evaluar las actitudes hacia la membresa a una iglesia podra ser: Los servicios religiosos me dan inspiracin y me ayudan a dar lo mejor de m mismo durante la siguiente semana.

Dependiendo del fraseo de un reactivo en particular, una respuesta extrema de "fuertemente de acuerdo" o "fuertemente en desacuerdo" indicara la respuesta ms favorable en la actitud subyacente medida con este cuestionario. Likert (1932)

90

asign una puntuacin de 5 a esta respuesta extrema, 1 a la respuestas totalmente contraria y 2, 3 y 4 a las respuestas intermedias. La puntuacin total de la escala se obtiene al sumar las puntuaciones de los reactivos individuales. Por tal razn, la escala Likert tambin se conoce como escala sumatoria. Escalas Guttman

En una escala Gutiman, las personas que corroboran una afirmacin tambin concuerdan con afirmaciones ms leves que tienen que ver con el mismo continuo subyacente (Guttman, 1944, 1947). As, cuando el examinador conoce la confirmacin ms extrema de la persona evaluada en el continuo, le es posible reconstruir tambin la respuesta intermedia. Las escalas Guttman se producen al seleccionar reactivos que caigan en una secuencia ordenada de confirmaciones de la persona examinada. Es poco comn que se logre una escala Guttman perfecta debido a los errores de medicin pero, de todas maneras, es una meta adecuada para ciertos tipos de pruebas. Aunque el enfoque Guttman se dise originalmente para determinar si un conjunto de afirmaciones de actitud es unidimensional, la tcnica se ha utilizado para muchos tipos diferentes de pruebas. Por ejemplo, Beck utiliz un mtodo de escalamiento del tipo Guttman para producir los reactivos individuales del Beck Depresaion Invcntory (Inventario Beck de Depresin; BDI, Beck, Steer y Garbn, 1988; Beck y colaboradores, 1961). Los reactivos de este inventario se parecen a los siguientes: ( ) En ocasiones me siento triste o afligido ( ) Con frecuencia me siento triste o afligido ( ) Me siento triste o afligido la mayor parte del tiempo ( ) Siempre me siento triste y no puedo tolerarlo. Se pide al cliente que "marque en cada grupo las afirmaciones que, a su parecer, lo representen de manera ms certera". Un cliente que marque una alternativa extrema (p. ej., "Siempre me siento triste y no puedo tolerarlo") casi con toda seguridad coincidir tambin con las afirmaciones ms leves. Mtodo de concordancia emprica

Es posible que el lector haya observado que la mayor parte de los mtodos de escalamiento que se analizan en la seccin anterior dependen del juicio autorizado

91

de expertos para la seleccin y ordenacin de los reactivos. Tambin es posible construir escalas de medicin que se basen por completo en consideraciones empricas ajenas a la teora o el juicio experto. En el mtodo de concordancia emprica, los reactivos de una prueba se seleccionan para una escala con base nicamente en qu tan bien contrastan con un grupo criterio con respecto a una muestra normativa. Por ejemplo, se podra obtener una escala de Depresin a partir de una reserva de preguntas de falso-verdadero de un inventario de personalidad, como se ve a continuacin: 1. Se rene a un grupo cuidadosamente selec cionado y homogneo de personas que ex perimenten depresin mayor, a fin de que respondan a la reserva de preguntas de falsoverdadero. 2. En cada reactivo se compara la frecuencia de confirmacin del grupo de depresin con la de la muestra normativa. 3. Los reactivos que muestran una gran diferencia en frecuencia de confirmacin entre las muestras con depresin y normativa se seleccionan para la escala de Depresin, se codifican en la direccin favorecida por los individuos con depresin (verdadero o falso, segn sea apropiado). 4. Entonces, la puntuacin en bruto de la escala de Depresin es sencillamente el nmero de reactivos respondidos en la direccin codificada. El mtodo de concordancia emprica puede producir algunas sorpresas

interesantes. Un descubrimiento comn es que algunos reactivos seleccionados para una escala pueden no mostrar relacin obvia con el constructo a medir. Por ejemplo, un reactivo como "Bebo mucho agua" (codificado como verdadero) podra

92

terminar dentro de una escala de Depresin. La fundamentacin momentnea para incluir este reactivo es sencillamente que funciona. Por supuesto, el reto que se les presenta a los investigadores consiste en determinar por qu funciona el reactivo.

Construccin de escalamiento racional (consistencia interna)

El enfoque racional de la construccin de una escala es un mtodo popular para el desarrollo de los inventarios de autoinforme. El nombre racional es en cierto modo equivocado, ya que algunos mtodos estadsticos son esenciales para este enfoque. Tambin, el nombre implica que otros enfoques no son racionales o son irracionales, lo cual es falso. En el centro del mtodo de escalamiento racional se encuentra que todos los reactivos de la escala se correlacionan en sentido positivo entre s y tambin con la puntuacin total de la misma. Un nombre alternativo y ms apropiado para este enfoque es el de consistencia interna, el cual enfatiza lo que en realidad se hace. Supngase que un autor de pruebas desea desarrollar una nueva escala de autoinforme para el potencial de liderazgo. Con base en una revisin de la literatura pertinente, el investigador podra concluir que el potencial de liderazgo se caracteriza por confianza en uno mismo, flexibilidad bajo presin, inteligencia elevada, capacidad de persuasin, asertividad y la capacidad para percibir lo que otros piensan y sienten. Estos conceptos sugieren que los siguientes reactivos de falso-verdadero podran ser tiles en la evaluacin del potencial de liderazgo (Oough y Bradley, 1992): En general tengo confianza y segundad en m mismo. (V) Cuando otras personas estn en desacuerdo conmigo, en general me quedo en silencio o cedo de algn otro modo. (F) Creo que me encuentro notablemente por encima del promedio en cuanto a capacidad intelectual. (V) Con frecuencia siento que tengo una comprensin

93

deficiente de la manera en que otras personas reaccionarn ante las cosas. (F). Es probable que mis amigos me describieran como una persona fuerte y enrgica. (V) La V y la F despus de cada afirmacin indican la direccin codificada de manera racional para el potencial de liderazgo. Por supuesto, tambin se propondran reactivos adicionales con intenciones similares. El autor de la prueba podra comenzar con 100 reactivos que parecen con una base racional evaluar el potencial de liderazgo. Estos reactivos preliminares se aplicaran a una muestra amplia de individuos similares a la poblacin blanco a la que se dirige la escala. Por ejemplo, si sta se disea para identificar a estudiantes universitarios con potencial de liderazgo, entonces debera aplicarse a una muestra representativa de varios cientos de estudiantes universitarios. Para el desarrollo de la escala son deseables muestras muy grandes. En este caso hipottico, supngase que se obtienen resultados con 500 estudiantes universitarios. El siguiente paso en la construccin de un escalamiento racional consiste en correlacionar las puntuaciones de cada uno de los reactivos preliminares con la puntuacin total de la prueba para los 500 participantes en la muestra del piloteo. Debido a que las puntuaciones en los reactivos son dicotmicas (se asigna de manera arbitraria un 1 para la respuesta que corresponde a la clave de calificacin y O a la alternativa), se requiere de un coeficiente r de correlacin biserial. Una vez que se obtienen las correlaciones, el investigador busca en el listado las correlaciones dbiles y las inversas (correlaciones negativas). Estos reactivos se descartan debido a que no contribuyen a la medicin del potencial de liderazgo. Podran eliminarse hasta la mitad de los reactivos originales. Si de inicio se descarta una gran proporcin de stos, el investigador podra volver a calcular las correlaciones entre los reactivos y el total, con base en una reserva reducida de aqullos para verificar la homogeneidad de los restantes. Los reactivos que sobreviven a este procedimiento iterativo constituyen la escala de potencial de liderazgo. El lector debera mantener en mente que el enfoque racional para la construccin de escalas

94

tan slo produce una homognea al medir un constructo especificado. Se necesitaran estudios adicionales con nuevas muestras de individuos para determinar la confiabilidad y validez de la nueva escala.

Construccin de Reactivos

Construir los reactivos de una prueba es un procedimiento doloroso y laborioso que impone demandas a la creatividad de los autores de pruebas. Quien los redacta se enfrenta con una profusin de preguntas inciales: El contenido de los reactivos debe ser homogneo o variado? Qu rango de dificultad deberan cubrir los reactivos? Cuntos reactivos inciales deberan construirse? Qu procesos cognitivos y dominios del reactivo deberan cubrirse? Qu tipos de reactivos de prueba deberan utilizarse?

Preguntas inciales en construccin de pruebas

La primera pregunta tiene que ver con la homogeneidad contra la heterogeneidad en el contenido de los reactivos de una prueba. En gran medida, aquello que dicta si el contenido de los reactivos ha de ser homogneo o variado es la manera en que el autor de la prueba ha definido al nuevo instrumento. Considrese una prueba culturalmente reducida de la inteligencia general. Dicho instrumento podra incorporar reactivos variados, en tanto las preguntas no supongan una escolaridad especfica. El autor de la prueba podra tener la intencin de incorporar problemas novedosos que sean igualmente desconocidos para todas las personas evaluadas. Por otro lado, con una prueba de pensamiento espacial que se base en la teora, se requeriran subescalas con reactivos que tengan contenido homogneo. El rango de dificultad de los reactivos debe ser el suficiente como para dar lugar una diferenciacin significativa de las personas evaluadas en ambos extremos. Entonces, las pruebas ms tiles son aquellas que incluyen una serie graduada de reactivos muy fciles, que aprueban casi todos, al igual que un grupo de stos cada

95

vez ms difciles que casi nadie aprueba. Se observa un efecto de lmite superior cuando nmeros significativos de examinandos obtienen puntuaciones perfectas o casi perfectas. El problema con el efecto de lmite superior es que no son posibles las distinciones entre personas con puntuaciones elevadas, aunque estos individuos podran diferir de manera sustancial en cuanto al rasgo subyacente que mide la prueba. Se observa un efecto de lmite inferior cuando cantidades significativas de examinandos obtienen puntuaciones que se encuentran cerca o en la parte ms baja de la escala. Por ejemplo, el WAIS-R tiene un importante efecto de lmite inferior en cuanto a que no puede discriminar entre los niveles moderado, grave y profundo de retraso mental todas las personas con discapacidades significativas del desarrollo fallan en sus respuestas a casi todas las preguntas. Los autores de pruebas esperan que algunos de los reactivos iniciales produzcan contribuciones poco eficaces para el objetivo global de medicin de su instrumento. Por esta razn, es comn la prctica de construir un primer borrador que contenga un exceso de reactivos, quizs el doble del nmero de preguntas que se deseen para el bosquejo final. Por ejemplo, el MMPI, que contiene 550 reactivos, originalmente consista de ms de 1 000 afirmaciones de falso-verdadero acerca de la personalidad. Pautas para la redaccin de reactivos de opcin mltiple o Elija palabras que tengan significados precisos. o Evite la sintaxis compleja o extraa. o Incluya toda la informacin necesaria para la seleccin de la respuesta. o Incluya lo ms posible de la pregunta dentro del planteamiento. o No tome los planteamientos al pie de la letra de los libros de texto. o Utilice opciones de igual extensin y fraseo paralelo. o Utilice "ninguna de las anteriores" y "todas las anteriores" en raras ocasiones. o Reduzca al mnimo el empleo de negativos como no. o Evite la utilizacin de palabras no funcionales. o Evite la especificidad innecesaria en el planteamiento. o Evite indicios innecesarios de la respuesta correcta.

96

o Presente los reactivos a otras personas para escrutinio editorial.

UNIDAD 2. APROXIMACIN AL USO DE LAS PRUEBAS PSICOLGICAS

Captulo 4. Las Pruebas y su Proceso de Aplicacin Leccin 16. Definicin de una prueba Una prueba es un procedimiento estandarizado para tomar una muestra de conducta y describirla con categoras o puntuaciones. Adems, la mayor parte tiene normas o estndares, con base en los cuales pueden utilizarse los resultados para pronosticar otras conductas ms importantes. Incluidas dentro de esta perspectiva se encuentran las pruebas tradicionales como los cuestionarios de personalidad y las pruebas de inteligencia, pero la definicin tambin incluye diversos

procedimientos que el lector podra no reconocer como tales. Por ejemplo, todos los mtodos siguientes pueden ser pruebas: una lista de verificacin para clasificar las habilidades sociales de un joven con retraso mental; una medida sin lmite de tiempo del dominio en la suma de pares de nmeros de tres dgitos; valoraciones por computadora del tiempo de reaccin; e incluso, pruebas situacionales como la observacin de un individuo que trabaja en una tarea de grupo con dos "ayudantes" poco cooperativos y que slo le causan dificultades. En suma, las pruebas son sumamente variadas en sus formatos y aplicaciones. Sin embargo, la mayor parte posee estas caractersticas que las definen: Procedimiento estandarizado. Muestra de conducta. Puntuaciones o categoras. Normas o estndares. Prediccin de conducta fuera de la prueba. La imagen que se desea representar tiene que ver en especial con las pruebas referentes a la norma las que utilizan una poblacin bien definida de personas para su esquema interpretativo. Sin embargo, las caractersticas definitorias de una

97

prueba difieren un tanto en el caso especial de las pruebas referidas a criterio las que miden lo que una persona puede hacer, en lugar de comparar los resultados con los niveles de desempeo de otros. Por tal razn, se tratan por separado las pruebas referidas a criterio. El procedimiento estandarizado es una caracterstica esencial de cualquier prueba psicolgica. Se considera que una prueba est estandarizada si los procedimientos para su aplicacin son uniformes de un examinador a otro y de un ambiente a otro. Por supuesto, la estandarizacin depende, en cierto grado, de la capacidad del examinador. Incluso la mejor prueba puede resultar intil en manos de un evaluador descuidado, con entrenamiento deficiente o mal informado. Sin embargo, la mayora de los examinadores son competentes. Por tanto, la estandarizacin depende en gran medida de las disposiciones de aplicacin que se encuentran en el manual de instrucciones que por lo comn acompaa a una prueba. La formulacin de las instrucciones es un paso esencial para la estandarizacin de una prueba. A fin de garantizar procedimientos uniformes de aplicacin, quien desarrolla una prueba debe proporcionar materiales estmulo comparables para todos los examinados, debe especificar con una precisin considerable las instrucciones verbales para cada reactivo o subprueba y debe aconsejarle al examinador cmo ha de manejar una diversidad de dudas por parte de la persona evaluada. Para ilustrar estos puntos, considrense las diversas maneras en que una persona que desarrolla una prueba podra enfocar la evaluacin de la retencin de dgitos el nmero mximo de dgitos presentados verbalmente que un sujeto puede recordar de memoria. Podra ser que una prueba no estandarizada de retencin de dgitos sugiriera tan slo que el examinador presentara de manera verbal series cada vez ms largas de nmeros hasta que el sujeto fallara. El nmero de dgitos en la serie ms larga recordada sera, entonces, la capacidad de retencin de dgitos del sujeto. La mayora de los lectores puede darse cuenta de que una prueba con tal definicin tan general carecer de uniformidad de un examinador a otro. Si quien aplica la prueba est en libertad de improvisar cualquier serie de dgitos, qu podra impedirle que presentara, con la inflexin familiar de un locutor de televisin,"

98

1 -800-325-3535"? Tal serie sera bastante ms fcil de recordar que un conjunto ms aleatorio, por ejemplo, "7-2-8-1-9-4-6-3-7-4-2". La velocidad de presentacin tambin puede tener un efecto crucial sobre la uniformidad de una prueba de retencin de dgitos. Para propsitos de estandarizacin, es esencial que todos los examinadores presenten cada serie a una tasa constante; por ejemplo, un dgito por segundo. Por ltimo, el examinador necesita saber cmo ha de reaccionar ante respuestas inesperadas, como el que un sujeto le diga: "podra repetirlos de nuevo?" Por razones obvias, el consejo habitual es "no". Quien desarrolla una prueba puede incluso llegar hasta el punto de recomendar el comportamiento deseado en el examinador, como mantener una expresin facial neutra cuando se registra la respuesta de un sujeto. Estas influencias aparentemente sutiles pueden tener un serio impacto sobre la uniformidad de los procedimientos de prueba. Por ejemplo, un examinador que se sonre con displicencia cuando registra las respuestas podra provocar que el sujeto se sienta ansioso y falle en una tarea fcil. Una prueba psicolgica tambin es una muestra limitada de conducta. Ni el sujeto ni el examinador tienen el tiempo suficiente para una prueba realmente amplia, incluso cuando sta se dirige a un dominio conductual bien definido y finito. As, las restricciones prcticas dictan que una prueba es slo una muestra de conducta. Sin embargo, la muestra de conducta es de inters slo en la medida que permita que el examinador realice inferencias acerca del dominio total de conductas relacionadas. Por ejemplo, el propsito de una prueba de vocabulario consiste en determinar la reserva completa de palabras de la persona examinada, al pedir definiciones de una muestra muy pequea, pero cuidadosamente seleccionada, de palabras. El hecho de que el sujeto pueda definir las 35 palabras particulares de una subprueba de vocabulario (p. ej., en el WAIS-R) es de poca consecuencia directa. Pero el significado de dichos resultados es de gran importancia debido a que seala el conocimiento general de vocabulario del individe evaluado. Un punto interesante del que el pblico en general tiene poco conocimiento es que los reactivos de prueba no necesitan parecerse a las conductas que la prueba intenta pronosticar. La caracterstica esencial de una buena prueba es que permita

99

que el examinador pronostique otras conductas no que refleje aqullas a predecir. Si responder "cierto" a la afirmacin "bebo mucha agua" ayuda a predecir la depresin, entonces esta afirmacin, en apariencia no relacionada, es un ndice til de la depresin. Por tanto, el lector observar que la prediccin exitosa es una cuestin emprica que se resuelve a travs de la investigacin apropiada. Aunque la mayora de las pruebas toman una muestra directa del dominio de conductas que esperan predecir, ste no es un requisito psicomtrico. Una prueba psicolgica tambin debe permitir la derivacin de puntuaciones o categoras. Las pruebas se esfuerzan en ser una forma de medicin similar a los procedimientos de las ciencias fsicas, donde los nmeros representan dimensiones abstractas como peso o temperatura. Toda prueba suministra una o ms puntuaciones o proporciona evidencia de que una persona pertenece a una categora y no a otra. En pocas palabras, las pruebas psicolgicas resumen la ejecucin en nmeros o clasificaciones. La suposicin implcita del punto de vista psicomtrico es que las pruebas miden las diferencias individuales en cuanto a rasgos o caractersticas que existen en cierto sentido vago de la palabra. En la mayor parte de los casos, se supone que todas las personas poseen el rasgo o caracterstica medida, aunque en diferentes cantidades. El propsito de la prueba consiste en estimar la cantidad del rasgo o cualidad que posee un individuo. En este contexto, se deben hacer dos advertencias. Primero, toda puntuacin de prueba siempre reflejar cierto grado de error de medicin. La imprecisin de las pruebas es simplemente inevitable: stas deben depender de una muestra externa de conducta para estimar la caracterstica no observable y, por tanto, inferida. Con frecuencia, los psicmetras expresan este punto fundamental con la ecuacin: X=T+e donde X es la puntuacin observada, T la puntuacin verdadera y e el componente de error positivo o negativo. Lo mejor que puede hacer quien desarrolla una prueba es procurar que e sea muy pequeo. Nunca se le puede eliminar por completo, como tampoco se puede saber su impacto exacto sobre el caso individual. La segunda advertencia es que los consumidores de pruebas deben prevenirse de

100

materializar las caractersticas medidas. Los resultados no representan una "cosa" que tenga realidad fsica; por lo comn, representan una abstraccin que se ha demostrado que tiene utilidad para pronosticar conductas externas a la prueba. Por ejemplo, cuando se analiza el CI de una persona, los psiclogos se refieren a una abstraccin que no tiene existencia directa, material, pero que, sin embargo, es til para pronosticar el rendimiento escolar y otros resultados. Una prueba psicolgica tambin debe poseer normas o estndares. En general, la puntuacin de prueba de una persona se interpreta al compararla con las puntuaciones obtenidas por otros individuos en la misma prueba. Para este propsito, es comn que quienes desarrollan pruebas aplican normas un resumen de los resultados de prueba de un grupo grande y representativo de personas. El grupo normativo se conoce como muestra de estandarizacin. La seleccin y evaluacin de la muestra de estandarizacin es crucial para la utilidad de una prueba. Este grupo debe ser representativo de la poblacin a la que se dirige la prueba o, de otra manera, no ser posible determinar la posicin relativa de un individuo examinado. En el caso extremo donde no se proporcionan normas, el examinador no puede utilizar en absoluto los resultados de la prueba. Una excepcin a este punto ocurre en el caso de las pruebas referidas a criterio. Las normas no slo establecen un desempeo promedio, sino que tambin sirven para indicar la frecuencia con la que se obtienen diferentes puntuaciones altas y bajas As, las normas permiten que el examinador determine el grado al que se desva una puntuacin con respecto a las expectativas. Tal informacin puede ser muy importante en la prediccin de la conducta externa a la prueba del individuo examinado. Las normas tienen tal importancia trascendental en la interpretacin de pruebas, que despus se les considerar con amplitud en una seccin independiente dentro de este texto. Por ltimo, las pruebas no constituyen un fin en s mismas. En general, el propsito ltimo de una prueba consiste en pronosticar conductas adicionales, diferentes de aquellas que se muestrean de manera directa en la prueba. As, el examinador puede tener mayor inters en las conductas externas a la prueba pronosticadas por sta que en las respuestas de prueba en s. Quizs un ejemplo concreto aclarar

101

este punto. Supngase que un examinador aplica una prueba de manchas de tinta a un paciente en un hospital psiquitrico y que el paciente responde a una mancha de tinta describindola como "ojos que se asoman sigilosamente". Con base en las normas establecidas, el examinador podra pronosticar entonces que el sujeto es sumamente suspicaz y obtendr poco beneficio de una psicoterapia individual.

Leccin 17. Tipos y usos de las pruebas Las pruebas pueden agruparse de manera amplia en dos bandos: pruebas grupales y pruebas individuales. Las pruebas grupales son medidas principalmente de lpiz y papel, adecuadas para examinar a grandes grupos de personas a un mismo tiempo. Las pruebas individuales son instrumentos que, por su diseo y propsito, deben aplicarse a una sola persona. Una ventaja importante de estas ltimas es que el examinador puede estimar el nivel de motivacin del sujeto y evaluar la relevancia de otros factores (p. ej., impulsividad o ansiedad) sobre los resultados de prueba. Por conveniencia, las pruebas se clasificarn en ocho categoras representadas en; cada una de ellas contiene pruebas referidas a la norma, referidas a criterio, individuales y grupales. El lector observar que cualquier tipologa de las pruebas es una determinacin puramente arbitraria. Por ejemplo, podra postularse incluso otra dicotoma: pruebas que buscan medir el desempeo mximo (p. ej., una prueba de inteligencia) contra las que buscan estimar una respuesta tpica (p. ej., un inventario de personalidad). Principales tipos de pruebas psicolgicas: Pruebas de inteligencia: miden la capacidad de un individuo en reas relativamente globales como comprensin verbal, organizacin perceptual o razonamiento y, por tanto, ayudan a determinar el potencial para el trabajo escolar o para ciertas ocupaciones. Pruebas de aptitud: miden la capacidad para una tarea o tipo de habilidad relativamente especfica; en efecto, las pruebas de aptitud son una forma estrecha de prueba de capacidad.

102

Pruebas de aprovechamiento: miden el grado de aprendizaje, xito o logro de una persona en un tema o tarea. Pruebas de creatividad: evalan el pensamiento novedoso y original y la capacidad para encontrar soluciones poco comunes o inesperadas, en especial, para problemas definidos de manera vaga. Pruebas de personalidad: miden los rasgos, cualidades o conductas que determinan la individualidad de una persona; dichas pruebas incluyen listas de verificacin, inventarios y tcnicas proyectivas. Inventarios de intereses: miden la preferencia de un individuo por ciertas actividades o temas y, por tanto, ayudan a determinar la eleccin de carrera. Procedimientos conductuales: describen de manera objetiva una conducta y estiman su frecuencia, identificando los antecedentes y consecuencias de la conducta. Pruebas neuropsicolgicas: miden el desempeo cognoscitivo, sensorial, perceptual y motor para determinar el grado, localizacin y consecuencias conductuales del dao cerebral

En un sentido estricto, existen cientos de tipos diferentes de pruebas, cada una de las cuales mide un aspecto ligeramente diferente del individuo. Por ejemplo, podra discutirse que incluso dos pruebas de inteligencia constituiran diferentes tipos de medida. Una prueba podra revelar la suposicin de que la inteligencia es un constructo biolgico que puede medirse mejor a travs de las ondas cerebrales, mientras otra podra fundamentarse en la perspectiva tradicional de que la inteligencia se exhibe en la capacidad para aprender habilidades aculturadas como el vocabulario. Agrupar ambas medidas bajo la categora de pruebas de inteligencia es con toda seguridad una simplificacin exagerada pero, sin embargo, es un punto de partida til. Las pruebas de inteligencia se disearon originalmente para tornar una muestra de una amplia variedad de habilidades, a fin de estimar el nivel intelectual general del individuo. Las escalas Binet-Simon tuvieron xito, en parte, debido a que incorporaban tareas heterogneas, incluyendo definiciones de palabras, memoria de

103

diseos, preguntas de comprensin y tareas de visualizacin espacial. Las pruebas grupales de inteligencia que florecieron con tal profusin durante y despus de la segunda Guerra Mundial tambin medan capacidades diversas como lo demuestra la prueba Army Alfa con sus ocho secciones diferentes que miden juicio prctico, informacin, aritmtica y razonamiento, entre otras habilidades. Las pruebas modernas de inteligencia tambin emulan este patrn histricamente establecido al tomar una muestra de una amplia variedad de destrezas consideradas importantes en nuestra cultura. En general, el trmino prueba de inteligencia se refiere a una prueba que produce una puntuacin resumida general, basada en los resultados de una muestra heterognea de reactivos. Por supuesto, una prueba de este tipo podra tambin proporcionar un perfil de las puntuaciones de subprueba, pero es la puntuacin general la que en trminos generales atrae la mayor atencin. Una prueba de aptitud mide uno o ms segmentos claramente definidos y relativamente homogneos de una capacidad; tiene dos variedades: pruebas de una sola aptitud y bateras de prueba de aptitudes mltiples. Como es obvio, las primeras evalan slo una capacidad, mientras que las segundas proporcionan un perfil de puntuaciones para varias aptitudes. Con frecuencia, las pruebas de aptitud se emplean para pronosticar el xito en una profesin, curso de entrenamiento o esfuerzos educativos. Por ejemplo, las Medidas Seashore de Talentos Musicales (Seashore, 1938), una serie de pruebas que cubren tono, sonoridad, ritmo, tiempo, timbre y memoria tonal, pueden utilizarse para identificar a nios que tienen un talento potencial para la msica. Tambin existen pruebas de aptitudes especializadas para la evaluacin de habilidades en trabajo de oficina, capacidades mecnicas, destreza manual y capacidad artstica. El uso ms comn para las pruebas de aptitud consiste en determinar las admisiones a la universidad. La mayora de los estudiantes universitarios estn familiarizados con el SAT (del ingls Scliolastic Assessment Test; Prueba de Evaluacin Escolar, antes llamada Scholastic Aptitude Test; Prueba de Aptitud Escolar) del Comit de Examen de Ingreso a la Universidad. Esta prueba contiene una seccin Verbal, que deslaca el conocimiento de palabras y la comprensin de

104

lectura, y una seccin de Matemticas, que destaca el lgebra, la geometra y el razonamiento perspicaz. En efecto, las universidades que requieren con fines de admisin ciertas puntuaciones mnimas en el SAT, utilizan la prueba para pronosticar el xito acadmico. Las pruebas de aprovechamiento miden el grado de aprendizaje, xito o logro de una persona en una materia. La suposicin implcita de la mayor parte de estas pruebas es que las escuelas han enseado la materia de manera directa. Por tanto, el propsito de la prueba consiste en determinar la cantidad del material que el sujeto ha absorbido o dominado. En general, las pruebas de aprovechamiento tienen varias subpruebas; por ejemplo, lectura, matemticas, lenguaje, ciencias naturales y ciencias sociales, las cuales se revisan en el tema 8B, Pruebas grupales de aprovechamiento. La distincin entre pruebas de aptitud y de aprovechamiento es ms una cuestin de uso que de contenido (Gregory, 1994a). De hecho, cualquier prueba puede ser de aptitud, en el sentido de que ayuda a pronosticar el desempeo futuro. De la misma manera, cualquier prueba puede ser de aprovechamiento, en el sentido de que refleja cunto ha aprendido el sujeto. Por tanto, en la prctica, la distincin entre estos dos tipos de instrumentos se determina por sus respectivos usos. En ciertas ocasiones, un instrumento puede servir para ambos propsitos, actuando como una prueba de aptitud para predecir el desempeo futuro, y como prueba de aprovechamiento, para supervisar el aprendizaje pasado. Las pruebas de creatividad evalan la capacidad del sujeto para producir nuevas ideas, discernimientos o creaciones artsticas que se consideran de valor social, esttico o cientfico. As, las medidas de creatividad enfatizan la novedad y originalidad en la solucin de problemas confusos o en la produccin de obras artsticas. Las pruebas de creatividad tienen una historia accidentada. En el decenio de 1960 se les promocionaba como una alternativa til para las pruebas de inteligencia y se les utiliz ampliamente en los sistemas educativos de EUA. Los educadores se mostraron especialmente impresionados de que las pruebas de creatividad requirieran del pensamiento divergente empleando una variedad de respuestas

105

para un problema complejo o confuso en oposicinal pensamiento convergente encontrando una solucin correcta nica para un problema bien definido. Por ejemplo, una prueba de creatividad podra pedirle al individuo examinado que imaginara todas las cosas que sucederan si las nubes tuvieran cuerdas que colgaran de ellas hasta el piso (Guilford, 1954). Se supona que los alumnos que pudieran dar un gran nmero de consecuencias eran ms creativos que sus compaeros menos imaginativos. Sin embargo, algunos psicmetras se mostraron escp-ticos, concluyendo que la creatividad es slo otra etiqueta para la inteligencia aplicada (p. ej., McNemar, 1964). Las pruebas de personalidad miden los rasgos, cualidades o conductas que determinan la individualidad de una persona; esta informacin ayuda a pronosticar la conducta. Estas pruebas pueden encontrarse en muchas variedades diferentes, incluyendo listas de verificacin, inventarios y tcnicas proyectivas como frases incompletas y manchas de tinta. Los inventarios de intereses miden la preferencia de un individuo por ciertas actividades o temas y, con ello, ayudan a determinar la eleccin de carrera; se basan en la suposicin explcita de que los patrones de inters determinan y, por tanto, tambin predicen la satisfaccin con el trabajo. Por ejemplo, si la persona examinada tiene los mismos intereses que los contadores exitosos y satisfechos, se considera probable que disfrutar del trabajo de un contador. La suposicin de que los patrones de inters pronostican la satisfaccin con el trabajo se confirma en gran medida a travs de estudios empricos. Existen muchos tipos de procedimientos conductuales para evaluar los antecedentes y consecuencias de la conducta, incluyendo listas de verificacin, escalas de clasificacin, entrevistas y observaciones estructuradas. Estos mtodos comparten una suposicin comn de que la conducta puede comprenderse mejor en trminos de caractersticas definidas de manera clara como frecuencia, duracin, antecedentes y consecuencias. Los procedimientos conductuales tienden a ser sumamente pragmticos en el sentido de que generalmente se encuentran entretejidos con enfoques de tratamiento. Las pruebas neuropsicolgicas se utilizan para la evaluacin de personas de las

106

que se sospecha o se sabe que tienen una disfuncin cerebral. La neuropsicologa es el estudio de las relaciones cerebro-conducta. A travs de los aos, los neuropsiclogos han descubierto que ciertas pruebas y procedimientos son muy sensibles a los efectos del dao cerebral, y emplean estas pruebas y procedimientos especializados para hacer inferencias acerca de la localizacin, grado y consecuencias de dicho dao. Aunque las pruebas y procedimientos neuropsicolgicos son tiles para llegar a un diagnstico neurolgico, su principal propsito consiste en valorar las fortalezas y debilidades sensoriales, motoras, cognitivas y conductuales de un paciente con alteracin neurolgica. La evaluacin de fortalezas y debilidades en estos pacientes es crucial para documentar la mejora, proyectar el grado de deterioro en los padecimientos degenerativos y planificar tratamientos efectivos para incapacidades especficas.

Leccin 18. Procesos de aplicacin estandarizados La interpretacin de una prueba psicolgica es ms confiable cuando las mediciones se obtienen bajo las condiciones estandarizadas. Los procedimientos no estandarizados pueden alterar el significado de los resultados de la prueba, que pueden resultar invlidos y, por tanto, engaosos. En las aplicaciones tpicas, quienes aplican una prueba deben seguir de manera cuidadosa los procedimientos estandarizados para la aplicacin y calificacin que especifica el editor de la prueba. Las especificaciones concernientes a las instrucciones para las personas examinadas, lmites de tiempo, forma de presentacin o respuesta del reactivo y materiales o equipo de prueba deben observarse de manera estricta. Slo deben hacerse excepciones con base en el juicio profesional considerado de modo cuidadoso, principalmente en las aplicaciones clnicas (AERA, APA, NCME, 1985) Supngase que las instrucciones para la seccin de vocabulario de una prueba de inteligencia para nios especifica que el examinador debe preguntar: "qu significa la palabra divn, qu es un divn?" Si el sujeto respondiera "nunca he escuchado

107

esa palabra", un examinador sin experiencia podra sentirse tentado a responder: "ya sabes, un sof qu es un sof?" Esto podra parecerle al lector como una forma inocente de juego limpio, un simple refraseo de la pregunta original. Sin embargo, al alejarse de los procedimientos estandarizados, el examinador ha aplicado en realidad otra prueba. El punto de pedir la definicin de divn (y no sof) es precisamente que divn es ms difcil de definir y, por tanto, es un mejor ndice de habilidades de nivel superior en cuanto a vocabulario. Aunque los procedimientos estandarizados de prueba son normalmente esenciales, existen casos en que es deseable, o incluso necesaria, la flexibilidad en los procedimientos. Como lo sugieren las normas de la APA, dichas desviaciones deben ser razonadas y deliberadas. Aqu es pertinente realizar una analoga entre el espritu y la letra de la ley. Un examinador demasiado entusiasta podra captar, por un decir, la letra de la ley al adherirse de manera literal y estricta a los procedimientos de prueba expresados en el manual de edicin. Pero, en realidad sta era la intencin del editor? Siquiera es la manera en que, en realidad, se aplic la prueba a la muestra normativa? Es ms probable que los editores preferiran que los examinadores captaran el espritu de la ley incluso si, en ocasiones, fuera necesario adaptar un tanto los procedimientos de la prueba. Considrese la siguiente situacin que surgi cuando un psiclogo le aplic una prueba estandarizada de inteligencia a una estudiante universitaria ansiosa y demasiado concreta. Cuando se le pregunt: "cuntos son cuatro dlares ms cinco dlares?", la estudiante respondi: "cuatro dlares son cuatro dlares y cinco dlares son cinco dlares". Una interpretacin literal del manual de prueba requerira que el examinador registrara un crdito de cero y prosiguiera con el siguiente reactivo. Sin embargo, la pregunta tena el propsito de examinar las habilidades aritmticas y no lo concreto del pensamiento. As, el examinador hizo de nuevo la pregunta con un ligero cambio en cuanto a nfasis: "cuntos son cuatro dlares y cinco dlares?" La sujeto lanz una fuerte carcajada y respondi de inmediato "nueve dlares no me percat de que era una pregunta de aritmtica". Los ajustes menores a los procedimientos, que se adhieren al espritu en el que se desarroll la prueba, ocurren de manera regular y no son causa de alarma. Estas

108

adaptaciones menores no invalidan las normas establecidas por el contrario, la adaptacin apropiada de los procedimientos es necesaria de modo que las normas puedan continuar siendo vlidas. Despus de todo, los examinadores que recolectaron dalos sobre la muestra de estandarizacin no actuaron como autmatas sin corazn cuando presentaron las preguntas a los sujetos. Los examinadores que deseen obtener resultados vlidos deben ejercer, del mismo modo, una flexibilidad razonada en los procedimientos de prueba. Sin embargo, es necesario tener una considerable experiencia clnica para determinar si un ajuste en el procedimiento es menor o tan sustancial que las normas existentes ya no pueden aplicarse. sta es la razn por la cual los examinadores en psicologa pasan, por lo comn, por una extensa experiencia supervisada antes de que se les permita aplicar e interpretar pruebas individuales de capacidad o de personalidad.

Leccin 19. Procesos de aplicacin deseables Se analizarn primero las pruebas individuales y despus se enumerarn de manera breve algunos puntos importantes acerca de los procedimientos deseables en las pruebas con grupos. Un componente esencial de las pruebas individuales es que los examinadores deben familiarizarse ntimamente con los materiales e instrucciones antes de comenzar con la aplicacin. En su mayora, esto implica extensos ensayos y anticipacin de las circunstancias poco comunes y de la respuesta apropiada. Un examinador bien preparado tiene memorizados los elementos clave de las instrucciones verbales y est listo para manejar lo inesperado. Con frecuencia, el estudiante de evaluacin inexperto supone que los

procedimientos de examen son tan sencillos y simples que una sola lectura rpida del manual ser suficiente como preparacin para la prueba. Aunque algunas pruebas individuales son sumamente rudimentarias y poco complicadas, muchas de ellas tienen aspectos complejos de aplicacin que, si no se toman en cuenta, pueden causar que el individuo examinado falle de manera innecesaria en los

109

reactivos. Por ejemplo, Choi y Proctor (1994) encontraron que 25 entre 27 estudiantes de posgrado cometan serios errores en la aplicacin de la Stanford-Binet: Cuarta Edicin, incluso aunque se videogrababan las sesiones y los estudiantes saban que se evaluaran sus habilidades de prueba. La atencin apropiada a los detalles de aplicacin es esencial para obtener resultados vlidos. La necesidad de tener una ntima familiaridad con los procedimientos de prueba se ilustra muy bien en la subprueba de Diseo con Cubos del WAIS-III (Wechsler, 1997). Los materiales para la subprueba incluyen nueve bloques (cubos) de color rojo en dos lados, blanco en dos lados y rojo y blanco en dos lados. La tarea de la persona evaluada consiste en utilizar los cubos para construir patrones representados en tarjetas. Para los diseos iniciales se necesitan cuatro cubos, mientras que en los diseos ms difciles se utilizan los nueve cubos. Los individuos inteligentes no tienen dificultad para comprender esta tarea y las instrucciones exactas no influyen de manera apreciable en su desempeo. Sin embargo, las personas cuya inteligencia es promedio o inferior a ste requieren de las elaboradas demostraciones y correcciones que se especifican en el Manual del WAIS-III (Wechsler, 1997). En particular, el examinador muestra los primeros dos diseos y responde al xito o fracaso del examinado en ellos, segn un flujo complejo de reaccin y contrarreaccin como se presenta en las tres pginas de instrucciones. Lo sentimos por el examinador que no ha ensayado esta subprueba y anticipado la respuesta apropiada para las personas que fallan en los primeros dos diseos. Sensibilidad hacia las discapacidades

Otro ingrediente importante de la aplicacin vlida de una prueba es la sensibilidad a las discapacidades de la persona evaluada. Las discapacidades en audicin, visin, habla o control motor pueden distorsionar gravemente los resultados de prueba. Si el examinador no reconoce la discapacidad fsica responsable del desempeo deficiente en la prueba, puede clasificarse al sujeto como discapacitado a nivel intelectual o emocional cuando, de hecho, el problema esencial es una discapacidad sensorial o motora.

110

Vernon y Brown (1964) informaron sobre el trgico caso de una nia pequea a la que se le releg a un hospital para individuos con retraso mental, como consecuencia de la insensibilidad del examinador hacia una discapacidad fsica. El examinador no se dio cuenta de que la nia era sorda y concluy que el CI de 29 en la Stanford-Binet era vlido. La nia permaneci en el hospital durante cinco aos, pero se le dio de alta despus de que obtuvo un CI de 113 en una prueba de inteligencia basada en el desempeo. Despus de dejar el hospital, ingres a una escuela para sordos y logr buen progreso. Las pruebas vlidas con sujetos que tienen discapacidades auditivas requieren antes que nada que el examinador detecte la existencia de la discapacidad! Con frecuencia esto es ms difcil de lo que parece. Muchas personas con una prdida auditiva leve aprenden a compensar su discapacidad fingiendo que comprenden lo que otros dicen y esperando que las siguientes seales dentro de la conversacin les ayuden a aclarar las palabras o frases percibidas apenas. Como resultado, otras personas incluyendo los psiclogos pueden no darse cuenta de que el individuo con una alteracin auditiva leve tiene alguna discapacidad. Las indicaciones de una posible dificultad auditiva incluyen falta de respuesta normal ante el sonido, falta de atencin, dificultades para obedecer instrucciones orales, observacin intensa de los labios del hablante y articulacin deficiente (Sattler, 1988). En todos los casos donde se sospecha la existencia de una alteracin auditiva, es crucial canalizar al sujeto a un examen audiolgico. Si se confirma un problema auditivo grave, entonces el examinador debera considerar el uso de una de las pruebas especializadas. En el caso de personas con una prdida auditiva leve, es esencial que el examinador se coloque de frente al sujeto, hable ms fuerte y repita las instrucciones lentamente. Tambin es importante localizar una habitacin silenciosa para la prueba. De manera ideal, dicha habitacin tendr cortinas y superficies con textura en las paredes para reducir al mnimo los efectos distractores de los ruidos de fondo. En contraste con los individuos que tienen alteraciones auditivas, las personas con discapacidades visuales generalmente atienden bien a los materiales de prueba presentados de modo verbal. La persona con alteraciones visuales introduce un tipo

111

diferente de reto para el examinador; delectar la existencia de una alteracin visual y despus, asegurarse de que el sujeto puede ver bien los materiales de prueba. La visin borrosa o doble puede significar problemas visuales, como los dolores de cabeza o las nuseas despus de leer. En general, es tan comn que los nios requieran anteojos correctores, que los examinadores deben estar alertas a un problema de visin en cualquier sujeto joven que no utilice anteojos y que no haya pasado por un examen reciente de la visin. Las alteraciones del habla representan otro problema para quienes deben hacer un diagnstico. Las respuestas verbales de las personas con alteraciones del habla son difciles de descifrar. Debido a la incapacidad del examinador para entender las respuestas, los sujetos pueden recibir un menor crdito del que merecen Incluso si su discapacidad es leve, las personas con parlisis cerebral u otras alteraciones motoras pueden recibir penalizacin en pruebas de ejecucin con lmite de tiempo. Cuando se somete a prueba a una persona con una discapacidad motora leve, los examinadores podran omitir las subpruebas de ejecucin cronometradas o descontar estos resultados si son consistentemente ms bajos que las puntuaciones de las subpruebas sin lmite de tiempo Si un sujeto tiene una discapacidad motora obvia como lo es una dificultad para manipular las piezas de un rompecabezas entonces los instrumentos estndar aplicados de manera norma! son generalmente inapropiudos. Se han desarrollado de manera expresa varios instrumentos alternativos para examinar a personas con parlisis cerebral y otras alteraciones motoras y las pruebas estndar se han adaptado de modo ingenioso y se han establecido nuevas normas para estas adaptaciones.

Procedimientos deseables con pruebas de grupo

Por lo comn, los psiclogos y educadores suponen que casi cualquier adulto puede aplicar de manera adecuada las pruebas grupales, en tanto tenga el manual requerido. La aplicacin de una prueba grupal parecera un procedimiento simple y sencillo en el que se pasan los formatos y lpices, se leen las instrucciones, se toma el tiempo y se recogen los materiales. En realidad, conducir una prueba grupal requiere tanto refinamiento como aplicar

112

una prueba individual. Sin duda, la ms grande fuente de error en la aplicacin de una prueba grupal tiene que ver con tomar de manera inadecuada el tiempo en las pruebas cronometradas. Los examinadores deben conceder! tiempo suficiente para el proceso completo de prueba: organizacin, lectura de las instrucciones en voz alta y presentacin de la prueba en s por parte de los sujetos. Conceder el tiempo suficiente requiere previsin en la programacin. Por ejemplo, en muchos ambientes escolares, los nios deben proceder a la siguiente clase en un horario establecido, sin considerar las actividades en proceso. Los examinadores sin experiencia podran sentirse tentados a reducir el lmite de tiempo designado para una prueba, de modo que se pueda respetar el horario de la escuela. Por supuesto, reducir el tiempo en una prueba causa que las normas sean completamente invlidas y con toda probabilidad reduce la puntuacin de la mayora de los sujetos en el grupo. Conceder demasiado tiempo para una prueba puede constituir tambin un tremendo error. Por ejemplo, considrese el impacto de recibir tiempo adicional en la Miller Analogies Test (MAT; Prueba de Analogas de Miller), una prueba de razonamiento de alto nivel que en algn tiempo requirieron muchas universidades para la solicitud de ingreso al posgrado. Dado que la MAT es una prueba con lmite de tiempo que necesita de pensamiento analgico rpido, conceder ms tiempo permitira que la mayora de los individuos examinados resolvieran vanos problemas adicionales. Es probable que este tipo de error de prueba disminuyera la validez de los resultados de la MAT, como mecanismo de prediccin del desempeo en el posgrado. Una segunda fuente de error en la aplicacin de pruebas grupales es la falta de claridad en las instrucciones para los examinados. Los examinadores deben leer las instrucciones con lentitud, con una voz clara y fuerte que atraiga la atencin de los sujetos. Las instrucciones no deben parafrasearse. Cuando el manual lo permite, los examinadores deben detenerse en la lectura y aclarar las dudas de los individuos que tienen alguna confusin. Las variaciones en las condiciones fsicas de aplicacin de prueba constituyen una tercera fuente de error potencial en la conduccin de una prueba grupal. Los examinadores deben asegurarse de que la habitacin de examen est bien

113

iluminada y, de ser necesario, que tenga calefaccin o aire acondicionado para controlar las variaciones extremas en cuanto a temperatura y humedad. Es poco comn que los autores de pruebas entren en detalles sobre las especificaciones relativas a iluminacin, temperatura y humedad, dado que los examinadores y sujetos, con unas cuantas excepciones, tendrn que tolerar las condiciones existentes. Sin embargo, es obvio que los examinandos no pueden tener un desempeo ptimo si se les somete a prueba en una habitacin con iluminacin pobre o que es demasiado fra u opresivamente caliente y hmeda. Los examinadores previsores deberan hacerle el favor a sus examinados de programar que las pruebas grupales importantes se presenten en un ambiente agradable y bien iluminado. La importancia de la superficie de escritura se aumenta por la tendencia actual a utilizar hojas separadas de respuesta. Los sujetos necesitan de un espacio ms amplio de escritorio cuando emplean hojas separadas de respuesta que bajo otras condiciones. Aunque pocos editores de prueba lo sealan, sera bueno especificar en los manuales de prueba las variaciones admisibles en cuanto a superficie de escritura que de todos modos permiten resultados comparables de prueba. El ruido es otro factor que debe controlarse en las pruebas grupales. Durante algn tiempo se ha sabido que el ruido provoca una disminucin en el desempeo, en especial para tareas de alta complejidad (p. ej. Boggs y Simn, 1968). Es de sorprender que exista poca investigacin acerca de los efectos del ruido en las pruebas psicolgicas. Sin embargo, parece casi seguro que el ruido fuerte, en especial si es intermitente e imposible de predecir, causar que las puntuaciones de prueba se reduzcan de manera sustancial. No se puede esperar que los nios en una escuela primaria tengan un buen desempeo mientras que un obrero de la construccin golpea con un marro una pared de cemento en la habitacin contigua. Para ser justos con los examinandos, existen ocasiones en las que debe reprogramarse la aplicacin de la prueba. Una cuarta fuente de error en la aplicacin de una prueba grupal es la incapacidad para explicar cundo pueden adivinarse las respuestas y si est permitido hacerlo. Quiz con ms frecuencia que cualquier otra duda, a los examinadores se les

114

pregunta si "existe alguna sancin por adivinar mal una respuesta?" En la mayora de los casos, quienes desarrollan pruebas anticipan esta cuestin y proporcionan pautas explcitas para los sujetos en cuanto a las ventajas, desventajas, o ambas, de conjeturar una respuesta. Los examinadores no deben dar consejo adicional sobre adivinar las respuestas ello constituira una grave desviacin con respecto al procedimiento estandarizado. La mayora de quienes desarrollan pruebas incorporan una correccin de conjeturas basada en principios establecidos de probabilidad. Considrese una prueba de opcin mltiple que tiene cuatro alternativas por reactivo. En aqullos donde el sujeto realiza una conjetura aleatoria, sin tener el conocimiento, las probabilidades de estar en lo correcto son de 1 entre 4, mientras que las probabilidades de estar mal son de 3 entre 4. As, por cada tres conjeturas incorrectas, habr una correcta que refleje la suerte ms que el conocimiento. Supngase que una nia responde correctamente a 35 preguntas de una prueba de 50 reactivos, pero en nueve preguntas sus respuestas son errneas. En total ha respondido a 44 preguntas, dejando seis sin responder. El hecho de que haya elegido la alternativa incorrecta en nueve preguntas sugiere que ha obtenido tres respuestas correctas por suerte ms que por conocimiento. Recurdese que, en el caso de las conjeturas aleatorias, se espera que haya, en promedio, tres respuestas errneas por cada respuesta correcta, de modo que para nueve respuestas incorrectas se esperaran tres conjeturas correctas en otras preguntas. La puntuacin corregida de la nia aquella que de hecho se informa y se compara con las normas existentes sera entonces de 32, es decir, 35 menos 3. En otras palabras, es probable que conociera 32 respuestas, pero al adivinar en otras 12 aument su puntuacin en otros 3 puntos. La correccin para la puntuacin que se ejemplifica en el prrafo anterior, se refiere slo a las respuestas aleatorias, sin conocimientos. El efecto de tal correccin consiste en eliminar las ventajas que de otra manera se concederan a quienes toman riesgos de manera aventurada. En algunos casos, un individuo examinado puede eliminar una o dos de las alternativas, con lo cual aumenta las probabilidades de adivinar correctamente entre las opciones restantes.

115

En esta situacin puede ser adecuado que la persona trate de adivinar la respuesta. Un redactor hbil de reactivos puede disear preguntas de modo que la alternativa correcta sea totalmente contraria a la intuicin y las alternativas incorrectas tengan una cualidad persuasivamente atractiva. Para estos reactivos, una conjetura basada en conocimientos es casi siempre incorrecta. Ya sea que una prueba grupal utilice o no una correccin para la puntuacin, el punto importante reside en enfatizar en este contexto que quien aplica la prueba debe seguir el procedimiento estandarizado y nunca ofrecer consejo adicional acerca de adivinar las respuestas. En las pruebas grupales, las desviaciones con respecto al manual de instrucciones son simplemente inaceptables.

Leccin 20. Influencias del evaluador y del evaluado La importancia del rapport

Los editores de pruebas instan a los examinadores a establecer un rapport una atmsfera cmoda y clida que sirva para motivar a los examinandos y que eduzca la cooperacin. Dar lugar a un ambiente cordial para la prueba es un aspecto crucial de una prueba vlida. Un examinador que no establece rapport puede provocar que una persona reaccione con ansiedad, falta de cooperacin de naturaleza pasivoagresiva u hostilidad abierta. El fracaso para establecer el rapport distorsiona los datos de la prueba: se subestima la capacidad y se hace un juicio inadecuado de la personalidad. El rapport es de particular importancia en las pruebas individuales y en particular cuando se evala a nios. Wechsler (1974) ha sealado que el establecimiento del rapport crea fuertes demandas sobre las habilidades clnicas del examinador: Debe lograr que el nio se sienta cmodo, mantenerlo interesado en las tareas en cuestin y alentarlo a realizar su mejor estuerzo. No existe una frmula mgica para "ganarse" al nio; las aproximaciones que tienen xito con algunos nios pueden enfadar a otros. Con experiencia, el examinador desarrollar una perceptividad que

116

le permitir establecer relaciones cordiales con los nios y adaptarse a las necesidades especificas de cada uno. Las sugerencias generales que aparecen a continuacin se ofrecen para ayudar al examinador en sus esfuerzos. Para lograr que el nio se sienta cmodo con su entorno, el examinador podra hacer que participe en alguna conversacin informal, antes de adentrarse en el asunto ms serio de aplicar de sus pasatiempos o intereses es una buena maneta de romper el hielo, aunque en el caso de un nio tmido, puede ser mejor alentarlo a que hable sobre algn aspecto concreto del ambiente un cuadro en la pared, un animal en el saln de clases o un libro o juguete (que no sea parte del material de prueba) en la habitacin de examen. En general, este periodo introductorio no requiere ms de 5 a 10 minutos, aunque la prueba no debe comenzar hasta que el nio parezca lo suficientemente relajado como para dar su mximo esfuerzo.

Un estudio de Gregory, Lehman y Mohn (1976) ilustra la importancia de establecer rapport cuando se examina a los nios. Estos investigadores buscaron determinar los efectos del bajo nivel de exposicin al plomo sobre el CI al aplicar el WISC a 193 nios que vivan cerca de una fundicin de plomo. Los nios se asignaron a cinco diferentes estudiantes de posgrado que aplicaron las pruebas, con base en una rotacin casi aleatoria en la que el examinador que estuviera libre atenda al primer nio que llegara. Los grupos de nios sometidos a prueba por cada uno de los cinco psicmetras no difera en el promedio de edad, exposicin al plomo o clase social. Lo que es ms, las magnitudes de las muestras eran sustanciales, ya que su nmero iba de los 30 a los 45 nios. De aqu que el promedio de los CI examinados dentro de los cinco grupos debera haber sido muy similar. Sin embargo, las diferencias entre los CI examinados en los cinco grupos fueron penosamente grandes, con puntuaciones promedio que variaban hasta 14 puntos. Clasificadas de menor a mayor, las puntuaciones promedio de los cinco grupos fueron 90, 94,95,96 y 104. El examinador cuyos sujetos obtuvieron en promedio un CI de 90 era muy formal, preciso, fro y apresurado. De hecho examin con mucho a la mayora de los sujetos (45, en comparacin con 37 del siguiente examinador ms prolfico) y, en general, terminaba mucho antes con cada nio. En el otro extremo se

117

encontraba el examinador, cuyos sujetos obtuvieron un CI promedio de 104. Fue mucho ms all del buen rapport, hasta llegar al grado de ofrecer apoyo y aliento que rayaba en conducir a los sujetos a la respuesta correcta. Por ejemplo, en Diseo con Cubos inst a un nio a "Vamos, coloca los cubos de las esquinas y sigue a partir de all". Por tanto, los examinadores pueden diferir en cuanto a sus capacidades para establecer rapport. Es probable que los examinadores fros obtengan menos cooperacin de sus sujetos, lo cual tiene como consecuencia que se reduzca el desempeo en una prueba de capacidad o que se obtengan resultados distorsionados o defensivos en pruebas de personalidad. Los examinadores demasiado solcitos pueden errar en la direccin opuesta, dando seales sutiles (y en ocasiones ms que obvias) de las respuestas correctas. Se deben evitar ambos extremos.

La persona examinada

Los examinandos difieren no slo en las caractersticas que los examinadores desean evaluar, sino tambin en otros aspectos ajenos que podran alterar los resultados de prueba. Por ejemplo, un individuo inteligente podra tener un desempeo deficiente en una prueba cronometrada de la capacidad debido a ansiedad ante sta; un asesino cuerdo podra tener el propsito de parecer mentalmente enfermo en un inventario de personalidad con la finalidad de evitar una acusacin; un estudiante con capacidad promedio podra prepararse para tener un mejor desempeo en una prueba de aptitud. Algunos sujetos carecen totalmente de motivacin y no les interesa si obtienen un buen resultado en pruebas psicolgicas. En todos estos casos, los resultados de prueba pueden ser imprecisos debido a los efectos penetrantes y causantes de distorsin de ciertas caractersticas del examinando como la ansiedad, simulacin, entrenamiento o antecedentes culturales. Ansiedad ante la prueba

La ansiedad ante la prueba se refiere a aquellas respuestas fenomenolgicas,

118

fisiolgicas y conductuales que acompaan a la preocupacin acerca del posible fracaso en una prueba. No hay duda de que los sujetos experimentan diferentes niveles de ansiedad ante la prueba, que van desde una actitud despreocupada, hasta un temor incapacitante ante el prospecto de que se les someta a prueba. Un amplio cuerpo de investigacin ha confirmado el concepto de sentido comn de que la ansiedad ante la prueba se correlaciona en sentido negativo con el rendimiento escolar, las puntuaciones de pruebas de aptitud y las medidas de inteligencia (Naveh-Benjamin, McKeachie y Lin, 1987; McKeachie, 1984). Sin embargo, la interpretacin de estos descubrimientos de correlacin no es simple. Una posibilidad es que los estudiantes desarrollen ansiedad ante la prueba, debido a antecedentes de tener un mal desempeo en los exmenes. Es decir, las disminuciones en desempeo pueden anteceder y causar dicha ansiedad. En apoyo a este punto de vista, Paulman y Kennelly (1984) encontraron que con independencia de su ansiedad muchos estudiantes con ansiedad ante la prueba tambin tenan ineficiencias en presentacin de exmenes en ambientes acadmicos. Dichos estudiantes lograban pobres resultados en pruebas, estuvieran ansiosos o no. Lo que es ms, Naveh-Benjamin, McKeachie y Lin (1987) determinaron que una gran proporcin de estudiantes universitarios con ansiedad ante la prueba tenan malos hbitos de estudio que los predisponan a un pobre desempeo en pruebas. La ansiedad de estos individuos es, en parte, un subproducto de la frustracin que han tenido toda la vida con respecto a resultados mediocres en pruebas. Otras lneas de investigacin indican que la ansiedad ante la prueba tiene un efecto perjudicial directo sobre el desempeo en pruebas. Es decir, es probable que esta ansiedad sea tanto una causa como un efecto en la ecuacin que la vincula con el desempeo deficiente en pruebas. Considrese el estudio original que realiz Sarason (1961) sobre este tema, quien someti a prueba a sujetos con alta y baja ansiedad bajo instrucciones neutras o inductores de ansiedad. Los sujetos eran estudiantes universitarios a los que se les pidi que memorizaran palabras de dos slabas con un bajo nivel de significado una tarea difcil. La mitad de los sujetos trabaj bajo instrucciones neutras simplemente se les dijo que memorizaran las

119

listas. A los sujetos restantes se les dijo que memorizaran las listas y que la tarea era una prueba de inteligencia. Se les inst a tener el mejor desempeo posible. Los dos grupos no difirieron de manera significativa en su desempeo cuando las instrucciones eran neutras y no amenazantes. Sin embargo, cuando stas excitaban la ansiedad, los niveles de desempeo de los sujetos con alto grado de ansiedad descendieron de modo notable, dejndolos con una enorme desventaja, en comparacin con aquellos que tenan baja ansiedad. Esto indica que los sujetos con ansiedad ante la prueba muestran disminuciones significativas en su desempeo cuando perciben la situacin como una prueba. En contraste, los sujetos con bajo nivel de ansiedad sufren un efecto relativamente nulo de tal redefinicin simple del contexto. Las pruebas con estrictos lmites de tiempo representan un problema especial para las personas con altos niveles de ansiedad ante la prueba. La presin de tiempo parece exacerbar el grado de amenaza personal, causando reducciones significativas en el desempeo de las personas con ansiedad ante la prueba. Siegman (1956) demostr este punto hace muchos aos al comparar los niveles de desempeo de pacientes mdicos/psiquitricos con alta y baja ansiedad en las subpruebas con y sin lmite de tiempo del WAIS. El WAIS consiste de 11 subpruebas que incluyen seis subpruebas para las cuales el examinador utiliza un cronmetro, a fin de imponer estrictos lmites de tiempo y cinco subpruebas para las cuales el sujeto tiene un tiempo ilimitado de respuesta. Es interesante que los sujetos con alta y baja ansiedad tuvieron una capacidad total idntica en el WAIS. Sin embargo, cada grupo tuvo un mejor desempeo en la direccin prevista en los diferentes tipos de subpruebas. En particular, los sujetos con bajo nivel de ansiedad superaron a aqullos con ansiedad elevada en las subpruebas con lmite de tiempo, mientras que se observ el patrn inverso en las subpruebas sin lmite de tiempo. Motivacin para el engao

Los resultados de prueba pueden ser imprecisos si la persona tiene razones para desempearse de una manera inadecuada o no representativa. El falseamiento abierto de los resultados de prueba es poco comn, pero llega a suceder. Una pequea fraccin de personas que buscan beneficiarse de la rehabilitacin o de

120

instituciones sociales "se fingirn malos" en pruebas de personalidad o de capacidad. En ocasiones, las personas que anticipan una acusacin criminal fingirn enfermedad mental en pruebas de personalidad. Considrese el caso del cliente de psicoterapia que contest una prueba de personalidad por instrucciones de su terapeuta. El terapeuta deseaba una evaluacin precisa de la depresin aparentemente leve del cliente. Los resultados fueron ambiguos, lo cual indica ya sea un grado monumental de trastorno psicolgico o un intento consciente de exagerar los sntomas. Dos semanas despus, el terapeuta descubre de manera inadvertida que el cliente est a punto de ser acusado de abuso sexual infantil. En apariencia, haba falseado los resultados de prueba anticipando que pronto se haran cargos legales en su contra. En parte, haba planeado defenderse aduciendo que la enfermedad mental era una factor atenuante para su conducta. En la mayora de los casos, un psicmetra bien entrenado puede detectar el falseamiento consciente al hacer dos preguntas: 1) El cliente tiene motivacin para tener un desempeo engaoso en las pruebas? 2) El patrn general de resultados es sospechoso a la luz de otra informacin conocida del cliente? Si la respuesta para ambas preguntas es s entonces el examinado r har bien en ser escptico con los resultados de la prueba.

Captulo 5. Pruebas de Personalidad Leccin 21. Medicin de la personalidad En algunos aspectos, medir la personalidad, se asemeja mucho a evaluar la inteligencia, En uno u otro caso se intenta cuantificar algo que no podemos ver ni tocar, y en ambos casos una buena prueba ha de ser confiable y valida a la vez. Al evaluar la personalidad, no nos interesa la mejor conducta, lo que queremos averiguar es la conducta tpica del sujeto, es decir, como suele comportarse en situaciones ordinarias. En la intrincada tarea de medir la personalidad los psiclogos recurren a cuatro

121

instrumentos

bsicos: la

entrevista personal, la

observacin

directa

del

comportamiento, los test objetivos y los test proyectivos.

La historia de la evaluacin de la personalidad puede caracterizarse por dos tendencias superpuestas. Primero, las tcnicas proyecivas desestructuradas, como la prueba Rorschach, dominaron las pruebas de personalidad a inicios del siglo XX y despus perdieron su popularidad. En segundo lugar, los enfoques estructurados como los inventarios de autoinforme y las clasificaciones conductuales obtuvieron importancia a mediados del siglo y luego aumentaron rpidamente su popularidad. Las tcnicas proyectiva son resplandecientes en cuanto a las hiptesis que dan por resultado sin embargo, las tcnicas proyectivas carecen en gran medida de la aprobacin de los clnicos con orientacin psicomtrica. Los mtodos ms objetivos para la evaluacin de la persona los favorecen los psiclogos con una mentalidad dirigida a la medicin con instrumentos de respuesta de cierjo/ falso y de eleccin forzosa, incluyendo la prueba de personalidad de ms amplio uso, el Inventario multifsico de la personalidad (MMPI) y su revisin ms reciente, el MMPI-2. Los psicmetras contemporneos han dependido de tres tcticas para el desarrollo de las pruebas: los enfoques ligados a la teora, las estrategias analtico-factoriales y los mtodos con codificacin de criterio. Por supuesto, las fronteras son un tanto artificiales y muchos de los autores de pruebas utilizan una combinacin de mtodos. Cada vez que un psiclogo se enfrenta a la difcil tarea de medir la personalidad de un individuo, asumen un reto ya que la personalidad es algo que ellos no pueden ni ver ni tocar, pero que saben que esta presente en cada una de las persona, y tratar de ver como es la personalidad de un individuo en particular no es tarea fcil para los mismos. Para ilustrar esta temtica veremos tres instrumentos, dos de carcter objetivo y dos proyectivo.

122

Leccin 22. 16 PF

FICHA TCNICA

Nombre original :

"Sixteen Personality Factor Questionnaire (16 PF)". Institute for

Personality and Ability Testing, Champaign, Illinois, U.S.A.

123

Autor:

R.B. Cattell.

Nombre en la Adaptacin Espaola: Cuestionario de Personalidad 16 PF.

Adaptacin Espaola: Seccin de Estudios de TEA Ediciones, S.A. Madrid, 1.975.

Administracin: Individual y Colectiva.

Duracin:

Variable, 45 a 60 minutos.

Aplicacin:

Adolescentes y Adultos, con un nivel cultural equivalente al de la Enseanza Media para las Formas A Y B.

Significacin: Apreciacin de diecisis rasgos de primer orden y cuatro de segundo orden de la personalidad; posible medida de la distorsin motivacional en las Formas A, C y D, y de la Negacin en la Forma A.

Material: Manual, Cuadernillos, Hojas de respuestas y plantillas de correccin.

El Cuestionario de Personalidad de 16 Factores es un instrumento de valoracin objetiva, elaborado mediante investigacin psicolgica con el fin de ofrecer en el menor tiempo posible una visin muy completa de la personalidad.

El 16 PF se diseo para ser aplicado a sujetos de 16 aos en adelante y existen en uso o en preparacin, seis formas diferentes; la C y la D estn destinadas a sujetos con formacin medio-baja; la A y la B para personas con nivel de formacin igual o superior al de bachillerato superior. Las restantes formas del cuestionario E y F, estn proyectadas para sujetos que presentan algn dficit en su formacin y nivel de comprensin lectora.

124

La visin global de la personalidad que intenta el 16 PF se basa en la evaluacin de 16 dimensiones funcionalmente independientes y psicolgicamente significativas, aisladas y definidas repetidamente durante ms de treinta aos de investigaciones factoriales, en grupos de sujetos normales y clnicos.

Los rasgos de personalidad evaluados por el 16 PF no estn nicamente aislados y definidos por el Cuestionario, sino que se encuadran dentro del contexto de una teora general de la personalidad; la primera publicacin comercial de la prueba (1949) fue precedida de una fase de cerca de diez aos de investigacin emprica factorial.

Las dimensiones del 16 PF se especifican y definen brevemente ms adelante; los factores, identificados por letras, se describen en sus dos polos o extremos mediante una denominacin tcnica y unos cuantos adjetivos de uso corriente.

Adems de los 16 factores primarios mencionados, el cuestionario puede evaluar ocho dimensiones secundarias que, como se indica posteriormente, son rasgos ms amplios, obtenidos a partir de los factores primarios.

INSTRUCCIONES PARA LA APLICACIN

Las contestaciones se recogen en una Hoja de respuestas separada, nunca sobre el mismo Cuadernillo. En primer lugar se le pide al sujeto que anote los datos de identificacin (apellidos, nombre, edad, etc.), en la parte superior de la Hoja de Respuestas. A continuacin se le indica que lea, a la vez que lo hace el examinador en voz alta, las instrucciones de la portada del Cuadernillo y conteste en la Hoja a los cuatro ejemplos que se proponen.

125

En ocasiones es preferible leer y discutir con el sujeto ciertos puntos de las instrucciones, aunque el examinador debe ser siempre juez crtico en cualquier situacin particular. Para contestar en la Hoja y sealar sus respuestas, el sujeto debe colocar la Hoja de forma apaisada; el espacio dedicado a los cuatro ejemplos de entrenamiento se encuentran en la parte superior, fuera del recuadro dedicado a los elementos, y stos estn dispuestos en forma de columnas, una para cada pgina del Cuadernillo.

Es probable que ayude al examinado conocer este diseo intencional en columnas, de modo que al final de cada columna y pgina tenga un control de que viene contestando a cada elemento en el lugar correspondiente.

Aunque el Cuestionario no tiene un tiempo limitado, es preferible recordarles que no deben entretenerse demasiado en cada cuestin, sino contestar de un modo natural, sincero y rpido.

Terminada la aplicacin se recoge la Hoja de respuestas y el Cuadernillo, comprobando si se han anotado bien los datos de identificacin y si se ha dado una y slo una respuesta a cada cuestin.

NORMAS PARA LA CORRECCIN Y PUNTUACIN

Las hojas de respuestas pueden ser corregidas manualmente. Cada respuesta puede recibir 2, 1 0 puntos, excepto en el factor B (Inteligencia), cuyas contestaciones reciben 1 0 puntos. La puntuacin de cada elemento contribuye slo a un factor o escala (excepto en DM de la Forma A).

La utilizacin de la plantilla, preparada al efecto, facilita la correccin manual; en ella se pueden obtener las puntuaciones directas en los 16 factores. Basta

126

colocarla sobre la hoja de respuestas de modo que por los espacios transparentes de referencia - en la parte izquierda y fuera del recuadro dedicado a las contestaciones - aparezcan las estrellas superior e inferior de la hoja.

Cada una de las escalas ocupa en la plantilla una zona aproximadamente horizontal, separada por lneas y claramente diferenciadas. La puntuacin directa de cada escala se puede hallar comenzando por la izquierda y sumando los puntos obtenidos por las contestaciones del sujeto que aparezcan a travs de los espacios transparentes; al terminar en el margen derecho de la plantilla, se anota el resultado en la casilla existente en el margen derecho de la hoja de respuestas.

FIABILIDAD

La consistencia de las 16 escalas, puede mostrarse de muy diferentes modos. El primer tipo de consistencia es la fiabilidad o concordancia de los resultados a travs del tiempo. La fiabilidad puede, a su vez, subdividirse en:

a. Coeficiente de permanencia o correlacin test-retest en dos ocasiones distintas separadas por un pequeo intervalo de tiempo;

b. Coeficiente de estabilidad o correlacin test-retest con un intervalo de tiempo ms largo.

En diferentes aplicaciones de 16PF de diversas formas o diversas combinaciones se ha encontrado coeficientes de permanencia entre 0,70 y 0,90 aproximadamente. En todos los casos, el retest se realizo dentro de la semana siguiente a la primera aplicacin. En otras aplicaciones, igualmente se han encontrado coeficientes de estabilidad del orden del 0,71 y 0,88 con muestras de 132 personas y con un intervalo de tiempo de 2 meses. Los coeficientes de estabilidad ms bajos se

127

presentan en aplicaciones test-retest con intervalos de 4 aos con valores entre 0,41 y 0,64.

VALIDEZ

El concepto de validez exige la eleccin de los elementos que sean buenas medidas de los factores de personalidad tal como estos factores son definidos por los estudios de investigacin. Este concepto de validez de las escalas puede evaluarse directamente correlacionando las puntuaciones directas con los factores puros. En aplicaciones de diversas formas de PF16 se ha encontrado que la validez es mayor cuando se combinan las Formas y los ndices son relativamente elevados, incluso en las escalas que contienen menos elementos.

El concepto de validez tambin puede evaluarse indirectamente determinando en que grado las correlaciones obtenidas entre las escalas del 16 PF y un grupo representativo de variables psicolgicas diversas, estn de acuerdo con aquellas que se esperara obtener a partir de los criterios conceptuales o factores puros. Para ello, en una aplicacin de las formas A, B, C y D a 606 varones y mujeres se encontr coeficientes de validez entre 0.90 y 0,96.

En ambas estimaciones de la validez, directa e indirecta, se encuentra gran congruencia. En ambos estudios los ndices ms elevados son obtenidos por las escalas A y F, y los ms bajos por las escalas M, N, O y Q1.

NORMAS INTERPRETATIVAS

CONVERSIN DE PUNTUACIONES DIRECTAS EN DECATIPOS

El significado de las puntuaciones directas de una forma o combinacin de formas del 16 PF depende, naturalmente, de la forma o formas utilizadas.

128

Consecuentemente, antes de que las puntuaciones directas puedan ser evaluadas e interpretadas, deben convertirse a una escala comn y nica que site la puntuacin del sujeto (adolescentes, universitario o de la poblacin general adulta) en relacin con las obtenidas por un grupo normativo y definido de la poblacin. Las tablas construidas en la tipificacin permiten la conversin de las puntuaciones directas en otras denominadas decatipos, una escala tpica de diez puntos que ha mostrado en la prctica un grado bastante bueno, en la discriminacin de los resultados.

Los decatipos se distribuyen sobre una escala de diez puntos equidistantes en unidades tpicas (supuesta la distribucin normal), con una media en el decatipo 5,50 y una desviacin de 2 decatipos. As, pues, los decatipos 5 y 6 se extienden, respectivamente, a media desviacin tpica a ambos lados de la media, y comprenden el grupo central de la poblacin, mientras que los extremos superior del decatipo 10 e inferior del decatipo 1 se encuentran a dos y media desviaciones tpicas a ambos lados de la media.

Se puede, por tanto, considerar que los decatipos 5 y 6 son valores medios, 4 y 7 muestran una pequea desviacin (en una y otra direccin, respectivamente), 2-3 y 8-9 indican una gran desviacin, y 1 y 10 son valores extremos, entendiendo todas estas posiciones como relativas a la poblacin especifica sobre la cual se realiz la tipificacin.

La seleccin del baremo adecuado permite obtener los decatipos correspondientes a las puntuaciones directas alcanzadas por cualquier sujeto en las 16 escalas. Las tablas cubren, para cada una de las formas del cuestionario, las poblaciones adolescentes y adultos de uno y otro sexo. Para su elaboracin, se han conjugado los criterios de significacin estadstica y de utilizacin prctica. El Psiclogo debe

129

elegir aquel baremo que mejor se ajuste a los sujetos examinados y a la finalidad de su estudio.

INTERPRETACIN

Cada uno de los factores primarios evaluados por el 16 PF tiene una denominacin alfabtica (desde A a Q ) y un 4 nombre tcnico. La definicin e interpretacin de los mismos, tal como se presenta en los prrafos siguientes, es breve, no tcnica y, naturalmente, menos exacta que la descripcin critica y ms profunda que presenta el "Handbook" u otras obras similares; si el Psiclogo desea profundizar mas en el significado y operatividad de los factores debera examinar los numerosos perfiles estudiados en el "Handbook" para grupos clnicos o profesionales bien definidos.

En las siguientes descripciones interpretativas de las puntuaciones bajas (decatipos 1-3) y altas (decatipos 8-10) el nombre tcnico se incluye entre parntesis; previamente se da una breve definicin menos tcnica, con varios adjetivos descriptivos que suelen utilizarse frecuentemente en la prctica.

FACTOR A

PUNTUACIONES BAJAS (1-3) Reservada, alejada, crtica, fra. (Sizotimia)

La persona que punta bajo tiende a ser dura, fra, escptica y a mantenerse alejada. Le gustan ms las cosas que las personas, trabajar en solitario y evitar las opiniones comprometidas. Suele ser precisa y rgida en su manera de hacer las cosas y en sus criterios personales, rasgos que son deseables en muchas ocupaciones. En ocasiones puede ser crtica, obstaculizadora e inflexible.

130

PUNTUACIONES ALTAS (8-10)

Abierta, afectuosa, reposada, participativa. (Afectotimia)

La persona que punta alto tiende a ser afable, reposada, emocionalmente expresiva (de aqu el polo de afectotimia), dispuesta a cooperar, solcita con los dems, bondadosa, amable y adaptable. Le gustan las ocupaciones que exijan contactos con la gente y las situaciones de relacin social. Fcilmente forma parte de grupos activos, es generosa en sus relaciones personales, poco temerosa de las crticas y bastante capaz de recordar los nombres de las personas.

FACTOR B

PUNTUACIONES BAJAS (1-3) Inteligencia baja, pensamiento concreto. (Poca capacidad mental para los estudios)

La persona que punta bajo tiende a ser lenta para aprender y captar las cosas; corta e inclinada a interpretaciones concretas y literales. Su cortedad puede ser debida a una escasa capacidad intelectual o a la influencia de factores psicopatolgicos que limitan su actuacin.

PUNTUACIONES ALTAS (8-10)

Inteligencia alta, pensamiento abstracto, brillante. (Mucha capacidad mental para los estudios).

131

La persona que punta alto tiende a ser rpida en su comprensin y aprendizaje de las ideas. Existe alguna relacin con el nivel cultural y con la viveza mental. En una situacin de diagnstico psicopatolgico, estas puntuaciones altas contraindican la existencia de un deterioro mental.

FACTOR C

PUNTUACIONES BAJAS (1-3)

Afectada por los sentimientos, poco estable emocionalmente, turbable. (Poca fuerza del ego)

La persona que punta bajo tiende a presentar poca tolerancia a la frustracin; cuando las condiciones no son satisfactorias es voluble, plstica, evade las necesidades y llamadas de la realidad, neurticamente fatigada, displicente, de emocin y turbacin fcil, activa cuando se encuentra insatisfecha; presenta sntomas neurticos (fobias, alteraciones del sueo, quejas psicosomticas, etc). Estas puntuaciones bajas son comunes a casi todas las formas de alteraciones neurticas y a algunas psicticas.

PUNTUACIONES ALTAS (8-10)

Emocionalmente estable, tranquila, madura, afronta la realidad. (Mucha fuerza del ego)

La persona que punta alto tiende a ser emocionalmente madura, estable, realista acerca de la vida, tranquila, con buena firmeza interior y capacidad para mantener una slida moral de grupo. A veces puede presentar ajustes conformistas en el caso de problemas no resueltos.

132

FACTOR E

PUNTUACIONES BAJAS (1-3)

Sumisa, dbil, acomodaticia, conformista. (Sumisin)

La persona que punta bajo tiende a ceder ante los dems, a ser dcil, y a conformarse. Es, a menudo, dependiente, acepta las ideas de los otros, y se muestra ansiosa por una exactitud obsesiva. Esta pasividad es parte de muchos sndromes neurticos.

PUNTUACIONES ALTAS (8-10)

Dominante, independiente, agresiva, competitiva, obstinada. (Dominancia)

La persona que punta alto es dogmtica, segura de s misma, de mentalidad independiente. Tiende a ser austera, autoreguladora, hostil y extrapunitiva, autoritaria (en el manejo de los dems), y a hacer caso omiso de toda autoridad.

FACTOR F

PUNTUACIONES BAJAS (1-3)

Sobria, prudente, seria, taciturna. (Desurgencia)

La persona que punta bajo tiende a ser reprimida, reticente, introspectiva. A veces es terca, pesimista, indebidamente cauta; es considerada por los dems como

133

presumida y estiradamente correcta. Suele ser una persona sobria y digna de confianza.

PUNTUACIONES ALTAS (8-10)

Descuidada (confiada a la buena ventura), animada e impulsiva, entusiasta. (Surgencia)

La persona que punta alto tiende a ser jovial, activa, charlatana, franca, expresiva, acalorada y descuidada. Frecuentemente se le escoge como lder electo. Puede ser impulsiva y de actividad imprevisible o cambiante.

FACTOR G

PUNTUACIONES BAJAS (1-3) Despreocupada, evita las normas, acepta pocas obligaciones. (Poca fuerza del superego)

La persona que punta bajo suele ser inestable en sus propsitos. Sus acciones son casuales y faltas de atencin a los compromisos del grupo y las exigencias culturales. Su alejamiento de la influencia del grupo puede llevarle a actos antisociales, lo cual le hace ser ms efectiva, a la vez que su negativa de sujecin a las normas le permite tener menos conflictos somticos en situaciones de tensin.

PUNTUACIONES ALTAS (8-10)

Escrupulosa (consciente), perseverante, sensata, sujeta a normas. (Mucha fuerza del superego)

La persona que punta alto tiende a ser de carcter exigente, dominada por el

134

sentido del deber, perseverante, responsable, organizada, y 'no malgasta un minuto'. Normalmente es escrupulosa y moralista. Ms que a tipos graciosos prefiere como compaeros a personas trabajadoras. Hay que distinguir el ntimo 'imperativo categrico' de este superego esencial (en el sentido sicoanaltico), del 'yo social ideal' del Q3 aparentemente similar. FACTOR H

PUNTUACIONES BAJAS (1-3) Cohibida, reprimida, tmida, falta de confianza en s misma. (Trectia)

La persona que punta bajo suele ser tmida, alejada, cautelosa, retrada, que permanece al margen de la actividad social. Puede presentar sentimientos de inferioridad. Tiende a ser lenta y torpe al hablar y expresarse, no le gustan las ocupaciones con contactos personales. Ms que un grupo amplio, prefiere uno o dos amigos ntimos, y no es dada a mantenerse en contacto con todo lo que est ocurriendo a su alrededor.

PUNTUACIONES ALTAS (8-10) Emprendedora, socialmente atrevida, espontnea, no inhibida (Parmia)

La persona que punta alto tiende a ser sociable, atrevida, dispuesta a intentar nuevas cosas, espontnea, de numerosas respuestas emocionales. Su indiferencia (falta de vergenza) le permite soportar sin fatiga el 'toma y daca' del trato con la gente y las situaciones emocionales abrumadoras. Sin embargo, puede

despreocuparse por los detalles, e invertir mucho tiempo charlando. Tiende a ser emprendedora y estar activamente interesada por el otro sexo.

135

FACTOR I

PUNTUACIONES BAJAS (1-3)

Sensibilidad dura, confiada en s misma, realista (Harria)

La persona que punta bajo tiende a ser prctica, realista, varonil, independiente, responsable y, a la vez, escptica de las elaboraciones culturales subjetivas. A veces es inamovible, dura, cnica, pagada de s misma. Tiende a mantener el grupo trabajando sobre unas bases prcticas, realistas y acertadas.

PUNTUACIONES ALTAS (8-10)

Sensibilidad blanda, dependiente, impresionable, superprotegida. (Premsia)

La persona que punta alto suele dejarse afectar por los sentimientos, idealista, soadora, artista, descontentadiza femenina. A veces solicita para s la atencin y ayuda de los otros; es impaciente, dependiente, poco prctica. Le disgustan las personas y profesiones rudas. Suele frenar la accin del grupo y turbar su moral con actividades intiles e idealistas.

FACTOR L

PUNTUACIONES BAJAS (1-3)

Confiable, adaptable, no afectada por los celos o envidia, de trato fcil. (Alaxia)

136

La persona que punta bajo suele no presentar tendencia a los celos o envidia; es adaptable, animosa, no competitiva, interesada por los dems, buena colaboradora del grupo.

PUNTUACIONES ALTAS (8-10) Suspicaz, engreda, difcil de engaar. (Protensin)

La persona que punta alto suele ser desconfiada y ambigua. A menudo se encuentra complicada con su propio yo, le gusta opinar sobre s misma, y est interesada en la vida mental ntima. Suele actuar con premeditacin, es despegada de los otros y colabora deficientemente con el grupo.

NOTA: Este Factor no es necesariamente 'Paranoia'; de hecho, los datos de los esquizofrnicos paranoicos no son tan claros como cabra esperar a partir de los valores tpicos del Factor L.

FACTOR M

PUNTUACIONES BAJAS (1-3)

Prctica, cuidadosa, convencional, regulada por realidades externas, formal y correcta. (Praxernia)

La persona que punta bajo suele mostrarse ansiosa por hacer las cosas correctamente, atenta a los problemas prcticos y sujeta a los dictados de lo que es evidentemente posible. Se preocupa por los detalles, capaz de serenidad en situaciones de emergencia, aunque a veces es poco imaginativa.

137

PUNTUACIONES ALTAS (8-10)

lmaginativa, centrada en sus necesidades ntimas, abstrada, despreocupada de los asuntos prcticos.

(Autia) La persona que punta alto tiende a ser poco convencional, despreocupada de lo cotidiano, bohemia, motivada por si misma, creadora, imaginativa, preocupada por lo 'esencial' y despreocupada de las personas particulares y la realidad fsica. Sus intereses, dirigidos hacia su intimidad, la llevan a veces a situaciones irreales, con explosiones expresivas. Su individualidad le empuja a verse excluido de las actividades del grupo.

FACTOR N

PUNTUACIONES BAJAS (1-3) Franca, natural, sencilla, sentimental. (Sencillez)

La persona que punta bajo suele ser sencilla, sentimental, llana, poco sofisticada. Se le satisface fcilmente y se muestra contenta con lo que le acontece; es natural, espontnea, poco refinada y torpe.

PUNTUACIONES ALTAS (8-10) Astuta, calculadora, mundana, perspicaz. (Astucia) La persona que punta alto suele ser refinada, experimentada, mundana y astuta. A menudo es 'cabeza dura' y analtica. Su enfoque es intelectual y poco sentimental, aproximndose a las situaciones de una manera casi cnica.

138

FACTOR O

PUNTUACIONES BAJAS (1-3) Apacible, segura de s, flexible, serena. (Adecuacin imperturbable)

La persona que punta bajo tiende a ser plcida, de nimo invariable. Su confianza en s misma y su capacidad para tratar con cosas es madura y poco ansiosa; es flexible y segura, pero puede mostrarse insensible cuando el grupo no va de acuerdo con ella, lo cual puede provocar antipatas y recelos.

PUNTUACIONES ALTAS (8-10)

Aprensiva, preocupada, depresiva, turbable. (Tendencia a la culpabilidad)

La persona que punta alto suele ser depresiva, preocupada, llena de presagios e ideas largamente gestadas. Ante las dificultades presenta tendencia infantil a la ansiedad. En los grupos no se siente aceptada ni con libertad para actuar. Una puntuacin alta es muy corriente en los grupos clnicos de todo tipo.

FACTOR Q1 PUNTUACIONES BAJAS (1-3)

Conservadora, respetuosa de las ideas establecidas, tolerante de los defectos tradicionales.

139

(Conservadurismo)

La persona que punta bajo confa en lo que le han enseado a creer y acepta lo 'conocido y verdadero', a pesar de sus inconsistencias, aunque se le presente algo que pudiera ser mejor. Es precavida y puntillosa con las nuevas ideas, tiende a posponer u oponerse a los cambios, a seguir la lnea tradicional, a ser conservadora en religin y poltica, y a despreocuparse de las ideas analticas e 'intelectuales'.

PUNTUACIONES ALTAS (8-10)

Analtico-critica, liberal, experimental, de ideas libres y pensamiento abierto. (Radicalismo)

La persona que punta alto suele interesarse por cuestiones intelectuales y dudar de los principios fundamentales. Es escptica y de espritu inquisitivo en las ideas, sean tradicionales o nuevas. Suele estar bien informada, poco inclinada a moralizar y ms a preguntarse por la vida en general y a ser ms tolerante con las molestias y el cambio.

FACTOR Q2 PUNTUACIONES BAJAS (1-3)

Dependiente, buena compaera y de fcil unin al grupo. (Adhesin al grupo)

La persona que punta bajo prefiere trabajar y tomar decisiones con los dems, le gusta y depende de la aprobacin social. Tiende a seguir las directrices del grupo, incluso mostrando falta de decisiones personales. No es necesariamente gregaria

140

por decisin propia, sino que necesita del apoyo del grupo.

PUNTUACIONES ALTAS (8-10)

Autosuficiente, prefiere sus propias decisiones, llena de recursos. (Autosuficiencia)

La persona que punta alto es temperamentalmente independiente, acostumbrada a seguir su propio camino; toma sus decisiones y acta por su cuenta. No tiene en consideracin la opinin del grupo, aunque no es necesariamente dominante en sus relaciones con los dems. No le disgusta la gente, simplemente no necesita de su asentimiento y apoyo.

FACTOR Q3 PUNTUACIONES BAJAS (1-3)

Autoconflictiva, necesidades.

despreocupada

de

protocolos,

orientada por

sus

propias

(Baja integracin)

La persona que punta bajo no est preocupada por aceptar y ceirse a las exigencias sociales. No es excesivamente considerada, cuidadosa o esmerada. Puede sentirse desajustada, y muchas de sus desadaptaciones (especialmente las afectivas, pero no las paranoicas) puntan en esta direccin de la variable.

PUNTUACIONES ALTAS (8-10)

Controlada, socialmente adaptada, llevada por su propia imagen. (Mucho control de su autoimagen)

141

La persona que punta alto suele tener mucho control de sus emociones y conducta en general, y ser cuidadosa y abierta a lo social; evidencia lo que comnmente se llama 'respeto hacia s misma'; tiene en cuenta la reputacin social. No obstante, a veces tiende a ser obstinada. Los lderes eficaces y algunos paranoicos puntan alto en Q3.

FACTOR Q4 PUNTUACIONES BAJAS (1-3) Relajada, tranquila, aletargada, no frustrada.

(Poca tensin rgica) La persona que punta bajo suele ser sosegada, relajada, tranquila y satisfecha (no frustrada). En algunas situaciones, su estado de mucha satisfaccin le puede llevar a la pereza y al bajo rendimiento, en el sentido de que no tiene motivacin para intentar algo (como un alto nivel de tensin rgica puede desbaratar tambin el rendimiento escolar o Profesional).

PUNTUACIONES ALTAS (8-10)

Tensa, frustrada, presionada, sobreexcitada. (Mucha tensin rgica)

La persona que punta alto suele ser tensa, excitable, intranquila, irritable e impaciente. Est a menudo fatigada pero incapaz de permanecer inactiva. Dentro del grupo tiene una pobre visin del grado de cohesin, del orden y del mando. Su frustracin representa un exceso del impulso de estimulacin no descargada.

142

Leccin 23. MMPI INVENTARIO MULTIFASICO DE LA PERSONALIDAD DE MINNESOTA (MMPI).

DESCRIPCIN GENERAL

FICHA TCNICA

Nombre:

Inventario Multifsico de la Personalidad de Minnesota.

Autores:

S. R. Hathaway y J. C. Mc Kinley.

Administracin:

Individual y Colectiva.

Duracin:

Variable, de 45 a 60 minutos.

Aplicacin:

Sujetos cuyas edades oscilen entre 14 y 64 aos, con una

cultura equivalente a seis aos de escolaridad y saber leer con fluidez; los sujetos no deben presentar alteraciones severas en su contacto con la realidad y limitaciones en su dotaci6n intelectual.

Significacin:

Evala

las caractersticas

de personalidad, de

manera

multifsica puesto que intenta abarcar diversos aspectos de la persona mediante el uso de 14 escalas; 4 de validez y 10 Clnicas.

ANTECEDENTES

Este inventario fue construido originalmente por el Psiclogo Starke Hathaway y el Psiquiatra J.C. Mckinley; los primeros estudios sobre el tema aparecieron hacia 1.940. Posteriormente, en 1.943, la Universidad de Minnesota public el cuestionario y, en 1.945, autoriz su publicacin a la Corporacin de Psicologa. Los autores de la prueba pretendan que el MMPI fuera til para la evaluacin

143

diagnstica de rutina. A finales de la dcada de 1.930 y principios de 1.940, un objetivo primordial para el Psiclogo Clnico y el Psiquiatra era asignar clasificaciones Psico-diagnsticas apropiadas a casos individuales.

Desde su primera publicacin en 1.943, ha sido uno de los instrumentos de Psicoevaluacin ms objetivo y til tanto en la investigacin como en la prctica clnica ya que su uso se facilita por la alta calidad interpretativa de sistemas actuariales que ayudan en el proceso Clnico de elaboracin de decisiones.

Por otra parte para su elaboracin Hathaway y Mckinley, tuvieron en cuenta la educacin y cultura de los sujetos a quienes se les administr, para que las frases fueran comprendidas an por personas de bajo nivel intelectual.

En su elaboracin los autores utilizaron un enfoque de codificacin emprica en la construccin de las diversas escalas del MMPI. Inicialmente se procedi a reunir una gran cantidad de reactivos potenciales para el inventario, seleccionando una amplia variedad de enunciados afirmativos de tipos de personalidad extrados de fuentes tales como: historias de casos e informes Psicolgicos y Psiquitricos; luego se seleccionaron grupos criterio apropiados y se procedi a elaborar las escalas administrando los 504 reactivos originales a "Grupos Normales" y a "Grupos Clnicos", realizando un anlisis de estos reactivos; poco tiempo despus se elaboraron 2 escalas clnicas adicionales, primero la escala de MasculinidadFeminidad (MF) y la escala de introversin social (IS) desarrollada por Drake en 1.946.

ESTRUCTURA DEL INVENTARIO

El Inventario Multifsico de la Personalidad de Minnesota (MMPI) incluye 566 enunciados afirmativos de autoreferencia. La tarea de la persona que resuelve la

144

prueba consiste en dar respuesta a cada afirmacin como verdadera si se aplica a s misma y como falsa si se considera que no es aplicable a s misma.

El contenido de los tems de este instrumento es muy variado. Estos dan informacin sobre conductas exteriores, sentimientos que puedan observarse y actitudes generales de tipo social; adems algunos tems intentan detectar "sntomas morbosos", mientras que otros parecen no poseer ningn sentido favorable o desfavorable.

DESCRIPCIN DE LAS ESCALAS

Como ya se ha visto el MMPI est formado por 14 escalas de validez: frases omitidas (?), sinceridad (L), puntuacin de validez (F) y factor corrector (K); 10 escalas clnicas: escala 1 (Hipocondriasis), escala 2 (Depresin), escala 3 (Histeria), escala 4 (Desviacin Psicoptica), escala 5 (Masculinidad-Feminidad), escala 6 (Paranoia), escala 7 (Psicastenia), escala 8 (esquizofrenia), escala 9 (hipomana), escala 0 Si (introversin o extroversin social).

ESCALAS DE VALIDACIN

ESCALA DE FRASES OMITIDAS (?) Comprende todos aquellos elementos clasificados por el sujeto como NO SE o "No puedo decir"; el valor de esta puntuacin afecta el significado de las dems puntuaciones.

ESCALA DE SINCERIDAD (L) Se construy con el fin de detectar un intento deliberado por parte del sujeto para presentarse a s mismo de una manera favorable evaluando el grado de franqueza del sujeto.

145

PUNTUACIN DE VALIDEZ (F) Se desarroll para detectar formas desviadas de responder a los reactivos de la prueba; puntuaciones altas indican el descontrol de las emociones, como tambin indican sntomas del Neurtico y Psiquitrico.

FACTOR CORRECTOR (K) Se elabor como un ndice de los intentos del examinado por negar su patologa y presentarse a s mismo de una manera favorable o para aparecer de manera muy desfavorable. Est integrada por 30 frases, es una escala de correccin para las Escalas Clnicas: 1 (Hs), 4 (Dp), 7(Pf), 8 (Es) y 9 (Ma) y se relaciona con la actitud defensiva ante la debilidad Psicolgica o exhibicionismo Psicolgico.

ESCALAS CLNICAS

Se encuentran subdivididas en tres zonas as:

l. - ZONA PSICONEUROTICA

Comprende las siguientes Escalas:

ESCALA 1 HS (Hipocondriasis o Somatizacin) Se desarroll para identificar pacientes que manifestaran un patrn de sntomas asociados con la clasificacin de hipocondra y/o Somatizacin localizada (se caracteriza por una preocupacin anormal por las propias funciones corporales y temores concomitantes a la enfermedad), Esta escala consta de 33 reactivos asociados con preocupaciones Somticas o con el funcionamiento fsico en general.

ESCALA 2 D (Depresin).

146

Se elabor con el propsito de evaluar el grado en que un sujeto puede presentar depresin sintomtica caracterizada por pesimismo, falta de esperanza en el futuro e insatisfaccin general con la propia situacin de vida. Esta escala consta de 60 reactivos que tratan diversos aspectos de la depresin (negacin de la felicidad y el mrito personal, retardo psicomotor, ausencia de inters en lo que les rodea.

ESCALA 3 Hi (Histeria). Se desarroll para identificar individuos que utilizaban reacciones histricas ante las situaciones de tensin, adems de determinar Somatizacin no Localizada sin determinacin de una causa real. Consta de 60 reactivos de dos tipos generales; algunos tienen que ver con una negacin general de la Salud Fsica y una variedad de quejas sintomticas algo ms especificas.

ZONA SOCIAL

Comprende las siguientes escalas:

ESCALA 4 Dp (Desviacin Psictica) Se elabor con el fin de identificar personas asociales, antisociales, sociales y disociales. Esta escala consta de 50 reactivos que cubren un amplio rango de temas incluyendo falta de satisfaccin en la vida, problemas sexuales y dificultad con la autoridad.

ESCALA 5 MF (Masculinidad- Feminidad) Se desarroll para definir los intereses que son propios de hombres y mujeres; adems de identificar la homosexualidad. Consta de 60 reactivos relacionados con material sexual y diversidad de temas.

ZONA PSIQUIATRICA

147

Comprende las siguientes escalas:

ESCALA 6 PA (Paranoia) Se elabor a fin de identificar pensamientos o ideas paranoides (sentimientos de persecucin, ideas de grandeza, suspicacia, opiniones, actitudes rgidas, etc). Consta de 40 a 60 reactivos relacionados con conductas Psicticas.

ESCALA 7 Pt (Psicastenia) Se desarroll con el propsito de encontrar caractersticas de la personalidad clasificada como Psicastenia (reacciones fbicas - obsesivo compulsivas y excesivas dudas); sin embargo en la actualidad no es de uso comn. Esta escala consta de 48 reactivos que cubren una variedad de sntomas y conductas relacionadas con pensamientos obsesivos, sentimientos de temor y/o ansiedad y dudas sobre la propia capacidad.

ESCALA 8 Es (Esquizofrenia) Se elaboro para identificar individuos asociados con la esquizofrenia, aislamiento emocional, las relaciones inadecuadas con las familias, apata e indiferencia. Esta escala consta de 78 reactivos que cubren un amplio grupo de conductas; siendo la ms amplia de todas las escalas clnicas.

ESCALA 9 Ma (Mana - Hipomana) Se desarroll bsicamente para identificar estados de nimo de las personas con caractersticas manaco depresivas, tipo manaco.

ESCALA O Si (Introversin - Extroversin Social) Aunque esta escala se desarroll despus de las otras Escalas Clnicas, ha sido tratada como estndar. Se dise para evaluar la tendencia de los sujetos a aislarse de los contactos y responsabilidades sociales; adems de identificar aspectos relacionados con la extroversin social. Consta de 70 reactivos de dos

148

tipos generales: un grupo se refiere a la participacin social, en tanto que el otro a una inadaptacin neurtica general y autodesprecio.

MATERIAL DE LA PRUEBA

FORMA INDIVIDUAL

- Hoja de anotacin y perfil. - 12 Plantillas de correccin.

FORMA COLECTIVA

- Cuadernillo con 566 reactivos. - Hoja de respuestas y Perfil. - Clave de correccin. - 15 plantillas de correccin (incluyendo escalas adicionales).

ESCALAS ADICIONALES

Comprende las siguientes Escalas:

FUERZA DEL YO (Es) La desarroll Barron (1.953), especficamente para predecir la respuesta de pacientes neurticos a la Psicoterapia individual. Consta de 68 reactivos que hacen referencia al funcionamiento fsico, aislamiento, actitudes hacia la religin, posicin moral, adecuacin personal y habilidad para enfrentar fobias y ansiedades.

DEPENDENCIA (Dy) La desarroll Navran (1.954), para evaluar la intensidad de las necesidades de dependencia. Consta de 57 reactivos.

149

DOMINANCIA (Do) La desarrollaron Gough, McClosky y Meehl (1.951); esta variable de la personalidad puede ser importante en la psicologa de la participacin social. Consta de 28 reactivos que permiten detectar la iniciativa social, capacidad para el mando, persistencia, acciones esforzadas, preocupacin e identificacin con la comunidad o sociedad y sentimiento de la responsabilidad.

RESPONSABILIDAD (Re) La desarrollaron los mismos autores de la Escala de Dominancia en 1.952. Consta de 32 reactivos los cuales se refieren a la preocupacin por temas sociales y morales, desaprobacin de privilegios, nfasis en los deberes y la autodisciplina, seguridad personal, etc. (Gough, 1.952).

CONTROL (Cn) La desarroll Cuadra, (1.953) para estudiar el problema de la necesidad de hospitalizacin. Consta de 50 reactivos que incluyen la conciencia de las propias debilidades, sensibilidad a las crticas sociales, ciencias religiosas y participacin en actividades riesgosas.

FUNDAMENTO ESTADSTICO

CONFIABILIDAD

En los cuestionarios de personalidad, la estimacin de este estadstico depende en gran medida de que el grupo comprenda slo sujetos normales, incluya slo enfermos Psiquitricos hospitalizados, o est formado por personas de ambos grupos. Es muy probable que los rasgos de personalidad sean ms estables en los sujetos normales que en los enfermos Psiquitricos; por esto teniendo en cuenta

150

las dificultades aludidas para una prueba como el MMPI, los datos que se citan a continuaci6n parecen bastante satisfactorios.

Hathaway y Mc Kinley (1.942) y Mc Kinley y Hathaway (1.942, 1.944), han aplicado la forma individual a un grupo de 47 sujetos normales no seleccionados, presentan coeficientes de fiabilidad en seis de las variables bsicas; utilizando el procedimiento de test-retest con un tiempo de intervalo entre tres das y ms de un ao.

Cottle (1.950) obtiene coeficientes de confiabilidad test-retest aplicando la forma individual y la forma colectiva en un grupo de 30 enfermos Psiquitricos no seleccionados; Holaberg y Alessi (1.949), citan coeficientes de confiabilidad obtenidos mediante la aplicacin de la forma individual completa y una versin reducida de la misma.

VALIDEZ

El criterio de validez se obtuvo principalmente en la prediccin de casos clnicos; el valor del pronstico del MMPI se hall comparando sus resultados con el diagnstico final elaborado por Profesionales Neuropsiquitricos de los Centros Clnicos. De esta manera, se ha observado que una puntuacin alta en una escala predice positivamente el diagnstico clnico final del profesional, y discrimina en ms de un 60% las nuevas admisiones de enfermos psiquitricos. Este porcentaje ha sido obtenido en la diferenciacin entre varios tipos de casos clnicos.

INSTRUCCIONES PARA LA APLICACIN Y CORRECCIN

APLICACIN

151

Esta prueba puede administrarse con facilidad en forma individual o colectiva y dicha aplicacin puede ser realizada por examinadores no profesionales (familiarizados con todo el material presentado en el Manual); aunque necesita de un clnico experimentado para su interpretacin. Adems la disponibilidad de diversas formas bsicas asegura que puede administrarse a un amplio espectro de personas de la manera ms conveniente para los sujetos y el examinador.

Las formas se encuentran disponibles para administraciones individuales, en grupo, para individuos ciegos u otros que no pueden leer y formas abreviadas que siempre conducen a una prdida de informacin.

Las instrucciones que deben darse al sujeto son las indicadas en la primera pgina del cuadernillo forma colectiva.

Seisdedos y Cordero en el Manual publicado por TEA Ediciones, 1.986, afirman que el MMPI debe ser presentado como una tarea seria e importante, brindando al sujeto la seguridad de que las respuestas sern estudiadas en su propio beneficio. Si se consigue esta actitud, se favorecer en gran medida la cooperacin de los examinados; algunos pueden necesitar posteriores aclaraciones sobre el propsito perseguido y el uso que van a tener los resultados. Si es posible, deben darse respuestas sinceras, evitando eludir o desviar la responsabilidad.

CORRECCIN Y VALORACIN

Algunos autores afirman que en primer lugar, deben separarse las hojas de respuestas segn el sexo de los examinados, y tambin borrar las respuestas que tengan sealadas las dos contestaciones (V y F), que se considerarn como respuestas NO SE.

152

Otros consideran que se realiza observando detalladamente la hoja de respuestas y anotando el nmero de respuestas omitidas; luego se procede a contar cuidadosamente el nmero de respuestas que caen dentro de las plantillas, anotando las puntuaciones en bruto de las diferentes escalas; en caso de no tener disponibles las plantillas se podr utilizar la clave de correccin.

Posteriormente se anotan las puntuaciones en bruto de las diferentes escalas con el mayor cuidado convirtiendo esta puntuacin en Puntajes T que vienen relacionados en la hoja del perfil arriba del nombre de la escala.

Por otra parte hay cinco escalas Clnicas que son modificadas por diversas proporciones del valor en bruto obtenido por la Escala K. De esta forma, la escala 1Hs, deber ser incrementada en su puntaje en bruto, por el 0.5 (la mitad) del valor de la Escala K en bruto.

Al puntaje en bruto de la Escala 4 Dp, se le agrega el 0.4 de K.

Al puntaje en bruto de la Escala 7 Pt, se le agregar el puntaje completo de K.

Al puntaje en bruto de la Escala 8 Es, se le agregar el puntaje completo de K y al puntaje en bruto de la Escala 9 Ma, se le agregar el 0.2 de K.

Una vez modificados los puntajes de estas cinco escalas, se elabora el perfil, ubicando cada puntaje en bruto en el nivel de su conversin correspondiente en calificaciones T.

CODIFICACIN DEL PERFIL

153

Con respecto al MMPI se han utilizado dos sistemas de codificacin: el sistema original de Hathaway (1.947) y un sistema ms completo desarrollado por Welsh (1.948). En la actualidad existe una gran cantidad de material publicado en ambos sistemas. A continuacin se describirn los pasos de cada uno de ellos:

- CODlGO DE WELSH

Paso 1. Escribir los dgitos que representan las escalas ordenadas segn la cuanta de la puntuacin T, de mayor a menor.

Paso 2. Introducir los smbolos que indiquen la cuanta de los valores T (90 o mayor, 80 -89, - 70 -79, - 60 - 69, -50 - 59,- 40 49, 30-39 # 29 o menor a la derecha de #) .

Paso 3. Se pueden codificar las escalas de validacin y colocarlas separadamente a la derecha del cdigo de las escalas clnicas.

- CODIGO DE HATHAWAY.

Paso 1. Se registra el nmero de la Escala que tiene la mayor puntuacin T.

Paso 2. Se anotan a continuacin de este nmero, y por orden descendente de las puntuaciones T, los nmeros de las escalas que tengan valores superiores a 54.

Paso 3.

154

Insertar un apstrofe () despus del ltimo nmero de escala en la clave que tenga una puntuacin T de 70 o ms.

Paso 4. Se subrayan los nmeros de las escalas cuyos valores T sean iguales o se diferencien en solo un punto.

Paso 5. Utilizar un guin (-) y luego registrar el nmero de la escala menor en el perfil si dicha escala tiene una puntuaci6n T menor que 46.

Paso 6. Siga la misma regla para subrayar esas puntuaciones bajas como se indic en el paso 4 para puntuaciones altas.

Paso 7. A la derecha y separada de las escalas clnicas, registre los puntajes crudos para L, F y K en ese orden y separada por dos puntos (:). Si la puntuacin directa de L es igual o mayor que 10, o si la F es igual o mayor que 16, se coloca un "X"; a fin de sugerir que el perfil puede ser invlido.

INTERPRETACIN

A continuacin se presenta de manera breve algunos indicadores para la interpretaci6n del MMPI, a fin de ser una gua didctica en dicha explicacin. Es muy importante para la interpretacin del MMPI tener un conocimiento previo de las caractersticas clnicas correspondientes a los nombres de las escalas; adems es importante tener en cuenta las caractersticas cuantitativas del MMPI, que son las que permitirn la organizacin de las escalas en el perfil; se podr observar, que se

155

utilizarn con frecuencia los trminos elevada o baja, para designar la ubicacin general de cada escala dentro del perfil.

Cuando se hable de una Escala elevada se har referencia a que tiene un puntaje por arriba de la media estadstica y, en comparacin con las dems, tiende a sobresalir. Su puntaje es el ms alto o uno de los ms altos.

Se hablar de Escalas bajas, cuando el puntaje de la misma sea inferior a la media estadstica o en comparacin con los dems, sea uno de los ms reducidos o el ms reducido.

Otro aspecto importante al aplicar el MMPI es tener en cuenta la finalidad de la aplicaci6n y las situaciones que la rodean. Para poder interpretar los perfiles del MMPI en forma integral, se debe tomar en cuenta que en esta tcnica concurren dos aspectos fundamentales: una parte cuantitativa y otra cualitativa.

La parte cuantitativa proporciona una informacin, tanto de la severidad con que un rasgo se acenta en la personalidad (por la elevacin de cada escala), como de la comparacin de las caractersticas de un sujeto con otros de su mismo grupo o de otros grupos sociales.

El aspecto cualitativo del inventario debe ser entendido en base a los elementos clnicos que proporcionan cada una de las escalas y de las combinaciones en que se encuentran relacionadas; en este punto se debe tener en cuenta que todas las escalas del perfil tienen relacin entre s, adems de la configuracin que se puede observar con la clave.

156

Leccin 24. El Test de Rorschach Se ha discutido desde hace algn tiempo la utilizacin de las pruebas proyectivas, ya que no cumplen con los requisitos psicomtricos (confiabilidad, validez y normas), por eso algunos autores opinan que no se les debe dar el titulo de pruebas, sino utilizar uno menos comprometedor como el de tcnicas o mtodos proyectivos de evaluacin. Levy en 1963 propuso llamarlas tcnicas de provocacin de respuestas, ya que dependen de la habilidad del clnico para hacer interpretaciones, otros ms estrictos, sugieren que se deben retirar del arsenal de pruebas psicolgicas. Se abordan los argumentos a favor y en contra de las pruebas proyectivas y su valor de uso como instrumentos propios del quehacer psicolgico. Veamos aqu el test de Rorschach El test de Rorschach es una tcnica y mtodo proyectivo de psicodiagnstico, creado por el psicoanalista suizo Hermann Rorschach (1884-1922). Se public por vez primera en 1921 y alcanz una amplia difusin. El test consiste en una serie de lminas en las que encontramos manchas aleatorias de tinta. El psicoterapeuta pide al sujeto que d sentido a esas manchas. A partir de estas interpretaciones el psicoterapeuta intenta ver lo que sucede en la mente del paciente. El test de Rorschach es quizs el ms conocido de los test, debe su nombre al psiquiatra suizo Hermann Rorschach (1884-1922). Bsicamente es un test proyectivo aunque a partir de l se ha estudiado su cuantificacin. Por lo que se lo considera una de las pruebas ms completas. Pero su mayor logro es la amplia difusin que posee, ya que a partir de ella existe una

157

amplia cantidad de investigaciones y casustica. El material actual disponible es inmenso. El test de Rorschach consta de 10 lminas compuestas por manchas de tinta (negras y policromticas) sobre un fondo blanco. Estas lminas poseen una morfologa vaga por lo que resultan especialmente sugerentes. Las lminas son presentadas de manera sucesiva a un paciente preguntndole lo que ve en ellas y como y donde manifiesta lo observado. Esta basado en lo que las personas perciben, ya que visualizan en las manchas diferentes aspectos. El anlisis del test est basado en lo percibido. Para mencionar solo algunos pocos ejemplos que ilustran sobre las caractersticas del test, cabe mencionar que interesa (entre otras cosas) la localizacin de lo observado, su forma, si presenta movimientos (que tipos de movimientos) si se perciben diferentes aspectos, si se perciben utilizando toda la lmina o parte de ella (en que detalles de una lmina se visualizan los elementos), si lo observado tiene dimensin, profundidad, color, reflejo, sombra, brillo, si se observan objetos inanimados, humanos, animales, paisajes, el tipo de respuestas, etc. Sera interminable describir la infinidad de respuestas posibles. Varios caminos han tenido un desarrollo independiente. Los de mayor desarrollo y difusin fueron los de Klopfer y Rapaport, tambin alcanzaron un importante desarrollo las lecturas de Beck, Hertz y Piotrowsky entre otros. El nombre de John Exner merece una mencin particular, integr las cinco principales corrientes en un nico Sistema Comprensivo, y es en la actualidad la corriente de mayor desarrollo, difusin, utilizacin y expansin en el mundo. A diferencia de los anteriores posee un enfoque menos complicado en sus lecturas y desarrollos diagnsticos. Se presenta a si mismo como un medio y no un fin, por lo que se promociona como un test para ser utilizado en diferentes mbitos y por diferentes lecturas tericas. Proporciona ms de cincuenta rasgos de la Personalidad estudiada, superando a cualquier otra prueba. Del sujeto estudiado, nos habla entre otros rasgos de:

158

Inteligencia: Capacidad. Estilo. Fantasa. Complejidad. Ajuste. Distorsin. Afectos: Inters. Formas de mostrarlos. Control. Influencia de las emociones en la resolucin Oposicionismo. de problemas. Constriccin de las muestras afectivas.

Vivencialidad: Recursos psicolgicos disponibles. Modos de afrontamiento: Reflexivo. Impulsivo. Ambigual. Activo o pasivo.

Autopercepcin:

Autoestima:

Egocentrismo,

narcisismo,

dependencia,

aislamiento. Preocupacin corporal.

Interrelaciones: Modelos de lo humano. Inters por los dems. Habilidad social. Inters por lo convencional. Visin de las relaciones sociales bien como de cooperacin o bien como agresivas.

Estrs: Nivel. Presiones que inciden en l Tono de humor: Valoracin de las interacciones con el entorno. Nivel de Depresin. Potencialidad suicida.

En la descripcin de la Personalidad, no slo se refiere a lo patolgico, sino tambin a rasgos positivos en los que la terapia puede apoyarse o incluso potenciarlos. Con frecuencia descubre problemas que el propio sujeto ignoraba, hacindole involucrarse ms en la terapia. Libre del error de deseabilidad social, el Rorschach es insustituible cuando de la evaluacin dependan consecuencias ajenas al mero diagnstico: Custodia de hijos, puestos de trabajo, mejor trato por parte de la Justicia, etc. Es ideal para la Seleccin de Personal de alta cualificacin, ya que, adems de lo dicho, la rica informacin que proporciona sealar a los sujetos ms idneos para desempear tareas concretas.

159

Requiere mayor nivel de conocimientos que otras pruebas. No solo sobre el propio Rorschach sino tambin sobre Personalidad y Psicopatologa, solo as se logra conseguir toda la amplitud de informacin que es capaz de proporcionar.

El Rorschach como test perceptivo El test de Rorschach no es propiamente un test proyectivo, sino que naci como un test perceptivo. Esto es, da cuenta de qu y cmo la persona ve el mundo; su capacidad para resistir el estrs, su tendencia a la introversin o extroversin, si sufre de algn tipo de problema emocional, la mucha o poca adecuacin a la realidad social, etc. Mtodos de interpretacin Rorschach muri en 1922, a un ao de presentar su test. Esto, sumado a su difusin un tanto tarda, llevo a que distintos psiclogos americanos y europeos

160

definieran sus propios mtodos de interpretacin del test. Los mtodos de mayor renombre fueron los de Klopfer y Rapaport, junto a los de Beck, Hertz y Piotrowsky. Con el tiempo, la diversidad de mtodos y la falta de un mtodo comn llevo al desprestigio del test por su falta de confiabilidad; esto es, cada psiclogo tena su propio mtodo y era casi imposible comparar resultados. A inicios de los 70, la Fundacin Rorschach comenz una serie de estudios para determinar cuales eran los mtodos de tabulacin e interpretacin ms utilizados, para despus iniciar una serie de investigaciones sobre aquellos indicadores que provean de informacin clnica relevante. El resultado de estos esfuerzos es el ahora conocido Mtodo Comprehensivo de Exner, editado por primera vez el ao 1974. El mtodo comprehensivo de Exner El mtodo comprehensivo de Exner es el resultado de las investigaciones iniciadas en los 70 por la Fundacin Rorschach para generar un mtodo nico de codificacin, tabulacin e interpretacin del Rorschach. Cada una de las variables que presenta el modelo cuenta con investigaciones empricas que respaldan su validez. En estos momentos, es el estndar de facto para la aplicacin e interpretacin del Rorschach y, segn la experiencia del autor, da resultados bastante vlidos. Si bien las propiedades psicomtricas del test de Rorschach son limitadas, el procedimiento se est fortaleciendo en tanto los sistemas de codificacin se hacen ms especficos y los investigadores dedican ms atencin a la comprobacin emprica de sus conceptos. La validez de la interpretacin puede mejorar con el uso frecuente de la tcnica y con la mayor experiencia clnica. Para complementar informacin sobre este test, recomendamos ver las siguientes pginas:

161

www.rorschach.org http://www.serymp.org Leccin 25. Casa rbol Persona (H-T-P) La H-T-P es una prueba proyectiva que utiliza dibujos a pulso de una casa, un rbol y una persona (Buck, 1948, 1981). A la persona examinada se le da casi completa libertad de trazar los tres objetos, se piden dibujos a lpiz y a colores por separado. Aunque el examinador puede improvisar una prueba H-T-P con meras hojas de papel en blanco, Buck (1981) recomienda el uso de una forma de dibujo con cuatro hojas que tiene en la primera pgina la informacin de identificacin. Las pginas 2, 3 y 4 tienen como ttulo Casa, rbol y Persona. Se necesitan dos formatos de dibujo para cada examinando, uno para los dibujos a lpiz y el otro para los dibujos a color. Buck (1981) tambin proporciona un formato independiente de cuatro hojas para una fase de interrogatorio posterior a los dibujos que consiste de 60 preguntas diseadas para obtener las opiniones de la persona examinada en cuanto a los elementos de los dibujos. Muchos profesionales consideran que la fase de interrogatorio no amerita un esfuerzo adicional. Tambin se cuestiona el valor de los dibujos realizados con colores (Killian, 1987). La Tcnica Proyectiva del Dibujo de casa-rbol-persona tiene en mucho la misma herencia que la Prueba del Dibujo de la Figura Humana. Como la Prueba DFH, la HT-P se concibi en un principio como una medida de inteligencia, completa con un sistema de calificacin cuantitativa para estimar un nivel aproximado de capacidad (Buck, 1948). Sin embargo, los clnicos pronto abandonaron el empleo de la H-T-P corno medida de inteligencia y ahora se le utiliza casi de manera exclusiva como medida proyectiva de la personalidad. Aunque no se ahondar en los detalles, la interpretacin de la H-T-P depende de tres suposiciones generales: el dibujo de la Casa refleja la vida hogarea y las relaciones intrafamiliares de la persona examinada, el del rbol refleja la manera en que el individuo experimenta el ambiente y el de la Persona hace eco de sus relaciones interpersonales. Buck (1981) proporciona numerosas hiptesis

162

interpretativas tanto para los aspectos cuantitativos como cualitativos de los tres dibujos. La H-T-P es una atractiva prueba que ha fascinado a los clnicos por ms de 40 aos. Por desgracia, Buck (1948, 1981) nunca ha proporcionado algn tipo de evidencia que sustente la confiabilidad o validez de este instrumento. De hecho, quizs l mismo es su peor crtico. En cierto punto dentro de su manual de la prueba, incluso llega a afirmar que la investigacin sobre validacin no es posible con la H-T-P (Buck, 1981, p. 164). Entre los impedimentos para dicha investigacin cita los siguientes elementos: 1. Ningn signo en s mismo es indicacin infalible de alguna fortaleza o debilidad en el individuo. 2. Ningn signo en la H-T-P tiene un solo significado. 3. La importancia de un signo puede diferir notablemente de una constelacin a otra. 4. La cantidad de datos diagnsticos y pronsticos que pueden obtenerse de cada uno de los puntos de anlisis puede variar en gran medida de una persona a otra. 5. Los colores no tienen algn significado absoluto y universal. 6. Ninguno de los elementos del sistema de calificacin cuantitativa puede tomarse automticamente por su valor aparente

Captulo 6. Pruebas de Inteligencia y otras pruebas de las funciones cognitivas En la medicin de estas capacidades con test de inteligencia nos encontramos con un gran problema derivado del hecho de que la expresin de las mismas est muy influenciada por el momento en que se realizan. El cansancio, el estado de humor y otros mltiples factores pueden afectar significativamente su expresin de un da a otro o entre el comienzo y el final de un mismo da. El segundo gran problema es que cada medicin concreta utiliza un test de

163

inteligencia especfico y particular y que los resultados pueden variar en gran medida en funcin de si el individuo ha realizado un test de inteligencia similar en el pasado o por la mayor o menor simpata o afinidad cultural con el mismo, aunque si est bien diseados este aspecto debera ser bastante reducido. Una conclusin sencilla sera el pensar que estas capacidades no son estables a lo largo de la vida y que se encuentran muy influenciadas por el medio ambiente. Sin embargo, algunos expertos opinan que existe una gran estabilidad de las capacidades a lo largo de la vida, especialmente a partir de los 6 aos. Por su parte, el lenguaje, como expresin del inconsciente colectivo, claramente opina que la inteligencia es una cualidad fija puesto que utiliza el verbo ser y no el verbo estar en expresiones como "Esa persona es muy inteligente". Para ilustrar la relacin entre el desarrollo de la comprensin de la inteligencia y la medicin psicolgica, ilustraremos la temtica a partir de la prueba WISC-R

164

Leccin 26. WISC - R, escala de inteligencia de Wechsler para nios - revisada

CARACTERSTICAS

Versin revisada, modificada y actualizada del WISC. El WISC-R mantiene un gran nmero de elementos del WISC tradicional, sustituyendo o eliminando los que resultaban obsoletos y aadiendo otros, en ciertas pruebas, para aumentar su fiabilidad; se ha modificado el orden de aplicacin a fin de que sea ms ameno para el nio.

Algunas pruebas amplan sus instrucciones con nuevos ejemplos, evitando as posibles ambigedades y garantizando que el nio comprenda la naturaleza de la tarea que ha de realizar.

Aplicacin: Individual.

Tiempo: Aproximadamente 1 hora y 30 minutos. Edad: De 6 a 16 aos.

Juego completo con 25 cuadernos de anotacin y material manipulativo. En la escala del WISC-R se incluyen las siguientes pruebas: Escala verbal: Informacin. Semejanzas. Aritmtica. Escala de ejecucin: Figuras Incompletas. Ordenacin de Dibujos. Diseos con Cubos.

165

Comprensin.

Composicin de Objetos

Un buen ejemplo de su uso lo encontrar en el artculo anexo: Estructura factorial de la Escala de Inteligencia para Nios de Wechsler-Revisada (WISC-R). Un acercamiento desde el mbito clnico (http://www.cop.es/delegaci/andocci/VOL.%2019_3_6.pdf)

166

Leccin 27. MEDICIN RPIDA DE HABILIDAD INTELECTUAL - BARSIT


INTRODUCCIN Con el BARSIT se obtiene rpidamente un ndice de la aptitud para aprender, mediante la valorizacin de factores de inteligencia verbal y razonamiento numrico, haciendo tambin intervenir elementos cognoscitivos lgico-verbales y de informacin general. El BARSIT es una prueba que puede emplearse colectivamente y utiliza material impreso (papel y lpiz). Es de fcil aplicacin y se recomienda como prueba inicial. El BARSIT tiene un doble uso: a. Para escolares a partir de la terminacin del 3er. Grado (Psicologa Educativa) b. Para adultos con educacin primaria (Psicologa del Trabajo y Educativa) Propsitos 1. Determinar rpidamente el nivel de inteligencia o aptitud para aprender. 2. Comparar la composicin de grupos. Si se usa con este fin, se obtiene una apreciacin de la distribucin del grupo y se puede comparar la composicin de dicho grupo con sus afines. 3. Seleccionar previamente casos excepcionales. Al aplicar el BARSIT a grupos, se pueden escoger los individuos que hayan alcanzado resultados superiores o inferiores para el estudio detallado de tales casos extremos - supra o subnormales - y aplicarles reactivos adecuados. 4. Adaptabilidad del sujeto. El BARSIT como prueba inicial sirve de adiestramiento para aquellos individuos que no hayan tenido anteriormente ocasin de realizar pruebas o tests. Este primer contacto con una prueba, relativamente sencilla, establece una "empatia" entre el sujeto y las sucesivas pruebas, y los resultados sern orientadores para determinar la aplicacin de otros tests. Descripcin de la prueba La prueba est impresa en un pliego de cuatro pginas y a dos colores: negro y azul. La primera pgina contiene los datos de identificacin del sujeto, las instrucciones y diez ejemplos que deben ser resueltos con la ayuda del examinador. En las tres pginas restantes figuran sesenta tems o cuestiones escalonadas experimentalmente con arreglo a la dificultad intrnseca1 que presentan y mezclan progresivamente los cinco tipos de preguntas o reactivos que se van formulando: 1. Informacin o conocimientos generales. 2. Comprensin de vocabulario mediante el conocimiento de opuestos. 3. Razonamiento verbal, discriminando la palabra que expresa un concepto diferente a otras cuatro que mantienen entre s una semejanza de categora. 4. Razonamiento lgico mediante la asociacin a un elemento dado del anlogo, de acuerdo con otra

167

asociacin conocida. 5. Razonamiento numrico mediante series de nmeros que deben completarse, una vez deducida la regla que rige a cada serie. A excepcin de las series numricas, los otros cuatro tipos de preguntas se formulan por el sistema de seleccin mltiple. En este caso el sujeto no debe escribir ninguna palabra, limitndose a subrayar la respuesta seleccionada como adecuada a la cuestin que se le presenta. APLICACIN Y CALIFICACIN Instrucciones previas a la aplicacin de la prueba 1 El examinador debe tener un conocimiento cabal de la prueba y debe haberse familiarizado con las instrucciones de este Manual antes de aplicarla por primera vez. 2 No es necesaria una especial preparacin psicolgica para aplicar el BARSIT, pero el examinador debe poseer las condiciones necesarias para dirigir el grupo. 3 Los sujetos que vayan a efectuar el test deben poder trabajar en condiciones favorables: saln apropiado con mesas adecuadas (distanciadas para evitar copias), buena iluminacin y ventilacin. 4 Deben disponer de lpices y ejemplares impresos del BARSIT, uno para cada sujeto; adems de algunos lpices de reserva para utilizarlos en casos de emergencia. 5 Un solo examinador difcilmente podr atender grupos mayores de veinticinco examinandos. En caso de tener que aplicar en una sesin la prueba a un grupo numeroso - disponindose de local amplio y adecuado - el examinador debe obtener la colaboracin de auxiliares. 6 Los auxiliares deben haber sido previamente instruidos. Sus funciones sern: distribuir y recoger los ejemplares, evitar copias, y hacer que los examinandos sigan estrictamente las instrucciones de la parte de la prueba que estn efectuando. En el caso de producirse alguna rotura de la punta de un lpiz, el auxiliar deber suministrar inmediatamente otro (nunca debe emplearse tiempo en sacar una nueva punta). En ningn caso los auxiliares intervendrn positiva o negativamente en los trabajos de los que efectan la prueba. No deben ni siquiera comprobar cmo son los resultados, abstenindose de todo acto o movimiento de aprobacin o desaprobacin. El sujeto no debe sentirse cohibido por esta comprobacin, ni tampoco estimulado.

Cmo debe aplicarse el BARSIT


Una vez que estn convenientemente sentados los examinandos se proceder a entregar a cada uno un lpiz y un ejemplar de la prueba. Cuando se distribuyan los formularios se colocarn stos delante del individuo, de manera que tengan a la vista solamente la pgina en donde aparecen las instrucciones. Al efectuar dicha distribucin, nunca deben ser colocadas las hojas al revs. El examinador debe explicar brevemente lo que se espera, diciendo: "Ustedes van a realizar una prueba sencilla y muchas de las cuestiones que se les preguntan son bastante fciles. Deben procurar

168

responder el mayor nmero posible de cuestiones para demostrar la cantidad de trabajo que son capaces de hacer en poco tiempo". (Cuando los examinandos tengan instruccin superior a la primaria, podrn abreviarse las siguientes instrucciones. Despus de la lectura que ellos mismos hayan hecho, el examinador se limitar a cerciorarse de que han sido comprendidas las instrucciones.) Para comenzar dir: "Escriban con letra clara sus apellidos y sus nombres dentro del cuadro que hay en la parte superior de la pgina que tienen a la vista, despus la edad y la fecha del da en que se efecta la prueba". Terminados de anotar estos datos, el aplicador de la prueba leer en voz alta las instrucciones que figuran en la primera pgina al mismo tiempo que lo hacen por su cuenta los sujetos que realizan la prueba. Es conveniente que el aplicador lea en forma muy clara y no pase a una cuestin nueva sin asegurarse que todos estn siguiendo y comprendiendo lo que se est leyndoles. Al terminar de leer cada uno de los ejemplos, debe preguntar a alguno de los que se examinan, para que ste d la respuesta y explique qu debe hacerse. De todos modos, el examinador debe dictar la respuesta correcta. Es conveniente insistir hasta estar seguro de que las instrucciones, y especialmente la forma en que deben ir poniendo las soluciones, han sido bien comprendidas. El aplicador de la prueba les dir: "No deben escribir ninguna palabra, y solamente subrayar una de las cinco palabras que se encuentran despus de la pregunta y que sea la que mejor conteste a ella". (Cuando sea necesario, explicar que subrayar quiere decir poner una raya por debajo.) Al llegar a los ejemplos 5 y 10, les dir: "Cuando ustedes encuentren series de nmeros como stas, deben tratar de encontrar cules son los dos nmeros que faltan y escribirlos en los espacios punteados". Si las series han sido ledas con cierta entonacin, haciendo una marcada pausa al llegar a los espacios punteados, el sujeto descubrir fcilmente los nmeros que faltan. En el caso de que no lo comprenda, se le ayudar dndole las explicaciones necesarias. Despus les repetir: "Cuando encuentren series de nmeros deben escribir los dos nmeros que faltan para llenar los espacios punteados".

Es necesario comprobar que todos han comprendido bien estas instrucciones y han resuelto los diez ejemplos correctamente.

169

Por ltimo el aplicador leer las seis lneas que figuran al pie de la pgina en donde se les recomienda que trabajen con rapidez, pero que procuren no cometer errores y que no se distraigan mirando lo que hacen los dems. Se les preguntar si tienen alguna duda, y en el caso de que alguien formule alguna pregunta, sta ser aclarada, pero una vez dada la orden de comenzar no deben darse nuevas explicaciones. Antes de dar la orden de que pueden empezar les dir: "Van a disponer de diez minutos para contestar el mayor nmero de preguntas posible"."Hay tres pginas por llenar y deben trabajar sin distraerse". Llegado este momento se procurar atraer la atencin de todos y se dar la orden: "Vuelvan la pgina. Comiencen por la pgina dos y contesten las cuestiones que all encuentren! "No se entretengan! Empiecen!

Tiempo de ejecucin
Se otorgan diez minutos. El tiempo se comienza a contar a partir del momento de dar la orden: "Empiecen", o sea despus de finalizadas las instrucciones de la primera pgina. Transcurridos exactamente diez minutos despus de dada la orden de "empiecen", se dir "ALTO! Dejen los lpices de encima de la mesa", y el aplicador, ayudado por los auxiliares, recoger las pruebas. Esta operacin de recoger los formularios debe hacerse muy rpidamente.

Calificacin
Para calificar el BARSIT, se revisarn las contestaciones dadas, de acuerdo con la clave de correccin, y a cada cuestin bien resuelta se otorga un punto. (En la parte superior de la clave, encima de cada columna de respuestas se destaca un nmero que corresponde a la pgina del test. Si se hacen coincidir ambos nmeros, la operacin de corregir las pruebas es sumamente fcil.) Se considera la respuesta como incorrecta si se ha subrayado ms de una palabra, y si en las series numricas solamente aparece bien uno de los dos nmeros que se deben escribir, tambin se conceptuar como incorrecta. Una vez calificada la prueba se anotarn los puntos obtenidos en la casilla correspondiente de la primera pgina, y se le asignar la centila que le pertenece, de acuerdo con la Tabla de normotipos.

INTERPRETACIN Y DATOS ESTADSTICOS


Cmo han sido obtenidos los normotipos Con el BARSIT se han realizado aplicaciones en Argentina, Colombia, Uruguay y Venezuela, y actualmente se estn efectuando nuevos experimentos en otras repblicas americanas. Las tablas que figuran en esta primera edicin del manual corresponden a los resultados obtenidos con sujetos venezolanos. Para establecer las normas correspondientes a los escolares, se acumularon por separado las puntuaciones alcanzadas por estudiantes de diferentes regiones del pas (varones y nias), que hubieren cursado o estuvieren terminando tercero, cuarto, quinto o sexto grado de instruccin primaria. (La educacin primaria en Venezuela alcanza hasta el 6

170

grado.) Se ha excluido intencionalmente los datos de escolares de edades anormales en relacin con el grado. Patrocinaron las investigaciones el Laboratorio de Psicologa Aplicada (Psicotecnia) de la Escuela Normal M.A.C.; los servicios de Psicologa Aplicada de los Liceos "Fermn Toro" y "Aplicacin"; la Seccin de Psicopedagoga del Instituto Pedaggico, y el Instituto de Psicologa y Psicologa Aplicada (Psicotecnia) de la Facultad de Filosofa y Letras de la Universidad Central de Venezuela. Todas las aplicaciones del BARSIT se llevaron a cabo durante el primero o ltimo mes de cada ao escolar, dirigidas por el propio autor, y realizadas con la colaboracin de estudiantes seleccionados de los cursos de Mediciones y evaluacin psicopedaggica. Para establecer las normas de personas adultas, representativas de la poblacin trabajadora venezolana, se han reunido las puntuaciones de individuos comprendidos entre las edades de veinte a treinta aos. Se han distribuido en tres grupos de acuerdo con el nivel de instruccin: 1. Primaria completa (sexto grado) 2. Casi completa (cuarto o quinto grados) 3. Incompleta (hasta tercer grado) Los datos proceden de diferentes regiones del pas, y han sido facilitados por diversas industrias que han adoptado el BARSIT como prueba preliminar de preempleo o para fines de entrenamiento, y en proporcin muy considerable por los servicios de seleccin que dirige el Dr. Pedro Snchez Landaeta. Cmo usar los normotipos El generalizado sistema de las centilas o rangos percentilares se utiliza en los normotipos venezolanos (en este Manual se publican los revisados en Diciembre de 1956, vase Cuadro n 1). Del mismo modo que cuartila o decila expresa un valor estadstico que indica cuartas partes o dcimas partes del total de un grupo, la centila seala las centsimas partes del grupo a que nos referimos. Una centila siempre indica la porcin que est por debajo, por lo cual puede utilizarse como una medida de ordenacin o posicin. As por ejemplo, a un adulto con instruccin primaria completa, que haya obtenido 42 puntos con el BARSIT, de acuerdo con los normotipos le corresponde la centila 66. Este valor significa que si comparamos dicha puntuacin con los resultados de adultos de su mismo nivel, 66% de individuos quedan igual o por debajo de l, y por tanto solamente 34% pueden alcanzar una puntuacin superior a la que l ha obtenido. Otro ejemplo: A un escolar de 12 aos, que haya cursado el 5 grado y solamente conteste bien 30 cuestiones o tems del BARSIT, de acuerdo con las Escalas de los normotipos de 5 grado, a 30 puntos le corresponde la centila 10. Comparndose esta puntuacin con lo que es normal en su grupo, solamente 10% de escolares de su mismo nivel de instruccin obtienen resultados iguales o inferiores, y por tanto cabe esperar que 90% alcancen resultados superiores a 30 puntos.

Cuadro 1
Test rpido Barranquilla - normotipos
CENTILAS

venezolanos
CENTILAS

171

PUNTOS

Escolares de nueve

a catorce
TERCERO

Trabajadores adultos de 20 a
CON INSTRUCCIN PRIMARIA DE 6 GRADO
99 98 97 96 99

30 aos

PUNTOS

aos GRADOS
SEXTO
60 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 3433 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
'

QUINTO

CUARTO

5 0 4

o MENOS
90 59 58 57 56 55 54 53 52 51 50 49 48 47 46 45 98 97 96 95 94 93 92 91 89 87 85 82 80 77 74 71 69 65 62 58 54 51 48 45 41 37 34 31 28 25 22 19 17 15 13 11 9 2 1 8 7 6 5 4 650 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

99 98 97 95 93 91 87 82 75 69 61 54 46 39 31 25 19 13 9 7 5 3 2 1

9 o 10a

95 94 93 91 89 87 85 82 80 76

98 97 96 95 94 92 91 89 88 86 84 82 80 77 74 71 69 65 62 59 55 52 48 45 42 39 35 32 29 26 23 20 18 16 14 12 10 9 8 7 6 5 4 3

99 98 96 95 92 89 85 81 74 68 61 53 47 39 32 25 20 15 10 8 5 4 2 1

99 98 97 96 95 93 91 88 85 81 76 71 65 60 54 48 42 37 31 26 21 17 13 10 8 6 4 3 2 1 99

99

98 97 96 95 94 93 91 89 87 84 81 78 75 71 67 63 59 55 50 45 41 37 33 29 25 21 19 16 13 11 9

73 70 66 62 58 54 50 46 42 38 34 30 27 23 20 17 15 12 10 9 7 6 5 4 3 2 1

12-14a 11-13a

7 6 5 4 3 2

<N

1012
498 309 387

N de casos Media Desviacin

316 23.0 9.2

930

997

N de casos Media Desviacin

40.4
5.2

36.5
5.4

31.4
6.8

38.0
9.9

29.4 11.9

20.6 11.4

172

Cmo interpretar los resultados cualitativamente Cuando se desee una rpida interpretacin cualitativa de los puntos obtenidos con el BARSIT, basada en cinco categoras: Excelente, Superior, Mediano, Inferior y Muy inferior, de acuerdo con el nivel de instruccin, se puede usar la escala valorativa, segn el Cuadro n 2.

Cuadro 2 Interpretacin cualitativa segn la puntuacin obtenida con el BARSIT


MUY INFERIOR 10%

INFERIOR 20%

MEDIANO 40%

SUPERIOR 20% de 44 a 46 de 40 a 43 de 35 a 39 de 28 a 34

EXCELENTE 10%

ESCOLARES Sexto grado Quinto grado Cuarto grado Tercer grado

hasta 34 hasta 30 hasta 23 hasta 11

de 35 a 37 de 31 a 33 de 24 a 27 de 12a 18

de 38 a 43 de 34 a 39 de 28 a 34 de 19 a 27

ms de 46 ms de 43 ms de 39 ms de 34

Sexto grado 4 o 5 grado Hasta Ser. grado

hasta 26 hasta 15 hasta 6

de 27 a 33 de 16 a 23 de 7 a 14

de 34 a 43 de 24 a 35 de 15 a 26

de 44 a 50 de 36 a 44 de 27 a 34

ms de 50 ms de 44 ms de 34

Validez
Conseguimos puntuaciones de calificaciones escolares. Con ello intentbamos obtener criterios externos que nos permitieran calcular el grado de conexin entre los rendimientos de la prueba y las notas escolares. Al lado de resultados alentadores: r - + 716; otros eran de r = + .446. El diagrama n 1 muestra la relacin que existe entre el xito en los estudios y las puntuaciones del BARSIT. (Datos procedentes del Colegio San Jos, Barranquilla, noviembre 1944, cuarto ao, B. N = 26, X = 31, DE = 6.8)

Ms estudios de validez
Los alumnos del curso de Mediciones y evaluacin del Instituto Pedaggico Nacional (Cursos para Directores, 1947-48), recopilaron nuevos datos de los resultados del BARSIT y las calificaciones escolares^alcanzadas por los estudiantes de los terceros grados de las Escuelas Pblicas de Caracas. Se tomaron 267 muestras (X = 23, DE = 9). El coeficiente de validez que se obtuvo fue de + .457.

Confiabilidad
Un primer intento para calcular coeficientes de confiabilidad se llev a cabo repitiendo la aplicacin de la prueba al mismo grupo, transcurridas unas semanas de la primera aplicacin, y el resultado de este coeficiente de constancia fue de r = + .91. (Liceo de Aplicacin, Caracas, octubrenoviembre de 1948.) La falta de otras pruebas tipificadas no nos permiti calcular co eficientes de equivalencia.

173

INFORMACIN COMPLEMENTARIA ACERCA DEL BARSIT


Es comn en los manuales de pruebas ofrecer las referencias necesarias de la informacin bibliogrfica. En esta edicin tenemos que suplir la falta de trabajos publicados sobre el BARSIT, por el acopio de datos que han quedado inditos. La bibliografa sobre pruebas en espaol es relativamente escasa. Tenemos conocimiento de trabajos cientficos llevados a cabo en Argentina, Colombia, Costa Rica, Cuba, Chile, Ecuador, Espaa, Guatemala, Mxico, Panam, Per, Puerto Rico, Uruguay y Venezuela. Pero la falta de comunicacin entre los profesionales y la poca difusin de las ediciones circunscribe la aplicacin de los resultados y la utilizacin de los mismos.

Historia del BARSIT


En el ao 1940, en Barranquilla, Colombia se cre un Instituto de Psicologa Aplicada (Instituto Psicotcnico), como ampliacin del Laboratorio de Psicologa Experimental del Colegio de Barranquilla, "destinado a la investigacin y estudio, desde el punto de vista del rendimiento y bienestar de los alumnos. . . tendiendo a determinar el nivel mental, y tipo predominante de su inteligencia. . ." (Revista del Museo del Atlntico, Publicacin Bimestral, Director Julio Enrique Blanco, Barranquilla, Repblica de Colombia, Nmero preliminar octubre de 1941. Durante ms de un lustro se recopilaron datos que pudieran ser utilizados para la fijacin de estndares o normotipos. Fruto de ello es el "Informe de la labor realizada durante los aos 1940, 1941, 1942, 1943 y 1944 por Francisco del Olmo Barrios", (Suplemento a los Nos. 8 y 9 de la Revista del Museo del Atlntico, marzo de 1945), y (Franziska Baumgarten: "Progress of Psychotechnique" I. 1939-1945 Bern. - La Psychotechnique en Colombie, por Mercedes Rodrigo, pgina 115). Entre las 32 pruebas adoptadas por el Instituto de Barranquilla (pgina 46, del informe citado), se experiment el "Rapid Survey Intelligence Test" de Rudolf Pintner, previamente traducido con autorizacin personal del autor. Los resultados de ese experimento demostraron que no se poda utilizar en nuestro medio. Surgan marcadas dificultades, especialmente en cuanto a la adaptacin a los lmites de tiempo para efectuar los diferentes tipos de ejercicios. El tiempo de tres minutos para cada una de las cuatro partes de que consta la prueba result demasiado breve para los sujetos examinados, ya que no estaban habituados a realizar pruebas calculadas para tiempos cortos. Adems presenta un segundo inconveniente a los aplicadores de las pruebas, pues las instrucciones se deben impartir por separado, pgina por pgina, siendo esto un obstculo al tener que mantener una estrecha vigilancia para evitar que se intente comenzar a resolver partes del test mientras se dan las instrucciones. Durante los aos 1943 y 1944, se estudi una nueva prueba que llenara un cometido similar a la del Dr. Pintner, pero evitando los inconvenientes de los tiempos parciales. Se crearon nuevos tems para medir el vocabulario, el razonamiento verbal y otros para el razonamiento lgico; para medir el razonamiento numrico se organizaron series adecuadas, y adems se introdujeron nuevos tems de informacin general, factor que ha demostrado su validez en pruebas de otros autores (Terman, Wechsler, etctera). Terminadas las experiencias en 1945 se trataron estadsticamente los resultados. Se haban examinado los siguientes escolares: De 13 aos: 1003; de 12 aos: 462; de 11 aos: 338; de 10 aos: 252; de 9 aos: 108. Calculados los resultados con esta muestra de 951 varones y 1202 nias que estaban terminando el ao escolar en escuelas oficiales y colegios privados, se obtuvieron los siguientes datos: Segundo ao N = 565 X= 19 46 DE = 8.37 T er cer ao N = 7 8 5 X = 28 99 DE = 7 .57 C u a r t o a o N = 8 0 3 X = 3 4 2 1 D E = 6 . 6 7 (La instruccin primaria en Colombia finalizaba en esa poca al 4 ao.)

174

Cuestionario AHORA EMPIEZAN A CONTAR LOS DIEZ MINUTOS


1. El queso se fabrica de:

las flores,

la harina,

la leche,

las uvas,

el azcar

2. Lo contrario de abierto es:

liso,

cerrado,

delante,

claro,

despejado

3. De estas cinco palabras una pertenece a una clase diferente. Cul es ?

rojo,

amarillo,

morado,

bandera,

verde

4. El pjaro canta, y el perro: habla, rebuzna, cacarea, maulla, ladra

5. Escriba los dos nmeros que faltan a esta serie:

10

15

20

25

35

40

45

55

6. Para medir la temperatura se emplea el:

litro,

gramo,

termmetro,

metro,

kilovatio

7. Lo contrario de dormido es:

noche,

luz,

amanecer,

despierto,

claridad

8. De estas cinco palabras una pertenece a una clase diferente. Cul es?

agua,

platino,

caf",

t,

cerveza

9. El zapato protege al pie, y el sombrero protege a:

la cabeza,

la mano,

el dedo,

el brazo,

la rodilla

10. Escriba los dos nmeros que faltan a esta serie:

175

12

..........

18

21

24

............

30

11. El tringulo es una figura formada por:

4 lados,

6 lados,

5 lados,

3 lados,

9 lados

12. Lo contrario de negro es:

oscuro,

sombra,

opaco,

sucio,

blanco

13. De estas cinco palabras una pertenece a una clase diferente. Cul es ?

Pedro,

Enrique,

Ana,

Jos,

Carlos

14. El naranjo es un rbol, y el perro es:

un objeto,

un animal,

una cosa,

un mineral,

un vegetal

15. Escriba los dos nmeros que faltan a esta serie:

11

13

............

17 .............

21

23

16. El gato es un: insecto, mamfero, ave, pez, reptil

17. Lo contrario de triste es:

alegre,

preocupado,

dolorido,

desgraciado,

enfermo

18. De estas cinco palabras una pertenece a una clase diferente. Cul es?

Bogot,

Lima,

Alpes,

Caracas,

Quito

19. La piel cubre al hombre, y las plumas cubren a:

la vaca,

el perro,

el gato,

la gallina,

el caballo

20. Escriba los dos nmeros que faltan a esta serie:

14

21

28

42

49

63

70

176

21. Treinta es el triple de:

quince,

tres,

diez,

doce,

cinco

22. Lo contrario de calor es:

sudor,

fatiga,

blanco,

fro,

luz

23. De estas cinco palabras una pertenece a una clase diferente. Cul es?

cuchara,

plato,

tenedor,

cuchillo,

cucharita

24. Para coser se emplea la aguja, y para dibujar se emplea el:

lpiz,

bastn,

tintero,

pie,

ojo

25. Escriba los dos nmeros que faltan a esta serie:

40

36

32

28

20

16

12

26. La Cordillera de los Andes est en: Europa, Asia, Amrica, Australia, frica

27. Lo contrario de arriba es:

dentro,

abajo,

cerca,

completo,

lejos

28. De estas cinco palabras una pertenece a una clase diferente. Cul es?

General,

Teniente,

Capitn,

Presidente,

Coronel

29. Con el cuero se fabrica el calzado, y con la tela:

piel,

lana,

algodn,

seda,

vestidos

30. Escriba los dos nmeros que faltan a esta serie:

64

58

52

46

..........

34

28

...........

16

10

31. Roma es la capital de:

Nicaragua,

Espaa,

Grecia,

Italia,

Paraguay

177

32. Lo contrario de s es:

antes,

afirmar,

duda,

luego,

no

33. De estas cinco palabras una pertenece a una clase diferente. Cul es?

vaso,

copa,

agua,

jarra,

taza

34. La nariz sirve para oler, y los ojos sirven para:

or,

ver,

gustar,

tocar,

andar

35. Escriba los dos nmeros que faltan a esta serie:

10

20

80

160

640

1280

36. El idioma oficial de Hait es el:

ingls,

francs,

espaol,

holands,

portugus

37. Lo contrario de despacio es:

de prisa,

lento,

pausado,

dbil,

grueso

38. De estas cinco palabras una pertenece a una clase diferente. Cul es?

carpintero,

herrero,

mdico,

albail,

zapatero

39. Al lunes sigue el martes, y a enero sigue: junio, viernes, mes, febrero, ao

40. Escriba los dos nmeros que faltan a esta serie:

16

32

128

256

41. Fernando de Magallanes fue un famoso: militar, aviador, navegante, sabio, sacerdote

178

42. Lo contarlo de blando es: suave, duro, liso, grueso, dbil

43. De estas cinco palabras una pertenece a una clase diferente. Cul es? ver, or, oler, andar, gustar

44. El codo articula el brazo, y la rodilla articula: el corazn, los dedos, los pulmones, el cerebro, la pierna

45. Escriba los dos nmeros que faltan a esta serie: 5 6 8 11 15 20 33 41 60

46. Cristbal Coln descubri Amrica en el: siglo XIII, siglo XVII, siglo IV, siglo XV, siglo XIV

47. Lo contarlo de fuera es: libre, lejos, distinto, malo, dentro

48. De estas cinco palabras una pertenece a una clase diferente. Cul es? Venus, Jpiter, Satlite, Urano, Neptuno

49. Octubre es anterior a noviembre, y jueves es anterior a: diciembre, viernes, septiembre, mircoles, da

50. Escriba los dos nmeros que faltan a esta serie: 90 80 71 63 50 45 ..................... 38 36 35

51. Los primeros ferrocarriles empezaron a funcionar hacia: 1900, 1800, 1825, 1750, 1710

52. Lo contarlo de empezar es: iniciar, adelantar, obstruir, terminar, buscar

179

53. De estas cinco palabras una pertenece a una clase diferente. Cul es? feliz, triste, satisfecho, alegre, contento

54. La paz viene despus de la guerra, y la calma viene despus de: la tormenta, el crepsculo, el bienestar, la felicidad, el ocaso

55. Escriba los dos nmeros que faltan a esta serie: 120 100 82 66 40 30 ...................... 16 12 10

56. La bitcora es de uso indispensable en: msica, biologa, navegacin, teatro, qumica

57. Lo contarlo de homogneo es: compacto, heterogneo, abstracto, sutil, neutro

58. De estas cinco palabras una pertenece a una clase diferente. Cul es? Stravinski, Bach, Mozart, Newton, Chopin

59. La biblioteca es para guardar libros, y la pinacoteca para guardar: peridicos, discos, pelculas, monedas, cuadros

60. Escriba los dos nmeros que faltan a esta serie: 6561 2187 729 81 9 3

180

Leccin 28. Test de aptitudes diferenciales (DAT) El DAT se public inicialmente en 1947 para proporcionar una base paia la orientacin educativa y vocacional de los alumnos de bachillerato. Despus, los examinadores encontraron que esta prueba es til en la orientacin vocacional de jvenes adultos que se encuentran fuera de la escuela y en la seleccin de empleados. La paieba ha tenido revisiones peridicas y es una de las bateras de prueba de aptitudes mltiples ms popular de todos los tiempos (Bennett, Seashore y Wesman, 1982, 1984). Razonamiento Verbal (RV), Razonamiento Numrico (RN), Razonamiento Abstracto (RA), Velocidad y Precisin Perceptual (VPP), Razonamiento Mecnico (RM), Relaciones Espaciales (RE), Ortografa (O), Uso del lenguaje (UL). Los autores eligieron las reas para las ocho pruebas con base en datos experimentales y experienciales, ms que en un anlisis factorial formal realizado por ellos mismos. En la construccin del DAT, los autores se guiaron por varios criterios explcitos: Cada prueba debe ser independiente: existen situaciones en las que se requiere o se desea slo una parte de la batera. Las pruebas deben medir poder: para la mayor parte de los propsitos vocacionales a los que contribuyen los resultados de una prueba, la evaluacin del poder resolver problemas difciles en el tiempo adecuado es de inters primordial. La batera de prueba debe producir un perfil: las ocho calificaciones independientes puede convertirse en rangos percentiles y representarse en una grfica comn de perfil. Las normas deben ser adecuadas: en la quinta edicin, las normas se obtuvieron de 100 000 estudiantes para la estandarizacin de otoo y 70 000 para la de primavera. Los materiales de prueba deben ser prcticos: con lmites de tiempo de 6 a 30 minutos por prueba, el DAT completo puede aplicarse en una sesin escolar

181

matutina o vespertina. Las pruebas deberan ser fciles de aplicar: cada una contiene excelentes ejemplos de "calentamiento" y las pueden aplicar personas con un mnimo de entrenamiento especial. Deben estar disponibles formas alternas: con propsitos de repeticin de prueba, la disponibilidad de formas alternas (en la actualidad formas C y D) reducir cualesquier efecto de la prctica. La confiabilidad del DAT es, por lo general, bastante alta, con coeficientes por mitades que en gran medida se localizan en el rango de .90 y confiabilidades de formas alternas que se encuentran en el rango de .73 a .90, con mediana de .83. Razonamiento mecnico es una excepcin, con confiabilidades tan bajas como .70 en el caso de las nias. Las pruebas muestran un patrn mixto de intercorrelaciones, que los autores interpretan de manera optimista como una confirmacin de la independencia de las ocho pruebas. En realidad, muchas de las correlaciones son bastante altas y parece probable que las ocho pruebas reflejen un menor nmero de factores de capacidad. Con toda seguridad, las pruebas de Razonamiento Verbal y Capacidad numrica miden un solo factor slido, con correlaciones alrededor de .70 en diversas muestras. El manual presenta amplios datos que demuestran que las pruebas del DAT, en especial la combinacin RV + RN, constituyen buenos medios de prediccin de las calificaciones en educacin media superior y universidad (correlaciones en los rangos de .60 y .70). Por tal razn, la combinacin de RV + RN se considera con frecuencia como un ndice de la aptitud escolar. La evidencia de a validez diferencial de las otras pruebas es bastante limitada. Aun as, el DAT revisado es mejor que las ediciones anteriores. Una mejora importante es la eliminacin del aparente sesgo de gnero en las pruebas de Uso del Lenguaje y Razonamiento Mecnico una fuente de crticas en ediciones anteriores. Los editores de la Quinta Edicin llevaron a cabo un cuidadoso estudio sobre sesgo de gnero, raza, tnico y regional, a fin de eliminar los reactivos que podran ser estereotpicos u ofensivos para subgrupos identificables. Lo que es ms, realizaron anlisis estadsticos complejos para eliminar reactivos de

182

dificultad desigual entre subgrupos raciales equiparados en trminos de desempeo general.

Ejemplo de reactivo
RELACIONES ESPACIALES

Cul de las figuras de la derecha se puede hacer al doblar el patrn a la izquierda? El patrn siempre representa la parte externa de la figura.

Leccin 29. Test guestaltico visomotor de Bender Ms all de cualquier duda, la prueba de dibujo de ms amplia utilizacin es el Test Guestllico Visomotor, conocido de manera ms comn como Prueba Gestalt de Bender (BGT, Bender, 1938). La BGT consta de nueve figuras estmulo (figura 9-9); se instruye a la persona evaluada para que copie cada figura en una hoja de papel en blanco. Se dice al examinando que la BGT: "... no es una prueba de capacidad artstica, pero intente copiar el dibujo lo ms precisamente posible. Trabaje con la rapidez o lentitud que usted desee" (Huit, 1977). Se han diseado vanos sistemas de calificacin para determinar si el desempeo de una' persona es el ms comn en individuos con dao' cerebral o sin l (Hain, 1964; Hutt y Briskin, ' 1960; Lacks, 1999; Pascal y Suttell, 1951;" Pauker, 1976). En el caso de adultos, el mejor de estos enfoques de calificacin se encuentra en Lacks (1999). Esta autora identific 12 signos cualitativos que se califican segn presencia contra ausencia en el protocolo completo. La presencia de cualesquiera de los cinco signos indica dao cerebral (cuadro 9 -11). Con: base en la confirmacin independiente de otras fuentes de informacin, Lacks resea tasas de' xito de 82 a 86% en una muestra combinada de admisiones a la unidad de tratamiento psi-* quitrico agudo de un centro urbano de salud mental comunitaria (Lacks y Newport, 1980). En Gregory (1999) se analizan diversas variaciones interesantes en la BGT. Grolh-Marnat |;{1990) dedica un captulo completo a este instrumento, incluyendo

183

pautas interpretativas para nios y adultos.

A.

1.

o o o 2 .

o o o

o o o

o o o

o o o

o o o

o o o

o o o

o o o

o o o

3. 4.

Resumen de signos diagnsticos en el Test Guestltico Visomotor


1. Rotacin: la figura se rota de 80 a 180 grados.

2. Dificultad de superposicin: problema para di bujar las partes de una sola figura que debe ran traslaparse. 3. Simplificacin: se simplifica la figura. 4. Fragmentacin: la figura se descompone de tal manera que se pierde la gestalt general. 5. Retrogresin: sustitucin con una forma gestalt ms primitiva que el estmulo. 6. Perseveracin: los aspectos de un estmulo anterior se llevan al estmulo actual. 7. Colisin: dos figuras independientes se super ponen o chocan entre s. 8. Impotencia: numerosas borraduras e incapa cidad para terminar un dibujo a satisfaccin

184

de la propia persona. 9. Dificultad de cierre: dificultad para lograr que se toquen las partes adyacentes de una figura. 10. Falta de coordinacin motora: el temblor es evidente en el dibujo. 11. Dificultad de angulacin: dificultad grave en la reproduccin de los ngulos de los dibujos. 12. Cohesin: disminucin o incremento aislados en tamao de una subparte de un dibujo.
Nota: Se puede contar un decimotercer error si la prueba completa requiere ms de 15 minutos. Fuente: Basado en Lacks, P (1999). Bender-Gestalt screening forbrain dysfunction (2* edicin). Nueva York: John Wiley.

Leccin 30. Minimental Test

La herramienta de uso ms amplio para el estado mental es el Mini-mental state examination, MMSE (Examen del Estado Minimental), una prueba de deteccin de 5 a 10 minutos que produce un ndice global del funcionamiento cognitivo (Folstein, Folstein y McHugh, 1975; Tornbaugh, McDowell, Kristjansson y Hubley, 1996). La prueba contiene 30 reactivos calificables que tienen que ver con orientacin, memoria inmediata, atencin, clculo, produccin y comprensin del lenguaje y copia de diseos. Los reactivos son tan fciles que la mayora de los adultos normales casi siempre obtienen puntuaciones en el rango de 27 a 30 puntos. La confrabilidad de este sencillo instrumento es excelente. Folstein y colaboradores (1975) informan de una confiabilidad lest-retest a 24 horas de .89 para 22 pacientes con diversos sntomas de depresin. La confiabilidad para un periodo de 28 das con 23 pacientes clnicamente estables con diagnsticos de demencia, depresin y esquizofrenia fue un impresionante .99. Se encuentran disponibles datos normativos que provienen de varias fuentes (p. ej., Lindal y Stefansson, 1993; Tombaugh, McDowell, Kristjansson y Hubley, 1996). Con una puntuacin de corte de 23 o menor como anormal y 24 o mayor como normal, el MMSE tiene cerca de 80 a 90% de precisin en la identificacin de pacientes ancianos de los que se sospecha la presencia de enfermedad de Alzheimer u otros tipos de demencia. Esta puntuacin de corte produce menos

185

falsos positivos (pacientes normales a los que se clasifica dentro del diagnstico de demencia). La sensibilidad del instrumento depende de varios factores, incluyendo la puntuacin de corte utilizada, el nivel educativo de la persona evaluada, el grado de la demencia, la naturaleza de la patologa subyacente y el tipo de entorno en el que se lleva a cabo la evaluacin (Anthony, LeResche, Niaz, Von Korff y Folstein, 1982; Tombaugh, McDowell, Kristjansson y Hubley, 1996; Tsai y Tsuang, 1979). A pesar de sus limitaciones, el MMSE contina siendo la prueba ms confiable y prctica para la deteccin de demencia en ancianos (Ferris, !992). Debring, Van Gorp, Stuck y otros investigadores (1994) recomiendan su empleo como parte de una batera corta de deteccin de la declinacin cognitiva en ancianos. En el cuadro 9-14 se resumen medias adicionales del estado mental geritrico.

186

187

CONCLUSIN Lea y discuta con sus compaeros los aspectos ms importantes del artculo anexo Importancia del Avance en la Investigacin Psicomtrica ubicado en la siguiente direccin electrnica: http://www.salvador.edu.ar/psic/ua1-9pub02-7-01.htm

188

REFERENCIAS USADAS Y BIBLIOGRAFA RECOMENDADA

Anastasi, A. (1968). Psychological testing. New York: MacMillan.

Anastasi, A. y Urbina, S. (1997). Psychological Testing (7 ed.). Englewood Cliffs, NJ: Prentice-Hall.

Arnau, J. (1989). Metodologa de la investigacin y diseo. En J. Arnau y H. Carpintero (Eds.). Historia, teora y mtodo. Madrid: Alhambra Universidad.

Canpintero, H. (1996). Historia de las ideas psicolgicas. Madrid: Pirmide.

Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.

Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston. Gregory, R. (2001). Evaluacin psicolgica: Historia, principios y aplicaciones. Mxico: Manual Moderno Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and applications: An introduction. Applied Psychological Measurement, 6(4), 373-378.

Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, New Jersey: Lawrence Erlbaum Associates.

Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test scores. New York: Addison-Wesley.

Martnez-Arias, R (1995). Psicometra: Teora de los tests psicolgicos y educativos. Madrid: Sntesis.

189

Meli, J.L. (1990). La construccin de la Psicometra coma ciencia terica y aplicada. Valencia: Cristbal Serrano.

Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational measurement. New York: MacMillan.

Muiz, J. (1991). Introduccin a los mtodos psicofsicos. Barcelona: PPU.

Muiz, J. (1998). La teora clsica de los tests. Madrid: Pirmide.

Nunnally, J. C. (1973). Introduccin a la medicin psicolgica. Buenos Aires: Paids.

Rust, J. y Golombok, S. (1989). Modern psychometrics: The science of psychological assessment. London: Routledge.

Thorndike, R. M. (1997). The early history of intellegence testing. En D. P. Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.), Contemporary intelectual assessment, theories, tests and issues, (pp. 3-17). New York: The Guildford Press.

Van der Linden, W. J. (1986). The changing conception of measurement in education and psychology. Applied Psychological Measurement, 10, 325332. Yela, M. (1968). Apuntes de psicometra y estadstica. Madrid: Universidad Complutense de Madrid.

190

http://www.scribd.com/doc/3476657/Evaluacion-Psicologica1-tema-6

http://www.psicoactiva.com/software.htm

También podría gustarte