Está en la página 1de 7

En defensa de la evaluación auténtica

Grant Wiggins

Serie: Textos y Traducciones. No. 3


Textos y Traducciones es una colección editada por Dialoga. Profesionales en educación,
S.C. La colección se compone de ensayos, artículos de revista o capítulos de libros que fue-
ron seleccionados por la calidad de sus aportaciones y por considerarlos de interés para la
reflexión de los maestros y de las personas interesadas en la mejora de la educación. La selec-
ción de los textos se realizó con la intención de aportar elementos para que los lectores pon-
gan en práctica nuevas formas de enseñanza, reflexionen sobre la importancia de su trabajo
para la mejora del aprendizaje de los alumnos y cuenten con nuevas ideas que orienten su
comprensión de las políticas educativas.

Los textos y los autores fueron seleccionados por un consejo académico asesor, quienes eli-
gieron materiales de reciente edición o que fueron publicados en los últimos veinte años.
Generalmente se trata de textos que son de escasa circulación en el país o poco conocidos
en México –pese a la calidad de su contenido y del impacto favorable en la discusión aca-
démica y pedagógica que han tenido en el medio educativo de origen–. La posición de los
autores no necesariamente coincide con el punto de vista de Dialoga.

Este material es gratuito. Se publica sin fines de lucro, sólo en versión electrónica. La traduc-
ción es responsabilidad de Dialoga. Profesionales en educación, S.C. Las personas interesa-
das en enviar comentarios u observaciones lo pueden hacer a: contacto@dialoga.com.mx

Texto original: Wiggins, Grant (1990). The case for authentic assessment. Practical Assessment,
Research & Evaluation, 2(2).

Coordinación académica: Francisco Deceano Osorio

Coordinación editorial: Alicia Luna Rodríguez

Apoyo técnico: Javier Ulises Mendoza Ravelo

Diseño gráfico: Vania Bachur Colín

www.dialoga.com.mx

Derechos reservados. El titular de los derechos de la colección Textos y Traducciones y de la


presente versión es: Dialoga. Profesionales en educación, S.C. San Francisco 1660, piso 2, Del
Valle, México, D.F.
En defensa de la evaluación auténtica

Grant Wiggins

Índice

¿Qué es la evaluación auténtica?.............................................................................................. 4


¿Por qué necesitamos invertir tiempo en estas formas tan laboriosas de evaluación?...... 5
¿No es demasiado cara y laboriosa la evaluación auténtica?............................................... 6
¿Llegará a confiar el público en la objetividad y confiabilidad de las calificaciones
basadas en juicios?.................................................................................................................. 6
Lecturas complementarias ......................................................................................................... 7

3
En defensa de la evaluación auténtica1

Grant Wiggins

¿Qué es la evaluación auténtica?

L
a evaluación es auténtica cuando examinamos directamente el desempeño de los alumnos en
tareas intelectuales valiosas. La evaluación tradicional, en contraste, se basa en “reactivos” indi-
rectos, que funcionan como substitutos, a partir de los cuales creemos que se pueden hacer infe-
rencias válidas sobre el desempeño de los estudiantes en dichas tareas.

¿Queremos evaluar la capacidad de nuestros alumnos para plantear y resolver problemas en ma-
temáticas? ¿La investigación experimental en ciencias? ¿Su manera de hablar, escuchar y facilitar
una discusión? ¿La realización de investigación documental? ¿Revisar sus escritos creativos hasta que
“funcionen” para los lectores? Entonces permitamos que la evaluación se construya a partir de estos
retos intelectuales.

Algunas comparaciones con los exámenes estandarizados ayudarán a clarificar lo que significa eva-
luación “auténtica”:

• La evaluación auténtica exige que los alumnos se desempeñen efectivamente usando el cono-
cimiento adquirido. Los exámenes tradicionales tienden a revelar sólo lo que los alumnos pueden
reconocer, recordar o “conectar” de lo que aprendieron fuera de contexto. Esto puede ser tan
problemático como querer inferir la habilidad para manejar o para enseñar sólo a partir de exá-
menes escritos.

• La evaluación auténtica presenta al estudiante el conjunto entero de tareas que reflejan las prio-
ridades y retos de las actividades de enseñanza: investigar, escribir, revisar y discutir sus escritos,
aportar un análisis oral interesante de un evento político, colaborar con otros en un debate, etc.
Los exámenes convencionales normalmente se limitan a contestar preguntas de respuesta única
con papel y lápiz.

• Las evaluaciones auténticas buscan observar si el alumno puede ejecutar/diseñar respuestas,


desempeños y productos nítidos, completos y justificables. Los exámenes convencionales sólo
requieren a los alumnos seleccionar o escribir respuestas correctas, sin importar las razones. (Ra-

4 1
Wiggins, Grant (1990). The case for authentic assessment. Practical Assessment, Research & Evaluation, 2(2). Consultado
el 21 de octubre de 2009. Disponible en: http://PAREonline.net/getvn.asp?v=2&n=2 . Traducción: Gregorio Hernández.
ramente hay oportunidad adecuada de planear, revisar y substanciar las respuestas en los exá-
menes, incluso cuando incluyen preguntas abiertas). En consecuencia…

• La evaluación auténtica logra validez y confiabilidad al enfatizar y estandarizar los criterios apro-
piados para calificar tal variedad de productos. Los exámenes tradicionales estandarizan “reac-
tivos” objetivos y, en consecuencia, la (única) respuesta correcta de cada uno.

• La “validez” del examen debería depender, en parte, de si el examen estimula la prueba de


habilidades del mundo real. En la mayoría de los exámenes de opción múltiple la validez se
determina meramente por la correlación entre los reactivos y los contenidos del curriculum (o
mediante correlaciones sofisticadas con los resultados de otros exámenes estandarizados).

• Las tareas auténticas involucran retos y roles “semi-estructurados” que ayudan a los alumnos a
ensayar las ambigüedades complejas del “juego” de la vida adulta y profesional. Los exámenes
tradicionales, en cambio, son más como ejercicios mecánicos que evalúan elementos estáticos,
simples y a menudo arbitrarios de esas actividades.

Más allá de esas consideraciones técnicas, el movimiento hacia la reforma de la evaluación se basa
en la premisa de que la evaluación principalmente debería apoyar las necesidades de los aprendices.
Por ello, los exámenes estandarizados compuestos por reactivos y calificaciones que carecen de signi-
ficado claro y útil debilitan la capacidad de los maestros para mejorar la enseñanza, y la capacidad
de los alumnos de mejorar su desempeño. Esto es
como ensayar y enseñar en función de exámenes
que no se comprometen con la validez. Las evaluaciones auténticas
buscan observar si el alumno puede
Los mejores exámenes muestran siempre a alum-
ejecutar/diseñar respuestas,
nos y maestros el tipo de trabajo que realmente
importa. Son instrumentos para capacitar y mirar desempeños y productos nítidos,
hacia adelante, y no sólo para reflejar la ense- completos y justificables.
ñanza previa. En muchas universidades y espacios
profesionales los retos esenciales se conocen de
antemano (p. ej., un reporte a presentar, un recital o concierto, etc.). Los exámenes tradicionales, al
mantener en completo secreto su validez, hacen difícil para maestros y alumnos ensayar y desarrollar
la confianza que surge del conocimiento del desempeño que se espera de uno. Un reto conocido
posibilita también que todos los alumnos mantengan estándares elevados.

¿Por qué necesitamos invertir tiempo en estas for-


...los exámenes estandarizados mas tan laboriosas de evaluación?
compuestos por reactivos y
calificaciones que carecen de Si bien los exámenes de opción múltiple pueden
significado claro y útil debilitan la ser indicadores o predictores válidos del desempe-
ño académico, con frecuencia dichos exámenes
capacidad de los maestros para confunden a los alumnos y maestros sobre el tipo
mejorar la enseñanza, y la de trabajo que debe llegarse a dominar. Las nor-
capacidad de los alumnos de mas no son estándares. Los reactivos no son pro-
mejorar su desempeño. blemas reales. Las respuestas correctas no requie-
ren una fundamentación lógica.

Lo que los defensores de las pruebas tradicionales no ven es que es la forma, no el contenido del exa-
men lo que es dañino para el aprendizaje. La cuestión a debatir respecto a la reforma de la evalua-
ción no es la validez técnica de las pruebas estandarizadas, pues a través de estas los alumnos llegan
a creer que aprender es memorizar grandes cantidades de datos. Los maestros llegan a creer que los
exámenes son una dañina molestia impuesta demasiado tarde (cuando la enseñanza ha terminado).

5
Y se conduce a ambos a creer que las respuestas correctas importan más que los hábitos mentales.

Avanzar hacia tareas y logros más auténticos mejora, entonces, la enseñanza y el aprendizaje: los
alumnos tienen mayor claridad sobre sus obligaciones (y se les pide dominar tareas más interesantes),
y los maestros pueden llegar a creer que los resultados de la evaluación son significativos y útiles para
mejorar la enseñanza.

Si tu objetivo es meramente monitorear el desempeño, entonces la evaluación convencional puede


ser adecuada. Si tu objetivo es mejorar el desempeño a todos los niveles, entonces los exámenes de-
ben integrarse por tareas, criterios y estándares ejemplares.

¿No es demasiado cara y laboriosa la evaluación auténtica?

Los costos son engañosos. Aunque evaluar tareas basadas en juicios parece caro (alrededor de 2
dólares por estudiante) comparado con calificar exámenes de opción múltiple (1 centavo por estu-
diante), los beneficios en el desarrollo profesional de los maestros, la evaluación local, y el aprendizaje
de los alumnos son muchos. En estados como California y Nueva York se ha encontrado que, a través
de sus exámenes de escritura y de ciencia práctica, se dan mejoras significativas a nivel local en la
enseñanza y la evaluación de la escritura y la ciencia, especialmente cuando los maestros participan
en el proceso de calificación.

Si los costos resultan prohibitivos, se pueden evaluar sólo muestras de la población, que es la estrategia
seguida en California, Vermont y Connecticut en sus nuevos proyectos de evaluación con base en
portafolios y desempeño. Así, se puede obtener información valiosa a un costo mínimo a través de una
muestra de distintos géneros de escritura, donde cada estudiante realiza sólo uno; o evaluando sólo a
una muestra pequeña de estudiantes.

¿Y qué ganamos al fracasar en evaluar adecuadamente las capacidades y resultados que decimos
valorar simplemente porque es más tardado, caro y laborioso? La mayoría de los países que piden a
los alumnos de manera rutinaria contestar oralmente y por escrito sus evaluaciones principales, son los
mismos países que nos aventajan en las comparaciones internacionales. Para lograr que la evalua-
ción sea de calidad superior, normalmente destinan dinero, tiempo y acciones de capacitación. Así
mismo, asumen de manera correcta que los estándares altos dependen de la calidad de la evalua-
ción cotidiana.

¿Llegará a confiar el público en la objetividad y confiabilidad de las calificaciones basadas en jui-


cios?

Tendemos a olvidar que muchos programas de evaluación a nivel estatal y nacional, con un nivel alto
de credibilidad e integridad, han operado por muchos años usando el criterio humano:

• Desde que existen, los exámenes de los Re-


gentes de Nueva York han incluido pregun-
tas con redacción de ensayos, calificados
Para lograr que la evaluación sea
localmente.
de calidad superior, normalmente
• El Programa de Ubicación Avanzada: usa destinan dinero, tiempo y acciones
preguntas y tareas abiertas, incluyendo no de capacitación. Así mismo,
sólo ensayos sino Portafolios de Arte y exá- asumen de manera correcta que los
menes de Lengua Extranjera.
estándares altos dependen de la
• Evaluaciones estatales de escritura: se usan calidad de la evaluación cotidiana.
en muchos estados, e incluyen ensayos mo-

6
delo, capacitación de lectores/revisores, y procedimientos de lectura “ciega” para prevenir los
sesgos y ganar confianza y credibilidad.

• La Evaluación Nacional del Progreso Educativo (NAEP, por sus siglas en inglés): es la evaluación
ordenada por el Congreso, utiliza numerosas preguntas abiertas, tareas de escritura, y pruebas
prácticas de desempeño en ciencia.

• Las nuevas Evaluaciones basadas en portafolios y en desempeño, implementadas en Arizona,


California, Connecticut, Kentucky, Maryland, and New York.

Aunque la calificación de los exámenes estandarizados no se presta a errores significativos, el proce-


dimiento para elegir los reactivos, y la manera en que se establecen las normas y las líneas de corte
(calificación mínima aprobatoria) a menudo son bastante subjetivas, y tradicionalmente inmunes al
escrutinio y la vigilancia pública.

La evaluación genuina no evita el juicio humano. Monitoreamos y mejoramos nuestros juicios median-
te sesiones de capacitación, ejemplos de desempeño, revisión de las políticas, así como a través de
procedimientos básicos tales como pedir que jueces neutrales revisen el trabajo de los estudiantes sin
importar el nombre o la experiencia de la persona,
de manera similar a como se hace rutinariamente
Para mejorar el desempeño de los en los mundos del deporte, el arte y otras profesio-
alumnos debemos reconocer que las nes donde se juzga el desempeño.
habilidades intelectuales esenciales
La evaluación auténtica tiene también la ventaja
se están fugando por las grietas de dar a los padres y a los miembros de la comuni-
de la evaluación convencional. dad productos observables y evidencias compren-
sibles del desempeño de los alumnos. La calidad
del trabajo de los alumnos se vuelve más compren-
sible para la gente común que cuando se les habla en un lenguaje más técnico y abstracto como el
de los números y las normas.

En última instancia, como dice la investigadora Lauren Resnick, “Lo que evalúas es lo que obtienes. Si
no lo evalúas, no lo tendrás”. Para mejorar el desempeño de los alumnos debemos reconocer que las
habilidades intelectuales esenciales se están fugando por las grietas de la evaluación convencional.

Lecturas complementarias

Archbald, D. & Newmann, F. (1989) "The Functions of Assessment and the Nature of Authentic Acade-
mic Achievement," in Berlak (ed.) Assessing Achievement: Toward the development of a New Science
of Educational Testing. Buffalo, NY: SUNY Press.

Frederiksen, J. & Collins, A. (1989) "A Systems Approach to Educational Testing," Educational Resear-
cher, 18, 9 (December).

National Commission on Testing and Public Policy (1990) From Gatekeeper to Gateway: Transforming
Testing in America. Chestnut Hill, MA: NCTPP, Boston College.

Wiggins, G. (1989) "A True Test: Toward More Authentic and Equitable Assessment," Phi Delta Kappan,
70, 9 (May).

Wolf, D. (1989) "Portfolio Assessment: Sampling Student Work," Educational Leadership 46, 7, pp. 35-39
(April).

También podría gustarte