Está en la página 1de 18

Más allá de la retroalimentación: desarrollar la capacidad del

estudiante en evaluaciones complejas.

Beyond feedback: Developing student capability in complex appraisal

Assessment & Evaluation in Higher Education, Volume 35, Issue 5 August 2010 , pages 535 - 550

D. Royce Sadler *

Griffith Institute for Higher Education, Griffith University, Mt Gravatt campus, Brisbane 4111,
Australia

Entregarles a los estudiantes una retroalimentación detallada acerca de las fortalezas y


debilidades de su trabajo, la cual incluye sugerencias para mejorar su rendimiento, se
está convirtiendo en una práctica común en la educación superior. Sin embargo, para
muchos estudiantes la retroalimentación no tiene ningún impacto, y si lo tiene, es
mínimo; a pesar del cantidad considerable de tiempo y esfuerzo que se dedica a su
producción. Con el fin de aumentar la efectividad de la retroalimentación, se han
realizado investigaciones teóricas y empíricas exhaustivas que han estudiado su
estructura, el momento oportuno de la entrega y otros parámetros. Para que los
estudiantes sean capaces de aplicar la información de la retroalimentación, primero
deben entender el significado de los enunciados que la componen. También deben
identificar, con cierta certeza, los aspectos particulares de su trabajo que necesitan
atención. Para que esto ocurra, los estudiantes deben tener conocimientos básicos
fundamentales. Este artículo expone la naturaleza de ese conocimiento y la manera en
la que los estudiantes pueden adquirirlo. Deben adquirir por sí solos tres conceptos
fundamentales: cumplimiento de una tarea, calidad y criterios, y también crear una
reserva de conocimientos tácitos pertinentes.

Palabras claves: evaluación formativa; retroalimentación; juicio cualitativo; evaluación


entre pares; criterios.

Introducción
En la literatura acerca de investigaciones sobre el aprendizaje, inicialmente se asociaba a la
retroalimentación -como elemento fundamental de la evaluación formativa- con el
conocimiento de los resultados. Esto aludía a resultados simples (como la respuesta a la
pregunta de una prueba) que podrían clasificarse como correctos o incorrectos. Como lo
planteó Kulhavy (1977), la retroalimentación se define como “cualquiera de los numerosos
procedimientos que se utilizan para comunicarle a un estudiante si la respuesta a una pregunta
es correcta o incorrecta” (211). A partir de esto se deducía que los estudiantes sabrían que
estudiando se resolvería el problema si se les decía que lo hicieran. Aquellos encargados de
investigar la enseñanza se interesaron particularmente en los efectos de las diversas
características (especialmente el apremio, la pertinencia, información personal y tipo de
recompensa) de la retroalimentación en la retención de los contenidos aprendidos. Este

*
Email: r.sadler@griffith.edu.au
enfoque, que se desarrolló a partir de modelos de aprendizaje estímulo-respuesta conductista,
se considera en la actualidad como un enfoque excesivamente limitado.
Las características de la retroalimentación que eran importantes en los primeros estudios
todavía mantienen su importancia hoy en día, aunque el enfoque ha cambiado. En general la
educación ha cambiado el énfasis que ponía en el fomento de la memorización de material
objetivo por el énfasis en el desarrollo de las habilidades de los estudiantes para producir
respuestas en tareas evaluadas que son más bien divergentes que convergentes y más bien
complejas que simples. Esas respuestas comúnmente se evalúan basándose en juicios
cualitativos. Sadler (1987, 1989) describió esos juicios como algo salido directamente de la
mente de una persona la cual, por lo tanto, funciona como la fuente y el instrumento de cada
valoración. Los juicios cualitativos no pueden reducirse a un conjunto de procedimientos
formales que pueden ser aplicados por inexpertos en la materia. Aumentar los límites de la
retroalimentación para que ésta promueva el aprendizaje complejo tiene consecuencias
trascendentales. Con este propósito, la retroalimentación puede incorporar varios elementos.
Entre esos se incluyen un puntaje o nota simbólicos para representar la calidad global del
trabajo; una explicación o justificación detallada para el puntaje; una descripción de la
calidad del trabajo; elogios, estímulos u otro tipo de comentarios afectivos; diagnósticos de
las debilidades; y sugerencias para mejorar las deficiencias específicas y para fortalecer el
trabajo en su totalidad.
No es posible en este artículo resumir los resultados de los cuatro análisis más
importantes acerca de la retroalimentación, realizados por Natriello (1987), Crooks (1988),
Black y William (1998), y Hattie y Timperley (2007), pero sí se puede decir que todas ellos
abordan predominantemente el aprendizaje escolar. Sin embargo, resulta útil hacer algunas
observaciones que señalen resultados similares pero en la educación superior. La
retroalimentación tiene la capacidad de influir en el aprendizaje, pero la simple entrega de
una retroalimentación no conduce necesariamente a una mejora. Esto es un hecho que los
docentes de todos los sectores de la educación, incluida la educación superior, conocen bien
(Crisp 2007). Arriesgándose a pasar por alto las complejidades acerca de la
retroalimentación, la visión general dice que la relación que existe entre su estructura, el
momento oportuno en el que se entrega y la efectividad es compleja y variable, y no tiene
una receta mágica. Incluso algo tan aparentemente sencillo como incluir elogios no significa
necesariamente que se lograrán beneficios académicos. Butler (1987) descubrió que existe
una diferencia crucial entre los efectos de los elogios hacia el estudiante como persona
(retroalimentación relacionada con el ego) y los elogios que tienen que ver con la calidad de
la tarea realizada (retroalimentación relacionada con la tarea).

Retroalimentación en la educación superior


Específicamente, con respecto a la educación superior, la posición comúnmente adoptada
dice que la retroalimentación es fundamental para el desarrollo de un aprendizaje efectivo
debido en parte a que los procedimientos de evaluación tienen un papel clave en la formación
del comportamiento de aprendizaje, y la retroalimentación puede acelerar ese proceso
significativamente. La retroalimentación debería ayudarle a
l estudiante a comprender mejor el objetivo del aprendizaje, el estado de sus
logros en relación con ese objetivo y las maneras de acortar las diferencias entre su estado
actual y el estado deseado (Sadler 1989). La evaluación formativa y la retroalimentación
deberían, por lo tanto, habilitar a los estudiantes a convertirse en estudiantes autorregulados
(Carless 2006). Obviamente, la intención de la retroalimentación no puede separarse de los
problemas logísticos prácticos que conlleva la entrega de ésta. Debido a que tanto la
efectividad como la eficacia son preocupaciones constantes, la retroalimentación no sólo
debería ser de un tipo adecuado, sino que también debería ser entregada utilizando los
recursos disponibles, especialmente en lo que se refiere al tiempo que tienen los académicos
para entregar una retroalimentación individual a los estudiantes. La expectativa natural es
creer que los estudiantes se beneficiarán con la retroalimentación en la medida en que ésta
sea proporcional con el esfuerzo que conlleva producirla. Esto ha llevado a la realización de
importantes investigaciones enfocadas en el desarrollo de maneras adecuadas para crear y
comunicar esa retroalimentación (Carless 2007; Duncan 2007; Hounsell y otros 2008), y a la
realización de análisis de la reacción de los estudiantes a la retroalimentación (Chanock 200;
Orsmon, Ferry y Reiling 2005; Nesbit y Burton 2006; Weaver 2006; Lizzio y Wilson 2008;
Poulos y Mahony 2008; Walter 2009).
A pesar de que la cantidad total de los estudios publicados que se centran
específicamente en la retroalimentación en la educación superior es pequeña en relación con
la cantidad que se encuentra en otros sectores de la educación y en investigaciones acerca de
la psicología del aprendizaje, la variedad es considerable. Los estudios que se citan más
adelante describen la base de este artículo, ya que se centran en la retroalimentación como
una comunicación. Poner un énfasis en la manera en la que los estudiantes perciben e
interpretan la retroalimentación, en vez de ponerlo en la manera en la que los docentes
piensan que debe recibirse la retroalimentación concuerda con el enfoque que se le da al
aprendizaje centrado en los estudiantes. Varios investigadores han abordado el problema
acerca de la manera en la que los estudiantes entienden la retroalimentación, especialmente
el lenguaje en el que se expresan los comentarios (Higgins, Hartley y Skelton 2001, 2002;
Carless 2006; Rae y Cochrane 2008). Entre las maneras que existen para lidiar con los
problemas de comunicación se encuentran propuestas para enfocarse de manera explícita en
aumentar el entendimiento de los estudiantes respecto a los criterios de evaluación con el fin
de iniciar los diálogos productivos necesarios (Rust, Price y O’Donovan 2003). También se
ha dirigido la atención a la contextualización del mensaje que contiene la retroalimentación,
al estudiante como receptor del mensaje y a la manera en la que el estudiante comprende el
mensaje. Incluso el medio de comunicación parece hacer una diferencia. En un estudio
realizado por van den Berg, Admiraal y Pilot (2006) se concluyó que “los estudiantes hicieron
más observaciones acerca de la estructura en las comentarios escritos que en los comentarios
orales. En los comentarios orales los estudiantes hicieron más observaciones acerca del
estilo” (145). Esto no significa necesariamente que una sea superior que la otra, sólo significa
que es muy posible que esas diferencias tengan repercusiones en la manera en que los
estudiantes reciben y usan la retroalimentación.
En este artículo, la diferencia que existe con la investigación actual yace en la premisa
que dice que sin importar los niveles de motivación que tengan los estudiantes para aprender,
éstos no pueden transformar los enunciados que contienen la retroalimentación en actos que
los ayudarán a mejorar si no poseen el conocimiento práctico suficiente acerca de algunos
conceptos fundamentales. Los docentes que redactan la retroalimentación obviamente poseen
un conocimiento práctico que incluye estos conceptos y recurren a este conocimiento para
llevar a cabo la tarea. Además tienden a suponer que los estudiantes también poseen un
conocimiento mínimo adecuado. Sin embargo, a menos que se identifique y trate este
conocimiento esencial, las expectativas que se tengan respecto a la retroalimentación más
minuciosa son por naturaleza limitadas.

Alcance y terminología
Las tareas evaluadas que son de particular interés en este artículo requieren que los
estudiantes demuestren mayores habilidades cognitivas o algún tipo de capacidad
profesional. Los logros en estas tareas se evalúan comúnmente por medio de actividades que
requieren respuestas largas y complejas que demandan una capacidad de análisis, de síntesis,
creatividad, evaluación o pensamiento crítico. Esas respuestas son un elemento común en
una amplia variedad de disciplinas, campos y profesiones tanto en cursos de pregrado como
de postgrado. Dentro de ellos se incluyen las lenguas, artes y letras, salud y ciencias sociales,
artes visuales y escénicas, y muchas áreas de la ciencia y tecnología.
Tanto el docente como el examinador pueden decidir las especificaciones de la tarea,
o pueden negociarse en colaboración con los estudiantes. En este artículo, se asume que una
vez que se han entregado las especificaciones de manera oficial, éstas definen los parámetros
del diseño en los cual se deben basar los estudiantes para construir sus respuestas. Con ese
fin, las especificaciones deben ser interpretadas de manera literal. Al evaluador generalmente
se le llama profesor; en la práctica puede ser un tutor, un ayudante del profesor u otra persona
calificada. Juicio y valoración se utilizan como sinónimos. La retroalimentación debe incluir
cualquier tipo de comunicación que realice el docente al estudiante después de la valoración
de la respuesta dada por el estudiante. Puede entregarse en directo, como por ejemplo en un
discurso, o por escrito, en un archivo de audio, o de otra forma de carácter permanente a la
que se pueda acceder cuando sea necesario. Cualquier tipo de evaluación termina cuando el
docente ha revisado las respuestas, ha entregado los resultados y ha dado la información
pertinente (como comentarios, puntajes o notas) a los estudiantes, y en el caso que sea
necesario, a la institución. Esta secuencia básica de evaluación: dar una tarea, evaluar las
respuestas de los estudiantes y entregar información sobre el desempeño, es una práctica
común en la educación superior.

Prealimentación (Feedforward)
Las dos herramientas principales para guiar a los estudiantes en la producción del trabajo
pedido son las especificaciones de la tarea que se va a evaluar y, en muchos casos, la
información respecto a la manera en la que se evaluará el trabajo. El diseño en sí se deja en
manos de los estudiantes. No se pueden hacer suposiciones acerca de la manera en la que se
entrega la información; éstas pueden incluir instrucciones escritas, presentaciones orales o
que utilicen alguna tecnología y discusiones cara a cara. Todas esas comunicaciones están
pensadas para un uso futuro y, utilizando la terminología de Bjorkman (1972), constituyen
una “prealimentación”. En este punto es necesario hacer una salvedad: informarle a los
estudiantes con anterioridad los criterios y estándares de evaluación (como una guía de
evaluación u otro formato) puede ser algo problemático. Nicol y Macfarlane-Dick (2006), al
notar la conveniencia de entregar con anterioridad criterios y estándares, citaron varios
estudios que destacan los componentes tácitos presentes en las expectativas y estándares
académicos, advirtiendo de ese modo las limitaciones inherentes de las descripciones
explícitas. En el estudio de Sadler (2009b), se han desarrollado en detalle las objeciones
teóricas complementarias. En este artículo no se aborda en profundidad este tema ya que es
un aspecto secundario al tema principal.

Retroalimentación (Retroalimentación)
La primera de las dos funciones generales de la retroalimentación es entregar un enunciado
acerca del desempeño basado en la evaluación del docente (ya sea por medio de una
clasificación o una nota) de la respuesta del estudiante, y una razón que indique la manera en
la que se consideraron las fortalezas y debilidades de la respuesta en el juicio. La segunda
función es entregar consejos o sugerencias respecto a la manera en la que se podría haber
elaborado una mejor respuesta. Claramente, si se quiere que la retroalimentación tenga una
buena posibilidad de lograr su propósito formativo, tiene que ser específica (haciendo
referencia, como debe hacerlo, al trabajo recién evaluado) y también general (identificando
un principio más general que podría aplicarse a trabajos posteriores). Por lo tanto, a pesar de
que la retroalimentación es principalmente de carácter retrospectivo, también se puede
utilizar en futuras ocasiones. Este componente especifico que tiene relación con futuras
actividades constituye un elemento adicional de prealimentación (Hounsell y otros, 2008).
Las recomendaciones generales que se encuentran en la literatura respecto de las
propiedades deseables de la retroalimentación incluyen: decirle a los estudiantes las
fortalezas de sus trabajos; decirles (de manera gentil) las deficiencias, donde se encuentran y
de qué tipo son; decirle a los estudiantes que podrían haber hecho para mejorar su trabajo; y
señalarles lo que podrían hacer la próxima vez que realicen un trabajo parecido. En todos los
casos, la retroalimentación debe tener como objetivo ser útil y entregar apoyo. La cantidad
de información en la retroalimentación de un trabajo en particular depende en parte de las
posibilidades que tenga el trabajo de ser arreglado. Cuando exista una cantidad de
deficiencias razonablemente pequeña en lugares específicos que solucionándose aumenten
de manera sustancial la calidad del trabajo, el docente podría entregar una cantidad
considerable de detalles. En el caso de un trabajo de alta calidad, no hay mucho que decir; en
el caso de un trabajo que presenta debilidades en su totalidad, el docente podría no saber qué
decir o por dónde comenzar.
Los docentes que entregan una retroalimentación escrita exhaustiva que utilice las
propiedades recomendadas, generalmente encuentran que la tarea requiere de mucho trabajo
y de la utilización de procesos cognitivos. Ponen mucha atención en la precisión de la
redacción, ya que posteriormente la retroalimentación se convertirá en una comunicación
diferenciada que se podría mencionar varias veces. Debido a que la comunicación es
asíncrona, el docente tiene que anticipar la posible reacción del estudiante ante el contenido
y el tono de la retroalimentación, y esto requiere un costo afectivo de parte del docente.
Dentro de las alternativas para la retroalimentación individual se encuentran los métodos
sistemáticos, algunos de los cuales requieren un mínimo uso de tecnología, como por
ejemplo, comentar el trabajo de los estudiantes utilizando códigos que permitan que los
estudiantes busquen los enunciados con la retroalimentación correspondiente en una lista
(Ramsden 2003). También se incluyen plantillas electrónicas, guías de evaluación y de
criterios, y bases de datos con oraciones que los evaluadores pueden utilizar para elaborar
una retroalimentación más extensa. Esto ayuda a ahorrar tiempo y esfuerzo de manera
considerable (Case 2007). En la medida en que la retroalimentación se entregue usando
tecnologías y mecanismos estructurados, se pueden aliviar las demandas cognitivas y
laborales. Sin embargo, sea cual sea la manera en la que se produzca y comunique la
retroalimentación, y a pesar del efecto limitado que a menudo ésta presenta, los docentes que
son meticulosos siguen poniendo un esfuerzo considerable para entregarle una
retroalimentación a sus estudiantes.

Prealimentación y retroalimentación como información


La prealimentación y la retroalimentación tienen una importante característica en común:
como mensajes de un solo sentido, del docente al estudiante, su esencia es informar o dar a
conocer una información. Sin embargo, a pesar de los mejor esfuerzos por parte de los
docentes para dar a conocer toda la información, de manera objetiva y con precisión, muchos
estudiantes no la entienden debidamente ya que, como se argumenta más adelante, ellos no
están preparados para decodificar los enunciados adecuadamente. Como consecuencia, los
docentes que se comprometen a entregar una retroalimentación de alta calidad quieren que
ésta les sirva a sus estudiantes. Por lo tanto, es necesario poner atención adicional en lo que
los estudiantes deducen de esa retroalimentación, en lugar de ponerla solamente en la
composición de ésta. Desde la perspectiva del estudiante, esto representa un énfasis en la
visibilidad (del estudiante) en lugar de poner un énfasis en la divulgación de información
(por parte del docente). ¿Qué significa esto en la práctica? ¿Cómo se puede mejorar la
situación para el estudiante? Para empezar, las partes de la retroalimentación que aborden
específicamente las fortalezas, las debilidades y especialmente los consejos para mejorar los
próximos trabajos son más que una simple vía de información. En su mayoría, son
expositivas y didácticas. El docente quiere que el alumno aprenda de la actividad evaluada y
el texto que contiene la retroalimentación es el medio de enseñanza. La siguiente pregunta
es: ¿cómo aprenden los humanos de un texto expositivo? Durante los años 60, muchos
investigadores estudiaron el tema bajo el lema “aprendizaje verbal significativo”. Uno de los
más destacados fue Ausubel (1963) y Carroll (1968).
Obviamente, la retroalimentación tiene que ver con el trabajo del estudiante al que,
en principio, pueden acceder tanto el docente como el estudiante, por lo que se podría pensar
que interpretar la retroalimentación y aprender de ella serían procesos simples para el
estudiante. Para comprobar este supuesto, es necesario dejar de lado la retroalimentación por
un momento y analizar el contexto en el que los docentes formulan la retroalimentación
(expositiva) y el contexto en el cual los estudiantes la interpretan y aprenden de ella,
respectivamente. Dejando de lado cualquier tipo de prejuicios personales que el docente
tenga acerca de un estudiante en particular, el profesor revisa el trabajo con una mirada
objetiva, evaluándolo como si fuese un observador o consumidor externo. Aunque el docente
puede suponer algunas cosas acerca de las intenciones de quien produjo el trabajo, no se
puede comprobar que lo que él supone es verdad. Sin embargo, esas supuestas intenciones sí
influyen en la manera en la que se elabora la retroalimentación y en la manera en la que se
entrega la orientación. También influyen factores adicionales. Por ejemplo, la evaluación
podría realizarse en un momento y en una situación en los que no se tenga contacto con el
estudiante (dependiendo del tipo de trabajo), y un docente podría tener cursos tan grandes
que solamente conocería a sus estudiantes por los trabajos que entreguen para evaluación.
No obstante, el docente acepta una gran responsabilidad cuando intenta convertir una
actividad evaluada en una instancia de aprendizaje significativa.
Los estudiantes enfrentan al menos tres desafíos interpretativos cuando intentan
beneficiarse de una retroalimentación. El primero tiene que ver con el trabajo en general: los
estudiantes podrían enfocarse en parte en la manera exacta en la que fue entregado o realizado
el trabajo y en parte en lo que ellos hubieran querido que fuera este trabajo. La inversión
personal del estudiante en la producción del trabajo hace que desaparezcan los límites entre
ambos aspectos. El segundo desafío surge cuando la realización de las medidas sugeridas en
la retroalimentación depende de la comprensión por parte del estudiante de ciertos conceptos
o criterios usados en la comunicación. Los docentes se acostumbran a usar ciertos términos
y pueden suponer con facilidad que los estudiantes conocen sus significados. El tercer desafío
lo enfrenta el estudiante que no tiene el conocimiento tácito (Polanyi 1962) necesario para
identificar el aspecto de su trabajo que se menciona en una parte de la retroalimentación. Por
ejemplo, un docente podría poner el siguiente comentario en una de las secciones del trabajo
“Esto no tiene una relación lógica con el punto anterior”. El estudiante que no se da cuenta
de los problemas de lógica no puede tomar medidas correctivas. Por otro lado, puede que
para explicar por qué la relación lógica no es la adecuada se necesite una explicación del
largo de un párrafo o más, y el profesor no dispone del tiempo para redactarla o no está
conciente de que podría ser necesaria. De cualquier modo, la oportunidad de aprender del
incidente desaparece.
En las tres situaciones, el estudiante no puede establecer conexiones críticas entre la
retroalimentación y el trabajo. Los enunciados, por lo tanto, no funcionan como
comunicación y la entrega de la información es en vano. Replantear los enunciados con la
información o elaborarlos de manera que entreguen detalles más precisos es inútil si los
referentes principales que los constituyen siguen siendo confusos. Suponiendo que se
resuelva el problema de la interpretación, un cuarto desafío que enfrentan los estudiantes es
incorporar la retroalimentación entregada por el docente a sus conocimientos básicos actuales
para que puedan utilizarse, cuando sea necesario, en actividades constructivas posteriores.
Como pasa en cualquier tipo de aprendizaje, es necesario interiorizar los nuevos cocimientos
antes de que se evaporen si se quiere que éstos influyan de manera positiva en los próximos
trabajos. Tanto la interpretación como la incorporación de la retroalimentación dependen de
la expresión verbal y del razonamiento y, por lo tanto, del conocimiento de los conceptos y
del vocabulario que sea necesario para convertir un discurso específicamente relacionado con
la evaluación en un discurso para la producción (futura).

El profesor como evaluador


A continuación se realiza un resumen de la experiencia típica que vive un docente al emitir
juicios; esto se hace con el fin de proporcionar un marco que ayude a pensar en la manera en
la que los estudiantes podrían desarrollar una competencia personal respecto a la evaluación.
Sea cual sea la disciplina o tipo de tarea a evaluarse, los docentes pueden emitir cientos de
juicios cualitativos de forma rutinaria todos los años, como parte de sus responsabilidades
académicas (Sadler 1998). Esto los expone a una variedad de formas en las que los
estudiantes discuten, describen, comparan, evalúan, crean, analizan, sintetizan y resuelven
problemas. Ellos ocupan la recopilación de juicios emitidos en base a respuestas pasadas
bastante similares y aplican esta información a nuevos trabajos estudiantiles. Esas
experiencias de evaluación también permiten acceder a la imaginación y conocer las
estrategias de los estudiantes, entregando experiencias indirectas respecto a los desafíos que
surgen cuando se realiza un trabajo, y aumentando y enriqueciendo el conocimiento propio
de los docentes acerca de las acciones que podrían servirle a otros estudiantes. Observe que
las ideas de los docentes acerca de las maneras en las que se podría haber producido un mejor
trabajo surgen a partir de las interacciones entre el conocimiento evaluativo que posee el
docente y los trabajos mismos de los estudiantes. Aunque algunas de esas ideas pueden ser
novedosas, es posible que al profesor no se le ocurran si le faltan trabajos. Esto básicamente
sucede debido a que los estudiantes también son imaginativos y creativos. Observe también
que la retroalimentación constructiva no necesita basarse en suposiciones acerca de las
intenciones de los estudiantes.
La exposición del docente a diferentes trabajos produce dos tipos distintos de
conocimientos. El primer conocimiento se manifiesta a través de la variedad en la calidad
general del total de los trabajos; esto se complementa indirectamente con la variedad de los
trabajos que el docente haya evaluado en el pasado. Esta variedad en la calidad tiene un rol
fundamental en la formación y el mantenimiento del concepto abstracto de calidad que posee
el docente. Este conocimiento no se aplica sólo a las respuestas de alguna tarea evaluada en
particular, sino también a los estudiantes y a otras actividades evaluadas.
El segundo tipo de conocimiento es la comparabilidad. Éste se construye a partir de
cada subconjunto de trabajos estudiantiles que según el juicio tienen la misma calidad, pero
que fueron ejecutados de manera diferente. Un nivel determinado de calidad se puede
“expresar” de muchas maneras. Esto constituye una parte tan importante de la experiencia
habitual a la hora de evaluar una gran cantidad de trabajos, que no se le considera un hecho
extraordinario o particularmente agotador. Sin embargo, esta diferencia es una sorpresa para
muchos profesores universitarios cuando pasan de ser uno entre muchos estudiantes a ser el
evaluador de una gran cantidad de trabajos estudiantiles. Estos dos tipos de conocimientos,
calidad y comparabilidad, puede representarse como dos dimensiones o ejes. Cada trabajo
puede ubicarse en una posición única dentro del espacio bidimensional definido por la calidad
y la comparabilidad. Al calificar una gran cantidad de trabajos, el evaluador llena
progresivamente ese espacio con juicios que ha emitido en base a casos reales. Es dentro de
este abundante espacio de evaluación experiencial que el docente construye la
retroalimentación.
La materia prima de la retroalimentación surge de la manera en la que los docentes
llegan a un juicio. Cuando los docentes explican por qué emitieron un juicio, ellos siempre
utilizan criterios, ya que los criterios, por definición, son elementos esenciales de los
discursos evaluativos. Además, los profesores apelan rutinariamente a cualquier criterio que
sea importante para emitir un juicio particular. Esto significa que están concientes de los
criterios que son pertinentes y de los que no lo son. Detrás de cada criterio se encuentra un
concepto permanente relacionado con la calidad y que los estudiantes también pueden
adquirir. Por otra parte, analizar la experiencia del profesor da una idea sobre la manera en
la que esto último puede llevarse a cabo.
Sin importar la habilidad y acuciosidad que se utilice para construir una
retroalimentación, cuesta comprender por qué ésta, sean cuales sean sus propiedades, es el
instrumento fundamental al que se le adjudica la tarea de ayudar a mejorar. La solución que
se propone en este artículo es entregarles a los estudiantes una experiencia en evaluación
similar a la de los docentes. Idealmente, debería ser lo más parecida en alcance y tipo como
lo permitan los recursos disponibles. La herramienta principal, como es de esperarse, es la
evaluación entre pares (Boud, Cohen y Sampson 2001). Las tipologías y diversas propuestas
para implementar la evaluación entre pares son mencionadas ampliamente en la literatura.
Sin embargo, lo que se requiere no es realizar una evaluación entre pares como una actividad
o una situación rutinaria, sino realizar una evaluación entre pares con un propósito que se
haya diseñado con una intención pedagógica clara, a saber, proporcionarles a los estudiantes
una experiencia práctica y un acervo de conocimientos conceptuales. Esto se describe a
continuación.
Evidentemente, es necesario eliminar o reducir la brecha que se produce entre la
retroalimentación entregada por el docente y la apreciación de la importancia práctica de ésta
por parte de los estudiantes. Una opción para lograr lo anterior podría ser enseñarles a los
estudiantes conceptos fundamentales en una actividad separada, que no esté relacionada con
la situación en donde se realizan actividades de evaluación reales. La alternativa que se
describe más adelante tiene relación con los objetivos de la educación superior, que incluyen
hacer que los estudiantes entiendan habilidades y conceptos complejos relacionados con
diversas disciplinas, campos y profesiones. En términos básicos, se puede decir que los
estudiantes han aprendido cuando se cumplen varias condiciones. La primera condición es
que ellos sean capaces de hacer o producir, cuando se les pida, algo que no eran capaces de
hacer o producir anteriormente. También deben ser capaces de lograr esto de manera
independiente sin la ayuda de otros (como un tutor o un grupo de estudiantes específico, pero
no necesariamente estando aislados de otros). Finalmente, los estudiantes deben ser capaces
de entregar un producto que tenga un nivel de calidad aceptable. Se sobreentiende que los
estudiantes deben ser capaces de reconocer diferentes niveles de calidad en los trabajos que
se les pidan. Lógicamente, esto es necesario si se espera que sean capaces de controlar la
calidad de su propio trabajo mientras lo estén realizando (Sadler 1989).
La característica principal de la propuesta alternativa es proporcionarles a los
estudiantes una experiencia sustancial en la evaluación, no como un conocimiento adicional,
sino como parte estratégica del diseño de la enseñanza. El objetivo general es enseñarles a
los estudiantes los conocimientos explícitos y tácitos suficientes que les permitan reconocer
y juzgar la calidad cuando la tenga enfrente, y que también les permitan explicar los juicios
emitidos. Si esto se lograra, surgirían varios beneficios adicionales. Dentro de ellos se
encuentra un mayor interés de los estudiantes en los contenidos y la estructura del programa
académico; la disminución de la importancia que se le ha dado a la retroalimentación del
docente como el elemento crucial para mejorar el aprendizaje; y el desarrollo de habilidades
y conocimientos evaluativos que serán de gran valor en estudios avanzados o en carreras a
los que se opten después de la graduación.
Es necesario que los estudiantes conozcan términos y conceptos de evaluación
correspondientes para que sean capaces de pensar, planificar, desarrollar y revisar trabajos
de alta calidad; de tener la confianza para evaluar trabajos complejos completos; de participar
en conversaciones inteligentes acerca de la calidad y los componentes que la distinguen. Para
muchos estudiantes, entender los conceptos fundamentales y lo que éstos implican en la
práctica no es algo insignificante. Comunicárselos, aunque sea por medio de múltiples
mensajes, raramente es efectivo. Como se podría esperar, existe una gran cantidad de
investigaciones en la literatura acerca de la formación de conceptos (también llamada logro
de conceptos y adquisición de conceptos). Los trabajos de Bruner, Goodnow y Austin (1956)
y Vygotsky (1934/1986) son de gran importancia en el campo, pero en este artículo no
realizará un resumen de sus trabajos. Sin embargo, el propósito de esta investigación, se
identificarán tres clases de conceptos que son importantes para adquirir conocimientos acerca
de la evaluación; estos son el cumplimiento de una tarea, la calidad y los criterios. Estos
forman las intenciones explícitas que son parte de una evaluación entre pares estructurada.
El orden en el que están enumerados no es casual; el propósito es seguir una progresión
estructural. Primero, se debe hacer revisar si se cumplen las especificaciones de la tarea antes
de evaluar la calidad de un trabajo; una vez hecho esto se emite un juicio sobre su calidad;
por último, se explica o justifica el juicio emitido utilizando los criterios fundamentales. Los
tres son elementos cruciales para evaluar trabajos complejos en varias disciplinas.

Cumplimiento de una tarea


En la educación superior, la forma y la estructura de la respuesta que se espera de un
estudiante en una tarea evaluada son generalmente establecidas por el docente o acordadas
con él. Como pueden avalar muchos académicos, las producciones de los estudiantes a
menudo no cumplen con las especificaciones básicas. Muchas de las respuestas no abordan
el tema especificado, no resuelven el problema especificado, ni responden la pregunta
especificada. Además, los estudiantes que entregan esas repuestas generalmente no se dan
cuenta de su error. El problema aquí no es que los estudiantes produzcan lo que se les pida y
lo hagan mal; sino que ellos produzcan otra cosa, algo que podría tener alguna relación con
la tarea que se pidió, pero que sin embargo no corresponde a lo pedido. Al parecer, en la
actualidad no existen muchos estudios acerca de la razón por la cual se produce este
fenómeno, de las características de lo que producen los estudiantes a cambio y de lo que se
podría hacer respecto a eso.
Sin embargo, a pesar de la escasez de estudios el problema es reconocido
ampliamente. La prueba de esto se encuentra en una gran cantidad de fuentes con consejos
para estudiantes que aparecen técnicas de estudio y en guías de evaluación en sitios de
Internet acerca de la educación superior y en manuales impresos. En la sección referente a
cómo responder preguntas en un examen, Race (2007) lo explica de la siguiente forma:

Asegúrese de que responda lo que se le está preguntando y no lo que usted cree que se le
está preguntando. La causa principal por la cual se descuenta puntaje en los exámenes es
que los estudiantes se salen del tema a la hora de responder las preguntas. El puntaje se
entrega por los puntos que tienen una estricta relación con la pregunta. No se entrega más
puntaje por conocimientos, información u opiniones adicionales que no tengan que ver con
la pregunta, por muy brillantes que éstos sean.

Abordar una pregunta es el arte de hacer que su contestación sea una excelente respuesta
a las palabras de la pregunta. Estas son palabras o frases con “instrucciones” importantes
tales como comparar, contrastar… mostrar, etc. (261)

Una reacción típica de los evaluadores frente a un trabajo que no aborde claramente la tarea
pedida es evaluar el trabajo de todos modos pero restándole puntaje o créditos.
En esta sección, el método que se propone para abordar este problema es introducir
el concepto “cumplimiento de una tarea”. Si se les pide a los estudiantes que hagan una crítica
de, por ejemplo, una política pública; un trabajo literario o una solución tecnológica a un
problema, se espera que las respuestas correspondan a una crítica. Una crítica es un tipo de
respuesta diferente a la explicación; en ella el estudiante se involucra en la evaluación de algo
y emite un juicio cauteloso acerca del tema. Tampoco se parece a una opinión ni a los tipos
de actividad mental a la que libremente se le llama pensamiento crítico. Para desarrollar una
crítica, el estudiante debe tomar distancia del contenido o tema, sopesar las características y
condiciones relacionadas con el tema, examinar las pruebas o motivos que lo llevan a hacer
su evaluación, y luego poner el resultado de la reflexión evaluativa en palabras. La crítica
tiene una estructura determinada, razón por la cual pertenece a una categoría diferente de
producción. Esto no quiere decir de ninguna manera que las críticas que realicen distintos
estudiantes acerca de una misma cosa sean las mismas –o parecidas. Idealmente, éstas serán
diferentes. Sin embargo, la crítica tienen propósito y estructuras lo suficientemente similares
para que formen parte de la categoría debidamente llamada “crítica”. Por otro lado, una
explicación se somete a un conjunto diferente de características. Se llega a ella a través de
diferentes procesos cognitivos, y trae como consecuencia un producto final específico. Otros
ejemplos de tipos de tareas son las soluciones, comparaciones, comprobaciones,
demostraciones, extrapolaciones y situaciones hipotéticas.
El cumplimiento de una tarea se refiere a la congruencia entre el tipo de respuesta
estipulada en las especificaciones de la tarea y el tipo de respuesta que el estudiante entrega
en realidad. Si las especificaciones piden una crítica, el estudiante que entrega una
explicación, una combinación entre una sinopsis y una conjetura, u otra cosa completamente
distinta no está cumpliendo con la forma y la estructura requeridos. Por lo tanto, no se puede
decir que la producción corresponde a la categoría de respuesta requerida. Por consiguiente,
no se puede evaluar su calidad como crítica. Entregar créditos por cualquier trabajo que no
es una crítica tiene tres efectos negativos potenciales: se recompensa y se respalda la acción
del estudiante sin que exista un cambio en su pensamiento y en la práctica; el estudiante
obtiene créditos sin llegar a un objetivo educacional valioso; y la intención de la tarea
evaluada, que es proporcionar evidencia de las capacidades de los estudiantes se destruye.
Hay que reconocer que no todos los docentes quieren que las tareas para evaluación
se interpreten de manera literal, y muchos de ellos utilizan formas o palabras familiares por
costumbre. Existen más posibilidades de que esto ocurra cuando los académicos, al crear las
tareas de evaluación, se centren principalmente en los contenidos que quieren evaluar, y no
pongan la suficiente atención en lo que los estudiantes deberían hacer con esos contenidos
para demostrar que se lograron los objetivos de mayor importancia fijados para el curso. Esta
actitud se puede traspasar al proceso de calificación: el trabajo que presente una información
completa puede recibir mayores recompensas, sea cual sea la tarea pedida. Sin embargo, decir
“Este estudiante obviamente sabe mucho sobre el tema, y eso merece un debido
reconocimiento” refleja un desconocimiento acerca de la importancia del cumplimiento de la
tarea, y no incluir este último concepto en las listas de criterios de evaluación refleja un
desconocimiento también.

Calidad
Este concepto se aplica en contextos disciplinarios y profesionales donde se espera que las
producciones complejas realizadas por los estudiantes no sean del mismo tipo. El concepto
de calidad en estas situaciones es abstracto y los estudiantes normalmente tienen dificultades
para comprenderlo. Calidad se entiende como la manera en la que el trabajo se realiza para
lograr el propósito deseado. Cuando se evalúan fenómenos complejos, la calidad es
determinada configuradamente (Kaplan 1964) en lugar de determinarse a través de la “suma”
de “medidas” particulares de sus componentes. Esos juicios integrales pueden equivaler a
más (aunque algunas veces a menos) de lo que equivaldría una consideración formal de las
diversas características por separado. Estas características son, por supuesto, comúnmente
llamadas criterios (Sadler 2009b). En la práctica, es más fácil reconocer la calidad cuando se
presenta que definirla de manera abstracta o explicarla en un caso particular. Con cierta
frecuencia, se pierde algo importante cuando se intenta expresar la calidad de forma
proporcional o declarativa, es decir, en palabras, como por ejemplo con guías de evaluación
y la expansión de criterios fijos.
Las determinaciones de calidad a menudo requieren considerar todos los tipos de
juicios integrales en donde se tratan múltiples criterios simultáneamente de manera
entrelazada. Para emitir un juicio es necesario ver más allá de las diferencias superficiales
que se presentan en trabajos individuales y concentrarse en aspectos más profundos, más
sutiles y más abstractos. También requiere mucho más que tomar múltiples muestras
representativas de un juicio; cada una de ellos relacionada a un único criterio. Esta es la razón
por la cual en este artículo la calidad como concepto se trata como una propiedad integrada
por derecho propio y no como algo “compuesto” o construido a partir de juicios basados en
criterios separados. Los estudiantes necesitan estar expuestos a una variedad de trabajos que
exijan diferentes calidades y adquirir experiencia en la emisión de juicios respecto a esos
trabajos; y, por lo tanto, llenar por sí mismos el espacio de evaluación bidimensional
mencionado anteriormente. Ellos deben conocer los ejemplos de manera planificada y no
aleatoria, y ganar experiencia en emitir juicios sobre la calidad. Necesitan crear razones y
relatos verbales acerca de las maneras en las que se podrían haber realizado mejores trabajos.
Por último, necesitan conversar con los profesores y con otros estudiantes sobre el proceso
de evaluación. Estos tres hechos entregan los medios con los que los estudiantes pueden
desarrollar un concepto de calidad que básicamente sea similar al que posee el docente y, en
particular entender que implica una alta calidad. Aunque proporcionar estas experiencias a
los estudiantes pareciera añadir más capas a la tarea de la enseñanza, se puede llevar a cabo
a través de la evaluación entre pares para que se convierta en una estrategia poderosa para la
enseñanza en la educación superior (Sadler 2009ª).

Criterios
Criterio se entiende como una propiedad o característica que es útil para la calidad y para su
determinación. Algunos criterios (como cantidad de palabras y utilizar convenciones de
referencia para realizar un texto escrito) son directos y están bien definidos. En el caso de
estos criterios, es relativamente fácil saber cuando se han cumplido las condiciones o cuando
se ha quebrantado una regla. Otros criterios, probablemente la mayoría de ellos, incluidos
algunos que reciben nombres increíblemente simples, son considerablemente más abstractos.
Esto los hace complicados para los estudiantes hasta que ellos comiencen a utilizarlos
competentemente, lo que a menudo requiere sofisticación y precisión. Estos criterios
abstractos son conceptos que no están bien definidos, por lo que deben aprenderse del mismo
modo en el que las personas forman otros conceptos abstractos y los utilizan en contextos
sociales o profesionales. Eventualmente, los criterios deben pasar a ser algo habitual dentro
del vocabulario de evaluación de cada estudiante, lo que les permitirá practicar y razonar en
sus propias cabezas a medida que emiten juicios y, en un futuro, explicar y justificar estos
juicios frente otras personas.
La coherencia (en un artículo académico) es un ejemplo de criterio abstracto. ¿Qué
tan bien entienden los estudiantes este concepto? ¿Pueden reconocer niveles altos y bajos de
coherencia en trabajos particulares? ¿Reconocen eficazmente esta propiedad pero utilizan
una terminología diferente para referirse a ella (como “unión”)? ¿Pueden detectar la
coherencia y mantenerla en sus producciones cuando están realizando un trabajo? La prueba
esencial para saber si los estudiantes entienden el criterio (de evaluación) de la coherencia no
tiene que ver con la capacidad que ellos posean para definirla formalmente. Tiene que ver
con la capacidad para emitir juicios certeros acerca de la coherencia en sus propios trabajos
y en los de otros, y con la capacidad para utilizar de manera apropiada el término cuando
expliquen los juicios emitidos acerca de la calidad, entregando una retroalimentación que
ayude a mejorar el trabajo y conversando con otros.
Se puede decir lo mismo de otros criterios como la evidencia (para realizar una
afirmación), la originalidad o precisión (de un argumento), la habilidad (en una interpretación
musical), la elegancia (en una solución matemática o en un software), la integridad (en una
entrevista clínica), la eficiencia (en el diseño de un proyecto) y la convicción (en una opinión
legal o en el anteproyecto de una política). Los estudiantes deben entender lo que éstos
significan e implican para las decisiones reales relacionadas con la evaluación. Deben saber
cuando es apropiado utilizar criterios particulares en casos particulares. Deben saber cuando
apelar a un criterio que raramente se utiliza y que no es parte de lo estándar, ya que, en casos
particulares, esto es sumamente importante. Deben saber ignorar un criterio que normalmente
es indispensable cuando la presencia de un criterio superordinado lo vuelva irrelevante en
una evaluación particular. El punto al que se quiere llegar aquí es que el conocimiento
profundo de los criterios y de la manera adecuada de usarlos no llega utilizando la
retroalimentación como la estrategia de aprendizaje principal. La divulgación puede informar
y provocar mejorías solamente cuando los estudiantes, como destinatarios del mensaje,
comprendan todos los referentes –que incluyen los significados e implicancias de los
términos, y la estructura de la comunicación.
El problema subyacente que surge respecto a los criterios como conceptos tiene que
ver con que términos específicos pueden significar cosas distintas para distintos profesores,
y con que estas diferencias todavía no hayan sido estudiadas. Por motivos de tiempo no es
posible realizar un análisis detallado de esto, sólo es posible mencionarlo y hacer breves
comentarios. A pesar de que los profesores que enseñan en diferentes cursos podrían estar de
acuerdo en que existiera una lista establecida de criterios, pueden surgir grandes debates
cuando se intente formalizar las interpretaciones de esos mismos criterios para que todos los
docentes y evaluadores los utilicen de manera constante. Además, los estudios de
investigación acerca de las formas en la que los docentes pueden transmitir de mejor manera
sus expectativas (incluidos los significados de los criterios) tienden a centrarse
específicamente en la evaluación cualitativa de un curso en vez de hacerlo en la consistencia
de la interpretación en todos los cursos, y este tema no es visto como algo problemático. Dos
ejemplos recientes son los estudios realizados por Andrade y Du (2007) y Rust, Price y
O’Donovan (2003) en los Estados Unidos y en el Reino Unido, respectivamente, donde el
interés fundamental estaba en la manera en la que los profesores dan a conocer sus
expectativas a los estudiantes. La consistencia en la interpretación de los términos
fundamentales podría no presentar problemas para profesores de educación superior o para
equipos de docentes, pero sí presenta problemas para los estudiantes, especialmente cuando
se encuentran con interpretaciones que difieren significativamente de profesor a profesor y
de curso a curso. Finalmente, se podría concluir que los estudiantes deben familiarizarse tanto
con los estándares como con los criterios. La razón por la que no se mencionó este aspecto
anteriormente tiene que ver con que se puede pensar que los estándares son etiquetas que se
aplican a divisiones establecidas (pero que han sido determinadas arbitrariamente) en la
escala de la calidad. El aspecto más importante que los estudiantes deben entender primero
es la naturaleza constitutiva de la calidad.

Conocimiento tácito
Un ambiente educativo que se ocupa de que los estudiantes desarrollen un entendimiento
conceptual acerca del cumplimiento de una tarea, la calidad y los criterios, aumentará, como
consecuencia, el conocimientos tácito de los estudiantes (Polanyi 1962). No se puede enseñar
(o captar) de ninguna otra manera. La realización de varias evaluaciones entre pares con un
propósito específico se convierte en un recipiente en el cual estos tres conceptos pueden
reaccionar e interactuar. Esta actividad que se basa en la experiencia no solo da lugar a una
evaluación o juicio sino también a un conjunto de conocimientos prácticos desconocidos,
difíciles de entender y que a menudo llegan inesperadamente. Estos conocimientos están
relacionados con las relaciones complejas que existen entre los elementos de evaluación y la
manera en la que éstos se aplican. Los profesionales y evaluadores expertos recurren
constantemente a sus reservas de conocimientos tácitos; éstas constituyen la esencia de una
gran cantidad de habilidades profesional.
Como ejemplo de esto, considere nuevamente el ejercicio de tener docentes hábiles
como evaluadores. Ellos generalmente examinan el trabajo con dos intenciones simultáneas.
Una de ellas es desarrollar un punto de vista acerca de la calidad general del trabajo y la otra
es anotar las características particulares (que a menudo son las fortalezas y debilidades, pero
no siempre es el caso) que requieren una atención especial. Estas “anotaciones” específicas
están asociadas a criterios (a menudo extraídos de un grupo indefinido de posibles criterios)
que luego son útiles tanto para formar la perspectiva inicial del evaluador como para construir
una retroalimentación (Wittgenstein 1974; Sadler 1989, 2009b). La importancia de un criterio
específico en un juicio específico depende de la manera en la que se percibe el trabajo que se
está evaluando. Por lo tanto, es una función que corresponde tanto de la condición mental del
perceptor como de las propiedades del trabajo que se está evaluando. Los posibles criterios
que se escojan según su relevancia en un punto en particular están más relacionados con lo
que dictan los sentidos que con lo que se considera importante. Estar al tanto de lo que es
importante es un elemento esencial del conocimiento tácito de un evaluador experto. Sólo
cuando el estudiante desarrolle también un conocimiento tácito que coincida a grandes rasgos
con el del docente, el alumno estará en condiciones de comprender los juicios y fundamentos
del docente.
Las instituciones de educación superior no solo tienen la responsabilidad de
enseñarles a los estudiantes los mecanismos de evaluación, sino también de ayudarlos a
comprender a cabalidad lo complejo que puede ser emitir juicios cualitativos con integridad
(Taras 2006; Ellery 2008). Esto hace necesaria la inmersión del docente y del estudiante en
actividades de evaluación que conectan formas simbólicas (palabras, oraciones y discurso)
con sus referentes concretos (trabajos de los estudiantes como ejemplificaciones), un
requisito que se aplica generalmente a las evaluaciones (Sadler 1980).

El camino a seguir
El objetivo manifiesto ya no es informarle a los estudiantes sobre la calidad de sus trabajos
(dar a conocer la información) sino hacerlos ver y entender las razones por las cuales se exige
una calidad (visibilidad), y en el proceso desarrollar la capacidad personal para emitir juicios
complejos. Esto incluye emitir juicios acerca de sus propios trabajos, durante la producción
del trabajo y una vez terminado éste. La clave para lograrlo yace en educar a los estudiantes
en el arte de realizar evaluaciones sustanciales y exhaustivas de manera similar a las que
utilizan habitualmente los evaluadores expertos. En la implementación de ese método
específico a la evaluación entre pares explicada detalladamente por Sadler (2009ª), la materia
prima a partir de la cual se realizan los juicios consiste en el trabajo de otros estudiantes, que
normalmente tienen distinta calidad y son de distintas formas.
Existen cuatro tareas básicas en la evaluación entre pares, y se pueden expresar como
preguntas con el siguiente orden. ¿Sirve una respuesta específica como un intento de abordar
el tema especificado en la descripción de la tarea? Esta es una pregunta relacionada con la
categoría, no tiene que ver con la calidad; eso sólo se puede decidir después de analizar el
trabajo completo. La siguiente pregunta es: ¿Qué tan bien cumple el trabajo los propósitos
pedidos? Esto apunta directamente a la determinación de la calidad. Tercera pregunta:
¿cuáles son los motivos que se utilizaron para emitir el juicio: utilizar cualquier criterio que
se apropiado para apoyar la evaluación? Los inconvenientes de no tener criterios establecidos
por adelantado El contraargumento frente a las posibles objeciones de que tener criterios
estandarizados dificulta el proceso de evaluación es que capacitar a los estudiantes para que
utilicen criterios fijados con anterioridad, guías de criterios y guías de evaluación no los
prepara adecuadamente para que sigan aprendiendo por el resto de su vida, ya que en el
mundo que viene después de la graduación, se debe evaluar una cantidad de cosas de distintos
tipos por muchas razones y propósitos, y pretender tener una guía de evaluación para cada
una de ellas es poco realista. A esto se añade demás la observación hecha anteriormente en
este artículo que dice que utilizar criterios preestablecidos no produce necesariamente los
juicios más auténticos. La cuarta y última pregunta es ¿cómo se puede mejorar el trabajo de
manera sustancial? Esto requiere consejos sobre el trabajo completo y respecto a las
deficiencias o debilidades específicas.
Esta evaluación entre pares realizada con una intención específica se convierte en un
elemento fundamental dentro de un enfoque pedagógico general que básicamente puede
remplazar a los métodos de tradicionales utilizados para dominar los contenidos más
importantes del curso. Este proceso hará que el profesor sea el responsable de lograr que los
estudiantes maduren progresivamente su capacidad para emitir juicios evaluativos al
proporcionar situaciones de práctica reales que no representen riesgos en las cuales ellos
también puedan reconocer las normas o estándares de calidad de la disciplina o profesión
correspondiente. En la vida real, los evaluadores están obligados a seguir ciertos parámetros.
En un curso las evaluaciones se rigen por los parámetros que estipulen las especificaciones
de la tarea. Dentro de esos parámetros, los estudiantes (como evaluadores) son capaces de
desarrollar habilidades para reconocer la calidad cuando ésta se exprese de distintas maneras.
A pesar de que el reconocimiento de la calidad es la actividad principal dentro de la
evaluación, no tiene que ver con los gustos personales. Los juicios se emiten dentro de un
contexto social-profesional definido y éstos deben ser justificados; el método que
comúnmente se utiliza es ocupar criterios que son sobresalientes en cada caso específico.
Este método general ocupa elementos del trabajo de Polanyi (1962), y se podría describir
como la manera de ayudar a los estudiantes a convertirse verdaderos expertos.
Todavía existen muchas cosas que se desconocen respecto a la mejor manera de
diseñar actividades de evaluación que ayuden a mejorar la enseñanza de los estudiantes de
educación superior. Los estudios citados anteriormente en este artículo se han centrado en
ciertos factores que pueden ayudar o entorpecer las mejorías en el rendimiento. La mayoría
de esos factores han sido estructurados y ejecutados en modelos que dependen de la
retroalimentación como parte clave del proceso. El tema de este artículo ha sido proponer un
modelo alternativo para la organización del aprendizaje y de la enseñanza. Este modelo
cuestiona la visión que dice que el docente debería ser la opción automática y fundamental
para mejorar el aprendizaje. Se ha puesto demasiada atención al nivel micro que se utiliza en
el modelo tradicional: lo que puede hacer el docente para construir una retroalimentación
más efectiva, y lo que debería hacer el estudiante para beneficiarse aún más de la
retroalimentación entregada.
Las investigaciones sobre la eficacia comparada de las innovaciones en la entrega de
la retroalimentación han basado típicamente sus conclusiones en cuestionarios en los cuales
los estudiantes cuentan sus experiencias, y en los puntajes obtenidos en las pruebas y tareas
evaluadas. Sin embargo, un aumento regular en el desempeño incluso cuando se ha entregado
una buena retroalimentación solamente indica que algunos estudiantes mejoraron. ¿Qué pasa
con los estudiantes que no mostraron mejorías? Encuestarlos para saber sus puntos de vista
probablemente no entregue evidencia que pueda servir para implementar nuevos cambios a
menos que los estudiantes hayan tenido algún tipo de experiencia con métodos alternativos.
¿Cuáles de los estudiantes que no mostraron mejorías podrían tener resultados diferentes
utilizando un método distinto, siempre y cuando éste sea implementado sin perjudicar a
aquellos que ya saben cómo interpretar y utilizar la retroalimentación? Estas son preguntas
para el futuro.

Conclusión
Para resumir, comúnmente se cree que la responsabilidad del docente respecto al uso de
actividades evaluadas para facilitar mejorías en el aprendizaje se cumple a cabalidad cuando
se entregan comunicaciones verbales extensas referentes a las especificaciones de la tarea
que se evaluará (y posiblemente a criterios de evaluación establecidos); información acerca
de la calidad de un trabajo evaluado; y consejos que ayuden a construir una respuesta a tareas
evaluadas que se presenten en un futuro. A la primera se la conoce comúnmente como
prealimentación, a las otras se las conoce como retroalimentación. Sin embargo, la evidencia
empírica muestra que aunque estas comunicaciones sean comprendidas por los estudiantes,
es muy común que no se observen mejorías en sus próximos trabajos, y si las hay, éstas serán
mínimas. Debido a que la retroalimentación de alta calidad requiere una contribución
específica por parte de los docentes, y debido a que a muchos de los estudiantes no les interesa
o no obtienen beneficios de ella, se puede entender que los docentes se sientan
desconcertados o desanimados.
El argumento presentado en este artículo hace mención a que el problema
fundamental no yace tanto en la calidad de la prealimentación y de la retroalimentación, sino
en suponer que informarles algo a los estudiantes, aunque sea de manera detallada, es la ruta
más apropiada para mejorar la enseñanza compleja. Aprender a partir de lo que el profesor
dice que debe hacerse es una estrategia general errónea ya que rara vez se cumplen las
condiciones para que los enunciados realicen una conexión íntima con el trabajo del
estudiante (con miras a trabajos futuros). Además, algunas formas de dar a conocer la
información, en especial las guías de evaluación y las plantillas que contengan criterios y
estándares pueden de hecho dificultar la formación de un concepto de calidad más completo
ya que tienden a priorizar características (criterios) específicas, en lugar de priorizar la
calidad como una propiedad global. También pueden dificultar el desarrollo de habilidades
que ayuden a identificar los criterios que sean más importantes en una evaluación especifica.
En palabras simples, depender de la entrega de información (como se expresa en la
prealimentación y retroalimentación) como el vehículo principal para promover las mejorías
en los estudiantes es depender del modelo de transmisión de información que se utiliza para
desarrollar conceptos de evaluación significativos.
Suponiendo que la baja disposición de los estudiantes a aprender no es la razón por
la cual no aprovechan las oportunidades de aprendizaje; entonces el tema sería cómo crear
un ambiente de enseñanza diferente que funcione eficazmente. La alternativa que se propone
para cambiar la secuencia usual es utilizar de manera intensa la evaluación entre pares con
un objetivo específico, como una estrategia pedagógica, no solo para evaluar sino también
para enseñar los contenidos fundamentales del curso. Los estudiantes deben tener un
conocimiento práctico razonable acerca de tres conceptos en particular –el cumplimiento de
una tarea, la calidad y los criterios- si se quiere que las interacciones entre docentes y
estudiantes tengan un efecto formativo, y si se quiere desarrollar capacidades para realizar
evaluaciones complejas. Estos conceptos de evaluación no deben considerarse como algo
abstracto sino como conceptos esenciales que deben interiorizarse, utilizarse y aplicarse en
operaciones concretas. Sin éstos, es probable que los conceptos clave de evaluación
continúen siendo ignorados e invisibles. A medida que se ponga en marcha este modelo, la
importancia de la retroalimentación como una divulgación se reduce. Por supuesto, si el
proceso fuera completamente exitoso, se obviaría completamente la necesidad de depender
sustancialmente de la retroalimentación entregada por el profesor.

References
Andrade, H., and Y. Du. 2007. Student responses to criteria-referenced self-assessment.
Assessment and Evaluation in Higher Education 32: 159-181.
Ausubel, D. 1963. The psychology of meaningful verbal learning. New York: Grune &
Stratton.
Black, P. and D. Wiliam. 1998. Assessment and classroom learning, Assessment in Education
5: 7-74.
Bjorkman, M. 1972. Feedforward and feedback as determiners of knowledge and policy:
Notes on a neglected issue. Scandinavian Journal of Psychology 13: 52-158.
Boud, D., R. Cohen, and J. Sampson. 2001. Peer learning in higher education: Learning from
& with each other. London: Routledge
Carroll, J.B. 1968. On learning from being told. Educational Psychologist 5: 4-10.
Crooks, T.J. 1988. The impact of classroom evaluation practices on students. Review of
Educational Research 58: 438-481.
Polanyi, M. 1962. Personal knowledge: Towards a post-critical philosophy. London: Routledge
& Kegan Paul.
Higgins, R., P. Hartley, and A. Skelton. 2002. The conscientious consumer: Reconsidering
the role of assessment feedback in student learning. Studies in Higher Education 27:
53-64.
Rust, C., M. Price, and B. O'Donovan. 2003. Improving students' learning by developing their
understanding of assessment criteria and processes. Assessment & Evaluation in Higher
Education 28: 147-164.
Sadler, D.R. 1980. Conveying the findings of evaluative inquiry. Educational Evaluation and
Policy Analysis 2(2): 53-57.
-------. 1989. Formative assessment and the design of instructional systems. Instructional
Science 18: 119-144.
-------. 1998. Formative assessment: Revisiting the territory. Assessment in Education:
Principles, Policy & Practice 5: 77-84.
-------. 2009a. Transforming holistic assessment and grading into a vehicle for complex
learning. In Assessment, learning and judgement in higher education, ed. G. Joughin,
49-64. Dordrecht: Springer.
-------. 2009b. Indeterminacy in the use of preset criteria for assessment and grading in higher
education. Assessment and Evaluation in Higher Education 34: 159-179.
Vygotsky, L.S. 1986. Thought and language. Revised and edited by Kozulin, A. Cambridge,
Mass: MIT Press. (Originally published in Russian as Myshlenie I rech, (1934