Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AcbVa
-2-
ndice de contenidos
0. Introduccin .................................................................................................................................. 4
1. La evaluacin de ejecuciones ........................................................................................................ 5
2. Diseo de rbricas....................................................................................................................... 11
3. Revisin de la rbrica.................................................................................................................. 20
Bibliografa ........................................................................................................................................ 22
-3-
0. Introduccin
En este segundo cuaderno de instrumentos de evaluacin educativa se abordarn
los pasos necesarios para disear rbricas como instrumento privilegiado en la evaluacin
de ejecuciones o del desempeo. As, como para el caso del diseo de cuestionarios de
rendimiento (tambin llamadas pruebas objetivas), que constituye el cuaderno de
instrumentos de evaluacin #1, los contenidos que se van a tratar tienen un carcter
eminentemente prctico que, esperemos, sirvan de gua en la construccin de los
instrumentos que van a ser utilizados en la evaluacin de los aprendizajes en el aula.
Como se ver, los ejemplos que van a ir apareciendo se basan en el currculo oficial
de la Comunitat Valenciana: Decreto 108/2014, para Educacin Primaria y el todava vigente
Decreto 112/2007, para Educacin Secundaria Obligatoria. Pero fundamentalmente nos
centraremos ms en el de Educacin Primaria, por tener un diseo ms til para el tema de
fondo que nos ocupa, la evaluacin referida al criterio.
Desde esta premisa, y recordando lo dicho en el documento Gua de evaluacin
educativa para el profesorado de educacin primaria y secundaria (Corts de las Heras, 2014),
nuestros elementos de trabajo son los criterios de evaluacin y en la medida de lo posible,
los indicadores de logro que se hayan establecido a partir de stos o, como en otros
contextos de evaluacin se denominan, descriptores. Siempre y cuando estos criterios de
evaluacin estn redactados en forma de resultados de aprendizaje (lo que se espera que
el estudiante alcance a conocer al finalizar un perodo formativo) con su sintaxis completa:
proceso, contenido y naturaleza de la ejecucin, estaremos en condiciones ptimas de
disear nuestros instrumentos de evaluacin. Ellos sern los que nos ayuden a determinar
qu tipo de pruebas e instrumentos son los ms idneos para evaluar los aprendizajes de
nuestro alumnado y, para el caso de las rbricas, sern aquellos que tengan que ver con
desempeos complejos o productos. De aqu que comenzaremos este cuaderno prctico
con algo de teora, describiendo qu se entiende por evaluacin de ejecuciones.
Una vez descritas las principales caractersticas y pasos que se siguen en la
evaluacin de ejecuciones, el cuaderno se centra en las rbricas:
Su concepto,
tipos ,
los pasos para su diseo, desde la determinacin de los criterios de
realizacin y atributos hasta la eleccin de una escala y,
los criterios de calidad de una rbrica, que tienen que ver con su
validez y fiabilidad.
-4-
1. La evaluacin de ejecuciones
En la gua de evaluacin anteriormente mencionada (Corts de las Heras, 2014) se
dieron unas pinceladas sobre el concepto de evaluacin autntica, corriente evaluativa
que ha surgido como rechazo a la evaluacin tradicional, centrada en el desarrollo de
pruebas objetivas que, aunque tcnicamente impecables, poco o nada han ayudado en el
diseo de intervenciones educativas. En la evaluacin autntica cobraban fuerza tres
grandes aspectos: a) el planteamiento de tareas complejas en contextos reales o simulados,
b) su carcter formativo y c) el uso amplio de indicadores y adems compartido con los
estudiantes.
As para Wiggins (1998, p. 22 y ss.):
Una evaluacin es autntica cuando la anclamos en el tipo de trabajo real
que la gente hace. Es autntica porque vemos si los estudiantes pueden usar
inteligentemente lo que han aprendido en situaciones que paulatinamente se
aproximan a situaciones adultas y si pueden presentar innovaciones ante
nuevas situaciones.
E
e
d
R
v
i
2.
Especificacin
de
criterios
de
evaluacin, prueba, instrumentos y
escalas.
3. Desarrollo de la rbrica.
4. Revisin de la rbrica.
procesos,
-6-
Indicadores de logro:
6MAT BL5.1.1. Recoge y registra informaciones cuantificables a partir de:
encuestas, medios de comunicacin, INE, internet,...
6MAT BL5.1.2. Interpreta y analiza
datos sobre informaciones
cuantificables a partir de: encuestas, medios de comunicacin, INE, internet,...,
utilizando la media, la moda y el rango.
Contenido
Informacin cuantificable de inters humano
Moda, media, rango
Naturaleza de la ejecucin
Encuestas, medios de comunicacin, INE, Internet
A partir de este punto se podra ir pensando en el tipo de actividad de evaluacin:
- Son acciones complejas que no se suelen dar a la vez, si no en un proceso a lo
largo de un determinado tiempo.
o qu actividades de evaluacin podra plantear? Una exposicin oral
con presentacin donde se den unas conclusiones, un informe escrito
donde plasmen el proceso, una prueba escrita donde identifiquen datos y
los analicen e interpreten
o cundo voy a evaluar el desempeo? Un da, varios das, en clase, en una
actividad extraescolar, desde mi casa con un producto que me
entreguen
o cmo y con qu voy a evaluar? Evalo solo yo, que se valoren entre
ellos utilizando algn instrumento dependiendo de la prueba de
evaluacin: prueba objetiva, ensayo de opinin, lista de cotejo, una
rbrica
- Necesitan haber trabajado conceptos como la moda, media y rango
- Necesitan haber manejado fuentes de informacin analgica y digital
(encuestas, medios de comunicacin diferentes, INE, Internet)
En resumen, se debe:
1. Elegir la prueba de evaluacin.
2. Especificar si la situacin de evaluacin ser formal o informal.
3. Especificar las condiciones de la prueba.
En cualquier caso se debe ser muy preciso a la hora de delimitar las condiciones de
realizacin: han de ser iguales para todos, salvo adaptaciones necesarias; con los mismos
materiales, tiempo de ejecucin, recursos humanos, con las mismas instrucciones
4. Definir los criterios de realizacin: se dedicar un apartado especial, ya que es
una parte fundamental para el desarrollo de las rbricas.
5. Elegir el tipo de rbrica (las veremos ms adelante) y escala de medida.
-8-
Relevancia
Incluye datos de indicadores relevantes en educacin, economa y salud de
distintos pases.
Claridad
Refleja con claridad los datos de los diferentes pases pudindose identificar y
asociar fcilmente a cada pas al que pertenecen y distinguirse de otros
indicadores.
Anlisis
Analiza de forma cuantitativa el fenmeno estudiado a partir de los datos
estableciendo comparaciones entre los diferentes pases usando la media, la
moda y el rango.
Interpretacin
Establece una interpretacin clara y congruente a partir de los datos obtenidos,
dando una visin global a partir del anlisis.
En los siguientes apartados se desarrollarn las fases 3. y 4. del proceso de
evaluacin del desempeo expuesto en la Tabla 1. Las fases 5. y 6. no difieren del uso de
otros instrumentos en el marco de la evaluacin referida al criterio y no sern tratadas en
este documento.
-10-
2. Diseo de rbricas
Definicin
El trmino rbrica, en el contexto de la evaluacin, proviene del ingls scoring rubric,
que traducido literalmente es rbrica para puntuar. Efectivamente, se tiene claro que es
un instrumento de evaluacin que sirve para puntuar o al menos para calificar al estudiante
en el ejercicio de un desempeoy quiz los angloparlantes que propusieron el trmino le
aadieron este adjetivo (scoring) al sustantivo (rubric) para denotar un tipo especial de
rbrica.
Segn el Longman Dictionary of Contemporary English, el trmino rubric es un
conjunto de instrucciones o una explicacin en un libro o examen, etc. Con el adjetivo, y
tomado de manera literal, se est diciendo que es un conjunto de instrucciones que sirve
para puntuar.
En el diccionario de la Real Academia de la Lengua Espaola, en su 23 edicin,
rbrica est definido como:
1. Rasgo o conjunto de rasgos de forma determinada, que como parte de la
firma pone cada cual despus de su nombre o ttulo, [...].
2. Epgrafe o rtulo.
3. Cada una de las reglas que ensean la ejecucin y prctica de las
ceremonias y ritos de la Iglesia catlica en los libros litrgicos.
Es decir, nada que ver con el concepto ingls moderno. Quiz porque an no se haya
incorporado plenamente su uso como ese conjunto de reglas o instrucciones que se utiliza
en un examen. As, las referencias remiten al uso en la firma (esos rallajos que hacemos
encima de nuestro nombre, quien lo utilice, cuando firmamos algn documento) o a un uso
ms antiguo, que remite adems a la etimologa de la palabra, derivada del latn ruber
(rojo)1, que era el color utilizado en los epgrafes o rtulos de los libros y probablemente en
el conjunto de las reglas de la liturgia.
Dejando la cuestin estrictamente lxica y centrndose en la cuestin pedaggica,
en distintos libros, artculos y otro tipo de documentos que tratan las rbricas, suelen
aparecer diferentes definiciones. Por ejemplo, la del glosario de trminos de pruebas
estandarizadas del Educational Testing Service (ETS), encargados de la evaluacin de PISA
ltimamente (https://www.ets.org/understanding_testing/glossary/) que define rbrica
como un conjunto de reglas para puntuar las respuestas a un tem de respuesta
construida2, a veces denominado gua de puntuacin o valoracin (scoring guide).
Personalmente, creo que no es una definicin de aplicacin general por estar demasiado
contextualizada en pruebas estandarizadas. As, las guas de valoracin utilizada en las
pruebas PISA, por ejemplo, no son estrictamente una rbrica. La rbrica requiere de algunas
caractersticas ms especficas.
En otros documentos se encontrarn otras definiciones, aqu se propone una que
tiene sentido con lo que se va a exponer seguidamente.
Como curiosidad, Jose Antonio Milln en el primer captulo de su libro El candidato melanclico
hace mencin a rbrica y otras derivadas de la misma raz: rubor, rub, rubeola
2
Una pregunta de una prueba objetiva que requiere de una respuesta abierta, y generalmente larga.
En el cuaderno de evaluacin sobre pruebas objetivas aparecen este tipo de tems.
-11-
Rbrica
Instrumento de calificacin que utiliza la descripcin cualitativa de los criterios
de realizacin de una tarea o actividad compleja a evaluar de forma graduada. As,
proporciona pautas con respecto a cmo se va a apreciar el trabajo de un estudiante.
Como ya se ha dicho, la rbrica es un excelente instrumento para la evaluacin del
desempeo, aunque no es el nico, existen otras alternativas como la lista de cotejo o las
escalas observacionales, quiz ms apropiadas cuando la informacin a registrar se limita a
la determinacin de si se cumple o no con unos criterios especficos. En el esquema
siguiente se hace una clasificacin de los distintos tipos reconocidos para la evaluacin del
desempeo, y las rbricas se sitan como un tipo de escala o gua de valoracin. La
explicacin sobre el tipo de rbricas (analticas u holsticas) se da ms adelante.
Tipos de rbricas
Habitualmente se suele hacer una clasificacin de las rbricas en: a) holsticas o b)
analticas, atendiendo a cmo consideran la evaluacin del desempeo, si como un todo o
por partes respectivamente.
Tambin existe otra clasificacin atendiendo al tipo de desempeo que se evala, si
es especfico o es general, quedando as rbricas que son especficas o rbricas que son
genricas, y esto depender del tipo de criterios por los que se evaluar en ese desempeo.
En esta clasificacin no se profundizar demasiado, simplemente sirva decir que las
rbricas genricas se dan cuando existen desempeos que renen caractersticas similares
independientemente del contenido, que son interdisciplinares, por ejemplo, la presentacin
de una informacin (siempre y cuando el contenido de esa presentacin no sea objeto de
evaluacin). Por el contrario, las rbricas especficas de la tarea, enfatizan las
caractersticas peculiares de una tarea concreta que no volver a repetirse y estn
centradas en conceptos, hechos o destrezas y habilidades muy especficas.
Obviamente tanto con un tipo de clasificacin como con otra, aunque ms con la
ltima desarrollada, puede haber enfoques mixtos donde se combinan aspectos genricos y
especficos o dos rbricas que se combinen para formar una sola, con una evaluacin
holstica y otra analtica de diferentes partes del desempeo. En definitiva, se puede hacer
este tipo de combinaciones obteniendo cuatro tipos de rbricas: holstica especfica o
genrica y analtica especfica o genrica.
Especial descripcin merecen las rbricas holsticas y analticas. Pero antes
mencionemos los elementos esenciales con los que cualquier rbrica debe presentarse.
1) Criterios de realizacin (opcional).
2) Atributos, asociados a cada criterio de realizacin.
3) Niveles de desempeo.
4) Descripcin de los niveles de desempeo.
La forma en la que lo hagan determinar si estamos ante una rbrica holstica o
analtica. Estos elementos se distribuyen en forma de matriz, filas por columnas, donde
niveles y atributos fundamentalmente se reparten los papeles.
Rbricas holsticas
Cuando se da la superposicin de criterios o son criterios muy asociados, es mejor
utilizar este tipo de rbrica. Los criterios se consideran en combinacin en una sola escala
descriptiva. Apoyan valoraciones ms amplias sobre la calidad del proceso o del producto.
Una valoracin holstica puede tambin formar parte de una analtica como un factor ms,
aunque este tipo de mtodos tiene la dificultad de sobreponer los criterios de la rbrica
holstica con los otros factores.
Su uso resulta ms prctico, ms rpido que las rbricas analticas. Sin embargo, al
proporcionar una valoracin global del desempeo se pierden detalles especficos y su uso
formativo est limitado, al contrario que las analticas, usndose preferiblemente en
evaluaciones con propsito sumativo. Tambin dada su limitada escala de puntuacin este
uso sumativo se circunscribe casi al hecho de proporcionar una calificacin (excelente,
notable, bien), ms que una puntuacin.
-13-
En la rbrica holstica los niveles suelen aparecer delimitando las filas y los criterios
de realizacin y sus atributos se combinan para proporcionar una descripcin para cada uno
de estos niveles.
2
Suficiente
Se consulta una nica fuente de informacin aunque fiable. Algn indicador de los presentados
es relevante en todas o alguna de las reas y se refleja de forma clara, aunque no es suficiente
para permitir una lectura sencilla de los datos. El anlisis y la interpretacin es congruente con
los datos en alguna ocasin.
3
Bueno
Se consultan diversas fuentes de informacin, aunque alguna de ellas puede no ser fiable. La
mayor parte de indicadores y los datos asociados son relevantes y permiten una lectura sencilla
de casi toda la informacin. El anlisis y la interpretacin se mantiene casi siempre congruente
con los datos obtenidos.
4
Excelente
Se han consultado diversas fuentes de informacin fiables. Todos los indicadores y datos son
relevantes y estn reflejados de forma clara, permitiendo una lectura directa de los datos. El
anlisis de los datos es completo y permite una interpretacin totalmente congruente.
Rbricas analticas
En las rbricas analticas los criterios de realizacin, con sus atributos, se evalan en
los distintos niveles proporcionando una descripcin para cada uno de ellos. Cada atributo
recibir una puntuacin por separado, aunque tambin puede obtenerse con propsitos
sumativos una puntuacin global del desempeo. Ocasionalmente se asignan pesos a la
evaluacin de cada atributo.
La principal ventaja en el uso de este tipo de rbricas es que proporciona tanto a los
estudiantes como al docente una imagen muy clara de por qu obtienen la puntuacin que
obtienen los alumnos y se detecta mejor qu partes del desempeo requieren de una
revisin por parte de ambos. Su funcin es diagnstica y con propsitos claramente
formativos, aunque ya se ha dicho que puede utilizarse una puntuacin global del
desempeo con propsitos sumativos. Sin embargo, para crearlas se necesita mucho
tiempo y su uso en la prctica de la evaluacin requiere de mucha destreza, especialmente
-14-
En este esquema, se aprecia que los niveles forman ahora las columnas, y los
atributos, cada uno de ellos por separado, las filas. Para cada atributo, y en cada nivel, se da
una descripcin. Adicionalmente, se puede considerar que un atributo pese ms en el
conjunto de atributos que otro, as pueden utilizarse o bien porcentajes o bien factores de
multiplicacin de los atributos, cuyo uso es ms sencillo, y en el fondo es similar al uso de
porcentajes.
-15-
1
Necesita mejorar
2
Suficiente
3
Bueno
4
Excelente
Bsqueda
Ha consultado varias
fuentes
de
informacin, todas
ellas fiables.
Relevancia
Ningn
indicador
es
relevante en las tres reas
(educacin, economa y
salud).
Algn indicador es
relevante, en todas o
alguna de las tres reas
(educacin, economa y
salud).
La mayor parte de
indicadores
son
relevantes en las tres
reas
(educacin,
economa y salud).
Claridad
Anlisis
Se realiza un anlisis
completo de los
datos
obtenidos
estableciendo
comparaciones entre
los
valores
de
distintos pases.
En alguna parte de la
interpretacin se puede
observar congruencia
con los datos obtenidos.
En la mayor parte de
la interpretacin se
puede
observar
congruencia con los
datos obtenidos.
Toda
la
interpretacin
es
congruente con el
anlisis de los datos
obtenidos.
Interpretacinn No
Interpretaci
se
realiza
una
interpretacin congruente
con el anlisis de los datos
obtenidos.
Punt.
Peso %
(opcional)
TOTAL
-19-
3. Revisin de la rbrica
En este apartado se muestran aquellos aspectos que se han debido tener en cuenta
a lo largo del proceso de elaboracin de una rbrica y que ahora servirn como elementos
de revisin. Todos ellos inciden en dos caractersticas fundamentales de cualquier
instrumento, y sobre ellas ya se ha hablado en anteriores documentos de esta serie, la
fiabilidad y la validez. Dos conceptos ntimamente relacionados pero no en la misma
direccin. Obtener un instrumento fiable no implica que sea vlido. Ahora bien, si el
esfuerzo est en obtener un instrumento vlido es seguro que ser en cierta forma fiable.
Validez de la rbrica
En principio se destacan caractersticas que se refieren a cmo el instrumente mide
lo que el evaluador pretende medir (validez) en base al contenido que recoge el
instrumento: es ese contenido y no otro el que se quiere evaluar; y en base a la construccin
del propio instrumento respetando la estructura o constructo del contenido (dominio) a
evaluar. As, una rbrica bien construida debe:
a) describir fielmente el contenido que se quiere evaluar y en toda su extensin. Es
decir, estn todos los atributos del desempeo o producto a evaluar y estn bien descritos
(p.ej.: si se quiere evaluar el conocimiento sobre historia, pero se describe en trminos de
exposicin del conocimiento sobre historia, no se est evaluando el conocimiento sino la
exposicin; por otra parte tambin se deben evaluar todos aquellos aspectos observables
que se entienden por conocimiento sobre historia o al menos los ms relevantes).
b) contener atributos apropiados que se corresponden con los de la respuesta del
alumno en el desempeo o producto que es evaluado (p.ej.: si se evala el razonamiento,
los errores de pronunciacin en la explicacin del estudiante son irrelevantes al propsito
de la evaluacin y no deberan incluirse en los criterios de realizacin).
Fiabilidad de la rbrica
Este concepto tiene que ver con la precisin de la medida o calificacin, en algunos
casos, de los instrumentos de evaluacin. De ah que es importante como primera
caracterstica que los niveles de la rbrica estn bien definidos y permitan una separacin
clara en la ejecucin o producto. Si no fuese as, cualquier asignacin de nivel a un
desempeo evaluado tendra ms de arbitrario de lo deseable.
Otra caracterstica tiene que ver con lo que ya se ha comentado en el apartado de
Estrategia general de desarrollo de los descriptores, y es que aunque los descriptores para
cada nivel de la escala sean diferentes de los anteriores o los siguientes, esa diferencia la
deben dar los cambios producidos en la cualidad de los criterios con el uso de esos
calificadores que se han mostrado anteriormente, y no la debera dar la introduccin
explcita o implcita de nuevos criterios o cambios en la importancia que toman los mismos.
Desde el punto de vista del uso de las rbricas es deseable que adems se hagan
comprobaciones del funcionamiento de las rbricas desde el punto de vista de la fiabilidad.
Se puede hacer de dos modos:
a) Valorar los mismos productos o desempeos (si est la posibilidad) por un
mismo docente dos o ms veces con las rbricas elaboradas, para comprobar si
se llega a las mismas conclusiones. Entre la primera y segunda valoracin se
recomienda un perodo largo de lavado, es decir, dejar pasar el tiempo para no
condicionar la valoracin de la segunda vez por el recuerdo de la primera
valoracin.
b) Valorar los mismos productos o desempeos por varios docentes con las mismas
rbricas.
Es interesante anotar qu porcentaje de coincidencias se ha obtenido. Si est por
-20-
debajo del 80%, la rbrica se puede mejorar todava un poco ms. Menos del 60% de
coincidencias requieren de una revisin profunda de las rbricas tal y como se ha sealado
en este apartado de fiabilidad, tanto en la fiabilidad intrajueces (un mismo valorador en dos
o ms tiempos diferentes), como en la fiabilidad interjueces (distintos evaluadores valoran
varios desempeos). Esto se puede hacer sin necesidad de recurrir a tcnicas estadsticas
ms o menos complejas.
Tambin cabe destacar que el uso de testigos (muestras de desempeo o de
anclaje) entre los diferentes niveles de la rbrica va a contribuir a la consecucin de un
instrumento fiable.
Aunque estoy convencido de que con empeo y un procedimiento, acaba por salir.
-21-
4. Bibliografa
Brualdi Timmins, A.C. (1998). Implementing performance assessment in the
classroom. Practical Assessment, Research & Evaluation, 6(2). Recuperado 13 junio 2014 de
http://PAREonline.net/getvn.asp?v=6&n=2.
ERIC/AE (2014). Scoring Rubrics Definitions and Construction. Disponible on-line en:
http://ericae.net/faqs/rubrics/scoring_rubrics.htm].
Gonzalez, J. (2014). Know your terms: holistic, analytic and single-point rubrics.
Recuperado 1 junio 2014 de http://www.cultofpedagogy.com/holistic-analytic-single-pointrubrics/.
Mertler, C.A. (2001). Designing scoring rubrics for your classroom. Practical
Assessment, Research & Evaluation, 7(25). Recuperado 13 junio 2014 de
http://PAREonline.net/getvn.asp?v=7&n=25.
Moskal, B. (2000). Scoring rubrics: what, when and how?. Practical Assessment,
Research
&
Evaluation,
7(3).
Recuperado
13
junio
2014
de
http://PAREonline.net/getvn.asp?v=7&n=3.
Moskal, B. (2003). Recommendations for developing classroom performance
assessments and scoring rubrics. Practical Assessment, Research & Evaluation, 8(14).
Recuperado 13 junio 2014 de http://PAREonline.net/getvn.asp?v=8&n=14.
Moskal, B. M. y Leydens, J.A. (2000). Scoring rubric development: validity and
reliability. Practical Assessment, Research & Evaluation, 7(10). Recuperado 13 junio 2014 de
http://PAREonline.net/getvn.asp?v=7&n=10.
Simon, M. y Forgette R. (2001). A rubric for scoring postsecondary academic skills.
Practical Assessment, Research & Evaluation, 7(18). Recuperado 13 junio 2014 de
http://PAREonline.net/getvn.asp?v=7&n=18.
Tiemey, R. y Simon, M. (2004). What's still wrong with rubrics: focusing on the
consistency of performance criteria across scale levels. Practical Assessment, Research &
Evaluation, 9(2). Recuperado 13 junio 2014 de http://PAREonline.net/getvn.asp?v=9&n=2.
Wiggins, G. (1998). Educative Assessment. Designing Assessments To Inform and
Improve Student Performance. Jossey-Bass Publishers, San Francisco, CA.
-22-
-23-