Está en la página 1de 29

evaluacin

Tipos de evaluacin e instrumentos de

Javier Corts De las Heras

2009

Introduccin a los distintos tipos de evaluacin y los instrumentos


ms usuales.

cortes_jav@gva.es

1
Tipos de evaluacin en Educacin Superior
Cuando se pretende hablar de tipos de evaluacin, algunos autores suelen introducir
elementos que pueden causar confusin en el lector (p.ej. Chatterji (2003), introduce como
tipos de evaluacin toda una serie de instrumentos clasificados segn distintos criterios). En
otros manuales se hace referencia a tipos de evaluacin ms centrados en mbitos
laborales o de gestin de calidad, en otros se establecen relaciones de tareas que deben
hacer los estudiantes o evaluados, etc.

En definitiva, existe bastante confusin a la hora de delimitar los tipos de evaluacin o


al menos sobre qu tipo de evaluacin se est hablando y a quines o cmo se est
aplicando. Esta breve referencia que se expone en este apartado no pretende tampoco dar
respuesta a todas las incgnitas que surgen a la hora de describir qu tipo de evaluacin
hacemos con nuestros estudiantes. La clasificacin que se ofrece puede ser revisada con
ms profundidad de la que aqu se expone, es discutible y provisional, pero al menos puede
servir como un primer intento de encajar las cosas.

Un tipo de evaluacin respecto a un criterio de clasificacin no impide que se d otro


tipo de evaluacin en otro criterio. De hecho, muchos tipos de evaluacin estn altamente
asociados, otros son transversales. Por ejemplo, la evaluacin sumativa la podemos utilizar
en la evaluacin de ejecuciones o en la evaluacin mediante pruebas objetivas; y tambin la
formativa, por qu no.

Los criterios de clasificacin de los tipos evaluacin son los siguientes. Segn:

1. El agente evaluador.
2. El momento.
3. El propsito.
4. El objeto de evaluacin.
5. Los usos e interpretacin de la puntuacin.
6. La actividad del evaluado.
7. La actividad del evaluador.
8. Los modos de puntaje.

Asimismo, tambin se podra mencionar como criterio el posicionamiento terico de


la evaluacin que puede incluir la evaluacin tradicional y la evaluacin autntica,
asimilndola con otros trminos como el de evaluacin alternativa, ambas frente a la primera
citada. Se expone una definicin de evaluacin alternativa como descriptor del Tesauro de la
base de Education Resources Infromation Center (ERIC) (http://www.eric.ed.gov).

2
(trad.: Estimacin del conocimiento o las habilidades por otros medios distintos a los
empleados tradicionalmente, pruebas objetivas, especialmente las pruebas de eleccin
mltiple estandarizadas). (ERIC Thesaurus, 15/09/2000).

A su vez este trmino incluye como trmino ms especfico el de evaluacin


autntica, asimilada en el tesauro a evaluacin basada en ejecuciones. Sin embargo, algunos
autores argumentan el sentido que se le da a este tipo de evaluacin yendo ms all de una
evaluacin basada en ejecuciones (Chatterji, 2003; Shelley y Howell, 2008, Wiggins, 1998).

Tabla 1: Clasificacin de los tipos de evaluacin segn criterios.


Criterio de clasificacin Tipos de evaluacin
1. Agente evaluador - Autoevaluacin
- Coevaluacin
- Heteroevaluacin
2. Momento - Evaluacin continua
- Evaluacin final
3. Propsito - Evaluacin sumativa
- Evaluacin formativa
4. Objeto - Conceptos, principios, hechos
- Procedimientos, Habilidades, Destrezas,
procesos, conductas
- Actitudes, Preferencias, Valores, Personalidad
- (la agrupacin es intencionada)
5. Usos e interpretacin de la puntuacin - Evaluacin referida a la Norma
- Evaluacin referida al Criterio
6. Modos de puntaje - Evaluacin holstica (global).
- Evaluacin analtica.
7. Actividad del evaluado - Evaluacin escrita (prueba escrita, trabajo,
memoria, informe, ensayo, diario,)
- Evaluacin oral (entrevista, exposicin o
presentacin,
- Evaluacin (cualquier otra) ejecucin (role
playing, simulacin, juego, discusin en grupo,
actividad fsica, accin procedimentada,)
8. Actividad del evaluador - Observacin
- Entrevista
- Pruebas, escalas, cuestionario
- Otras (portfolio, rejilla de constructos
personales, historias de vida, grupo de
discusin,).

1. La evaluacin segn el agente evaluador:

Hace referencia a quin es la persona que evala a otra persona o a s mismo


respecto a un objeto de evaluacin (accin).

Puede distinguirse claramente entre: a) autoevaluacin: la que realiza un individuo


sobre su propia accin; b) coevaluacin: la que realizan distintos individuos que realizan la
accin u objeto de evaluacin entre s (la evaluacin que realiza la clase a los distintos grupos
de la misma clase que exponen un tema, la evaluacin por pares,); c) heteroevaluacin: la
ms conocida, la que realiza una persona (p.ej.: en el proceso e/a, el profesor) sobre otra
que realiza una accin (prueba, exposicin, ensayo,).
3
2. La evaluacin segn el momento en el que se realiza:

Distingue entre una evaluacin realizada a lo largo de todo el proceso de e/a, de


forma frecuente, muchas veces asimilada a la evaluacin formativa, ya que sta ltima ha de
tener como requisito la continuidad. Sin embargo, la evaluacin continua muchas veces no es
formativa. La evaluacin final propone un nico momento de evaluacin al finalizar un proceso
de e/a (puede ser una prueba parcial, a final de curso, al cabo de tres aos) y generalmente
no supone retroalimentacin de la informacin para la mejora del propio aprendizaje. Su
caracterstica principal es que etiqueta el proceso de aprendizaje de alguna manera
(pasa/no pasa; apto/ no apto; suspenso / aprobado / notable /;).

3. Segn el propsito:

Se distingue entre: a) evaluacin formativa: la que evala el proceso de e/a de forma


frecuente e interactiva proporcionando informacin para la mejora tanto del aprendizaje
como de la enseanza, por tanto ha de ser necesariamente continua, y b) evaluacin
sumativa: mide mediante pruebas (de forma continua o final) con el propsito de obtener una
puntuacin del producto de aprendizaje.

4. Segn el objeto de evaluacin:

Este tipo de clasificacin va a asociarse inmediatamente a uno u otro tipo


instrumentos de evaluacin. Segn si se evalan conceptos, principios o hechos, o bien
procedimientos, destrezas, habilidades, conductas o finalmente actitudes, valores,
personalidad, (siguiendo una clasificacin harto conocida). Es decir, segn el dominio u
objeto de evaluacin, la especificacin de la prueba y su desarrollo, los mtodos de puntaje e
interpretacin, va a tomar un cariz u otro.

En todos los casos (objetos de evaluacin), la especificacin del dominio antes de la


preparacin de la prueba es una fase fundamental, especialmente en las pruebas referidas al
criterio seguidamente explicadas.

5. Segn mtodos de puntuacin:

Se suelen distinguir dos tipos de evaluacin, principalmente usados en la evaluacin


de ejecuciones: a) evaluacin analtica: basada en las valoraciones o juicios emitidos sobre las
partes de un proceso o producto de aprendizaje de forma individual, que en suma daran una
valoracin del conjunto de ese proceso o producto, suelen utilizarse para la valoracin
escalas analticas . b) evaluacin holstica: basada en el juicio de un proceso o producto de
aprendizaje en su conjunto, suelen utilizarse escalas holsticas (scoring rubrics) o ejemplos
tpicos de comparacin que describen niveles de ejecucin. Aunque no pertenezca a este
criterio de clasificacin, la evaluacin holstica adems tiene una connotacin ms amplia
asimilndose a la evaluacin de procesos, continua y formativa.

4
6. Segn usos e interpretacin de la puntuacin:

Se encuentran dos tipos evaluacin, o ms bien pruebas (tests).: a) referidas a la


norma (TRN), en los que la puntuacin de un individuo se compara con relacin a un grupo de
individuos (grupo normativo) medidos en el atributo que mide el test. Y b) referidos al criterio
(TRC), en los que la puntuacin de un individuo se compara con relacin a un dominio de
aprendizaje y destrezas. Siguiendo la definicin de Shrock y Coscarelli (2000), en el primer
caso un individuo siempre se compara con otro en trminos de puntuacin, mientras que en
el caso de los TRC, el individuo no se compara con otros sino con el nivel dado en referencia
a unos estndares que especifican el dominio de aprendizaje o habilidad.

7. Segn la actividad o modos de respuesta del evaluado:

Las evaluaciones pueden cubrir un amplio espectro, desde ejecuciones escritas de


cualquier tipo, pasando por ejecuciones orales u otras actividades que pueden incluir
actuaciones en escenarios simulados o reales, role-playing, juegos reglados, grupos de
discusin, Lo importante en este caso es la accin que va a tener que realizar la persona
evaluada. Cuando se hace una bsqueda sobre mtodos de evaluacin suelen aparecer
clasificaciones basadas en actividades que tienen que realizar los individuos sujetos a
evaluacin. No suele mencionarse instrumento o estrategia alguna, confundindolas as con
lo que en realidad son modos de respuesta de un individuo demandados en una evaluacin
concreta.

8. Segn la actividad del evaluador

Se incluyen tres metodologas de evaluacin ms otros tipos no clasificables


fcilmente. As, siguiendo a Padilla (2002) podemos distinguir entre el diseo y aplicacin de:
a) procedimientos de observacin, b) tcnicas e instrumentos de encuesta (entrevista), c)
pruebas y escalas y d) otras tcnicas (rejilla de constructos personales, portfolios, historias
de vida, grupo de discusin). Este ltimo grupo puede confundirse con los clasificados segn
la actividad del evaluado, pero el acento se pone ahora en el diseo y aplicacin de
instrumental especfico en la utilizacin de estas tcnicas.

5
Instrumentos de evaluacin segn el modo de respuesta
o presentacin
Se van a especificar tres grupos de instrumentos de evaluacin:

1. Instrumentos de evaluacin basados en respuesta estructurada escrita.


2. Instrumentos de evaluacin basados en ejecuciones, distinguiendo entre:
a. Respuesta abierta escrita: ensayos o pruebas de respuesta corta.
b. Evaluacin de conductas.
c. Evaluacin de productos.
d. Evaluacin de entrevistas.
e. Portfolio.
3. Evaluacin de actitudes, personalidad, preferencias:
a. Escalas de actitudes
b. Rejilla de constructos personales.

Para cada uno de ellos se presenta una ficha a modo de resumen, con algn ejemplo.
En la ficha se encontrarn los siguientes elementos: descripcin, modo de respuesta, modo
de presentacin, tipos de tems, escalas de puntuacin, complejidad de conocimiento
evaluable, competencias evaluables, ventajas e inconvenientes.

6
PRUEBAS ESCRITAS DE RESPUESTA ESTRUCTURADA

Descripcin

Las pruebas objetivas son tambin pruebas escritas pero, a diferencia de las anteriores, se basan en el criterio de
objetividad en funcin de una serie de preguntas con respuesta cerrada.
La principal ventaja frente a las anteriores pruebas es la rapidez con la que se corrigen, la posibilidad de abarcar gran
cantidad de contenidos y tratar de forma estadstica los datos para valorar principalemente la dificultad, discriminacin y
homogeneidad de los tems y la fiabilidad de la prueba, desde las dos teoras principales de los tests: Teora de Respuesta al
Item (TRI) o Teora Clsica (TC).
La principal desventaja de estas pruebas es que difcilmente se va a poder evaluar algo ms que no sea el recuerdo de la
informacin por parte del estudiante, aunque si se cuida la formulacin de tems se puede evaluar el procesamiento de la
informacin de orden ms complejo.

Modos de respuesta Escrita Estrategia Prueba

Conceptos, principios, Competencias Acadmicas vinculadas a


Tipo de conocimiento hechos una materia
evaluables
Modalidad de
Mtodo de enseanza Leccin magistral Clases tericas
enseanza

Tipos de tems o preguntas

Los tipos de tem que requieren una respuesta estructurada son:: respuesta breve, asociacin, verdadero-falso, eleccin
mltiple e interpretativos. Cada uno de ellos tiene unas ventajas e inconvenientes y puede alcanzar la medida de
conocimiento ms o menos complejo. Asimismo, para cada uno de ellos se hacen unas recomendaciones u otras para la
mejora de su calidad.

Escalas de puntuacin

Escalas sumativas, donde el acierto suele valer 1 punto. Se aplica correccin por azar en los de eleccin mltiple. La
puntuacin obtenida en el test se puede transformar linealmente a cualquier otro tipo de escala numrica. Adems existen
otros procedimientos tcnicos ms complejos para obtencin de escalas basadas en la teora de respuesta al tem.

Ventajas Inconvenientes
- Se puede obtener muestras de mucho contenido
- La adivinacin es una fuente de error.
en un corto perodo de tiempo.
- Es difcil construir tems tcnicamente efectivos.
- Pueden medir un rango amplio de conductas y
- No se adapta para la medicin de ciertas
habilidades cognitivas.
conductas (procedimentales o sociales).
- Se obtienen puntuaciones objetivas.
- Slo es posible una respuesta correcta.
- Mtodo de puntuacin eficiente.
- Los tems generalmente miden conceptos
- Puede ser diseado con la intencin de tener una
aislados en lugar de conceptos y habilidades
alta consistencia interna.
integrales.
- Eficaz en la administracin a grandes grupos.

7
Sugerencias de escritura para todo tipo de tems
Hay cuatro reglas principales que todo tem que vayamos a escribir debe cumplir:
1. Cada tem debe ser diseado para medir slo el resultado seleccionado del dominio.
2. Los tems deben provocar las ejecuciones deseadas de la manera ms directa posible.
3. Cada tem debera referirse a una sola cuestin o concepto con una respuesta correcta clara
o mejor opcin.
4. Los tems no deben proporcionar pistas, gramaticales o de cualquier otro tipo, a la persona
que contesta
Respecto a las sugerencias de procedimiento a la hora de formular tems se destaca:
a) formulacin lingstica: redactar tems claros, sintticos y construidos correctamente en el
sentido lingstico. Igualmente se deben formular en forma de pregunta y en forma positiva. Utilizar
siempre el formato de respuesta correcta o mejor respuesta. Situar toda la informacin de un mismo
tem en una misma pgina, fcilmente abarcable con la mirada.
b) resolucin: minimizar el tiempo que necesita el estudiante para la lectura y comprensin del
tem. Y, en la medida de lo posible, explicitar el tiempo de resolucin del mismo.
c) Revisin: disponer de tiempo para realizar la revisin de los tems en sus diversos aspectos
(formulacin, contenido y puntuacin)
Respecto a las sugerencias de contenido:
a) formulacin: contenidos importantes o significativos, utilizar el tipo de tem ms adecuado
para cada caso, adaptar las cuestiones a los niveles de habilidad de los sujetos y el propsito del test
(p.e.: uso de vocabulario comprensible) y evitar tems basados en opiniones.
b) Facilidad/dificultad: evitar el conocimiento superespecfico, el nivel de dificultad del tem debe
determinarse segn lo que se precise para lograr una congruencia tem objetivo. En definitiva, evitar
aadir al tem dificultad irrelevante.

Ejemplo de tem de respuesta breve:


Quin es el autor del libro Alicia en el Pas de las Maravillas?_____________

Respuesta clave: Lewis Carroll

Posibles respuestas: Lewis Carroll (respuesta clave); Charles Dodgeson (correcta porque Lewis Carroll fue el
pseudnimo de Charles Dogseson, aunque no coincide con la respuesta clave); Charles Dickens (respuesta
incorrecta)

8
PRUEBAS ESCRITAS DE RESPUESTA ABIERTA (ENSAYOS)

Descripcin

Es un modelo de prueba escrita donde el alumno ha de expresar por escrito una serie de contenidos referidos a un
conjuntos de preguntas o texto a comentar. Este tipo de exmenes puede posibilitar la exposicin ordenada, adems del
recuerdo de la informacin, de opiniones y puntos de vista ms personales. Se valora no slo el recuerdo de cierta
informacin relevante que quiera constarse que se ha adquirido, sino tambin la capacidad del estudiante de utilizar
estrategias de expresin escrita y elaboracin de un escrito con informacin estructurada, lgica, as como otros aspectos
formales: presentacin, ortografa, estilo de discurso (fragmentado, cohesionado,), uso del vocabulario,
En este tipo de pruebas podemos diferenciar adems dos tipos de preguntas: a) las que requieren una respuesta libre, b) las
que requieren una respuesta limitada, en la que se explicitaran los puntos o contenidos que debera contener la respuesta.

Modos de respuesta Escrita Estrategia Prueba

Conceptos, principios, Competencias Acadmicas vinculadas a


Tipo de conocimiento hechos una materia
evaluables
Modalidad de
Mtodo de enseanza Leccin magistral Clases tericas
enseanza

Tipos de tems o preguntas

Estos tems requieren que el diseador del tem d una instruccin escrita. A los alumnos evaluados se les proporciona
generalmente un cuaderno de respuestas en el que pueden proporcionar la respuesta a esa instruccin especificada.
Tanto las respuestas cortas como los ensayos son muy apropiados para medir nivel de pensamiento alto o resolucin de
problemas. Este tipo de evaluacin sin embargo no es apropiada para evaluar a nios muy pequeos o alumnos con
necesidades educativas en aspectos relacionadas con el lenguaje escrito.

Escalas de puntuacin

Analticas holstica

Ventajas Inconvenientes
- No se puede usar para personas que no dominen
- Puede medir pensamiento y procesos complejos la competencia escrita.
(creatividad, resolucin de problemas, - Consume mucho tiempo en el puntaje.
organizacin). - No se pueden obtener evidecias sobre mucho
- Permite sistemas de puntuacin analticos u contenido.
holsticos. - Sin criterios claros la puntuacin puede ser
- Se permite ms de una respuesta correcta. excesivamente subjetiva.
- Se puede administrar a grandes grupos. - Se necesita entrenamiento para realizar una
buena valoracin.

9
Este ejemplo es para la delimitacin de un ejercicio de ensayo.

Habilidades especficas a evaluar:

 El estudiante puede analizar las causas y los efectos de hechos histricos


 El estudiante puede proporcionar detalles adicionales para justificar las relaciones causa-efecto.
Instrucciones: escribe de 2 a 3 prrafos sobre el siguiente tema histrico. Sers evaluado en funcin de tu
habilidad para relacionar causas y efectos y sobre la justificacin de tu respuesta con hechos y fuentes
histricas. Los puntos los conseguirs por la precisin en hechos, fechas, nombres de personas implicadas,
organizaciones y normas legales que cites. Tienes 90 minutos para realizar el ejercicio.
Tema: Identifica los eventos clave que llevaron a la Guerra Civil espaola. Qu grupos polticos se vieron ms
implicados en la Guerra Civil y cmo se implicaron? Justifica tu respuesta.
Ten en cuenta que la longitud de la respuesta esperada, el criterio de puntaje, los contenidos esperados del
ensayo, las condiciones (p.e.: tiempo lmite, cuaderno de respuesta) bajo las que el estudiante debe responder,
deben estar especificadas en las instrucciones proporcionadas al estudiante. La inclusin de un mtodo de
puntaje pueden centrar ms an las ejecuciones que esperamos del estudiante. La estructuracin del ejercicio
en la manera que lo hemos mostrado controlar los posibles errores tanto para los examinados cuando
respondan, as como para los evaluadores cuando tengan que valorar el ensayo.


EVALUACIN DE CONDUCTAS

Descripcin

Este mtodo requiere que los estudiantes demuestren conductas o procesos que deben ser directamente observados. La
caracterstica distintiva de este tipo de estrategia de evaluacin de ejecuciones es que las conductas, ejecuciones y
demostraciones estn presentes y tiene que ser evaluadas mientras ocurren. Conductas motoras, ejecucin de una tarea y
habilidades sociales, son ejemplos de lo que se puede valorar.
Otros ejemplos incluyen la valoracin de charlas, debates o demostraciones de conductas en entornos reales o simulados.

Modos de respuesta Diversos Estrategia Observacin

Procedimientos Intelectuales, de
Competencias
Tipo de conocimiento (habilidades y comunicacin e
destrezas) evaluables interpersonales

Estudio de casos Modalidad de


Mtodo de enseanza Aprendizaje cooperativo
Estudio y trabajo en grupo
enseanza

Tipos de tems o preguntas

Las preguntas o estmulos, o directrices que se suelen dar suelen ser abiertas. Las observaciones puede seguir un sistema
de categoras estructurado o una observacin naturalstica. Un anecdotario realizado por el profesor puede ser una
herramienta de observcin no estructurada, aunque posteiormente se pueden dar criterios de observacin ms cerrados.
La metodologa observacional, en definitiva, es compleja y puede darse en mltiples entornos: reales o simulados
(artificiales).

Escalas de puntuacin

Analsitcas u holsticas

Ventajas Inconvenientes
- Consume mucho tiempo en la valoracin y
puntaje.
- Puede medir pensamiento y procesos complejos - Se limita a los procesos relacionados con el
(creatividad, resolucin de problemas, producto.
organizacin). - No se pueden obtener evidecias sobre mucho
- Permite sistemas de puntuacin analticos u contenido.
holsticos. - Sin criterios claros la puntuacin puede ser
- No tiene un lmite de tiempo. excesivamente subjetiva.
- Se permite ms de una respuesta correcta. - Se necesita entrenamiento para realizar una
buena valoracin.
- No se puede realizar en grandes grupos.

EVALUACIN DE PRODUCTOS

Descripcin

Este tipo de evaluacin requiere que los estudiantes creen o elaboren un producto, que servir entonces como base para
ser evaluado (p.ej.: una memoria de investigacin o de prcticas). Otros ejemplos incluyen: libros, trabajos artsticos,
informes de laboratorio, artculos, proyectos cientficos, Atributos como habilidades artsticas, destrezas culinarias, trabajo
cientfico,,y habilidades relacionadas con la elaboracin o creacin de productos suelen ser valoradas. El rasgo ms
distintivo de este mtodo de evaluacin es que el producto mismo sirve como base para la valoracin del constructo de
aprendizaje subyacente.

Modos de respuesta Cualquier formato Estrategia Observacin producto.

Intelectuales, de
Competencias
Tipo deconocimiento Procedimentales comunicacin e
evaluables interpersonales

Aprendizaje orientado a Modalidad de Tutoras / Trabajo


Mtodo de enseanza proyectos autnomo o en grupo
enseanza

Tipos de tems o preguntas

Las preguntas o estmulos, o directrices que se suelen dar suelen ser abiertas, incluyendo nicamente algunos criterios o
parmetros fijos. Pueden existir ejemplos de productos que requieran de directrices absolutamente cerradas.

Escalas de puntuacin

Analticas u holsticas.

Ventajas Inconvenientes
- Puede medir pensamiento y procesos complejos
- Consume mucho tiempo en la valoracin.
(creatividad, resolucin de problemas,
- Se limita a los procesos relacionados con el
organizacin).
producto.
- Permite sistemas de puntuacin analticos u
- No se pueden obtener evidecias sobre mucho
holsticos.
contenido.
- Requiere de una produccin que est a la vista.
- Sin criterios claros la puntuacin puede ser
- Requiere de la aplicacin de habilidades para el
excesivamente subjetiva.
desarrollo del producto.
- Se necesita entrenamiento para realizar una
- No tiene un lmite de tiempo o espacio, a priori.
buena valoracin.
- Se puede administrar a gandes grupos.


Ejemplo: Informe Cientfico (5 de Educacin Primaria)
Instrucciones dadas al alumnado:
Escribe un informe donde se comparen dos de los ocho planetas del Sistema Solar. Asegrate de
incluir en tu informe comparativo la discusin sobre: nombre de los planetas, tiempo que necesitan
para hacer la rotacin sobre su eje y alrededor del Sol, dos hechos sobre las lunas de estos planetas,
temperatura media, tamao de los planetas, distancia media al Sol, el apodo del planeta, y si en el
planeta e puede dar la vida, tal como la conocemos. Asegrate de separar tus propias opiniones de
los hechos. Da razones para apoyar cada opinion dada.
El informe debe ser preciso, claro y de dos pginas.

Se har en clase en tres clases de una hora (3 horas total) donde podrs reunir la informacin sobre
los planetas y escribir el informe. Puedes usar los recursos de la clase, el aula de informtica o de tu
casa. Todo el trabajo se debe realizar en tiempo de clase y al finalizar cada una de las tres clases se
recoger el trabajo.

El trabajo valdr un 50% de la nota final. Usar los criterios que os proporciono en la lista adjunta
para valorar vuestros trabajos. Revsalos mientras preparas tu trabajo.

Criterios de puntuacin (1 punto por


cada S
S No
Los planetas se identifican por su nombre Presente: _____ _____
Preciso: _____ _____
Se dan los tamaos de los planetas Presente: _____ _____
Preciso: _____ _____
Se dan las temperaturas medias Presente: _____ _____
Preciso: _____ _____
(contina)


EVALUACIN DE ENTREVISTAS

Descripcin

Es un mtodo en el que el evaluado responde en un dilogo uno a uno, aunque puede darse el formato de entrevistas
grupales, con el examinador. Se ha de demostrar la competencia de habilidades o capacidades a travs de las respuestas a
preguntas realizadas durante la entrevista. LA entrevista puede adoptar un formato estructurado o libre. En el formato
estructurado el examindor posee un guin de preguntas, tipo cuestionario. Tambin pueden incluirse estmulos visuales o
auditivos que complemente a las preguntas. Un examen oral sera tambin un ejemplo de entrevista.
Puede ser de gran ayuda la utilizacin de procedimientos de grabacin.

Modos de respuesta Oral Estrategia Entrevista/cuestionario

Vinculados al mundo
Conocimientos Competencias profesional, de
Tipo de conocimiento Actitudes comunicacin, de
evaluables
desarrollo profesional

Resolucin de Modalidad de
Mtodo de enseanza problemas
Seminarios/Talleres
enseanza

Tipos de tems o preguntas

Las preguntas presentadas oralmente, puede requerir una respuesta cerrada o abierta:
(abierta) Qu papel juega la estadstica en el proceso de investigacin?
(semi-abierta) Cmo definiras la estadstica?
(cerrada) Crees que la estadstica trata fundamentalmente sobre el estudio de la incertidumbre?

Escalas de puntuacin

Escalas analticas u holsticas.

Ventajas Inconvenientes
- Es muy costosa en cuanto a tiempo y puntaje.
- No se pueden obtener evidecias sobre mucho
- Es muy apropiada cuando el foco de aprendizaje es
contenido.
la comunicacin oral.
- Se limita slo a los procesos dnde se da la
- Puede medir un amplio rango de conductas
interaccin.
cognitivas, sociales, personales y afectivas.
- Sin criterios claros la puntuacin puede ser
- Es posible ms de una respuesta correcta.
excesivamente subjetiva.
- Permite una puntuacin analtica u holstica.
- Se necesita entrenamiento para realizar una
buena entrevista.


Ejemplo: Entrevista uno a uno para medir el Locus de Control
Pregunta Busca en la respuesta Puntuacin
Piensa en un proyecto que hayas reune mis propios estndares Locus de control interno
finalizado en tu casa de calidad, el tiempo o las metas (Cdigo 1)
que me marqu

Cmo decidiste que habas com- otros (ej.: mi madre) me Locus de control externo
pletado con xito la tarea? dijeron que estaba bien (Cdigo 2)


PORTAFOLIO

Descripcin

Son colecciones de trabajos o registros de conducta que en conjunto proporcionan una imagen global de competencias en
un rea de aprendizaje amplia. Se utiliza generalmente en educacin como una herramienta de documentacin global en
aprendizajes para los que se quiere seguir su proceso y evolucin, o para recoger evidencias sobre habilidades en una
materia, arte, etc. En los portfolios adems se incluyen guas para la seleccin de los contenidos, criterios para juzgar, los
trabajos o reflexiones de los propios estudiantes, investigaciones bibliogrficas, eleboraciones multimedia, maquetas,
sntesis,

Modos de respuesta Diversos Estrategia Otras tcnicas

De todo tipo,
Conceptuales (hasta el
especialmente las que
ms alto nivel), Competencias
Tipo de conocimiento procedimentales y
tienen carga
evaluables procedimental y
actitudinales
actitudinal

Modalidad de Tutoras
Mtodo de enseanza Contrato de aprendizaje Estudio y trabajo
enseanza autnomo

Tipos de tems o preguntas

Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, los tipos de tems o
preguntas pueden adoptar cualquier formato de los presentados en esta gua. No obstante, se exponen brevemente los
contenidos bsicos que ha de tener un portafolios, con la dificultad de que puede tomar un formato libre (el estudiante
decide qu contenidos incluir como evidencias (Coln, Gin e Imbernon, 2006): a) trabajos sustantivos en relacin con la
enseanza de las temticas tratadas en la asignatura, b) temas relacionados con el aprendizaje y c) transferencias
personales o profesionales.

Escalas de puntuacin

Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, las escalas de puntuacin
pueden adoptar cualquier formato de los presentados en esta gua, y especialmente los recomendados para la evaluacin de
ejecuciones: escalas holsticas o analticas.

Ventajas Inconvenientes
- Mide la evolucin en un perodo o tiempo
- Requiere de muestras de trabajo adecuadas.
determinado en una materia.
- Requiere un gran nmero de muestras de
- Es fcilmente integrable en el proceso de
trabajo.
enseanza.
- Difcil de puntuar objetivamente si los criterios no
- Puede medir conductas o resultados de
son claros.
aprendizaje complejos.
- Los estudiantes puede responder con ayuda
- Se puede usar individualmente o adaptarse a
externa.
grupos.
- Se necesita una buena formacin para aplicarlo
- Puede medir procesos complejos de pensamiento.
como instrumento de evaluacin.
- Permite una puntuacin analtica u holstica.


Ejemplo de Estructura de potafolios como instrumento de evaluacin, como criterios predefinidos por
el profesor (formato cerrado).

Pgina principal: Portfolio de materia o asignatura


Instrucciones (para el estudiante)
Propsito
Qu resultados de aprendizaje se van a evaluar, a qu competencias estn asociados
Contenido(*)
Se especificarn distintos formatos de muestras de trabajo que se van a evaluar con los
consiguientes criterios de evaluacin, temporalizacin, muestras necesarias y condiciones de
ejecucin cada tarea.
Sugerencias
Algunas sugerencias para ayudar al cumplimiento de las tareas.

(*) Dentro del contenido, podemos clasificar las evidencias de aprendizaje (o trabajos):
a) tareas sustantivas de los contenidos de la materia.
b) tareas o trabajos relacionados con el aprendizaje o con los contenidos de la materia.
c) tareas de transferencia o generalizacin al mbito personal o profesional.

Si se utiliza un formato mixto de portafolio, el profesor puede dar directrices cerradas para el
apartado a) y dejar la eleccin libre de contenidos en los apartados b) y c), especialmente en este
ltimo.


ESCALA DE ACTITUDES

Descripcin

Las escalas de actitudes consisten en tems de respuesta estructurada donde los individuos seleccionan una de las
opciones de respuestas en el contexto de una afirmacin o cuestin. Algunas respuestas pueden ser abiertas, aunque
complica el anlisis de la informacin. No existe una respuesta correcta o incorrecta. En algunos casos un conjunto de
preguntas puede conformar una dimensin o factor, aunque esto requiere de un gran desarrollo tcnico de la escala en el
que se comprueba generalmente la validez de constructo.

Entrevista / escala
Modos de respuesta Escrita / oral Estrategia (prueba)

Competencias Desarrollo y compromiso


Tipo de conocimiento Actitudes y valores
profesional y personal
evaluables

Contratos de aprendizaje Modalidad de


Mtodo de enseanza Apje. Cooperativo
Estudio y trabajo en grupo
enseanza

Tipos de tems o preguntas

Se presentan diferentes formatos en funcin de las escalas de puntuacin. No obstante se dan una serie de
recomendaciones generales para la escritura de tems (Chatterji, 2003): a) especificar el dominio y subdominio del
constructo con indicadores observables, b) desarrollar tems para el cuestionario que estn conectados con los indicadores
del dominio, c) asegurarse que los tems de observacin estn situados concretamente en segmentos de tiempo, episodios,
experiencias o lugares (p.ej. en casa, esta semana, sobre la escuela,), d) seleccionar una escala de respuesta, que encaje
con la lgica y semntica de las frases de los tems, e) asegurarse de que los tems forman un conjunto homogneo, dentro
del dominio o subdominio y f) incluir bastantes tems para asegurar la precisin del instrumento.
En general se dan afirmaciones, en primera persona muchas veces, y se puntan en funcin de una escala o se ordenan o
se sitan en un polo u otro de una dimensin o actitud,

Escalas (de puntuacin)

Escalas Likert (sumativas) , Escalas de Thurstone (diferenciales), Escalas de Guttman (acumulativas), Diferencial Semntico,
Q Sort de Stephenson, Difernecial semntico, Eleccin de alternativas, Listas de ordenamiento. Se puede ampliar ms
informacin en Morales, Urosa y Blanco (2003).

Ventajas Inconvenientes

- Es difcil conseguir una buena validez de


constructo.
- Se pueden evaluar actitudes de una manera
- Falsificacin de las respuestas o deseabilidad
rpida y con bajo coste, especialmente si se usan
social.
procedimientos escritos y no de entrevista.
- Inercia en las respuestas
- El procedimiento de evaluacin es sencillo.
- Pueden presentar ambigedad semntica
fcilmente.


Ejemplo de diferencial semntico
Qu significado tienen para los profesores la evaluacin alternativa?

Las evaluaciones alternativas son


1. Buenas ____ ____ ____ ____ ____ ____ ____ Malas
2. Rpidas ____ ____ ____ ____ ____ ____ ____ Lentas
3. Dbiles ____ ____ ____ ____ ____ ____ ____ Fuertes
4. Efectivas ____ ____ ____ ____ ____ ____ ____ No efectivas

Ejemplo de escala de Thurstone


Actitud hacia las pelculas.
Seale si est de acuerdo con las siguientes frases

Las pelculas son la influencia positiva ms poderosa en nuestra vida. 

Ir al cine es un pecado. 

A veces creo que las pelculas son algo deseable, otras lo dudo... 

Nota: los estmulos ya tienen una puntuacin otorgada por un grupo de jueces, puntuacin que no se
presenta a la persona que responde. En funcin de las respuestas que d la persona obtendr una
puntuacin u otra. En todo caso, la persona que responde slo ha de sealar la respuesta con la que
est de acuerdo (s/no). En otras escalas tipo Thurstone, se pide que valoren el grado de acuerdo
(tipo escala Likert) aunque con una connotacin final distinta modificada por las puntuaciones que los
jueces han dado a cada frase o sentencia.

 
REJILLA DE CONSTRUCTOS PERSONALES

Descripcin

Es una tcnica compleja que parte de la Teora de los Constructos Personales de G.A. Kelly. Aqu se presenta una adaptacin
para su uso en evaluacin educativa. Los estudiantes generan su propia matriz de informacin para interpretar o valorar un
objeto o realidad. La rejilla es individual, y generalmente distinta a la de otro estudiante ya que se hacen valoraciones sobre
un conjunto de elementos, se decide cmo valorar los elementos y qu elementos van a ser valorados. Consta de cuatro
fases: a) eleccin de elementos (personas, eventos, objetos, profesiones,), b) establecimiento de los constructos relevantes
para los elementos, c) representacin de los datos, d) anlisis de informacin. Se da un ejemplo en esta ficha de su uso y se
remite a Padilla, M.T. (2002, pp. 299-313).

Modos de respuesta Escrita / Oral Estrategia Otras tcnicas

Desarrollo y
Competencias
Tipo de conocimiento Actitudes y valores compromiso profesional
evaluables y personal

Aprendizaje Basado en Modalidad de


Mtodo de enseanza Problemas
Prcticas externas
enseanza

Tipos de tems o preguntas

Se expone un ejemplo en la siguiente pgina.

Escalas de puntuacin

Se expone un ejemplo en la siguiente pgina.

Ventajas Inconvenientes

- La informacin siempre la proporciona el individuo.


- Permite una reflexin profunda al estudiante.
- Es un procedimiento complejo.
- Es una herramienta potente para proporcionar
- Requiere bastante tiempo de anlisis
feedback al estudiante y ajustar las necesidades de
comparado con otras tcnicas.
formacin a nivel individual.
- Se puede realizar en pequeos grupos.


Tomada de Padilla (2002, p. 310).

Esta rejilla es un ejemplo para la el proceso de decisin vocacional.


Los elementos en esta rejilla son las elecciones profesionales a las que se les da un orden de eleccin
de 1 (ms preferida) a 10 (menos preferida), denominado rango.
El constructo son las caractersticas laborales, a las que se les asigna un rango de preferencia.
La rejilla cuenta con un sistema de puntuacin (escala tipo Likert) de 1 a 3, Poco probable a Muy
probable).
El estudiante valora cada celda dada por una profesin y una caracterstica. P.ej. diseador grfico es
probable que est remunerado (2), poco probable que exista la promocin (1) o muy probable que le
satisfaga personalmente (3).

Procedimientos de anlisis pasan por:


1) Suma de las columnas: proporciona informacin sobre qu profesin es la que ms o menos
caractersticas laborables tiene como muy o poco probables, y permite ordenarlas en funcin
de esta (rangos) (p.ej. la que ms en el ejemplo es Adjunto de Administracin.
2) Se procede a otros clculos ms complejos, como el de utilidad esperada que resulta de
multiplicar cada caracterstica laboral con una puntuacin inversa (la ms alta si fue la
primera elegida: es decir que el 1, primera elegida, en el ejemplo valdra 10 puntos
promocin), por cada uno de los valores de la profesin (columna) y sumarlos.

Este tipo de rejillas puede usarse para valorar preferencias, actitudes, valores, caractersticas
sobre elementos de formacin o accin profesional, personas, contenidos, servicios,

 
Cmo desarrollar mtodos de puntaje para la evaluacin
de ejecuciones
Uno de los aspectos clave de la evaluacin de ejecuciones es el desarrollo de un buen
mtodo de puntaje (scoring rubric) o criterios de puntaje (scoring criteria). Estos criterios
son guas que usamos para asegurar que los juicios que realizamos sobre las respuestas
abiertas son precisos, consistentes y justos. Acompaan a todos los mtodos de evaluacin
de ejecuciones donde se anticipan los grados o niveles de correccin o aceptabilidad de las
respuestas. Sin el desarrollo de estos mtodos de puntaje la herramienta de evaluacin slo
estara parcialmente definida.

Existen dos tipos de mtodos de puntaje: analtico y holstico o global

MTODO DE PUNTAJE ANALTICO

La respuesta se divide en partes relevantes. A cada parte se la evala y punta por


separado. El nmero de valoraciones producidas en un mtodo analtico es igual al nmero
de partes que evaluamos por separado.

Ejemplo

Para el ejemplo de la grfica que proponamos en la especificacin del dominio el


mtodo de puntaje analtico quedara como sigue:

Objetivo 1.0 (16 puntos)

Listado analtico S No
1.1 Selecciona y 1 0
justifica el uso de un
grfico lineal para
representar datos
1.3 Identifica una Eje X 1 0
escala de unidades
apropiada para
Eje Y 1 0
1.4 Etiquete el grfico Ttulo 1 0
adecuadamente
Variable X 1 0
Variable Y 1 0
Unidades de la escala 1 0
Limpieza 1 0

Escala de valoracin analtica Ninguno Uno Ambos


1.2 Selecciona los ejes apropiados para las variables 0 1 2

 
Ninguno 1a5 6-9 10-14
1.5 Representa en el grfico los valores X Y 0 1 2 3
correctamente
1.6 Conecta los puntos adecuadamente 0 1 2 3
..

MTODO DE PUNTAJE HOLSTICO

En este caso, la respuesta es evaluada en su conjunto por el evaluador, resultando en


un juicio global sobre su calidad. Una nica puntuacin se deriva de este mtodo.

Ejemplo

Siguiendo los mismos objetivos que el ejemplo anterior, un ejemplo de escala holstica
sera:

Valoracin Descripcin de ejecuciones


4 Opta por un grfico lineal y justifica su seleccin. Identifica las unidades de la
escala apropiadamente. Selecciona apropiadamente los ejes para cada
variable. Etiquete correctamente, de manera precisa y claramente. Representa
y conecta de 10 a 14 puntos correctamente. Usa un lenguaje apropiado para
describir de manera precisa las tendencias de los datos. Presentacin clara y
coherente.
3 Opta por un grfico lineal aunque no justifica su seleccin. Dibuja y conecta de
10 a 14 puntos correctamente. Usa un lenguaje apropiado para describir de
manera precisa las tendencias de los datos. Errores menores en: identifica las
unidades de la escala o selecciona los ejes para cada variable o etiquete el
grfico, o presenta informacin de manera clara y coherente.
2 Opta por un grfico lineal aunque no justifica su seleccin. Dibuja y conecta de 6
a 9 puntos correctamente o comete errores menores en la descripcin de
tendencia de los datos. Adems puede haber errores menores en: identificar
las unidades de la escala o seleccionar los ejes para cada variable o etiquetar
grfico o presentar informacin clara y coherentemente. No justifica el grfico.
1 Opta por un grfico lineal. Dibuja y conecta de 1 a 5 puntos correctamente
pero omite o comete errores mayores en la descripcin de tendencias de los
datos. Puede haber errores menores en: identificar las unidades de la escala o
seleccionar los ejes para las variables o etiquetar el grfico, o presentar
informacin de manera clara y coherente. No justifica o defiende el grfico.
0 Opta por un grfico de sectores o circular o cualquier otra tcnica grfica
inapropiada, con una presentacin de la informacin incoherente.

DECIDIR UN MTODO ANALTICO U HOLSTICO

Para decidirse por un sistema u otro se debe tener en mente los propsitos de la
evaluacin. Se trata de obtener una valoracin cuantitativa?es necesario un sistema de
puntaje? Si la respuesta es afirmativa una acercamiento holstico puede ser ms apropiado.
Muchas evaluaciones a gran escala incorporan evaluacin de ejecuciones y optan por un
mtodo holstico. Sin embargo, para situaciones de diagnstico puede que no sea fcilmente
adaptable.

Si nuestro propsito es diagnosticar las fortalezas y debilidades en los alumnos, o


facilitar decisiones con propsitos formativos (y no nicamente sumativos), es ms
 
recomendable optar por un mtodo analtico, que adems servir igualmente para realizar
una evaluacin sumativa.

DECIDIR UN TIPO DE ESCALA

Una vez se ha decidido el mtodo de puntaje, uno de los dos o la combinacin de


ambos, la siguiente decisin es establecer el tipo de escala que se va a utilizar. Esta decisin
se realizar en funcin del tipo de tarea y de los grados de variabilidad que se espere en las
respuestas. Podemos usar dos tipos: a) una lista o, b) una escala de valoracin.

a) Lista
Habitualmente la lista est asociada a los indicadores del dominio de contenido y
permite una clasificacin dicotmica de calidad basada en cada indicador. Cada
categora de puntaje a comprobar se asocia a un valor numrico.

Ejemplos: S= 1 No= 0; Presente= 1 Ausente=0; Observado= 1 No observado=0

b) Escala de valoracin
La escala de valoracin es un conjunto ordenado de categoras que denotan
diferentes grados de calidad.

Ejemplos de una escala de 4 puntos (pueden ser de 3, 4, 5, 7 o ms): 0= No


observado; 1= Observado algunas veces; 2= Observado la mayor parte de las veces; 3=
Observado de manera consistente y muy frecuentemente.

Definicin operativa de los puntos de la escala

Para permitir un puntaje consistente realizado por diferente jueces u observadores


es importante definir operativamente los puntos de la escala con indicadores observables de
la ejecucin que permitan obtener evidencias de las conductas tpicas. Las escalas de
valoracin son muy populares en educacin, pero extremadamente difciles de implementar
con fiabilidad porque los descriptores de las categoras se definen muchas veces de manera
vaga y no presentan conductas directamente observables.

Un ejemplo de una escala que no define claramente los descriptores observables

Indicador: Representa los valores X Y en el grfico de manera precisa

Escala 1: 0= Pobre 1=Satisfactorio 2=Bueno


3=Excelente

Escala 2: 0= Por debajo de la media 1=Medio 2=Por encima de la media


3=Excelente

El problema en las dos escalas es que los descriptores del tipo Bueno o Excelente
son demasiado amplios y pueden comportar diferentes significados en los evaluadores.

 
Las mejoras en los descriptores unidos a la escala de puntuacin puede realizarse
considerando los errores tpicos y las omisiones encontradas en una muestra de respuestas.
Por ejemplo, para la tarea del grfico el uso de descriptores observables puede generar una
escala de cuatro puntos como la siguiente:

Indicador: Representa los valores X Y en el grfico de manera precisa

Escala 1: 0= Ninguno 1=1-5 puntos 2= 6-9 puntos 3= 10-


14 puntos

PASOS PARA CONSTRUIR UN NIVEL DE EJECUCIN (RUBRIC)

Los pasos que se deben tomar para disear los niveles en una evaluacin de
ejecuciones deben comenzar con acciones tomadas durante la planificacin (o mientras se
desarrollan las especificaciones) y acaban con la tarea de evaluacin finalizada y el nivel
(rubric), como se describe a continuacin:

En las especificaciones:

1) Identificar y justificar el mejor mtodo de evaluacin a travs del cual se van a


obtener evidencias del dominio de las conductas u objetivos del dominio educativo.
(un producto?una observacin de las conductas presente o demostradas?un
ensayo?un portafolio?)
2) Especificar si ser usada un mtodo analtico u holstico o la combinacin de ambos.
3) Especificar el esquema de puntuacin o la localizacin de cada punto de la escala que
se va a utilizar. Lista o escala de valoracin?
4) Identificar los pesos en trminos de valores de los puntos para situarlos en
diferentes componentes del indicador. Esto es importante para el mtodo analtico.
Entonces:

5) Disear un ejercicio para capturar los objetivos especificados y las conductas del
dominio educativo. Escribir las instrucciones y las indicaciones para motivar las
respuestas, situar el contexto y las condiciones y proporcionar instrucciones para los
evaluadores.
6) Desarrollar un borrador de mtodo de puntaje. Usar descriptores observables para
definir la calidad de las respuestas segn diferentes niveles de aceptabilidad. Tratar
de definir operativamente casa punto de la escala.
7) Probar la tarea en una muestra de alumnos (o alternativamente ejecutar la tarea
uno mismo). Observar o recopilar datos sobre posibles rangos de respuesta a la
tarea.
8) Listar los errores ms comunes, las omisiones, las imprecisiones que se encuentran
en las respuestas tpicas. Basndose en el anlisis de estos errores, revisar los
descriptores del mtodo de puntaje utilizado. Usar las respuestas presentes para
clarificar indicadores observables a diferentes niveles de calidad.
9) Intentar puntuar las respuestas presentes usando el mtodo de puntaje revisado.
Valorar hasta qu punto con los niveles de ejecucin establecidos para un indicador
se facilita una puntuacin consistente por diferentes evaluadores ya entrenados.
10) Comprobar, para estar seguros, que los niveles de ejecucin se asocian a los
indicadores originalmente especificados en el dominio.

 
11) Conservar algunas respuestas de la muestra en cada punto de la escala para usar
como modelos de anclaje (modelos de respuesta) durante la puntuacin.

 
Algunas referencias bibliogrficas
Anguera, M.T. (1982). Metodologa de la observacin en las ciencias humanas.
Madrid: Ctedra.

Barton, J. y Collins, A. (1993). Portfolios in Teacher Education. Journal of Teacher


Education, 44 (3), 200-212.

Chatterji, M. (2003). Designing and Using Tools for Educational Assessment. Boston
(MA): Pearson Education.

Coln, M.T., Gin, N. e Imbernon, F. (2006). La carpeta de aprendizaje del alumnado


universitario: la autonoma del estudiante en el proceso de aprendizaje. Barcelona: Ediciones
Octaedro.

CRESST. CRESST Assessment Glossary.


http://www.cse.ucla.edu/CRESST/pages/glossary.htm (julio, 2006).

De Miguel, M. (Dir.) (2004). Adaptacin de los planes de estudio al proceso de


convergencia europea. ANECA. http://www.mec.es/univ/index.htm (enero 2005).

De Miguel, M. (Dir.), Alfaro, I.J., Apodaca, P., Arias, J.M., Garca Jimnez, E., Lobato
Fraile, C., Prez Boullosa, A. (2006a). Modalidades de enseanza centradas en el desarrollo
de competencias. Orientaciones para promover el cambio metodolgico en el Espacio
Europeo de Educacin Superior. Ediciones Universidad de Oviedo: Oviedo.

De Miguel, M. (Dir.), Alfaro, I.J., Apodaca, P., Arias, J.M., Garca Jimnez, E., Lobato
Fraile, C., Prez Boullosa, A. (2006b). Metodologas de enseanza y aprendizaje para el
desarrollo de competencias. Orientaciones para el profesorado universitario ante el Espacio
Europeo de Educacin Superior. Alianza Editorial: Madrid.

ERIC Thesaurus On-line. Term: Alternative Assessment.

Morales Vallejo, P., Urosa Sanz, B. y Blanco Blanco, A. (2003). Construccin de


Escalas de Actitudes tipo Likert. Madrid: La Muralla.

Padilla, M.T. (2002). Tcnicas e instrumentos para el diagnstico y la evaluacin


educativa. Madrid: Editorial CCS.

Servei de Formaci Permanent. Evaluacin de estudiantes.


http://www.uv.es/sfp/pdi/material_formatiu.htm (febrero 2003).

Shelley, K. y Howell, S.L. (2008). The State of Authentic Assessment. ERIC Report
#ED503679.

 
Shrock, S. y Coscarelli, W. (2000). Criterion-Referenced test Development: technical
and legal guidelines for corporate training and certification. (2 Ed.). Silver Spring (MD):
nd

International Society for Performance Improvement.

Suen, H.K. (1990). Principles of Test Theories. Hillsdale, NJ: LEA.

Suen, H.K. y Ary, D. (1989). Analyzing Quantitative Behavioral Observation Data.


Hillsdale, NJ: LEA.

Wiggins, G. (1998). Educative Assessment. Designing Assessments To Inform and


Improve Student Performance. San Francisco (CA): Jossey-Bass Publishers.

También podría gustarte