Está en la página 1de 70

Módulo 2

Técnicas e instrumentos de la evaluación de los


aprendizajes

Continuamos nuestro trabajo con el segundo módulo de nuestra Diplomatura en


Evaluación Educativa.

Le recordamos que los módulos deben ir archivándolos para tenerlos siempre


disponibles.

Analicemos, en primer lugar, el recorrido a realizar a través de los objetivos que nos
proponemos lograr …

Objetivo general:
Elaborar instrumentos de evaluación que cumplan con los criterios de validez y
confiabilidad.

Unidad 1:
Procedimientos, técnicas e instrumentos de la evaluación.

Objetivos:

 Explicar la noción de procedimientos evaluativos.


 Analizar las diferencias entre técnicas e instrumentos.
 Realizar una clasificación de técnicas e instrumentos.
 Evaluar motivos en la elección de instrumentos y técnicas.
 Delimitar las características de la observación y distinguir entre observación
directa e indirecta.
 Analizar la importancia de la observación sistemática.
 Explicar la importancia de la resolución de problemas.
 Explicar el objetivo de la entrevista y distinguir entre entrevistas individuales y
colectivas.
 Diferenciar técnicas cualitativas y cuantitativas de recolección de datos.
 Evaluar el uso de los cuestionarios.
 Distinguir entre cuestionarios abiertos y cerrados.
 Analizar las características y la utilidad del informe de evaluación.
 Comparar el uso del debate dirigido, el grupo de discusión, el Phillips 66, el foro, el
seminario, la discusión de gabinete, el diálogo o debate público y el torbellino de
ideas.
 Distinguir entre mapa conceptual, mapa mental y red conceptual y analizar sus
usos.
 Analizar las características de la planificación de la evaluación.
 Caracterizar las pruebas multiítem.
 Diferenciar las características básicas de las pruebas orales.
 Diferenciar las características básicas de las pruebas prácticas.
 Valorar el registro anecdótico y el R.S.A. como instrumentos de evaluación.
 Explicar el uso de las escalas de Thurnstone, de LIckert y de Osgood.
 Analizar las principales características y utilidad del portafolio.
 Analizar las características del juicio de expertos.
 Distinguir entre diferentes criterios de evaluación y relacionarlos entre sí.

Contenidos:

Procedimientos evaluativos.
Herramientas: técnicas e instrumentos.
Clasificación general de herramientas.
Tabla de especificaciones.
Observación y resolución de problemas.
Observación sistemática.
Resolución de problemas.
La técnica de recolección de datos.
Entrevista o técnica de autodescripción.
Cuestionarios y su importancia.
Informe como técnica evaluativa.
Características técnicas de los informes.
Debate y sus modalidades.
Tipos de variantes para el uso del debate.
Organizadores conceptuales o gráficos.
La planificación de la evaluación.
Pruebas multiítem de base común.
Pruebas orales.
Pruebas prácticas.
Registro anecdótico o de incidentes.
Registro de secuencia de aprendizajes (R.S.A.) y lista de cotejos.
Escalas de calificación.
El portafolio como técnica de evaluación.
Juicio de expertos.
Clasificación de los criterios de la evaluación.
Prácticas comunes en la evaluación.
Unidad 2:
El problema de la validez y la confiabilidad de los instrumentos de
evaluación

Objetivos:

 Analizar la relación entre validez y confiabilidad.


 Conocer los diferentes tipos de validez de los instrumentos de evaluación.
 Describir los diferentes factores que afectan a la confiabilidad.
 Calcular el coeficiente de confiabilidad a través de diferentes modelos.
 Contenidos:
 El problema de la validez y la confiabilidad de los instrumentos de evaluación.
 Tipos de validez: de contenido, de criterio y de constructo.
 Criterios para obtener la validez.
 Criterios para mejorar la confiabilidad de un instrumento evaluativo.
 Factores que afectan la confiabilidad.
 Coeficiente de confiabilidad. Modelos.

Iniciamos el recorrido por el módulo …

Unidad 1
Procedimientos, técnicas e instrumentos de la evaluación

Procedimientos evaluativos:
Se puede definir como procedimientos a las maneras de obrar y de actuar para
conseguir un fin. Estos procedimientos se relacionan concretamente con la selección y
preparación de las herramientas, es decir técnicas e instrumentos que se van a utilizar
para la evaluación, lo que resulta una tarea muy importante.
De una buena selección de las técnicas e instrumentos que guarden coherencia
con los objetivos propuestos, se deriva una buena recolección de información (sobre el
alumno, sobre los procesos de enseñanza y de aprendizaje). Y los materiales que
servirán como base para una reorientación del aprendizaje.
Desde otro punto de vista, los procedimientos se pueden comprender como la
serie de herramientas a aplicar en su conjunto o los protocolos de decisión de cara a la
evaluación.

Herramientas: técnicas e instrumentos para la evaluación:


Centrando la atención en la evaluación de los aprendizajes la preocupación se
ubica en la selección de las herramientas, es decir, las técnicas y los instrumentos más
adecuados para llevar a cabo la tarea de evaluación.
Las técnicas representan el conjunto de procedimientos y actividades que
permiten que se manifieste y demuestre el aprendizaje obtenido para poder valorarlo y
compararlo con los objetivos propuestos.
Los instrumentos son los medios de se sirve el docente para guiar o conducir una
técnica y recabar en forma sistematizada la información.
En cuanto a los criterios para seleccionar una técnica, interesan:
 Las características de los alumnos.
 Los objetivos establecidos.
 El tipo de aprendizaje que se desea evaluar.
 Los medios con que se cuenta.
 El tiempo disponible.
En la búsqueda de los instrumentos de evaluación es necesario tener presente
algunos aspectos fundamentales: a) una de las principales tareas del evaluador es la
construcción de instrumentos, por lo que es en este aspecto dónde se pone de manifiesto
la pericia del evaluador; b) ningún objeto de evaluación, por ejemplo el dominio de
determinadas competencias, puede ser abarcado en su totalidad con un único
instrumento, por tanto es necesario abandonar la idea sobre la posibilidad de construir un
instrumento de evaluación absolutamente abarcativo; c) cada uno de los diferentes tipos
de instrumentos y técnicas de recolección y registro de la información posee ventajas y
desventajas, la ponderación de ambos aspectos y la idea de complementariedad de éstos
deben orientar la selección de los instrumentos a emplear.
Tanto las técnicas como los instrumentos deben elegirse en función de algunos
criterios tales como características de los participantes, escolaridad, alfabetización,
experiencia en resolver pruebas y modos de expresión, objetivos y naturaleza del
aprendizaje y preparación de la persona encargada de coordinar la aplicación de la
evaluación.
Existen muchas tipologías o clasificaciones de técnicas e instrumentos, pero más
allá de la adopción de unos u otros criterios clasificatorios lo central es poder identificar
estas diferentes herramientas como complementarias entre sí y por ende la necesidad de
incluir cierta variedad de las mismas en la tarea de la evaluación.
A continuación se enumeran diferentes técnicas e instrumentos que se elaboran
especialmente para generar información que alimente los procesos de evaluación:
a) Técnicas basadas en la observación (de proceso o de producto):
 Lista de control o de cotejo.
 Registros anecdóticos o de secuencias de aprendizaje (R.S.A.).
 Observación y formulación de hipótesis.
 Escalas (de apreciación o de clasificación).
b) Pruebas orales o escritas:
I. Estructuradas.
 De recordación (preguntas de respuesta breve, completamiento, identificación de
elementos en diagramas).
 De reconocimiento (localización en un mapa, doble alternativa, pareamiento,
selección múltiple)
II. Semiestructuradas:
 De recordación de datos sobre una base.
 Comparación de elementos según criterio.
 Establecimiento de relaciones de causa y efecto.
 Resumen o síntesis.
 Elaboración de esquemas o cuadros sinópticos.
III. No estructuradas:
 Debate.
 Entrevista.
 Encuesta.
 Habilidad para aplicar un principio.
 Interpretación de relaciones.
 Reconocimiento de inferencias.
 Reconocimiento de hipótesis.
c) Otros instrumentos:
 Cuestionarios cerrados.
 Cuestionarios abiertos.
 Informes abiertos.
 Informes guiados.
 Entrevistas abiertas.
 Entrevistas guiadas.
 Autoinformes.
 Intravistas.
Por último se enumeran tipos de herramientas cuyo contenido central tienen
existencia anterior o independiente del proceso de evaluación y a los que se recurre
productivamente para extraer información según las necesidades impuestas por este
proceso. Entre ellos encontramos:
 Análisis de contenidos.
 Portafolios.

Tabla de especificaciones:
La tabla de especificaciones es un dispositivo que se emplea para relacionar los
objetivos perseguidos durante el proceso de enseñanza o aprendizaje, con los contenidos
fundamentales de cada área o disciplina.
La construcción de este instrumento permite:
 Relacionar objetivos y contenidos.
 Reflexionar acerca del énfasis que se da a cada objetivo y a cada contenido
durante el aprendizaje.
 Considerar productos de aprendizaje más complejos.
 Mejorar el poder discriminativo de la prueba.
 Elaborar una prueba representativa y equilibrada.
En cuanto a los pasos para la elaboración de una tabla de especificaciones
interesan:
 Seleccionar objetivos.
 Seleccionar contenidos.
 Dar una importancia relativa a cada objetivo.
 Decidir el porcentaje con coherencia con el enfoque de los procesos de enseñanza
y aprendizaje.
 Otorgar importancia relativa a los contenidos.
 Determinar el puntaje total de la prueba.
 Calcular el puntaje correspondiente a cada categoría de objetivos.
Ejemplo: Reconocer 11% de 45 5 puntos
Conceptualizar 20% de 45 9 puntos
Construir algoritmos 27% de 45 12 puntos
Resolver problemas 42 % de 45 19 puntos
Total de puntos: 45

Observación y resolución de problemas:


Una serie de técnicas e instrumentos se pueden utilizar con el fin de llevar a cabo
el diagnóstico basado el currículo se pueden utilizar estrategias diagnósticas que también
se pueden emplear en la evaluación sumativa y formativa, algunas de ellas son la
observación y la resolución de problemas.
Es importante tener en cuenta que estas estrategias requieren la confección de un
conjunto de actividades estructuradas de manera flexible que permiten organizar la
información con el fin de producir aprendizajes profundos y significativos.
La observación es un proceso intelectual que necesita de la atención y
concentración selectiva de la acción mental que se transforma en mayor eficacia sobre
un determinado sector.
La observación se utiliza para evaluar el proceso pedagógico, para corroborar una
hipótesis y para realizar un diagnóstico. Se requiere del seguimiento de determinados
pasos y del arribo a acuerdos escolares antes de ser llevada a cabo. Los acuerdos
implican la determinación de aquello que se va a observar, el marco teórico desde donde
se mirará y la comunicación de las conclusiones una vez finalizada la observación.
Existe gran número de instrumentos para registrar, almacenar y representar lo
observado.
En la observación sistemática es necesario identificar que se pretende observar
por ejemplo hábitos de trabajo, formas de organización, etc.
Las situaciones objeto de observación son:
- Actividades de enseñanza y aprendizaje en diferentes contextos.
- Documentos institucionales.
- Reuniones de padres, asambleas, jornadas, recreos, etc.
Es importante que el observador registre con el mayor grado de exactitud lo que
acontece para luego producir un informe destacando los datos más significativos, esto
requiere de una preparación y esfuerzo por parte del observador.
La resolución de problemas es otra técnica importante para la evaluación en
cualquier de sus formas.
Los problemas son situaciones nuevas, sorprendentes e interesantes que
requieren del uso de procedimientos heurísticos. Propone la utilización de caminos a
seguir no estereotipados, la utilización de procedimientos originales promoviendo de esta
manera la generación de un pensamiento dinámico, productivo, crítico y creativo. Se
caracteriza por crear en el alumno el hábito y la actitud de enfrentarse al aprendizaje
como un problema al que hay que encontrar respuesta. No se trata solo de enseñar a
resolver problemas sino también de enseñar a plantearse problemas, a convertir la
realidad en un problema que merece ser indagado y estudiado.
Los requisitos para su resolución son que se formule de acuerdo con las
competencias que poseen quienes tienen que resolverlos, que despierten interés, que
permitan formular hipótesis, su comprobación y la enunciación de nuevos interrogantes.
Según el ámbito donde se desarrollan pueden clasificarse en problemas científicos,
cotidianos y escolares. Según el tipo de pensamiento que se activa en su resolución y
que pueden ser productivos cuando permiten la resolución a través de la utilización de
actividades novedosas y reproductivas para su resolución se utilizan actividades
repetitivas que lleva a los problemas a transformarse en ejercicios.

La técnica de recolección de datos:


Es importante recurrir al mismo alumno para conocer, por ejemplo, las actividades
que realizó, su comportamiento pasado y recabar informaciones relativas a su vida
interior, sentimientos, intereses, opiniones. Este tipo de información sobre la persona es
muy difícil de obtener mediante procedimientos de pruebas o de observación.
Este tipo de procedimientos permite recolectar datos que luego de ser analizados
e interpretados posibilitan el arribo a una conclusión respecto de la pregunta o problema
que el docente plantea. Los datos obtenidos pueden ser cualitativos o cuantitativos, por
ende la recolección de los primeros se realiza a través de cuestionarios estandarizados y
pruebas estructurados, mientras que los segundos a partir de entrevistas y observaciones
entre otras.
La entrevista pertenece al tipo de procedimientos de autoinforme oral, mientras
que el cuestionario y los inventarios, junto con las escalas de actitudes, pertenecen al tipo
de procedimientos de autoinforme escrito.

La entrevista o técnica de autodescripción en foco:


La entrevista o técnica de autodescripción es otro instrumento de evaluación no
estructurada que puede ser utilizado en forma escrita u oral, y que puede realizarse en
forma individual o colectiva.
La entrevista es una conversación intencional que se realiza con el fin de conocer
la opinión, la representación, las creencias que poseen los alumnos sobre un determinado
tema. Permite obtener respuestas particulares y únicas que proveen una variada
información.
La entrevista exige la relación, generalmente frente a frente, entre el entrevistador,
persona que dirige la entrevista, que interroga y que busca la información, y el
entrevistado, que es la persona que proporciona la información al responder las preguntas
que se le formulan.
La entrevista es una técnica escasamente utilizada por los docentes y directivos
en las instituciones educativas debido a que requiere un tiempo de preparación, un
espacio para ser llevado a cabo, un tiempo para la implementación, para el análisis y la
interpretación de los datos. Quien realiza una entrevista necesita invertir mucho esfuerzo
para arribar a conclusiones que no pueden ser generalizables.

La realización de una entrevista consta de etapas:


Preparación donde se seleccionan los objetivos y ejes temáticos a partir de los
cuales se formulan preguntas que guían la entrevista pero que se estructurarán de
manera flexible en función de lo que acontezca;
Iniciación: donde se establece el contacto con el entrevistado para entrar en
tema;
Desarrollo: que es el momento más sustancial del encuentro porque se produce
el intercambio entre ambos sujetos;
Cierre: se elabora un resumen y se pregunta cómo se sintió el entrevistado.
Al igual que las técnicas de observación y las de análisis de rendimiento escolar
las entrevistas pueden usarse para evaluar aspectos muy diversos: intereses, fines, logros
de objetivos, dificultades de aprendizaje, actitudes y valores.
Para comprender mejor lo dicho puede servir el siguiente esquema:

INICIACIÓN

ETAPAS DE LA DESARROLLO
ENTREVISTA

CIERRE

En el ámbito educativo la utilización de la entrevista favorece el desarrollo de un


contacto estrecho entre el docente y el alumno que posibilita conocer como acontece su
aprendizaje; entre el docente y el directivo para identificar el desarrollo de la práctica
profesional, entre otras posibilidades.
Las preguntas para la entrevista deben confeccionarse de acuerdo con:
a) Una secuencia general en torno a una línea o núcleo.
b) Con adecuación a la experiencia y conocimientos del alumno.
c) Las preguntas generales deben preceder a las específicas.
d) La secuencia completa debe seguir algún orden lógico.
e) Algunas preguntas deben hacerse al final para no influir sobre las otras.
En cuanto a la interpretación de los datos de la entrevista, ésta debe conducir a la
obtención de comentarios o respuestas del alumno que indiquen si las hipótesis
planteadas son las correctas. Cuando se registra una entrevista, el docente trata
simplemente de recordar los principales hallazgos, y deberá hacer un esfuerzo por
concentrarse en lo que el alumno dijo o hizo en el curso de la misma.
Finalmente deben tenerse en cuenta los siguientes aspectos respecto de la
entrevista:
 Planificar la entrevista para obtener y ordenar la información pertinente.
 Ayudar al alumno a adoptar una actitud relajada y suprimir todo protocolo.
 Ubicarse en el lugar del alumno e intentar ver las cosas desde su óptica.
 Hablar al mismo nivel que el alumno manteniendo una actitud de cooperación y sin
alardes de autoridad.
 Dar al alumno toda la responsabilidad que sea capaz de asumir y ayudarle a
encadenar las fases de su razonamiento.
 Terminar la entrevista con una actitud optimista, dejando al alumno menos
preocupado y más seguro de sí mismo.
 Prestar especial atención a los comentarios finales del alumno.

-Entrevista colectiva: Un equipo de miembros elegidos por el grupo interroga a un


experto ante el auditorio sobre un tema de interés previamente establecido.

Cuestionarios en foco:
El cuestionario puede ser analizado como un tipo de entrevista y puede ser de
autoinforme, es decir, entrevista altamente estructurada y que presenta las preguntas en
forma escrita para que la persona que contesta lo lea y luego responda.
Más específicamente, el cuestionario es una técnica en la que se obtienen
respuestas orales o escritas las mismas no son elaboradas por el docente para que el
alumno solo tenga que identificar las que consideran pertinente frente al conjunto de
opciones presentadas.
En la institución educativa puede administrarse con el fin de construir el perfil de
los diferentes actores de la institución educativa, o bien para determinar el grado de
acuerdo o desacuerdo respecto de un cambio que se implementa en la institución. Se
debe construir en forma de pruebas estructuradas que constan de diferentes ítems entre
los que se puede contar con opciones múltiples, apareamiento, completamiento de laguna
o preguntas que requieran de una respuesta muy estructurada como puede ser el tiempo
de lectura, lo que más lee, etc.
Los datos obtenidos permiten comparar los datos recolectados en diferentes
tiempos o espacios, como así también contrastar una misma población a través del
tiempo. Y de esta manera determinar las fortalezas y debilidades respecto del
aprendizaje, la enseñanza o la evaluación.
Los cuestionarios se clasifican en:
- De acuerdo al tipo de respuesta:
a) Directa son resueltos por la persona que ejecuta el diagnóstico y generalmente no
requieren de la presencia de un encuestador.
b) Indirecta el docente encargado de formular las preguntas y el alumno deberá señalar
con una tilde o cruz la respuesta.
- De acuerdo con el tipo de preguntas:
a) Abiertas: en la cual el encuestado contesta todo lo que sabe respecto de la cuestión a
ser evaluada.
b) Cerradas o dicotómicas se las conoce también con el nombre de alternativas fijas ya
que el alumno opta entre un sí y un no, no se obtienen posiciones intermedias y son de
fácil tabulación.
En el caso particular de cuestionarios de elección múltiple las preguntas
formuladas son cerradas y se presentan con alternativas de respuestas de las cuales el
sujeto debe seleccionar la o las que considera correctas.
Los cuestionarios se pueden emplear tanto en el diagnóstico institucional como
áulico por que permiten recolectar un amplio espectro de información en un tiempo
reducido y de esta manera luego del análisis e interpretación de los datos se puede tener
una visión general de la problemática objeto de la evaluación.
Si se compara la entrevista con el cuestionario, se puede deducir que éstos
poseen ciertas ventajas y también algunas desventajas con relación a la entrevista.

Ventajas Desventajas
El sujeto registra sus propias respuestas. Produce en general informaciones más
superficiales que la entrevista porque se
hace más difícil señalar razones que
justifican la respuesta.
Puede utilizarse en situaciones grupales. Las preguntas pueden responderse con
menor atención que en la entrevista.
Insume menos tiempo que la entrevista, Exige una cierta habilidad mínima de
tanto al docente como al alumno. lectura a quien responda, la que limita su
utilización en ciertos niveles.
Posibilita atender a una muestra mayor y su Dificulta la posibilidad de ir más allá de lo
estudio es más amplio en aquellos manifestado por quien responde.
aspectos que realmente interesan.
Posibilita respuestas de mayor franqueza, No delimita generalmente los objetivos que
si es anónimo. pueden ser muy largos (aunque esto se
puede subsanar para evitar cansancio o
aburrimiento).

Importancia de los informes como estrategias metodológicas y evaluativos:


Muchas de las actividades intelectuales del ámbito académico se ejecutan fuera de
los recintos áulicos y bibliotecarios. Tanto en las Ciencias Naturales como en las Ciencias
Sociales, los trabajos de campo son muy frecuentes, y en el primer caso, también los de
laboratorio.
Informar se define como enterar, dar noticia de una cosa. El primer concepto
consiste en describir una situación real, cualquier de las relaciones humanas, políticas o
administrativas, todo lo que interesa a diversas disciplinas antropológicas, sociológicas,
lingüísticas o la investigación administrativa.
El informe requiere la elaboración previa de algún diseño de campo o
experimental, y realizado este trabajo y observado el fenómeno en cuestión, se procede a
describirlo detalladamente e interpretarlo de acuerdo con los conocimientos teóricos.
La elaboración de los informes ayuda al alumno en el desarrollo de su labor
intelectual en varios sentidos: desarrolla la capacidad de observación, ayuda a recolectar
datos, organiza los datos observados, hace gráficos relacionados, incentiva la aplicación
de nociones teóricas del alumno y orienta la interpretación sistemática de los hechos para
comunicarlos.

a) Características de los informes:


Las principales características que distinguen al informe escrito son:
1. El informe es generalmente preparado a pedido de un superior (profesor, jefe) o de un
cliente. Excepcionalmente se escribe de propia iniciativa.
2. El informe es leído como una obligación de trabajo por el destinatario.
3. El informe es preparado en una situación específica y cumple una necesidad de
información para tomar una decisión por parte del nivel superior.
4. El lector del informe es generalmente un solo individuo, y a veces, un grupo
estrechamente unido, por razones de trabajo o de función.
5. El informe se caracteriza también por el uso liberal de cuadros, gráficos, fotografías u
otro tipo de material documental.
6. El informe es factual. Cuando se aportan opiniones personales, conclusiones,
recomendaciones o solicitudes, se las denomina como tales y sus fundamentos se dan a
conocer al lector.
7. El informe contiene la metodología usada para reunir la información.
8. El informe recurre al vocabulario y fraseología técnicos, y elude las formas meramente
literarias.
Estas características determinan todo el proceso de elaboración de un informe,
desde la etapa inicial de reunir los elementos informativos hasta la redacción y
diagramación finales.

b) Estructura básica de un informe:


Las habilidades que requiere la elaboración de este tipo de textos son la reducción
y la selección de información de las fuentes escritas y no escritas que se han consultado;
la jerarquización, ordenamiento y puesta en relación de la información; la elaboración de
inferencias y de juicios sobre lo analizado, y finalmente, la habilidad para comunicar por
escrito los resultados del trabajo realizado. Esto implica el dominio de estrategias de
análisis y globalización combinadas.
Entre los informes típicos de las actividades de los universitarios se encuentran los
informes bibliográficos. Estos informes son textos en los que el estudiante expone el
producto del trabajo de lectura y de análisis de un conjunto de documentos que ha debido
consultar sobre un tema propuesto por una cátedra.
El estudiante debe poder transmitir por escrito los resultados de su actividad
interpretativa, poner en evidencia su capacidad de comprensión y de síntesis en un texto
en el que se presente claramente el tema, se lo desarrolle y se planteen conclusiones.
El evaluador del informe bibliográfico no debe tener necesidad de recurrir a los
textos que allí se exponen para comprender el análisis propuesto por el estudiante. Es por
eso que este tipo de informe suele presentar una organización en diferentes partes, que
facilita la comprensión.
Partes del informe bibliográfico o reseña:
1. La introducción en la que se presenta y delimita el tema y el objetivo del trabajo; se
anuncian, se caracterizan o se sitúan los documentos a analizar; se justifica el tratamiento
que se hará de los documentos; y eventualmente, se explican o se anticipan los pasos
que se seguirán en el desarrollo del escrito.
2. Un desarrollo en el que pueden plantearse las ideas comunes de las diferentes
fuentes y luego las diferencias o las ideas contrapuestas; y pueden tomarse diferentes
aspectos de 1 tema y tratarlos de acuerdo con los planteos de cada autor
3. Un cierre en el que se suelen sintetizar los contenidos desarrollados; y aportar
elementos de juicio sobre su valor.

c) El esquema o guía del informe:


Todo escrito es, en esencia, un trabajo intelectual que debe ejecutarse con cierto
método.
Antes de redactar debe prepararse un plan completo del texto, comúnmente
denominado esquema o guía. Nunca se comienza a escribir al acaso, de primera
intención, confiando en que las ideas irán apareciendo en su orden lógico a medida que
avance la escritura. Esas ideas pueden no aparecer o surgir a destiempo, o no ser
pertinentes o suficientemente demostrativas.
La confección de un plan previo ofrece estas ventajas:
 Visión en un cuadro sinóptico del asunto en su totalidad, lo cual permite saber de
antemano:
 Con cuáles hechos, ideas o argumentos se cuenta para agotar el tratamiento del
tema, y de cuáles se carece y es necesario investigar;
 Apreciación comparada de los distintos elementos del informe, con sus virtudes o
defectos:
 excesos, carencias, inconveniencia, desorden, incoherencia, debilidad y
jerarquización conceptual:
 Facilidad para la corrección, enmiendas, supresiones o agregados que son más
engorrosos y lentos de realizar una vez redactado el texto completo;
 Redacción más armónica, fluida y adecuada, pues se hace a partir de una posición
estratégica ya tomada y las palabras, tono y estilo se conforman mejor a ella.
El plan se organiza ordenado jerárquicamente en las tres partes básicas:
introducción, cuerpo y conclusión, e incluidas dentro de ellas las ideas principales, y si son
necesarias, las ideas de apoyo.

d) El empleo de tablas y gráficos:


El empleo de tablas y gráficos en los informes plantea problemas especiales. No
existe ninguna norma categórica al respecto. Sin embargo, en la práctica se aceptan,
como generales, dos reglas:
El texto escrito debe poder leerse, aun omitiendo a lectura de las ilustraciones,
tendría una idea acabada del mensaje transmitido. Pero para el caso de que las tablas y
números fueran complemento ineludible de la información transmitida, dichas tablas o
gráficos sólo expresarán en forma resumida las ideas principales. Se colocarán
inmediatamente antes o después de la idea que ilustran.
Cada tabla o gráfico presentará una sola idea, con el objeto de que su contenido e
importancia puedan comprenderse rápida y claramente.
El fundamento de estas reglas deriva de la práctica tanto en la actividad
empresaria como académica. El lector debe tener la posibilidad de enterarse en detalle de
los datos numéricos o gráficos a su voluntad. Si resulta satisfecho con los datos sumarios
dejará a un lado la lectura del anexo o, en caso contrario, recurrirá al análisis de las tablas
finales.
Al mismo tiempo, el informante decidirá a su criterio si los incluye o no, en la
medida que sean pertinentes, fundamentales, demostrativos o de lectura urgente. Por lo
general, cuando se supone que el informe tendrá una validez larga y será archivado para
consulta en el futuro, es conveniente agregar las tablas y gráficos analíticos en el
apéndice.

e) Listas o enumeraciones internas:


En la redacción moderna se ha adoptado la práctica de adentrar y ordenar
verticalmente las ideas de una misma categoría, precediéndolas de un número, una letra,
un guión o un punto grueso, para facilitar su lectura y comprensión. Es una forma
ventajosa de presentar con claridad una serie de pensamientos conectados entre sí y
permitir una mejor comparación evaluativa de ellos.
Cada una de las ideas enumeradas se redactan en una o muy pocas líneas
(aproximadamente cinco) y resume un pensamiento sustancial y significativo, sin entrar en
detalles, porque éstos se suponen sobreentendidos por el lector. Con esto se logra dar
más fuerza y valor demostrativo a la expresión y proporcionar una visión totalizadora y
rápida del problema.
Por otra parte, una redacción de este estilo obliga al escritor a seleccionar
inteligentemente los diversos puntos, sin incurrir en repeticiones o confusión de ideas.
Los diversos elementos de la enumeración se presentan en una gradación, según
su valor e importancia. Puede ser decreciente, es decir, del elemento más importante al
menos importante, o creciente, a la inversa. Se emplea la enumeración decreciente
cuando se pretende ser más categórico y expeditivo, y la creciente, cuando se adopta una
estrategia más persuasiva.
El empleo correcto de este recurso de las listas exige estas condiciones:
 Que las ideas seleccionadas resuman en sí contenidos importantes, de la misma
categoría conceptual, y no se repitan o estén incluidos ya en otro punto anterior;
 Que no sean muy extensos los puntos o las listas, porque entonces se perdería el
objetivo de claridad, serían difíciles de abarcar en una sola visión y ofrecerían
dificultad de recordación;
 Que las estructuras o formas gramaticales empleadas sean concordantes:
oraciones enteras, frases con verbos en infinitivo o sustantivos, sin mezclarlas.

f) La presentación o diagramación del informe:


Los contenidos de un informe suelen agruparse según las normas de la institución
o empresa, dentro de la cual circula el escrito. Sin embargo, la organización ideal y
completa de un informe debe hacerse en la siguiente forma:
 Cubierta.
 Título, nombre del autor, lugar, fecha, nombre de la organización y número de
serie.
 Tabla de contenido.
 Sumario o índice.
 Informe propiamente dicho.
 Introducción.
 Desarrollo o cuerpo.
 Conclusión.
 Apéndices o anexos.
 Bibliografía.
 Ilustraciones, gráficas, etc., o todo otro material complementario.

I. Debate en foco:
El debate es una forma de evaluar de forma inestructurada. Siempre se centra un
tema problemático, y por ello no puede usarse en forma indiscriminada para diagnosticar
cualquier contenido conceptual, sino aquellos que se presten para planificarlo, por
ejemplo, acciones de personas importantes dentro de una sociedad. Se distinguen:
a) Debate dirigido o discusión guiada: Un grupo reducido trata un tema en discusión
informal con la ayuda activa y estimulante de un conductor.

b) Pequeño grupo de discusión: Un grupo reducido trata un tema o problema en


discusión e informal, conducido por un coordinador.

c) Phillips 66: Un grupo grande se divide en subgrupos de seis personas, para discutir
durante seis minutos un tema y llegar a una conclusión. De los informes de todos los
subgrupos se extrae luego la conclusión general.
Un portavoz de cada grupo expone en el aula común sus resultados, que una vez
comparados con los del resto de los subgrupos serán sintetizados por el moderador y
anotados en la pizarra. Si todavía quedasen puntos por tratar se repite el proceso hasta
que se hayan trabajado todos los aspectos.

d) Foro: El grupo en su totalidad discute informalmente un tema, hecho o problema,


conducido por el coordinador.

e) Seminario: Un grupo reducido investiga o estudia intensivamente un tema en sesiones


planificadas recurriendo a fuentes originales de información. El grupo de participantes
estudia en profundidad un tema pero, a diferencia de la técnica anterior, no recibe
información ya elaborada, sino que debe investigar y estudiar el tema en reuniones,
presentando al final un informe con los datos obtenidos. Conviene que el grupo no tenga
menos de cinco componentes ni más de doce y que todos posean un nivel similar de
conocimiento e intereses homogéneos.

f) Discusión de gabinete o dirigida: Un grupo reducido de miembros capacitados


discute un problema importante hasta llegar a la mejor solución o acuerdo para una
decisión. Esta técnica se centra en profundizar en los conocimientos mediante un análisis
crítico de los temas y estimular la comunicación interpersonal, la tolerancia y el trabajo en
equipo.
g) Diálogo o debate público: Dos personas capacitadas o especialmente invitadas
conversan ante un auditorio sobre un tópico siguiendo un esquema previsto.

h) Torbellino de ideas o Brainstorming: En un grupo reducido, los miembros exponen


con la mayor libertad sobre un tema o problema, con el objetivo de producir ideas
originales o soluciones nuevas. Es una técnica en la que los participantes expresan con
absoluta libertad todo lo que se les ocurra a propósito de un tema o como solución a un
problema. Sin ningún análisis ni filtro sobre su calidad, se anotan en la pizarra. Sólo al
final, cuando se agotan la producción de ideas, se realiza una evaluación de las mismas.

Organizadores conceptuales o gráficos:


Los organizadores conceptuales o gráficos son organizadores compuestos por
conceptos que se colocan en una elipse y se unen a través de líneas, solo se pueden
utilizar flechas cuando se relacionan conceptos que se encuentran en un mismo nivel,
proposiciones y conceptos unidos por palabras enlace, la función de las palabras enlace
es unir conceptos y establecer la relación entre ambos, nunca deben colocarse en elipses.
Incluyen varios tipos: el cuadro sinóptico, el mapa mental, el mapa conceptual y la
red conceptual.
Los organizadores presentan las siguientes características:
- Jerarquización: Los conceptos se organizan en función de su importancia e
inclusividad, los más generales se ubican en la parte superior mientras que los
más específicos en la media e inferior. Los ejemplos siempre se ubican al final
y no se incluyen en elipses.
- Selección: De un texto se identifican las ideas centrales de las cuales se
extraen los conceptos más relevantes y se procede a construir el mapa.
- Impacto visual: En las elipses se recomienda escribir los conceptos con
mayúscula y los enlaces con minúscula para favorecer el contraste.
En la instancia de evaluación su uso permite comprender cómo los alumnos
identifican y diferencian los conceptos fundamentales, los jerarquizas e integran, de esta
manera adquieren nuevo significado y permiten observar como relacionan el tema objeto
de estudio con los anteriormente desarrollados. El docente puede conocer el camino
seguido por el alumno en la organización de su conocimiento y por ende en la
construcción del aprendizaje significativo.
El cuadro sinóptico se puede explicar como un esquema realizado en un cuadro
de doble entrada.
Sinopsis es una palabra que deriva de las palabras griegas: syn = con y opsis=
vista.
Tal cual lo indica la etimología de la palabra el cuadro sinóptico permite abarcar a
primera vista el contenido de un tema.
Este sistema es uno de los más efectivos de la técnica del aprendizaje, valioso
auxiliar para la iniciación del alumno en el trabajo de investigación pero igualmente para
realizar una evaluación del conocimiento.
Se trata en realidad, de una síntesis diagramada que permite la fijación visual
del exacto lugar que ocupan los conceptos en el total del tema.
El cuadro sinóptico debe reunir los siguientes requisitos:
 Ser lo más breve posible.
 No contener detalles demasiados minuciosos o secundarios.
 Debe sí, encerrar lo esencial del tema tratado.
Advertimos, sin embargo, que el uso abusivo del cuadro sinóptico puede llevar
al alumno a no poder pensar fuera de él, remarcamos, pues, su valor auxiliar, en el
proceso de aprendizaje.
El mapa mental es un diagrama que se usa para representar palabras, ideas,
tareas y otros elementos que se enlazan y se organizan radialmente alrededor de una
idea o palabra clave. Al igual que el cerebro, el mapa mental procede mediante la
asociación de ideas. Se ubica la idea central en el centro y de ella se desprenden, por
asociación, ramas hacia todas las ideas que se relacionan con ella. Así, muestra las
diferentes dimensiones o aspectos de un mismo tema.

En relación con el proceso de aprendizaje, el mapa mental:


 Ayuda a organizar la información tan pronto como ésta se inicia, dando facilidad
para asimilarla o recordarla.
 Representa y organiza las ideas tan pronto como aparecen en forma espontánea.
 Desarrolla la creatividad ya que no posee una estructura lineal típica de la
escritura, y las ideas fluyen más rápido.
 Capacita para la resolución de problemas.
 Ayuda a la planificación y a la organización de la información relevante.
 Cuando se presenta un tema, el mapa mental se puede utilizar como guía en la
exposición, y si su uso es favorable, permite tener la perspectiva completa del
tema en forma organizada y coherente en una sola hoja.
Para evaluar el mapa mental se tienen en cuenta la brevedad, la utilización de colores
diferentes, los códigos, números y símbolos para referirse a frases y palabras y la
escritura de izquierda a derecha.
Es importante tener en cuenta que los mapas mentales no son equivalentes a los
mapas conceptuales. Entre sus diferencias es importante tener en cuenta que un mapa
mental tiene un solo concepto principal, mientras que un mapa conceptual tiene varios.
Los mapas conceptuales sirven para ordenar, motivar y procesar. Permiten
relacionar lo que se piensa con lo que otras personas piensan. Son recursos
esquemáticos para representar un conjunto de conceptos y sus relaciones de una manera
gráfica.
Joseph D. Novack, creador de esta técnica, indica que el mapa conceptual contiene
tres elementos fundamentales:
 Concepto: Son las imágenes mentales que provocan las palabras o signos con lo
que se expresan regularidades. Hacen referencia a objetos o acontecimientos y se
colocan en los nodos de los mapas conceptuales.
 Proposición: Dos o más conceptos unidos por palabras enlace y para formar una
unidad semántica.
 Palabras enlazantes: Sirven para unir los conceptos y señalar el tipo de relación
que existe entre ellos. Estas palabras se emplean con los conceptos para formar
las frases que tengan significado.
Novack creó los mapas conceptuales como una fórmula para llevar a la práctica
las ideas de Ausubel sobre aprendizaje significativo. Es una técnica de aprendizaje, y a la
vez, un instrumento de recolección de datos acerca de lo que aprenden y cómo aprenden
los alumnos y por ello se presenta como “estrategia”, “método” y “recurso esquemático”.
La evaluación a través de los mapas conceptuales, como la mayoría, debe
sintetizarse en una valoración, a veces numérica, por las existencias prácticas del sistema
educativo.
En el caso particular de las redes conceptuales, se trata de organizadores
gráficos que presentan las ideas centrales y los significados básicos que es preciso
aprender sobre un determinado tema u objeto de estudio.
Galagovsky, L. R. (1993) define las redes como: “(...) son circuitos de oraciones
nucleares relacionadas, que codifican significados fundamentales y aprendizajes
entretejidos según las conexiones que cada sujeto le supo dar “.
La utilización de este recurso se sustenta en el supuesto que sólo se producirán
aprendizajes profundos, significativos y duraderos, si los alumnos son capaces de
establecer relaciones entre los conceptos centrales del tema, para diagramar oraciones
nucleares que den cuenta de lo sobresaliente del mismo.
La función de las redes conceptuales es guiar el aprendizaje de los alumnos y la
enseñanza de los docentes.
Las redes conceptuales se diferencian de los mapas conceptuales, porque en las
primeras no se establecen relaciones jerárquicas de lo macro a lo micro donde existe un
concepto inclusor de los demás, que sí ocurre en los mapas.
Es importante destacar que la utilización de las técnicas y estrategias requieren
del esfuerzo, el tiempo y dedicación del docente, pero solo con su utilización se logrará la
innovación y el mejoramiento de la calidad educativa.

Planificación, objetivos y técnicas para la evaluación diagnóstica:


El primer paso del proceso de Diagnóstico consiste en la búsqueda de información
relativa a los alumnos, es decir a su objeto de aplicación, teniendo en cuenta la situación
en la que se manifiesta la necesidad de efectuarlo y las opiniones sobre el caso.
Los campos donde se debe hallar la información en forma certera y rápida difieren
en cada análisis, si bien con frecuencia corresponden al sujeto, a su familia, a su entorno
social y cultural, a su ambiente escolar y a las instituciones escolares.
Para recabar la información necesaria se puede recurrir a diferentes medios, entre
los que se citan las entrevistas, las autobiografías, las encuestas estandarizadas y no
estandarizadas, los cuestionarios, los anecdotarios, las listas de cotejo, los sociogramas,
las listas de control, los exámenes de análisis preexistentes, la anamnesis o historia
“clínica” y otras estructuraciones de datos similares.
La información necesaria para la realización del Diagnóstico es de diversa índole.
 En relación con el Sujeto: se debe establecer de quién se trata realmente,
delimitarlo en forma clara respecto de su entorno y la comunidad escolar.
 En relación con otros miembros de la Comunidad escolar, grupos o entidades: se
requiere analizar la relación de la Institución escolar con la necesidad diagnóstica
y determinar a quiénes afecta y a qué otras personas podría involucrar en
principio, aunque luego los hechos determinen otra realidad.
Estas dos perspectivas surgen por la necesidad de que el Sujeto sea comprendido en
relación con su entorno, tanto en sus características individuales, como en las familiares,
escolares y sociales.
Una vez determinado, delimitado y definido el sujeto, es importante realizar una
clarificación acerca del motivo del Diagnóstico, lo que incluye la reformulación del
problema en términos concretos siempre que éste no sea lo suficientemente
comprensible.
El Sujeto, el Objeto y la Naturaleza del caso constituyen la base sobre la cual la
persona que realiza el Diagnóstico debe estimar si los recursos, las metas, las estrategias
y las limitaciones con las que cuenta para realizarlo resultan suficientes y adecuados, en
lo que concierne a los aspectos de tipo personal, instrumental, temporal, económico,
procedimental y de competencia.
Una vez que haya acumulado la información suficiente y se ha logrado una
definición concreta del problema, debe proceder a la organización del Diagnóstico sobre
la base de los datos disponibles y su análisis de forma conveniente de acuerdo con el tipo
particular de diagnóstico seleccionado o a realizar. El análisis facilita la orientación, “la
tarea de elegir y decidir las prioridades de la conducta o los aspectos a estudiar y las
variables más adecuadas que ha de utilizarse en cada caso, así como la información que
se debe recabar y las observaciones a realizar.” (Fernández Ballesteros, R y otros, 1990).
La evaluación diagnóstica busca lograr el aprendizaje significativo del alumno y
para ello se debe relacionar con los conocimientos anteriores, y lograr la comprensión y la
exposición organizada de los mismos, normalmente escrita sobre cierta área conceptual.
Para la evaluación diagnóstica del concepto se tienen diversos instrumentos en
forma oral, como debates, exposiciones individuales o grupales, entrevistas, escalas de
calificación y listas de control, y en forma escrita, como pruebas objetivas, subjetivas y
prácticas, cuestionarios, entrevistas, resolución de problemas y mapas conceptuales.
En lo que respecta a los procedimientos, como conjuntos de acciones ordenadas y
orientadas a la consecución de una meta, también es posible la evaluación diagnóstica
procedimental. Los rasgos característicos de todo procedimiento se refieren a la
actuación, y por lo tanto, evaluar procedimientos implica doble aprendizaje. Se debe saber
qué acciones deben sucederse y en qué orden y bajo qué condiciones y se pide al alumno
la forma en que realiza una descripción, los aspectos que debe considerar, la
clasificación, observación, composición práctica y creativa y tarea específicas asociadas.
La enseñanza que se orienta a desarrollar procedimientos utiliza una estructura de
orden secuencial para su organización, que comienza por los más simples y generales.
Algunas ideas básicas a partir de las cuales se pueden tomar decisiones con
relación a la planificación de los contenidos procedimentales son: vincular el nuevo
material con los conocimientos previos para que el aprendizaje resulte significativo,
incentivar la autonomía de los alumnos, de sus aprendizajes y resolver los problemas que
se puedan presentar en el proceso de aprendizaje.

Modelos gráficos y herramientas tecnológicas para la encuesta escolar.

Los sociogramas permiten establecer conexiones múltiples entre diferentes datos del de
la historia del objeto de estudio. Ayudan a observar el tipo de relaciones que se
establecen entre los alumnos de una misma clase y al mismo tiempo brindan información
suficiente como para intervenir en esas dinámicas e intentar cambios a favor de una
buena armonía colectiva. En el ámbito escolar han demostrado su incuestionable utilidad
y eficacia como instrumento de diagnóstico psicopedagógico al servicio del departamento
de orientación. Pero es en las tutorías donde adquiere pleno sentido y se obtiene el
máximo de su rendimiento, al servicio de una intervención educativa adecuada en el
grupo de alumnos, tendiente a lograr el desarrollo de las necesarias habilidades sociales.

Pruebas multiítem de base común y que requieren el ordenamiento:


Las pruebas multiítem son un tipo especial en que la estructura presenta un
esquema de información que puede estar representado por un texto escrito, una poesía,
un párrafo, una lectura, un gráfico, un mapa, una tabla de alimentos y otros ítems
similares.
Mediante las pruebas multiítem se pueden valorar: la comprensión y aplicación de
principios, la interpretación de relaciones y la resolución de problemas.
Al utilizar los múltiples datos que se pueden presentar, se construyen varios ítems
generalmente de selección múltiple.
Estas pruebas reúnen las ventajas siguientes:
a) Realizan la evaluación de los objetivos educacionales que en la actualidad ocupan el
más alto nivel de importancia en lo conceptual y procedimental.
b) El nivel de aprendizaje que evalúa no depende solamente del recuerdo.
Como desventajas, se tienen:
a) Suelen ser difíciles de preparar.
b) La dificultad para encontrar textos, gráficos, tablas, etc., que posean suficiente
información.
Por su parte, las pruebas que requieren ordenamiento consisten en listas de
elementos o datos que se deben ordenar de acuerdo con el criterio indicado, según las
instrucciones de la prueba. Puede tratarse, por ejemplo, de un criterio lógico, cronológico
o histórico, de tipo espacial, de procedimientos, de procesos o de operaciones.
Con este tipo de pruebas se evalúa la capacidad de observación, la reflexión y la
asimilación de conocimientos, el establecimiento de secuencias y la discriminación de
posiciones.

Pruebas orales y prácticas:


La prueba oral se refiere a la exposición verbal de un contenido en forma libre o
según un cuestionario, y lo único que se requiere es el diálogo entre docente y alumno, es
decir, se basa en la palabra hablada como medio de expresión, se busca la interpretación
y la comunicación a través del diálogo.
Puede utilizarse para presentar la defensa de un proyecto, la argumentación en
favor o en contra de una hipótesis, la solución de situaciones problemáticas, la
interpretación de diseños y los debates.

Par evaluar la prueba oral se pueden tener en cuenta:


1. Dominio del tema explorado.
2. Claridad y efectividad de la exposición.
3. Utilización de la terminología técnica.
4. Desenvolvimiento personal.
5. Ejemplificación y/o utilización de gráfico
Existen diferentes tipos de pruebas orales de acuerdo con criterios y enfoques, o
formas de planificar. Pueden ser individuales o colectivas, orales de respuesta escrita o
práctica, o escritas de respuesta oral; estructurales o funcionales; máximas (se establece
un límite de tiempo), óptimas (se fija un tiempo ideal de exposición), o mínimas (se fija un
tiempo mínimo de exposición), independientes o estimuladas (con intervención del
docente), inmediatas o diferidas.
Existen algunas destrezas importantes que se evalúan en una prueba oral.
 Preguntas sobre hechos y descripciones, que ponen a prueba la memoria del
alumno.
 Preguntas para profundizar: en que el docente hace preguntas como respuestas a
explicaciones superficiales de los alumnos.
 Preguntas de alto rango: que existen un proceso analítico y requieren establecer
relaciones.
 Preguntas divergentes: que no admiten una simple respuesta de sí o no y su
función es promover la creatividad.
En cuanto a las pruebas prácticas, de ejecución o funcionales, se utilizan para
verificar el grado de dominio de una habilidad o destreza. Se pide al alumno que cumpla
una actividad real para comprobar la eficacia de su realización. Se aplican especialmente
a áreas tales como Ciencias, Arte y Educación Física.
Para la realización de estas pruebas prácticas se requiere que el alumno disponga
de todos los elementos necesarios, como materiales, herramientas.
Este tipo de pruebas permite la valoración del resultado o de producto.
Si bien las pruebas prácticas son insustituibles para evaluar objetivos y contenidos
programáticos de ciertas asignaturas como Artes Plásticas, la elaboración resulta
laboriosa y requiere mucho cuidado y tiempo.

El registro anecdótico y el R.S.A. en foco:


El registro anecdótico o de incidentes y su organización representa una doble
responsabilidad para el docente en cuanto a que la misma persona no siempre realiza
ambas tareas.
Los incidentes pueden ser referidos por cualquier miembro del grupo de personas
que están en contacto con el alumno. De hecho, el valor del registro puede ser
acrecentado si se trata de diferentes personas.

Para este tipo de registros se utilizan fichas como la siguiente:

Nombre: Fecha: Nombre: Clase:


Clase: Lugar: Fecha: Incidente: Comentario:
Incidente:
Observador:

En cuanto al registro de secuencia de aprendizaje (R.S.A.) es un instrumento


cuya técnica se basa en la observación directa. Se usa para evaluar procedimientos,
productos y aspectos del desarrollo personal y social, en los que la evaluación de las
características se limita a un simple juicio de sí o no está presente lo que se evalúa.
La lista de cotejo consiste en un listado de palabras, frases u oraciones que
expresan conductas positivas o negativas, secuencias de acciones o ausencia de
resultados en relación con el R.S.A.
El concepto que se emite debe reflejar una conducta más o menos permanente a
criterio del docente. Para cada rasgo o constructo, se establecen indicadores que se
seleccionan y planifican teniendo como base los objetivos del grado o curso y estos deben
ser motivo de observación en forma permanente y ser evaluados de acuerdo con las
recomendaciones técnicas que se ofrecen. Los docentes deben interpretar que los
indicadores (conducta observable) son objetivos que se irán logrando en forma
progresiva.
Para organizar un R.S.A. se debe contar con la lista de alumnos y los constructos
con sus respectivos indicadores:
 Tener en cuenta todos los indicadores seleccionados para observar y
registrar.
 Establecer en forma previa un criterio para registrar (presencia o ausencia).
 Registrar por lo menos tres observaciones para deducir la estimación pues
el registro periódico permite realizar orientaciones oportunas.
 Registrar un indicador por vez.
Ejemplo de un registro de una lista de cotejo.

Escalas de calificación:
Los instrumentos psicométricos que se emplean para medir las actitudes, se
denominan escalas de actitud, como la de Thurstone y Lickert.
Para elaborar la escala de Thurstone se requiere una serie de enunciados que
expresan distintas actitudes frente a algo, como una institución, reglamento o suceso. Se
pide a los jueces que clasifiquen esos enunciados en grupos que se ubiquen dentro de
intervalos de manera uniforme a lo largo del continuo de actitudes, que van desde lo
sumamente favorable a lo sumamente desfavorable.
Una vez realizada la actividad, se descartan los enunciados que distintos jueces
colocaron en puntos muy diferentes del continuo, o que recibieron puntajes muy
diferentes.
De los que restan se elige una serie menor que represente la totalidad del continuo
de la mejor manera posible. Estos enunciados constituyen la escala de actitudes.
La escala de Lickert consiste en una serie de ítems o afirmaciones sobre un objeto
determinado. En la respuesta se señala el grado de acuerdo o desacuerdo con la afirmación a lo
largo de un “continuo”, desde acuerdo completo a completo desacuerdo y se asigna un valor
numérico a cada posición. Es más fácil de confeccionar que las de Thurstone y suele ser más
utilizada.

En relación con la escala de Thurnstone, la valoración de los ítems se basa en datos


empíricos que se obtienen en el grupo encuestado y no en la opinión previa de los jueces. El sujeto
no señala si está de acuerdo o no con esta opinión. Los ítems no son independientes unos de otros
sino que están todos en la misma línea y todos deben tener un grado de correlación con los
demás.
Lickert supone que no hay un intervalo o distancia uniforme de opinión a opinión.

Escala de Osgood o diferencial semántico:


Las escalas de diferencial semántico fueron inventadas por Charles E. Osgood,
Gorge J. Suci y Percy H. Tannebaum en 1967 para medir los significados connotativos de
los conceptos.
El principio metodológico de Osgood y los demás autores buscan comprobar que
todos los adjetivos que se agrupan en pares opuestos indican tres factores generales:
Evaluación individual del objeto o concepto: bueno, malo, dulce, amargo.
Potencial o poder que el sujeto percibe en el objeto o concepto: fuerte, débil, grande,
pequeño.
Actividad que el sujeto capta: activo, pasivo, rápido, lento.
En síntesis, es un procedimiento mediante el cual el significado de un concepto se
establece con las evaluaciones hechas sobre una serie de dimensiones definidas por
objetivos bipolares.

Para Osgood existen ocho factores distintos de diferencial semántico:

Factor I. Evaluación expresada a través de escalas.


Factor II. Potencia que agrupa las escalas.
Factor III. Actividad orientada.
Factor IV. Estabilidad.
Factor V. Tensión.
Factor VI. Novedad.
Factor VII. Receptividad.
Factor VIII. Agresividad.

El portafolio como técnica educativa:


El portafolio es una colección de los trabajos que un estudiante realiza en un
período de tiempo, un semestre o un año. Podría compararse con los portafolios de
modelos, fotógrafos, artistas y otros profesionales, en los cuales éstos demuestran sus
logros, destrezas y talentos en su campo.
El alumno, con el asesoramiento del docente, recopila los trabajos que evidencian
sus esfuerzos, sus áreas fuertes y débiles, sus talentos y sus destrezas.
La redacción es una excelente herramienta para el aprendizaje y muy útil para
implementar el portafolio, y por ello se debe asignar trabajos prácticos para brindar la
optunidad valiosa de recibir información acerca de la metodología a aplicar.
El contenido del portafolio puede variar dependiendo del período que cubra.
El portafolio se utiliza para recopilar los trabajos de un curso o grado, para realizar
en forma periódica una revisión y verificar de qué manera se desarrolla la tarea.
La variedad y complejidad de los trabajos incluidos pueden ser determinadas por
el docente, el estudiante o el contenido del curso. El propósito que se persigue en cada
caso es guiar el diseño del portafolio.
En un portafolio se pueden incluir: diarios, bitácoras, cuadernos, comentarios
sobre un trabajo, reflexiones personales, expresiones de sentimientos, ideas sobre
proyectos, investigaciones, grabaciones, obras de arte, videos, fotografías, evidencias del
esfuerzo realizado para llevar a cabo tareas del curso, asignaciones grupales como redes
conceptuales, composiciones, ejemplos que demuestran el progreso del estudiante,
comentarios literarios, pruebas escritas, informes, monografías y ensayos.
El portafolio resulta un instrumento muy útil tanto para el docente como para el
alumno. El docente no tiene que evaluar tantos trabajos escritos, además, se le da
oportunidad de conocer cómo piensa cada uno de sus alumnos y cómo reflexiona acerca
de sus trabajos.
Otra forma de valuar el portafolio corresponde tanto al docente como al alumno.
Éste comienza a evaluar su desempeño desde el momento en el cual empieza a
seleccionar los trabajos que incluirá en el portafolio.
El docente puede utilizar una escala de calificación teniendo como base criterios
para asignar puntajes, y éstos deben ser conocidos por los alumnos.
Juicio de expertos:
Se define como experto a una persona que posee conocimiento y alto nivel de
competencia en ciertos aspectos del programa o proyecto que se trata de implementar.
Es una técnica que consiste en someter a evaluaciones, por parte de un conjunto
calificado de personas (los expertos), una serie de aspectos, elementos o etapas de un
proyecto o programa, a fin de obtener su opinión acerca de la validez, relevancia,
factibilidad, coherencia, tipo de deficiencias, tipo de decisiones, etc., de los mismos.
El juicio de experto se utiliza como un complemento o como vía de comparación y
en otros casos resulta la única vía válida, rápida o disponible.
Los juicios de expertos se pueden obtener en forma oral o escrita, individual o en
grupo.
En forma oral, un experto o grupo de ellos pueden emitir juicios a través de
entrevistas individuales o colectivas, estructuradas o abiertas.
En el caso de entrevista estructurada, se preparan de antemano preguntas
relativas a los aspectos o al material, y los expertos pueden responder en forma individual
sin influencia de unos para con los otros.

Criterios de evaluación en foco:


Como una extensión de la temática de las funciones y objetivos de la evaluación,
se define el concepto de criterios de evaluación. Una posible clasificación de criterios de
evaluación puede ser el siguiente:
Para cada criterio de evaluación se definen descriptores de niveles de logro. El
número representa el nivel más bajo.
• Los criterios no tienen la misma ponderación.
• Los descriptores se concentran en los aspectos positivos, aunque la descripción de los
niveles más bajos también puede incluir la imposibilidad de alcanzar determinado
rendimiento.

Criterio A Conocimiento y comprensión Máximo 10


Este criterio incluye:
• Usar el conocimiento y la comprensión para tomar decisiones.
• Usar formas de representación numérica, algebraica, geométrica, gráfica y de otros
tipos.
• Pasar de una representación a otra.
• Usar apropiadamente la tecnología.
Nivel de logro (descriptor)
9-10 Demuestra un conocimiento completo y una comprensión exhaustiva del tema y es
capaz de hacer deducciones con profundidad, incluso en situaciones no conocidas. Pasa
con seguridad de una forma de representación a otra.
7-8 Demuestra un amplio conocimiento y una buena comprensión del tema y hace
deducciones con cierta profundidad. Es capaz de pasar de unas formas de representación
a otras en la mayoría de las situaciones.
5-6 Demuestra un conocimiento y una comprensión bastante buenos del tema, que le
permiten hacer deducciones. Usa una gama variada de formas para representar las ideas
matemáticas.
3-4 Demuestra un conocimiento y una comprensión parciales del tema. Usa una gama
limitada de formas de representar las ideas matemáticas.
1-2 Demuestra un conocimiento matemático mínimo e intenta usar diversas formas de
representar las ideas matemáticas.
0 No alcanza ninguno de los niveles especificados por los descriptores que se exponen
seguidamente.

Criterio B Aplicación y razonamiento Máximo 10


Este criterio incluye:
• Seleccionar y usar conocimientos y destrezas apropiados.
• Reconocer modelos y estructuras, y describirlos como relaciones o reglas generales.
• Sacar conclusiones de acuerdo con los hallazgos.
• Justificar relaciones matemáticas.
• Desarrollar estrategias flexibles, incluyendo el uso de la tecnología apropiada.
Nivel de logro (Descriptor)
9-10 Al investigar problemas que plantean un desafío, reconoce modelos y estructuras,
los describe como relaciones o reglas generales, extrae conclusiones y proporciona
justificaciones o pruebas. Selecciona y aplica técnicas avanzadas de resolución de
problemas, incluyendo el uso de la tecnología, cuando es apropiado.
7-8 Al investigar problemas de cierta complejidad, reconoce modelos y estructuras, los
describe como relaciones o reglas generales y extrae conclusiones de acuerdo con los
hallazgos. Selecciona y aplica destrezas y técnicas de resolución de problemas con
buenos resultados. Hace una elección razonada del uso de la tecnología cuando es
apropiado.
5-6 Al investigar problemas, reconoce modelos y estructuras, los describe como
relaciones o reglas generales y extrae conclusiones. Aplica destrezas y técnicas de
resolución de problemas apropiadas y usa la tecnología apropiada de forma limitada.
3-4 Reconoce modelos y sugiere relaciones o reglas generales al investigar problemas.
Aplica destrezas y técnicas de resolución de problemas con algunos resultados.
1-2 Usa un conocimiento matemático limitado y reconoce modelos o estructuras sencillos
al investigar problemas. Aplica técnicas básicas de resolución de problemas a tareas de
rutina.
0 No alcanza ninguno de los niveles especificados por los descriptores que se exponen
seguidamente.

Criterio C Comunicación Máximo 6


Este criterio incluye:
• Codificar y decodificar.
• Describir con palabras (verbalizar) una secuencia de razonamiento.
• Explicar soluciones.
• Presentar información matemática con claridad y lógica.
• Usar la tecnología apropiada para comunicar de forma eficaz.
Nivel de logro (Descriptor)
5-6 Reconoce y usa una amplia gama de símbolos y lenguaje matemáticos. Verbaliza de
forma eficaz y explica las soluciones de los problemas con claridad. Elige y usa la
tecnología más apropiada para representar la información con claridad y lógica.
3-4 Reconoce y usa una gama de símbolos y lenguaje matemáticos. Verbaliza las
secuencias de razonamiento y explica las soluciones de los problemas. La información
matemática se presenta con claridad y lógica.
1-2 Reconoce y usa símbolos y lenguaje matemáticos básicos. Intenta verbalizar cuando
investiga problemas planteados en contextos conocidos. Presenta con claridad algunos
datos.
0 No alcanza ninguno de los niveles especificados por los descriptores que se exponen
seguidamente.

Criterio D Reflexión y evaluación Máximo 8:


Se espera que los estudiantes reflexionen sobre métodos y procesos, y evalúen la
importancia y la fiabilidad de sus hallazgos y los de los demás. Se espera que los
alumnos y alumnas consideren enfoques alternativos para resolver problemas, cuando
sea apropiado.
Este criterio incluye:
• Reflexionar sobre métodos y procesos empleados en investigaciones que podrían ser
abiertas, y evaluarlos.
• Evaluar el uso de la tecnología, cuando sea apropiado.
Nivel de logro (Descriptor)
7-8 Presenta una justificación concisa y razonada del método y los procesos y, cuando
corresponde, considera la totalidad de los enfoques que se podrían haber empleado,
incluyendo el uso de la tecnología. El estudiante hace una evaluación completa de la
importancia y fiabilidad de los hallazgos.
5-6 Presenta una justificación razonada del método y los procesos, y proporciona una
evaluación de la importancia y fiabilidad de los hallazgos. Cuando corresponde sugiere
otros enfoques para resolver el problema.
3-4 Justifica el método y la mayoría de los procesos empleados y evalúa la fiabilidad de
los hallazgos con cierto resultado.
1-2 Intenta justificar el método empleado y evaluar la fiabilidad de los hallazgos.
0 No alcanza ninguno de los niveles especificados por los descriptores que se exponen
seguidamente.

Una conclusión sobre criterios y algunos interrogantes:


a) Al confeccionar un instrumento de evaluación, ¿se debe pensar necesariamente en
todos los criterios o se puede prescindir de uno de ellos?
Los criterios pretenden abarcar todas las dimensiones fundamentales de la
disciplina, por lo que, eventualmente una sola pregunta bien pensada y redactada puede
detonar respuestas que abarcan todas esas dimensiones.
No es una ley, pero es recomendable que las preguntas permitan captar
información acerca del aprendizaje de todas las dimensiones recogidas en los criterios.
A no ser de que el profesor o profesora haya tomado la decisión, luego de
identificar las falencias o debilidades de sus alumnos y alumnas, de trabajar con un solo
aspecto o dimensión, por ejemplo, ortografía u operatoria. En ese caso es evidente que va
a predominar un criterio.
Lo importante es que los alumnos y alumnas sepan qué va a considerar el
profesor o profesora al momento de evaluar; eso tiene que ser conocido y compartido.
b) ¿Es recomendable formular cada pregunta, pensando en un solo criterio de evaluación;
por ejemplo, una pregunta que permitiera observar el nivel de logro relativo a criterio A;
una segunda pregunta relativa a criterio B, y así sucesivamente?
La respuesta a esta pregunta es similar a la anterior: en teoría, una “buena”
pregunta permite observar en el trabajo que produce el alumno y alumna todas las
dimensiones del aprendizaje recogidas en los criterios de evaluación en su rango
completo de niveles de logro.
Sin lugar a duda, los profesores y profesoras pueden tener razones de peso para justificar
la inclusión de más de una pregunta en una evaluación; no obstante el número de
preguntas incluidas en una evaluación, cada una debe cumplir lo más cercanamente
posible las condiciones de “buena” pregunta anteriormente definidas.
c) ¿Cómo traducir logros obtenidos en los criterios a una calificación?
Ojalá no usáramos la palabra calificación, pues nos obliga a medir,
homogeneizando los aprendizajes de los alumnos y alumnas. Y después de todo, está
claro que evaluar es mucho más que calificar. Esta pregunta es como decir ¿cómo
transfiero un dato cualitativo a conceptos cuantitativos?
Poner notas es una obligación del sistema y tenemos que considerarlo una tarea
necesaria y sería bueno que pudiéramos hacerlo de tal forma que resulte justo y
representativo.
Primero, debemos tener claro que lo óptimo en una evaluación por criterios no
necesariamente es equivalente a un 7. Lo óptimo es equivalente al grado máximo de logro
al que pueden aspirar los alumnos y alumnas, independiente del colegio o condición que
sean. Ya dijimos que evaluar con criterios es también un proceso, y permite conocer en
qué lugar del proceso están mis estudiantes, identificando sus debilidades y fortalezas.
Por eso se debe proponer que piensen, por ejemplo, que si un instrumento es
corregido aplicando todos los criterios, generará un número x de puntaje que significará el
puntaje excelente. Dependiendo del lugar y tiempo del proceso, los alumnos y alumnas
que van avanzando probablemente no estarán en el nivel óptimo, pero es hacia allá
donde vamos como profesores y profesoras.
Por ello una manera de resolver el tema de traducir el puntaje a notas sería que el
docente, considerando el avance del grupo, establezca un número específico de la tabla
de puntaje como el punto en que se ubica la nota siete, que con el transcurso del proceso
debería ir acercándose al óptimo, por lo que cada vez podría definirse un número distinto.
Así, por ejemplo, si el puntaje óptimo o excelente es 120 y yo decido que por
tratarse de la primera evaluación del proceso, el puntaje equivalente a un siete será 45
pts. (45 es un ejemplo arbitrario), entonces 45 hacia arriba un siete y hacia abajo,
construyo una tabla de transferencia en la que ubicaré las notas inferiores a siete.

Prácticas comunes en evaluación:


En la actualidad, la práctica más común es aplicar técnicas e instrumentos de
evaluación para luego sacar el puntaje en cada caso, convertir este en una nota a través
de una escala de conversión, colocar las notas en los libros de clase y luego comenzar
con el curso una nueva unidad de trabajo, momento en que, idealmente, todos los
alumnos y alumnas comienzan “desde cero”. El mensaje que se envía así a los
estudiantes con esta práctica es simple: la evaluación cierra el proceso de aprendizaje.
Lo que no se ha logrado en la evaluación puede olvidarse hasta la próxima vez
que se vea el tema en la escuela o, en algunos casos, hasta nunca jamás. Es la premisa
opuesta a lo anterior la que impera en las actividades y discusiones que este módulo
incentiva: la evaluación se considera como un paso más en el aprendizaje de los alumnos
y alumnas.
ACTIVIDADES

1. Seleccione una técnica y un instrumento que Ud. Utilizaría para aplicar en una
prueba diagnóstica, una formativa y una sumativa.

2. Seleccione una temática para el debate y otra para una entrevista. ¿De qué
manera las podría utilizar en una evaluación diagnóstica y en una formativa?
Elabore un informe:
4. De una definición de método y de estrategia. A continuación distinga entre
técnica e instrumento.

5. Complete un cuadro con las características principales de las siguientes técnicas


grupales que pueden usarse en la evaluación: simposio, mesa redonda, panel,
debate y entrevista colectiva.
Simposio:

Mesa redonda:

Panel:

Debate:

Entrevista colectiva:

6. A continuación se presenta un cuadro comparativo basado en los trabajos de


Isolina Romero en México, autora del libro: “Indigo: Adiós a la obediencia”*
SÍNTOMAS DE HIPERACTIVIDAD CARACTERÍSTICAS DE HIPERACTIVIDAD
PATOLÓGICA Y DISFUNCIONAL EN NIÑOS SANOS Y FUNCIONALES

A pesar de que el niño esté jugando Si el niño está ocupado en un tema de su


con algo de su interés, no puede interés (pintar un mandala, jugar con la
quedarse concentrado por mucho computadora, hacer una construcción con
tiempo. Se levanta, hace otra cosa, bloques) puede quedarse concentrado por
se dispersa. mucho tiempo.

Su actividad motora es excesiva. Se Se mueve todo el tiempo, pero sus


mueve constantemente y hace actividades son coherentes, coordinadas y
movimientos que no parecen con motivo. Sus actividades y movimientos
justificados. Se mueven por están de acuerdo con un proyecto específico
moverse, o por llamar la atención. del niño.

Es muy impulsivo, suele tomar la Tiene mucha velocidad de ejecución, pero es


iniciativa en el grupo, en ocasiones más maduro y respetuoso.
hasta sin respeto hacia los demás.

En general no termina lo que Deja su actividad sólo si se aburre. De lo


empieza. contrario termina con éxito.

Suele tener dificultades de Tiene dificultades de aprendizaje porque no


aprendizaje asociadas con le gustan los métodos convencionales de
problemas de socialización, uniformidad del sistema escolar tradicional.
conflictos personales y falta de No tiene asociados trastornos sociales,
autocontrol. suele ser muy carismático y querido.
Su coordinación motora suele ser Sus movimientos son rápidos pero no
brusca, rápida y torpe. Suele sufrir torpes. En general tiene equilibrio y no se
accidentes y romper cosas. lastima.

Pierde sus pertenencias con ¡También!...


facilidad

a) A continuación, observe las conductas de un alumno o alumna que muestre


síntomas de hiperactividad en el término de una semana en su escuela. Trate de
registrar de manera objetiva y ordenada el resultado de su observación. Anote lo
registrado.

b) Elabore un pequeño informe que pueda servir de ayuda al equipo de orientación.


c) Plantee un instrumento de evaluación que utilizaría para ayudar en el proceso de
aprendizaje del alumno seleccionado.

7. Elabore una tabla de especificaciones. Contenido: una unidad de aprendizaje.


8. Elija una unidad o eje temático y elabore ejercicios relacionados con los
instrumentos expuestos en el módulo.
9. Elabore preguntas de respuestas breves que:
a) Midan un solo concepto por vez.
b) Estén enunciadas sin ambigüedad.
c) Puedan contestarse con una palabra, frase u oración.
d) Sean breves y directas.
e) Especifiquen claramente la naturaleza de la respuesta que se debe dar.

10. Responda. ¿Qué tipos de aprendizajes pueden evaluarse con las pruebas de
multiítem de base común y con la de ensayo.

11. Elabore una idea para una prueba de ejecución. ¿Qué características especiales
exhibe?

12. Elabore una lista de cotejos y explique su utilidad.


13. Planifique una prueba de ensayo y elabore criterios e indicadores para evaluar a
los alumnos.

14. Elabore un glosario con el vocabulario técnico de la materia que Ud. dicta y
arme un mapa mental para evaluar el proceso de aprendizaje de estos conceptos.
15. Elabore un informe breve acerca de las observaciones que Ud. realizaría en una
salida de campo acerca de los resultados de un panel debate planificado o
implementado por los alumnos.

16. Describa.
a) Los procedimientos para evaluar y construir escalas de actitudes: Thurnstone,
LIckert y Osgood.
b) Las dimensiones que analiza una observación sistemática.
17. Establezca diferencias entre:
a) Pruebas orales y prácticas.
b) Observación cotidiana e institucional.
c) Escala de calificación y registro de secuencia de aprendizaje.
18. Responda en forma completa.
a) ¿Qué técnica utilizaría para evaluar el constructo solidaridad?
b) ¿Con qué fines se puede utilizar un cuestionario?
c) ¿Cuál es la ventaja de un informe?

19. Planifique una prueba oral de proceso o de producto como culminación de un


eje temático. Elabore en forma previa los indicadores que evaluará de acuerdo con
el tiempo y número de alumnos disponibles.

20. Elija un caso real que preocupe a sus alumnos. Para ello puede utilizar la
técnica de lluvia de ideas o brainstorming mencionada en el módulo. Seleccione las
ideas más relevantes y sobre este hecho plantee casos para que trabajen bajo su
supervisión. Analice las respuestas de los alumnos a las temáticas elegidas para
comprender sus valores.

Hemos finalizado la primer unidad, si tienes dudas en la resolución de las


actividades el tutor está dispuesto a dialogar contigo.

Unidad 2:
El problema de la validez y la confiabilidad de los instrumentos de
evaluación

Los docentes permanentemente deben emitir un juicio respecto del aprendizaje


que alcanzan los estudiantes en las diferentes temáticas que enseñan. Este juicio
supone que con anterioridad se recogió información de manera sistemática y
confiable, se analiza correctamente y se contrasta contra un referente previamente
establecido, por tanto, la conclusión obtenida sería válida, confiable y objetiva.
Pero, ¿qué ocurre realmente en el aula? Para decir que se va por el camino
correcto se debe responder positivamente a las siguientes preguntas: ¿lo que
respondieron los estudiantes era lo que quería evaluar el profesor?, ¿las
respuestas en la evaluación son coherentes con el dominio de la disciplina que se
presenta durante las clases? y ¿los resultados son independientes de quién
evalúe y de quién revise la información obtenida?
Las concepciones de evaluación y los enfoques teóricos con que cada docente se
aproxima a la evaluación del aprendizaje de sus estudiantes condicionan la forma
en que toma decisiones al interior del aula. Además, hay que tener presente que la
información que se recoge siempre está permeada por las características
psicológicas, sociales, económicas y físicas, particulares de cada estudiante, y
puede estar influida por problemas de índole pasajera, circunstancias especiales
del contexto, o situaciones propias de la administración de los instrumentos con
los que se recoge dicha información (Luckett y Sutherland, 2000; Salinas, 2002;
Sanmartí, 2007).
En este sentido, la calidad de una evaluación, es decir, la consistencia,
adecuación y pertinencia de los procedimientos e instrumentos que se utilizan
para evaluar el desempeño de los estudiantes, debiese considerar la validez,
confiabilidad y objetividad como elementos esenciales al momento de
interpretar los resultados y así tomar decisiones adecuadas respecto de qué y
cómo enseñar.
En el presente módulo tendremos como objetivo analizar desde una perspectiva
teóricopráctica los conceptos de validez, confiabilidad y objetividad de una
evaluación, y proponer sugerencias que permitan a los docentes resguardar estos
criterios en futuras evaluaciones de aprendizajes al interior de sus aulas.

Validez:
El primer elemento a considerar en la calidad de una evaluación es la validez de la
información recogida con un instrumento o en una situación evaluativa. Este
concepto tiene su origen en la medición y se ha desarrollado ampliamente desde
el enfoque psicométrico, donde se dice que una prueba es válida “si mide lo que
pretendía medir”; no obstante, esta definición genérica debe complementarse con
la finalidad para la que fue construida, es decir, si la interpretación de una
determinada puntuación permite señalar correctamente una conclusión respecto
del fin o constructo que mide dicha prueba. Concordante con esta idea, Messick
(1989) define la validez como “un juicio evaluativo integrado del grado en el cual la
evidencia empírica y teórica soporta la adecuación y pertinencia de las inferencias
y acciones basadas en los puntajes de un test o en otros modos de evaluación”
Así, por ejemplo, la pregunta ¿la Prueba de ingreso a la Uniiversidad es válida? no
es una buena pregunta, más bien correspondería decir: ¿la Prueba de ingreso es
válida para predecir los resultados de los estudiantes durante su primer año de
universidad?, o mejor aún, ¿en qué grado es válido el puntaje de la Prueba de
ingreso para predecir el resultado de los estudiantes en su primer año de
universidad?
En otras palabras, la validez no es una propiedad intrínseca de un instrumento o
situación evaluativa, sino una propiedad de la interpretación y los usos que se
realizan de la información obtenida a partir de ellos.
El concepto de validez utilizado en el enfoque psicométrico tiene sentido solo para
pruebas a gran escala, aplicadas a un número considerable de estudiantes, donde
se espera que los resultados generen una distribución normal (se espera que la
mayoría de las personas obtenga puntuaciones medias y una proporción menor se
ubique en los extremos), pero en el aula no se tiene como objetivo que los
resultados de los alumnos se distribuyan de esta forma, por el contrario, se espera
una curva asimétrica, donde la mayoría (si no todos) esté sobre el puntaje de
aprobación de un determinado aprendizaje, ya que esto indicaría que lograron
aprender lo que se esperaba para ese momento (edad, curso, período del año,
etc.).
Por esta razón, Stiggins (2001) evita hablar de “validez” en el contexto de el aula y
reemplaza este término por evaluación de “alta calidad” (high-quality classroom
assessment).
Diversos autores plantean que en el aula el significado de validez no es el
tradicional, ya que la evidencia estadística es muy difícil de obtener. Más aún
cuando la mayoría de los profesores no tiene conocimientos en teoría de la
medición, producto de la escasa presencia de esta disciplina en su formación
inicial y, por tanto, muy pocas herramientas para hacer adaptaciones y reconocer
las limitaciones de la “validez psicométrica” en el aula. Asimismo, podemos
preguntarnos hasta qué punto la utilización de la validez propia de la medición
psicométrica asegura una orientación hacia las temáticas relevantes en el aula y
cómo aportarían otras perspectivas teóricas a generar un marco sólido para
obtener evaluaciones válidas al interior del aula.
Brookhart (2003), por medio de un cuadro comparativo, realiza una clara
diferenciación de la validez de una evaluación según el contexto para el cual fue
diseñada. Destaca principalmente el propósito de la validez y la importancia del
contexto de aplicación de la evaluación.
A gran escala el propósito es sacar conclusiones del desempeño de los
estudiantes para los fines específicos de la evaluación diseñada, mientras que a
nivel de aula es determinar el desempeño de los estudiantes y entregar evidencia
respecto de la enseñanza de ese contenido.
Con respecto al contexto, las evaluaciones a gran escala no la consideran como
una variable relevante, mientras que a nivel aula sí es un tema a considerar,
debido que importan, por ejemplo, los conocimientos previos del alumno y su
contexto sociocultural.
Comparación de la validez en evaluaciones a gran escala y en el aula:

Evaluación a gran escala Evaluación a nivel aula

Las interpretaciones y las acciones Las deducciones y las acciones


tomadas son externas al proceso de tomadas son internas al proceso de
medición. medición.

Los estudiantes son la “materia” sobre Los estudiantes son observadores


la que se realizan las observaciones, no conjuntamente con los profesores;
tienen injerencia en la evaluación. “esas mediciones” corresponden a
procesos formativos de evaluación.

Los estudiantes no reciben un beneficio Los estudiantes reciben beneficios


directo de la evaluación, los análisis no individuales de la información de la
son individuales. evaluación.

El objetivo de la evaluación es realizar El objetivo de la evaluación es


una inferencia significativa comprender cómo es el desempeño de
estadísticamente sobre el rendimiento los estudiantes comparado con el
de los estudiantes y/o la utilización “ideal” (definido en los objetivos de
eficaz de esa información para una aprendizaje) y/o el uso efectivo de esa
finalidad determinada. información para el aprendizaje.

El contexto de la medición es un El contexto de la medición es un


constructo irrelevante. constructo relevante.

Las especificaciones del contenido Las especificaciones de contenido


describen un dominio disciplinar. reflejan el dominio (objetivo de
aprendizaje) y la enseñanza (modos,
actividades).

La administración del test es Las creencias de los profesores, sus


estandarizada y se controla el efecto de prácticas y el conocimiento de la
las ciencias, prácticas y diferencias materia y de los estudiantes
culturales. (incluyendo diferencias culturales y
lingüísticas) son preocupaciones
relevantes.
La evaluación es independiente de la
enseñanza.

Se puede relacionar con diferentes La evaluación es parte de la


contextos a través de cruces de datos. enseñanza. Unabuena evaluación es
un “episodio genuino de aprendizaje”.
Aunque es claro el hecho de que la validez de una evaluación en el aula no
obedece a una lógica psicométrica es posible rescatar algunos elementos de los
distintos tipos, categorías o aspectos relacionados con la validez que se han
descrito en diversas clasificaciones, donde las más clásicas son la validez de
contenido, de constructo y la relacionada a criterio.
Lo primero que se observa al introducirse en los textos especializados es que
hasta el día de hoy no existe un acuerdo en la comunidad científica respecto de si
hay una validez (la de constructo) que incluye a las otras o si son de naturaleza
diferente y excluyente.
En este sentido, observamos que existen una gran cantidad de opciones en
cuanto al tipo de evidencia que se puede acumular y reportar. Cada tipo de
evidencia ilumina y da apoyo a distintas facetas de la validez. Así, en el presente
artículo no se pretende profundizar en la discusión ni adherir a una clasificación en
particular, sino considerar cuáles de estas categorías o aspectos serían relevantes
de considerar para resguardar la calidad de la evaluación en el contexto
educacional, específicamente en el aula.
A continuación se presenta una revisión conceptual de las tipologías relevantes en
la evaluación al interior del aula y se indican algunos ejemplos de situaciones de
evaluación descritas por los estudiantes, en las cuales se evidencia la falta de
validez.

Validez de contenido:
La validez de contenido es un concepto que ha resultado controversial a través del
tiempo.
Muchos especialistas señalan que es parte de la validez de constructo y que dada
su naturaleza “cualitativa” es técnicamente incorrecto y no corresponde a una
nomenclatura psicométrica, proponiendo hablar de relevancia, representación o
cobertura de los contenidos.
Gorin (2007), por su parte, señala que un constructo se mantiene independiente
del contexto de evaluación, mientras que un contenido es dependiente de dicho
contexto.
Hogan (2004) plantea que para determinar la validez de constructo de un
instrumento se requiere analizar su estructura interna y los procesos de respuesta.
Como ambos procedimientos son muy difíciles de llevar a cabo en el aula y el
contexto es un elemento importante que condiciona las situaciones de evaluación,
se presenta la validez de contenido como un elemento clave a considerar para
resguardar la calidad de una evaluación.
Como ya se mencionó, no es tema de esta unidad discutir si es una categoría
diferente o parte de la validez de constructo, sino rescatar la importancia de
considerar este criterio para resguardar la calidad de una evaluación.
Esta “validez” se refiere a la correspondencia que existe entre el
contenido/habilidades que evalúa el instrumento y el campo de conocimiento al
cual se atribuye dicho contenido.
En el ámbito educacional se ha trabajado ampliamente en generar índices de
validez de contenido en pruebas a gran escala, considerando variables como:
a) la opinión de expertos (profesores, investigadores, curriculistas, directivos) en
cuanto a la cobertura curricular de las pruebas y la cobertura instruccional de
dichos contenidos,
b) la muestra de estudiantes a quienes se les aplicó la prueba,
c) el número de ítems de cada contenido, entre otras.
Sin embargo, estos modelos estadísticos diseñados para calcular índices de
validez de contenido no son aplicables a las situaciones evaluativas que se
realizan al interior del aula, dado que no cumplen con los requisitos de base que
sostienen dichos modelos.
En este sentido, resguardar que las evaluaciones en el aula tengan validez de
contenido implica garantizar que las situaciones evaluativas incluyan los
contenidos y habilidades asociadas a estos. Se deben considerar los contenidos y
habilidades más relevantes para demostrar el logro de un aprendizaje, es decir, se
debe seleccionar una muestra pertinente y representativa del universo de
contenidos cubierto por un curso, una clase, o un conjunto de ellas.
Hay consenso en al menos cuatro elementos que caracterizan el concepto de
validez de contenido: la definición de un dominio disciplinar, la relevancia de dicho
dominio, la representatividad del dominio y los procedimientos de construcción del
instrumento o situación evaluativa.
Esto es particularmente importante porque las conclusiones que se pueden sacar
a partir de una evaluación sólo son válidas para lo que se evaluó, es decir, los
puntajes o categorías que obtenga cada estudiante deben provenir de tareas y
estímulos de calidad, coherentes con los propósitos conceptuales para los que
fueron elaborados.
Por tanto, certificar lo que un estudiante sabe y es capaz de hacer o no en un
curso tiene directa relación con los contenidos y habilidades que fueron evaluados.

A continuación se exponen algunos ejemplos de evaluaciones consideradas


negativas por los estudiantes y que tienen relación con la falta de validez de
contenido:

• “Durante un curso se dio la situación de que el profesor dio bastante lectura para
una prueba y en ella comenzó a preguntar datos demasiado específicos, palabras
exactas citadas en los textos para identificar de qué autor podían ser y nombres y
fechas, que si bien eran interesantes o importantes, para una evaluación de tantos
contenidos eran muy específicos”.
• “Para mí son negativas todas aquellas evaluaciones en las que se preguntan
citas textuales de la bibliografía, que no están relacionadas con el marco teórico
general del curso”.
• “Recuerdo una prueba que involucraba muchos contenidos pero que nos habían
anticipado no sería memorística, sin embargo, a la hora de enfrentarme a la
prueba era evidente que las respuestas debían ser literales, pues las preguntas
eran muy específicas y no apuntaban a lo que en el curso se había considerado
como relevante”.
• “Me ha tocado responder evaluaciones donde las preguntas no tienen nada que
ver con los contenidos que entraban, parecieran evaluar cualquier cosa menos lo
que debiesen”.
• “Creo que una situación evaluativa negativa podría ser el caso de matemáticas,
cuando por ejemplo nos ponían unos ejercicios que se podían resolver solo si se
te ocurría el truco adecuado. Creo que es negativo porque el aprender no depende
de si te sabes o no el truco, sino de resolver y plantear bien un problema”.
• “Hay veces en que tenemos que estudiar, por ejemplo un texto entero, y luego en
la prueba aparecen un par de preguntas textuales y nada más… me parece
negativo porque creo que es bueno aplicar lo que uno lee, además suelen pasar
que justo nos preguntan lo que teníamos menos claro de todo y eso nos
perjudica”.
• “En una clase nos pidieron hacer unos gráficos de la economía de la región y
luego el profesor evaluó más la estética, que si estaban o no bien elaborados, y
los compañeros que pintaron los gráficos de colores les fue mejor que a mi grupo
que teníamos los gráficos en blanco y negro… ahí aprendí a preocuparme más
por la estética que por los contenidos”.
Como se puede apreciar en estos relatos, los estudiantes resienten que se les
evalúen contenidos demasiado específicos, carentes de significado o que no
tienen relación con el dominio disciplinar esperado.

A continuación se presentan algunas sugerencias para resguardar la validez de


contenido de una situación evaluativa, que corresponden a procedimientos y
acciones que un profesor de aula podría llevar a cabo en la elaboración de sus
propias evaluaciones.
Si bien hay sugerencias en el ámbito estadístico que también se pueden realizar,
no han sido consideradas en este análisis:

1) Elaborar una tabla de especificaciones del instrumento, que considere: el


contenido, la meta/objetivo/indicador de aprendizaje/logro específica/o que
se desea abordar con ese contenido, la habilidad cognitiva, afectiva o
psicomotora que se desea evaluar asociada a ese contenido y los ítems que
se han elaborado para ello. Con esta tabla es posible visualizar si se están
cubriendo todos los contenidos seleccionados, si las habilidades asociadas a
dichos ítems son coherentes con las metas de aprendizaje trazadas y si los
ítems corresponden a los contenidos y habilidades que se esperaban. A
partir de este análisis, también es posible establecer si existe una graduación
de la complejidad en cuanto a las habilidades evaluadas y si los ítems son
los más apropiados para evaluar una habilidad determinada.
2) Verificar a través de criterio de jueces que la situación de evaluación sea
adecuada para medir los contenidos planteados en el aprendizaje. Dado que
en la sala de clases es el mismo profesor quien construye los instrumentos y
situaciones evaluativas, muchas veces se pasan por alto aspectos que para
quien no ha visto antes dicha evaluación son más evidentes. Por esta razón
se recomienda mostrar a otros profesores el instrumento con su pauta de
corrección y la tabla de especificaciones para que den su opinión. Puede ser
que el problema se encuentre en la redacción de una instrucción o en la
pauta de respuesta, y al mirar solo la tabla esto no es evidente.

Validez instruccional:
Según Hogan (2004), esta validez corresponde a una aplicación particular de la
validez de contenido y es conocida también como validez curricular.
Tiene relación con lo que los estudiantes han tenido oportunidad de aprender
durante las clases para responder correctamente en una evaluación.
En el ámbito educativo este tipo de validez es clave, dado que representa la
relación entre lo que se enseña y lo que se evalúa. Cuando esta relación es débil
se presentan dos problemas, por una parte, los estudiantes no tienen posibilidad
de demostrar lo que aprendieron durante las clases y, por otra, son evaluados en
aspectos que no se les enseñaron. Esta última idea se ve reflejada especialmente
cuando se cambia el énfasis de lo que se enseñó, por ejemplo, en clases se
enseñan los conceptos, sus definiciones y luego en la evaluación se les pide que
apliquen dichos conceptos en situaciones que nunca han sido trabajadas durante
las clases, aludiendo a que se espera que los estudiantes sean capaces de
hacerlo como parte de la “construcción” de su propio aprendizaje.
En evaluaciones a gran escala se incorporan otros problemas éticos relacionados
con la interpretación que se hace de los resultados: responsabilizar a los
estudiantes por no saber contenidos que no han tenido la oportunidad de aprender
y responsabilizar a los docentes por el bajo logro de sus estudiantes sin
proporcionarles las condiciones, materiales o la capacitación necesaria para
enseñar los contenidos.
En conclusión, se dice que una evaluación tiene validez instruccional cuando
contiene situaciones evaluativas coherentes con las actividades de aprendizaje
realizadas por los alumnos.
En este apartado se incluye también lo que se ha llamado “validez semántica”, que
consiste en que las situaciones de evaluación contienen términos cuyo significado
es conocido y compartido entre el constructor del instrumento (en el caso del aula,
el profesor) y los alumnos. Muchas veces se enseña un contenido usando un
término y luego en la evaluación se pregunta utilizando otro término “sinónimo”
que no ha sido trabajado.
En estricto rigor, el contenido fue enseñado, pero frente a una respuesta errónea
de los estudiantes cabe preguntarse si no dominan el contenido o fue la palabra
que no comprendieron lo que provocó dicha respuesta.

A continuación se presenta una serie de situaciones relatadas por los estudiantes


que resultaron negativas para ellos y que aluden a la validez instruccional.

• “Ha sido negativo para mi aprendizaje el hecho de que muchas veces los
profesores evalúan materia o contenidos que no correspondía a lo que habíamos
visto en las clases. Eso me acarreó a la larga una desmotivación y frustración al
no conseguir la calificación esperada o al no poder aplicar lo que había estudiado”.
• “Fue negativo para mí cuando las clases teóricas no iban acordes a las
evaluaciones de laboratorio y nos evaluaban materia que aún no habíamos visto,
hay muchas actividades de laboratorio que aún no logro comprender del todo”.
• “Las pruebas en un curso no correspondían a lo que el profesor enseñaba en
clases, enseñaba mal, creaba un clima de terror en la sala y luego nos preguntaba
cosas que no había enseñado o que había pasado en el curso del lado”.
• “En un tramo de mi carrera, la primera prueba que nos hicieron no correspondía
con lo que trabajábamos y aprendíamos en clases. Solo hacíamos teoría y la
prueba fue de aplicación, con muchos detalles, y el profesor no hacía ni destacaba
esos elementos.
En suma, lo que aprendí no me sirvió para la prueba”.
• “He tenido profesores que evalúan en sus pruebas cosas (contenidos) que han
tratado mal, a la rápida o sencillamente no han tratado ni en clases ni en los textos
referidos (asumiendo que los vimos en otros cursos). No me parece pedagógico
evaluar contenidos de otros cursos”.

Como se puede observar las opiniones de los estudiantes aluden directamente al


desempeño profesional del docente, por tanto, las acciones que se sugieren a
continuación para resguardar la validez instruccional tienen relación con las
prácticas de enseñanza que se utilizan habitualmente:

1) Velar porque las situaciones de evaluación contengan los contenidos vistos en


las actividades de aprendizaje realizadas. Esto supone llevar un registro de lo que
se enseñó en cada clase, para elaborar las situaciones de evaluación no basta
con utilizar la calendarización o planificación, a menos que ésta sea actualizada
permanentemente. Muchas veces las dinámicas propias de un curso permiten
profundizar o volver atrás en una temática, o sucede alguna actividad no
planificada, produciéndose desfases temporales que pueden hacer que se evalúen
contenidos que aún no han sido revisados o que se vieron en un curso, pero en
otro aún no.
2) Velar porque las situaciones de evaluación sean equivalentes o similares a las
actividades de aprendizaje realizadas. No significa repetir la guía que se realizó en
clases y ahora ponerle una nota, por el contrario, esta sugerencia apunta a evaluar
actividades en término de habilidades similares a las trabajadas. Esto supone que
durante el proceso de enseñanza se produjeron actividades para lograr los
aprendizajes esperados o metas de aprendizaje determinadas para esos
estudiantes y, por tanto, se debe evaluar si se lograron o no. Se sugiere, por una
parte, hacer uso de la planificación de clases y que esta sea una guía flexible de
apoyo a la preparación de la enseñanza; y, por otra, utilizar la tabla de
especificaciones, poniendo énfasis en que las situaciones de evaluación sean
coherentes con lo que cada profesor trabajó con sus estudiantes. En este último
punto, los “jueces expertos” no tienen competencia ya que no estuvieron durante
el proceso, por lo que solo depende de la autoevaluación que realice el profesor
respecto de su propia práctica.
3) Cuidar que el lenguaje utilizado en las situaciones de evaluación sea conocido
por los estudiantes. Esto implica tener especial cuidado en utilizar términos
familiares para los estudiantes, tanto en las instrucciones como en el lenguaje
técnico propio de la disciplina que se desea evaluar. Es importante hacer notar
que el fin de una evaluación es obtener información del aprendizaje de los
estudiantes y las “palabras truco” sólo permiten generar información de mala
calidad respecto de ese fin.

Validez consecuencial:
Este tipo de validez se relaciona con las consecuencias y secuelas intencionales y
no intencionales que tendrá el uso e interpretaciones que se dará a la información
recogida en la evaluación.
Los aspectos consecuenciales de la validez son especialmente importantes en
una evaluación cuando las interpretaciones de la información pueden implicar
consecuencias adversas para los participantes, por ende, estudiar la validez de las
consecuencias podría ayudar a controlar estos aspectos. En las evaluaciones a
gran escala las consecuencias están en la toma de decisiones y reformulación de
políticas públicas y tienen implicancias éticas y sociales que hacen relevante
estudiar la validez desde este punto de vista.
En el aula, en cambio, las consecuencias tienen relación directa con las dinámicas
de enseñanza y de aprendizaje que se dan entre profesores y alumnos; en este
sentido, observamos que si la integración entre enseñanza y evaluación es
tomada seriamente, una situación evaluativa debería ser como consecuencia un
vehículo para el aprendizaje.
Por tanto, se podría decir que la validez consecuencial a nivel de aula tiene
relación directa con los efectos de la evaluación sobre la enseñanza y los
aprendizajes de los estudiantes, por consecuencia, se relaciona con los propósitos
para los cuales se diseñó la evaluación.
Así, McMillan (2003) plantea una serie de preguntas que, de ser respondidas
positivamente, indicarían que una evaluación tiene validez consecuencial:

¿Los estudiantes adquieren una comprensión profunda de lo que están


aprendiendo mientras se preparan para la evaluación?
¿Los estudiantes creen que son capaces de aprender nuevos conocimientos
después de autoevaluarse en ejercicios de práctica de una evaluación?
¿Los estudiantes son capaces de transferir sus conocimientos en las tareas
siguientes?
La decisión de llevar a cabo revisiones adicionales, como evaluaciones formativas,
¿llevan a un mayor aprendizaje del estudiante?

Estas preguntas apuntan a propósitos diferentes y no siempre se darán todas al


mismo tiempo, lo importante es tener en cuenta que la evaluación en el aula
siempre tiene consecuencias y, por tanto, los docentes deben pensar en ellas
antes, durante y después de realizar la evaluación, para sacar el mayor provecho
de esta instancia y minimizar los efectos negativos que se puedan generar. Entre
las consecuencias imprevistas de una evaluación, y que le restan validez,
destacan la falta de motivación de los estudiantes para participar en una actividad
de evaluación, interiorizar un error conceptual a causa de la tarea realizada,
generar un ambiente de competencia entre los estudiantes, resentimiento de los
estudiantes por el formato de la evaluación, entre otros.
Los estudiantes relatan una serie de situaciones que para ellos fueron negativas,
donde se evidencia la validez consecuencial:

“En un trabajo en grupo, en el cual se evaluó a todos por igual, uno de mis
compañeros no se preparó bien, se puso nervioso y la exposición no fue la mejor,
pero los otros tres compañeros hicieron su presentación de buena forma. Por las
razones anteriores, la evaluación del grupo fue disminuida y con esto se premió al
compañero deficiente y se perjudicó a los otros que sí lo hicimos bien”.
“Un ejemplo de situación negativa correspondería a evaluaciones que se basan en
la amenaza de sanciones en caso de no ser aprobadas. Si bien podría otorgar una
presión que provoque mayor conciencia y en consecuencia mayor efectividad, a
juicio particular no es correcto provocar miedo o algún tipo de daño psicológico al
grupo evaluado”.
“Una evaluación oral, para mí es muy confuso dar a conocer lo que se sabe con
tanta presión de por medio, los nervios juegan en contra en estos casos y siento
que no representa una buena manera de evaluar ya que lo que preguntan se
podría responder perfectamente en forma escrita y lo hacen más por no revisar”.
“Recuerdo pruebas demasiado extensas en que las preguntas eran
exclusivamente de memorización de contenidos y no había oportunidad de pensar
y analizar nada. Me aprendía las cosas y me fue bien, pero no me acuerdo de
nada, es como si no hubiese hecho el curso y ahora lo voy a necesitar para mi
futuro laboral”.

Puesto que las consecuencias de una evaluación pueden ser negativas, y de largo
plazo en nuestros estudiantes, las sugerencias que se dan para resguardar la
validez consecuencial se basan en su mayoría en acciones relacionadas con la
definición y planificación de una evaluación:

1) Definir claramente los propósitos y usos de la evaluación. Como esta


validez se basa en las implicancias que tiene un proceso evaluativo para los
estudiantes, es importante definir previamente la finalidad que tiene
realizarlo, es decir, ¿para qué evaluamos? En este sentido se presentan tres
grandes fines: diagnóstico (por ejemplo, identificar los conocimientos previos
de los estudiantes, reconocer conductas de entrada, ajustar la planificación al
contexto, etc.), formativo (por ejemplo, mejorar los aprendizajes y la
motivación de los estudiantes, monitorear su desarrollo, mejorar el proceso
de enseñanza, etc.) y sumativo (por ejemplo, certificar los aprendizajes de los
estudiantes, informar a los padres el desempeño de sus hijos al final del
curso, etc.), a partir de los cuales se tomarán decisiones que tendrán
implicancias para la enseñanza y el aprendizaje de los alumnos. Es
importante tener presente que un mismo instrumento puede ser válido
consecuencialmente para una instancia y no tener ninguna validez en otra.
2) Identificar claramente las evidencias que darán cuenta de los propósitos
de la evaluación. Como ya se ha señalado anteriormente, la validez
consecuencial está determinada por la correspondencia entre la información
que se recoge y los fines para los que se utilizará. En este sentido, la
sugerencia es tener una buena planificación que permita resguardar esta
correspondencia y no realizar una evaluación y luego definir para qué la
puedo usar. Un ejemplo de esto son las “pruebas sin aviso” que se realizan
en una clase, cuya motivación obedece más a un control disciplinario que a
la evaluación de los aprendizajes esperados. Estas evaluaciones por lo
general son improvisadas y se agregan como una calificación cuyas
consecuencias son, en su mayoría, negativas para los estudiantes.

Confiabilidad:
Otro elemento que se considera al momento de analizar la calidad de una
evaluación es la confiabilidad o precisión de ésta. A diferencia de la validez, la
confiabilidad sólo se relaciona con la consistencia de la medición, al margen de lo
que se mida exactamente (Flórez, 1999; Hogan, 2004).
La confiabilidad implica que el instrumento entrega resultados similares cuando se
repite su aplicación en las mismas circunstancias a las mismas personas. El
concepto de confiabilidad hace referencia a consistencia, exactitud y estabilidad
de los resultados, a las inferencias que se pueden realizar, y tiene directa
relevancia en las conclusiones y posterior toma de decisiones.
La confiabilidad se puede verificar de diversas maneras, pero las más comunes
son el coeficiente alfa de Crombach, que entrega la consistencia interna de un
instrumento, la correlación test-retest, que evalúa la consistencia entre dos
mediciones del mismo test, aplicadas al mismo sujeto, y las formas paralelas, que
evalúan el grado de correlación que hay entre dos versiones de una misma
prueba.
Este criterio de calidad tiene su origen en la psicometría, donde se dice que una
prueba será confiable si consistentemente genera la misma puntuación, o una
similar, al ser aplicada a un individuo, y su puntuación es replicable al menos con
un margen de error pequeño. Moss (2003) señala que en las evaluaciones de
aula, a diferencia de las evaluaciones a gran escala, la confiabilidad no es un tema
relevante y que muy pocas veces se considera; sin embargo, argumenta que su
afirmación se refiere a pruebas, y que en la sala de clases los profesores tienen
múltiples instancias para recoger información complementaria de un aprendizaje.
Smith (2003) reafirma esta idea señalando que los profesores no calculan
coeficientes alfa, ni correlaciones test-retest, ni formas paralelas, por una parte,
porque no tienen un número de casos suficientes y, por otra, porque las
evaluaciones son realizadas a un estudiante en un tiempo específico. No obstante,
lo que es fundamental en este caso es que se espera que el alumno cambie su
aprendizaje de una semana a otra, elemento que va contra lo esperado en
psicometría respecto de la estabilidad de los rasgos que se miden.
Por tanto, en el contexto de la sala de clases, donde no interesa generar un orden
o jerarquía de los estudiantes en las actividades que se evalúan, la confiabilidad
desde una mirada psicométrica no es pertinente (Brookhart, 2003; Smith, 2003).
Además, muchas evaluaciones se califican con categorías (por ejemplo,
excelente, satisfactorio, regular, insatisfactorio), lo que generaría un problema para
hacer algún cálculo de confiabilidad “tradicional”. Moss (2003) plantea que lo
correcto para hablar de confiabilidad a nivel de aula es analizar la “suficiencia de
información”, es decir, la confiabilidad está representada por tener suficiente
evidencia de un aprendizaje que permita tomar decisiones con el menor margen
de error. En su propuesta, se plantea que esta evidencia debe no solo
corresponder al mismo contenido sino tener un mismo nivel de exigencia, lo que
parece ser lo más difícil de cumplir (Smith, 2003). Brookhart (2003) es muy claro
en el momento de diferenciar la confiabilidad a gran escala y a nivel de aula (ver
Tabla 2).
La confiabilidad a gran escala se entiende como la consistencia entre los factores
que componen un instrumento de medición, mientras que a nivel de aula es vista
como suficiencia de la información. En el primer caso se busca una clasificación
estable a lo largo de un continuo y a nivel de aula se busca obtener información
estable entre el ideal del aprendizaje (lo que busca el profesor de sus alumnos) y
lo real alcanzado.
Comparación de la Confiabilidad de evaluaciones a gran escala y en la sala de
clases.
(Adaptado de Brookhart, 2003)
Evaluación a gran escala Evaluación en el aula
La confiabilidad es la consistencia entre La confiabilidad es la suficiencia de la
factores relevantes. Información.

El objetivo de la confiabilidad es tener El objetivo de la confiabilidad es tener


una clasificación estable de los información estable acerca de la
estudiantes en una escala de diferencia entre el desempeño de los
puntuación o una categorización estudiantes y el “ideal”, tal como se
estable a lo largo de un continuo de definen en los objetivos de aprendizaje.
progreso.
Entre los factores que pueden influir en la confiabilidad de una evaluación
destacan:
a) El número de observaciones o evidencias de un aprendizaje, ya que mientras
más instancias de evaluación del mismo aprendizaje haya (número de ítems en
una prueba, instancias de evaluación formativas, etc.), mayor será la “consistencia
interna” del proceso de evaluación y más confiable será la conclusión respecto del
logro del estudiante;
b) Las características de la aplicación, referidas a la claridad de las instrucciones,
tiempo destinado y disposiciones del espacio físico; y c) la precisión de la
corrección y puntuación (Himmel et al., 1999; Hogan, 2004). Este último punto
será tratado en forma independiente bajo el título de “Objetividad”, dada la
relevancia que tiene en el ámbito educativo.
Los estudiantes frente a este criterio de calidad señalan que sus malas
experiencias evaluativas se centran principalmente en la falta de oportunidades
para demostrar su aprendizaje en distintas instancias. Algunos ejemplos se
presentan a continuación:
• “En un taller en la universidad, solo había una prueba al final y con eso se jugaba
la nota del curso. Encuentro que eso es una mala evaluación, porque hay muchas
cosas que pueden afectar la respuesta que uno da y justo ese día puede pasar
algo que haga que uno responda mal, aunque haya estudiado”.
• “Una situación negativa de evaluación fue cuando tenía que disertar y estaba
enferma con fiebre y me sentía muy mal; la profesora me retó porque mi
exposición fue muy mala. Me dio mucha rabia, porque yo me sabía la materia y no
tuve otra oportunidad de demostrarlo”.
• “En un curso donde las pruebas eran una pregunta por cada tema y si justo no te
sabías eso específico, perdías con esa pregunta, aunque te supieras el tema”.
Rev. Pensamiento Educativo, Vol. 43, 2008. pp. 285-305
299 Rev. Pensamiento Educativo, Vol. 43, 2008. pp. 285-305
Evaluación al interior del aula: una mirada desde la validez, confiabilidad y
objetividad. Carla Förster Marín, Cristian A. Rojas-Barahona.
• “En las pruebas de alternativas de una profesora, donde en general la alternativa
más larga era la correcta, y entonces, por descarte uno podía responder las
pruebas y sacar buena nota, al final creo que no aprendí casi nada”.
Para resguardar que las evaluaciones sean confiables se debe tener en cuenta
que el fin último de este criterio es que las conclusiones y posteriores decisiones
respecto de la forma que se aborda el proceso de enseñanza-aprendizaje con los
alumnos debe estar basado en la evidencia suficiente para no cometer errores (o
al menos minimizarlos).
En este sentido las acciones sugeridas a continuación proporcionan una guía para
lograr evaluaciones confiables:
1) Aplicar al mismo estudiante variadas situaciones evaluativas que midan el
mismo aprendizaje. Dar la posibilidad al estudiante de demostrar su desempeño
frente a un mismo aprendizaje, a través de reiteradas oportunidades, permite tener
la certeza de que el aprendizaje fue o no logrado. Esto se puede realizar en
distintas actividades evaluativas o poniendo en un mismo instrumento distintas
situaciones de evaluación que evalúen lo mismo (por ejemplo, distintos ítems en
una prueba).
2) Velar por la claridad de los ítems e instrucciones. Hay ocasiones en que un ítem
puede estar correctamente construido, pero ser comprendido por los estudiantes
en dos sentidos diferentes, si no está esto considerado, al momento de revisar la
información se puede generar un sesgo que altere las puntuaciones de los
estudiantes y, por tanto, la confiabilidad de la evaluación.
3) Velar porque el ambiente de aplicación sea similar en cuanto a recursos,
espacios y tiempo. Es particularmente importante tener en cuenta esta sugerencia
cuando se realizan evaluaciones en ambientes que no son los óptimos, por
ejemplo: hay música en el patio, hace mucho calor en la sala, hay una actividad
recreativa programada a continuación, etc., pues los resultados de la evaluación
estarán influidos por estos aspectos y puede que no representen los aprendizajes
reales de los estudiantes.
4) Velar por la precisión de la corrección. Esta sugerencia se refiere a la
objetividad de la revisión de la información recogida en la evaluación y será
tratada con detalle a continuación.
Objetividad:
La objetividad o precisión de la corrección en un proceso evaluativo es un
elemento clave asociado a la confiabilidad de una evaluación; sin embargo, se
decidió tratarlo en forma separada dada la relevancia e impacto que tiene al
interior de la sala de clases.
Esto no supone que sea independiente de la confiabilidad.
Por lo general, la objetividad se entiende como la calidad de un objeto en sí,
independiente de las consideraciones o juicios personales.
En relación a este tema Calatayud (1999) afirma que quien cree que la evaluación
de los estudiantes es una acción objetiva, se embarca en una tarea imposible. La
autora plantea que la evaluación es una práctica compleja, que involucra no solo
el dominio de una técnica, sino también posee una carga moral y valórica
importante, y por tanto, es una actividad ligada a las creencias personales de los
docentes, lo quieran o no. Desde esta perspectiva, la imparcialidad no es posible y
cada juicio que se emite tiene un componente de apreciación propio de quien lo
expresa.
Esta preocupación por la objetividad de la evaluación no es un tema nuevo.
Estudios asociados a las expectativas de los docentes como los de Rosenthal y
Jacobson (1968; efecto “Pigmalion”), de Spears (1984) y de Rubie-Davies (2006)
muestran que los estudiantes considerados de “bajo rendimiento” tienen menos
tiempo para contestar en una interrogación oral, reciben menos ayuda o “pistas”
cuando preguntan alguna duda en una prueba y reciben menos retroalimentación
de su desempeño que los estudiantes considerados de “alto rendimiento”, para los
cuales los docentes tienen mayores expectativas. Cabe señalar que estas
expectativas, en general, están condicionadas por características personales de
los estudiantes como el género, el nivel socioeconómico, la raza o etnia, la
apariencia física y los patrones de lenguaje oral.
Estudios como el de López y colaboradores (1983) dan cuenta de cómo diferentes
profesores de matemáticas o física dan puntuaciones o calificaciones distintas a
un mismo ejercicio, lo cual se podría atribuir a diferentes niveles de exigencia en la
corrección que no debería afectar a los estudiantes, si son corregidos todos por la
misma persona (Gil Pérez y Vilches, 2008), mientras que otras evidencias indican
que un mismo profesor puede puntuar o calificar de manera diferente la respuesta
de un estudiante dependiendo del momento (Hoyat, 1962). Aunque se asume que
la corrección nunca será ciento por ciento objetiva, es conocido por todos que los
profesores tienen escaso tiempo para corregir trabajos y pruebas de sus
estudiantes, y que lo hacen en los pocos espacios físicos y temporales que tienen
disponibles, implicando que algunos comienzan en el colegio durante la mañana,
pero pueden terminar al día siguiente en su casa de madrugada. Si no se generan
acciones concretas que eviten distorsionar el criterio de corrección, las
posibilidades de cambiar la exigencia y la respuesta esperada pueden ser
enormes.
Estos problemas de objetividad se ven reflejados en las opiniones de estudiantes
respecto de experiencias de evaluación que resultaron ser negativas para su
proceso de aprendizaje:
• “En un taller se hacían controles de lectura con tres preguntas sin mayor
explicación, al tener el control observé que no tenía todo el puntaje en ninguna de
las preguntas, al preguntar por qué, el profesor me dio la respuesta correcta y era
lo mismo pero con otras palabras”.
• “Una prueba en un ramo donde casi todo el curso se sacó un rojo. Nadie
entendía por qué estaba todo mal. Las preguntas fueron muy específicas, y la
pauta era muy estricta. No quedó claro qué estaba mal y qué era correcto”.
• “En la clase de artes, en mi caso presenté una pintura que fue bien evaluada, la
hice a la rápida y no me tomó mayor trabajo, en cambio, a uno de mis compañeros
lo evaluó muy mal, siendo que su pintura era mucho más trabajada, novedosa y
había seguido todas las instrucciones. Como no había pauta, no pudo alegar
nada”.
• “En enseñanza media, todas las evaluaciones de historia se realizaban con
cuestionarios, el problema radicaba en que las pruebas quedaban en poder del
profesor y no se tenía derecho a corrección”.
• “Un trabajo final de un curso, donde a pesar que mi trabajo fue considerado uno
de los mejores del curso en la presentación, fue mal evaluado porque me
encontraba en malas relaciones con el profesor”.
• “Un profesor califica como insatisfactorio un trabajo, pero al comparar notamos
que estaba mejor que otros que tenían calificaciones satisfactorias. Son
experiencias negativas donde pesa más el criterio del profesor que no es conocido
ni entendido por los alumnos”.
Dado que la objetividad de una evaluación consiste en resguardar la ausencia de
sesgos o apreciaciones subjetivas en la interpretación de las evidencias y/o
procesos que las generaron, se sugieren algunas acciones que un docente puede
realizar fácilmente en el aula:
1) Informar a los alumnos la intencionalidad de la evaluación y los aprendizajes a
evaluar. La doble función de esta acción es que, por una parte, el docente debe
hacer explícito el propósito de sus evaluaciones en la planificación, y, por otra,
para sus estudiantes no hay ambigüedades en qué se les va a evaluar y con qué
fin, por tanto la evaluación deja de ser una “caja negra” y se convierte en una
herramienta de aprendizaje con normas claras y bien definidas.
2) Dar a conocer a los alumnos los criterios de evaluación. Si entendemos que la
evaluación es parte del proceso de enseñanza-aprendizaje, y por ende su fin es
ayudar a mejorar los conocimientos de los estudiantes, estos deben saber
claramente con qué criterios se les va a evaluar. Preparar una presentación oral
que va a ser evaluada en cuanto al uso de las habilidades comunicativas es muy
diferente que prepararla para ser evaluado en el dominio conceptual de dicha
presentación, por tanto, los énfasis que un estudiante pone y el tipo de aprendizaje
que desarrolla estarán en directa relación con la pauta de trabajo que se le haya
entregado. Si la pauta y sus criterios son ambiguos o desconocidos, el estudiante
realizará lo que cree que debe hacer y si eso no concuerda con lo que el profesor
evalúa, la evidencia no será confiable y las conclusiones erróneas.
3) Elaborar pautas de respuesta o corrección. Es común elaborar pruebas o
situaciones de evaluación, y luego, al momento de corregir se hace un punteo de
las ideas que deberían estar presentes en la respuesta o desempeño del
estudiante, sin embargo, lo que en una respuesta significa 0.75 puntos cuando se
comienza a corregir, puede significar 0.8 cuando se está terminando. El criterio y
la exigencia varían producto de diferentes causas (por ejemplo, momento del día,
el contexto en el cual se corrige, etc.), por tanto, tener una pauta clara y precisa
ayuda a mantener la consistencia en la aplicación y evitar los sesgos propios de
un proceso corrección. Además, permite que los estudiantes conozcan esos
criterios y puedan contrastarlos con sus resultados, haciendo transparente el
proceso de evaluación y permitiéndoles reconocer sus errores y conocer qué se
esperaba en cada caso.
4) Establecer previamente los criterios de asignación de puntajes en función de la
relevancia y nivel de complejidad de los aprendizajes. Este elemento es clave en
dos sentidos: primero permite al docente asegurar, previo a la aplicación de la
evaluación, que los ítems a evaluar reflejan, en términos de extensión y
complejidad, la relevancia que se les asigna con un puntaje determinado en
comparación con el puntaje total de la evaluación; y en segunda instancia, los
estudiantes toman decisiones en función del peso que tiene cada ítem respecto de
la dedicación y orden con la que se enfrentan a ellos. La ausencia de esta
asignación genera ambigüedad para los alumnos en los énfasis que da el docente
a cada aspecto que se está evaluando.
Conclusiones:
La evaluación es parte del proceso de enseñanza y aprendizaje al interior del aula,
y como tal puede marcar a un estudiante tanto positiva como negativamente. En
esta revisión se ha presentado cómo la ausencia de validez, confiabilidad y
objetividad en una situación evaluativa puede generar desmotivación, aprendizajes
erróneos y sentimientos de injusticia en los estudiantes, que en nada favorecen un
ambiente de aprendizaje que resulte significativo para ellos.
En general, los profesores no calculan la confiabilidad, el error estándar de una
medición o los coeficientes de validez y de discriminación de una evaluación.
Estas técnicas son propias del desarrollo de pruebas estandarizadas y de
aplicación a gran escala, pero tienen una importancia limitada en la evaluación al
interior del aula. En el artículo se intenta rescatar los elementos que pueden ser
claves y necesarios de resguardar para hacer evaluaciones que aporten al
aprendizaje de los estudiantes, como son la validez de contenido, la validez
instruccional, la validez consecuencial, la confiabilidad y la objetividad. Como se
discutió anteriormente, la validez no se plantea en términos absolutos, sino en
grados y depende del propósito para el que fue creada la evaluación, si sus
resultados serán más o menos válidos para sacar conclusiones respecto de ese
fin.
Tanto la validez como la confiabilidad aumentan o disminuyen según sea la
calidad de la evidencia que las sustenta.
La validez de contenido de un instrumento o situación evaluativa se refiere a la
cobertura y relevancia de los contenidos y/o habilidades en un área disciplinar
específica que han sido seleccionados, y las sugerencias para resguardar este
criterio son: elaborar una tabla de especificaciones del instrumento y someter la
evaluación a criterio de “jueces”.
La validez instruccional hace referencia a la coherencia entre lo que se va a
evaluar y lo que los estudiantes han tenido oportunidad real de aprender. Las
sugerencias para resguardar este criterio de calidad son: velar por que las
situaciones de evaluación contengan los contenidos vistos en las actividades de
aprendizaje, sean equivalentes a las actividades realizadas y utilicen un lenguaje
conocido por los estudiantes.
La validez consecuencial tiene relación con las consecuencias tanto positivas
como negativas que puede tener una evaluación para el aprendizaje de los
estudiantes; se sugiere resguardar este criterio definiendo claramente los
propósitos y usos de la evaluación e identificando a priori las evidencias que darán
cuenta de dichos propósitos.
Es pertinente resaltar que la validez instruccional debe ir de la mano de la validez
de contenidos, no sería lógico evaluar algo que efectivamente se enseñó, pero
que no es relevante para el área disciplinar del curso.
La confiabilidad corresponde a la consistencia y precisión de una evaluación, vale
decir, que las evidencias que se recojan del desempeño de los estudiantes sean
suficientes para emitir un juicio respecto del nivel de logro de sus aprendizajes.
Las acciones que permiten resguardar este criterio son: evaluar en reiteradas
ocasiones a un estudiante respecto de un mismo aprendizaje, ya sea en instancias
diferentes o en varios ítems dentro de una misma situación evaluativa, velar por la
claridad de los ítems, sus instrucciones, el ambiente de aplicación y la precisión en
la corrección. Este último elemento también es llamado objetividad y tiene especial
importancia al interior de la sala de clases, dadas las consecuencias que puede
generar el no resguardarlo. Para ello se sugiere informar previamente a los
estudiantes la intencionalidad de la evaluación y los aprendizajes a evaluar, dar a
conocer los criterios de evaluación, elaborar pautas de respuesta o corrección y
asignar previamente los puntajes en función de la relevancia y nivel de
complejidad de los aprendizajes.
Aun cuando la evaluación de aprendizajes al interior del aula es una tarea
compleja que requiere tiempo y esfuerzo adicional, es fundamental integrarla
como parte del proceso de enseñanza y no verla como una instancia separada. Si
se asume esta posición habrá coherencia entre la planificación y la práctica, en la
selección de los contenidos y habilidades que se enseñan y que se evalúan,
mejorando conductas evaluativas donde escasea la validez, confiabilidad y
objetividad.

Seguimos trabajando en el próximo módulo…

También podría gustarte