Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Septiembre de 2005.
1
INTRODUCCION
Planeación Intervención
Observación
2
La evaluación no puede limitarse al ámbito de los objetivos más fácilmente
contrastables, porque se perdería de vista la importante influencia de estrategias
intelectuales y de procesos de pensamiento subyacentes a las tareas específicas, factores que
nos permiten explicar causalmente el origen del éxito o fracaso del alumno. Sólo así la
evaluación cumple su función de perfeccionamiento del proceso didáctico.
Tipología de la evaluación1:
Sumativa
Por su funcionalidad Formativa
Nomotética Normativa
Por su normotipo Criterial
Idiográfica
Inicial
Por su temporalidad Procesual
Final
Autoevaluación
Por sus agentes Coevaluación
Heteroevaluación
¿Qué tipos de referencias o criterios nos van a servir de punto de apoyo en nuestras
interpretaciones?
La evaluación nomotética, cuyo referente es externo, puede ser referida a una norma
o a un criterio. Cuando la referencia es normativa, nos permite la comparación del
rendimiento de cada alumno con respecto al logrado por el grupo. Si la referencia es contra
criterio, nos permite determinar el nivel de competencia del alumno con respecto a un
objetivo fijado.
1
Casanova (1998)
3
¿Para qué se evalúa?
Proceso:
4
La evaluación final o sumativa constituye un balance de los conocimientos adquiridos y
nos permite emitir un juicio de acreditación académica, posibilita la comparación de
grupos y la conexión entre niveles secuenciados, por lo que exige un espectro amplio de
conductas representativas y significativas del aprendizaje. La información cuantitativa
proporcionada por la evaluación sumativa, permite además cumplir con la función de
control y acreditación del aprendizaje, imprescindible para la planeación y sistematización
de la práctica educativa.
Objetivos y evaluación.
Las características del aprendizaje, las posibilidades del maestro y las circunstancias en
que ha de desarrollarse la evaluación, determinan cual es la estrategia más adecuada, o
simplemente posible, y a que nivel de rigor o complejidad puede llegarse. Es realmente
indispensable que el juicio de evaluación no se base en impresiones subjetivas, situaciones
excepcionales o aisladas, ni en información insuficiente, irrelevante o accesoria. La
información obtenida a través de algún instrumento o de la observación intencionada y
sistemática, debe ser analizada por el maestro y comparada con parámetros adecuados:
5
PLANEACIÓN DE LA EVALUACIÓN DEL
APRENDIZAJE
6
La evidencia o indicadores del aprendizaje deberán reflejar los objetivos de la
enseñanza del curso, para su expresión adecuada el enunciado debe comprender tres
elementos: a) la conducta o ejecución específica de la persona; b) las condiciones en que
deberá manifestarse la conducta, y c) la norma de ejecución para ser aceptada.
Para esta parte del diseño se recomienda una taxonomía de objetivos educativos
acorde con los descubrimientos más recientes en materia de aprendizaje. Se revisaron
diversas taxonomías en la literatura especializada y aquella que es más acorde con los
modelos educativos actuales es la que propone Marzano (2000) el cual desarrolla una
propuesta a partir de un análisis de la taxonomía de Bloom, principalmente de sus
debilidades. En su propuesta rescata aquellos aspectos aún vigentes de la taxonomía
publicada por Bloom en 1956, incorporando los avances de los 40 años posteriores a su
publicación.
Cabe hacer un paréntesis y señalar cuáles son las críticas más comunes a la
taxonomía de Bloom, y en que consisten; una de ellas es que se sustenta en una concepción
del aprendizaje a un nivel unidimensional, asumiendo el constructo de complejidad como
único elemento para separar los niveles del dominio cognoscitivo, otra crítica relacionada
con este constructo, es acerca de la estructura jerárquica que presupone que aquellos niveles
subordinados involucran menor nivel de complejidad de los procesos cognoscitivos
inherentes. Ambas características de la taxonomía no se pueden sostener desde los
descubrimientos actuales de investigación básica de los procesos cognoscitivos en el
hombre (Furst, 1994).
2
Entre las más conocidas se encuentran las de Bloom (1956), Gagné (1970) y Tuckman (1979),
Haladyna (1997) y Marzano (2000) aunque existen otros enfoques diferentes o complementarios.
7
Estas críticas se sustentan en el principio básico de que la dificultad de un proceso
mental es una función de al menos dos factores: la complejidad inherente al proceso en
términos de los pasos involucrados en el procesamiento de la información y en el grado de
familiaridad con el proceso. La complejidad de un proceso mental es invariante, es decir
que el número de pasos y sus relaciones no cambian, no obstante la familiaridad con el
proceso puede cambiar a lo largo del tiempo. A mayor familiaridad con un proceso se
asocia un menor tiempo de ejecución y una mayor facilidad en la misma. En consecuencia
no es conveniente ordenar jerárquicamente los procesos mentales en función de su
complejidad, resulta más efectivo ordenarlos en términos de control, ya que actualmente
sabemos que algunos procesos ejercen un control sobre la operación de otros procesos.
8
Esta teoría de aprendizaje, permite el diseño de un sistema jerárquico del
pensamiento humano desde la perspectiva de dos criterios: el flujo de información y el nivel
de conciencia para el control de los procesos involucrados. En términos del flujo de
información, el procesamiento de la información siempre inicia con el sistema de
autoeficacia, prosigue con el sistema metacognitivo y finaliza con el sistema cognoscitivo,
es decir que los tres sistemas representan una organización jerárquica en términos del flujo
de la información. El estatus de los diversos factores dentro de un sistema afectan el estatus
de los diferentes factores dentro de los demás sistemas.
Por ejemplo si dentro del sistema de autoeficacia no existen creencias que concedan
importancia a la tarea, o piensa que tiene pocas probabilidades de lograr una ejecución
aceptable, el individuo no se involucrará en la tarea o su nivel de compromiso será mínimo
o de baja motivación. Además, aún si la tarea se percibe como importante y el sujeto piensa
que puede realizarla, pero el sistema metacognitivo no establece metas claras o no existe un
monitoreo efectivo, la ejecución de la tarea puede fallar. Finalmente aún cuando funcionen
bien todas las operaciones de los dos primeros sistemas, pero el procesamiento de la
información dentro del sistema cognoscitivo no opera efectivamente, la tarea no se
completará.
Adicionalmente estos tres sistemas también tienen una jerarquía relativa al nivel de
conciencia requerida o recursos de procesamiento conciente para controlar la ejecución. Es
decir que en el sistema de autoeficacia los procesos para establecer la relevancia, eficacia y
motivación hacia la ejecución de una tarea, representan un nivel de introspección y
pensamiento conciente mayor que aquel involucrado en los procesos metacognitivos de
establecimiento de metas y monitoreo conciente. Finalmente en el sistema cognoscitivo, los
procesos de utilización de la información son los que requieren mayor grado de
pensamiento conciente en su ejecución, seguidos de los de análisis, comprensión y por
último los de recuperación que pueden darse de manera automática.
9
Taxonomía de Objetivos Educativos
Los tres sistemas de pensamiento
Descripción de los objetivos
Nivel 6: Self-System El estudiante:
Examinando relevancia Identifica la importancia del conocimiento y el razonamiento que subyace a su
percepción
Examinando eficacia Identifica las creencias acerca de su habilidad para mejorar su competencia o
comprensión del conocimiento y el razonamiento que subyace a esta
percepción
Examinando respuesta Identifica respuestas emocionales al conocimiento y las razones de estas
emocional respuestas
Examinando motivación Identifica su nivel de motivación para mejorar su competencia o comprensión
relativa al conocimiento y las razones de este nivel de motivación
Nivel 5: Sistema de
Metacognición
Especificación de metas Establece un plan de metas relativas al conocimiento
Monitoreo de procesos Monitorea la ejecución del conocimiento
Monitoreo de Claridad Determina el grado en el cual tiene claridad acerca del conocimiento
Monitoreo de exactitud Determina el grado de exactitud del conocimiento
Sistema Cognoscitivo
Nivel 4: Utilización del conocimiento
Toma de decisiones Usa su conocimiento para tomar decisiones o puede tomar decisiones acerca
del uso de su conocimiento
Solución de problemas Usa su conocimiento para resolver problemas o puede resolver problemas
acerca de su conocimiento
Cuestionamiento Usa su conocimiento para generar y probar hipótesis o genera y prueba
experimental hipótesis acerca de su conocimiento
Investigación Usa su conocimiento para conducir investigaciones o puede conducir
investigaciones acerca del conocimiento
Nivel 3: Análisis
Empate Identifica importantes similitudes y diferencias entre el conocimiento
Clasificación Identifica categorías superordinadas y subordinadas relacionadas con el
conocimiento
Errores de análisis Identifica errores en la presentación o uso de la información
10
La taxonomía divide de manera clara el dominio del conocimiento y las operaciones
mentales, al postular tres sistemas de pensamiento que operan con tres dominios de
conocimiento. Así las operaciones mentales contenidas en los sistemas de pensamiento
interactúan de diversas maneras con los tres dominios de conocimientos, los cuales pueden
clasificarse en tres categorías generales: información, procedimientos mentales y
procedimientos psicomotores. Dado que estos tres tipos de conocimiento son muy
diferentes, resulta conveniente pensar en ellos como dominios sobre los que actúan los tres
sistemas del pensamiento.
Dominio de Información
Componentes Descripción Ejemplos
Vocabulario Significado de términos a un El significado del término
nivel general y muchas veces “democracia” sin los detalles de
superficial. sus implicaciones en diversos
contextos.
Detalles Hechos Contienen información específica Las características de un lugar:
acerca de personas, lugares, “Chetumal es la capital de
cosas y eventos. Quintana Roo”.
Secuencias de Eventos importantes que Los eventos que ocurren entre el
tiempo ocurren entre dos puntos en el inicio de una campaña política y
tiempo. las elecciones presidenciales en
un país.
Secuencias causa- Involucran eventos que Organización de secuencias
efecto producen un producto o un causales de algún evento
efecto. Comúnmente los efectos histórico.
tienen redes complejas de Secuencia de los procesos de
causas. división celular.
Episodios Eventos específicos que ocurren Un debate político entre
en un determinado tiempo y candidatos de los partidos
lugar, entre personas específicas políticos, previo a las elecciones
y con secuencias de tiempo y presidenciales de un país.
causales particulares.
Ideas Generalizaciones Son declaraciones de carácter El amor es una de las emociones
organizadas general, representan humanas más poderosas.
abstracciones que identifican
clases o categorías de personas,
lugares o situaciones.
Principios Tipos específicos de Causal: La tuberculosis es
generalizaciones que se refieren producida por una bacteria
a relaciones causales o denominada “tubercle bacillus”
correlacionales. Correlacional: Las ciudades con
mayor densidad de población
presentan índices de criminalidad
elevados.
11
Dominio de procedimientos mentales
Descripción Ejemplos
Reglas simples Es el tipo más simple, consiste de El procedimiento para realizar
Habilidades una producción “si (una situación una resta entre dos números
X)-entonces ejecuta la acción Y)” naturales.
y se emplean en los pasos de
algún procedimiento
Algoritmos Procedimientos mentales que Obtener la media aritmética o
normalmente no presentan la varianza de un grupo de
variantes en su aplicación, tienen datos.
resultados específicos y un
número específico de pasos.
Tácticas Consisten en la producción de un Interpretación de una gráfico
patrón general en el cual se que presenta una función entre
incorporan reglas generales, no variables.
hay un orden o número de pasos
rígido.
Procesos Procedimientos Técnicamente se refieren a Elaborar un plan de
macro procedimientos más complejos mercadotecnia de algún
con varios subcomponentes y que producto o servicio.
requieren alguna forma de
administración y control.
12
Ejemplos de tabla de especificaciones:
13
Niveles de complejidad Nivel 1.Recuperación
Matemáticas sugeridos Nivel 2. Comprensión
Nivel 3. Análisis
Nivel 4. Utilización del conocimiento
Nivel 5. Metacognición
Nivel 6. Autoeficacia
Área 1 2 3 4 5 6 Dominio Evidencia necesaria para la Ponderación
Rasgos del Perfil
referencial de validez evaluación de ese rasgo
M. Operaciones X Algoritm. Maneja los algoritmos de las 25%
numéricas básicas. operaciones básicas
X Reglas Aplica la jerarquía de las
simples operaciones básicas con enteros y
fracciones
X Reglas Descompone un número en factores
simples primos
X Algoritm. Encuentre el mínimo común múltiplo
y el máximo común divisor
M. Operaciones con X Algoritm. Aplica las leyes de los exponentes al 25%
potencias y raíces. realizar operaciones
X Algoritm. Convierte de la notación de radical a
la notación de potencia
X Reglas Simplifica radicales
simples
X Algoritm. Aplica las leyes de los radicales
14
TÉCNICAS E INSTRUMENTOS DE
RECOGIDA DE DATOS
De recogida de datos
Observación Participante
No participante
Estructurada
Formal Semiestructurada
Entrevista Abierta
Técnicas Informal
Encuesta
Sociometría
Coloquio
Trabajos del alumno
De análisis de datos
Triangulación
Análisis de contenido
Anecdotario
Lista de control
Escala de valoración
Cuestionario
Instrumentos Sociograma
Psicograma
Diario
Grabación
15
Preguntas de ensayo
Conviene usar las preguntas de ensayo siempre que se requiera obtener información
acerca de las habilidades que los alumnos tienen en la organización, integración y síntesis
de su conocimiento a fin de resolver problemas para los cuales no existan planes
predeterminados de solución, de manera que se requiera ser original e innovador en su
enfoque a las situaciones presentadas en los problemas.
Para identificar este potencial, se requiere que cada pregunta sea cuidadosamente
redactada de tal manera que el estudiante manifieste esta clase de habilidad. El simple
hecho de formular una pregunta para que se escriba un ensayo a partir de ella, no quiere
decir que automáticamente se está asegurando que se podrán evaluar esas habilidades.
1. Relacione las preguntas tan directamente como le sea posible con los resultados de
aprendizaje que se desea evaluar. Es decir, al elaborar la pregunta tenga en mente los
procesos mentales que quiere que el estudiante use al contestarla.
2. Use las preguntas de ensayo solo en el caso de que desee obtener evidencia de procesos
mentales complejos (análisis, síntesis y evaluación) y utilice material novedoso para
redactar las preguntas. Se debe evitar que los estudiantes se limiten a reproducir el
material que han leído en los textos o que han escuchado en las exposiciones en clase.
3. Formule preguntas que presenten al estudiante una tarea clara y definida. Empiece con
palabras o frases como: “compare”, “contraste”, “indique las razones para”,
“proporcione ejemplos originales de “, “explique cómo”, “Haga una predicción de lo
que sucedería si”, “critique”, “diferencie”, “ilustre”, etc.
16
5. Conceda tiempo suficiente para responder la prueba (sugiera duraciones límites para
cada pregunta) y adapte el tamaño y la complejidad de la respuesta al nivel de
maduración de los estudiantes.
Para que las preguntas de ensayo sean indicadores fiables del aprovechamiento de los
estudiantes, se deben tomar ciertas precauciones. Además de las sugerencias presentadas, se
debe mantener un estándar congruente en la estimación y calificación de las respuestas de
los estudiantes y se deben proporcionar al estudiante las bases sobre las cuales se juzgará
cada respuesta. Dado que una de las principales limitaciones de las pruebas de ensayo es la
subjetividad en el proceso de calificación se recomienda que:
Decida de antemano qué cualidades tomará en cuenta para estimar la adecuación de una
respuesta. Si existe más de una cualidad para ser apreciada, haga evaluaciones separadas
para cada una.
Prepare una guía de respuestas o una respuesta modelo por adelantado, la cual muestre
los aspectos que deben quedar incluidos, especificando el número de puntos que
asignará a cada respuesta así como a cada parte de la misma.
Califique las respuestas ignorando quien las escribió para evitar predisposiciones
personales durante la calificación.
Escriba comentarios y corrija los errores de las respuestas para retroalimentar a sus
estudiantes.
17
ELABORACIÓN DE REACTIVOS DE
OPCIÓN MÚLTIPLE
Los estímulos de una prueba objetiva pueden ser de diferentes formas, sin embargo
diversas investigaciones y la propia evidencia empírica resultante de las aplicaciones,
demuestran que los reactivos de opción múltiple son los más estables y nos sirven no solo
para medir los resultados de conocimiento, sino de una gran variedad de habilidades y
capacidades intelectuales, por lo que resultan ser los de uso más común. Las investigaciones
también han demostrado que los estímulos de opción múltiple con cuatro opciones son los
mejores, siempre que se inicie con cinco opciones y se elimine la que consistentemente
tenga menor frecuencia de respuestas.
Algunas ventajas de las pruebas objetivas conformadas por reactivos de opción múltiple
son:
Los reactivos de opción múltiple se conforman por una base y cuatro o cinco opciones
de respuesta. La base es el enunciado que presenta la situación problema planteada explícita
o implícitamente en una pregunta, afirmación o enunciado incompleto. Las opciones se
entienden como las posibles respuestas, entre las cuales una responde correctamente al
enunciado o pregunta y las otras son respuestas incorrectas llamadas distractores.
En cuanto a su escritura:
18
Evite errores gramaticales: de puntuación y de ortografía, así como abreviaturas.
Evite el uso complicado de gerundios, participios, artículos y preposiciones.
Emplee conceptos conocidos en lugar de sinónimos o vocabulario rebuscado.
Si los artículos o preposiciones que acompañan a los sustantivos son iguales para todas
las opciones, deben formar parte de la base.
Tome en cuanta el tiempo de lectura por reactivo, utilice la información necesaria pero
suficiente, para minimizar el tiempo.
Evite elaborar reactivos que evalúen sólo el sentido común del sustentante.
Tome en cuenta el nivel escolar y el de maduración de los examinados.
En cuanto al contenido:
Cada estímulo debe presentar, por sí mismo, un problema que al ser resuelto permita
demostrar que se ha alcanzado un objetivo determinado.
Incluya todos los elementos estrictamente necesarios para comprender el sentido
correcto de la pregunta, de tal manera que sin leer las opciones tenga sentido propio.
Los estímulos deben ser independientes unos de otros, sin que la información contenida
en uno sugiera la solución de otro.
Elabore un esquema de indagación y no sólo una palabra o frase.
Cuide que la redacción sea precisa y adecuada.
No sobrecargue el enunciado con material no pertinente por el deseo de seguir
enseñando.
Evite términos que confundan o den claves de la respuesta correcta.
Evite que una pregunta ayude a responder otra.
Redacte el enunciado en forma afirmativa siempre que sea posible.
19
Indicaciones para elaborar las opciones
1. Simple
2. Jerarquización u ordenamiento
3. Selección de elementos de un listado
4. Relación de Columnas
5. Multireactivos (de cabecera o grupo de reactivos dependientes del contexto)
1. Formato Simple:
20
Formato:
Ejemplos:
2. Jerarquización u ordenamiento
Este tipo de pregunta requiere elegir la opción que contiene el ordenamiento o secuencia
correcta de diversos elementos. La base del reactivo indica que la situación por resolver es
ordenar, con base en algún criterio, una serie de elementos presentados al azar en una lista.
Las opciones se forman a partir de la combinación de varios ordenamientos y sólo una
combinación es correcta.
21
Este tipo de reactivo es útil para evaluar entre otros aspectos: Identificación de procesos,
procedimientos y eventos históricos. El número de elementos a ordenar no deber ser muy
grande y se asignará un punto por el ordenamiento correcto y ninguno por los demás.
Formato:
ENUNCIADO: --------------------------------------------------------------------------------------.
1. ----------------------------
2. ---------------------------
3. --------------------------- Aquí se escribe la lista de elementos en desorden -
4. ---------------------------
5. ---------------------------
OPCIONES:
A) 3, 2, 4, 1, 5
B) 2, 4, 3, 5, 1
C) 5, 1, 2, 4, 3
D) 4, 3, 1, 2, 5
E) 2, 3, 4, 5, 1
Ejemplo:
Indica la secuencia en la que se ordenan cronológicamente los acontecimientos de la vida política
de Benito Juárez.
A) 2, 3, 1, 4
B) 1, 2, 4, 3
C) 2, 4, 3, 1
D) 4, 1, 3, 2
22
Formato:
ENUNCIADO: --------------------------------------------------------------------------------------.
1. -----------------------------
2. ---------------------------- Aquí se escribe la lista de elementos mayor a la
3. ---------------------------- solicitada en la base.
4. ----------------------------
5. ----------------------------
OPCIONES:
A) 1, 2, 5
B) 2, 3, 5
C) 1, 2, 4 Se elige un número de elementos relacionados con un
D) 1, 3, 5 aspecto específico
E) 2, 3, 4
Ejemplo:
De los siguientes tipos de tejido presentados en la lista, elige los cinco tipos de tejido conectivo.
1. Muscular estriado
2. Óseo
3. Cartilaginoso
4. Conjuntivo denso
5. Nervioso
6. Adiposo
7. Sanguíneo
A) 1, 3, 4, 5, 7
B) 2, 3, 4, 6, 7
C) 1, 2, 3, 6, 7
D) 2, 3, 4, 5, 6
Es una forma modificada del estímulo de opción múltiple donde se enlistan en una columna
una serie de premisas y en la otra columna las respuestas posibles. No obstante, a menos
que todas las respuestas sirvan como opciones razonables para cada premisa, el formato
será inadecuado. Hay dos errores comunes al elaborar este tipo de estímulo:
Tendencia a mantener la misma cantidad de premisas y respuestas;
Incluir demasiados elementos en ambas listas.
23
Reglas para su elaboración
a. Incluya sólo material homogéneo en cada estímulo, como “autores y obras”,
“científicos y descubrimientos”, “conceptos y sus definiciones”, etc. para que las
respuestas sean razonables.
b. Utilice listas de tamaño razonable y ubique las respuestas a la derecha; esto
permite una mayor facilidad de lectura y búsqueda.
c. Utilice un número de respuestas menor o mayor que el de las premisas y haga que
las respuestas se puedan usar más de una vez, para reducir la respuesta por tanteo.
d. Especifique en las instrucciones las bases de la correspondencia e indique que cada
respuesta puede usarse una o más veces, o no usarse.
Formato:
1.__________________________________ a) _______________________________
b) _______________________________
2. __________________________________ c) _______________________________
d) _______________________________
OPCIONES:
A) 1 a, b; 2 c, d
B) 1 a, c; 2 b, d
C) 1 b, c; 2 a, d
D) 1 c, d; 2 a, b
Ejemplo:
Relacione los movimientos con sus consecuencias.
Movimientos Consecuencias
E) 1 a, b; 2 c, d
F) 1 a, c; 2 b, d
G) 1 b, c; 2 a, d
H) 1 c, d; 2 a, b
24
5. Multirreactivos
Formato:
INSTRUCCIONES:--------------------------------------------------------------------------------
SITUACIÓN: --------------------------------------------------------------------------------------.
BASE 1 1. --------------------------------------------------------------------------------
OPCIONES:
A) --------------------
B) --------------------
C) --------------------
D) --------------------
BASE 2 2. --------------------------------------------------------------------------------
OPCIONES:
A) --------------------
B) --------------------
C) --------------------
D) --------------------
Ejemplos:
350
300
250
200
150
100
50
0
90
92
94
96
98
00
19
19
19
19
19
20
o
o
añ
añ
añ
añ
añ
añ
25
1. La denominación de la gráfica anterior es:
A) Gráfica x-y
B) Polígono
C) Histograma
D) Pastel
A) 150
B) 200
C) 250
D) 300
3. De acuerdo con los datos de ingreso, entre los años 1990 y 2000, ¿cuál es la moda?
A) 150
B) 200
C) 250
D) 300
1. La disfagia es debida a:
A) estenosis esofágica
B) acalasia esofágica
C) tumor de mediastino
D) candidiasis esofágica
E) cáncer esofágico
A) omeprazol
B) cisaprida
C) ketoconazol
D) dilataciones esofágicas
E) ranitidina
A) candidiasis pulmonar
B) tromboembolia pulmonar
C) Sx. Vena cava
D) Mediastinitis aguda
E) Neumonía por neumocystis
26
4. Para establecer el diagnóstico principal, usted solicita:
27
ANÁLISIS Y CALIBRACIÓN DE REACTIVOS
Calibración de reactivos
Las preguntas tienen una dificultad relativa de acuerdo con el grupo y nivel en que
se apliquen. Una pregunta con una baja frecuencia de aciertos tiene una dificultad mayor
que otra con una frecuencia alta. La dificultad del reactivo es una información básica para la
base de datos del banco de reactivos y para el momento del diseño de la prueba, ya que ésta
debe estar balanceada en cuanto a la dificultad global y de cada una de sus áreas o
secciones.
P
GD= x100 ; 0 GD 100%
N
28
donde
P = Total de respuestas correctas de los sustentantes
N = Total de sustentantes (sólo respuestas válidas)
P(GS ) P(GI )
PD = x100
N
donde:
P(GS) = Respuestas correctas del Grupo Superior
P(GI) = Respuestas correctas del Grupo Inferior
N = Total de sustentantes (sólo respuestas válidas)
PD
RD =
ND
Los reactivos con valores inferiores de RD deben revisarse personalmente por los
redactores de reactivos para verificar su redacción, la opción correcta, el comportamiento de
las opciones distractoras, etc.
29
Estos indicadores clásicos del reactivo se pueden obtener de manera automática con
Kalt de uso general. También se puede calcular mediante otros procedimientos específicos
de teoría de respuesta al ítem, si se obtiene el paquete de Kalt Criterial.
Análisis de distractores
Para analizar cada una de las opciones de respuesta, se construyen tablas de
contingencias con las opciones de respuesta y la frecuencia de respuestas de los sustentantes
divididos en Grupos Superior (GS) e Inferior (GI) como una partición de la población
sustentante, dividida en términos de la mediana.
Para que un reactivo sea aceptable se deben verificar varias relaciones. Las
verificaciones a realizar corresponden al funcionamiento de un reactivo en la tabla de
contingencias, de acuerdo con las siguientes condiciones:
Para evaluar la dificultad del reactivo de una manera rápida y accesible utilizaremos
la medida clásica del grado de dificultad como porcentaje de respuestas correctas. También
se puede calcular mediante otros procedimientos como en el caso del análisis de Rasch. En
el Manual Técnico del CENEVAL3, se describen ambos procedimientos.
3
CENEVAL (1999)
30
Ejemplo para un cálculo rápido:
Opciones A B* C D E
Superior 20 1 12 4 2 1
Inferior 20 5 3 3 7 2
Total 40 6 15 7 9 3
* = respuesta correcta
En nuestro ejemplo:
El reactivo del ejemplo tiene un valor aceptable porque se encuentra entre el 20% y
el 80%, (aún con el criterio más estricto de 27% y 73% que exige Kalt), observamos
además que se trata de un reactivo difícil ya que lo contestaron menos del 50% de
los alumnos.
PD = (12 3) / 40
= 9 / 40
= 0.225
x 100 = 22.50
ND = 0.3 x GD
es decir: 30% del GD
30% (37.5) = 11.25
La relación discriminativa:
31
RD = 22.5 / 11.25 = 2
2 1
Análisis de la prueba
Desde la planeación hemos trabajado en garantizar la validez de los exámenes que
estamos construyendo, no obstante, además de la validación lógica de contenido de cada
reactivo de la prueba, es necesario hacer algunos análisis empíricos a partir de resultados de
las aplicaciones, que nos permitan verificar la calidad de la prueba.
El concepto de validez
Desde un punto de vista científico, la validez de constructo es en sí la validez,
mientras que los demás tipos de validez (predictiva, concurrente, convergente, factorial)
pueden ser considerados más bien como estrategias de colección y análisis de datos
empleadas para probar las conexiones conceptuales entre la medición y el constructo
(Angoff, 1988; APA, AERA & NMCE, 1999). Aquí el énfasis está dado en sustentar el
grado en que los puntajes en la prueba representan la medida de la característica o atributo
psicológico que se supone evalúa la prueba, es decir, el constructo teórico, por lo que es
necesario establecer procedimientos para la revisión lógica de tal adecuación, el análisis de
su estructura interna o el análisis de la relación de la prueba con variables externas (caso de
la validez concurrente, o predictiva).
32
En función de estas formas diversas de obtener evidencias de validez, se adoptaron
categorías tales como la validez de contenido, de constructo y de criterio, esta última
subdividida a su vez en dos categorías denominadas predictiva y concurrente. Esto no
implica que sean diferentes tipos de validez o que alguna estrategia de validación sea mejor
para cada tipo determinado de inferencia o uso posible de una prueba; de hecho no es
posible hacer una distinción rigurosa entre estas categorías.
Análisis de confiabilidad
Además de la validez, debemos demostrar que los exámenes que construimos son
confiables, es decir que podemos obtener la misma medición en diferentes condiciones.
Confiabilidad indica consistencia y precisión en la medición.
En algún caso la condición será el paso del tiempo (estabilidad temporal), es decir,
que sin que medie ningún aprendizaje extra, la persona que es medida en dos momentos
diferentes debe dar las mismas respuestas al instrumento. Por el dinamismo que representa
el proceso de aprendizaje el primer caso está expuesto a cambios en cortas temporadas,
midiéndose en muchas ocasiones la estabilidad del instrumento viciada con el dinamismo
de aprendizaje, por lo que no se sugiere realizar estudios de este tipo en períodos que
excedan los tres meses.
En el tercer caso la condición consiste en la relación que guardan cada una de las
partes del instrumento, con el resultado final que se obtiene (consistencia interna). Esto
implica la relación que guardan la calificación total del estudiante con las calificaciones
obtenidas en los temas y las preguntas que integran el instrumento.
33
La consistencia interna es, en la mayoría de los casos, la forma más estable de medir
la confiabilidad de un instrumento. Además, un estudio de consistencia interna permite la
obtención automática de la validez teórica, siempre y cuando el universo de conocimientos
esté bien definido y el muestreo de los conocimientos sea representativo. Por esto y,
asumiendo el cuidado requerido en la elaboración de la tabla de especificaciones y la
elaboración de las preguntas que representen el conocimiento en forma amplia y en la
taxonomía requerida, se propone una forma breve de obtención de la consistencia en el
instrumento, incluyendo ambos índices requeridos.
N GD(100 GD)
ALFA = 1
N 1 s2 N 2
donde
N = número de reactivos
GD = Grado de dificultad de cada reactivo
s2 = varianza de puntuaciones de los sustentantes en porcentaje de aciertos
4
Tristán, Agustín, (1996): “ Formulación directa para calcular la Confiabilidad con Alfa de Cronbach”,
Cuadernos del CENEVAL 96-1.
5
Tristán, Agustín (1999) Contribución al esutdio del error de medida (parte 1). Notas sobre Evaluación
Criterial. CENEVAL / ICI.
34
a) error estándar para la media =
N
b) error estándar para la mediana =
2N
c) error estándar para la desviación estándar =
2N
en estas expresiones:
M = número de reactivos
N = número de sustentantes
s = desviación estándar de las dificultades de los reactivos
t0.975(M-1)= valor de t de Student para 97.5% de confianza (5% en prueba estadística de 2
colas) para M reactivos (M-1 grados de libertad)
= confiabilidad (ALFA de Cronbach)
= desviación de las puntuaciones
= 3.14159265359
35
A partir de un modelo procedente de la teoría de muestras pequeñas se pueden
encontrar límites inferiores para el valor del error de medida que conducen, a su vez, a
longitudes de un examen o partes del mismo6. El tamaño de la muestra de reactivos que
debe aplicarse a los sustentantes tiene un error dado por la expresión:
s
error de medida t 0.975 ( M 1)
M 1
donde:
M = número de reactivos
s = desviación estándar de las dificultades de los reactivos
t0.975(M-1)= valor de t de Student para 97.5% de confianza (5% en prueba estadística de 2
colas) para M reactivos (M-1 grados de libertad)
error % 20 15 12 10 5
Número mínimo de reactivos 12 19 27 39 131
Toda esta información estadística obtenida a partir del estudio piloto de los
instrumentos, es útil para el diseño de las versiones de exámenes que se utilizarán en los
procesos de admisión de la Universidad, permitiendo además la mejora continua tanto de
reactivos, como de distractores.
6
Tristán, Agustín (1999) Contribución al estudio del error de medida (parte 1). Notas sobre Evaluación
Criterial. CENEVAL / ICI.
Tristán, Agustín (1999) Contribución al estudio del error de medida (parte 1). Notas sobre Evaluación
Criterial. CENEVAL / ICI.
36
REFERENCIAS BIBLIOGRÁFICAS
Bloom, B. et al. (1990): Taxonomía de los objetivos de la educación: Clasificación de las metas
educacionales. Buenos Aires: El Ateneo.
Marzano, R. J. (2000): Designing a New Taxonomy of Educational Objectives. Corwin Press, Inc.
A Sage Publications Company. California.
Quezada, R. (1991): Guía para evaluar el aprendizaje teórico y práctico. México: Limusa.
Tenbrink, Terry (1997): Evaluación: Guía Práctica para Profesores. Madrid, Narcea S. A. de
Ediciones:. 255-273.
Tristán López, Agustín (1995): “Nuevas capacidades de Kalt para el dictamen de cuestionarios
objetivos”. Memoria del I Foro Nacional de Evaluación Educativa. México: CENEVAL.
37