Documentos de Académico
Documentos de Profesional
Documentos de Cultura
net/publication/273450042
CITATIONS READS
4 90
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Significancia del sentido de agencia académica y derivación tecnológica en educación superior View project
All content following this page was uploaded by Sandra Castañeda Figueiras on 13 December 2016.
FACULTAD DE PSICOLOGÍA
ISBN 970-32-3960-9
Índice?
Presentación de la obra
Sandra Castañeda F. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix
Colaboradores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi
SECCIÓN I.
Medición del aprendizaje y fortalecimiento de evidencias
en apoyo a la toma de decisiones en educación
Capítulo 1. Evaluación del aprendizaje en educación superior
Sandra Castañeda F.
Universidad Nacional Autónoma de México. . . . . . . . . . . 3
Capítulo 2. Preparación y calibración de reactivos:
medición de y para el aprendizaje
Miguel López O.
Universidad Nacional Autónoma de México . . . . . . . . . . 29
SECCIÓN II.
Hallazgos de investigación en estudios de validación
de constructo en el proceso de responder
Capítulo 3. Efectos de fuentes de contenido sobre dificultades
apriorística y empírica de ítems objetivos
Sandra Castañeda, Raquel García, María de Lourdes
Pineda, Miguel López e Isaac Ortega
Universidad Nacional Autónoma de México . . . . . . . . . . 59
Capítulo 4. Validando puntajes de bancos de Ítems de
exámenes de egreso de licenciatura
Sandra Castañeda, Daniel González y Cesar Varela
Universidad Nacional Autónoma de México
Universidad de Sonora . . . . . . . . . . . . . . . . . . . . . . . 75
vi EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
SECCION III.
Diseñando la evaluación objetiva de resultados de aprendizaje
Introducción
Sandra Castañeda F.
Universidad Nacional Autónoma de México . . . . . . . . . 141
Capítulo 6. Diseñando exámenes
Sandra Castañeda, Raquel García y Rosa Elsa González
Universidad Nacional Autónoma de México . . . . . . . . . 145
SECCION IV.
Guías para elaborar ítems objetivos
Capítulo 11. Guía general de elaboración de reactivos
Sandra Castañeda, Miguel López, Raquel García y
Rosa Elsa González
Universidad Nacional Autónoma de México
Salvador Ruiz de Chávez Consultores en Educación . . 271
Capítulo 12. Guía específica de Contaduría
Salvador Ruiz de Chávez
Consultores en Educación. . . . . . . . . . . . . . . . . . . . 313
Capítulo 13. Guía específica de Pedagogía
Rosa Elsa González y Raquel García
Universidad Nacional Autónoma de México . . . . . . . . 321
Capítulo 14. Guía específica de Psicología
Raquel García y Rosa Elsa González
Universidad Nacional Autónoma de México . . . . . . . . 329
Glosario. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
Presentación
En tanto la evaluación es un proceso de obtención de información, esen-
cial para la toma de decisiones en cualquier esfera del comportamiento
humano, incluyendo la educativa, instrumentar acciones que optimicen
las maneras en las que se realiza en la Educación Superior constituye un
objetivo prioritario cuando lo que se desea es asegurar la calidad del co-
nocimiento que se construye en los escenarios formativos. Con esto en
mente, desarrollar habilidades docentes para seleccionar, construir y
evaluar instrumentos útiles para diagnosticar el logro de los alumnos,
así como para derivar acciones que fomenten aprendizajes exitosos ha-
ría más explícita y, sobre todo, más efectiva la relación entre la evalua-
ción y la instrucción en las asignaturas que se enseñan. También,
aseguraría las condiciones bajo las cuales conocimientos, habilidades y
valores deberían ser mostrados como evidencia contundente de que el
alumno realmente domina lo requerido por el aprendizaje complejo.
Cabe aquí hacer explícitas las consideraciones generales en las que esta
obra se fundamenta. La primera refiere al hecho de que no es posible
que un solo método evalúe todas las áreas de pericia que un estudiante
universitario debe mostrar. Por ello, el sistema de evaluación debe con-
tener todos aquellos métodos que permitan reflejar, con suficiente am-
plitud, todas las áreas de competencia involucradas. Así, a mayor
cantidad y variedad de métodos de evaluación, mayor posibilidad de for-
mular juicios certeros sobre el aprendizaje y desempeño de los estu-
diantes. Si bien el volumen que ahora presentamos se enfoca a la
evaluación mediante ítems objetivos, no se deja de reconocer y reco-
mendar el uso de formas alternativas de evaluación. En términos gene-
rales, las formas alternativas son pruebas que requieren que el
examinando elabore, de una manera más activa, su propia respuesta a
partir de demandas cognoscitivas mayores lo que promueve las habili-
dades intelectuales de orden superior (Shavelson, Carey y Webb, 1990).
Por estas razones, ya está en preparación un volumen que las describe.
Referencias
Por esta razón, desarrollar en los estudiantes las habilidades que les
permitan construir, validar e integrar el conocimiento y tomar decisiones
en un mundo cambiante, representa, hoy día, uno de los retos más im-
portantes del subsistema. El desafío es algo más que poner información
disponible en la mente de los estudiantes, es necesario fomentar en los
estudiantes las habilidades cognitivas y de control ejecutivo que les per-
mitan construir conocimientos de la mejor calidad, validarlos con evi-
dencias fuertes, adaptarlos a situaciones imprevisibles y transmitirlos
apropiadamente.
Bajo esta óptica, la evaluación es vista en este capítulo como una práctica
privilegiada que apoya, desde el escenario educativo, una de las finalida-
des prioritarias de la sociedad actual, producir y distribuir aprendizajes de
calidad. En esta empresa, el cuerpo del trabajo retoma avances del en-
tendimiento de la Cognición Humana para apoyar examinación que refle-
je, oportunamente, riesgos en estructuras de conocimiento, procesos
cognitivo - motivacionales y estrategias de procesamiento para, en con-
secuencia, estar en capacidad de prescribir acciones que fomenten hábi-
tos de excelencia académica.
Nuestras creencias
Cuando enseñamos, al igual que en cualquier otra actividad, estamos in-
fluidos por creencias, son fundamentales. Afectan lo que suponemos de
8 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Caracterizando la evaluación
En otras latitudes existen esfuerzos importantes para fomentar la pe-
ricia docente para evaluar resultados de aprendizaje. Se han estable-
cido estándares profesionales para habilidades de evaluación para
profesores (vg., Standards for Teacher Competence in Educational
Assessment of Students, 1990), se han generado códigos, el de Res-
ponsabilidades Profesionales en Medición Educativa (1995) y el de
Prácticas Justas de Examinación (1988), asimismo se han publicado
varias actualizaciones de los Estándares de Examinación Educativa y
Psicológica (1999).
10 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Principios
La evaluación debe apoyar la enseñanza. Al igual que la evaluación im-
pacta al aprendizaje y la motivación del estudiante, también influye en
la enseñanza del salón de clases. De aquí que la evaluación deba ser una
actividad integrada a la enseñanza, más que simplemente auditar el
aprendizaje (Shepard, 2000). Cuando sí se la integra, informa al docen-
te acerca de qué actividades y contenidos serán más útiles, qué nivel de
enseñanza es el más apropiado y cómo diseñar evaluación formativa
que provea información diagnóstica. Así, el docente podrá identificar
cuándo hacer más preguntas, de qué nivel de dificultad deben ser, en
qué tipos de conocimientos, en qué formato deberían ser presentadas y,
desde luego, a elaborar las respuestas más apropiadas a las preguntas
de los estudiantes.
Una buena evaluación debe ser válida. La validez es un concepto que ne-
cesita ser entendido a profundidad. La validez es vista como un concep-
to unitario de los factores que determinan responder a la examinación
(Messick 1994; Embretson 1999). Al igual que con la confiabilidad, com-
prender los asociados técnicos que acompañan a la noción de validez es
esencial para elaborar inferencias apropiadas y razonables de los punta-
jes del examen. La validez de constructo refiere a la integración de cual-
quier evidencia en apoyo a la interpretación o significado de los
puntajes obtenidos en un examen o prueba, incluyendo evidencias de
contenido y de criterio. Un rasgo fundamental de la validez de cons-
tructo es el de la representación del constructo, en ella se establecen
los mecanismos teóricos subyacentes a la ejecución en una tarea parti-
cular, previamente identificados mediante análisis lógico de los proce-
sos, estructuras y estrategias cognitivas subyacentes a la ejecución
meta o por investigación empírica de funciones profesionales a ser for-
madas en la educación superior.
Una buena evaluación debe ser justa y ética. Una evaluación justa es
conceptuada en términos de: a) ausencia de sesgos por género o cual-
quier otra diferencia, b) tratamiento igualitario a los examinandos, c)
igualdad de resultados y d) oportunidad para aprender. Incluye dere-
chos y responsabilidades de los sustentantes, la influencia de contextos
lingüísticos diferentes y de sujetos con necesidades especiales.
Caracterizando al aprendizaje
Hablar de la evaluación del aprendizaje sin analizar qué es lo que se en-
tiende por aprender resultaría poco prudente. Actualmente, el aprendi-
zaje es caracterizado como un proceso complejo que involucra la
construcción de nuevo conocimiento (Castañeda, 2004a). El nuevo co-
nocimiento se construye sobre la base del conocimiento actual. Los co-
nocimientos previos (aún concepciones intuitivas), así como los
conocimientos a ser aprendidos, son articulados por el aprendiz en es-
tructuras de conocimiento que los integra, significativamente, a su base
de conocimientos para que el aprendizaje sea exitoso.
De aquí que una parte crucial del trabajo del docente sea diseñar inte-
racciones que promuevan internalizar estrategias particulares, formas
de razonamiento y estándares conceptuales, asociados al dominio del
conocimiento específico que se está aprendiendo. En este contexto, la
evaluación por pares juega un papel central. La co evaluación de pares
representa un artefacto privilegiado para apoyar a los estudiantes a fa-
16 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
miliarizarse con los criterios, valores y metas del aprendizaje y para de-
sarrollar habilidades de discusión y argumentación, en una comunidad
de aprendizaje y práctica en la que se compartan metas, tareas y res-
ponsabilidades.
Por todo lo an te rior, las prác ticas for mativas y las de evaluación de -
ben incluir diversos tipos de conocimiento, el declarativo (referido a
qué son las cosas), el conocimiento procedimental (referido a cómo
se hacen las cosas) y el conocimiento condicional (referido a las con -
diciones bajo las cuales se hacen las cosas) para que el estu diante
construya y reconstruya los conocimientos, para que los experimen-
te y los valide a partir de las experiencias educativas y de la vida real
y para que los integre a su estruc tu ra cognitiva, más que sólo eva-
luar conceptos aislados, independientes unos de otros.
EVALUACIÓN DEL APRENDIZAJE EN EDUCACIÓN SUPERIOR 17
Toda vez que el docente identificó los componentes requeridos por la ta-
rea, los organiza en un espacio tridimensional cartesiano (Castañeda,
1993 y 1998), como el ejemplificado en la figura 1. La representación
tridimensional lo guía, a manera de metáfora viso espacial, a organizar
los componentes de “procesos” (discriminación, generalización, etc…),
los de “tipos de conocimiento” (factual, conceptual, procedimental) y los
de “contextos” (reconocimiento y recuerdo), en términos de los niveles
de complejidad creciente comprometidos en la ejecución de la tarea.
Referencias
Alexander, P. A. y Murphy, P. K. (1998). The research base for APA’s
Learner-Centered Psychological Principles. En N. Lambert y B. L.
McCombs (Eds.), How students learn: Reforming schools through
learner-centered education. Washington: American Psychological
Association.
American Federation of Teachers, National Council on Measurement in Edu-
cation, National Education Association. (1990). Standards for teacher
competence in educational assessment of students. 1990. Disponible
en el sitio web http://ericae.net/scripts/ft/ftget.asp?want=http://www
.unl.edu/buros/article3.html
Arce, A. & Borges, I. (2004). Métodos para estimar confiabilidad de me-
diciones basadas en normas y en criterios. En S. Castañeda (Ed.),
Educación, Aprendizaje y Cognición. Teoría en la práctica (pp.
189-202). México: UNAM, U. de G. y Manual Moderno.
Bass, K. M. y Glaser, R. (2004). Developing assessments to inform tea-
ching and learning. (Reporte 628). EE. UU.: Centro de Investiga-
ción del Aprendizaje y el Desarrollo, Universidad de Pittsburg.
Castañeda, S. (1993). Procesos Cognitivos y Educación Médica. Serie
Seminarios Institucionales de la Facultad de Medicina. México:
UNAM
Castañeda, S. (1997). El rol de la enseñanza estratégica en el estudio
independiente. En P. Ávila (Ed.), Estudio independiente, (pp.
107-146). México: Instituto Latinoamericano de la Comunicación
Educativa y O E A.
Castañeda, S. (1998). Evaluación de resultados de aprendizaje en esce-
narios educativos. Revista Sonorense de Psicología. 12(2): 57- 67.
Castañeda, S. (2002). A cognitive model for learning outcomes assess-
ment. International Journal of Continuing Engineering Education
and Life-long Learning, 12(1-4), 94-106.
Castañeda, S. (2004a). Educación, Aprendizaje y Cognición. En S. Cas-
tañeda (Ed.), Educación, Aprendizaje y Cognición. Teoría en la
práctica (pp. 49-74). México: UNAM, U. de G. y Manual Moderno.
Castañeda, S. (2004b). Enseñanza estratégica: guía abreviada para el
docente y el tutor. En S. Castañeda (Ed.), Educación, Aprendizaje y
Cognición. Teoría en la práctica, (pp. 393-422). México: UNAM, U.
de G. y Manual Moderno.
26 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Joint Com mit tee on Tes ting Prac ti ces. Ame ri can Psycho lo gi cal
Asso cia tion. (1988). Code of fair tes ting prac ti ces in edu ca -
tion, 1988. EE. UU: Wa shing ton, DC: Dis po ni ble en http://eri-
cae.net/scripts/ft/ftget.asp?want=http://ericae.net/code.htm
Introducción
Este capítulo pretende contribuir a la adopción de una práctica compe-
tente de la evaluación educativa, partiendo de un marco conceptual diri-
gido a la revisión y discusión de aspectos que son relevantes en la
medición y fomento del aprendizaje. Con esta base se orienta el empleo
de estrategias metodológicas y procedimientos psicométricos, que son
útiles para diseñar y elaborar ítems y pruebas, tanto para medir el de-
sempeño o aprovechamiento en los alumnos, como para fortalecer su
logro académico, aplicando un modelo de medición. Se analiza la impor-
tancia de que esta práctica se realice con compromiso profesional y con-
ciencia social de la responsabilidad que se desprende de su ejercicio.
Marco conceptual
Los tiempos actuales definitivamente son de transición y cambio. Mu-
chas formas de pensar acerca de lo que nos rodea y de nuestro conoci-
30 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
La invitación que se nos ofrece es para procurar una concepción que per-
mita entender cómo se dan las relaciones entre los componentes y va-
riables que participan en la evaluación y la medición educativas; y
acerca de cómo pueden éstas aportar información que apoye esclarecer
la medida en que se están alcanzando los resultados esperados después
de un proceso de aprendizaje y, con ello, valorar el grado en que una
meta formativa propuesta se está cumpliendo.
Cabe asumir que todas las partes y pasos del proceso de evaluación son
igualmente importantes y que, de alguna manera, están involucrados en
las decisiones que se toman a partir de los resultados de una medición,
por lo que es obligatorio ser cuidadoso en todo momento. Cualquier
paso que se realice en forma deficiente debilitará la validez, confiabili-
dad y objetividad de la medición y con ello atentará también contra su
utilidad y credibilidad, reduciendo la calidad y maximizando efectos in-
deseables.
Algunos estudios (por ejemplo, Bransford, 1979), han dejado claro que
el desempeño de un alumno en una prueba está ligado a la forma como
se le evalúa, al tipo de respuesta que se le demanda, al tiempo que se le
otorga para responder y a las condiciones bajo las cuales ocurre la eva-
luación.
Lo que se encuentra tiene que ver, más bien, con la aproximación tradi-
cional a la enseñanza y a la evaluación del aprendizaje, difícilmente
compatibles con los cambios requeridos para lograr la aceleración inte-
lectual y la modificación continua del conocimiento planteadas por los
nuevos objetivos formativos.
El modelo de medición
El tercer componente del modelo propuesto por Thorndike (op. cit.), son
los reactivos que componen las pruebas. Un reactivo es aquello que pro-
duce una respuesta o reacción, como efecto de un estímulo; aquello que
sirve para conocer las propiedades de un cuerpo por las reacciones que
provoca. Ítem es un trozo, una parte de, un segmento, un elemento. Es
el término que también se emplea para identificar cada una de las pre-
guntas o enunciados que se formulan en un examen o prueba, al pre-
sentar tareas o actividades que deberá efectuar quien lo responde.
Reactivo se emplea como sinónimo de ítem, porque en el contexto de la
evaluación educativa significan lo mismo.
que midan sólo conocimiento factual, o para medir recuerdo guiado, etc.
Hay entonces muchas posibilidades (Embretson, 1985).
Una vez que han sido obtenidos los resultados (datos tales como pun-
tuaciones, frecuencias de respuestas, etc.), mediante los instrumentos
aplicados (pruebas, exámenes) y sea posible describir con objetividad
y precisión la situación explorada, se fundamentará entonces afirmar o
confirmar la existencia de relaciones, significativas o no, mediante un
juicio valorativo (evaluación), entre los antecedentes (los rasgos o atri-
butos de las personas) y los consecuentes (sus respuestas a los reacti-
vos del instrumento). También se tendrán elementos necesarios para
predecir resultados futuros, si no cambian las condiciones ahora pre-
sentes.
Por otra parte, el concepto de habilidad suele ser de uso muy común. En
un sentido general, habilidad es la destreza y capacidad para aplicar lo
aprendido, por lo que no se reduce a tener “conocimientos”. Esta distin-
ción se establece explícita o implícitamente, cuando los alumnos se que-
jan de que una prueba exploró sólo lo que manejaban de ”memoria"
(conocimientos). De igual manera, los profesores pretenden que, como
resultado de sus cursos, los alumnos desarrollen habilidades y no sólo
“almacenen” la información.
Mientras que las habilidades son formas concretas que pueden tomar los
procesos cognoscitivos, el contenido es la información sobre la cual ope-
ran dichos procesos. El contenido se refiere a dominios o campos del co-
nocimiento, que pueden ser tan generales como “materias” (español,
física, matemáticas), o de mayor nivel de especificidad e inclusividad,
como las unidades, temas y subtemas (De Sánchez, 1991).
Linacre (1998) señala que se hace referencia a los reactivos como “fáci-
les” y “difíciles”. Así es cómo se ven desde el punto de vista de las perso-
nas que toman la prueba. Estos ítems existen con la intención de
representar alguna área de contenido, una construcción teórica o una
variable psicológica. Un reactivo fácil debería representar un nivel infe-
rior, más elemental o una primera fase de una variable. Un reactivo difí-
cil debería representar un nivel superior, más avanzado o una última
fase de una variable. ¿Pero es así?
q Las preguntas de examen definen las líneas que representan las va-
riables; y las respuestas a esas preguntas ubican en dichas líneas a
las personas. Cuando una persona es sometida a una medición, el
propósito es estimar su localización en la línea representada. Para
que esto sea posible se debe contar con un instrumento que defina
la línea. También debe disponerse de un procedimiento para con-
vertir las respuestas de una persona a una localización en la línea
que representa la variable de interés.
q Esta línea debe tener una dirección que permita determinar los va-
lores que corresponden a las observaciones, para poder examinar
con facilidad la magnitud del dominio del rasgo (ya sea un conoci-
miento o una habilidad) que se mide.
PREPARACIÓN Y CALIBRACIÓN DE REACTIVOS: 47
MEDICIÓN DE Y PARA EL APRENDIZAJE
Embretson (1985) señala que esta línea inició una corriente psicométri-
ca que pronto empezó a reconocerse como innovadora. Se trata de la
TRI: Teoría de Respuesta al Ítem, que afirma que lo único que se puede
estimar con consistencia y suficiencia, a partir del análisis de las res-
puestas en cada reactivo, en una prueba típica de desempeño escolar,
es el parámetro de dificultad del reactivo; y que de él se puede inferir
con precisión y estabilidad la habilidad de una persona.
Bajo estas circunstancias, señala Linacre (1998), las medidas son ambi-
guas y generan incertidumbre. Dicen: “éste es el nivel de rendimiento
de la persona bajo estas condiciones de la prueba”, pero también dicen:
“no espere este nivel de rendimiento bajo otras condiciones”.
Una prueba que sea muy fácil o muy difícil suele tener poco valor expli-
cativo acerca de las características de la población, porque arroja muy
poca variabilidad. Así que una pregunta importante es: ¿cuál debería ser
un nivel de dificultad adecuado? La respuesta dependerá en gran parte
de los propósitos del examen y ayuda mucho para esta decisión el contar
con reactivos calibrados.
I = información.
b = habilidad.
u = persona
d = dificultad
i = ítem
X = respuesta
( bu - di )
e = exp ( bu - di )
52 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Cuan do una perso na (u) es más hábil (b) que la dificultad (d) del ítem
(i), en ton ces b u es ma yor que di , su diferencia es positiva y la proba-
bilidad de éxito en el ítem es mayor que un me dio. Mientras más so -
brepase la habilidad de la persona a la dificultad del ítem más grande
será su diferencia positiva y más cerca de 1 estará la probabilidad de
éxito.
Consideraciones Finales
Una vez expuestas las formalidades matemáticas del modelo de Rasch,
que sustentan la calibración de los reactivos, es conveniente ahora re-
saltar su valor práctico.
Los valores de calibración de los reactivos permiten que con toda preci-
sión se construyan instrumentos objetivamente balanceados, por ejem-
plo para incluir un muestreo óptimo de la dificultad en una prueba,
porque ya se conocen los parámetros de cada ítem. Es también muy útil
para formar dos o más versiones equivalentes de examen.
Los supuestos con que trabaja el modelo de Rasch y que admiten prueba
empírica de la estabilidad de las medidas son: (1) que la habilidad de los
sustentantes puede determinarse de manera confiable, sin importar los
reactivos específicos que se utilicen en una prueba en particular, por lo
que se rompe la dependencia hacia el instrumento empleado, el que se
use para hacer la medición, que es una de las debilidades mayores de la
teoría clásica de Respuesta a la Prueba, siempre y cuando los ítems ha-
yan pasado por un proceso cuidadoso para su calibración. Y (2) que los
reactivos calibrados tendrán también un comportamiento muy estable
en sus valores de dificultad, independientemente de los sujetos particu-
lares a los que se aplique el instrumento, en poblaciones que sean razo-
nablemente similares.
Referencias
Adkins, W. D. (1990). Elaboración de Tests (Desarrollo e Interpretación
de los Tests de Aprovechamiento). México: Trillas.
Aiken, L. R. (1996). Tests Psicológicos y Evaluación. (8a. ed.). México:
Prentice-Hall.
Annastasi, A. (1966). Tests Psicológicos. Madrid, España: Aguilar.
Baker F. (2001). The Basics of Item Response Theory. [Los básicos de la
teoría de la respuesta al item]. EE. UU.: ERIC Clearinghouse on
Assessment and Evaluation.
PREPARACIÓN Y CALIBRACIÓN DE REACTIVOS: 55
MEDICIÓN DE Y PARA EL APRENDIZAJE
Introducción
La medición de resultados de aprendizaje constituye un área de creci-
miento significativo para los programas de medición a gran escala y, en
la medida en la que su uso se amplía, los cuestionamientos acerca de
su validez y su calidad técnica representan interrogantes teóricas im-
portantes. Identificar cuáles propiedades de las medidas son las más
adecuadas para medir lo que se desea medir y, en consecuencia, am-
pliar el rango de evidencias que permitan elaborar las inferencias a ser
hechas, constituyen retos a resolver en los estudios contemporáneos
de validez. Generar tales evidencias le demanda al especialista en me-
dición educativa indagar, primero, las que se vinculan con las fuentes
de contenido incluidas en los ítems utilizados en la medición para, des-
pués, obtener las derivadas de estudios empíricos del puntaje del exa-
men o prueba.
En este ámbito, el especialista debe estar atento a los efectos que cier-
tas fuentes de contenido pueden generar (errores de medición) que
afecten los puntajes. En especial, de aquellas fuentes que sistemática-
mente generen errores y para las cuales los procedimientos usuales
para estimar la confiabilidad de los puntajes no son sensibles, sólo lo son
para la presencia de errores aleatorios. Es necesario que el especialista
identifique qué fuentes de contenido del ítem podrían aumentar la difi-
cultad o facilidad en el ítem, en vías de identificar elementos que, poten-
cialmente, podrían generar varianza irrelevante de constructo, porque
ninguna información en este sentido se puede desprender del comuni-
céntrico índice de dificultad empírica por sí mismo.
62 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
El problema
A partir de lo planteado, un problema a ser considerado -debido a la impor-
tancia que sus efectos revisten sobre la validez- es el hecho de que la medi-
ción a gran escala descanse, mayoritariamente en México, en formatos
objetivos que intentan medir resultados de aprendizajes complejos. En la
actualidad, necesidades prácticas acerca de estandarizar procesos de medi-
ción y abatir costos derivados de la calificación de formatos de respuesta
construida, ha generado el uso masivo de reactivos objetivos. Los exámenes
objetivos son instrumentos conformados por ítems que miden la habilidad
de los sustentantes para ganar puntajes, miden el logro de los sustentantes
para hacer las cosas que los ítems requieren.
Pero ¿cuáles rasgos o fuentes de contenido de los ítems son sensibles para
medir lo que en el ítem se intenta medir? Si la teoría que fundamenta la
construcción de exámenes objetivos no puede explicar por qué determina-
da fuente de contenido incluida en el ítem es más útil que otra para medir
un rasgo particular, entonces no podrá sernos útil para entender el proceso
de responderlos y, menos aún, para derivar certificaciones de aprendizaje
y recomendaciones adecuadas para resolver los problemas detectados.
EFECTOS DE FUENTES DE CONTENIDO SOBRE DIFICULTADES 63
APRIORÍSTICA Y EMPÍRICA DE ÍTEMS OBJETIVOS
Un examen bien diseñado debe asegurar que tanto los datos recabados
a partir de los ítems, como sus magnitudes sean los correctos, de otra
manera no sería posible prevenir explicaciones alternativas que resulten
perniciosas para el sustentante y para terceros interesados. De aquí que
indagar los efectos de ciertas fuentes de contenido sobre la dificultad del
ítem sea de interés.
Objetivos de la investigación
Método
Participantes
Escenario
Instrumentos
La escala caracteriza al ítem con base en los valores que adquieren las
fuentes de contenido incluidas en el reactivo, por ejemplo, el tipo de for-
mato del ítem, las operaciones o procesos cognitivos requeridos para re-
solverlo, los patrones en los que la pregunta y la respuesta requieren
interactuar para resolver el ítem e, incluso, la dificultad del lenguaje, así
como la claridad y exactitud de los términos teóricos o técnicos que se
utilizan.
Procedimiento
El estudio se realizó mediante una investigación de campo, de observa-
ciones pasivas y muestras aleatorias de sujetos y de reactivos. Dado que
el control experimental no era posible por tratarse de observaciones re-
cabadas durante la aplicación de un examen general de egreso de la li-
cenciatura en Psicología en el país, se recurrió al control estadístico de
las variables de interés. Este control se realizó mediante análisis de re-
gresión múltiple hacia adelante, donde la variable criterio fue el Puntaje
Global de Dificultad Apriorística y las predictoras los Puntajes obtenidos
en las cuatro fuentes de contenido estudiadas. Las definiciones de las
variables medidas se presentan a continuación.
EFECTOS DE FUENTES DE CONTENIDO SOBRE DIFICULTADES 67
APRIORÍSTICA Y EMPÍRICA DE ÍTEMS OBJETIVOS
Resultados
Con relación al primer objetivo de la investigación, se corrió un análisis
de regresión múltiple hacia adelante donde la variable criterio fue el
puntaje global de Dificultad Apriorística y las variables independientes
los puntajes parciales obtenidos en cada una de las cuatro fuentes de
contenido analizadas. Los valores obtenidos en el modelo se presentan
en la Tabla 1.
Tabla 1
Variables predictoras y coeficientes de determinación de la variable
criterio Puntaje Global de Dificultad Apriorística.
__________________________________________________
Variables predictoras Coeficientes de determinación del
Puntaje Global de Dificultad Apriorística
__________________________________________________
2
Operación Cognitiva (O. C.) R = .70*
2
(O. C.) + Campo de Conocimiento (C. C.) R = .86*
2
(O. C.) + (C. C.) + Formato reactivo (F. R.) R = .96*
2
(O. C.) + (C. C.) + F. R. + Contexto R = .99*
*p <0.0001
__________________________________________________
2
El mayor coeficiente de determinación parcial (R = .70) lo obtuvo la
fuente Operación Cognitiva y la co ocurrencia combinada entre ésta y las
otras tres fuentes que configuraron el modelo predictivo mostró buen
poder explicativo dado el coeficiente de determinación múltiple obtenido
2
(R = .99). Sugiere que una buena cantidad de la dificultad apriorística
estimada por los jueces puede deberse a esta fuente. En cambio, la
fuente Campo de Conocimiento explicó sólo el 16 % de la varianza entre
jueces, la de Formato del reactivo un 10% y la del Contexto del reactivo
sólo un 4%.
Los valores del factor de inflación de la varianza de las cuatro fuentes anali-
zadas fueron lo suficientemente pequeños y, por ende, los de tolerancia lo
suficientemente altos, para considerar que no se presentaron problemas
de colinearidalidad entre las variables independientes y la variable criterio.
Tabla 2
Valores de F y p de dificultad empírica por niveles de dificultad apriorística
en la fuente Operación Cognitiva.
__________________________________________________
SC gl MC F p
__________________________________________________
Entre grupos 3.471 2 1.735 3.245 0.043
Intra grupos 49.740 93 0.535
Total 53.210 95
__________________________________________________
Tabla 3
Valores de F y p de la dificultad empírica por niveles de dificultad
apriorística en la fuente Campo de Conocimiento.
__________________________________________________
SC gl MC F p
__________________________________________________
Entre grupos 2.437 1 2.437 4.512 0.036
Intra-grupos 50.773 94 0.540
Total 53.210 95
__________________________________________________
EFECTOS DE FUENTES DE CONTENIDO SOBRE DIFICULTADES 69
APRIORÍSTICA Y EMPÍRICA DE ÍTEMS OBJETIVOS
Discusión
A partir de la evidencia recabada es posible establecer que existen co
ocurrencias significativas entre cuatro fuentes de contenido y el cons-
tructo hipotetizado Dificultad Apriorística Global del Ítem. Ganar com-
prensión acerca de lo que mejor explica este constructo implica, en un
inicio al menos, identificar aquellos factores con los cuales co ocurre. Si
bien es cierto que la simple co ocurrencia entre factores puede no ser
concluyente, también lo es que la co ocurrencia entre ellos puede estar
causalmente relacionada. Así, la información de co ocurrencia entre
fuentes comprometidas en la dificultad apriorística de un ítem ayuda, al
menos, a definir las dimensiones significativamente involucradas en el
fenómeno bajo estudio, sobre todo cuando el control experimental no es
posible, como fue el caso que nos ocupó.
los ítems. El especialista podrá analizar los ítems o modificarlos para ge-
nerar las medidas más sensibles a lo que desea medir.
Referencias
Bejar, I. (2002). Generative Testing: From Conception to Implementa-
tion. En S. H. Irvine y P. C. Kyllonen. (Ed.). Item Generation for
Test Development. (199-218). EE. UU.: LEA.
Castañeda, S. (1993). Procesos Cognitivos y Educación Médica. México:
UNAM.
Castañeda, S. (1998). Evaluación de resultados de aprendizaje en esce-
narios educativos. Revista Sonorense de Psicología, 12(2). 57- 67.
Castañeda, S. (2002). A cognitive model for learning outcomes assess-
ment. International Journal of Continuing Engineering Education
and Life-long Learning, Vol.12, Nos. (1-4), 94-106. UNESCO: UK.
Castañeda, S., Bazán, A., Sánchez, B. & Ortega, I. (2004). Validez
apriorística y empírica de constructos. Modelamiento estructural de
porciones extensas de exámenes objetivos a gran escala. Revista
Latina de Pensamiento y Lenguaje y Neuropsicología Latina, 12(2),
183-198.
Castañeda, S., González, D., López, O., García-Jurado, R., Ortega, I.,
Pineda, M. L. & García, R. (2003). Escala de valoración de fuentes
de contenido en ítems objetivos. Documento de trabajo del proyec-
to de investigación CONACYT 40608-H. Manuscrito no publicado.
UNAM.
Cronbach, L, J. (1957). The two disciplines of scientific psychology.
American Psychologist, 12, 671-684.
Embretson, S. E. (2002) Generating Abstract Reasoning Items with
Cognitive Theory. En S. H. Irvine y P. C. Kyllonen. (Eds.) Item Ge-
neration for Test Development. (pp. 219-250). EE .UU.: LEA.
García, R. (2004). Efectos de variables asociadas al capital cultural de
los jueces sobre la validación de una escala de valoración de reacti-
vos objetivos. Tesis de licenciatura. UNAM, México.
Haladyna, T. M. (1989). Validity of a Taxonomy of Multiple-Choice
Item-Writing Rules, Applied Measurement in Education, 2(1),
51-78.
Haladyna, T. M. (1994). Developing and Validating Multiple-Choice
Items. EE. UU.: LEA.
Haladyna, T. M. (2004). Developing and Validating Multiple-Choice
Items. (3a. Ed.). EE.UU.: LEA.
EFECTOS DE FUENTES DE CONTENIDO SOBRE DIFICULTADES 73
APRIORÍSTICA Y EMPÍRICA DE ÍTEMS OBJETIVOS
_____________________
*
Se agradece al Proyecto CONACyT 40608-H el financiamiento a esta investigación y al
Centro Nacional de Evaluación para la Educación Superior y al Mtro. Salvador Ruiz de
Chávez las facilidades para realizarla.
76 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Sin embargo, cabe resaltar aquí dos aspectos: a) el que las evaluaciones
no son válidas o inválidas por sí mismas, más bien, son sus resultados,
los puntajes, los que tienen más o menos evidencia para apoyar (o refu-
tar) una interpretación específica y b) el que los datos de la evaluación
serán más o menos validos para algún propósito o interpretación muy
específico, en un punto en el tiempo y para una población bien definida,
dado que la validez siempre es aproximada como hipótesis.
Se puede decir que en tanto las teorías que subyacen a los exámenes
(cualquiera que sea su aproximación) comprometen modelos para ela-
borar inferencias acerca de lo que los sustentantes conocen y son capa-
ces de hacer (en un dominio de conocimiento particular), estos marcos
de trabajo generan universos de discurso dependientes de los tipos de
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 77
DE EXÁMENES DE EGRESO DE LICENCIATURA
Errores como éste son errores que sistemáticamente afectan los punta-
jes y para los cuales los procedimientos usuales para estimar la confiabi-
lidad de los puntajes no son sensibles, sólo lo son para la presencia de
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 81
DE EXÁMENES DE EGRESO DE LICENCIATURA
Objetivos de investigación
El objetivo principal de los estudios que son descritos en este capítulo
fue la validación de evidencias (puntajes) que hipotéticamente repre-
sentan demandas de dos fuentes de contenido incluidas en ítems de
bancos de exámenes de egreso en las licenciaturas de Contaduría, Peda-
gogía y Psicología. En la última disciplina, se contó con tres bancos dado
que el examen especifica áreas de aplicación particular, entre otras, la
Psicología Clínica, la Psicología Educativa y la Psicología del Trabajo.
Método
Participantes
La edad promedio general entre las muestras fue de 25 años, con excep-
ción de Psicología del Trabajo que fue de 21 años. En tanto en Contadu-
84 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Escenario
Materiales y medidas
Así, las fuentes de contenido utilizadas para caracterizar los ítems fueron:
Procedimiento
Tabla 1
Distribución de ítems de Contaduría por fuentes de contenido analiza-
das.
__________________________________________________
Campo de Conocimiento
__________________________________________________
Teórico Técnico Combinado total
5 8 4 17
__________________________________________________
Operación Cognitiva
__________________________________________________
Comprender Aplicar Resolver total
10 7 0 17
__________________________________________________
_____________________
1
los ítems son propiedad intelectual del centro de evaluación correspondiente
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 87
DE EXÁMENES DE EGRESO DE LICENCIATURA
Tabla 2
Distribución de ítems de Pedagogía por fuentes de contenido analizadas.
__________________________________________________
Campo de Conocimiento
__________________________________________________
Teórico Técnico Combinado total
18 13 11 42
__________________________________________________
Operación Cognitiva
__________________________________________________
Comprender Aplicar Resolver total
19 23 0 42
__________________________________________________
Tabla 3
Distribución de ítems de Psicología Clínica por fuentes de contenido ana-
lizadas.
__________________________________________________
Ítems Campo de Conocimiento
__________________________________________________
Teórico Técnico Combinado total
Comunes + Clínica 9 14 15 38
__________________________________________________
Operación Cognitiva
__________________________________________________
Comprender Aplicar Resolver total
Comunes + Clínica 10 24 4 38
__________________________________________________
Tabla 4
Distribución de ítems de Psicología Educativa por fuentes de contenido
analizadas.
__________________________________________________
Reactivos Campo de Conocimiento
__________________________________________________
Teórico Técnico Combinado total
Comunes + Educativa 6 10 6 22
__________________________________________________
Operación Cognitiva
__________________________________________________
Comprender Aplicar Resolver total
Comunes + Educativa 3 16 3 22
__________________________________________________
Tabla 5
Distribución de ítems de Psicología del Trabajo por fuentes de contenido
analizadas.
__________________________________________________
Reactivos Campo de Conocimiento
__________________________________________________
Teórico Técnico Combinado total
Comunes + del Trabajo 5 14 10 29
__________________________________________________
Operación Cognitiva
__________________________________________________
Comprender Aplicar Resolver total
Comunes + del Trabajo 5 24 0 29
__________________________________________________
Tabla 6
Índices de consistencia interna de las fuentes de contenido del banco de
Contaduría.
__________________________________________________
Alfas para Tipos de Operación Cognitiva Alfas para tipos de Campo de Conocimiento
__________________________________________________
Comprender Teórico
Alfa = 0.68 Alfa = 0.67
Media = 3.96, DS = 2.43 Media = 2.00, DS = 1.55
(diez reactivos) (cinco reactivos)
Aplicar Técnico
Alfa = 0.35 Alfa = 0.68
Media = 1.90, DS = 1.32 Media = 3.03, DS = 2.07
(siete reactivos) (ocho reactivos)
Resolver Combinado
Sin datos porque no se incluyeron ítems Alfa = 0.18
que evaluaran resolver problemas Media = .83, DS = .87
(cuatro reactivos)
__________________________________________________
Aplicar Técnico
Alfa = 0.66 Alfa = 0.53,
Media = 13.55, DS = 3.70 Media = 6.42, DS = 2.11
(veintitrés ítems) (doce ítems)
Tabla 8
Índices de consistencia interna por fuentes de contenido en Psicología
Clínica.
__________________________________________________
Alfas para cada tipo de Operación Cognitiva Alfas por cada Campo de Conocimiento
__________________________________________________
Comprender Teórico
Alfa = 0.45 Alfa = 0.44
Media = 5.984, DS = 3.095 Media = 5.12, DS = 1.676
(diez reactivos) (nueve reactivos)
Aplicar Técnico
Alfa = 0.67 Alfa = 0.36
Media = 13.18, DS = 14.46 Media = 8.29, DS = 4.521
(veinticuatro reactivos) (catorce reactivos)
Resolver Combinado
Alfa = 0.69 Alfa = 0.69
Media = 2.15, DS = 1.34 Media = 7.07, DS = 8.299
(cuatro reactivos) (quince reactivos)
__________________________________________________
Tabla 9
Índices de consistencia interna por fuentes de Psicología Educativa.
__________________________________________________
Alfa para cada tipo de Operación Cognitiva Alfa por cada Campo de Conocimiento
__________________________________________________
Comprender Teórico
Alfa = 0.10 Alfa = 0.30
Media = 1.72, DS = 0.86 Media = 3.42, DS = 1.38
(tres reactivos) (seis reactivos)
Aplicar Técnico
Alfa = 0.38 Alfa = 0.17
Media = 8.25, DS = 5.59 Media = 5.13, DS = 1.61
(dieciséis reactivos) (diez reactivos)
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 91
DE EXÁMENES DE EGRESO DE LICENCIATURA
Tabla 10
Índices de consistencia interna por fuentes de Psicología del Trabajo.
__________________________________________________
Alfas para cada tipos de Operación Cognitiva Alfas para cada tipo de Campo de Conocimiento
__________________________________________________
Comprender Teórico
Alfa = 0.35 Alfa = 0.37
Media = 2.94, DS = 1.28 Media = 4.89, DS = 1.64
(cinco reactivos) (ocho reactivos)
Aplicar Técnico
Alfa = 0.73 Alfa = 0.49
Media = 13.35, DS = 4.08 Media = 5.52, DS = 2.12
(veinticuatro reactivos) (once reactivos)
Resolver Combinado
Sin datos porque no se incluyeron ítems Alfa = 0.72
que evaluaran resolver problemas Media = 5.88, DS = 2.42
(diez reactivos)
__________________________________________________
Construcción de la matriz
El estudio realizado
Resultados
Tabla 11
Distribución porcentual de las variables sociodemográficas de la mues-
tra.
__________________________________________________
Género Porcentaje Estado Civil Porcentaje
__________________________________________________
Femenino 41.60 Casado / Unión Libre 28.40
Masculino 58.40 Soltero / Divorciado /Viudo 70.80
__________________________________________________
Total 100.00 Total 99.12
__________________________________________________
Promedio de Licenciatura Porcentaje Edad Porcentaje
__________________________________________________
6.0 - 6.5 0.43 21 o Menos 2.16
6.6 - 7.0 0.65 22 - 25 55.19
7.1 - 7.5 2.60 26 - 30 18.40
7.6 - 8.0 11.47 31 - 35 10.61
8.1 - 8.5 28.79 36 - 39 8.01
8.6 - 9.0 29.44 41 o más 5.19
9.1 - 9.5 20.35
9.6 - 10.0 4.33
__________________________________________________
Total 98.05 Total 99.57
__________________________________________________
Cabe enfatizar que los resultados de este estudio solo pueden ser gene-
ralizados bajo el modelo teórico puesto a prueba y en las condiciones en
las que fueron recolectados los puntajes. Si bien los hallazgos sugieren
mejora en las medidas de Aplicar y Resolver problemas y en los campos
de conocimiento Teórico y Combinado, estos no pueden generalizarse a
la totalidad de la población que ha sustentado el examen de egreso del
cual se extrajeron los datos utilizados en este estudio debido a que las
muestras de ítems y de sustentantes fueron intencionales. Otra limitan-
te del estudio fue que el banco de ítems no incluyó todos los ítems del
banco extenso, lo que hace necesario estudios futuros tomando en
cuenta mayor número de ítems por cada factor.
una práctica profesional inicial de buena calidad. Está dirigido a los egre-
sados de las licenciaturas en Pedagogía y Ciencias de la Educación que
hayan cubierto el 100% de los créditos, estén titulados o no.
El estudio realizado
Resultados
Tabla 12
Distribución porcentual de las variables Sociodemográficas de la mues-
tra.
__________________________________________________
Género Porcentaje Estado Civil Porcentaje
__________________________________________________
Femenino 81.10 Casado / Unión Libre 37.68
Masculino 18.90 Soltero / Divorciado /Viudo 61.44
__________________________________________________
Total 100.00 Total 99.12
__________________________________________________
Promedio de
Licenciatura Porcentaje Edad Porcentaje
__________________________________________________
6.0 - 6.5 0.22 21 o Menos 1.99
6.6 - 7.0 1.44 22 - 25 38.12
7.1 - 7.5 7.51 26 - 30 25.75
7.6 - 8.0 18.23 31 - 35 14.14
8.1 - 8.5 37.57 36 - 39 10.72
8.6 - 9.0 23.98 41 o más 8.95
9.1 - 9.5 8.18 99.67
9.6 - 10.0 1.33
__________________________________________________
Total 98.45 Total 99.67
__________________________________________________
Finalmente, cabe enfatizar que los resultados de este estudio solo pue-
den ser generalizados bajo el modelo teórico del proceso de responder
puesto a prueba y en las condiciones en las que fueron colectados los
puntajes. Las evidencias empíricas de la estructura de los constructos
sólo describen la utilidad del enfoque utilizado respecto de estos cons-
tructos y con la muestra intencional de reactivos disponibles. Si bien los
hallazgos sugieren mejora en las medidas del campo de conocimiento
Técnico, estos no pueden generalizarse a la totalidad de los puntajes de
la población que ha sustentado el examen de egreso del cual se extraje-
ron los datos debido a que las muestras de ítems y de sustentantes fue-
ron intencionales.
Tabla 13
Distribución porcentual de las variables sociodemográficas de la
muestra.
__________________________________________________
Género Porcentaje Estado Civil Porcentaje
__________________________________________________
Femenino 88.00 Casado / Unión Libre 73.40
Masculino 12.00 Soltero / Divorciado /Viudo 26.60
__________________________________________________
Total 100.00 Total 100.00
__________________________________________________
Promedio de
Licenciatura Porcentaje Edad Porcentaje
__________________________________________________
6.0 - 6.5 0.50 21 o Menos 53.90
6.6 - 7.0 0.70 22 - 25 23.20
7.1 - 7.5 4.10 26 - 30 10.30
7.6 - 8.0 14.30 31 - 35 6.20
8.1 - 8.5 27.70 36 - 39 5.00
8.6 - 9.0 30.90 41 o más 0.00
9.1 - 9.5 15.70
9.6 - 10.0 4.10
__________________________________________________
Total 98.00 Total 98.60
__________________________________________________
Resultados
Tabla 14
Distribución porcentual de las variables sociodemográficas de la mues-
tra.
__________________________________________________
Género Porcentaje Estado Civil Porcentaje
__________________________________________________
Femenino 83.10 Casado / Unión Libre 60.20
Masculino 16.90 Soltero / Divorciado /Viudo 39.80
__________________________________________________
Total 100.00 Total 100.00
__________________________________________________
Promedio de
Licenciatura Porcentaje Edad Porcentaje
__________________________________________________
6.0 - 6.5 0.87 21 o Menos 41.99
6.6 - 7.0 4.76 22 - 25 25.11
7.1 - 7.5 17.25 26 - 30 15.15
7.6 - 8.0 31.10 31 - 35 9.52
8.1 - 8.5 25.00 36 - 39 4.76
8.6 - 9.0 17.00 41 o más 0.00
9.1 - 9.5 0.43
9.6 - 10.0 0.10
__________________________________________________
Total 96.51 Total 98.70
__________________________________________________
110 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Cabe enfatizar que los resultados de este estudio solo pueden ser ge-
neralizados bajo el modelo teórico puesto a prueba y en las condicio-
nes en las que fueron recolectados los puntajes. Si bien los hallazgos
sugieren mejora en las medidas de las operaciones “Aplicar” y “Resol-
ver problemas” y en el campo de conocimiento “Técnico”, estos no
pueden generalizarse a la totalidad de la población que ha sustentado
el examen de egreso del cual se extrajeron los datos utilizados en este
estudio debido a que las muestras de ítems y de sustentantes fueron
intencionales.
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 113
DE EXÁMENES DE EGRESO DE LICENCIATURA
Resultados
Tabla 15
Distribución porcentual de las variables sociodemográficas de la
muestra.
__________________________________________________
Género Porcentaje Estado Civil Porcentaje
__________________________________________________
Femenino 78.40 Casado / Unión Libre 67.20
Masculino 21.60 Soltero / Divorciado /Viudo 32.80
__________________________________________________
Total 100.00 Total 100.00
__________________________________________________
Promedio de
Licenciatura Porcentaje Edad Porcentaje
__________________________________________________
6.0 - 6.5 0.00 21 o Menos 48.20
6.6 - 7.0 0.08 22 - 25 25.90
7.1 - 7.5 4.40 26 - 30 11.00
7.6 - 8.0 20.90 31 - 35 6.70
8.1 - 8.5 30.50 36 - 39 7.10
8.6 - 9.0 28.50 41 o más 0.00
9.1 - 9.5 12.00
9.6 - 10.0 2.80
__________________________________________________
Total 100.00 Total 100.00
__________________________________________________
114 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Sin embargo y aun cuando es posible confiar en las inferencias a ser he-
chas a partir de los puntajes obtenidos por los sustentantes en la opera-
ción cognitiva Aplicar, los puntajes que muestran diferencias
significativas a favor de la ejecución en la operación Comprender sobre
la de Aplicar (t =5.427, 197 gl, p=.000) y Resolver problemas (t =
4.708, 197 gl, p =.00) deben ser tomados con cautela porque no valida-
ron los constructos hipotetizados.
Cabe enfatizar que los resultados de este estudio solo pueden ser gene-
ralizados bajo el modelo teórico puesto a prueba y en las condiciones en
las que fueron recolectados los puntajes. Si bien los hallazgos sugieren
mejora en las medidas de las operaciones “Comprender” y “Resolver
problemas” y en los campos de conocimiento “Teórico” y “Combinado”,
estos no pueden generalizarse a la totalidad de la población que ha sus-
tentado el examen de egreso del cual se extrajeron los datos utilizados
en este estudio debido a que las muestras de ítems y de sustentantes
fueron intencionales.
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 117
DE EXÁMENES DE EGRESO DE LICENCIATURA
Conclusiones generales
Referencias
Bentler, P. M. (1993). EQS: Structural Equations Program Manual. CA:
BMPD Statistical Software, Inc.
Campbell, D. T., & Fiske, D. W. (1958). Convergent and discriminant va-
lidations by multitrait-multimethod matrix. Psychological Bulletin.
56, 81-105.
Castañeda, S. (1993). Procesos Cognitivos y Educación Médica. México:
UNAM.
Castañeda, S. (1998). Evaluación de resultados de aprendizaje en esce-
narios educativos. Revista Sonorense de Psicología. 12(2), 57-67.
Castañeda, S. (2002). A cognitive model for learning outcomes assess-
ment. International Journal of Continuing Engineering Education
and Life-long Learning. UK: UNESCO 12, 1-4, 106.
VALIDANDO PUNTAJES DE BANCOS DE ÍTEMS 119
DE EXÁMENES DE EGRESO DE LICENCIATURA
Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance
structural analysis: Conventional criteria versus new alternatives.
Structural Equation Modeling, 6, 1-55.
Irvine, S. H. (2002) Item Generation for Test Development: An Intro-
duction. En S. H. Irvine y P. C. Kyllonen. (Eds.) Item Generation for
Test Development. (xv-xxv). EE. UU.: LEA.
Linacre, J. M. & Wright, B. D. (1994). A user’s Guide to BigSteps. Chica-
go, IL: MESA Press.
McCallum, R. C. & Austin, J. T. (2000). Applications of Structural Equa-
tion Modeling in Psychological Research. Annual Review of Psycho-
logy 51, 201–226.
Messick, S. (1989). Validity. En R. L. Linn (Ed.), Educational measure-
ment (3a. Ed.). N.Y.: American Council of Education & McMillan.
Messick, S. (1994). The interplay of evidence and consequences in the
validation of performance assessments. Educational Researcher,
32(2), 13-23.
Messick, S. (1995). Validity of Psychological Assessment. Validation on
Inferences From Person’s Responses and Performances as Scienti-
fic Inquiry Into Score Meaning. American Psychologist. 50(9),
741-749.
Mislevy, R. (1993). Foundations of a new test theory. En N. Frederiksen,
R. Mislevy y I. Bejar (Eds.). Test Theory for a New Generation of
Test. Hillsdale, N.J.: LEA.
Mislevy, R., Wilson, M., Ercikan K., & Chudowsky, N. (2003). Psychome-
tric principles in student assessment. En, T. Kellaghan & D. L. Stuf-
flebeam (Eds.), International Handbook of Educational Evaluation.
The Netherlands: Kluwer Academic Press.
Pollit, A. & Ahmed, A. (1999). A New Model of the Question Answering
Process. Participación presentada en la 1999 International Associa-
tion for Educational Assessment Conference realizada en Bled,
Eslovenia.
RASCAL (1992). Rasch Analysis Program (version 3.5). MN.: Assess-
ment Systems Corporation.
Wiley, D. E. (2002). Validity of Constructs Versus Construct Validity of
Scores. En H. I. Braun., D. N. Jackson & D. Wiley (Eds.), The Role Of
Constructs in Psychological and Educational Measurement (pp.
207-227). N.J.: LEA.
Capítulo 5 ?
Variables personales relacionadas con el promedio
académico, la atribución de éxito y la construcción
de teorías del desempeño académico
Aldo Bazán Ramírez
Universidad Autónoma del Estado de Morelos
Rafael Félix Verduzco
Instituto Tecnológico de Sonora
Helena Gaviño Sánchez
Universidad de Sonora
Al parecer, son los estudiantes expertos y exitosos los que tienen mejo-
res estrategias para analizar problemas y planear un proceso de solu-
ción (De Corte, 1999). Según señalan Weinstein y cols. (1998), estos
estudiantes hacen uso de manera eficaz de sus repertorios de estrate-
gias de aprendizaje para construir significados de manera que la infor-
mación nueva se vuelve una parte de su base organizada de
conocimiento, y que puede en el futuro ser consultada como recordato-
rio, aplicación, o solución de problemas.
Otra variable de tipo personal, clave para el aprendizaje, tiene que ver
con la propia valoración de los estudiantes con relación a lo que aprende
y como lo aprende. La autovaloración de los estudiantes respecto de sus
propias habilidades académicas y respecto del esfuerzo invertido en la
ejecución de una tarea o solución de problemas, y el dominio percibido
sobre dicha tarea o actividad, constituyen una dimensión fundamental
cuando se analizan los aspectos motivacionales de los estudiantes como
un elemento relacionado con otras variables que influyen en el aprendi-
zaje (Castañeda, 2002). Así por ejemplo, Popham (2000) considera que
evaluar los aspectos afectivos en situaciones de aprendizaje y ejecución
es, tal vez, más importante y más significativo que el evaluar los aspec-
tos cognitivos y el aprendizaje (resultados o logros), puesto que las acti-
tudes, intereses, expectativas y el gusto por los temas que se estudian
influyen, generalmente, en las estrategias de estudio y de solución de
problemas que emplean los alumnos, así como en el desarrollo de estilos
interactivos efectivos para el estudio, en la valoración del estudio y en la
autovaloración respecto al dominio de esos temas.
Sin embargo, llama la atención que el factor “nivel educativo de los padres”
influye de manera negativa y significativa, tanto a la atribución de éxito en
la lectura en inglés, así como a la atribución de fracaso en lectura.
Tabla 1
Comparación múltiple (Chipre HSD) por grado escolar en atribución de
éxito y atribución de fracaso en lectura.
__________________________________________________
Variable (I) Grado (J) Grado Diferencia Error estandar Significancia
Dependiente Escolar Escolar Entre medias
(I-J)
__________________________________________________
Quinto .6522 .28682 .060
ATEXLEC Tercero 1ro Secun .9000 .29782 * .010
Tercero -.6522 .28682 .060
Quinto 1ro Secun .2478 .30352 .694
Tercero -.9000 .29782 * .010
1ro Secun Quinto -.2478 .30352 .694
__________________________________________________
Quinto -.0725 .34253 .976
ATFRLEC Tercero 1ro Secun -.4371 .35566 .440
Tercero .0725 .34253 .976
Quinto 1ro Secun -.3646 .36246 .576
Tercero .4371 .35566 .440
1ro Secun Quinto .3646 .36246 .576
_______________________________________________________
*La diferencia de medias es significativa a un nivel de .05
Discusión
Un primer aspecto a tomarse en cuenta es la influencia del promedio
académico obtenido en un nivel escolar, sobre indicadores de aprove-
chamiento y ejecución en el siguiente nivel escolar. En los estudios uno y
tres, se encontraron relaciones de predicción entre el promedio final ob-
tenido en la preparatoria con los promedios de calificación obtenidas en
VARIABLES PERSONALES RELACIONADAS CON EL PROMEDIO 133
ACADÉMICO, LA ATRIBUCIÓN DE ÉXITO Y LA CONSTRUCCIÓN
DE TEORÍAS DEL DESEMPEÑO ACADÉMICO
Por otra parte, en los estudios que demandan ejecución tanto de estu-
diantes de educación básica (primaria y secundaria), así como de estu-
diantes universitarios, la auto evaluación es una variable altamente
predictora de dichas ejecuciones. En el caso de los estudiantes universi-
tarios, la auto evaluación del grado de dominio sobre un texto proporcio-
nado previamente, predice la ejecución de los estudiantes en una
evaluación de análisis de textos, mientras que en los niños bilingües de
primaria y de secundaria, la auto evaluación del grado de dominio sobre
lectura en inglés (asociado con dominio de una segunda lengua), permi-
te predecir el grado de atribución que hacen de su éxito en la lectura en
una segunda lengua.
134 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Referencias
Aguilar, J., Martínez, M., Valencia, A., Conroy, C. & Girardo, A. (1997). Me-
tas de logro, competitividad y perfiles motivacionales entre estudiantes
universitarios. Revista Latina de Pensamiento y Lenguaje, 5, 25-35.
Aguilar, J., Pacheco, J., Andrade, J., Vargas, J., Gutierrez, M. & Zetina,
G. (1992). Estudio sobre la validez concurrente del inventario de
factores de carrera con estudiantes de licenciatura, México: UNAM.
Aguilar, J., Valen cia, A. & Martínez, M. (2002). Un modelo de las in -
terrelaciones entre disposiciones motivacionales generales y es-
pecíficos. Re vis ta La ti na de Pen samien to y Len guaje, 10,
119-127.
Aguilar, J., Valencia, A., Martínez, M., Romero, P. & Lemus, L.
(2003-2004). Estilos parentales y medidas de desarrollo psicosocial
en estudiantes universitarios. Revista Latina de Pensamiento y Len-
guaje, 12, 69-81.
Aguilar, J., Valencia, A. & Romero, P. (2004). Estilos parentales y desa-
rrollo psicosocial en estudiantes de bachillerato. Revista Mexicana
de Psicología, 21(2), 119-129.
Aguilar, J., Valencia, A., Martínez, M. & Vallejo, A. (2002). Un modelo
estructural de la motivación intrínseca en estudiantes universita-
rios, en A. Bazán y A. Arce (Eds.). Estrategias de evaluación y me-
dición del comportamiento en Psicología (pp. 87-119). Ciudad
Obregón: ITSON-UADY.
VARIABLES PERSONALES RELACIONADAS CON EL PROMEDIO 135
ACADÉMICO, LA ATRIBUCIÓN DE ÉXITO Y LA CONSTRUCCIÓN
DE TEORÍAS DEL DESEMPEÑO ACADÉMICO
Castañeda, S., Lugo, E., Pineda, L., & Romero, N. (1998). Estado del
arte de la evaluación y el fomento del desarrollo intelectual en la en-
señanza de ciencias, artes y técnicas, en S. Castañeda (Coord.).
Evaluación y fomento del desarrollo intelectual en la enseñanza de
ciencias, artes y técnicas (pp. 17-156). México: Porrúa.
Castañeda, S. & Ortega, I. (2004). Evaluación de estrategias de apren-
dizaje y orientación motivacional al estudio. En S. Castañeda Edu-
cación, Aprendizaje y Cognición. Teoría en la práctica (pp.
277-299). México: UNAM, U. de G. y Manual Moderno.
Castejón, J., Navas, L., & Sampascual, G. (1996). Un Modelo estructural
sobre los determinantes cognitivo-motivacionales del rendimiento
académico. Revista de Psicología General y Aplicada, 49, 27-43.
Chan, D., Ramey, S., Ramey, C., & Schmittt, N. (2000). Modeling in-
traindividual changes in children’s social at home and at school: a
multivariate latent growth approach to understanding bet-
ween-settings differences in children’s social skill development.
Multivariate Behavioral Research, 35, 365-396.
Chartrand, J., Robbins, S., Morral, W. & Boggs, K. (1990). Development
and validation of the carrer factory inventory. Journal of Counseling
Psychology, 37, 491-501.
Corral, V. (1995). Modelos de variables latentes para la investigación
conductual. Acta Comportamentalia, 3, 171-190.
Corral, V. (1997). Disposiciones psicológicas: un análisis de las propen-
siones, capacidades y tendencias del comportamiento. Hermosillo:
Unison.
Cribbie, R., & Jamieson, J. (2000). Structural equation models and the
regression bias for measuring correlates of change. Educational and
Psychological Measurement, 60, 893-907.
De Corte, E. (1999). Desarrollo cognitivo de innovación tecnológica. Una
nueva concepción de la enseñanza y el aprendizaje para el siglo
XXI. Revista Latina de Pensamiento y Lenguaje, 4, 229-249.
Georgiou, S. N. (1999). Achievement atributions of sixth grade children
and their parents. Educational Psychology, 19, 399-412.
González, D., Castañeda, S. & Corral, V. (2002). Validación e identifica-
ción de constructos subyacentes a estrategias de aprendizaje uni-
versitario. Aproximación multirasgo-multimétodo (MRMM). Revista
Latina de Pensamiento y Lenguaje, 10, 107-118.
VARIABLES PERSONALES RELACIONADAS CON EL PROMEDIO 137
ACADÉMICO, LA ATRIBUCIÓN DE ÉXITO Y LA CONSTRUCCIÓN
DE TEORÍAS DEL DESEMPEÑO ACADÉMICO
Introducción
La sociedad contemporánea, inmersa en un proceso de cambio acelera-
do en todas sus esferas, exige transformaciones en la organización y
operación de sus instituciones, incluyendo las educativas. En este con-
texto, las universidades están llamadas a adecuar sus estructuras y for-
mas de organización a los retos de un mundo cambiante, donde los
desarrollos en ciencia y tecnología y el acceso y distribución de la infor-
mación, vía la Internet, han impactado la formación del capital humano
y donde la exigencia de generar mano de obra cada vez más calificada
para insertarse activamente en el mundo constituyen desafíos inaplaza-
bles de atender. Así, el tipo de educación ofertada en las universidades
-y las habilidades que ésta ha generado- han sido revisadas seriamente,
en la medida en la que en la sociedad del conocimiento se considera in-
dispensable aumentar, en calidad y cantidad, el capital humano requeri-
do para fomentar el crecimiento general.
Así, el desafío es algo más que poner información en la mente de los es-
tudiantes, es necesario fomentar las habilidades cognitivas y de control
ejecutivo que les permitan construir conocimientos de la mejor calidad,
validarlos con evidencias fuertes, adaptarlos a situaciones imprevisibles
y transmitirlos apropiadamente.
Referencias
Bass, K. M. & Glaser, R. (2004). Developing assessments to inform tea-
ching and learning. (Reporte No. 628).CA, EE. UU.: Universidad de
Pittsburg, Centro de Investigación del Aprendizaje y el Desarrollo.
Solano, G. (2004). Pruebas prácticas en la evaluación del aprovecha-
miento escolar: Métodos, ventajas y posibilidades. En S. Castañe-
da. Educación, Aprendizaje y Cognición. Teoría en la práctica (pp.
137-154). México: UNAM, U. de G. y Manual Moderno. ISBN
970-32-1129-1
Capítulo 6 ?
Diseñando exámenes
Sandra Castañeda F., Raquel García y Rosa Elsa González
Universidad Nacional Autónoma de México
Introducción
En la medida en la que los pun ta jes de los exámenes re flejan, con
una fre cuen cia ma yor a la de sea ble, la necesidad de efectuar refor -
mas substanciales en las prácticas educativas, el control de calidad
que la evaluación debe ejercer sobre los produc tos del aprendizaje
se cons titu ye en un factor determinante del mejoramiento de profe-
sores y estudiantes, del diseño, ajuste e implementación de sistemas
educativos y, de manera importante, de la selección y certificación de
individuos.
lladas por los examinandos en nuestros cursos, o bien, que nos permitan
diagnosticar, de manera directa, el nivel de logro obtenido en mecanis-
mos responsables del aprendizaje eficiente. En otras palabras, cuestio-
narnos si a partir de los puntajes podemos prescribir, con precisión, las
acciones remediales para fomentar el éxito o si sólo permiten identificar
el fracaso.
Se re co no ce (Wi ley, 2002) que lo que se eva lúa en los exá me nes
son cons truc tos acer ca de ca pa ci da des para eje cu tar las cla ses de
ta reas que ge ne ran las di fe ren cias en tre la eje cu ción exi to sa de la
no exi to sa. De esta ma ne ra, un re sul ta do in di vi dual debe re pre sen -
tar algo más que ha ber res pon di do co rrec ta men te los ítems, más
bien, debe per mi tir le al eva lua dor ge ne ra li zar acer ca de las ha bi li -
da des y los co no ci mien tos que do mi na el exa minan do. En este áni -
mo, los exá me nes pue den te ner un ca rác ter for ma ti vo, más allá de
sim ple men te asig nar una ca li fi ca ción. Pue den ex ten der el apren di -
za je de los alum nos a par tir de la re troa li men ta ción que re ci ben,
tan to de aque llo que do mi nan, como de lo que aún ne ce si ta ser con -
so li da do. De esta ma ne ra, los exá me nes alien tan la mo ti va ción de
los alum nos al acla rar les los con te ni dos por apren der, lo que fa ci li ta
su es tu dio. Sir ven, tam bién, para de ci dir ac cio nes re media les, su
uti li dad ra di ca en la iden ti fica ción de áreas de de fi cien cia en las que
los alum nos ne ce si tan ser re for za dos.
Planeando un examen
En acuerdo con Anderson (2003), elaborar un instrumento que evalúe re-
sultados de aprendizaje requiere planeación. En este trabajo recomenda-
mos una de ocho pasos que, con pequeñas modificaciones, es útil para
todo tipo de tareas de evaluación. La Tabla 1 los resume y en este capítulo
se revisan los dos primeros, establecer el universo de contenido o de medi-
da y seleccionar las tareas que elicitarán las conductas a ser evaluadas.
Tabla 1
Pasos del desarrollo de exámenes de resultados de aprendizaje.
__________________________________________________
Pasos
__________________________________________________
1. Establecer el universo de contenido,
2. Seleccionar tareas que elicitarán conductas a ser evaluadas,
3. Establecer reglas de elaboración de tareas e ítems que den oportuni-
dad de mostrar el nivel de logro alcanzado en lo que se evalúa y de-
sarrollar las medidas,
4. Revisar, técnicamente, los ítems elaborados,
5. Estructurar y armar el examen,
6. Administrar la evaluación,
7. Asignar calificaciones,
8. Interpretar e informar resultados a los implicados
__________________________________________________
148 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
De aquí que los exámenes puedan ser formativos, sumativos o una inge-
niosa combinación de ambos pero, en cualquier caso, lo importante es
que el docente alinee el que y el como de lo que enseñó con el que y el
como evaluarlo. Una práctica poco afortunada, pero común en los salo-
nes de clase, es solicitarle al examinando que resuelva problemas cuyos
niveles de demanda son inesperados en aras de “enseñarles a pensar
por sí mismos”, cuando en las actividades de aprendizaje no se les dio
suficiente ejemplificación y ejercitación en la solución de problemas de
alto nivel. Como docentes es necesario que recordemos que la gente ad-
quiere habilidades mediante práctica extensa y apropiada y durante un
período adecuado de realimentación. Queda por enfatizar que la alinea-
ción deberá atender, además, al período que se va a evaluar (un semes-
DISEÑANDO EXÁMENES 149
tre, una unidad o una lección, por ejemplo) y, con base en esto, planear
el nivel de detalle que se pedirá en la evaluación, en tanto el período sea
más largo, la evaluación será menos detallada y viceversa (Nitko,
1994).
En todos los casos, es recomendable elaborar un plan que resuma los tó-
picos que fueron enseñados (mismos que deberán ser evaluados), los
objetivos de aprendizaje que los estudiantes deberían haber logrado y
las estrategias que se usarán para medirlos. La Tabla 2 muestra un es-
quema.
Tabla 2
Plan para evaluar un período de seis semanas.
__________________________________________________
Unidad 1
__________________________________________________
Objetivo general de aprendizaje Se describe el objetivo
Marco temporal Se describe el tiempo para completar
la enseñanza
Evaluación formativa Se describen actividades de evaluación
(tareas e ítems) que serán utilizadas.
Evaluación sumativa Se describen actividades de evaluación
(tareas e ítems) que serán utilizadas
Peso porcentual de cada actividad Se especifica un peso porcentual
de evaluación para cada actividad
__________________________________________________
Unidad 2
__________________________________________________
Objetivo general de aprendizaje Se describe el objetivo
Marco temporal Se describe el tiempo para completar la
enseñanza
Evaluación formativa Se describen actividades de evaluación
(tareas e ítems) que serán utilizadas.
Evaluación sumativa Se describen actividades de evaluación
(tareas e ítems) que serán utilizadas
Peso porcentual de cada Se especifica un peso porcentual para
actividad de evaluación cada tipo actividad
__________________________________________________
Calificación final del periodo Se especifica un peso porcentual para
cada tipo de actividad
__________________________________________________
150 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Cuan do los exá me nes in ter pretan el pun ta je in divi dual de un exa -
mi nan do con re fe ren cia a es tán da res de eje cu ción com pe ten te -re -
pre sen tan los ni ve les mí ni mos acep ta dos como ni vel de lo gro en lo
que se está eva luan do-, se está ha cien do re fe ren cia a exá me nes re -
fe ri dos al cri te rio o cri te ria les. Es de cir, los pun ta jes se in ter pretan
con base en lo que el exa mi nan do debe sa ber y debe sa ber ha cer,
de acuer do con lo es ta ble ci do por ex per tos en el do mi nio de co no ci -
mien to, pre via men te ope ra cio na li za do en cri te rios trans pa ren tes y
pre ci sos. La toma de de ci sio nes se hace a par tir de esos cri te rios, lo
que fo men ta, des de la eva lua ción, el lo gro de com pe ten cias bá si -
cas.
Esquema resumido
Tabla 3
Ejemplo de una matriz vacía de identificación del contenido a ser eva-
luado.
__________________________________________________
Tipos de conocimiento
__________________________________________________
Operación cognitiva Factual Conceptual Procedimental Autorregulatorio
__________________________________________________
Identificar
Clasificar
Traducir
Inferir
Planear acciones
___________________________________________________________
Tabla 4
Caracterización de las sub operaciones cognitivas. Primera categoría.
Tabla 5
Caracterización de las sub operaciones cognitivas. Segunda categoría.
Tabla 6
Caracterización de las sub operaciones cognitivas. Tercera categoría.
Refieren a cómo hacer algo (despejar una ecuación, jugar tenis, interpretar
una radiografía, aplicar una técnica específica, entre otros). Tienden a ser
inaccesibles y por lo tanto, difíciles de ser examinados. Difícilmente son ex-
presados verbalmente. Su aprendizaje es difícil, toma mucho tiempo y
práctica. Incluye métodos de inferencia y criterios para usar las habilida-
des, algoritmos, técnicas y métodos. Se explicitan dos tipos:
Con esta actividad, completada para cada uno de los objetivos seleccio-
nados, el docente habrá seleccionado las tareas que elicitarán las con-
ductas a ser evaluadas.
3. Los modelos mentales que usan los estudiantes para resolver de-
mandas, constituyen otro aspecto en el que se debe establecer si se
han dado cambios cualitativos en el aprendizaje. En la medida en la
que el aprendizaje ocurre se desarrollan organizaciones del conoci-
miento, bien estructuradas y cualitativamente diferentes, que capa-
citan a los aprendices para construir una representación compleja o
modelo mental que los guía tanto en la solución de problemas, como
para futuros aprendizajes. Los modelos mentales apoyan a los estu-
diantes a evitar estrategias de solución por ensayo y error y a formu-
lar analogías e inferencias que favorecen nuevos aprendizajes y
comprensiones. Así, ciertos patrones (modelos mentales) sirven
para guiar acciones apropiadas en la ejecución experta. Este meca-
nismo refleja y provee una estructura para una representación que
va más allá de los rasgos superficiales.
Toda vez que el estudiante ha adquirido las redes bien integradas, a par-
tir de práctica extensa con el andamiaje arriba descrito, él puede cons-
truir líneas de razonamiento directo entre conceptos diferentes. Y, en la
medida en la que estas líneas directas sean frecuentemente activadas,
gracias a prácticas situadas y bien planeadas por los profesores, los con-
ceptos que las constituyen se agruparán más y el estudiante estará en
capacidad de establecer ligas directas entre el primer y último concepto
pudiendo saltarse los intermedios. Este es el segundo proceso de apren-
dizaje, conocido como “conocimiento encapsulado”, -refiere al aspecto
DISEÑANDO EXÁMENES 165
Los libretos también pueden formar familias con una estructura común,
pero con combinaciones diferentes de sus variables (restaurante de co-
mida rápida, de comida china, entre otros). De la misma manera, los li-
bretos de enfermedades describen el proceso de generación del
desorden: condiciones bajo las cuales ocurre, los procesos anormales y
los signos y síntomas causados por el desorden específico. Los libretos
de enfermedad también incluyen el curso que el desorden puede tomar
y la acción requerida para curarlo. Los profesionales de la salud desarro-
llan libretos similares a los del restaurante para todos los desórdenes y
tipos de pacientes que comúnmente ven en su práctica. En este proceso,
la práctica apropiada con casos variados, que sea continua, extensa y
realimentada por un supervisor competente juega un papel central en el
aprendizaje profesional.
Pero cabe hacer una diferenciación importante: hay una gran diferencia
entre el razonamiento clínico basado en redes de conceptos y el basado
en libretos de enfermedad. El basado en redes de conceptos se realiza
paso a paso y, aun cuando las redes hayan sido encapsuladas sus pasos,
aunque grandes, seguirán siendo realizados uno a la vez. En cambio,
cuando el razonamiento está basado en libretos de enfermedad, estos
se activan como un todo: una vez que se activa el libreto de enferme-
dad, se activan inmediata y automáticamente otros elementos del libre-
to.
Se sabe que los modelos men tales de los expertos son más comple-
jos, lo que les permite visualizar los problemas de una mejor manera
y utilizar sistemas de operaciones capaces de guiar su ejecución de
for ma heu rística efec tiva, en tan to que los nova tos no los poseen o
no los han refina do lo que les hace li gar sus acciones a al goritmos
multipasos rutinizados, volviendo su ejecución más lenta y con ma-
yor ries go de fallar. Los ex per tos forman mo delos men ta les que in te -
gran tanto conocimientos sobre conceptos y principios básicos de la
disciplina, como procedimientos y condiciones bajo las cuales deben
ser aplicados para operar sobre un tópico o campo de conocimiento
específico.
Con base en los fundamentos descritos hasta aquí el docente puede pla-
near las evaluaciones en una secuencia detallada de objetivos gradual-
mente más complejos, utilizando medidas de cambios cualitativos en los
mecanismos responsables del aprendizaje complejo.
Tabla 6
Integrando objetivos, operaciones cognitivas, tareas y criterio de
dominio.
__________________________________________________
Objetivo de aprendizaje Tarea o ítem Criterio de dominio
__________________________________________________
__________________________________________________
Referencias
Anderson, L. W. (2003). Classroom Assessment. Enhacing the Quality of
Teacher Decision Making. N.J.: LEA.
Bass, K. M. y Glaser, R. (2004). Developing assessments to inform tea-
ching and learning. (Reporte 628). EE. UU.: Centro de Investiga-
ción del Aprendizaje y el Desarrollo, Universidad de Pittsburg.
Castañeda, S. (1993). Procesos Cognitivos y Educación Médica. México:
UNAM.
Castañeda, S. (1998). Evaluación de resultados de aprendizaje en esce-
narios educativos. Revista Sonorense de Psicología. 12(2). 57-67.
Castañeda, S. (2002). A cognitive model for learning outcomes assess-
ment. International Journal of Continuing Engineering Education
and Life-long Learning, UNESCO: UK. 12(1-4), 94-106.
Glaser, R., Lesgold, A. & Lajoie, S. (1987). Toward a cognitive theory for
the measurement of achievement. En R. Ronning, J. Glover, J. C. Con-
nolly & J. Witt (Eds.). The influence of cognitive psychology on testing
and measurement, (pp. 966-131). Hillsdale, N.J. EE.UU.: LEA.
Haladyna, T. M. (2004). Developing and Validating Multiple-Choice
Items. (3a. ed.).EE. UU.: LEA.
Mehrens, W & Lehmann, I. (1982). Medición y Evaluación en la Educación y
en la Psicología. México: Compañía Editorial Continental, S. A. de C. V.
Nitko, A. J. (1994). A Model for Developing Curriculum-Driven Crite-
rion-Referenced and Norm-Referenced National Examinations for
Certification and Selection of Students. Ponencia presentada en la
Conferencia Internacional sobre Evaluación y Medición Educativas,
de la Asociación para el Estudio de la Evaluación Educativa en Sud-
áfrica (ASSESA).
170 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Introducción
En este capítulo se ilustrará, en primer lugar, la aplicación del análisis
cognitivo de tareas a un dominio de conocimiento particular, con la fi-
nalidad de aportarle al docente ideas y ejemplos de cómo operar esta
técnica para el establecimiento del universo de medida y las tareas a
ser evaluadas, después se presentarán lineamientos generales útiles
a la elaboración y redacción de reactivos, entre otros, criterios para la
clasificación de reactivos de opción múltiple (por su forma de respues-
ta y por su estructura), las ventajas y desventajas de este tipo de
ítems, las dimensiones a ser consideradas en la redacción de un ítem,
en términos de los siete tipos de formatos más utilizados y de dos
fuen tes de contenido que han mostrado afectar sensiblemente el gra-
do de dificultad de los reactivos (la operación cognitiva subyacente a
la ejecución y el tipo de conocimiento evaluado). También, se revisan
dos tipos de análisis de ítems, uno previo a su aplicación y otro poste-
rior. Finalmente, se presentan reglas técnicas para escribir reactivos
que atienden a seis aspectos básicos de la estructura del ítem y una
escala para que el docente autoevalúe la calidad de los ítems por él
elaborados.
Nivel lingüístico:
l Léxico/morfológico l Topicalización
l Sintáctico l Tipografía/puntuación
l Cohesión
Tabla 1
Componentes de código de la lengua para evaluar comprensión
de textos en inglés como lengua extranjera.
__________________________________________________
Componentes de código de la lengua
__________________________________________________
Reconocimiento léxico
Inferencia de vocabulario
Localización del mínimo comunicativo
Distribución de sustantivos y verbos en el enunciado
__________________________________________________
Reconocimiento de casos que alteran la comprensión del enunciado,
como palabras de tipo negativo, de cantidad o tiempo (adverbios)
Concepto de tiempo (auxiliares del sistema verbal)
Interpretación de los elementos de cohesión
Interpretación de los elementos de coherencia (pronombres, adjetivos
posesivos, etc...)
__________________________________________________
Nivel proposicional
Tabla 2
Estructura textual para la evaluación de la comprensión de textos en
inglés como lengua extranjera.
__________________________________________________
Componentes de la estructura textual
__________________________________________________
Interpretación de los elementos de coherencia
Interpretación del párrafo a partir de sus componentes
Interpretación de elementos visuales de apoyo
__________________________________________________
174 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Nivel conceptual
Tabla 3
Componentes de organización textual para evaluar comprensión de
textos en inglés como lengua extranjera.
__________________________________________________
Componentes de organización textual
__________________________________________________
comprensión de la organización del texto
elaboración de la información obtenida
__________________________________________________
Como fue ilustrado, para poder realizar un ACT con el propósito de ela-
borar un examen en un dominio especifico, se requirió analizar los obje-
tivos y contenidos del curso o asignatura a evaluar, en primer lugar.
Esto permitió definir el perfil de salida que debe alcanzar el alumno des-
pués de tomar el curso.
Tabla 4
Formato para escribir el objetivo general.
__________________________________________________
Escriba aquí el objetivo general de la materia presentado en el programa
que sirve de base para la evaluación. ___________________________
________________________________________________________
ELABORACIÓN DE ÍTEMS OBJETIVOS 177
Segundo paso: Analice el objetivo y decida cuales son las acciones que
el alumno debe ser capaz de realizar al final del curso; enuméralas en
orden de importancia de lo más a lo menos importante:
Ter cer paso: Par tien do del ob je ti vo que el alum no debe cum plir al
fi nal del cur so, se plan tean los co no ci mien tos y ha bi lida des que ad -
qui ri rá du ran te el pe riodo ins truc cio nal. Por ejemplo, si un ob je tivo
so lici ta la com pren sión de lec tu ra de tex tos de tipo aca dé mi co, es -
cri tos en in glés, de com pleji dad me dia. Se con si de ra rán las ta reas
que el ex per to rea li za para com pren der tex tos en in glés, sien do
muy im portan te de limi tar los co no ci mien tos y las ha bi lida des a de -
sa rro llar, los prime ros co rres pon den a lo que el alum no debe sa ber
y los se gun dos a lo que el alum no debe sa ber ha cer para rea li zar la
ta rea.
Tabla 5
Ejemplo de conocimientos y habilidades en la
comprensión de textos en inglés.
__________________________________________________
Conocimientos Habilidades
__________________________________________________
El alumno debe saber que es una El alumno será capaz de identifi-
palabra clave y como identificarla. car las palabras clave contenidas
Las palabras clave tienden a ser en un texto para encontrar el
sustantivos que están comprendi- tema general del mismo.
dos dentro de un campo semánti-
co (palabras que delimitan el tema
de un escrito).
__________________________________________________
Tabla 6
Formato para desglosar conocimientos y habilidades en el ACT.
__________________________________________________
Habilidades Conocimientos
__________________________________________________
__________________________________________________
Quinto paso: A partir de las tablas anteriores, elabore una tabla (con el
formato de la Tabla 7) que contenga las tareas que el alumno debe saber
resolver de acuerdo con lo planteado en los objetivos del curso o asigna-
tura.
Tabla 7
Formato para la elaboración de tareas en el ACT.
__________________________________________________
Tareas
__________________________________________________
__________________________________________________
Tabla 8
Tareas de comprensión de textos en inglés.
__________________________________________________
Tareas de comprensión
__________________________________________________
Reconocimiento de léxico
Inferencia de vocabulario
Localización del sujeto y verbo que lo acompaña
Distribución de sustantivos y verbos en el enunciado
__________________________________________________
Reconocimiento de casos que alteran la comprensión del enunciado,
como palabras de tipo negativo, de cantidad o tiempo (adverbios)
Concepto de tiempo (auxiliares del sistema verbal)
Interpretación de los elementos de cohesión (pronombres, adjetivos po-
sesivos, etc...)
__________________________________________________
ELABORACIÓN DE ÍTEMS OBJETIVOS 179
Tabla 9
Formato para determinar las tareas en el ACT.
__________________________________________________
Tareas de ACT
__________________________________________________
__________________________________________________
Sexto paso: Identificar las sub tareas que componen la tarea, decidir el
tipo de conocimiento que se integrará en el curso y los procesos nece-
sarios para llevar a cabo la tarea. Volvamos a nuestro ejemplo. Las ta-
reas identificadas deben dividirse en sus sub componentes (ver Tabla
10).
Tabla 10
Ejemplo de sub tareas en la comprensión de textos en inglés.
Tabla 11
Formato para los sub componentes de la tarea.
Séptimo paso: Una vez que todas las tareas se han integrado y jerarqui-
zado por orden de dificultad se puede elaborar un examen, revisando las
tablas ya elaboradas aquí y redactando los mejores reactivos posibles.
Para ello, le recomendamos continuar con la siguiente sección.
Respuesta óptima. Todas las opciones del reactivo son parcialmente co-
rrectas, pero una de ellas es la mejor. Requiere de un mayor dominio
conceptual y análisis de cada opción para poder contestarlos correcta-
mente, por lo que se emplean para evaluar aprendizajes complejos.
ELABORACIÓN DE ÍTEMS OBJETIVOS 181
Los reactivos de opción múltiple pueden ser útiles para medir el conoci-
miento de los alumnos de manera rápida y objetiva, sin embargo tam-
bién presentan algunas desventajas. Los autores de esta obra
comparten la opinión de que los reactivos de opción múltiple pueden
medir no sólo el aprendizaje simple (memorístico), sino también el com-
plejo. La Tabla 12 sintetiza ventajas y desventajas de Ítems de opción
múltiple (OM).
Tabla 12
Ventajas y desventajas de los ítems objetivos.
1. Simple; 5. Interpretativo,
4. canevá;
Tabla 13
Estructura del reactivo de formato simple.
Componentes Estructura
Base …:
Opciones A) …
B) …
C) …
D) …
Tabla 14
Estructura del formato de ordenamiento.*
Componentes Estructura
Descripción La base del reactivo incluye el enunciado de la situa-
ción a resolver y una lista de elementos. A partir de la
combinación de varios de ellos, se elaboran las opcio-
nes de respuesta. El examinando debe elegir la combi-
nación correcta. Este tipo de reactivo es útil para
situaciones en las que se requiera decidir el orden
temporal correcto de un listado de elementos.
184 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Tabla 15
Estructura del formato de apareamiento.*
Componentes Estructura
Tabla 16
Estructura del formato canevá.
Componentes Estructura
Tabla 17
Estructura del formato falso-verdadero.
Componentes Estructura
Opciones A) Falso
B) Verdadero
Tabla 18
Estructura del formato de ítem interpretativo.
Componentes Estructura
A) B) C) D) E)
Tabla 19
Ejemplo de reactivo falso verdadero múltiple.
Componentes Estructura
Para constituir una casa de bolsa se requiere cumplir,
Base
entre otros, los siguientes requisitos:
Dos socios Cada socio Cinco Que el
como debe por socios capital
mínimo lo menos como suscrito no
suscribir mínimo sea inferior
una acción al 75%
Opciones A) NO SÍ NO SÍ
B) SÍ SÍ NO NO*
C) NO NO SÍ SÍ
D) SÍ NO SI NO
Si bien, este formato tiene una larga historia, se ha vuelto más popular
recientemente. Una razón es la necesidad para crear reactivos que mi-
dan habilidades cognitivas de nivel superior. La colocación de los reacti-
vos debe situarse de manera adecuada para evaluar habilidades
cognitivas o aspectos que involucren habilidades de pensamiento com-
plejo, así como para hallar la solución a problemas o medir el pensa-
miento crítico.
Tabla 20
Estructura de formato grupos de reactivos dependientes del contexto.*
Componentes Estructura
Descripción El grupo de reactivos que se utilicen deben evaluar una
variedad de habilidades complejas (analizar, sintetizar y
evaluar hechos, conceptos, principios y/o procedimien-
tos) para resolver situaciones o problemas diversos.
En este formato se presenta uno o varios párrafos donde
se establece el problema o la situación específica y se
elaboran de dos a diez reactivos, en cualquier formato
de opción múltiple, acerca de la información presenta-
da.
Su construcción debe cuidar que el grupo de reactivos
incluidos sea consistente con la temática específica que
se está evaluando y para la cual la información que se da
en la descripción de la situación o problema a resolver es
pertinente.
El evaluador encontrará que este formato de reactivos le
permite:
l Evaluar integralmente, en una sola presentación glo-
bal, una competencia en los niveles de operación cog-
noscitivos requeridos, tanto en lo que individualmente
aporta cada reactivo incluido, como en lo que el con-
junto de ellos significa.
ELABORACIÓN DE ÍTEMS OBJETIVOS 191
Base 1 1. …
Opciones A) …
B) …
C) …
D) …
Base 2 2. …
Opciones A) …
B) …
C) …
D) …
Instrucciones
ACEPTADO NO ACEPTADO
A (x) A( )
AR ( ) AR ( )
R( ) R (x)
200 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A( )
AR (D)
R( )
A( ) A( ) A( ) A( ) A( ) A( ) A( ) A( ) A( )
AR ( ) AR ( ) AR ( ) AR ( ) AR ( ) AR ( ) AR ( ) AR ( ) AR ( )
R( ) R( ) R( ) R( ) R( ) R( ) R( ) R( ) R( )
Nota. Se eliminaron algunos de los espacios correspondientes a algunos reactivos de la escala de evalua-
ción por fines de espacio.
ELABORACIÓN DE ÍTEMS OBJETIVOS 201
A) independencia de criterio
C) responsabilidad personal
Como se puede observar las áreas de mejora del reactivo tienen que
ver, en términos generales, con que la estructura del párrafo y el voca-
bulario son complejos; valora solo el recuerdo; la base del reactivo da
indicios sobre la respuesta correcta; no usa sólo distractores plausibles;
y la extensión de las opciones de respuesta no es similar. Dada la evi-
dencia el evaluador decide rechazar el reactivo.
202 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
TABLA 21
Hoja de respuesta de la evaluación de algunos reactivos.
Referencias
Beller, M.; & Gafni, N. (2000). Can Item Format Account for Gender Dif-
ferences in Mathematics Achievement? Sex Roles, 42, 1-2.
Castañeda, S. (1998). Estado del arte de la evaluación y el fomento del
desarrollo intelectual en la enseñanza de ciencias, artes y técnicas.
En Castañeda, S. (Ed.) Evaluación y fomento del desarrollo intelec-
tual en la enseñanza de ciencias, artes y técnicas. Perspectiva in-
ternacional en el umbral del siglo XXI (pp.17–158). Colección
“Problemas Educativos de México”. México: UNAM, CONACYT y Mi-
guel Ángel Porrúa.
Castañeda, S. (1999). Guía de elaboración de reactivos. UNAM.
Castañeda, S. (2000). Guía del Examen General de Egreso de la licen-
ciatura en Psicología. 2ª Ed. CENEVAL.
Castañeda, S. (2004). Educación, Aprendizaje y Cognición. En Castañe-
da S. (Ed.) Educación, Aprendizaje y Cognición. Teoría en la prácti-
ca (pp. 49-74). México: UNAM, U. de G. y Manual Moderno.
Feng, X. & Mokhtari, K. (1998). Reading Easy and Difficult Texts in En-
glish and Chinese: Strategy Used by Native Speakers of Chinese.
Asian Journal of English Language Teaching, 8, 19-40.
García Jurado, R. (2003). Factores instruccionales que inciden en el
aprendizaje de la comprensión de lectura en inglés como lengua ex-
tranjera en alumnos de la UNAM, Campus Acatlán. Tesis de maes-
tría no publicada, UNAM, Facultad de Psicología, D. F., México.
Graves, B., & Frederiksen, C. (1991). Literary expertise in the descrip-
tion of a fictional narrative. North-Holland - Elsevier Science Publis-
hers, 20, 1-26.
Haladyna, T (2004). Developing and Validating Multiple-choice Test
Items. (3a. ed.). Mahwah, N.J.: LEA.
Jornet, J. M. & Suarez, J. M. (1996). Pruebas estandarizadas y evalua-
ción del rendimiento: usos y características métricas. Revista de
Investigación Educativa, 14 (2), 141-163.
Kolstad, R. K. & Kolstad, R. A. (1994). Applications of conventional and
non-restrictive multiple-choice examination items. Clearing House,
67(6), 3, 317.
Capítulo 8 ?
Escala de valoración de fuentes de contenido
de reactivos objetivos*
Sandra Castañeda, Isaac Ortega, Daniel González, Miguel López,
Raquel García, María de Lourdes Pineda y Rodrigo García
Universidad Nacional Autónoma de México
Tabla 1
Interacción formato del reactivo y tipo de conocimiento a evaluar (1- 11).
Tipo de
conocimiento
Formato del reactivo F* C* P*
a) Simple (1) 1 2 3
b) Ordenamiento (2) 2 4 6
c) Apareamiento (3) 3 6 9
d) Falso-Verdadero Múltiple o Canevá 4 7 10
Si el reactivo pertenece a un grupo de reactivos,
sumar 1 punto extra al valor de Dificultad
correspondiente a su Formato
Dificultad apriorística
Nota. F = factual; C = conceptual; P = procedimental.
Tabla 2
Interacción operación cognitiva y tipo de conocimiento que evalúa (1-9).
Tipo de
conocimiento
Formato del reactivo F C P
a) Comprender Identificación (1) 1 2 3
y organizar Ordenamiento y clasificación (2) 2 4 6
Jerarquización (3) 3 6 9
b) Aplicar Conceptos y principios (1) 1 2 3
Traducir/ procedimientos y rutinas
2 4 6
técnicas. (2)
Modelos mentales (3) 3 6 9
c) Resolver Identificar errores (1) 1 2 3
Proponer acciones con andamiaje (2) 2 4 6
Proponer acciones sin andamiaje (3) 3 6 9
Si el reactivo pertenece a un Grupo de Reactivos, se
suma 1 punto extra al valor de Dificultad
correspondiente a su Formato
Dificultad apriorística
Nota. F = factual; C = conceptual; P = procedimental.
ESCALA DE VALORACIÓN DE FUENTES DE CONTENIDO 209
DE REACTIVOS OBJETIVOS
Tabla 3
Interacción tipo de contexto en el que se presenta el reactivo
y el tipo de conocimiento que evalúa (1 – 12).
Tipo de conocimiento
Formato del reactivo F C P
F C P
a) E – R (1) 1 2 3
b) R - E (2) 2 4 6
c) C. E – R (3) 3 6 9
d) C. R – E (4) 4 8 12
Dificultad apriorística
Tabla 4
Interacción campo de conocimiento evaluado en el reactivo
y tipo de conocimiento que Evalúa (1 – 9).
Tipo de conocimiento
Formato del reactivo F C P
a) Teórico (1) 1 2 3
b) Técnico (2) 2 4 6
c) Combinado (3) 3 6 9
Dificultad apriorística
Nota. F = factual; C conceptual; P = procedimental; E = ejemplo; R =
regla; C = caso
Dificultad apriorística
Dificultad apriorística
6. Es ambiguo
7. El nivel de dificultad de la lectura del
reactivo y el del vocabulario usado no
son los más simples posibles.
8. No utiliza señales gráficas para indicar
donde termina la base del reactivo e ini-
cian las opciones de respuesta.
Dificultad apriorística
Dificultad apriorística
Tabla resumen
Puntos Puntos Fracción
Obtenidos Totales (F =
(PO) (PT) PO/PT)
1. Tipo de Formato
2. Demandas cognitivas
3. Contexto
4. Tipo de Conocimiento
5. Redacción
6. Uso técnico apropiado
Nota: F = Fracción
Referencias
Haladyna, T. M. (2004). Developing and validating multiple-choice test
items. Mahwah, N.J.: LEA.
Haladyna, T. M. & Downing, S. M. (1989). A taxonomy of multi-
ple-choice item-writing rules. En Applied measurement in educa-
tion. (pp. 37-50).
Capítulo 9 ?
Análisis de Reactivos
Miguel López Olivas
Universidad Nacional Autónoma de México
Introducción
Análisis de reactivos es un procedimiento psicométrico, por el cual pue-
den determinarse las propiedades y los valores de los ítems que integran
una prueba o instrumento de medición, una vez que ha sido aplicado
(Anastasi, 1966; Sax, 1980). Como se expone y explica más adelante,
hay varias posibilidades para el análisis, que más que ser excluyentes
son complementarias.
v Asignatura:
v Unidad:
v Tema:
v Subtema:
v Simple
v Ordenamiento
v Apareamiento
v Canevá
v Falso-verdadero Múltiple
3. Campo de Conocimiento:
v Teórico
v Técnico
v Combinado
218 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
4. Contexto de Evaluación:
v Reconocimiento
v Recuerdo
v Comprender y Organizar
v Aplicar
v Resolver
6. Tipo de Conocimiento:
v Factual
v Conceptual
v Procedural
Una vez que se han elegido descriptores, ya sea los sugeridos, que se
apegan a las fuentes de dificultad explicadas en esta obra; o algunos
otros que se juzguen convenientes para caracterizar cada ítem del ban-
co, siempre y cuando ya se haya aplicado en un instrumento, conviene
idear un espacio de trabajo para el análisis.
Esta información se toma como base para ilustrar el primer nivel de aná-
lisis, esto es, el que se puede realizar como un ejercicio de inspección
ANÁLISIS DE REACTIVOS 219
Tema 1: operaciones.
Tabla 1
Base-0: formato general. Asignatura: Matemáticas (MA)
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO4 FO4 FO5 FO5
Campo de
CC1 CC1 CC2 CC3 CC2 CC2 CC3 CC3 CC1 CC1
Conocimiento
Contexto de
CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Evaluación
Operación
OC1 OC1 OC1 OC1 OC2 OC2 OC3 OC3 OC2 OC3
Cognitiva
Tipo de
TC1 TC1 TC2 TC2 TC2 TC1 TC1 TC3 TC3 TC3
Conocimiento
220 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Ítem 1 2 3 4 5 6 7 8 9 10
Respuesta
A D D C B B C A A D
Correcta
Sujetos
1 A D D C B C A B D C
2 A D A A A D A C A A
3 B D C C B C C C C D
4 B D D B B A D C C A
5 C D D C B D A C B A
6 B D D D B A A D A B
7 A D D C B B A D A D
8 A D D C B D C C A D
9 A D D A B C B D C A
10 A D D A B C B B B A
Claves
Formato del Ítem Contexto de Evaluación Tipo Conocimiento
Simple FO1 Reconocimiento CE1 Factual TC1
Ordenamiento FO2 Recuerdo CE2 Conceptual TC2
Apareamiento FO3 Operación Cognitiva Procedural TC3
Canevá FO4 Comprender OC1
F-V múltiple FO5 Aplicar OC2
Campo de Conocimiento Resolver OC3
Teórico CC1
Técnico CC2
Mixto CC3
Tabla 2
Base-1: Aciertos obtenidos por cada sujeto y en cada ítem de la prueba.
Banco de Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO4 FO4 FO5 FO5
Campo de Conocimiento CC1 CC1 CC2 CC3 CC2 CC2 CC3 CC3 CC1 CC1
Contexto de Evaluación CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Operación Cognitiva OC1 OC1 OC1 OC1 OC2 OC2 OC3 OC3 OC2 OC3
Tipo de Conocimiento TC1 TC1 TC2 TC2 TC2 TC1 TC1 TC3 TC3 TC3
ANÁLISIS DE REACTIVOS 221
Ítem 1 2 3 4 5 6 7 8 9 10
Respuesta Correcta A D D C B B C A A D
Sujetos Suma
1 A D D C B C A B D C 5
2 A D A A A D A C A A 3
3 B D C C B C C C C D 5
4 B D D B B A D C C A 3
5 C D D C B D A C B A 4
6 B D D D B A A D A B 4
7 A D D C B B A D A D 8
8 A D D C B D C C A D 8
9 A D D A B C B D C A 4
10 A D D A B C B B B A 4
Suma 6 10 8 5 9 1 2 0 4 3 48
Para determinar los aciertos que cada sujeto obtuvo y los que se dieron
en cada reactivo de la prueba, basta con comparar la respuesta en cada
ítem con la clave de respuestas correctas.
Aún cuando la tarea pareciera estar completa y aunque una gran mayo-
ría de los profesores o evaluadores suelen terminar los análisis en este
punto, en realidad estas operaciones marcan sólo el principio, pues la in-
formación disponible permite obtener un provecho mucho mayor, como
podrá advertirse en las siguientes bases.
Tabla 3
Base-2: Ordenamiento de los reactivos de mayor a menor número de
aciertos. Banco de Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 2 2 2 1 2
Tema 2 2 2 2 2 1 1 1 2 1
Subtema 1 1 1 1 1 2 2 1 1 2
Formato FO1 FO3 FO2 FO1 FO2 FO5 FO5 FO4 FO3 FO4
Campo de Conocimiento CC1 CC2 CC2 CC1 CC3 CC1 CC1 CC3 CC2 CC3
Contexto de Evaluación CE1 CE2 CE1 CE1 CE2 CE2 CE1 CE2 CE1 CE2
Operación Cognitiva OC1 OC2 OC1 OC1 OC1 OC2 OC3 OC3 OC2 OC3
Tipo de Conocimiento TC1 TC2 TC2 TC1 TC2 TC3 TC3 TC1 TC1 TC3
Ítem 2 5 3 1 4 9 10 7 6 8
Respuesta Correcta D B D A C A D C B A
Sujetos Suma
1 D B D A C D C A C B 5
2 D A A A A A A A D C 3
3 D B C B C C D C C C 5
4 D B D B B C A D A C 3
5 D B D C C B A A D C 4
222 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
6 D B D B D A B A A D 4
7 D B D A C A D A B D 8
8 D B D A C A D C D C 8
9 D B D A A C A B C D 4
10 D B D A A B A B C B 4
Suma 10 9 8 6 5 4 3 2 1 0 48
Tabla 4
Base-3: Ordenamiento de los sujetos de mayor a menor número de
aciertos. Banco de Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 2 2 2 1 2
Tema 2 2 2 2 2 1 1 1 2 1
Subtema 1 1 1 1 1 2 2 1 1 2
Formato FO1 FO3 FO2 FO1 FO2 FO5 FO5 FO4 FO3 FO4
Campo de Conocimiento CC1 CC2 CC2 CC1 CC3 CC1 CC1 CC3 CC2 CC3
Contexto de Evaluación CE1 CE2 CE1 CE1 CE2 CE2 CE1 CE2 CE1 CE2
Operación Cognitiva OC1 OC2 OC1 OC1 OC1 OC2 OC3 OC3 OC2 OC3
Tipo de Conocimiento TC1 TC2 TC2 TC1 TC2 TC3 TC3 TC1 TC1 TC3
Ítem 2 5 3 1 4 9 10 7 6 8
Respuesta Correcta D B D A C A D C B A
Sujetos Suma
7 D B D A C A D A B D 8
8 D B D A C A D C D C 8
1 D B D A C D C A C B 5
3 D B C B C C D C C C 5
5 D B D C C B A A D C 4
ANÁLISIS DE REACTIVOS 223
6 D B D B D A B A A D 4
9 D B D A A C A B C D 4
10 D B D A A B A B C B 4
2 D A A A A A A A D C 3
4 D B D B B C A D A C 3
Suma 10 9 8 6 5 4 3 2 1 0 48
Tabla 5
Base-4: Resultados ordenados de mayor a menor número de aciertos
en el formato del ítem
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO4 FO4 FO5 FO5
Campo de Conocimiento CC1 CC1 CC2 CC3 CC2 CC2 CC3 CC3 CC1 CC1
Contexto de Evaluación CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Operación Cognitiva OC1 OC1 OC1 OC1 OC2 OC2 OC3 OC3 OC2 OC3
Tipo de Conocimiento TC1 TC1 TC2 TC2 TC2 TC1 TC1 TC3 TC3 TC3
Ítem 1 2 3 4 5 6 7 8 9 10
Respuesta Correcta A D D C B B C A A D
Sujetos Suma
1 A D D C B C A B D C 5
2 A D A A A D A C A A 3
3 B D C C B C C C C D 5
4 B D D B B A D C C A 3
5 C D D C B D A C B A 4
224 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
6 B D D D B A A D A B 4
7 A D D C B B A D A D 8
8 A D D C B D C C A D 8
9 A D D A B C B D C A 4
10 A D D A B C B B B A 4
Suma 6 10 8 5 9 1 2 0 4 3 48
Aciertos 16 13 10 2 7
Proporción FO1 0.33 FO2 0.27 FO3 0.21 FO4 0.04 FO5 0.15
Otro dato útil es establecer cuál tipo de formato, de los cinco disponi-
bles, tuvo más aciertos, es decir, influyó en que el reactivo fuera más o
menos difícil. Como se ve en la base, dos reactivos, uno con dificultad
cercana a la media y el otro, con cero dificultad, se asociaron al formato
1 (simple), representando el 33% de los aciertos y el formato 2 (ordena-
miento), con dificultades no extremas, aporta el 27 %. El formato 3
(apareamiento) agrupa reactivos con valores extremos, uno con 9 acier-
tos y el otro con 1; el formato 4 (canevá) se asocia con dos reactivos de
muy alta dificultad (el 7 y el 8) y el formato 5 (falso-verdadero múltiple)
con reactivos de dificultad alta. ¿Puede concluirse que el formato de los
reactivos afecta el desempeño de los sujetos? ¿Los resultados pueden
ser explicados con algún fundamento teórico?
Tabla 6
Base-5: Resultados ordenados de mayor a menor número de aciertos
en el campo de conocimiento. Banco de Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 2 2 1 1 1 1 2 2
Tema 2 2 1 1 2 2 2 2 1 1
Subtema 1 1 2 2 1 1 1 1 1 2
Formato FO1 FO1 FO5 FO5 FO2 FO3 FO3 FO2 FO4 FO4
Campo de Conocimiento CC1 CC1 CC1 CC1 CC2 CC2 CC2 CC3 CC3 CC3
Contexto de Evaluación CE1 CE1 CE2 CE1 CE1 CE2 CE1 CE2 CE2 CE2
Operación Cognitiva OC1 OC1 OC2 OC3 OC1 OC2 OC2 OC1 OC3 OC3
Tipo de Conocimiento TC1 TC1 TC3 TC3 TC2 TC2 TC1 TC2 TC1 TC3
Ítem 1 2 9 10 3 5 6 4 7 8
Respuesta Correcta A D A D D B B C C A
Sujetos Suma
1 A D D C D B C C A B 5
2 A D A A A A D A A C 3
3 B D C D C B C C C C 5
4 B D C A D B A B D C 3
5 C D B A D B D C A C 4
ANÁLISIS DE REACTIVOS 225
6 B D A B D B A D A D 4
7 A D A D D B B C A D 8
8 A D A D D B D C C C 8
9 A D C A D B C A B D 4
10 A D B A D B C A B B 4
Suma 6 10 4 3 8 9 1 5 2 0 48
Aciertos 23 18 7
Proporción CC1 0.48 CC2 0.38 CC3 0.15
Tabla 7
Base-6: Resultados ordenados de mayor a menor número de aciertos
en el contexto de evaluación
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 2 1 1 2 2 2
Tema 2 2 2 2 1 2 2 1 1 1
Subtema 1 1 1 1 2 1 1 1 2 2
Formato FO1 FO1 FO2 FO3 FO5 FO2 FO3 FO4 FO4 FO5
Campo de Conocimiento CC1 CC1 CC2 CC2 CC1 CC3 CC2 CC3 CC3 CC1
Contexto de Evaluación CE1 CE1 CE1 CE1 CE1 CE2 CE2 CE2 CE2 CE2
Operación Cognitiva OC1 OC1 OC1 OC2 OC3 OC1 OC2 OC3 OC3 OC2
Tipo de Conocimiento TC1 TC1 TC2 TC1 TC3 TC2 TC2 TC1 TC3 TC3
Ítem 1 2 3 6 10 4 5 7 8 9
Respuesta Correcta A D D B D C B C A A
Sujetos Suma
1 A D D C C C B A B D 5
2 A D A D A A A A C A 3
3 B D C C D C B C C C 5
4 B D D A A B B D C C 3
5 C D D D A C B A C B 4
6 B D D A B D B A D A 4
7 A D D B D C B A D A 8
8 A D D D D C B C C A 8
9 A D D C A A B B D C 4
10 A D D C A A B B B B 4
Suma 6 10 8 1 3 5 9 2 0 4 48
Aciertos 28 20
Proporción CE1 0.58 CE2 0.42
226 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Tabla 8
Base 7: Resultados ordenados de mayor a menor número de aciertos
en la operación cognoscitiva
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 2 1 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO5 FO4 FO4 FO5
Campo de Conocimiento CC1 CC1 CC2 CC3 CC2 CC2 CC1 CC3 CC3 CC1
Contexto de Evaluación CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Operación Cognitiva OC1 OC1 OC1 OC1 OC2 OC2 OC2 OC3 OC3 OC3
Tipo de Conocimiento TC1 TC1 TC2 TC2 TC2 TC1 TC3 TC1 TC3 TC3
Ítem 1 2 3 4 5 6 9 7 8 10
Respuesta Correcta A D D C B B A C A D
Sujetos Suma
1 A D D C B C D A B C 5
2 A D A A A D A A C A 3
3 B D C C B C C C C D 5
4 B D D B B A C D C A 3
5 C D D C B D B A C A 4
6 B D D D B A A A D B 4
7 A D D C B B A A D D 8
8 A D D C B D A C C D 8
9 A D D A B C C B D A 4
10 A D D A B C B B B A 4
Suma 6 10 8 5 9 1 4 2 0 3 48
Aciertos 29 14 5
Proporción OC1 0.60 OC2 0.29 0C3 0.10
Tabla 9
Base-8: Resultados ordenados de mayor a menor número de aciertos
en el tipo de conocimiento
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 2 1 1 1 2 2 2
Tema 2 2 2 1 2 2 2 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO3 FO4 FO2 FO2 FO3 FO4 FO5 FO5
Campo de Conocimiento CC1 CC1 CC2 CC3 CC2 CC3 CC2 CC3 CC1 CC1
Contexto de Evaluación CE1 CE1 CE1 CE2 CE1 CE2 CE2 CE2 CE2 CE1
Operación Cognitiva OC1 OC1 OC2 OC3 OC1 OC1 OC2 OC3 OC2 OC3
Tipo de Conocimiento TC1 TC1 TC1 TC1 TC2 TC2 TC2 TC3 TC3 TC3
Ítem 1 2 6 7 3 4 5 8 9 10
Respuesta Correcta A D B C D C B A A D
Sujetos Suma
1 A D C A D C B B D C 5
2 A D D A A A A C A A 3
3 B D C C C C B C C D 5
4 B D A D D B B C C A 3
5 C D D A D C B C B A 4
6 B D A A D D B D A B 4
7 A D B A D C B D A D 8
8 A D D C D C B C A D 8
9 A D C B D A B D C A 4
10 A D C B D A B B B A 4
Suma 6 10 1 2 8 5 9 0 4 3 48
Aciertos 19 22 7
Proporción TC1 0.40 TC2 0.45 TC3 0.15
Este ejemplo puede extenderse para dar cuenta, por ejemplo, de cómo
influyeron en los resultados las unidades, temas y subtemas examina-
dos. Así, puede notarse que en la unidad 1 se agruparon casi todos los
reactivos con menor dificultad, pero la excepción que marca el reactivo
6, en que hubo 1 acierto sobre 10 posibles, confirma algo que suele ocu-
rrir sin que se le preste mucha atención: los ítems que exploran la mis-
ma unidad o el mismo tema no necesariamente tienen el mismo grado
de dificultad.
Para este análisis la base de datos que sirva de fuente es muy similar a la
usada en el ejemplo anterior: en un arreglo de columnas y renglones se
identifica el número de reactivos que componen la prueba, el número de
opciones para responder, la clave de respuestas correctas y las respues-
tas de los sujetos.
Tabla 10
Ejemplo de base de datos de 10 reactivos con cuatro opciones
de respuesta, aplicados a 10 sujetos
ADDCBBCAAD
01ADDCBCABDC
02ADAAADACAA
03BDCCBCCCCD
04BDDBBADCCA
05CDDCBDACBA
06BDDDBAADAB
07ADDCBBADAD
08ADDCBDCCAD
09ADDABCBDCA
10ADDABCBBBA
Tabla 11
Análisis efectuado con ITEMAN
Tabla 12
Información de la escala empleada
Scale: 0
-------
Type of Scale DICHOT
N of Items 10
N of Examinees 10
ANÁLISIS DE REACTIVOS 231
Tabla 13
Tipo de correlación para obtener el coeficiente de asociación, entre la
respuesta al ítem y la respuesta a toda la prueba.
Tabla 14
Ejemplo de salida del reactivo 1
Tabla 15
Análisis del comportamiento de los reactivos 2 al 10
Prop. Disc. Point Prop. Endorsing Point
No. Correct Index Biser. Alt. Total Low High Biser. Key
---- ------- ------ ------ ----- ----- ---- ---- ------ --
2 1.00 .00 A .00 .00 .00
B .00 .00 .00
C .00 .00 .00
D 1.00 1.00 1.00 *
Other .00 .00 .00
3 .80 .25 .23 A .10 .50 .00 -.35
B .00 .00 .00
C .10 .00 .25 .04
D .80 .50 .75 .23 *
Other .00 .00 .00
4 .50 1.00 .70 A .30 .50 .00 -.43
B .10 .50 .00 -.35
C .50 .00 1.00 .70 *
D .10 .00 .00 -.15
Other .00 .00 .00
5 .90 .50 .35 A .10 .50 .00 -.35
B .90 .50 1.00 .35 *
C .00 .00 .00
D .00 .00 .00
Other .00 .00 .00
Otro caso interesante es el del reactivo 6, con sólo un acierto, por lo que
su grado de dificultad .10 es muy alto. No obstante, su nivel de discrimi-
nación es positivo y aceptable (.25) y el valor de la correlación alto y po-
sitivo (62). Este reactivo puso a prueba a todo el grupo, pero se encuen-
tra en un rango en que tanto los sujetos del grupo alto, como del bajo,
fallan al responder, por lo que no es apropiado. El reactivo 5 fue contes-
tado acertadamente por el 90 % del grupo, la discriminación es muy al-
ta, al igual que el valor de la correlación. Ocurre algo similar al caso del
234 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Los demás reactivos (3, 7, 9 y 10) tienen valores de dificultad entre .20
y .80, que son rangos estables al ser menos extremos. No obstante, sus
discriminaciones son sensibles al valor de la dificultad: el reactivo 3 tie-
ne discriminación de .25 con dificultad de .80; el 7 tiene discriminación
de .50 con dificultad de .20; el reactivo 9 tiene discriminación de 0 con
dificultad de .40 y el reactivo 10 tienen discriminación de .75 con dificul-
tad de .30. En todos los casos hay una buena correlación biserial
ítem-prueba.
Tabla 16
Principales valores estadísticos de la prueba
Scale Statistics
1. N of Items 10
2. N of Examinees 10
3. Mean 4.800
4. Variance 2.960
5. Std. Dev. 1.720
6. Minimum 3.000
7. Maximum 8.000
8. Median 4.000
9. Alpha 0.571
10. Mean P 0.480
11. Mean Item-Tot. 0.508
12. Max Score (Low) 3
13. N (Low Group 2
14. Min Score (High) 5
15. N (High Group) 4
Tabla 17
Base: Indicadores actualizados con los parámetros TRP. Banco de
Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO4 FO4 FO5 FO5
Cam Conoc. CC1 CC1 CC2 CC3 CC2 CC2 CC3 CC3 CC1 CC1
Contexto Ev CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Operac Cog. OC1 OC1 OC1 OC1 OC2 OC2 OC3 OC3 OC2 OC3
Tipo Conoc. TC1 TC1 TC2 TC2 TC2 TC1 TC1 TC3 TC3 TC3
Ítem 1 2 3 4 5 6 7 8 9 10
Índice Dificultad .60 1.0 .80 .50 .90 .10 .20 .00 .40 .30
Discriminación .25 .00 .25 1.0 .50 .25 .50 .00 .00 .75
Correlación .38 -- .23 .70 .35 .62 .49 -- .45 .84
Resp Correc. A D D C B B C A A D
Sujetos Suma
1 A D D C B C A B D C 5
2 A D A A A D A C A A 3
3 B D C C B C C C C D 5
4 B D D B B A D C C A 3
5 C D D C B D A C B A 4
6 B D D D B A A D A B 4
7 A D D C B B A D A D 8
8 A D D C B D C C A D 8
9 A D D A B C B D C A 4
10 A D D A B C B B B A 4
Suma 6 10 8 5 9 1 2 0 4 3 48
238 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Por ello, podría ser más útil y recomendable su empleo, cuando se dis-
ponga de dos o más versiones de examen y cuando los instrumentos se
apliquen a gran escala y en poblaciones diferentes.
Tabla 18
Ejemplo de encabezado de análisis RASCAL
Tabla 19
Parámetros finales de ajuste de los reactivos
Std. Scale
Item Difficulty Chi Sq. df
Error dDiff
1 -0.950 0.735 0.400 1 91
2 --Deleted--
3 -2.140 0.846 3.223 1 81
4 -0.404 0.749 1.723 1 96
5 -3.038 1.092 0.115 1 72
6 3.402 1.276 0.069 1 131
7 1.994 1.115 0.321 1 118
8 --Deleted--
9 0.195 0.808 1.349 1 102
10 0.942 0.933 1.177 1 109
En este arreglo se observa que dos reactivos fueron excluidos del análi-
sis, el 2 (que obtuvo 100% de aciertos) y el 8 (que obtuvo 0 aciertos),
porque, como ya se explicó en la estrategia TRP, no tienen variabilidad y
240 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Tabla 20
Equivalencia entre número de aciertos y habilidad requerida en los sujetos
Tabla 21
Resultados de la medición
Tabla 22
Base: Indicadores actualizados con los parámetros TRI. Banco de
Reactivos de Matemáticas
Asignatura MA MA MA MA MA MA MA MA MA MA
Unidad 1 1 1 1 1 1 2 2 2 2
Tema 2 2 2 2 2 2 1 1 1 1
Subtema 1 1 1 1 1 1 1 2 2 2
Formato FO1 FO1 FO2 FO2 FO3 FO3 FO4 FO4 FO5 FO5
Campo de
CC1 CC1 CC2 CC3 CC2 CC2 CC3 CC3 CC1 CC1
Conocimiento
Contexto de
CE1 CE1 CE1 CE2 CE2 CE1 CE2 CE2 CE2 CE1
Evaluación
Operación
OC1 OC1 OC1 OC1 OC2 OC2 OC3 OC3 OC2 OC3
Cognitiva
Tipo de
TC1 TC1 TC2 TC2 TC2 TC1 TC1 TC3 TC3 TC3
Conocimiento
ANÁLISIS DE REACTIVOS 243
Ítem 1 2 3 4 5 6 7 8 9 10
Índice
.60 1.0 .80 .50 .90 .10 .20 .00 .40 .30
Dificultad
Discriminación .25 .00 .25 1.0 .50 .25 .50 .00 .00 .75
Correlación .38 -- .23 .70 .35 .62 .49 -- .45 .84
Dificul. TRI -0.950 -- -2.140 -0.404 -3.038 3.402 1.994 -- 0.195 0.942
Error Medición 0.735 -- 0.846 0.749 1.092 1.276 1.115 -- 0.808 0.942
Respuesta
A D D C B B C A A D
Correcta
Sujetos Suma
1 A D D C B C A B D C 5
2 A D A A A D A C A A 3
3 B D C C B C C C C D 5
4 B D D B B A D C C A 3
5 C D D C B D A C B A 4
6 B D D D B A A D A B 4
7 A D D C B B A D A D 8
8 A D D C B D C C A D 8
9 A D D A B C B D C A 4
10 A D D A B C B B B A 4
Suma 6 10 8 5 9 1 2 0 4 3 48
Conclusiones
Referencias
Aiken, L. R. (1996). Tests Psicológicos y Evaluación. (8a. ed.). México:
Prentice-Hall.
Anastasi, A. (1966). Tests Psicológicos. Madrid: Aguilar.
Castañeda, S., González, D., López, M., García-Jurado, R., Ortega, I.,
Pineda, L., Bazán, A. y Sánchez, B. (2004). Validez apriorística y
empírica de constructos. Modelamiento estructural de porciones
extensas de exámenes objetivos a gran escala. Revista Latina de
Pensamiento. Lenguaje y Neuropsicología 12(2), 183-198.
Castañeda, S. & López, M. (1999). Elaboración de un instrumento para
la medición de conocimientos y habilidades en estudiantes de Psico-
logía. Revista Intercontinental de Psicología y Educación 1, 9-15.
Embretson, S. E. (1983). Construct validity: Construct representation
versus nomothetic span. Psychological Bulletin, 93, 179 - 197.
Embretson S. E. (1985). Introduction to the problem of test design. En
S. E. Embretson (Ed.), Test Design. Developments in Psychology
and Psychometrics. (pp. 3-17). Orlando, FL: Academic Press.
ITEMAN. (1993). Conventional Item Analysis Program. (Versión 3.5).
St. Paul, MN: Assessment Systems Corp.
López, O. M. (2004, septiembre) Análisis de Ítems. Material presentado
en el Taller de calibración de Reactivos. XII Congreso Mexicano de
Psicología. México: Campeche, Camp.
Microsoft. (2000). EXCEL. (Versión 2000). EE. UU.: Microsoft Corp.
Nunnally, J.C. (1987). Teoría Psicométrica. México: Trillas.
RASCAL. (1992). Rasch Analysis Program. (Versión 3.5). (St. Paul, MN:
Assessment Systems Corp.
ANÁLISIS DE REACTIVOS 245
Calificar debe ser algo más que sólo asignar una letra o número. En
tanto mejoremos las prácticas de calificar se podrán mejorar la con-
fiabilidad y validez de una calificación y, más importante aún, se po-
drá potenciar la docencia y el aprendizaje del estudiante. Calificar es
una parte integral del proceso de enseñanza y debe entretejerse en el
curso, cuidadosamente planeada para que sea confiable, válida, apro-
piada y significativa, tanto para los estudiantes como para los profe-
sores.
MEDIA
NA S B MB
NA S B NA
Tabla 1
Equivalencias entre estaninas, rango percentilar y calificaciones.
Estaninas 1 2 3 4 5 6 7 8 9
Rango Inferior 4a 11a 23a 40a 60a 77a 89a Arriba
percentilar a4 10 22 39 59 76 88 95 de 95
Calificaciones 4 5 6 7 8 9 10
254 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
e) Un aspecto básico que no debe ser pasado por alto por los docentes
refiere a planear compromisos temporales realistas y apropiados.
Tabla 2
Procedimiento para diseñar la asignación de calificaciones.
a) Pruebas de aula. Son las que utiliza el profesorado para calificar y/o
evaluar el aprendizaje de los estudiantes. Se refieren a componentes
netamente curriculares (matemáticas, geografía.). El énfasis en su
desarrollo se sitúa en la representatividad del contenido del examen
respecto al programa educativo. Pueden darse con una doble finali-
dad: formativa y/o sumativa. El estándar, en este caso, surge nece-
sariamente de elementos de juicio que sintetizan los elementos que
se consideran una muestra relevante del programa, y constituyen un
indicador acerca de las competencias alcanzadas por los alumnos.
b) Pruebas diagnósticas. Son aquellas dirigidas a establecer un diagnós-
tico y/o explicación de la situación educativa de una persona, con la
finalidad de identificar componentes para su mejora. El estándar, en
estos casos, toma como punto de partida el comportamiento norma-
tivo, por lo que se toma como referencia la curva normal. De esta for-
ma, el énfasis se sitúa más que en los elementos de validación, en el
ajuste al modelo de medida (fiabilidad).
c) Pruebas de certificación y/o admisión. Tienen por objeto certificar la
competencia adquirida por una persona en un programa, o comprobar
las competencias necesarias para su admisión. Las pruebas recogen
en estos casos los elementos que se consideran relevantes en cuanto a
competencias adquiridas (certificación) o previas (admisión). El están-
258 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
tras que cuando se quiere saber qué tan buena o mala es una puntua-
ción obtenida se requiere de un continuo cualitativo. En términos gene-
rales, el continuo se constituye de una escala que es una escalera con
una serie de peldaños crecientes que indican un incremento de la canti-
dad de la cualidad medida. En educación, para obtenerla se determina
por medio de jueces con base en una muestra de ejecuciones, por ejem-
plo una rúbrica que determina rangos.
Los patrones de respuesta se pueden ver alterados por objetivos que va-
loran conocimiento específico que pueden presentar un grado de dificul-
tad, pero que no necesariamente dependen de los demás objetivos que
constituyen el examen.
El tercer lugar, el reactivo tiene que diferenciar entre los alumnos que
tienen un desempeño alto de los que lo tienen pobre, es decir el reactivo
debe tener la facultad de discriminar (Anderson, 2003) y que las pun-
tuaciones del reactivo tengan una alta relación con las puntuaciones de
la prueba (Jornet, 2002).
En cuarto lugar, los reactivos deben ser contestados como una tarea in-
dependiente de las otras, sin embargo debe complementar la informa-
ción que proveen otros reactivos sobre el desempeño del respondiente,
es decir, la respuesta a un reactivo debe correlacionar con la de otro
reactivo.
CALIFICANDO, INTERPRETANDO Y REALIMENTANDO 261
AL APRENDIZAJE
Los últimos dos criterios son los que predeterminan la distribución de las
pruebas comerciales de referencia a la norma y por ende su forma de in-
terpretar los resultados.
Como se puede apreciar en la figura 3 hay una relación clara entre rango
percentilar y las estaninas. Si el 4% de los estudiantes están por abajo
del 4% de la población, el alumno que se ubique en esta estanina podría
1
Valor del recorrido de una variable, bajo el cual se encuentra una proporción determina-
da de la población. Es un valor tal que supera un determinado porcentaje de los miem-
bros de la población, por ejemplo, un alumno con 99 significaría que el 99% de la
población de referencia está por debajo de él.
262 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
miento del alumno; este margen suele ser equivalente al 10% o 20%
de la puntuación total.
2. Obtener la puntuación correspondiente a cada alumno.
3. Comparar la puntuación con el límite establecido. Para decidir si el
alumno en cuestión esta o no en condiciones de tomar el curso, los
resultados de cada tipo de prueba deben interpretarse de manera
contraria: en el caso de los requisitos mínimos de un curso desarrolla-
do, la puntuación del alumno debe estar por encima del límite de lo
establecido; en el caso de los objetivos del curso siguiente, la puntua-
ción debe estar por debajo.
4. Emitir el dictamen correspondiente.
l Ha mejorado considerablemente en …
l Podría beneficiarse de …
l Requiere ayuda en …
l Necesita reforzar …
Las palabras que se sugiere evitar son: “siempre”, “nunca”, “no puede o
es incapaz de …” y “el no va ha …” porque denotan la inhabilidad del eva-
266 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
De esta manera, el docente puede diseñar protocolos para que los estu-
diantes reciban realimentación adecuada sobre su ejecución. En un co-
mienzo, les ayuda a identificar el nivel de sus conocimientos y habilida-
des actuales, durante las clases diseña oportunidades frecuentes para
que el estudiante ejecute y reciba las sugerencias de cómo pueden me-
jorar. En términos generales, los protocolos brindan oportunidades al
estudiante para reflexionar acerca de lo que ha aprendido, de lo que to-
davía no aprende y de cómo evaluarse. Así, la corrección de errores y el
conocimiento de resultados son diseñados de tal manera que satisfa-
gan: a) ser frecuentes y b) elaborarse sobre pequeños, pero significati-
vos trozos del curso, para que sean útiles, es decir, para que la reali-
mentación sea específica y a tiempo.
Dado que la evaluación debe ser informativa para que cumpla su fun-
ción, la realimentación necesita informarle al estudiante, exactamente,
qué es lo que pudo hacer para hacerlo bien (opciones de acción), más
que decirle que fue lo que hizo mal (esto puede ser desmotivante y afec-
tar su valoración de auto eficacia ante la tarea en cuestión).
estudiantes, dado que su valor real descansa en el hecho de que los mis-
mos estudiantes puedan supervisarse a sí mismos y mejorar la calidad
de su compromiso para lograrlo. Así, la realimentación se constituye en
un importante artefacto para involucrar al estudiante en la evaluación
para el aprendizaje. Ayuda al docente a entender cómo es que la evalua-
ción para el aprendizaje debe ligarse con la motivación de aprender.
Referencias
Aguilar, E. & Zaragoza, S (2002) La evaluación normativa a través de
exámenes colegiados y de solvencia académica en el nivel medio
superior de la Universidad Autónoma del Estado de Morelos. En
CENEVAL (Ed.), Quinto Foro de Evaluación Educativa, (pp. 19-25).
Ensenada, Baja California, México: CENEVAL, A. C.
Anderson, L. W. (2003). Classroom Assessment. Enhacing the Quality of
Teacher Decision Making. New Jersey: Lawrence Erlbaum Associates.
Baumgartner, T. A., Jackson, A. S., Mahar, M. T., & Rowe, A. (2003).
Measurement for evaluation in physical education and exercise
science (7a ed.). Dubuque, IA: McGraw-Hill.
Dalziel, J. (1998). Using marks to assess student performance: Some
problems and alternatives. Assessment and Evaluation in Higher
Education, 23, 351–366.
268 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Hensley, L. D., & East, W. B. (1989). Testing and grading in the psycho-
motor domain. En M. J. Safrit & T. M. Wood (Eds.), Measurement
concepts in physical education and exercise science (pp. 297–321).
Champaign, IL, EE.UU.: Human Kinetics.
Jornet, J. (2002). Evaluación referida a criterio. (Disponible por el Cen-
tro Nacional de Evaluación Superior). D. F., México: CENEVAL, A. C.
Jornet, J. & Perales, M. (2002). La interpretación de puntuaciones en las
pruebas de rendimiento: elementos metodológicos en el desarrollo
de estándares. En CENEVAL, Quinto Foro de Evaluación Educativa,
Ensenada, Baja California 2002 (pp. 195-204). D. F., México:
CENEVAL, A. C.
Jornet, J., Suárez, J. & Perales, M. (2002). Evaluación referida al crite-
rio: componentes metodológicos para la elaboración de pruebas de
aula. Tantak, 27, 7-52.
Lacy, A. C., & Hastad, D. N. (2003). Measurement in physical education
and exercise science (4a. ed.). New York: Benjamin Cummings.
Livas, I. (2006). Análisis e Interpretación de los Resultados de la Eva-
luación Educativa. Recuperado el 23 de marzo de 2006 de la fuente
http://www.universidadabierta.edu.mx/SerEst/Apuntes/Ma-
cias_joseeduardoe-Analisis_Interpr_Eva_Edu.htm
McKeachie, W.J. (1999). Teaching tips: Strategies, research, and theory
for college and university teachers (10a. ed.). Boston: Houghton
Mifflin.
Phye, G. (1997) Handbook of Classroom Assessment. Learning, achie-
vement, and adjustment. San Diego, CA.: Academic Press.
Walvoord, B. E., & Anderson, V. J. (1998). Effective grading; A tool for
learning and assessment. San Francisco, CA.: Jossey-Bass.
Zlokovich, M. S. (2001). Grading for Optimal Student Learning. APS
Observer, Vol. 14 (1). Recuperado el 30 de mayo de 2006 de la
fuente http://www.psychologicalscience.org/tea-
ching/tips/tips_0101.cfm
Zorrilla, M. (2004, noviembre). Comunicación, medición e impacto de
los resultados de evaluación. Seminario internacional Estándares y
evaluación de aprendizajes: Avances y retos en América Latina y el
Perú, Lima, Perú.
Sección IV
Guías para elaborar ítems
objetivos
Capítulo 11 ?
Guía General de
Elaboración de Reactivos
Sandra Castañeda, Miguel López,
Raquel García y Rosa Elsa González
Universidad Nacional Autónoma de México, México
Salvador Ruiz de Chávez
Consultores en Educación, México
272 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
ÍNDICE
Presentación
I. GUÍA GENERAL
1. Nociones.
2. Formatos de respuesta más frecuentes.
3. Fuentes de contenido: Formato.
A. Formato simple.
B. Ordenamiento.
C. Apareamiento.
D. Canevá.
E. Falso-verdadero múltiple.
F. Reactivo dependiente de contexto.
4. Fuente de contenido: Operación cognitiva
A. Comprender y organizar lo aprendido.
a. Identificación.
b. Clasificación.
c. Ordenamiento.
d. Organización jerárquica.
B. Aplicar conceptos, principios y procedimientos.
a) Traducción.
b) Aplicación de conceptos y principios.
c) Inferencia.
d) Presuposiciones.
e) Aplicación de procedimientos.
C. Resolver problemas.
a) Planificación de acciones
b) Corrección de errores.
5. Fuente de contenido: Campo de conocimiento.
A. Teórico.
B. Técnico.
C. Combinado.
6. Fuente: Contexto del reactivo.
A. Ejemplo – Regla (E-R)
B. Regla – Ejemplo (R-E)
C. Caso Ejemplo – Regla (CE-R)
D. Caso Regla – Ejemplo (CR-E)
7. Recomendaciones generales para elaborar ítems.
II. GUÍA ESPECÍFICA DE CONTADURÍA
III. GUÍA ESPECÍFICA DE PEDAGOGÍA
IV. GUÍA ESPECÍFICA DE PSICOLOGÍA
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 273
Debido a la amplitud del tema, esta sección fue dividida en dos partes; la
primera consta de una guía general que contiene conceptos y ejemplos
referidos a los reactivos objetivos donde se muestran, de manera gráfi-
ca, componentes fundamentales para elaborar diversos tipos de reacti-
vos, desde los más simples, hasta aquellos utilizados para medir la
capacidad de los examinandos para resolver problemas. En esta sección
se presentan ejemplos tomados de tres dominios: Contaduría, Pedago-
gía y Psicología.
Presentación
INICIO
SALIDA
A
Guía general
1. Nociones
Los exámenes objetivos son instrumentos de uso común y de aplicación
sencilla. Están conformados por reactivos objetivos, es decir, ítems que
no requieren de juicios personales del evaluador o de interpretaciones
para calificar las respuestas sino que, más bien, poseen una clave de
respuesta única, previamente establecida y acordada.
u BASE DEL
REACTIVO
El instructivo que señala el procedimiento para registrar
- desde su origen - una operación se denomina:
u BASE DEL
REACTIVO
El instructivo que señala el procedimiento para registrar
- desde su origen - una operación se denomina:
A. Formato simple
La base del reactivo u consiste en uno o varios enunciados que plantean
la situación a resolver y, enseguida, se presentan las opciones de res-
puesta, de la cuales una es correcta v y las demás son distractores creí-
bles w. Véase el ejemplo siguiente.
v C) un gameto Distractores w
D) una hembra
E) un óvulo
B. Formato de ordenamiento
La base del reactivo u incluye una lista de elementos v que deben ser
ordenados siguiendo alguna regla especificada en las instrucciones w,
también indicadas en la base.
A) 1, 5, 3, 7
Opciones B) 6, 4, 7, 8
x C) 3, 5, 1, 2 y
D) 6, 8, 4, 2
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 279
C. Formato de apareamiento
u Conceptos v Descripción
1. Validez interna a) Variables extrañas, no manipuladas por el
2. Validez externa investigador, que ponen en riesgo la validez
3. Variables extrañas interna
4. Efecto de confusión b) Se denominan así a aquellas variables que los
5. Variables extrañas sistemáticas investigadores deciden no estudiar
6. Variables extrañas asistemáticas c) Es el grado de certidumbre de que la
manipulación de la variable independiente es la
responsable de los cambios observados en la
variable dependiente
d) Varían junto con la variable independiente en
forma consistente y deben controlarse para
evitar efectos de confusión en los resultados del
experimento
e) Se refiere al grado en que los resultados de un
experimento pueden generalizarse a otros
sujetos, escenarios o pruebas
Relacione los pasos de la elaboración de un estudio de casos (columna izquierda) con las
situaciones que ejemplifican el proceso (columna derecha)
u Pasos v Situación
1. Definición del problema a) El grupo debate sobre los ensayos presentados
2. Investigación del hecho o por cada estudiante
análisis del problema b) Los alumnos emprenden una búsqueda de
3. Elaboración del caso por escrito bibliografía especializada del tema
4. Discusión en grupo del caso, a c) El grupo llega al consenso de emplear
través del material elaborado cloroflorurocarbono
d) Los alumnos se interesan en indagar sobre la
destrucción de la capa de Ozono
e) El grupo elabora ensayos que contengan las
hipótesis sobre el tema
Para estudiar el desarrollo psicológico del niño, Jean Piaget definió dos procesos
fundamentales en el ámbito afectivo-social: la autonomía y la descentración. Relacione
cada término con su definición correspondiente:
u Términos v Definición
1. Autonomía a) Proceso por medio del cual se internalizan reglas
2. Descentración b) Proceso que permite al niño ser cada vez menos
dependiente
c) Proceso de autorregulación de la conducta en el grupo
d) Proceso por medio del cual el niño llega a coordinar su
punto de vista con el de los demás
A) 1a, 2c
w
B) 1b, 2d
C) 1c, 2b
D) 1d, 2a
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 281
A) positivista
B) idealista
v
C) funcionalista
D) materialista
Los siguientes reactivos están enumerados del 3 al 4. Son corrientes psicológicas. Léalas
detenidamente y marque en la hoja de respuestas la opción que corresponda al enfoque
filosófico que la sustenta. Cada opción sólo puede ser usada una vez.
u Reactivos
3 Psicología mentalista
4 Psicología conductista
282 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Métodos instruccionales:
A) Pregunta adjunta
B) Organizador avanzado
C) Señalización (títulos, oraciones “tópico”, palabras de énfasis, etc...)
etc.) v
D) Mapa conceptual
Los siguientes reactivos están enumerados del 1 al 7. Son efectos de los métodos
instruccionales citados. Léalos detenidamente y marque en la hoja de respuestas la opción que
corresponda al enfoque filosófico que la sustenta. Cada opción puede ser usada más de una
vez.
u Reactivos
1 Favorece que los estudiantes construyan conexiones externas entre la información que
va a ser aprendida y los conocimientos que poseen previamente. También permite que
se actualicen los conocimientos prerrequisito necesarios para aprender la nueva
información.
6 Hace que la estructura de lo que va a ser aprendido se haga más clara, a pesar de que
NO proveen información substantiva sobre el contenido
7 Favorece que los estudiantes diferencien e integren en una representación espacial los
componentes principales de la estructura conceptual del contenido a ser aprendido.
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 283
Opciones de respuesta
A) El aprendiz
B) El profesor v
C) El currículo
D) Evaluación de resultados de aprendizaje
u Reactivos
2. Debe organizar lo que va a ser enseñado con base en las características del alumno
más que en los contenidos
3 Su actividad debe considerar tanto los procesos requeridos como a los productos a los
que se quiere llegar.
D. Formato de canevá
Base En el ANOVA, cuando la variable independiente (VI) tiene tres o más niveles se
requiere de pruebas ____________para saber cuáles son estadísticamente
u diferentes entre sí.
A) post hoc v
Opciones
B) de medidas repetidas
w C) de control asociativo
D) pre – test
u Base Para que pueda solventar los pagos a través de tarjetas electrónicas o
reactivo 1 cualquier otro medio similar es indispensable que:
Un ejemplo más
Ejemplo de identificación
b) Clasificación
La operación cognitiva le demanda al examinando construir categorías
que pongan de manifiesto su capacidad de trascender la información ini-
cial a clases que no se encuentran presentes, gracias a la utilización de
reglas de inclusión de clase (de tiempo, de función, de temática, etcéte-
ra).
Ejemplo de clasificación
c) Ordenamiento
La operación cognitiva le demanda al examinando construir una organi-
zación que ordena temporalmente, de manera adecuada, la información
evaluada por el ítem.
Ejemplo de ordenamiento
Base Ordene del más antiguo al más nuevo los enfoques psicológicos que se listan
u a continuación. Utilice los números progresivos que identifican a cada uno
de ellos para identificar la ordenación correcta que aparece en una de las
opciones de respuesta.
1. Psicogenético
2. Psicofísica
3. Conductismo
v v
4. Psicología Cognitiva
A) 2, 3, 1, 4
wOpciones B) 1, 2, 3, 4
C) 3, 2, 1, 4
D) 2, 3, 4, 1
d) Organización jerárquica
La operación cognitiva le demanda al examinando organizar jerárquica-
mente los componentes que conforman un concepto complejo, un prin-
cipio, una teoría, un procedimiento, una técnica, etcétera.
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 291
2
Con base en lo anterior, ¿cuál de los diagramas siguientes representa
Pregunta
mejor las relaciones jerárquicas entre las ideas?
u
1
1 6 7
2 3
A) B)
2 3 4 5
8 9 7 4 5 6 9
10
8 10
Opciones 1 7
11 6 7
w C) 8 9 10 D)
2 6
3 4 5 2 3 4 8 9 10
5
292 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
La pregunta deja patente que se les solicita a los alumnos la relación je-
rárquica u entre las ideas que se muestran en la base v, con el fin de
que de que seleccione la respuesta correcta w.
a) Traducción
La operación cognitiva le demanda al examinando comprender los con-
tenidos del ítem, aún cuando éstos sean presentados en palabras dife-
rentes que signifiquen lo mismo a las usadas originalmente, o bien se
muestren mediante imágenes o símbolos que los representen.
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 293
Ejemplo 1 de traducción
Resultados de opinión
40
35
Niñas
30
Fr primaria
25
20 Estudiantes
15
10
5
0
alto poco poco alto acuerdo
desacuerdo desacuerdo acuerdo
Valoración
Opciones
A) Existe diferencia significativa por género antes y después del
matrimonio
v
B) El tiempo influye en la percepción de la satisfacción sexual
C) Existe diferencia significativa en la percepción de la satisfacción
sexual entre las parejas que reciben información sobre sexualidad en
comparación de quienes no reciben
D) Existe diferencia significativa en la percepción de satisfacción sexual
antes y después del matrimonio
Opciones A) Género
B) Calificación en matemáticas
C) Nivel socioeconómico
D) Gusto hacia la escuela
Instrucciones Lea con atención la situación que se describe, donde para efectos de este
reactivo se considera verdadera la información dada. Posteriormente
responda con base en el texto a la pregunta que se le plantea
c) Presuposiciones
d) Aplicación de procedimientos
La operación cognitiva le demanda al examinando aplicar, de manera
adecuada, los pasos requeridos en un procedimiento, algoritmo, técnica
o instrumentación.
298 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A) I, II, III, IV
B) V, III, II, IV
Opciones
C) II, IV, V, I
D) II, V, IV, I
a) Planificación de acciones
Instrucciones Lea el caso que se presenta a continuación y responda las preguntas que
se presentan con relación a él.
Base 2 Con relación al caso anterior ¿qué secuencia de procedimientos sería la más
adecuada?
u 1. Entrevista
2. Aplicación de pruebas psicológicas
3. Sugerencia de tratamiento
4. Diagnóstico
A) 1, 2, 4, 3
Opciones B) 2, 1, 4, 3
C) 4, 1, 2, 3
v
D) 1, 4, 2, 3
Base 3 De acuerdo a los datos del caso, seleccione las pruebas más adecuadas para
su evaluación.
u
A) MMPI, CAT, Kuder
Opciones B) WISC-RM, Bender, Dibujo figura humana
C) WAIS, DFH, Raven
v
D) Raven, MMPI, Bender
A) Paidopsiquiatra
Opciones B) Psiquiatra
v C) Neurólogo
D) Médico General
¿Cómo debe ser tratado el paciente? ¿Cuál es el método, técnica, más adecuado
para [ ]?
¿Cuál es la fundamentación teórica de [ ]?
b) Corrección de errores
La operación cognitiva le demanda al examinando aplicar conceptos,
principios, teorías, métodos, técnicas y procedimientos para identificar y
corregir errores importantes ante casos y problemas, así como para la
argumentación teórica del curso de acción remedial.
PROPUESTA DE ENSEÑANZA v
La propuesta de enseñanza considera tres niveles: el concreto, el representativo y el abstracto.
1. Nivel concreto. Utilizando círculos de cartón cortados en fracciones para representar fracciones
302 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
2. Nivel representativo
A) dibujar las fracciones en papel
B) planear suficiente práctica con incremento del denominador 11/25; 34/48; etcétera.
3. Nivel abstracto
Se muestra el procedimiento completo de resolución para que el alumno lo memorice y
aplique al resolver
Un alumno decide dibujar las operaciones para que su trabajo se vea bonito, tal como se veían los
materiales que el profesor usó con él. Al llegar a la primera multiplicación: ½ por ½ igual a ¼
(ver el dibujo), el niño dice: Profe: esta multiplicación está mal. Da más chico y hemos visto que
la multiplicación es como una suma abreviada y aquí da menos.
X =
½ ½ = ¼
El profesor no supo que hacer y pensó que tal vez el niño tenía razón, aunque confirmó que el
procedimiento era el correcto.
GUÍA GENERAL DE ELABORACIÓN DE REACTIVOS 303
Base 2 Los conceptos de error constructivo y de afectividad son manejados por el psicólogo:
¿Cuál es el riesgo de [.......] para [.......]? ¿Cuál es el método, técnica, más adecuado
¿Una decisión nociva para [paciente, para mejorar/resolver [.......]?
institución, comunidad, etc.) es [.......]? ¿Es coherente [aplicación técnica] con
¿De qué manera [.......] se puede corregir [teoría que se selecciona como marco
[.......]? referencial]?
[Descripción de un error importante en una Una implicación práctica de […teoría,
situación o problema específico] principio, concepto…] es...
Otra manera de clasificar a los ítems tiene que ver con la cualidad de la
información que manejen en cuanto a los campos de conocimiento que
utilicen (Vg., teórico o técnico), como también en cuanto al patrón en el
que presenten la pregunta y soliciten la respuesta (regla – ejemplo o vi-
ceversa, por ejemplo). A continuación de describen ambas fuentes de
contenido y se ilustra con un ejemplar.
A. Teórico
Los reactivos tienen el énfasis en el conocimiento declarativo, que puede
ser de tipo factual (fechas, lugares, nombres propios, fórmulas) o con-
ceptual (conceptos, principios y explicaciones). Los componentes del
reactivo serán los mismos independientemente de la modalidad o for-
mato, la base del reactivo y las opciones de respuesta.
Opciones A) ambiental
v B) estratégico
C) recaudatorio
D) político
B. Técnico
Un reactivo de este campo hace énfasis en conocimientos procedimen-
tales (ejecución de procedimientos, estrategias, métodos y destrezas).
A continuación se presenta un reactivo que solicita la secuencia del pro-
cedimiento u de toma de decisiones, cuya respuesta w se encuentra en
las opciones v.
Base
¿En qué fases se pueden dividir los procesos o fenómenos de toma de
u decisiones?
v
C) Planificar, evaluar y seleccionar las alternativas w
D) Seleccionar, secuenciar y evaluar las alternativas
306 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A) A – B
Opciones
v B) A – B –A
C) A – B – C
D) A – B – A – Bw
C. Combinado
1. de la transferencia w
2. de contra transferencia
Opciones
3. disociativo del alumno
v
4. de la inferencia
Base
La etapa que da inicio al periodo de liquidación, aparte de que la
u empresa aún no concluya las operaciones de finiquito, se denomina:
Opciones A) Disolución
B) Quiebra
v C) Suspensión
D) Terminación
308 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Otro ejemplo
Un ejemplo más
Base
En un diseño de investigación con grupo experimental y control, se pretende
u que en el primero:
Un ejemplo
Otro ejemplo
A) Balanceo
Opciones B) Contrabalanceo
v C) Variación sistemática
D) Mantenimiento constante
Base Se sabe que 12% de las tiendas Roto, S. A. de cierta región del estado
u ofrecen cupones a sus clientes. Con una muestra de 100, encuentre la
probabilidad de las que otorguen cupones estén entre 16 y 18%
Opciones A) 0.0771
v B) 0.0780
C) 0.07982
D) 0.08023
B. Los contenidos del examen deberán asegurar que las inferencias in-
tentadas a partir de los puntajes del examen sean igualmente válidas
para examinados de diferentes grupos. De esta manera, el elabora-
dor de ítems deberá hacer conciencia de que ciertas fuentes de conte-
nido pueden generar errores de medición que afecten los puntajes de
ciertos grupos de examinandos y de otros no. Es necesario que el es-
pecialista identifique qué fuentes de contenido del ítem podrían au-
mentar la dificultad o facilidad en el ítem, en vías de identificar
elementos que, potencialmente, podrían generar varianza irrelevante
de constructo, como podrían ser la complejidad lingüística en el que
él ítem sea elaborado.
A) orden
B) activo
Opciones
C) ingresos
D) pasivo
A) orden
B) activo
Opciones
C) ingresos
D) pasivo
A) financiera
B) de costos
Opciones
C) administrativa
D) de sociedades
Cuando sea posible, la base del reactivo debe redactarse de forma po-
sitiva, Conocer lo verdadero generalmente es más importan te que co-
nocer lo no verdadero. Las frases negativas en reactivos se utilizan
con frecuencia porque es fácil crearlas. Los estados positivos de los
reactivos requieren que el autor elabore tres distractores para cuatro
alternativas de preguntas; pero en el estado negativo el reactivo re-
quiere sólo de una alternativa plausible como respuesta. Observe el
siguiente reactivo.
D. Emplear tér mi nos que den pis tas de la res pues ta co rrec ta. El au -
tor debe te ner la cer te za de que la res pues ta de sea da es co rrec -
ta o cla ra men te la me jor. To das las op cio nes de ben ser
gra ma ti cal men te con sis ten tes con la base y con el for ma to. Las
vio la cio nes a esta regla pue den pro veer pis tas que ayu dan a los
es tu dian tes a des car tar los dis trac to res. Obser ve el si guien te
reac ti vo.
316 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A) auténtica
B) financiera
Opciones
C) comprobatoria
D) contabilizador
A) fuente
B) financiero
Opciones
C) comprobatorio
D) contabilizador (Respuesta correcta)
A) catálogo de cuentas.
B) cheque al portador.
Opciones
C) guía de programas.
D) mapa conceptual.
Los exa minan dos pue den re co no cer una res pues ta co rrec ta al eli-
mi nar, por ob ser va ción, las op cio nes in co rrec tas sin te ner que ana -
li zar a con cien cia to das las op cio nes pre sen ta das. Estas op cio nes se
ge ne ran, con fre cuen cia, cuan do el ela bora dor tie ne di fi cul ta des
para crear otros distrac to res plau si bles y gene ra otro que in te gra o
elimi na a to dos los pre sen ta dos pre via men te. Obser ve el si guien te
ejem plo:
318 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A. Diez años.
B. Tres años.
Opciones
C. Cinco años.
D. Siete años.
GUÍA ESPECÍFICA DE CONTADURÍA 319
A. Diez años.
B. Tres años.
Opciones
C. Cinco años. (Respuesta Correcta)
D. Siete años.
A) Gobernación
B) Hacienda y Crédito Público
Opciones
C) Economía
D) La Función Pública
A) Gobernación
B) Hacienda y Crédito Público (Respuesta correcta)
Opciones
C) La Función Pública
D) Economía
Capítulo 13 ?
Guía específica de Pedagogía
Rosa Elsa González y Raquel García
Universidad Nacional Autónoma de México
A) Situación de aprendizaje.
B) El orden de actividades.
Opciones C) Los recursos didácticos.
D) Método de enseñanza.
A) Situación de aprendizaje.
B) El orden de actividades.
Opciones
C) Los recursos didácticos.
D) Método de enseñanza (Respuesta correcta)
GUÍA ESPECÍFICA DE PEDAGOGÍA 323
A) Rousseau y. Wallon.
B) Ferriére y Comenio.
Opciones
C) Freinet y. Herbart.
D) Bacon.
q Los sus ten tan tes eli mi na rán los dis trac to res que con ten gan
pa la bras como “todo”, “sólo” o “nun ca” por que en mu chas
oca sio nes son fal sas, por lo que se debe evi tar el uso de las
mis mas.
F. Crea ción de dis trac to res plau si bles. Los bue nos reac ti vos de
op ción múl ti ple de pen den de los dis trac to res para su efec ti vi -
dad, por lo que és tos de ben ser acep ta bles con re la ción a la
base del reac ti vo y la res pues ta co rrec ta. Obser ve el ejem plo
si guien te:
A) psicología y sociología.
B) filosofía y sociología.
Opciones
C) sociología y numerología.
D) psicología y didáctica
326 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
A) Teológico.
B) Científico.
Opciones
C) Todas las anteriores.
D) Ninguna de las anteriores.
A) Mágico.
B) Teológico.
Opciones
C) Científico.
D) Humanístico. (Respuesta correcta)
GUÍA ESPECÍFICA DE PEDAGOGÍA 327
A) Mantenimiento constante.
B) Variación sistemática.
Opciones
C) Contrabalanceo.
D) Balanceo.
GUÍA ESPECÍFICA DE PSICOLOGÍA 331
Cuando sea posible, la base del reactivo debe redactarse de forma posi-
tiva, Conocer lo verdadero generalmente es más importante que cono-
cer lo no verdadero. Las frases negativas en reactivos se utilizan con
frecuencia porque es fácil crearlas. Los estados positivos de los reactivos
requieren que el autor elabore tres distractores para cuatro alternativas
de preguntas; pero en el estado negativo el reactivo requiere sólo de
una alternativa plausible como respuesta. Observe el siguiente reactivo.
A) El reflejo condicionado.
B) El estimulo.
Opciones
C) La respuesta.
D) El reforzador.
A) sueños.
B) sexo.
Opciones
C) estructuras psíquicas.
D) inhalación de cocaína.
A) Cabezología.
B) Frentología.
Opciones
C) Frenología.
D) Chipotología.
A) Antropometría.
B) Fisiología.
Opciones
C) Frenología.
D) Neurología. (Respuesta correcta)
334 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Referencias
Castañeda, S. (1993). Procesos Cognitivos y Educación Médica. Serie
Seminarios Institucionales de la Facultad de Medicina. México:
UNAM
Castañeda, S. (1998). Evaluación de resultados de aprendizaje en esce-
narios educativos. Revista Sonorense de Psicología. 12(2): 57- 67.
336 EVALUACIÓN DEL APRENDIZAJE EN EL NIVEL UNIVERSITARIO.
ELABORACIÓN DE EXÁMENES Y REACTIVOS OBJETIVOS
Constructo. Variable medida que tiene lugar dentro de una teoría o es-
quema teórico.
GLOSARIO 339
Formato del reactivo. Estructura del ítem que implica un grado de difi-
cultad adicional al requerido por el conocimiento o habilidad que valora
el reactivo.