FACULTAD DE HUMANIDADES
Y CIENCIAS DE LA EDUCACIN
Construccin de
Instrumentos
SEGUNDA PARTE
Procedimientos
Diferencias entre tests de aptitud y tests de rendimiento..........................................................69
Examen del examen............................................................................................................ 72
El examen por temas............................................................................................................73
Las pruebas de ensayo.........................................................................................................74
Las pruebas de ensayo. Pasos para la construccin ...................................................................76
Mejoramiento de las pruebas de ensayo..................................................................................79
Pruebas de ensayo breve..........................................................................................................81
Items de ensayo breve .............................................................................................................88
Exmenes orales..................................................................................................................90
Principios para conducir exmenes orales...............................................................................95
Anteproyecto para la incorporacin del examen escrito. Facultad de Humanidades....................97
Proyecto para la enseanza de la Ciencia ............................................................................101
Pruebas domiciliarias..........................................................................................................106
Pruebas de libro abierto.......................................................................................................107
Empleo de pruebas por temas y de pruebas objetivas............................................................108
Diferencias y semejanzas entre las pruebas por tema y las pruebas objetivas..........................109
Errores ms frecuentes en la construccin de pruebas...............................................................112
Pasos para construir pruebas de aprovechamiento.....................................................................113
Gua para la construccin de pruebas de aprovechamiento..........................................................114
Como se prepara, aplica y evala un test..................................................................................117
Construccin de pruebas........................................................................................................131
Los objetivos educacionales. Algunas ideas clave......................................................................139
Taxonoma de los objetivos educacionales. Dominio cognitivo.....................................................140
Evaluacin del aprendizaje en las ciencias. Taxonoma.............................................................147
Pruebas de rendimiento. Clasificacin de los tems....................................................................153
Aspectos a evaluar: tems ms apropiados................................................................................154
Pruebas escritas . Clasificacin de tems.................................................................................155
Los tems verdadero-falso............................................................................................. 156
Las respuestas de tipo eleccin mltiple.........................................................................158
Las preguntas de eleccin mltiple...........................................................................................169
Sugerencias para redactar tems de tipo objetivo......................................................................169
Sugerencias para emplear diferentes tipos de tems...................................................................171
Evaluacin de la comprensin de lectura...................................................................................174
Items complejos.....................................................................................................................176
Ejemplos de tems..................................................................................................................179
Ejemplos de tems de respuesta seleccionada..........................................................................184
Evaluacin del aprendizaje en las ciencias................................................................................191
Tipos de Items........................................................................................................................197
Cmo analizar los tems..........................................................................................................203
Criterios para juzgar la calidad de una prueba........................................................................207
Relaciones entre dificultad y discriminacin..............................................................................208
Construccin de pruebas. Presentacin de informe de resultados...............................................210
Glosario de trminos relacionados con medicin .......................................................................211
LA EVALUACIN EDUCATIVA
Autora: Celia Agudo de Crsico
Evaluar es apreciar el valor de algo. En la esfera educativa es tan grande la importancia que
se asigna a la evaluacin, que resulta imposible concebir un sistema que se desenvuelva con
eficacia y que no posea tcnicas y procedimientos de evaluacin y medida, imprescindibles para
estimar los distintos aspectos de la labor educacional, especialmente el grado en que los alumnos,
en todos los aspectos de su conducta, obtienen provecho de la accin educativa.
Todo evaluador comete errores. En lo que concierne a la falibilidad de los juicios valorativos,
las investigaciones psicolgicas han puesto de relieve algunas conclusiones. Por ejemplo, las que
se desprenden del estudio de los juicios emitidos en las escalas de clasificacin. Mientras algunos
jueces son demasiado benvolos o poco crticos, otros son demasiado severos, es decir, que tien-
den a clasificar muy bajo y se ha determinado que los clasificadores son bastante consistentes en
este tipo de errores, ya sea que se clasifiquen a s mismos o que tengan que clasificar a otros
sujetos. Otro error en la relacin clasificador clasificado, es la tendencia a clasificar a un sujeto
de igual modo en todos sus rasgos (comnmente se suele determinar a este tipo de error como
efecto anti-halo). Este error se comete muy a menudo en las calificaciones que los docentes hacen
de sus alumnos.
4
En cuanto a la cuestin de si hay buenos y malos jueces de la naturaleza humana, dicho
de otro modo, si hay una habilidad general para juzgar la personalidad, hay poca evidencia para
creer que existe un factor general que pudiera caracterizarse como habilidad para juzgar a los
otros. Parecera que son distintas las habilidades que se aplican para actuar con precisin en la
autoclasificacin, en la clasificacin de sujetos conocidos, y en la clasificacin de extraos.
Adems, el estudio de las respuestas dadas ante inventarios o cuestionarios de personalidad,
revelan una serie de tendencias tpicas en ciertos sujetos que saturan todas sus respuestas,
como por ejemplo, responder afirmativamente a todos los enunciados socialmente deseables.
La definicin que se dio del trmino medida es muy amplia, pero no se la puede estre-
char sin caer en la exclusin de procesos universales relacionados con las medidas. Si se
acepta dicha definicin, muchos de los que se oponen a la medicin en las ciencias de la
conducta, aparecern utilizando medidas en su trabajo diario. As el maestro que establece tres
categoras de aprovechamiento, a las que llama buena, muy buena y regular, an sin saberlo
est midiendo, utilizando un nivel elemental de medicin, o expresando con mayor vaguedad los
resultados de una medicin previa.
5
La psicologa es la disciplina que ms ha contribuido brindando instrumentos tcnicos
de medida y evaluacin para su uso educativo. En trminos muy generales se admite que el
aporte de la psicologa a la educacin se traduce por: a) aplicar las teoras del aprendizaje a los
programas; b) la Psicometra a mejorar los exmenes y otros instrumentos de evaluacin; y c)
la teora de la personalidad a la prevencin y tratamiento de las inadaptaciones y a los proble-
mas de la educacin de la personalidad y el carcter. (Cattell, R. B.; 1965). Todos estos aportes
consisten no slo en la facilitacin de marcos tericos, sino tambin en tests, escalas, cuestio-
nario, inventarios y dems instrumentos de medida y evaluacin.
En el plano de la educacin formal existen una gran cantidad de funciones que requieren
evaluacin sistemtica. A continuacin mencionaremos algunas de ellas: a) el planeamiento
educativo; b) la ubicacin educativa, ya sea desde el punto de vista de la integracin (educacin
comn) o de la diferenciacin (enseanza diferenciada); c) la orientacin y el consejo; d) La
mejora de la instruccin; e) la mejora de la situacin de aprendizaje; f) la prediccin del xito
escolar o acadmico.
Cabe tambin mencionar a este respecto todos los tipos de agrupamiento de alumnos
que implican alguna forma de clasificacin o seleccin de los mismos promovidos con el pro-
psito de aumentar la eficacia de la enseanza y del aprendizaje:
1.admisin en la escuela.
2.los grados, que son una forma de agrupamiento que se basa en el nivel de rendimiento
de los alumnos y en su ritmo de progreso.
3.la formacin de clases especiales (para disminuidos fsicos o inadaptados sociales o
emocionales).
4.la formacin de clases especiales para aquellos cuya inteligencia estimada es ms
baja que lo considera el nivel mnimo de educabilidad en una clase normal.
5.nios con bajo aprovechamiento en una materia particular (por lo general se forman
grupos temporarios).
6.nios con inteligencia excepcionalmente alta.
7.alumnos con manejo deficiente del idioma local (extranjeros); en pases donde se
produce una gran inmigracin.
8.ubicacin de alumnos en diferentes clases o cursos dentro de una escuela.
Esto puede ocurrir desde el comienzo o despus que los alumnos han seguido un
curso comn por cierto tiempo.
9.recursos para obtener grupos relativamente homogneos a los fines de la instruccin.
Se refiere a la prctica de ensear por separado, dentro de un mismo establecimiento, a
los nios de una misma edad pero con niveles de habilidad diferentes.
10.formacin de clases paralelas: Dentro de cada edad o grado los alumnos pueden
ser divididos en clases, de modo que cada una de ellas contiene alumnos de todos los
niveles de habilidad.
11.planificacin de grupos flexibles (Yates, 1967).
Los modos que asume la evaluacin educativa son muy variados, pues debe aplicarse
a las mltiples variables que es menester considerar para el mejor conocimiento de la conducta del
educando, del proceso del aprendizaje y de la situacin de aprendizaje, donde importa tanto la institu-
6
cin educativa como la interaccin entre los miembros del grupo escolar.
Entre los modos de evaluacin ms empleados por los docentes pueden mencionarse
las composiciones escritas, los exmenes escritos sobre temas, los exmenes orales, las lec-
ciones, las pruebas prcticas, las entrevistas, las notas, las escalas de clasificacin, los tests
diagnsticos, los tests de inteligencia estandarizados, las observaciones, los cuestionarios e
inventarios. En algunos casos los resultados obtenidos de la aplicacin de todos esos medios
de evaluacin se acumulan en un registro o legajo escolar.
Hay tambin tests y cuestionarios que pueden y deben ser aplicados por el maestro,
pero ste deber estar informado, entre otros, de los siguientes aspectos:
1.los objetivos que se propone medir la tcnica utilizada.
2.el tipo de sujetos a quienes puede aplicarse en relacin con la poblacin sobre la que
fue estandarizada.
3.las condiciones de aplicacin (consigna, tiempo, etc.), sin cuya rigurosa observancia
los resultados pierden todo valor.
4.las caractersticas o propiedades mtricas del instrumento, expresadas a travs de
sus coeficientes de validez y confiabilidad y el error estndar, sin lo cual no se puede
estimar la significacin de los puntajes obtenidos.
5.el tipo de escala y las normas son otros de los requisitos para la interpretacin de los
puntajes.
Es necesario sealar, ante todo, el papel destacado que la evaluacin desempea, den-
tro de la concepcin actual de la psicologa del aprendizaje. En efecto, son numerosas las
investigaciones sobre aprendizaje, tanto en situaciones de laboratorio como dentro del aula,
que han permitido verificar el efecto positivo del conocimiento inmediato, por parte del sujeto de
los resultados de su desempeo o feedback en trminos de teora de la informacin. Uno de los
rasgos ms sobresalientes de la instruccin programada, es que la misma se encuentra en una
situacin ventajosa frente al maestro (debido a que ste, por lo general, orienta el aprendizaje
de varios individuos en forma simultnea), para brindar al aprendiz el conocimiento inmediato de
7
la correccin o inexactitud de cada una de sus respuestas, confirmando su comportamiento, en
el primer caso e indicndole cmo corregir el error en el segundo.
A la crtica frecuente contra la frialdad del nmero y su reemplazo por letras o concep-
tos, tales como bueno, distinguido, etc., puede replicarse que la funcin de la letra o palabra no
difiere de la que cumple el nmero, si es que hay una correspondencia unvoca entre la secuen-
cia de letras del alfabeto o de los trminos en la serie de los mismos y cada uno de los
elementos de la serie de dgitos, con la ventaja a favor de estos ltimos de que facilitan las
operaciones.
Otra crtica corriente es que la nota como incentivo puede resultar muy perjudicial, ya
que algunos alumnos estudian y trabajan por ella y no por adquirir conocimientos o habilidades
o destrezas. Si bien esto puede ser cierto en muchos casos, la solucin no est en suprimir la
nota, sino en promover la motivacin intrnseca del aprendizaje, y en favorecer la competencia
del sujeto consigo mismo en lugar de fomentar su rivalidad con los dems.
Un inconveniente muy serio que se presenta cuando se debe recurrir a las notas como datos
para cualquier estudio o investigacin, consiste en que aquellas no significan lo mismo de es-
cuela en escuela, ni de maestro en maestro. Por ejemplo, si en una escuela secundaria se
quieren tomar en cuenta los antecedentes de escolaridad primaria, las notas no sirven ms para
8
una orientacin general, dentro de lmites muy groseros. Para resolver este problema, en ciertos
pases se han ideado procedimientos que aunque laboriosos, permiten equiparar las notas puestas
por todos los maestros de un rea determinada.
Los docentes usan diferentes criterios para asignar notas y varios estudios permiten
suponer que dichas notas son en realidad un ndice que sintetiza ciertas caractersticas de la
relacin docente alumno, y que cuando esa relacin mejora, tambin mejoran las notas, aun-
que el aprovechamiento real (medido por pruebas), no sea distinto.
Entre las crticas que se formulan a los exmenes, figuran las siguientes:
1.dominan y distorsionan la totalidad del programa (en el caso de los exmenes finales
o de seleccin, especialmente).
2.estimulan entre los alumnos el poco saludable espritu competitivo.
3.producen desagrado con todo lo que se asocia a ellos.
9
Las crticas anteriores constituyen un buen punto de partida para tratar de mejorar los
exmenes, dada la necesidad que tienen los educadores de recurrir a ellos. Entre las diversas
medidas que pueden contribuir a dicho mejoramiento, se sealan:
1.considerar las caractersticas del grupo a examinar.
2.formular con claridad los objetivos del examen
3.considerar la forma de examen ms adecuada a tales fines.
4.intentar el muestreo ms amplio y representativo de las informaciones o habilidades
que se desean examinar.
5.al formular las preguntas contar con una anticipacin de las posibles respuestas que
darn los examinados, fijar el margen de libertad que se puede permitir a las mismas, y
de acuerdo con ello elaborar un detallado y preciso esquema de evaluacin, antes de
tomar el examen.
6.no dar un juicio absoluto sobre el valor de cada escrito, sino que una vez calificados
todos los exmenes deben ubicarse en orden de mritos.
Para superar los bajos ndices de validez y confiabilidad apreciados en los escritos tradi-
cionales, se introdujeron en las primeras dcadas de este siglo, las llamadas pruebas objetivas
de evaluacin del aprovechamiento.
Estas se caracterizan porque se construyen sobre la base de una definicin de los obje-
tivos que se persiguen con la enseanza; tratan de hacer un muestreo representativo de aquello
que los alumnos puedan realmente haber aprendido y se expresan en forma de preguntas de
variado tipo, para las cuales hay una sola respuesta correcta. Las pruebas deben su denomina-
cin de objetivas a esta ltima caracterstica de poseer una sola respuesta correcta, lo que
permite un criterio unvoco entre mltiples evaluadores.
A continuacin se sealan y comentan en forma muy escueta, los pasos principales que
deben tenerse en cuenta en la construccin de pruebas objetivas:
10
u solarespuesta correcta. El valor en puntos deber estipularse previendo todas las cir-
cunstancias.
6. Aplicacin: Las medidas que deben residir la administracin de una prueba objetiva,
son similares a las de la toma de cualquier test.
Son muchas las crticas que se han alzado contra las pruebas objetivas, pero la mayo-
ra de ellas incurren en el error comn de achacarles incapacidad para satisfacer una serie de
necesidades, que las mismas pruebas no pretenden cubrir.
Es preciso admitir que an en las pruebas llamadas objetivas hay un grave riesgo de
subjetividad, en el momento de decidir sus contenidos.
Debe advertirse que no hay una solucin perfecta para los delicados problemas que
plantea la evaluacin objetiva del aprovechamiento escolar o acadmico.
Bibliografa
11
FUNDAMENTOS DE LA EVALUACIN
12
sos de pensamiento a partir de la informacin. El conocimiento verbal es una forma de
conocimiento muy potente y peculiarmente humana. La posesin del conocimiento se de-
muestra emplendolo en la resolucin de problemas, toma de decisiones, explicacin, argu-
mentacin y prediccin.
La decisin crtica y el momento ms subjetivo en la construccin de las pruebas tiene lugar
cuando se selecciona el contenido.
Las capacidades aprendidas de alto nivel representan una combinacin compleja de objeti-
vos y contenidos. No es lo mismo inventar que reconocer, evaluar la lectura crtica que
escribir en forma imaginativa.
Si las pruebas demandan conocimiento de trivialidades en lugar de conceptos importantes,
principios fundamentales o procedimientos tiles, entonces fallan como instrumentos vli-
dos. Si proporcionan resultados poco estables porque los problemas son muy pocos, ambi-
guos, muy difciles o muy fciles, entonces tampoco resultan vlidas. Estas fallas son
remediables y no todas inherentes a la forma de la prueba.
El principal propsito de una prueba es diferenciar niveles de aprovechamiento que permitan
derivar juicios comparativos basados en estndares absolutos (grado de dominio) o relativos
(rendimientos inter e intraindividuales). La primera es ms un complemento que un sustitu-
to.
La tarea del evaluador demanda elaborar juicios slidos sobre la utilidad potencial de los
distintos temas de conocimiento.
Toda prueba para la cual los alumnos puedan prepararse eficazmente concentrndose en el
aprendizaje memorista y que, por consiguiente, los estimule a dejar de lado el significado y
la comprensin al estudiar, es una prueba deficiente.
Una medicin es objetiva si puede verificarse mediante otra medicin independiente. La pre-
cisin de la medida no depende de la utilizacin del nmero sino del cuidado con el que se
han delimitado y jerarquizado los atributos medidos.
Todo conocimiento verbal puede expresarse en proposiciones. Una proposicin es un enun-
ciado del que puede decirse si es verdadero o falso.
13
CUATRO TIPOS DE EVALUACIN
Fuente: Stufflebeam. La evaluacin orientada hacia el perfeccionamiento.
Seleccin: Mara del C. Malbrn
Decidir el marco que Seleccionar los re- Llevar a cabo y per- Decidir la continua-
debe ser abarcado, cursos de apoyo, las feccionar la planifi- cin, finalizacin,
Relacin las metas relaciona- estrategias de solu- cacin y los procedi- modificacin o re-
con la das con la satisfac- cin y las planifica- mientos del progra- adaptacin de la
toma de cin de las necesida- ciones de procedi- ma, esto es, efectuar actividad del cambio.
decisio- des o la utilizacin de mientos, esto es, es- un control del proceso. Y presentar un infor-
nes en el las oportunidades y tructurar las activi- Y proporcionar un es- me claro de los efec-
proceso los objetivos relacio- dades de cambio. Y bozo del proceso real tos (deseados y no
de nados con la solucin proporcionar una para utilizarlo ms tar- deseados, positivos
cambio de los problemas, por base para juzgar la de en la interpretacin y negativos).
ejemplo, la planifica- realizacin. de los resultados.
cin de los cambios
necesarios. Y propor-
cionar una base para
juzgar los resultados.
14
Evaluacin del contexto
Puede estar motivada desde dentro de la institucin como una valoracin regular del esta-
do de la institucin o como una respuesta a ciertos sectores que estn insatisfechos con la
labor de la institucin.
Puede estar motivada desde fuera de la institucin como por ejemplo cuando sta reclama
ms fondos. Estos estudios pueden estar dirigidos a reas especficas o amplias (ms usual).
Generalmente ayudan a la renovacin del sistema y a la promocin de un mejor y ms
eficiente servicio, al diagnosticar problemas concretos y modos de perfeccionamiento y co-
municar puntos fuertes y dbiles de la institucin.
Los resultados de la evaluacin del contexto pueden conducir a una decisin acerca de la
introduccin de algn cambio en el sistema. En este caso, el personal del programa debe
clarificar el problema/s que debe/n ser resuelto/s y formular sus objetivos. Luego considerar
si existe alguna estrategia de solucin clara y apropiada, as como fcilmente adaptable a
su situacin.
La evaluacin del contexto persigue identificar las virtudes y defectos de la institucin y
proporcionar una gua para su perfeccionamiento. Los principales objetivos son la valoracin
del estado global del objeto, la identificacin de sus deficiencias, la identificacin de las
virtudes que pueden subsanar esas deficiencias, el diagnstico de los problemas cuya solu-
cin pueda mejorar el estado del objeto y, en general, la caracterizacin del marco en que
se desenvuelve el programa. Tambin est destinada a examinar si las metas y prioridades
existentes estn en consonancia con las necesidades que deben satisfacer. Los resultados
de una evaluacin del contexto deben proporcionar una base slida para el ajuste (o estable-
cimiento) de metas y prioridades y para la designacin de los cambios necesarios.
Evaluacin de entrada
15
el procedimiento y alcanzar el nivel operativo deseado, as como la habilidad suficiente para
su aplicacin. Incluso si un proyecto ha tenido xito, puede determinarse que las condicio-
nes de la institucin han variado y, como consecuencia, dar por terminado el trabajo.
La principal orientacin de una evaluacin de entrada es ayudar a prescribir un programa
mediante el cual se efecten los cambios necesarios. Esto se realiza identificando y exami-
nando crticamente los mtodos potencialmente aplicables. Es una anunciadora del xito, el
fracaso y la eficacia de un cambio.
Esencialmente, una evaluacin de entrada debe identificar y valorar los mtodos aplicables
(incluyendo los que estn operando) y ayudar a explicar y desmenuzar el que se ha esco-
gido. Tambin debe buscar las barreras, las limitaciones y los recursos potencialmente uti-
lizables a tener en cuenta en la activacin del programa.
El propsito global de una evaluacin de entrada es ayudar a los sectores interesados en la
consideracin de estrategias de programa alternativas en el contexto de sus necesidades y
circunstancias ambientales, as como desarrollar un plan que sirva a sus propsitos; otra
funcin importante es ayudar a los clientes a evitar la infructuosa prctica que consiste en
perseguir innovaciones propuestas que fracasarn o utilizarn mal los recursos.
. El propsito es valorar, interpretar y juzgar los logros de un programa. Debe incluir a menudo, una
valoracin de los efectos a largo plazo.
El principal objetivo de una evaluacin del producto es averiguar hasta qu punto el progra
ma ha satisfecho las necesidades del grupo al que pretenda servir. -
16
Debe ocuparse ampliamente de los efectos del programa, incluyendo los efectos deseados
y no deseados, as como los resultados positivos y negativos.
Debe recoger y analizar juicios acerca del xito del programa, procedentes de una amplia
gama de gente relacionada con l. A veces puede hacerse comparando los resultados con
los de otros programas alternativos.
La utilizacin bsica (de un programa) de evaluacin del producto es determinar si un pro-
grama concreto merece prolongarse, repetirse y/o ampliarse a otros mbitos. Tambin debe
proporcionar una gua para modificar el programa con el fin de que mejor sirva a la necesidad
de todos lomiembros interesados y resulte ms efectivo en relacin a su costo.
17
SEMEJANZAS Y DIFERENCIAS ENTRE LA EVALUACIN
DIAGNSTICA, LA SUMATIVA Y LA FORMATIVA
Tipo de evaluacin
18
DIAGNSTICA SUMATIVA (evaluacin FORMATIVA (evalua-
(evaluacin del estado de producto) cin de proceso)
de preparacin para ...)
19
EL DIAGNSTICO PEDAGGICO
Autores: M. D. O. De Araujo
M. C. A. De Crsico, M. Moraschi
Pero al emplear el trmino diagnstico se hace inevitable la relacin con el mbito mdi-
co. Es prcticamente imposible, al pensar en el trmino diagnstico, eludir la asociacin diag-
nstico-mdico. La actividad de diagnosticar ha sido desde hace muchos siglos una caracters-
tica esencial de la labor mdica, un paso inevitable y previo a la puesta en prctica del trata-
miento curativo. Por eso, cuando se trata de diagnosticar en cualquier sector de la actividad
humana, resulta de gran valor heurstico, asomarse al modelo mdico para comprender tareas
que involucra la labor diagnstica. En la preparacin de los futuros mdicos, el diagnstico
ocupa un puesto central; se sostiene que el primer paso hacia un tratamiento exitoso es un
diagnstico correcto. De ah, que la precisin diagnstica sea de capital importancia.
20
3.reflexiona acerca de los hechos determinados y los compara con cuadros que conoce
tericamente y/o por su propia experiencia;
4.piensa en las posibles soluciones;
5.razona acerca de las implicaciones que tienen las soluciones propuestas;
6.compara los hechos reales con las sugerencias propuestas, para determinar si hay
identidad entre los hechos establecidos y las soluciones sugeridas.
De dnde obtiene el mdico los hechos en que se basa para desarrollar este proceso?.De
la anamnesis o historia, del examen psquico y fsico, de las pruebas de laboratorio, de los datos ob-
tenidos del empleo de instrumentos de precisin tales como los rayos X, el electrocardigrafo, el
electroencefalgrafo, etc. La importancia de una historia cuidadosa ha sido reconocida desde los
tiempos ms antiguos; algunos mdicos opinan que la historia contribuye por misma al 50% del
diagnstico correcto, otros elevan el porcentaje al del 75%.
Una vez efectuada esta breve incursin por el territorio ajeno, trataremos de trasladar a
nuestro propio campo, el de la educacin, las palabras y cuanto ellas implican en materia de
acciones y de productos o resultados de las mismas.
Ante todo debemos dilucidar una cuestin fundamental. El diagnstico mdico supone
diferenciar entre diversos estados de enfermedad, es decir que se hace necesario cuando sur-
gen anomalas, cuando la persona sobre quien debe practicarse el diagnstico se halla enferma
y por lo tanto ha dejado algn aspecto de su organismo o psiquismo, de funcionar normalmente
para ubicarse, por exceso o por defecto, en la zona de la patologa.
21
dificultad de aprendizaje, debemos realizar un conjunto de actos que guardan notable paralelis-
mo con los del mdico diagnosticador (anamnesis y exploracin), mediante los que extraemos
de dicho conjunto de actos una serie de datos que nos conducirn a asimilar el trastorno parti-
cular a alguno de los ya descriptos. En sntesis, los procedimientos de diagnstico en sentido
estricto, se realizan en educacin para descubrir lo que falla en el alumno y atenuar o curar ese
trastorno.
En tanto la tarea de reunir los datos acerca del paciente o del aprendiz requieren un
proceso de aguda observacin, para completar la fase descriptiva el razonamiento correcto es
en el anlisis final lo ms importante. Los falsos diagnsticos resultan a menudo no de los
datos falsos, sino de una interpretacin equivocada. Reunir los datos, hacer uso de los ms
importantes, descartar la informacin no pertinente y producir el juicio final, requieren una capa-
cidad mental y profesional de alto nivel.
El diagnstico es por lo tanto, una forma de evaluacin. Como toda evaluacin tiene dos
componentes fundamentales; la descripcin, que puede ser de naturaleza objetiva, caso de
aplicar la medicin, y el juicio de valor que es siempre subjetivo. Ambos componentes mencio-
nados quedan incluidos dentro del diagnstico pedaggico, proceso en el que se describe y
valora algn aspecto de la conducta del alumno. 1
Los dos propsitos fundamentales del diagnstico lo distinguen de otras formas de eva-
luacin. Estos propsitos son los siguientes:
Con frecuencia la instruccin comienza en el mismo punto para todos los miembros de
la clase. Esta prctica supone que todos los alumnos estn en el mismo punto del continuo de
rendimiento, un cero imaginario en trminos de dominio de los objetivos planeados.
Generalmente las clases se forman con alumnos de una gran variedad de antecedentes
educacionales con una falta de uniformidad en sus patrones de rendimiento, as como en la
naturaleza, cantidad y profundidad del estudio independiente. Al aumentar esta heterogeneidad
la varianza respecto de un cero imaginario se incrementa.
Los estudiantes que caen bajo este punto son los que an no han logrado ninguno de los
objetivos planeados o que poseen pocos o ninguno de los contenidos y conductas llamados de
entrada y juzgados como prerrequisitos para el progreso futuro.
22
Uno de los objetivos principales del tipo de diagnstico previo a la instruccin es deter-
minar la posicin del alumno en el continuo imaginario de rendimiento para que pueda ser colo-
cado en la etapa adecuada de la secuencia instruccional. Si este proceso comienza en el mis-
mo punto para todos los alumnos, el resultado puede ser que, aquellos que ya han logrado el
dominio de los objetivos pronto se aburran y desinteresen mientras que los que posean los
prerrequisitos se frustren y desalienten cayendo en el crculo vicioso fracaso-hostilidad-fracaso.
El tipo de diagnstico al que nos estamos refiriendo puede cumplir distintas funciones:
Cualquier agrupacin debe realizarse sobre la base del estudio diagnstico. Thelen en
1967, identific un tipo de agrupamiento que denomin grupos de enseabilidad, para los que
tiene enorme importancia la enseanza compensatoria o mejor llamada enseanza adecua-
da. La enseanza adecuada es el proceso por el cual se determina el status de los alumnos
en un rea de desarrollo y se ajusta la instruccin al status sin segregar a aqullos del grupo
total de la clase.
En los pases donde los procedimientos diagnsticos se estn aplicando en forma siste-
mtica desde hace largos aos, los criterios utilizados para determinar la necesidad de ense-
anza adecuada han sido obtenidos de los resultados del desempeo de los alumnos en prue-
bas normalizadas. Pero cada vez ms se sospecha que los criterios utilizados se basan en
supuestos no siempre vlidos. Se recomendaba enseanza compensatoria cuando se encon-
traba discrepancia entre el desempeo en una prueba de inteligencia y en una de aprovecha-
miento o cuando el status de rendimiento estaba bajo el promedio.
El primero de los criterios se basa en la suposicin que todos los individuos tienen la
misma aptitud para todas las reas y que sta se mide por las llamadas pruebas de inteligencia.
El segundo supone que todos los alumnos deben alcanzar hasta las normas estableci-
das para su edad o grupo.
23
en los casos en que el progreso en un rea se detenga o descienda marcadamente en un pero-
do dado.
Todo docente sabe que a pesar del diagnstico previo a la instruccin con la adecuada
ubicacin de sus alumnos y la compensacin de sus deficiencias anteriores, algunos alumnos
pueden seguir siendo aprendices fracasados durante el proceso de instruccin.
Es en estos casos cuando debe utilizarse el otro tipo de diagnstico. Con l se intentar
la bsqueda de las causas de la repetida dificultad para aprovechar plenamente el proceso
enseanza-aprendizaje.
Los cuatro pasos principales en el diagnstico de las dificultades para aprender son:
Por lo general, en la identificacin de alumnos con dificultades para aprender, los docen-
tes se centran en aquellos alumnos que tienen problemas en las habilidades bsicas y en las
reas de contenido. Sin embargo, tambin requieren atencin adecuada los que tienen dificulta-
des en sus relaciones sociales, en su ajuste emocional y en otros aspectos de su desarrollo
personal-social que no slo son significativos per se, sino por su influencia directa en la efec-
tividad del aprendizaje.
En los casos en que un nmero relativamente grande de alumnos experimente una mis-
ma dificultad, podra pensarse, en primera instancia, que sto obedece a mtodos de ensean-
za inapropiados, a fallas en el nfasis dado a determinados temas en el plan de estudio o a
materiales de curso extremadamente complejos. Cuando las fallas no pueden explicarse por
instruccin defectuosa y con el fin de determinar las causas de los problemas, es preciso reali-
zar un estudio minucioso del alumno y de su medio ambiente. Las causas de la actual inhabili-
dad para el aprendizaje pueden ser de carcter educacional o no educacional.
Estas clases por lo general no son excluyentes y por ende se relacionan unas con otras.
24
tensin concomitante con los cambios puberales y con la adolescencia o los efectos emociona-
les negativos generados por situaciones anormales en el hogar, son efectos de factores psicol-
gicos as como la privacin cultural podra mencionarse como factor ambiental con influencia
negativa en el aprendizaje.
Por todo lo expuesto, en un diagnstico de amplio alcance ser necesario considerar los
siguientes aspectos del alumno:
Las pruebas diagnsticas pueden ser del tipo normalizado o simplemente del tipo infor-
mal o hechas por el docente.
25
Pero si cualquier conclusin relativa o capacidad potencial para el aprendizaje se infiere
de los resultados de una prueba diagnstica de cualquier tipo, a tal inferencia puede llegarse
vlidamente si, y slo si se han satisfecho los siguientes supuestos:
1.Todos los alumnos han tenido una oportunidad igual para aprender los tipos detareas
que se presentan en la prueba.
2.Se ha motivado a todos los alumnos para que en la prueba se esfuercen al mximo
de sus capacidades.
3.Todos los alumnos tienen los llamados comportamientos capacitadores (habilidad
para la lectura, por ej.) necesarios para lograr su actuacin exitosa en la prueba.
4.No hay alumnos con comportamientos incapacitadores (pnico a la prueba, proble-
mas emocionales, etc.) que puedan afectar su actuacin ptima en la prueba.
Los docentes bajo adecuada direccin, pueden llegar a construir instrumentos diagns-
ticos altamente analticos para determinar si el alumno posee las destrezas y habilidades as
como los contenidos juzgados como prerrequisitos para la nueva tarea que emprendern.
Preferentemente, una prueba diagnstica debe ser del tipo objetivo por su facilidad de
aplicacin y de interpretacin, debe incluir uno o ms tems por cada elemento importante y no
slo una muestra de la gama de contenidos y conductas que lleva una prueba de final de instruc-
cin o sumativa. Como la atencin se debe centrar en las dificultades para aprender que tienen
los estudiantes, la prueba deber construirse a la luz de las fuentes ms comunes de error que
cometen los mismos. Los errores son un maravilloso vehculo cuando pueden usarse para clari-
ficar malas interpretaciones y diagnosticar fallas.
Las pruebas diagnsticas hechas por el profesor, fciles de aplicar e interpretar y que
pueden sealar las necesidades especficas de un rea en trminos de dominio antes que en
trminos comparativos con algn grupo no siempre representativo, se hacen cada vez ms ne-
cesarias.
Los elementos de prueba no deben ser difciles para que el 65% o ms de los alumnos
pueda intentar responderlos con probabilidad de acierto.
El mejor mtodo para informar el puntaje de estas pruebas, lo constituyen los perfiles
26
individuales por sub-destrezas, mtodo que exige una elaboracin minuciosa.
Para que las pruebas diagnsticas puedan ser ms efectivas, deben seguir los siguien-
tes criterios:
1.Ser parte integral del curriculum enfatizando y clarificando los objetivos importantes.
2.Las respuestas que requieren sus tems deberan ser lo ms funcionales posibles.
3.Ser analticas y basadas en evidencia obtenida experimentalmente sobre dificultades
de aprendizaje y malas interpretaciones por parte de los alumnos.
4.Revelar suficientemente el proceso mental del aprendiz para detectar puntos de error.
5.Sugerir o proveer procedimientos especficos compensatorios para cada error detecta
do.
6.Ser diseadas sistemticamente para cubrir una larga secuencia de aprendizaje.
7.Ser elaboradas para verificar olvidos de elementos difciles tanto como para detectar
aprendizaje incorrecto.
8.Revelar el progreso del alumno en trminos objetivos.
Las pruebas no pueden ser los nicos instrumentos diagnsticos que deben usarse.
Para ciertos campos como el del pensamiento, de las actitudes y de los sentimientos, resultan
de gran ayuda otros procedimientos complementarios, como las conversaciones abiertas en el
aula; las preguntas y los temas abiertos, el registro de la lectura y de la redaccin, la ejercitacin
y las tareas especiales.
Con el fin de ayudar a los alumnos a superar sus dificultades de aprendizaje, no hay una
pauta fija a seguir. Los procedimientos especficos que se usan como remediadores dependern
de la naturaleza concreta de la dificultad de aprendizaje, as como de los factores que la han
causado y han contribuido a provocarla. En algunos casos un simple repaso o una reiteracin de
la enseanza, pueden ser los procedimientos remediadores aconsejados, pero en otros habr
que mejorar la motivacin, superar deficiencias en hbitos de trabajo y de estudio, corregir
dificultades emocionales, etc.
As como los procedimientos de evaluacin son tiles para el programa general de ins-
truccin, tambin lo son para el diagnstico con el fin de remediar las deficiencias en el apren-
dizaje.
A lo largo de este breve escrito, que no pretende ser ms que una mera introduccin al
tema del diagnstico pedaggico como actividad evaluativa, se ha llamado la atencin reiterada-
mente hacia la complejidad de las tareas que debe encarar el docente diagnosticador.
27
Este debe reunir un conocimiento integral de:
1.el educando y los mltiples factores personales y sociales que inciden sobre sus capa-
cidades de aprendizaje;
2.el curriculum y sus objetivos y mtodos de enseanza;
3.los recursos de evaluacin que incrementan la validez y la confiabilidad del diagnsti-
co.
Todos los roles y competencias involucrados en esta lista sinttica, son exigidos al
docente, quien lo sabe de antemano o llega a comprenderlo en el ejercicio de sus funciones.
Una adecuada capacitacin docente debe, por lo tanto, dar a las actividades relaciona-
das con el diagnstico la importancia que contemporneamente se les asigna.
Bibliografa
1 Se hace notar que la evaluacin educacional no se restringe slo al alumno sino que abarca desde cualquier
elemento del curriculum hasta el sistema educativo.
28
ESTRATEGAS DE EVALUACIN
La principal diferencia entre las prcticas de evaluacin actuales y las tradicionales reside
en que hoy las pruebas se utilizan para juzgar la calidad de las acciones educacionales
ocupando la asignacin de notas un papel secundario. La labor de los maestros se juzga
tambin sobre la base del desempeo de los alumnos en las pruebas.
Este cambio en los objetivos de la evaluacin ha determinado modificaciones en los recur-
sos utilizados. Se han puesto en evidencia algunas inadecuaciones de las pruebas usuales
referidas a normas, dando surgimiento a lo que podramos llamar la era de las mediciones
referidas al criterio.
La denominacin mediciones referidas al criterio fue acuada por R. Glaser y David Klaus en
1962.
Brevemente definida, una prueba referida al criterio se disea para producir una descripcin
clara del significado real del rendimiento del examinado. Ms que interpretar ste en rela-
cin con el de otros sujetos, tal como sucede en la mayora de las pruebas tradicionales, la
prueba referida al criterio produce una semblanza ms completa de lo que puede y no puede
realizar el alumno.
En muchas circunstancias, la informacin que se desea brinden las pruebas sobre el alum-
no es cunto sabe o cunto puede hacer comparado con otros, informacin que indudable-
mente se obtiene con las medidas referidas a normas. En otros casos, sin embargo, lo que
se desea saber con precisin es cunto puede hacer o cunto sabe un sujeto determinado
sobre algn aspecto seleccionado. En esta situacin, las medidas referidas al criterio son
las indicadas.
Robert Glaser en 1963 us la denominacin mediciones referidas a la norma para aludir a
las pruebas tradicionales de aprovechamiento que enfatizan la identificacin del status o
posicin relativa que corresponde al alumno con respecto de un grupo y la denominacin
mediciones referidas al criterio para las pruebas que identifican el grado de dominio de
conductas especificas por parte del alumno en trminos absolutos.
El conocimiento adquirido en la construccin de pruebas referidas a normas en cuanto a los
fundamentos, metodologa, criterios para seleccionar y mejorar tems, etc. resulta de gran
provecho para quienes deseen construir recursos referidos al criterio.
Si bien las mediciones relativas a normas siguen ocupando un papel central en los exme-
nes de aptitud, cuando se trabaja con pruebas de aprovechamiento dentro del marco de la
situacin de enseanza-aprendizaje, usualmente deseamos saber ms acerca del desem-
peo del examinado de lo que brindan estos recursos.
Ambos tipos de evaluacin pueden ser considerados como dos estrategias que persiguen
diferentes fines. La diferencia fundamental entre ambas radica en la calidad de la descrip-
29
cin que ofrecen. En un caso interesa la descripcin en trminos de comparaciones
interindividuales, en el otro obtener una descripcin lo ms clara posible del significado del
rendimiento individual con fines de enseanza y aprendizaje. Objetivos tan distintos recla-
man obviamente, mtodos diferentes.
Segn Robert Ebel, las pruebas referidas a normas que interpretan el puntaje del alumno en
relacin con las normas establecidas a travs del examen de individuos similares, muestran
en forma amplia una multitud de elementos de conocimiento o habilidad en forma difusa.
Las referidas al criterio informan cules o cuntas de un conjunto de metas especficas de
aprovechamiento ha alcanzado un alumno particular. Se concentran en un nmero limitado
de aspectos especficamente definidos, examinando cada uno de ellos repetidamente para
obtener mayor certeza de su real logro.
Cada uno de estos tipos de pruebas tiene sus ventajas y limitaciones. Las referidas al
criterio pueden brindar informacin ms especfica y detallada sobre el desempeo del alumno
pero implican la realizacin de informes ms extensos y engorrosos. Las referidas a la
norma pueden proveer una sntesis ms concisa de un rea menos claramente definida de
logros.
Las mediciones relativas a criterios enfatizan el dominio de aspectos especficos por todos
los alumnos, si bien existe alguna arbitrariedad en la definicin del grado de dominio y en
los criterios de seleccin de los especficos. Las mediciones por normas alientan y recom-
pensan la calidad del aprovechamiento individual si bien tambin es arbitraria la seleccin
de los elementos de las tareas en que debe demostrarse dicha calidad.
Existen tambin diferencias en las concepciones sobre el aprendizaje en que se basan
dichas clases de instrumentos. Las pruebas relativas al criterio tratan el aprendizaje como
si se lograra a travs de unidades separadas, discretas, que se suman a un conjunto apren-
dido. Las remitidas a normas son consistentes con la nocin de que el aprendizaje consiste
en la construccin de una estructura de numerosas relaciones entre conceptos. En las
etapas tempranas del aprendizaje, tales como las que ocurren en el aprendizaje de las
letras, nmeros y operaciones aritmticas bsicas, la nocin de acumular elementos o as-
pectos separados o no relacionados directamente entre s hasta poder integrarlos en una
secuencia puede resultar adecuada. Pero an en las etapas tempranas el descubrimiento
de relaciones resulta muy importante y difcil de desmembrar en aspectos ntidamente se-
parados.
La idea de dominio resulta tentadora pero engaosa. El dominio completo an de las ideas
y habilidades ms simples es muy difcil o imposible de lograr. No parece razonable insistir
para que un alumno que completa un curso deba dominar todo lo que se ha establecido
previamente ni que deba insistir hasta lograr todo aquello que otro estudiante ha consegui-
do. Dado que ninguno de nosotros dispone de tiempo ilimitado para vivir o para dedicar al
aprendizaje, existen serios obstculos prcticos para hacer del tiempo, ms que del monto
aprendido, la principal variable en el proceso del aprendizaje.
Un peligro inherente al uso de las mediciones referidas al criterio reside en el hecho de que
los maestros puedan dedicarse meramente a la enseanza de aspectos muy particulares
30
implicados en las pruebas descuidando los procesos ms abarcadores y fundamentales.
Las principales dificultades que hay que enfrentar cuando se piensa en la utilizacin de
pruebas referidas al criterio son: la seleccin y justificacin posterior del conjunto de ideas
y habilidades que cada estudiante tendr que aprender; el problema de determinar el nivel de
desempeo que se tomar como indicacin de que se ha logrado el objetivo; el retest repe-
tido de quienes no alcanzan el criterio luego de completar el ciclo; la identificacin de un
ntido nivel de rendimiento que permita clasificar vlidamente los desempeos en trminos
de logro y no logro del objetivo, especialmente en los casos lmite o intermedios; el modo o
maneras para informar sin que origine una labor tan minuciosa que complique en lugar de
simplificar las tareas de evaluacin y comunicacin de resultados.
No cabe duda que en las etapas iniciales del aprendizaje tal como tiene lugar en los prime-
ros grados y en los programas que intentan desarrollar habilidades tcnicas, las mediciones
referidas al criterio son claramente superiores a las relativas a normas. Pero queda abierta
la cuestin en otros mbitos relativa a la supuesta superioridad de las primeras sobre las
segundas.
La principal funcin de cualquier prueba de rendimiento, sea referida a normas o a criterios
es diferenciar niveles de aprovechamiento. Las pruebas no sern vlidas si no logran
esta diferenciacin. Es necesario salvaguardar contra la idea equivocada de que si dispone-
mos de datos sobre el nivel de rendimiento de un individuo en relacin con algn objetivo o
estndar o con su propio rendimiento anterior no necesitaremos realizar comparaciones con
otros individuos. Diferentes tipos de comparaciones no constituyen alternativas equivalen-
tes. Cada una de ellas provee una clase sustancialmente diferentes de informacin. En
muchas situaciones las comparaciones interindividuales son necesarias o deseables. Ni la
excelencia ni la deficiencia en el aprovechamiento pueden ser identificadas confiablemente
sobre otra base que la comparacin entre los desempeos individuales.
31
Con relacin a los controles a posteriori, el anlisis del poder discriminativo de los tems
utilizado en las pruebas referidas a normas se basa casi exclusivamente en las tcnicas
correlacionales y stas, como se sabe, dependen en gran medida de la variabilidad de las
respuestas de los examinados. Una de las principales acciones que dieron origen a las
pruebas referidas a criterios fue la identificacin ms clara de los objetivos de aprendizaje
de modo que un nmero progresivamente mayor de alumnos lograra el dominio de los mis-
mos. El resultado de esto es, obviamente, una disminucin de la variacin de las respues-
tas. Esto torna poco adecuada la utilizacin del poder discriminativo para este tipo de prue-
bas, aspecto que cobra valor en un marco comparativo interindividual.
Cuando se presenta insuficiente variacin, resulta posible comparar los puntajes de alum-
nos que no han sido y han sido enseados en el programa, en cuyo caso puede utilizarse un
anlisis de correlacin biserial.
Otro procedimiento consiste en computar las diferencias entre los niveles de dificultad de
los grupos de aprovechamiento superior e inferior (usualmente el 27% ms alto y bajo) y
calcular en base a stos el grado de discriminacin del tem.
Hay autores que propugnan el grado de sensibilidad del tem en cuanto a la instruccin
misma como indicador ms adecuado dentro de un contexto. Uno de estos ndices se refiere
a la diferencia entre el pretest o preprueba antes de la instruccin y el postest o postprueba.
El primer paso para preparar una prueba de este tipo consiste en adoptar una estrategia de
espectro limitado para aislar un pequeo nmero de los aspectos importantes a ser evalua-
dos an cuando stos puedan ser complejos que luego se desmembran en sus elementos
componentes. El espectro limitado contribuye a la precisin y grado de especificacin pos-
terior.
El segundo paso reside en la seleccin de alternativas que involucren la puesta a prueba de
realizaciones observables del alumno que se analizan en trminos de: a) en qu medida el
atributo resulta evaluado; b) en qu grado una alternativa resulta ms adecuada en relacin
con los propsitos de la medida. La seleccin termina en la decisin de optar por un tipo de
tarea congruente para cada clase de realizacin especficamente establecida que debera
ser la de mayor poder como muestra.
Los componentes de las especificaciones de la prueba pueden conceptualizarse segn el
siguiente esquema:
- Propsito: la prueba est diseada para ser utilizada con un grupo de sujetos que conocen
los nmeros, pueden leerlos y manejar en forma elemental las operaciones aritmticas pero
no saben leer la hora. La prueba intenta controlar el progreso en esta adquisicin.
- Para ello debern prepararse las especificaciones del instrumento que permitirn: a) desa-
rrollar una serie de tems congruentes con el tipo de adquisiciones que se describan; b)
comunicar en forma clara, carente de ambigedad la significacin del desempeo individual
32
a la luz de las especificaciones; c) los tems se prepararn cuidando dicha congruencia en
forma sistemtica; d) el constructor y un juez competente ajeno a la prueba juzgarn cada
tem en relacin con las especificaciones y se determinar la necesidad de introducir modi-
ficaciones en los mismos.
Descripcin general: Presentados una serie de relojes que marcan diferentes momentos
(en trminos de horas y minutos), el examinado seleccionar la alternativa que corresponda en
cada caso con la que ilustra el reloj.
Item de muestra: Para el reloj que se presenta a la izquierda, marque la hora que est
representada segn las alternativas de la derecha.
a. 1.35
b. 8.05
c. 8.00
d. 5.05
1.los relojes podrn ser de forma circular o cuadrada, aproximadamente del tamao de un
reloj de pulsera. Podrn representar cualquier momento en unidades de 5 en 5 minutos;
2.podrn usarse nmeros arbigos, romanos o simplemente marcas, puntos o elementos
similares para sealar las doce posiciones;
3.las agujas minutero y horaria tendrn una representacin clara en cuanto al tamao relati-
vo (corta y larga) utilizando lneas rectas o flechas. Nunca se superpondrn totalmente;
4.la aguja minutero slo se dirigir a puntos del reloj que representen incrementos tempora-
les de 5 minutos (ej. 5.10 5.15), nunca a puntos intermedios entre stos (ej. 5.08 5.18).
La aguja horaria reflejar con la mayor precisin posible la posicin entre las horas de acuerdo
con la ubicacin de la aguja minutero;
5.no se usarn relojes digitales.
Atributos de la respuesta:
1.se presentarn cuatro opciones, una de las cuales corresponder a la hora y minutos
marcada en el reloj. Estas consistirn en un nmero que representa la hora seguido de un
punto y luego los minutos. Todas las opciones de respuestas reflejarn intervalos de 5 minutos.
2.se considerarn opciones incorrectas: a- cuando se lee invirtiendo las agujas minutero y
horaria;b- un tiempo de 5 minutos antes o despus del sealado; c- la transposicin del
tiempo correcto -por ejemplo, 15.3 en lugar de 3.15; d- slo la hora omitiendo los minutos; e-
los minutos correctos pero una hora ms o menos que la sealada; f- otra hora que la que
marca el reloj.
3.el orden de las alternativas correcta e incorrectas ser dispuesto al azar.
33
Lectura de la hora del reloj en el reloj pulsera. Postest.
1-
12
11 1
10 2
9 3
a.1.35
b.8.05
8 4
c.8.00
7 5
6 d.5.05
2-
XII
IX III a.9.20
b.9.25
VI
c.10.20
d.7.05
3-
X
X X
X X
X X a.1.00
X X b.12.00
X X c.12.00
X
d.11.55
4-
a.11.45
b.2
c.8.45
d.9.00
5-
12
9 3 a.10.40
b.10.45
6 c.8.55
d.9.45
34
los propsitos particulares para lo que fue construda.
6-datos comparativos disponibles que permitan no solo determniar si el alumno ha logrado o no
determinada conducta, sino los distintos grados en que diferentes alumnos se desempearon
con respecto al rea de cuestin. Esta informacin resulta til para evaluar el grado de adecua-
cin del desempeo individual.
35
LAS MEDICIONES REFERIDAS AL CRITERIO
Fuente: Wardrop, J.(1976). Standardized Testing in the Schools:
Uses and Roles. Brooks/Cole Publising Company, Monterrey, California.
Traduccin y sntesis: Mara del C. Malbrn.
De las muchas crticas que han recibido las pruebas de rendimiento estandarizadas
para la evaluacin del desempeo del alumno, una de las ms frecuentes ha sido la que sea-
la la falta de propiedad de las comparaciones normativas para ciertos usos educacionales.
Una de las ms persuasivas es la formulada por Glaser (1963).
Distinciones Bsicas
36
En contraste, las pruebas referidas al criterio muestran como caractersticas salientes
el que:
La distincin entre ambos puede expresarse en forma ms simple. Una evaluacin re-
ferida a la norma es aquella en la que el rendimiento del examinado se evala en comparacin
con un nivel deseado de eficiencia a lo largo de un continuo de adquisicin. Las dems dife-
rencias son mucho menos importantes.
Despus de todo, las definiciones ofrecidas sugieren que el hecho de considera a una
2
prueba como RN o RC depende de cmo se interpreten los puntajes, no de las caractersticas
intrnsecas de la misma. Cualquier prueba o examen puede ser visto desde ambos puntos de
referencia. Sin embargo, si se desea construir un instrumento de uno de los dos tipos, debera-
mos tener en cuenta otros atributos. Ambas deben comenzar con un conjunto (pool) de tems o
problemas pertinentes respecto del contenido. Una prueba RN representa objetivos tomados de
los materiales curriculares usuales, una prueba RC representa objetivos aislados o tomados
separadamente del programa vigente en forma directa. Usualmente stos se refieren a objetivos
importantes o cruciales dentro del programa y los tems seleccionados son claramente espec-
ficos y pertinentes para ello en una situacin particular. Son vlidos cuando ponen en juego o
resultan indicadores del grado de logro de esos objetivos especificados. Inversamente, en la
prueba RN las mediciones sern vlidas si logran discriminar en forma confiable entre los indivi-
duos y pueden ser relacionadas en forma significativa con otras mediciones concurrentes o
futuras del rendimiento evaluado.
Una prueba RC ideal estara compuesta de tems que resolvieran todos aquellos alum-
nos que hubieran tenido oportunidad de aprender el contenido que est siendo evaluados y a la
inversa no resolvieran quienes no hubieran tenido esas oportunidades. Sin embargo, y esto es
un problema para los diseadores de pruebas, es raro que los alumnos lleguen a la situacin de
enseanza sin saber nada acerca del contenido y es igualmente inusual que un tem de prueba
est tan bien preparado y la situacin de examen tan libe de influencias irrelevantes de modo
que todos los alumnos que hayan dominado el contenido resuelvan las cuestiones en forma
perfecta.
1 Las pruebas referidas a normas tambin incluyen contenidos y objetivos curriculares. La diferen-
cia radica en la es-pecificidad de la relacin.
2
RC: referidas a criterios.
37
No obstante lo dicho, una prueba RC es probable que contenga una cantidades tems
que casi todos los que hayan recibido la enseanza pertinente puedan resolver satisfactoria-
mente. Esta situacin crea dificultades para quienes buscan determinar la confiabilidad y vali-
dez de las mediciones. En trminos de la teora clsica de las pruebas, confiabilidad alude a la
habilidad para discriminar entre los individuos; en una situacin en la que todos o casi todos
logran el criterio buscado, estas discriminaciones no son posibles. Adems son innecesarias,
salvo en el sentido de separar quienes han logrado los objetivos deseados respecto de los que
no estn en condiciones. Hasta el momento no se han desarrollado procedimientos que permi-
tan determinar esos controles necesarios para asegurar la calidad de los instrumentos.
Desde que Glaser (1963) introdujo el trmino, las pruebas RC han sufrido distorsiones.
Una de las razones es la que obedece a la aceptacin indiscriminada de este enfoque por los
educadores que consideran que el nico abordaje defendible es el de la enseanza consiste
entonces en usar pruebas RC empleando aquellos tems que muestran objetivos claves. En este
contexto, las pruebas RC deberan denominarse pruebas relativas al grado de dominio de los
objetivos. El problema reside en que, dad la variedad y cantidad de objetos especficos que se
persiguen en la mayora de los cursos, cada unos de ellos estara representado en la prue-
ba por un nmero tan pequeo de tems que afectara su calidad en el sentido de no brindar
suficiente oportunidad al estudiante para evidenciar el nivel o grado de sus logros.
Para resolver esta cuestin necesitamos comprender o saber cmo ayudar a que los
individuos aprendan y cmo han llegado a saber lo que han logrado. Este conocimiento provee la
base conceptual para establecer los niveles implicado en el criterio. En ausencia de procedi-
mientos tericamente basados, podemos estudiar empricamente la cuestin comparando el
rendimiento de los estudiantes en la prxima unidad criterio, con la que est siendo desarrolla-
da. Ello requiere la observacin cuidadosa de las actividades de aprendizaje de un nmero de
38
alumnos con el fin de dar cuenta de las innumerables influencias que afectan al aprendizaje o
que o hacen posible y de la cantidad que los resultados pretendidos son posibles o alcanzables.
Comentarios evaluativos
39
LA EVALUACIN BASADA EN NORMAS Y CRITERIOS
Mara del C. Malbrn
Las evaluaciones del aprovechamiento acadmico se realizan para producir una descrip-
cin clara del significado del rendimiento de los estudiantes. Cmo otorgar ese significado?.
Dado que las mediciones son de naturaleza esencialmente comparativa se requiere un marco al
que remitir las puntuaciones observadas de modo de conferirles esa significacin.
40
determinacin de categoras tales como superior, medio y bajo rendimiento
fundamentacin de decisiones educacionales basadas en lo que la mayora de los estudian-
tes logran
41
CONSTRUCCIN Y UTILIZACIN DE
PRUEBAS EDUCACIONALES
Mara del C. Malbrn.
Existen aspectos que deberan evaluar todas o casi todas las asignaturas? Cules son?
Cmo equilibrar en las evaluaciones los pesos relativos al dominio de informacin y a las
habilidades? (procesos mentales) Se pueden evaluar stas sin recurrir a la informacin?
Cundo existen cursos paralelos, debe usarse la misma prueba o pruebas diferentes?
Deben comunicarse al alumno los objetivos de la prueba y discutirse con l los resulta-
dos?
42
CUALIDADES DE UNA
PRUEBA DE APROVECHAMIENTO
(Segn Ebel, R. 1965, 1972)
EQUILIBRIO grado en que la proporcin de tems pone a prueba los resultados particulares
de lo enseado. El marco de referencia est incluido en la Tabla de Especificaciones. La
proporcin de tems que versan sobre cada aspecto del rendimiento, concuerdan con la
intencin del constructor de la prueba, tal como se expresa en las especificaciones de
sta?.
EFICACIA nmero de respuestas requeridas por unidad de tiempo. La prueba hace uso
eficaz del limitado tiempo que dispone el docente para prepararla y calificarla y del limitado
tiempo tambin que dispone el estudiante para realizarla?.
DIFICULTAD el grado de dificultad debe ser apropiado al grupo que se va a examinar. Gene-
ralmente, un examen confiable es aquel en el que cada tem es superado por la mitad de los
estudiantes. Las preguntas de la prueba, y sta en su totalidad, son de dificultad adecuada,
ni muy fciles ni demasiado difciles, de manera que puedan ser eficaces para los examina-
dos a los que est destinada.
DISCRIMINACIN cualidad de los tems para distinguir entre los estudiantes ms prepara-
dos y los menos preparados. Cada una de las preguntas discrimina netamente entre los
estudiantes de rendimiento ms alto y ms bajo, y la prueba en su totalidad produce una
amplia distribucin de puntajes?
43
ciones y que puede ser controlada con respecto a los tems, los encargados de la puntua-
cin, los sujetos examinados, etc. Arroja la prueba resultados que concuerdan con los
objetivos evaluados en otras ocasiones o utilizando distintos calificadores?
RAPIDEZ se refiere al grado en que la velocidad de respuesta influye sobre los puntajes.
En las pruebas de aprovechamiento la rapidez generalmente no juega un rol significativo en
la de terminacin del puntaje. Debe permitirse el tiempo suficiente para que la mayora de
los examinados complete la prueba. Tiene la prueba una longitud adecuada para el tiempo
disponible?. Se evita que el ritmo de trabajo del examinado influya indebidamente en el
puntaje que obtiene?
44
CONDICIONES QUE DEBEN CUMPLIR LOS
INSTRUMENTOS DE EVALUACIN
Mara del C. Malbrn
Pertinencia
1.la estructura de los objetivos es un esquema conceptual: no es que tengamos objetivos, sino
que elegimos conceptuar el rendimiento de acuerdo con ellos (Stenhouse)
2.un objetivo est definido con suficiente claridad si es capaz de ilustrar o describir la clase de
realizacin que se espera del estudiante, de modo que cuando ella se observe pueda ser recono-
cida (Tyler)
3.uno de los principales objetivos de la educacin es desarrollar en los estudiantes el conoci-
miento sustantivo, entendiendo el conocimiento como estructura construda por los procesos de
pensamiento a partir de la informacin. El conocimiento verbal es una forma de conocimiento muy
potente y particularmente humana. La apropiacin del conocimiento se de muestra emplendolo
en la solucin de problemas, la toma de decisiones, la explicacin, argumentacin, prediccin
(Ausubel)
4.la tarea del evaluador demanda elaborar juicios slidos sobre la utilidad potencial de los distin-
tos temas de conocimiento. La decisin crtica y el momento ms subjetivo en la construccin de
las pruebas tiene lugar cuando se selecciona el contenido
5.las capacidades aprendidas de alto nivel representan una combinacin compleja de objetivos y
contenidos. No es lo mismo inventar que reconocer, evaluar crticamente un texto que escribir en
forma imaginativa
6.si las pruebas demandan conocimiento de trivialidades en lugar de conceptos importantes, prin-
cipios fundamentales o procedimientos tiles fallan como instrumentos vlidos. Si proporcionan
resultados poco estables porque los problemas son muy pocos, muy ambiguos, muy difciles o
muy fciles, tampoco resultan vlidas. Estas fallas son remediables (Ebel)
7.una prueba para la cual los estudiantes puedan prepararse eficazmente concentrndose en el
aprendizaje memorista y que, por lo tanto, los estimule a dejar de lado el significado y la com
prensin al estudiar es un instrumento deficiente (Ebel)
8.una prueba educacional que no promueva el aprendizaje es de utilidad cuestionable; la promo-
cin del aprendizaje es una labor compleja que requiere diversidad de instrumentos
9.todo conocimiento verbal puede expresarse en proposiciones. Una proposicin es un enunciado
del que puede establecerse su grado de verdad o falsedad. Las proposiciones deben satisfacer
ciertas condiciones:
45
- Estar expresadas en trminos todo lo precisos y carentes de ambigedad que el cono-
cimiento el lenguaje lo permitan, en una formulacin razonablemente concisa;
- Ser aceptados como verdaderos por una mayora de expertos en ese campo de conoci-
miento;
- Ser consideradas por un nmero mayoritario de expertos en ese campo como enuncia
dos dignos de ser conocidos y recordados;
- Expresar principios e ideas que exijan el conocimiento del campo (Cohen y Nagel).
1.Los tipos de enunciados que se incluyen en las pruebas pueden ser clasificados como:
fcticos, generalizadores, comparativos, condicionales, relacionales, explicativos, ilus-
trativos, predictivos, metodolgicos, de cmputo, evaluativos.
2.Una clasificacin til de las cuestiones utilizadas en las pruebas educacionales es la
que se refiere al tipo de habilidades que demandan: comprensin de la terminologa,
comprensin de hechos, principios o generalizaciones, capacidad para traducir, explicar
o ilustrar (comprensin de relaciones), capacidad para calcular, capacidad para predecir
(lo verosmil dentro de las condiciones especificadas), capacidad para proponer decisio-
nes adecuadas (en situaciones problemticas), capacidad para formular juicios evaluativos.
3.Las pruebas deberan centrarse en la competencia cognitiva entendida como la capaci-
dad para adquirir, evaluar y aplicar el conocimiento y atender al desarrollo y uso del cono-
cimiento en la resolucin de problemas del mundo real, al mundo de la experiencia. El
pensamiento crtico debe entenderse como la eleccin del mejor curso de accin sobre la
base de los argumentos ms vlidos, como el desarrollo de un marco analtico para em-
plear crticamente el conocimiento producido sobre bases metodolgicas (Meehan, 1991).
Equilibrio
Objetividad
46
Especificidad
Dificultad
La dificultad de los tems y de la prueba como un todo debe resultar adecuada al tipo de
decisiones que se desea toma como resultado de la misma. Es un indicador crtico del grado de
dominio. Se relaciona con la oportunidad para: a. diferenciar niveles de logro; b. descubrir las
diversidades; c. determinar la progresin o secuencia ms adecuada del contenido; d. determi-
nar el grado en que resulta apropiada para el grupo examinado.
Discriminacin
Seala la calidad de la prueba para distinguir entre los estudiantes ms y menos prepa-
rados. Contribuye sustancialmente a la validez diagnstica del instrumento. La discriminacin
puede determinarse para la prueba como un todo, los tems o tareas individuales y las partes o
alternativas de cada tem (anlisis interno).
47
CONFIABILIDAD Y VALIDEZ
Mara del C. Malbrn
til Atractivo
Prctico Eficaz
Seguro Cambiante
Consistente Falseable
Influenciable Variable
Natural Fluctuante
Representativo Aleatorio
Independiente Idoneidad
Redundante
Preciso
Pertinente
Imparcial
Azaroso
Replicable
Artificial
Desvinculado
Discriminativo
Generalizable
Objetivo
Equilibrado
Predictivo
Claro
Apropiado
Superficial
Obsoleto
Sensible
Constante
Realista
Accesible
Estable
Efectivo
Certero
Influble
Adecuado
Verificable
Errdicado
Abarcador
Trivial
48
CONFIABILIDAD Y VALIDEZ DE LAS PRUEBAS
DE APROVECHAMIENTO.
Mara del C. Malbrn
Cmo afecta el grado de acuerdo del alumno con la posicin del profesor rendimiento en
las pruebas?. Son concientes los profesores de la incidencia de este tipo de sesgo?
Reciben diferente tratamiento los alumnos libres respecto de los regulares en la evalua-
cin del contenido del examen?
De que modos influyen el conocimiento previo que tiene el profesor sobre el alumno para
juzgar la actualizacin en una prueba final? Afecta la evaluacin del profesor la consulta
a la libreta del estudiante?
Qu recaudos se toman para tratar que las pautas de evaluacin se mantengan constan-
tes durante todo el proceso o sesin de examen?. Se acuerdan criterios entre los exami-
nadores en las pruebas orales o se prepara una clave tentativa de correccin en las prue-
bas escritas?. Se utiliza el mismo marco de referencia para corregir todas las pruebas
tomadas en la misma oportunidad?
49
Constituyen las pruebas una muestra representativa de los aspectos desarrollados du-
rante el cursos?. La frecuencia con que se interroga acerca de determinados temas o
contenidos, de qu fuente se deriva?. Se enfatizan en la prueba los mismo aspectos que
se destacaron durante el curso?. Se planifican las pruebas los mismos aspectos que se
destacaron durante el cursos?. Se planifican las pruebas de modo de controlar su ade-
cuacin respecto del programa vigente?
Dan usualmente las pruebas suficiente oportunidad al estudiante para poner de manifies-
to su grado de dominio del material examinado?
En general, puede considerarse que la nota final refleja el nivel de aprovechamiento alcanzado
por el estudiante del curso.
La longitud de las pruebas resulta acorde con el grado de complejidad de los contenidos
y habilidades del curso?
Son conciente los profesores del grado en que el modo de formulacin de las preguntas
afecta el contenido de las respuestas?. Aceptan el hecho de que toda evaluacin est
sujeta a error y actan consecuentemente?
Cundo se afirma que un determinado aspecto resulta de difcil logro para los estudian
tes, en qu elementos de juicio se basan esas apreciaciones?
50
LA VALIDEZ DE CONTENIDO
1. Especificar los constructos que involucra el instrumento: el rea o dominio del constructo y
los aspectos includos y excludos ; las facetas y dimensiones del constructo
2. Especificar los fines u objetivos del instrumento (diagnstico, formativo, sumativo, visin
general del rendimiento)
3. Seleccionar la metodologa acorde al constructo y los fines
4. Elegir y/o generar items iniciales de diversas fuentes: deduccin, experiencia, teoras sobre
el constructo, bibliografa, otros instrumentos, sugerencias de expertos y de examinados
5. Cotejar los items con las dimensiones y facetas del constructo: tablas de especificaciones,
mapas del contenido, elaboracin de mayor cantidad de items que el nmero previsto .
Asegurar la proporcin de items segn la importancia de cada dimensin
6. Examinar la estructura, forma y contenido de cada item : adecuacin del item a la dimen-
sin del constructo,consistencia, precisin, especificidad, claridad del lenguaje, elimina-
cin de los items redundantes
7. Establecer los parmetros cuantitativos: formatos de respuesta, escalas ,asignacin de
puntajes
8. Redactar las instrucciones y decidir la presentacin: adecuacin al tipo de items, estructu-
ra gramatical, diagramacin, consignas de trabajo, tiempo
9. Consultar expertos para evaluar la definicin del constructo, el rea y dimensiones elegi-
das, la pertinencia de los items, las consignas y modos de respuesta, el tratamiento de los
datos
10. Pilotear el instrumento con una muestra e introducir los cambios segn los datos recogidos
11. Aplicar la versin corregida al grupo destinatario
12. Revisar los datos y consultar expertos para realizar las modificaciones que resultaran indi-
cadas.
13. Utilizar otros controles de validez apropiados para el uso y refinamiento del instrumento
(de criterio, de constructo)
51
GUIA PARA EL ANALISIS
DEL CONTENIDO
Mara C. del C. Malbrn
3. Elaborar una jerarqua conceptual, mapa cognitivo, ruta de acceso, para favorecer la apro-
piacin del contenido
5. Comparar el resultado con las estrategias utilizadas para el estudio de los temas
6. Desarrollar un enfoque similar para el anlisis de los aspectos relativos a ejemplos, ilustra-
ciones y procedimientos
Bibliografa
Bloom,B. Esquemas para aplicar la Taxonoma en actividades de planificacin y evaluacin
Ausubel,D. y Novak, J. Mapas cognitivos y UVE heurstica
52
ALGUNAS CUESTIONES RELATIVAS A LAS
PRUEBAS DE APROVECHAMIENTO
EBEL, Robert (1975)
Traduccin y sntesis: Mara del C. Malbrn
Las pruebas se usan a veces con poco tino, se interpretan en forma equivocada, se
derivan de ellas resultados no previstos en su construccin o se utilizan como armas agresi-
vas y no como recursos.
Primera Cuestin
Todas las pruebas, an las de personalidad basadas en el autoinforme, pueden redu-
cirse a pruebas de conocimiento. Todo nuestro sistema, tanto el escolar como el de vida, est
destinado a la transmisin de conocimientos.
Tal vez el rasgo ms peculiar del ser humano y su desarrollo mental, consista en su
habilidad para producir y usar el conocimiento verbal. Este conocimiento implica ms que in-
formacin: implica comprensin y habilidad para usarlo, requiere el desarrollo de una estructu-
ra coherente de conceptos y relaciones.
Si proporcionan resultados poco estables porque los problemas son muy pocos, muy
ambiguos, muy difciles o muy fciles, entonces tampoco resultan vlidas.
53
Segunda Cuestin
No olvidan o descuidan el rea afectiva, los aspectos no cognitivos del desarrollo huma-
no tales como intereses, actitudes, ideales, apreciaciones, autoconcepto, compromiso con la
sociedad y responsabilidad tica?. No hemos deshumanizado la educacin con nuestra insis-
tencia en el desarrollo cognitivo?
Los sentimientos no estn sujetos al desarrollo educativo por medio del proceso de
enseanza-aprendizaje. Son parte, parte muy valiosa, de nuestra herencia biolgica.
Nacemos con un amplio repertorio de impulsos-hambre, sueo, amor, ira, miedo, dolor.
La maduracin agrega otros. La experiencia los asimila a una amplia variedad de objetivos y
situaciones. Nos ensea a enfrentar sentimientos poco placenteros y a dominar la expresin de
ciertos sentimientos en determinadas circunstancias, pero ellos no se desarrollan a la manera
de las destrezas fsicas o de las habilidades cognitivas.
BLOOM y el comit por l liderado, public una clasificacin de los objetivos cognitivos
en 1956 y afectivos en 1964.
Los objetivos afectivos tienen ms relacin con la conducta que con los sentimientos:
atencin, aceptacin, respuesta, compromiso, preferencia, conceptualizacin, organizacin y
caracterizacin. Cul es la base de esta conducta?. Si es racional se basa en lo cognitivo. Si
es conducta habitual puede basarse en la costumbre o la imitacin. En cualquiera de los dos
casos, debe ste ser el principal inters de las escuelas?
Puede ser cierto que las escuelas debieran interesarse ms por el desarrollo en el rea
de los sentimientos, autoconceptos y relaciones interpersonales. Si es as, la educacin cognitiva
es un medio, no una alternativa de la educacin afectiva. De este modo las pruebas de desarro-
llo cognitivo en lo que hace a sentimientos, autoconceptos y relaciones interpersonales sern
adecuadas para evaluar el desarrollo afectivo del alumno.
Muchos de los que enfatizan las metas afectivas en detrimento de las cognitivas, fre-
cuentemente son vagos acerca de la naturaleza precisa de esas metas, de los procedimientos
de enseanza que conducirn a los alumnos a lograrlos y las evaluaciones que permitirn saber
si se han logrado. Esta persecucin de metas intangibles puede servir como excusa para el
logro de metas ms tangibles.
54
Tercera cuestin
Criterio: pueden brindar informacin ms especfica y detallada sobre el desempeo del alum-
no con el costo de una manera ms extensiva.
Criterio: enfatizan el dominio especfico a lograr por todos los alumnos, si bien existe alguna
arbitrariedad en la definicin de dominio y en la eleccin de los especficos.
55
MEJORAMIENTO DE LAS PRCTICAS
DE EVALUACIN EN EL NIVEL SUPERIOR
Fuente: Ramsden, P. (1992) Learning to teach in hirgher education. London: Routledege.
Seleccin, sntesis y traduccin: Mara del C. Malbrn
3. Aprender de los errores del estudiante. Utilizar recursos para identificar errores y fallas en
la comprensin de modo de modificar la enseanza para superarlos.
-Discusin sobre los mtodos apropiados y cmo ellos se relacionan con el contenido del
cursos;
6. Trasmitir mensajes acerca de las cuestiones de evaluacin, as como los objetivos pro-
puestos para el curso, que no considerarn satisfactoria la memorizacin, reproduccin e
imitacin, sino la demostracin concluyente y la aplicacin.
8. Utilizar las pruebas de seleccin mltiple y otros recursos objetivos con cautela, preferi-
blemente en combinacin con toros recursos. Cuando el nmero de estudiantes lo permi-
te, utilizar recursos alternativos de evaluacin.
56
9. En problemas que requieren tratamiento cuantitativo incluir cuestiones que requieren ex-
plicaciones en prosa as como ejemplos numricos.
10. Centrarse en la validez (es importante lo que se est evaluando?). Tratar de evitar cues-
tiones triviales o superficiales slo porque ellas son ms fciles de puntuar que las que
abordan aspectos importantes.
11. Tratar por todos los medios de reducir la ansiedad frente a las pruebas.
12. No incluir cuestiones que uno mismo est listo para responder. Practicar la costumbre de
escribir modelos de respuesta a la preguntas y utilizarlas para comunicar a los estudian-
tes lo que se desea.
13. Reducir la competencia entre los estudiantes proveyndoles datos sobre los criterios de
xito basados en los estndares o patrones previstos (utilizando resultados de los produc-
tos del grupo o derivando criterios sobre el rendimiento de los grupos).
14. Estar alerta sobre la objetividad y precisin de las evaluaciones sobre la habilidad del es-
tudiante y conciente de que el juicio humano es el elemento ms importante en cualquier
indicador del aprovechamiento.
57
MODELO DE CUATRO ETAPAS DEL PROCESO DE
ENSEANZA- APRENDIZAJE- EVALUACIN
(Propuesto por Glaser, elaborado por Deccecco y del paradigma de evaluacin
preparado por Metfessel y Michael.)
Traduccin y sntesis: Mara del C. Malbrn
W. B. Michael
El modelo de enseanza de cuatro etapas inicialmente propuesto por Glaser (1962) con-
siste en una secuencia de cuatro componentes principales: objetivos, conducta de entrada,
procedimientos de instruccin y evaluacin de logros. Este modelo con enlaces de realimentacin
puede tomarse como una definicin de currculum, considerado como un proceso de enseanza-
aprendizaje- evaluacin resultante en un conjunto integrado y cohesivo de productos finales
(conductas del estudiante). El supuesto subyacente al uso de este modelo es que el desarrollo
del currculum y la seleccin, organizacin y uso de los materiales de instruccin que lo acom-
paan, dependen del cumplimiento de los requerimientos de una concepcin comprensiva del
proceso de enseanza- aprendizaje, proceso que se halla anclado entre un conjunto inicial de
objetivos, que representan los logros perseguidos, y un conjunto final de conductas cuya con-
gruencia con los objetivos necesita determinarse.
58
Modelos del proceso del enseanza - aprendizaje - evaluacin
A.3
C.1
Criterios de juicio
Condiciones
externas
59
A- Formulacin de un conjunto comprensivo y consistente de metas
generales y objetivos especificos.
60
B. Conductas de entrada (condiciones internas)de los estudiantes y docentes
B. 1 Estudiantes B. 2 Docentes
Informacin disponible Informacin no siempre
a partir de pretest, regis- disponible pero sucepti-
tros acumulativos u ob- ble de obtenerse en base
servaciones preliminares a la consideracin de ca-
relativas a las diferencias ractersticas tales como
individuales en habilida- habilidades y aptitudes,
des, conocimiento previo competencia en la mate-
pertinente, competencias ria de estudio, patrones
cognitivas existentes, pa- motivacionales, capaci-
trones motivacionales (ac- dad en el diagnstico del
titudes, intereses, valores, aprendizaje, preferencias
necesidades), estilos de a- en cuanto al estilo de es-
prendizaje, determinantes tilo de enseanza, patro-
sociales y culturales, etc., nes temperamentales, em-
que permiten a los docen- pata, etc.
tes modificar los procedi-
mientos de instruccin.
61
C. Procedimientos de instruccin (procesamiento de la informacin)
62
D. Evaluacin del desempeo con enlaces de realizacin a los pasos c,b y a.
63
CARRERA DOCENTE UNIVERSITARIA.
PROYECTO DE EVALUACIN
Mara del C. Malbrn
Fundamentos
De acuerdo con este modelo la evaluacin supone un proceso destinado a recabar informacin
sistemtica y oportuna proveniente de tres fuentes de criterios:
Una distincin til es la que diferencia entre valor o vala y mrito (Scriven, 1981). An
cuando un programa meritorio puede no ser vlido, esto es, no adecuarse al objetivo propuesto,
el mrito entendido como calidad es un prerrequisito de la validez.
Dos premisas bsicas que subyacen a la actividad evaluativa aluden a su carcter inevi-
table y a su contribucin para una comprensin ms amplia y una mejora subsiguiente de la
educacin.
1
Stufflebeam, D. Y Shinkield, A. (1987) Evaluacin sistemtica. Gua terica y prctica. Barcelona: Paidos. .
64
lar el camino para el perfeccionamiento y promover una mayor comprensin de la empresa
evaluativa.
El trabajo evaluativo es una labor de equipo que reclama el cumplimiento de las respon-
sabilidades de todos los sectores involucrados. Ayuda a tomar y justificar decisiones que pue-
dan satisfacer mejor las necesidades. No podemos asegurar que las metas sean valiosas si no
las comparamos con las necesidades de las personas a las que presuntamente sirven. El valor
y mrito de las metas requiere identificar, obtener y proporcionar informacin til y descriptiva y
determinar sus impactos, solucionar los problemas de responsabilidad y promover la compren-
sin de los fenmenos implicados (orientacin hacia el perfeccionamiento).
Objetivos
Aspectos a evaluar
65
antigedad de ttulo y en la docencia universitaria, concursos realizados, actividades de
investigacin, roles docentes que desempean), preparacin general, manejo de otra len-
gua, habilidades docentes, dominio de la materia o disciplina, actitudes docentes y hacia la
formacin docente especializada, actitudes hacia la investigacin, disposicin para el traba-
jo en grupos y la labor interdisciplinaria;
8. Impacto e influencias de la Carrera Docente Universitaria en las Unidades Acadmicas: ac-
tuacin de los docentes como multiplicadores, consultores, productores de informacin,
factores de cambio;
9. Proyecciones futuras: tendencias de desarrollo y ampliacin del mbito de accin de la
Carrera Docente Universitaria.
Fuentes de datos
Recursos humanos
1. un coordinador del equipo con rango de profesor titular. Se recomienda designar un profesor
de la Carrera Docente Universitaria;
2. tres evaluadores con rango de profesor adjunto o JTP. Se recomienda designar profesores
que hallan estado a cargo de los talleres de la carrera o egresados de alto rendimiento en la
misma.
66
CRITERIOS PARA LA EVALUACIN DE CURSOS
Mara del C. Malbrn
Existen dos criterios bsicos que debe cumplir toda evaluacin para ser efectiva:
1.objetividad, imparcialidad o confiabilidad de las estimaciones. Alude al grado en que ellas estn
libres de factores o influencias extraas a los rasgos que se desea evaluar. La subjetividad del evaluador,
las condiciones en que se realiza la evaluacin, los cambios que produce la situacin de prueba en el
examinado, las oportunidades que se brindan a la persona para mostrar sus logros, las imprecisiones
en las pautas de correccin, si no se controlan afectan la objetividad de las evaluaciones, disminuyen-
do su confiabilidad.El resultado de la evaluacin puede considerarse objetivo cuando es posible
replicarlo utilizando calificadores independientes o repitiendo el procedimiento en diferentes oportuni-
dades.
2.validez de las estimaciones que se refiere al grado en que las mismas traducen el propsito
para el que fueron realizadas.Una evaluacin es vlida cuando refleja los objetivos que se persi
guieron con el curso, el grado de nfasis que se otorg a los mismos durante su dictado, las
diferencias individuales en los conocimientos y habilidades adquiridas.
Los objetivos prescriptos para el desarrollo del curso constituyen una valiosa gua para determinar si
la evaluacin realizada es pertinente, especfica y equilibrada.
67
Gua para ponderar los aspectos a evaluar en los alumnos
68
DIFERENCIAS ENTRE TESTS DE APTITUD
Y TESTS DE RENDIMIENTO
Tests de Rendimiento
Qu miden?
. Los efectos de conjuntos de experiencias relativamente tipificadas, tales como las de un
curso de francs elemental, etc. Es decir, en lneas generales, miden los efectos del apren-
dizaje celebrado bajo condiciones parcialmente conocidas y controladas.
Tests de Aptitud
. Se incluye en ellos los de inteligencia general, las bateras de aptitud mltiple y los de
aptitudes especiales.
Qu miden?
. La influencia acumulativa de una multiplicidad de experiencias de la vida ordinaria. Es decir,
miden los efectos del aprendizaje bajo condiciones relativamente incontroladas y descono
cidas.
69
. Que de ningn modo los tests de rendimiento miden los efectos del aprendizaje, mientras
que los de aptitud miden la capacidad innata, independientemente del aprendizaje.
Sera una concepcin falsa. Los tests psicolgicos miden la conducta corriente del indivi-
duo, que inevitablemente refleja la influencia del aprendizaje anterior.
. A los fines de consejo. Una valoracin tanto de aptitudes como de conocimientos son pasos
necesarios en el planeamiento educativo y profesional, que constituyen objetivos importan-
tes de la situacin de consejo.
. Los tests de rendimiento constituyen tambin una importante caracterstica de los progra-
mas de enseanza de tipo teraputico. Es decir identificacin de las dificultades de un
individuo con fines remediales.
. Para los estudiantes, sirven para facilitar el aprendizaje. Ya que revelan debilidades del
aprendizaje pasado, proporcionan directrices para el futuro y procuran una motivacin al
que aprende.
. Para el profesor, sirven como ayuda en la valoracin de la enseanza, el mejoramiento de
las tcnicas de instruccin y la revisin del contenido de los cursos de estudio.
70
a- Planeamiento del test:
. la forma sistemtica para obtener estas especificaciones es a travs de una Tabla de do-
ble entrada con los objetivos en la parte superior y los temas en la columna izquierda.
b- Redaccin de elementos:
en funcin de los objetivos, contenido, se debern tomar decisiones acerca del tipo y variedad
de items que se utilizarn en la prueba.
c-Anlisis de elementos:
71
EXAMEN DEL EXAMEN
Celia A. de Crsico
72
EL EXAMEN POR TEMAS
73
LAS PRUEBAS DE ENSAYO
74
tencia entre los evaluados.
Existe acuerdo en reconocer que cuanto ms breve y directa la pregunta, mayor la consis-
tencia al puntuarla y mayor el nmero de cuestiones a incluir en una prueba.
Por otra parte, cuanto ms restringida la respuesta, mayor la probabilidad de transformar
la en un item de seleccin mltiple. Las preguntas muy especficas tambien corren el ries-
go de convertirse en memoristas. El tipo de preparacin del examinado es otro aspecto:
no est igualmente preparado para el PE un estudiante de Matemtica que uno que de Le-
tras.
75
LAS PRUEBAS DE ENSAYO
PASOS PARA LA CONSTRUCCIN
Mara del C. Malbrn
3.Construir modelos de respuesta para cada pregunta; por ejemplo, un examinador constru-
ye la pregunta y otro la respuesta, y calcular el tiempo: dado que el examinador conoce al
menos como el mejor estudiante, el tiempo debe calcularse de modo de permitir la mejor
respuesta posible. El examinador debe tratar de distinguir la respuesta ideal de la respuesta
dentro del marco real.
4. Hacer revisar las preguntas por otros colegas. Cuando los alumnos no responden una
pregunta, la conclusin usual del examinador es que no realizaron el esfuerzo necesario
para aprender el tpico. Requiere comprensin poco comn en el examinador pensar que la
enseanza puede haber sido inadecuada o la pregunta ambigua. Un modo de contrarrestar
sto es pedir las crticas o sugerencias de los colegas.
6. Reconocer la importancia del muestreo adecuado al elegir las preguntas. Algunos exami-
nados contestan mejor una clase de preguntas que otra. En general, las preguntas cuidado-
samente construdas solicitan respuestas cortas y pertinentes. La composicin extendida
que requiere organizar e integrar grandes cuerpos de informacin es ms apropiada como
tarea de aprendizaje que de examen. La situacin de examen es una situacin restringida y
hay ciertos juicios evaluativos que demandan otros tipos de evidencias
76
o la observacin a travs de un perodo de tiempo. Algunos examinadores ofrecen preguntas
alternativas, lo que en algunos casos puede justificarse; por ejemplo cuando la variabilidad
en experiencias previas o en capacidad es grande. El problema es la comparabilidad y la
asignacin de puntajes para quienes eligen las ms complejas. Otro problema radica en la
seleccin por parte del estudiante por la apariencia de la pregunta ms que por el contenido;
el enfoque superficial de quienes conocen menos para juzgar la complejidad, la apreciacin
por la forma de la pregunta ms que por la respuesta que hay que escribir, la imposibilidad
de cambiar de pregunta luego de la eleccin.
8. Ser concientes de las limitaciones de las pruebas al emitir juicios (influencias del error y
del muestreo)
Algunos estudios muestran que existen al menos cinco caractersticas de las pruebas
de ensayo que afectan la variabilidad de las notas asignadas por los examinadores:
ideas, forma, sabor estilo, presentacin, ortografa.
Existe acuerdo en reconocer que cuanto ms breve y directa la pregunta, mayor la con-
sistencia al puntuarla y mayor el nmero de cuestiones a incluir en una prueba. Sin embargo,
77
las preguntas muy especficas corren el riesgo de convertirse en memoristas.
Quienes defienden el uso de las pruebas de ensayo caracterizan a las pruebas objetivas
como medidas de reconocimiento. Sin embargo, esto es una simplificacin: los buenos tems
de las pruebas objetivas exigen al examinado desarrollar un fundamento para elegir entre las
opciones alternativas. Inventar o construir una respuesta no es necesariamente una tarea ms
compleja o difcil o indicativa de habilidades superiores que elegir la mejor respuesta. El aje-
drez, que pocos consideraran como un juego simple o superficial, es, en esencia, una prueba
de seleccin mltiple en la que el sujeto debe elegir entre un nmero limitado de opciones la
mejor. Asimismo, la eleccin de opciones limitadas y claramente definidas forma parte de mu-
chas actividades acadmicas, profesionales y de la vida real.
78
MEJORAMIENTO DE
LAS PRUEBAS DE ENSAYO
Dado el vasto empleo que se hace de los exmenes y que an dentro de un sistema
ideal, los maestros y profesores se ven necesitados de tomar exmenes y evaluarlos, es
preciso considerar en forma cuidadosa la manera en que pueden perfeccionarse dichos ins-
trumentos.
2.Formular, del modo ms preciso posible, aquello que se desea medir. Esto implica en
primer lugar, una concepcin clara de los objetivos o propsitos que deben guiar la pre-
paracin del examen.
4.Una vez definido el campo, el examinador deber seleccionar los aspectos ms impor-
tantes. Deber intentar un muestreo amplio y representativo. Deben eliminarse las
superposiciones de temas. Se deben prever la extensin y el tiempo que pueden insumir
cada una de las respuestas. No pedir demasiado, ni demasiado poco en el tiempo que se
dispone.
5.Tratar de seleccionar las preguntas, contando con una anticipacin de las posibles
respuestas. El examinador har esto basndose en su conocimiento de la forma en que
suele operar la mente de sus alumnos a travs de su experiencia con las respuestas que
ha podido recoger anteriormente.
6.Al plantear la seleccin de las preguntas, determinar el margen de libertad que puede
permitirse a la respuesta. No olvidar que preguntas demasiado amplias pueden llevar a
respuestas insatisfactorias, entre otras razones, porque inducen al examinado a tratar de
adivinar la intencin fundamental de la pregunta. Mayor xito se deriva de preguntas que
son ms restringidas, pero que dan al candidato, sin embargo, una amplia oportunidad
79
para reunir sus ideas, organizarlas y expresar el resultado con sus propias palabras,
aunque el producto final conste slo de unas pocas oraciones. Tales preguntas dan opor-
tunidad para que el candidato seleccione libremente entre su bagaje de conocimientos la
informacin adecuada a un problema particular, decidir cul es la mejor manera de pre-
sentar esta informacin o razonamiento y componer y redactar la respuesta.
Varias ventajas derivan del hecho de que el examinado debe encarar problemas particu-
lares: a)porque es una situacin real; b) porque la tarea est definida; c) porque el exa-
minado sabe lo que se le pide.
8.La calificacin es ante todo una ubicacin de los escritos en orden de mritos y no un
intento de dar un juicio absoluto sobre el valor de cada escrito. Es recomendable em-
plear el procedimiento de la escala cualitativa para evaluar cada una de las respuestas y los
escritos en general.
80
PRUEBAS DE ENSAYO BREVE
Puede responder a las cuestiones en el orden que estime conveniente, siempre y cuan-
do deje bien aclarado el nmero correspondiente. Trace lnea despus de completar cada
una.
Planifique su tiempo de acuerdo con su ritmo personal de trabajo, pero sin demorarse
excesivamente en una pregunta determinada.
Buena suerte!
81
Primera parte
Segunda parte
5. mencione tres de las capacidades que pone en juego la escena segn el modelo de
Gagn.
6. describa brevemente las memorias episdica y semntica, ilustrando cada tipo con un
ejemplo tomado de la historieta.
7.la situacin puede utilizarse como contraejemplo del mtodo clnico. Mencione tres
razones que lo ilustren.
82
Tercera parte
Para las situaciones, problemticas o interrogantes que se presentan, seleccione tres de las
mismas. Responda brevemente, indicando las ideas, razones o elementos principales:
83
Clave de respuestas
Orientaciones Generales:
.Se ha tratado de que cada respuesta contenga tres elementos de modo de facilitar una
puntuacin ms discriminativa. En general, el criterio debera ser:
2 puntos para las respuestas que contengan los tres elementos.
1 punto para las que contengan dos elementos o tres poco pertinentes para el
tema
0 punto para las respuestas inadecuadas, incorrectas o no pertinentes.
.De este modo, el puntaje mximo 30 que luego se convertir en la escala usual de 0 a
10. La zona crtica de puntuacin es la comprendida entre 9 y 12 porque decide el aprobado-
desaprobado y 18 y 21 porque marca el lmite promocin directa-tradicional. En stos casos
es conveniente someter la prueba a ms de un evaluador para asegurarse y evitar, dentro de
lo posible, el uso de puntajes limtrofes.
.Los criterios generales para evaluar el contenido son: a.- respuestas que revelen lec-
tura de los materiales; b.- respuestas que se adecuen, resulten pertinentes a lo que se solici-
ta; c.- respuestas que revelen uso comprensivo de la terminologa; d.- respuestas que reve-
len comprensin de la situacin presentada, en funcin de los elementos tericos. En caso
de duda, dos medidas tiles para disiparla son: 1.- recurrir a la bibliografa; 2.- consultar a
otros docentes de la ctedra para que decidan en forma independiente, sto es, sin conocer
el juicio del primer puntuador.
.La clave de respuestas es tentativa. Por lo tanto pueden aparecer respuestas que no
esten contempladas en la clave pero sean aceptables an mejores que las previstas. La su-
tileza de algunos alumnos puede ser mayor que la de los docentes de la ctedra!
.La actitud general del evaluador en una prueba de ste tipo debe ser flexible y el 10
una nota alcanzable sin ser dadivoso. Una prctica aconsejable es ponerse en los zapatos
del examinado y pensar qu habra contestado uno a la pregunta. Estas advertencias son
especialmente aplicables a las cuestiones que requieren mayor creatividad para aplicar el
conocimiento y para aquellas que solicitan un manejo ms puntual de la informacin.
.Un consejo final:no utilicemos la prueba como un instrumento para ejercer poder (como
a veces se hace, sino como un medio para la mejora de la enseanzay el aprendizaje.
Primera Parte
N 1
. deficiencias en la presentacin
. programacin ( aproximaciones sucesivas )
. tamao del paso ( pasos muy grandes, baches )
. graduacin o secuencia de los pasos, materiales y tareas
. falta de indicios y claves para ayudar a la discriminacin y por tanto al mantenimiento.
84
. escasa atencin al ritmo individual del alumno
. falta, escasez o inadecuacin del reforzamiento ( contnuo en la adquisicin, intermi
tente en el mantenimiento de las respuestas aprendidas).
. falta de retroalimentacin, feedback o conocimiento de los resultados.
. aumento de errores al aumentar la dificultad y complejidad de los materiales.
. uso inadecuado de los reforzadores
. contingencias respuesta-refuerzo
. refuerzo no inmediato (prdida de su valor confirmatorio)
. escasez de reforzadores disponibles
. falta o inadecuacin del refuerzo necesario para mantener la respuesta
. descuido por la actividad o participacin activa del alumno.
Nro. 2
Nro. 3
85
puede hacer el aprendizaje al desarrollo en trminos de habilidades y potencialidades. La
idea general reside en que el desarrollo proviene de los efectos acumulativos del aprendizaje
con las limitaciones impuestas por la maduracin. El ejemplo ilustrara el descuido por las
capacidades aprendidas que intervienen en el proceso de desarrollo.
Nro. 4
Segunda Parte
Nro 1
Nro. 2
86
. Imposicin de la lgica del adulto (el adulto es el centrado).
. No se toman las respuestas del alumno para proseguir el interrogatorio ni se exploran las
razones de las respuetas infantiles;
. Las respuestas infantiles se desechan como errneas (tratamiento del error);
. No se favorece, ms bien se obstaculiza la expresin de los contenidos mentales del alum-
no.
87
TEMS DE ENSAYO BREVE
1.Se compararon grupos de nios cuya dieta era de alto y bajo valor calrico respectiva-
mente en cuanto a su rendimiento escolar. Este result significativamente ms alto para
el primer grupo. Qu mtodo/s se utiliz? Cmo lo sabe?.
3. Gesell inform que a uno de dos gemelos se le dio entrenamiento para iniciarlo en salto
mientras que al otro no; sin embargo los dos aprendieron a saltar a la misma edad. A
qu proceso podra atribuirse esa diferencia? Qu mtodo/s se utiliz?
88
zaron? Cmo lo sabe?
10.Un psiclogo est interesado en los cambios de los juegos de los nios a medida que
crecen. Selecciona un gran nmero de nios de diferentes edades y registra con quienes
juegan y a qu juegan. Qu mtodo/s utiliza? Qu caracterstica/s del estudio le da a
Ud. Informacin para distinguir el mtodo/s?
89
EXMENES ORALES
Fuente: Robert Ebel. Redicin del Aprov. Educ., 1972.
La historia de los exmenes orales es muy antigua. Hasta hace un siglo eran la forma
de comprobacin predominante en las escuelas. En la actualidad slo ocasionales voces se
alzan para proclamar sus virtudes como pruebas escolares. Con todo, siguen gozando de
favor para algunos fines. El examen final del doctorado es por lo comn oral. En tal contexto,
cumple una funcin ms ceremonial que evaluativa. Los exmenes orales son valuados de
una manera particular en el otorgamiento de certificados o en la seleccin de profesionales
cuyo trabajo requiere relacin asidua con personas: docentes; especialistas mdicos; poli-
cas y otros funcionarios pblicos.
Esencia y Variaciones
En esencia, el examen oral hace intervenir a dos personas que se encuentran cara a
cara. El examinador hace preguntas. El examinando trata de responderlas. El examinador
insiste con nuevas preguntas o acepta la respuesta. Por ltimo, juzga la calidad de las res-
puestas y califica de acuerdo con ella al examinando. Muchas veces la calificacin se reduce
a aprobado o aplazado.
Las entrevistas que se realizan para incorporar personal incluyen con frecuencia al-
gn tipo de examen oral, y existe cierta similitud en ambos casos en los principios que deben
aplicarse. Es acertado considerar los exmenes orales como un tipo especial de prueba de
rendimiento, pero dado que estn rodeados de circunstancias muy especiales el carcter
definitorio y la tensin, el status desigual de los participantes -), el rendimiento que se mani-
fiesta en ellos no puede considerarse como una conducta tpica.
Justificaciones
90
se pueden evaluar caractersticas personales que sera imposible evaluar en una comproba-
cin escrita, por ejemplo la apariencia, modales, personalidad, vivacidad, franqueza, toleran-
cia de las tensiones, estilo y calidad de lenguaje. En una palabra, se puede juzgar mejor la
impresin que el examinando causar a otra persona.
A pesar de lo dicho, las pretensiones de los entusiastas de las pruebas orales resultan
a veces excesivas. Un examen oral no es ms eficaz que otro escrito en lo que hace a eva-
luar rasgos intangibles, mal definidos, como el carcter, la creatividad o la aptitud general.
Aquellos que consideran que el examen oral evala la capacidad del examinando para pensar
bajo el fuego, o dicho con ms precisin, para pensar ms eficazmente estando sometido a
tensiones, pasan por alto el hecho de que la mayora de las personas piensan mejor cuando
no se hallan bajo tensin. La capacidad de no cortarse en situaciones de tensin no puede
considerarse un buen indicador de la eficacia general de alguien. Pero los defensores de los
exmenes orales deben evitar la pretensin de que stos miden capacidades tales como
lealtad para con la organizacin, honradez, aplicacin, integridad y hasta la capacidad de
trabajar en equipo con otros, porque todas estas son caractersticas que los examinandos
tienen pocas oportunidades para mostrar y los examinadores para observar en el contexto del
examen oral.
Limitaciones
Los exmenes orales tienen ciertas limitaciones intrnsecas, que explican el hecho de
su limitacin virtual como instrumentos de evaluacin educacional. Como el examen oral es
por esencia un proceso individual, consume mucho tiempo, sobretodo si cada comprobacin
tiene la duracin que necesariamente debe tener (30 minutos o ms)para suministrar una
muestra suficiente de las capacidades del estudiante. La necesidad de disponer de un tiempo
holgado se acenta cuando se emplea ms de un examinador para lograr una evaluacin
objetiva. Estas caractersticas hacen tambin que los exmenes orales sean costosos y com-
plejos en su administracin.
91
los rasgos y capacidades pertinentes. Otras influencias reducen tambin la validez del exa-
men. La tensin que surge de la relacin personal con el examinador perturba los procesos
mentales, normalmente eficaces, de algunas personas. En otras, la facundia y la simpata
personal pueden ayudar a encubrir las deficiencias reales.
Pero la mayor limitacin de los exmenes orales est dada por la dificultad de obtener
puntajes de razonable confiabilidad en un plazo razonable tambin. Investigaciones de Hartog,
Barnes y Pressey, Riggs, Trimble y otros confirman esta conclusin. Por otra parte, como lo
ha demostrado Carter y como hizo ver Trimble en otro estudio, es posible obtener evaluacio-
nes confiables cuando se cumplen ciertas condiciones. Si se emplean varios evaluadores, si
todos ellos centran su inters en las mismas cosas y si el examen es suficientemente prolon-
gado y estructurado, los puntajes de los exmenes orales pueden ser confiables y vlidos.
Con todo, para obtener este resultado se necesita ms cuidado y habilidad de lo que la mayo-
ra de los examinadores pueden dedicar.
1. Evtese recurrir a los exmenes orales cuando se puede idear una comprobacin escri-
ta que pueda cumplir la misma funcin con razonable eficacia.
Son pocas las ocasiones en las que debe emplearse un examen oral para evaluar el
dominio que un examinando posee de ciertos contenidos de conocimiento. Los exmenes
escritos de ninguna manera tienen las limitaciones de alcance y profundidad que algunos de
sus crticos parecen dar por supuestas. En general, los exmenes orales deberan reservarse
principalmente para ocasiones ceremoniales o para circunstancias en las cuales el principal
inters reside en la evaluacin de caractersticas de personalidad. De ninguna manera se los
debe emplear para evaluar rasgos intangibles, mal determinados.
2. Debe definirse con claridad el objetivo del examen y el fundamento sobre el cual se
juzgarn los rendimientos del examinando.
Los rasgos de personalidad o las habilidades que se desea evaluar tienen que definirse
de una manera libre de ambigedad. Asimismo deben definirse la escala en que se expresa-
rn las calificaciones y la nota de aprobacin. Saxe, Hartnett, Carter, Graham, Hartog y Trimble
describen diferentes escalas de calificacin. Deben especificarse tambin las maneras con-
venientes e inconvenientes de preguntar y la orientacin que deben seguir las preguntas.
92
una evaluacin impuesta y se someten a ella de mala gana, difcilmente se comporten de
manera responsable.
4. Si es posible, conviene tomar medidas para que el examinando sea escuchado en dos
sesiones independientes, con diferentes conjuntos de examinadores.
5. Hay que preparar a los examinandos para que den una impresin fiel de s mismos en el
examen.
Los examinandos deben conocer la finalidad del examen, los fundamentos que se
emplearn para medir su competencia, la ndole general de las preguntas que se harn y los
procedimientos que se aplicarn. Si los examinadores consideran que es lcito hacer pregun-
tas ajenas al tema o imposibles de responder (para comprobar si el estudiante puede recono-
cer tales preguntas), los examinandos tienen que estar enterados de esa posibilidad.
6. Se deben recoger datos para poder controlar la confiabilidad de los puntajes obtenidos
en cada examen.
93
Observaciones Finales
Aunque la forma oral parece a veces aportar una solucin preferible o fcil para un
problema de exmenes, rara vez sucede as. Si se la considera con mayor atencin, la apa-
rente superioridad del mtodo oral tiende a diluirse en el yermo de las dificultades y en las
nieblas de la falta de confiabilidad. Ms tarde o ms temprano, la mayora de las autoridades
encargadas de los exmenes vuelven nuevamente a los mtodos ms precisos y ms fciles
de aplicar. Es posible emplear con eficacia los exmenes orales, pero la mayora de las
veces las dificultades que presentan hacen que carezcan de atractivo.
94
PRINCIPIOS PARA CONDUCIR EXMENES ORALES
1. Usarlos para los propsitos adecuados segn su naturaleza. Por ejemplo, para obtener
informacin acerca de la profundidad del conocimiento del estudiante, en casos donde la
presentacin oral es un propsito del curso o en las situaciones en que los otros tipos de
exmenes resultan inadecuados.
5. Presentar preguntas en forma que el estudiante pueda identificar lo que se le pide con
un mnimo de dificultad.
6. Cuando se emplean varios examinadores, responsabilizar a cada uno de una parte es-
pecfica del examen.
8. Presentar las cuestiones que, dado lo que se ha enseado, puede esperarse que un
estudiante sepa contestar. Un examen no es el lugar apropiado para que el profesor pue-
da mostrar su propia erudicin.
9. Usar preguntas generales y especficas, pero hacerlo de acuerdo con algn orden lgi-
co.
11.Desarrollar algunas tcnicas para facilitar el desarrollo del examen tales como: a) crea-
cin de una atmsfera cordial; b) entrenamiento en la manera de formular preguntas; c)
disear algn mtodo para registrar las respuestas.
12.Llevar algn registro escrito del desempeo del estudiante mientras se desarrolla el
examen sin que esto perturbe al alumno.
95
13.Permitir un tiempo necesario para que el estudiante medite su respuesta.
96
ANTEPROYECTO PARA LA INCORPORACIN DEL
EXAMEN ESCRITO. FACULTAD DE HUMANIDADES.
UNLP
Mara del C. Malbrn
. Las pruebas escritas debern constituir una muestra representativa del programa vi-
gente de la asignatura
. Se acompaaran de una clave de correccin que se elaborar simultneamente al te-
mario. En ella constarn los criterios para determinar el grado de correccin de las res-
puestas as como el puntaje previsto en cada caso
. Las pruebas debern demandar del estudiante aprendizajes complejos tal como corres-
ponde al nivel superior de la enseanza, esto es, desalentarn la reproduccin rutinaria o
memorista y la trivialidad, abarcando tanto el dominio de la informacin como las habili-
dades para operar con la misma.
. Los docentes de la ctedra (profesores titulares y adjuntos) tendrn libertad para deci-
dir el tipo de instrumento a utilizar (pruebas tipo ensayo, pruebas objetivas, pruebas mix-
tas, etc.). Esta informacin sobre la estructura del examen deber hacerse conocer a los
estudiantes en el programa de la asignatura
97
simultneamente. Si las cuestiones fueran presentadas en el pizarrn o dictadas a la
audiencia, las hojas en blanco a utilizar sern autenticadas por los profesores de la cte-
dra previamente
. Las instrucciones para completar la prueba se brindarn en voz alta para todos los
examinados. Luego se dejar un tiempo para evacuar consultas y dudas. No se permitirn
preguntas o solicitudes de aclaracin durante la realizacin del examen
. En caso de ser desaprobado el examen escrito, los criterios a seguir sern los mismos
que se establecen para el examen oral
. Las pruebas escritas no sern devueltas al alumno sino que quedarn archivadas en la
Facultad
. La Facultad podr designar vedores autorizados para controlar la legalidad de los pro-
cedimientos
. El alumno cuya conducta no se ajustara a las pautas establecidas, ser retirado del
recinto. En este caso se considerar que ha desaprobado el examen. Para evitar altera-
ciones en los otros examinados, el profesor comunicar en voz baja e individualmente
esta decisin al examinado que transgrediera las normas
. El alumno que por cualquier motivo solicitara salir momentneamente del recinto no podr
volver a ingresar al mismo y perder el derecho a rendir examen en ese turno. El examen se
98
considerar desaprobado
. El alumno no podr solicitar ser examinado con otro tipo de recurso de evaluacin si el
programa de la asignatura no lo contempla explcitamente
. Los examinados debern cuidar la legibilidad utilizando una clara grafa, evitando el
uso de abreviaturas no convencionales y organizando el material de modo de facilitar su
lectura por parte del evaluador. La mesa examinadora podr rehusar calificar un examen
que no cumpla con estos requisitos elementales
. Las pruebas debern ser firmadas y la firma aclarada por el estudiante. Cuando se
utilicen varias hojas, las mismas debern ser numeradas por el examinado
. Evaluada la prueba y asignados los puntajes, el alumno podr pedir vista de la misma y
de la clave de correccin con la que fue calificada
. El alumno tendr derecho a cuestionar la validez de la prueba para lo cual deber
presentar por escrito sus objeciones al Departamento respectivo
. analizar
. explicar
. encontrar relaciones
. comparar
. integrar
. expresar ideas en forma lgica y pertinente
. seleccionar ideas significativas
. organizar y sintetizar ideas
. extraer conclusiones
99
. interpretar, generalizar, extrapolar informacin
. describir secuencias de desarrollo
. aplicar ideas o habilidades en la resolucin de situaciones y problemas
. evaluar ideas segn diferentes criterios
100
INSTITUTO PARA EL MEJORAMIENTO
DE LA ENSEANZA DE LAS CIENCIAS
(INEC)
PROGRAMA REGIONAL DE DESARROLLO EDUCATIVO O.E.A.
LOS OBJETIVOS:
1. La sola observacin tiene poco valor a menos que sea precisa y pertinente. Su evalua-
cin se apoya principalmente en la habilidad del estudiante para informar, siendo inevita-
ble que en su mayor parte toma la forma de calificaciones adjudicadas por los informes
escritos de observacin. Pero existen dos aspectos de la observacin para los que los
profesores pueden conceder crdito, en tanto que no puede hacerlo un examen prctico
convencional, y es de esperar que ninguno de ellos sea pasado por alto. El primero es el
informe oral, que habitualmente es ms inmediato y menos ensayado que el escrito. El
segundo es la observacin e inters de los estudiantes por los rasgos inusuales e inespe-
rados de un experimento an cuando no sean pertinentes para el propsito inmediato del
mismo. No ser fcil calificar estos dos aspectos pero al menos podran ser acreditados
en una revisin peridica que clasifique la actitud de cada estudiante hacia los trabajos
prcticos.
101
slo puede hacerse en aquellos experimentos en los que se brinda a los estudiantes infor-
macin restringida sobre el procedimiento. Debera incluir la habilidad para reconocer las
fuentes de error y la habilidad para hacer predicciones acerca de otros experimentos.
Puede ser posible para los profesores usar experimentos especficos para evaluar algu-
nos componentes de la destreza manipulativa, particularmente produccin, pureza y pre-
cisin. Sin embargo, muchos profesores consideran que una calificacin basada en una
impresin general del trabajo durante un perodo de, digamos, un trmino lectivo o an un
ao, es ms apropiada para los aspectos menos exactos de la destreza manipulativa, que
slo puede evaluarse mediante la observacin directa. Si se usa una calificacin peridi-
ca es importante que los profesores busquen concientemente la evidencia de las destre-
zas durante todo el perodo y no se fen simplemente de su memoria al finalizar el mismo.
5. Para el propsito de esta evaluacin las actitudes pueden ser divididas en tres catego-
ras:
102
Tipos de Trabajo
En el curso pueden identificarse tres tipos principales de trabajo; los examinadores espera-
rn ver cada uno de ellos usado en la evaluacin, aunque no necesariamente con el mismo
peso.
1. Trabajo cuantitativo
2. Trabajo preparatorio
3. Trabajo cualitativo
Al comienzo del curso se podra decir a los estudiantes que sus trabajos prcticos
sern evaluados y que los resultados se enviarn a los examinadores. Tambin podran cono-
cer, en trminos generales, las cualidades que los profesores tendrn en cuenta. Asimismo,
se les podra decir que la evaluacin ser ms evidente en algunas ocasiones que en otras,
pero que generalmente tendr lugar el trabajo corriente y no en oportunidades especiales.
Puede tranquilizarlos saber que la calificacin promedio para los trabajos prcticos ser ma-
yor que para los exmenes escritos.
Existen tres formas principales en las que pueden adjudicarse las calificaciones, y los
profesores probablemente encontrarn que tienen que usar todas ellas;
2.Calificacin por impresin en una ocasin particular. Ser til calificar pruebas menos
precisas que las mencionadas en 1. Por ejemplo, un profesor puede desear evaluar la
destreza en el manejo de un aparato poco familiar, digamos un cromatgrafo. Esto puede
hacerse mejor mediante la observacin directa de los estudiantes en el trabajo, pero la
tarea no resulta fcil en una clase numerosa. Los profesores deberan tratar de evaluar
por impresin slo una de tales cualidades durante un experimento. Adems, general-
mente estn demasiado ocupados como para hacer ms que tomar nota de aquellos que
lo hacen bien o mal; al resto slo se lo puede calificar por el trabajo promedio.
103
para el trabajo del nivel A en general. El primero tiene la desventaja de que un profesor
no puede estimar el nivel general de habilidad prctica de su grupo hasta haberle ensea-
do durante un tiempo. La desventaja del ltimo reside en que depende de la experiencia
del profesor en el trabajo de nivel A. Ya que, de todos modos, las calificaciones brutas
se graduaran (scaled) en una norma, lo que importa es su distribucin y consistencia
interna. Sin embargo, es deseable alguna uniformidad y se ha decidido que los profesores
debieran tratar de juzgar cul es el promedio del trabajo a partir del nivel A en general
ms que a partir de su grupo de enseanza.
As:
Trabajo promedio 3
104
EVALUACION DE TRABAJOS PRACTICOS EN QUIMICA
1. Destreza en la observacin 25 %
4. Destrezas manipulativas 30 %
Las pruebas domiciliarias o para llevar a casa son esencialmente similares a las
pruebas de libro abierto. Presentan respecto a estas ltimas una ventaja y una desventaja:
. desventaja: falta de seguridad de que las respuestas de los estudiantes sean pro-
ductos exclusivos de su propio trabajo. Por esta razn, las pruebas domiciliarias resultan
ms adecuadas como ejercicio de aprendizaje que como pruebas de rendimiento. Debe sea-
larse sin embargo, que los esfuerzos que algunas veces producen y el grado de aprendizaje
resultante las convierte en un recurso interesante.
Un problema digno de ser tenido en cuenta cuando se emplea este tipo de recursos
radica en la clave de correccin: hay que dar a conocer los criterios para juzgar las respues-
tas y dar oportunidad a los estudiantes para analizarlas y discutirlas, y estar preparados para
brindar las justificaciones necesarias.
106
PRUEBAS DE LIBRO ABIERTO
8. Resulta ms difcil determinar si hay intercambio de respuestas o copia por parte del
estudiante.
107
EMPLEO DE PRUEBAS
POR TEMA Y DE PRUEBAS OBJETIVAS
Conviene emplear las pruebas por temas para medir el rendimiento educacional cuando:
Se emplearn las pruebas objetivas para la medicin del rendimiento educacional cuando:
1.el grupo que debe evaluarse es grande o la prueba debe usarse nuevamente.
2.se pueden obtener con eficiencia puntajes de prueba confiables.
3.la imparcialidad en la evaluacin, la ecuanimidad y la ausencia de efectos de halos son
esenciales.
4.el docente confa ms en su capacidad para formular con claridad tems de pruebas
objetivas que en su capacidad para juzgar correctamente las respuestas a una prueba de
composicin.
5.es ms urgente informar rpidamente los puntajes que preparar rpidamente la prueba.
1. medir casi cualquier rendimiento educacional importante que pueda estimarse median-
te una prueba escrita.
2. evaluar la comprensin y la capacidad para aplicar principios.
3. evaluar la capacidad para pensar crticamente.
4. evaluar la capacidad para resolver problemas nuevos.
5. evaluar la capacidad para seleccionar hechos y principios pertinentes y para integrar-
los en la solucin de problemas complejos.
6. estimular a los alumnos para que estudien teniendo como objetivo el dominio del cono-
cimiento.
108
DIFERENCIAS Y SEMEJANZAS ENTRE LAS PRUEBAS
POR TEMA Y LAS PRUEBAS OBJETIVAS
Los estudiantes dedican la mayor parte Los estudiantes dedican la mayor parte de
de su tiempo a pensar y a escribir su su tiempo a leer la cuestin y a pensar la
respuesta. respuesta.
La tarea del estudiante y la base sobre la La tarea del estudiante y la base sobre la
cual ser juzgada la calidad de su respues- cual ser juzgada la calidad de su respuesta
ta no estn siempre claramente especifica- estn especificadas con claridad.
das.
La distribucin de los puntajes puede ser La distribucin de los puntajes est determi-
controlada por quien califica la prueba. nada casi exclusivamente por la prueba.
109
Semejanzas
. Ambas pueden ser utilizadas para medir los rendimientos educacionales importantes de
una asignatura en forma escrita.
. Ambas son adecuadas para estimular a los examinados para que estudien procurando la
comprensin de los principios, la organizacin e integracin de las ideas y la aplicacin
del conocimiento a la resolucin de problemas.
. El empleo de ambas requiere la utilizacin de juicios subjetivos por parte del constructor.
110
ERRORES MS FRECUENTES
EN LA CONSTRUCCIN DE PRUEBAS
8. Ignorar el hecho inevitable de que el puntaje en la prueba es afectado por las preguntas
o tareas incluidas en ella y a subestimar la magnitud de los errores resultantes
111
PASOS PARA CONSTRUIR PRUEBAS DE APROVECHAMIENTO
4. Diagramar el texto
6. Aplicar la prueba
Implica la relacin entre los objetivos de la prueba con los propsitos del curso.
Cuestiones vinculadas:
. Qu me propongo que los alumnos muestren?
. En qu contexto?
. Con qu grado de eficiencia para ser considerado aceptable?
. Qu clases de desempeo estn includas y cmo jerarquizarlas?
. Cmo ordenar las categoras para darles la secuencia ms apro
piada?
. Respeta la jerarquizacin y nfasis de la prueba lo enseado en
el curso?
113
VI.- orientacin hacia las relaciones de la ciencia con otros asuntos humanos.
114
a nota. Identificacin de los tems que deben ser eliminados, cambiados sustancialmente o
mejorados en posteriores ediciones de la prueba.
115
COMO SE PREPARA, APLICA Y EVALUA UN TEST
La preparacin final del test comprende revisar y redactar los tems ... disponer los
tems en cierto orden lgico ... y preparar instrucciones claras ... Despus que se ha
aplicado y calificado el test, los procedimientos de anlisis de tems pueden ayudar a
determinar la eficacia de cada uno de ellos.
Cuando se elaboran tems para un test particular es necesario, por lo general, prepa-
rarlos con una o dos semanas de anticipacin. Algunos maestros preparan diariamente unos
cuantos tems mientras an estn pensando en el material expuesto en clase. En cualquier
caso, la preparacin anticipada hace posible olvidarse de los tems por cierto tiempo, de
modo que se puedan revisar ms tarde desde una perspectiva ms fresca. Tambin es reco-
mendable preparar ms tems de los que pide una tabla de especificaciones por la probabili-
dad de que aparezcan defectos en algunos de ellos cuando se proceda a la revisin final. Los
tems extra facilitaran mantener la distribucin de ellos, determinada por la tabla de especi-
ficaciones. Si se tiene la fortuna de terminar con ms tems buenos de los que exija la tabla
de especificaciones, los tems extra se podrn archivar, en previsin de un uso futuro.
Durante la preparacin de los tems, se escribirn uno por uno en tarjetas diferentes
de 13 por 20 cm. Esto simplificar la tarea de revisar los tems, disponerlos en el test y
archivarlos para usarlos posteriormente. Gracias a esto, se dispondr tambin de un lugar
adecuado para registrar los datos del anlisis de tems, para cuando ms tarde se evale la
eficacia de cada uno de ellos.
El conjunto de tems para un test particular, despus de haberse hecho a un lado por
cierto tiempo, puede ser revisado por el maestro que lo elabor o por uno de sus colegas. En
cualquier caso, es muy til leer cada tem y contestarlo como si se estuviera aplicando el
test. Se comprobar as la respuesta correcta y se revelar cualquier defecto obvio. Se pue-
de hacer una evaluacin ms cuidadosa de los tems, considerndolos a la luz de las siguien-
tes preguntas:
Cada tem debe relacionarse con una de las celdas de la tabla de especificaciones,
que se elabor originalmente para medir un aspecto del contenido de la materia y la conducta
116
del estudiante especificada en la tabla. Si en el momento en el que se elabor el tem, se
apreci la celda a la cual ste se refiere, entonces ser simplemente cuestin de leerlo y
volver a comprobar su propiedad. Las preguntas de ensayo y los tems objetivos de tipo
complejo, naturalmente, necesitarn comprobarse respecto de varias celdas de la tabla.
2.Es cada tipo de tem adecuado al resultado particular del aprendizaje que se ha
de medir?
Ciertos resultados del aprendizaje pueden medirse con cualquiera de los tipos comu-
nes de tems. En este caso, es preferible el tem de opcin mltiple. No obstante, puede ser
necesario el test de completacin o de ensayo cuando el resultado del aprendizaje pide que
se suministre la respuesta. De la misma manera, si solamente son razonables dos alternati-
vas, el tem verdadero-falso ser ms til o, si el resultado demanda que se relacionen una
serie de elementos homogneos, el ms eficaz ser el de correspondencia. La revisin de
tems permite otra comprobacin de la propiedad de cada tipo de ellos con respecto a los
resultados que se van a medir.
El problema presentado por un tem, cualquiera que sea su tipo, deber ser tan claro
y preciso que todos los estudiantes entiendan la tarea que se les pide. Las equivocaciones en
un tem debern obedecer a falta de conocimiento o de la capacidad intelectual exigida por el
mismo. Aunque la ambigedad es un problema de primer orden en la elaboracin de test, es
por fortuna una deficiencia que se hace patente cuando se realiza una nueva revisin de los
tems.
Este punto se relaciona obviamente con el anterior, aunque aqu la atencin se dirija
ms directamente hacia el nivel de lectura del tem. Excepto por los trminos tcnicos que
constituyen parte necesaria del problema, el vocabulario debe seguir siendo sencillo. De la
misma manera, sern preferibles frases cortas en lugar de largas y complejas. Estos dos
factores pueden contribuir a que desaparezca la ambigedad, pero algo no menos importante
es que le dan al lector deficiente la oportunidad de que demuestre su nivel de aprovecha-
miento de manera ms adecuada. La capacidad de lectura es algo que vale la pena medir por
s misma, con todas las precauciones posibles para que no interfiera con la medicin de otros
resultados.
117
les, las inconsistencias gramaticales y claves similares que se pueden pasar por alto fcil-
mente durante la elaboracin de los tems.
6.Es la dificultad del tem adecuada a los estudiantes que habrn de someterse al
test?
Los tems de pretest, los tests de diagnstico y los de dominio tienden a poseer grados
de dificultad relativamente bajos. No obstante, para los test de aprovechamiento general se
prefieren los tems de un 50% de grado de dificultad, es decir, los tems a los cuales la mitad
de los estudiantes responde correctamente. Como veremos ms adelante, el 50% de grado
de dificultad permite la discriminacin mxima entre los estudiantes de mayores puntuacio-
nes y los de puntuaciones menores. Aunque los juicios que de primera mano, hacemos acer-
ca de la dificultad del tem estn propensos a tener baja confiabilidad, puede estimarse en
parte la adecuacin de los tems para el grupo y as tambin disponerlos con arreglo a su
dificultad. Al revisar la dificultad de los tems, es recomendable tener en mente que la mayor
parte de los maestros tienden a equivocarse en cuanto elaboran tems demasiado fciles
para el grupo al que se han de aplicar.
7.Son los tems independientes entre ellos y, en tanto que grupo, estn a sal-
vo de traslaparse?
Adems de estas cuestiones generales aplicables a todo tipo de tems, las reglas para
elaborar cada tipo especfico tambin proporcionan criterios para evaluarlos. Por ejemplo, al
revisar los tems de opcin mltiple merecen atencin especial la integridad del problema
presentado en el pie, la inclusin de una respuesta que claramente sea la ptima y que las
respuestas de distraccin parezcan razonables. Inmediatamente antes de revisar el grupo de
118
tems puede ser de utilidad la preparacin de una lista de comprobaciones de los criterios,
basada en las reglas de elaboracin de cada tipo de tems.
Cuando se ha completado la seleccin de los tems y stos ya estn listos para inte-
grarse al formato del test, ha llegado el momento de decidir cul ser la mejor forma de
ordenarlos:
1.se deben disponer los tems de modo que todos los de igual tipo queden den-
tro del mismo grupo
Un procedimiento bastante comn consiste en agrupar todos los tems de opcin ml-
tiple con los de verdadero-falso, los complejos, las preguntas de ensayo, y as sucesivamen-
te. Esta disposicin permite disponer de un conjunto especfico de instrucciones para cada
tipo de tems al principio de cada seccin del test. Puesto que el estudiante mantiene un
mtodo uniforme de responder a lo largo de cada seccin, tal disposicin contribuir tambin
a resolver eficazmente el test. Por ltimo, esto mismo tender a simplificar la calificacin y el
anlisis de los resultados.
3.Para ciertos fines puede ser deseable agrupar los tems que midan los mismos
resultados del aprendizaje o el mismo contenido de la materia.
119
primer caso, por ejemplo, se podran agrupar todos los tems de opcin mltiple de acuerdo
con las categoras taxonmicas (es decir, el conocimiento, la comprensin, la aplicacin,
etc.).
Tal disposicin satisfara el requisito del orden de dificultad creciente y sera til tanto para
diagnosticar las dificultades de aprendizaje de los estudiantes como para poner de relieve los
diferentes resultados del curso. En el segundo caso, se pueden agrupar todos los tems que
clasifiquen contenidos similares de la materia. Por ejemplo, los tems de historia se pueden
poner con arreglo a las pocas, los tems de biologa de acuerdo con clases de plantas o de
animales, y as sucesivamente. Aunque cualquiera de estos mtodos de disponer los tems
demuestre su utilidad en un test particular, se le debe dar preferencia al agrupamiento de los
tems del mismo tipo y al arreglo de estos respecto de su dificultad ascendente.
Ejemplo
Instrucciones : Este es un test de lo que usted ha aprendido durante las primeras cinco se-
manas del curso. Sus resultados se utilizarn para esclarecer cualquier dificultad y as poder-
le ayudar a completar satisfactoriamente el curso.
Hay 60 tems de opcin mltiple y usted dispondr de una hora para completar el test.
En cada tem, elija la respuesta que complete mejor el enunciado o que responda mejor a la
pregunta y encierre en un crculo la letra correspondiente.
Como la calificacin que usted obtenga depender del nmero de tems que responda correc-
tamente, asegrese de responder a todos.
Cuando el mismo test comprende dos o ms tipos de tems, por lo general se reco-
mienda proporcionar instrucciones generales para la totalidad del test e instrucciones espe-
ciales para cada parte. Cuando se hace esto, las instrucciones generales debern contener la
informacin relativa al propsito del test, al tiempo disponible y a lo que se debe hacer res-
pecto de las conjeturas, al paso que las instrucciones especiales debern referirse a la mane-
ra de responder en las secciones particulares del test. Asimismo, algunos tems, como los
ejercicios de tipo clave, requerirn tambin instrucciones especiales.
120
El uso de hojas de respuestas presentadas por separado requiere cierta elaboracin
de las instrucciones para el registro de las respuestas. Si los estudiantes no estn familiariza-
dos con el uso de hojas de respuestas separadas, es recomendable presentar un tem de
muestra con la respuesta correcta marcada adecuadamente. Existen varios tipos de hojas
separadas de respuestas y las instrucciones especficas, claro est, necesitarn adaptarse al
tipo particular de hoja que se use. No obstante, a menos que se vaya a usar una mquina
para calificar, de ordinario ser satisfactoria una hoja de respuestas elaborada por el maes-
tro, en que simplemente aparezca una lista de las letras correspondientes a las opciones de
cada tem, como el siguiente ejemplo:
ITEM RESPUESTA
1. A B C D E
2. A B C D E
3. A B C D E
4. A B C D E
Con una hoja de respuestas de este tipo, las instrucciones debern pedirle al estu-
diante que marque con una X la letra correspondiente a la mejor respuesta. Tachar la res-
puesta es mejor que encerrarla en un crculo, ya que tales marcas son ms visibles a travs
de las perforaciones de una plantilla para calificar. Con este tipo de hoja de respuestas, la
preparacin de una clave de calificacin consiste solamente en perforar las letras correspon-
dientes a las respuestas correctas de cada tem.
Es punto controvertido el relativo a corregir las puntuaciones de los tems por las
respuestas dadas al tanteo, aunque tal controversia se presenta principalmente en relacin
con los tests estandarizados. Como los tests de aprovechamiento estandarizados contienen
por lo comn cierto material inadecuado al grupo que se somete a prueba, y como puede
suceder que no todos los estudiantes tengan la oportunidad de finalizarlo, es defendible la
prctica de advertir a los estudiantes que habr una penalidad para las respuestas dadas al
tanteo. Naturalmente, el propsito de sto es desalentar a los alumnos que pretendan mejo-
rar sus puntuaciones tratando de adivinar algunas de las respuestas. No obstante, tales ins-
121
trucciones no tienen un efecto uniforme sobre ellos. Es probable que el estudiante temerario
siga adivinando a diestra y siniestra en tanto que el estudiante ms cauteloso hasta renuncie
a responder con base a conjeturas apoyadas en un conocimiento aceptable.
Puede haber ciertos cursos o unidades de stos en donde la precisin reciba tanta
atencin durante la enseanza que tambin sea deseable ponerla de relieve durante los test.
En este caso seran apropiadas las instrucciones de no responda al tanteo. Tambin seran
apropiadas en el caso de que se hiciera una prueba de velocidad, es decir, una en que los
estudiantes no tuviesen tiempo suficiente para considerar todos los temes. En ambos casos
se deber informar a los estudiantes que se aplicar una correccin por las respuestas dadas
al tanteo. Durante la calificacin se habr de aplicar la siguiente frmula de correccin por
respuestas al tanteo:
Para aplicar esta frmula de correccin por respuestas al tanteo, basta contar el n-
mero de respuestas correctas y el nmero de incorrectas que contenga una hoja de test e
incorporar estos nmeros a la frmula. No se cuentan los tems omitidos. As pues, si un
estudiante tiene 40 tems correctos y 6 incorrectos en un test de opcin mltiple de 50 tems
de cuatro opciones, su puntuacin corregida se computar de la siguiente manera:
40 6 = 40 2 = 38
3
En este caso se supone que el estudiante respondi al tanteo en 8 de los tems y logr
aciertos por azar (es decir, 2 correctos, 6 incorrectos). La frmula elimina simplemente a las
122
dos respuestas correctas que se pueden explicar por aciertos casuales en el tanteo.
En el original que se emplear para la reproduccin del test, los tems debern estar
espaciados sobre la pgina de manera que sean fciles de leer y calificar. Si se usan tems de
opcin mltiple, las opciones debern enumerarse debajo del pie. Todas las partes de un tem
debern colocarse en la misma pgina. Para los tipos complejos de tems tal vez sea necesa-
rio presentar el material introductorio en la primera pgina o en una hoja independiente que
se debe proporcionar junto con el test.
Cuando las respuestas se deben dar sobre el mismo test se debern tomar medidas
para que se marquen las respuestas al lado izquierdo de la pgina. Esto simplifica la califica-
cin. Cuando se usan hojas independientes de respuesta y se administra el test a ms de un
grupo de estudiantes, de ordinario es necesario advertirles que no hagan marcas en los cua-
dernillos del test. Asimismo, una buena medida es hacer ms copias de las necesarias ya que
algunos estudiantes pasaran por alto tal advertencia.
123
de respuestas casi siempre lo mejor es perforar las letras de las respuestas correctas en una
copia de la hoja de respuestas y utilizarla como una plantilla de calificar. Esta se puede poner
sobre cada hoja de respuestas con lo que aparecern a travs de las perforaciones las res-
puestas correctamente marcadas. Cuando no aparece ninguna marca se puede dibujar una
lnea roja a travs de la perforacin. Esto le indicar al estudiante la respuesta correcta, que
no dio en cada tem. Si se emplea una mquina calificadora, simplemente se revisarn las
hojas de respuestas para asegurarse de antemano que solamente se marc una respuesta en
cada tem.
De esta manera, la informacin del anlisis de tems nos puede decir si el tem fue
demasiado fcil o demasiado difcil, que tan bien discrimin entre los estudiantes con pun-
tuaciones altas y los estudiantes con puntuaciones bajas en el test, y si todas las opciones
funcionaron de la manera deseada. El anlisis de tems proporciona datos que ayudan tam-
bin a percibir fallas tcnicas especficas y, con ello, a obtener mayor informacin para me-
jorar los tems. Aun en el caso de que no se vayan a usar nuevamente los tems, el anlisis
de estos tiene ciertas ventajas. Primero, proporciona informacin til para analizar el test en
clase. Por ejemplo, los tems fciles pueden pasarse por alto o tratarse superficialmente; las
respuestas a tems difciles se pueden explicar con mayor detalle y se pueden sealar a los
estudiantes los tems defectuosos en lugar de defenderlos como si no lo fueran. En segundo
lugar, proporciona datos para ayudar a los estudiantes a mejorar su aprendizaje. La frecuen-
cia con que se elige cada respuesta incorrecta revela errores y conceptos equivocados comu-
nes que constituyen una ayuda para introducir correcciones en la enseanza. Tambin pro-
124
porciona ideas y capacita para la preparacin de mejores tests en ocasiones futuras.
Se pueden aplicar diferentes procedimientos para analizar tems (Downie, 1967). Para
los tests informales de aprovechamiento usados en la enseanza solamente el procedimiento
ms sencillo parece justificable. Los siguientes pasos delinean un procedimiento simple y
eficaz. Para ilustrar los pasos, usaremos 32 hojas de test:
1. ordene las hojas de test (32 en total) desde la puntuacin ms alta hasta la ms baja.
2. seleccione aproximadamente la tercera parte de las hojas correspondientes a las califi-
caciones ms altas. Estas constituirn el grupo superior ( 10 hojas). Seleccione el mismo
nmero de hojas con las puntuaciones ms bajas. Estas constituirn el grupo inferior (10
hojas). Separe el grupo intermedio de hojas (12 hojas). Aunque este grupo podra incluir-
se tambin en el anlisis, usando solamente los grupos superiores e inferiores se simpli-
fica el procedimiento.
3. con cada tem, cuente el nmero de estudiantes del grupo superior que eligi cada
opcin. Haga lo mismo con el grupo inferior.
4. registre el nmero correspondiente al paso 3 en una copia del test, en columnas coloca-
das a la izquierda de las opciones a que se refiere cada nmero. El nmero tambin se
puede registrar, de la siguiente manera, sobre la tarjeta del tem o en una hoja indepen-
diente:
Item 1 Opciones A B* C D E
Superior 10 0 6 3 1 0
Inferior 10 3 0
* respuesta correcta
5. estime la dificultad del tem , determinando el porcentaje de los estudiantes que res-
pondieron correctamente a l. El procedimiento ms sencillo consiste en fundamentar la
estimacin solamente a los estudiantes incluidos en los grupos de anlisis de tems. As
pues, sume los totales de los grupos superior e inferior (10 + 10 = 20); sume los nmeros
de elecciones de la respuesta correcta (para el tem 1, de arriba, 6 + 2 = 8); divida la
primera suma entre la segunda y multiplique por 100, de la siguiente manera:
125
Indice de dificultad = 8 x 100 = 40
20
Aunque nuestro clculo se basa solamente en los grupos superior e inferior se aproxima
mucho a la estimacin que se obtendra con el grupo total. As pues, vale decir que el
ndice de dificultad de este tem es del 40% (para este grupo particular). Ntese que, como
la dificultad se refiere al porcentaje de veces que se responde correctamente al tem, un
porcentaje menor indica mayor dificultad del tem.
Aunque el anlisis por inspeccin puede ser todo lo que se necesite para la mayora
de los propsitos, se puede calcular fcilmente un ndice de discriminacin. Simplemente
hay que restar el nmero del grupo inferior, correspondiente a los estudiantes que acerta-
ron en el tem, del nmero del grupo superior, y dividir por el nmero correspondiente a
cada grupo. De tal manera, en nuestro tem de muestra, el clculo habr de ser as:
Indice de discriminacin = 6 2 = 0. 40
10
Ntese que el poder de discriminacin del tem se representa con una fraccin deci-
mal. El mximo poder discriminativo positivo se indica con un ndice de 1.00. Este se
obtiene solamente cuando todos los estudiantes del grupo superior eligen la respuesta
correcta sin que lo haga ninguno del grupo inferior. Respecto de los grupos de 10, supe-
rior e inferior, de nuestro ejemplo, la computacin del tem con mximo poder discriminativo
sera como sigue:
Indice de discriminacin = 10 0 = 1. 00
10
Se puede ver que el tem tiene un nivel de dificultad del 50% (acertaron los 10 del
grupo superior y fallaron los 10 del inferior). Esto explica por qu se recomienda a los
elaboradores de tests que preparen los tems con un 50% de grado de dificultad. Sola-
mente a este nivel es posible la discriminacin mxima.
126
Se obtiene un poder discriminativo nulo (0.00) cuando el mismo nmero de estudian-
tes de ambos grupos aciertan en el tem y el poder discriminativo negativo, cuando acier-
tan ms estudiantes del grupo inferior que del grupo superior. Ambos tipos de tems debe-
rn omitirse del test de aprovechamiento y habr que descartarlos o mejorarlos.
Los pasos anteriores del procedimiento para analizar tems se pueden modificar para
que se ajusten a situaciones particulares. En ciertos casos todo lo que se necesitar ser
una inspeccin de los datos en lugar de computar la dificultad y el poder discriminativo.
Asimismo, al seleccionar los grupos superior e inferior puede ser conveniente, si se trata
de un grupo numeroso, tomar el 25% superior y el 25% inferior, o en el caso de un grupo
pequeo, las mitades superior e inferior del grupo. Lo importante es utilizar una parte del
grupo lo suficientemente numerosa para que arroje informacin de utilidad. Con los tests
de aprovechamiento aplicados en la clase rara vez se justifica seleccionar el 27% inferior
del grupo (como se recomienda para un anlisis ms afinado) y aplicarles otros
afinamientos estadsticos.
127
Cmo interpretar los datos del anlisis de tems
Cuando se archivan los tems y se vuelven a usar despus de cierto tiempo, es reco-
mendable registrar en la tarjeta correspondiente, cada vez que se le utiliza, los datos del
anlisis de tems. Si se coleccionan tales datos se podr observar la variabilidad de los ndi-
ces de dificultad y poder discriminativo del tem y, por tanto, ser ms fcil interpretar la
informacin.
128
Lecturas Complementarias
129
CONSTRUCCIN DE PRUEBAS
Celia A. de Crsico
I.- Diagramacin.
III. - Aplicacin.
. Cmo ordenar y preparar los tems para su clara presentacin y fcil correccin.
. La correcta estructura de cada tem es ya el primer paso hacia una buena presentacin de la
prueba, requisito indispensable para que el texto pueda ser adecuadamente ledo y respondi-
do.
Tamao de la hoja
Uso de cartula
. Si la prueba se aplica a los alumnos de una clase bastar con destinar unos renglones de la
primera pgina para que cada sujeto escriba su nombre y la fecha correspondiente a la admi-
nistracin. Pero si se aplica a una muestra de sujetos cuyos antecedentes personales intere-
san para el anlisis de los resultados, se hace necesario dedicar una primera pgina para que
sirva de cartula, donde se soliciten todos los datos que el evaluador considere imprescindi-
bles.
130
Aprovechamiento de la pgina
. Debe establecerse la extensin ms conveniente para cada lnea escrita, cuidando que el
material resulte plenamente legible. Deben pues evitarse las lneas demasiadas extensas o
demasiadas cortas. Los tems deben ubicarse en columna dejando espacio suficiente para
que la respuesta pueda consignarse con claridad. Si se trata de respuesta constuda (escrita)
debe haber espacio para los trazos normales.
. Siendo los tems unidades de puntaje deben llevar numeracin corrida. As el puntaje total
atribuido a un trabajo perfecto coincidir con el nmero de los tems de la prueba.
. Es probable que dos o ms tems formen parte de un mismo ejercicio. En una prueba puede
haber varios ejercicios que tambin deben ser identificados (aqu las convenciones pueden
ser nmeros romanos o letras maysculas).
. Debe dejarse doble espacio entre el enunciado del tem y las alternativas que se presentan;
stas deben identificarse mediante letras minsculas.
. Si la prueba est constituida por una serie de ejercicios los espacios entre ellos debern ser
mayores que los que median entre los tems.
. Todas estas sencillas indicaciones, son algunas de las que habrn de tenerse en cuenta
para que la tarea resulte claramente perceptible tanto al examinado como al corrector.
. La dificultad para construir un tem de prueba objetiva, depende ms del nivel de calidad
exigido que de la forma en que el tem se plasme. Tambin la dificultad est en relacin con
el tema que se trate. Por ejemplo los tems que miden memoria de hechos son ms fciles de
construir que los que miden comprensin.
. Los tems del tipo seleccin son ms fciles de corregir que los de respuesta construda.
131
. La clave de correccin debe buscar el esquema ms simple: a cada tem debe corresponder
un punto.
. Si se trata de un tem de cotejo o de algn otro tipo, cuya resolucin demande ms tarea por
parte del examinado, debe concebrselo como un ejercicio compuesto por tantos tems como
cuestiones se planteen.
. En el caso de los tems grficos a completar (esquemas, mapas, etc.) deben evitarse las
claves de correccin complejas, es decir aquellas del tipo. Si ubica todos los elementos: 10
puntos, si ubica todos menos dos: 8 puntos ..... y as sucesivamente.
. Es imprescindible controlar las correcciones, las parciales y las totales pues en este sencillo
procedimiento de corregir y sumar se encuentra una fuente de errores.
III. - Aplicacin
. Si se quiere que el esfuerzo de construccin del test no se malogre y que la precisin de los
puntajes resulte viciada deben evitarse los errores en la administracin y en la correccin de
la prueba. Los resultados vlidos dependen de la precisin en la administracin y en la co-
rreccin.
. La comparacin vlida entre una prueba y otra, esto es el valor diagnstico de la prueba
para cada individuo, depende de la cuidadosa administracin y precisa correccin de toda la
prueba.
132
b) condiciones ambientales.
c) motivacin.
d) consignar instrucciones.
e) efectos de la adivinacin.
f) correccin y control de la misma.
. Seguidamente se ofrece una breve consideracin de estos aspectos que por otra parte han
sido vastamente estudiados y difundidos.
. Por ello resulta ms conveniente antes que estipular lmites de tiempo, esta-
blecer lmites de trabajo. As cuando el 80 o 90% de los alumnos han finaliza-
do puede considerarse oportuno dar por terminada la tarea.
b) Condiciones ambientales
133
. El clima del trabajo no debe ser alterado por estmulos no pertinentes (tim-
bres, presencia de personas ajenas a la situacin de pruebas, etc.).
c) Aspectos motivacionales.
. Se cree y con razn, que los puntajes de una prueba son infludos a veces en
forma muy significativa por la motivacin.
d) Consignas o instrucciones.
134
cuestiones que parecen insuperables.
.volver a ellas despus de haber concluido con las dems(cuando se trata
de una prueba de rapidez).
.no tratar de acortar por adivinanza si es que no se sabe nada acerca
de la pregunta, pues ello gravitar sobre su puntaje (si se hace correccin
por azar).
.contar con los elementos necesarios para el trabajo.
. las consignas para el trabajo en las pruebas corrientes construdas por los
profesores estn implcitas en los enunciados de cada tem, dado que se
supone que los alumnos estn familiarizados con la tarea.
e) Efectos de la adivinacin.
. Todo tipo de cuestin objetiva en que el sujeto debe elegir entre dos o ms
respuestas sugeridas, implica elementos de azar y de adivinacin. Es preciso
distinguir entre la adivinacin honesta y deshonesta. La primera es la que
se basa en un conocimiento, aunque sea parcial, del tema. La segunda es la
mera adivinacin con ignorancia total de la informacin.
. Las tcnicas utilizadas para atenuar los efectos de la adivinacin, sobre todo
en las pruebas homogneas del tipo seleccin mltiple, carecen de valor prc-
tico, cuando se trabaja con las tpicas pruebas de aprovechamiento escolar, en
que todos los estudiantes tienen oportunidad de leer y encarar todos los tems 1 .
. Para asegurar precisin en los puntajes las correcciones deben ser controla-
das pues los errores de este tipo pueden invalidar los resultados.
. Los alumnos deben ser informados cuanto antes acerca de los resultados de
su desempeo (previo anlisis de la significacin de los puntajes y conversin
de los mismos a notas), pues ello constituye un verdadero refuerzo del apren-
dizaje.
1
Para una consideracin ms detallada vase: ADKINS WOOD DOROTHY: Elaboracin de test Psicolgicos.
Ed. Trillas 1965.
135
IV. Elaboracin de una planilla con los resultados:
Una vez corregida la prueba es necesario elaborar los resultados. En lo que sigue se
darn unas breves orientaciones para una primera aproximacin al anlisis de los tems o
reactivos, cuando el nmero de examinados es pequeo (alrededor de 30 casos).
Es preciso disponer las pruebas por orden de puntajes (de mayor a menor) como se indica
en la TABLA A.
TABLA A:
Item
Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 total
A 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 19
B 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 19
C 1 - 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 18
D 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 - 1 1 18
E 1 - 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 - 1 1 17
F 1 1 1 1 1 1 - 1 1 1 1 - - 1 1 1 1 - 1 1 16
G 1 1 1 1 1 1 - 1 1 1 1 - - 1 - 1 1 - 1 1 15
H 1 1 1 1 1 1 - 1 1 1 1 - - - - 1 1 - 1 1 14
I 1 1 1 1 1 1 - 1 1 1 1 - - - - 1 1 - - 1 13
J 1 - 1 1 1 1 - 1 1 1 1 - - - - 1 1 - - 1 12
K 1 - 1 1 1 1 - - 1 1 1 - - 1 - 1 1 - - 1 12
L 1 - - 1 1 1 - - 1 1 1 1 - - - - 1 - 1 1 12
M 1 1 - 1 1 1 - - 1 1 1 - - - - - 1 - - 1 12
N 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - 1 1 12
O 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - 1 1 12
P 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - - 1 11
Q 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - - - 10
R 1 - 1 1 1 1 - - 1 - - - - - - 1 1 - - - 9
S 1 - 1 1 1 1 - - - - - - - - - 1 1 - - - 8
T 1 - 1 1 1 1 - - - - - - - - - 1 1 - - - 8
U 1 - - 1 1 1 - - - - - - - - - 1 1 - - - 7
V 1 1 - 1 1 1 - - - - - - - - - 1 - - - - 5
W 1 - - 1 - - - - - - - - - - - 1 1 - - - 5
X 1 - - 1 - - - - - - - - - - - 1 - - - - 3
total 24 8 18 24 22 22 - 10 18 17 21 6 5 9 6 24 22 3 12 16
136
Una inspeccin a los datos consignados en la TABLA A revela que:
137
LOS OBJETIVOS EDUCACIONALES.
ALGUNAS IDEAS CLAVES.
. Deben diferenciarse los objetivos de las metas. Estas ltimas son ms amplias, a largo
plazo y se traducen en contenidos, programas y actividades.
. Los objetivos una vez que se han definido claramente, pueden convertirse en modelos o
planes que pueden plasmar u orientar la instruccin y los procesos de evaluacin.
. En la redaccin de los objetivos se deben utilizar verbos que indiquen una accin o conduc-
ta a evualuar.
. Deben ser enunciaciones precisas, que indiquen cambios (conductas esperadas) en un rea
de contenido.
. Deben ser conductas claras que indiquen una forma de evaluar, no deben estar sujetos a
mltiples interpretaciones.
. Tales conductas se expresan operativamente a travs de verbos que implican una observa-
cin directa, describen lo que el estudiante hace para demostrar o evidenciar logros.
138
TAXONOMA DE LOS OBJETIVOS EDUCACIONALES
DOMINIO COGNITIVO
Fuente: Bloom,B y otros
Mara del C. Malbrn
Niveles de especificidad
1.00 CONOCIMIENTO 2.00 COMPRENSIN 3.00 APLICACIN 4.00 ANLISIS 5.00 SNTESIS 6.00 EVALUACIN
1.1.0 1.2.0 1.3.0 2.1.0 2.2.0 2.3.0 4.1.0 4.2.0 4.3.0 5.1.0 5.2.0 5.3.0 6.1.0 6.2.0 juicios
de especficos de forma y de universales y traduccin interpretacin extrapolacin de de de principios produccin produc- derivacin juicios en en funcin
modos de tratar abstracciones en elementos relaciones de de una cin de de un funcin de de
1.1.1 con especficos un campo 2.1.1 organizacin comunica- un plan o conjunto evidencias evidencias
de termino- de un cin nica conjunto de internas externas
loga 1.2.1 1.3.1 nivel de de ope- relaciones
de conven- de princi- abstrac- raciones abstractas
1.1.2 ciones pios y ge- cin a
de hechos neralizaciones otro
especficos 1.2.2
de tenden- 1.3.2 2.1.2
cias y de teoras y de una
secuencias estructuras forma
simblica
1.2.3 a otra
de clasifi- Relaciones posibles entre los niveles de la Taxo-
caciones y 2.1.3 noma de los objetivos educacionales de B.
categoras de una
forma Bloom. Dominio Cognitivo.
1.2.4 verbal a Una lectura del modelo.
de criterios otra
1.2.5
de
categoras
Evaluacin
Sntesis
Anlisis Modo de
operar con el
Aplicacin
Comprensin
conocimiento
CONOCIMIENTO
139
LOS OBJETIVOS COGNITIVOS:
SELECCIN, FORMULACIN, CLASIFICACIN Y EVALUACIN
1.0.0. CONOCIMIENTO
Habilidad para recordar-reconocer o evocar-ideas, hechos, criterios, etc., en una situacin
en la que se proporcionan ciertos datos indicios o claves que facilitan la recuperacin de la
informacin almacenada.
1.1.0 de especficos
1.1.1 de terminologa
1.1.2 de hechos especficos
1.2.0 de forma y modos de tratar con especficos
1.2.1 de convenciones
1.2.2 de tendencias y secuencias
1.2.3 de clasificaciones y categoras
1.2.4 de criterios
1.2.5 de metodologas
1.3.0 de universales y abstracciones en un campo
1.3.1 de principios y generalizaciones
1.3.2 de teoras y estructuras
2.0.0. COMPRENSIN
Habilidad para recibir significativamente el material comunicado.
2.1.0 traduccin
2.1.1 de un nivel de abstraccin a otro
2.1.2 de una forma simblica a otra
2.1.3 de una forma verbal a otra
2.2.0 interpretacin
2.3.0 extrapolacin
3.0.0. APLICACIN
Habilidad para usar abstracciones, reglas, principios, ideas, mtodos, en situaciones parti-
culares y concretas.
4.0.0. ANLISIS
Habilidad para fragmentar una comunicacin en sus elementos o partes constituyentes y
para jerarquizarlos.
140
4.1.0 de elementos
4.2.0 de relaciones
4.3.0 de principios de organizacin
5.0.0. SNTESIS
Habilidad para trabajar con partes, piezas elementos, etc., y combinarlos o reunirlos de
modo de formar un todo organizado y significativo o un nuevo patrn o estructura.
5.1.0 produccin de una comunicacin nica
5.2.0 produccin de un plan o conjunto de operaciones
5.3.0 derivacin de un conjunto de relaciones abstractas
6.0.0. EVALUACIN
Habilidad para formular o emitir juicios cuanti o cualitativos acerca del grado o extensin
en el que los materiales, mtodos, ideas, satisfacen determinados criterios.
6.1.0 juicios en funcin de evidencias internas
6.2.0 juicios en funcin de evidencias externas
141
Se proporcionan a continuacin ejemplos de conductas, contenidos, objetivos y actividades
de evaluacin correspondientes a las distintas reas y subreas previstas en la taxonoma.
1.1.0
de especficos
1.2.0
de formas y
modos de tratar
con especficos
1.2.1 Formas, usos, re- Identificar las ta- Cul es la forma co-
de convenciones glas, recursos, sm- reas del alfabeto rrecta de...?Cul de
bolos, representa- griego. Conocer los siguientes smbolos
ciones, formatos. las reglas de pun- se usa para...? Cul
tuacin. de las siguientes reglas
se usa para...?
1.2.3 Recordar, recono- Tipos, clases, con- Conocer las clasi- Cules son los prin-
de clasificacio- cer, identificar juntos, divisiones, f i c a c i o n e s d e l a c i p a l e s t i p o s d e . . . ?
nes y categoras jerarquizaciones. ciencia. Cmo clasificara...?
142
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN
1.3.0
de universales
y abstracciones
en un campo.
2.0.0
COMPRENSIN
2.1.0
Traduccin
143
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN
3.0.0
APLICACIN Generalizar, rela- Principios, leyes, Utilizar las leyes Indique en cules de
cionar, elegir, de- conclusiones, de trigonometra los siguientes enun-
sarrollar, organi- efectos, mtodos, para resolver si- ciados se cumple...
z a r, e m p l e a r, teoras, situacio- tuaciones prcti- El procedimiento ms
t r a n s f e r i r, nes, abstraccio- cas. indicado para
restructurar, cla- nes, procesos, fe- Aplicar las leyes realizar...es...
s i f i c a r, c a m b i a r, nmenos, proce- de MENDEL a Marque las acciones
calcular, demos- dimientos. descubrimientos que deberan realizar-
t r a r, r e s o l v e r, de gentica vege- se para mejorar...
usar, manipular, tal.
modificar, prepa-
rar, producir.
4.0.0 ANLISIS
4.1.0 Diferenciar, distin- Hiptesis, conclu- Distinguir entre El autor de ... sostie-
de elementos g u i r, d e t e c t a r, siones, supuestos, hechos e hipte- ne que... Cul de las
identificar, clasifi- declaraciones (de sis. Distinguir una siguientes suposicio-
c a r, d i s c r i m i n a r, hecho, de inten- conclusin de las nes est apoyando di-
r e c o n o c e r, c a t e - cin), argumentos, afirmaciones que cho autor?
g o r i z a r, d e d u c i r, alegatos. la sustentan.
descomponer, sub-
d i v i d i r, s e l e c c i o -
nar.
4.2.0 Interrelaciones,
C o n t r a s ta r, c o m - Comprobar la Lea los anunciados y
de relaciones pertinencias, eviden-
pa r a r, d i s t i n g u i r, coherecia entre la elija la respuesta que
deducir. cias, falacias, argu- hiptesis y la in- explica mejor la rela-
mentos, alegatos, cau-
formacin dada. cin que existe entre
sas-efectos, consis-
Inferir el marco, ellos.Cul de los si-
tencias, ideas, formas
4.3.0 Distinguir, detec- propsito o punto guientes enunciados
patrones, propsitos,
de principios de tar, deducir, ilus- puntos de vista, de vista particular explica mejor la postu-
organizacin trar, inferir. sesgos (parcialida- en que se basa. ra de ...acerca de...?
des), arreglos.
144
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN
5.0.0 SINTESIS
5.2.0 Proponer, planifi- Planes, objetivos, Proponer maneras Producir un plan para...
produccin de un car, producir, di- especificaciones, de comprobar una Disear un aparato con
plan o conjunto sear, modificar, esquemas, opera- hiptesis. el objetivo de...
de operaciones. componer, crear, ciones, formas, so- Disear un edificio Desarrollar una serie de
p r o y e c ta r, g e n e - luciones, caminos. segn indicacio- pasos para...
rar. nes.
6.1.0 Argumentar, dis- Precisiones, con- Formular juicios Cules son las supo-
juicios en funcin cutir,validar, eva- sistencias, fala- sobre un documen- siciones implcitas
de evidencias in- l u a r, a p r e c i a r, cias, errores, grado to en funcin de la en...?
ternas. comparar, criticar, deexactitud, con- exactitud, preci- Indique los errores en
contrastar, funda- fiabilidad. sin, orden lgico ...segn...
mentar, explicar, con que ha sido
justificar, concluir. elaborado. Sealar
las falacias lgi-
cas de un razona-
miento.
6.2.0 Juzgar, argumen- Fines, medios efi- Distinguir entre la En que medida el
juicios en funcin ta r, c o n s i d e r a r, ciencia, economa, terminologa que da artculo...cumple con
de evidencias ex- discutir, comparar, utilidad, necesidad, precisin a un texto las normas de...?
ternas contrastar. cursos de accin, y aquella que sim- Cules de los princi-
plemente reempla- pios tericos
patrones, normas,
za un nombre co-
teoras, generaliza- de...pueden encontrar-
mn por otro esot-
ciones. se en la obra de...?
rico. Evaluar crtica-
mente ciertas
creencias sobre la
salud.
145
EVALUACIN DEL APRENDIZAJE EN LAS CIENCIAS
Propuestas para un esquema de categorizacin
Las conductas sugeridas por esta categora son, primero que el estudiante haya ad-
quirido la informacin especfica y, segundo, que pueda recordarla cuando se le pida que lo
haga y pueda demostrar comprensin de la informacin identificndola en un contexto nuevo
o sabiendo cmo manejarlo.
A.1. Conocimiento de hechos especficos. Ej. Una abeja obrera tiene seis patas.
La piedra caliza flota en el mercurio.
1
En Bloom, B. S. Y otros Evaluacin del Aprendizaje. Tomo III. Cap. XVIII. Buenos Aires: Troquel, 1975.
146
A.8. Conocimiento de leyes o principios cientficos. Generalizaciones que los cien-
tficos derivan de un gran nmero de observaciones de fenmenos. Ej. Principio de
Arqumedes, leyes de Mendel.
A.11. Traduccin del conocimiento de una forma simblica a otra. Ej. Dada una
ecuacin qumica para cualquier reaccin, el estudiante la traduce en una afirmacin
verbal sobre la reaccin o dada una descripcin verbal de fuerzas existentes en una
situacin donde un caballo tira de una carreta por un camino escabroso, el estudiante
traduce esta informacin en un diagrama vectorial que muestra las fuerzas interactuantes.
147
C. 0. Procesos de la investigacin cientfica: descubrimiento de un
problema y bsqueda de las formas de resolverlo
D. 4. Extrapolacin e interpolacin.
148
E. 0. Procesos de la investigacin cientfica: construccin, prueba,
revisin de un modelo terico.
149
G. 0. Destrezas manipulativas (en trabajos de laboratorio)
H. 5. Desarrollo de inters por la ciencia y por las actividades con ella relacionadas.
H. 6. Desarrollo del inters por seguir una carrera cientfica o un trabajo relacionado con
ella.
150
I. 0. Orientacin Alude al desarrollo de la sensibilidad del estudiante hacia las relacio-
nes de la ciencia, otras reas del esfuerzo humano y otras formas de pensamiento.
En las categoras H e I las perspectivas que el estudiante adquiere sobre las relacio-
nes entre la ciencia y la cultura complementan y proporcionan algunos elementos cognitivos
esenciales para su visin personal de la relacin entre l y la ciencia.
Nota: se remite al lector al captulo original para un anlisis ms detallado del modelo y su
potencial empleo con fines de enseanza y evaluacin.
151
PRUEBAS DE RENDIMIENTO
CLASIFICACIN DE LOS TEMS
TIPOS DE
TEMS
ENSAYO R E S P U E S TA
BREVE
VERDADERO-
PREGUNTA B L A N C O S FALSO
PARA COMPLE-
SELECCIN MLTI-
TAR
PLE
COTEJO
ORDENAMIEN-
TO
R E S P U E S - R E S P U E S - MEJOR VARIEDAD
TA TA RESPUES- NEGATIVA
CORRECTA MLTIPLE TA
152
ASPECTOS A EVALUAR:
Items ms apropiados
153
PRUEBAS ESCRITAS. CLASIFICACIN DE LOS TEMS
154
EJEMPLOS DE TEMS VERDADERO-FALSO
. Si el trueno sigue al relmpago con un intervalo de 10, el rayo debe haberse producido a
10 KM de distancia
155
LOS TEMS VERDADERO - FALSO
Recopilacin de Mara del C. Malbrn
Para ser incluidas como tems de prueba, las proposiciones deben poseer las siguientes ca-
ractersticas:
. fcticos (las preguntas que utilizan Quin? ; Qu? ; Cundo? ; Dnde? ; usualmente
aluden a informacin fctica);
. generalizadores (la mayor parte de ...; muchos ...);
. comparativos (la diferencia entre ...; ambas ...);
. condicionales (si ...; cuando ...);
. relacionales (cuando mayor ...; cuanto ms alto ...; la medida en que ...);
. explicativos (la principal razn ...; el propsito de ...; uno de los factores que ...; dado
que ...; aunque es ...);
. ilustrativos (un ejemplo de ...);
. basados en evidencias (los estudios sobre ... demuestran que ...);
. predictivos (puede esperarse que ...);
. metodolgicos (para poder ...; un mtodo para asegurar ...; un paso para ...; el empleo
de ...; al realizar ...);
. de clculo o estimacin (para la serie ... el elemento que sigue...);
. evaluativos (es mejor ...; es posible demostrar ...; la principal limitacin ...)
156
LAS RESPUESTAS DE TIPO ELECCIN MLTIPLE
Celia A. de Corsico
Las preguntas de tipo eleccin mltiple son las que reciben mayor aplicacin en las
pruebas educativas, pues se usan junto a diagramas y mapas, etc., como en relacin con
problemas verbales y numricos. Por su intermedio, pueden medirse no solo informacin
consistente en el manejo de hechos, sino tambin razonamientos o interpretaciones muy
elaborados. En el tipo de mejor razn, por ejemplo, las alternativas que se proporcionan
pueden estar dispuestas gradualmente de acuerdo con su carcter de ms o menos razona-
bles; pero solamente una respuesta deber ser la enteramente correcta. As mismo, en los
test de cotejo, se puede requerir que los examinados apliquen una serie de principios a una
serie de problemas. Sin embargo, se necesita proceder con mucho cuidado en la construc-
cin de preguntas de esta clase y los siguientes consejos pueden resultar tiles.
(a) El tipo de eleccin mltiple no debera ser usado, en los casos en que las preguntas
simples de repeticin, fueran las adecuadas, es decir cuando hay una sola respuesta
definitivamente correcta para la pregunta. Por ejemplo, sera una prdida de tiempo ex-
presar los problemas aritmticos de la siguiente manera:
3 x 28 = 1; 1; 1 1 ; 2
7 6 2
Por cierto los problemas matemticos se expresan mejor en forma abierta que en forma ce-
rrada, dado que estas ltimas solicitan al examinado invertir el orden de la tarea y volverse
desde las respuestas dadas hacia la pregunta, tratando de hallar la respuesta adecuada.
(b) Todas las respuestas proporcionadas deben ser suficientemente plausibles como para
que un grupo considerable de sujetos las seleccionen, de lo contrario no tiene objeto
incluirlas en la prueba. Las alternativas incorrectas, pueden construirse sobre la base de
las falsas concepciones y errores que el examinador haya advertido prevalecen entre los
examinados. A veces suele ocurrir que los examinados de menor rendimiento seleccio-
nan las respuestas que contienen varias palabras o frases idnticas a las palabras o fra-
ses que figuran en el enunciado introductorio.
Sin embargo, tanto las respuestas correctas como las incorrectas, deberan ser homog-
neas en su construccin (modo de expresin, extensin y otras caractersticas externas).
Si la respuesta correcta es siempre la ms larga o la ms corta que las incorrectas el
examinado puede descubrir esto y emplearlo en su ventaja.
(b) Cada respuesta debera ser analizada para despejar la presencia de posibles claves,
157
que induciendo al sujeto en forma directa hacia la respuesta acertada, le eviten el esfuer-
zo de reflexionar sobre el problema planteado y desvirten de este modo el propsito de
la pregunta. Por ejemplo, cada una de las respuestas deben concordar gramaticalmente
con la pregunta. Esto se hace necesario especialmente en los tests de cotejo. Algunos
autores incluyen en un mismo conjunto, tems tan heterogneos que los examinados pue-
den estar en condiciones de distinguir las respuestas correspondientes, sin poseer el menor
conocimiento real del tema. El que sigue es un ejemplo extremo e hipottico de un mal
tem, que aunque supone poner de manifiesto el conocimiento de trminos geogrficos,
podra ser respondido correctamente, procediendo tan solo por inferencia.
Monzones y Lochs, deben ser (b) y (e) dado que son los nicos que quedan en plural.
Es poco probable que la palabra Monzones haya sido ubicada tan prxima a su enunciado
correspondiente; adems la palabra Lochs se parece mucho a lago. De manera que Lochs
debe ser (b). En cuanto a (a) y (c), aluden a lneas geogrficas y ros respectivamente, por lo
tanto isobara y vertiente se adaptan a ellas.
El examinador deber recordar que una prueba de cotejo es una prueba de extensin
de las de eleccin mltiple, y que por lo tanto debera verse que para cada tem que figura en
una columna, haya al menos tres tems (es preferible que sean cuatro o ms) en la otra
columna que constituyan respuestas posibles.
(c) No es raro que se pueda obtener un tem mejor convirtiendo en respuesta una pregunta
parcialmente formulada, y transformando en pregunta la respuesta correcta. Por ejemplo:
158
La figura literaria que consiste en reducir el nmero de trminos de un enunciado, se denomi-
na:
Meiosis ...............
Hiprbola ...............
Eufemismo ...............
Metfora ...............
La meiosis denota:
Probablemente la segunda forma requiere una comprensin ms plena del asunto que
la primera. Una tercera, y tal vez mejor forma para esta pregunta, sera un conjunto de frases
que exigiera la aplicacin y no meramente la posesin del conocimiento; un conjunto de
frases entre las cuales el examinado debera seleccionar aquella que mostrara meiosis. En
general, el examinador debera estudiar cada tem, en un intento por anticipar todos los pro-
cesos mentales por cuyo intermedio se puede alcanzar la respuesta correcta. Si algunos de
esos procesos no es representativo de la habilidad que desea medir, debera modificar el
tem.
(e)Todos los enunciados y respuestas deben ser lo ms sucintos posibles, y al mismo tiempo,
altamente precisos. Las preguntas muy complicadas o expresadas en lenguaje frondoso, pue-
den depender ms (para su correcta respuesta) de la inteligencia y habilidad para la lectura
que posea el examinado, que de su real conocimiento del tema.
(f) Dentro de las series de respuestas que se brinden, la posicin de la correcta debe estable-
cerse al azar para evitar otra posible indicacin ajena a los propsitos de la prueba.
159
II) Las preguntas del tipo repeticin simple y abierto para com-
pletar.
Una pregunta o un problema breves son seguidos de un espacio en blanco donde debe es-
cribirse la respuesta. Tambin pueden emitirse ciertas palabras o frases breves en una ora-
cin o prrafo, dejando espacios en blanco para ser llenados.
Ejemplos.
2. S y 2 X 3 + 9 + 3, como es dy ?.................................................................................
X dx
5. Un test geogrfico puede consistir en un mapa en el que figuren slo nmeros y no se den
los nombres. Debajo se colocan dichos nmeros en columna y se le pide al examinado que
escriba el nombre correspondiente junto a cada nmero. La misma tcnica puede ser usada
para probar el conocimiento de las partes de algn instrumento, mecanismo o espcimen
biolgico.
Ventajas: Naturalidad, semejanza con preguntas corrientes; estar libre de los efectos casua-
les de adivinacin que se producen en los tems cerrados o de reconocimiento; facilidad con
que pueden ser construidos. (Esta facilidad puede ser ilusoria).
160
Consejos para su construccin
Ejemplo:
7) Pigmalion 7).............................
161
Se puede pedir tambin que el sujeto tache o subraye la palabra que este mal escrita.
Los tems verdadero- falso se usan mucho en todas las materias porque ayudan a hacer un
muestreo rpido y porque es fcil construirlos.
Pero se han ido abandonando por efectos de la ADIVINACIN y errores insospechados. Algu-
nos recomiendan que se los use slo cuando no se puede aplicar los de eleccin mltiple.
En general es preferible usar oraciones que incluyan una sola idea; enunciarla positivamente
y cuidar de no incluir negaciones ni el uso de porque o por lo tanto.
La parte crucial del enunciado, que lo hace verdadero o falso, debe ir al final.
No deben ser evidentemente verdaderos ni evidentemente falsos. Los verdaderos deben te-
ner apariencia de falsos, tal como los falsos deben tener apariencia de verdaderos.
Al mismo tiempo, deben ser netamente verdaderos o falsos para el estudiante bien informa-
do. No deben tener trucos, pues el estudiante se fijar en los aspectos esenciales y no en
detalles secundarios.
Se ha establecido que ciertas verbalizaciones son ms aptas para ser usadas en los tems
verdaderos que en los falso o viceversa.
Los examinados pronto reconocen que la gran mayora de los tems que contienen TODOS-
SIEMPRE- NUNCA- IMPOSIBLE, son falsos. La mayora de los que contienen POR LO GE-
NERAL- A MENUDO, son verdaderos.
La mayora de los enunciados largos tienden a ser ms verdaderos que falsos. Hay que
aprender a usar con cautela las experiencias anteriores o introducirlas con la misma fre-
cuencia tanto en los verdaderos como en los falsos.
Si el nmero de enunciados es menor que 20, hay que cuidar que no sean exactamente 10
verdaderos y 10 falsos, porque los alumnos tienden a tomar en cuenta este punto de referen-
cia.
El orden en que aparezcan los enunciados debe ser enteramente al azar. Si el examinador
nunca ubica ms de dos enunciados verdaderos o falsos en forma consecutiva, el examinado
lo advierte.
162
Una forma es arrojar una moneda. Si cae cara tomar el tem verdadero ms fcil y ponerle
el nmero 1. Si las cuatro siguientes son cruces ubicar los cuatro tem falsos ms fciles
con los nmeros de 2 a 5 y as sucesivamente.
Manera de registrar:
Subrayar las palabras VERDADERO- FALSO o SI- NO, dibujar un crculo alrededor de las
letras V o F, o escribir las letras V o F. Uno de los ms simples y satisfactorios es usar + o
en un espacio en blanco al final del enunciado. Los espacios es conveniente que se alineen a
la derecha.
Se debe aplicar la correccin para la adivinacin y se debe advertir esto a los examinados en
las instrucciones generales antes de comenzar con el test.
163
LAS PREGUNTAS DE ELECCIN MLTIPLE
Celia A. De Crsico
Puede distinguirse un gran nmero de variedades de este tipo, figurando a continuacin ejem-
plos de las ms importantes.
I.El nmero de las respuestas alternativas es por lo comn de cinco, pero pueden
variar entre tres y siete, o an entre dos y siete, de acuerdo con el nmero de posibi-
lidades implcitas en la pregunta. Las preguntas con seis o siete respuestas ocupan
demasiado espacio. Las preguntas con dos o tres respuestas deberan evitarse por-
que requieren la correccin de los factores de azar (guessing correction). Es conve-
niente, aunque no necesario, que en una misma prueba, se proporcione el mismo
nmero de respuestas para todas las preguntas.
II.Cuando las respuestas consisten en una sola palabra, stas pueden ser impresas en
una sola lnea en forma consecutiva (pueden ir incluidas entre parntesis). Se instru-
ye al examinado para que subraye la palabra correcta, dentro de cada uno de los
conjuntos de palabras que figuran entre parntesis.
Cuando las respuestas constan de varias palabras o frases, el subrayado resulta per-
turbador, tanto para el examinado como para el que examina. Las respuestas pueden
estar impresas y numeradas en forma consecutiva, y el examinado debe escribir el
nmero de su eleccin en el espacio en blanco. Por ejemplo:
-Cul es la funcin del nervio sacro, dentro del sistema nervioso autnomo?
No obstante este tipo de pregunta resulta de difcil lectura. De ah que sea ms reco-
mendable disponer todas las respuestas en una columna, y pedir al examinado que
trace una cruz en el espacio en blanco que acompaa a la respuesta correcta, aunque
ste ltimo mtodo insume mucho espacio. El tem puede enunciarse en forma de
pregunta o de frase a completar.
164
III.En el tipo de la mejor razn se instruye al examinado para que identifique entre un conjun-
to de razones a la mejor de ellas para un cierto enunciado. A veces, un tem ms
adecuado puede consistir en encontrar la peor de las razones. Por ejemplo:
.Muchas investigaciones indican que la inteligencia de los nios se halla influda por
el ambiente y la educacin. Cul de las siguientes razones es la que proporciona la
evidencia ms pobre para esta conclusin?
..........................
...........................
Los nios que han sido sometidos a tests antes de ser ubicados
en hogares adoptivos, y que son vueltos a testar varios aos
despus, muestran un aumento mayor en su inteligencia cuando
han sido criados en hogares de ms alto nivel socioeconmico.
.........................
...........................
165
IV.En lugar de una, pueden ser dos o tres las respuestas correctas. Las instrucciones
deben darse en forma absolutamente clara. Por ejemplo:
-Ponga una cruz al lado de dos de los siguientes pintores ingleses que se han hecho
especialmente famosos por sus paisajes:
-Ponga una cruz al lado de una sola de las respuestas. Sir Thomas Brown es famoso
como autor de:
Poesa ...............
V.El mismo conjunto de respuestas puede aplicarse a varias preguntas. Por ejemplo:
1. Clarinete C M B P
2. Tringulo C M B P
3. Timbales C M B P
4. Corno Ing. C M B P
5. Corno Franc. C M B P
166
VI.Los tests de cotejo son una extensin de la categora anterior. Las preguntas y las
respuestas se ubican en dos listas que llevan un orden diferente. Por ejemplo:
-A la izquierda hay una lista de Tratados o Paces, a la derecha una lista de desarrollos
histricos que se asocian con dichos Tratados. Despus de cada uno de dichos desa-
rrollos, escriba la letra que corresponde al Tratado con que se vincula el suceso. Ad-
vierta que no es necesario que use todas las letras y que algunas de ellas pueden ser
usadas dos veces.
167
SUGERENCIAS PARA REDACTAR TEMS DE TIPO
OBJETIVO
A.G. Wesman
Traduccin Mara del C. Malbrn
1. Exprese el tem tan claramente como sea posible. La dificultad de un tem debe
surgir del problema que se presenta ms bien que de las palabras que lo expresan.
3. Evite las oraciones complejas o confusas. La estructura de las oraciones debe ser lo
ms simple posible. Cuando el enunciado es complejo, es conveniente usar dos o ms
oraciones para expresarlo. En general, es conveniente presentar primero el aspecto fun-
damental de la pregunta y luego las explicaciones o aclaraciones.
4. Incluya todas las aclaraciones necesarias para proveer una base razonable para la
eleccin de la respuesta. No deje aspectos implcitos en la pregunta.
8. Adapte el nivel de dificultad del tem al grupo y al propsito para el que fue cons-
truido. Un examen debe incluir slo aquellas cuestiones que todos los alumnos puedan
contestar correctamente de acuerdo con los objetivos que ha tenido la enseanza. Es
probable que un tem que cumpla con esta condicin resulte til para discriminar clara-
mente los diferentes niveles de habilidad entre los alumnos. Adems, es un error selec-
cionar tems que el estudiante ideal debiera saber, ms bien que en trminos de lo que
realmente puede realizar un estudiante promedio.
168
9. Evite indicios no pertinentes para la respuesta correcta.
169
SUGERENCIAS PARA EMPLEAR DIFERENTES TIPOS
DE TEMS
A.G. Wesman.
Traduccin Mara del C. Malbrn
1. Use este tipo de tem slo para preguntas que pueden responderse mediante una nica
palabra, frase, nmero o smbolo.
2. No copie las oraciones palabra por palabra del contexto e intente usarlas como tem de
respuesta breve.
4. Permita suficiente espacio para consignar la respuesta y disponga los espacios en for-
ma conveniente para facilitar la valoracin.
6. Prepare los problemas de clculo de modo que la solucin sea un nmero entero, salvo
cuando la habilidad para trabajar con fracciones o decimales sea un propsito de la prue-
ba.
1. selos slo en aquellos casos en los que la afirmacin sea verdadera o falsa en forma
estricta. Incluya en cada enunciado solamente una idea central significativa.
2. Evite el uso de largas oraciones que implican frases o agregados explicativos. Use
enunciados breves y de estructura sencilla.
5. Evite que las respuestas correctas queden dispuestas segn pautas discernibles.
170
C. Los tems de Eleccin Mltiple.
1. Use una pregunta directa o una oracin incompleta como planteo del tem.
2. En general, incluya en el enunciado o planteo todas las palabras que de otra manera
tendra que repetir en cada alternativa.
3. Elija como correcta la alternativa acerca de la cual exista acuerdo sobre su veracidad o
correccin, es decir la mejor respuesta.
6. Cuide que todas las alternativas resulten plausibles y atractivas para los examinados
en trminos de la informacin o de la destreza que el tem pone en juego.
9. Use la alternativa ninguna de las anteriores slo en aquellos tems para los que hay
una respuesta absolutamente correcta. sela como respuesta obvia varias veces en la
primera parte del examen pero en las partes posteriores espacie su empleo. Evite em-
plearla como respuesta correcta para tems en los que puede cubrir una gran proporcin
de respuestas incorrectas.
10.Disponga las respuestas en un orden lgico si existe, pero evite una preferencia con-
sistente con respecto a la posicin de la alternativa correcta.
12.No presente una serie de tems del tipo verdadero- falso bajo la forma de un reactivo
de seleccin mltiple.
13.Evite claves verbales que permitan a los estudiantes seleccionar la respuesta correcta
o eliminar opciones incorrectas.
171
3. Disponga las premisas y las respuestas de modo que tengan una claridad y convenien-
cia mximas para el alumno.
4. En las instrucciones explique claramente lo que se espera que el alumno haga para
indicar las respuestas.
5. No intente brindar apareamiento uno a uno perfecto entre las premisas y las respues-
tas.
4.Observe las mismas indicaciones para preparar el enunciado y las alternativas del
tem basado en representaciones grficas que se emplean para los tems de eleccin
mltiple.
172
EVALUACIN DE LA COMPRENSIN DE LECTURA
Fuente: B. S. Bloom y otros.(1976). Evaluacin del Aprendizaje.
Bs. As.:Troquel.
El hombre estuvo siempre interesado por su propio pasado. Los exploradores de hoy
han hallado los comienzos de la civilizacin al retroceder miles de aos. Esos exploradores,
llamados arquelogos, buscan los materiales que permitan estudiar la historia de la humani-
dad. El material puede estar construido por escritos, fragmentos de obras de arte o ruinas
antiguas.
a. de los exploradores
b. de una tumba real
c. de Egipto
d. de testimonios antiguos
La palabra rigurosos, tal como aparece marcada y usada en este pasaje significa
a. exactos
b. difciles
c. incorrectos
d. exagerados
173
El trmino se centran, tal como aparece marcado y usado en este pasaje significa lo contrario
de
a. se concentran
b. se enfocan
c. convergen
d. se dispersan
La palabra notable, tal como aparece marcada y usada en este pasaje significa
a. espeluznante
b. insignificante
c. perturbador
d. interesante
La palabra enorme, tal como aparece marcada y usada en este pasaje significa ms o menos
lo mismo que
a. vasta
b. valiosa
c. valerosa
d. vlida
La palabra suscit, tal como aparece marcada y usada en este pasaje, significa ms o menos
lo mismo que
a. concit
b. acus
c. concili
d. confirm
La palabra interesado, tal como aparece marcada y usada en este pasaje, significa lo contra-
rio de
a. negligente
b. preocupado
c. fascinado
d. monopolizado
174
TEMS COMPLEJOS
Clave:
A.Correcta: los datos por s solos bastan para mostrar que la proposicin o hiptesis es
correcta.
B.Probablemente correcta: los datos indican que la proposicin o hiptesis puede ser
correcta, que es lgica en base a los datos, pero stos no bastan para afirmar que es
claramente correcta.
E.Incorrecta: los datos por s solos bastan para mostrar que la proposicin o hiptesis
es incorrecta.
Las preguntas 1 a 8 se refieren al siguiente diagrama. Emplee la clave anterior para contes-
tarlas. Se considera que el lagarto tiene sangre fra y los dems animales sangre caliente.
4. La temperatura del ratn estar aproximadamente a mitad de camino entre la del gato
y la del oso hormiguero.
175
5. En ningn momento del experimento tuvo alguno de los animales la misma temperatura
corporal.
6. Existe una estrecha correlacin entre la temperatura del cuerpo del lagarto y la tempe-
ratura del ambiente externo.
Zarigeya
Temperatura del cuerpo. C
40
Gato
30 Ornitorrinco
Oso hormiguero
20
10 Lagarto
10 20 30 40
Temperatura extrema. C
Instrucciones: Lea las afirmaciones que se presentan seguidamente prestando cuidados aten-
cin a sus relaciones recprocas. A continuacin de cada una deber consignar A, B, C o D
segn corresponda de acuerdo con la siguiente clave.
Clave:
A.Si la afirmacin contiene la idea central en torno de la cual pueden agruparse las res-
tantes afirmaciones.
B.Si la afirmacin contiene una idea importante que sirve como apoyo de la idea central.
176
D. Si la afirmacin contiene una idea o ideas que no son pertinentes.
1. Las rutas romanas conectaban todas las partes del Imperio con Roma.
2. Las rutas romanas estaban tan bien construdas que algunas de ellas existen hoy.
3. Uno de los ms grandes logros de los romanos consisti en el extenso y durable sistema
de rutas.
4. Los viajeros ricos en los tiempos romanos viajaban en carros tirados por caballos.
5. A travs de las rutas romanas las caravanas transportaban valiosas mercancas desde
Alejandra y el este.
6. Algunas de las carreteras italianas del presente se construyeron sobre rutas originalmen-
te romanas.
177
EJEMPLOS DE TEMS
Los enunciados siguientes aluden a las ideas bsicas sobre las que se edifica la teora de J.
Piaget sobre el desarrollo cognitivo. Coloque en cada caso el nombre que recibe cada una:
Al lado de cada uno de los enunciados, coloque el nombre del perodo que corresponde segn
Piaget.
178
Para las actividades cognitivas que se mencionan, indique el nombre del perodo a que perte-
nece segn Piaget.
. Concluir que dos recipientes de distinta forma pueden tener igual volu-
men..............................................................................................................................
. Buscar un objeto que ha desaparecido del campo visual...................................................
. Diferenciar un hecho de un concepto y de un principio.....................................................
. Ordenar objetos segn su tamao relativo.........................................................................
. Discriminar entre tres colores distintos..............................................................................
. Determinar mediante inferencia la verdad o falsedad de algunos enuncia-
dos..........................................................................................................................
. Identificar objetos por el nombre.......................................................................................
Se presenta al nio un conjunto de cuentas de madera, 18 de las cuales son marrones y dos
blancas y se le pregunta: Qu hay ms, cuentas de madera o cuentas marrones?
Preoperatoria............................................................................................................................
Op.Concretas...........................................................................................................................
Conclusin.........................................................................................................................
Entre las siguientes marque las que constituyen caractersticas del pensamiento segn Piaget:
. Reversibilidad
. Centracin
. Conservacin
. Egocentrismo
. Irreversibilidad
. Transduccin
179
Marque las tareas que recin podran comprenderse cabalmente despus de los 11 o 12 aos
de edad, segn las caractersticas que Piaget atribuye al pensamiento formal.
.... Determinar que cuerpos de un mismo volumen pueden tener distinto peso
A continuacin se mencionan algunos de los principios bsicos que rigen el desarrollo cognitivo
segn Piaget. Explique brevemente sus alcances:
1. L a a c c i n d e s e m p e a u n p a p e l c l a v e e n e l c o n o c i m i e n t o d e l m u n -
do.............................................................................................................................
2. Las caractersticas que permiten distinguir etapas en el desarrollo cognitivo son clara-
mente distinguibles en la conducta infantil................................................................
3. El desarrollo intelectual tiene un carcter acumulativo....................................................
4. Si bien las cronologas no son fijas, el orden de sucesin de las etapas del desarrollo
cognitivo es relativamente invariable...............................................................................
5. Los organismos vivos son sistemas autorregulados........................................................
Seguidamente se mencionan los tipos de juicios morales segn Kohlberg. Coloque al lado de
cada uno el nmero (de 1 a 6) segn aparecen evolutivamente.
180
Clasifique las siguientes manifestaciones en preconvencionales, convencionales y
postconvencionales segn corresponda:
Al lado de cada enunciado seale si resulta verdadero (V) o falso (F) de acuerdo con los
resultados de las investigaciones de Kohlberg
..... Se encuentran diferencias importantes en la secuencia con que aparecen los tipos mora-
les en individuos que pertenecen a distintas culturas, religiones y clases sociales
..... En el nivel preconvencional, el valor de la vida humana no es juzgado por s mismo sino
por referencia a criterios externos a ella misma
..... Los principios ticos del nio constituyen un fiel reflejo de la moralidad adulta
..... Para acceder a los niveles superiores de desarrollo moral el sujeto debe haber previa-
mente transitado los ms primitivos
181
A continuacin se mencionan las teoras ms conocidas acerca del lenguaje. Coloque
para cada enunciado de la izquierda, el nmero que le corresponde segn lo que consta en la
columna de la derecha
* El nio adquiere las habilidades del lenguaje que 1. Teora del aprendizaje
son reforzadas por la gente que lo rodea................ 2. Teora gentica
3. Teora de la capacidad innata
* El lenguaje influye sobre los conceptos y la con- 4. Hiptesis de la relatividad
cepcin del mundo de quien habla...................... lingstica
182
EJEMPLOS DE TEMS DE
RESPUESTA SELECCIONADA
a.- una masa de protoplasma que tiene muchos ncleos pero carece de lmites defini-
dos entre las clulas.
e.- el punto por el cual los impulsos nerviosos pasan de una clula a otra.
I) * . # II) * . # III) * . *
* #.* #.#
183
Si una persona est pensando en tomar baos de sol, cul es la hora del da durante
la que es ms probable que llegue a quemarse seriamente?. Es mucho ms probable que se
queme seriamente durante el medioda (de 11 a 13) porque
a.- estamos un poco ms cerca del sol al medioda que a la maana o a la tarde
b.- cuando los rayos del sol caen directamente (perpendiculares) sobre una superficie,
sta recibe mayor cantidad de ellos que cuando caen en forma oblicua
c.- cuando los rayos del sol caen perpendicularmente sobre una superficie, sta refle-
ja menor cantidad de rayos que cuando caen en forma oblicua
d.- cuando el sol est justo sobre la cabeza, los rayos deben atravesar menor cantidad
de atmsfera absorbente que cuando est cerca del horizonte
g.- los rayos ultravioletas de la luz solar son los principales responsables de las que
maduras del sol
Un ladrillo puede ser arrastrado con relativa facilidad sobre una superficie lisa tirando
de l mediante una cuerda. Esta sin embargo se romper si se tira demasiado fuerte. Cul
de los siguientes principios es ms til para explicar este hecho?
c.- La inercia
184
Para cada una de las afirmaciones siguientes, coloque sobre la lnea de puntos (V) si
resulta verdadera y (F) si es falsa
... Un cuerpo sumergido en un fluido es impulsado hacia la superficie por una fuerza
igual al peso del fluido desplazado
... La fuerza de ascensin de un objeto rodeado por un lquido o gas es igual al rea de
la superficie del objeto multiplicada por la presin del lquido o gas que lo rodea
Al lado de cada enunciado coloque una (V) si resulta verdadero y una (F) si es falso:
... Las influencias hereditarias pueden manifestarse por primera vez a cualquier edad
... Ciertos agentes txicos transportados por la corriente sangunea pasan de la madre al feto
... Las caractersticas muy resistentes al cambio pueden ser de origen hereditario o ambiental
185
Para cada enunciado coloque sobre la lnea de puntos
... 3.- El sistema de partidos est en crisis, tal como lo muestran algunos ejemplos recientes
... 4.- El ao previo a la eleccin presidencial afecta la vida econmica de la Nacin por la
incertidumbre de los resultados
En una clase de geografa sobre Holanda, un estudiante dijo que las casas de los
holandeses siempre estn bien orientadas y limpias. El profesor pregunt sobre las fuentes
de las que haba obtenido la informacin y sugiri al resto de la clase que investigara sobre el
tema. Entre las razones ofrecidas por los estudiantes marque con una (X) las que ofrecen
mayor fundamento a la afirmacin
... 3.- La enciclopedia que consult dice que una caracterstica sobresaliente de los
holandeses radica en el orden y en la limpieza
... 4.- He estado en muchas casas de holandeses y todas estaban ordenadas y limpias
... 5.- Le en un libro de cuentos que las casas de los holandeses son siempre limpias
y ordenadas
... 6.- V una pelcula sobre una familia holandesa cuya casa estaba siempre ordenada
y limpia
... 7.- Un pueblo tan evolucionado debe tener sus casas ordenadas y limpias
... 8.- He vivido seis meses en Holanda y considero que el orden y la limpieza se
respetan rigurosamente en el hogar y la comunidad
186
Un grupo de profesores discuta las ventajas de dos mtodos de calificacin. Haba
quienes proponan el empleo de un sistema doble: S (satisfactorio- aprobado) e I (insatisfac-
torio- desaprobado), en lugar del sistema de notas corriente. Los impulsores del sistema S-I
argumentaban:
En las siguientes afirmaciones marque con una (X) la que considere menos importante como
parte del razonamiento:
... 1.- Las notas no son fieles indicadores del progreso logrado
... 2.- El sistema S-I atena las diferencias
... 3.- El sistema S-I proporciona una imagen ms adecuada del progreso del estu
diante
... 4.- Las notas estn indebidamente infludas por el azar
... 5.- El estudiante es mejor juez de su propio progreso que el profesor
187
Un supuesto importante que no aparece explcitamente es:
Para que una especie pueda evolucionar de un ambiente completamente acutico a uno te-
rrestre, es indispensable que la adaptacin ocurra en el sistema:
a.- digestivo
b.- locomotor
c.- circulatorio
d.- nervioso
e.- respiratorio
Los efectos usuales del LSD sobre la persona son similares a los sntomas que produce la
a.- leucemia
b.- tuberculosis
c.- hemofilia
d.- esquizofrenia
188
e.- ceguera
I) B + C > A
II) 2 C > A + B
III) 3 . A + B > A + C
IV) 4 . A + C > B + C
a.- Ninguno
b.- Slo 1
c.- Slo 2
d.- Solamente 1 y 2
e.- Todos
189
EVALUACIN DEL APRENDIZAJE EN LAS CIENCIAS
v v v v v =0
a a a a =0 a
A B C D E
1.1. Cul de los diagramas representa al auto cuando dobla una esquina?
1.2. Cul de los diagramas representa una disminucin en la velocidad del auto? (Iguales
alternativas que para 1.1.)
1.3. Cul de los diagramas representa al auto ponindose en marcha? (Iguales alternativas
que para 1.1.)
1.4. Cul de los diagramas representa el incremento en la velocidad del auto? (Iguales
alternativas que para 1.1.)
190
2. Cul de las siguientes posibilidades presenta la mayor diversidad en estructura?
Clave:
a. La proposicin es verdadera si se da la condicin
b. La proposicin es verdadera sin tener en cuenta la condicin
c. La proposicin es falsa si se da la condicin
d. La proposicin es falsa sin tener en cuenta la condicin
Proposicin Condicin
191
4. Qu progreso gentico se ilustra en el siguiente diagrama?
a. Falta de disgregacin
b. Apareamiento sexual
c. Crossing- over
d. Seleccin natural
5. Supongamos que se realiza el siguiente experimento con el propsito de mostrar que una
planta que crece dentro de una campana de vidrio disminuye el dixido de carbono (CO 2 )
y aumenta la cantidad de oxigeno (O 2) en ese mbito.
Debajo de una campana de vidrio se ubican una planta y una vela encendida tal como mues-
tra el dibujo. La vela se quema durante un minuto y luego se apaga. Tres das ms tarde, la
vela se enciende por medio del aparato elctrico y se quema durante un minuto antes de
apagarse.
2. Antes que pudieran derivarse conclusiones, con cual de los siguientes cambios debera
repetirse el experimento?
3. Supongamos que esta definitivamente probado que una planta que crece dentro de una
campana de vidrio disminuye el dixido de carbono (CO 2) y aumenta el oxigeno (O 2 ) pre-
sente. Cmo se relaciona este descubrimiento con la observacin de que las plantas res-
tituyen la capacidad de aire para permitir que la vela siga ardiendo?
192
a. Agrega informacin que contradice la observacin
b. Agrega informacin compatible con la observacin
c. No agrega nada a la observacin
d. Ambos no pueden ser correctos
6. Supongamos que se le dan dos pelotas y se le dice que una es hueca y la otra slida, pero
no puede determinar cual es cual por el solo hecho de mirarlas. Si desea resolver la
cuestin, cul de los dos procedimientos esquematizados tendr que emplear?
a. Procedimiento I
b. Procedimiento II
c. Procedimiento III
Una joven acrbata del circo que cuelga de sus cabellos como parte de su actuacin se
pregunta si debe cambiar de profesin, si es necesario antes que sea demasiado tarde. Su
problema es el siguiente: su madre es calva, pero su padre posee cabello normal. Su herma-
no mayor est perdiendo rpidamente el cabello y pronto ser calvo. Supongamos que B
representa el gen para la calvicie y b el gen para la carencia de calvicie. En la condicin
heterocigotica B es dominante en los hombres y b en las mujeres. Un hombre heterocigtico
ser calvo pero una mujer heterocigtica no ser calva.
1. Cul de los siguientes apareamientos representa a los padres de la joven acrbata del
circo?
a. B b XX x BbXy
b. bbXX x BBXY
c. BbXX x bbXY
d. BBXX x bbXY
e. BBXX x BbXY
a. BbXy
b. bbXY
c. BbXX
d. BBXY
e. BBXX
193
3. El genotipo de la joven acrbata est representado por
a. BbXY
b. BBXY
c. bbXX
d. BBXX
e. BbXX
4. Sobre la base de estos datos, cul de las siguientes sugerencias para la joven acrbata
sera ms justificable?
8. Un marinero a la deriva en el ocano sobre una balsa agot sus reservas de agua dulce.
Tuvo muchsima sed, pero temi tomar el agua de mar porque haba odo que poda ocasio-
nar la muerte. Qu principio biolgico provocara un desastre si el marinero tomaba el agua
de mar?. Seleccione una de las cinco probabilidades siguientes:
b. Las diversas sales que posee el agua de mar tenderan a corroer el estmago
c. Cuando el agua de mar llegara a los intestinos de marinero, la sal natural ya exis-
tente en sus clulas sanguneas las abandonara para mezclarse con las sales intesti-
nales
194
d. El agua salada se dirigira y pasara por los riones con tanta rapidez que los sobre
cargara, lo que producira la muerte por insuficiencia renal
e. Parte del agua contenida en la sangre la abandonara para unirse al agua de mar en
los intestinos.
195
TIPOS DE TEMS
Mara del C. Malbrn
1. Comente brevemente las afirmaciones siguientes en cuanto a las derivaciones que tuvie-
ron para el tratamiento y educacin infantil.
a. La mente de los nios es como una tabula rasa, una especie de hoja en blanco (John
Locke. S. XVII)
-
2. A continuacin se citan algunas afirmaciones sobre los test que hoy se consideran err-
neas. En cada caso mencione el argumento principal que permite rechazarlas:
c. Los test que miden la misma caracterstica arrojan los mismos resultados
-
e. Si una persona es inteligente, puede desempearse con xito en cualquier tipo de ta-
reas que pongan en juego el intelecto
-
-
196
II. tems de respuesta construda. Variedad respuesta breve
3. En un estudio sobre la habilidad de los seres humanos para juzgar a sus semejantes que
utiliz tcnicas correlacinales, se concluy:
La capacidad para juzgar a los dems no se relaciona con la edad (en los adultos) ni
marcadamente con el sexo. Se relaciona en forma directa con la inteligencia, los intereses
artsticos y el ajuste emocional y en forma inversa con las actitudes autoritarias. Asimis-
mo, la confianza de los evaluadores en sus predicciones se relaciona inversamente con la
precisin de las mismas.
4. Para cada una de las adquisiciones siguientes seale el tipo de aprendizaje que ilustran
197
Para las actividades cognitivas que figuran a continuacin, escriba sobre la lnea de puntos el
nombre del perodo de desarrollo a que corresponden segn Piaget:
5. Al lado de cada enunciado coloque una (V) si resulta verdadero y una (F) si falso:
. . . Las influencias hereditarias pueden manifestarse por primera vez en cualquier edad.
198
. . . Las caractersticas muy resistentes al cambio pueden ser de origen tanto hereditario
como ambiental.
199
IV. tems de respuesta seleccionada de opcin mltiple. Variedad
respuesta correcta
7. A continuacin se enumera una serie de cualidades que debe reunir un buen examen.
Seale aquella que debe preceder a las restantes:
200
VI. tems de respuesta seleccionada. Variedad respuesta mltiple
. . . demostrar que las culturas primitivas tienen pautas de crianza ms coherentes que las
ms evolucionadas
. . . mostrar que son las normas socioculturales las que determinan las experiencias ade-
cuadas para cada nivel de edad
. . . ilustrar que la educacin de los nios sigue patrones similares no importa cun dife-
rentes sean las culturas
. . . descubrir que pautas que para la sociedad occidental resultan extraas o poco acep-
tables, aparecen como naturales en otras culturas
. . . actuar sobre ellas para ensearles cmo deben criar a los nios
Estos tems fueron construidos y probados por la prof. Mara del C. Malbrn. Los ndices de
dificultad y discriminacin obtenidos permiten considerarlos adecuados.
201
CMO ANALIZAR LOS TEMS
Fuente: Gronlund, N.(1974) Elaboracin de Tests de Aprovechamiento.
Mxico: Trillas.Cap. 6
De esta manera, la informacin del anlisis de tems no puede decir si el tem fue
demasiado fcil o demasiado difcil, qu tan bien discrimin entre los estudiantes con pun-
tuaciones altas y los estudiantes con puntuaciones bajas en el test, y si todas las opciones
funcionaron de la manera deseada. El anlisis de tems proporciona datos que ayudan tam-
bin a percibir fallas tcnicas especficas y, con ello, a obtener mayor informacin para me-
jorar los tems. Aun en el caso de que no se vayan a usar nuevamente los tems, el anlisis
de stos tiene cierta ventajas. Primero, proporciona informacin til para analizar el test en
clase. Por ejemplo, los tems fciles pueden pasarse por alto o tratarse superficialmente; las
respuestas a tems difciles se pueden explicar con mayor detalle y se pueden sealar a los
estudiantes los tems defectuosos en lugar de defenderlos como si no lo fueran. En segundo
lugar, proporciona datos para ayudar a los estudiantes a mejorar su aprendizaje. La frecuen-
cia con que se elige cada respuesta incorrecta revela errores y conceptos equivocados comu-
nes que constituyen una ayuda para introducir correcciones en la enseanza. Tambin pro-
porciona ideas y capacita la preparacin de mejores tests en ocasiones futuras.
Se pueden aplicar diferentes procedimientos para analizar tems (Downie, 1967). Para
los tests informales de aprovechamiento usados en la enseanza el procedimiento ms sim-
ple parece justificable. Los siguientes pasos delinean un procedimiento sencillo y eficaz.
1.Ordene las hojas de test (32 en total) desde la puntuacin ms alta a la ms baja.
2.Seleccione aproximadamente la tercera parte de las hojas correspondientes a las
202
calificaciones ms altas. Estas constituirn el grupo superior (10 hojas). Seleccione el
mismo nmero de hojas con las puntuaciones ms bajas. Estas constituirn el grupo
inferior (10 hojas). Separe el grupo intermedio de hojas (12 hojas). Aunque este grupo
podra incluirse tambin en el anlisis, usar solamente los grupos superior e inferior se
simplifica el procedimiento.
3.Con cada tem, cuente el nmero de estudiantes del grupo superior que eligi cada
opcin. Haga lo mismo con el grupo inferior.
4.Registre el nmero correspondiente al paso 3 en una copia del test, en columnas
colocadas a la izquierda de las opciones a que se refiere cada nmero. El nmero
tambin se puede registrar, de la siguiente manera, sobre la tarjeta del tem o en una
hoja independiente:
Item 1 Opciones A B1 C D E
Superior 10 0 6 3 1 0
Inferior 10 3 2 2 3 0
Aunque nuestro clculo se basa solamente en los grupos superior e inferior se aproxi-
ma mucho a la estimacin que se obtendra con el grupo total. As pues, vale decir que el
ndice de dificultad de este tem es del 40 % (para este grupo particular). Ntese que, como
la dificultad se refiere al porcentaje de veces que se responde correctamente al tem, un
porcentaje menor indica mayor dificultad del tem.
Aunque el anlisis por inspeccin puede ser todo lo que se necesite, para la mayora de
los propsitos se puede calcular fcilmente un ndice de discriminacin. Simplemente
203
hay que restar el nmero del grupo inferior, correspondiente a los estudiantes que acerta-
ron en el tem, del nmero del grupo superior, relativo a los aciertos, y dividir entre el
nmero correspondiente a cada grupo. De tal manera, en nuestro tem de muestra, el
clculo habr de ser as:
Ntese que el poder de discriminacin del tem se representa con una fraccin decimal.
El mximo poder discriminativo positivo se indica con un ndice de 1.00. Este se obtiene
solamente cuando todos los estudiantes del grupo superior eligen la respuesta correcta
sin que lo haga ninguno del grupo inferior. Respecto de los grupos de 10, superior e
inferior, de nuestro ejemplo, la computacin del tem con mximo poder discriminativo
sera como sigue:
Se puede ver que el tem tiene un nivel de dificultad del 50% (acertaron los diez del grupo
superior y fallaron los diez del inferior). Esto explica por qu se recomienda a los
elaboradores de test que preparen los tems con un 50% de grado de dificultad. Solamen-
te a este nivel es posible la discriminacin mxima.
Los pasos anteriores del procedimiento para analizar tems se pueden modificar para que
se ajusten a situaciones particulares. En ciertos casos todo lo que se necesitar ser una
inspeccin de los datos en lugar de computar la dificultad y el poder discriminativo. Asi-
mismo, al seleccionar los grupos superior e inferior puede ser conveniente, si se trata de
204
un grupo numeroso, tomar el 25 % superior y el 25 % inferior, o en el caso de un grupo
pequeo, las mitades superior e inferior del grupo. Lo importante es utilizar una parte del
grupo lo suficientemente numerosa para que arroje informacin de utilidad. Con los tests
de aprovechamiento aplicados en la clase rara vez se justifica seleccionar el 27 % supe-
rior y el 27 % inferior del grupo (como se recomienda para un anlisis ms fino) y aplicar-
les otros afinamientos estadsticos.
Cuando se archivan los tems y se vuelven a usar despus de cierto tiempo, es reco-
mendable registrar en la tarjeta correspondiente cada vez que se le utiliza, los datos del
anlisis de tems. Si se coleccionan tales datos se podr observar la variabilidad de los ndi-
ces de dificultad y poder discriminativo del tem y, por tanto, ser ms fcil interpretar la
informacin.
205
CRITERIOS PARA JUZGAR LA CALIDAD
DE UN ITEM
2. Moderada (30- 44
66- 85) Menos de 30%
3. Pobre (0- 29
86- 100) Menos de 10%
206
CRITERIOS PARA JUZGAR LA CALIDAD
DE UNA PRUEBA
A.Poder discriminativo
B.Dificultad
0- 29 Muy difcil
207
RELACIONES ENTRE DIFICULTAD Y DISCRIMINACIN
p q Mara del C. Malbrn
.99 .01
.95 .05
.90 .10
.85 .16
.80 .20
.75 .26
.70 .30
.65 .35
.60 .40
.55 .35
.50 .50
.45 .40
.40 .35
.35 .30
.30 .25
.25 .21
.20 .15
.15 .11
.10 .05
208
CONSTRUCCIN DE PRUEBAS
PRESENTACIN DEL INFORME DE RESULTADOS
209
GLOSARIO DE TRMINOS RELACIONADOS
CON MEDICIN
(Traducido de A Glossary of 100 Measurement Terms de Roger T. Lenon, Director Test
Department. Harcourt, Brace and World Inc.)
Instituto de Investigaciones Educativas (Universidad de Chile)
Presentamos este glosario de trminos con el doble propsito de dar una informacin
inicial sobre algunos conceptos bsicos y de ofrecer un material de consulta breve y de fcil
manejo que ser til en las diferentes etapas del estudio de la medicin educacional y psico-
lgica.
Anlisis de tems. El proceso de evaluar cada uno de los tems mediante diferentes mto-
dos, por lo general implica la determinacin del grado de dificultad, su poder de discri-
minacin y a menudo, su correlacin con algn criterio.
Anlisis factorial. Cualquiera de los diversos mtodos empleados para analizar las
intercorrelaciones entre un conjunto de variables, tales como los puntajes de un test.
El anlisis factorial trata de explicar las interrelaciones en trminos de algunos facto-
res subyacentes, cuyo nmero es de preferencia menor que el de las variables origi-
nales. Revela qu cantidad de la variacin en cada una de las medidas originales es
producida, o se relaciona con cada uno de los factores hipotticos. El anlisis factorial
ha contribuido a la comprensin de la organizacin o de los componentes de la inteli-
gencia, de las aptitudes y de la personalidad, y ha sealado el camino para la cons-
truccin de tests ms puros para los diversos componentes
210
Asimetra. La tendencia de una distribucin a alejarse de la simetra o equilibrio alrededor
del medio.
Batera. Un conjunto de tests estandarizados en la misma poblacin, de tal modo que los
resultados de los diferentes tests sean comparables; a veces, inadecuadamente se
designa al grupo de tests que se aplican juntos, aunque no hayan sido estandarizados
en los mismos sujetos.
Campo de variacin. La diferencia entre el puntaje mnimo y mximo obtenido en un test por
un grupo de individuos.
Confiabilidad. El grado en que un test es consistente al medir lo que mide; confianza, esta-
bilidad, ausencia relativa de errores de medicin. Comnmente la confiabilidad se
estima por medio de algunos de los coeficientes de confiabilidad o por medio del error
estndar de medicin.
211
tanto, una medida del grado en que las dos formas son consistentes o confiables al
medir la variable, suponiendo que las habilidades de los examinados no varan entre
las dos aplicaciones (ver confiabilidad, coeficiente de confiabilidad y errores de medi-
cin).
Correccin del factor azar. Una reduccin de puntaje para las respuestas incorrectas, algu-
nas veces aplicada al computar tems de verdadero y falso o de seleccin mltiple.
Muchos han puesto en duda la validez o utilidad de esta tcnica que tiene como pro-
psito evitar la adivinacin y dar rangos ms exactos para los examinados en trmi-
nos de su verdadero conocimiento. Los puntajes a los que se han aplicado tales co-
rrecciones, por ejemplo - restar las respuestas incorrectas a las correctas, o una frac-
cin de las incorrectas; a menudo son denominadas correccin del factor azar.
Criterio. Una pauta por medio de la cual puede juzgarse o evaluarse un test; un conjunto de
puntajes, apreciaciones, etc., que el test predecira o con los cuales se correlacionara.
Cuartil. Uno de los tres puntos que dividen los casos de una distribucin en cuatro grupos
iguales. El cuartil menor, o percentil 25, distingue el cuarto inferior del grupo; el
cuartil medio corresponde al percentil 50 (p mediana); y el tercer cuartil o percentil
75, indica el cuarto superior.
Curva pulida. Una curva pulida trazada por el promedio o puntajes medios de grupos de
edad o de cursos sucesivos o por los percentiles de un solo grupo. (ver el cuadro 1
bajo el ttulo de extrapolacin).
Decil. Cualquiera de los nueve puntos que dividen una distribucin en diez partes iguales
cada dcimo percentil. El primer decil es es dcimo percentil, el noveno decil es el
nonagsimo perceptil, etc.
212
Distribucin (de frecuencias). Una tabulacin de los puntajes de mayor a menor o de menor
a mayor que muestra el nmero de individuos que han obtenido cada puntaje o caen
dentro de cada intervalo de puntajes.
34,1 34,1
Frecuencia
15,9 15,9
-1 D.S. Md + 1 D.S.
Variable
Curva normal, se muestran las reas bajo la curva que
corresponden a distancias de t 1 desviacin estndar.
Edad mental (E. M.). Edad en la cual un cierto puntaje es el promedio en un test de inteligen-
cia. Si un puntaje de 55 en un test de inteligencia corresponde a una edad mental de
6 aos 10 meses, luego 55 es el puntaje medio que obtendra un grupo no selecciona-
do de nios de 6 aos 10 meses.
Error de medicin o error estndar. Una estimacin de la magnitud del error de una medi-
cin o puntaje, el valor en que un puntaje obtenido difiere de otro verdadero hipotti-
co. El error estndar es un valor tal que en dos tercios de los casos el puntaje obteni-
do no diferir en ms de un error estndar del puntaje verdadero. Error probable de un
puntaje es una medida similar excepto en que en la mitad de los casos el puntaje
213
obtenido difiere del verdadero en no ms de un error probable. El error probable es
igual a dos tercios del error estndar. Cunto mayor sea el error probable o error
estndar de un puntaje menos confiable ser la medida.
Extrapolacin. En general, cualquier proceso de estimar valores de una funcin ms all del
margen de los datos disponibles. En relacin a las normas de un test, es el proceso de
extender las normas ms all de los lmites de los datos obtenidos, o por mtodos
menos rigurosos, usualmente grficos. En este proceso de extrapolacin el juicio de
la persona que confecciona el test ejerce una marcada influencia, por ello se conside-
ra que los valores de las normas extrapoladas son un tanto arbitrarias.
Factor (en medicin mental). Un rasgo hipottico, habilidad o componente de una habili-
dad, que subyace e influencia el desempeo de uno o ms tests y por lo tanto hace
que los puntajes de los tests se correlacionan. El trmino factor se refiere, en senti-
do estricto, a una variable terica derivada por un proceso de anlisis factorial de
una tabla de intercorrelaciones entre los test; pero tambin se emplea comnmente
para designar la interpretacin psicolgica dada a la variable, tal como habilidad ver-
bal, habilidad numrica, etc.
Forma paralela. Cualquiera de las dos formas de un test que es estrictamente equivalente en
contenido y dificultad de sus tems. Debido a que las frmulas de Kuder-Richardson
permiten una estimacin de la confiabilidad con una sola administracin del test y sin
dividir el test en dos mitades, su uso se ha hecho comn en la construccin de test.
Las frmulas Kuder-Richardson no son apropiadas para estimar la confiabilidad de los
tests de velocidad.
Frmula Spesrman- Brown. Una frmula que permite obtener la relacin entre la confiabilidad
de un test y su longitud. Por medio de ella se logra una estimacin de la confiabilidad
de un test, que ha sido alargado o acortado en cierta medida, a partir de la confiabilidad
conocida de un test de longitud determinada. Se emplea comnmente para estimar la
confiabilidad de todo un test basndose en la correlacin entre sus dos mitades
(confiabilidad par-impar).
Grado de dificultad. El porcentaje de un grupo, tal como los estudiantes de un cierto curso
o edad, que corresponden correctamente a un tem.
214
Interpolacin. En general, cualquier proceso para estimar valores intermedios entre dos puntos
conocidos. Tal como se aplica a las normas de un test, se refiere al procedimiento
empleado para asignar valores estimados (inferidos) (por ejemplo curso o edad equi-
valentes) a los puntajes entre los sucesivos puntajes medios reales obtenidos en el
proceso de estandarizacin. Al leer las tablas de normas, a veces, es necesario inter-
polar para obtener un valor normativo para un puntaje que est ubicado entre dos en
una tabla; por ejemplo en la que aparece a continuacin, a una edad de 12,5 se le
asignara, por interpolacin, un puntaje de 118 (ver cuadro nmero 1 bajo el ttulo de
extrapolacin).
Inventario. (Referente a los tests de rendimiento). Un test que trata de abarcar en forma ms
o menos completa alguna unidad de instruccin o adiestramiento relativamente pe-
quea. El propsito de un inventario, tal como lo sugiere su nombre, es ms bien de
hacer un recuento del conocimiento o destreza de un individuo antes de un esfuerzo
para medir, en el sentido usual. El trmino a veces designa un test empleado para
medir el nivel de rendimiento anterior a la instruccin. Muchos cuestionarios de perso-
nalidad y de intereses se han denominado inventarios, puesto que evalan el nivel
de un individuo en diferentes caractersticas personales, o su nivel de inters en una
variedad de tipos de actividades.
Item de evocacin. Un tem que exige al examinado recordar la respuesta correcta basndo-
se en su memoria. Por ejemplo Coln descubri Amrica en a) 1425, b) 1492, c)
1520, d) 1546.
Item de reconocimiento. Un tem que exige al examinado reconocer o seleccionar las res-
puestas correctas entre dos o ms respuestas dadas.
Item de respuestas mltiples. Un tipo especial de tem de seleccin mltiple en el cual dos
o ms alternativas pueden ser correctas.
Item de seleccin mltiple. Un tem de un test en el cual la tarea del examinado consiste en
elegir la respuesta correcta, o la mejor respuesta, entre varias respuestas u opciones
dadas.
Item de trminos pareados. Un tem que requiere la correcta asociacin de cada alternativa
de una lista con otra alternativa en una segunda lista.
215
Media. (ver media aritmtica).
Mediana. El valor de la variable bajo y sobre el cual queda el cincuenta por ciento de los
casos. El percentil 50, punto que divide el grupo en dos partes iguales. En la repre-
sentacin grfica la vertical que pasa por el valor de la mediana divide al grfico en
dos partes iguales.
Modo. El puntaje o valor que aparece con mayor frecuencia en una distribucin.
Muestra al azar. Una muestra de los miembros de una poblacin diseada en tal forma que
cada uno de los miembros de ella tenga oportunidad de ser includo, es decir, construda
de modo que excluya la seleccin y las operaciones viciadas. El propsito de estas
operaciones es obtener una muestra suficientemente representativa de la poblacin
para que los resultados obtenidos con ella puedan ser generalizados respecto a la
poblacin. Una de las grandes ventajas de las muestras al azar es la existencia de
frmulas para estimar la variacin esperada entre los valores de la muestra y de sus
verdaderos valores en la poblacin total; en otras palabras, gracias a estas frmulas
sabemos cun precisa ser una estimacin del valor de la poblacin por medio de una
muestra al azar de un tamao dado.
Normas de curso. El puntaje promedio obtenido por los alumnos de un determinado curso.
(ver normas, edad modal)
Normas de edad. Valores que representan el desempeo tpico o promedio comn de las
personas de diferentes grupos de edad.
216
Normas de edad modal. Normas basadas en el rendimiento de alumnos en edad modal de
sus respectivos cursos; normas que estn libres de la influencia distorsionada de alum-
nos bajo o sobre el nivel de su curso.
Percentil (P). Un punto de una distribucin bajo el cual queda el porcentaje de casos indica-
do por cada percentil. As P 15 designa el puntaje o punto bajo el cual queda el 15% de
los casos. El percentil no tiene relacin alguna con el porcentaje de respuestas
correctas que un individuo obtiene en un test.
Perfil. Una representacin grfica de los resultados de diversos tests, ya sea de un individuo
o de un grupo, cuando los resultados han sido expresados en trminos uniformes o
comparables. Este mtodo de representacin permite una fcil identificacin de reas
de eficiencia o deficiencia.
Poder discriminativo. La capacidad de un tem para diferenciar entre personas que presen-
tan un rasgo en forma marcada y aqullas que lo presentan en forma dbil.
Problemas de verdadero - falso. Una pregunta o ejercicio de un test en la cual la tarea del
sujeto consiste en indicar si una afirmacin es verdadera o falsa.
217
Puntaje estndar. Un trmino general que se refiere a la transformacin de puntajes brutos
por razones de conveniencia, comparabilidad, facilidad de interpretacin, etc. El puntaje
estndar ms simple es el que expresa la desviacin de un puntaje promedio en rela-
cin a la desviacin estndar de ese grupo. En otras palabras:
Multiplicando esta razn por una constante apropiada y al sumar o restar otra cons-
tante puede obtenerse cualquier puntaje estndar que tenga la media y la desviacin
estndar deseada. Tales puntajes estndar no afectan la posicin relativa de los indi-
viduos en el grupo ni tampoco cambian la forma de la distribucin original. Tipos ms
complicados de puntaje estndar prevn distribuciones que difieren de la distribucin
original, en cuanto a la forma; en realidad a veces se usan precisamente con este
propsito. Ejemplos de este ltimo grupo son los puntajes estndar normalizados.
218
Test colectivo. Un test que puede aplicarse a un grupo de individuos al mismo tiempo y con
un solo examinador.
Test de capacidad. Un test que tiene como objeto medir el nivel de capacidad sin considerar
la rapidez en la respuesta; por lo tanto, un test en el cual el lmite de tiempo es largo
o para el cual no hay lmite de tiempo.
Test de ejecucin. Un test que requiere una respuesta motora o manual por parte del exami-
nado. El trmino test de ejecucin tambin se usa para designar una verdadera si-
tuacin de trabajo donde la respuesta al test es idntica a la conducta sobre la cual se
desea obtener informacin.
Test de madurez. (Desarrollo, disposicin). Un test que mide el grado en el cual un individuo
ha adquirido cierto grado de madurez, ciertas habilidades o informaciones necesarias
para llevar a cabo con xito alguna actividad nueva de aprendizaje. As, un test de
madurez para la lectura indica el grado en que el nio ha alcanzado el grado de desa-
rrollo que le permite comenzar con xito un programa de aprendizaje formal de la
lectura.
Test de personalidad. Un test que tiene como objetivo medir aspectos no intelectuales de la
estructura mental o psicolgica de un individuo. Los tests de personalidad compren-
den los llamados inventarios de personalidad o inventarios de adaptacin que tratan
de medir el grado en que se presentan rasgos tales como: dominio, sociabilidad, intro-
versin, etc., por medio de respuestas auto - descriptivas a una serie de preguntas.
Tambin encontramos aquellas escalas de clasificacin que exigen clasificar, sea el
mismo interesado u otro, segn el grado en que se posee cierta caracterstica. Los
test situacionales en las cuales uno o varios jueces observan la conducta de un indivi-
duo en situaciones similares a las de la vida real y las evalan en relacin a diversos
rasgos de la personalidad. Algunos autores tambin clasifican los inventarios de inte-
reses como tests de personalidad.
Test de conocimiento. Un test que mide el grado en que una persona ha adquirido informa-
cin, por lo general como resultado de instruccin especfica.
Test de pronstico. Un test usado para predecir el xito o fracaso futuro en un campo o
asignatura especfica.
219
Test estandarizado. Una muestra sistemtica del desempeo, obtenida bajo condiciones
establecidas, computadas de acuerdo a reglas fijas y susceptible de evaluacin con
referencia a informaciones normativas. Algunos escritores usan el trmino para desig-
nar a los tests experimentales para los cuales existe evidencia de validez y
confiabilidad.
Validez El grado en que un tests cumple con el propsito para el que se utiliza. Tiene diferen-
tes significados para diversos tipos de tests y, por lo tanto, son apropiadas diferentes
evidencias de validez; por ejemplo:
220