Está en la página 1de 220

UNIVERSIDAD NACIONAL DE LA PLATA

FACULTAD DE HUMANIDADES
Y CIENCIAS DE LA EDUCACIN

Construccin de
Instrumentos

Departamento de Ciencias de la Educacin


Ctedra: Tcnicas de Exploracin Psicopedaggicas
Titular: Prof. Mara Malbrn
CONSTRUCCIN DE INSTRUMENTOS
PRIMERA PARTE
Fundamentos
La evaluacin educativa...........................................................................................................1
Fundamentos de la evaluacin...............................................................................................12
Cuatro tipos de evaluacin.....................................................................................................14
Semejanzas y diferencias entre evaluacin diagnstica, sumativa y formativa.............................18
El diagnstico pedaggico.....................................................................................................20
Estrategias de evaluacin......................................................................................................29
Las mediciones referidas al criterio.........................................................................................36
La evaluacin basada en normas y criterios.............................................................................40
Construccin y utilizacin de pruebas educacionales...............................................................42
Cualidades de una prueba de aprovechamiento........................................................................43
Condiciones que deben cumplir los instrumentos de evaluacin................................................45
Confiabilidad y validez...........................................................................................................48
Confiabilidad y validez de las pruebas de aprovechamiento.......................................................49
La validez de contenido.........................................................................................................51
Gua para el anlisis del contenido.........................................................................................52
Algunas cuestiones relativas a las pruebas de aprovechamiento...............................................53
Mejoramiento de las prcticas de evaluacin en el nivel superior...............................................56
Modelo de cuatro etapas del proceso de enseanza - aprendizaje - evaluacin..........................58
Carrera Docente Universitaria. Proyecto de evaluacin ............................................................64
Criterios para la evaluacin de cursos....................................................................................67

SEGUNDA PARTE
Procedimientos
Diferencias entre tests de aptitud y tests de rendimiento..........................................................69
Examen del examen............................................................................................................ 72
El examen por temas............................................................................................................73
Las pruebas de ensayo.........................................................................................................74
Las pruebas de ensayo. Pasos para la construccin ...................................................................76
Mejoramiento de las pruebas de ensayo..................................................................................79
Pruebas de ensayo breve..........................................................................................................81
Items de ensayo breve .............................................................................................................88
Exmenes orales..................................................................................................................90
Principios para conducir exmenes orales...............................................................................95
Anteproyecto para la incorporacin del examen escrito. Facultad de Humanidades....................97
Proyecto para la enseanza de la Ciencia ............................................................................101
Pruebas domiciliarias..........................................................................................................106
Pruebas de libro abierto.......................................................................................................107
Empleo de pruebas por temas y de pruebas objetivas............................................................108
Diferencias y semejanzas entre las pruebas por tema y las pruebas objetivas..........................109
Errores ms frecuentes en la construccin de pruebas...............................................................112
Pasos para construir pruebas de aprovechamiento.....................................................................113
Gua para la construccin de pruebas de aprovechamiento..........................................................114
Como se prepara, aplica y evala un test..................................................................................117
Construccin de pruebas........................................................................................................131
Los objetivos educacionales. Algunas ideas clave......................................................................139
Taxonoma de los objetivos educacionales. Dominio cognitivo.....................................................140
Evaluacin del aprendizaje en las ciencias. Taxonoma.............................................................147
Pruebas de rendimiento. Clasificacin de los tems....................................................................153
Aspectos a evaluar: tems ms apropiados................................................................................154
Pruebas escritas . Clasificacin de tems.................................................................................155
Los tems verdadero-falso............................................................................................. 156
Las respuestas de tipo eleccin mltiple.........................................................................158
Las preguntas de eleccin mltiple...........................................................................................169
Sugerencias para redactar tems de tipo objetivo......................................................................169
Sugerencias para emplear diferentes tipos de tems...................................................................171
Evaluacin de la comprensin de lectura...................................................................................174
Items complejos.....................................................................................................................176
Ejemplos de tems..................................................................................................................179
Ejemplos de tems de respuesta seleccionada..........................................................................184
Evaluacin del aprendizaje en las ciencias................................................................................191
Tipos de Items........................................................................................................................197
Cmo analizar los tems..........................................................................................................203
Criterios para juzgar la calidad de una prueba........................................................................207
Relaciones entre dificultad y discriminacin..............................................................................208
Construccin de pruebas. Presentacin de informe de resultados...............................................210
Glosario de trminos relacionados con medicin .......................................................................211
LA EVALUACIN EDUCATIVA
Autora: Celia Agudo de Crsico

Evaluar es apreciar el valor de algo. En la esfera educativa es tan grande la importancia que
se asigna a la evaluacin, que resulta imposible concebir un sistema que se desenvuelva con
eficacia y que no posea tcnicas y procedimientos de evaluacin y medida, imprescindibles para
estimar los distintos aspectos de la labor educacional, especialmente el grado en que los alumnos,
en todos los aspectos de su conducta, obtienen provecho de la accin educativa.

Aunque produce efectos considerables, la evaluacin no debe considerarse un fin en s


misma, sino un recurso importantsimo para apoyar en l otros aspectos muy significativos de la
tarea educacional.

Debido a la heterogeneidad de los alumnos en todos los aspectos que conciernen a su


ajuste personal y social y a la gran diversidad de acciones educativas que una sociedad puede
ofrecer a los que estudian, se hace forzosa la evaluacin para determinar la correcta ubicacin de
los alumnos y la enseanza que se les debe impartir.

Se evala para conocer la marcha de la enseanza y del aprendizaje, para diagnosticar


problemas, para determinar hasta que punto se cumplen los objetivos que persigue la enseanza,
para obtener fundamentos slidos que posibiliten la mejora de los contenidos de un programa, de
un ciclo o de todo un sistema.

La falta de una evaluacin sistemtica y planeada impide el conocimiento cabal de la reali-


dad educativa, expone a seguir cometiendo errores, a adoptar reformas y modificaciones sin saber
por qu se hacen, sin poder predecir con cierta probabilidad a dnde habrn de conducir tales
modificaciones.

Todo evaluador comete errores. En lo que concierne a la falibilidad de los juicios valorativos,
las investigaciones psicolgicas han puesto de relieve algunas conclusiones. Por ejemplo, las que
se desprenden del estudio de los juicios emitidos en las escalas de clasificacin. Mientras algunos
jueces son demasiado benvolos o poco crticos, otros son demasiado severos, es decir, que tien-
den a clasificar muy bajo y se ha determinado que los clasificadores son bastante consistentes en
este tipo de errores, ya sea que se clasifiquen a s mismos o que tengan que clasificar a otros
sujetos. Otro error en la relacin clasificador clasificado, es la tendencia a clasificar a un sujeto
de igual modo en todos sus rasgos (comnmente se suele determinar a este tipo de error como
efecto anti-halo). Este error se comete muy a menudo en las calificaciones que los docentes hacen
de sus alumnos.

Algunos autores sealan un error de contraste en las clasificaciones, esto es la tolerancia


de un clasificador que est ubicado en un extremo del rasgo que se evala, y tiende a clasificar a
los dems cerca del extremo opuesto. Tambin habra un tipo de error inverso al que se indic
recin, y que se denomina de semejanza. Otra fuente de error en las clasificaciones esta dada por
la tendencia a clasificar de igual modo los rasgos que al clasificador le parecen lgicamente seme-
jantes o relacionados.

4
En cuanto a la cuestin de si hay buenos y malos jueces de la naturaleza humana, dicho
de otro modo, si hay una habilidad general para juzgar la personalidad, hay poca evidencia para
creer que existe un factor general que pudiera caracterizarse como habilidad para juzgar a los
otros. Parecera que son distintas las habilidades que se aplican para actuar con precisin en la
autoclasificacin, en la clasificacin de sujetos conocidos, y en la clasificacin de extraos.
Adems, el estudio de las respuestas dadas ante inventarios o cuestionarios de personalidad,
revelan una serie de tendencias tpicas en ciertos sujetos que saturan todas sus respuestas,
como por ejemplo, responder afirmativamente a todos los enunciados socialmente deseables.

La evaluacin y la medicin en especial, son elementos bsicos que posibilitan el abor-


daje de los problemas educativos a travs del mtodo cientfico de investigacin. El concepto de
evaluacin es ms amplio que el de medicin, ya que sta no implica necesariamente a la
primera. La evaluacin supone la existencia de un propsito o la idea de que algo es bueno o
deseable desde cierto punto de vista o de acuerdo con una jerarqua de valores. Cuando las
medidas se relacionan con los fines, entonces estamos frente a una labor evaluativa.

El trmino medicin ha recibido numerosas definiciones y de la forma en que se lo defina


deriva tambin la posibilidad de determinar distintos niveles de medicin. Optando por alguna de
las ms usadas, diremos que medir es asignar signos numricos a objetos o hechos de acuerdo
con ciertas reglas. (Stevens, S. S.; 1951)

Algunas de las ventajas ms evidentes de la medicin pueden reconocerse y aceptarse


con facilidad, ya que la medicin permite efectuar descripciones precisas, objetivas y comuni-
cables que el pensamiento puede manejar con facilidad. Por supuesto que la precisin no tiene
su origen en el nmero en s, que sirve para expresar la medida, sino enel cuidado con que se
han delimitado y definido los atributos medidos, en el cuidado con que se han hecho las obser-
vaciones, ya sea directamente o auxiliadas por instrumentos.

La definicin que se dio del trmino medida es muy amplia, pero no se la puede estre-
char sin caer en la exclusin de procesos universales relacionados con las medidas. Si se
acepta dicha definicin, muchos de los que se oponen a la medicin en las ciencias de la
conducta, aparecern utilizando medidas en su trabajo diario. As el maestro que establece tres
categoras de aprovechamiento, a las que llama buena, muy buena y regular, an sin saberlo
est midiendo, utilizando un nivel elemental de medicin, o expresando con mayor vaguedad los
resultados de una medicin previa.

Donde la medicin es muy exacta es raro que se necesite de la matemtica compleja


(un nio de diez aos puede medir exactamente la superficie de una figura geomtrica regular),
porque las relaciones y funciones que se estudian son claras y evidentes. Cuando las medidas
estn sujetas a inexactitud considerable, como ocurre en las ciencias de la conducta, se hacen
necesarios mtodos estadsticos ms complejos, para hallar el ndice de error y para extraer las
relaciones complejas que vinculan a los datos entre s. (Eysenck, H. J).

La medida en el plano educativo, lejos de sustituir a la evaluacin, tiende a complemen-


tarla, a ponerse como un instrumento a su servicio y a ampliar sus alcances.

5
La psicologa es la disciplina que ms ha contribuido brindando instrumentos tcnicos
de medida y evaluacin para su uso educativo. En trminos muy generales se admite que el
aporte de la psicologa a la educacin se traduce por: a) aplicar las teoras del aprendizaje a los
programas; b) la Psicometra a mejorar los exmenes y otros instrumentos de evaluacin; y c)
la teora de la personalidad a la prevencin y tratamiento de las inadaptaciones y a los proble-
mas de la educacin de la personalidad y el carcter. (Cattell, R. B.; 1965). Todos estos aportes
consisten no slo en la facilitacin de marcos tericos, sino tambin en tests, escalas, cuestio-
nario, inventarios y dems instrumentos de medida y evaluacin.

En el plano de la educacin formal existen una gran cantidad de funciones que requieren
evaluacin sistemtica. A continuacin mencionaremos algunas de ellas: a) el planeamiento
educativo; b) la ubicacin educativa, ya sea desde el punto de vista de la integracin (educacin
comn) o de la diferenciacin (enseanza diferenciada); c) la orientacin y el consejo; d) La
mejora de la instruccin; e) la mejora de la situacin de aprendizaje; f) la prediccin del xito
escolar o acadmico.

Cabe tambin mencionar a este respecto todos los tipos de agrupamiento de alumnos
que implican alguna forma de clasificacin o seleccin de los mismos promovidos con el pro-
psito de aumentar la eficacia de la enseanza y del aprendizaje:
1.admisin en la escuela.
2.los grados, que son una forma de agrupamiento que se basa en el nivel de rendimiento
de los alumnos y en su ritmo de progreso.
3.la formacin de clases especiales (para disminuidos fsicos o inadaptados sociales o
emocionales).
4.la formacin de clases especiales para aquellos cuya inteligencia estimada es ms
baja que lo considera el nivel mnimo de educabilidad en una clase normal.
5.nios con bajo aprovechamiento en una materia particular (por lo general se forman
grupos temporarios).
6.nios con inteligencia excepcionalmente alta.
7.alumnos con manejo deficiente del idioma local (extranjeros); en pases donde se
produce una gran inmigracin.
8.ubicacin de alumnos en diferentes clases o cursos dentro de una escuela.
Esto puede ocurrir desde el comienzo o despus que los alumnos han seguido un
curso comn por cierto tiempo.
9.recursos para obtener grupos relativamente homogneos a los fines de la instruccin.
Se refiere a la prctica de ensear por separado, dentro de un mismo establecimiento, a
los nios de una misma edad pero con niveles de habilidad diferentes.
10.formacin de clases paralelas: Dentro de cada edad o grado los alumnos pueden
ser divididos en clases, de modo que cada una de ellas contiene alumnos de todos los
niveles de habilidad.
11.planificacin de grupos flexibles (Yates, 1967).

Los modos que asume la evaluacin educativa son muy variados, pues debe aplicarse
a las mltiples variables que es menester considerar para el mejor conocimiento de la conducta del
educando, del proceso del aprendizaje y de la situacin de aprendizaje, donde importa tanto la institu-

6
cin educativa como la interaccin entre los miembros del grupo escolar.

Entre los modos de evaluacin ms empleados por los docentes pueden mencionarse
las composiciones escritas, los exmenes escritos sobre temas, los exmenes orales, las lec-
ciones, las pruebas prcticas, las entrevistas, las notas, las escalas de clasificacin, los tests
diagnsticos, los tests de inteligencia estandarizados, las observaciones, los cuestionarios e
inventarios. En algunos casos los resultados obtenidos de la aplicacin de todos esos medios
de evaluacin se acumulan en un registro o legajo escolar.

Debe advertirse que la aplicacin de tcnicas psicomtricas como as tambin de la


observacin y la entrevista como recursos para la obtencin de datos, si se pretende que ellos
sean vlidos y confiables se requiere personal capacitado en Psicologa, Psicometra y Estads-
tica Aplicada y en algunos casos se requiere que la tarea sea desempeada por un psiclogo
educacional o cuente con el asesoramiento y supervisin del mismo.

Hay tambin tests y cuestionarios que pueden y deben ser aplicados por el maestro,
pero ste deber estar informado, entre otros, de los siguientes aspectos:
1.los objetivos que se propone medir la tcnica utilizada.
2.el tipo de sujetos a quienes puede aplicarse en relacin con la poblacin sobre la que
fue estandarizada.
3.las condiciones de aplicacin (consigna, tiempo, etc.), sin cuya rigurosa observancia
los resultados pierden todo valor.
4.las caractersticas o propiedades mtricas del instrumento, expresadas a travs de
sus coeficientes de validez y confiabilidad y el error estndar, sin lo cual no se puede
estimar la significacin de los puntajes obtenidos.
5.el tipo de escala y las normas son otros de los requisitos para la interpretacin de los
puntajes.

En suma, la aplicacin de un instrumento psicomtrico en el campo educativo exige que


sus usuarios conozcan sus alcances y limitaciones, lo que puede lograrse en primer trmino de
la lectura del respectivo manual, y como necesario complemento, de la frecuentacin de los
textos y publicaciones peridicas especializadas.

Lo que resta de este artculo se dedicar a considerar exclusivamente las formas ms


comunes que asume la evaluacin del aprendizaje escolar y acadmico, efectuada por el docen-
te y algunos de los problemas que ello presenta.

Es necesario sealar, ante todo, el papel destacado que la evaluacin desempea, den-
tro de la concepcin actual de la psicologa del aprendizaje. En efecto, son numerosas las
investigaciones sobre aprendizaje, tanto en situaciones de laboratorio como dentro del aula,
que han permitido verificar el efecto positivo del conocimiento inmediato, por parte del sujeto de
los resultados de su desempeo o feedback en trminos de teora de la informacin. Uno de los
rasgos ms sobresalientes de la instruccin programada, es que la misma se encuentra en una
situacin ventajosa frente al maestro (debido a que ste, por lo general, orienta el aprendizaje
de varios individuos en forma simultnea), para brindar al aprendiz el conocimiento inmediato de

7
la correccin o inexactitud de cada una de sus respuestas, confirmando su comportamiento, en
el primer caso e indicndole cmo corregir el error en el segundo.

Puede afirmarse que el conocimiento inmediato de que se ha respondido acertadamente


acta como un refuerzo, es decir, como un hecho que aumenta la probabilidad de que la res-
puesta se vuelva a dar la prxima vez que se presente la misma pregunta o problema que le dio
origen. Por ello la evaluacin inmediata y continua es vista como uno de los pilares del proceso
de aprendizaje.

Entre las formas ms frecuentes que asume la evaluacin en el mbito educativo, se


encuentra la nota. La nota es slo una forma sinttica de expresar el complejo proceso de
evaluacin. Este implica como ya se ha visto, el uso de distintos procedimientos e instrumentos
de medida, y aunque debe tratar de ser objetiva, incluye elementos subjetivos, dado el amplio
margen de indeterminacin que afecta todas las estimaciones que se realizan en los planos
conductales y sociales.

La funcin de la nota es hacer conocer al alumno y a sus padres o personas directamen-


te interesadas, los resultados de su actuacin escolar. Admitir que la nota por s sola es una
expresin incompleta de la evaluacin, no significa abogar para que se la suprima, pues hay
varias razones que la hacen til y necesaria, a saber:
1.expresa en forma objetiva y comparable la estimacin del desempeo del alumno.
2.es fcil y claramente interpretable (reconociendo que a pesar de todo puede ser mal
interpretada)
3.su carcter numrico facilita diversas operaciones, que permiten un tratamiento ms
equitativo de los mritos.
4.proporciona al alumno una gua para conocer los resultados de su desempeo (hecho
esencial en el proceso de aprendizaje, como se indic anteriormente), y regular dicho
desempeo en forma adecuada con realismo y sensatez.

A la crtica frecuente contra la frialdad del nmero y su reemplazo por letras o concep-
tos, tales como bueno, distinguido, etc., puede replicarse que la funcin de la letra o palabra no
difiere de la que cumple el nmero, si es que hay una correspondencia unvoca entre la secuen-
cia de letras del alfabeto o de los trminos en la serie de los mismos y cada uno de los
elementos de la serie de dgitos, con la ventaja a favor de estos ltimos de que facilitan las
operaciones.

Otra crtica corriente es que la nota como incentivo puede resultar muy perjudicial, ya
que algunos alumnos estudian y trabajan por ella y no por adquirir conocimientos o habilidades
o destrezas. Si bien esto puede ser cierto en muchos casos, la solucin no est en suprimir la
nota, sino en promover la motivacin intrnseca del aprendizaje, y en favorecer la competencia
del sujeto consigo mismo en lugar de fomentar su rivalidad con los dems.
Un inconveniente muy serio que se presenta cuando se debe recurrir a las notas como datos
para cualquier estudio o investigacin, consiste en que aquellas no significan lo mismo de es-
cuela en escuela, ni de maestro en maestro. Por ejemplo, si en una escuela secundaria se
quieren tomar en cuenta los antecedentes de escolaridad primaria, las notas no sirven ms para

8
una orientacin general, dentro de lmites muy groseros. Para resolver este problema, en ciertos
pases se han ideado procedimientos que aunque laboriosos, permiten equiparar las notas puestas
por todos los maestros de un rea determinada.

Los docentes usan diferentes criterios para asignar notas y varios estudios permiten
suponer que dichas notas son en realidad un ndice que sintetiza ciertas caractersticas de la
relacin docente alumno, y que cuando esa relacin mejora, tambin mejoran las notas, aun-
que el aprovechamiento real (medido por pruebas), no sea distinto.

En la mayora de las situaciones en que el docente debe expresar su evaluacin, la nota


se convierte en el indicador exclusivo del desempeo del alumno, pero no se debe confiar en ella
como el nico criterio para juzgarlo.

Los exmenes constituyen uno de los temas ms controvertidos en el rea de la evalua-


cin educativa. Son muy numerosas las investigaciones que se han dedicado esclarecer la
significacin del examen escrito tradicional.

Suele reconocerse que los exmenes se emplean como:


1.pruebas de aprovechamiento individual.
2.pruebas de aprovechamiento colectivo.
3.valoracin indirecta de la labor docente.
4.instrumentos de valor pronstico.
5.incentivos para estimular el trabajo de los alumnos (aunque esta funcin es admitida
pocas veces en forma explcita)
6.recursos para orientar el aprendizaje, como nico papel, segn algunos autores.

Entre las crticas que se formulan a los exmenes, figuran las siguientes:
1.dominan y distorsionan la totalidad del programa (en el caso de los exmenes finales
o de seleccin, especialmente).
2.estimulan entre los alumnos el poco saludable espritu competitivo.
3.producen desagrado con todo lo que se asocia a ellos.

Sin embargo, lo ms importante es que los exmenes, en su mayora, son instrumentos


muy deficientes para medir el aprovechamiento o las posibilidades futuras de los examinados.
Su falla capital, aunque no exclusiva, es su escasa confiabilidad.

Las causas principales de la baja confiabilidad de los exmenes son:


1.cambios reales en los estados fsicos y mentales de los examinados, que afectan su
desempeo.
2.muestreo inadecuado de la informacin y de la habilidad de los examinados por las
preguntas que integran el examen.
3.inconsistencias en las pautas de valoracin adoptadas por los distintos examinadores,
o por el mismo examinador en distintas ocasiones.
4.diferencias de opinin entre los distintos examinadores en lo que concierne a los m
ritos relativos de las respuestas de los examinados.

9
Las crticas anteriores constituyen un buen punto de partida para tratar de mejorar los
exmenes, dada la necesidad que tienen los educadores de recurrir a ellos. Entre las diversas
medidas que pueden contribuir a dicho mejoramiento, se sealan:
1.considerar las caractersticas del grupo a examinar.
2.formular con claridad los objetivos del examen
3.considerar la forma de examen ms adecuada a tales fines.
4.intentar el muestreo ms amplio y representativo de las informaciones o habilidades
que se desean examinar.
5.al formular las preguntas contar con una anticipacin de las posibles respuestas que
darn los examinados, fijar el margen de libertad que se puede permitir a las mismas, y
de acuerdo con ello elaborar un detallado y preciso esquema de evaluacin, antes de
tomar el examen.
6.no dar un juicio absoluto sobre el valor de cada escrito, sino que una vez calificados
todos los exmenes deben ubicarse en orden de mritos.

Para superar los bajos ndices de validez y confiabilidad apreciados en los escritos tradi-
cionales, se introdujeron en las primeras dcadas de este siglo, las llamadas pruebas objetivas
de evaluacin del aprovechamiento.

Estas se caracterizan porque se construyen sobre la base de una definicin de los obje-
tivos que se persiguen con la enseanza; tratan de hacer un muestreo representativo de aquello
que los alumnos puedan realmente haber aprendido y se expresan en forma de preguntas de
variado tipo, para las cuales hay una sola respuesta correcta. Las pruebas deben su denomina-
cin de objetivas a esta ltima caracterstica de poseer una sola respuesta correcta, lo que
permite un criterio unvoco entre mltiples evaluadores.

A continuacin se sealan y comentan en forma muy escueta, los pasos principales que
deben tenerse en cuenta en la construccin de pruebas objetivas:

1. definicin de los objetivos de la enseanza: Implica la seleccin de lo que va


medirse en relacin con los propsitos que ha perseguido la enseanza, pues la evalua-
cin de los logros slo puede hacerse en cotejo con los fines que el educador se propuso.

2. tabla de especificaciones: Donde se determinan y jerarquizan los aspectos fundantes


que han sido enseados.

3. Elaboracin y seleccin de las preguntas (tems o reactivos) . Lo que deter


mina la eleccin de la forma de la pregunta es el contenido. El nmero de la pregunta
debe guardar adecuada proporcin con la importancia asignada a los temas. Una prueba
masiado corta es poco confiable.

4. Diagrama de un texto : Cuidar la presentacin de textos y grficos, para asegurar su


correcta lectura e interpretacin.

5. Esquema de evaluacin (Clave de respuestas) : A cada pregunta corresponder

10
u solarespuesta correcta. El valor en puntos deber estipularse previendo todas las cir-
cunstancias.

6. Aplicacin: Las medidas que deben residir la administracin de una prueba objetiva,
son similares a las de la toma de cualquier test.

7. Anlisis de los resultados: Cuando se trata de pruebas confeccionadas por el do-


cente para ser aplicadas en grupos pequeos, mediante sencillos procedimientos esta-
dsticos, pueden determinarse el grado de dificultad de cada tem y su respectivo poder
de discriminacin (cmo distingue los buenos trabajos de los ms pobres), y la conver
sin de los puntajes a su equivalente en notas. Para las pruebas estandarizadas el pro-
ceprocedimiento es ms complejo.

Son muchas las crticas que se han alzado contra las pruebas objetivas, pero la mayo-
ra de ellas incurren en el error comn de achacarles incapacidad para satisfacer una serie de
necesidades, que las mismas pruebas no pretenden cubrir.

Es preciso admitir que an en las pruebas llamadas objetivas hay un grave riesgo de
subjetividad, en el momento de decidir sus contenidos.

Debe advertirse que no hay una solucin perfecta para los delicados problemas que
plantea la evaluacin objetiva del aprovechamiento escolar o acadmico.

Bibliografa

Cattell, R. B.(1965) Scientific Analysis of Personality; England, Penguin Books.


Eysenk, H. J. (1959) Estudio Cientfico de la Personalidad; Buenos Aires, Paidos.
Guilford, J, P. (1959) Personality; New York, Mc Graw Hill.
Hotyat, Ferndinand.(1966) Los exmenes; Buenos Aires, Kapeluz.
Lindquist. (1951) Educational Measurement; Washington, American Council on Education.
Mc Intosch, d. et. al.(1962) The Scaling of Teachers Marks and Estimates; Edimburgo, Oliver
and Boyd.
Skinner, B. F.: The Science of Learning and the Art of Teaching; Harvard, Educational Review,
1954, 24, 86-97.
Stevens, S. S.(1951)Mathematics, Measurement and Pshychophysics en el Handbook of Ex-
perimental Psychology; New York, J. Wiley and Sons.
Torgerson, W. S.(1959) Theory and Methods of Scaling; New York, J. Wiley and sons.
Vernon, P. E. (1956)The Measuremente of Abilities; London, University of London Press.
Yates, Alfred.(1967) Grouping in Education; Hamburg, Unesco Institute of Education.

11
FUNDAMENTOS DE LA EVALUACIN

Recopilado de diversas fuentes


por Mara del C. Malbrn.

Todos los resultados importantes de la educacin son mensurables. Un resultado es algo


que produce una diferencia observable.
Para que un resultado de la educacin sea importante, debe traducirse en una diferencia.
Si crea una diferencia, entonces la base para la medicin existe.
Todo lo que existe, existe en alguna cantidad.
Todo lo que existe en cantidades, puede medirse.
Si algo no puede ser definido claramente, no puede ser enseado provechosamente ni medi-
do en forma vlida.
La tangibilidad es una cuestin de grado: hay resultados de la educacin que son difciles
de definir, de ensear en forma intencional y de medir (pensamiento crtico, conciencia cvi-
ca, por ejemplo).
Lo mejor que la medicin educacional puede ofrecer en la mayora de los casos es propor-
cionar una ordenacin jerrquica aproximada de distintos individuos en funcin de su capa-
cidad para ejecutar un conjunto de tareas ms o menos bien definidas. No es posible de-
mostrar que las unidades usadas en la medicin de esta capacidad son iguales. El punto
cero de la escala de capacidad no est claramente determinado.
Una prueba educacional que no promueva de algn modo el aprendizaje es cuestionable; la
promocin del aprendizaje es una labor compleja que requiere diversidad de instrumentos.
El valor educativo de una prueba depende de su calidad y de la habilidad de quien la emplea.
No se han inventado sustitutos eficaces para las pruebas; ensear sin comprobar es inima-
ginable; la evaluacin brinda informacin esencial para orientar la enseanza, corregir el
rumbo, saber en que direccin se marcha.
Las pruebas no reemplazan la observacin directa: son simplemente una tcnica especiali-
zada para ampliar, refinar, registrar con eficacia y resumir esas observaciones.
El constructor de una prueba enfrenta dos problemas principales: 1) determinar qu ha de
medir (pertinencia); 2) decidir cmo medir (confiabilidad).
La formulacin de objetivos educacionales proporciona informacin y orientacin para deter-
minar qu se ha de medir.
La pertinencia alude a la relacin lgica entre la prueba y lo enseado. La confiabilidad a la
coherencia de las mediciones de un rendimiento particular en distintos momentos o diferen-
tes pruebas.
La estructura de los objetivos es un esquema conceptual y no una cosa. No es que tenga-
mos objetivos, sino que elegimos conceptuar nuestro comportamiento segn objetivos.
Un objetivo est definido con suficiente claridad si es capaz de ilustrar o describir la clase
de comportamiento que se espera que adquiera el estudiante, de modo que cuando tal com-
portamiento sea observado, pueda ser reconocido.
Uno de los principales objetivos de la educacin es desarrollar en los estudiantes el conoci-
miento sustantivo, entendiendo el conocimiento como estructura construida por los proce-

12
sos de pensamiento a partir de la informacin. El conocimiento verbal es una forma de
conocimiento muy potente y peculiarmente humana. La posesin del conocimiento se de-
muestra emplendolo en la resolucin de problemas, toma de decisiones, explicacin, argu-
mentacin y prediccin.
La decisin crtica y el momento ms subjetivo en la construccin de las pruebas tiene lugar
cuando se selecciona el contenido.
Las capacidades aprendidas de alto nivel representan una combinacin compleja de objeti-
vos y contenidos. No es lo mismo inventar que reconocer, evaluar la lectura crtica que
escribir en forma imaginativa.
Si las pruebas demandan conocimiento de trivialidades en lugar de conceptos importantes,
principios fundamentales o procedimientos tiles, entonces fallan como instrumentos vli-
dos. Si proporcionan resultados poco estables porque los problemas son muy pocos, ambi-
guos, muy difciles o muy fciles, entonces tampoco resultan vlidas. Estas fallas son
remediables y no todas inherentes a la forma de la prueba.
El principal propsito de una prueba es diferenciar niveles de aprovechamiento que permitan
derivar juicios comparativos basados en estndares absolutos (grado de dominio) o relativos
(rendimientos inter e intraindividuales). La primera es ms un complemento que un sustitu-
to.
La tarea del evaluador demanda elaborar juicios slidos sobre la utilidad potencial de los
distintos temas de conocimiento.
Toda prueba para la cual los alumnos puedan prepararse eficazmente concentrndose en el
aprendizaje memorista y que, por consiguiente, los estimule a dejar de lado el significado y
la comprensin al estudiar, es una prueba deficiente.
Una medicin es objetiva si puede verificarse mediante otra medicin independiente. La pre-
cisin de la medida no depende de la utilizacin del nmero sino del cuidado con el que se
han delimitado y jerarquizado los atributos medidos.
Todo conocimiento verbal puede expresarse en proposiciones. Una proposicin es un enun-
ciado del que puede decirse si es verdadero o falso.

13
CUATRO TIPOS DE EVALUACIN
Fuente: Stufflebeam. La evaluacin orientada hacia el perfeccionamiento.
Seleccin: Mara del C. Malbrn

Evaluacin Evaluacin Evaluacin del Evaluacin del


del contexto de entrada proceso producto

Definir el contexto Identificar y valorar la Identificar o pronosti- Recopilar descripcio-


institucional, identifi- capacidad del sistema, car, durante el proce- nes y juicios acerca
Objetivo las estrategias de pro- so, los defectos de la de los resultados y re-
car la poblacin objeto
del estudio y valorar grama alternativas, la planificacin del proce- lacionarlos con los ob-
sus necesidades, planificacin de pro- dimiento o de su reali- jetivos y la informacin
identificar las oportu- cedimientos para llevar zacin, proporcionar proporcionada por el
nidades de satisfacer a cabo las estrategias, informacin para las contexto, por la entra-
las necesidades, diag- los presupuestos y los decisiones preprogra- da de datos y por el
nosticar los proble- programas. madas y describir y juz- proceso, e interpretar
mas que subyacen a gar las actividades y su valor y su mrito.
las necesidades y juz- aspectos del procedi-
gar si los objetivos miento.
propuestos son lo su-
ficientemente cohe-
rentes con las necesi-
dades valoradas.

Utilizacin de mto- Inventariar y analizar Controlar las limitacio- Definir operacional-


dos como el anlisis los recursos humanos nes potenciales del mente y valorar los cri-
Mtodo de sistemas, la ins- y materiales disponi- procedimiento y per- terios de los resulta-
peccin, la revisin bles, las estrategias manecer alerta ante dos, mediante la reco-
de documentos, las de solucin y las es- las que no se espera- pilacin de los juicios
audiciones, las entre- trategias de procedi- ban, mediante la ob- de los clientes y la rea-
vistas, los test diag- miento referentes a su tencin de informacin l i z a c i n d e a n l i s i s
nsticos y la tcnica aplicabilidad, viabilidad especfica de las de- cualitativos y cuantita-
Delphi. y economa. Utilizar cisiones programa- tivos.
mtodos como la bs- das, la descripcin del
queda de bibliografa, proceso real, la conti-
las visitas a progra- nua interaccin con el
mas ejemplares, los personal del proyecto
grupos asesores y en- y, la observacin de
sayos piloto. sus actividades.

Decidir el marco que Seleccionar los re- Llevar a cabo y per- Decidir la continua-
debe ser abarcado, cursos de apoyo, las feccionar la planifi- cin, finalizacin,
Relacin las metas relaciona- estrategias de solu- cacin y los procedi- modificacin o re-
con la das con la satisfac- cin y las planifica- mientos del progra- adaptacin de la
toma de cin de las necesida- ciones de procedi- ma, esto es, efectuar actividad del cambio.
decisio- des o la utilizacin de mientos, esto es, es- un control del proceso. Y presentar un infor-
nes en el las oportunidades y tructurar las activi- Y proporcionar un es- me claro de los efec-
proceso los objetivos relacio- dades de cambio. Y bozo del proceso real tos (deseados y no
de nados con la solucin proporcionar una para utilizarlo ms tar- deseados, positivos
cambio de los problemas, por base para juzgar la de en la interpretacin y negativos).
ejemplo, la planifica- realizacin. de los resultados.
cin de los cambios
necesarios. Y propor-
cionar una base para
juzgar los resultados.

14
Evaluacin del contexto

Puede estar motivada desde dentro de la institucin como una valoracin regular del esta-
do de la institucin o como una respuesta a ciertos sectores que estn insatisfechos con la
labor de la institucin.
Puede estar motivada desde fuera de la institucin como por ejemplo cuando sta reclama
ms fondos. Estos estudios pueden estar dirigidos a reas especficas o amplias (ms usual).
Generalmente ayudan a la renovacin del sistema y a la promocin de un mejor y ms
eficiente servicio, al diagnosticar problemas concretos y modos de perfeccionamiento y co-
municar puntos fuertes y dbiles de la institucin.
Los resultados de la evaluacin del contexto pueden conducir a una decisin acerca de la
introduccin de algn cambio en el sistema. En este caso, el personal del programa debe
clarificar el problema/s que debe/n ser resuelto/s y formular sus objetivos. Luego considerar
si existe alguna estrategia de solucin clara y apropiada, as como fcilmente adaptable a
su situacin.
La evaluacin del contexto persigue identificar las virtudes y defectos de la institucin y
proporcionar una gua para su perfeccionamiento. Los principales objetivos son la valoracin
del estado global del objeto, la identificacin de sus deficiencias, la identificacin de las
virtudes que pueden subsanar esas deficiencias, el diagnstico de los problemas cuya solu-
cin pueda mejorar el estado del objeto y, en general, la caracterizacin del marco en que
se desenvuelve el programa. Tambin est destinada a examinar si las metas y prioridades
existentes estn en consonancia con las necesidades que deben satisfacer. Los resultados
de una evaluacin del contexto deben proporcionar una base slida para el ajuste (o estable-
cimiento) de metas y prioridades y para la designacin de los cambios necesarios.

Evaluacin de entrada

. La evaluacin de este tipo debe localizar la literatura ms importante, interrogar al perso-


nal que haya tenido xito en un problema similar, fomentar el ingenio y la creatividad del
personal de la institucin y de los destinatarios y, posiblemente consultar a expertos
externos.
Posteriormente se encargar a uno o ms equipos que propongan una o ms estrategias
de solucin. La/s propuesta/s resultante/s deben ser valoradas segn criterios como el
inters que tienen para las necesidades, problemas y objetivos establecidos, su solvencia
y viabilidad.
Los resultados de la evaluacin de entrada pueden ser utilizados para decidir si ha sido
hallada una estrategia de solucin lo suficientemente prometedora como para seguir
adelante con su desarrollo. Si no lo es, debe decidirse su importancia para continuar la
bsqueda y reemprenderla con otra estrategia de solucin.
Si se ha encontrado una estrategia prometedora, debe decidirse si necesita comprobacin
o es lo suficientemente conocida y el personal es capaz de aplicarla como actividad regu-
lar.
Si se decide su comprobacin, la atencin debe dirigirse hacia el examen de la estrategia y
someterla a una evaluacin del proceso y del producto por el perodo necesario para analizar

15
el procedimiento y alcanzar el nivel operativo deseado, as como la habilidad suficiente para
su aplicacin. Incluso si un proyecto ha tenido xito, puede determinarse que las condicio-
nes de la institucin han variado y, como consecuencia, dar por terminado el trabajo.
La principal orientacin de una evaluacin de entrada es ayudar a prescribir un programa
mediante el cual se efecten los cambios necesarios. Esto se realiza identificando y exami-
nando crticamente los mtodos potencialmente aplicables. Es una anunciadora del xito, el
fracaso y la eficacia de un cambio.
Esencialmente, una evaluacin de entrada debe identificar y valorar los mtodos aplicables
(incluyendo los que estn operando) y ayudar a explicar y desmenuzar el que se ha esco-
gido. Tambin debe buscar las barreras, las limitaciones y los recursos potencialmente uti-
lizables a tener en cuenta en la activacin del programa.
El propsito global de una evaluacin de entrada es ayudar a los sectores interesados en la
consideracin de estrategias de programa alternativas en el contexto de sus necesidades y
circunstancias ambientales, as como desarrollar un plan que sirva a sus propsitos; otra
funcin importante es ayudar a los clientes a evitar la infructuosa prctica que consiste en
perseguir innovaciones propuestas que fracasarn o utilizarn mal los recursos.

Evaluacin del proceso

Es una comprobacin continua de la realizacin de un plan. Proporciona continua informacin al


personal acerca de hasta qu punto las actividades de un programa siguen un buen ritmo, se
desarrollan tal como se haban planeado y utilizan los recursos disponibles de manera eficiente.
Proporciona una gua para modificar o explicar el plan, puesto que no todos los aspectos
pueden ser determinados de antemano y algunas de las decisiones iniciales pueden demos-
trar ms tarde ser infructuosas.
Permite valorar peridicamente hasta qu punto los que participan en el programa aceptan y
son capaces de desempear sus funciones.
Una evaluacin del proceso debe proporcionar un informe del programa que realmente se
est llevando a cabo, compararlo con lo que se haba planificado, establecer un recuento de
los distintos costos de su realizacin y saber como juzgar la calidad del trabajo tanto de los
observadores como de los participantes.
La principal misin de la evaluacin del proceso es obtener continua informacin que pueda
ayudar al personal a llevar a cabo el programa tal como estaba planeado o modificarlo tanto
como sea necesario. Es una fuente de informacin vital para interpretar los resultados de la
evaluacin del producto.

Evaluacin del producto

. El propsito es valorar, interpretar y juzgar los logros de un programa. Debe incluir a menudo, una
valoracin de los efectos a largo plazo.
El principal objetivo de una evaluacin del producto es averiguar hasta qu punto el progra
ma ha satisfecho las necesidades del grupo al que pretenda servir. -

16
Debe ocuparse ampliamente de los efectos del programa, incluyendo los efectos deseados
y no deseados, as como los resultados positivos y negativos.
Debe recoger y analizar juicios acerca del xito del programa, procedentes de una amplia
gama de gente relacionada con l. A veces puede hacerse comparando los resultados con
los de otros programas alternativos.
La utilizacin bsica (de un programa) de evaluacin del producto es determinar si un pro-
grama concreto merece prolongarse, repetirse y/o ampliarse a otros mbitos. Tambin debe
proporcionar una gua para modificar el programa con el fin de que mejor sirva a la necesidad
de todos lomiembros interesados y resulte ms efectivo en relacin a su costo.

El anlisis de la evaluacin precedente, en el contexto de un proceso de cambio


institucional, reafirma muchas caractersticas importantes de un mtodo sistemtico de evalua-
cin:
1.la evaluacin es una parte integrante del programa regular de una institucin y no slo
una actividad especializada relacionada con proyectos de renovacin y el perfecciona-
miento de cualquier mtodo especializado es slo una parte del mosaico de la evalua-
cin formal e informal de la institucin;
2.desempea un papel vital en la estimulacin y planificacin de cambios;
3.el desarrollo de nuevos programas debe incluir una previsin acerca de la utilizacin
prctica de la evaluacin.
4.las decisiones acerca del principio, mantenimiento, aplicacin o final de los progra-
mas o de su perfeccionamiento casi siempre reflejan fuerzas dinmicas- racionales e
irracionales- que van ms all de la esfera de estudio e influencia del evaluador.

La evaluacin es una necesaria faceta del perfeccionamiento. No podemos mejorar nues-


tros programas a menos que sepamos cuales son sus puntos fuertes y dbiles y a menos de
que dispongamos de mejores medios. No podemos estar seguros de que nuestras metas son
vlidas a menos que podamos compararlas con las necesidades de la gente a la que pretende-
mos servir. No podemos realizar una planificacin efectiva si no conocemos bien las opciones y
sus mritos relativos. Y no podemos converncer a nuestros clientes de que hemos hecho un
buen trabajo que merece un apoyo econmico continuado a menos que les mostremos evidencia
de que hemos hecho lo que prometimos y que ello ha producido resultados beneficiosos. Por
estas y otras razones, los servicios pblicos deben someter su trabajo a una evaluacin compe-
tente. Debe ayudrseles a diferenciar lo bueno de los malo, a marcar el camino para el perfec-
cionamiento necesario, a ser responsables con sus patrocinadores y clientes y a alcanzar una
mayor comprensin de su especialidad.

El propsito ms importante de la evaluacin no es demostrar sino perfeccionar ... No


podemos estar seguros de que nuestras metas son valiosas si no las comparamos con las
necesidades de la gente a las que presuntamente sirven.

17
SEMEJANZAS Y DIFERENCIAS ENTRE LA EVALUACIN
DIAGNSTICA, LA SUMATIVA Y LA FORMATIVA

(B. Bloom, 1976)

Tipo de evaluacin

DIAGNSTICA SUMATIVA (evaluacin de FORMATIVA (evaluacin


(evaluacin del estado producto) de proceso)
de preparacin para ...)
Determinar la presencia o Retroalimentacin al profe- Certificacin o adjudi-
ausencia de destrezas sor y al estudiante, acerca cacin de nota al es-
pre- requeridas. Determi- de los progresos de este tudiante al final de
Funcin
nar el nivel de dominio ltimo a lo largo de una una unidad, semestre
anterior que poseen los unidad. Ubicacin de los o curso
estudiantes. Clasificar a errores en trminos de la
los alumnos de acuerdo estructura de una unidad
con ciertas caractersti- de modo tal que puedan
cas conocidas o que es- prescribirse tcnicas de
tn relacionadas con mo- instruccin variadas (alter-
dos alternativos de ins- nativas) para remediar las
truccin. Determinar las deficiencias.
causas implcitas de que
se presenten dificultades
de aprendizaje en forma
repetida.

Tiempo Ubicacin al comienzo Durante la instruccin. Al final de una unidad,


de una unidad, semes- semestre o ao de
tre o ao de trabajo. Du- trabajo.
rante el proceso de en-
seanza, cuando el es-
tudiante evidencia repe-
tida inhabilidad para
aprovechar plenamente
la instruccin corriente

Conductas cognitivas, Conductas cognitivas Generalmente conduc-


Enfasis afectivas y tas cognitivas; ello
en la psicomotrices. Factores depende de la asigna-
evaluacin fsicos, psicolgicos y tura; a veces conduc-
ambientales. tas psicomotrices;
ocasionalmente con-
ductas afectivas.

18
DIAGNSTICA SUMATIVA (evaluacin FORMATIVA (evalua-
(evaluacin del estado de producto) cin de proceso)
de preparacin para ...)

Tipos de Instrumentos formativos y Instrumentos formativos Exmenes finales o


instrumen- sumativos para pretest. ideados especialmente. sumativos
tos Pruebas de aprovecha-
miento estandarizadas.
Tests diagnsticos
estandarizados.
Instrumentos construidos
por el docente.
Observacin y lista de
control.

Cmo se Muestra especfica de Muestra especfica de to- Una muestra de los


muestrean cada conducta inicial que das las tareas relaciona- objetivos ponderados
los obje- se considera pre- requi- das en la jerarqua de la del curso.
tivos de sito. Muestra de los obje- unidad.
la evalua- tivos ponderados por el
curso. Muestra de las
cin variables del estudiante
que en forma hipottica o
conocida se relaciona
con un tipo particular de
instruccin. Muestra de
conductas que se rela-
cionan desde el punto de
vista fsico, emocional o
ambiental.

Diagnstico de las des- No puede ser especificada La dificultad media


Dificultad oscila entre 35% y
trezas y habilidades pre- de antemano
de los 70%; con algunos
requeridas: un gran n-
tems mero de tems sencillos tems muy fciles y
del 65% de dificultad o otros muy difciles.
ms alta.

Asigna- Referidos a un criterio y Referidos a un criterio Por lo general referidos


cin de tambin a una norma. a una norma, pero pue-
puntajes den serlo a un criterio.

Patrn individual de los


Mtodo Perfil individual a nivel Puntaje total o sub-
puntajes correctos o
para de las sub- destrezas. puntajes de acuerdo
incorrectos en cada
comuni- con los objetivos.
tarea includa en la je-
car los rarqua.
puntajes

19
EL DIAGNSTICO PEDAGGICO
Autores: M. D. O. De Araujo
M. C. A. De Crsico, M. Moraschi

Si hemos de abordar el tema del diagnstico pedaggico es conveniente tratar de escla-


recer los significados a que apunta la palabra diagnstico. Si nos remontamos a sus orgenes,
surge que el latn gener la palabra diagnstico por adopcin a su vez del vocablo griego diagno-
sis. La forma ms antigua de esta palabra griega es diagignoskein, donde da (dos) y gignoskein
(saber o percibir); de ah, distinguir o diferenciar.

Pero al emplear el trmino diagnstico se hace inevitable la relacin con el mbito mdi-
co. Es prcticamente imposible, al pensar en el trmino diagnstico, eludir la asociacin diag-
nstico-mdico. La actividad de diagnosticar ha sido desde hace muchos siglos una caracters-
tica esencial de la labor mdica, un paso inevitable y previo a la puesta en prctica del trata-
miento curativo. Por eso, cuando se trata de diagnosticar en cualquier sector de la actividad
humana, resulta de gran valor heurstico, asomarse al modelo mdico para comprender tareas
que involucra la labor diagnstica. En la preparacin de los futuros mdicos, el diagnstico
ocupa un puesto central; se sostiene que el primer paso hacia un tratamiento exitoso es un
diagnstico correcto. De ah, que la precisin diagnstica sea de capital importancia.

El propio empleo moderno del trmino diagnstico le ha agregado contexto y funcin a la


palabra, que se define como el arte de reconocer la enfermedad a partir de sus sntomas y
tambin la decisin alcanzada. Dice el Diccionario de la Real Academia: Diagnstico, pertene-
ciente o relativo a la diagnosis, que a su vez significa conocimiento de los signos de las
enfermedades; y agrega, con referencia al diagnstico, conjunto de signos que sirven para fijar
el carcter peculiar de una enfermedad; calificacin que da el mdico a la enfermedad segn los
signos que advierte.

Resulta claro que la actual definicin de diagnstico se relaciona mucho ms


especficamente con la medicina que su definicin griega; sta aparentemente usaba la palabra
tan slo para implicar la diferenciacin entre dos hechos, presumiblemente sobre la base de las
caractersticas distinguibles ms apropiadas.

Cuando la medicina moderna se refiere al proceso de diagnstico, se propone diferenciar


entre diversos estados de enfermedad sobre la base de sus tres caractersticas ms distinguibles,
apropiadas y especificadas, a saber: origen (etiologa); sntomas (proceso patolgico actual,
activo, signos clnicos y sntomas clnicos) y curso (pronstico y mtodos de tratamiento).

Al efectuar el diagnstico el mdico sigue conciente o inconcientemente ciertos procedi-


mientos lgicos definidos. Estos pueden presentarse en forma sincrnica o de etapas super-
puestas, pero aqu los hemos de enumerar de manera secuencial:
1.reconoce el problema que tiene el paciente;
2.rene los datos que le permiten plantear el problema con mayor claridad;

20
3.reflexiona acerca de los hechos determinados y los compara con cuadros que conoce
tericamente y/o por su propia experiencia;
4.piensa en las posibles soluciones;
5.razona acerca de las implicaciones que tienen las soluciones propuestas;
6.compara los hechos reales con las sugerencias propuestas, para determinar si hay
identidad entre los hechos establecidos y las soluciones sugeridas.

De dnde obtiene el mdico los hechos en que se basa para desarrollar este proceso?.De
la anamnesis o historia, del examen psquico y fsico, de las pruebas de laboratorio, de los datos ob-
tenidos del empleo de instrumentos de precisin tales como los rayos X, el electrocardigrafo, el
electroencefalgrafo, etc. La importancia de una historia cuidadosa ha sido reconocida desde los
tiempos ms antiguos; algunos mdicos opinan que la historia contribuye por misma al 50% del
diagnstico correcto, otros elevan el porcentaje al del 75%.

Contemporneamente la naturaleza del diagnstico mdico es objeto de sutiles anli-


sis lgicos y psicolgicos tendientes, entre otras cosas, a determinar los orgenes del llama-
do juicio clnico. Uno de los resultados de dichos anlisis es el haber complementado y an
sustituido, en algunos centros mdicos, el diagnstico personal del mdico por el que efecta
una computadora, alimentada por mayor informacin que la que puede albergar un solo cere-
bro. Ello obedece a que el juicio diagnstico se apoya en una compleja constelacin de varia-
bles determinantes. Lo mismo acontece, como veremos luego, con el diagnstico pedaggico.

Una vez efectuada esta breve incursin por el territorio ajeno, trataremos de trasladar a
nuestro propio campo, el de la educacin, las palabras y cuanto ellas implican en materia de
acciones y de productos o resultados de las mismas.

Penetremos pues en nuestro propio dominio, dispuestos a establecer las analogas y


las diferencias que a nuestro criterio correspondan.

Ante todo debemos dilucidar una cuestin fundamental. El diagnstico mdico supone
diferenciar entre diversos estados de enfermedad, es decir que se hace necesario cuando sur-
gen anomalas, cuando la persona sobre quien debe practicarse el diagnstico se halla enferma
y por lo tanto ha dejado algn aspecto de su organismo o psiquismo, de funcionar normalmente
para ubicarse, por exceso o por defecto, en la zona de la patologa.

Si transportamos la situacin al campo educativo correspondera efectuar un diagnstico


pedaggico toda vez que el sujeto de la educacin, dejara, como tal, de actuar normalmente.
Dicho de otro modo, el diagnstico se hara necesario slo en los casos de trastornos de apren-
dizaje; all donde ste se manifestara deficitario o alterado de alguna manera. A nuestro pare-
cer, esta connotacin del diagnstico educativo resulta estrecha. Lo que se trata de hacer en
educacin en cuanto al diagnstico se refiere, en sentido amplio, es determinar el estado de
preparacin de un alumno o aprendiz, para encarar de ah en ms un nuevo o nuevos aprendiza-
jes. Debe admitirse sin embargo, que el diagnstico educativo en sentido estricto, guarda una
muy completa analoga con el empleo del trmino en medicina. En efecto, el diagnstico peda-
ggico en sentido estricto significa que antes de someter a tratamiento curativo un trastorno o

21
dificultad de aprendizaje, debemos realizar un conjunto de actos que guardan notable paralelis-
mo con los del mdico diagnosticador (anamnesis y exploracin), mediante los que extraemos
de dicho conjunto de actos una serie de datos que nos conducirn a asimilar el trastorno parti-
cular a alguno de los ya descriptos. En sntesis, los procedimientos de diagnstico en sentido
estricto, se realizan en educacin para descubrir lo que falla en el alumno y atenuar o curar ese
trastorno.

En tanto la tarea de reunir los datos acerca del paciente o del aprendiz requieren un
proceso de aguda observacin, para completar la fase descriptiva el razonamiento correcto es
en el anlisis final lo ms importante. Los falsos diagnsticos resultan a menudo no de los
datos falsos, sino de una interpretacin equivocada. Reunir los datos, hacer uso de los ms
importantes, descartar la informacin no pertinente y producir el juicio final, requieren una capa-
cidad mental y profesional de alto nivel.

El diagnstico es por lo tanto, una forma de evaluacin. Como toda evaluacin tiene dos
componentes fundamentales; la descripcin, que puede ser de naturaleza objetiva, caso de
aplicar la medicin, y el juicio de valor que es siempre subjetivo. Ambos componentes mencio-
nados quedan incluidos dentro del diagnstico pedaggico, proceso en el que se describe y
valora algn aspecto de la conducta del alumno. 1

Los dos propsitos fundamentales del diagnstico lo distinguen de otras formas de eva-
luacin. Estos propsitos son los siguientes:

1.ubicar adecuadamente al alumno en el proceso de instruccin (diagnstico en sen-


tido amplio).
2.descubrir las causas subyacentes de deficiencias o dificultades de aprendizaje (diagns-
tico en sentido estricto).

Ambos tipos de diagnstico se aplican en distintos momentos. Mientras el primero debe


tener lugar antes que la instruccin comience, el segundo se aplica durante el proceso
instruccional y ante la repetida evidencia de inhabilidad para aprovecharlo plenamente.

Con frecuencia la instruccin comienza en el mismo punto para todos los miembros de
la clase. Esta prctica supone que todos los alumnos estn en el mismo punto del continuo de
rendimiento, un cero imaginario en trminos de dominio de los objetivos planeados.

Generalmente las clases se forman con alumnos de una gran variedad de antecedentes
educacionales con una falta de uniformidad en sus patrones de rendimiento, as como en la
naturaleza, cantidad y profundidad del estudio independiente. Al aumentar esta heterogeneidad
la varianza respecto de un cero imaginario se incrementa.

Los estudiantes que caen bajo este punto son los que an no han logrado ninguno de los
objetivos planeados o que poseen pocos o ninguno de los contenidos y conductas llamados de
entrada y juzgados como prerrequisitos para el progreso futuro.

22
Uno de los objetivos principales del tipo de diagnstico previo a la instruccin es deter-
minar la posicin del alumno en el continuo imaginario de rendimiento para que pueda ser colo-
cado en la etapa adecuada de la secuencia instruccional. Si este proceso comienza en el mis-
mo punto para todos los alumnos, el resultado puede ser que, aquellos que ya han logrado el
dominio de los objetivos pronto se aburran y desinteresen mientras que los que posean los
prerrequisitos se frustren y desalienten cayendo en el crculo vicioso fracaso-hostilidad-fracaso.

El tipo de diagnstico al que nos estamos refiriendo puede cumplir distintas funciones:

1.determinar si el alumno posee o no ciertos comportamientos y destrezas juzgados


como prerrequisitos para el logro de los objetivos planeados.
2.establecer si el estudiante ha logrado el dominio de los objetivos planeados con el fin
de programarle una tarea ms avanzada.
3.clasificar al alumno de acuerdo con ciertas caractersticas tales como inters, perso-
nalidad, aptitud, historia educacional, etc.

Cualquier agrupacin debe realizarse sobre la base del estudio diagnstico. Thelen en
1967, identific un tipo de agrupamiento que denomin grupos de enseabilidad, para los que
tiene enorme importancia la enseanza compensatoria o mejor llamada enseanza adecua-
da. La enseanza adecuada es el proceso por el cual se determina el status de los alumnos
en un rea de desarrollo y se ajusta la instruccin al status sin segregar a aqullos del grupo
total de la clase.

La funcin de la enseanza adecuada es corregir las deficiencias en los aprendizajes


previos. Estas deficiencias acumuladas, constituyen una de las principales causas del incre-
mento del tiempo necesario para aprender, de la escasa motivacin y de los fracasos en el
aprendizaje.

En los pases donde los procedimientos diagnsticos se estn aplicando en forma siste-
mtica desde hace largos aos, los criterios utilizados para determinar la necesidad de ense-
anza adecuada han sido obtenidos de los resultados del desempeo de los alumnos en prue-
bas normalizadas. Pero cada vez ms se sospecha que los criterios utilizados se basan en
supuestos no siempre vlidos. Se recomendaba enseanza compensatoria cuando se encon-
traba discrepancia entre el desempeo en una prueba de inteligencia y en una de aprovecha-
miento o cuando el status de rendimiento estaba bajo el promedio.

El primero de los criterios se basa en la suposicin que todos los individuos tienen la
misma aptitud para todas las reas y que sta se mide por las llamadas pruebas de inteligencia.

El segundo supone que todos los alumnos deben alcanzar hasta las normas estableci-
das para su edad o grupo.

La mejor medida de lo que un individuo rendira en un rea dada es su rendimiento ante-


rior en el rea. Obsrvese aqu la importancia que la historia educacional del aprendiz tiene
dentro del proceso diagnstico. La necesidad de atencin adecuada, estara indicada entonces,

23
en los casos en que el progreso en un rea se detenga o descienda marcadamente en un pero-
do dado.

Todo docente sabe que a pesar del diagnstico previo a la instruccin con la adecuada
ubicacin de sus alumnos y la compensacin de sus deficiencias anteriores, algunos alumnos
pueden seguir siendo aprendices fracasados durante el proceso de instruccin.

Es en estos casos cuando debe utilizarse el otro tipo de diagnstico. Con l se intentar
la bsqueda de las causas de la repetida dificultad para aprovechar plenamente el proceso
enseanza-aprendizaje.

Los cuatro pasos principales en el diagnstico de las dificultades para aprender son:

1.identificacin de los alumnos que las posean.


2.definicin de la naturaleza especfica de las dificultades.
3.determinacin del o de los factores que causan las dificultades.
4.toma de decisin respecto del tratamiento a seguir.

Por lo general, en la identificacin de alumnos con dificultades para aprender, los docen-
tes se centran en aquellos alumnos que tienen problemas en las habilidades bsicas y en las
reas de contenido. Sin embargo, tambin requieren atencin adecuada los que tienen dificulta-
des en sus relaciones sociales, en su ajuste emocional y en otros aspectos de su desarrollo
personal-social que no slo son significativos per se, sino por su influencia directa en la efec-
tividad del aprendizaje.

El paso de definir la naturaleza especfica de la dificultad requiere un cuidadoso estudio


no slo de los resultados de una prueba sino tambin de un prolijo examen de antiguos resulta-
dos de pruebas, de calificaciones anteriores, del registro del alumno, etc.

En los casos en que un nmero relativamente grande de alumnos experimente una mis-
ma dificultad, podra pensarse, en primera instancia, que sto obedece a mtodos de ensean-
za inapropiados, a fallas en el nfasis dado a determinados temas en el plan de estudio o a
materiales de curso extremadamente complejos. Cuando las fallas no pueden explicarse por
instruccin defectuosa y con el fin de determinar las causas de los problemas, es preciso reali-
zar un estudio minucioso del alumno y de su medio ambiente. Las causas de la actual inhabili-
dad para el aprendizaje pueden ser de carcter educacional o no educacional.

Las causas no educacionales pueden ser clasificadas, por su naturaleza, en fsicas,


psicolgicas y ambientales.

Estas clases por lo general no son excluyentes y por ende se relacionan unas con otras.

Entre los problemas fsicos que afectan el proceso de enseanza-aprendizaje encontra-


mos las condiciones de salud general, neurolgicas, glandulares, de dieta, de audicin, del
habla, visuales, etc., del alumno. Una baja autoestima, la neurosis o desrdenes mentales, la

24
tensin concomitante con los cambios puberales y con la adolescencia o los efectos emociona-
les negativos generados por situaciones anormales en el hogar, son efectos de factores psicol-
gicos as como la privacin cultural podra mencionarse como factor ambiental con influencia
negativa en el aprendizaje.

Por todo lo expuesto, en un diagnstico de amplio alcance ser necesario considerar los
siguientes aspectos del alumno:

a.nivel de rendimiento y habilidades.


b.ambiente cultural de procedencia.
c.contenido de su aprendizaje social.
d.aproximacin personal a las tareas de aprendizaje (motivaciones especficas).
e.lo que espera de s mismo y de los otros.
f.aproximacin especial a la solucin de problemas y a la abstraccin.
g.su sistema mental.
h.sus necesidades especiales.
i.las condiciones bajo las cuales ocurre el aprendizaje (relaciones interpersonales y su
estructura; el clima del aula y los valores del grupo).

El docente no tiene por qu ser un experto en detectar las causas no educacionales de


la actual inhabilidad en el aprendizaje pero debe estar en condiciones de aprovechar los aportes
de los especialistas tales como mdico escolar, asistente social, psiclogo educacional, etc.,
as como tambin reconocer los sntomas asociados con dichas causas y proponer las solucio-
nes posibles a los problemas.

Las dificultades en el aprendizaje tienen causas mltiples y son producto de un conjunto


de factores entre los que pueden sealarse uno o alguno de ellos como circunstanciales.

No siempre la escuela es capaz de solucionar el problema de los alumnos que padecen


sntomas de causas no educacionales. En estos casos, si el alumno afectado continua rindien-
do poco en la interaccin diaria del aula, el docente no debe reprochrselo ya que los problemas
escolares del educando son parte indivisible de sus problemas vitales y viceversa.

La determinacin del status de los alumnos en un rea dada y el ajuste de la instruccin


respecto del status, debe ser un proceso continuo en el aula.

El papel que desempean las pruebas en el proceso diagnstico es de gran importancia.

Mientras una prueba de rendimiento se disea para expresar en trminos de un nico


puntaje el aprovechamiento del alumno en un rea dada, una prueba diagnstica ayuda a descu-
brir deficiencias en el aprendizaje y/o en la enseanza.

Las pruebas diagnsticas pueden ser del tipo normalizado o simplemente del tipo infor-
mal o hechas por el docente.

25
Pero si cualquier conclusin relativa o capacidad potencial para el aprendizaje se infiere
de los resultados de una prueba diagnstica de cualquier tipo, a tal inferencia puede llegarse
vlidamente si, y slo si se han satisfecho los siguientes supuestos:

1.Todos los alumnos han tenido una oportunidad igual para aprender los tipos detareas
que se presentan en la prueba.
2.Se ha motivado a todos los alumnos para que en la prueba se esfuercen al mximo
de sus capacidades.
3.Todos los alumnos tienen los llamados comportamientos capacitadores (habilidad
para la lectura, por ej.) necesarios para lograr su actuacin exitosa en la prueba.
4.No hay alumnos con comportamientos incapacitadores (pnico a la prueba, proble-
mas emocionales, etc.) que puedan afectar su actuacin ptima en la prueba.

Los docentes bajo adecuada direccin, pueden llegar a construir instrumentos diagns-
ticos altamente analticos para determinar si el alumno posee las destrezas y habilidades as
como los contenidos juzgados como prerrequisitos para la nueva tarea que emprendern.

Preferentemente, una prueba diagnstica debe ser del tipo objetivo por su facilidad de
aplicacin y de interpretacin, debe incluir uno o ms tems por cada elemento importante y no
slo una muestra de la gama de contenidos y conductas que lleva una prueba de final de instruc-
cin o sumativa. Como la atencin se debe centrar en las dificultades para aprender que tienen
los estudiantes, la prueba deber construirse a la luz de las fuentes ms comunes de error que
cometen los mismos. Los errores son un maravilloso vehculo cuando pueden usarse para clari-
ficar malas interpretaciones y diagnosticar fallas.

Las pruebas diagnsticas normalizadas ayudan al docente a desarrollar una perspectiva


de la clase como conjunto. El progreso de cada alumno puede ser visto teniendo como marco el
total de la clase, pero ayudar a un alumno a que sea ms efectivo en el logro de los objetivos
dados, requiere un anlisis ms especfico de lo que pueden brindar las pruebas normalizadas
que con frecuencia tratan casi exclusivamente de una secuencia de aprendizaje y descuidan
algunas habilidades.

Las pruebas diagnsticas hechas por el profesor, fciles de aplicar e interpretar y que
pueden sealar las necesidades especficas de un rea en trminos de dominio antes que en
trminos comparativos con algn grupo no siempre representativo, se hacen cada vez ms ne-
cesarias.

Los elementos de prueba no deben ser difciles para que el 65% o ms de los alumnos
pueda intentar responderlos con probabilidad de acierto.

En una prueba diagnstica, el puntaje simple o compuesto es de escasa o ninguna


significacin pero en ella los puntajes parciales o los porcentajes de respuestas correctas a
tems individuales, son las medidas buscadas.

El mejor mtodo para informar el puntaje de estas pruebas, lo constituyen los perfiles

26
individuales por sub-destrezas, mtodo que exige una elaboracin minuciosa.

Para que las pruebas diagnsticas puedan ser ms efectivas, deben seguir los siguien-
tes criterios:
1.Ser parte integral del curriculum enfatizando y clarificando los objetivos importantes.
2.Las respuestas que requieren sus tems deberan ser lo ms funcionales posibles.
3.Ser analticas y basadas en evidencia obtenida experimentalmente sobre dificultades
de aprendizaje y malas interpretaciones por parte de los alumnos.
4.Revelar suficientemente el proceso mental del aprendiz para detectar puntos de error.
5.Sugerir o proveer procedimientos especficos compensatorios para cada error detecta
do.
6.Ser diseadas sistemticamente para cubrir una larga secuencia de aprendizaje.
7.Ser elaboradas para verificar olvidos de elementos difciles tanto como para detectar
aprendizaje incorrecto.
8.Revelar el progreso del alumno en trminos objetivos.

Las pruebas no pueden ser los nicos instrumentos diagnsticos que deben usarse.
Para ciertos campos como el del pensamiento, de las actitudes y de los sentimientos, resultan
de gran ayuda otros procedimientos complementarios, como las conversaciones abiertas en el
aula; las preguntas y los temas abiertos, el registro de la lectura y de la redaccin, la ejercitacin
y las tareas especiales.

Pero si bien estos procedimientos son ms flexibles y proporcionan indicios ms revela-


dores que los formales, no siempre son confiables, salvo que se renan en forma ordenada y de
acuerdo con una serie de hiptesis.

Con el fin de ayudar a los alumnos a superar sus dificultades de aprendizaje, no hay una
pauta fija a seguir. Los procedimientos especficos que se usan como remediadores dependern
de la naturaleza concreta de la dificultad de aprendizaje, as como de los factores que la han
causado y han contribuido a provocarla. En algunos casos un simple repaso o una reiteracin de
la enseanza, pueden ser los procedimientos remediadores aconsejados, pero en otros habr
que mejorar la motivacin, superar deficiencias en hbitos de trabajo y de estudio, corregir
dificultades emocionales, etc.

As como los procedimientos de evaluacin son tiles para el programa general de ins-
truccin, tambin lo son para el diagnstico con el fin de remediar las deficiencias en el apren-
dizaje.

Un anlisis minucioso de los resultados de las evaluaciones durante el diagnstico y el


tratamiento pondr de manifiesto errores del alumno que pueden ser prevenidos y factores que
los originan que pueden modificarse.

A lo largo de este breve escrito, que no pretende ser ms que una mera introduccin al
tema del diagnstico pedaggico como actividad evaluativa, se ha llamado la atencin reiterada-
mente hacia la complejidad de las tareas que debe encarar el docente diagnosticador.

27
Este debe reunir un conocimiento integral de:

1.el educando y los mltiples factores personales y sociales que inciden sobre sus capa-
cidades de aprendizaje;
2.el curriculum y sus objetivos y mtodos de enseanza;
3.los recursos de evaluacin que incrementan la validez y la confiabilidad del diagnsti-
co.

Todos los roles y competencias involucrados en esta lista sinttica, son exigidos al
docente, quien lo sabe de antemano o llega a comprenderlo en el ejercicio de sus funciones.

Una adecuada capacitacin docente debe, por lo tanto, dar a las actividades relaciona-
das con el diagnstico la importancia que contemporneamente se les asigna.

Bibliografa

Bloom, Benjamn S. y otros.(1971). Hand-book on Formative and Summative Evaluation of studant


learning. New York. Mo. Graw Hill .
Buffic, Edward G. y otros.(1968).Mathematics: strategies of teaching. New Jersey. Prentics-
Hall.
Cronbach, L. Y.(1970).Essentials of Pschycological Testing. 3. edicin New York. Harper and Row.
Ebel, R. L.(1965). Measuring Educational Achievement. Engle-Wood, Cliffs, N. Y.: Prentice Hall.
Encyclopeedia Britnica (1971). Volumen 7 p.p.352-356.
Gronlund, Norman E.(1971). Measurement and Evaluation in teaching. New York. Mac Millan.
Lain Entralgo, Pedro.( 1961).La Historia Clnica 2.ed. Barcelona, Salvat Editores.
Lindquist, E. Educational Measurement.(1950)Washington D. C. American Council on Education.

1 Se hace notar que la evaluacin educacional no se restringe slo al alumno sino que abarca desde cualquier
elemento del curriculum hasta el sistema educativo.

28
ESTRATEGAS DE EVALUACIN

Fuentes: -Popham, W. J.(1978) Criterion-Referenced Measurement


Prentice-Hall, Inc. New Jersey,
Ebel, R.(1975) Educational Tests: Valid?, Biased?, Useful?.
Phi Delt, Kappan, October
Notas seleccionadas y traducidas por la Profesora Mara Malbrn.

La principal diferencia entre las prcticas de evaluacin actuales y las tradicionales reside
en que hoy las pruebas se utilizan para juzgar la calidad de las acciones educacionales
ocupando la asignacin de notas un papel secundario. La labor de los maestros se juzga
tambin sobre la base del desempeo de los alumnos en las pruebas.
Este cambio en los objetivos de la evaluacin ha determinado modificaciones en los recur-
sos utilizados. Se han puesto en evidencia algunas inadecuaciones de las pruebas usuales
referidas a normas, dando surgimiento a lo que podramos llamar la era de las mediciones
referidas al criterio.
La denominacin mediciones referidas al criterio fue acuada por R. Glaser y David Klaus en
1962.
Brevemente definida, una prueba referida al criterio se disea para producir una descripcin
clara del significado real del rendimiento del examinado. Ms que interpretar ste en rela-
cin con el de otros sujetos, tal como sucede en la mayora de las pruebas tradicionales, la
prueba referida al criterio produce una semblanza ms completa de lo que puede y no puede
realizar el alumno.
En muchas circunstancias, la informacin que se desea brinden las pruebas sobre el alum-
no es cunto sabe o cunto puede hacer comparado con otros, informacin que indudable-
mente se obtiene con las medidas referidas a normas. En otros casos, sin embargo, lo que
se desea saber con precisin es cunto puede hacer o cunto sabe un sujeto determinado
sobre algn aspecto seleccionado. En esta situacin, las medidas referidas al criterio son
las indicadas.
Robert Glaser en 1963 us la denominacin mediciones referidas a la norma para aludir a
las pruebas tradicionales de aprovechamiento que enfatizan la identificacin del status o
posicin relativa que corresponde al alumno con respecto de un grupo y la denominacin
mediciones referidas al criterio para las pruebas que identifican el grado de dominio de
conductas especificas por parte del alumno en trminos absolutos.
El conocimiento adquirido en la construccin de pruebas referidas a normas en cuanto a los
fundamentos, metodologa, criterios para seleccionar y mejorar tems, etc. resulta de gran
provecho para quienes deseen construir recursos referidos al criterio.
Si bien las mediciones relativas a normas siguen ocupando un papel central en los exme-
nes de aptitud, cuando se trabaja con pruebas de aprovechamiento dentro del marco de la
situacin de enseanza-aprendizaje, usualmente deseamos saber ms acerca del desem-
peo del examinado de lo que brindan estos recursos.
Ambos tipos de evaluacin pueden ser considerados como dos estrategias que persiguen
diferentes fines. La diferencia fundamental entre ambas radica en la calidad de la descrip-

29
cin que ofrecen. En un caso interesa la descripcin en trminos de comparaciones
interindividuales, en el otro obtener una descripcin lo ms clara posible del significado del
rendimiento individual con fines de enseanza y aprendizaje. Objetivos tan distintos recla-
man obviamente, mtodos diferentes.

Las pruebas educacionales, deben ser referidas a normas o a criterios?

Segn Robert Ebel, las pruebas referidas a normas que interpretan el puntaje del alumno en
relacin con las normas establecidas a travs del examen de individuos similares, muestran
en forma amplia una multitud de elementos de conocimiento o habilidad en forma difusa.
Las referidas al criterio informan cules o cuntas de un conjunto de metas especficas de
aprovechamiento ha alcanzado un alumno particular. Se concentran en un nmero limitado
de aspectos especficamente definidos, examinando cada uno de ellos repetidamente para
obtener mayor certeza de su real logro.
Cada uno de estos tipos de pruebas tiene sus ventajas y limitaciones. Las referidas al
criterio pueden brindar informacin ms especfica y detallada sobre el desempeo del alumno
pero implican la realizacin de informes ms extensos y engorrosos. Las referidas a la
norma pueden proveer una sntesis ms concisa de un rea menos claramente definida de
logros.
Las mediciones relativas a criterios enfatizan el dominio de aspectos especficos por todos
los alumnos, si bien existe alguna arbitrariedad en la definicin del grado de dominio y en
los criterios de seleccin de los especficos. Las mediciones por normas alientan y recom-
pensan la calidad del aprovechamiento individual si bien tambin es arbitraria la seleccin
de los elementos de las tareas en que debe demostrarse dicha calidad.
Existen tambin diferencias en las concepciones sobre el aprendizaje en que se basan
dichas clases de instrumentos. Las pruebas relativas al criterio tratan el aprendizaje como
si se lograra a travs de unidades separadas, discretas, que se suman a un conjunto apren-
dido. Las remitidas a normas son consistentes con la nocin de que el aprendizaje consiste
en la construccin de una estructura de numerosas relaciones entre conceptos. En las
etapas tempranas del aprendizaje, tales como las que ocurren en el aprendizaje de las
letras, nmeros y operaciones aritmticas bsicas, la nocin de acumular elementos o as-
pectos separados o no relacionados directamente entre s hasta poder integrarlos en una
secuencia puede resultar adecuada. Pero an en las etapas tempranas el descubrimiento
de relaciones resulta muy importante y difcil de desmembrar en aspectos ntidamente se-
parados.
La idea de dominio resulta tentadora pero engaosa. El dominio completo an de las ideas
y habilidades ms simples es muy difcil o imposible de lograr. No parece razonable insistir
para que un alumno que completa un curso deba dominar todo lo que se ha establecido
previamente ni que deba insistir hasta lograr todo aquello que otro estudiante ha consegui-
do. Dado que ninguno de nosotros dispone de tiempo ilimitado para vivir o para dedicar al
aprendizaje, existen serios obstculos prcticos para hacer del tiempo, ms que del monto
aprendido, la principal variable en el proceso del aprendizaje.
Un peligro inherente al uso de las mediciones referidas al criterio reside en el hecho de que
los maestros puedan dedicarse meramente a la enseanza de aspectos muy particulares

30
implicados en las pruebas descuidando los procesos ms abarcadores y fundamentales.
Las principales dificultades que hay que enfrentar cuando se piensa en la utilizacin de
pruebas referidas al criterio son: la seleccin y justificacin posterior del conjunto de ideas
y habilidades que cada estudiante tendr que aprender; el problema de determinar el nivel de
desempeo que se tomar como indicacin de que se ha logrado el objetivo; el retest repe-
tido de quienes no alcanzan el criterio luego de completar el ciclo; la identificacin de un
ntido nivel de rendimiento que permita clasificar vlidamente los desempeos en trminos
de logro y no logro del objetivo, especialmente en los casos lmite o intermedios; el modo o
maneras para informar sin que origine una labor tan minuciosa que complique en lugar de
simplificar las tareas de evaluacin y comunicacin de resultados.
No cabe duda que en las etapas iniciales del aprendizaje tal como tiene lugar en los prime-
ros grados y en los programas que intentan desarrollar habilidades tcnicas, las mediciones
referidas al criterio son claramente superiores a las relativas a normas. Pero queda abierta
la cuestin en otros mbitos relativa a la supuesta superioridad de las primeras sobre las
segundas.
La principal funcin de cualquier prueba de rendimiento, sea referida a normas o a criterios
es diferenciar niveles de aprovechamiento. Las pruebas no sern vlidas si no logran
esta diferenciacin. Es necesario salvaguardar contra la idea equivocada de que si dispone-
mos de datos sobre el nivel de rendimiento de un individuo en relacin con algn objetivo o
estndar o con su propio rendimiento anterior no necesitaremos realizar comparaciones con
otros individuos. Diferentes tipos de comparaciones no constituyen alternativas equivalen-
tes. Cada una de ellas provee una clase sustancialmente diferentes de informacin. En
muchas situaciones las comparaciones interindividuales son necesarias o deseables. Ni la
excelencia ni la deficiencia en el aprovechamiento pueden ser identificadas confiablemente
sobre otra base que la comparacin entre los desempeos individuales.

Especificaciones para la preparacin de pruebas referidas al criterio

Estas pruebas se utilizan para determinar la posicin de un individuo respecto de un rea


bien determinada. Un rea bien determinada o delimitada consiste en un conjunto de aspec-
tos (ideas, habilidades, disposiciones, etc.) que pueden ponerse a prueba en una situacin
de examen. El rea cubierta puede ser simple o compleja.
El esquema descriptivo de la prueba representa el intento por parte del constructor para
comunicar el rea que evaluar la misma. La comunicacin consiste en las especificaciones
de la prueba. Luego los tems debern ser congruentes con las especificaciones.
El nivel de exigencia exigido por la prueba influir sobre el nmero de tems necesarios.
Dados que estas pruebas se utilizan en un contexto de enseanza-aprendizaje para contro-
lar el progreso del alumno en el curso, debern dar suficiente oportunidad para que ste
muestre lo que es capaz de hacer.
Las tcnicas para mejorar las pruebas referidas a criterios pueden ser tanto a priori como a
posteriori. Las primeras de tipo lgico, basadas en el juicio experto, las segundas de tipo
emprico.
Los controles basados en el juicio deben ser sistemticos, esto es, a partir de la creacin
de una situacin cuidadosamente estructurada en la que personas calificadas juzguen los
tems en funcin de la consistencia o congruencia con las especificaciones previstas.

31
Con relacin a los controles a posteriori, el anlisis del poder discriminativo de los tems
utilizado en las pruebas referidas a normas se basa casi exclusivamente en las tcnicas
correlacionales y stas, como se sabe, dependen en gran medida de la variabilidad de las
respuestas de los examinados. Una de las principales acciones que dieron origen a las
pruebas referidas a criterios fue la identificacin ms clara de los objetivos de aprendizaje
de modo que un nmero progresivamente mayor de alumnos lograra el dominio de los mis-
mos. El resultado de esto es, obviamente, una disminucin de la variacin de las respues-
tas. Esto torna poco adecuada la utilizacin del poder discriminativo para este tipo de prue-
bas, aspecto que cobra valor en un marco comparativo interindividual.
Cuando se presenta insuficiente variacin, resulta posible comparar los puntajes de alum-
nos que no han sido y han sido enseados en el programa, en cuyo caso puede utilizarse un
anlisis de correlacin biserial.
Otro procedimiento consiste en computar las diferencias entre los niveles de dificultad de
los grupos de aprovechamiento superior e inferior (usualmente el 27% ms alto y bajo) y
calcular en base a stos el grado de discriminacin del tem.
Hay autores que propugnan el grado de sensibilidad del tem en cuanto a la instruccin
misma como indicador ms adecuado dentro de un contexto. Uno de estos ndices se refiere
a la diferencia entre el pretest o preprueba antes de la instruccin y el postest o postprueba.
El primer paso para preparar una prueba de este tipo consiste en adoptar una estrategia de
espectro limitado para aislar un pequeo nmero de los aspectos importantes a ser evalua-
dos an cuando stos puedan ser complejos que luego se desmembran en sus elementos
componentes. El espectro limitado contribuye a la precisin y grado de especificacin pos-
terior.
El segundo paso reside en la seleccin de alternativas que involucren la puesta a prueba de
realizaciones observables del alumno que se analizan en trminos de: a) en qu medida el
atributo resulta evaluado; b) en qu grado una alternativa resulta ms adecuada en relacin
con los propsitos de la medida. La seleccin termina en la decisin de optar por un tipo de
tarea congruente para cada clase de realizacin especficamente establecida que debera
ser la de mayor poder como muestra.
Los componentes de las especificaciones de la prueba pueden conceptualizarse segn el
siguiente esquema:

1.descripcin general del tipo de realizaciones que evaluar el instrumento;


2.muestra de tems que reflejen los componentes;
3.atributo del estmulo o clase de materiales que se presentarn al examinado;
4.atributos de la respuesta que se pedir al examinado.

Ejemplo de las especificaciones para una prueba referida al criterio

- Propsito: la prueba est diseada para ser utilizada con un grupo de sujetos que conocen
los nmeros, pueden leerlos y manejar en forma elemental las operaciones aritmticas pero
no saben leer la hora. La prueba intenta controlar el progreso en esta adquisicin.
- Para ello debern prepararse las especificaciones del instrumento que permitirn: a) desa-
rrollar una serie de tems congruentes con el tipo de adquisiciones que se describan; b)
comunicar en forma clara, carente de ambigedad la significacin del desempeo individual

32
a la luz de las especificaciones; c) los tems se prepararn cuidando dicha congruencia en
forma sistemtica; d) el constructor y un juez competente ajeno a la prueba juzgarn cada
tem en relacin con las especificaciones y se determinar la necesidad de introducir modi-
ficaciones en los mismos.

Descripcin general: Presentados una serie de relojes que marcan diferentes momentos
(en trminos de horas y minutos), el examinado seleccionar la alternativa que corresponda en
cada caso con la que ilustra el reloj.

Item de muestra: Para el reloj que se presenta a la izquierda, marque la hora que est
representada segn las alternativas de la derecha.

a. 1.35
b. 8.05
c. 8.00
d. 5.05

Atributos del estmulo:

1.los relojes podrn ser de forma circular o cuadrada, aproximadamente del tamao de un
reloj de pulsera. Podrn representar cualquier momento en unidades de 5 en 5 minutos;
2.podrn usarse nmeros arbigos, romanos o simplemente marcas, puntos o elementos
similares para sealar las doce posiciones;
3.las agujas minutero y horaria tendrn una representacin clara en cuanto al tamao relati-
vo (corta y larga) utilizando lneas rectas o flechas. Nunca se superpondrn totalmente;
4.la aguja minutero slo se dirigir a puntos del reloj que representen incrementos tempora-
les de 5 minutos (ej. 5.10 5.15), nunca a puntos intermedios entre stos (ej. 5.08 5.18).
La aguja horaria reflejar con la mayor precisin posible la posicin entre las horas de acuerdo
con la ubicacin de la aguja minutero;
5.no se usarn relojes digitales.

Atributos de la respuesta:

1.se presentarn cuatro opciones, una de las cuales corresponder a la hora y minutos
marcada en el reloj. Estas consistirn en un nmero que representa la hora seguido de un
punto y luego los minutos. Todas las opciones de respuestas reflejarn intervalos de 5 minutos.
2.se considerarn opciones incorrectas: a- cuando se lee invirtiendo las agujas minutero y
horaria;b- un tiempo de 5 minutos antes o despus del sealado; c- la transposicin del
tiempo correcto -por ejemplo, 15.3 en lugar de 3.15; d- slo la hora omitiendo los minutos; e-
los minutos correctos pero una hora ms o menos que la sealada; f- otra hora que la que
marca el reloj.
3.el orden de las alternativas correcta e incorrectas ser dispuesto al azar.

33
Lectura de la hora del reloj en el reloj pulsera. Postest.
1-
12
11 1
10 2
9 3
a.1.35
b.8.05
8 4
c.8.00
7 5
6 d.5.05

2-
XII

IX III a.9.20
b.9.25
VI
c.10.20
d.7.05

3-
X
X X
X X
X X a.1.00
X X b.12.00
X X c.12.00
X
d.11.55

4-

a.11.45
b.2
c.8.45
d.9.00

5-
12

9 3 a.10.40
b.10.45
6 c.8.55
d.9.45

En sntesis, una prueba referida al criterio presenta las siguientes caractersticas:

1-un esquema descriptivo claro, libre de ambigedades;


2-un nmero adecuado de items por cada aspecto evaluado;
3-un espectro de conductas suficientemente limitado;
4-consitencia como instrumento de medida, fundamentalmente entendida con referencia al pro-
grama de enseanza y a las decisiones que fundamente en relacin con l;
5-validez en cuanto a la seleccin de las realizaciones que mejor representan el rea selecciona-
da, en cuanto a la congruencia de los items con las especificaciones y en cuanto al grado en que

34
los propsitos particulares para lo que fue construda.
6-datos comparativos disponibles que permitan no solo determniar si el alumno ha logrado o no
determinada conducta, sino los distintos grados en que diferentes alumnos se desempearon
con respecto al rea de cuestin. Esta informacin resulta til para evaluar el grado de adecua-
cin del desempeo individual.

35
LAS MEDICIONES REFERIDAS AL CRITERIO
Fuente: Wardrop, J.(1976). Standardized Testing in the Schools:
Uses and Roles. Brooks/Cole Publising Company, Monterrey, California.
Traduccin y sntesis: Mara del C. Malbrn.

De las muchas crticas que han recibido las pruebas de rendimiento estandarizadas
para la evaluacin del desempeo del alumno, una de las ms frecuentes ha sido la que sea-
la la falta de propiedad de las comparaciones normativas para ciertos usos educacionales.
Una de las ms persuasivas es la formulada por Glaser (1963).

Las pruebas de aprovechamiento educacional... se aplican frecuentemente con el


propsito de ordenar a los estudiantes de una clase o escuela ms que para evaluar el
logro de objetivos curriculares especificados. Cuando tales mediciones referidas a la
norma se utilizan, el estudiante particular es evaluado en trminos de una comparacin
entre su rendimiento y el de otros miembros del grupo. Tales evaluaciones proveen poca
o mucha informacin acerca del grado de dominio que muestran los desempeos en
trminos de lo que el alumnos puede realizar.

Las personas interesadas en el desarrollo de la enseanza enfatizan, como es lgico,


el papel de las pruebas como medidas del cumplimiento de ciertas metas en relacin con el
nivel deseado. Este nfasis est relacionado con el inters por validar los materiales que ellos
preparan y se basa en la efectividad con la que los alumnos demuestran que han logrado la
informacin y las habilidades que estn siendo enseadas. Pero los diseadores del curricu-
lum no son los nicos que muestran legtimo inters acerca del grado en que los alumnos lo-
gran determinados niveles de habilidad: maestros, profesores, administradores y padres estn
igualmente interesados en conocer cunto sabe el estudiante o que es lo que puede hacer.
Este inters trasciende el rendimiento relativo comparado con otros miembros del grupo o si
el individuo cumple o no los estndares previstos, centrndose en el desempeo tomado en
trminos absolutos.

Distinciones Bsicas

La diferencia fundamental que subyace a los comentarios precedentes es la que alude a


la diferencia entre las medidas referidas a la norma y al criterio. De acuerdo con los usos
comunes de los trminos, las mediciones referidas a la norma son las que se expresan en las
pruebas cuando stas se construyen para que:

1-los tems produzcan una diferenciacin mxima entre individuos;


2-arrojen altos coeficientes de validez con respecto a otros indicadores del aprovecha
miento;
3-permitan un ordenamiento claro entre los miembros de una clase o escuela;
4-los puntajes puedan ser interpretados en trminos de la posicin relativa que ocupa
un individuo en la distribucin (a travs de valores percentilares, estndar o de otra clase).

36
En contraste, las pruebas referidas al criterio muestran como caractersticas salientes
el que:

1-Los tems se seleccionan de acuerdo con la pertinencia del contenido respecto de


los objetivos curriculares.1
2-Los tems permiten una mxima discriminacin entre los grupos que han tenido y no
han tenido la oportunidad para aprender la informacin y las habilidades puestas en
juego;
3-Los resultados se interpretan en trminos del grado en que un individuo en particular
cumple con un estndar u objetivo determinado (criterio).

La distincin entre ambos puede expresarse en forma ms simple. Una evaluacin re-
ferida a la norma es aquella en la que el rendimiento del examinado se evala en comparacin
con un nivel deseado de eficiencia a lo largo de un continuo de adquisicin. Las dems dife-
rencias son mucho menos importantes.

Despus de todo, las definiciones ofrecidas sugieren que el hecho de considera a una
2
prueba como RN o RC depende de cmo se interpreten los puntajes, no de las caractersticas
intrnsecas de la misma. Cualquier prueba o examen puede ser visto desde ambos puntos de
referencia. Sin embargo, si se desea construir un instrumento de uno de los dos tipos, debera-
mos tener en cuenta otros atributos. Ambas deben comenzar con un conjunto (pool) de tems o
problemas pertinentes respecto del contenido. Una prueba RN representa objetivos tomados de
los materiales curriculares usuales, una prueba RC representa objetivos aislados o tomados
separadamente del programa vigente en forma directa. Usualmente stos se refieren a objetivos
importantes o cruciales dentro del programa y los tems seleccionados son claramente espec-
ficos y pertinentes para ello en una situacin particular. Son vlidos cuando ponen en juego o
resultan indicadores del grado de logro de esos objetivos especificados. Inversamente, en la
prueba RN las mediciones sern vlidas si logran discriminar en forma confiable entre los indivi-
duos y pueden ser relacionadas en forma significativa con otras mediciones concurrentes o
futuras del rendimiento evaluado.

Algunos problemas relacionados con las evaluaciones

Una prueba RC ideal estara compuesta de tems que resolvieran todos aquellos alum-
nos que hubieran tenido oportunidad de aprender el contenido que est siendo evaluados y a la
inversa no resolvieran quienes no hubieran tenido esas oportunidades. Sin embargo, y esto es
un problema para los diseadores de pruebas, es raro que los alumnos lleguen a la situacin de
enseanza sin saber nada acerca del contenido y es igualmente inusual que un tem de prueba
est tan bien preparado y la situacin de examen tan libe de influencias irrelevantes de modo
que todos los alumnos que hayan dominado el contenido resuelvan las cuestiones en forma
perfecta.

1 Las pruebas referidas a normas tambin incluyen contenidos y objetivos curriculares. La diferen-
cia radica en la es-pecificidad de la relacin.
2
RC: referidas a criterios.

37
No obstante lo dicho, una prueba RC es probable que contenga una cantidades tems
que casi todos los que hayan recibido la enseanza pertinente puedan resolver satisfactoria-
mente. Esta situacin crea dificultades para quienes buscan determinar la confiabilidad y vali-
dez de las mediciones. En trminos de la teora clsica de las pruebas, confiabilidad alude a la
habilidad para discriminar entre los individuos; en una situacin en la que todos o casi todos
logran el criterio buscado, estas discriminaciones no son posibles. Adems son innecesarias,
salvo en el sentido de separar quienes han logrado los objetivos deseados respecto de los que
no estn en condiciones. Hasta el momento no se han desarrollado procedimientos que permi-
tan determinar esos controles necesarios para asegurar la calidad de los instrumentos.

Otro aspecto indispensable para asegurara la calidad de un medida RC es el que alude a


la validez. El enfoque tradicional de estimar este atributo en trminos de los coeficientes de
correlacin que utilizan criterios extremos resulta inaplicable, al menos tal como se usa. Por lo
tanto, tpicamente cuando se habla de medidas RC la validez a la que alude es la de contenido.
Como se sabe, este tipo de validacin est sujeto a limitaciones cuando se omiten los restan-
tes, incluida la validez de construccin. Los problemas de validacin de las pruebas RC perma-
necen an sin solucin satisfactoria.

Problemas relativos a la adecuacin del contenido

Desde que Glaser (1963) introdujo el trmino, las pruebas RC han sufrido distorsiones.
Una de las razones es la que obedece a la aceptacin indiscriminada de este enfoque por los
educadores que consideran que el nico abordaje defendible es el de la enseanza consiste
entonces en usar pruebas RC empleando aquellos tems que muestran objetivos claves. En este
contexto, las pruebas RC deberan denominarse pruebas relativas al grado de dominio de los
objetivos. El problema reside en que, dad la variedad y cantidad de objetos especficos que se
persiguen en la mayora de los cursos, cada unos de ellos estara representado en la prue-
ba por un nmero tan pequeo de tems que afectara su calidad en el sentido de no brindar
suficiente oportunidad al estudiante para evidenciar el nivel o grado de sus logros.

Cuales son los criterios?

Cuando hablamos de medidas RC suponemos niveles de logos predeterminados o


rendimiento a nivel del criterio: Tales aseveraciones podran hacer creer que esta tarea es fcil
o sencilla. Sin embargo, determinar el criterio o nivel a ser considerado aceptable para proponer
al estudiante un nivel ms alto o promoverlo no es asunto de importancia menos. Derivado de
ello tambin es difcil determinar cundo en relacin con el rendimiento en la prueba considera-
remos que dichos niveles han sido alcanzados.

Para resolver esta cuestin necesitamos comprender o saber cmo ayudar a que los
individuos aprendan y cmo han llegado a saber lo que han logrado. Este conocimiento provee la
base conceptual para establecer los niveles implicado en el criterio. En ausencia de procedi-
mientos tericamente basados, podemos estudiar empricamente la cuestin comparando el
rendimiento de los estudiantes en la prxima unidad criterio, con la que est siendo desarrolla-
da. Ello requiere la observacin cuidadosa de las actividades de aprendizaje de un nmero de

38
alumnos con el fin de dar cuenta de las innumerables influencias que afectan al aprendizaje o
que o hacen posible y de la cantidad que los resultados pretendidos son posibles o alcanzables.

El procedimiento tpicamente usado para establecer niveles de criterio consiste en em-


plear un procedimiento arbitrario y decidir que un nivel de xito del 80 % (menos frecuente del 70
o 90%) constituye el criterio.

Comentarios evaluativos

Si bien el tono de los comentarios precedentes ha sido negativo, consideramos que el


concepto de mediciones RC es til. Sirve para recordar que las medidas RN no son las nicas
utilizadas para evaluar el rendimiento de los alumnos. Explicita la necesidad de centrarse en los
objetivos curriculares (sea o no que estn expresados en trminos de rendimientos observables)
cuando se seleccionan procedimientos de evaluacin. Enfatizan que existen importantes ele-
mentos de juicio acerca del rendimiento que exceden la comparacin con el grupo, hecho fre-
cuente olvidado o descuidado cuando se abordan dificultades de enseanza y aprendizaje.
Cuando las evaluaciones RC son adecuadamente concebidas y preparadas pueden
convertirse en informacin inestimable acerca del grado en que los alumnos logran los niveles
de aprovechamiento deseados. Si se preparan instrumentos de calidad, estas pruebas deben
ocupar un lugar comparable al que juegan las pruebas RN tradicionales.

39
LA EVALUACIN BASADA EN NORMAS Y CRITERIOS
Mara del C. Malbrn

Las evaluaciones del aprovechamiento acadmico se realizan para producir una descrip-
cin clara del significado del rendimiento de los estudiantes. Cmo otorgar ese significado?.
Dado que las mediciones son de naturaleza esencialmente comparativa se requiere un marco al
que remitir las puntuaciones observadas de modo de conferirles esa significacin.

Un modo de hacerlo consiste en diferenciar entre mediciones referidas a normas y medi-


ciones referidas a criterios tales como el grado de cumplimiento de los objetivos, el grado de
dominio del contenido o el grado de progreso observado.

Estos dos tipos de mediciones utilizan diferentes patrones o estndares comparativos y,


por lo tanto, producen diferente tipo de informacin sobre el rendimiento observado. De acuerdo
con los datos que s e desean obtener podr emplearse una de ellas o ambas.

a . Juicios evaluativos en funcin de las diferencias interindividuales


(referidos a normas) .

Basados en la idea de un continuo de aptitud entre los estudiantes.

Informacin que producen:

cunto conoce o puede hacer el estudiante comparado con otros


status o posicin relativa del estudiante con respecto al grupo
descripcin del rendimiento en trminos de comparaciones interindividuales
muestreo amplio de contenidos
sntesis de los logros obtenidos en un rea de conocimiento y/o en una unidad temporal
determinada
evaluacin de procesos abarcadores y fundamentales o bsicos
Niveles de rendimiento medio que se tomarn como indicadores de que se ha logrado el
objetivo
determinacin de niveles de aprovechamiento, casos limtrofes, dificultades de aprendizaje
basadas en la diversidad de rendimientos del grupo
simplificaciones para la comunicacin de los resultados
identificacin y ubicacin de los estudiantes en subgrupos
fundamentacin de decisiones sobre notas y promociones
identificacin de estudiantes avanzados o de alto rendimiento
certificacin del rendimiento
diagnstico del rendimiento sobre la base del grupo
comparaciones entre grupos
determinacin de criterios de ingreso, promocin, acreditacin
obtencin de estndares institucionales

40
determinacin de categoras tales como superior, medio y bajo rendimiento
fundamentacin de decisiones educacionales basadas en lo que la mayora de los estudian-
tes logran

Dificultades : no tienen en cuenta debidamente los progresos individuales, se interesan por


los productos ms que por los procesos, pueden descuidar las relaciones evaluacin ense-
anza, son de naturaleza ms retrospectiva que prospectiva.

b.Juicios evaluativos en funcin de un criterio de dominio.

Basados en la idea de un continuo de aprovechamiento o dominio.

Informacin que producen:

descripcin de la competencia lograda en un aspecto seleccionado


identificacin de cuntas y cules metas ha logrado el estudiante
posicin en el continuo de aprendizaje o dominio respecto del nivel deseado
diferencias de rendimiento entre el pretest y el postest
determinacin de cunto puede hacer el estudiante sobre un aspecto determinado
aprovechamiento dentro del marco de la situacin de enseanza aprendizaje
descripcin del significado del rendimiento individual con fines de enseanza
concentracin en un nmero limitado de aspectos especficamente definidos examinando
cada uno de ellos para obtener evidencia de su logro
grado de dominio de aspectos bsicos en todos los estudiantes
exploracin de la calidad del aprovechamiento individual
estimacin del grado de dominio de requisitos
control del grado de progreso del estudiante en el curso
identificacin de los objetivos de aprendizaje en los que se desea que un nmero progresiva-
mente mayor de estudiantes logre el dominio
centracin en un pequeo nmero de los aspectos significativos para ser evaluados
logro de una consistencia mxima entre la evaluacin y la enseanza
determinacin de diferentes grados en los que distintos estudiantes demuestran que han
logrado informacin y habilidades que estn siendo enseadas
ajuste de la relacin de contenidos y objetivos curriculares basada en el desempeo indivi-
dual
ubicacin del estudiante en el punto de la secuencia de aprendizaje en que se encuentra
recoleccin de datos tiles para la autoenseanza

Dificultades : cmo desmembrar aspectos ntidamente recortados en el continuo de aprendizaje


o dominio; cmo o con qu criterios seleccionar los aspectos a ser evaluados; cmo diferenciar
claramente los niveles de logro/dominio no logro.

41
CONSTRUCCIN Y UTILIZACIN DE
PRUEBAS EDUCACIONALES
Mara del C. Malbrn.

Evaluacin referida a la norma o al criterio?

Cules son las pruebas ms eficientes?

Qu habilidades se requieren para construir una prueba adecuada?

Cmo puede determinarse la calidad de una prueba?

Debe entrenarse el alumno en la realizacin de pruebas?

Existen aspectos que deberan evaluar todas o casi todas las asignaturas? Cules son?

Son mejores las pruebas de pocos o de muchos tems?

Deben las pruebas tener el sello personal del constructor?

Cmo equilibrar en las evaluaciones los pesos relativos al dominio de informacin y a las
habilidades? (procesos mentales) Se pueden evaluar stas sin recurrir a la informacin?

Pueden ser evaluadas en forma objetiva caractersticas tales como la perseverancia, el


gusto, etc.?

Favorecen las pruebas la competencia indebida entre los alumnos?

Cundo existen cursos paralelos, debe usarse la misma prueba o pruebas diferentes?

Deben comunicarse al alumno los objetivos de la prueba y discutirse con l los resulta-
dos?

Son tiles las pruebas de libro abierto?

Qu ventajas ofrece la organizacin de un Departamento de Evaluacin en la institucin?

42
CUALIDADES DE UNA
PRUEBA DE APROVECHAMIENTO
(Segn Ebel, R. 1965, 1972)

PERTINENCIA entre el desempeo requerido para responder correctamente y el objetivo


cuando se redactan los tems. Estos deben estar directamente relacionados con los objeti-
vos del curso y la instruccin brindada. La pertinencia contribuye a la validez. Se han
elegido cuidadosamente las preguntas incluidas en esta prueba para evaluar los rendimien-
tos deseados?

EQUILIBRIO grado en que la proporcin de tems pone a prueba los resultados particulares
de lo enseado. El marco de referencia est incluido en la Tabla de Especificaciones. La
proporcin de tems que versan sobre cada aspecto del rendimiento, concuerdan con la
intencin del constructor de la prueba, tal como se expresa en las especificaciones de
sta?.

EFICACIA nmero de respuestas requeridas por unidad de tiempo. La prueba hace uso
eficaz del limitado tiempo que dispone el docente para prepararla y calificarla y del limitado
tiempo tambin que dispone el estudiante para realizarla?.

OBJETIVIDAD acuerdo experto acerca de las respuestas correctas o mejores. Es una


caracterstica de la puntuacin y no de la forma en que se redactan los tems. Son las
preguntas suficientemente claras y las respuestas lo bastante definidas como para que
cualquier experto en el tema sobre el cual versa la prueba obtenga en ella un puntaje perfec-
to o casi perfecto?

ESPECIFICIDAD en cuanto a los aprendizajes particulares a ser examinados. Requieren


las preguntas rendimientos especficos para el campo sobre el cual versa la prueba de ma-
nera que los novicios en ese campo an cuando sean duchos en rendir pruebas, que no
hayan estudiado la temtica, tengan que esperar puntajes cercanos al nivel del azar?

DIFICULTAD el grado de dificultad debe ser apropiado al grupo que se va a examinar. Gene-
ralmente, un examen confiable es aquel en el que cada tem es superado por la mitad de los
estudiantes. Las preguntas de la prueba, y sta en su totalidad, son de dificultad adecuada,
ni muy fciles ni demasiado difciles, de manera que puedan ser eficaces para los examina-
dos a los que est destinada.

DISCRIMINACIN cualidad de los tems para distinguir entre los estudiantes ms prepara-
dos y los menos preparados. Cada una de las preguntas discrimina netamente entre los
estudiantes de rendimiento ms alto y ms bajo, y la prueba en su totalidad produce una
amplia distribucin de puntajes?

CONFIABILIDAD caracterstica compleja que se relaciona con la estabilidad de las medi-

43
ciones y que puede ser controlada con respecto a los tems, los encargados de la puntua-
cin, los sujetos examinados, etc. Arroja la prueba resultados que concuerdan con los
objetivos evaluados en otras ocasiones o utilizando distintos calificadores?

IMPARCIALIDAD para asegurarla el profesor debe construir y aplicar la prueba de manera


que permita a cada estudiante igual oportunidad para demostrar su aprovechamiento.

RAPIDEZ se refiere al grado en que la velocidad de respuesta influye sobre los puntajes.
En las pruebas de aprovechamiento la rapidez generalmente no juega un rol significativo en
la de terminacin del puntaje. Debe permitirse el tiempo suficiente para que la mayora de
los examinados complete la prueba. Tiene la prueba una longitud adecuada para el tiempo
disponible?. Se evita que el ritmo de trabajo del examinado influya indebidamente en el
puntaje que obtiene?

44
CONDICIONES QUE DEBEN CUMPLIR LOS
INSTRUMENTOS DE EVALUACIN
Mara del C. Malbrn

Pertinencia

Alude a las decisiones acerca de qu medir. La formulacin de objetivos educacionales proporcio-


na informacin y orientacin para ello. Implica la relacin lgica entre la prueba y lo que se ha enseado
(validez del contenido, validez ecolgica). Son por lo tanto aspectos a tener en cuenta en relacin con el
desempeo requerido: a. los objetivos; b. los contenidos; c. las habilidades/tcnicas/procedimientos; d. el
contexto; e. la instruccin

Consideraciones para favorecer la pertinencia:

1.la estructura de los objetivos es un esquema conceptual: no es que tengamos objetivos, sino
que elegimos conceptuar el rendimiento de acuerdo con ellos (Stenhouse)
2.un objetivo est definido con suficiente claridad si es capaz de ilustrar o describir la clase de
realizacin que se espera del estudiante, de modo que cuando ella se observe pueda ser recono-
cida (Tyler)
3.uno de los principales objetivos de la educacin es desarrollar en los estudiantes el conoci-
miento sustantivo, entendiendo el conocimiento como estructura construda por los procesos de
pensamiento a partir de la informacin. El conocimiento verbal es una forma de conocimiento muy
potente y particularmente humana. La apropiacin del conocimiento se de muestra emplendolo
en la solucin de problemas, la toma de decisiones, la explicacin, argumentacin, prediccin
(Ausubel)
4.la tarea del evaluador demanda elaborar juicios slidos sobre la utilidad potencial de los distin-
tos temas de conocimiento. La decisin crtica y el momento ms subjetivo en la construccin de
las pruebas tiene lugar cuando se selecciona el contenido
5.las capacidades aprendidas de alto nivel representan una combinacin compleja de objetivos y
contenidos. No es lo mismo inventar que reconocer, evaluar crticamente un texto que escribir en
forma imaginativa
6.si las pruebas demandan conocimiento de trivialidades en lugar de conceptos importantes, prin-
cipios fundamentales o procedimientos tiles fallan como instrumentos vlidos. Si proporcionan
resultados poco estables porque los problemas son muy pocos, muy ambiguos, muy difciles o
muy fciles, tampoco resultan vlidas. Estas fallas son remediables (Ebel)
7.una prueba para la cual los estudiantes puedan prepararse eficazmente concentrndose en el
aprendizaje memorista y que, por lo tanto, los estimule a dejar de lado el significado y la com
prensin al estudiar es un instrumento deficiente (Ebel)
8.una prueba educacional que no promueva el aprendizaje es de utilidad cuestionable; la promo-
cin del aprendizaje es una labor compleja que requiere diversidad de instrumentos
9.todo conocimiento verbal puede expresarse en proposiciones. Una proposicin es un enunciado
del que puede establecerse su grado de verdad o falsedad. Las proposiciones deben satisfacer
ciertas condiciones:

45
- Estar expresadas en trminos todo lo precisos y carentes de ambigedad que el cono-
cimiento el lenguaje lo permitan, en una formulacin razonablemente concisa;
- Ser aceptados como verdaderos por una mayora de expertos en ese campo de conoci-
miento;
- Ser consideradas por un nmero mayoritario de expertos en ese campo como enuncia
dos dignos de ser conocidos y recordados;
- Expresar principios e ideas que exijan el conocimiento del campo (Cohen y Nagel).

1.Los tipos de enunciados que se incluyen en las pruebas pueden ser clasificados como:
fcticos, generalizadores, comparativos, condicionales, relacionales, explicativos, ilus-
trativos, predictivos, metodolgicos, de cmputo, evaluativos.
2.Una clasificacin til de las cuestiones utilizadas en las pruebas educacionales es la
que se refiere al tipo de habilidades que demandan: comprensin de la terminologa,
comprensin de hechos, principios o generalizaciones, capacidad para traducir, explicar
o ilustrar (comprensin de relaciones), capacidad para calcular, capacidad para predecir
(lo verosmil dentro de las condiciones especificadas), capacidad para proponer decisio-
nes adecuadas (en situaciones problemticas), capacidad para formular juicios evaluativos.
3.Las pruebas deberan centrarse en la competencia cognitiva entendida como la capaci-
dad para adquirir, evaluar y aplicar el conocimiento y atender al desarrollo y uso del cono-
cimiento en la resolucin de problemas del mundo real, al mundo de la experiencia. El
pensamiento crtico debe entenderse como la eleccin del mejor curso de accin sobre la
base de los argumentos ms vlidos, como el desarrollo de un marco analtico para em-
plear crticamente el conocimiento producido sobre bases metodolgicas (Meehan, 1991).

Equilibrio

Se refiere a la validez del contenido para reflejar la jerarquizacin acorde con: a. La


organizacin lgica; b. Los tipos de aprendizaje implicados; c. El nfasis otorgado durante el
desarrollo del curso; d. El tiempo disponible.

La omisin de objetivos importantes, las preferencias temticas del profesor, la genera-


lidad o especificidad excesivas, los saltos de un tema a otro, la falta de claridad para comuni-
car a los estudiantes la relacin entre la enseanza y la evaluacin atentan contra el equilibrio.

Objetividad

Aspecto clave de la confiabilidad de los instrumentos; se refiere al acuerdo experto acer-


ca del grado de correccin o adecuacin de las respuestas. Tiene que ver con la estabilidad de
los puntajes utilizando diferentes puntuadores, un mismo puntuador en distintas oportunidades,
una misma prueba aplicada en diferentes momentos o sesiones. Depende asimismo del grado
de estructuracin y organizacin de las tareas (claridad de las consignas) y del grado de com-
plejidad de los tems (puntajes simples y puntajes compuestos). Auxiliares tiles para controlar
este aspecto son la calidad de la clave de correccin previa y la medida en que un experto en el
contenido puede obtener un puntaje perfecto o casi perfecto si la realiza.

46
Especificidad

Se vincula con la validez de contenido y de construccin. La especificidad en cuanto a


los contenidos o habilidades que se evalan aseguran que el azar, la familiaridad del estudiante
para rendir pruebas, la fluidez verbal, la elegancia o estilo (salvo cuando no sean objetivos de la
tarea), influyan indebidamente en la puntuacin; que quienes adoptan un enfoque superficial
obtengan similares resultados a los que poseen mayor dominio.

Dificultad

La dificultad de los tems y de la prueba como un todo debe resultar adecuada al tipo de
decisiones que se desea toma como resultado de la misma. Es un indicador crtico del grado de
dominio. Se relaciona con la oportunidad para: a. diferenciar niveles de logro; b. descubrir las
diversidades; c. determinar la progresin o secuencia ms adecuada del contenido; d. determi-
nar el grado en que resulta apropiada para el grupo examinado.

Discriminacin

Seala la calidad de la prueba para distinguir entre los estudiantes ms y menos prepa-
rados. Contribuye sustancialmente a la validez diagnstica del instrumento. La discriminacin
puede determinarse para la prueba como un todo, los tems o tareas individuales y las partes o
alternativas de cada tem (anlisis interno).

47
CONFIABILIDAD Y VALIDEZ
Mara del C. Malbrn

En la siguiente lista escriba (c) si la palabra alude fundamentalmente a la confiabili-


dad y (v) si a la validez.

til Atractivo
Prctico Eficaz
Seguro Cambiante
Consistente Falseable
Influenciable Variable
Natural Fluctuante
Representativo Aleatorio
Independiente Idoneidad
Redundante
Preciso
Pertinente
Imparcial
Azaroso
Replicable
Artificial
Desvinculado
Discriminativo
Generalizable
Objetivo
Equilibrado
Predictivo
Claro
Apropiado
Superficial
Obsoleto
Sensible
Constante
Realista
Accesible
Estable
Efectivo
Certero
Influble
Adecuado
Verificable
Errdicado
Abarcador
Trivial

48
CONFIABILIDAD Y VALIDEZ DE LAS PRUEBAS
DE APROVECHAMIENTO.
Mara del C. Malbrn

Se presenta a continuacin una serie de cuestiones relacionadas con la confiabilidad y


validez de los instrumentos de evaluacin del aprovechamiento del alumno. Han sido recopila-
das de la literatura especfica existente sobre el tema. Gran parte de ellas se aplican a la ma-
yora de las situaciones de evaluacin y pueden plantearse cualesquiera sea el tipo de instru-
mento que se utilice. La lista tiene el propsito de ayudar a los evaluadores a mejorar sus
estimaciones a travs del control sistemtico de las fuentes que ms comnmente determi-
nan los errores.

Qu recaudos se toman para evitar la introduccin de factores no pertinentes en la evalua-


cin?. Cules son comnmente esos factores?

En las pruebas de ensayo, qu peso se asigna a cualidades tales como el estilo, la


legibilidad, la ortografa, la prolijidad?. De qu modo influyen en la evaluacin del conteni-
do de la prueba?

Cmo afecta el grado de acuerdo del alumno con la posicin del profesor rendimiento en
las pruebas?. Son concientes los profesores de la incidencia de este tipo de sesgo?

En general, puede el alumno prescindir de la informacin brindada por el profesor y atenderse


a la consulta bibliogrfica sin que ello afecte la calificacin obtenida.

Reciben diferente tratamiento los alumnos libres respecto de los regulares en la evalua-
cin del contenido del examen?

De que modos influyen el conocimiento previo que tiene el profesor sobre el alumno para
juzgar la actualizacin en una prueba final? Afecta la evaluacin del profesor la consulta
a la libreta del estudiante?

Qu recaudos se toman para tratar que las pautas de evaluacin se mantengan constan-
tes durante todo el proceso o sesin de examen?. Se acuerdan criterios entre los exami-
nadores en las pruebas orales o se prepara una clave tentativa de correccin en las prue-
bas escritas?. Se utiliza el mismo marco de referencia para corregir todas las pruebas
tomadas en la misma oportunidad?

Cundo se prepara un clave tentativa de correccin, se la utiliza sin modificaciones para


evaluar todas las pruebas?. Cmo se evalan las respuestas no previstas?
Utilizan los profesores la misma amplitud de notas para expresar el rendimiento del estu-
diante? Una misma nota final tiene similar significado para cursos dictados por distintos
profesores de la asignatura o de diferentes materias?

49
Constituyen las pruebas una muestra representativa de los aspectos desarrollados du-
rante el cursos?. La frecuencia con que se interroga acerca de determinados temas o
contenidos, de qu fuente se deriva?. Se enfatizan en la prueba los mismo aspectos que
se destacaron durante el curso?. Se planifican las pruebas los mismos aspectos que se
destacaron durante el cursos?. Se planifican las pruebas de modo de controlar su ade-
cuacin respecto del programa vigente?

Respecta la estructura de la prueba la jerarquizacin dada durante el cursos a los con-


tenidos y habilidades perseguidas?. Se planifican las cuestiones o problemas de modo de
poner en evidencia el rendimiento especifico que se desea evaluar?

Dan usualmente las pruebas suficiente oportunidad al estudiante para poner de manifies-
to su grado de dominio del material examinado?

Se proporciona al estudiante conocimiento inmediato de los resultados?. Se discuten


las respuestas con el fin de aclarar errores, omisiones, fallas en la comprensin?. Se
proporcionan las razones por las que las respuestas reciben diferentes puntuacin segn
el grado de correccin o ajuste de las mismas?

Se utilizan los resultados de las pruebas para introducir modificaciones en el curso


mientras ste se va desarrollando o en futuros cursos?

En general, puede considerarse que la nota final refleja el nivel de aprovechamiento alcanzado
por el estudiante del curso.

La longitud de las pruebas resulta acorde con el grado de complejidad de los contenidos
y habilidades del curso?

Son conciente los profesores del grado en que el modo de formulacin de las preguntas
afecta el contenido de las respuestas?. Aceptan el hecho de que toda evaluacin est
sujeta a error y actan consecuentemente?

De qu modo se prev la incidencia del azar o de factores aleatorios en la evaluacin del


rendimiento?. Cmo se controla la trivialidad, el aprendizaje verbalista o memorista, la
repeticin no significativa, en la formulacin de las preguntas incluidas en las pruebas?

Cundo se afirma que un determinado aspecto resulta de difcil logro para los estudian
tes, en qu elementos de juicio se basan esas apreciaciones?

50
LA VALIDEZ DE CONTENIDO

Mara del C. Malbrn

1. Especificar los constructos que involucra el instrumento: el rea o dominio del constructo y
los aspectos includos y excludos ; las facetas y dimensiones del constructo
2. Especificar los fines u objetivos del instrumento (diagnstico, formativo, sumativo, visin
general del rendimiento)
3. Seleccionar la metodologa acorde al constructo y los fines
4. Elegir y/o generar items iniciales de diversas fuentes: deduccin, experiencia, teoras sobre
el constructo, bibliografa, otros instrumentos, sugerencias de expertos y de examinados
5. Cotejar los items con las dimensiones y facetas del constructo: tablas de especificaciones,
mapas del contenido, elaboracin de mayor cantidad de items que el nmero previsto .
Asegurar la proporcin de items segn la importancia de cada dimensin
6. Examinar la estructura, forma y contenido de cada item : adecuacin del item a la dimen-
sin del constructo,consistencia, precisin, especificidad, claridad del lenguaje, elimina-
cin de los items redundantes
7. Establecer los parmetros cuantitativos: formatos de respuesta, escalas ,asignacin de
puntajes
8. Redactar las instrucciones y decidir la presentacin: adecuacin al tipo de items, estructu-
ra gramatical, diagramacin, consignas de trabajo, tiempo
9. Consultar expertos para evaluar la definicin del constructo, el rea y dimensiones elegi-
das, la pertinencia de los items, las consignas y modos de respuesta, el tratamiento de los
datos
10. Pilotear el instrumento con una muestra e introducir los cambios segn los datos recogidos
11. Aplicar la versin corregida al grupo destinatario
12. Revisar los datos y consultar expertos para realizar las modificaciones que resultaran indi-
cadas.
13. Utilizar otros controles de validez apropiados para el uso y refinamiento del instrumento
(de criterio, de constructo)

51
GUIA PARA EL ANALISIS
DEL CONTENIDO
Mara C. del C. Malbrn

1. Identificar los trminos clave para la comprensin del contenido:


a. constructos
b. procesos
c . opuestos
d. procedimientos y mtodos

2. Ordenarlos segn criterios:


a. generalidad - especificidad
b. simplicidad - complejidad
c . alcance explicativo

3. Elaborar una jerarqua conceptual, mapa cognitivo, ruta de acceso, para favorecer la apro-
piacin del contenido

4. Asignar a los distintos aspectos los items correspondientes de la prueba

5. Comparar el resultado con las estrategias utilizadas para el estudio de los temas

6. Desarrollar un enfoque similar para el anlisis de los aspectos relativos a ejemplos, ilustra-
ciones y procedimientos

7. Preparar una UVE heurstica armonizando los contenidos conceptuales y de procedimiento


includos en la prueba

8. Comparar el enfoque centrado en el anlisis de los procesos y en el anlisis del contenido

Bibliografa
Bloom,B. Esquemas para aplicar la Taxonoma en actividades de planificacin y evaluacin
Ausubel,D. y Novak, J. Mapas cognitivos y UVE heurstica

52
ALGUNAS CUESTIONES RELATIVAS A LAS
PRUEBAS DE APROVECHAMIENTO
EBEL, Robert (1975)
Traduccin y sntesis: Mara del C. Malbrn

. Se presentan y discuten a continuacin algunas de las cuestiones que se plantean con


mayor frecuencia en relacin con las pruebas de aprovechamiento:

. Son las pruebas vlidas?


. Son tiles?
. Deben referirse a la norma o al criterio?
. No discriminan en contra de ciertos grupos?
. Es un mito el CI?
. No favorecen la competencia destructiva?

Las pruebas se usan a veces con poco tino, se interpretan en forma equivocada, se
derivan de ellas resultados no previstos en su construccin o se utilizan como armas agresi-
vas y no como recursos.

Primera Cuestin
Todas las pruebas, an las de personalidad basadas en el autoinforme, pueden redu-
cirse a pruebas de conocimiento. Todo nuestro sistema, tanto el escolar como el de vida, est
destinado a la transmisin de conocimientos.

Tal vez el rasgo ms peculiar del ser humano y su desarrollo mental, consista en su
habilidad para producir y usar el conocimiento verbal. Este conocimiento implica ms que in-
formacin: implica comprensin y habilidad para usarlo, requiere el desarrollo de una estructu-
ra coherente de conceptos y relaciones.

Cules son las alternativas del conocimiento como objetivo de la educacin:


Habilidad para pensar?
Desarrollo de destrezas intelectuales?
Estrategias cognitivas?

Si las pruebas demandan conocimiento de trivialidades en lugar de conceptos importan-


tes, principios fundamentales o procedimientos tiles, entonces fallan como instrumentos vli-
dos.

Si proporcionan resultados poco estables porque los problemas son muy pocos, muy
ambiguos, muy difciles o muy fciles, entonces tampoco resultan vlidas.

Estas fallas son remediables y no todas inherentes al resultado de la prueba.

53
Segunda Cuestin

No olvidan o descuidan el rea afectiva, los aspectos no cognitivos del desarrollo huma-
no tales como intereses, actitudes, ideales, apreciaciones, autoconcepto, compromiso con la
sociedad y responsabilidad tica?. No hemos deshumanizado la educacin con nuestra insis-
tencia en el desarrollo cognitivo?

No podemos negar la importancia de nuestra sensibilidad para con los otros, ms an en


el caso de los maestros.

Los sentimientos no estn sujetos al desarrollo educativo por medio del proceso de
enseanza-aprendizaje. Son parte, parte muy valiosa, de nuestra herencia biolgica.

Nacemos con un amplio repertorio de impulsos-hambre, sueo, amor, ira, miedo, dolor.
La maduracin agrega otros. La experiencia los asimila a una amplia variedad de objetivos y
situaciones. Nos ensea a enfrentar sentimientos poco placenteros y a dominar la expresin de
ciertos sentimientos en determinadas circunstancias, pero ellos no se desarrollan a la manera
de las destrezas fsicas o de las habilidades cognitivas.

BLOOM y el comit por l liderado, public una clasificacin de los objetivos cognitivos
en 1956 y afectivos en 1964.

Los objetivos afectivos tienen ms relacin con la conducta que con los sentimientos:
atencin, aceptacin, respuesta, compromiso, preferencia, conceptualizacin, organizacin y
caracterizacin. Cul es la base de esta conducta?. Si es racional se basa en lo cognitivo. Si
es conducta habitual puede basarse en la costumbre o la imitacin. En cualquiera de los dos
casos, debe ste ser el principal inters de las escuelas?

Puede ser cierto que las escuelas debieran interesarse ms por el desarrollo en el rea
de los sentimientos, autoconceptos y relaciones interpersonales. Si es as, la educacin cognitiva
es un medio, no una alternativa de la educacin afectiva. De este modo las pruebas de desarro-
llo cognitivo en lo que hace a sentimientos, autoconceptos y relaciones interpersonales sern
adecuadas para evaluar el desarrollo afectivo del alumno.

Muchos de los que enfatizan las metas afectivas en detrimento de las cognitivas, fre-
cuentemente son vagos acerca de la naturaleza precisa de esas metas, de los procedimientos
de enseanza que conducirn a los alumnos a lograrlos y las evaluaciones que permitirn saber
si se han logrado. Esta persecucin de metas intangibles puede servir como excusa para el
logro de metas ms tangibles.

En la medida en que un resultado educativo perseguido es intangible (es decir no est


claramente definido) no es adecuado como meta de instruccin. Si algo no puede ser definido
claramente, no puede ser enseado provechosamente ni medido en forma vlida.

54
Tercera cuestin

Pruebas referidas a la norma interpretan el puntaje de un alumno particular en relacin


con las normas establecidas a travs del examen de otros individuos similares. Muestran en
forma amplia multitud de elementos de conocimiento o habilidad en forma difusa.

Pruebas referidas al criterio informan cules o cuntas de un conjunto de metas especfi-


cas de aprovechamiento ha alcanzado un alumno particular. Se concentran en un nmero limita-
do de metas especficamente definidas, examinando cada una de ellas repetidamente para obte-
ner certeza de su logro.

Cada tipo tiene sus ventajas y limitaciones:

Criterio: pueden brindar informacin ms especfica y detallada sobre el desempeo del alum-
no con el costo de una manera ms extensiva.

Norma: proveen una sntesis ms concisa de un rea claramente definida de logros.

Criterio: enfatizan el dominio especfico a lograr por todos los alumnos, si bien existe alguna
arbitrariedad en la definicin de dominio y en la eleccin de los especficos.

Norma: alientan y recompensan la calidad individual en el aprovechamiento, si bien es arbitra-


ria la seleccin de los elementos de las tareas en que debe demostrarse esa calidad.

Hay tambin diferencias en las concepciones de aprendizaje que reflejan.

Criterio: tratan el aprendizaje como si se lograra a travs de unidades separadas, discretas,


que se suman a un conjunto aprendido. Apropiado en las primeros grados y la enseanza tcni-
ca.

Norma: son consistentes con la nocin de que el aprendizaje consiste en la construccin de


una estructura de numerosas relaciones entre conceptos. En las etapas superiores es particu-
larmente importante.

La principal finalidad de cualquier prueba de aprovechamiento es diferenciar niveles de apro-


vechamiento , no slo entre alumnos, tambin en relacin con algn criterio o cuando el logro
presente se compara con el pasado. Estos tres tipos de comparaciones no son mutuamente
excluyentes y particularmente las dos ltimas no suplantan la primera.

55
MEJORAMIENTO DE LAS PRCTICAS
DE EVALUACIN EN EL NIVEL SUPERIOR
Fuente: Ramsden, P. (1992) Learning to teach in hirgher education. London: Routledege.
Seleccin, sntesis y traduccin: Mara del C. Malbrn

1. Relacionar la evaluacin con el aprendizaje: nfasis primero en el aprendizaje, segundo en


estimular el inters y esfuerzo, por ltimo en la asignacin de notas . Evaluar durante las
experiencias de aprendizaje no solamente al finalizar. Presentar problemas realistas
cuando sea posible, alentar la integracin y aplicacin del contenido.

2. Utilizar la evaluacin para orientar al estudiante acerca de cmo progresa en el aprendiza-


je.

3. Aprender de los errores del estudiante. Utilizar recursos para identificar errores y fallas en
la comprensin de modo de modificar la enseanza para superarlos.

4. Utilizar recursos variados de evaluacin.

5. Comprometer a los estudiantes en el proceso de evaluacin mediante.

-Discusin sobre los mtodos apropiados y cmo ellos se relacionan con el contenido del
cursos;

-Actuar en forma conjunta evaluador-estudiantes, estableciendo los criterios para conside-


rar el xito y el fracaso;

-Implementar actividades de autoevaluacin y evaluacin mediante los pares;

-Ofrecer a los estudiantes formas variadas de evaluacin.

6. Trasmitir mensajes acerca de las cuestiones de evaluacin, as como los objetivos pro-
puestos para el curso, que no considerarn satisfactoria la memorizacin, reproduccin e
imitacin, sino la demostracin concluyente y la aplicacin.

7. Considerar la relacin entre informacin y retroalimentacin, justificando las decisiones


sobre bases racionales.

8. Utilizar las pruebas de seleccin mltiple y otros recursos objetivos con cautela, preferi-
blemente en combinacin con toros recursos. Cuando el nmero de estudiantes lo permi-
te, utilizar recursos alternativos de evaluacin.

56
9. En problemas que requieren tratamiento cuantitativo incluir cuestiones que requieren ex-
plicaciones en prosa as como ejemplos numricos.

10. Centrarse en la validez (es importante lo que se est evaluando?). Tratar de evitar cues-
tiones triviales o superficiales slo porque ellas son ms fciles de puntuar que las que
abordan aspectos importantes.

11. Tratar por todos los medios de reducir la ansiedad frente a las pruebas.

12. No incluir cuestiones que uno mismo est listo para responder. Practicar la costumbre de
escribir modelos de respuesta a la preguntas y utilizarlas para comunicar a los estudian-
tes lo que se desea.

13. Reducir la competencia entre los estudiantes proveyndoles datos sobre los criterios de
xito basados en los estndares o patrones previstos (utilizando resultados de los produc-
tos del grupo o derivando criterios sobre el rendimiento de los grupos).

14. Estar alerta sobre la objetividad y precisin de las evaluaciones sobre la habilidad del es-
tudiante y conciente de que el juicio humano es el elemento ms importante en cualquier
indicador del aprovechamiento.

57
MODELO DE CUATRO ETAPAS DEL PROCESO DE
ENSEANZA- APRENDIZAJE- EVALUACIN
(Propuesto por Glaser, elaborado por Deccecco y del paradigma de evaluacin
preparado por Metfessel y Michael.)
Traduccin y sntesis: Mara del C. Malbrn

W. B. Michael

El modelo de enseanza de cuatro etapas inicialmente propuesto por Glaser (1962) con-
siste en una secuencia de cuatro componentes principales: objetivos, conducta de entrada,
procedimientos de instruccin y evaluacin de logros. Este modelo con enlaces de realimentacin
puede tomarse como una definicin de currculum, considerado como un proceso de enseanza-
aprendizaje- evaluacin resultante en un conjunto integrado y cohesivo de productos finales
(conductas del estudiante). El supuesto subyacente al uso de este modelo es que el desarrollo
del currculum y la seleccin, organizacin y uso de los materiales de instruccin que lo acom-
paan, dependen del cumplimiento de los requerimientos de una concepcin comprensiva del
proceso de enseanza- aprendizaje, proceso que se halla anclado entre un conjunto inicial de
objetivos, que representan los logros perseguidos, y un conjunto final de conductas cuya con-
gruencia con los objetivos necesita determinarse.

58
Modelos del proceso del enseanza - aprendizaje - evaluacin

A. OBJETIVOS B. CONDICIONES INTERNAS C. PROCESAMIENTO D. EVALUACIN


DE LA INFORMACIN

A.1 A.2 B.1 B.2 C.1 C.1


Generales Especfi- Contenido Proceso
cas Estudiantes Docentes

A.3
C.1
Criterios de juicio
Condiciones
externas
59
A- Formulacin de un conjunto comprensivo y consistente de metas
generales y objetivos especificos.

Desarrollo de un sistema comprensivo y cohesivo de metas generales y


objetivos especficos (cambios de conducta perseguidos o logros) fre-
cuentemente dispuestos en ordenjerrquico o taxonoma desde los ge-
nerales a los particulares (cognitivos, afectivos y psicomotores)

A. 1 Objetivos o metas A.2 Objetivos de con-


educacionales generales, ductas especificos,
cuya significacin social, comnmente estableci-
institucional y filosfica dos pro profesionales
la determinan profesio- en forma operacional
nales, estudiantes, para permitir una medi-
grupos de la comunidad, cin relativa objetiva y/
etc o determinacin empri-
ca del grado en qeu los
cambios deseados o
logros han sido alcan-
zados en el desempeo
terminal.

A.3 Desarrollo de criterios de juicio para definir la per-


tinencia, significacin y propiedad de los objetivos y
para determinar niveles aceptables de logros mensu-
rables (conductas de estos objetivos dentro de un
sistema de prioridades realistas en relacin con las
necesidades y expextativas sociales; del alumno y
el docente, oportunidad para la interaccin estudian-
te docente y realimentacin para motivar y guiar el
aprendizaje; disponibilidades de personal, recursos
financieros y fsicos y oportunidad para obtener o
construir instrumentos de evaluacin apropiados.

60
B. Conductas de entrada (condiciones internas)de los estudiantes y docentes

Caractersticas de los estudiantes y docentes anteriores a las


actividades de enseanza- aprendizaje y potencialmente
interactuantes entre s:

B. 1 Estudiantes B. 2 Docentes
Informacin disponible Informacin no siempre
a partir de pretest, regis- disponible pero sucepti-
tros acumulativos u ob- ble de obtenerse en base
servaciones preliminares a la consideracin de ca-
relativas a las diferencias ractersticas tales como
individuales en habilida- habilidades y aptitudes,
des, conocimiento previo competencia en la mate-
pertinente, competencias ria de estudio, patrones
cognitivas existentes, pa- motivacionales, capaci-
trones motivacionales (ac- dad en el diagnstico del
titudes, intereses, valores, aprendizaje, preferencias
necesidades), estilos de a- en cuanto al estilo de es-
prendizaje, determinantes tilo de enseanza, patro-
sociales y culturales, etc., nes temperamentales, em-
que permiten a los docen- pata, etc.
tes modificar los procedi-
mientos de instruccin.

61
C. Procedimientos de instruccin (procesamiento de la informacin)

Implementacin de las actividades de enseanza referidas al proceso de apren-


dizaje dirigidas a la obtencin de cambios relativamente permanentes en las
tendencias de conducta (capacidades o disposiciones tal como se infieren de
las medidas de desempeo y logros observables) entre lasque se cuentan:co-
nocimiento y destrezas verbales, adquisicin de conceptos y principios, reso-
lucin de problemas, capacidades que requieren la transferencia positiva del
aprendizaje (incluyendo aprendizaje por recepcin significativa, enseanza
expositiva, aprendizaje por descubrimiento, etc.), aprendizaje creativo, apren-
dizaje social y afectivo, etc

Condiciones manipulables en la situacin de estimulo para modificar el apren-


dizaje sujetas al control del docente y sus capacidades para tomar decisiones.

C. 1 Componentes del contenido C. 2 Componentes del proceso


Seleccin y organizacin del conte- Seleccin, organizacin y ejecu-
Nido que implica el uso previsto de cin de las conductas del docen-
Los materiales de instruccin: libros, te (actos de enseanza) para faci-
Peridicos, filmes, cintas grabadas, litar las actividades de aprendizaje
Instruccin programada, estudio in- del estudiante e interaccin docen-
dependiente, planes de investigacin, te- alumno, conferencias, sesiones
Instruccin asistida por computadoras, de pregunta- respuesta, discusio-
Redes de informacin, hipertexto,etc. nes, Informes escritos, etc.

C. 3 Condiciones externas a la situacin de aprendizaje que el


docentetoma en cuenta y manipula para lograr los objetivos de la ins-
truccin condiciones externas que median entre los componentes del
contenido y los procesos en C y que interactuan con las condiciones
internas del aprendiz y el maestro en B estando funcionalmente rela-
cionadas con las caractersticas de los materiales de intruccin y con
la exposicin y uso por parte del docente de actividades eficientes
con los materiales a travs de la atinada aplicacin de los principios
de la teora del aprendizaje

62
D. Evaluacin del desempeo con enlaces de realizacin a los pasos c,b y a.

Determinacin de la medida en que los logros de conducta perseguidos han sido


cumplidos en trminos de los datos proporcionados por pruebas, escalas, observa-
ciones y otras muestras de conducta una vez que se han establecido los pratrones
de juicio con referencia a los que se consideran cambios deseables en los niveles
de desempeo o posiciones deseables en las variables criterio en ausencia de da-
tos del pretest necesarios para determinar cambios. La efectividad del proceso de
ense-anza- aprendizaje a) en trminos del grado de congruencia o corresponden-
cia entre los niveles deseados y observados respecto de los objetivos especficos
con algunas previsiones acerca de los logros no esperados o creativos; b) interpre-
tada en relacin con las conductas de entrada (paso B) y los procedimientos de
instruccin que incluyen componentes del contenido y del proceso (paso C); jui-
cios que conducen a nuevas decisiones relativas a posibles alteraciones en la na-
turaleza y prioridades de los objetivos, en revisiones de o modificaciones en los
materiales de instruccin y conductas de enseanza y en cambios posibles en los
niveles esperados de desempeo del estudiante.

63
CARRERA DOCENTE UNIVERSITARIA.
PROYECTO DE EVALUACIN
Mara del C. Malbrn

Fundamentos

El marco conceptual en que se basa el proyecto se deriva del modelo de evaluacin


orientada hacia el perfeccionamiento propuesto por D. Stufflebeam, (1987 1 ) del que se es-
cogen los aspectos considerados ms pertinentes.

De acuerdo con este modelo la evaluacin supone un proceso destinado a recabar informacin
sistemtica y oportuna proveniente de tres fuentes de criterios:

1. las necesidades y expectativas de los destinatarios;


2. el mrito o calidad del servicio;
3. el grado de necesidad del mismo (validez potencial).

El proceso incluye evaluar la metodologa propuesta, seguir de cerca el desarrollo del


servicio, valorar los resultados a corto y largo plazo y buscar modos en los que se aumente
progresivamente la eficiencia y efectividad. Aspira a aumentar la sencillez, utilizar el tiempo y
los recursos del modo ms apropiado, asegurar la viabilidad poltica y la equidad.

Una distincin til es la que diferencia entre valor o vala y mrito (Scriven, 1981). An
cuando un programa meritorio puede no ser vlido, esto es, no adecuarse al objetivo propuesto,
el mrito entendido como calidad es un prerrequisito de la validez.

Un modo de encarar el estudio es centrarse en la evolucin del programa. Para ello es


conveniente utilizar un amplio espectro de tcnicas y aplicarlas segn los diferentes contextos
evaluativos: anlisis de contenido, informes preliminares, observaciones y entrevistas, informes
tcnicos, estudio de caso, anlisis estadstico, listas de control, compulsa de opiniones,
teorizacin.
Se considera que la evaluacin seria es la que cumple ciertas normas: debe ser til, factible,
tica y precisa. (Estndares para las evaluaciones de programas, proyectos y materiales, Joint
Committee, 1981).

Dos premisas bsicas que subyacen a la actividad evaluativa aluden a su carcter inevi-
table y a su contribucin para una comprensin ms amplia y una mejora subsiguiente de la
educacin.

Un medio para asegurar y comprobar la calidad de las evaluaciones consiste en el em-


pleo de la metaevaluacin. El objetivo de la misma es controlar la solidez de las evaluaciones,
evitar o enfrentar las prcticas inadecuadas o los servicios que no son de inters pblico, sea-

1
Stufflebeam, D. Y Shinkield, A. (1987) Evaluacin sistemtica. Gua terica y prctica. Barcelona: Paidos. .

64
lar el camino para el perfeccionamiento y promover una mayor comprensin de la empresa
evaluativa.

El trabajo evaluativo es una labor de equipo que reclama el cumplimiento de las respon-
sabilidades de todos los sectores involucrados. Ayuda a tomar y justificar decisiones que pue-
dan satisfacer mejor las necesidades. No podemos asegurar que las metas sean valiosas si no
las comparamos con las necesidades de las personas a las que presuntamente sirven. El valor
y mrito de las metas requiere identificar, obtener y proporcionar informacin til y descriptiva y
determinar sus impactos, solucionar los problemas de responsabilidad y promover la compren-
sin de los fenmenos implicados (orientacin hacia el perfeccionamiento).

El modelo se basa en la idea de que el propsito ms importante de la evaluacin no es


demostrar, sino perfeccionar. Los aspectos crticos del objeto a ser valorados abarcan sus
metas, su planificacin, su realizacin y su impacto. Distingue entre evaluacin de contexto, de
entrada, de proceso y de producto. Las etapas comprendidas son las de identificar, obtener y
proporcionar informacin. Para ello se alternan acciones de ndole comparativa y no comparati-
va, segn el momento de desarrollo del programa en que se realicen, de acuerdo con el grado en
que permitan concentrarse en lo que resulte mejor para el servicio y atiendan a su uso continuo,
de modo que el camino quede abierto para posibles avances y cambios.

Objetivos

Obtener informacin que permita apreciar el grado de desarrollo de la Carrera Docente


Universitaria, optimizar su funcionamiento y proyectar acciones para su progreso futuro.

Aspectos a evaluar

1. Estructura y organizacin: costo, sistema de asistencia y promocin, ambiente fsico, se-


cuencia de las actividades, monto de trabajo exigido, cronograma y horarios, certificacin;
2. Contenidos curriculares: aplicabilidad, pertinencia, variedad, secuencia, grado de compleji-
dad y abstraccin, informacin y habilidades requeridas para el dominio de los contenidos,
equilibrio entre los contenidos y las producciones requeridas;
3. Calidad del trabajo acadmico exigido a los alumnos: pertinencia, aplicabilidad al rea o
disciplina de trabajo del docente, originalidad, contribucin al desarrollo de la enseanza y
al enriquecimiento del docente universitario;
4. Calidad de los materiales de trabajo, lectura y bibliografa: pertinencia, actualizacin, acce-
sibilidad, grado de complejidad y abstraccin, inters;
5. Clima, atmsfera de las clases y reuniones: relaciones entre las autoridades, profesores y
alumnos; dinamismo de las relaciones y actividades, calidad de las relaciones grupales e
intercambios interdisciplinarios, proyecciones sociales de los intercambios;
6. Actuacin acadmica de los profesores: adecuacin a la audiencia, roles ejercidos, carcter
de los trabajos y evaluaciones utilizados, feedback recibido, solvencia acadmica;
7. Caractersticas de los alumnos: descripcin de la matrcula a partir de los indicadores dispo-
nibles (edad, sexo, profesin, unidad acadmica, departamento o ctedra de procedencia,

65
antigedad de ttulo y en la docencia universitaria, concursos realizados, actividades de
investigacin, roles docentes que desempean), preparacin general, manejo de otra len-
gua, habilidades docentes, dominio de la materia o disciplina, actitudes docentes y hacia la
formacin docente especializada, actitudes hacia la investigacin, disposicin para el traba-
jo en grupos y la labor interdisciplinaria;
8. Impacto e influencias de la Carrera Docente Universitaria en las Unidades Acadmicas: ac-
tuacin de los docentes como multiplicadores, consultores, productores de informacin,
factores de cambio;
9. Proyecciones futuras: tendencias de desarrollo y ampliacin del mbito de accin de la
Carrera Docente Universitaria.

Fuentes de datos

Estudio del contenido de la Ordenanza vigente;


Informe de la Coordinacin Acadmica de la Carrera Docente Universitaria;
Estudio de la matrcula desde la creacin de la carrera;
Anlisis del curriculum vitae de los profesores de la carrera para caracterizar el grupo
desde el punto de vista acadmico;
Encuesta a los profesores de la carrera;
Encuesta a los egresados y alumnos de la carrera;
Entrevista a los responsables de la Carrera Docente Universitaria en las diferentes Unida-
des Acadmicas (Secretarios Acadmicos, Secretarios de Postgrado);
Anlisis de contenido de las planificaciones y propuestas didcticas cumplidas en los
Seminarios y Seminarios Taller.

Recursos humanos

Formacin de un Comit Tcnico de Evaluacin integrado por:

1. un coordinador del equipo con rango de profesor titular. Se recomienda designar un profesor
de la Carrera Docente Universitaria;
2. tres evaluadores con rango de profesor adjunto o JTP. Se recomienda designar profesores
que hallan estado a cargo de los talleres de la carrera o egresados de alto rendimiento en la
misma.

66
CRITERIOS PARA LA EVALUACIN DE CURSOS
Mara del C. Malbrn

A continuacin se brindan algunas pautas destinadas a orientar el proceso de evaluacin de los


alumnos y de los profesores del curso. Se han elaborado con el propsito de fijar criterios comunes
teniendo en cuenta que los cursos se realizarn en distintos distritos, lo que obliga a tratar de homologar
las formas de juzgar los resultados y de derivar las nota s para hacerlas lo ms equivalente posibles.

Existen dos criterios bsicos que debe cumplir toda evaluacin para ser efectiva:

1.objetividad, imparcialidad o confiabilidad de las estimaciones. Alude al grado en que ellas estn
libres de factores o influencias extraas a los rasgos que se desea evaluar. La subjetividad del evaluador,
las condiciones en que se realiza la evaluacin, los cambios que produce la situacin de prueba en el
examinado, las oportunidades que se brindan a la persona para mostrar sus logros, las imprecisiones
en las pautas de correccin, si no se controlan afectan la objetividad de las evaluaciones, disminuyen-
do su confiabilidad.El resultado de la evaluacin puede considerarse objetivo cuando es posible
replicarlo utilizando calificadores independientes o repitiendo el procedimiento en diferentes oportuni-
dades.

2.validez de las estimaciones que se refiere al grado en que las mismas traducen el propsito
para el que fueron realizadas.Una evaluacin es vlida cuando refleja los objetivos que se persi
guieron con el curso, el grado de nfasis que se otorg a los mismos durante su dictado, las
diferencias individuales en los conocimientos y habilidades adquiridas.
Los objetivos prescriptos para el desarrollo del curso constituyen una valiosa gua para determinar si
la evaluacin realizada es pertinente, especfica y equilibrada.

Orientacin para evaluar el rendimiento de los alumnos

- Las evaluaciones se transformarn en el sistema de notas numrico de 1 a 10 puntos.


- Con el objeto de cuidar la objetividad, se tratar de mantener pautas comunes para evaluar el rendi-
miento de todos los alumnos de modo que las notas resultantes reflejen diferencias reales en los
rendimientos y que quienes obtengan la misma nota registren niveles de logros similares.
- Las notas debern reflejar el orden de mritos derivado del rendimiento de los alumnos en la asig-
natura para producir una adecuada distincin entre los niveles de logros altos, medios y bajos.
- Las notas reflejarn o expresarn el grado en que el alumno ha alcanzado los objetivos previstos
para la asignatura, tanto en trminos de conocimiento como de habilidades y actitudes, segn la
ndole de la asignatura que se trate.
- Los recursos de evaluacin utilizar para la adjudicacin de notas debern ser lo ms variados posi-
ble: exposicin oral de hechos, ideas, principios; resolucin de problemas en forma oral y escrita;
participacin en las actividades del curso; cumplimiento de trabajos fuera de las horas de clases,
etc.

67
Gua para ponderar los aspectos a evaluar en los alumnos

El peso a asignar a cada aspecto depender de las caractersticas de la asignatura y de las


actividades previstas por el profesor para el desarrollo del curso.

1. Grado de conocimiento de hechos, datos, ideas, principios desarrollados en el curso.


2. Habilidad para comprender e interpretar situaciones.
3. Habilidad para aplicar principios y resolver problemas.
4. Aptitudes para el trabajo demandado por la asignatura: cuidado en la expresin oral,
manejo del lenguaje escrito, hbitos de estudio y trabajo, esmero en la preparacin y
presentacin de las tareas asignadas, etc.
5. Disposicin para el progreso en la asignatura, destreza en el desempeo de roles y
funciones, inters por los temas y habilidades implicadas , etc.

Con el objeto de adecuar los aspectos evaluar a la naturaleza de la asignatura y de


facilitar la traduccin a nota numrica, cada aspecto podr ser ponderado porcentualmente se-
gn la naturaleza del curso. As, en una asignatura de carcter ms terico, el apartado 1 puede
recibir ms peso que los restantes, mientras que en un curso de aplicacin, los apartados 3 y 5
resultar con ms peso para la calificacin final.

Gua para apreciar el rendimiento del profesor en el curso


1. Grado de conocimiento o dominio de los temas y habilidades a ensear.
2. Habilidades para planificar y evaluar el rendimiento
3. Habilidades para desarrollar la comprensin de los alumnos y para presentar situa-
ciones problemticas derivadas del carcter de la asignatura.
4. Habilidades para motivar y atraer el inters por la asignatura.
5. Habilidades para adecuar el lxico y los materiales a la audiencia.
6. Variedad en la utilizacin de recursos didcticos que estimulan la participacin y
actividad.
7. Disposicin para orientar a los alumnos en el aprendizaje y modo de trabajo del cur-
so.
8. Amplitud para intercambiar ideas con sus colegas y para recibir sugerencias.
9. Inters por la mejora y el progreso en el desarrollo del curso y de la capacitacin.
10. Condiciones personales (calidad de las relaciones interpersonales, modales socia-
les, etc.)

68
DIFERENCIAS ENTRE TESTS DE APTITUD
Y TESTS DE RENDIMIENTO

Fuente: Anastasi, A. Tests Psicolgicos.


Sntesis: Claudia Villar

Tests de Rendimiento

. El objetivo principal consiste en apreciar los efectos de un curso de instruccin o formacin.


. No se restringen a lo escolar.

Qu miden?
. Los efectos de conjuntos de experiencias relativamente tipificadas, tales como las de un
curso de francs elemental, etc. Es decir, en lneas generales, miden los efectos del apren-
dizaje celebrado bajo condiciones parcialmente conocidas y controladas.

Cules son sus usos?


. Representan generalmente una valoracin final del status del individuo despus de comple-
tar su formacin.
. Ponen de relieve lo que el individuo puede llevar a cabo en ese momento.

Tests de Aptitud

. Se incluye en ellos los de inteligencia general, las bateras de aptitud mltiple y los de
aptitudes especiales.

Qu miden?
. La influencia acumulativa de una multiplicidad de experiencias de la vida ordinaria. Es decir,
miden los efectos del aprendizaje bajo condiciones relativamente incontroladas y descono
cidas.

Cules son sus usos?


. Sirven para predecir la actuacin subsiguiente. Se emplean para estimar el grado en que el
individuo aprovechar la formacin o para predecir lacalidad de su rendimiento en una nueva
situacin.

A pesar de las diferencias sealadas debe considerarse:


. Que la distincin entre tests de rendimiento y de aptitud no es rgida. Algunos tests de
aptitud pueden depender de un aprendizaje anterior bastante especfico y uniforme, mien-
tras que otros de rendimiento abarcan experiencias educativas relativamente amplias y
tipificadas. De la misma manera cualquier tests de rendimiento puede usarse como prono-
ticador del aprendizaje futuro.

69
. Que de ningn modo los tests de rendimiento miden los efectos del aprendizaje, mientras
que los de aptitud miden la capacidad innata, independientemente del aprendizaje.
Sera una concepcin falsa. Los tests psicolgicos miden la conducta corriente del indivi-
duo, que inevitablemente refleja la influencia del aprendizaje anterior.

Usos Especficos de los Tests de Rendimiento

. Se emplean frecuentemente para comprobar la consecucin de las normas mnimas de


ejecucin.
Implican una estimacin del status actual de un individuo para una tarea determinada.

. La seleccin es otra de las funciones, ejercen un papel principal en la admisin de solici-


tantes, por ejemplo para una gran variedad de trabajos industriales especializados, para el
ingreso a la Universidad, escuelas profesionales, escuelas especializadas, etc.

. La colocacin y clasificacin representan otros tipos de decisiones que utilizan tests de


rendimiento. Por ejemplo, clasificacin de personal militar en funcin de la formacin ante-
rior, distribucin en secciones o agrupaciones de nios de la escuela primaria.

. A los fines de consejo. Una valoracin tanto de aptitudes como de conocimientos son pasos
necesarios en el planeamiento educativo y profesional, que constituyen objetivos importan-
tes de la situacin de consejo.

. Los tests de rendimiento constituyen tambin una importante caracterstica de los progra-
mas de enseanza de tipo teraputico. Es decir identificacin de las dificultades de un
individuo con fines remediales.

. Para los estudiantes, sirven para facilitar el aprendizaje. Ya que revelan debilidades del
aprendizaje pasado, proporcionan directrices para el futuro y procuran una motivacin al
que aprende.
. Para el profesor, sirven como ayuda en la valoracin de la enseanza, el mejoramiento de
las tcnicas de instruccin y la revisin del contenido de los cursos de estudio.

Elaboracin de tests por el profesor

Los principales pasos en la elaboracin de un test de rendimiento escolar son:

a-planeamiento del test


b-redaccin de elementos
c-anlisis de estos

70
a- Planeamiento del test:

. la redaccin de elementos sin un adecuado planeamiento llevar a un test desequilibrado.


. la planificacin implica: determinar el/los objetivo de la evaluacin, delimitar reas de
contenido, decidir la forma de evaluar tales contenidos (habilidades que se evalan: me-
moria?; comprensin?; aplicacin?; etc.). Luego en funcin de estos tres primeros aspec-
tos considerar el tipo de instrumento a utilizarse: ensayo?; objetiva?, entre otros.

. las especificaciones bosquejadas en el planeamiento de un test deben indicar: los temas,


clases de aprendizaje que deben probarse (en funcin de los objetivos) y la importancia
relativa de los temas. Partiendo de esta base, es posible determinar el nmero de elemen-
tos decada clase que se ha de preparar sobre cada tema.

. la forma sistemtica para obtener estas especificaciones es a travs de una Tabla de do-
ble entrada con los objetivos en la parte superior y los temas en la columna izquierda.

b- Redaccin de elementos:
en funcin de los objetivos, contenido, se debern tomar decisiones acerca del tipo y variedad
de items que se utilizarn en la prueba.

Aspectos que deben considerarse en la redaccin:


- los enunciados son claros? Estn libres de ambigedad?
Se identifica en l lo que se est pidiendo como respuesta?
- Tiene el tem un significado preciso?
- El tem requiere una sla respuesta? o Da lugar a varias formas de contestar? Se indica
cuntas respuestas se requieren (tratndose de items de respuesta seleccionada)?
- Es en extensin lo suficientemente extenso o es extremadamente breve que da lugar a
incomprensin?

Tambin un enunciado muy extenso puede confundir en vez de aclarar.


- No son los enunciados o tems copia o parfrasis de una parte del texto de estudio?
Este aspecto debe evitarse totalmente.

c-Anlisis de elementos:

- implica la aplicacin de ciertos recursos de la estadstica:


clculo del ndice de dificultad, discriminacin, eficacia de las alternativas.
- establecer la dificultad de un elemento implica determinar la cantidad de personas que
respondieron correctamente.
- el valor de la discriminacin viene dado por el nmero de personas que dan la respuesta
correcta en el grupo inferior restado al nmero de personas que lo contestan correctamen-
te del grupo superior.

La finalidad del anlisis de elementos en un test elaborado por el profesor radica en


identificar las deficiencias, bien en el test o bien en la enseanza.

71
EXAMEN DEL EXAMEN
Celia A. de Crsico

Para qu se usan los exmenes

1. Pruebas de aprovechamiento individual.


2. Pruebas de aprovechamiento colectivo.
3. Valoracin indirecta del docente.
4. Funcin pronstica.
5. Adems del aprovechamiento hay muchas otras cualidades que pueden manifestarse en
un examen.
6. Constituyen un incentivo para estimular el trabajo de los alumnos (aunque rara vez se lo
admite explcitamente)
7. Muchos autores americanos, consideran que su nica funcin legtima es la de guidance.

Crtica de los efectos de los exmenes sobre la educacin

1. El examen domina y distorsiona la totalidad del programa.


2. El examen estimula el poco saludable espritu competitivo entre los alumnos.
3. El examen produce desagrado por todo lo que asocia con la escuela.

Falta de confiabilidad del examen escrito tradicional

Su falla capital aunque no la nica- es su escasa confiabilidad. Al respecto se han


podido establecer los siguientes hechos:
a.cuando los examinados rinden dos exmenes sobre la misma materia escolar, sobre los
mismos temas, preparados y evaluados por el mismo examinador, es posible que obten-
gan dos notas distintas.
b.cuando un mismo conjunto de exmenes es evaluado por dos examinadores
distintos,las notas muestran gran discrepancia en la mayora de los casos.

Las causas principales de la baja confiabilidad de los exmenes son:


1.cambios reales en los estados fsicos y mentales de los examinados, que afectan su
desempeo.
2.muestreo inadecuado de la informacin y de la habilidad de los examinados, por las pre-
guntas que integran el examen.
3.inconsistencias en las pautas de valoracin adoptadas por los distintos examinadores, o
por el mismo examinador en distintas ocasiones.
4.diferencias de opinin entre los distintos examinadores en lo que concierne a los mritos
relativos de las respuestas de los examinandos.

72
EL EXAMEN POR TEMAS

GRONLUND ha identificado tipos de logros de aprendizaje complejo que pueden ser


evaluados efectivamente mediante un examen por temas:

. explicar relaciones causa-efecto


. describir aplicaciones de principios
. presentar argumentos pertinentes
. formular hiptesis aceptables
. formular conclusiones vlidas
. enunciar supuestos necesarios
. describir las limitaciones de los datos
. explicar mtodos y procedimientos
. producir, organizar y expresar ideas
. integrar el aprendizaje en diferentes reas
. crear formas originales (por ej. de diseo y experimentacin)
. evaluar el grado de adecuacin de ideas.
. inferir correctamente
. deducir principios y relaciones.
. formar nuevas combinaciones de ideas.
. extender principios a nuevas situaciones.

Sugerencias para la mejora de un examen por temas


(Segn Adkins Wood. Elaboracin de Test Psicolgicos. Trillas. 1967.)

1.El profesor debe dedicar tiempo necesario al desarrollo de las preguntas.


2.Las preguntas debern definir con precisin la direccin y amplitud de las respuestas
deseadas.
3.Un gran nmero de preguntas de respuesta corta es preferible a un pequeo nmero de
preguntas que piden largas respuestas.
4.Debe tomarse en cuenta la relacin tiempo disponible/extensin adecuada de las respues-
tas.
5.Administrar el mismo examen a los estudiantes cuyo grado relativo de aprovechamiento
en la materia debe ser comparado.
6.Construir simultneamente al examen la clave de respuestas tentativa.
7.Aplicar la clave a una muestra pequea de respuestas como prueba preliminar.
8.Calificar un tema en serie para todos los estudiantes.
9.Controlar que los patrones de calificacin no varen apreciablemente cuando los exme
nes se evalan en varias sesiones o etapas.
10.Usar juicios aislados de jueces competentes empleando la media resultante como fallo
final en aquellos casos que las condiciones lo permitan o las consecuencias de la califica-
cin lo impongan.
(VASE EL MANUAL CITADO ANTERIORMENTE PARA INFORMACIN ADICIONAL SOBRE ESTOS 10 PUNTOS)

73
LAS PRUEBAS DE ENSAYO

. Requieren el juicio experto, de un proceso analtico complejo.


. Mayor flexibilidad en el contenido y en la eleccin del enfoque por parte del examinado.
. Gran variabilidad en sus formas (desde las ms restringidas a las ms amplias).
Se les objeta que los profesores difieren grandemente en sus juicios acerca de la calidad de
una prueba particular y que la nota asignada depende ms de quien lea el examen quede su
contenido.
. Se ha demostrado que si los profesores vuelven a leer un grupo de exmenes meses ms
tarde sin mirar las notas originales, las discrepancias entre ambos conjuntos de notas son
significativas.
. Se asume en defensa de la PE que constituyen una muestra de un rendimiento experto en
presentar, comunicar y discutir ideas a travs de la presentacin de problemas o cuestio
nes. No basta con el reconocimiento de las mismas como en el caso de las pruebas de
seleccin, construir pruebas objetivas y someterlas a controles estadsticos de confiabilidad
y validez exceden la posibilidad de la mayora de maestros y profesores. Usualmente no
disponen de otras alternativas que las PE.
. Cmo aprendern los estudiantes a expresar sus ideas por escrito si no se los evala en
ste aspecto?
. Las PE son inferiores indudablemente respecto de las PO en cuanto al empleo del tiempo y
la rapidez de puntuacin.
. El uso del tiempo por parte del examinado muestra considerables diferencias individuales.
. Las fuentes de variacin que afectan los resultados de las PE son mltiples:
.el contenido de la prueba;
.el nivel en el que se aplica;
.la pericia de quien la prepara y la califica;
.el contexto en el que se usa.
. Respecto de la variabilidad de los puntuadores pueden sealarse:
. diferentes evaluadores asignan distintas notas a la misma PE;
. un mismo evaluador asigna distintas notas a la misma PE en diferentes momentos;
. las diferencias tienden a aumentar en relacin directa con el grado de libertad que se per-
mite a las respuestas del examinado.
. Los evaluadores difieren en su grado de severidad, en los stndares o patrones que utilizan,
en la amplitud de notas que usan, en el valor o jerarquizacin que otorgan a las respuestas.
. Algunos estudios muestran que existen al menos cinco caractersticas de las PE que
afectan la variabilidad de las notas asignadas por los evaluados:
* ideas; * forma; * sabor, estilo; * presentacin; *ortografa
. Las PE cometen errores de muestreo en la seleccin de las preguntas. Los estudiantes
dedican mayor tiempo a pensar y escribir en las PE y a leer y pensar en las PO (Ebel).
Como para el primer caso se requiere mayor tiempo, sto limita la cantidad de informacin
que puede obtenerse en un sesin de prueba y est en directa relacin con la complejidad
de la pregunta.
. CONFIABILIDAD. PROBLEMAS CRITICOS: adecuacin de la muestra de preguntas, consis-

74
tencia entre los evaluados.
Existe acuerdo en reconocer que cuanto ms breve y directa la pregunta, mayor la consis-
tencia al puntuarla y mayor el nmero de cuestiones a incluir en una prueba.
Por otra parte, cuanto ms restringida la respuesta, mayor la probabilidad de transformar
la en un item de seleccin mltiple. Las preguntas muy especficas tambien corren el ries-
go de convertirse en memoristas. El tipo de preparacin del examinado es otro aspecto:
no est igualmente preparado para el PE un estudiante de Matemtica que uno que de Le-
tras.

75
LAS PRUEBAS DE ENSAYO
PASOS PARA LA CONSTRUCCIN
Mara del C. Malbrn

1. Definir cuidadosamente los objetivos

2. Formular preguntas correctamente enfocadas o planteadas, de amplitud restringida o conve


nientemente aclarada, concisas de modo de orientar la bsqueda de la informacin pertinen-
te para el problema, decidir cul es la mejor forma de presentar la informacin o el razona-
miento, componer o construir y escribir la respuesta. Las preguntas deben estar dirigidas a
la facilitacin de las respuestas, indicar el grado de libertad permisible, orientar la interpre-
tacin unvoca, la longitud deseada, indicando la informacin pertinente y las vas de razo-
namiento ms adecuadas. En resumen, definir la tarea, aclarar qu se requiere del estu-
diante, no dejar librado a la imaginacin o adivinacin.

3.Construir modelos de respuesta para cada pregunta; por ejemplo, un examinador constru-
ye la pregunta y otro la respuesta, y calcular el tiempo: dado que el examinador conoce al
menos como el mejor estudiante, el tiempo debe calcularse de modo de permitir la mejor
respuesta posible. El examinador debe tratar de distinguir la respuesta ideal de la respuesta
dentro del marco real.

4. Hacer revisar las preguntas por otros colegas. Cuando los alumnos no responden una
pregunta, la conclusin usual del examinador es que no realizaron el esfuerzo necesario
para aprender el tpico. Requiere comprensin poco comn en el examinador pensar que la
enseanza puede haber sido inadecuada o la pregunta ambigua. Un modo de contrarrestar
sto es pedir las crticas o sugerencias de los colegas.

5. Probar con una muestra con el objeto de obtener informacin sobre:


a. Interpretan los estudiantes el sentido de la pregunta?
b. Es de apropiada dificultad?
c. Se pueden ordenar confiablemente las respuestas segn su calidad?

El contraste entre la respuesta prevista por el examinador y la dada por el examinado


puede ser notable; los examinadores tienden a formular preguntas muy complejas, de all la
ventaja del pretest.

6. Reconocer la importancia del muestreo adecuado al elegir las preguntas. Algunos exami-
nados contestan mejor una clase de preguntas que otra. En general, las preguntas cuidado-
samente construdas solicitan respuestas cortas y pertinentes. La composicin extendida
que requiere organizar e integrar grandes cuerpos de informacin es ms apropiada como
tarea de aprendizaje que de examen. La situacin de examen es una situacin restringida y
hay ciertos juicios evaluativos que demandan otros tipos de evidencias

76
o la observacin a travs de un perodo de tiempo. Algunos examinadores ofrecen preguntas
alternativas, lo que en algunos casos puede justificarse; por ejemplo cuando la variabilidad
en experiencias previas o en capacidad es grande. El problema es la comparabilidad y la
asignacin de puntajes para quienes eligen las ms complejas. Otro problema radica en la
seleccin por parte del estudiante por la apariencia de la pregunta ms que por el contenido;
el enfoque superficial de quienes conocen menos para juzgar la complejidad, la apreciacin
por la forma de la pregunta ms que por la respuesta que hay que escribir, la imposibilidad
de cambiar de pregunta luego de la eleccin.

7. Elegir adecuados procedimientos de puntuacin para aumentar la objetividad. Cmo aten-


der a los aspectos significativos? Algunas alternativas son:
a. guas detalladas para puntuar, como el uso de una lista de control;
b. calificaciones globales usando varios examinadores;
c. procedimientos analticos que especifican y jerarquizan aspectos para evaluar
la informacin. Juzgar el contenido y asignar puntajes son dos tareas diferentes.
Garantizar la objetividad no siempre asegura la validez, por ejemplo al enfatizar
elementos por sobre el valor esencial o crucial de la respuesta, cuando la misma
supone una combinacin de elementos o relaciones. Otros aspectos tienen que
ver con el efecto de halo producido por la ortografa, puntuacin, estilo, caligrafa,
as como premiar la evaluacin de una parte por el todo. Una caligrafa uniforme,
fluda, legible, la buena redaccin pueden compensar algunas deficiencias de conte
nido y, a la inversa, fallas en la ortografa, estilo y redaccin pueden incidir negativa
mente sobre la evaluacin del contenido. El efecto de halo puede reducirse corri-
giendo las pruebas por pregunta ms que por prueba.
d. Leer la cuestin, formarse una opinin general y puntuar. La evaluacin puede
ser global o analtica pero usualmente toma en cuenta aspectos comunes como
las ideas o contenido, la organizacin del material, el estilo, la ortografa y presenta
cin y la creatividad o elaboracin personal de la respuesta.
La confiabilidad aumenta con el nmero de evaluadores independientes.

8. Ser concientes de las limitaciones de las pruebas al emitir juicios (influencias del error y
del muestreo)

Algunos estudios muestran que existen al menos cinco caractersticas de las pruebas
de ensayo que afectan la variabilidad de las notas asignadas por los examinadores:
ideas, forma, sabor estilo, presentacin, ortografa.

En las pruebas de ensayo la competencia del calificador es decisiva. Usualmente las


deficiencias que se registran en cuanto al contenido son: afirmaciones incorrectas en las res-
puestas; omisin de ideas importantes; afirmaciones correctas pero no pertinentes; conclusio-
nes errneas por fallas en el razonamiento o inadecuada aplicacin de principios; redaccin
oscura que dificulta el desarrollo y expresin de las ideas.

Existe acuerdo en reconocer que cuanto ms breve y directa la pregunta, mayor la con-
sistencia al puntuarla y mayor el nmero de cuestiones a incluir en una prueba. Sin embargo,

77
las preguntas muy especficas corren el riesgo de convertirse en memoristas.

Factores que influyen en el rendimiento en pruebas de ensayo son la habilidad para


elaborar las respuestas y escribirlas con rapidez. Si sta no es objetivo de la prueba, como en
el caso de un periodista o escritor, afecta su validez.

Quienes defienden el uso de las pruebas de ensayo caracterizan a las pruebas objetivas
como medidas de reconocimiento. Sin embargo, esto es una simplificacin: los buenos tems
de las pruebas objetivas exigen al examinado desarrollar un fundamento para elegir entre las
opciones alternativas. Inventar o construir una respuesta no es necesariamente una tarea ms
compleja o difcil o indicativa de habilidades superiores que elegir la mejor respuesta. El aje-
drez, que pocos consideraran como un juego simple o superficial, es, en esencia, una prueba
de seleccin mltiple en la que el sujeto debe elegir entre un nmero limitado de opciones la
mejor. Asimismo, la eleccin de opciones limitadas y claramente definidas forma parte de mu-
chas actividades acadmicas, profesionales y de la vida real.

Una prueba de ensayo proporciona al examinado libertad para expresar su individualidad


en la respuesta y libertad el examinador para dejarse guiar por sus preferencias individuales al
puntuar.

En muchos casos se utilizan preguntas de ensayo combinadas con tems de seleccin


mltiple.

78
MEJORAMIENTO DE
LAS PRUEBAS DE ENSAYO

Dado el vasto empleo que se hace de los exmenes y que an dentro de un sistema
ideal, los maestros y profesores se ven necesitados de tomar exmenes y evaluarlos, es
preciso considerar en forma cuidadosa la manera en que pueden perfeccionarse dichos ins-
trumentos.

Se mencionan y comentan a continuacin, algunas medidas que pueden contribuir al


mejoramiento de los exmenes.

1.Considerar la naturaleza del grupo que va a ser examinado. Va a ser examinado el


tamao y la homogeneidad del grupo que, deben tenerse en cuenta.

2.Formular, del modo ms preciso posible, aquello que se desea medir. Esto implica en
primer lugar, una concepcin clara de los objetivos o propsitos que deben guiar la pre-
paracin del examen.

3.Habiendo decidido los aspectos de informacin o de habilidad que se desean medir, el


examinador deber considerar la forma de examen ms adecuada a tales fines. Se reco-
noce que muchos aspectos de la habilidad de los alumnos, pueden desplegarse ms
claramente gracias a un escrito, y que en el caso de Matemtica y Fsica, a veces es
necesario plantear problemas ms o menos largos y complejos. El estilo literario de la
composicin, las cualidades de imaginacin y originalidad, el inters del examinado por
el tema, y su propio pensamiento acerca de dicho tema, pueden mostrarse mejor en un
escrito corriente que en una prueba objetiva.

4.Una vez definido el campo, el examinador deber seleccionar los aspectos ms impor-
tantes. Deber intentar un muestreo amplio y representativo. Deben eliminarse las
superposiciones de temas. Se deben prever la extensin y el tiempo que pueden insumir
cada una de las respuestas. No pedir demasiado, ni demasiado poco en el tiempo que se
dispone.

5.Tratar de seleccionar las preguntas, contando con una anticipacin de las posibles
respuestas. El examinador har esto basndose en su conocimiento de la forma en que
suele operar la mente de sus alumnos a travs de su experiencia con las respuestas que
ha podido recoger anteriormente.

6.Al plantear la seleccin de las preguntas, determinar el margen de libertad que puede
permitirse a la respuesta. No olvidar que preguntas demasiado amplias pueden llevar a
respuestas insatisfactorias, entre otras razones, porque inducen al examinado a tratar de
adivinar la intencin fundamental de la pregunta. Mayor xito se deriva de preguntas que
son ms restringidas, pero que dan al candidato, sin embargo, una amplia oportunidad

79
para reunir sus ideas, organizarlas y expresar el resultado con sus propias palabras,
aunque el producto final conste slo de unas pocas oraciones. Tales preguntas dan opor-
tunidad para que el candidato seleccione libremente entre su bagaje de conocimientos la
informacin adecuada a un problema particular, decidir cul es la mejor manera de pre-
sentar esta informacin o razonamiento y componer y redactar la respuesta.

Varias ventajas derivan del hecho de que el examinado debe encarar problemas particu-
lares: a)porque es una situacin real; b) porque la tarea est definida; c) porque el exa-
minado sabe lo que se le pide.

7.Antes de tomar el examen, debe prepararse un esquema detallado para su evaluacin.


Debe establecerse de antemano el peso de cada respuesta sobre el puntaje total.

8.La calificacin es ante todo una ubicacin de los escritos en orden de mritos y no un
intento de dar un juicio absoluto sobre el valor de cada escrito. Es recomendable em-
plear el procedimiento de la escala cualitativa para evaluar cada una de las respuestas y los
escritos en general.

80
PRUEBAS DE ENSAYO BREVE

Mara del C. Malbrn

Instrucciones generales para el trabajo

Puede responder a las cuestiones en el orden que estime conveniente, siempre y cuan-
do deje bien aclarado el nmero correspondiente. Trace lnea despus de completar cada
una.

Las respuestas deben basarse en la bibliografa consultada, utilizando la terminologa


propia del enfoque o teora que se trate. No se tendrn en cuenta para la puntuacin las
que expresan opiniones personales o provenientes del sentido comn.

Limtese a responder a lo requerido en cada pregunta. La informacin que exceda lo


solicitado no ser tomada en consideracin.

Planifique su tiempo de acuerdo con su ritmo personal de trabajo, pero sin demorarse
excesivamente en una pregunta determinada.

No olvide colocar su nombre en forma legible en cada hoja.

Buena suerte!

81
Primera parte

A partir de la observacin del cuadro responda a las cuestiones que se presentan:

1. adoptando un punto de vista skinneriano, mencione tres elementos de la teora que


explicaran la situacin.

2. proporcione tres conceptos derivados de la teora de Ausubel aplicables al caso.

3. analice la situacin en trminos de las relaciones entre aprendizaje y desarrollo, men-


cionando tres pertinentes.

4.seleccione tres de los elementos del Programa de Enriquecimiento Instru-mental de uti-


lidad para enfrentar el problema.

...es posible que el alumno


lo haya olvidado o no lo haya
entendido nunca ...

Segunda parte

A partir de la observacin de la historieta responda a las cuestiones que se presentan:

5. mencione tres de las capacidades que pone en juego la escena segn el modelo de
Gagn.

6. describa brevemente las memorias episdica y semntica, ilustrando cada tipo con un
ejemplo tomado de la historieta.

7.la situacin puede utilizarse como contraejemplo del mtodo clnico. Mencione tres
razones que lo ilustren.

82
Tercera parte

Para las situaciones, problemticas o interrogantes que se presentan, seleccione tres de las
mismas. Responda brevemente, indicando las ideas, razones o elementos principales:

a. cmo organizara su explicacin si un maestro le interrogara acerca de las diversida-


des intelectuales que se verifican en el aula tomando en cuenta el modelo de Sternberg?

b. cmo explicara a un docente el concepto de zona de desarrollo prximo y su grado


de pertinencia para la labor del aula?

c. durante la vida escolar se aprenden numerosos conceptos. Qu criterios usara Usted


para explicar a un maestro la naturaleza y clase de los mismos tomando en cuenta los
trabajos de Luria?

d. a partir de las teoras sobre la transferencia, cmo orientara a un maestro interesado


en la aplicacin de lo aprendido a nuevas situaciones?

83
Clave de respuestas
Orientaciones Generales:

.Se ha tratado de que cada respuesta contenga tres elementos de modo de facilitar una
puntuacin ms discriminativa. En general, el criterio debera ser:
2 puntos para las respuestas que contengan los tres elementos.
1 punto para las que contengan dos elementos o tres poco pertinentes para el
tema
0 punto para las respuestas inadecuadas, incorrectas o no pertinentes.

.De este modo, el puntaje mximo 30 que luego se convertir en la escala usual de 0 a
10. La zona crtica de puntuacin es la comprendida entre 9 y 12 porque decide el aprobado-
desaprobado y 18 y 21 porque marca el lmite promocin directa-tradicional. En stos casos
es conveniente someter la prueba a ms de un evaluador para asegurarse y evitar, dentro de
lo posible, el uso de puntajes limtrofes.

.Los criterios generales para evaluar el contenido son: a.- respuestas que revelen lec-
tura de los materiales; b.- respuestas que se adecuen, resulten pertinentes a lo que se solici-
ta; c.- respuestas que revelen uso comprensivo de la terminologa; d.- respuestas que reve-
len comprensin de la situacin presentada, en funcin de los elementos tericos. En caso
de duda, dos medidas tiles para disiparla son: 1.- recurrir a la bibliografa; 2.- consultar a
otros docentes de la ctedra para que decidan en forma independiente, sto es, sin conocer
el juicio del primer puntuador.

.La clave de respuestas es tentativa. Por lo tanto pueden aparecer respuestas que no
esten contempladas en la clave pero sean aceptables an mejores que las previstas. La su-
tileza de algunos alumnos puede ser mayor que la de los docentes de la ctedra!

.La actitud general del evaluador en una prueba de ste tipo debe ser flexible y el 10
una nota alcanzable sin ser dadivoso. Una prctica aconsejable es ponerse en los zapatos
del examinado y pensar qu habra contestado uno a la pregunta. Estas advertencias son
especialmente aplicables a las cuestiones que requieren mayor creatividad para aplicar el
conocimiento y para aquellas que solicitan un manejo ms puntual de la informacin.

.Un consejo final:no utilicemos la prueba como un instrumento para ejercer poder (como
a veces se hace, sino como un medio para la mejora de la enseanzay el aprendizaje.

Primera Parte
N 1
. deficiencias en la presentacin
. programacin ( aproximaciones sucesivas )
. tamao del paso ( pasos muy grandes, baches )
. graduacin o secuencia de los pasos, materiales y tareas
. falta de indicios y claves para ayudar a la discriminacin y por tanto al mantenimiento.

84
. escasa atencin al ritmo individual del alumno
. falta, escasez o inadecuacin del reforzamiento ( contnuo en la adquisicin, intermi
tente en el mantenimiento de las respuestas aprendidas).
. falta de retroalimentacin, feedback o conocimiento de los resultados.
. aumento de errores al aumentar la dificultad y complejidad de los materiales.
. uso inadecuado de los reforzadores
. contingencias respuesta-refuerzo
. refuerzo no inmediato (prdida de su valor confirmatorio)
. escasez de reforzadores disponibles
. falta o inadecuacin del refuerzo necesario para mantener la respuesta
. descuido por la actividad o participacin activa del alumno.

Nro. 2

. ausencia o inadecuacin de enlaces significativos facilitadores


. disponibilidad de organizadores previos, de contextos significativos a los que asimilar
la nueva experiencia.
. dificultad para la subsuncin en la estructura cognitiva existente.
. escasez de marcos de referencia que vinculen conceptos y sus relaciones (jerarquas
conceptuales, aprendizaje supraordenado).
. nfasis sobre el aprendizaje memorista que descuida la significacin, relaciones arbitrarias,
no sustanciales entre los materiales y los inclusores existentes.
. falta de organizacin y significacin potencial de los materiales o de las tareas de aprendi-
zaje.
. dificultades para recuperar elementos de la memoria (inclusin obliterativa).
. falta de diferenciacin progresiva a partir de elementos ms generales e inclusivos, de
puentes cognitivos para pasar de un concepto a otro (reconciliacin integradora).
. falta de disponibilidad de una matriz ideativa y organizada para entender y/o fijar nuevas
ideas.
. falta de actitud significativa en el alumno.

Nro. 3

. Aprendizaje y desarrollo como procesos mutuamente independientes: el alumno no estaba


maduro; el aprendizaje no aprovech las oportunidades creadas por el desarrollo, no se
tom en consideracin el nivel evolutivo de las habilidades implicadas, el material no respet
las caractersticas del pensamiento infantil, la enseanza no estaba adaptada a los niveles
de desarrollo. La idea general es la de la sujecin del aprendizaje al desarrollo.

. Aprendizaje y desarrollo como sinnimos: no se tuvieron en cuenta la historia de aprendiza-


je previo del alumno, los prerequisitos en trminos de habilidades y conocimientos. La idea
general es la de enfatizar el aprendizaje por sobre los procesos internos y sus posibilidades
de ser modificado por la accin del ambiente.
. Aprendizaje como proceso previo al desarrollo:no se tuvieron en cuenta las contribuciones que

85
puede hacer el aprendizaje al desarrollo en trminos de habilidades y potencialidades. La
idea general reside en que el desarrollo proviene de los efectos acumulativos del aprendizaje
con las limitaciones impuestas por la maduracin. El ejemplo ilustrara el descuido por las
capacidades aprendidas que intervienen en el proceso de desarrollo.

. Aprendizaje y desarrollo como producto de interacciones complejas en las que intervienen


la maduracin, la disposicin, el aprendizaje incidental, el aprendizaje escolar. La idea gene-
ral es que los efectos de ambos no se diferencian claramente en la conducta y, por lo tanto es
difcil determinar los efectos de los procesos aislados en situaciones como la ejemplificada.

. El desarrollo cognitivo como resultado del aprendizaje incidental y mediado: fallas en el


papel del mediador como organizador de las experiencias de aprendizaje, como estructurador
del entorno de aprendizaje, como gua para las actividades implicadas en la resolucin de
problemas.

Nro. 4

. diagnstico de las funciones cognitivas deficientes o inadecuadas.


. facilitacin de experiencias de aprendizaje a travs de un mediador.
. nfasis sobre la intervencin en las funciones deficientes para superar las dificultades.
. actuacin sobre las fases de entrada, elaboracin y salida para favorecer el uso eficiente de
la informacin.

Segunda Parte

Nro 1

. Encadenamiento verbal: El sol sale por el este


. Informacin verbal significativa: El sol sale por la maana. A mi edad.... Comunica
cin de informacin.
. Resolucin de problemas. Combinaciones que hace el nio para dar las respuestas.
. Actitudes: And a tu asiento...; Lstima...; Al sol no le importa....
. Habilidades intelectuales: relacin con la propia experiencia, para sostener un punto de
vista, para manejar smbolos verbales.

Nro. 2

. Episdica: o de experiencias especficas; alude a la informacin sobre acontecimientos


ocurridos y sobre el momento y el contexto en que lo hicieron o sucedieron: El sol entra
por la ventana del living; a mi edad no puedo....
. Semntica: objetiva, de propiedades y relaciones independientes de momentos o lugares:
El sol sale por la maana (o por el este, como lo solicitaba la maestra).
Las memorias episdica y semntica son variedades en cuanto a lo que se retiene.

Nro. 3 - Piaget. Inhelder y Matalon

86
. Imposicin de la lgica del adulto (el adulto es el centrado).
. No se toman las respuestas del alumno para proseguir el interrogatorio ni se exploran las
razones de las respuetas infantiles;
. Las respuestas infantiles se desechan como errneas (tratamiento del error);
. No se favorece, ms bien se obstaculiza la expresin de los contenidos mentales del alum-
no.

87
TEMS DE ENSAYO BREVE

Mara del C. Malbrn

Los mtodos de la Psicologa. Trabajo de aplicacin

1.Se compararon grupos de nios cuya dieta era de alto y bajo valor calrico respectiva-
mente en cuanto a su rendimiento escolar. Este result significativamente ms alto para
el primer grupo. Qu mtodo/s se utiliz? Cmo lo sabe?.

2.Para estudiar el desarrollo moral un psiclogo compar tres grupos de nios de 6, 8 y


10 aos en los juicios que expresaban sobre diferentes situaciones. Otro psiclogo ob-
serv a un grupo en este aspecto desde los 4 hasta los 10 aos. Qu mtodo/s utiliz
cada uno de ellos? Cmo lo sabe?

3. Gesell inform que a uno de dos gemelos se le dio entrenamiento para iniciarlo en salto
mientras que al otro no; sin embargo los dos aprendieron a saltar a la misma edad. A
qu proceso podra atribuirse esa diferencia? Qu mtodo/s se utiliz?

4. Un grupo de psiclogos compararon las caractersticas de pacientes esquizofrnicos


con personas mentalmente sanas. Otro grupo de estos profesionales examin las expe-
riencias tempranas de las personas con y sin esquizofrenia a partir de las historias indivi-
duales. Cul de estos grupos era el de psiclogos del desarrollo? Qu mtodo/s se
utiliz en cada situacin?

5. Un psiclogo infantil est interesado en saber si la actividad prenatal est relacionada


con el nivel de actividad del sujeto a los 6 aos. Qu mtodo/s deber utilizar y por qu?

6. Un investigador interesado en la efectividad de dos mtodos de enseanza dividi al


azar a un grupo de sujetos en dos subgrupos: a uno se le ense a leer mediante un
mtodo fontico, a otro mediante un abordaje lingstico. Qu mtodo/s utiliz? Cmo
lo sabe?

7. Un psiclogo examin la capacidad para el condicionamiento del parpadeo en un grupo


de nios de 2 meses, otro de 6 meses y otro de 1 ao. Concluy que los de 2 meses no
responden al condicionamiento en tanto que s lo hacen los de 6 meses y 1 ao, siendo
ms rpido en stos ltimos. Qu mtodos utiliz? Cmo lo sabe?

8. Aplicando diferentes pruebas durante la infancia y la adolescencia a un grupo, un equi-


po de investigadores estudi el nivel de dependencia afectiva. Los nios que mostraron
un alto nivel de dependencia durante los aos preescolares, fueron los que tambin se
mostraron ms dependientes en la infancia y en la adolescencia. Qu mtodo/s se utili-

88
zaron? Cmo lo sabe?

9. Un maestro seleccion al azar 1.000 oraciones de nios de cinco grupos de edades


diferentes y obtuvo datos sobre la edad en que los nios usan sustantivos, verbos, adje-
tivos y otros elementos gramaticales. Qu mtodo/s utiliz? Cmo lo sabe?

10.Un psiclogo est interesado en los cambios de los juegos de los nios a medida que
crecen. Selecciona un gran nmero de nios de diferentes edades y registra con quienes
juegan y a qu juegan. Qu mtodo/s utiliza? Qu caracterstica/s del estudio le da a
Ud. Informacin para distinguir el mtodo/s?

89
EXMENES ORALES
Fuente: Robert Ebel. Redicin del Aprov. Educ., 1972.

La historia de los exmenes orales es muy antigua. Hasta hace un siglo eran la forma
de comprobacin predominante en las escuelas. En la actualidad slo ocasionales voces se
alzan para proclamar sus virtudes como pruebas escolares. Con todo, siguen gozando de
favor para algunos fines. El examen final del doctorado es por lo comn oral. En tal contexto,
cumple una funcin ms ceremonial que evaluativa. Los exmenes orales son valuados de
una manera particular en el otorgamiento de certificados o en la seleccin de profesionales
cuyo trabajo requiere relacin asidua con personas: docentes; especialistas mdicos; poli-
cas y otros funcionarios pblicos.

Esencia y Variaciones

En esencia, el examen oral hace intervenir a dos personas que se encuentran cara a
cara. El examinador hace preguntas. El examinando trata de responderlas. El examinador
insiste con nuevas preguntas o acepta la respuesta. Por ltimo, juzga la calidad de las res-
puestas y califica de acuerdo con ella al examinando. Muchas veces la calificacin se reduce
a aprobado o aplazado.

En algunos casos se emplea ms de un examinador para aumentar la objetividad del


examen. A veces, con el fin de reforzar la eficacia del proceso y la ecuanimidad de los jui-
cios, se entrevistan simultneamente varios candidatos, dndosele a cada uno la oportunidad
de responder a las mismas preguntas y de hacer comentarios a las respuestas de los otros
examinandos. En algunos casos, se indica a los examinandos que se hagan preguntas rec-
procas y los examinadores actan slo como jueces, y hasta puede dejarse a cargo de los
examinandos el juicio del propio desempeo.

Las entrevistas que se realizan para incorporar personal incluyen con frecuencia al-
gn tipo de examen oral, y existe cierta similitud en ambos casos en los principios que deben
aplicarse. Es acertado considerar los exmenes orales como un tipo especial de prueba de
rendimiento, pero dado que estn rodeados de circunstancias muy especiales el carcter
definitorio y la tensin, el status desigual de los participantes -), el rendimiento que se mani-
fiesta en ellos no puede considerarse como una conducta tpica.

Justificaciones

El examen oral requiere el contacto y la interaccin directas entre examinador y exa-


minando. Esta circunstancia hace que el examen oral, sino menos amenazador, por lo menos
resulte ms personal y, posiblemente, ms clido que los exmenes escritos. Algunos consi-
deran que los exmenes orales constituyen una experiencia agradable.

En un examen oral, en el cual examinador y examinando se encuentran cara a cara,

90
se pueden evaluar caractersticas personales que sera imposible evaluar en una comproba-
cin escrita, por ejemplo la apariencia, modales, personalidad, vivacidad, franqueza, toleran-
cia de las tensiones, estilo y calidad de lenguaje. En una palabra, se puede juzgar mejor la
impresin que el examinando causar a otra persona.

Cuando el objetivo del examen es evaluar el conocimiento de habilidades intelectua-


les que posee el examinando, la forma oral permite una flexibilidad de enfoque que general-
mente falta en el examen escrito. Se puede pedir al examinando que desarrolle, aclare o
justifique su respuesta. Los puntos importantes pueden sondearse de manera profunda. De
esta manera surge un cuadro claro de las capacidades y limitaciones del examinando. Aque-
llas personas que consideran que los fraudes de los alumnos son un problema importante en
los exmenes escritos opinarn que esta limitacin difcilmente pueda surgir en un examen
oral. Hasta el descaro resulta ms difcil de ejercitar con eficacia cuando se trata de respues-
tas espontneas a preguntas orales y no de responder por escrito. Por ltimo, cosa que suce-
de en cualquier examen bien concebido independientemente de su forma, un examen oral
puede ser una experiencia de aprendizaje.

A pesar de lo dicho, las pretensiones de los entusiastas de las pruebas orales resultan
a veces excesivas. Un examen oral no es ms eficaz que otro escrito en lo que hace a eva-
luar rasgos intangibles, mal definidos, como el carcter, la creatividad o la aptitud general.
Aquellos que consideran que el examen oral evala la capacidad del examinando para pensar
bajo el fuego, o dicho con ms precisin, para pensar ms eficazmente estando sometido a
tensiones, pasan por alto el hecho de que la mayora de las personas piensan mejor cuando
no se hallan bajo tensin. La capacidad de no cortarse en situaciones de tensin no puede
considerarse un buen indicador de la eficacia general de alguien. Pero los defensores de los
exmenes orales deben evitar la pretensin de que stos miden capacidades tales como
lealtad para con la organizacin, honradez, aplicacin, integridad y hasta la capacidad de
trabajar en equipo con otros, porque todas estas son caractersticas que los examinandos
tienen pocas oportunidades para mostrar y los examinadores para observar en el contexto del
examen oral.

Limitaciones

Los exmenes orales tienen ciertas limitaciones intrnsecas, que explican el hecho de
su limitacin virtual como instrumentos de evaluacin educacional. Como el examen oral es
por esencia un proceso individual, consume mucho tiempo, sobretodo si cada comprobacin
tiene la duracin que necesariamente debe tener (30 minutos o ms)para suministrar una
muestra suficiente de las capacidades del estudiante. La necesidad de disponer de un tiempo
holgado se acenta cuando se emplea ms de un examinador para lograr una evaluacin
objetiva. Estas caractersticas hacen tambin que los exmenes orales sean costosos y com-
plejos en su administracin.

El contacto personal y la interaccin entre examinando y examinador, que constituye


uno de los puntos a favor del examen oral, tiene, al mismo tiempo, sus inconvenientes. Abre
la puerta al prejuicio, la parcialidad y la discriminacin sobre la base de causas que no son

91
los rasgos y capacidades pertinentes. Otras influencias reducen tambin la validez del exa-
men. La tensin que surge de la relacin personal con el examinador perturba los procesos
mentales, normalmente eficaces, de algunas personas. En otras, la facundia y la simpata
personal pueden ayudar a encubrir las deficiencias reales.

Pero la mayor limitacin de los exmenes orales est dada por la dificultad de obtener
puntajes de razonable confiabilidad en un plazo razonable tambin. Investigaciones de Hartog,
Barnes y Pressey, Riggs, Trimble y otros confirman esta conclusin. Por otra parte, como lo
ha demostrado Carter y como hizo ver Trimble en otro estudio, es posible obtener evaluacio-
nes confiables cuando se cumplen ciertas condiciones. Si se emplean varios evaluadores, si
todos ellos centran su inters en las mismas cosas y si el examen es suficientemente prolon-
gado y estructurado, los puntajes de los exmenes orales pueden ser confiables y vlidos.
Con todo, para obtener este resultado se necesita ms cuidado y habilidad de lo que la mayo-
ra de los examinadores pueden dedicar.

Sugerencias para el empleo eficaz del examen oral

1. Evtese recurrir a los exmenes orales cuando se puede idear una comprobacin escri-
ta que pueda cumplir la misma funcin con razonable eficacia.

Son pocas las ocasiones en las que debe emplearse un examen oral para evaluar el
dominio que un examinando posee de ciertos contenidos de conocimiento. Los exmenes
escritos de ninguna manera tienen las limitaciones de alcance y profundidad que algunos de
sus crticos parecen dar por supuestas. En general, los exmenes orales deberan reservarse
principalmente para ocasiones ceremoniales o para circunstancias en las cuales el principal
inters reside en la evaluacin de caractersticas de personalidad. De ninguna manera se los
debe emplear para evaluar rasgos intangibles, mal determinados.

2. Debe definirse con claridad el objetivo del examen y el fundamento sobre el cual se
juzgarn los rendimientos del examinando.

Los rasgos de personalidad o las habilidades que se desea evaluar tienen que definirse
de una manera libre de ambigedad. Asimismo deben definirse la escala en que se expresa-
rn las calificaciones y la nota de aprobacin. Saxe, Hartnett, Carter, Graham, Hartog y Trimble
describen diferentes escalas de calificacin. Deben especificarse tambin las maneras con-
venientes e inconvenientes de preguntar y la orientacin que deben seguir las preguntas.

3. Es conveniente emplear dos o ms examinadores competentes, responsables y bien


adiestrados.

En este contexto, competencia significa poseer de manera sobresaliente los rasgos


y habilidades sobre los cuales versa la evaluacin de los examinandos. La responsabilidad es
producto del inters afectivo en el proceso de seleccin o evaluacin, de asignar gran valor
al cumplimiento eficaz de esta tarea. Si los examinadores tienen que cumplir su tarea como

92
una evaluacin impuesta y se someten a ella de mala gana, difcilmente se comporten de
manera responsable.

El proceso de adiestramiento de los examinadores debera, como mnimo, incluir un


anlisis previo del objetivo del examen, los rasgos que se han de evaluar, las orientaciones
que deben seguir las preguntas y las que deben evitar y el significado de los distintos puntajes
de la escala. En un nivel deseable, el proceso de adiestramiento abarcar ensayos prcticos
para establecer procedimientos y fundamentos comunes para los juicios de evaluacin. El
adiestramiento puede prolongarse paralelamente a los exmenes, si se controla peridica-
mente el grado en que existe coincidencia entre los examinadores y se trata de explicar los
casos de desacuerdo extremo.

4. Si es posible, conviene tomar medidas para que el examinando sea escuchado en dos
sesiones independientes, con diferentes conjuntos de examinadores.

Como lo mostr Hartog, el desempeo de un mismo examinando en ocasiones dife-


rentes puede ser muy distinto. Las preguntas pueden seguir direcciones diferentes en dos
ocasiones, refirindose en una de ellas a temas que el examinando conoce bien y dejando a
la vista su ignorancia, en la otra. La seguridad en s mismo que el estudiante tiene puede ser
reforzada en una ocasin y demolida en otra. Un examen nico puede ser una base inestable
para la evaluacin.

5. Hay que preparar a los examinandos para que den una impresin fiel de s mismos en el
examen.

Los examinandos deben conocer la finalidad del examen, los fundamentos que se
emplearn para medir su competencia, la ndole general de las preguntas que se harn y los
procedimientos que se aplicarn. Si los examinadores consideran que es lcito hacer pregun-
tas ajenas al tema o imposibles de responder (para comprobar si el estudiante puede recono-
cer tales preguntas), los examinandos tienen que estar enterados de esa posibilidad.

6. Se deben recoger datos para poder controlar la confiabilidad de los puntajes obtenidos
en cada examen.

Por lo comn, es imposible validar estadsticamente los puntajes de un examen oral.


La validez debe ser intrnseca a los fundamentos de los juicios que hacen los examinadores.
Pero si estos discrepan entre s, o si el desempeo de los examinandos en distintas sesiones
de examen muestra incoherencias muy grandes, las evaluaciones necesariamente carecern
de confiabilidad y de ninguna manera se las podr tomar como vlidas.

93
Observaciones Finales

Aunque la forma oral parece a veces aportar una solucin preferible o fcil para un
problema de exmenes, rara vez sucede as. Si se la considera con mayor atencin, la apa-
rente superioridad del mtodo oral tiende a diluirse en el yermo de las dificultades y en las
nieblas de la falta de confiabilidad. Ms tarde o ms temprano, la mayora de las autoridades
encargadas de los exmenes vuelven nuevamente a los mtodos ms precisos y ms fciles
de aplicar. Es posible emplear con eficacia los exmenes orales, pero la mayora de las
veces las dificultades que presentan hacen que carezcan de atractivo.

94
PRINCIPIOS PARA CONDUCIR EXMENES ORALES

Fuente: TESTING BULLETIN, NRO. 7 OFFICE OF EVALUATION SERVICES.


Michigan state university
TRADUCCIN: MARA DEL C. MALBRN

1. Usarlos para los propsitos adecuados segn su naturaleza. Por ejemplo, para obtener
informacin acerca de la profundidad del conocimiento del estudiante, en casos donde la
presentacin oral es un propsito del curso o en las situaciones en que los otros tipos de
exmenes resultan inadecuados.

2. Preparar de antemano un bosquejo de los materiales que muestrear el examen y la


extensin o amplitud de las preguntas.

3. Determinar previamente el peso asignado a los diferentes tpicos.

4. Presentar preguntas apropiadas a los propsitos del curso.

5. Presentar preguntas en forma que el estudiante pueda identificar lo que se le pide con
un mnimo de dificultad.

6. Cuando se emplean varios examinadores, responsabilizar a cada uno de una parte es-
pecfica del examen.

7. Juzgar a los estudiantes sobre la base de su desempeo definido en forma precisa y no


en trminos de una impresin general.

8. Presentar las cuestiones que, dado lo que se ha enseado, puede esperarse que un
estudiante sepa contestar. Un examen no es el lugar apropiado para que el profesor pue-
da mostrar su propia erudicin.

9. Usar preguntas generales y especficas, pero hacerlo de acuerdo con algn orden lgi-
co.

10.No destinar un tiempo excesivo en la obtencin de respuestas a una pregunta. Si las


primeras cuestiones no producen una respuesta apropiada pasar a otro tema o subtema.

11.Desarrollar algunas tcnicas para facilitar el desarrollo del examen tales como: a) crea-
cin de una atmsfera cordial; b) entrenamiento en la manera de formular preguntas; c)
disear algn mtodo para registrar las respuestas.

12.Llevar algn registro escrito del desempeo del estudiante mientras se desarrolla el
examen sin que esto perturbe al alumno.

95
13.Permitir un tiempo necesario para que el estudiante medite su respuesta.

14.Evitar la polmica con el estudiante. Es la oportunidad que se le da y debe permitirse


que la use ampliamente.

96
ANTEPROYECTO PARA LA INCORPORACIN DEL
EXAMEN ESCRITO. FACULTAD DE HUMANIDADES.
UNLP
Mara del C. Malbrn

1. Estructura y contenido del examen escrito.

. Las pruebas escritas debern constituir una muestra representativa del programa vi-
gente de la asignatura
. Se acompaaran de una clave de correccin que se elaborar simultneamente al te-
mario. En ella constarn los criterios para determinar el grado de correccin de las res-
puestas as como el puntaje previsto en cada caso
. Las pruebas debern demandar del estudiante aprendizajes complejos tal como corres-
ponde al nivel superior de la enseanza, esto es, desalentarn la reproduccin rutinaria o
memorista y la trivialidad, abarcando tanto el dominio de la informacin como las habili-
dades para operar con la misma.
. Los docentes de la ctedra (profesores titulares y adjuntos) tendrn libertad para deci-
dir el tipo de instrumento a utilizar (pruebas tipo ensayo, pruebas objetivas, pruebas mix-
tas, etc.). Esta informacin sobre la estructura del examen deber hacerse conocer a los
estudiantes en el programa de la asignatura

2. Criterios de aplicacin y calificacin

. El temario de la prueba se har conocer a los examinados en el momento de iniciarse el


examen
. El sistema de asignacin de notas ser el usual en la Facultad
. La prueba escrita ser aplicada en un recinto que asegure el trabajo individual del alumno
y el control por parte del personal docente de la ctedra
. Si el nmero de examinados excediera las disponibilidades del recinto, la prueba escri-
ta se aplicar por grupos. En caso de no contarse con docentes suficientes para aplicarla
en forma simultnea, se administrar por turnos, para lo cual la ctedra deber disponer
de versiones paralelas en dificultad y complejidad del instrumento. No podr utilizarse el
mismo examen para grupos sucesivos de examinados ni en fechas sucesivas de los lla-
mados de exmenes
. Las cuestiones o tareas planteadas en el examen se prepararn de modo de emplear
aproximadamente dos horas reloj de trabajo a un estudiante promedio
. Podr considerarse que el tiempo de trabajo est cumplido cuando alrededor del 90%
de los examinados haya concluido el examen
. Los alumnos ingresarn al recinto en forma simultnea, munidos de elementos para
escribir, libreta de estudiante, documentos de identidad y, si se considerara conveniente,
el programa de la asignatura. Salvo en los casos en que la ndole de la tarea lo justificara,
no les ser permitido disponer de otros materiales durante el examen
. Si las pruebas fueran impresas, los ejemplares sern entregados a todos los examinados

97
simultneamente. Si las cuestiones fueran presentadas en el pizarrn o dictadas a la
audiencia, las hojas en blanco a utilizar sern autenticadas por los profesores de la cte-
dra previamente
. Las instrucciones para completar la prueba se brindarn en voz alta para todos los
examinados. Luego se dejar un tiempo para evacuar consultas y dudas. No se permitirn
preguntas o solicitudes de aclaracin durante la realizacin del examen
. En caso de ser desaprobado el examen escrito, los criterios a seguir sern los mismos
que se establecen para el examen oral
. Las pruebas escritas no sern devueltas al alumno sino que quedarn archivadas en la
Facultad
. La Facultad podr designar vedores autorizados para controlar la legalidad de los pro-
cedimientos

3. Responsabilidades de los profesores

. La construccin del examen escrito ser responsabilidad de los profesores titulares y


adjuntos de la asignatura
. Las ctedras que optaran o incluyeran exmenes escritos finales debern hacerlo cons-
tar en el programa de la asignatura
. En ningn caso la aplicacin y calificacin de la prueba podr estar a cargo de ayudan-
tes alumnos
. La aplicacin de la prueba podr contar con la colaboracin de los docentes auxiliares
(jefes de trabajos prcticos y ayudantes diplomados), pero la evaluacin final ser res-
ponsabilidad exclusiva de los profesores titulares y adjuntos de la ctedra
. Previamente a la iniciacin del examen escrito, el profesor tomar lista de los presen-
tes y controlar las actas, de modo de evitar dificultades una vez iniciado el trabajo
. Las pruebas cuyas respuestas dificulten determinar si se han alcanzado el puntaje m-
nimo de aprobacin en razn de la baja calidad de las respuestas segn la clave de co-
rreccin, sern calificadas en forma independiente por los integrantes de la mesa exami-
nadora. En este caso, la nota final resultar del promedio de las notas asignadas por los
distintos calificadores
. Los profesores debern comunicar los resultados del examen escrito a travs de las
actas correspondientes dentro de las 24 horas de realizado el examen
. Si los profesores titulares y adjuntos a cargo de la ctedra estuvieran ausentes en un
turno de exmenes determinado, quienes los reemplacen utilizarn el examen oral segn
la reglamentacin vigente

4. Responsabilidades de los estudiantes

. El alumno cuya conducta no se ajustara a las pautas establecidas, ser retirado del
recinto. En este caso se considerar que ha desaprobado el examen. Para evitar altera-
ciones en los otros examinados, el profesor comunicar en voz baja e individualmente
esta decisin al examinado que transgrediera las normas
. El alumno que por cualquier motivo solicitara salir momentneamente del recinto no podr
volver a ingresar al mismo y perder el derecho a rendir examen en ese turno. El examen se

98
considerar desaprobado
. El alumno no podr solicitar ser examinado con otro tipo de recurso de evaluacin si el
programa de la asignatura no lo contempla explcitamente
. Los examinados debern cuidar la legibilidad utilizando una clara grafa, evitando el
uso de abreviaturas no convencionales y organizando el material de modo de facilitar su
lectura por parte del evaluador. La mesa examinadora podr rehusar calificar un examen
que no cumpla con estos requisitos elementales
. Las pruebas debern ser firmadas y la firma aclarada por el estudiante. Cuando se
utilicen varias hojas, las mismas debern ser numeradas por el examinado
. Evaluada la prueba y asignados los puntajes, el alumno podr pedir vista de la misma y
de la clave de correccin con la que fue calificada
. El alumno tendr derecho a cuestionar la validez de la prueba para lo cual deber
presentar por escrito sus objeciones al Departamento respectivo

Aclaraciones que pueden resultar de utilidad para el anlisis del


anteproyecto

. La ndole de algunas asignaturas y, consecuentemente de las cuestiones que se


planteen, puede requerir por parte del examinado la utilizacin de tablas, grficas, mapas,
calculadoras, etc., cuya utilizacin puede ser imprescindible o aconsejable durante el exa-
men. Sera conveniente en estos casos hacer mencin explcita en el programa de la asigna-
tura
. Una de las crticas ms contundentes que han recibido los exmenes de este tipo es
su baja confiabilidad. A esta deficiencia contribuyen la reduccin del muestreo de contenidos
y habilidades, las ambigedades en las consignas, preguntas y planteos, la deficiente rela-
cin entre la longitud y complejidad de las cuestiones y el tiempo disponible, la falta de
direcciones que orienten las respuestas del estudiante, la escasa coherencia o congruencia
entre los objetivos y contenidos de la asignatura y la naturaleza de las preguntas incluidas en
el examen
. Las pruebas diseadas para evaluar el rendimiento en el nivel superior de la ense-
anza deberan evaluar aprendizajes complejos del tipo:

. analizar
. explicar
. encontrar relaciones
. comparar
. integrar
. expresar ideas en forma lgica y pertinente
. seleccionar ideas significativas
. organizar y sintetizar ideas
. extraer conclusiones

99
. interpretar, generalizar, extrapolar informacin
. describir secuencias de desarrollo
. aplicar ideas o habilidades en la resolucin de situaciones y problemas
. evaluar ideas segn diferentes criterios

100
INSTITUTO PARA EL MEJORAMIENTO
DE LA ENSEANZA DE LAS CIENCIAS
(INEC)
PROGRAMA REGIONAL DE DESARROLLO EDUCATIVO O.E.A.

PROYECTO PARA LA ENSEANZA DE LA CIENCIA DE LA


FUNDACIN NUFFIELD.NIVEL A DE QUMICA.

EVALUACIN DE LOS TRABAJOS PRCTICOS

LOS OBJETIVOS:

Se sugieren los siguientes objetivos, con las ponderaciones indicadas en porcentaje.

1. Destreza en la observacin (25%).


2. Habilidad para interpretar las observaciones (15%).
3. Habilidad para planear experimentos (10%).
4. Destrezas manipulativas (30%).
5. Actitudes hacia los trabajos prcticos (20%).

1. La sola observacin tiene poco valor a menos que sea precisa y pertinente. Su evalua-
cin se apoya principalmente en la habilidad del estudiante para informar, siendo inevita-
ble que en su mayor parte toma la forma de calificaciones adjudicadas por los informes
escritos de observacin. Pero existen dos aspectos de la observacin para los que los
profesores pueden conceder crdito, en tanto que no puede hacerlo un examen prctico
convencional, y es de esperar que ninguno de ellos sea pasado por alto. El primero es el
informe oral, que habitualmente es ms inmediato y menos ensayado que el escrito. El
segundo es la observacin e inters de los estudiantes por los rasgos inusuales e inespe-
rados de un experimento an cuando no sean pertinentes para el propsito inmediato del
mismo. No ser fcil calificar estos dos aspectos pero al menos podran ser acreditados
en una revisin peridica que clasifique la actitud de cada estudiante hacia los trabajos
prcticos.

2. La evaluacin de la interpretacin es similar a la de la observacin; en que los profeso-


res slo pueden juzgar aquello que los estudiantes escriben o dicen. Se acreditar la
aproximacin analtica a las observaciones, incluyendo aqullas no previstas y la habili-
dad para comentar en forma crtica sobre las situaciones prcticas.

3. La habilidad para planear es la ms fcilmente evaluada porque requiere de los estu-


diantes el escribir su plan y el someterlo a la calificacin antes de comenzar, pero esto

101
slo puede hacerse en aquellos experimentos en los que se brinda a los estudiantes infor-
macin restringida sobre el procedimiento. Debera incluir la habilidad para reconocer las
fuentes de error y la habilidad para hacer predicciones acerca de otros experimentos.

Podra arguirse que tanto la interpretacin como el planeamiento pueden evaluarse en


base a exmenes escritos. Esto puede ser as, pero la interpretacin de un estudiante de
las observaciones que realmente ha hecho y sus planes de un experimento que sabe que
debe intentar poner en marcha, bien pueden ser diferentes de su interpretacin y
planeamiento de situaciones hipotticas sobre el papel. Los procesos del pensamiento
pueden ser similares, pero su contextura es diferente y por consiguiente su resultado
tambin puede serlo.

4. Las destrezas manipulativas pueden evaluarse mediante la calificacin de los resulta-


dos de los experimentos, por ejemplo, produccin, pureza y precisin (precisin en el
trabajo ms bien que en el clculo); tambin puede evaluarse mediante la observacin
directa de aspectos tales como orden, trabajo metdico, destreza y velocidad. Es desea-
ble que esta evaluacin no se limite a operaciones de rutina; debera incluir la habilidad
de los estudiantes para adaptar sus destrezas manipulativas a nuevas situaciones y para
seguir instrucciones poco familiares.

Puede ser posible para los profesores usar experimentos especficos para evaluar algu-
nos componentes de la destreza manipulativa, particularmente produccin, pureza y pre-
cisin. Sin embargo, muchos profesores consideran que una calificacin basada en una
impresin general del trabajo durante un perodo de, digamos, un trmino lectivo o an un
ao, es ms apropiada para los aspectos menos exactos de la destreza manipulativa, que
slo puede evaluarse mediante la observacin directa. Si se usa una calificacin peridi-
ca es importante que los profesores busquen concientemente la evidencia de las destre-
zas durante todo el perodo y no se fen simplemente de su memoria al finalizar el mismo.

5. Para el propsito de esta evaluacin las actitudes pueden ser divididas en tres catego-
ras:

(i) disposicin para cooperar en la rutina corriente de un laboratorio de Qumica.


Esta incluir un conocimiento de las normas de seguridad y una disposicin para
cumplirlas y otras reglas necesarias para la marcha eficiente de un laboratorio.
(ii) persistencia e inventiva voluntad para trabajar sin ayuda en problemas determi
nados y para verlos a travs de una conclusin significativa.
(iii) entusiasmo; confianza en el trabajo prctico como una ocupacin valiosa sin
coaccin.Podra ponerse de manifiesto en sugerencias para lneas de investiga
cin no especificadas en el curso y en asumir el rol ms activo cuando se trabaja
en grupos.

Probablemente el mtodo ms apropiado para evaluar actitudes sea una calificacin al


fin de cada ao o incluso, al fin del curso.

102
Tipos de Trabajo

En el curso pueden identificarse tres tipos principales de trabajo; los examinadores espera-
rn ver cada uno de ellos usado en la evaluacin, aunque no necesariamente con el mismo
peso.

1. Trabajo cuantitativo

2. Trabajo preparatorio

3. Trabajo cualitativo

Adjudicacin de las Calificaciones

Al comienzo del curso se podra decir a los estudiantes que sus trabajos prcticos
sern evaluados y que los resultados se enviarn a los examinadores. Tambin podran cono-
cer, en trminos generales, las cualidades que los profesores tendrn en cuenta. Asimismo,
se les podra decir que la evaluacin ser ms evidente en algunas ocasiones que en otras,
pero que generalmente tendr lugar el trabajo corriente y no en oportunidades especiales.
Puede tranquilizarlos saber que la calificacin promedio para los trabajos prcticos ser ma-
yor que para los exmenes escritos.

Durante los ensayos se us un esquema graduado (5- 4- 3- 2- 1) para adjudicar califi-


caciones a un objetivo particular en una ocasin particular, pudiendo los profesores hallar til
una escala de cinco puntos especialmente para aquellas partes del trabajo que se califican
por impresin ms que por un esquema de calificacin.

Existen tres formas principales en las que pueden adjudicarse las calificaciones, y los
profesores probablemente encontrarn que tienen que usar todas ellas;

1. Un esquema de calificacin. Tendr la mayor utilidad cuando se califiquen pruebas es-


critas de observacin, interpretacin, planeamiento y precisin.

2.Calificacin por impresin en una ocasin particular. Ser til calificar pruebas menos
precisas que las mencionadas en 1. Por ejemplo, un profesor puede desear evaluar la
destreza en el manejo de un aparato poco familiar, digamos un cromatgrafo. Esto puede
hacerse mejor mediante la observacin directa de los estudiantes en el trabajo, pero la
tarea no resulta fcil en una clase numerosa. Los profesores deberan tratar de evaluar
por impresin slo una de tales cualidades durante un experimento. Adems, general-
mente estn demasiado ocupados como para hacer ms que tomar nota de aquellos que
lo hacen bien o mal; al resto slo se lo puede calificar por el trabajo promedio.

Durante las pruebas se prest considerable atencin al problema de si el promedio po-


da ser la estimacin del profesor del promedio de su grupo o su estimacin del promedio

103
para el trabajo del nivel A en general. El primero tiene la desventaja de que un profesor
no puede estimar el nivel general de habilidad prctica de su grupo hasta haberle ensea-
do durante un tiempo. La desventaja del ltimo reside en que depende de la experiencia
del profesor en el trabajo de nivel A. Ya que, de todos modos, las calificaciones brutas
se graduaran (scaled) en una norma, lo que importa es su distribucin y consistencia
interna. Sin embargo, es deseable alguna uniformidad y se ha decidido que los profesores
debieran tratar de juzgar cul es el promedio del trabajo a partir del nivel A en general
ms que a partir de su grupo de enseanza.

As:

Excelencia de trabajo inusual en un estudiante de nivel A 5

Por encima del trabajo promedio 4

Trabajo promedio 3

Por debajo del trabajo promedio 2

Trabajo inusualmente pobre para un estudiante de nivel A 1

3. Calificacin por impresin despus de un perodo de tiempo. Se aplicar principalmen-


te a las actitudes hacia el trabajo prctico, aunque los profesores puedan desear evaluar
otros objetivos, particularmente algunos de los aspectos menos precisos de la destreza
manipulativa, peridicamente ms que en experimentos aislados. El perodo se deja a
criterio del profesor: podra hacerse una vez por trmino, una vez por ao o, para algunos
objetivos, al terminar el curso.

104
EVALUACION DE TRABAJOS PRACTICOS EN QUIMICA

Aspectos a evaluar y sus ponderaciones

1. Destreza en la observacin 25 %

2. Habilidad para interpretar las observaciones 15 %

3. Habilidad para planificar experimentos 10 %

4. Destrezas manipulativas 30 %

5 Actitudes hacia los T.P. 20 %


105
PRUEBAS DOMICILIARIAS
Fuente: Ebel, R. ( 1977) Fundamentos de la medicin educacional.
Buenos Aires: Guadalupe.

Las pruebas domiciliarias o para llevar a casa son esencialmente similares a las
pruebas de libro abierto. Presentan respecto a estas ltimas una ventaja y una desventaja:

. ventaja: eliminan la presin psicolgica provocada por la limitacin de tiempo que a


veces reduce la eficacia de una prueba de libro abierto tomada en el aula, en la medida en
que permiten una mejor utilizacin del material de consulta.

. desventaja: falta de seguridad de que las respuestas de los estudiantes sean pro-
ductos exclusivos de su propio trabajo. Por esta razn, las pruebas domiciliarias resultan
ms adecuadas como ejercicio de aprendizaje que como pruebas de rendimiento. Debe sea-
larse sin embargo, que los esfuerzos que algunas veces producen y el grado de aprendizaje
resultante las convierte en un recurso interesante.

Un problema digno de ser tenido en cuenta cuando se emplea este tipo de recursos
radica en la clave de correccin: hay que dar a conocer los criterios para juzgar las respues-
tas y dar oportunidad a los estudiantes para analizarlas y discutirlas, y estar preparados para
brindar las justificaciones necesarias.

106
PRUEBAS DE LIBRO ABIERTO

1. Pueden construirse y emplearse para remplazar cualquiera de las formas tradicionales


de prueba: ensayo, eleccin mltiple, verdadero-falso, etc.

2. Disminuyen la ansiedad y el bloqueo emocional.

3. Enfatizan la resolucin de problemas y el razonamiento por sobre el recuerdo de he-


chos.

4. Disminuyen el fraude por parte del examinado.

5. Son adaptables a los distintos niveles de preparacin de los estudiantes.

6. Pueden provocar disminucin en el empeo con que estudian los alumnos.

7. Pueden provocar la tendencia a estudiar lo estrictamente necesario descuidando una


comprensin ms plena.

8. Resulta ms difcil determinar si hay intercambio de respuestas o copia por parte del
estudiante.

9. Tienden a fomentar un conocimiento ms superficial.

107
EMPLEO DE PRUEBAS
POR TEMA Y DE PRUEBAS OBJETIVAS

Fuente: Ebel R.;(1972) Tratado de Medicin Educacional. Buenos Aires: Guadalupe.

Conviene emplear las pruebas por temas para medir el rendimiento educacional cuando:

1. el grupo que debe evaluarse es pequeo y la prueba no se emplear nuevamente.


2. el docente desea hacer todo lo posible para estimular y recompensar el desarrollo de la
habilidad de los estudiantes para la expresin escrita.
3. el docente est ms interesado en indagar las actitudes del estudiante que en medir sus
rendimientos. (Hasta qu punto es posible que un docente deba estar ms interesado en
las actitudes que en el rendimiento y hasta qu punto puede esperar que en una prueba
los estudiantes podrn de manifiesto honestamente sus actitudes, es algo cuestionable).
4. el docente tiene ms confianza en su capacidad como lector crtico que como escritor
imaginativo de buenos tems de pruebas objetivas.
5. el tiempo disponible para la preparacin de la prueba es ms breve que el tiempo dis-
ponible para la calificacin de la prueba.

Se emplearn las pruebas objetivas para la medicin del rendimiento educacional cuando:

1.el grupo que debe evaluarse es grande o la prueba debe usarse nuevamente.
2.se pueden obtener con eficiencia puntajes de prueba confiables.
3.la imparcialidad en la evaluacin, la ecuanimidad y la ausencia de efectos de halos son
esenciales.
4.el docente confa ms en su capacidad para formular con claridad tems de pruebas
objetivas que en su capacidad para juzgar correctamente las respuestas a una prueba de
composicin.
5.es ms urgente informar rpidamente los puntajes que preparar rpidamente la prueba.

Pueden emplearse tanto pruebas por temas como objetivos para:

1. medir casi cualquier rendimiento educacional importante que pueda estimarse median-
te una prueba escrita.
2. evaluar la comprensin y la capacidad para aplicar principios.
3. evaluar la capacidad para pensar crticamente.
4. evaluar la capacidad para resolver problemas nuevos.
5. evaluar la capacidad para seleccionar hechos y principios pertinentes y para integrar-
los en la solucin de problemas complejos.
6. estimular a los alumnos para que estudien teniendo como objetivo el dominio del cono-
cimiento.

108
DIFERENCIAS Y SEMEJANZAS ENTRE LAS PRUEBAS
POR TEMA Y LAS PRUEBAS OBJETIVAS

EXAMEN POR TEMAS PRUEBA OBJETIVAUEBA


Requieren del estudiante que planifique su Requieren del estudiante que elija su res-
propia respuesta y la exprese en sus pro- puesta entre varias alternativas que se le
pias palabras. presentan.

Presenta un nmero relativamente peque- Presenta muchas cuestiones especficas


o de cuestiones generales que requieren que requieren slo respuestas breves.
respuestas extensas.

Los estudiantes dedican la mayor parte Los estudiantes dedican la mayor parte de
de su tiempo a pensar y a escribir su su tiempo a leer la cuestin y a pensar la
respuesta. respuesta.

La calidad de la prueba est determinada La calidad de la prueba est determinada


en gran medida por la habilidad del que en gran medida por la habilidad de quien
lee y califica las respuestas de los alum- construye la prueba.
nos.

La prueba es relativamente fcil de prepa- La prueba es relativamente tediosa y difcil


rar y difcil de puntuar con precisin. de preparar pero relativamente fcil de pun-
tuar con precisin.
Da libertad al estudiante para expresar su
individualidad a travs de sus respuestas Da libertad al examinador en la construc-
y al examinador para guiarse por sus pre- cin de la prueba.
ferencias individuales al calificarlas.

La tarea del estudiante y la base sobre la La tarea del estudiante y la base sobre la
cual ser juzgada la calidad de su respues- cual ser juzgada la calidad de su respuesta
ta no estn siempre claramente especifica- estn especificadas con claridad.
das.

La prueba permite y a veces estimula la La prueba permite y a veces estimula la adi-


improvisacin sin la informacin sobre el vinacin sin la informacin sobre el tema.
tema.

La distribucin de los puntajes puede ser La distribucin de los puntajes est determi-
controlada por quien califica la prueba. nada casi exclusivamente por la prueba.

Fuente:Ebel, R. (1965) Tratado de Medicin Educacional, Buenos Aires: Guadalupe.

109
Semejanzas

. Ambas pueden ser utilizadas para medir los rendimientos educacionales importantes de
una asignatura en forma escrita.

. Ambas son adecuadas para estimular a los examinados para que estudien procurando la
comprensin de los principios, la organizacin e integracin de las ideas y la aplicacin
del conocimiento a la resolucin de problemas.

. El empleo de ambas requiere la utilizacin de juicios subjetivos por parte del constructor.

110
ERRORES MS FRECUENTES
EN LA CONSTRUCCIN DE PRUEBAS

Mara del C. Malbrn

1. Excesiva confianza en el propio juicio, las observaciones fortuitas y las inferencias no


verificadas (falta de confiabilidad de los jueces)

2. Empleo de patrones o estndares absolutos para juzgar el rendimiento

3. Escaso tiempo dedicado a la preparacin de las pruebas

4. Ineficacia y brevedad de la prueba para producir un muestreo adecuado de la informa


cin y las habilidades

5. Excesiva importancia concedida a detalles secundarios, efmeros o triviales

6. Ambigedad en la formulacin de las preguntas o consignas

7. Inclusin de indicios o claves sugerentes para las respuestas

8. Ignorar el hecho inevitable de que el puntaje en la prueba es afectado por las preguntas
o tareas incluidas en ella y a subestimar la magnitud de los errores resultantes

9. Adjudicar a diferencias mnimas de puntajes diferencias significativas en el rendimien


to de los examinados

10.No emplear el anlisis estadstico para controlar la eficacia de las pruebas.

111
PASOS PARA CONSTRUIR PRUEBAS DE APROVECHAMIENTO

Mara del C. Malbrn

1. Determinar los objetivos de la prueba (qu se desea medir)

2. Construir la Tabla de Especificaciones

3. Seleccionar y redactar los tems

4. Diagramar el texto

5. Preparar la clave de respuestas

6. Aplicar la prueba

7. Analizar los resultados


112
GUIA PARA LA CONSTRUCCIN
DE PRUEBAS DE APROVECHAMIENTO

Mara del C. Malbrn

1.Definicin de los objetivos de la prueba (Qu se desea medir)

Implica la relacin entre los objetivos de la prueba con los propsitos del curso.

Cuestiones vinculadas:
. Qu me propongo que los alumnos muestren?
. En qu contexto?
. Con qu grado de eficiencia para ser considerado aceptable?
. Qu clases de desempeo estn includas y cmo jerarquizarlas?
. Cmo ordenar las categoras para darles la secuencia ms apro
piada?
. Respeta la jerarquizacin y nfasis de la prueba lo enseado en
el curso?

2.Construccin de la tabla de especificaciones permite relacionar los objetivos con los


contenidos y determinar y jerarquizar los aspectos fundamentales que han sido ensea-
dos. Esquema que proporciona un fundamento til para desarrollar tems de prueba que
muestren representativamente el rendimiento deseado.

Ejemplos de categoras en el curriculum de ciencia:

I.- conocimiento y comprensin: de hechos especficos, terminologa, conceptos,


convenciones, tendencias, clasificaciones y criterios, tcnicas y procedimientos, leyes o
principios, teoras, identificacin en un nuevo contexto, traduccin de una forma simb-
lica a otra.

II.- procesos de la investigacin cientfica: observacin y medicin, descubrimiento


de un problema y bsqueda de las formas de resolverlo, interpretacin de datos y formu-
lacin de generalizaciones, construccin, puesta a prueba y revisin de un modelo teri-
co.

III.- aplicacin de conocimientos y mtodos cientficos.

IV.- destrezas manipulativas.

V.- actitudes e intereses.

113
VI.- orientacin hacia las relaciones de la ciencia con otros asuntos humanos.

Para la categorizacin del contenido: estructuras de aprendizaje.

3.Elaboracin y seleccin de las preguntas, tems o reactivos: lo que determina la


eleccin de la forma de la pregunta es el contenido. El nmero de preguntas debe adecuarse
a la importancia asignada a los temas. Una prueba demasiado corta es poco confiable.

Contenido del tem:


. Es trivial el contenido? (merece ser evaluado?)
. Enfatiza la memorizacin de hechos o detalles?
. Es especfico de acuerdo al grupo al que se destina?
. Es suficientemente significativo?
. Est correctamente ubicado en la secuencia de la prueba?
. Es adecuada su formulacin?

Estructura del tem:

. puede el examinado usar la informacin contenida en otro tem para


resolver ste?
. la forma elegida, es la ms adecuada?
. se presenta la informacin suficiente para resolverlo? Contiene in-
formacin superflua que no sirve para resolverlo? Es ambiguo? Pue-
de el examinado no resolverlo porque no est claramente expresado?
. la respuesta correcta es claramente una?
. no se suministran indicios para resolverlo sin conocer el contenido
que evala?
. congruencia gramatical
. subrayado de trminos
. nmero de alternativas
. repeticin de palabras

4.Diagramacin del texto: implica el cuidado en la presentacin para favorecer la lectu-


ra e interpretacin tanto del texto como de las grficas acompaantes.

5.Esquema de evaluacin o clave de respuestas: se prepara simultneamente a los


tems. Se prevn las respuestas que se considerarn correctas as como los puntajes par-
ciales que se asignarn a los distintos tems. Debern preverse las circunstancias o moda-
lidades de respuestas a las que se asignar algn valor.

6.Aplicacin de la prueba: relacin tiempo-cantidad de tems.

7.Anlisis de los resultados: grado de dificultad y poder de discriminacin. Conversin

114
a nota. Identificacin de los tems que deben ser eliminados, cambiados sustancialmente o
mejorados en posteriores ediciones de la prueba.

Anlisis de tems (para valores 1-0)

1. Ordenar las pruebas del puntaje ms alto al ms bajo.


2. Identificar los grupos superior e inferior.
3. Sumar el nmero de respuestas correctas por tem.
4. Dividir el nmero total de correctas por N y multiplicar por 100: ndice de dificul
tad.
5. Restar al nmero de correctas del GS el nmero de correctas del GI y dividir el
resultado
por el nmero de individuos del subgrupo: poder de discriminacin.
6. Analizar el nmero de respuestas por alternativa para ver cmo funcionaron (en
tems SM)

115
COMO SE PREPARA, APLICA Y EVALUA UN TEST

Autor: Gronlund, N.(cap. 6)

La preparacin final del test comprende revisar y redactar los tems ... disponer los
tems en cierto orden lgico ... y preparar instrucciones claras ... Despus que se ha
aplicado y calificado el test, los procedimientos de anlisis de tems pueden ayudar a
determinar la eficacia de cada uno de ellos.

Cuando se elaboran tems para un test particular es necesario, por lo general, prepa-
rarlos con una o dos semanas de anticipacin. Algunos maestros preparan diariamente unos
cuantos tems mientras an estn pensando en el material expuesto en clase. En cualquier
caso, la preparacin anticipada hace posible olvidarse de los tems por cierto tiempo, de
modo que se puedan revisar ms tarde desde una perspectiva ms fresca. Tambin es reco-
mendable preparar ms tems de los que pide una tabla de especificaciones por la probabili-
dad de que aparezcan defectos en algunos de ellos cuando se proceda a la revisin final. Los
tems extra facilitaran mantener la distribucin de ellos, determinada por la tabla de especi-
ficaciones. Si se tiene la fortuna de terminar con ms tems buenos de los que exija la tabla
de especificaciones, los tems extra se podrn archivar, en previsin de un uso futuro.

Durante la preparacin de los tems, se escribirn uno por uno en tarjetas diferentes
de 13 por 20 cm. Esto simplificar la tarea de revisar los tems, disponerlos en el test y
archivarlos para usarlos posteriormente. Gracias a esto, se dispondr tambin de un lugar
adecuado para registrar los datos del anlisis de tems, para cuando ms tarde se evale la
eficacia de cada uno de ellos.

Como revisar y redactar los tems

El conjunto de tems para un test particular, despus de haberse hecho a un lado por
cierto tiempo, puede ser revisado por el maestro que lo elabor o por uno de sus colegas. En
cualquier caso, es muy til leer cada tem y contestarlo como si se estuviera aplicando el
test. Se comprobar as la respuesta correcta y se revelar cualquier defecto obvio. Se pue-
de hacer una evaluacin ms cuidadosa de los tems, considerndolos a la luz de las siguien-
tes preguntas:

1.Mide cada tem un resultado importante del aprendizaje, incluido en la tabla


de especificaciones?

Cada tem debe relacionarse con una de las celdas de la tabla de especificaciones,
que se elabor originalmente para medir un aspecto del contenido de la materia y la conducta

116
del estudiante especificada en la tabla. Si en el momento en el que se elabor el tem, se
apreci la celda a la cual ste se refiere, entonces ser simplemente cuestin de leerlo y
volver a comprobar su propiedad. Las preguntas de ensayo y los tems objetivos de tipo
complejo, naturalmente, necesitarn comprobarse respecto de varias celdas de la tabla.

2.Es cada tipo de tem adecuado al resultado particular del aprendizaje que se ha
de medir?

Ciertos resultados del aprendizaje pueden medirse con cualquiera de los tipos comu-
nes de tems. En este caso, es preferible el tem de opcin mltiple. No obstante, puede ser
necesario el test de completacin o de ensayo cuando el resultado del aprendizaje pide que
se suministre la respuesta. De la misma manera, si solamente son razonables dos alternati-
vas, el tem verdadero-falso ser ms til o, si el resultado demanda que se relacionen una
serie de elementos homogneos, el ms eficaz ser el de correspondencia. La revisin de
tems permite otra comprobacin de la propiedad de cada tipo de ellos con respecto a los
resultados que se van a medir.

3.Presenta cada tem una tarea claramente formulada?

El problema presentado por un tem, cualquiera que sea su tipo, deber ser tan claro
y preciso que todos los estudiantes entiendan la tarea que se les pide. Las equivocaciones en
un tem debern obedecer a falta de conocimiento o de la capacidad intelectual exigida por el
mismo. Aunque la ambigedad es un problema de primer orden en la elaboracin de test, es
por fortuna una deficiencia que se hace patente cuando se realiza una nueva revisin de los
tems.

4.Est el tem redactado en lenguaje claro y sencillo?

Este punto se relaciona obviamente con el anterior, aunque aqu la atencin se dirija
ms directamente hacia el nivel de lectura del tem. Excepto por los trminos tcnicos que
constituyen parte necesaria del problema, el vocabulario debe seguir siendo sencillo. De la
misma manera, sern preferibles frases cortas en lugar de largas y complejas. Estos dos
factores pueden contribuir a que desaparezca la ambigedad, pero algo no menos importante
es que le dan al lector deficiente la oportunidad de que demuestre su nivel de aprovecha-
miento de manera ms adecuada. La capacidad de lectura es algo que vale la pena medir por
s misma, con todas las precauciones posibles para que no interfiera con la medicin de otros
resultados.

5.Est el tem libre de claves extraas?

Si bien no deseamos que un estudiante falle en un tem cuando posee el conocimien-


to que se est midiendo, tampoco queremos que lo resuelva con xito cuando no ha logrado
el aprovechamiento deseado. As pues, la revisin de los tems nos presenta otra oportunidad
de buscar en ellos las claves que podran permitirle al estudiante poco informado dar la res-
puesta correcta. Durante la revisin saltan a la vista frecuentemente las asociaciones verba-

117
les, las inconsistencias gramaticales y claves similares que se pueden pasar por alto fcil-
mente durante la elaboracin de los tems.

6.Es la dificultad del tem adecuada a los estudiantes que habrn de someterse al
test?

Los tems de pretest, los tests de diagnstico y los de dominio tienden a poseer grados
de dificultad relativamente bajos. No obstante, para los test de aprovechamiento general se
prefieren los tems de un 50% de grado de dificultad, es decir, los tems a los cuales la mitad
de los estudiantes responde correctamente. Como veremos ms adelante, el 50% de grado
de dificultad permite la discriminacin mxima entre los estudiantes de mayores puntuacio-
nes y los de puntuaciones menores. Aunque los juicios que de primera mano, hacemos acer-
ca de la dificultad del tem estn propensos a tener baja confiabilidad, puede estimarse en
parte la adecuacin de los tems para el grupo y as tambin disponerlos con arreglo a su
dificultad. Al revisar la dificultad de los tems, es recomendable tener en mente que la mayor
parte de los maestros tienden a equivocarse en cuanto elaboran tems demasiado fciles
para el grupo al que se han de aplicar.

7.Son los tems independientes entre ellos y, en tanto que grupo, estn a sal-
vo de traslaparse?

La respuesta a un tem no debe depender de que se conozca la respuesta de otro. As,


cada tem debe constituir una unidad calificable por separado. Los tems interdependientes
propenden a ocurrir especialmente cuando varios de ellos se basan en un conjunto comn de
materiales introductorios. Un problema muy relacionado con sto se presenta cuando la in-
formacin de un tem ayuda a determinar la respuesta para otro. Esto sucede muy frecuente-
mente con los tests que incluyen tanto tems de seleccin como tems de suministro. La
informacin proporcionada en los tems de seleccin a menudo presenta material auxiliar
para redactar las respuestas a los tems de suministro. Estos defectos se pueden remediar
fcilmente con una revisin general de los tems cuando se lleva a cabo la seleccin final.

8.Satisfacen adecuadamente la tabla de especificaciones los tems que se ha-


brn de incluir en el test?

La revisin, eliminacin y correccin de los tems puede producir un conjunto de tems


que se aparten notablemente de la tabla de especificaciones. De esta manera, puede ser
necesario volver a corregir algunos o elaborar nuevamente otros. En cualquier caso, se debe
hacer la seleccin final de los tems con arreglo a la tabla de especificaciones, para garanti-
zar as un muestreo adecuado de los resultados deseados del aprendizaje.

Adems de estas cuestiones generales aplicables a todo tipo de tems, las reglas para
elaborar cada tipo especfico tambin proporcionan criterios para evaluarlos. Por ejemplo, al
revisar los tems de opcin mltiple merecen atencin especial la integridad del problema
presentado en el pie, la inclusin de una respuesta que claramente sea la ptima y que las
respuestas de distraccin parezcan razonables. Inmediatamente antes de revisar el grupo de

118
tems puede ser de utilidad la preparacin de una lista de comprobaciones de los criterios,
basada en las reglas de elaboracin de cada tipo de tems.

Como disponer los tems

Cuando se ha completado la seleccin de los tems y stos ya estn listos para inte-
grarse al formato del test, ha llegado el momento de decidir cul ser la mejor forma de
ordenarlos:

1.se deben disponer los tems de modo que todos los de igual tipo queden den-
tro del mismo grupo

Un procedimiento bastante comn consiste en agrupar todos los tems de opcin ml-
tiple con los de verdadero-falso, los complejos, las preguntas de ensayo, y as sucesivamen-
te. Esta disposicin permite disponer de un conjunto especfico de instrucciones para cada
tipo de tems al principio de cada seccin del test. Puesto que el estudiante mantiene un
mtodo uniforme de responder a lo largo de cada seccin, tal disposicin contribuir tambin
a resolver eficazmente el test. Por ltimo, esto mismo tender a simplificar la calificacin y el
anlisis de los resultados.

2.los tems se deben disponer en orden de dificultad creciente.

Es deseable comenzar con tems fciles e ir aumentando gradualmente la dificultad a


lo largo del test. Esto tendr un efecto motivacional favorable en los estudiantes e impedir
que los menos preparados se atasquen con los tems difciles al principio del test. Como se
apunt previamente, nuestros juicios acerca de la dificultad del tem estn lejos de ser per-
fectos. No obstante, inspeccionndolos, se tendr una base para establecer de modo general
un orden de dificultad creciente. Cuando se han separado los tems de acuerdo con su tipo,
de la manera sugerida, lo mejor ser disponerlos dentro de cada seccin con arreglo a una
dificultad cada vez mayor y despus ordenar del mismo modo las secciones. Es decir, prime-
ro se ponen los tems sencillos (por ejemplo los de verdadero-falso y los de opcin mltiple)
y al final los tems ms complejos (por ejemplo, los ejercicios de tipo clave y las preguntas de
ensayo). Restringiendo el nmero de tipos diferentes de tems en un test particular, se facili-
tar la obtencin de un orden eficaz.

3.Para ciertos fines puede ser deseable agrupar los tems que midan los mismos
resultados del aprendizaje o el mismo contenido de la materia.

Es evidente que a un mismo test no se le pueden aplicar demasiados mtodos diferen-


tes de disponer sus tems. No obstante, como la mayora de los tests comprenden solamente
uno o dos tipos de tems, generalmente es viable seleccionarlos de acuerdo con los resulta-
dos del aprendizaje que se vayan a medir o con el rea de contenido de la materia. En el

119
primer caso, por ejemplo, se podran agrupar todos los tems de opcin mltiple de acuerdo
con las categoras taxonmicas (es decir, el conocimiento, la comprensin, la aplicacin,
etc.).
Tal disposicin satisfara el requisito del orden de dificultad creciente y sera til tanto para
diagnosticar las dificultades de aprendizaje de los estudiantes como para poner de relieve los
diferentes resultados del curso. En el segundo caso, se pueden agrupar todos los tems que
clasifiquen contenidos similares de la materia. Por ejemplo, los tems de historia se pueden
poner con arreglo a las pocas, los tems de biologa de acuerdo con clases de plantas o de
animales, y as sucesivamente. Aunque cualquiera de estos mtodos de disponer los tems
demuestre su utilidad en un test particular, se le debe dar preferencia al agrupamiento de los
tems del mismo tipo y al arreglo de estos respecto de su dificultad ascendente.

Como preparar las instrucciones

Las instrucciones de un test de aprovechamiento deben ser sencillas y concisas, apar-


te de contener informacin sobre lo siguiente: 1. el propsito del test, 2. el tiempo permitido
para completar el test, 3. la manera de registrar las respuestas y 4. si se ha de conjeturar o no
cuando se tengan dudas acerca de la respuesta. Las siguientes instrucciones de muestra,
relativas a un test de opcin mltiple, son ejemplo de cmo se cubren los cuatro puntos
mencionados.

Ejemplo

Instrucciones : Este es un test de lo que usted ha aprendido durante las primeras cinco se-
manas del curso. Sus resultados se utilizarn para esclarecer cualquier dificultad y as poder-
le ayudar a completar satisfactoriamente el curso.
Hay 60 tems de opcin mltiple y usted dispondr de una hora para completar el test.
En cada tem, elija la respuesta que complete mejor el enunciado o que responda mejor a la
pregunta y encierre en un crculo la letra correspondiente.
Como la calificacin que usted obtenga depender del nmero de tems que responda correc-
tamente, asegrese de responder a todos.

Cuando el mismo test comprende dos o ms tipos de tems, por lo general se reco-
mienda proporcionar instrucciones generales para la totalidad del test e instrucciones espe-
ciales para cada parte. Cuando se hace esto, las instrucciones generales debern contener la
informacin relativa al propsito del test, al tiempo disponible y a lo que se debe hacer res-
pecto de las conjeturas, al paso que las instrucciones especiales debern referirse a la mane-
ra de responder en las secciones particulares del test. Asimismo, algunos tems, como los
ejercicios de tipo clave, requerirn tambin instrucciones especiales.

120
El uso de hojas de respuestas presentadas por separado requiere cierta elaboracin
de las instrucciones para el registro de las respuestas. Si los estudiantes no estn familiariza-
dos con el uso de hojas de respuestas separadas, es recomendable presentar un tem de
muestra con la respuesta correcta marcada adecuadamente. Existen varios tipos de hojas
separadas de respuestas y las instrucciones especficas, claro est, necesitarn adaptarse al
tipo particular de hoja que se use. No obstante, a menos que se vaya a usar una mquina
para calificar, de ordinario ser satisfactoria una hoja de respuestas elaborada por el maes-
tro, en que simplemente aparezca una lista de las letras correspondientes a las opciones de
cada tem, como el siguiente ejemplo:

ITEM RESPUESTA
1. A B C D E
2. A B C D E
3. A B C D E
4. A B C D E

Con una hoja de respuestas de este tipo, las instrucciones debern pedirle al estu-
diante que marque con una X la letra correspondiente a la mejor respuesta. Tachar la res-
puesta es mejor que encerrarla en un crculo, ya que tales marcas son ms visibles a travs
de las perforaciones de una plantilla para calificar. Con este tipo de hoja de respuestas, la
preparacin de una clave de calificacin consiste solamente en perforar las letras correspon-
dientes a las respuestas correctas de cada tem.

El problema de responder al tanteo

En nuestras instrucciones de muestra, se inform a los estudiantes de Como su cali-


ficacin depende del nmero de respuestas, asegrese de responder a todas las preguntas.
Con esto se pretende igualar la variacin que se presente entre los estudiantes en su tenden-
cia a conjeturar cuando tienen dudas acerca de la respuesta. Tales instrucciones hacen inne-
cesaria la correccin por respuestas dadas al tanteo. Cuando los estudiantes responden a
todos los tems de un test, las puntuaciones corregidas y las no corregidas los colocan exac-
tamente en el mismo orden jerrquico. Solamente cuando el estudiante omite ciertos temes
del test, la correccin introduce una diferencia en el orden jerrquico.

Es punto controvertido el relativo a corregir las puntuaciones de los tems por las
respuestas dadas al tanteo, aunque tal controversia se presenta principalmente en relacin
con los tests estandarizados. Como los tests de aprovechamiento estandarizados contienen
por lo comn cierto material inadecuado al grupo que se somete a prueba, y como puede
suceder que no todos los estudiantes tengan la oportunidad de finalizarlo, es defendible la
prctica de advertir a los estudiantes que habr una penalidad para las respuestas dadas al
tanteo. Naturalmente, el propsito de sto es desalentar a los alumnos que pretendan mejo-
rar sus puntuaciones tratando de adivinar algunas de las respuestas. No obstante, tales ins-

121
trucciones no tienen un efecto uniforme sobre ellos. Es probable que el estudiante temerario
siga adivinando a diestra y siniestra en tanto que el estudiante ms cauteloso hasta renuncie
a responder con base a conjeturas apoyadas en un conocimiento aceptable.

En los tests informales de aprovechamiento, por lo general las puntuaciones no debe-


rn corregirse por respuestas al tanteo. El material del test est muy relacionado con las
experiencias de aprendizaje de los estudiantes y los lmites temporales son de ordinario sufi-
cientemente flexibles para permitirles que consideren cuidadosamente todos los temes del
test. En estas circunstancias, las respuestas conjeturales tienden a estar basadas en infor-
macin legtima. Aunque en ciertas condiciones sea objetable permitir que se den respuestas
al tanteo, esto es bastante similar a la conducta que se requiere para hacer inferencias,
identificar las causas y efectos probables de una accin, y en varios aspectos de toma de
decisiones en la solucin de problemas. De esta manera, responder al tanteo no es completa-
mente objetable desde el punto de vista educativo.

Puede haber ciertos cursos o unidades de stos en donde la precisin reciba tanta
atencin durante la enseanza que tambin sea deseable ponerla de relieve durante los test.
En este caso seran apropiadas las instrucciones de no responda al tanteo. Tambin seran
apropiadas en el caso de que se hiciera una prueba de velocidad, es decir, una en que los
estudiantes no tuviesen tiempo suficiente para considerar todos los temes. En ambos casos
se deber informar a los estudiantes que se aplicar una correccin por las respuestas dadas
al tanteo. Durante la calificacin se habr de aplicar la siguiente frmula de correccin por
respuestas al tanteo:

Puntuacin = Aciertos - Incorrectos


n1

En la frmula anterior, n es el nmero de opciones de cada tem. De tal manera, para


un test de opcin mltiple con tems de cuatro opciones, la frmula tomara la forma siguien-
te:

Puntuacin = Aciertos - Incorrectos


3

Para aplicar esta frmula de correccin por respuestas al tanteo, basta contar el n-
mero de respuestas correctas y el nmero de incorrectas que contenga una hoja de test e
incorporar estos nmeros a la frmula. No se cuentan los tems omitidos. As pues, si un
estudiante tiene 40 tems correctos y 6 incorrectos en un test de opcin mltiple de 50 tems
de cuatro opciones, su puntuacin corregida se computar de la siguiente manera:

40 6 = 40 2 = 38
3

En este caso se supone que el estudiante respondi al tanteo en 8 de los tems y logr
aciertos por azar (es decir, 2 correctos, 6 incorrectos). La frmula elimina simplemente a las

122
dos respuestas correctas que se pueden explicar por aciertos casuales en el tanteo.

Como reproducir el test

En el original que se emplear para la reproduccin del test, los tems debern estar
espaciados sobre la pgina de manera que sean fciles de leer y calificar. Si se usan tems de
opcin mltiple, las opciones debern enumerarse debajo del pie. Todas las partes de un tem
debern colocarse en la misma pgina. Para los tipos complejos de tems tal vez sea necesa-
rio presentar el material introductorio en la primera pgina o en una hoja independiente que
se debe proporcionar junto con el test.

Cuando las respuestas se deben dar sobre el mismo test se debern tomar medidas
para que se marquen las respuestas al lado izquierdo de la pgina. Esto simplifica la califica-
cin. Cuando se usan hojas independientes de respuesta y se administra el test a ms de un
grupo de estudiantes, de ordinario es necesario advertirles que no hagan marcas en los cua-
dernillos del test. Asimismo, una buena medida es hacer ms copias de las necesarias ya que
algunos estudiantes pasaran por alto tal advertencia.

Los test de aprovechamiento aplicados en la clase se reproducen generalmente en


duplicadora, fotocopiadora, offset, etc. Sea cual fuere el mtodo de reproduccin, el original
se debe comprobar cuidadosamente en lo tocante a disposicin de los tems, legibilidad,
precisin de los detalles de los esquemas o dibujos y carencia de erratas.

Cmo aplicar y clasificar el test

La administracin de un test de aprovechamiento informal cuidadosamente preparado


consiste principalmente en proporcionar condiciones propias para la tarea, reducir al mnimo
las interrupciones y disponer de un espacio suficiente entre los estudiantes para impedir que
se copien. Las instrucciones escritas deben ser suficientemente claras para que el mismo
estudiante pueda aplicarse el test, aunque en ciertas circunstancias sea recomendable que
las instrucciones tambin se den oralmente. Con estudiantes jvenes tambin puede ser til
recurrir a ilustraciones de pizarrn. Lo ms importante es asegurarse que todos los estudian-
tes sepan exactamente lo que deben hacer y proporcionarles las condiciones ms favorables
para ello.

La calificacin es ms fcil si se marcan todas las respuestas en el lado izquierdo de


cada hoja del test, como ya se indic arriba. En este caso, la calificacin consiste simple-
mente en marcar las respuestas correctas sobre una copia del test, colocando ste junto a las
columnas de respuestas de las hojas de los estudiantes. Si se utiliza una hoja independiente

123
de respuestas casi siempre lo mejor es perforar las letras de las respuestas correctas en una
copia de la hoja de respuestas y utilizarla como una plantilla de calificar. Esta se puede poner
sobre cada hoja de respuestas con lo que aparecern a travs de las perforaciones las res-
puestas correctamente marcadas. Cuando no aparece ninguna marca se puede dibujar una
lnea roja a travs de la perforacin. Esto le indicar al estudiante la respuesta correcta, que
no dio en cada tem. Si se emplea una mquina calificadora, simplemente se revisarn las
hojas de respuestas para asegurarse de antemano que solamente se marc una respuesta en
cada tem.

A menos que se introduzca correccin por respuestas dadas al tanteo, la puntuacin


que el estudiante obtenga en el test objetivo ser simplemente el nmero de respuestas mar-
cadas correctamente. As, cada tem se cuenta como un punto. Aunque los maestros frecuen-
temente se inclinan por darle mayor valor a ciertos tems que a otros debido a su importancia
o dificultad, tal ponderacin de las puntuaciones no hace que aumente la confiabilidad ni la
validez (Ebel, 1965). Por el contrario, lo nico que se consigue es complicar la tarea de
calificar y aumentar la posibilidad de error de calificacin. La mejor manera de aumentar el
peso relativo de un rea en la puntuacin total consiste en elaborar ms tems al respecto.

Cmo analizar los items

Despus de administrado y calificado el test, de ordinario es conveniente evaluar la


eficacia de los tems. Esto se hace estudiando las respuestas dadas a cada tem. El procedi-
miento, cuando est formalizado, recibe el nombre de anlisis de tems y nos da informacin
acerca de los siguientes puntos:

1. la dificultad del tem.


2. el poder discriminativo del tem.
3. la eficiencia de cada opcin.

De esta manera, la informacin del anlisis de tems nos puede decir si el tem fue
demasiado fcil o demasiado difcil, que tan bien discrimin entre los estudiantes con pun-
tuaciones altas y los estudiantes con puntuaciones bajas en el test, y si todas las opciones
funcionaron de la manera deseada. El anlisis de tems proporciona datos que ayudan tam-
bin a percibir fallas tcnicas especficas y, con ello, a obtener mayor informacin para me-
jorar los tems. Aun en el caso de que no se vayan a usar nuevamente los tems, el anlisis
de estos tiene ciertas ventajas. Primero, proporciona informacin til para analizar el test en
clase. Por ejemplo, los tems fciles pueden pasarse por alto o tratarse superficialmente; las
respuestas a tems difciles se pueden explicar con mayor detalle y se pueden sealar a los
estudiantes los tems defectuosos en lugar de defenderlos como si no lo fueran. En segundo
lugar, proporciona datos para ayudar a los estudiantes a mejorar su aprendizaje. La frecuen-
cia con que se elige cada respuesta incorrecta revela errores y conceptos equivocados comu-
nes que constituyen una ayuda para introducir correcciones en la enseanza. Tambin pro-

124
porciona ideas y capacita para la preparacin de mejores tests en ocasiones futuras.

Procedimiento simplificado de anlisis de tems

Se pueden aplicar diferentes procedimientos para analizar tems (Downie, 1967). Para
los tests informales de aprovechamiento usados en la enseanza solamente el procedimiento
ms sencillo parece justificable. Los siguientes pasos delinean un procedimiento simple y
eficaz. Para ilustrar los pasos, usaremos 32 hojas de test:

1. ordene las hojas de test (32 en total) desde la puntuacin ms alta hasta la ms baja.
2. seleccione aproximadamente la tercera parte de las hojas correspondientes a las califi-
caciones ms altas. Estas constituirn el grupo superior ( 10 hojas). Seleccione el mismo
nmero de hojas con las puntuaciones ms bajas. Estas constituirn el grupo inferior (10
hojas). Separe el grupo intermedio de hojas (12 hojas). Aunque este grupo podra incluir-
se tambin en el anlisis, usando solamente los grupos superiores e inferiores se simpli-
fica el procedimiento.
3. con cada tem, cuente el nmero de estudiantes del grupo superior que eligi cada
opcin. Haga lo mismo con el grupo inferior.
4. registre el nmero correspondiente al paso 3 en una copia del test, en columnas coloca-
das a la izquierda de las opciones a que se refiere cada nmero. El nmero tambin se
puede registrar, de la siguiente manera, sobre la tarjeta del tem o en una hoja indepen-
diente:

Item 1 Opciones A B* C D E

Superior 10 0 6 3 1 0

Inferior 10 3 0

* respuesta correcta

5. estime la dificultad del tem , determinando el porcentaje de los estudiantes que res-
pondieron correctamente a l. El procedimiento ms sencillo consiste en fundamentar la
estimacin solamente a los estudiantes incluidos en los grupos de anlisis de tems. As
pues, sume los totales de los grupos superior e inferior (10 + 10 = 20); sume los nmeros
de elecciones de la respuesta correcta (para el tem 1, de arriba, 6 + 2 = 8); divida la
primera suma entre la segunda y multiplique por 100, de la siguiente manera:

125
Indice de dificultad = 8 x 100 = 40
20

Aunque nuestro clculo se basa solamente en los grupos superior e inferior se aproxima
mucho a la estimacin que se obtendra con el grupo total. As pues, vale decir que el
ndice de dificultad de este tem es del 40% (para este grupo particular). Ntese que, como
la dificultad se refiere al porcentaje de veces que se responde correctamente al tem, un
porcentaje menor indica mayor dificultad del tem.

6. estime el poder discriminativo del tem , comparando el nmero de estudiantes de los


grupos superior e inferior que respondieron correctamente a l. Se puede apreciar en el
ejemplo anterior que 6 estudiantes del grupo superior y 2 del inferior eligieron la respues-
ta correcta. Esto indica discriminacin positiva puesto que el tem discrimina entre los
estudiantes de la misma manera que la puntuacin total del test. Esto significa que los
estudiantes con puntuaciones altas en los tests (grupo superior)acertaron en el tem ms
frecuentemente que los estudiantes con puntuaciones bajas (grupo inferior).

Aunque el anlisis por inspeccin puede ser todo lo que se necesite para la mayora
de los propsitos, se puede calcular fcilmente un ndice de discriminacin. Simplemente
hay que restar el nmero del grupo inferior, correspondiente a los estudiantes que acerta-
ron en el tem, del nmero del grupo superior, y dividir por el nmero correspondiente a
cada grupo. De tal manera, en nuestro tem de muestra, el clculo habr de ser as:

Indice de discriminacin = 6 2 = 0. 40
10

Ntese que el poder de discriminacin del tem se representa con una fraccin deci-
mal. El mximo poder discriminativo positivo se indica con un ndice de 1.00. Este se
obtiene solamente cuando todos los estudiantes del grupo superior eligen la respuesta
correcta sin que lo haga ninguno del grupo inferior. Respecto de los grupos de 10, supe-
rior e inferior, de nuestro ejemplo, la computacin del tem con mximo poder discriminativo
sera como sigue:

Indice de discriminacin = 10 0 = 1. 00
10

Se puede ver que el tem tiene un nivel de dificultad del 50% (acertaron los 10 del
grupo superior y fallaron los 10 del inferior). Esto explica por qu se recomienda a los
elaboradores de tests que preparen los tems con un 50% de grado de dificultad. Sola-
mente a este nivel es posible la discriminacin mxima.

126
Se obtiene un poder discriminativo nulo (0.00) cuando el mismo nmero de estudian-
tes de ambos grupos aciertan en el tem y el poder discriminativo negativo, cuando acier-
tan ms estudiantes del grupo inferior que del grupo superior. Ambos tipos de tems debe-
rn omitirse del test de aprovechamiento y habr que descartarlos o mejorarlos.

7. determine la eficacia de las respuestas de distraccin , comparando el nmero de


estudiantes de los grupos superior e inferior que eligieron cada opcin incorrecta. Una
buena respuesta de distraccin resultar atractiva para ms estudiantes del grupo infe-
rior que del grupo superior. As, con nuestros datos ilustrativos del anlisis de tems, en lo
que se refiere al paso 4, las opciones A y B funcionan eficazmente, la opcin C es defi-
ciente porque atrajo a ms estudiantes del grupo superior y la opcin E es totalmente
ineficaz por no haber sido atractiva para ninguno. Un anlisis de ese modo es til para
evaluar un tem y, cuando se le combina con la inspeccin del mismo, proporciona infor-
macin muy til para mejorarlo.

Los pasos anteriores del procedimiento para analizar tems se pueden modificar para
que se ajusten a situaciones particulares. En ciertos casos todo lo que se necesitar ser
una inspeccin de los datos en lugar de computar la dificultad y el poder discriminativo.
Asimismo, al seleccionar los grupos superior e inferior puede ser conveniente, si se trata
de un grupo numeroso, tomar el 25% superior y el 25% inferior, o en el caso de un grupo
pequeo, las mitades superior e inferior del grupo. Lo importante es utilizar una parte del
grupo lo suficientemente numerosa para que arroje informacin de utilidad. Con los tests
de aprovechamiento aplicados en la clase rara vez se justifica seleccionar el 27% inferior
del grupo (como se recomienda para un anlisis ms afinado) y aplicarles otros
afinamientos estadsticos.

127
Cmo interpretar los datos del anlisis de tems

Como se utiliza un nmero de estudiantes relativamente pequeo cuando se analizan


test aplicados en la clase, se debe interpretar muy cuidadosamente la informacin del anli-
sis de tems. Es de esperarse que tanto la dificultad como el poder discriminativo de un tem
varen de uno a otro grupo. As pues, no parece prudente determinar un grado mnimo de
poder discriminativo para seleccionar los tems o para distinguir entre ellos con base en dife-
rencias pequeas en cuanto a sus ndices de discriminacin. En igualdad de circunstancias,
debiramos preferir los tems con un 50% de grado de dificultad, e igualmente los que tengan
el mayor poder discriminativo. No obstante, la naturaleza provisional de nuestros datos de-
manda que permitamos un amplio margen de error. Si un tem proporciona un ndice positivo
de discriminacin, si todas las opciones funcionan eficientemente y si el tem mide un resul-
tado educativamente significativo, entonces deber conservrsele en el archivo de tems con
miras a usarlo en el futuro.

Cuando se archivan los tems y se vuelven a usar despus de cierto tiempo, es reco-
mendable registrar en la tarjeta correspondiente, cada vez que se le utiliza, los datos del
anlisis de tems. Si se coleccionan tales datos se podr observar la variabilidad de los ndi-
ces de dificultad y poder discriminativo del tem y, por tanto, ser ms fcil interpretar la
informacin.

128
Lecturas Complementarias

Downie, N. M. (1967). Fundamentals of Measurement. Nueva York: Oxford University Press


Cap. 10: Item Analysis.

Ebel, R. L.(1967). Measuring Educational Achievement. Englewood, Cliffs, N. J.: Prentice-


Hall, Inc. Cap. 7: How to Administer and Score an Achievement Test. Cap. 11: How to
Improve Test Quality Through Item Analysis.

129
CONSTRUCCIN DE PRUEBAS
Celia A. de Crsico

I.- Diagramacin.

II.- Esquema y clave de correccin.

III. - Aplicacin.

IV. Planilla con los resultados.

I. Diagramacin y edicin de la prueba

. Cmo ordenar y preparar los tems para su clara presentacin y fcil correccin.

. La correcta estructura de cada tem es ya el primer paso hacia una buena presentacin de la
prueba, requisito indispensable para que el texto pueda ser adecuadamente ledo y respondi-
do.

. Seguidamente se indican algunos de los aspectos ms importantes a tener en cuenta en la


diagramacin y edicin de las pruebas objetivas corrientes, elaboradas y administradas por
el profesor o maestro.

Tamao de la hoja

. El tamao ms conveniente es el oficio ya que si bien el de tipo carta es ms manuable,


resulta demasiado pequeo.

Uso de cartula

. Si la prueba se aplica a los alumnos de una clase bastar con destinar unos renglones de la
primera pgina para que cada sujeto escriba su nombre y la fecha correspondiente a la admi-
nistracin. Pero si se aplica a una muestra de sujetos cuyos antecedentes personales intere-
san para el anlisis de los resultados, se hace necesario dedicar una primera pgina para que
sirva de cartula, donde se soliciten todos los datos que el evaluador considere imprescindi-
bles.

130
Aprovechamiento de la pgina

. Debe establecerse la extensin ms conveniente para cada lnea escrita, cuidando que el
material resulte plenamente legible. Deben pues evitarse las lneas demasiadas extensas o
demasiadas cortas. Los tems deben ubicarse en columna dejando espacio suficiente para
que la respuesta pueda consignarse con claridad. Si se trata de respuesta constuda (escrita)
debe haber espacio para los trazos normales.

Identificacin de los tems:

. Siendo los tems unidades de puntaje deben llevar numeracin corrida. As el puntaje total
atribuido a un trabajo perfecto coincidir con el nmero de los tems de la prueba.
. Es probable que dos o ms tems formen parte de un mismo ejercicio. En una prueba puede
haber varios ejercicios que tambin deben ser identificados (aqu las convenciones pueden
ser nmeros romanos o letras maysculas).

. Las pginas deben numerarse para facilitar su ordenamiento y correccin.

Diferenciacin de los elementos del tem:

. Debe dejarse doble espacio entre el enunciado del tem y las alternativas que se presentan;
stas deben identificarse mediante letras minsculas.

. Si la prueba est constituida por una serie de ejercicios los espacios entre ellos debern ser
mayores que los que median entre los tems.

. Todas estas sencillas indicaciones, son algunas de las que habrn de tenerse en cuenta
para que la tarea resulte claramente perceptible tanto al examinado como al corrector.

II. Esquema y clave de correccin:

. La dificultad para construir un tem de prueba objetiva, depende ms del nivel de calidad
exigido que de la forma en que el tem se plasme. Tambin la dificultad est en relacin con
el tema que se trate. Por ejemplo los tems que miden memoria de hechos son ms fciles de
construir que los que miden comprensin.

. El problema capital en la construccin de tems es encontrar preguntas que posean una


nica respuesta.
A pesar de ese obstculo una de las razones ms importantes de la amplia difusin de las
pruebas objetivas, es la facilidad con que pueden ser corregidas.

. Los tems del tipo seleccin son ms fciles de corregir que los de respuesta construda.

131
. La clave de correccin debe buscar el esquema ms simple: a cada tem debe corresponder
un punto.

. Si se trata de un tem de cotejo o de algn otro tipo, cuya resolucin demande ms tarea por
parte del examinado, debe concebrselo como un ejercicio compuesto por tantos tems como
cuestiones se planteen.

. En el caso de los tems grficos a completar (esquemas, mapas, etc.) deben evitarse las
claves de correccin complejas, es decir aquellas del tipo. Si ubica todos los elementos: 10
puntos, si ubica todos menos dos: 8 puntos ..... y as sucesivamente.

. Si en lugar de un tem (un punto)se lo concibe como un ejercicio y se le asignan tantos


puntos a la ms de cinco o siete. La diagramacin de un ejercicio de esa naturaleza exige el
empleo de referencias para que la respuesta pueda consignarse en forma clara.

. Si se trata de un tem con blancos para llenar es conveniente, segn la importancia de la


tarea, asignar un punto a cada blanco llenado o con ms frecuencia a la totalidad del tem
correcto.

. Cuando no se usan hojas de respuesta la clave de valoracin ms sencilla consiste simple-


mente en la copia de la prueba con las respuestas marcadas o escritas. Cuando la correccin
se hace a mano puede ganarse bastante tiempo si se usa una tira de papel ms que la hoja
entera. Tambin puede ser muy prctico superponer una plantilla perforada que deja al descu-
bierto los espacios donde se registra la respuesta y lleva la clave correspondiente sobre cada
uno de ellos.

. Es imprescindible controlar las correcciones, las parciales y las totales pues en este sencillo
procedimiento de corregir y sumar se encuentra una fuente de errores.

III. - Aplicacin

. Si se quiere que el esfuerzo de construccin del test no se malogre y que la precisin de los
puntajes resulte viciada deben evitarse los errores en la administracin y en la correccin de
la prueba. Los resultados vlidos dependen de la precisin en la administracin y en la co-
rreccin.

. La comparacin vlida entre una prueba y otra, esto es el valor diagnstico de la prueba
para cada individuo, depende de la cuidadosa administracin y precisa correccin de toda la
prueba.

. En el proceso de la administracin de una prueba el evaluador debe tener en cuenta los


siguientes aspectos:

a) tiempo: establecer lmites.

132
b) condiciones ambientales.
c) motivacin.
d) consignar instrucciones.
e) efectos de la adivinacin.
f) correccin y control de la misma.

. Seguidamente se ofrece una breve consideracin de estos aspectos que por otra parte han
sido vastamente estudiados y difundidos.

a) El establecimiento de los lmites de tiempo:

. Cuando se trata de evaluar procesos complejos lo que ms suele interesar es


el nivel y no la rapidez del desempeo.

. En el mbito escolar se otorga ms importancia a la bondad de los trabajos


que a la rapidez con que se efectan, dentro de lmites razonables.

. Tericamente la extensin de la prueba y el lmite de tiempo deben ser deter-


minados a la luz de los propsitos con que ella se administra.

. Por ello resulta ms conveniente antes que estipular lmites de tiempo, esta-
blecer lmites de trabajo. As cuando el 80 o 90% de los alumnos han finaliza-
do puede considerarse oportuno dar por terminada la tarea.

. Para una prueba estandarizada es necesario la determinacin experimental


para fijar los lmites de tiempo ptimos.

. Para asegurar una cuidadosa observacin de los lmites de tiempo se suelen


emplear planillas donde el examinador consigna entre otros datos (en el caso
de pruebas divididas en dos o ms partes o secciones) la hora de iniciacin y
de finalizacin de cada parte.

b) Condiciones ambientales

. El ambiente de trabajo es otro de los requisitos que se consideran en la apli-


cacin de un examen o test, como ineludible para asegurar igualdad de oportu-
nidades a todos los alumnos.

. Las condiciones de iluminacin y acstica son necesidades obvias. Por otra


parte para asegurar la autonoma en el trabajo los alumnos deben estar ubica-
dos en bancos individuales y a cierta distancia unos de otros. De esta manera
se evitar la copia que puede anular la validez de las pruebas de respuesta
breve.

133
. El clima del trabajo no debe ser alterado por estmulos no pertinentes (tim-
bres, presencia de personas ajenas a la situacin de pruebas, etc.).

. El examinador deber atenerse a las consignas no haciendo comentarios in-


necesarios evitando adems la entrada o salida a destiempo de los alumnos.

c) Aspectos motivacionales.

. Una situacin de prueba es probable que est plagada de temores, ansieda-


des extremas, frustraciones y otros factores adversos a un buen desempeo.

. Se cree y con razn, que los puntajes de una prueba son infludos a veces en
forma muy significativa por la motivacin.

. Dentro de los aspectos motivacionales cabe mencionar el inters o el desin


ters por la prueba, el agrado o el desagrado y el nivel de ansiedad.

. El problema de la motivacin es sin duda muy complejo por el hecho de que


los individuos reaccionan ante los estmulos en formas muy distintas y an el
mismo individuo acusa distinta reaccin segn las circunstancias.

. Las condiciones de motivacin ms deseables son las que permiten que el


mayor nmero de individuos alcancen el mejor desempeo sin que se vean
afectados por excesivas tensiones emocionales.
Qu medios pueden usarse para controlar la motivacin?

. No hay duda de que la personalidad del examinador posee gran influencia en


el momento de la aplicacin de la prueba como en cualquier relacin docente-
alumno.

. Un recurso muy importante consiste en brindar a los examinados una infor-


macin lo ms clara posible acerca de los propsitos que se persiguen con la
prueba, es decir de las consecuencias que los resultados de su desempeo
tendrn.

d) Consignas o instrucciones.

. Dentro de las orientaciones previas es conveniente asesorar a los alumnos


para que sepan encarar adecuadamente su trabajo. Por ejemplo:

.atender cuidadosamente las instrucciones del examinador.


.leer cuidadosamente la prueba (los enunciados de cada tem).
.trabajar lo ms rpido que se pueda, sin detenerse con exceso en las

134
cuestiones que parecen insuperables.
.volver a ellas despus de haber concluido con las dems(cuando se trata
de una prueba de rapidez).
.no tratar de acortar por adivinanza si es que no se sabe nada acerca
de la pregunta, pues ello gravitar sobre su puntaje (si se hace correccin
por azar).
.contar con los elementos necesarios para el trabajo.
. las consignas para el trabajo en las pruebas corrientes construdas por los
profesores estn implcitas en los enunciados de cada tem, dado que se
supone que los alumnos estn familiarizados con la tarea.

e) Efectos de la adivinacin.

. Todo tipo de cuestin objetiva en que el sujeto debe elegir entre dos o ms
respuestas sugeridas, implica elementos de azar y de adivinacin. Es preciso
distinguir entre la adivinacin honesta y deshonesta. La primera es la que
se basa en un conocimiento, aunque sea parcial, del tema. La segunda es la
mera adivinacin con ignorancia total de la informacin.

. Las tcnicas utilizadas para atenuar los efectos de la adivinacin, sobre todo
en las pruebas homogneas del tipo seleccin mltiple, carecen de valor prc-
tico, cuando se trabaja con las tpicas pruebas de aprovechamiento escolar, en
que todos los estudiantes tienen oportunidad de leer y encarar todos los tems 1 .

f) correccin y control de la misma

. Corresponde aqu proceder de acuerdo con lo indicado en el prrafo relativo


a clave de correccin.

. Para asegurar precisin en los puntajes las correcciones deben ser controla-
das pues los errores de este tipo pueden invalidar los resultados.

. Los alumnos deben ser informados cuanto antes acerca de los resultados de
su desempeo (previo anlisis de la significacin de los puntajes y conversin
de los mismos a notas), pues ello constituye un verdadero refuerzo del apren-
dizaje.

1
Para una consideracin ms detallada vase: ADKINS WOOD DOROTHY: Elaboracin de test Psicolgicos.
Ed. Trillas 1965.

135
IV. Elaboracin de una planilla con los resultados:

Una vez corregida la prueba es necesario elaborar los resultados. En lo que sigue se
darn unas breves orientaciones para una primera aproximacin al anlisis de los tems o
reactivos, cuando el nmero de examinados es pequeo (alrededor de 30 casos).
Es preciso disponer las pruebas por orden de puntajes (de mayor a menor) como se indica
en la TABLA A.

TABLA A:

Item
Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 total

A 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 19

B 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 19

C 1 - 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 1 1 1 18

D 1 1 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 - 1 1 18

E 1 - 1 1 1 1 - 1 1 1 1 1 1 1 1 1 1 - 1 1 17

F 1 1 1 1 1 1 - 1 1 1 1 - - 1 1 1 1 - 1 1 16

G 1 1 1 1 1 1 - 1 1 1 1 - - 1 - 1 1 - 1 1 15

H 1 1 1 1 1 1 - 1 1 1 1 - - - - 1 1 - 1 1 14

I 1 1 1 1 1 1 - 1 1 1 1 - - - - 1 1 - - 1 13

J 1 - 1 1 1 1 - 1 1 1 1 - - - - 1 1 - - 1 12

K 1 - 1 1 1 1 - - 1 1 1 - - 1 - 1 1 - - 1 12

L 1 - - 1 1 1 - - 1 1 1 1 - - - - 1 - 1 1 12

M 1 1 - 1 1 1 - - 1 1 1 - - - - - 1 - - 1 12

N 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - 1 1 12

O 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - 1 1 12

P 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - - 1 11

Q 1 - 1 1 1 1 - - 1 1 - - - - - 1 1 - - - 10

R 1 - 1 1 1 1 - - 1 - - - - - - 1 1 - - - 9

S 1 - 1 1 1 1 - - - - - - - - - 1 1 - - - 8

T 1 - 1 1 1 1 - - - - - - - - - 1 1 - - - 8

U 1 - - 1 1 1 - - - - - - - - - 1 1 - - - 7

V 1 1 - 1 1 1 - - - - - - - - - 1 - - - - 5

W 1 - - 1 - - - - - - - - - - - 1 1 - - - 5

X 1 - - 1 - - - - - - - - - - - 1 - - - - 3

total 24 8 18 24 22 22 - 10 18 17 21 6 5 9 6 24 22 3 12 16

136
Una inspeccin a los datos consignados en la TABLA A revela que:

a) una prueba de 20 tems ha sido aplicada a 24 sujetos.


b) el puntaje 12 representa la mediana pues divide el total en el 50% superior y el 50%
inferior.
c) los tems 1,4 y 16 han sido contestados por todos los alumnos, es decir que han
resultado demasiado fciles.
e) el tem 7 no ha sido resuelto por ningn alumno (excesivamente difcil)
f) los tems 8, 19 y 20 permiten discriminar entre los mejores trabajos y los ms pobres.

Estas sencillas consideraciones permiten apreciar dos atributos fundamentales de los


tems a saber: su grado de dificultad y su poder discriminativo, que proporciona datos im-
prescindibles sobre la estructura de la prueba y al mismo tiempo contribuyen a precisar el
diagnstico sobre el desempeo del grupo.

137
LOS OBJETIVOS EDUCACIONALES.
ALGUNAS IDEAS CLAVES.

Fuente: Bloom,B., Hastings,J. y Madaus,G. (1975)


Evaluacin del Aprendizaje. Vol I. Troquel.
Sntesis: Claudia M. Villar.

. Deben diferenciarse los objetivos de las metas. Estas ltimas son ms amplias, a largo
plazo y se traducen en contenidos, programas y actividades.

. Los objetivos una vez que se han definido claramente, pueden convertirse en modelos o
planes que pueden plasmar u orientar la instruccin y los procesos de evaluacin.

. A los fines de la evaluacin significativa los objetivos deben enunciarse en trminos de


resultados o cambios fcilmente observables, para determinar si el alumno progresa o no
en el aprendizaje, pudiendo identificarse el grado o la medida de ese progreso e indagar las
razones del fracaso en caso de no evidenciarse cambio.

. En la redaccin de los objetivos se deben utilizar verbos que indiquen una accin o conduc-
ta a evualuar.

. Redactar o enunciar slo contenidos no describe la forma en que el contenido ha de ser


aprendido.

. Los temas o contenidos se utilizan para desarrollar habilidades y no deben convertirse en


fines en s mismos.

. Los objetivos educacionales nacen de metas amplias a largo plazo.

. Los objetivos a corto plazo no deben enunciarse en forma ambigua.

. Deben ser enunciaciones precisas, que indiquen cambios (conductas esperadas) en un rea
de contenido.

. Deben ser conductas claras que indiquen una forma de evaluar, no deben estar sujetos a
mltiples interpretaciones.

. Deben expresarse en trminos de conductas deseadas y delimitando un rea de contenido.

. Tales conductas se expresan operativamente a travs de verbos que implican una observa-
cin directa, describen lo que el estudiante hace para demostrar o evidenciar logros.

. Adems de la conducta y el contenido un objetivo puede precisar las condiciones y el grado


de precisin con que debe manifestarse la conducta esperada.

138
TAXONOMA DE LOS OBJETIVOS EDUCACIONALES
DOMINIO COGNITIVO
Fuente: Bloom,B y otros
Mara del C. Malbrn

Niveles de especificidad

1.00 CONOCIMIENTO 2.00 COMPRENSIN 3.00 APLICACIN 4.00 ANLISIS 5.00 SNTESIS 6.00 EVALUACIN

1.1.0 1.2.0 1.3.0 2.1.0 2.2.0 2.3.0 4.1.0 4.2.0 4.3.0 5.1.0 5.2.0 5.3.0 6.1.0 6.2.0 juicios
de especficos de forma y de universales y traduccin interpretacin extrapolacin de de de principios produccin produc- derivacin juicios en en funcin
modos de tratar abstracciones en elementos relaciones de de una cin de de un funcin de de
1.1.1 con especficos un campo 2.1.1 organizacin comunica- un plan o conjunto evidencias evidencias
de termino- de un cin nica conjunto de internas externas
loga 1.2.1 1.3.1 nivel de de ope- relaciones
de conven- de princi- abstrac- raciones abstractas
1.1.2 ciones pios y ge- cin a
de hechos neralizaciones otro
especficos 1.2.2
de tenden- 1.3.2 2.1.2
cias y de teoras y de una
secuencias estructuras forma
simblica
1.2.3 a otra
de clasifi- Relaciones posibles entre los niveles de la Taxo-
caciones y 2.1.3 noma de los objetivos educacionales de B.
categoras de una
forma Bloom. Dominio Cognitivo.
1.2.4 verbal a Una lectura del modelo.
de criterios otra

1.2.5
de
categoras
Evaluacin
Sntesis


Anlisis Modo de
operar con el
Aplicacin
Comprensin
conocimiento

CONOCIMIENTO
139
LOS OBJETIVOS COGNITIVOS:
SELECCIN, FORMULACIN, CLASIFICACIN Y EVALUACIN

Mara del C. Malbrn

Esquema para la utilizacin de la taxonoma de B. Bloom y colabo-


radores con fines de planeamiento y evaluacin

La taxonoma de B. Bloom y colaboradores comprende seis reas que se caracterizan


seguidamente:

1.0.0. CONOCIMIENTO
Habilidad para recordar-reconocer o evocar-ideas, hechos, criterios, etc., en una situacin
en la que se proporcionan ciertos datos indicios o claves que facilitan la recuperacin de la
informacin almacenada.
1.1.0 de especficos
1.1.1 de terminologa
1.1.2 de hechos especficos
1.2.0 de forma y modos de tratar con especficos
1.2.1 de convenciones
1.2.2 de tendencias y secuencias
1.2.3 de clasificaciones y categoras
1.2.4 de criterios
1.2.5 de metodologas
1.3.0 de universales y abstracciones en un campo
1.3.1 de principios y generalizaciones
1.3.2 de teoras y estructuras

2.0.0. COMPRENSIN
Habilidad para recibir significativamente el material comunicado.
2.1.0 traduccin
2.1.1 de un nivel de abstraccin a otro
2.1.2 de una forma simblica a otra
2.1.3 de una forma verbal a otra
2.2.0 interpretacin
2.3.0 extrapolacin

3.0.0. APLICACIN
Habilidad para usar abstracciones, reglas, principios, ideas, mtodos, en situaciones parti-
culares y concretas.

4.0.0. ANLISIS
Habilidad para fragmentar una comunicacin en sus elementos o partes constituyentes y
para jerarquizarlos.

140
4.1.0 de elementos
4.2.0 de relaciones
4.3.0 de principios de organizacin

5.0.0. SNTESIS
Habilidad para trabajar con partes, piezas elementos, etc., y combinarlos o reunirlos de
modo de formar un todo organizado y significativo o un nuevo patrn o estructura.
5.1.0 produccin de una comunicacin nica
5.2.0 produccin de un plan o conjunto de operaciones
5.3.0 derivacin de un conjunto de relaciones abstractas

6.0.0. EVALUACIN
Habilidad para formular o emitir juicios cuanti o cualitativos acerca del grado o extensin
en el que los materiales, mtodos, ideas, satisfacen determinados criterios.
6.1.0 juicios en funcin de evidencias internas
6.2.0 juicios en funcin de evidencias externas

141
Se proporcionan a continuacin ejemplos de conductas, contenidos, objetivos y actividades
de evaluacin correspondientes a las distintas reas y subreas previstas en la taxonoma.

CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE


TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN
1.0.0
CONOCIMIENTO

1.1.0
de especficos

1.1.1 Definir, seleccio- Vocabulario, trmi- Conocer el voca- Qu palabra significa


de terminologa nar, aparear, listar, nos, significados, bulario utilizado los mismo que...? Qu
n o m b r a r, d i s t i n - definiciones, refe- en las disciplinas anunciado define mejor
guir, recordar, enu- rentes, elementos. cuantitativas (en el trmino...? Qu
merar, reconocer, el trabajo cientfi- nombre recibe el proce-
denominar, repro- co, en contabili- so de...? En el siguien-
ducir. dad, etc.) te contexto, qu signi-
fica la palabra...?

1.1.2 Recordar, recono- H e c h o s , i n f o r m a - Conocer las pro- Dnde se encuen-


de hechos cer, identificar. cin sobre hechos piedades fsicas y tra...? En qu ao
especficos (fuentes, nombres, qumicas de los ocurri...? Cmo se
fechas, sucesos, elementos ms co- llama el...?Cul es la
personas, lugares, munes y sus com- caracterstica ms im-
perodos), propie- puestos. portante de...?Cul
dades, ejemplos, es la primera diferen-
fenmenos. cia entre...?

1.2.0
de formas y
modos de tratar
con especficos

1.2.1 Formas, usos, re- Identificar las ta- Cul es la forma co-
de convenciones glas, recursos, sm- reas del alfabeto rrecta de...?Cul de
bolos, representa- griego. Conocer los siguientes smbolos
ciones, formatos. las reglas de pun- se usa para...? Cul
tuacin. de las siguientes reglas
se usa para...?

1.2.2 Procesos, desa- Conocer las ca- Cul de los siguien-


de tendencias y rrollos, causas, re- ractersti cas del tes enunciados descri-
secuencias laciones, influen- d e s a r r o l l o be mejor la actual ten-
cias. ontogen-tico. dencia de ...? Cul
es la causa (o efecto)
ms importante de...?

1.2.3 Recordar, recono- Tipos, clases, con- Conocer las clasi- Cules son los prin-
de clasificacio- cer, identificar juntos, divisiones, f i c a c i o n e s d e l a c i p a l e s t i p o s d e . . . ?
nes y categoras jerarquizaciones. ciencia. Cmo clasificara...?

1.2.4 Fundamentos, pau- D i f e r e n c i a r u n a C u l e s e l c r i t e r i o


de criterios tas, elementos de pera de una sin- ms importante para
juicio. fona. seleccionar...?

142
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN

1.2.5 Tcnicas, enfo- Conocer los pro- Cul es la mejor ma-


de metodologa ques, usos, proce- cedimientos para nera de...? De qu se
dimientos, trata- construir pruebas compone el equipo ne-
mientos de rendimiento cesario para...?

1.3.0
de universales
y abstracciones
en un campo.

1.3.1 Proposiciones, Conocer las leyes Cal de los siguientes


de principios fundamentos, le- de reproduccin y enunciados ilustra el
y generaliza- yes. herencia. principio de...?
ciones

1.3.2 Formulaciones, Conocer la for- Cul enunciado es


de principios organizaciones, m u l a c i n d e l a ms consistente con la
y generaliza- modelos, interre- teora de la teora de...?
ciones laciones, bases. evolucin.

2.0.0
COMPRENSIN

2.1.0
Traduccin

2.1.1 Transformar, ex- Significados, sm- Expresar una Qu significa...?


de un nivel de presar en sus pro- bolos, abstraccio- cuestin o proble- Cal de los siguien-
abstraccin a pias palabras, nes, definiciones, ma tcnico en tr- tes trminos tiene un
otro. ilustrar, convenir. palabras, frases, minos menos significado similar
elementos. abstractos. a...?

2.1.2 P a r a f r a s e a r, r e - Convertir expre- Cul de los siguientes


de una forma p r e s e n t a r, c a m - siones simblicas enunciados contiene un
simblica a otra. b i a r, r e f o r m u l a r, en formas verba- ejemplo de...?
leer, ejemplificar les.

2.1.3 Formula en lengua-


de una forma je directo afirma-
verbal a otra. ciones no literales.

143
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN

2.2.0 R e o r d e n a r, d i f e - Ideas, relaciones, Identificar equvo- El enunciado supone


interpretacin renciar, distinguir, fundamentos, cos o ambigeda- q u e ... la
derivar, explicar, nuevos enfoques, des en un texto. afirmacin...significa
mostrar, ejemplifi- conclusiones, re- que...; entonces...
car. querimientos, m-
todos, teora, abs-
traccin.
2.3.0 E s t i m a r, i n f e r i r, Consecuencias, Predecir la conti- Cul es el efecto
extrapolacin concluir, predecir, implicaciones, nuidad de las ten- ms probable si
extender, interpo- conclusiones, ra- dencias observa- sucede...?Cul de
lar, completar, deri- mificaciones, co- das en... los siguientes
var, generalizar. rrelaciones, efec- enunciados podr
tos, probabilida- cumplirse si...
des.

3.0.0
APLICACIN Generalizar, rela- Principios, leyes, Utilizar las leyes Indique en cules de
cionar, elegir, de- conclusiones, de trigonometra los siguientes enun-
sarrollar, organi- efectos, mtodos, para resolver si- ciados se cumple...
z a r, e m p l e a r, teoras, situacio- tuaciones prcti- El procedimiento ms
t r a n s f e r i r, nes, abstraccio- cas. indicado para
restructurar, cla- nes, procesos, fe- Aplicar las leyes realizar...es...
s i f i c a r, c a m b i a r, nmenos, proce- de MENDEL a Marque las acciones
calcular, demos- dimientos. descubrimientos que deberan realizar-
t r a r, r e s o l v e r, de gentica vege- se para mejorar...
usar, manipular, tal.
modificar, prepa-
rar, producir.
4.0.0 ANLISIS

4.1.0 Diferenciar, distin- Hiptesis, conclu- Distinguir entre El autor de ... sostie-
de elementos g u i r, d e t e c t a r, siones, supuestos, hechos e hipte- ne que... Cul de las
identificar, clasifi- declaraciones (de sis. Distinguir una siguientes suposicio-
c a r, d i s c r i m i n a r, hecho, de inten- conclusin de las nes est apoyando di-
r e c o n o c e r, c a t e - cin), argumentos, afirmaciones que cho autor?
g o r i z a r, d e d u c i r, alegatos. la sustentan.
descomponer, sub-
d i v i d i r, s e l e c c i o -
nar.
4.2.0 Interrelaciones,
C o n t r a s ta r, c o m - Comprobar la Lea los anunciados y
de relaciones pertinencias, eviden-
pa r a r, d i s t i n g u i r, coherecia entre la elija la respuesta que
deducir. cias, falacias, argu- hiptesis y la in- explica mejor la rela-
mentos, alegatos, cau-
formacin dada. cin que existe entre
sas-efectos, consis-
Inferir el marco, ellos.Cul de los si-
tencias, ideas, formas
4.3.0 Distinguir, detec- propsito o punto guientes enunciados
patrones, propsitos,
de principios de tar, deducir, ilus- puntos de vista, de vista particular explica mejor la postu-
organizacin trar, inferir. sesgos (parcialida- en que se basa. ra de ...acerca de...?
des), arreglos.

144
CATEGORAS EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE EJEMPLOS DE
TAXONMICAS CONDUCTA CONTENIDO OBJETIVOS ACTIVIDADES DE
EVALUACIN

5.0.0 SINTESIS

5.1.0 C o m b i n a r, c a t e - Estructuras, pa- Improvisar un Escribir un ensayo,


produccin de gorizar, reescribir, trones, produc- discurso. poema, cuento,
una comunica- r e s u m i r, o r g a n i - tos, ejecuciones, Contar una expe- composicin musi-
cin nica. zar, reordenar, re- diseos, trabajos, riencia personal. cal.
l a t a r, o r i g i n a r, comunicaciones,
constituir. composiciones.

5.2.0 Proponer, planifi- Planes, objetivos, Proponer maneras Producir un plan para...
produccin de un car, producir, di- especificaciones, de comprobar una Disear un aparato con
plan o conjunto sear, modificar, esquemas, opera- hiptesis. el objetivo de...
de operaciones. componer, crear, ciones, formas, so- Disear un edificio Desarrollar una serie de
p r o y e c ta r, g e n e - luciones, caminos. segn indicacio- pasos para...
rar. nes.

5.3.0 Producir, desarro- Fenmenos,taxo- Formular hiptesis Proponer una hiptesis


derivacin de un llar, combinar, or- nomas, conceptos, apropiadas basa- para explicar...o un es-
conjunto de rela- ganizar, sintetizar, esquemas, teoras, das en el anlisis quema conceptual para
ciones abstrac- deducir, formular, relaciones, genera- de los factores im- clasificar hechos, su-
tas. modificar. lizaciones, descu- plicados. cesos.
brimientos, cami-
nos.
6.0.0
EVALUACIN

6.1.0 Argumentar, dis- Precisiones, con- Formular juicios Cules son las supo-
juicios en funcin cutir,validar, eva- sistencias, fala- sobre un documen- siciones implcitas
de evidencias in- l u a r, a p r e c i a r, cias, errores, grado to en funcin de la en...?
ternas. comparar, criticar, deexactitud, con- exactitud, preci- Indique los errores en
contrastar, funda- fiabilidad. sin, orden lgico ...segn...
mentar, explicar, con que ha sido
justificar, concluir. elaborado. Sealar
las falacias lgi-
cas de un razona-
miento.

6.2.0 Juzgar, argumen- Fines, medios efi- Distinguir entre la En que medida el
juicios en funcin ta r, c o n s i d e r a r, ciencia, economa, terminologa que da artculo...cumple con
de evidencias ex- discutir, comparar, utilidad, necesidad, precisin a un texto las normas de...?
ternas contrastar. cursos de accin, y aquella que sim- Cules de los princi-
plemente reempla- pios tericos
patrones, normas,
za un nombre co-
teoras, generaliza- de...pueden encontrar-
mn por otro esot-
ciones. se en la obra de...?
rico. Evaluar crtica-
mente ciertas
creencias sobre la
salud.

145
EVALUACIN DEL APRENDIZAJE EN LAS CIENCIAS
Propuestas para un esquema de categorizacin

Autor: Leopold E. Klopfer 1

A.0. Conocimiento y comprensin

Las conductas sugeridas por esta categora son, primero que el estudiante haya ad-
quirido la informacin especfica y, segundo, que pueda recordarla cuando se le pida que lo
haga y pueda demostrar comprensin de la informacin identificndola en un contexto nuevo
o sabiendo cmo manejarlo.

A.1. Conocimiento de hechos especficos. Ej. Una abeja obrera tiene seis patas.
La piedra caliza flota en el mercurio.

A.2.Conocimiento de la terminologa cientfica. Ej. La piedra caliza es un mineral.


En el hemisferio sur se denomina al 21 de marzo equinoccio otoal y al 21 de setiem-
bre equinoccio vernal.

A.3. Conocimiento de los conceptos de la ciencia. Incluye ideas cientficas limita-


das tales como densidad, difusin, simbiosis, etc. Como ideas ms amplias: ciclo, sis-
tema, fuerza, etc.

A.4. Conocimiento de convenciones. Se centra en el uso correcto de los signos, sm-


bolos, abreviaturas y prcticas en una disciplina cientfica para representar ciertas en-
tidades y relaciones incluyendo su interpretacin adecuada.

A.5. Conocimiento de tendencias y secuencias. Se refiere al ordenamiento que hace


el estudiante de los fenmenos conforme a la secuencia correcta de los mismos en su
aparicin en la naturaleza o bajo la manipulacin experimental. Ej. La accin del agua
subterrnea cida en las montaas de piedra caliza con el tiempo tiende a....

A.6. Conocimiento de clasificaciones, categoras y criterios. Ordenamiento de los


objetos y fenmenos conforme a las estructuras organizadoras establecidas por los cien-
tficos de una disciplina y su reconocimiento de las caractersticas o propiedades que
determinan la ubicacin de un objeto o fenmeno dentro de una categora particular.

A.7. Conocimiento de las tcnicas y procedimientos cientficos. Ej. Recordar y


describir cmo se determina el peso especfico del mercurio o cmo se estudia el creci
miento y divisin de las clulas en el cuerpo de una abeja obrera

1
En Bloom, B. S. Y otros Evaluacin del Aprendizaje. Tomo III. Cap. XVIII. Buenos Aires: Troquel, 1975.

146
A.8. Conocimiento de leyes o principios cientficos. Generalizaciones que los cien-
tficos derivan de un gran nmero de observaciones de fenmenos. Ej. Principio de
Arqumedes, leyes de Mendel.

A.9. Conocimientos de teoras o esquemas conceptuales principales. Alude al co-


nocimiento de las formulaciones ms abstractas de las ciencias, de las ideas organiza-
doras y explicativas de cada campo cientfico como la teora de la evolucin, el modelo
orbital del tomo, la teora general de la relatividad, etc.

A.10. Identificacin del conocimiento dentro de un contexto nuevo. Se aplica cuando


el estudiante puede identificar un hecho, concepto, procedimiento, esquema de clasifi-
cacin, principio, teora, etc. Cuando se presenta en un contexto diferente de aqul en
que se present la instruccin original.

A.11. Traduccin del conocimiento de una forma simblica a otra. Ej. Dada una
ecuacin qumica para cualquier reaccin, el estudiante la traduce en una afirmacin
verbal sobre la reaccin o dada una descripcin verbal de fuerzas existentes en una
situacin donde un caballo tira de una carreta por un camino escabroso, el estudiante
traduce esta informacin en un diagrama vectorial que muestra las fuerzas interactuantes.

B. 0. Procesos de la investigacin cientfica: observacin y medicin

B. 1. Observacin de objetos y fenmenos.

B. 2. Descripcin de las observaciones con el empleo de un lenguaje apropiado. Efica-


cia en la comunicacin de las observaciones.

B. 3. Medicin de objetos y cambios.

B. 4 . Seleccin de instrumentos apropiados

B. 5 . Estimacin de mediciones y reconocimiento de los lmites de la precisin.

147
C. 0. Procesos de la investigacin cientfica: descubrimiento de un
problema y bsqueda de las formas de resolverlo

C. 1. Reconocimiento de un problema. Abarca desde la conciencia del problema hasta


el descubrimiento de un problema especfico que puede investigarse experimen-
talmente.

C. 2 . Formulacin de una hiptesis de trabajo.

C. 3. Seleccin de pruebas adecuadas para una hiptesis. Implica la eleccin de un de


terminado enfoque emprico o una serie de experimentos que pueden verificar lgi-
camente si la hiptesis es correcta.

C. 4. Creacin de procedimientos adecuados para llevar a cabo comprobaciones experi-


mentales.

D. 0. Procesos de la investigacin cientfica: interpretacin de datos


y formulacin de generalizaciones

D.1. Procesamiento de datos experimentales. Se refiere a manipular, corregir y organi-


zar observaciones y mediciones.

D. 2. Presentacin de datos en forma de relaciones funcionales.

D. 3. Interpretacin de datos y observaciones experimentales.

D. 4. Extrapolacin e interpolacin.

D. 5. Evaluacin de una hiptesis sometida a prueba a la luz de los datos experimenta-


les obtenidos.

D. 6. Formulacin de generalizaciones justificadas por las relaciones descubiertas.

148
E. 0. Procesos de la investigacin cientfica: construccin, prueba,
revisin de un modelo terico.

E. 1. Reconocimiento de la necesidad de un modelo terico til para relacionar fenme-


nos diferentes y leyes o principios empricos. Se refiere a la aceptacin de la
construccin de la teora como una parte legtima de la investigacin cientfica.

E. 2. Formulacin de un modelo terico para dar cuenta de los fenmenos y principios


conocidos , entraa una sntesis del conocimiento para desarrollar una operacin
abstracta operando a un nivel ms alto de abstraccin para intentar formular una
exposicin ms amplia y general acerca de los fenmenos en un rea de la inves-
tigacin.

E. 3. Especificacin de los fenmenos y principios que son contemplados o explicados


por un modelo terico.

E. 4. Deduccin de nuevas hiptesis a partir de un modelo terico.

E.5. Interpretacin y evaluacin de los resultados de experimentos para probar un modelo


terico, implica anlisis de relaciones. Se analizan las relaciones entre la evidencia
emprica obtenida y la hiptesis sometida a prueba entre la evidencia emprica y el
modelo terico del cual se dedujo la hiptesis. Cuando se dispone de estos anlisis,
el estudiante formula un juicio acerca de la validez del propio modelo terico.

E. 6. Formulacin de un modelo revisado, perfeccionado o ampliado cuando est justifi-


cado por observaciones o interpretaciones nuevas. Cualquiera sea el camino que
siga la reformulacin, debe asegurar que el nuevo modelo satisfaga las funciones
correlativa, explicativa y heurstica y los criterios de parsimonia, elegancia y ca-
rcter persuasivo que se esperan de un modelo terico aceptable.

F.0. Aplicacin de conocimientos y mtodos cientficos

F.1. Aplicacin a nuevos problemas en el mismo campo cientfico.

F. 2. Aplicacin a nuevos problemas en otro campo de la ciencia.

F. 3. Aplicacin a problemas externos de la ciencia (incluida la tecnologa)

149
G. 0. Destrezas manipulativas (en trabajos de laboratorio)

G. 1. Adquisicin de destrezas en la utilizacin de equipos comunes de laboratorio.

G. 2. Ejecucin de las tcnicas comunes de laboratorio con cuidado y seguridad.

H. 0. Actitudes e intereses (rea afectiva)

H. 1. Manifestacin de actitudes favorables hacia la ciencia y los cientficos.

H. 2. Aceptacin de la investigacin cientfica como una forma de pensamiento.

H. 3. Adopcin de actitudes cientficas es decir, hbitos de pensamientos que caracte-


rizan a los cientficos cuando se dedican a la investigacin.

H. 4. Satisfaccin por las experiencias de aprendizaje de la ciencia.

H. 5. Desarrollo de inters por la ciencia y por las actividades con ella relacionadas.

H. 6. Desarrollo del inters por seguir una carrera cientfica o un trabajo relacionado con
ella.

150
I. 0. Orientacin Alude al desarrollo de la sensibilidad del estudiante hacia las relacio-
nes de la ciencia, otras reas del esfuerzo humano y otras formas de pensamiento.

I. 1. Relaciones y distinciones entre diversos tipos de proposiciones cientficas en las


que el estudiante toma conciencia de ellas cada vez que se dedica a la investiga-
cin y cuando retrocede para observar a la ciencia desde una perspectiva ms am-
plia.

I. 2. Reconocimiento de las limitaciones de la explicacin cientfica y de la influencia de la


investigacin cientfica en la filosofa general, esto es, relaciones entre el tipo de
pensar que practica en sus cursos de ciencia y las formas alternativas de construir el
mundo.

I. 3. Perspectiva histrica: reconocimiento de los antecedentes de la ciencia, el reconoci-


miento de que el desarrollo pasado, presente y futuro de la ciencia es un producto de
su propia historia y un reflejo de la cultura general de su poca, da al estudiante una
perspectiva histrica sobre la empresa cientfica.

I. 4. Conciencia de las relaciones entre la ciencia, la tecnologa y la economa o entre el


progreso cientfico, los logros tcnicos y el desarrollo econmico, alude a las rela-
ciones entre la ciencia y la cultura ms amplia en que florece.

I. 5 . Conciencia de las implicaciones sociales y morales de la investigacin cientfica.


Alude a las influencias sutiles de las ideas cientficas en los valores humanos y en la
percepcin que el hombre tiene del mundo.

En las categoras H e I las perspectivas que el estudiante adquiere sobre las relacio-
nes entre la ciencia y la cultura complementan y proporcionan algunos elementos cognitivos
esenciales para su visin personal de la relacin entre l y la ciencia.

Nota: se remite al lector al captulo original para un anlisis ms detallado del modelo y su
potencial empleo con fines de enseanza y evaluacin.

151
PRUEBAS DE RENDIMIENTO
CLASIFICACIN DE LOS TEMS

TIPOS DE
TEMS

ENSAYO R E S P U E S TA
BREVE

EXTENSO RESUMIDO SUMINISTRO SELECCIN

VERDADERO-
PREGUNTA B L A N C O S FALSO
PARA COMPLE-
SELECCIN MLTI-
TAR
PLE
COTEJO
ORDENAMIEN-
TO

R E S P U E S - R E S P U E S - MEJOR VARIEDAD
TA TA RESPUES- NEGATIVA
CORRECTA MLTIPLE TA
152
ASPECTOS A EVALUAR:
Items ms apropiados

ASPECTOS Ensayo Respuesta breve

1.Procesos cognitivos de alto nivel +

2.Tiempo que requiere prepararlos +

3.Habilidad para redactar +

4.Reduccin, adivinacin y azar +

5.Adecuado muestro aprovechamiento +

6.Objetividad para evaluar y asignar notas +

7.Reduccin efectos de dar rodeos +

8.Reduccin efectos de fluidez verbal, +


estilo, etc.

153
PRUEBAS ESCRITAS. CLASIFICACIN DE LOS TEMS

I. Items de respuesta construda

1.Variedad ensayo extenso


2.Variedad ensayo breve
3.Variedad respuesta breve
4.Variedad completamiento

II. Items de respuesta seleccionada

1. Reactivos verdadero-falso (dos opciones) y variedad racimo


2. Items de cotejo o emparejamiento
3. Items de seleccin mltiple

3.1. Variedad respuesta correcta


3.2. Variedad mejor respuesta
3.3. Variedad respuesta mltiple
3.4. Marcos para completar
3.5. Variedad negativa

4. Items de ordenamiento o jerarquizacin


5. Items complejos que combinan eleccin mltiple y jerarquizacin

154
EJEMPLOS DE TEMS VERDADERO-FALSO

. Todos los gases son ms livianos que el aire

. Un bote se hundir ms profundamente en el agua si pasa de un ro a un ocano

. El sonido puede ser transmitido a travs del vaco

. La velocidad de cada de los cuerpos varia directamente con sus pesos

. La cantidad de energa total del universo est en constante cambio

. El punto de ebullicin del agua depende de la presin atmosfrica

. Si el trueno sigue al relmpago con un intervalo de 10, el rayo debe haberse producido a
10 KM de distancia

. El uso del vapor revolucion los transportes del Siglo XVII

155
LOS TEMS VERDADERO - FALSO
Recopilacin de Mara del C. Malbrn

Los tems V - F no estn necesariamente limitados a evaluar el recuerdo del estudian-


te sobre detalles fcticos. Cuando esto sucede, la falla reside no en la forma, sino en el
contenido del tem. Las crticas relativas a la supuesta futilidad y ambigedad de los tems V-
F, se originan en parte por el hecho de que muchas veces los constructores intentan trasladar
de manera demasiado directa las expresiones de los libros de texto a los enunciados, o en
utilizar proposiciones que caen en la zona crepuscular que media entre la verdad y la false-
dad. Sin embargo, existen razones a favor de los tems V-F:

. la esencia del rendimiento educacional reside en el dominio de conocimientos verbales


tiles;
. todo conocimiento verbal puede expresarse en proposiciones;
. una proposicin es un enunciado del que puede establecerse su verdad o falsedad;
. el grado de dominio de un estudiante sobre determinado sector de conocimiento est
indicado por su capacidad de juzgar la verdad o falsedad de las proposiciones relacio-
nadas con l.

Para ser incluidas como tems de prueba, las proposiciones deben poseer las siguientes ca-
ractersticas:

. su dominio resultar esencial, no incidental, en el rea que se trate;


. puedan defenderse como una proposicin verdadera;
. no resulten obvias para cualquier persona con sentido comn o informacin general.

Los enunciados a ser utilizados en tems VF pueden ser de distintos tipos:

. fcticos (las preguntas que utilizan Quin? ; Qu? ; Cundo? ; Dnde? ; usualmente
aluden a informacin fctica);
. generalizadores (la mayor parte de ...; muchos ...);
. comparativos (la diferencia entre ...; ambas ...);
. condicionales (si ...; cuando ...);
. relacionales (cuando mayor ...; cuanto ms alto ...; la medida en que ...);
. explicativos (la principal razn ...; el propsito de ...; uno de los factores que ...; dado
que ...; aunque es ...);
. ilustrativos (un ejemplo de ...);
. basados en evidencias (los estudios sobre ... demuestran que ...);
. predictivos (puede esperarse que ...);
. metodolgicos (para poder ...; un mtodo para asegurar ...; un paso para ...; el empleo
de ...; al realizar ...);
. de clculo o estimacin (para la serie ... el elemento que sigue...);
. evaluativos (es mejor ...; es posible demostrar ...; la principal limitacin ...)

156
LAS RESPUESTAS DE TIPO ELECCIN MLTIPLE
Celia A. de Corsico

Las preguntas de tipo eleccin mltiple son las que reciben mayor aplicacin en las
pruebas educativas, pues se usan junto a diagramas y mapas, etc., como en relacin con
problemas verbales y numricos. Por su intermedio, pueden medirse no solo informacin
consistente en el manejo de hechos, sino tambin razonamientos o interpretaciones muy
elaborados. En el tipo de mejor razn, por ejemplo, las alternativas que se proporcionan
pueden estar dispuestas gradualmente de acuerdo con su carcter de ms o menos razona-
bles; pero solamente una respuesta deber ser la enteramente correcta. As mismo, en los
test de cotejo, se puede requerir que los examinados apliquen una serie de principios a una
serie de problemas. Sin embargo, se necesita proceder con mucho cuidado en la construc-
cin de preguntas de esta clase y los siguientes consejos pueden resultar tiles.

(a) El tipo de eleccin mltiple no debera ser usado, en los casos en que las preguntas
simples de repeticin, fueran las adecuadas, es decir cuando hay una sola respuesta
definitivamente correcta para la pregunta. Por ejemplo, sera una prdida de tiempo ex-
presar los problemas aritmticos de la siguiente manera:

3 x 28 = 1; 1; 1 1 ; 2
7 6 2

Por cierto los problemas matemticos se expresan mejor en forma abierta que en forma ce-
rrada, dado que estas ltimas solicitan al examinado invertir el orden de la tarea y volverse
desde las respuestas dadas hacia la pregunta, tratando de hallar la respuesta adecuada.

(b) Todas las respuestas proporcionadas deben ser suficientemente plausibles como para
que un grupo considerable de sujetos las seleccionen, de lo contrario no tiene objeto
incluirlas en la prueba. Las alternativas incorrectas, pueden construirse sobre la base de
las falsas concepciones y errores que el examinador haya advertido prevalecen entre los
examinados. A veces suele ocurrir que los examinados de menor rendimiento seleccio-
nan las respuestas que contienen varias palabras o frases idnticas a las palabras o fra-
ses que figuran en el enunciado introductorio.

Sin embargo, tanto las respuestas correctas como las incorrectas, deberan ser homog-
neas en su construccin (modo de expresin, extensin y otras caractersticas externas).
Si la respuesta correcta es siempre la ms larga o la ms corta que las incorrectas el
examinado puede descubrir esto y emplearlo en su ventaja.

(b) Cada respuesta debera ser analizada para despejar la presencia de posibles claves,

157
que induciendo al sujeto en forma directa hacia la respuesta acertada, le eviten el esfuer-
zo de reflexionar sobre el problema planteado y desvirten de este modo el propsito de
la pregunta. Por ejemplo, cada una de las respuestas deben concordar gramaticalmente
con la pregunta. Esto se hace necesario especialmente en los tests de cotejo. Algunos
autores incluyen en un mismo conjunto, tems tan heterogneos que los examinados pue-
den estar en condiciones de distinguir las respuestas correspondientes, sin poseer el menor
conocimiento real del tema. El que sigue es un ejemplo extremo e hipottico de un mal
tem, que aunque supone poner de manifiesto el conocimiento de trminos geogrficos,
podra ser respondido correctamente, procediendo tan solo por inferencia.

a)Una lnea geogrfica a lo largo


de la cual las presiones atmosf- Vertiente ..........
ricas son iguales.

b) Lagos escoceses o mares interiores Monzones ..........

c) Una porcin elevada de tierra desde


la cual los ros fluyen en dos o ms Isobara ...........
direcciones.

d) Lneas de un mapa que muestran las


alturas por sobre el nivel del mar o Lochs ..........
por debajo del mismo.

e) Vientos que soplan en el Ocano


Indico, durante ciertas estaciones. Lneas
Isomtricas ...........

Lneas isomtricas debe ser (d) porque Lneas se menciona en (d).

Monzones y Lochs, deben ser (b) y (e) dado que son los nicos que quedan en plural.
Es poco probable que la palabra Monzones haya sido ubicada tan prxima a su enunciado
correspondiente; adems la palabra Lochs se parece mucho a lago. De manera que Lochs
debe ser (b). En cuanto a (a) y (c), aluden a lneas geogrficas y ros respectivamente, por lo
tanto isobara y vertiente se adaptan a ellas.

El examinador deber recordar que una prueba de cotejo es una prueba de extensin
de las de eleccin mltiple, y que por lo tanto debera verse que para cada tem que figura en
una columna, haya al menos tres tems (es preferible que sean cuatro o ms) en la otra
columna que constituyan respuestas posibles.

(c) No es raro que se pueda obtener un tem mejor convirtiendo en respuesta una pregunta
parcialmente formulada, y transformando en pregunta la respuesta correcta. Por ejemplo:

158
La figura literaria que consiste en reducir el nmero de trminos de un enunciado, se denomi-
na:

Meiosis ...............

Hiprbola ...............

Eufemismo ...............

Metfora ...............

La pregunta anterior puede ser formulada de la siguiente manera:

La meiosis denota:

La reduccin de trminos de un enunciado ...............

Una exageracin de la expresin retrica ...............

La sustitucin de una expresin ofensiva ...............


por otra agradable

Un smil imaginativo ...............

Probablemente la segunda forma requiere una comprensin ms plena del asunto que
la primera. Una tercera, y tal vez mejor forma para esta pregunta, sera un conjunto de frases
que exigiera la aplicacin y no meramente la posesin del conocimiento; un conjunto de
frases entre las cuales el examinado debera seleccionar aquella que mostrara meiosis. En
general, el examinador debera estudiar cada tem, en un intento por anticipar todos los pro-
cesos mentales por cuyo intermedio se puede alcanzar la respuesta correcta. Si algunos de
esos procesos no es representativo de la habilidad que desea medir, debera modificar el
tem.

(e)Todos los enunciados y respuestas deben ser lo ms sucintos posibles, y al mismo tiempo,
altamente precisos. Las preguntas muy complicadas o expresadas en lenguaje frondoso, pue-
den depender ms (para su correcta respuesta) de la inteligencia y habilidad para la lectura
que posea el examinado, que de su real conocimiento del tema.

(f) Dentro de las series de respuestas que se brinden, la posicin de la correcta debe estable-
cerse al azar para evitar otra posible indicacin ajena a los propsitos de la prueba.

159
II) Las preguntas del tipo repeticin simple y abierto para com-
pletar.

Una pregunta o un problema breves son seguidos de un espacio en blanco donde debe es-
cribirse la respuesta. Tambin pueden emitirse ciertas palabras o frases breves en una ora-
cin o prrafo, dejando espacios en blanco para ser llenados.

Ejemplos.

1. a) Quin fue el inventor de la mquina a vapor?................................................................

1. b) El inventor de la mquina a vapor fue...........................................................................

2. S y 2 X 3 + 9 + 3, como es dy ?.................................................................................
X dx

3. la ley de Ohm dice........................................X Resistencia...........................................

4. Cuando una sal se disuelve en el agua las molculas se dividen en ....................................


la carga elctrica positiva es llevada por los ...................una carga negativa por los.............,
tiene lugar una accin equilibrada por medio de la cual XY=...............................la
teora..............................proporciona una aplicacin de la ................................de la elec-
tricidad por las soluciones de la sal.

5. Un test geogrfico puede consistir en un mapa en el que figuren slo nmeros y no se den
los nombres. Debajo se colocan dichos nmeros en columna y se le pide al examinado que
escriba el nombre correspondiente junto a cada nmero. La misma tcnica puede ser usada
para probar el conocimiento de las partes de algn instrumento, mecanismo o espcimen
biolgico.

Cada respuesta correcta recibe un punto.

Ventajas: Naturalidad, semejanza con preguntas corrientes; estar libre de los efectos casua-
les de adivinacin que se producen en los tems cerrados o de reconocimiento; facilidad con
que pueden ser construidos. (Esta facilidad puede ser ilusoria).

Desventajas: limitado al conocimiento memorstico y a las habilidades en problemas aritm-


ticos o cientficos simples.

160
Consejos para su construccin

a) tratar de preguntar acerca de aspectos importantes del conocimiento.


b) estar seguro de que hay slo una respuesta correcta posible, y por lo tanto limitar las
respuestas a simples palabras o nmeros o frases breves. Si hay probabilidad de que se
presenten alternativas, el examinador deber tenerlas en cuenta de antemano y decidir
cul de ellas ser la correcta. Para el examinador ser ms fcil pensar primero en la
respuesta y luego construir alrededor de ella la pregunta u oracin, de forma tal que la
respuesta quede completamente delimitada.
c) las preguntas deben ser breves. No deben ser ambiguas. Evitar una excesiva mutilacin
de una frase completa por la insercin de demasiados espacios en blanco. Una oracin a
completar debe ser considerada como una pregunta. Por lo tanto dejar las palabras sufi-
cientes como para que la pregunta sea inteligible. No dejar blancos muy al comienzo, que
slo puedan responderse consultando el resto del trozo o los prrafos siguientes; la ma-
yora de los blancos debe estar al final.
d) estudiar el contenido de la oracin o pregunta para ver que todo sea esencial para la
produccin de una respuesta correcta. En tems mal construdos la respuesta puede de-
ducirse simplemente por el ejercicio de la inteligencia y sin conocimiento del tema. En
otros la respuesta puede estar dada ms adelante, o puede haber indicios en la misma
construccin gramatical.

Ejemplo:

6. Una porcin de tierra enteramente rodeada de agua es una .................................................

Puede superarse la dificultad escribiendo un/a ....................................................................


e) No variar el tamao del espacio en blanco de acuerdo con la extensin de la respuesta
esperada; sto dara claves. Cuidar que quede espacio para los alumnos de letra grande.
f) Para facilitar la evaluacin las respuestas deben anotarse sobre el margen derecho. Una
solucin es:

Escriba el nombre del autor de cada una de las siguientes obras:

7) Pigmalion 7).............................

8) La voz humana 8).............................

III) Las preguntas del tipo verdadera-falso.

Generalmente constan de un conjunto de enunciados de los cuales aproximadamente la mi-


tad es verdadero y la otra mitad es falso.

El sujeto debe marcar cules son verdaderos y cuales falsos.

161
Se puede pedir tambin que el sujeto tache o subraye la palabra que este mal escrita.

Los tems verdadero- falso se usan mucho en todas las materias porque ayudan a hacer un
muestreo rpido y porque es fcil construirlos.

Pero se han ido abandonando por efectos de la ADIVINACIN y errores insospechados. Algu-
nos recomiendan que se los use slo cuando no se puede aplicar los de eleccin mltiple.

No es necesario restringir el uso de estos tems a la informacin de memoria; pueden expre-


sarse de esa forma cuestiones de principio general o de interpretacin.

Se deben tener en cuenta los siguientes principios para su construccin:


Los enunciados tienen que ser simples, pues de lo contrario pueden tener secciones que sean
verdaderas y otras falsas.

En general es preferible usar oraciones que incluyan una sola idea; enunciarla positivamente
y cuidar de no incluir negaciones ni el uso de porque o por lo tanto.

La parte crucial del enunciado, que lo hace verdadero o falso, debe ir al final.

No deben ser evidentemente verdaderos ni evidentemente falsos. Los verdaderos deben te-
ner apariencia de falsos, tal como los falsos deben tener apariencia de verdaderos.

Al mismo tiempo, deben ser netamente verdaderos o falsos para el estudiante bien informa-
do. No deben tener trucos, pues el estudiante se fijar en los aspectos esenciales y no en
detalles secundarios.

Se ha establecido que ciertas verbalizaciones son ms aptas para ser usadas en los tems
verdaderos que en los falso o viceversa.

Los examinados pronto reconocen que la gran mayora de los tems que contienen TODOS-
SIEMPRE- NUNCA- IMPOSIBLE, son falsos. La mayora de los que contienen POR LO GE-
NERAL- A MENUDO, son verdaderos.

La mayora de los enunciados largos tienden a ser ms verdaderos que falsos. Hay que
aprender a usar con cautela las experiencias anteriores o introducirlas con la misma fre-
cuencia tanto en los verdaderos como en los falsos.

Si el nmero de enunciados es menor que 20, hay que cuidar que no sean exactamente 10
verdaderos y 10 falsos, porque los alumnos tienden a tomar en cuenta este punto de referen-
cia.

El orden en que aparezcan los enunciados debe ser enteramente al azar. Si el examinador
nunca ubica ms de dos enunciados verdaderos o falsos en forma consecutiva, el examinado
lo advierte.

162
Una forma es arrojar una moneda. Si cae cara tomar el tem verdadero ms fcil y ponerle
el nmero 1. Si las cuatro siguientes son cruces ubicar los cuatro tem falsos ms fciles
con los nmeros de 2 a 5 y as sucesivamente.

Manera de registrar:

Subrayar las palabras VERDADERO- FALSO o SI- NO, dibujar un crculo alrededor de las
letras V o F, o escribir las letras V o F. Uno de los ms simples y satisfactorios es usar + o
en un espacio en blanco al final del enunciado. Los espacios es conveniente que se alineen a
la derecha.

Se debe aplicar la correccin para la adivinacin y se debe advertir esto a los examinados en
las instrucciones generales antes de comenzar con el test.

163
LAS PREGUNTAS DE ELECCIN MLTIPLE

Tipo mejores razones y cotejo de tems

Celia A. De Crsico

Puede distinguirse un gran nmero de variedades de este tipo, figurando a continuacin ejem-
plos de las ms importantes.

I.El nmero de las respuestas alternativas es por lo comn de cinco, pero pueden
variar entre tres y siete, o an entre dos y siete, de acuerdo con el nmero de posibi-
lidades implcitas en la pregunta. Las preguntas con seis o siete respuestas ocupan
demasiado espacio. Las preguntas con dos o tres respuestas deberan evitarse por-
que requieren la correccin de los factores de azar (guessing correction). Es conve-
niente, aunque no necesario, que en una misma prueba, se proporcione el mismo
nmero de respuestas para todas las preguntas.

II.Cuando las respuestas consisten en una sola palabra, stas pueden ser impresas en
una sola lnea en forma consecutiva (pueden ir incluidas entre parntesis). Se instru-
ye al examinado para que subraye la palabra correcta, dentro de cada uno de los
conjuntos de palabras que figuran entre parntesis.
Cuando las respuestas constan de varias palabras o frases, el subrayado resulta per-
turbador, tanto para el examinado como para el que examina. Las respuestas pueden
estar impresas y numeradas en forma consecutiva, y el examinado debe escribir el
nmero de su eleccin en el espacio en blanco. Por ejemplo:

-Cul es la funcin del nervio sacro, dentro del sistema nervioso autnomo?

(1)- Aumentar la circulacin y la respiracin.


(2)- Controlar las posturas y movimientos de los miembros.
(3)- Aumentar la actividad de los rganos de reproduccin.
(4)- Contraer los esfnteres y los rganos excretorios.
(5)- Inhibir la actividad del canal de alimentacin.
..............3....................

No obstante este tipo de pregunta resulta de difcil lectura. De ah que sea ms reco-
mendable disponer todas las respuestas en una columna, y pedir al examinado que
trace una cruz en el espacio en blanco que acompaa a la respuesta correcta, aunque
ste ltimo mtodo insume mucho espacio. El tem puede enunciarse en forma de
pregunta o de frase a completar.

164
III.En el tipo de la mejor razn se instruye al examinado para que identifique entre un conjun-
to de razones a la mejor de ellas para un cierto enunciado. A veces, un tem ms
adecuado puede consistir en encontrar la peor de las razones. Por ejemplo:

.Muchas investigaciones indican que la inteligencia de los nios se halla influda por
el ambiente y la educacin. Cul de las siguientes razones es la que proporciona la
evidencia ms pobre para esta conclusin?

La correlacin entre la inteligencia de los hurfanos y sus padres


es menor que la que existe entre los nios y sus padres, cuando
stos los han criado

..........................

La diferencia entre los C.I. de pares de mellizos idnticos es ms


alta entre los que han sido criados por separado que entre aque-
llos que han sido criados juntos.

...........................

Los nios que han sido sometidos a tests antes de ser ubicados
en hogares adoptivos, y que son vueltos a testar varios aos
despus, muestran un aumento mayor en su inteligencia cuando
han sido criados en hogares de ms alto nivel socioeconmico.

.........................

El trmino medio de los nios de padres profesionales, muestran


una inteligencia marcadamente superior a la de los hijos de obre-
ros no calificados.

...........................

165
IV.En lugar de una, pueden ser dos o tres las respuestas correctas. Las instrucciones
deben darse en forma absolutamente clara. Por ejemplo:

-Ponga una cruz al lado de dos de los siguientes pintores ingleses que se han hecho
especialmente famosos por sus paisajes:

Constable ............... Reynolds ...............

Hogarth ............... Romney ...............

Lawrence ............... Turner ...............

-Ponga una cruz al lado de una sola de las respuestas. Sir Thomas Brown es famoso
como autor de:

Obras de ficcin ...............

Obras de teatro ...............

Poesa ...............

Crnicas de Viaje ...............

Ninguna de stas ...............

V.El mismo conjunto de respuestas puede aplicarse a varias preguntas. Por ejemplo:

-Identifique los siguientes instrumentos orquestales, dibujando un crculo alrededor


de C para cuerdas, M para maderas, B para cobres y P para percusin:

1. Clarinete C M B P

2. Tringulo C M B P

3. Timbales C M B P

4. Corno Ing. C M B P

5. Corno Franc. C M B P

166
VI.Los tests de cotejo son una extensin de la categora anterior. Las preguntas y las
respuestas se ubican en dos listas que llevan un orden diferente. Por ejemplo:

-A la izquierda hay una lista de Tratados o Paces, a la derecha una lista de desarrollos
histricos que se asocian con dichos Tratados. Despus de cada uno de dichos desa-
rrollos, escriba la letra que corresponde al Tratado con que se vincula el suceso. Ad-
vierta que no es necesario que use todas las letras y que algunas de ellas pueden ser
usadas dos veces.

(a) Berln La quiebra del imperio napolenico .g..

(b) Frankfort Se establece la liga de las Naciones .f..

(c) Pars Alemania Anexa Alsacia y Lorena .b..

(d) Tilsit Francia recupera Alsacia y Lorena .f..

(e) Utrecht Se reconoce finalmente la Indepencia de Holanda .b..

(f) Versailles G. Bretaa se transforma en una potencia suprema .c..

(g) Viena Las potencias occidentales consideran la Guerra


de los Balcanes

(h) Westfalia .a..

167
SUGERENCIAS PARA REDACTAR TEMS DE TIPO
OBJETIVO

A.G. Wesman
Traduccin Mara del C. Malbrn

1. Exprese el tem tan claramente como sea posible. La dificultad de un tem debe
surgir del problema que se presenta ms bien que de las palabras que lo expresan.

2. Siempre que sea posible elija palabras de significado preciso.

3. Evite las oraciones complejas o confusas. La estructura de las oraciones debe ser lo
ms simple posible. Cuando el enunciado es complejo, es conveniente usar dos o ms
oraciones para expresarlo. En general, es conveniente presentar primero el aspecto fun-
damental de la pregunta y luego las explicaciones o aclaraciones.

4. Incluya todas las aclaraciones necesarias para proveer una base razonable para la
eleccin de la respuesta. No deje aspectos implcitos en la pregunta.

5. Evite la inclusin de palabras que no resulten funcionales. Una palabra o frase no


es funcional cuando no contribuye a la eleccin de la respuesta. Las palabras innecesa-
rias resultan irrelevantes para los propsitos del examen. Sin embargo, algunas oracio-
nes introductorias, que no son estrictamente necesarias, pueden ocasionalmente justifi-
carse cuando ayudan a clarificar el problema presentado. La lectura innecesaria acta
como distractor toda vez que el objetivo del examen no incluya especficamente la com-
prensin de la misma y el monto que el estudiante es capaz de manejar en un tiempo
determinado.

6. Evite especificaciones innecesarias para la pregunta en cuestin. Los tems que


examinan detalles insignificantes favorecen el aprendizaje memorista y desalientan a los
estudiantes maduros cuyos hbitos de estudio no se dirigen hacia el conocimiento de los
mismos.

7. Trate de ser preciso en todas las partes que componen el tem.

8. Adapte el nivel de dificultad del tem al grupo y al propsito para el que fue cons-
truido. Un examen debe incluir slo aquellas cuestiones que todos los alumnos puedan
contestar correctamente de acuerdo con los objetivos que ha tenido la enseanza. Es
probable que un tem que cumpla con esta condicin resulte til para discriminar clara-
mente los diferentes niveles de habilidad entre los alumnos. Adems, es un error selec-
cionar tems que el estudiante ideal debiera saber, ms bien que en trminos de lo que
realmente puede realizar un estudiante promedio.

168
9. Evite indicios no pertinentes para la respuesta correcta.

10.Evite una redaccin estereotipada en el enunciado del tem o en la alternativa


correcta. Las respuestas memoristas se basan en estereotipos verbales. Respuesta
memorista se define en este contexto como aqulla en la que se usan las palabras sin una
clara concepcin de sus significados.

11.Evite las fuentes de dificultad no pertinentes.

12.Someta los tems que ha construido al examen de algn colega versado en la


materia. La consulta en general debe enfocar los siguientes aspectos:

a) el control del grado de correccin de la respuesta o alternativa que Ud. ha selec


cionado como correcta.
b) La estimacin del grado apropiado de dificultad.
c) Las sugerencias para un mejor planteo o redaccin del tem.
d) Las sugerencias para mejorar las alternativas distractoras.
e) La estimacin de la significacin del tem.

169
SUGERENCIAS PARA EMPLEAR DIFERENTES TIPOS
DE TEMS
A.G. Wesman.
Traduccin Mara del C. Malbrn

A. Los tems de Respuesta Breve.

1. Use este tipo de tem slo para preguntas que pueden responderse mediante una nica
palabra, frase, nmero o smbolo.

2. No copie las oraciones palabra por palabra del contexto e intente usarlas como tem de
respuesta breve.

3. Haga la pregunta o las instrucciones explcitamente.

4. Permita suficiente espacio para consignar la respuesta y disponga los espacios en for-
ma conveniente para facilitar la valoracin.

5. En los problemas de clculo especifique el grado de precisin esperado.

6. Prepare los problemas de clculo de modo que la solucin sea un nmero entero, salvo
cuando la habilidad para trabajar con fracciones o decimales sea un propsito de la prue-
ba.

7. En los ejercicios de completamiento evite la excesiva mutilacin del tem.

B. Los tems Verdadero- Falso.

1. selos slo en aquellos casos en los que la afirmacin sea verdadera o falsa en forma
estricta. Incluya en cada enunciado solamente una idea central significativa.

2. Evite el uso de largas oraciones que implican frases o agregados explicativos. Use
enunciados breves y de estructura sencilla.

3. Evite el uso de oraciones tomadas textualmente de manuales o fuentes consultadas por


el alumno.

4. Evite el uso de claves ajenas a la respuesta.

5. Evite que las respuestas correctas queden dispuestas segn pautas discernibles.

170
C. Los tems de Eleccin Mltiple.

1. Use una pregunta directa o una oracin incompleta como planteo del tem.

2. En general, incluya en el enunciado o planteo todas las palabras que de otra manera
tendra que repetir en cada alternativa.

3. Elija como correcta la alternativa acerca de la cual exista acuerdo sobre su veracidad o
correccin, es decir la mejor respuesta.

4. Evite, cuando sea posible, el enunciado en forma negativa del problema.


5. Cuide que todas las alternativas sean apropiadas para el enunciado del tem.

6. Cuide que todas las alternativas resulten plausibles y atractivas para los examinados
en trminos de la informacin o de la destreza que el tem pone en juego.

7. Evite distractores altamente tcnicos.

8. Evite alternativas que se superpongan mutuamente.

9. Use la alternativa ninguna de las anteriores slo en aquellos tems para los que hay
una respuesta absolutamente correcta. sela como respuesta obvia varias veces en la
primera parte del examen pero en las partes posteriores espacie su empleo. Evite em-
plearla como respuesta correcta para tems en los que puede cubrir una gran proporcin
de respuestas incorrectas.

10.Disponga las respuestas en un orden lgico si existe, pero evite una preferencia con-
sistente con respecto a la posicin de la alternativa correcta.

11.Si el tem examina la definicin de un trmino, es preferible usualmente incluir el


mismo en el enunciado y presentar definiciones alternativas en las respuestas posibles.

12.No presente una serie de tems del tipo verdadero- falso bajo la forma de un reactivo
de seleccin mltiple.

13.Evite claves verbales que permitan a los estudiantes seleccionar la respuesta correcta
o eliminar opciones incorrectas.

D. Los tems de Cotejo.

1. Agrupe slo premisas y respuestas homogneas en un tem de cotejo considerado ais-


ladamente.

2. Use listas de respuestas relativamente cortas.

171
3. Disponga las premisas y las respuestas de modo que tengan una claridad y convenien-
cia mximas para el alumno.

4. En las instrucciones explique claramente lo que se espera que el alumno haga para
indicar las respuestas.

5. No intente brindar apareamiento uno a uno perfecto entre las premisas y las respues-
tas.

E. Los tems que emplean material grfico.

1. Use grabados, diagramas, grficos y recursos similares no con fines de entretenimiento


o atraccin, sino en el caso en que resulten apropiados para los propsitos del examen.

2.Seleccione o invente el recurso grfico teniendo en mente el propsito especfico para


el que lo destinar.

3.Use representaciones grficas que estn correctamente diagramadas y resulten clara-


mente perceptibles.

4.Observe las mismas indicaciones para preparar el enunciado y las alternativas del
tem basado en representaciones grficas que se emplean para los tems de eleccin
mltiple.

5.Si es necesario, prepare el texto para explicar la representacin grfica, hacindolo de


la manera ms simple posible para su comprensin.

172
EVALUACIN DE LA COMPRENSIN DE LECTURA
Fuente: B. S. Bloom y otros.(1976). Evaluacin del Aprendizaje.
Bs. As.:Troquel.

El hombre estuvo siempre interesado por su propio pasado. Los exploradores de hoy
han hallado los comienzos de la civilizacin al retroceder miles de aos. Esos exploradores,
llamados arquelogos, buscan los materiales que permitan estudiar la historia de la humani-
dad. El material puede estar construido por escritos, fragmentos de obras de arte o ruinas
antiguas.

Han desarrollado mtodos de estudio muy rigurosos, que se centran en determinar la


antigedad, o la poca, de las cosas que encuentran.

El final de la Primera Guerra Mundial marca el comienzo del perodo de la expansin


de la arqueologa. En Egipto se realiz un notable descubrimiento: el hallazgo de una tumba
real que databa del ao 1352 A. De J. C. Encontrar un rey de 18 aos de edad envuelto en oro
y enterrado entre una enorme cantidad de objetos de oro suscit el inters de todo el mundo.

El pasaje trata en general

a. de los exploradores
b. de una tumba real
c. de Egipto
d. de testimonios antiguos

El mejor ttulo para este fragmento podra ser

a. El descubrimiento del pasado del Hombre


b. La muerte de un rey
c. Un renovado inters por las obras de arte
d. Quiere ser explorador?

La palabra rigurosos, tal como aparece marcada y usada en este pasaje significa

a. exactos
b. difciles
c. incorrectos
d. exagerados

173
El trmino se centran, tal como aparece marcado y usado en este pasaje significa lo contrario
de

a. se concentran
b. se enfocan
c. convergen
d. se dispersan

La palabra notable, tal como aparece marcada y usada en este pasaje significa

a. espeluznante
b. insignificante
c. perturbador
d. interesante

La palabra enorme, tal como aparece marcada y usada en este pasaje significa ms o menos
lo mismo que

a. vasta
b. valiosa
c. valerosa
d. vlida

La palabra suscit, tal como aparece marcada y usada en este pasaje, significa ms o menos
lo mismo que

a. concit
b. acus
c. concili
d. confirm

La palabra interesado, tal como aparece marcada y usada en este pasaje, significa lo contra-
rio de

a. negligente
b. preocupado
c. fascinado
d. monopolizado

174
TEMS COMPLEJOS

Instrucciones: Esta parte de la prueba se propone evaluar su capacidad para interpretar


datos. A continuacin de los datos encontrar una serie de proposiciones e hiptesis. Debe
suponer que los datos tal como estn presentados son correctos. Evale cada proposicin o
hiptesis de acuerdo con la siguiente clave

Clave:

A.Correcta: los datos por s solos bastan para mostrar que la proposicin o hiptesis es
correcta.

B.Probablemente correcta: los datos indican que la proposicin o hiptesis puede ser
correcta, que es lgica en base a los datos, pero stos no bastan para afirmar que es
claramente correcta.

C.Evidencia insuficiente: no hay datos para decidir si la proposicin o hiptesis es o


no correcta.

D.Probablemente incorrecta: los datos indican que la proposicin o hiptesis proba-


blemente sea incorrecta, que no es lgica en base a los datos, pero estos no bastan
para afirmar que es claramente errnea.

E.Incorrecta: los datos por s solos bastan para mostrar que la proposicin o hiptesis
es incorrecta.

Las preguntas 1 a 8 se refieren al siguiente diagrama. Emplee la clave anterior para contes-
tarlas. Se considera que el lagarto tiene sangre fra y los dems animales sangre caliente.

1. Cuando la temperatura externa es de 50 0 C, la temperatura del gato es tambin de


50 0C.

2. A una temperatura externa de 50 0 C, la temperatura del gasto es de 50 0 C.

3. Cuando la temperatura externa es de 50 0 C, la temperatura del oso hormiguero ser


ms alta que la del gato.

4. La temperatura del ratn estar aproximadamente a mitad de camino entre la del gato
y la del oso hormiguero.

175
5. En ningn momento del experimento tuvo alguno de los animales la misma temperatura
corporal.

6. Existe una estrecha correlacin entre la temperatura del cuerpo del lagarto y la tempe-
ratura del ambiente externo.

7. A 20 0 C bajo cero, el lagarto estar congelado.

8. Si se diagramara, la temperatura de otros animales de sangre fra se asemejara a la


del lagarto.

Zarigeya
Temperatura del cuerpo. C

40
Gato

30 Ornitorrinco
Oso hormiguero
20

10 Lagarto

10 20 30 40
Temperatura extrema. C

(Adaptado de Burmester, 1961)


Procesos de la investigacin cientfica. Interpretacin de datos y observaciones experimen-
tales. Extrapolacin de una hiptesis a la luz de los datos obtenido.

Instrucciones: Lea las afirmaciones que se presentan seguidamente prestando cuidados aten-
cin a sus relaciones recprocas. A continuacin de cada una deber consignar A, B, C o D
segn corresponda de acuerdo con la siguiente clave.

Clave:

A.Si la afirmacin contiene la idea central en torno de la cual pueden agruparse las res-
tantes afirmaciones.

B.Si la afirmacin contiene una idea importante que sirve como apoyo de la idea central.

C.Si la afirmacin contiene un hecho ilustrativo o una declaracin ms detallada relativa


a la idea de apoyo.

176
D. Si la afirmacin contiene una idea o ideas que no son pertinentes.

1. Las rutas romanas conectaban todas las partes del Imperio con Roma.

2. Las rutas romanas estaban tan bien construdas que algunas de ellas existen hoy.

3. Uno de los ms grandes logros de los romanos consisti en el extenso y durable sistema
de rutas.

4. Los viajeros ricos en los tiempos romanos viajaban en carros tirados por caballos.

5. A travs de las rutas romanas las caravanas transportaban valiosas mercancas desde
Alejandra y el este.

6. Algunas de las carreteras italianas del presente se construyeron sobre rutas originalmen-
te romanas.

177
EJEMPLOS DE TEMS

Lic. Mara del C. Malbrn

Los enunciados siguientes aluden a las ideas bsicas sobre las que se edifica la teora de J.
Piaget sobre el desarrollo cognitivo. Coloque en cada caso el nombre que recibe cada una:

. Logro de cierto de armona en la interaccin con el medio ambiente....................................


. Esfuerzo para incorporar aspectos del medio ambiente a las estructuras previamente exis-
tentes en el individuo...................................................................................................
. Accin interiorizada y reversible cuya adquisicin gradual es la esencia del desarrollo
cognitivo.............................................................................................................................
. Actividad mental operatoria que permite advertir que ciertos aspectos de una condicin
cambiante son invariables a pesar de las modificaciones...................................................
. Esfuerzo para que la conducta del organismo se ajuste en forma activa al medio ambien-
te.............................................................................................................................

Al lado de cada uno de los enunciados, coloque el nombre del perodo que corresponde segn
Piaget.

. El pensamiento se torna reversible................................................................................


. Los objetos adquieren permanencia...............................................................................
. El pensamiento es racional y sistemtico.........................................................................
. El pensamiento es preconceptual...................................................................................
. Logra las ideas de conservacin.....................................................................................
. An no puede ponerse mentalmente en el lugar de otros.................................................

178
Para las actividades cognitivas que se mencionan, indique el nombre del perodo a que perte-
nece segn Piaget.

. Concluir que dos recipientes de distinta forma pueden tener igual volu-
men..............................................................................................................................
. Buscar un objeto que ha desaparecido del campo visual...................................................
. Diferenciar un hecho de un concepto y de un principio.....................................................
. Ordenar objetos segn su tamao relativo.........................................................................
. Discriminar entre tres colores distintos..............................................................................
. Determinar mediante inferencia la verdad o falsedad de algunos enuncia-
dos..........................................................................................................................
. Identificar objetos por el nombre.......................................................................................

A continuacin se menciona uno de los experimentos clsicos de J. Piaget. Escriba la res-


puesta que dara un nio en la etapa preoperatoria y en la etapa de operaciones concretas,
consignando la conclusin correspondiente:

Se presenta al nio un conjunto de cuentas de madera, 18 de las cuales son marrones y dos
blancas y se le pregunta: Qu hay ms, cuentas de madera o cuentas marrones?

Preoperatoria............................................................................................................................

Op.Concretas...........................................................................................................................

Conclusin.........................................................................................................................

Entre las siguientes marque las que constituyen caractersticas del pensamiento segn Piaget:

. Reversibilidad
. Centracin
. Conservacin
. Egocentrismo
. Irreversibilidad
. Transduccin

179
Marque las tareas que recin podran comprenderse cabalmente despus de los 11 o 12 aos
de edad, segn las caractersticas que Piaget atribuye al pensamiento formal.

.... Determinar que cuerpos de un mismo volumen pueden tener distinto peso

.... Formular dos explicaciones alternativas para un mismo fenmeno


.... Clasificar un grupo numeroso de objetos en varias categoras

.... Intentar una hiptesis para resolver un problema fsico

.... Inferir una regla ortogrfica

.... Resolver una ecuacin simple con una incgnita

A continuacin se mencionan algunos de los principios bsicos que rigen el desarrollo cognitivo
segn Piaget. Explique brevemente sus alcances:

1. L a a c c i n d e s e m p e a u n p a p e l c l a v e e n e l c o n o c i m i e n t o d e l m u n -
do.............................................................................................................................
2. Las caractersticas que permiten distinguir etapas en el desarrollo cognitivo son clara-
mente distinguibles en la conducta infantil................................................................
3. El desarrollo intelectual tiene un carcter acumulativo....................................................
4. Si bien las cronologas no son fijas, el orden de sucesin de las etapas del desarrollo
cognitivo es relativamente invariable...............................................................................
5. Los organismos vivos son sistemas autorregulados........................................................

Seguidamente se mencionan los tipos de juicios morales segn Kohlberg. Coloque al lado de
cada uno el nmero (de 1 a 6) segn aparecen evolutivamente.

La observancia u obediencia a las normas se produce para

..... evitar la censura de autoridades legtimas y la culpa resultante

..... evitar la desaprobacin o antipata de otros

..... obtener premios o la devolucin de favores

..... mantener el respeto de la comunidad

..... evitar el autorreproche

..... evitar el castigo

180
Clasifique las siguientes manifestaciones en preconvencionales, convencionales y
postconvencionales segn corresponda:

. Si obras mal ser tu propia conciencia la que te recriminar............................................


. Al mentiroso la gente le pierde toda confianza.................................................................
. Si eres bueno conmigo, yo ser generoso contigo.............................................................
. Si no lo hago me dejarn sin ir de paseo...........................................................................
. La ley ordena que todos debemos pagar...........................................................................

Al lado de cada enunciado seale si resulta verdadero (V) o falso (F) de acuerdo con los
resultados de las investigaciones de Kohlberg

..... Se encuentran diferencias importantes en la secuencia con que aparecen los tipos mora-
les en individuos que pertenecen a distintas culturas, religiones y clases sociales
..... En el nivel preconvencional, el valor de la vida humana no es juzgado por s mismo sino
por referencia a criterios externos a ella misma

..... Los principios ticos del nio constituyen un fiel reflejo de la moralidad adulta

..... Para acceder a los niveles superiores de desarrollo moral el sujeto debe haber previa-
mente transitado los ms primitivos

..... El pensamiento moral evoluciona en forma similar al desarrollo en otras reas de la


conducta tal como la cognitiva

181
A continuacin se mencionan las teoras ms conocidas acerca del lenguaje. Coloque
para cada enunciado de la izquierda, el nmero que le corresponde segn lo que consta en la
columna de la derecha

* El nio adquiere las habilidades del lenguaje que 1. Teora del aprendizaje
son reforzadas por la gente que lo rodea................ 2. Teora gentica
3. Teora de la capacidad innata
* El lenguaje influye sobre los conceptos y la con- 4. Hiptesis de la relatividad
cepcin del mundo de quien habla...................... lingstica

* El desarrollo del lenguaje es consecuencia de las


estructuras cerebrales que contienen reglas lings-
ticas......................................................................

* Los determinantes biolgicos son fundamentales


en la produccin e interpretacin del lenguaje, que
es caracterstico de la especie.............................

* El ensayo y error as como la imitacin son proce-


sos bsicos en el desarrollo lingstico...................

182
EJEMPLOS DE TEMS DE
RESPUESTA SELECCIONADA

Recopilacin: Mara del C. Malbrn

La sinapsis puede caracterizarse como

a.- una masa de protoplasma que tiene muchos ncleos pero carece de lmites defini-
dos entre las clulas.

b.- un lapsus de la memoria causado por la circulacin sangunea insuficiente en el


cerebro.

c.- la unin de los cromosomas maternos y paternos durante el proceso de madura-


cin de las clulas germinales.

d.- la porcin cilndrica y alargada del axn.

e.- el punto por el cual los impulsos nerviosos pasan de una clula a otra.

El orden de las etapas del ciclo vital de la mosca domstica es

a.- larva- huevo- ninfa- adulto

b.- ninfa- larva- huevo- adulto

c.- ninfa- huevo- larva- adulto

d.- huevo- larva- ninfa- adulto

Si * = -1 y # = 1; cul/es de la/s siguiente/s expresin/es es/son positiva/s?

I) * . # II) * . # III) * . *
* #.* #.#

a.- slo I d.- I y II


b.- slo II e.- I, II y III
c.- slo III

183
Si una persona est pensando en tomar baos de sol, cul es la hora del da durante
la que es ms probable que llegue a quemarse seriamente?. Es mucho ms probable que se
queme seriamente durante el medioda (de 11 a 13) porque

a.- estamos un poco ms cerca del sol al medioda que a la maana o a la tarde

b.- cuando los rayos del sol caen directamente (perpendiculares) sobre una superficie,
sta recibe mayor cantidad de ellos que cuando caen en forma oblicua

c.- cuando los rayos del sol caen perpendicularmente sobre una superficie, sta refle-
ja menor cantidad de rayos que cuando caen en forma oblicua

d.- cuando el sol est justo sobre la cabeza, los rayos deben atravesar menor cantidad
de atmsfera absorbente que cuando est cerca del horizonte

e.- as como una bala disparada perpendicularmente contra un bloque de madera en


tra ms profundamente, los rayos del sol al medioda penetran en la piel con mayor
impacto

f.- el aire, por lo general, es ms caliente al medioda que a la maana o a la tarde

g.- los rayos ultravioletas de la luz solar son los principales responsables de las que
maduras del sol

Un ladrillo puede ser arrastrado con relativa facilidad sobre una superficie lisa tirando
de l mediante una cuerda. Esta sin embargo se romper si se tira demasiado fuerte. Cul
de los siguientes principios es ms til para explicar este hecho?

a.- La fuerza es igual a la masa por la aceleracin

b.- Friccin entre dos cuerpos que entran en contacto

c.- La inercia

d.- La conservacin de la energa

e.- Ninguno de los anteriores

184
Para cada una de las afirmaciones siguientes, coloque sobre la lnea de puntos (V) si
resulta verdadera y (F) si es falsa

... Un cuerpo sumergido en un fluido es impulsado hacia la superficie por una fuerza
igual al peso del fluido desplazado

... La fuerza de ascensin de un objeto rodeado por un lquido o gas es igual al rea de
la superficie del objeto multiplicada por la presin del lquido o gas que lo rodea

... La fuerza de flotacin de un cubo de aluminio de un centmetro de lado es exacta-


mente la misma que la de un cubo de hierro de un centmetro cuando ambos estn
sumergidos en agua

... Si un objeto insoluble se sumerge sucesivamente en varios fluidos de diferente


densidad, la fuerza de flotacin que se ejerce sobre l en cada caso, variar
inversamente a la densidad de los fludos

Al lado de cada enunciado coloque una (V) si resulta verdadero y una (F) si es falso:

... Las influencias hereditarias pueden manifestarse por primera vez a cualquier edad

... Las influencias ambientales comienzan a operar en el momento del nacimiento

... El parecido entre padres e hijos obedece a factores hereditarios

... Las capacidades desarrolladas por la experiencia no se trasmiten hereditariamente

... Los genes son afectados por muy pocos factores

... Ciertos agentes txicos transportados por la corriente sangunea pasan de la madre al feto

... Toda la conducta humana es fenotpica

... Las caractersticas muy resistentes al cambio pueden ser de origen hereditario o ambiental

185
Para cada enunciado coloque sobre la lnea de puntos

A.- Si considera que podra usarse para apoyar la propuesta

R.- Si podra usarse para rechazarla


N.- Si no pesa a favor ni en contra (neutro)

EL PERODO DE GOBIERNO DEL PRESIDENTE DEBERA CONSERVARSE EN SEIS AOS

... 1.- La eficiencia aumenta con la experiencia

... 2.- El pueblo debe poder controlar la gestin del presidente

... 3.- El sistema de partidos est en crisis, tal como lo muestran algunos ejemplos recientes

... 4.- El ao previo a la eleccin presidencial afecta la vida econmica de la Nacin por la
incertidumbre de los resultados

... 5.- Es importante mantener en el gobierno a un presidente cuya gestin es satisfactoria

En una clase de geografa sobre Holanda, un estudiante dijo que las casas de los
holandeses siempre estn bien orientadas y limpias. El profesor pregunt sobre las fuentes
de las que haba obtenido la informacin y sugiri al resto de la clase que investigara sobre el
tema. Entre las razones ofrecidas por los estudiantes marque con una (X) las que ofrecen
mayor fundamento a la afirmacin

... 1.- Alguien me dijo que siempre son ordenados y limpios

... 2.- Estuve en casa de unos holandeses y la encontr ordenada y limpia

... 3.- La enciclopedia que consult dice que una caracterstica sobresaliente de los
holandeses radica en el orden y en la limpieza

... 4.- He estado en muchas casas de holandeses y todas estaban ordenadas y limpias

... 5.- Le en un libro de cuentos que las casas de los holandeses son siempre limpias
y ordenadas

... 6.- V una pelcula sobre una familia holandesa cuya casa estaba siempre ordenada
y limpia

... 7.- Un pueblo tan evolucionado debe tener sus casas ordenadas y limpias

... 8.- He vivido seis meses en Holanda y considero que el orden y la limpieza se
respetan rigurosamente en el hogar y la comunidad

186
Un grupo de profesores discuta las ventajas de dos mtodos de calificacin. Haba
quienes proponan el empleo de un sistema doble: S (satisfactorio- aprobado) e I (insatisfac-
torio- desaprobado), en lugar del sistema de notas corriente. Los impulsores del sistema S-I
argumentaban:

A la escuela se va a aprender, no a obtener calificaciones. Estas no son tiles como


indicadores de cunto se ha aprendido, dado su carcter relativo y las influencias del azar y
la probabilidad. El estudiante puede juzgar mejor que el profesor si progresa o no lo hace.
Por lo tanto, un sistema S-I disminuira las distinciones poco fundadas entre las notas y ofre-
cera una imagen ms realista del progreso en el aprendizaje

En las siguientes afirmaciones marque con una (X) la que considere menos importante como
parte del razonamiento:

... 1.- Las notas no son fieles indicadores del progreso logrado
... 2.- El sistema S-I atena las diferencias
... 3.- El sistema S-I proporciona una imagen ms adecuada del progreso del estu
diante
... 4.- Las notas estn indebidamente infludas por el azar
... 5.- El estudiante es mejor juez de su propio progreso que el profesor

La conclusin se deriva fundamentalmente de la proposicin que afirma:

... 1.- No se va a la escuela simplemente a obtener calificaciones


... 2.- El estudiante es el mejor juez de su progreso
... 3.- Las notas son indicadores poco confiables del progreso efectuado por el estu
diante
... 4.- Un sistema de calificaciones es mejor que el otro
... 5.- En la determinacin de las notas influye el azar

187
Un supuesto importante que no aparece explcitamente es:

... 1.- El sistema de notas corriente no admite mejoras


... 2.- El principal inters de la gente por la escuela es aprender
... 3.- Los profesores no debieran ser jueces de lo que aprende el alumno
... 4.- El sistema S-I es mejor que el corriente
... 5.- El sistema de calificaciones no tiene importancia

La conclusin del razonamiento es que

... 1.- las calificaciones deberan ser abolidas


... 2.- los estudiantes no estn interesados en las notas
... 3.- los estudiantes deberan autocalificarse
... 4.- el sistema vigente debera reemplazarse por otro
... 5.- las notas son poco confiables

Para que una especie pueda evolucionar de un ambiente completamente acutico a uno te-
rrestre, es indispensable que la adaptacin ocurra en el sistema:

a.- digestivo

b.- locomotor

c.- circulatorio

d.- nervioso

e.- respiratorio

Los efectos usuales del LSD sobre la persona son similares a los sntomas que produce la

a.- leucemia

b.- tuberculosis

c.- hemofilia

d.- esquizofrenia

188
e.- ceguera

Requerimientos: Conocimiento de los efectos alucinatorios del LSD que aparecen en


algunas formas de la esquizofrenia. Dado que el LSD afecta la visin, podra tomarse (e)
como altamente plausible. Sin embargo, la droga usualmente agudiza ms que limita la vi-
sin y no existe evidencia de que la dae en forma permanente.

Cul de los siguientes enunciados es falso si A > B y B > C

I) B + C > A

II) 2 C > A + B

III) 3 . A + B > A + C

IV) 4 . A + C > B + C

a.- Ninguno

b.- Slo 1

c.- Slo 2

d.- Solamente 1 y 2

e.- Todos

Requerimientos: Razonamiento lgico empleando smbolos que expresan desigual-


dades. Si las diferencias entre A y B y entre B y C son pequeas, el enunciado I puede ser
verdadero. Los enunciados reducen a una las desigualdades de la expresin., eliminando las
A en el nmero y las C en el nmero. El enunciado debe ser la clave, dado que su opuesto
puede ser deducido de las desigualdades en la expresin: dado que A > B y B > C, A > C.
Sumando B > C y A > C produce A + B > 2 C. Consecuentemente 2 C > A + B no puede ser
verdadero. La respuesta correcta es c.

189
EVALUACIN DEL APRENDIZAJE EN LAS CIENCIAS

Fuente: Leopold Klopfer en Bloom, B. y otros.


Evaluacin del aprendizaje. Bs. As. Troquel, 1976.

Ejemplos de tems de evaluacin

1. Las flechas muestran la direccin de la velocidad y los vectores de aceleracin para un


auto en cinco momentos diferentes. El auto viaja por lo general hacia el oeste, pero a
veces cambia su direccin.

v v v v v =0

a a a a =0 a
A B C D E

1.1. Cul de los diagramas representa al auto cuando dobla una esquina?

a. Diagrama A b. Diagrama B c. Diagrama C


b. Diagrama D e. Diagrama E

1.2. Cul de los diagramas representa una disminucin en la velocidad del auto? (Iguales
alternativas que para 1.1.)

1.3. Cul de los diagramas representa al auto ponindose en marcha? (Iguales alternativas
que para 1.1.)

1.4. Cul de los diagramas representa el incremento en la velocidad del auto? (Iguales
alternativas que para 1.1.)

(Adaptado de Ruterford y otros, 1966)


(Conocimiento de convenciones)

190
2. Cul de las siguientes posibilidades presenta la mayor diversidad en estructura?

a. Cinco clases de vertebrados


b. Cinco especies de reptiles adaptados a la vida en los mares, desiertos, selvas tropicales,
selvas templadas y lagunas
c. Cinco ordenes de mamferos adaptados para excavar, deslizarse, saltar, alimentarse de
plantas y ser animales de rapia
d. Cinco gneros de polillas que se alimentan del nctar de tulipanes, narciso, arvejas, ma-
dreselvas y orqudeas

(Adaptado de Biological Sciences Curriculum Study, 1965)


(Conocimiento de clasificaciones y categoras)

3. Emplee la siguiente clave para contestar las preguntas 1 a 7

Clave:
a. La proposicin es verdadera si se da la condicin
b. La proposicin es verdadera sin tener en cuenta la condicin
c. La proposicin es falsa si se da la condicin
d. La proposicin es falsa sin tener en cuenta la condicin

Proposicin Condicin

1. La fuerza de atraccin o repulsin si las cargas son cuantitativamente iguales


entre dos cargas es inversamente
proporcional al cuadrado de sus distancias

2. La direccin de la corriente de si se invierten las cargas en los terminales


electrones a travs de un conductor
es irreversible aun

3. Dos partculas cargadas se repelen en- si las partculas se acercan lo suficiente


tre s

4. Una partcula negativamente cargada si la partcula negativa posee la carga ms


repele a una partcula positivamente car- grande
gada
5. Dos objetos cargados se repelen entre s si ambos atraen objetos igualmente cargados

6. A volumen constante la temperatura si la temperatura se expresa en grados cent-


y presin absolutas de un gas son grados
directamente proporcionales

7. A temperatura constante la presin si la presin se expresa en milmetros de mer-


y volumen absolutos de un gas son curio y el volumen en centmetros cbicos
inversamente proporcionales

(Adaptado de Nelson, 1967) (Conocimiento y comprensin de principios y leyes)

191
4. Qu progreso gentico se ilustra en el siguiente diagrama?

a. Falta de disgregacin
b. Apareamiento sexual
c. Crossing- over
d. Seleccin natural

(Adaptado de Biological Sciences Curriculum Study, 1965)


(Traduccin del conocimiento de una forma simblica a otra)

5. Supongamos que se realiza el siguiente experimento con el propsito de mostrar que una
planta que crece dentro de una campana de vidrio disminuye el dixido de carbono (CO 2 )
y aumenta la cantidad de oxigeno (O 2) en ese mbito.

Debajo de una campana de vidrio se ubican una planta y una vela encendida tal como mues-
tra el dibujo. La vela se quema durante un minuto y luego se apaga. Tres das ms tarde, la
vela se enciende por medio del aparato elctrico y se quema durante un minuto antes de
apagarse.

1. Cul de los siguientes interrogantes contesta el experimento?

a. Todas las partes de una planta toman CO 2 y despiden O 2 ?


b. Necesitan las plantas luz para tomar CO 2 y despedir O 2?
c. Tienen el mismo efecto en el aire las plantas y las velas encendidas?
d. Es la cantidad de CO 2 tomada por una planta mayor que la cantidad de O 2 que
despide?

2. Antes que pudieran derivarse conclusiones, con cual de los siguientes cambios debera
repetirse el experimento?

a. Emplear una campana de vidrio ms grande


b. Omitir la vela
c. Omitir la planta
d. Encender la vela con un haz de luz concentrado

3. Supongamos que esta definitivamente probado que una planta que crece dentro de una
campana de vidrio disminuye el dixido de carbono (CO 2) y aumenta el oxigeno (O 2 ) pre-
sente. Cmo se relaciona este descubrimiento con la observacin de que las plantas res-
tituyen la capacidad de aire para permitir que la vela siga ardiendo?

192
a. Agrega informacin que contradice la observacin
b. Agrega informacin compatible con la observacin
c. No agrega nada a la observacin
d. Ambos no pueden ser correctos

6. Supongamos que se le dan dos pelotas y se le dice que una es hueca y la otra slida, pero
no puede determinar cual es cual por el solo hecho de mirarlas. Si desea resolver la
cuestin, cul de los dos procedimientos esquematizados tendr que emplear?

a. Procedimiento I
b. Procedimiento II
c. Procedimiento III

7. Los problemas 1 a 4 estn basados en la siguiente situacin, que se relaciona con la


herencia de la calvicie, un rasgo influenciado por el sexo.

Una joven acrbata del circo que cuelga de sus cabellos como parte de su actuacin se
pregunta si debe cambiar de profesin, si es necesario antes que sea demasiado tarde. Su
problema es el siguiente: su madre es calva, pero su padre posee cabello normal. Su herma-
no mayor est perdiendo rpidamente el cabello y pronto ser calvo. Supongamos que B
representa el gen para la calvicie y b el gen para la carencia de calvicie. En la condicin
heterocigotica B es dominante en los hombres y b en las mujeres. Un hombre heterocigtico
ser calvo pero una mujer heterocigtica no ser calva.

1. Cul de los siguientes apareamientos representa a los padres de la joven acrbata del
circo?

a. B b XX x BbXy
b. bbXX x BBXY
c. BbXX x bbXY
d. BBXX x bbXY
e. BBXX x BbXY

2. El genotipo del hermano mayor de la joven est representado por

a. BbXy
b. bbXY
c. BbXX
d. BBXY
e. BBXX

193
3. El genotipo de la joven acrbata est representado por

a. BbXY
b. BBXY
c. bbXX
d. BBXX
e. BbXX

4. Sobre la base de estos datos, cul de las siguientes sugerencias para la joven acrbata
sera ms justificable?

a. No necesita cambiar de profesin, ya que conforme a la informacin gentica no hay


probabilidad de que pierda el cabello

b. La probabilidad de que se vuelva calva es de 1 en 4

c. La probabilidad de que se vuelva clava es de 3 en 4

d. La probabilidad de que se vuelva calva es de 50%

e. Cambie su profesin: conforme a la informacin gentica es casi seguro que se volver


calva.

(Adaptado de Nelson, 1967)


(Aplicacin de conocimientos y mtodos cientficos)

8. Un marinero a la deriva en el ocano sobre una balsa agot sus reservas de agua dulce.
Tuvo muchsima sed, pero temi tomar el agua de mar porque haba odo que poda ocasio-
nar la muerte. Qu principio biolgico provocara un desastre si el marinero tomaba el agua
de mar?. Seleccione una de las cinco probabilidades siguientes:

a. Existen muchos microorganismos en el agua de mar, algunos de los cuales pueden


ocasionar la muerte

b. Las diversas sales que posee el agua de mar tenderan a corroer el estmago

c. Cuando el agua de mar llegara a los intestinos de marinero, la sal natural ya exis-
tente en sus clulas sanguneas las abandonara para mezclarse con las sales intesti-
nales

194
d. El agua salada se dirigira y pasara por los riones con tanta rapidez que los sobre
cargara, lo que producira la muerte por insuficiencia renal

e. Parte del agua contenida en la sangre la abandonara para unirse al agua de mar en
los intestinos.

(Adaptado de Hedges, 1966)


(Aplicacin de conocimientos y mtodos cientficos)

195
TIPOS DE TEMS
Mara del C. Malbrn

I.tems de respuesta construida. Variedad ensayo extenso

1. Comente brevemente las afirmaciones siguientes en cuanto a las derivaciones que tuvie-
ron para el tratamiento y educacin infantil.

a. La mente de los nios es como una tabula rasa, una especie de hoja en blanco (John
Locke. S. XVII)

-

b. El nio es como un noble salvaje, dotado de un sentido moral innato J. J. Rousseau. S.


XVIII)

2. A continuacin se citan algunas afirmaciones sobre los test que hoy se consideran err-
neas. En cada caso mencione el argumento principal que permite rechazarlas:

a. Los tests miden la inteligencia innata



b. Los test no deben incluir elementos culturales



c. Los test que miden la misma caracterstica arrojan los mismos resultados

-

d. La prediccin del rendimiento futuro cuanto ms temprana ms confiable



-

e. Si una persona es inteligente, puede desempearse con xito en cualquier tipo de ta-
reas que pongan en juego el intelecto
-
-

196
II. tems de respuesta construda. Variedad respuesta breve

3. En un estudio sobre la habilidad de los seres humanos para juzgar a sus semejantes que
utiliz tcnicas correlacinales, se concluy:

La capacidad para juzgar a los dems no se relaciona con la edad (en los adultos) ni
marcadamente con el sexo. Se relaciona en forma directa con la inteligencia, los intereses
artsticos y el ajuste emocional y en forma inversa con las actitudes autoritarias. Asimis-
mo, la confianza de los evaluadores en sus predicciones se relaciona inversamente con la
precisin de las mismas.

De acuerdo con esta informacin, complete los enunciados siguientes:

a. La/s variable/s con la/s que la correlacin tiene signo positivo



b. La/s variable/s con la/s que la correlacin tiene signo negativo



-

c. La/s variable/s con la/s que la correlacin es muy baja o nula



-

d. La precisin del evaluador aumenta a medida que



4. Para cada una de las adquisiciones siguientes seale el tipo de aprendizaje que ilustran

Calcular la superficie de un campo triangular empleando el teorema de Pitgoras



Clasificar animales ovparos y vivparos
Aprender el sistema Morse
Aprender a tirar al blanco
Cruzar las calles segn lo indica el semforo
Armar un sistema que conecte el reloj despertador con el receptor de radio

Ensear al perro a llevar el diario a la cama de su amo

197
Para las actividades cognitivas que figuran a continuacin, escriba sobre la lnea de puntos el
nombre del perodo de desarrollo a que corresponden segn Piaget:

a. Establecer que s A > B y B > C, luego A > C


b. Determinar que pese a las modificaciones en
la forma se conserva una determinada sustancia

c. Clasificar objetos tangibles

d. Establecer que pese a que se adopten diversos


ordenamientos, un cierto nmero de objetos no
varia en cuanto a su cantidad

e. Determinar, mediante inferencia, la verdad o


falsedad de algunas proposiciones

f. Formular dos hiptesis alternativas para explicar


un mismo fenmeno

g. Discriminar entre dos colores distintos -

h. Identificar objetos por su nombre

i. Captar simultneamente varios hechos separa


dos, recordando el pasado y anticipando el futuro

III. tems de respuesta seleccionada de dos opciones. Variedad ra


cimo

5. Al lado de cada enunciado coloque una (V) si resulta verdadero y una (F) si falso:

. . . Las influencias hereditarias pueden manifestarse por primera vez en cualquier edad.

. . . Las influencias ambientales comienzan a operar en el momento del nacimiento.

. . . El parecido entre padres e hijos obedece a factores hereditarios.

. . . Las capacidades desarrolladas por la experiencia no se transmiten hereditariamente


. . . Los genes son afectados por muy pocos factores.

. . . Ciertos agentes txicos transportados por la corriente sangunea pasan de la madre


al feto.

198
. . . Las caractersticas muy resistentes al cambio pueden ser de origen tanto hereditario
como ambiental.

. . . Toda la conducta humana es fenotpica.

. . . La educacin o el adiestramiento pueden impulsar a un individuo ms all de los lmi-


tes impuestos por la herencia.

6. Clasifique las siguientes cuestiones en problemas de confiabilidad o de validez agregan-


do a cada caso una (C) o una (V) :

. . . Ambigedad de las consignas.

. . . Alto nivel de ansiedad del examinado.

. . . Concordancia de los contenidos de la prueba con los propsitos.

. . . Falta de amplitud de la prueba para cubrir los aspectos significativos de la habilidad


examinada.

. . . Distorsiones de los juicios del examinador.

. . . Influencia de factores aleatorios en la puntuacin del test.

. . . Derivacin de conclusiones no pertinentes segn los propsitos de la prueba.

. . . Errores en la puntuacin de los tems.

199
IV. tems de respuesta seleccionada de opcin mltiple. Variedad
respuesta correcta

7. A continuacin se enumera una serie de cualidades que debe reunir un buen examen.
Seale aquella que debe preceder a las restantes:

a. el grado de dificultad debe adecuarse al nivel de preparacin de los alumnos.

b. las situaciones de prueba deben ser representativas de lo que se ha enseado.

c. deben preverse con anterioridad las respuestas que se consideran correctas.

d. el nmero de tems debe tomar en cuenta el tiempo disponible.

e. debe establecerse previamente el valor que se acreditar a cada respuesta.

V. tems de respuesta seleccionada de opcin mltiple. Variedad


mejor respuesta

8. Cul de las siguientes funciones resultara de menor importancia si se considera a la


evaluacin como un componente que retroalimenta informacin a la totalidad del proceso
educativo?

a. Asignar notas a fin de curso.

b. Diagnosticar fallas en el desempeo acadmico.

c. Conocer el estado de preparacin de los alumnos.

d. Realizar ajustes en el desarrollo de los contenidos.

e. Informar sobre la marcha del proceso de enseanza.

200
VI. tems de respuesta seleccionada. Variedad respuesta mltiple

9. Entre los siguientes marque los enunciados correctos

El estudio de la niez en diferentes culturas permite

. . . comprender que ciertas pautas consideradas universales son en realidad caractersti-


cas de determinados contextos culturales

. . . ilustrar cmo el medio sociocultural se refleja en las distintas pautas de crianza

. . . demostrar que las culturas primitivas tienen pautas de crianza ms coherentes que las
ms evolucionadas

. . . obtener ideas acerca de cmo criar a los nios

. . . analizar los efectos sobre la conducta de pautas de crianza muy diferentes

. . . mostrar que son las normas socioculturales las que determinan las experiencias ade-
cuadas para cada nivel de edad

. . . ilustrar que la educacin de los nios sigue patrones similares no importa cun dife-
rentes sean las culturas

. . . descubrir que pautas que para la sociedad occidental resultan extraas o poco acep-
tables, aparecen como naturales en otras culturas

. . . actuar sobre ellas para ensearles cmo deben criar a los nios

Estos tems fueron construidos y probados por la prof. Mara del C. Malbrn. Los ndices de
dificultad y discriminacin obtenidos permiten considerarlos adecuados.

201
CMO ANALIZAR LOS TEMS
Fuente: Gronlund, N.(1974) Elaboracin de Tests de Aprovechamiento.
Mxico: Trillas.Cap. 6

Despus de administrado y calificado el test, de ordinario es conveniente evaluar la


eficacia de los temes. Esto se hace estudiando las respuestas dadas a cada tem. El proce-
dimiento, cuando est formalizado, recibe el nombre de anlisis de temes y nos da informa-
cin acerca de los siguientes puntos:

1. la dificultad del tem.


2. el poder discriminativo del tem.
3. la eficiencia de cada opcin.

De esta manera, la informacin del anlisis de tems no puede decir si el tem fue
demasiado fcil o demasiado difcil, qu tan bien discrimin entre los estudiantes con pun-
tuaciones altas y los estudiantes con puntuaciones bajas en el test, y si todas las opciones
funcionaron de la manera deseada. El anlisis de tems proporciona datos que ayudan tam-
bin a percibir fallas tcnicas especficas y, con ello, a obtener mayor informacin para me-
jorar los tems. Aun en el caso de que no se vayan a usar nuevamente los tems, el anlisis
de stos tiene cierta ventajas. Primero, proporciona informacin til para analizar el test en
clase. Por ejemplo, los tems fciles pueden pasarse por alto o tratarse superficialmente; las
respuestas a tems difciles se pueden explicar con mayor detalle y se pueden sealar a los
estudiantes los tems defectuosos en lugar de defenderlos como si no lo fueran. En segundo
lugar, proporciona datos para ayudar a los estudiantes a mejorar su aprendizaje. La frecuen-
cia con que se elige cada respuesta incorrecta revela errores y conceptos equivocados comu-
nes que constituyen una ayuda para introducir correcciones en la enseanza. Tambin pro-
porciona ideas y capacita la preparacin de mejores tests en ocasiones futuras.

Procedimiento simplificado de anlisis de tems

Se pueden aplicar diferentes procedimientos para analizar tems (Downie, 1967). Para
los tests informales de aprovechamiento usados en la enseanza el procedimiento ms sim-
ple parece justificable. Los siguientes pasos delinean un procedimiento sencillo y eficaz.

Para ilustrar los pasos, usaremos 32 hojas de test:

1.Ordene las hojas de test (32 en total) desde la puntuacin ms alta a la ms baja.
2.Seleccione aproximadamente la tercera parte de las hojas correspondientes a las

202
calificaciones ms altas. Estas constituirn el grupo superior (10 hojas). Seleccione el
mismo nmero de hojas con las puntuaciones ms bajas. Estas constituirn el grupo
inferior (10 hojas). Separe el grupo intermedio de hojas (12 hojas). Aunque este grupo
podra incluirse tambin en el anlisis, usar solamente los grupos superior e inferior se
simplifica el procedimiento.
3.Con cada tem, cuente el nmero de estudiantes del grupo superior que eligi cada
opcin. Haga lo mismo con el grupo inferior.
4.Registre el nmero correspondiente al paso 3 en una copia del test, en columnas
colocadas a la izquierda de las opciones a que se refiere cada nmero. El nmero
tambin se puede registrar, de la siguiente manera, sobre la tarjeta del tem o en una
hoja independiente:

Item 1 Opciones A B1 C D E
Superior 10 0 6 3 1 0
Inferior 10 3 2 2 3 0

1. Estime la dificultad del tem, determinando el porcentaje de estudiantes que respondie-


ron correctamente. El procedimiento ms sencillo consiste en fundamentar la estimacin
solamente en los estudiantes incluidos en los grupos de anlisis de tems. As pues, sume
los totales de los grupos superior e inferior (10 + 10 = 20); sume los nmeros de eleccio-
nes de la respuesta correcta (para el tem 1, de arriba, 6 + 2 = 8); divida la primera suma
entre la segunda y multiplique por 100, de la siguiente manera:

Indice de dificultad = 8 x 100 = 40 %


20

Aunque nuestro clculo se basa solamente en los grupos superior e inferior se aproxi-
ma mucho a la estimacin que se obtendra con el grupo total. As pues, vale decir que el
ndice de dificultad de este tem es del 40 % (para este grupo particular). Ntese que, como
la dificultad se refiere al porcentaje de veces que se responde correctamente al tem, un
porcentaje menor indica mayor dificultad del tem.

2. Estime el poder discriminativo de tem , comparando el nmero de estudiantes de los


grupos superior e inferior que respondieron correctamente. Se puede apreciar en el ejem-
plo anterior que seis estudiantes del grupo superior y dos del inferior eligieron la respues-
ta correcta. Esto indica discriminacin positiva puesto que el tem discrimina entre los
estudiantes de la misma manera que la puntuacin total del test. Significa que los estu-
diantes con puntuaciones altas en el test (grupo superior) acertaron en el tem ms fre-
cuentemente que los estudiantes con puntuaciones bajas (grupo inferior).

Aunque el anlisis por inspeccin puede ser todo lo que se necesite, para la mayora de
los propsitos se puede calcular fcilmente un ndice de discriminacin. Simplemente

203
hay que restar el nmero del grupo inferior, correspondiente a los estudiantes que acerta-
ron en el tem, del nmero del grupo superior, relativo a los aciertos, y dividir entre el
nmero correspondiente a cada grupo. De tal manera, en nuestro tem de muestra, el
clculo habr de ser as:

Indice de discriminacin = 6 - 2 = 0.40


10

Ntese que el poder de discriminacin del tem se representa con una fraccin decimal.
El mximo poder discriminativo positivo se indica con un ndice de 1.00. Este se obtiene
solamente cuando todos los estudiantes del grupo superior eligen la respuesta correcta
sin que lo haga ninguno del grupo inferior. Respecto de los grupos de 10, superior e
inferior, de nuestro ejemplo, la computacin del tem con mximo poder discriminativo
sera como sigue:

Indice de discriminacin = 10 - 0 = 1.00


10

Se puede ver que el tem tiene un nivel de dificultad del 50% (acertaron los diez del grupo
superior y fallaron los diez del inferior). Esto explica por qu se recomienda a los
elaboradores de test que preparen los tems con un 50% de grado de dificultad. Solamen-
te a este nivel es posible la discriminacin mxima.

Se obtiene un poder discriminativo nulo (0.00) cuando el mismo nmero de estudiantes


de ambos grupos aciertan el tem, y el poder discriminativo negativo, cuando aciertan
ms estudiantes del grupo inferior que del grupo superior. Ambos tipos de temes debern
quitarse de los test de aprovechamiento general y habr que descartarlos o mejorarlos.

3. Determine la eficacia de las respuestas de distraccin, comparando el nmero de estu-


diantes de los grupos superior e inferior que eligieron cada opcin incorrecta. Una buena
respuesta de distraccin resultar atractiva para ms estudiantes del grupo inferior que
del grupo superior. As, con nuestros datos ilustrativos del anlisis de tems, en lo que se
refiere al paso 4, las opciones A y B funcionan eficazmente, la opcin C es deficiente
porque atrajo a ms estudiantes del grupo superior y la opcin E es totalmente ineficaz
por no haber sido atractiva para ninguno. Un anlisis de ese modo es til para evaluar un
tem y, cuando se le combina con la inspeccin del mismo, proporciona informacin muy
til para mejorarlo.

Los pasos anteriores del procedimiento para analizar tems se pueden modificar para que
se ajusten a situaciones particulares. En ciertos casos todo lo que se necesitar ser una
inspeccin de los datos en lugar de computar la dificultad y el poder discriminativo. Asi-
mismo, al seleccionar los grupos superior e inferior puede ser conveniente, si se trata de

204
un grupo numeroso, tomar el 25 % superior y el 25 % inferior, o en el caso de un grupo
pequeo, las mitades superior e inferior del grupo. Lo importante es utilizar una parte del
grupo lo suficientemente numerosa para que arroje informacin de utilidad. Con los tests
de aprovechamiento aplicados en la clase rara vez se justifica seleccionar el 27 % supe-
rior y el 27 % inferior del grupo (como se recomienda para un anlisis ms fino) y aplicar-
les otros afinamientos estadsticos.

Como interpretar los datos del anlisis de tems

Como se utiliza un nmero de estudiantes relativamente pequeo cuando se analizan


test aplicados en la clase, se debe interpretar muy cuidadosamente la informacin del anli-
sis de tems. Es de esperarse que tanto la dificultad como el poder discriminativo de un tem
varen de uno a otro grupo. As pues, no parece prudente determinar un grado mnimo de
poder discriminativo para seleccionar los tems o para distinguir entre ellos con base en dife-
rencias pequeas en cuanto a sus ndices de discriminacin. En igualdad de circunstancias,
debiramos preferir los tems con un 50 % de grado de dificultad, e igualmente los que ten-
gan el mayor poder discriminativo. No obstante, la naturaleza provisional de nuestros datos
demanda que permitamos un amplio margen de error. Si un tem proporciona un ndice posi-
tivo de discriminacin, si todas las opciones funcionan eficientemente y si el tem mide un
resultado educativamente significativo, entonces deber conservrsele en el archivo de temes
con miras de usarlo en el futuro.

Cuando se archivan los tems y se vuelven a usar despus de cierto tiempo, es reco-
mendable registrar en la tarjeta correspondiente cada vez que se le utiliza, los datos del
anlisis de tems. Si se coleccionan tales datos se podr observar la variabilidad de los ndi-
ces de dificultad y poder discriminativo del tem y, por tanto, ser ms fcil interpretar la
informacin.

205
CRITERIOS PARA JUZGAR LA CALIDAD
DE UN ITEM

A. Poder discriminativo de los tems (D)


Ideal Real

1. Alto (0,40 ms) Ms de 30%

2. Moderado (0,20- 0,39) Menos de 25%

3. Bajo (0,01- 0,19) Menos de 15%

4. Cero negativo Menos de 5%

B. Dificultad de los tems (p)

1. Superior (45- 65) Ms de 40%

2. Moderada (30- 44
66- 85) Menos de 30%

3. Pobre (0- 29
86- 100) Menos de 10%

206
CRITERIOS PARA JUZGAR LA CALIDAD
DE UNA PRUEBA

A.Poder discriminativo

0,40 y ms Muy bueno

0,30- 0,39 Razonablemente bueno

0,20- 0,29 Marginal

Menos de 0,19 Pobre; para eliminar revisar

B.Dificultad

45- 65% ptimo

30- 44 Ms bien difcil

66- 85 Ms bien fcil

0- 29 Muy difcil

86- 100 Muy fcil

207
RELACIONES ENTRE DIFICULTAD Y DISCRIMINACIN
p q Mara del C. Malbrn

.99 .01

.95 .05

.90 .10

.85 .16

.80 .20

.75 .26

.70 .30

.65 .35

.60 .40

.55 .35

.50 .50

.45 .40

.40 .35

.35 .30

.30 .25

.25 .21

.20 .15

.15 .11

.10 .05

208
CONSTRUCCIN DE PRUEBAS
PRESENTACIN DEL INFORME DE RESULTADOS

Mara del C. Malbrn

1. Formulacin de los objetivos generales del instrumento.


2. Caracterizacin del grupo a que est destinado.
3. Especificaciones de contenido y objetivos (puede adoptar la forma que se considere con-
veniente: cuadro, lista, etc.)
4. Espcimen del instrumento y de la clave de respuestas con los puntajes asignados si
correspondiera.
5. Anlisis estadstico de los tems.
6. Estudio de la eficiencia de los tems y del instrumento como un todo.
7. Sugerencias para su mejoramiento y utilizacin posterior.

209
GLOSARIO DE TRMINOS RELACIONADOS
CON MEDICIN
(Traducido de A Glossary of 100 Measurement Terms de Roger T. Lenon, Director Test
Department. Harcourt, Brace and World Inc.)
Instituto de Investigaciones Educativas (Universidad de Chile)

Presentamos este glosario de trminos con el doble propsito de dar una informacin
inicial sobre algunos conceptos bsicos y de ofrecer un material de consulta breve y de fcil
manejo que ser til en las diferentes etapas del estudio de la medicin educacional y psico-
lgica.

Las definiciones estn tomadas de obras de la especialidad. En aquellos casos en que


existen discrepancias se anotarn las diferentes acepciones de los trminos.

Anlisis de tems. El proceso de evaluar cada uno de los tems mediante diferentes mto-
dos, por lo general implica la determinacin del grado de dificultad, su poder de discri-
minacin y a menudo, su correlacin con algn criterio.

Anlisis factorial. Cualquiera de los diversos mtodos empleados para analizar las
intercorrelaciones entre un conjunto de variables, tales como los puntajes de un test.
El anlisis factorial trata de explicar las interrelaciones en trminos de algunos facto-
res subyacentes, cuyo nmero es de preferencia menor que el de las variables origi-
nales. Revela qu cantidad de la variacin en cada una de las medidas originales es
producida, o se relaciona con cada uno de los factores hipotticos. El anlisis factorial
ha contribuido a la comprensin de la organizacin o de los componentes de la inteli-
gencia, de las aptitudes y de la personalidad, y ha sealado el camino para la cons-
truccin de tests ms puros para los diversos componentes

Aptitud. Una combinacin de habilidades y otras caractersticas innatas o adquiridas, que


indicara la habilidad de un individuo para aprender en un rea determinada. Por ej.:
aptitud musical se referir en trminos generales a la combinacin de caractersti-
cas fsicas y mentales, factores de motivacin y posiblemente otras caractersticas,
que conducen a adquirir eficiencia en el campo musical. Algunos excluyen de este
concepto los factores de motivacin, pero se prefiere la acepcin ms general. El
profano puede pensar que aptitud slo se refiere a alguna capacidad innata; pero el
trmino ya no tiene una excepcin tan restringida en psicologa ni en medicin.

Aptitud acadmica. La combinacin de habilidades innatas y adquiridas que se requiere


para el trabajo escolar; probabilidad de xito para dominar el trabajo acadmico a
partir de la medicin de las habilidades necesarias.

210
Asimetra. La tendencia de una distribucin a alejarse de la simetra o equilibrio alrededor
del medio.

Batera. Un conjunto de tests estandarizados en la misma poblacin, de tal modo que los
resultados de los diferentes tests sean comparables; a veces, inadecuadamente se
designa al grupo de tests que se aplican juntos, aunque no hayan sido estandarizados
en los mismos sujetos.

Campo de variacin. La diferencia entre el puntaje mnimo y mximo obtenido en un test por
un grupo de individuos.

Coeficiente de confiabilidad. El coeficiente de correlacin entre dos formas de un test,


entre puntajes de varias administraciones de un mismo test o entre las mitades de un
test, corregido con el mtodo adecuado. Estos tres coeficientes miden aspectos lige-
ramente distintos de la confiabilidad, pero a todos se les conoce, con justa razn,
como coeficientes de confiabilidad (ver coeficiente de formas paralelas, coeficiente
impar, coeficiente retest y formula (s) Kuder y Richardson.

Coeficiente de retest. Un tipo de coeficiente de confiabilidad que se obtiene aplicando el


mismo test dos veces con un breve intervalo y correlacionando los dos grupos de
puntajes.

Coeficiente de correlacin. (r) Una medida del grado de relacin o de correspondencia


entre dos grupos de medidas para el mismo grupo de individuos. El coeficiente de
correlacin utilizado con mayor frecuencia en la construccin de tests y en la investi-
gacin educacional se conoce como r de Pearson, denominado as en honor a su
creador Karl Pearson, o como r producto-momento para destacar la base matemti-
ca de su clculo. A menos que se especifique en otra forma, correlacin por lo co-
mn significa el coeficiente de correlacin producto-momento que vara entre 0,00
denotando ausencia total de relacin y 1,00 denotando correspondencia perfecta, po-
sitiva o negativa.

Coeficiente par-impar. Un coeficiente de confiabilidad obtenido por la correlacin entre los


puntajes de una mitad y los de la otra mitad de un test. Generalmente, pero no siem-
pre, las dos mitades estn compuestas de tems de nmeros pares o impares.

Coeficiente producto- momento. Ver coeficiente de correlacin.

Confiabilidad. El grado en que un test es consistente al medir lo que mide; confianza, esta-
bilidad, ausencia relativa de errores de medicin. Comnmente la confiabilidad se
estima por medio de algunos de los coeficientes de confiabilidad o por medio del error
estndar de medicin.

Confiabilidad basada en formas paralelas. El grado de correspondencia o correlacin en-


tre los resultados de formas alternativas (es decir no equivalentes) de un test. Por lo

211
tanto, una medida del grado en que las dos formas son consistentes o confiables al
medir la variable, suponiendo que las habilidades de los examinados no varan entre
las dos aplicaciones (ver confiabilidad, coeficiente de confiabilidad y errores de medi-
cin).

Correccin del factor azar. Una reduccin de puntaje para las respuestas incorrectas, algu-
nas veces aplicada al computar tems de verdadero y falso o de seleccin mltiple.
Muchos han puesto en duda la validez o utilidad de esta tcnica que tiene como pro-
psito evitar la adivinacin y dar rangos ms exactos para los examinados en trmi-
nos de su verdadero conocimiento. Los puntajes a los que se han aplicado tales co-
rrecciones, por ejemplo - restar las respuestas incorrectas a las correctas, o una frac-
cin de las incorrectas; a menudo son denominadas correccin del factor azar.

Correlacin. Relacin o correspondencia entre dos puntajes o medidas; tendencia de un


puntaje a variar en forma concomitante con otro. La existencia de una estrecha rela-
cin, es decir, de una alta correlacin entre dos variables no indica necesariamente
que una tenga relacin causal sobre la otra. (ver coeficiente de correlacin).

Criterio. Una pauta por medio de la cual puede juzgarse o evaluarse un test; un conjunto de
puntajes, apreciaciones, etc., que el test predecira o con los cuales se correlacionara.

Cuartil. Uno de los tres puntos que dividen los casos de una distribucin en cuatro grupos
iguales. El cuartil menor, o percentil 25, distingue el cuarto inferior del grupo; el
cuartil medio corresponde al percentil 50 (p mediana); y el tercer cuartil o percentil
75, indica el cuarto superior.

Curva pulida. Una curva pulida trazada por el promedio o puntajes medios de grupos de
edad o de cursos sucesivos o por los percentiles de un solo grupo. (ver el cuadro 1
bajo el ttulo de extrapolacin).

Decil. Cualquiera de los nueve puntos que dividen una distribucin en diez partes iguales
cada dcimo percentil. El primer decil es es dcimo percentil, el noveno decil es el
nonagsimo perceptil, etc.

Desviacin. La cantidad en que un puntaje difiere de un punto de referencia, tal como la


media, la norma o el puntaje en otro test.

Diagrama analtico de un curso. Un diagrama, por lo general, preparado en relacin a una


batera de tests de rendimiento, que muestra en desempeo relativo de los miembros
de un curso en las diferentes partes de la batera.

Desviacin estndar. Una medida de la variabilidad o dispersin de un conjunto de puntajes.


Cuanto ms se aglomeran los puntajes alrededor del promedio, menor es la desvia-
cin estndar.

212
Distribucin (de frecuencias). Una tabulacin de los puntajes de mayor a menor o de menor
a mayor que muestra el nmero de individuos que han obtenido cada puntaje o caen
dentro de cada intervalo de puntajes.

Distribucin normal. Una distribucin de puntajes o medidas que en una representacin


grfica presenta una curva simtrica. El cuadro muestra un grfico de la distribucin
normal, conocida como curva normal o curva de probabilidades. En una distribucin
normal, los puntajes o medidas se distribuyen en forma simtrica alrededor del pro-
medio, con igual nmero de casos a diferentes distancias por sobre y por debajo de la
media. En ella, los casos se concentran cerca del promedio y disminuyen en frecuen-
cia a medida que se alejan de l segn una ecuacin matemtica. La suposicin que
las caractersticas mentales y psicolgicas se distribuyen normalmente ha sido muy
til en el desarrollo de un test.

34,1 34,1
Frecuencia

15,9 15,9

-1 D.S. Md + 1 D.S.
Variable
Curva normal, se muestran las reas bajo la curva que
corresponden a distancias de t 1 desviacin estndar.

Edad mental (E. M.). Edad en la cual un cierto puntaje es el promedio en un test de inteligen-
cia. Si un puntaje de 55 en un test de inteligencia corresponde a una edad mental de
6 aos 10 meses, luego 55 es el puntaje medio que obtendra un grupo no selecciona-
do de nios de 6 aos 10 meses.

Edad modal. La edad, o edades, que es ms tpica o caracterstica de los alumnos de un


curso determinado.
Equivalente de curso. El nivel de curso para el cual un puntaje determinado es el promedio
real o estimado.

Error de medicin o error estndar. Una estimacin de la magnitud del error de una medi-
cin o puntaje, el valor en que un puntaje obtenido difiere de otro verdadero hipotti-
co. El error estndar es un valor tal que en dos tercios de los casos el puntaje obteni-
do no diferir en ms de un error estndar del puntaje verdadero. Error probable de un
puntaje es una medida similar excepto en que en la mitad de los casos el puntaje

213
obtenido difiere del verdadero en no ms de un error probable. El error probable es
igual a dos tercios del error estndar. Cunto mayor sea el error probable o error
estndar de un puntaje menos confiable ser la medida.

Efecto de la prctica. La influencia ejercida en la aplicacin de un test por su conocimiento


previo de parte del examinado, tambin puede darse como resultado de experiencias
en un test similar al administrado; generalmente, un aumento en el puntaje en la se-
gunda aplicacin, atribuido a un mayor conocimiento de las instrucciones, tipo de pre-
guntas, etc. El efecto de la prctica es mayor cuando el intervalo entre cada aplica-
cin es pequeo, cuando los materiales de los dos tests son muy similares o cuando la
aplicacin inicial constituy una experiencia novedosa para los sujetos.

Error probable. (ver error estndar).

Extrapolacin. En general, cualquier proceso de estimar valores de una funcin ms all del
margen de los datos disponibles. En relacin a las normas de un test, es el proceso de
extender las normas ms all de los lmites de los datos obtenidos, o por mtodos
menos rigurosos, usualmente grficos. En este proceso de extrapolacin el juicio de
la persona que confecciona el test ejerce una marcada influencia, por ello se conside-
ra que los valores de las normas extrapoladas son un tanto arbitrarias.

Factor (en medicin mental). Un rasgo hipottico, habilidad o componente de una habili-
dad, que subyace e influencia el desempeo de uno o ms tests y por lo tanto hace
que los puntajes de los tests se correlacionan. El trmino factor se refiere, en senti-
do estricto, a una variable terica derivada por un proceso de anlisis factorial de
una tabla de intercorrelaciones entre los test; pero tambin se emplea comnmente
para designar la interpretacin psicolgica dada a la variable, tal como habilidad ver-
bal, habilidad numrica, etc.

Forma paralela. Cualquiera de las dos formas de un test que es estrictamente equivalente en
contenido y dificultad de sus tems. Debido a que las frmulas de Kuder-Richardson
permiten una estimacin de la confiabilidad con una sola administracin del test y sin
dividir el test en dos mitades, su uso se ha hecho comn en la construccin de test.
Las frmulas Kuder-Richardson no son apropiadas para estimar la confiabilidad de los
tests de velocidad.

Frmula Spesrman- Brown. Una frmula que permite obtener la relacin entre la confiabilidad
de un test y su longitud. Por medio de ella se logra una estimacin de la confiabilidad
de un test, que ha sido alargado o acortado en cierta medida, a partir de la confiabilidad
conocida de un test de longitud determinada. Se emplea comnmente para estimar la
confiabilidad de todo un test basndose en la correlacin entre sus dos mitades
(confiabilidad par-impar).

Grado de dificultad. El porcentaje de un grupo, tal como los estudiantes de un cierto curso
o edad, que corresponden correctamente a un tem.

214
Interpolacin. En general, cualquier proceso para estimar valores intermedios entre dos puntos
conocidos. Tal como se aplica a las normas de un test, se refiere al procedimiento
empleado para asignar valores estimados (inferidos) (por ejemplo curso o edad equi-
valentes) a los puntajes entre los sucesivos puntajes medios reales obtenidos en el
proceso de estandarizacin. Al leer las tablas de normas, a veces, es necesario inter-
polar para obtener un valor normativo para un puntaje que est ubicado entre dos en
una tabla; por ejemplo en la que aparece a continuacin, a una edad de 12,5 se le
asignara, por interpolacin, un puntaje de 118 (ver cuadro nmero 1 bajo el ttulo de
extrapolacin).

Puntaje Equivalente en edad


120 12,6
115 12,4
110 12,2

Inventario. (Referente a los tests de rendimiento). Un test que trata de abarcar en forma ms
o menos completa alguna unidad de instruccin o adiestramiento relativamente pe-
quea. El propsito de un inventario, tal como lo sugiere su nombre, es ms bien de
hacer un recuento del conocimiento o destreza de un individuo antes de un esfuerzo
para medir, en el sentido usual. El trmino a veces designa un test empleado para
medir el nivel de rendimiento anterior a la instruccin. Muchos cuestionarios de perso-
nalidad y de intereses se han denominado inventarios, puesto que evalan el nivel
de un individuo en diferentes caractersticas personales, o su nivel de inters en una
variedad de tipos de actividades.

Item. Una pregunta, ejercicio o problema de un test.

Item de evocacin. Un tem que exige al examinado recordar la respuesta correcta basndo-
se en su memoria. Por ejemplo Coln descubri Amrica en a) 1425, b) 1492, c)
1520, d) 1546.

Item de reconocimiento. Un tem que exige al examinado reconocer o seleccionar las res-
puestas correctas entre dos o ms respuestas dadas.

Item de respuestas mltiples. Un tipo especial de tem de seleccin mltiple en el cual dos
o ms alternativas pueden ser correctas.

Item de seleccin mltiple. Un tem de un test en el cual la tarea del examinado consiste en
elegir la respuesta correcta, o la mejor respuesta, entre varias respuestas u opciones
dadas.

Item de trminos pareados. Un tem que requiere la correcta asociacin de cada alternativa
de una lista con otra alternativa en una segunda lista.

215
Media. (ver media aritmtica).

Media aritmtica. La suma de un conjunto de puntajes dividida por el nmero de dichos


puntajes (comnmente denominado promedio). El cociente entre la suma de todos los
puntajes y el nmero de los puntajes.

Mediana. El valor de la variable bajo y sobre el cual queda el cincuenta por ciento de los
casos. El percentil 50, punto que divide el grupo en dos partes iguales. En la repre-
sentacin grfica la vertical que pasa por el valor de la mediana divide al grfico en
dos partes iguales.

Modo. El puntaje o valor que aparece con mayor frecuencia en una distribucin.

Muestra al azar. Una muestra de los miembros de una poblacin diseada en tal forma que
cada uno de los miembros de ella tenga oportunidad de ser includo, es decir, construda
de modo que excluya la seleccin y las operaciones viciadas. El propsito de estas
operaciones es obtener una muestra suficientemente representativa de la poblacin
para que los resultados obtenidos con ella puedan ser generalizados respecto a la
poblacin. Una de las grandes ventajas de las muestras al azar es la existencia de
frmulas para estimar la variacin esperada entre los valores de la muestra y de sus
verdaderos valores en la poblacin total; en otras palabras, gracias a estas frmulas
sabemos cun precisa ser una estimacin del valor de la poblacin por medio de una
muestra al azar de un tamao dado.

Muestra representativa. Una muestra que corresponde o est de acuerdo a la poblacin de


la cual constituye muestra respecto a aquellos aspectos importantes para los propsi-
tos de una investigacin, por ejemplo, en la muestra utilizada para obtener las normas
de un test de rendimiento, caractersticas como la proporcin de alumnos de cada
provincia, regin, escuelas fiscales y particulares, etc.

N. es el smbolo empleado comnmente para designar el nmero de casos en una distribu-


cin, estudio, etc.

Normas. Estadsticas (por lo general percentiles o promedios), que describen el desempeo


de ciertos grupos tales como alumnos de diversas edades o cursos, en el grupo de
estandarizacin de un test. A menudo se supone que las normas son representativas
de una poblacin mayor, como el alumnado total de un pas. Las normas describen el
desempeo promedio o tpico; no se deben considerar como patrones ni como niveles
deseables de rendimiento.

Normas de curso. El puntaje promedio obtenido por los alumnos de un determinado curso.
(ver normas, edad modal)

Normas de edad. Valores que representan el desempeo tpico o promedio comn de las
personas de diferentes grupos de edad.

216
Normas de edad modal. Normas basadas en el rendimiento de alumnos en edad modal de
sus respectivos cursos; normas que estn libres de la influencia distorsionada de alum-
nos bajo o sobre el nivel de su curso.

Percentil (P). Un punto de una distribucin bajo el cual queda el porcentaje de casos indica-
do por cada percentil. As P 15 designa el puntaje o punto bajo el cual queda el 15% de
los casos. El percentil no tiene relacin alguna con el porcentaje de respuestas
correctas que un individuo obtiene en un test.

Perfil. Una representacin grfica de los resultados de diversos tests, ya sea de un individuo
o de un grupo, cuando los resultados han sido expresados en trminos uniformes o
comparables. Este mtodo de representacin permite una fcil identificacin de reas
de eficiencia o deficiencia.

Poder discriminativo. La capacidad de un tem para diferenciar entre personas que presen-
tan un rasgo en forma marcada y aqullas que lo presentan en forma dbil.

Problemas de completamiento. Una pregunta de un test que requiere la completacin de


una frase, oracin, etc., de la cual una o ms partes se han omitido.

Problemas de seleccin. En sentido amplio cualquiera de los tems de seleccin mltiple en


el que se pide al examinado que seleccione una o ms de las alternativas dadas. En
sentido ms estricto se emplea el trmino para sealar un tipo de tem de seleccin
mltiple en el cual las opciones o alternativas son: 1) de igual valor de preferencia,
es decir, elegidos con igual frecuencia por un grupo tpico; 2) de capacidad
discriminativa diferente, es decir, tal que slo una de las opciones discrimine entre las
personas ubicadas en un nivel superior e inferior en cuanto al factor que mide esta
alternativa.

Problemas de verdadero - falso. Una pregunta o ejercicio de un test en la cual la tarea del
sujeto consiste en indicar si una afirmacin es verdadera o falsa.

Puntaje bruto. El primer resultado cuantitativo obtenido al computar un test. Generalmente


es el nmero de respuestas correctas, el nmero de respuestas correctas menos una
cierta fraccin de incorrectas, el tiempo requerido para ejecutar una tarea, el nmero
de errores u otras medidas directas, no transformadas y no interpretadas, similares a
las anteriores.

217
Puntaje estndar. Un trmino general que se refiere a la transformacin de puntajes brutos
por razones de conveniencia, comparabilidad, facilidad de interpretacin, etc. El puntaje
estndar ms simple es el que expresa la desviacin de un puntaje promedio en rela-
cin a la desviacin estndar de ese grupo. En otras palabras:

Puntaje bruto (X) - promedio


Puntaje estndar (z)=
DESVIACIN ESTNDAR

Multiplicando esta razn por una constante apropiada y al sumar o restar otra cons-
tante puede obtenerse cualquier puntaje estndar que tenga la media y la desviacin
estndar deseada. Tales puntajes estndar no afectan la posicin relativa de los indi-
viduos en el grupo ni tampoco cambian la forma de la distribucin original. Tipos ms
complicados de puntaje estndar prevn distribuciones que difieren de la distribucin
original, en cuanto a la forma; en realidad a veces se usan precisamente con este
propsito. Ejemplos de este ltimo grupo son los puntajes estndar normalizados.

Puntaje verdadero. Un puntaje completamente libre de errores de medicin. Es un valor


hipottico que nunca se obtiene en la aplicacin de un test, pues siempre existe algn
error de medicin. A veces se define como el puntaje promedio en una serie de medi-
ciones obtenidas con los mismos tests o con tests exactamente equivalentes, supo-
niendo que no ha habido cambio o efecto de la prctica en el examinado durante las
aplicaciones.

r. (ver coeficiente de correlacin).

Rango-percentil. (asignacin de rango a travs de percentiles). El porcentaje de puntajes de


una distribucin igual o menor al porcentaje correspondiente a un rango dado.

Sociometra. La medicin de las relaciones interpersonales existentes entre los miembros


de un grupo. Por medio de tcnicas sociomtricas (el sociograma) se ha tratado de
descubrir esquemas de eleccin y de rechazo entre los individuos que componen un
grupo: cules son escogidos ms a menudo como amigos o dirigentes (estrellas)
cules son los rechazados por otros (aislados), la organizacin del grupo en pandillas
o subgrupos.

Tcnica proyectiva. (mtodo proyectivo). Una tcnica de estudio de la personalidad en el


cual el sujeto responde libremente a una serie de estmulos tales como manchas de
tinta, dibujos, frases inconclusas, etc. Recibe este nombre debido a la suposicin b-
sica que la sustenta; ella dice que la respuesta libre permite al individuo proyectar
las caractersticas de la organizacin de su personalidad, las cuales pueden ser com-
putadas e interpretadas por medio de procedimientos adecuados. Se obtiene as una
descripcin de la estructura bsica de su personalidad. El test de manchas de tinta de
Rorschach y el test de Apercepcin Temtica son las tcnicas proyectivas ms co-
mnmente usadas.

218
Test colectivo. Un test que puede aplicarse a un grupo de individuos al mismo tiempo y con
un solo examinador.

Test de capacidad. Un test que tiene como objeto medir el nivel de capacidad sin considerar
la rapidez en la respuesta; por lo tanto, un test en el cual el lmite de tiempo es largo
o para el cual no hay lmite de tiempo.

Test de diagnstico. Un test utilizado para localizar reas especficas de dificultad o de


potencialidad y para determinar la naturaleza de las dificultades. Provee medidas de
los componentes o subpartes de un conjunto mayor de habilidades. Los tests diagns-
ticos de conocimiento se emplean con frecuencia en reas especficas de contenido.

Test individual. Un test que se administra a una persona por vez.

Test de ejecucin. Un test que requiere una respuesta motora o manual por parte del exami-
nado. El trmino test de ejecucin tambin se usa para designar una verdadera si-
tuacin de trabajo donde la respuesta al test es idntica a la conducta sobre la cual se
desea obtener informacin.

Test de madurez. (Desarrollo, disposicin). Un test que mide el grado en el cual un individuo
ha adquirido cierto grado de madurez, ciertas habilidades o informaciones necesarias
para llevar a cabo con xito alguna actividad nueva de aprendizaje. As, un test de
madurez para la lectura indica el grado en que el nio ha alcanzado el grado de desa-
rrollo que le permite comenzar con xito un programa de aprendizaje formal de la
lectura.

Test de personalidad. Un test que tiene como objetivo medir aspectos no intelectuales de la
estructura mental o psicolgica de un individuo. Los tests de personalidad compren-
den los llamados inventarios de personalidad o inventarios de adaptacin que tratan
de medir el grado en que se presentan rasgos tales como: dominio, sociabilidad, intro-
versin, etc., por medio de respuestas auto - descriptivas a una serie de preguntas.
Tambin encontramos aquellas escalas de clasificacin que exigen clasificar, sea el
mismo interesado u otro, segn el grado en que se posee cierta caracterstica. Los
test situacionales en las cuales uno o varios jueces observan la conducta de un indivi-
duo en situaciones similares a las de la vida real y las evalan en relacin a diversos
rasgos de la personalidad. Algunos autores tambin clasifican los inventarios de inte-
reses como tests de personalidad.

Test de conocimiento. Un test que mide el grado en que una persona ha adquirido informa-
cin, por lo general como resultado de instruccin especfica.

Test de pronstico. Un test usado para predecir el xito o fracaso futuro en un campo o
asignatura especfica.

219
Test estandarizado. Una muestra sistemtica del desempeo, obtenida bajo condiciones
establecidas, computadas de acuerdo a reglas fijas y susceptible de evaluacin con
referencia a informaciones normativas. Algunos escritores usan el trmino para desig-
nar a los tests experimentales para los cuales existe evidencia de validez y
confiabilidad.

Validez El grado en que un tests cumple con el propsito para el que se utiliza. Tiene diferen-
tes significados para diversos tipos de tests y, por lo tanto, son apropiadas diferentes
evidencias de validez; por ejemplo:

1. La validez de un tests de rendimiento es el grado en que representa una muestra


equilibrada y adecuada de los resultados (conocimientos, etc.) que un curso o un pro-
grama educacional intentaba cubrir (validez de contenido). Se evidencia de mejor
forma por medio de una comparacin del contenido del tests con programas de estu-
dio, materiales de instruccin y exposiciones de los objetivos educacionales por me-
dio de un anlisis crtico del proceso requerido para responder a los tems.

2. La validez de un test de aptitud, de pronstico o de madurez es el grado en el cual


indica el futuro xito en el aprendizaje en el rea para la cual se usa como predictor
(Validez predictiva). Se evidencia por medio de las correlaciones entre los puntajes
del test y el xito posterior.

3. La validez de un test de personalidad es el grado en el cual provee una descripcin de


los rasgos de personalidad o de la organizacin de la personalidad de un individuo.
Puede evidenciarse por medio de la correspondencia entre los resultados del test y
otros tipos de evaluacin, tales como apreciaciones o clasificaciones clnicas; en este
caso la evidencia ser mayor o menor de acuerdo al grado de validez del criterio
utilizado. La definicin tradicional de validez el grado en que un test mide lo que
pretende medir, se considera poco satisfactoria, pues no enfatiza el hecho de que la
validez de un test se refiere especficamente a los propsitos con que se usa y que
diferentes evidencias permiten apreciar la validez de tests tambin diferentes. La va-
lidez de un tem se refiere al poder discriminativo, a su habilidad para distinguir entre
las personas que exhiben una caracterstica en forma marcada y aquellas que lo po-
seen en menor grado.

220