VII. Medir, Calificar, Evaluar. ¿Es Lo Mismo?: Aprendizaje y Evaluación, México, FCE

Texto N°1 de la Bibliografía ampliatoria
Amigues, R. y Zerbato-Poudou, M.T. (1999): Las prácticas escolares de

aprendizaje y evaluación, México, FCE
VII. Medir, Calificar, evaluar. ¿Es lo mismo?
Muy a menudo los profesores principiantes se desconciertan ante los rasgos

de las prácticas de evaluación. Se preguntan si han de hacer lo mismo
cuando califican o evalúan y si se enfrentan o no a realidades diferentes;
¿evaluar es medir?; ¿se puede evaluar sin medir? Sí es así, ¿cómo pueden
compararse evaluaciones diferentes?,. ¿La calificación es una medición o
una evaluación?. ¿Sobre qué se fundamentan estas distinciones; tienen
consecuencias prácticas? Por ejemplo, la calificación cifrada, comúnmente
utilizada, ¿se basa en una escala de medición?, ¿Cómo explicarle a un
alumno lo que habría tenido que hacer para obtener el promedio cuando
sólo tiene 8? ¿Qué justificaciones darle a tal otro porque sacó 9,5 cuando
tanto uno como el otro piensan que sus exámenes son comparables?
Para contestar de manera informada a este tipo de preguntas presentamos

primero un punto de vista técnico y petrológico, ya que constituyó el
fundamento esencial de las críticas a los procedimientos de evaluación
utilizados por los maestros.
La calificación y la medición: Las diferentes escalas.
De manera general, por medición se entiende “todo proceso que permite

asignar números a sujetos que respeten y representen algunas
propiedades” (Doron y Parot, 1991). En el campo escolar, la práctica de la
calificación emplea escalas de calificación para comparar los diversos
desempeños realizados por los alumnos, así como los criterios y las normas
a partir de los cuales se toman las decisiones. Esta parte ofrecerá
referencias y precisará las relaciones que mantienen las calificaciones, la
medición y los actos de evaluación.
En general, la medición de un objeto o de un fenómeno se vincula con la

escala de medición usada, y la descripción o la representación que se hará
de él, con mayor o menor precisión, dependerá del tipo de escala empleada.
En otras palabras, la naturaleza de las informaciones obtenidas, utilizadas y
transmitidas por el maestro dependerá íntimamente de los instrumentos de
evaluación utilizados y, en particular, de las escalas de calificación. Existen
cuatro tipos de escala, que presentaremos rápidamente.
La escala nominal permite distribuir los objetos en clases o categorías

determinadas por criterios distintivos. Por ejemplo, distribuir a individuos
conforme a su profesión o a su nivel socioeconómico (las categorías
socioprofesionales propuestas por el Instituto Nacional de Estadísticas y
Estudios Económicos resultan de este tipo de escala) A veces estas
categorías se designan por medio de números independientes de su
propiedad matemática; son “números” de categorías o un medio para
codificarlas conforme a un orden. Por ejemplo, designar a los varones con
un 1 y a las niñas con un 2. En cambio, esta clasificación permite
simplemente clasificar a los varones y a las niñas en dos categorías
excluyentes y obtener así una distribución de la población de un
establecimiento escolar; por ejemplo, y buscar la clase en la que la
efectividad es mayor. El uso de este tipo de escala permite representar
observaciones (en forma de cuadros, de histogramas…) y hacer
comparaciones entre distribuciones desiguales de observaciones. Sin
embargo, este tipo de escala sigue siendo más circunstancial que
sistemático en las prácticas escolares de los maestros.
La escala ordinal permite ordenar los objetos conforme a cierto orden a

partir de un criterio dado, como por ejemplo la estatura. En este caso, es
importante señalar que la distancia –o el intervalo- entre dos objetos
vecinos no se precisa. Así sucede con la distancia entre trabajos similares
clasificados conforme a un orden de preferencia, o entre obras literarias
seleccionadas por un jurado. Sucede también con ciertas boletas escolares
que utilizan las categorías A,B,C,D,E (donde A reúne a los muy buenos
alumnos y E a los menos buenos de una clase) para indicar la pertenencia
de un alumno particular a una categoría, o para dar una imagen de los
rendimientos de la clase. Pero el intervalo entre dos categorías no se define.
Desde un punto de vista teórico, este tipo de escala no permite calcular un

promedio aritmético. Sin embargo, esta clase de limitante teórica no
siempre es compatible con las “categorías del entendimiento profesoral”
(Bourdieu y Saint-Martín, 1965) cuyo deseo es muy a menudo afinar los
juicios de evaluación relativos a los rendimientos de los alumnos. Así sucede
cuando estas categorías se utilizan conforme al modo de la “calificación
cifrada”, del tipo B++, B+, B-, B-. Pero asimismo veremos más adelante, a
propósito de otras escalas de medición, que las prácticas pedagógicas se
permiten muchas “libertades” con el rigor petrológico oficial.
Tal vez esto sucede con las prácticas de evaluación cifrada porque, al
principio, la calificación introducida por los jesuitas tenía como meta
estimular competitividad entre los alumnos de la aristocracia, y no medir los
rendimientos de estos últimos o la eficacia de la enseñanza impartida con
referencia a una norma establecida. A imagen de una competencia
deportiva, cada alumno debía aprender a medirse con los demás y, en
cierta manera, los puntos que marcaba le hacían ser consciente de su lugar
en la jerarquía social. Actualmente estos tipos de escalas constituyen un
medio de transcripción, un código que permite situar el desempeño de un
alumno, la efectividad de cada categoría, resumir informaciones relativas a
la distribución de los alumnos en la clase, con respecto a una norma o a un
nivel escolar.
La escala de intervalo introduce una limitante suplementaria: la unidad. Así,

el tamaño de la diferencia comprobada entre dos valores de una escala es
cuantitativamente igual al observado en otra parte de la escala. Por
ejemplo, los calendarios emplean este tipo de escala para proponer una
unidad de tiempo. Pero no permiten afirmar que transcurrió dos veces más
tiempo en año 1000 que en el año 500. Lo mismo sucede con la escala de
temperatura representada por el termómetro, cuyo punto de origen,
correspondiente a “cero”, se basa en una convención: la temperatura del
hielo cuando se derrite. Sin embargo, 20 grados (Celsius) no representan
dos veces 10 grados (Celsius). Para cerciorarse de ello, basta convertir
estos intervalos a la escala Kelvin para comprobar que 293 grados (Kelvin)
no son el doble de 283 grados (Kelvin). En el campo escolar este tipo de
escala, que dispone también de un origen convencional (cero) se utiliza con
frecuencia con la calificación cifrada. Ahora bien, ni los alumnos ni los
profesores piensan que un examen calificado con 17 vale dos veces el que
obtuvo 9; o que dos exámenes calificados con 9 pueden hacer uno que
valgo 18. Asimismo, nadie se sorprende de que la primera calificación
obtenida por los alumnos franceses que empiezan a aprender chino no sea
cero, cuando lo ignoran todo del idioma chino.
La escala de relación, o proporcional, dispone de un origen, y permite

entonces operaciones particulares, como el cálculo del promedio aritmético,
por ejemplo. Lo mismo sucede con las escalas de peso o de longitud, y más
generalmente con las mediciones efectuadas en el campo de las ciencias de
la naturaleza.
Sin embargo no nos equivoquemos: desde un punto de vista matemático,

las escalas de calificación que permiten evaluar los exámenes no se
asemejan a escalas de peso. Pero desde el punto de vista práctico, se
consideran escalas de peso provistas de un origen (el cero) y de una unidad
de medición, el punto. Pero un punto no es una unidad de masa o de
fuerza. Desde la perspectiva de las prácticas pedagógicas la evaluación de
los exámenes escolares se asemeja a los comentarios de los meteorólogos,
para quienes las temperaturas estarían a veces “por encima” o “por
debajo” de las “normales estacionales”.
En las ciencias sociales las escalas de relación se emplean raras veces. La

medición suele llevarse a cabo de manera indirecta, con escalas de
medición menos rígidas que en las ciencias físicas, y siempre adquiere
aspectos estadísticos (descriptivos o inferenciales). Es precisamente la
razón por la cual la evaluación escolar representa un campo particular de
investigación sobre la metodología de la medición. Con la evaluación escolar
nos encontramos constantemente en presencia de dos tipos de discurso. Por
un lado el de los docentes, cuyas evaluaciones se basan en un registro muy
amplio: apreciaciones cualitativas no ordenadas (anotaciones de copias,
apreciaciones en las boletas escolares), y ordenadas (MB,B,S…), con
apreciaciones cifradas (calificación), etc. Por otro el de los especialistas de
la medición, que intentan, por medio de un procedimiento científico,
determinar el nivel adecuado de la medición a fin de llevar a cabo
exclusivamente las operaciones apropiadas a la naturaleza de las variables
estudiadas.
Pareciera juicioso separar bien estos dos tipos de discurso, aunque sólo
fuese para evitar ambigüedades en el sentido que debe atribuirse a tal o
cual tipo de evaluación. Sin embargo, su distinción se basa necesariamente
en un mejor conocimiento de las propiedades técnicas de las herramientas
de medición utilizadas. Y tal vez es ahí donde reside la dificultad esencial.
En efecto, a semejanza de las rutinas pedagógicas, el análisis reflexivo
acerca de este tipo de práctica no se impone como una necesidad desde el
momento en que las escalas de calificaciones son de uso común, Sin
embargo, las escalas de medición no lo dicen todo. Dicen lo que pueden
decir… y hasta lo que no se desearía oír. Por ejemplo, la inteligencia
humana se mide por medio de un coeficiente intelectual (ci): la relación
entre la edad mental y la edad real. Sin embargo, convencionalmente los
rendimientos obtenidos por sujetos de un mismo grupo de edad ante una
prueba se distribuyen en una escala normalizada cuyo promedio es 100 y la
diferencia tipo 15. El ci de un sujeto es, entonces, la calificación obtenida en
dicha escala. Se trata por consiguiente de un rango, y no de un coeficiente.
Así, decir que un individuo tiene un ci de 140 es indicar una medición, su
rango en un grupo de referencia. Decir que tiene una inteligencia superior al
promedio es un juicio de valor. Se concibe fácilmente el desconcierto del
genio, revelado así por la prueba, que hubiera tal vez preferido conocer la
medición exacta de su propia inteligencia, única susceptible de dar un
testimonio objetivo de su valor personal.
Este tipo de cuestión plantea, de nuevo, la de los vínculos que unen a los
“hechos” producidos con los métodos utilizados que permiten producirlos.
Ya evocamos este problema a propósito del aprendizaje. Pero si
consideramos las escalas de calificaciones como medio de información (en
el sentido de dar forma a evaluaciones que nos esforzamos por objetivar),
puede ser interesante saber cómo funcionan estos medios, cuáles son sus
intereses y sus límites. Por ejemplo no sólo saber calcular un promedio de
calificaciones para interpretar los rendimientos de los alumnos, apreciar la
dificultad del ejercicio propuesto, o también cerciorarse de la homogeneidad
del grupo de la clase, o de su heterogeneidad.
Es evidente que las prácticas escolares de evaluación no constituyen

propiamente actos de medición, en el sentido en que se entiende el mundo
físico. Pero que dichas prácticas escolares se permiten algunas fantasías con
la medición no las vuelve condenables justamente en nombre del rigor
petrológico y merecedoras de supresión, como lo reclaman algunos.
En este caso un gran número de prácticas sociales estarían amenazadas de

erradicación. Semejante proceso de intención reduciría en gran medida el
campo de las prácticas económicas, por ejemplo. Más seriamente,
avanzaremos poco en este campo si nos atenemos a posiciones rígidas y
dicotómicas: ¡la medición o nada! En cambio, es muy diferente considerar
desde el punto de vista de la teoría de la medición las cuestiones métricas
planteadas por las prácticas escolares de evaluación. Esta última
perspectiva permitiría una mejor comprensión de las diversas funciones de
la evaluación, de los diferentes niveles de decisión y de su articulación. Es lo
que examinaremos con la noción de nivel escolar.

VII. Medir, Calificar, Evaluar. ¿Es Lo Mismo?: Aprendizaje y Evaluación, México, FCE

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

VII. Medir, Calificar, Evaluar. ¿Es Lo Mismo?: Aprendizaje y Evaluación, México, FCE

Cargado por

Copyright:

Formatos disponibles

Texto N°1 de la Bibliografía ampliatoria

Amigues, R. y Zerbato-Poudou, M.T. (1999): Las prácticas escolares de

VII. Medir, Calificar, evaluar. ¿Es lo mismo?

Muy a menudo los profesores principiantes se desconciertan ante los rasgos

Para contestar de manera informada a este tipo de preguntas presentamos

La calificación y la medición: Las diferentes escalas.

De manera general, por medición se entiende “todo proceso que permite

En general, la medición de un objeto o de un fenómeno se vincula con la

La escala nominal permite distribuir los objetos en clases o categorías

La escala ordinal permite ordenar los objetos conforme a cierto orden a

Desde un punto de vista teórico, este tipo de escala no permite calcular un

La escala de intervalo introduce una limitante suplementaria: la unidad. Así,

La escala de relación, o proporcional, dispone de un origen, y permite

Sin embargo no nos equivoquemos: desde un punto de vista matemático,

En las ciencias sociales las escalas de relación se emplean raras veces. La

Es evidente que las prácticas escolares de evaluación no constituyen

En este caso un gran número de prácticas sociales estarían amenazadas de

También podría gustarte