Está en la página 1de 4

Confiabilidad de las pruebas que organismos internacionales aplican para medir y

evaluar la calidad educativa

Introducción
A través de las pruebas estandarizadas no se puede establecer si el profesorado es eficaz o
ineficaz en el desempeño de sus funciones ya que la calidad educativa está siendo medida con
una vara equivocada dado que los puntajes de los estudiantes en las pruebas estandarizadas de
logros no suministran un indicio preciso de la eficacia de la enseñanza.
Una prueba estandarizada es cualquier examen que se administra y califica siguiendo un
procedimiento estándar predeterminado. Las pruebas estandarizadas de logros son las que se
usan para evaluar la eficacia de una escuela a partir de los puntajes obtenidos por los alumnos en
dichas pruebas.
Desarrollo
Las pruebas estandarizadas de logros son herramientas de evaluación que permiten hacer una
inferencia válida sobre los conocimientos y/o las destrezas que posee un estudiante determinado
en un área particular de contenidos. Estas normas permiten que los conocimientos y/o las
destrezas relativas de un estudiante puedan ser comparadas con las poseídas por una muestra
nacional de estudiantes de la misma edad o grado escolar.
Se cree que esas inferencias relativas del status de un estudiante respecto a su dominio de
conocimientos y/o destrezas en un área temática o asignatura particular pueden dar mucha
información a los padres y educadores, dado que dicha información puede revelar las fortalezas y
las debilidades de un niño y se puede usar para planificar una enseñanza apropiada en el salón de
clase.
Pero en realidad esto no es así y tampoco estas pruebas estandarizadas de logros pueden medir
y evaluar la calidad educativa ya que, por cuestiones de tiempo de la prueba, esta no puede cubrir
en realidad todo los conocimientos y las destrezas de un dominio, por tanto, esta prueba no puede
abarcar todos los conocimientos y/o destrezas que los chicos en cualquier grado escolar dominen.
De ahí que, las pruebas estandarizadas de logros a menudo tienen que cumplir su labor de
medición con un conjunto mucho menor de ítems a razón del poco tiempo que hay para
presentarlas y muestrean los conocimientos y/o las destrezas de una esfera o dominio de
contenidos (solo 40 o 50 ítems, a veces menos, en el campo de una asignatura).
Los diseñadores de las pruebas estandarizadas de logros crean un instrumento de evaluación
que, mediante una cantidad de ítems, se obtengan interpretaciones válidas, referidas a normas,
sobre la situación de un estudiante respecto a una porción sustancial de contenidos. Los
diseñadores buscan ítems que aproximadamente la mitad de los estudiantes respondan
correctamente para diferenciar o discriminar entre los mismos y evitan los ítems que son
respondidos correctamente por demasiados estudiantes o por muy pocos de ellos.
Las herramientas de evaluación que son muy buenas para comparar el dominio relativo de
contenidos que ha logrado un escolar con los demás escolares del país y esta herramienta podría
medir la calidad educativa si se asume que el grupo normativo (promedio) nacional es
genuinamente representativo del país.
En este sentido, en realidad es muy frecuente que estas pruebas contengan demasiados pocos
ítems como para permitir comparar significativamente fortalezas y debilidades de los estudiantes
al interior de una misma asignatura, y por ende como para medir y evaluar la calidad educativa.
Solo es posible identificar las fortalezas y debilidades relativas de los estudiantes al interior de
una misma asignatura y entre asignaturas si la prueba contiene suficientes ítems para ello, cosa
que no sucede.
A su vez, estas pruebas estandarizadas de logros tampoco permiten hacer inferencias respecto
al mejoramiento del estudiante a lo largo del tiempo en diferentes asignaturas ya que los puntajes
de los estudiantes en las pruebas estandarizadas de logros se presenten en cifras y los puntajes
pueden fluctuar.
En este orden de ideas, las pruebas estandarizadas de logros no deberían ser usadas para
evaluar la calidad de la educación, deberían usarse para hacer las interpretaciones comparativas
que se supone deben suministrar ya que estas pruebas sirven es para brindar la evidencia
necesaria para hacer interpretaciones referidas a normas respecto a los conocimientos y/o a las
destrezas de los estudiantes en relación a aquéllos de los demás estudiantes del país.
Las pruebas estandarizadas de logros no deberían ser utilizadas para evaluar la calidad de la
educación ya que cualquier inferencia acerca de la calidad educativa basada en los logros de los
estudiantes en las pruebas estandarizadas de logros tiende a no ser válida. Las razones por las
cuales no se deberían usar pruebas estandarizadas de logros para evaluar la calidad educativa,
son:
La primera razón es que hay un desajuste significativo entre lo que se enseña y lo que miden
las pruebas estandarizadas de logros. En Estados Unidos hay gran diversidad curricular ya que
los estados suelen elegir objetivos educacionales diferentes por lo que se deben elaborar pruebas
estandarizadas de logros alineadas apropiadamente a los currículos de cada estado.
Dada la sustancial diversidad curricular del país, los diseñadores de pruebas se ven obligados
a crear una serie de evaluaciones únicas que se acomoden a todos pero esto es muy difícil de
lograr. Es imposible seleccionar todos los ítems que puedan medir todos los conocimientos y
destrezas de un área de contenido que los educadores nacionales consideran importantes. De
forma que las pruebas estandarizadas incluyen muchos ítems que no están alineados con lo que
se enfatiza en la enseñanza en un contexto determinado.
Es muy probable que las pruebas cubran tópicos que no son abordados en la enseñanza en un
contexto educativo particular, es decir que no haya concordancia entre lo que evalúa la prueba y
lo que se enseña. Las pruebas estandarizadas de logros son bastante generales para hacer que las
pruebas sean aceptables para un país como EE.UU., con currículos variados por lo que no dan
cabida a alineamientos enseñanza – medición. Esta falta de alineación, estos desajustes, llevan a
conclusiones falsas sobre la eficacia de la educación en un lugar determinado, si se utilizan los
puntajes de las pruebas estandarizadas como indicador de eficacia educativa.
La segunda razón es que estas pruebas permiten hacer comparaciones significativas entre
estudiantes basadas en sólo un conjunto pequeño de ítems.
Un ítem que es respondido correctamente por cerca de la mitad de estudiantes es el ítem que
mejor dispersa los puntajes totales de los estudiantes (40%), por el contrario, los ítems que son
respondidos correctamente por un gran número de estudiantes (90%), no contribuyen a dispersar
convenientemente los puntajes de las pruebas. La búsqueda de una varianza de puntajes en las
pruebas estandarizadas de logros, no permiten que los ítems en los cuales los estudiantes se
desempeñan bien sean incluidos.
La tercera razón corresponde al problema de causalidad confusa. Afirmar que puntajes bajos o
altos en las pruebas son resultado de la calidad de la enseñanza es ilógico porque el desempeño
de los estudiantes en las pruebas estandarizadas de logros está fuertemente influenciado por tres
factores, sólo uno de los cuales está vinculado a la calidad educativa. Estos tres factores son: lo
que se enseña en la escuela, la capacidad intelectual innata del estudiante, y el aprendizaje del
estudiante fuera de la escuela.
De formas tal, algunos de los ítems de las pruebas miden los conocimientos o destrezas que
los estudiantes aprenden en la escuela. El problema es que los ítems en las pruebas
estandarizadas de logros no miden sólo lo que realmente se ha enseñado en la escuela, dado que
en las pruebas estandarizadas de logros se esconden otros tipos de ítems.
Sumado a ello, se debe considerar que la capacidad intelectual innata de un estudiante es
diferente. Hay ítem, que tocan destrezas intelectuales innatas que no son fácilmente modificables
en la escuela, por lo que dispersan los puntajes de los examinados.
Por otro lado, los ítems más problemáticos y los que más abundan en las pruebas
estandarizadas miden lo que los estudiantes han aprendido fuera de la escuela. Al respecto, el
status socioeconómico de los niños se mezcla con su desempeño en las pruebas estandarizadas de
logros porque muchos ítems de las pruebas estandarizadas de logros se concentran en realidad en
evaluar conocimientos y/o destrezas aprendidas fuera del colegio que son probablemente
aprendidas más en algunos escenarios socioeconómicos que en otros.
Se han hecho propuestas para enfrentar esta problemática respecto a los ítems incluidos en las
pruebas estandarizadas de logros. Se ha propuesto que se necesita conocer a fondo las
interioridades de las pruebas estandarizadas de logros, se necesita llevar a cabo una campaña
educativa eficaz, para que los educadores, los padres de familia, y los diseñadores de políticas
educativas comprendan cuáles son realmente las debilidades evaluativas de las pruebas
estandarizadas de logros, se debe organizar una forma más apropiada de reunir evidencias
basadas en la evaluación. Finalmente, se ha propuesto que se debe evaluar el grado de dominio
por parte de los estudiantes de destrezas cognitivas genuinamente significativas si se quiere
evaluar y medir la calidad educativa.
Conclusión
En conclusión, en las pruebas estandarizadas de logros se insertan ítems que permitan
dispersar los puntajes de los estudiantes de manera que se puedan hacer interpretaciones finas y
precisas referidas a normas. Hay un serio desajuste entre lo que se enseña en un contexto
determinado y lo que se evalúa mediante las pruebas estandarizadas de logros eliminando ítems
importantes de las pruebas. Los problemas de estas pruebas para medir y evaluar la calidad
educativa, son: la búsqueda de varianza en los puntajes, las limitaciones de tener que usar pocos
ítems en la evaluación escolar, el desajuste significativo entre lo que se enseña y lo que miden las
pruebas estandarizadas de logros, y se usan ítems que miden diferencias en las capacidades
intelectuales innatas los cuales no se deben usar para evaluar la eficacia educacional.
Lo más importante es que los educadores estudien las pruebas de logros, analicen todos los
ítems detalladamente para ver lo que realmente están midiendo. Se requieren instrumentos de
evaluación que midan destrezas valiosas o conjuntos significativos de conocimientos.
Bibliografía
Popham, W.J. (s.f.) ¿Por qué las pruebas estandarizadas no miden la calidad educativa? Preal.

También podría gustarte