Está en la página 1de 18

Las evaluaciones diagnósticas

de los aprendizajes de Mejoredu:


reconceptualización, pertinencia y solidez
técnica de sus resultados

Fotografías: ©Mejoredu / Juan Carlos Angulo.

Introducción

En este documento se describen de manera sintética las característi-


cas más relevantes del marco normativo, contexto, enfoque, operación
y resultados del trabajo desarrollado por Mejoredu en materia de eva-
luación educativa. En particular, se pone el acento en las evaluaciones
diagnósticas del aprendizaje de las y los estudiantes de educación bá-
sica, destacando sus principales diferencias respecto a las evaluaciones
estandarizadas que se habían venido realizado en el pasado, por lo que
hace a su conceptualización, finalidad, estructura, estrategias de apli-
cación, naturaleza de sus resultados y usos para apoyar los procesos
de mejora continua que se desarrollan en las comunidades escolares
y en el Sistema Educativo Nacional.

Además de fundamentar la pertinencia y la solidez técnica de sus re-


sultados, se presentan los trazos fundamentales del trabajo en marcha
realizado de manera conjunta con la Secretaría de Educación Pública
sobre la evaluación diagnóstica y formativa, acorde con los principios
y enfoque pedagógico de la Nueva Escuela Mexicana.
El debate público y la reforma constitucional
en materia de evaluación

A partir de 2018 fueron claros los señalamientos respecto a las serias


limitaciones y deficiencias de las evaluaciones estandarizadas, como
las que había venido realizando el extinto Instituto Nacional para la
Evaluación de la Educación (inee). Las críticas han sido muchas y con-
tundentes desde los puntos de vista académico y técnico, además de
las de orden pedagógico y político.1

Se ha cuestionado su carácter prescriptivo y homogeneizante; la des-


contextualización de los instrumentos y resultados que arrojan; su
énfasis en la clasificación de los estudiantes como buenos o malos;
la nociva práctica de hacer rankings entre alumnos, entre tipos de
escuela y entre entidades federativas; su carácter punitivo y la poca
capacidad de retroalimentación a docentes, autoridades escolares y
autoridades educativas; así como los altos costos financieros que no
correspondían con sus pocos o nulos efectos en la mejora educativa.

1
La literatura y la documentación de estos cuestionamientos son amplias. Entre otras
referencias puede consultarse: Aboites, 2012; Barrenechea, 2010; Biesta, 2014; Darling-
Hammond, 2015; Díaz-Barriga, 2017; Didler, 2019; Holcombe, Jennings y Koretz, 2013;
Jackson, 2016; Kohn, 2013; Koretz, 2017; Wiliam, 2011. Un estudio reciente, desarrollado
por la Organización de las Naciones Unidas para la Educación, la Cultura y la Ciencia
(unesco) y dedicado a realizar un balance de las evaluaciones estandarizadas a gran
escala a nivel internacional, concluye señalando varias de sus limitaciones y se pro-
nuncia por reconocer que la evaluación debe “valorar más de lo que puede medirse” y
“buscar maneras” de mejorar la integración de las mismas en los procesos de evalua-
ción general de los sistemas educativos, con la finalidad de ampliar su relación con cua-
tro dimensiones fundamentales: la conceptualización de la educación y el aprendizaje;
el entendimiento de la calidad de la educación; el rango de aptitudes, conocimientos
y actitudes que se valoran; y la necesaria atención a la inclusividad y el respeto de la
diversidad (unesco, 2019).

2
Aunado a ello, a la luz de las normas internacionales para la evalua-
ción educativa, las evaluaciones que se desarrollaban en nuestro país
tenían muchos desafíos no resueltos en términos de su utilidad, legi-
timidad y factibilidad.2

En atención a estos debates, y ante la necesidad de reencauzar la eva-


luación, la reforma constitucional y legal realizada a inicios del presente
gobierno señala con claridad que “las evaluaciones diagnósticas serán
formativas e integrales y consisten en procesos mediante los cuales
se formulan juicios fundamentados en evidencia, sobre las cualidades
de los actores, instituciones o procesos del Sistema Educativo Nacional,
con la finalidad de contar con una retroalimentación que promueva
una acción de mejora en la educación”. Asimismo, este tipo de evalua-
ción, además de ser “diagnóstica, formativa e integral”, debe ser “con-
tinua, colectiva, incluyente y comunitaria, participativa y transparente
en todas sus etapas, sustentada en los principios de igualdad sustanti-
va, interculturalidad, imparcialidad, transparencia y rendición de cuen-
tas de la autoridad educativa, además de los criterios de equidad y ex-
celencia en educación”. La legislación también es clara en señalar que
las instancias evaluadoras deberán guiarse por criterios que orienten
“los procesos valorativos, cualitativos y formativos de la mejora conti-
nua de la educación” (lrmmce, 2019).

reconceptualización, pertinencia y solidez técnica de sus resultados


La nueva perspectiva de evaluación

Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:


diagnóstica y formativa

La interpretación y ejecución del mandato constitucional y de la ley re-


glamentaria correspondiente llevó a Mejoredu a establecer un nuevo
modelo de evaluación diagnóstica, formativa e integral (medfi), a fin de
replantear la perspectiva de evaluación con una narrativa y estrategias

2
De acuerdo con el Joint Committee on Standards for Educational Evaluation, una eva-
luación en el ámbito educativo debe cumplir con cuatro atributos: 1) utilidad, que es
el grado en el que los actores involucrados en una evaluación consideran que los pro-
cesos y productos que se generan a partir de ella son valiosos y útiles para atender
sus necesidades; 2) factibilidad, que es el grado en el que una evaluación cumple con
los criterios de viabilidad contextual, efectividad y eficiencia en el uso de los recursos;
3) legitimidad, que es el grado en que una evaluación es apropiada, justa, legal y res-
ponsiva con los actores y comunidades involucrados; y 4) precisión, que es el grado
en que una evaluación es confiable y veraz en cuanto a sus procesos y resultados
(Klinger et al., 2015; Yarbrough et al., 2010).

3
diferentes para orientar sus procesos y resultados, teniendo como eje
central vincularla a los procesos educativos; es decir, no convertir a la
evaluación en un fin en sí misma, sino en una herramienta que permita
retroalimentar estrecha y continuamente a los actores educativos, a las
y los docentes, a las autoridades escolares y a las autoridades educati-
vas, y junto con ellos hacer de la evaluación un proceso de acompaña-
miento permanente a los procesos de mejora continua de la educación
(Mejoredu, 2022).

Para Mejoredu Este punto, que en algunos de los debates sobre las evaluaciones pasa
y su modelo inadvertido, en realidad es central para obtener conclusiones correc-
de evaluación, tas: el propósito de las evaluaciones que la ley mandata no es el mis-
conviene mucho mo que han tenido las evaluaciones estandarizadas tradicionales.
más pensar en Para Mejoredu y su modelo de evaluación, conviene mucho más pensar
evaluaciones en evaluaciones que den información útil a docentes, autoridades es-
que den colares y autoridades educativas, sobre lo que las y los estudiantes han
información aprendido al inicio del ciclo escolar, dando más relevancia a la obten-
útil a docentes, ción oportuna de esta información en formatos comprensibles y utiliza-
autoridades bles, y no tanto a modelos matemáticos complejos que son de interés
escolares y de los especialistas, pero que no aportan mucha información a nivel del
autoridades aula y del Sistema Educativo Nacional (sen) para impulsar procesos
educativas. de mejora continua.

En el pasado, el SEN estaba sobreevaluado sin gran utilidad. Con la


política de mejora, el MEDFI se constituye en la respuesta al mandato
del legislador en cuanto al tipo de información que es preciso generar
para que las comunidades impulsen intervenciones que propicien la
mejora de la totalidad de las y los estudiantes.

Así, en la perspectiva del medfi la evaluación, si bien debe tener un


núcleo técnico y sistemático riguroso, también tiene que formar par-
te de procesos de diálogo y comprensión entre los diferentes agentes
educativos, y desarrollarse en ambientes de confianza. Esto supone
trascender la idea de una medición que se impone y clasifica a estu-
diantes, docentes y escuelas según sus niveles de logro, y a partir de
información de alta sofisticación estadística, de difícil comprensión
para la mayoría de los ciudadanos, e instalar, en su lugar, un diálogo par-
ticipativo entre los diferentes agentes educativos a partir de una info-
rmación que resulta útil y pertinente como insumo para la propia
valoración de sus avances, como base para que ellos mismos impulsen
procesos de mejora continua. El giro conceptual que se le ha dado a la

4
evaluación tiene mucho significado al transitar de una evaluación que El modelo
se montó en diversos dispositivos técnicos para usos inadecuados de evaluación
─como clasificar, estigmatizar y desacreditar─, a otra que usa también diagnóstica,
dispositivos técnicos, pero centrados en las comunidades escolares con formativa e integral
objeto de impulsar procesos de valoración, reflexión, reconocimiento se instala en las
y mejora.3 nuevas tendencias
internacionales
Aunado a lo anterior, el medfi se instala en las nuevas tendencias inter- que están dejando
nacionales de evaluación educativa que están dejando atrás el predo- atrás el predominio
minio de las evaluaciones estandarizadas con fines sumativos, y avan- de las evaluaciones
zan marcando un cambio importante hacia enfoques más formativos y estandarizadas
adaptativos: en lugar de ser una herramienta de clasificación, la evalua- con fines sumativos
ción formativa se convierte en un proceso dinámico que guía el apren- hacia enfoques
dizaje y fortalece las capacidades de reflexión sobre el hecho educati- más formativos
vo de los diversos agentes. Asimismo, con la propuesta de evaluación y adaptativos.
diagnóstica, formativa e integral, considerando sus tres estrategias de
acción,4 se avanza en el esfuerzo de dar coherencia a las evaluaciones
a nivel del aula, la escuela y las valoraciones en los niveles de política
educativa y del sistema, tema considerado como un desafío crucial
para avanzar en su consolidación y desarrollo, y para detonar procesos
relevantes de mejora continua de la educación (IIEP/UNESCO, 2023).

Este es el contexto en el que se deben valorar los diversos esfuerzos rea-


lizados en materia de evaluación educativa, y no sólo ceñirse a críticas

reconceptualización, pertinencia y solidez técnica de sus resultados


Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:
parciales y sesgadas, basadas en reduccionismos técnicos, sin tomar en
cuenta las importantes aristas de orden conceptual, pedagógico y con-
textual que le dan sentido a los instrumentos y herramientas utilizadas.
Para Mejoredu ha sido indispensable salirse de la caja técnica habitual
de las evaluaciones de gran escala a fin de revisitar, replantear y usar sus
potenciales analíticos para apoyar la nueva perspectiva de la evaluación;
es decir, aprovechar las herramientas científico técnicas con objeto de
apuntalar una evaluación más pertinente, sensible a las necesidades

3
Las tendencias internacionales, incluida la Organización para la Cooperación y el Desa-
rrollo Económicos (OCDE), se han movido hacia paradigmas similares al MEDFI. Después
de la pandemia, esta tendencia se acentúa.
4
Las tres estrategias planteadas por el medfi son: 1. apoyo a los procesos de valoración
diagnóstica (en el que se realizan tareas de recopilación, sistematización de informa-
ción y devolución formativa a nivel de aula, escuela y sistema); 2. impulso a la evaluación
formativa en el aula y la escuela; y 3. sistematización de experiencias en las comunida-
des escolares.

5
y contextos escolares y, sobre todo, ponerla al servicio de la mejora con-
tinua de la educación.5

Las evaluaciones diagnósticas del aprendizaje desarrolladas por Mejoredu


aportan información relevante, integral y, sobre todo, oportuna sobre
la situación de los aprendizajes de las y los estudiantes. Se aplican de
2º a 6º de primaria y de 1º a 3º de secundaria al inicio de los ciclos esco-
lares en las áreas de Lectura, Matemáticas y Formación Cívica y Ética.
Por su cobertura y perspectiva intra e intercurricular de la educación
básica, constituyen referentes útiles para definir intervenciones pe-
dagógicas orientadas a la mejora educativa integral. Hay que recordar
que las evaluaciones tradicionales de gran escala tuvieron un carác-
ter sumativo, ya que habitualmente se aplicaban al final de los grados
escolares terminales.

La información desagregada por cada una de las unidades de análisis


consideradas en Lectura, Matemáticas y Formación Cívica y Ética es
útil para identificar los aspectos y aprendizajes que mostraron mayor
dificultad en cada una de ellas. En contraste, las evaluaciones tradicio-
nales de gran escala no ofrecían información por alumno, sino que los
datos aportados eran de “alumnos promedio”, anónimos, que además
ya habían egresado cuando se daban a conocer los resultados, lo cual
dificultaba que las y los docentes pudieran definir acciones puntuales
de mejora.6

Asimismo, la estrategia de evaluación diagnóstica seguida por Mejoredu,


incluye información y orientaciones para apoyar a las y los docentes en
las tareas de enseñanza y aprendizaje, tomando como base los resul-
tados arrojados por la evaluación. A partir de éstos, se conforman los
mapas de atención prioritaria (map), donde se precisan los aprendiza-
jes por nivel de dificultad en las tres áreas evaluadas y sus respectivas
unidades de análisis.

5
Los responsables de las evaluaciones estandarizadas y los que continúan divulgando
la necesidad de apegarse a los estándares científico técnicos internacionales, caen en
un problema de sesgo cognitivo no menor. Tal como lo señaló uno de los fundadores
de la psicología humanista, Abraham Maslow: “Supongo que es tentador, si la única
herramienta que tienes es un martillo, tratar todo como si fuera un clavo”. Esto que
también se denomina el efecto Einstellung permite afirmar que confiar excesivamente
en una herramienta, método o enfoque, puede que no sea la solución más adecuada.
6
Aunque estos resultados permitían, bajo ciertos requisitos, hacer algunas desagrega-
ciones, nunca estuvieron pensados para trabajar con cada estudiante y con cada grupo
en cada escuela.

6
Mejoredu ha puesto
a disposición de las y
los docentes un conjunto
de Orientaciones didácticas
que contienen
sugerencias de
estrategias de enseñanza;
actividades de
aprendizaje en el aula,
material gráfico y
preguntas de reflexión.

reconceptualización, pertinencia y solidez técnica de sus resultados


Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:

7
Las evaluaciones diagnósticas incluyen también un importante compo-
nente formativo, que constituye una diferencia fundamental respecto
de las evaluaciones tradicionales de gran escala que solamente se cen-
traban en la emisión de resultados estadísticos con diferentes niveles
de desagregación, pero que muy poco hicieron para desarrollar estra-
tegias sólidas de retroalimentación con fines formativos. En contraste,
Mejoredu ha puesto a disposición de las y los docentes un conjunto de
Orientaciones didácticas que contienen sugerencias de estrategias
de enseñanza; ejemplos de actividades de aprendizaje en el aula, mate-
rial gráfico y preguntas de reflexión ─todo directamente vinculado con
los aprendizajes de las áreas evaluadas en cada grado─, y cuentan con re-
comendaciones específicas que las y los docentes pueden elegir, según
sean más apropiadas para sus estudiantes.7

Es muy importante destacar el esfuerzo de innovación tecnológica


realizado por Mejoredu para lanzar una alternativa de aplicación de las
evaluaciones a través de una plataforma tecnológica. Si bien es cier-
to que nuestro sistema educativo todavía tiene importantes desafíos
para reducir la brecha digital, resulta estratégico avanzar en el uso de
recursos tecnológicos, con el convencimiento de que en el mediano
y largo plazos se convertirán en importantes herramientas de apoyo
en los procesos de evaluación con fines formativos. La evaluación de
vanguardia en el mundo avanza en este terreno con objeto de reducir
costos y mejorar la eficiencia y efectividad de los procesos, pero tam-
bién para desarrollar sistemas adaptativos que permitan crear meca-
nismos personalizados de evaluación que se ajusten a la aptitud del
alumno, permitiendo comprobar el avance del aprendizaje a su pro-
pio ritmo. Las evaluaciones que se realizaban anteriormente nunca
pudieron mostrar adelantos en esta materia. En contraste, las impul-
sadas por Mejoredu han avanzado en este terreno y han colocado
los primeros pilares para consolidar un sistema robusto de evalua-
ción diagnóstica con fines formativos, utilizando recursos tecnológicos.
Dicho esfuerzo, sin duda, se encuentra en línea con una estrategia
incluyente para enfrentar el creciente proceso de las aplicaciones
de inteligencia artificial que van a permitir una mayor personalización
y tutorías focalizadas.

7
Mejoredu ha desarrollado veinticuatro orientaciones didácticas para promover el uso
formativo de los resultados de la evaluación, que han tenido una respuesta favorable
entre el personal docente y se han convertido en las publicaciones con mayor canti-
dad de descargas en la página web de la institución: <https://www.MEJOREDU.gob.mx/
publicaciones/libro/>.

8
Solidez técnica de los resultados

Con la finalidad de que los resultados fueran más claros, pertinentes


y útiles para las y los docentes, las autoridades escolares y las educati-
vas, se decidió organizar la información a partir de porcentajes o pro-
porciones de aciertos de los contenidos evaluados. Estos porcentajes
de aciertos fueron ponderados utilizando los factores de expansión
correspondientes al diseño de la muestra, con la finalidad de cuidar
que cada observación representara a un número técnicamente ade-
cuado de estudiantes y evitar con ello que la dificultad de la prueba se
redujera o incrementara artificialmente, como ocurre cuando la razón
entre la cantidad de estudiantes en muestra que tienen habilidad alta
y la cantidad de estudiantes en la muestra que tienen habilidad baja, es
distinta al correspondiente cociente poblacional.

Con esta opción se buscó que la información estuviera centrada en la


valoración de la situación de los aprendizajes en cada contexto escolar,
según el grado de dificultad mostrado, y no en la clasificación de las y los
alumnos. Esta forma de devolver los resultados busca distanciarse clara-
mente de los que se hacen por nivel de desempeño, los cuales utilizan
típicamente las evaluaciones estandarizadas para clasificar a las y los es-
tudiantes como insuficientes, satisfactorios o sobresalientes, de acuerdo
con los puntajes obtenidos en la prueba, debido a que a la mayoría de las

reconceptualización, pertinencia y solidez técnica de sus resultados


Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:
y los docentes de educación básica no les hace mucho sentido 8 que se re-
porten los resultados por nivel de logro, y consideran que una mejor for-
ma de comunicar los resultados es a través de reportes por escuela que
den información agregada por reactivo y por estudiante (Ravela, 2015).

Con las evaluaciones diagnósticas se ha buscado generar un diálogo


fructífero entre la psicometría y la pedagogía, reflejado fundamental-
mente en ofrecer resultados claros sobre los aprendizajes de las y los
estudiantes que puedan ser discutidos, analizados y confrontados con
la práctica pedagógica diaria de las y los docentes. De esta forma, los
resultados de las evaluaciones diagnósticas, además de permitir cono-
cer la situación global tanto en el área evaluada como en cada una de
las unidades de análisis consideradas, permiten identificar los apren-
dizajes de acuerdo con los niveles de dificultad mostrados, a fin de

8
De acuerdo con la consulta a docentes y otras figuras educativas sobre la evaluación
para la mejora del trabajo y la práctica docente (Mejoredu, 2021).

9
que las y los docentes puedan reconocer las prioridades de atención.
Los porcentajes promedio de aciertos se complementan con los map,
La estrategia más donde se establecen con claridad los grados de dificultad en cada
edecuada de mejora contenido evaluado para apoyar a maestras y maestros en sus decisio-
es comparar los nes pedagógicas y didácticas orientadas a recuperar, fortalecer o me-
esfuerzos de uno jorar los aprendizajes con estrategias generales de grupo, por subgru-
mismo, y no propiciar po de atención y a escala individual. Todo esto se acompaña con herra-
comparaciones con mientas para que las y los docentes, junto con sus estudiantes, puedan
otras escuelas o reflexionar sobre errores y aciertos, además de recurrir a las orientacio-
realidades educativas nes didácticas que fueron elaboradas para recuperar estrategias de
en diferentes enseñanza y ejemplos de actividades de aprendizaje en el aula.
contextos, como
suele suceder Conviene subrayar que los niveles de dificultad de los aprendizajes
con las evaluaciones fueron calculados a través de procedimientos estadísticos rigurosos.
estandarizadas Una vez realizados los análisis psicométricos de validez y confiabilidad,
tradicionales. se calcularon los niveles de dificultad en términos probabilísticos, esto
es, considerando la distribución de las respuestas en la población par-
ticipante y realizando los procedimientos de normalización estadística
correspondiente (tabla 1).

Es necesario reiterar que los resultados de las evaluaciones diagnós-


ticas de Mejoredu permiten identificar prioridades de atención pe-
dagógica, no estudiantes, escuelas y entidades federativas clasifica-
dos como buenos o malos. Se asume además que la estrategia más
adecuada de mejora es comparar los esfuerzos de uno mismo, y no
propiciar comparaciones con otras escuelas u otras realidades educa-
tivas en contextos diferentes, como suele suceder con las evaluaciones
estandarizadas tradicionales. Esto, además, permitirá avanzar en estu-
dios de trayectorias educativas de las y los estudiantes, con lo que se
podrán evaluar impactos de largo plazo.

Mejoredu cuenta con el equipo técnico y la experiencia para garantizar


la validez y confiabilidad de los resultados, considerando parámetros
internacionales. La tabla 1 muestra los análisis técnicos y las estimacio-
nes estadísticas que se utilizaron para dar cuenta de la calidad y con-
fiabilidad de los resultados de las evaluaciones diagnósticas que re-
portaron, en todos los casos, valores dentro de parámetros aceptables.
Los hallazgos de los análisis y estimaciones estadísticas demuestran
que los resultados de las evaluaciones diagnósticas, así como su dise-
ño técnico y la estrategia de levantamiento de información desarrolla-
dos, no sólo cumplen con criterios sólidos de validez y confiabilidad,

10
sino que además lo hacen de conformidad con los propósitos marcados
por nuestra Constitución y la ley en materia de evaluación y mejora
continua de la educación.

Tabla 1 Análisis técnico y estimaciones aplicadas a los resultados de las evaluaciones diagnósticas

Teoría Nombre Descripción Resultado

Teoría clásica Alfa de Cronbach Confiabilidad de cada prueba Valores superiores a 0.9 para primaria;
del test (tct) aplicada bajo la tct. y superiores 0.8 en secundaria, ambos
considerados aceptables.
tct Facilidad y pPlus Dificultad clásica del reactivo, 98.1% de los reactivos se ubican en el rango
proviene del porcentaje de [0.2, 0.8], lo cual indica que la dificultad de
de aciertos en la prueba. las pruebas es adecuada.
tct Discriminación Índice de discriminación. El índice de discriminación resultó bueno
En el caso de un puntaje para Lectura y Formación Cívica y Ética;
dicotómico, la correlación bueno para Matemáticas en primaria y regular
ítem / total y la punto biserial para secundaria.
coinciden (Ptbis).
Teoría de Gráfica de Curva característica logística. Para la mayoría de los reactivos la curva empírica
respuesta al distractores de la respuesta correcta se ajusta a la esperada,
reactivo (irt, mientras que las curvas correspondientes
por sus siglas a las opciones distractoras se acercan al cero
en inglés). conforme se incrementa el nivel de habilidad.
irt d50 Dificultad del reactivo Las pruebas tienen aproximadamente
bajo una probabilidad la misma cantidad de reactivos por debajo
de responder 50%, que por arriba de la media y casi en su totalidad
dado que el estudiante (97.5%) estuvieron entre menos una y más una
conoce la respuesta correcta. desviación estándar.
irt Ajuste interno Ajuste interno del modelo El 97.7% de los reactivos se encuentra
Rasch (infit). en un rango adecuado, entre 0.8 y 1.20.
irt Confiabilidad Confiabilidad de la prueba La confiabilidad de las pruebas de Lectura y
eap / pv suponiendo un modelo Matemáticas es buena o excelente, con valores
tridimensional. Cada en el intervalo 0.8, 1.0 en todos los casos.
dimensión corresponde En el caso de Formación Cívica y Ética para
a una asignatura: Lectura, primaria la confiabilidad es buena, y aceptable
Matemáticas, Formación en el caso de secundaria, donde aparecen
Cívica y Ética. Se estima algunas medidas eap en el intervalo [0.7, 0.8].
un modelo irt dicotómico
con valores plausibles
para cada asignatura.
Correlación entre Correlaciones dos a dos Alta para primaria, mostrando valores superiores
dimensiones entre las dimensiones a 0.7. Media o alta en el caso de secundaria, en la
del modelo escalado. que la mayoría de los valores son superiores a 0.7,
pero se observan algunos entre 0.6 y 0.7.
irt Mapa de Wrigth Mapa para comparar Los reactivos cubren relativamente bien los
el resultado de personas distintos niveles de habilidad de los estudiantes.
y reactivos.
irt Función de Muestra la precisión de las La escala estima con precisión el nivel
información puntuaciones en la escala irt. de habilidad de los estudiantes.
Con las evaluaciones
diagnósticas del
aprendizaje impulsadas
por Mejoredu,
la evaluación no se
impone al sistema, sino
que se convierte en
una herramienta a su
servicio y en especial
al de las y los docentes,
quienes finalmente
tienen la última
palabra para mejorar
continuamente
la educación.

12
Otras técnicas utilizadas para identificar sesgo en la aplicación de ins-
trumentos mostraron indicios favorables. Por ejemplo, los resultados
en distintos grupos de participantes, sean bajos o elevados, siguen pa-
trones similares: los aprendizajes que tienden a ser más difíciles para
unos también son más difíciles para otros, en general, lo que deja en-
trever, entre otras cosas, que el mecanismo de aplicación de los instru-
mentos que estuvo a cargo de las y los maestros fue confiable, y que
fueron respetados los mecanismos clave en su administración.

La información aportada a Mejoredu por diversas entidades federati-


vas que decidieron realizar una aplicación censal de las evaluaciones
diagnósticas aporta evidencia sólida sobre la consistencia con los re-
sultados de la muestra seleccionada. Adicionalmente, varios docentes
han comentado que los resultados de su grupo tienen significado para
ellos, y han corroborado que la información que se proporcionó sobre
sus estudiantes ha sido de utilidad y corresponde con observaciones
más detalladas que ellos han realizado sobre lo que saben y deben aún
desarrollar conforme avanza el ciclo escolar.9 Esta evidencia de validez
concurrente corrobora que los resultados de las evaluaciones diagnós-
ticas se relacionan positivamente con el trabajo realizado por las y los
docentes para aplicar, sistematizar, analizar resultados y utilizarlos con
el fin de mejorar la educación de sus grupos escolares.

reconceptualización, pertinencia y solidez técnica de sus resultados


Organización y coordinación interinstitucional

Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:


En los lineamientos que emitió Mejoredu para la realización de las eva-
luaciones diagnósticas del aprendizaje se establece claramente el mar-
co normativo que los fundamenta y motiva, el enfoque y perspectiva de
las evaluaciones diagnósticas y sus fines formativos, las características
fundamentales de los instrumentos y las orientaciones de su uso, ade-
más de establecer las modalidades de aplicación y el plan de activida-
des que corresponde a las autoridades educativas, a las escolares y al
personal docente para su realización.

En estos lineamientos se destaca que las evaluaciones diagnósticas


podrán ser aplicadas en todas las escuelas de educación básica del

9
Así se ha señalado en diversas reuniones, foros, talleres y diálogos regionales con maes-
tras y maestros de educación básica para analizar los resultados de las evaluaciones
diagnósticas y sus alcances e implicaciones pedagógicas.
13
Las autoridades país que así lo decidan, pero se subraya la aplicación en una mues-
educativas del país tra controlada de escuelas de primaria y secundaria a efecto de ofre-
han mostrado cer información agregada por entidad federativa y a escala nacional.
su confianza en Para la aplicación de esta muestra controlada se señalan las tareas de
los resultados que coordinación interinstitucional entre los diversos actores educativos y
Mejoredu les ha se establecen las actividades técnicas que corresponden fundamental-
devuelto sobre la mente a Mejoredu, así como las de orden operativo, administrativo y
situación de los de gestión que, de acuerdo con sus atribuciones, deben realizar las y los
aprendizajes de docentes, las autoridades escolares y las autoridades educativas.
las y los alumnos de
educación básica Con esta estrategia de aplicación se ha buscado impulsar mecanismos
de su entidad, de coordinación interinstitucional que respondan a criterios de corres-
al cumplir con ponsabilidad y austeridad republicana, para poner fin al dispendio fi-
los criterios nanciero que se realizaba en el país, gastando cientos de millones de
de pertinencia pesos en evaluaciones estandarizadas nacionales que terminaban re-
y validez técnica pitiendo los mismos resultados sin ningún impacto real en la mejora
correspondientes. educativa. Esta visión inercial de las evaluaciones estandarizadas sin
capacidad de autocrítica impidió mirar hacia opciones más creativas
de repensar la evaluación desde las necesidades del sen y de sus diver-
sos actores educativos. Con las evaluaciones diagnósticas del aprendi-
zaje impulsadas por Mejoredu, la evaluación no se impone al sistema,
sino que se convierte en una herramienta a su servicio y en especial al
de las y los docentes, quienes finalmente tienen la última palabra para
mejorar continuamente la educación.

Consolidación y prospectiva

Por las características, propósito y solidez técnica de los resultados de


las evaluaciones diagnósticas impulsadas por Mejoredu, además del
uso que tanto docentes como autoridades escolares y educativas han
hecho de los mismos, se puede afirmar su pertinencia ante las nece-
sidades de mejora continua del sen. Maestras y maestros han recibido
bien la propuesta y tienen la certeza de que los instrumentos utiliza-
dos y los resultados que les han sido devueltos tienen rigor técnico, son
válidos y confiables, y están pensados para apoyar ─no para substituir─
su trabajo pedagógico en las aulas.10

10
Un ejemplo del uso de los resultados de las evaluaciones diagnósticas para orientar las
decisiones de mejora docente puede consultarse en <https://www.youtube.com/watch?
v=qDbT7M4oQ6M>.

14
También las autoridades educativas del país han mostrado su con-
fianza en los resultados que Mejoredu les ha devuelto sobre la situa-
ción de los aprendizajes de las y los alumnos de educación básica de
su entidad, al cumplir con los criterios de pertinencia y validez téc-
nica correspondientes. Diversas autoridades educativas del país han
utilizado los resultados de estas evaluaciones para impulsar acciones
orientadas a la mejora de los aprendizajes, considerando sobre todo el
efecto generado por la pandemia.11 Estas acciones se han enfocado en
brindar al estudiantado el acceso a recursos educativos, fortalecer la
enseñanza y reducir la desigualdad de oportunidades educativas. Los
resultados de estas evaluaciones también se empiezan a emplear con
fines de monitoreo y seguimiento a los avances en la recuperación de
los aprendizajes.

Realizar un replanteamiento de la evaluación en México frente a las iner-


cias generadas por más de dos décadas de evaluaciones estandarizadas
con fines de rendición de cuentas no ha sido un camino fácil y exigirá
un esfuerzo continuado respecto al punto de inflexión que ya se ha ge-
nerado con las evaluaciones diagnósticas y formativas impulsadas por
Mejoredu. No sólo habrá que trascender las resistencias internas y ex-
ternas; además, será necesario desarrollar nuevas estrategias orienta-
das a consolidar una evaluación que efectivamente esté al servicio de
la mejora continua, propiciando nuevos diálogos entre la psicometría, la
pedagogía y la didáctica, para que la evaluación se vaya integrando

reconceptualización, pertinencia y solidez técnica de sus resultados


Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:
con más fuerza a los procesos educativos, responda a las necesidades
de los diferentes agentes y, sobre todo, permita recuperar los saberes, co-
nocimientos y experiencias de las y los docentes.

11
En la LVI sesión plenaria del Consejo Nacional de Autoridades Educativas (Conaedu),
celebrada el 15 de diciembre de 2022, Mejoredu presentó los resultados nacionales de
la evaluación diagnóstica para la mejora de los aprendizajes de las y los estudiantes
aplicada al inicio del ciclo escolar 2022-2023 y entregó a cada uno de los titulares de
educación de los estados los resultados de sus entidades federativas. Diversas autori-
dades educativas han utilizado los resultados de las evaluaciones diagnósticas como
insumos para el planteamiento de estrategias de recuperación de aprendizajes. Des-
tacan, entre otros, los estados de Sonora, Veracruz, Puebla, Hidalgo, San Luis Potosí,
Baja California Sur, Jalisco, Colima, Tabasco y Durango. En junio de 2022, la Subsecreta-
ría de Educación Básica de la SEP, hizo pública La Estrategia Nacional para Promover
Trayectorias Educativas Continuas, Completas y de Excelencia, en la cual se considera
a las evaluaciones diagnósticas elaboradas por Mejoredu como uno de sus componen-
tes, además de establecer una ruta de trabajo para su aplicación y usos para apoyar
la recuperación de aprendizajes.

15
En un esfuerzo de colaboración con la Secretaría de Educación Públi-
ca (sep), Mejoredu desarrolla actualmente estrategias de evaluación
diagnóstica y formativa que permitirán acompañar y retroalimentar la
nueva propuesta curricular para la educación básica (sep, 2023). Cabe
destacar que en esta propuesta curricular se realiza un análisis crítico
de la evaluación, de sus consecuencias y usos inadecuados, que han de-
rivado en una evaluación separada del proceso formativo y han tenido
como consecuencia la clasificación escolar y social de las y los estu-
diantes, entre otras. En el marco curricular actual, se apuesta por una
evaluación que es intrínseca a la relación pedagógica entre docente
y estudiante; sirve para retroalimentar el proceso educativo; fomenta
el diálogo que desencadena procesos de reflexión; considera los co-
nocimientos y saberes alrededor de la realidad de las y los alumnos
─en el aula, la escuela y la comunidad─; y reconoce que las valoraciones
siempre serán provisionales.

En consonancia con esta perspectiva pedagógica, que busca reconocer


formas distintas de enseñanza y aprendizaje y, por supuesto, con la fi-
nalidad de mejorar los procesos educativos, así como el alcance de sus
resultados, Mejoredu está desarrollando instrumentos y herramientas
inéditas que permiten valorar de manera más integral y contextuali-
zada los procesos de desarrollo de aprendizaje de las y los estudiantes,
considerando la transversalidad entre campos formativos, los diferen-
tes contextos escolares y comunitarios, y las experiencias de vida, a partir
de los cuales se construyen los aprendizajes. A ello se sumarán diver-
sos mecanismos de retroalimentación y materiales de apoyo para que
los ejercicios de evaluación diagnóstica se articulen cada vez más con
esfuerzos de devolución formativa con fines de mejora continua de la
educación, de tal forma que la evaluación permita a las y los docentes
realizar un seguimiento del aprendizaje de sus estudiantes, así como
construir puentes pedagógicos de diálogo basados en la confianza.

En el reconocimiento de que los instrumentos por sí mismos no deri-


van en una evaluación diagnóstica o formativa, y que lo importante es
el uso que se haga de ellos y la retroalimentación que se brinde a los
estudiantes, Mejoredu seguirá contribuyendo con innovaciones con-
ceptuales y metodológicas, y ofrecerá toda su capacidad institucional
para garantizar la pertinencia, utilidad y factibilidad de las evaluaciones
diagnósticas y formativas que promueva, así como la solidez técnica de
sus resultados.

16
Referencias

Aboites, H. (2012, noviembre-diciembre). La disputa por la evaluación en Mé-


xico: historia y futuro. El Cotidiano, (176): 5-17. <https://www.redalyc.org/
pdf/325/32525230002.pdf>.
Barrenechea, I. (2010). Evaluaciones estandarizadas: seis reflexiones críticas.
Archivos Analíticos de Políticas Educativas, 18(8). <https://epaa.asu.edu/
index.php/epaa/article/view/751/829>.
Biesta, G. (2014). ¿Medir lo que valoramos o valorar lo que medimos? Globali-
zación, responsabilidad y la noción de propósito de la educación. Pensa-
miento Educativo. Revista de Investigación Educacional Latinoameri-
cana, 51(1): 46-57.
Blanco, E. (2009). La desigualdad de resultados educativos: aportes a la teoría
desde la investigación sobre eficacia escolar. Revista Mexicana de Inves-
tigación Educativa, (14)43: 1019-1049.
Darling-Hammond, L. (2015, 2 de marzo). Unequal Opportunity: Race and Edu-
cation. Brown Center Chalkboard; The Brookings Institution.
Díaz-Barriga, Á. (2017). De la evaluación individual a una evaluación social-
integrada: la institución educativa, su unidad. En Á. Díaz-Barriga (coord.).
Docencia y evaluación en la Reforma Educativa 2013 (327-364). Instituto
de Investigaciones sobre la Universidad y la Educación de la Universidad
Nacional Autónoma de México.
Didier, L. (2019, julio-diciembre). Las pruebas estandarizadas: Cuando el neo-
liberalismo se sienta en las aulas. Encuentros. Revista de Ciencias Hu-
manas, Teoría Social y Pensamiento Crítico, (10): 87-97. <https://doi.org/
10.5281/zenodo.3241401>.
Holcombe, R., Jennings, J. y Koretz, D. (2013). The Roots of Score Inflation: An

reconceptualización, pertinencia y solidez técnica de sus resultados


Examination of Opportunities in Two States’ Tests. En G. L. Sunderman

Las evaluaciones diagnósticas de los aprendizajes de Mejoredu:


(ed.), Charting Reform, Achieving Equity in a Diverse Nation (163-189).
Information Age Publishing.
IIEP-UNESCO (2023). Instituto Internacional de Planeamiento de la Educación de
la Organización de las Naciones Unidas para la Educación, la Ciencia y la
Cultura. Evaluación formativa. Learning Portal [portal de internet]. <https://
learningportal.iiep.unesco.org/es/fichas-praticas/monitorear-el-aprendizaje/
evaluacion-formativa>.
Jackson, K. (2016). ¿Qué se pierden los puntajes de las pruebas? En D. Ravitch (ed.),
La muerte y la vida del gran sistema escolar americano: cómo las prue-
bas y la elección están destruyendo la educación (107-122). The New Press.
Jiménez, J. (2009, mayo-agosto). El efecto Mateo: un concepto psicológico.
Papeles del Psicólogo, 30(2): 145-154.
Klinger, D., McDivitt, P., Howard, B., Munoz, M., Rogers, W. y Wylie, E. (2015).The
Classroom Assessment Standards for PreK-12 Teachers. Kindle Direct Press.
Kohn, A. (2013). El mito de las pruebas (2a ed.). Paidós.
Koretz, D. (2017). Más allá del fracaso de la rendición de cuentas basada en
pruebas. Education Healthcare Public Services [página web]. <https://
es.aft.org/ae/winter2017-2018/koretz>.

17
lrmmce (2019, 30 de septiembre). Ley Reglamentaria del Artículo 3o. de la Cons-
titución Política de los Estados Unidos Mexicanos, en materia de Mejora
Continua de la Educación. Diario Oficial de la Federación.
Mejoredu (2021). Comisión Nacional para la Mejora Continua de la Educación.
Informe de resultados de la consulta a docentes y otras figuras educati-
vas sobre la evaluación para la mejora del trabajo y la práctica docente
[documento interno].
Mejoredu (2022). Comisión Nacional para la Mejora Continua de la Educación.
Modelo de evaluación diagnóstica, formativa e integral. La evaluación al
servicio de la mejora continua de la educación. <https://www.mejoredu.
gob.mx/images/publicaciones/Modelo_de_Evaluacion.pdf>.
Murillo, F. (2004). La investigación sobre eficacia escolar a debate: análisis de las
críticas y aportaciones. Tendencias pedagógicas, (9): 111-130.
Ravela, P. (2015). El uso de los resultados de las evaluaciones en la mejora de los
procesos de enseñanza. En M. Poggi (coord.), Mejorar los aprendizajes
en la educación obligatoria. Políticas y actores (69-110). Instituto Inter-
nacional de Planeamiento de la Educación de la Organización de las Na-
ciones Unidas para la Educación, la Ciencia y la Cultura. <https://unesdoc.
unesco.org/ark:/48223/pf0000234977/PDF/234977spa.pdf.multi>.
sep (2023). Secretaría de Educación Pública. Plan de estudio para la educación
preescolar, primaria y secundaria. <https://educacionbasica.sep.gob.mx/
wp-content/uploads/2023/07/Plan_de_Estudios_para_la_Educacion_
Preescolar_Primaria_y_Secundaria.pdf>.
UNESCO (2019). Organización de las Naciones Unidas para la Educación, la Cien-
cia y la Cultura. La promesa de las evaluaciones de aprendizaje a gran
escala. Reconocer los límites para generar oportunidades. <https://unes
doc.unesco.org/ark:/48223/pf0000369947>.
Yarbrough, D., Shula, L., Hopson, R. y Caruthers, F. (2010). The Program Evalu-
ation Standards: A Guide for Evaluators and Evaluation Users (3a. ed).
Corwin Press.
Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.

Comisión Nacional para la Mejora Continua de la Educación

DIRECTORIO

Silvia Valle Tépatl, presidenta; Etelvina Sandoval Flores, comisionada;


María del Coral González Rendón, comisionada; Florentino Castro López, comisionado;
Oscar Daniel del Río Serrano, comisionado.

Armando de Luna Ávila, Secretaría Ejecutiva; Laura Jessica Cortázar Morán,


Área de Especialidad en Control Interno en el Ramo Educación Pública;
Francisco Miranda López, Evaluación Diagnóstica; Gabriela Begonia
Naranjo Flores, Apoyo y Seguimiento a la Mejora Continua e Innovación Educativa;
Susana Justo Garza, Vinculación e Integralidad del Aprendizaje;
Miguel Ángel de Jesús López Reyes, Administración.

Cítese este documento de la siguiente manera:


Comisión Nacional para la Mejora Continua de la Educación (2024).
Las evaluaciones diagnósticas de los aprendizajes de Mejoredu: reconceptualización,
pertinencia y solidez técnica de sus resultados.

También podría gustarte