Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Las Evaluaciones Diagnosticas de Mejoredu
Las Evaluaciones Diagnosticas de Mejoredu
Introducción
1
La literatura y la documentación de estos cuestionamientos son amplias. Entre otras
referencias puede consultarse: Aboites, 2012; Barrenechea, 2010; Biesta, 2014; Darling-
Hammond, 2015; Díaz-Barriga, 2017; Didler, 2019; Holcombe, Jennings y Koretz, 2013;
Jackson, 2016; Kohn, 2013; Koretz, 2017; Wiliam, 2011. Un estudio reciente, desarrollado
por la Organización de las Naciones Unidas para la Educación, la Cultura y la Ciencia
(unesco) y dedicado a realizar un balance de las evaluaciones estandarizadas a gran
escala a nivel internacional, concluye señalando varias de sus limitaciones y se pro-
nuncia por reconocer que la evaluación debe “valorar más de lo que puede medirse” y
“buscar maneras” de mejorar la integración de las mismas en los procesos de evalua-
ción general de los sistemas educativos, con la finalidad de ampliar su relación con cua-
tro dimensiones fundamentales: la conceptualización de la educación y el aprendizaje;
el entendimiento de la calidad de la educación; el rango de aptitudes, conocimientos
y actitudes que se valoran; y la necesaria atención a la inclusividad y el respeto de la
diversidad (unesco, 2019).
2
Aunado a ello, a la luz de las normas internacionales para la evalua-
ción educativa, las evaluaciones que se desarrollaban en nuestro país
tenían muchos desafíos no resueltos en términos de su utilidad, legi-
timidad y factibilidad.2
2
De acuerdo con el Joint Committee on Standards for Educational Evaluation, una eva-
luación en el ámbito educativo debe cumplir con cuatro atributos: 1) utilidad, que es
el grado en el que los actores involucrados en una evaluación consideran que los pro-
cesos y productos que se generan a partir de ella son valiosos y útiles para atender
sus necesidades; 2) factibilidad, que es el grado en el que una evaluación cumple con
los criterios de viabilidad contextual, efectividad y eficiencia en el uso de los recursos;
3) legitimidad, que es el grado en que una evaluación es apropiada, justa, legal y res-
ponsiva con los actores y comunidades involucrados; y 4) precisión, que es el grado
en que una evaluación es confiable y veraz en cuanto a sus procesos y resultados
(Klinger et al., 2015; Yarbrough et al., 2010).
3
diferentes para orientar sus procesos y resultados, teniendo como eje
central vincularla a los procesos educativos; es decir, no convertir a la
evaluación en un fin en sí misma, sino en una herramienta que permita
retroalimentar estrecha y continuamente a los actores educativos, a las
y los docentes, a las autoridades escolares y a las autoridades educati-
vas, y junto con ellos hacer de la evaluación un proceso de acompaña-
miento permanente a los procesos de mejora continua de la educación
(Mejoredu, 2022).
Para Mejoredu Este punto, que en algunos de los debates sobre las evaluaciones pasa
y su modelo inadvertido, en realidad es central para obtener conclusiones correc-
de evaluación, tas: el propósito de las evaluaciones que la ley mandata no es el mis-
conviene mucho mo que han tenido las evaluaciones estandarizadas tradicionales.
más pensar en Para Mejoredu y su modelo de evaluación, conviene mucho más pensar
evaluaciones en evaluaciones que den información útil a docentes, autoridades es-
que den colares y autoridades educativas, sobre lo que las y los estudiantes han
información aprendido al inicio del ciclo escolar, dando más relevancia a la obten-
útil a docentes, ción oportuna de esta información en formatos comprensibles y utiliza-
autoridades bles, y no tanto a modelos matemáticos complejos que son de interés
escolares y de los especialistas, pero que no aportan mucha información a nivel del
autoridades aula y del Sistema Educativo Nacional (sen) para impulsar procesos
educativas. de mejora continua.
4
evaluación tiene mucho significado al transitar de una evaluación que El modelo
se montó en diversos dispositivos técnicos para usos inadecuados de evaluación
─como clasificar, estigmatizar y desacreditar─, a otra que usa también diagnóstica,
dispositivos técnicos, pero centrados en las comunidades escolares con formativa e integral
objeto de impulsar procesos de valoración, reflexión, reconocimiento se instala en las
y mejora.3 nuevas tendencias
internacionales
Aunado a lo anterior, el medfi se instala en las nuevas tendencias inter- que están dejando
nacionales de evaluación educativa que están dejando atrás el predo- atrás el predominio
minio de las evaluaciones estandarizadas con fines sumativos, y avan- de las evaluaciones
zan marcando un cambio importante hacia enfoques más formativos y estandarizadas
adaptativos: en lugar de ser una herramienta de clasificación, la evalua- con fines sumativos
ción formativa se convierte en un proceso dinámico que guía el apren- hacia enfoques
dizaje y fortalece las capacidades de reflexión sobre el hecho educati- más formativos
vo de los diversos agentes. Asimismo, con la propuesta de evaluación y adaptativos.
diagnóstica, formativa e integral, considerando sus tres estrategias de
acción,4 se avanza en el esfuerzo de dar coherencia a las evaluaciones
a nivel del aula, la escuela y las valoraciones en los niveles de política
educativa y del sistema, tema considerado como un desafío crucial
para avanzar en su consolidación y desarrollo, y para detonar procesos
relevantes de mejora continua de la educación (IIEP/UNESCO, 2023).
3
Las tendencias internacionales, incluida la Organización para la Cooperación y el Desa-
rrollo Económicos (OCDE), se han movido hacia paradigmas similares al MEDFI. Después
de la pandemia, esta tendencia se acentúa.
4
Las tres estrategias planteadas por el medfi son: 1. apoyo a los procesos de valoración
diagnóstica (en el que se realizan tareas de recopilación, sistematización de informa-
ción y devolución formativa a nivel de aula, escuela y sistema); 2. impulso a la evaluación
formativa en el aula y la escuela; y 3. sistematización de experiencias en las comunida-
des escolares.
5
y contextos escolares y, sobre todo, ponerla al servicio de la mejora con-
tinua de la educación.5
5
Los responsables de las evaluaciones estandarizadas y los que continúan divulgando
la necesidad de apegarse a los estándares científico técnicos internacionales, caen en
un problema de sesgo cognitivo no menor. Tal como lo señaló uno de los fundadores
de la psicología humanista, Abraham Maslow: “Supongo que es tentador, si la única
herramienta que tienes es un martillo, tratar todo como si fuera un clavo”. Esto que
también se denomina el efecto Einstellung permite afirmar que confiar excesivamente
en una herramienta, método o enfoque, puede que no sea la solución más adecuada.
6
Aunque estos resultados permitían, bajo ciertos requisitos, hacer algunas desagrega-
ciones, nunca estuvieron pensados para trabajar con cada estudiante y con cada grupo
en cada escuela.
6
Mejoredu ha puesto
a disposición de las y
los docentes un conjunto
de Orientaciones didácticas
que contienen
sugerencias de
estrategias de enseñanza;
actividades de
aprendizaje en el aula,
material gráfico y
preguntas de reflexión.
7
Las evaluaciones diagnósticas incluyen también un importante compo-
nente formativo, que constituye una diferencia fundamental respecto
de las evaluaciones tradicionales de gran escala que solamente se cen-
traban en la emisión de resultados estadísticos con diferentes niveles
de desagregación, pero que muy poco hicieron para desarrollar estra-
tegias sólidas de retroalimentación con fines formativos. En contraste,
Mejoredu ha puesto a disposición de las y los docentes un conjunto de
Orientaciones didácticas que contienen sugerencias de estrategias
de enseñanza; ejemplos de actividades de aprendizaje en el aula, mate-
rial gráfico y preguntas de reflexión ─todo directamente vinculado con
los aprendizajes de las áreas evaluadas en cada grado─, y cuentan con re-
comendaciones específicas que las y los docentes pueden elegir, según
sean más apropiadas para sus estudiantes.7
7
Mejoredu ha desarrollado veinticuatro orientaciones didácticas para promover el uso
formativo de los resultados de la evaluación, que han tenido una respuesta favorable
entre el personal docente y se han convertido en las publicaciones con mayor canti-
dad de descargas en la página web de la institución: <https://www.MEJOREDU.gob.mx/
publicaciones/libro/>.
8
Solidez técnica de los resultados
8
De acuerdo con la consulta a docentes y otras figuras educativas sobre la evaluación
para la mejora del trabajo y la práctica docente (Mejoredu, 2021).
9
que las y los docentes puedan reconocer las prioridades de atención.
Los porcentajes promedio de aciertos se complementan con los map,
La estrategia más donde se establecen con claridad los grados de dificultad en cada
edecuada de mejora contenido evaluado para apoyar a maestras y maestros en sus decisio-
es comparar los nes pedagógicas y didácticas orientadas a recuperar, fortalecer o me-
esfuerzos de uno jorar los aprendizajes con estrategias generales de grupo, por subgru-
mismo, y no propiciar po de atención y a escala individual. Todo esto se acompaña con herra-
comparaciones con mientas para que las y los docentes, junto con sus estudiantes, puedan
otras escuelas o reflexionar sobre errores y aciertos, además de recurrir a las orientacio-
realidades educativas nes didácticas que fueron elaboradas para recuperar estrategias de
en diferentes enseñanza y ejemplos de actividades de aprendizaje en el aula.
contextos, como
suele suceder Conviene subrayar que los niveles de dificultad de los aprendizajes
con las evaluaciones fueron calculados a través de procedimientos estadísticos rigurosos.
estandarizadas Una vez realizados los análisis psicométricos de validez y confiabilidad,
tradicionales. se calcularon los niveles de dificultad en términos probabilísticos, esto
es, considerando la distribución de las respuestas en la población par-
ticipante y realizando los procedimientos de normalización estadística
correspondiente (tabla 1).
10
sino que además lo hacen de conformidad con los propósitos marcados
por nuestra Constitución y la ley en materia de evaluación y mejora
continua de la educación.
Tabla 1 Análisis técnico y estimaciones aplicadas a los resultados de las evaluaciones diagnósticas
Teoría clásica Alfa de Cronbach Confiabilidad de cada prueba Valores superiores a 0.9 para primaria;
del test (tct) aplicada bajo la tct. y superiores 0.8 en secundaria, ambos
considerados aceptables.
tct Facilidad y pPlus Dificultad clásica del reactivo, 98.1% de los reactivos se ubican en el rango
proviene del porcentaje de [0.2, 0.8], lo cual indica que la dificultad de
de aciertos en la prueba. las pruebas es adecuada.
tct Discriminación Índice de discriminación. El índice de discriminación resultó bueno
En el caso de un puntaje para Lectura y Formación Cívica y Ética;
dicotómico, la correlación bueno para Matemáticas en primaria y regular
ítem / total y la punto biserial para secundaria.
coinciden (Ptbis).
Teoría de Gráfica de Curva característica logística. Para la mayoría de los reactivos la curva empírica
respuesta al distractores de la respuesta correcta se ajusta a la esperada,
reactivo (irt, mientras que las curvas correspondientes
por sus siglas a las opciones distractoras se acercan al cero
en inglés). conforme se incrementa el nivel de habilidad.
irt d50 Dificultad del reactivo Las pruebas tienen aproximadamente
bajo una probabilidad la misma cantidad de reactivos por debajo
de responder 50%, que por arriba de la media y casi en su totalidad
dado que el estudiante (97.5%) estuvieron entre menos una y más una
conoce la respuesta correcta. desviación estándar.
irt Ajuste interno Ajuste interno del modelo El 97.7% de los reactivos se encuentra
Rasch (infit). en un rango adecuado, entre 0.8 y 1.20.
irt Confiabilidad Confiabilidad de la prueba La confiabilidad de las pruebas de Lectura y
eap / pv suponiendo un modelo Matemáticas es buena o excelente, con valores
tridimensional. Cada en el intervalo 0.8, 1.0 en todos los casos.
dimensión corresponde En el caso de Formación Cívica y Ética para
a una asignatura: Lectura, primaria la confiabilidad es buena, y aceptable
Matemáticas, Formación en el caso de secundaria, donde aparecen
Cívica y Ética. Se estima algunas medidas eap en el intervalo [0.7, 0.8].
un modelo irt dicotómico
con valores plausibles
para cada asignatura.
Correlación entre Correlaciones dos a dos Alta para primaria, mostrando valores superiores
dimensiones entre las dimensiones a 0.7. Media o alta en el caso de secundaria, en la
del modelo escalado. que la mayoría de los valores son superiores a 0.7,
pero se observan algunos entre 0.6 y 0.7.
irt Mapa de Wrigth Mapa para comparar Los reactivos cubren relativamente bien los
el resultado de personas distintos niveles de habilidad de los estudiantes.
y reactivos.
irt Función de Muestra la precisión de las La escala estima con precisión el nivel
información puntuaciones en la escala irt. de habilidad de los estudiantes.
Con las evaluaciones
diagnósticas del
aprendizaje impulsadas
por Mejoredu,
la evaluación no se
impone al sistema, sino
que se convierte en
una herramienta a su
servicio y en especial
al de las y los docentes,
quienes finalmente
tienen la última
palabra para mejorar
continuamente
la educación.
12
Otras técnicas utilizadas para identificar sesgo en la aplicación de ins-
trumentos mostraron indicios favorables. Por ejemplo, los resultados
en distintos grupos de participantes, sean bajos o elevados, siguen pa-
trones similares: los aprendizajes que tienden a ser más difíciles para
unos también son más difíciles para otros, en general, lo que deja en-
trever, entre otras cosas, que el mecanismo de aplicación de los instru-
mentos que estuvo a cargo de las y los maestros fue confiable, y que
fueron respetados los mecanismos clave en su administración.
9
Así se ha señalado en diversas reuniones, foros, talleres y diálogos regionales con maes-
tras y maestros de educación básica para analizar los resultados de las evaluaciones
diagnósticas y sus alcances e implicaciones pedagógicas.
13
Las autoridades país que así lo decidan, pero se subraya la aplicación en una mues-
educativas del país tra controlada de escuelas de primaria y secundaria a efecto de ofre-
han mostrado cer información agregada por entidad federativa y a escala nacional.
su confianza en Para la aplicación de esta muestra controlada se señalan las tareas de
los resultados que coordinación interinstitucional entre los diversos actores educativos y
Mejoredu les ha se establecen las actividades técnicas que corresponden fundamental-
devuelto sobre la mente a Mejoredu, así como las de orden operativo, administrativo y
situación de los de gestión que, de acuerdo con sus atribuciones, deben realizar las y los
aprendizajes de docentes, las autoridades escolares y las autoridades educativas.
las y los alumnos de
educación básica Con esta estrategia de aplicación se ha buscado impulsar mecanismos
de su entidad, de coordinación interinstitucional que respondan a criterios de corres-
al cumplir con ponsabilidad y austeridad republicana, para poner fin al dispendio fi-
los criterios nanciero que se realizaba en el país, gastando cientos de millones de
de pertinencia pesos en evaluaciones estandarizadas nacionales que terminaban re-
y validez técnica pitiendo los mismos resultados sin ningún impacto real en la mejora
correspondientes. educativa. Esta visión inercial de las evaluaciones estandarizadas sin
capacidad de autocrítica impidió mirar hacia opciones más creativas
de repensar la evaluación desde las necesidades del sen y de sus diver-
sos actores educativos. Con las evaluaciones diagnósticas del aprendi-
zaje impulsadas por Mejoredu, la evaluación no se impone al sistema,
sino que se convierte en una herramienta a su servicio y en especial al
de las y los docentes, quienes finalmente tienen la última palabra para
mejorar continuamente la educación.
Consolidación y prospectiva
10
Un ejemplo del uso de los resultados de las evaluaciones diagnósticas para orientar las
decisiones de mejora docente puede consultarse en <https://www.youtube.com/watch?
v=qDbT7M4oQ6M>.
14
También las autoridades educativas del país han mostrado su con-
fianza en los resultados que Mejoredu les ha devuelto sobre la situa-
ción de los aprendizajes de las y los alumnos de educación básica de
su entidad, al cumplir con los criterios de pertinencia y validez téc-
nica correspondientes. Diversas autoridades educativas del país han
utilizado los resultados de estas evaluaciones para impulsar acciones
orientadas a la mejora de los aprendizajes, considerando sobre todo el
efecto generado por la pandemia.11 Estas acciones se han enfocado en
brindar al estudiantado el acceso a recursos educativos, fortalecer la
enseñanza y reducir la desigualdad de oportunidades educativas. Los
resultados de estas evaluaciones también se empiezan a emplear con
fines de monitoreo y seguimiento a los avances en la recuperación de
los aprendizajes.
11
En la LVI sesión plenaria del Consejo Nacional de Autoridades Educativas (Conaedu),
celebrada el 15 de diciembre de 2022, Mejoredu presentó los resultados nacionales de
la evaluación diagnóstica para la mejora de los aprendizajes de las y los estudiantes
aplicada al inicio del ciclo escolar 2022-2023 y entregó a cada uno de los titulares de
educación de los estados los resultados de sus entidades federativas. Diversas autori-
dades educativas han utilizado los resultados de las evaluaciones diagnósticas como
insumos para el planteamiento de estrategias de recuperación de aprendizajes. Des-
tacan, entre otros, los estados de Sonora, Veracruz, Puebla, Hidalgo, San Luis Potosí,
Baja California Sur, Jalisco, Colima, Tabasco y Durango. En junio de 2022, la Subsecreta-
ría de Educación Básica de la SEP, hizo pública La Estrategia Nacional para Promover
Trayectorias Educativas Continuas, Completas y de Excelencia, en la cual se considera
a las evaluaciones diagnósticas elaboradas por Mejoredu como uno de sus componen-
tes, además de establecer una ruta de trabajo para su aplicación y usos para apoyar
la recuperación de aprendizajes.
15
En un esfuerzo de colaboración con la Secretaría de Educación Públi-
ca (sep), Mejoredu desarrolla actualmente estrategias de evaluación
diagnóstica y formativa que permitirán acompañar y retroalimentar la
nueva propuesta curricular para la educación básica (sep, 2023). Cabe
destacar que en esta propuesta curricular se realiza un análisis crítico
de la evaluación, de sus consecuencias y usos inadecuados, que han de-
rivado en una evaluación separada del proceso formativo y han tenido
como consecuencia la clasificación escolar y social de las y los estu-
diantes, entre otras. En el marco curricular actual, se apuesta por una
evaluación que es intrínseca a la relación pedagógica entre docente
y estudiante; sirve para retroalimentar el proceso educativo; fomenta
el diálogo que desencadena procesos de reflexión; considera los co-
nocimientos y saberes alrededor de la realidad de las y los alumnos
─en el aula, la escuela y la comunidad─; y reconoce que las valoraciones
siempre serán provisionales.
16
Referencias
17
lrmmce (2019, 30 de septiembre). Ley Reglamentaria del Artículo 3o. de la Cons-
titución Política de los Estados Unidos Mexicanos, en materia de Mejora
Continua de la Educación. Diario Oficial de la Federación.
Mejoredu (2021). Comisión Nacional para la Mejora Continua de la Educación.
Informe de resultados de la consulta a docentes y otras figuras educati-
vas sobre la evaluación para la mejora del trabajo y la práctica docente
[documento interno].
Mejoredu (2022). Comisión Nacional para la Mejora Continua de la Educación.
Modelo de evaluación diagnóstica, formativa e integral. La evaluación al
servicio de la mejora continua de la educación. <https://www.mejoredu.
gob.mx/images/publicaciones/Modelo_de_Evaluacion.pdf>.
Murillo, F. (2004). La investigación sobre eficacia escolar a debate: análisis de las
críticas y aportaciones. Tendencias pedagógicas, (9): 111-130.
Ravela, P. (2015). El uso de los resultados de las evaluaciones en la mejora de los
procesos de enseñanza. En M. Poggi (coord.), Mejorar los aprendizajes
en la educación obligatoria. Políticas y actores (69-110). Instituto Inter-
nacional de Planeamiento de la Educación de la Organización de las Na-
ciones Unidas para la Educación, la Ciencia y la Cultura. <https://unesdoc.
unesco.org/ark:/48223/pf0000234977/PDF/234977spa.pdf.multi>.
sep (2023). Secretaría de Educación Pública. Plan de estudio para la educación
preescolar, primaria y secundaria. <https://educacionbasica.sep.gob.mx/
wp-content/uploads/2023/07/Plan_de_Estudios_para_la_Educacion_
Preescolar_Primaria_y_Secundaria.pdf>.
UNESCO (2019). Organización de las Naciones Unidas para la Educación, la Cien-
cia y la Cultura. La promesa de las evaluaciones de aprendizaje a gran
escala. Reconocer los límites para generar oportunidades. <https://unes
doc.unesco.org/ark:/48223/pf0000369947>.
Yarbrough, D., Shula, L., Hopson, R. y Caruthers, F. (2010). The Program Evalu-
ation Standards: A Guide for Evaluators and Evaluation Users (3a. ed).
Corwin Press.
Wiliam, D. (2011). Embedded Formative Assessment. Solution Tree Press.
DIRECTORIO