Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Validez y Justicia
Validez y Justicia
ndice
8
11
Estandarizacin
Reflexiones finales
18
19
15
16
Cuestionamientos e inquietudes
sobre la evaluacin docente y su relacin
con la validez y la justicia
as preocupaciones y demandas de los maestros del pas sobre la Evaluacin del desempeo
docente, compartidas por otros sectores como acadmicos, lderes de opinin y organizaciones
sociales, se han concentrado principalmente alrededor de cuatro asuntos: la estandarizacin
de la evaluacin, la pertinencia del tipo de instrumentos y de su contenido, la contextualizacin de
stos y la implementacin del modelo de evaluacin.
1. Se cuestiona que una evaluacin estandarizada pueda medir y valorar la prctica docente
compleja por definicin, as como hacerlo con justicia mediante el reconocimiento de la diversidad de contextos socioeconmicos y culturales y de las diferentes condiciones escolares.
2. Se duda de que el tipo de instrumentos empleado y sus contenidos cubran dicha complejidad y respondan a la variedad de perfiles docentes; se juzga que no incluyen la sustancia del
trabajo docente y que dejan fuera lo verdaderamente importante.
3. Se afirma que, como lo manda la ley, no estn considerados los contextos que condicionan
el quehacer y los resultados de los docentes.
4. Finalmente, se alzan quejas sobre los mecanismos de implementacin de las acciones evaluativas y sobre el trato que reciben los docentes en las diferentes fases del proceso.
Estas crticas guardan relacin con la incertidumbre respecto del impacto que puede tener la evaluacin sobre las trayectorias profesionales de los docentes.
Desde la perspectiva tcnica, los cuestionamientos se pueden resumir de la siguiente manera: el
modelo de evaluacin (los perfiles, parmetros e indicadores; los instrumentos y su calificacin; la
interpretacin de resultados y la retroalimentacin que se ofrece) es adecuado para tomar decisiones sobre la permanencia, la promocin y el reconocimiento de los docentes en su profesin?
En el lenguaje de la evaluacin, esta pregunta alude a la validez y a la justicia del modelo. Validez
y justicia son dos caras de una misma preocupacin: la primera es la cara tcnica mientras que la
segunda, la social. La validez de una evaluacin guarda relacin directa con la justicia en la medida
en que conlleva consecuencias para las personas.1
1
American Educational Research Association/American Psychological Association/National Council on Measurement. (2014). Standards for Educational and Psychological Testing. Washington: Author; Newton, Paul E. & Shaw, Stuart D. (2014). Validity in Educational & Psychological Assessment. Los Angeles: Cambridge Assessment/SAGE .
La validez se puede definir de varias formas; una con amplia aceptacin entre los especialistas
es la que la describe como el grado en el cual la evidencia y la teora sustentan las interpretaciones de las puntuaciones para los usos propuestos de las pruebas.2 Esta definicin introduce
una idea central: la validez no es un atributo constante de un instrumento, sino uno propio de las
interpretaciones y usos, que debe someterse a revisin continua, cada vez que se aplican los instrumentos, se interpretan sus resultados y se toman decisiones. Quienes disean, aplican y utilizan
evaluaciones tienen la responsabilidad no slo de estar atentos a posibles amenazas a la validez
reportadas por los evaluados u otros actores interesados, sino de vigilar y analizar continuamente el
proceso de evaluacin para identificar riesgos que pudieran ir apareciendo.
Considerando esta responsabilidad, en ejercicio de su autonoma y en cumplimiento de su mandato
constitucional y de sus atribuciones legales, el Instituto Nacional para la Evaluacin de la Educacin
(INEE ) ha realizado un proceso de validacin de cada etapa del diseo y desarrollo de la Evaluacin del
desempeo docente; ha sido receptivo a los planteamientos provenientes de diferentes sectores y,
adems, ha implementado diversos estudios para detectar elementos que pudieran afectar su validez.
Estas acciones, que constituyen una evaluacin de la evaluacin, han quedado sistematizadas en los
siguientes documentos:
I nforme tcnico del Modelo de Evaluacin del Desempeo del Servicio Profesional Docente.
Direccin General para la Evaluacin de Docentes y Directivos, Unidad de Evaluacin del
Sistema Educativo Nacional. Mxico, agosto de 2106.
E
valuacin del desempeo desde la experiencia de los docentes. Consulta con docentes que
participaron en la primera Evaluacin del desempeo en 2015. Direccin General de Directrices para la Mejora de la Educacin, Unidad de Normatividad y Poltica Educativa del Instituto
Nacional para la Evaluacin de la Educacin. Mxico, junio 2016.
Informe de supervisin de la Evaluacin del desempeo docente y del personal con funciones de docencia, direccin y supervisin en educacin bsica y media superior. Ciclo escolar
2015-2016. Direccin General de Lineamientos para las Evaluaciones, Unidad de Normatividad y Poltica Educativa del Instituto Nacional para la Evaluacin de la Educacin. Mxico,
junio 2016.
Evaluacin de desempeo para la permanencia de docentes, directivos y supervisores en
educacin bsica y media superior de Mxico. Anlisis y evaluacin de su implementacin
2015-2016. Oficina Regional de Educacin de la UNESCO para Amrica Latina y el Caribe (OREALC ), a solicitud del Instituto Nacional para la Evaluacin de la Educacin. Santiago de Chile,
enero 2016.
E
valuacin internacional de los procesos de evaluacin de ingreso y promocin al Servicio
Profesional Docente en educacin bsica y educacin media superior en Mxico, 2014-2015.
Informe evaluativo. Acuerdo de colaboracin entre el Instituto Nacional para la Evaluacin
de la Educacin de Mxico y el IIPE-UNESCO . Buenos Aires, abril 2015.
American Educational Research Association/American Psychological Association/National Council on Measurement. (2014). Standards for Educational and Psychological Testing. Washington: Author.
Secretara de Educacin Pblica (SEP) (2015). Perfil, parmetros e indicadores para Docentes y Tcnicos Docentes. Evaluacin del
desempeo. Ciclo escolar 2015-2016. Mxico: Autor.
SEP. (2016). Perfil, parmetros e indicadores para Docentes y Tcnicos Docentes en Educacin Bsica. Ciclo escolar 2016-2017.
Mxico: Autor.
SEP. (2015). Perfil, parmetros e indicadores para personal con funciones de Direccin y Supervisin. Ciclo escolar 2015-2016.
Mxico: Autor.
SEP. (2016). Perfil, parmetros e indicadores para personal con funciones de Direccin y Supervisin en Educacin Bsica.
Ciclo escolar 2016-2017. Mxico: Autor.
SEP. (2015). Perfil, parmetros e indicadores para Docentes y Tcnicos Docentes en Educacin Media Superior. Ciclo escolar
2015-2016. Mxico: Autor.
SEP. (2016). Perfil, parmetros e indicadores para Docentes y Tcnicos Docentes en Educacin Media Superior. Ciclo escolar
2016-2017. Mxico: Autor.
Leyva, Y., Conzuelo, S., y Navarro, M. (2015). La buena enseanza. Hacia la consolidacin de un marco de la buena enseanza en
Mxico. Perfil, parmetros e indicadores. RED. Revista de evaluacin para docentes y directivos, 1(1).
Los PPI fueron formulados por la SEP mediante un proceso en el que participaron docentes frente a
grupo, directores de escuela, supervisores, jefes de sector, asesores tcnico pedaggicos, responsables de los niveles educativos y autoridades educativas locales en cada entidad federativa, quienes
generaron propuestas. A partir de stas se definieron perfiles compuestos de dimensiones, parmetros e indicadores. Se identificaron cinco grandes dimensiones para los docentes de educacin
bsica (EB ) y cinco para los de educacin media superior (EMS ), que responden a las particularidades
de cada nivel (ver figura 1).
Figura 1
Dimensiones de los perfiles docentes de educacin bsica y educacin media superior
Educacin bsica
Dimensin 1
Dimensin 1
Dimensin 2
Dimensin 2
Dimensin 3
Dimensin 3
Dimensin 4
Un docente que asume las responsabilidades legales y ticas inherentes a su profesin para el bienestar de los alumnos.
Dimensin 4
Dimensin 5
Dimensin 5
Estos dos perfiles generales de la buena docencia son slo un paso en el proceso de definir el objeto
de evaluacin. Cuando se especifica lo que se quiere evaluar sobre una poblacin y los usos que
se darn a los resultados de esa evaluacin, se debe plantear tambin la siguiente pregunta: se
pueden identificar caractersticas de subpoblaciones que, de no tomarse en cuenta, podran dar lugar
a errores en la medicin? En una poblacin se puede encontrar una gran variedad de subpoblaciones
a partir de diferentes criterios, no todos relevantes para lo que se busca evaluar. En el caso de la
evaluacin docente, las caractersticas de algunas subpoblaciones como aquellas definidas por su
aficin a los deportes o su estado civil no son relevantes para el objeto a evaluar; sin embargo, hay
otras que exigen ser consideradas como, por ejemplo, el nivel educativo en que trabajan, las modalidades, los tipos de servicio, las asignaturas y las especialidades docentes. Es as que estos diferentes
mbitos de la actuacin docente dieron lugar a 33 perfiles en EB y a 6 en EMS (ver tablas 1 y 2).
Total
Docentes
(Nacionales)
15
Docentes
(Complementarios)
Lengua indgena
Segunda Lengua: Ingls
Asignatura Francs
Asignatura Estatal
Artes
Tecnologa
Tcnicos
Docentes
12
TOTAL
33
Total
Docentes
Tcnico Docente
TOTAL
Esta diversidad de perfiles constituye un importante avance para el Sistema Educativo Nacional en la
medida en que orienta la realizacin de evaluaciones justas y transparentes, favorece la legitimacin
social de la profesin docente y sirve de gua puntual para procesos de formacin inicial y continua.
10
En el marco de sus atribuciones, el INEE realiz el proceso de validacin de todos los PPI mediante
comits especializados en los que participaron docentes y personal con funciones de direccin y supervisin de los diferentes niveles y modalidades de EB y EMS . Los criterios de validacin utilizados
fueron los de congruencia, pertinencia, generalizacin, suficiencia y claridad.5 Como resultado de la
revisin, el Instituto emiti recomendaciones a la Coordinacin Nacional del Servicio Profesional Docente (CNSPD ) sobre aspectos tcnicos de la construccin de los PPI para que cumplieran de manera
suficiente con los criterios de validacin.
Para mantener la vigencia y pertinencia de los PPI se requiere no slo su revisin a la luz de los
resultados de las evaluaciones sino tambin escuchar la voz de los actores involucrados. Al realizar
esas acciones, el INEE ha reconocido tres principales lneas de trabajo para una mejor definicin del
objeto a evaluar:
1. Clarificar la redaccin de algunos parmetros e indicadores.
2. Fortalecer la congruencia entre ambos.
3. Ajustar algunos indicadores para que reflejen mejor el quehacer docente en sus respectivos
mbitos, y que representen mejor la diversidad de las prcticas de enseanza.
Para apoyar a la SEP en la mejora de estos aspectos, en marzo de 2015 el INEE elabor el documento
Referentes tcnicos para la elaboracin de parmetros e indicadores derivados de los distintos perfiles asociados al SPD y brind asesora a la CNSPD para mejorar los procesos de participacin social
y aumentar la representatividad en los comits para el desarrollo de los parmetros e indicadores.
Instituto Nacional para la Evaluacin de la Educacin. (2015). Lineamientos para llevar a cabo la evaluacin del desempeo de
quienes realizan funciones de docencia, direccin y supervisin en educacin bsica y media superior. LINEE -05-2015, Artculo 8.
11
se lleva a cabo.6 En los documentos Etapas, aspectos, mtodos e instrumentos (EAMI ),7 se establece
la importancia de que la evaluacin recupere las condiciones laborales de los maestros, a travs
de su contexto sociocultural y los rasgos particulares de la escuela y el aula en la que desarrollan
su prctica profesional. Asimismo, se describen las caractersticas del proceso en su conjunto, las
etapas e instrumentos que se emplearn, y se especifican los aspectos a evaluar en correspondencia
con los PPI .
En los EAMI se establecen las etapas para evaluar el desempeo del docente, como se enuncian en
la tabla 3.
Tabla 3 Etapas de la Evaluacin del desempeo docente en educacin bsica y media superior
Educacin bsica
Instituto Nacional para la Evaluacin de la Educacin. (2015). Lineamientos para llevar a cabo la evaluacin del desempeo
de quienes realizan funciones de docencia, direccin y supervisin en educacin bsica y media superior. LINEE-05-2015,
Artculos 9 y 34.
Secretara de Educacin Pblica. (2015). Etapas, aspectos, mtodos e instrumentos. Proceso de evaluacin del desempeo docente. Educacin bsica. Mxico. Autor.
SEP (2015). Etapas, aspectos, mtodos e instrumentos. Proceso de evaluacin del desempeo docente. Educacin media superior.
Mxico. Autor.
12
Las normas para el proceso de seleccin, capacitacin y certificacin de evaluadores, as como los criterios para la calificacin
de instrumentos se pueden consultar en:
Instituto Nacional para la Evaluacin de la Educacin. (2015). Lineamientos para la certificacin de evaluadores que participarn
en la evaluacin del desempeo en educacin bsica y media superior para el ciclo escolar 2015-2016. LINEE-02-2015.
INEE. (2015). Lineamientos para la seleccin y capacitacin de evaluadores que participarn en la evaluacin del desempeo en
educacin bsica y media superior para el ciclo escolar 2015-2016. LINEE-03-2015.
INEE. (2015). Criterios tcnicos y de procedimiento para el anlisis de los instrumentos de evaluacin, el proceso de calificacin
y la emisin de resultados de la evaluacin del desempeo de quienes realizan funciones de docencia en Educacin Bsica,
2015-2016.
INEE. (2015). Criterios tcnicos y de procedimiento para el anlisis de los instrumentos de evaluacin, el proceso de calificacin
y la emisin de resultados de la evaluacin del desempeo de quienes realizan funciones de docencia en Educacin Media
Superior, 2015-2016.
13
Instituto Nacional para la Evaluacin de la Educacin. (2015). Criterios tcnicos para el desarrollo y uso de instrumentos de
evaluacin educativa, 2014-2015. Mxico: Autor.
14
Debe decirse que, incluso si el mal trato no tuviera efecto alguno en el desempeo, seguira siendo inadmisible en tanto representa una falta de respeto a su dignidad.
11
Herramientas y procedimientos para dar acceso a la evaluacin a las personas con alguna discapacidad sin alterar la medicin
del constructo de inters.
15
Los estudios que el INEE ha realizado le han permitido hacer recomendaciones especficas a las
autoridades educativas para corregir las problemticas surgidas en la implementacin. De hecho,
los mismos estudios muestran que ya en la Evaluacin del desempeo realizada en julio de 2016 a
quienes ingresaron al Servicio dos aos antes, se introdujeron correcciones a los procedimientos y
fue posible apreciar una mejora moderada en la percepcin de los evaluados respecto de la expresada por los participantes en la evaluacin de 2015. Este incremento de la satisfaccin ocurre en
casi todos los elementos del proceso de evaluacin, tanto los previos a la aplicacin (notificacin,
utilidad de las guas, entre otros), como los que se llevan durante sta (las instrucciones, el trato del
aplicador, el funcionamiento del equipo de cmputo y otros).
A pesar de que los docentes reportan mayor satisfaccin con el proceso, su opinin sigue siendo
poco favorable en algunos rubros, en especial, la duracin de las aplicaciones y la claridad con la que
se plantean las preguntas, as como los casos de los exmenes de conocimientos y competencias
didcticas y la suficiencia y funcionamiento de los equipos de cmputo). Por ello, el INEE contina
recogiendo y analizando informacin para aportar a la mejora de la logstica y a la prevencin de
barreras a una evaluacin vlida y justa.
12
Esto complementa las consideraciones conceptuales y lgicas utilizadas para el diseo y desarrollo de los instrumentos, y contribuye a la revisin de posibles sesgos en los que se incurri durante dicho desarrollo.
16
Con base en los anlisis de dificultad, discriminacin, confiabilidad y otros que se han realizado
sobre los instrumentos aplicados, el Instituto ha determinado la cancelacin de algunos de ellos.
Las puntuaciones obtenidas en dichos instrumentos no tuvieron efecto en la calificacin de los docentes evaluados. Por lo dems, los indicadores psicomtricos han sido adecuados.
Como se ha dicho en este documento, una instancia evaluadora debe examinar continuamente los
resultados de sus instrumentos para identificar aspectos que atenten contra la validez. Por lo anterior, el INEE tiene prevista una agenda de estudios de validez para continuar el fortalecimiento
del desarrollo de evaluaciones justas y contextualizadas. Actualmente, se desarrolla uno sobre los
instrumentos de respuesta construida.
17
Estandarizacin
En los prrafos previos se ha aludido de diferentes maneras a las nociones de pertinencia y contextualizacin de las evaluaciones, as como a las de trato digno y accesibilidad a la evaluacin.
Enseguida se discute la nocin de estandarizacin, considerando que podr comprenderse mejor a
partir del anlisis previo.
Contrariamente a lo que se piensa, la estandarizacin de instrumentos es un medio para la justicia
en las evaluaciones. La estandarizacin busca ofrecer a todos los evaluados las mismas oportunidades para plasmar su capacidad, de manera que sus resultados sean comparables y se eviten
injusticias. Para que ello ocurra, se deben usar los mismos reactivos o tareas evaluativas, dar
las mismas instrucciones, proporcionar el mismo tiempo para responder, establecer condiciones
ambientales similares, entre otras medidas. Sin embargo, poner en las mismas condiciones a personas diferentes puede requerir de adaptaciones, por la forma en que algunas de ellas responden
al instrumento, sin alterar el concepto de estandarizacin. Por ejemplo, un docente con debilidad
visual puede necesitar una prueba distinta de la de sus colegas; esa prueba debe ser igual en los
contenidos, pero estar impresa en macrotipo y contar con diversas adecuaciones de diseo. Esto
se llama tcnicamente acomodacin, como se vio antes en este documento. Se puede afirmar, sin
caer en contradiccin, que la correcta estandarizacin de una prueba puede necesitar de este tipo
de adaptaciones para poner en verdadera igualdad de condiciones a todos los sustentantes.
Por otra parte, hay situaciones en las que las caractersticas de un grupo demandan adaptaciones
tales que el objeto a medir se modificara tanto que ya no sera el mismo. Por ejemplo, el quehacer
de las educadoras de preescolar indgena difiere cualitativamente del de las de preescolares generales. Lo mismo se puede decir de los docentes de Educacin Fsica y de otras especialidades. En esos
casos, el uso de un solo instrumento estandarizado para estos y otros grupos de maestros resultara
en injusticias y en falta de comparabilidad con el resto de sus colegas, por lo que se opt por tener
perfiles e instrumentos de evaluacin diferenciados.
Por lo examinado en este documento, se puede afirmar que la evaluacin del desempeo docente es
una evaluacin estandarizada y tambin una diversificada, en la que hay varias adaptaciones para poner en igualdad de condiciones a diferentes participantes: la diversificacin de perfiles, la posibilidad
de que cada evaluado caracterice el contexto para el cual su prctica es pertinente, las acomodaciones para docentes con debilidad visual y con discapacidad motora, la eliminacin de reactivos que
pueden introducir sesgo hacia algunos grupos, y otras medidas. Los 74 instrumentos de la evaluacin
docente desarrollados para el SPD estn diversificados para atender a la gran variedad de mbitos
educativos e incluyen tareas evaluativas que permiten introducir el contexto, pero, al interior de cada
mbito, estn estandarizados para asegurar la comparabilidad y evitar injusticias.
El grado en que deben diversificarse los instrumentos y las acomodaciones que deben introducirse
para asegurar la justicia de una evaluacin no pueden definirse de una vez y para siempre. Las
sucesivas aplicaciones de una evaluacin pueden ir mostrando la conveniencia de nuevas acomodaciones e incluso, de redisear sustancialmente instrumentos para hacerlos ms pertinentes a
las prcticas docentes.
18
Reflexiones finales
En este documento se revisaron algunos de los requisitos para que una evaluacin sea vlida y la
manera en que se aplicaron a la Evaluacin del desempeo. Se expuso informacin sobre la forma
en que el INEE ha buscado cubrirlos y sobre las tareas pendientes para continuar revisando la validez
de la evaluacin. El propsito del documento ha sido responder a las inquietudes sobre la pertinencia y contextualizacin de las evaluaciones, as como a las quejas sobre el trato que han recibido
algunos docentes en las sedes.
Una responsabilidad central del Instituto es asegurar la validez de la evaluacin, es decir, el grado en que la teora y la evidencia emprica justifican las interpretaciones de sus resultados y las
decisiones que se toman a partir de ellas. Para atenderla adecuadamente, el INEE ha asumido la
tarea de recoger, sistematizar y analizar continuamente informacin que le permita sustentarla.
Ha introducido mejoras y correcciones puntuales en los dos aos de operacin de las evaluaciones
docentes y, como se ha mencionado, ha hecho recomendaciones a la SEP . Pero, adems, est replanteando el modelo de evaluacin docente y programando una serie de acciones para la mejora
continua de su validez.
Todos los esfuerzos que el Instituto realice para asegurar este rasgo fundamental de las evaluaciones redundarn en decisiones justas para los docentes y benficas para el aprendizaje de los estudiantes de Mxico.
19
20