Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Grupo de Trabajo
sobre Estndares y Evaluacin
Julio 2007
1
Pedro Ravela, Patricia Arregui, Gilbert Valverde, Richard Wolfe, Guillermo Ferrer,
Felipe Martnez Rizo, Mariana Aylwin y Laurence Wolff1
El presente documento constituye el punto de vista de los miembros del actual Comit Gestor
del GTEE sobre la importancia, propsitos y usos de las evaluaciones estandarizadas2 de
aprendizajes y/o logros educativos3 en gran escala4, en Amrica Latina y el Caribe.
2. Esta convergencia en torno a la evaluacin a gran escala se origina, sin embargo, a partir
de intereses y perspectivas diversas en cuanto al rol del sistema educativo. En algunos
casos predomina una preocupacin por la formacin ciudadana y la consolidacin de una
sociedad democrtica; en otros, por la productividad de la fuerza de trabajo y la
competitividad de la economa nacional, por las oportunidades para el desarrollo integral
de las personas y sus posibilidades de participacin en la sociedad del conocimiento, o por
la equidad y la visin de la educacin como uno de los caminos para superar la pobreza.
Muchos sistemas de evaluacin parten de una combinacin de los intereses anteriores. En
casi todos los casos se asume que la evaluacin puede servir: i) como base para la
adopcin de polticas educativas mejor fundamentadas; ii) para la mejora de la gestin de
los sistemas educativos; iii) como instrumento para la colaboracin y el aprendizaje
continuo al interior de los mismos.
mismos criterios de valoracin. Por otra parte, dichos criterios estn fuertemente
vinculados a la experiencia profesional del docente: su formacin general y especfica, su
conocimiento de la disciplina que ensea, su capacidad para percibir los procesos y
dificultades de los estudiantes, su familiarizacin con diversos tipos de alumnos, etc. Dada
la heterogeneidad del cuerpo docente de un pas, no es posible obtener una visin de la
situacin del conjunto por la mera agregacin de los puntos de vista individuales.
5. Otra razn importante para cuestionar la equivalencia entre aos de estudio y acceso a las
capacidades simblicas es que la ampliacin de la cobertura educativa produjo un rpido
crecimiento del acceso a la profesin docente, que no fue acompaada por garantas de
calidad en la formacin y el egreso de las instituciones formadoras. Tanto en pases en que
la formacin de docentes es realizada por el sector pblico, como en pases en que la
misma ha sido encomendada al sector privado, en general, el Estado ha sido omiso en la
formulacin e instrumentacin de controles apropiados de la calidad de dicha formacin.
7.6. cmo influyen las condiciones de la enseanza (situacin de los maestros, recursos
disponibles, tiempos de estudio etc.) en los progresos de los alumnos;
7.7. cul es el efecto que tienen en los logros educativos las inversiones en programas
educativos, los cambios en la estructura del sistema, los cambios curriculares, los
programas de formacin, la adquisicin de material educativo, etc.5.
Un sistema de evaluacin de aprendizajes y/o logros educativos, que produzca y comunique adecuadamente
informacin sobre los aspectos antes indicados, puede ser un instrumento clave de mejora, enriqueciendo la
comprensin de la situacin educativa y la toma de decisiones por parte de diversos actores sociales.
Las autoridades y los formuladores de polticas educativas pueden comprender mejor los
problemas de la enseanza y del aprendizaje; hacerse cargo de las carencias en que se desarrolla la
labor docente y desarrollar polticas activas y pertinentes para apoyar el trabajo de las escuelas; valorar
sobre una base de evidencia emprica slida el impacto de las polticas y programas que han impulsado y
los probables efectos de las que se proponen impulsar.
Los directivos y docentes pueden, a partir de una mirada externa sobre los logros educativos en el
conjunto del sistema, comprender mejor lo que estn logrando sus propios estudiantes y lo que no,
cmo estn aprendiendo y qu dificultades tienen. Pueden aprender de las experiencias de otros
docentes y escuelas que trabajan con estudiantes de caractersticas tanto similares como diferentes a los
propios. Pueden tomar decisiones ms apropiadas acerca de qu aspectos del currculo enfatizar y
enriquecer sus propios modos de evaluar el aprendizaje de sus estudiantes.
Los supervisores y formadores de docentes pueden apoyarse en la informacin sobre los logros y
dificultades educativas en el conjunto del sistema para estudiar en profundidad las debilidades en el
enfoque o en la prctica de la enseanza que probablemente generan algunas de las insuficiencias
constatadas en los aprendizajes. Desde esa nueva perspectiva pueden mejorar su labor tanto de
orientacin a los docentes como de formacin de los mismos. En particular los supervisores pueden
beneficiarse de contar, como instrumento de apoyo para su labor, con un mapa de las escuelas que las
caracterice tanto en trminos de la composicin sociocultural de su alumnado como de sus logros
educativos.
Los padres y madres de estudiantes, adecuadamente informados, pueden comprender mejor qu es
lo que se espera que sus hijos aprendan, qu es lo que estn logrando y qu pueden ellos hacer para
colaborar con la escuela y con el aprendizaje de sus hijos.
La ciudadana en general estar mejor informada sobre lo que acontece al interior del sistema
educativo y, por tanto, ms atenta a los temas y problemas de la educacin. Estar, adems, en mejores
condiciones para exigir tanto a los poderes pblicos como a los profesionales de la docencia, la mejora
continua de la educacin que se brinda a los nios, nias y jvenes, y el uso responsable de los recursos
que se destinan a la educacin.
5
El cumplimiento de lo establecido en los numerales 7.4 a 7.7 requiere del desarrollo de dispositivos de recoleccin de
informacin que no se limitan a pruebas de logro educativa, as como de diseos del proceso de evaluacin adecuados a tales
propsitos.
5
9. Junto con las razones que justifican la importancia de desarrollar sistemas nacionales de
evaluacin de aprendizajes y/o logros educativos a gran escala, es necesario destacar
cuatro riesgos fundamentales que deben tenerse siempre presentes:
9.4. La evaluacin estandarizada externa slo podr tener efectos positivos sobre
la educacin si es concebida, percibida y empleada como un mecanismo de
responsabilizacin pblica de todos los actores vinculados al quehacer
educativo. Existe siempre el riesgo de que la poltica educativa se concentre en la
implementacin de evaluaciones, pero que luego no se tomen acciones concretas
6
para enfrentar y resolver los problemas que las mismas ponen de manifiesto.
Muchas veces las autoridades se limitan a informar de los resultados y transferir
toda la responsabilidad por la solucin de los problemas detectados a las escuelas y
familias, como si se tratase de un asunto privado entre ambas. Otras veces, toda la
responsabilidad se atribuye a los docentes, quienes, por su parte, tienden a
transferir toda la responsabilidad a los padres o al contexto. Lo importante es evitar
ingresar en una dinmica de culpabilizacin y, por el contrario, intentar construir
una lgica de responsabilidad compartida en torno a la educacin.
10. Los sistemas de evaluacin estandarizada se desarrollaron con fuerza en toda la regin
durante los aos 90. Algunos pases han mantenido sus sistemas en funcionamiento con
continuidad, aun cuando se produjeran cambios de enfoque o variaciones, a veces
accidentadas, en la institucionalidad de los mismos. Otros pases han sufrido importantes
discontinuidades y han tenido que comenzar prcticamente desde cero en repetidas
oportunidades o tendrn que hacerlo en el futuro prximo.
12. Durante los ltimos 12 aos ha estado activa en la regin la red de los sistemas de
evaluacin organizada en torno al Laboratorio Latinoamericano de Evaluacin de la
Calidad de la Educacin (LLECE) de OREALC/UNESCO, en la que participan
actualmente la casi totalidad de los pases latinoamericanos. Esta Red se rene
ordinariamente dos veces al ao y es un espacio de intercambio de experiencias y
formacin en el mbito de la evaluacin. Ms recientemente se ha constituido el Grupo
Iberoamericano de PISA integrado por Argentina, Brasil, Chile, Colombia, Espaa,
Mxico, Portugal y Uruguay.
13. Los principales cambios y mejoras que pueden ser observados en los ltimos aos en
los sistemas de evaluacin de la regin son los siguientes:
13.1. Parece haberse superado la etapa en la que las autoridades en varios pases
interferan en la divulgacin de los resultados de las evaluaciones cuando stos no
les parecan favorables. En general, existe en la regin una mayor transparencia en
la difusin de los resultados.
13.2. Hay una tendencia creciente a pasar de pruebas normativas a pruebas criteriales. La
diferencia principal es que las primeras tienen como propsito principal ordenar
comparativamente a los estudiantes, en tanto que las segundas ponen su foco de
atencin en qu es lo que los estudiantes saben y son capaces de hacer. Asimismo,
existe una tendencia creciente a incluir en las pruebas criteriales una definicin de
7
cul es el resultado que todos los estudiantes deberan alcanzar para que su
desempeo pueda ser considerado satisfactorio. Para comprender la importancia de
esta diferencia, es importante notar que mejor no es lo mismo que bueno y
peor no es lo mismo que malo. Por ejemplo, una evaluacin puede colocar el
foco de atencin en la comparacin relativa entre escuelas con mejores y peores
puntajes. Es perfectamente posible que las escuelas con puntajes ms altos
(mejores), no sean buenas, en la medida que no logran que todos o la mayora
de sus estudiantes alcancen los niveles de desempeo considerados satisfactorios.
La misma reflexin se aplica a las comparaciones de resultados entre pases.
13.3. Buena parte de los pases de la regin han mejorado sus capacidades tcnico-
metodolgicas para la construccin de pruebas y para el procesamiento de los
datos. Existen esfuerzos por desarrollar pruebas que evalen un rango de
conocimientos y capacidades ms amplio y que incluyan preguntas de respuesta
construida. Se han ido incorporando metodologas ms sofisticadas para el
tratamiento de datos, como la Teora de Respuesta al tem y el Anlisis Multinivel.
13.4. Es posible observar en la mayora de los pases una atencin creciente a la difusin
y uso de los resultados. Existe en la regin mayor conciencia de que no basta con
implementar una evaluacin y publicar un informe, sino que es necesario
desarrollar una estrategia de divulgacin y un conjunto de reportes apropiados a
cada una de las audiencias a las que se quiere llegar. Las Unidades de Evaluacin
tienen una mayor conciencia acerca de la existencia de usos apropiados e
inapropiados para cada tipo de evaluacin, aunque esta misma conciencia y
comprensin muchas veces no est suficientemente difundida entre quienes toman
decisiones de carcter poltico. Este aspecto ser analizado con mayor detalle ms
adelante en este documento.
14. Aun con los cambios y mejoras recin indicados, persiste un conjunto importante de
debilidades que es preciso sealar. Las mismas estn enumeradas a continuacin y se
8
14.2. An no se tiene claro que no cualquier evaluacin sirve para cualquier propsito y a
que es necesario disear cuidadosamente el sistema de evaluacin para el largo
plazo, en funcin de unos propsitos y usos claramente establecidos. En funcin de
los propsitos y usos es necesario adoptar un conjunto de decisiones relativas a la
utilizacin de censos o muestras, a los grados y disciplinas que sern evaluados, la
periodicidad de las evaluaciones, el tipo de pruebas y escalas de reporte, etc.
14.3. Existe, en general, insuficiente discusin pblica en torno a qu debe ser evaluado
en una evaluacin estandarizada y sobre qu aspectos del currculo deben haber sido
enseados a todos los estudiantes al concluir determinados niveles educativos. En el
fondo, esto refleja el problema antes mencionado de los currculos que carecen de
metas de aprendizaje claras o estndares. Mientras no exista claridad acerca de qu
deben aprender, conocer y ser capaces de hacer todos los estudiantes, tampoco
existir claridad ni para la enseanza ni para la evaluacin. Esta tarea requiere, por
un lado, un amplio debate social y, por otro, un trabajo tcnico coordinado entre las
unidades de currculo y de evaluacin.
14.4. Es necesario realizar un esfuerzo mayor por mejorar la investigacin sobre los
factores que explican los resultados. Ello implica, por un lado, mejorar mucho los
instrumentos complementarios que se aplican junto con las pruebas y, por otro lado,
concebir diseos de investigacin ms ambiciosos: estudios longitudinales, estudios
de valor agregado, estudios cualitativos, entre otros.
14.5. Los Ministerios de Educacin han tenido, por lo general, una limitada capacidad
para concebir, formular e implementar polticas que den respuesta a los problemas
identificados en las evaluaciones. Por lo general, falta articulacin entre las
Unidades de Evaluacin y otros actores educativos relevantes, dentro y fuera de los
Ministerios de Educacin, para asumir polticas consistentes, de envergadura y
duraderas para enfrentar los problemas de aprendizaje que las evaluaciones ponen
de manifiesto. En particular, es preciso destacar la necesidad de articulacin entre la
evaluacin, el desarrollo curricular, la formacin inicial y el desarrollo profesional
de los docentes.
14.6. Si bien existe una creciente preocupacin respecto a la divulgacin y uso de los
resultados, son insuficientes an las acciones en este terreno, en particular, para
lograr que los docentes comprendan y utilicen los resultados de las evaluaciones, y
para que los resultados de este tipo de evaluaciones se incorporen a la cultura
escolar. La mayor parte de los docentes en la regin no comprende los aspectos
tcnicos involucrados en el diseo de las evaluaciones nacionales e internacionales
y los tipos de resultados que las mismas arrojan. Por tanto, difcilmente puedan
9
15. Las principales debilidades y desafos recin enumerados pueden organizarse en torno a
dos categoras principales: problemas relacionados con la estrategia de difusin y
uso de los resultados y problemas relacionados con la calidad tcnica de las
evaluaciones. Slo una evaluacin tcnicamente buena y cuyos resultados sean conocidos
y utilizados de manera apropiada, puede tener algn impacto en la mejora de los
aprendizajes. Como resulta obvio, una evaluacin cuyos resultados son poco conocidos y
utilizados supone un ejercicio estril y un desperdicio de recursos. Pero, ms graves aun,
son aquellas situaciones en que evaluaciones tcnicamente malas son ampliamente
difundidas o en que las evaluaciones son empleadas para fines diferentes de aquellos para
los cuales fueron concebidas y diseadas.
10
Calidad tcnica
Difusin y uso Buena Mala
Aporte. Posibilidad de impacto Efectos perversos,
Adecuados a las caractersticas
en la mejora del rendimiento en interpretaciones y decisiones
tcnicas de la prueba las reas evaluadas. erradas.
Efectos perversos, Efectos perversos,
No adecuados a las caractersticas
interpretaciones y decisiones interpretaciones y decisiones
tcnicas de la prueba erradas. erradas.
Desperdicio de recursos y
Escasa o nula Desperdicio de recursos.
oportunidades.
En los tres captulos que siguen en el Documento: i) se plantean las alternativas y opciones
de poltica de evaluacin que es necesario analizar a la hora de poner en marcha o reformar un
sistema nacional de evaluacin; ii) se explicita con mayor amplitud cules son los
principales desafos tcnicos que un sistema nacional de evaluacin debe encarar; y, iii) se
plantean las condiciones necesarias para construir Unidades de Evaluacin efectivas.
III. Los propsitos y los usos de los resultados de las evaluaciones estandarizadas
17. Lo anterior aplica antes que nada a la necesidad de establecer un adecuado balance
entre la implementacin de pruebas nacionales y la participacin en la oferta
creciente de pruebas internacionales. Las pruebas nacionales pueden ofrecer una mirada
ms apropiada acerca de qu aprenden los estudiantes de aquello que se les est
enseando. Las pruebas internacionales pueden servir para ubicar la situacin del pas en
relacin a lo que saben y son capaces de hacer los estudiantes en otras sociedades y
enriquecer el debate sobre el currculo nacional y el enfoque de la enseanza. Los pases
deberan analizar cuidadosamente en qu pruebas internacionales participar, teniendo en
cuenta lo que cada una pretende evaluar y su pertinencia en relacin a los objetivos
nacionales. Parece recomendable el ejercicio de participar al menos peridicamente en
una evaluacin regional o internacional, en el marco de la poltica de prioridades que cada
pas defina.
19.2. Hace responsables tanto a los docentes como a los propios estudiantes por alcanzar
los conocimientos y capacidades que son objeto de evaluacin en el examen, lo cual
tiene impactos positivos sobre el aprendizaje.
20.1. Las pruebas deben tener carcter censal y cada estudiante debe tener ms de una
oportunidad para rendirla, lo cual requiere implementar varios operativos de
evaluacin cada ao.
20.2. Las pruebas deben tener una amplia cobertura curricular, lo cual requiere pruebas
extensas, en lo posible, con preguntas de respuesta construida (que tienen un
importante costo de codificacin) y deben abarcar varias asignaturas o disciplinas.
21. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes puede
generar tensiones importantes que es necesario anticipar. Si las pruebas son exigentes,
ello puede conducir a niveles de reprobacin muy altos, que afectaran principalmente a
los sectores sociales ms vulnerables, que podran agudizar problemas como la desercin
y el desempleo juvenil, y que seran insostenibles desde el punto de vista social y poltico.
Por ello, es preciso acompaar este tipo de evaluaciones (en realidad todo tipo de
evaluaciones, pero estas en particular) con acciones pedaggicas de carcter
complementario y compensatorio: proponer estndares altos implica asumir
responsabilidad sistmica por proporcionar todas las oportunidades para aprender (textos,
materiales, instalaciones, preparacin de maestros, entre otros).
22.1. Uno que ha sido implementado en diferentes pases, consiste en que la evaluacin
estandarizada constituya slo una parte del proceso de certificacin de
aprendizajes de los estudiantes (por ejemplo, el 40% de su calificacin final). El
resto de la nota corresponde a las evaluaciones que realizan los docentes a cargo de
los estudiantes. Si bien en este caso se mantiene el problema sealado al comienzo,
respecto a la heterogeneidad de los criterios de evaluacin empleados por los
docentes, es una forma de combinar la evaluacin externa y la interna e, incluso, de
aportar a los docentes una mirada externa que les permita reflexionar acerca de sus
propios criterios.
22.3. La peor respuesta que podra darse a este problema sera establecer un porcentaje
fijo de reprobacin, por ejemplo, no debe reprobar ms del 10% de los estudiantes.
Ello implica utilizar pruebas ms fciles y, por lo tanto, enviar a estudiantes,
familias y educadores una seal equivocada respecto a las expectativas de
aprendizaje.
23. La evaluacin externa con propsitos de certificacin es ms apropiada para los ciclos
superiores del sistema educativo, sobre todo hacia el final de la educacin media.
25. Un sistema de evaluacin de tipo formativo y sin consecuencias directas para los
estudiantes tiene las siguientes ventajas:
25.1. Los costos de aplicacin de pruebas pueden ser menores, dado que las pruebas
pueden tener carcter muestral y aplicarse slo en algunos grados clave y cada
cierto nmero de aos (la opcin entre pruebas muestrales o censales con un
enfoque formativo se desarrolla en el apartado 27). Esto puede permitir destinar
ms recursos a la divulgacin y capacitacin a partir de los resultados.
25.2. Las pruebas pueden disearse con carcter matricial. Esto significa que no todos los
estudiantes responden a las mismas preguntas sino a bloques de las mismas, lo cual
hace posible trabajar con una cantidad muy grande de preguntas que permiten
obtener un anlisis ms detallado de los distintos aspectos del currculo.
25.3. Es posible definir estndares o niveles de expectativa exigentes, que operen como
punto de referencia para estudiantes, familias y educadores acerca de lo que se debe
aspirar que conozcan y sean capaces de hacer los primeros, sin que ello produzca un
fracaso generalizado.
25.5. Una de las alternativas a considerar entre los usos de carcter formativo es la de
liberar una prueba completa, para que sea aplicada en forma autnoma por parte
de los maestros, con el fin de ayudarles a identificar dificultades de alumnos
individuales y de enriquecer su repertorio de instrumentos de evaluacin.
26.1. Para que los resultados de este tipo de evaluaciones tengan impacto sobre las
polticas educativas, debe realizarse una importante inversin de tiempo en el
anlisis y discusin de los resultados por parte de diversas reas del Ministerio de
Educacin y otros actores relevantes, en la comprensin de los problemas y
deficiencias que los resultados ponen de manifiesto y en la concepcin de acciones
e inversiones apropiadas para hacerles frente.
26.2. Las autoridades deben estar dispuestas a someter sus polticas y decisiones al
escrutinio de la ciudadana, para lo cual es necesario invertir en la comunicacin
apropiada y permanente de los resultados a la opinin pblica.
26.3. Para que los resultados de evaluaciones de carcter formativo tengan impacto sobre
las prcticas de enseanza, es imprescindible realizar una importante inversin de
tiempo en el anlisis e interpretacin de las implicancias didcticas de los
resultados: si los estudiantes no son capaces de resolver cierto tipo de situaciones,
qu es lo que se est haciendo de manera insuficiente o inapropiada en las aulas y
qu es lo que se debera hacer? Este tipo de anlisis debe ser realizado tanto por
especialistas en la didctica de las reas evaluadas como por los docentes.
26.4. Esto ltimo implica, dadas las condiciones predominantes de trabajo docente en la
regin, una inversin importante en la creacin de espacios permanentes y
sistemticos de formacin en servicio y de trabajo colectivo al interior de las
escuelas. En ausencia de estos espacios, los docentes no pueden comprender ni
apropiarse de los resultados de las evaluaciones y, por tanto, difcilmente estos
ltimos tendrn impacto sobre los modos de ensear de los docentes ni sobre los
aprendizajes de los estudiantes.
26.5. Para que los resultados de evaluaciones de carcter formativo tengan impacto sobre
la motivacin de los estudiantes y sobre la actitud de las familias hacia el
aprendizaje escolar de sus hijos e hijas, es necesario proveerles de informacin
apropiada y comprensible acerca de lo que se considera imprescindible haber
aprendido al cabo de cada grado o nivel educativo y acerca de los esfuerzos y
acciones que pueden contribuir al logro de dichos aprendizajes.
26.6. Es muy importante que los maestros puedan analizar la mayor cantidad posible de
temes6, en un contexto de concepcin de desarrollo pedaggico de los estudiantes,
para poder identificar qu temes implican un bloqueo importante para el desarrollo
de nuevos conceptos o capacidades.
26.7. Tambin es muy importante que las pruebas no se limiten a evaluar los
conocimientos y competencias correspondientes a un nico grado (aquel en que se
aplica la evaluacin), sino que incluyan una perspectiva ms amplia de niveles de
desempeo a lo largo de varios grados y que incluyan desde desempeos muy
bsicos hasta desempeos muy complejos. De este modo, es posible identificar qu
es lo que s han aprendido los estudiantes en grados anteriores y qu es lo que ahora
6
Siempre ser necesario conservar el carcter confidencial de una parte de los tems para poder realizar mediciones
comparables en el tiempo.
14
27. Las pruebas pueden tener carcter muestral o censal, dependiendo de la estrategia de
cambio educativo.
27.1. Las pruebas muestrales sirven para tener un diagnstico global del sistema. El
impacto de los resultados en este caso depende principalmente de las medidas de
poltica educativa que se tomen a nivel central y de una estrategia de difusin
apropiada que llegue a todas las escuelas.
27.2. Las pruebas censales sirven para obtener informacin de cada una de las escuelas.
El impacto de los resultados en este caso depende de la devolucin de la
informacin a cada comunidad educativa, con un enfoque y un formato adecuados
para promover una mayor participacin y compromiso a nivel local.
27.3. La informacin derivada de una evaluacin censal tambin puede resultar muy til
para dirigir mejor las polticas hacia distritos o escuelas con mayores problemas, ya
que se puede contar con un mapa de resultados de todas las escuelas, zonas,
provincias, tipos de escuela, etc.
27.5. Segn se indic antes, tambin es posible combinar una aplicacin muestral
controlada con una distribucin censal de las pruebas para su aplicacin en forma
autnoma por parte de las escuelas, con fines formativos y de anlisis de resultados
e identificacin de estudiantes que necesitan apoyos complementarios, al interior de
cada escuela.
29. La primera advertencia que es necesario formular en relacin a los enfoques de uso de la
evaluacin mencionados en el apartado anterior es que muchas veces se constituyen, con o
sin intencin deliberada, en un mecanismo por el cual el Estado renuncia a su
responsabilidad por los resultados del sistema educativo, responsabilidad que transfiere a
la relacin entre escuelas y familias, como si se tratase de un asunto entre actores privados
y no de un bien pblico y de un derecho que el Estado debe garantizar. En lugar de
ocuparse de crear las condiciones para que la enseanza resulte efectiva, en particular en
las escuelas que atienden a la poblacin ms desfavorecida, proveyendo los recursos
necesarios, constituyendo un elenco docente adecuadamente formado y estableciendo
mecanismos idneos para la evaluacin y la orientacin de la labor de las escuelas, el
Estado limita su accionar a la realizacin de evaluaciones, la entrega de resultados y el
establecimiento de incentivos en funcin de estos resultados. Este modo de operar no
considera la complejidad de la labor educativa, en especial en medios socialmente
desfavorecidos, y la necesidad de invertir en la creacin de capacidades como herramienta
principal para la mejora de la enseanza y el aprendizaje.
30. En los pases de la regin existe una responsabilidad fundamental del Estado respecto
a los problemas de calidad educativa, en la medida en que brinda o reconoce ttulos
habilitantes para ejercer la docencia y legitima la presencia en las aulas de docentes que,
en muchos casos, no han sido adecuadamente formados para desempear la profesin -a
quienes no acompaa ni supervisa en su ejercicio profesional-. El Estado no debera, por
un lado, aceptar esta situacin y, por otro, intentar resolver los problemas que ello genera
a travs de pruebas a los estudiantes e incentivos ligados a los resultados de las mismas.
31.2. Aun as, la informacin comparativa acerca de los niveles de desempeo alcanzados
por los estudiantes en diversidad de escuelas constituye informacin relevante para
los equipos docentes de las escuelas, en la medida en que enriquece la
autopercepcin de la propia labor, permitindoles ubicar los logros de sus
estudiantes en el contexto de los desempeos logrados por los estudiantes en otras
escuelas.
31.3. Para que la comparacin entre los niveles de desempeo alcanzados por los
estudiantes sea apropiada, debe tomar en consideracin sus condiciones sociales de
origen. Los resultados acadmicos de las escuelas debieran poder compararse con
los de escuelas de similar composicin social, dado que los retos y dificultades que
implica ensear a estudiantes de origen desfavorecido (o de lengua materna
indgena) son muy diferentes a los implicados en la enseanza a estudiantes
provenientes de familias con educacin secundaria completa y/o terciaria. Deben
16
ser tenidas en cuenta adems las tasas de desercin de las escuelas y sus polticas de
seleccin de estudiantes, dado que una escuela puede mejorar sus resultados a
travs de la exclusin de estudiantes con dificultades.
El logro educativo en cambio, se mide con una nica prueba y refleja la acumulacin de
conocimientos y capacidades a lo largo de toda la vida del estudiante, lo cual incluye el capital
cultural familiar y sus experiencias en otras escuelas o con otros docentes.
31.5. Debe tenerse siempre presente que el aprendizaje y el logro educativo de los
estudiantes dependen tanto de lo que hacen las escuelas y docentes, como del
esfuerzo de los propios estudiantes, del apoyo de las familias a la tarea escolar, del
contexto comunitario y cultural y de las polticas educativas. Los problemas
educativos no pueden ser resueltos apelando exclusiva ni principalmente a
mecanismos de mercado.
32. La divulgacin y uso de los resultados de las evaluaciones estandarizadas deberan estar
enmarcados en los siguientes criterios bsicos:
32.1. La labor educativa y la responsabilidad directa por sus resultados debe ser
compartida por diversos actores: las autoridades nacionales y regionales, los
cuerpos docentes, los estudiantes y sus familias. Debera evitarse todo uso de los
resultados con el fin deliberado o implcito de culpabilizar o responsabilizar de
manera exclusiva a ciertos actores.
17
32.2. En especial, resulta inapropiado utilizar los resultados de las pruebas estandarizadas
como indicador principal de la calidad del trabajo del docente o de la escuela, en
particular si no se ha controlado el efecto de otros factores internos y externos al
sistema educativo y si no se tiene en cuenta que el aprendizaje depende tambin de
la motivacin y esfuerzo personal del estudiante.
32.5. Se debera descartar cualquier tipo de uso de los resultados que, directa o
indirectamente, propicie la seleccin de estudiantes por parte de las escuelas a los
efectos de mejorar sus resultados. Una escuela que selecciona a sus estudiantes es
como un hospital para sanos.
32.6. Debera existir siempre una adecuada combinacin entre exigencias y apoyos a las
escuelas y a los docentes en materia de responsabilidad por los resultados. Por un
lado, es necesario que escuelas y docentes asuman su responsabilidad respecto al
objetivo de que todos los estudiantes aprendan lo que se espera de ellos.
Simultneamente, es deber de las autoridades establecer las polticas de apoyo
necesarias para que escuelas y docentes puedan desarrollar su labor de manera
apropiada. Un esquema de exigencias altas sobre escuelas y docentes sin los
correspondientes apoyos slo puede generar malestar y desnimo. Un esquema de
apoyos sin contrapartes y exigencias puede generar autocomplacencia.
32.7. Para que los procesos de evaluacin sean transparentes y para facilitar la
comprensin y uso de sus resultados, es importante dar a conocer la mayor cantidad
posible de actividades de las pruebas. No basta con ofrecer resultados numricos, es
fundamental ilustrar a los distintos actores acerca del tipo de tareas que los
estudiantes debieron resolver en las pruebas7. Si bien no se pretende que los
docentes utilicen pruebas estandarizadas para evaluar a sus estudiantes, el
conocimiento y la comprensin de las mismas puede contribuir a mejorar sus modos
de evaluar y a desarrollar una cultura de la evaluacin.
7
Este criterio debe combinarse adecuadamente con la necesidad de mantener el carcter confidencial de un
conjunto de preguntas, que puedan emplearse en futuras evaluaciones para establecer mediciones comparables
en el tiempo.
18
estudiantes continuar avanzando. Los resultados sern tiles no slo para los
docentes del grado evaluado, sino tambin para los de grados anteriores.
33. Teniendo como marco lo expresado acerca de las alternativas existentes para una poltica
de evaluacin, es indispensable, antes de poner en marcha un sistema de evaluacin (o de
modificar uno existente) seguir un itinerario de decisiones para definir las caractersticas
del sistema. Dicho itinerario implica responder a las preguntas incluidas en el Recuadro
adjunto, lo cual debera plasmarse en un plan de evaluacin a corto, mediano y largo
plazo, claro y explcito, que establezca con claridad qu va a ser evaluado, por qu y para
qu, y que exprese, justifique y organice las opciones tomadas. Es absolutamente
inconducente implementar un primer operativo de evaluacin si no se ha elaborado un
plan de trabajo de largo plazo.
34. En la elaboracin de dicho plan es muy importante considerar los costos en dinero
implicados en cada opcin y los recursos humanos necesarios para su adecuada
implementacin. Es necesario, en particular, balancear la inversin a realizar en la
recogida de informacin con la inversin a realizar en la difusin y uso de los
resultados. Muchos Ministerios de Educacin destinan importantes sumas de dinero a
recoger una gran cantidad de informacin todos los aos, que luego casi no se analiza, ni
se difunde ni se utiliza.
19
No hars dao. Una de las primeras normas del juramento hipocrtico seala que el
mdico se abstendr de todo aquello que pueda generar dao o perjuicio a sus pacientes. Del
mismo modo, a la hora de pensar en un sistema de evaluacin es importante considerar los
riesgos de efectos no deseados y perjudiciales que la estrategia de evaluacin diseada podra
tener sobre el propio sistema educativo que se desea mejorar.
No evaluars en vano. Otra de las tentaciones que deben ser evitadas es la de recoger
todos los aos informacin que nunca ser analizada ni utilizada. Para que un sistema de
evaluacin tenga impacto, se debe establecer una periodicidad en las mismas que garantice
que los datos recogidos puedan ser analizados, discutidos, comprendidos y utilizados.
Incorporar la nueva informacin y traducirla en decisiones y acciones lleva tiempo. Los cambios
en el sistema educativo requieren ms tiempo aun.
Vsteme despacio Sancho, que estoy apurado. Es muy importante que quienes toman
las decisiones en los Ministerios de Educacin desestimen la creencia ingenua en la existencia
de caminos fciles y rpidos. No es posible montar un programa de evaluacin serio en tres
meses. No existe coyuntura ni ventana de oportunidad que lo justifique: las consecuencias de
la improvisacin se harn sentir tarde o temprano. La evaluacin requiere reflexin cuidadosa
acerca de sus fines y usos; discusin pblica sobre qu es lo fundamental a evaluar; dilogo e
involucramiento de diferentes actores; conformacin de equipos tcnicos competentes en
diversos aspectos; e informacin previa para que los actores se involucren con la evaluacin.
20
6. Un sistema de evaluacin es un proyecto de largo plazo que requiere de un compromiso del Estado
y de una planificacin cuidadosa del diseo del sistema. Ello exige tomar decisiones acerca de los fines,
las consecuencias, los aspectos a evaluar, las reas y los grados, la periodicidad de las evaluaciones,
entre otras cosas. Todo ello exige tiempo, por lo que no es conveniente pretender la implementacin
de sistemas de evaluacin en plazos reducidos.
8. El sistema de evaluacin debe estar sustentado en una actitud firme de transparencia en relacin
a los resultados y de rendicin de cuentas a la sociedad.
9. Los Ministerios de Educacin deben asumir un compromiso serio y consistente con los
resultados de la evaluacin, lo cual implica promover el dilogo acerca de los problemas detectados
y los modos de enfrentarlos, disear lneas de accin apropiadas para resolver los problemas e invertir
los recursos necesarios para llevarlas adelante.
10. Los sistemas de evaluacin deben ser objeto de evaluacin peridica, con el fin de analizar la
calidad tcnica de la informacin que producen y su relevancia para diversos actores educativos y
sociales.