Evaluaciones Educativas AL Necesita Preal PDF

Programa de P omocin
r de la Reforma Educativa en Amrica Latina y el Caribe

Partnership for Educational Revitalization in the Americas
Grupo de Trabajo
sobre Estndares y Evaluacin
Las evaluaciones educativas

que Amrica Latina necesita
Pedro Ravela, Patricia Arregui, Gilbert Valverde, Richard Wolfe,

Guillermo Ferrer,
Felipe Martnez Rizo, Mariana Aylwin y Laurence Wolff
Julio 2007
1
LAS EVALUACIONES EDUCATIVAS QUE AMRICA LATINA NECESITA
Pedro Ravela, Patricia Arregui, Gilbert Valverde, Richard Wolfe, Guillermo Ferrer,
Felipe Martnez Rizo, Mariana Aylwin y Laurence Wolff1
El presente documento constituye el punto de vista de los miembros del actual Comit Gestor
del GTEE sobre la importancia, propsitos y usos de las evaluaciones estandarizadas2 de
aprendizajes y/o logros educativos3 en gran escala4, en Amrica Latina y el Caribe.
Est dirigido a tomadores de decisiones ministeriales, docentes, acadmicos, empresarios,

sindicatos, organizaciones sociales, organismos financiadores y medios de prensa. Pretende
aportar un punto de vista fundado que ilumine y oriente los debates y decisiones acerca de la
evaluacin estandarizada en los sistemas educativos.
El inters del documento se focaliza en la evaluacin estandarizada de aprendizajes y/o logros

educativos. No pretende orientar acerca de otros aspectos tambin importantes de la
evaluacin del quehacer educativo: la evaluacin que realizan los docentes en las aulas, la
evaluacin del desempeo docente, la evaluacin de las polticas educativas, la evaluacin de
los centros educativos, etc. Est referido nicamente a las evaluaciones en los niveles
primario y medio. No se pretende incursionar en la evaluacin en el nivel terciario ni en las
pruebas de seleccin para el mismo.
El documento est estructurado en cinco grandes captulos. En el primero se explica por qu

es importante desarrollar sistemas de evaluacin de aprendizajes y/o logros educativos a gran
escala y qu es lo que los mismos pueden aportar a las polticas educativas y a las prcticas de
enseanza. El segundo captulo revisa en forma rpida la situacin en Amrica Latina,
destacando los avances y cambios que se han producido y las debilidades y desafos que an
persisten. El captulo tres discute las alternativas existentes en cuanto a los propsitos y usos
de las polticas de evaluacin y las precauciones que deben tenerse en cuenta a la hora de
tomar decisiones sobre una poltica de evaluacin. En el captulo cuatro se enumeran los
principales desafos de tipo tcnico que las evaluaciones deben satisfacer para que sus aportes
sean serios, confiables y utilizables. El ltimo captulo analiza los requisitos fundamentales
que deben cumplirse para que una unidad de evaluacin pueda llevar adelante su labor de
manera apropiada.
1
Los autores de este documento son los miembros del Comit Gestor del Grupo de Trabajo sobre Estndares y Evaluacin
del PREAL.
2
A los efectos de este documento, se entiende por evaluacin estandarizada en gran escala a aquella que permite producir
informacin comparable acerca de los desempeos de estudiantes pertenecientes a distintos contextos culturales y regionales
e, incluso, a distintos pases. Para que la informacin sea comparable es necesario estandarizar el diseo de las pruebas y los
procedimientos de aplicacin de las mismas. Evaluacin estandarizada no implica pretensin de estandarizar los procesos de
enseanza ni los aprendizajes de los alumnos.
3 Los trminos aprendizaje y logro educativo aluden a fenmenos distintos, segn se explica en un Recuadro en el
apartado 30 de este documento.
4
A los efectos de este documento, se entiende por gran escala a aquellas evaluaciones que pretenden ofrecer un panorama
de la situacin de un pas o de un estado o provincia, aun cuando ello se haga a travs de una muestra no demasiado grande
(por ejemplo, 5.000 estudiantes). El trmino no se emplea como sinnimo de evaluaciones censales.
2
Propsitos e ideas centrales del documento

1. Destacar y explicar la importancia que los sistemas nacionales de evaluacin de aprendizajes y/o logros
educativos tienen como instrumento para la mejora de las polticas educativas y las prcticas de
enseanza.
2. Ayudar a los tomadores de decisiones a comprender y analizar las diversas opciones existentes en
cuanto a los propsitos y usos de los sistemas de evaluacin y las implicancias de cada una de ellas, de
modo de orientarlos en cmo concebir una estrategia de evaluacin.
3. Mostrar que para que la inversin en evaluacin valga la pena debe tener propsitos claros, una filosofa
orientada a construir una visin de responsabilidad compartida en relacin a la educacin, un diseo
tcnico de calidad y adecuado a los propsitos, una orientacin fuerte a apoyar a los docentes en su
tarea y una voluntad poltica manifiesta de encarar acciones dirigidas a resolver los problemas y
deficiencias que la evaluacin ponga de manifiesto.
4. Mostrar que para tener un buen sistema de evaluacin es necesario hacer una inversin importante para
construir una unidad tcnica competente y un plan de largo plazo, lo cual lleva tiempo y no puede ser
realizado en menos de dos aos.
5. Contribuir a evitar el simplismo y la ingenuidad con que muchos tomadores de decisiones piensan en la
evaluacin, lo que genera sistemas mal concebidos y deficientemente implementados y, como
consecuencia de ello, efectos perversos para el sistema educativo, malgasto de recursos y descrdito de la
evaluacin externa entre los docentes.
I. Por qu son importantes las evaluaciones nacionales de logros educativos?
1. La realizacin de evaluaciones estandarizadas como forma de conocer mejor la dinmica

de procesos y resultados en los sistemas educativos exhibe una tendencia creciente a
nivel regional y mundial, en pases de muy diversas culturas y orientaciones
ideolgicas de gobierno. Prueba de ello es la creciente participacin de los pases en las
evaluaciones internacionales como PISA, TIMSS, PIRLS y regionales como SERCE (en
Amrica Latina) y SACMEQ (en frica), as como el desarrollo de diferentes tipos de
sistemas nacionales y sub-nacionales de evaluacin en pases de todo el mundo.
2. Esta convergencia en torno a la evaluacin a gran escala se origina, sin embargo, a partir
de intereses y perspectivas diversas en cuanto al rol del sistema educativo. En algunos
casos predomina una preocupacin por la formacin ciudadana y la consolidacin de una
sociedad democrtica; en otros, por la productividad de la fuerza de trabajo y la
competitividad de la economa nacional, por las oportunidades para el desarrollo integral
de las personas y sus posibilidades de participacin en la sociedad del conocimiento, o por
la equidad y la visin de la educacin como uno de los caminos para superar la pobreza.
Muchos sistemas de evaluacin parten de una combinacin de los intereses anteriores. En
casi todos los casos se asume que la evaluacin puede servir: i) como base para la
adopcin de polticas educativas mejor fundamentadas; ii) para la mejora de la gestin de
los sistemas educativos; iii) como instrumento para la colaboracin y el aprendizaje
continuo al interior de los mismos.
3. La educacin es una actividad opaca, en el sentido de que sus resultados no son

directa ni inmediatamente observables. Por supuesto, un buen docente puede apreciar si
sus estudiantes estn aprendiendo o no y cmo, pero no todos los docentes tienen los
3
mismos criterios de valoracin. Por otra parte, dichos criterios estn fuertemente
vinculados a la experiencia profesional del docente: su formacin general y especfica, su
conocimiento de la disciplina que ensea, su capacidad para percibir los procesos y
dificultades de los estudiantes, su familiarizacin con diversos tipos de alumnos, etc. Dada
la heterogeneidad del cuerpo docente de un pas, no es posible obtener una visin de la
situacin del conjunto por la mera agregacin de los puntos de vista individuales.
4. En dcadas pasadas, la equivalencia entre permanencia en el sistema educativo y acceso al

conocimiento y a las capacidades simblicas se daba por descontada. Por esta razn, los
indicadores que se empleaban para valorar a los sistemas educativos estaban relacionados
con el acceso: matrcula, cobertura, retencin, etc. En esos momentos el acceso a la
educacin formal era limitado. Las mayoras ms pobres y con menor capital cultural no
accedan al sistema educativo o apenas cursaban unos pocos aos de educacin bsica. La
progresiva universalizacin del acceso y permanencia en el sistema educativo modific
esta situacin. Los nuevos estudiantes, procedentes de los sectores sociales ms
desfavorecidos, llegan al sistema educativo en desventaja en trminos de manejo del
lenguaje oral (oficial) y escrito, con lo cual la equivalencia entre aos de estudio y
acceso al conocimiento y a las capacidades simblicas ya no es tal.
5. Otra razn importante para cuestionar la equivalencia entre aos de estudio y acceso a las
capacidades simblicas es que la ampliacin de la cobertura educativa produjo un rpido
crecimiento del acceso a la profesin docente, que no fue acompaada por garantas de
calidad en la formacin y el egreso de las instituciones formadoras. Tanto en pases en que
la formacin de docentes es realizada por el sector pblico, como en pases en que la
misma ha sido encomendada al sector privado, en general, el Estado ha sido omiso en la
formulacin e instrumentacin de controles apropiados de la calidad de dicha formacin.
6. Como resultado de lo antedicho se corre el riesgo de propiciar una ilusin: la

poblacin est ms educada, porque ms ciudadanos acceden a la educacin formal
durante ms aos. Si bien la mayor permanencia en el sistema educativo es un derecho
incuestionable e implica siempre algn beneficio para las personas, ello no
necesariamente significa que todos los ciudadanos estn incorporando los conocimientos,
actitudes y capacidades necesarias y relevantes para la vida personal y social, los que, por
otra parte, son cada vez ms sofisticados y complejos.
7. De all la importancia de desarrollar sistemas de informacin que permitan hacer

visible un conjunto de aspectos centrales de la labor educativa:
7.1. en qu medida los alumnos estn aprendiendo lo que se espera de ellos al finalizar
ciertos grados o niveles;
7.2. cul es el grado de equidad o inequidad en el logro de dichos aprendizajes;
7.3. cmo evolucionan a lo largo de los aos, tanto los niveles de logro como la equidad
en el acceso al conocimiento por parte de los diversos grupos sociales;
7.4. en qu medida y de qu modo las desigualdades sociales y culturales existentes en la
sociedad inciden sobre las oportunidades de aprendizajes de los estudiantes;
7.5. cul es la diversidad de prcticas educativas existentes en escuelas y maestros y
cmo las mismas se relacionan con los aprendizajes de los estudiantes en diversos
contextos sociales;
4
7.6. cmo influyen las condiciones de la enseanza (situacin de los maestros, recursos
disponibles, tiempos de estudio etc.) en los progresos de los alumnos;
7.7. cul es el efecto que tienen en los logros educativos las inversiones en programas
educativos, los cambios en la estructura del sistema, los cambios curriculares, los
programas de formacin, la adquisicin de material educativo, etc.5.
A quines y cmo puede aportar informacin relevante un sistema de evaluacin de

logros educativos y/o aprendizajes
Un sistema de evaluacin de aprendizajes y/o logros educativos, que produzca y comunique adecuadamente
informacin sobre los aspectos antes indicados, puede ser un instrumento clave de mejora, enriqueciendo la
comprensin de la situacin educativa y la toma de decisiones por parte de diversos actores sociales.
Las autoridades y los formuladores de polticas educativas pueden comprender mejor los
problemas de la enseanza y del aprendizaje; hacerse cargo de las carencias en que se desarrolla la
labor docente y desarrollar polticas activas y pertinentes para apoyar el trabajo de las escuelas; valorar
sobre una base de evidencia emprica slida el impacto de las polticas y programas que han impulsado y
los probables efectos de las que se proponen impulsar.
Los directivos y docentes pueden, a partir de una mirada externa sobre los logros educativos en el
conjunto del sistema, comprender mejor lo que estn logrando sus propios estudiantes y lo que no,
cmo estn aprendiendo y qu dificultades tienen. Pueden aprender de las experiencias de otros
docentes y escuelas que trabajan con estudiantes de caractersticas tanto similares como diferentes a los
propios. Pueden tomar decisiones ms apropiadas acerca de qu aspectos del currculo enfatizar y
enriquecer sus propios modos de evaluar el aprendizaje de sus estudiantes.
Los supervisores y formadores de docentes pueden apoyarse en la informacin sobre los logros y
dificultades educativas en el conjunto del sistema para estudiar en profundidad las debilidades en el
enfoque o en la prctica de la enseanza que probablemente generan algunas de las insuficiencias
constatadas en los aprendizajes. Desde esa nueva perspectiva pueden mejorar su labor tanto de
orientacin a los docentes como de formacin de los mismos. En particular los supervisores pueden
beneficiarse de contar, como instrumento de apoyo para su labor, con un mapa de las escuelas que las
caracterice tanto en trminos de la composicin sociocultural de su alumnado como de sus logros
educativos.
Los padres y madres de estudiantes, adecuadamente informados, pueden comprender mejor qu es
lo que se espera que sus hijos aprendan, qu es lo que estn logrando y qu pueden ellos hacer para
colaborar con la escuela y con el aprendizaje de sus hijos.
La ciudadana en general estar mejor informada sobre lo que acontece al interior del sistema
educativo y, por tanto, ms atenta a los temas y problemas de la educacin. Estar, adems, en mejores
condiciones para exigir tanto a los poderes pblicos como a los profesionales de la docencia, la mejora
continua de la educacin que se brinda a los nios, nias y jvenes, y el uso responsable de los recursos
que se destinan a la educacin.
5
El cumplimiento de lo establecido en los numerales 7.4 a 7.7 requiere del desarrollo de dispositivos de recoleccin de
informacin que no se limitan a pruebas de logro educativa, as como de diseos del proceso de evaluacin adecuados a tales
propsitos.
5
8. El desarrollo de un sistema nacional de evaluacin estandarizada tiene la ventaja adicional

de obligar a realizar una discusin informada sobre qu aspectos del currculo formal son
exigibles a todos los estudiantes y a definir con claridad qu es lo que todos los
estudiantes deberan haber aprendido al final de cada ciclo educativo. La mayora de
los currculos en la regin estn constituidos por largas listas de objetivos y temas, todos
deseables pero no todos realizables. La elaboracin de pruebas nacionales obliga, como
requerimiento previo, a definir qu es lo que debe ser considerado como fundamental y,
por tanto, lo que todos los estudiantes deben saber y ser capaces de hacer. Distintos
trminos pueden ser utilizados para designar a estas definiciones: estndares,
competencias fundamentales, indicadores de logro, niveles de desempeo, metas de
aprendizaje, criterios de suficiencia, entre otros. Lo importante no es el trmino que se
emplee sino la necesidad de establecer metas ms claras y compartidas para el
aprendizaje.
9. Junto con las razones que justifican la importancia de desarrollar sistemas nacionales de
evaluacin de aprendizajes y/o logros educativos a gran escala, es necesario destacar
cuatro riesgos fundamentales que deben tenerse siempre presentes:
9.1. Es importante reconocer explcitamente que no todos los objetivos valiosos de la

educacin estn incluidos en una evaluacin estandarizada. Hay una gran
cantidad de saberes, actitudes, valores y aprendizajes relevantes que no pueden
por la dificultad para realizar una medicin- o no deben porque son propios de
cada entorno local y, por tanto, no son exigibles a todos los estudiantes en una
evaluacin nacional- formar parte de una evaluacin estandarizada. Lo anterior
implica que no puede reducirse la calidad educativa a los resultados de las
pruebas y que una evaluacin estandarizada aporta informacin fundamental
sobre la calidad educativa, pero no es un indicador completo de la misma.
9.2. En el mismo sentido, la evaluacin estandarizada de aprendizajes y/o logros

educativos es un componente esencial de un sistema integral de evaluacin
educativa, pero no es el nico tipo de evaluacin relevante. Un sistema integral de
evaluacin del sistema educativo debe integrar otros componentes: la evaluacin
realizada en el aula por los docentes, la evaluacin del desempeo docente, la
evaluacin de los centros educativos, la evaluacin de las polticas educativas, la
evaluacin del uso de los recursos, la evaluacin de la relevancia del currculo, etc.
9.3. La evaluacin es condicin necesaria pero no suficiente para mejorar la

educacin. No hay soluciones mgicas a los problemas educativos a travs de la
evaluacin. La evaluacin es apenas uno de varios elementos de la poltica
educativa que deben estar adecuadamente alineados: la formacin docente inicial
y en servicio, la carrera y condiciones para el trabajo docente, la gestin escolar, la
supervisin, los diseos curriculares, los libros y materiales educativos, una
inversin de recursos proporcional a las necesidades de las diversas poblaciones y
una accin decidida por parte de los responsables educativos para resolver los
problemas detectados, entre otros.
9.4. La evaluacin estandarizada externa slo podr tener efectos positivos sobre
la educacin si es concebida, percibida y empleada como un mecanismo de
responsabilizacin pblica de todos los actores vinculados al quehacer
educativo. Existe siempre el riesgo de que la poltica educativa se concentre en la
implementacin de evaluaciones, pero que luego no se tomen acciones concretas
6
para enfrentar y resolver los problemas que las mismas ponen de manifiesto.
Muchas veces las autoridades se limitan a informar de los resultados y transferir
toda la responsabilidad por la solucin de los problemas detectados a las escuelas y
familias, como si se tratase de un asunto privado entre ambas. Otras veces, toda la
responsabilidad se atribuye a los docentes, quienes, por su parte, tienden a
transferir toda la responsabilidad a los padres o al contexto. Lo importante es evitar
ingresar en una dinmica de culpabilizacin y, por el contrario, intentar construir
una lgica de responsabilidad compartida en torno a la educacin.
II. La situacin de la evaluacin estandarizada en Amrica Latina
10. Los sistemas de evaluacin estandarizada se desarrollaron con fuerza en toda la regin
durante los aos 90. Algunos pases han mantenido sus sistemas en funcionamiento con
continuidad, aun cuando se produjeran cambios de enfoque o variaciones, a veces
accidentadas, en la institucionalidad de los mismos. Otros pases han sufrido importantes
discontinuidades y han tenido que comenzar prcticamente desde cero en repetidas
oportunidades o tendrn que hacerlo en el futuro prximo.
11. Diecisis pases estn participando en el Segundo Estudio Regional en 3 y 6 de Primaria

que lleva adelante la OREALC/UNESCO: Argentina, Brasil, Chile, Colombia, Costa
Rica, Cuba, Ecuador, El Salvador, Guatemala, Mxico, Nicaragua, Panam, Paraguay,
Per, Repblica Dominicana y Uruguay. Seis de ellos participan en PISA 2006, y otros
tres se incorporaran al ciclo PISA 2009. Algunos pases de la regin han participado
adems (o lo estn haciendo) en los estudios de Matemtica y Ciencias (TIMSS), Lectura
(PIRLS) y Educacin Cvica que lleva adelante la IEA (International Association for the
Evaluation of Educational Achievement).
12. Durante los ltimos 12 aos ha estado activa en la regin la red de los sistemas de
evaluacin organizada en torno al Laboratorio Latinoamericano de Evaluacin de la
Calidad de la Educacin (LLECE) de OREALC/UNESCO, en la que participan
actualmente la casi totalidad de los pases latinoamericanos. Esta Red se rene
ordinariamente dos veces al ao y es un espacio de intercambio de experiencias y
formacin en el mbito de la evaluacin. Ms recientemente se ha constituido el Grupo
Iberoamericano de PISA integrado por Argentina, Brasil, Chile, Colombia, Espaa,
Mxico, Portugal y Uruguay.
13. Los principales cambios y mejoras que pueden ser observados en los ltimos aos en
los sistemas de evaluacin de la regin son los siguientes:
13.1. Parece haberse superado la etapa en la que las autoridades en varios pases
interferan en la divulgacin de los resultados de las evaluaciones cuando stos no
les parecan favorables. En general, existe en la regin una mayor transparencia en
la difusin de los resultados.
13.2. Hay una tendencia creciente a pasar de pruebas normativas a pruebas criteriales. La
diferencia principal es que las primeras tienen como propsito principal ordenar
comparativamente a los estudiantes, en tanto que las segundas ponen su foco de
atencin en qu es lo que los estudiantes saben y son capaces de hacer. Asimismo,
existe una tendencia creciente a incluir en las pruebas criteriales una definicin de
7
cul es el resultado que todos los estudiantes deberan alcanzar para que su
desempeo pueda ser considerado satisfactorio. Para comprender la importancia de
esta diferencia, es importante notar que mejor no es lo mismo que bueno y
peor no es lo mismo que malo. Por ejemplo, una evaluacin puede colocar el
foco de atencin en la comparacin relativa entre escuelas con mejores y peores
puntajes. Es perfectamente posible que las escuelas con puntajes ms altos
(mejores), no sean buenas, en la medida que no logran que todos o la mayora
de sus estudiantes alcancen los niveles de desempeo considerados satisfactorios.
La misma reflexin se aplica a las comparaciones de resultados entre pases.
13.3. Buena parte de los pases de la regin han mejorado sus capacidades tcnico-
metodolgicas para la construccin de pruebas y para el procesamiento de los
datos. Existen esfuerzos por desarrollar pruebas que evalen un rango de
conocimientos y capacidades ms amplio y que incluyan preguntas de respuesta
construida. Se han ido incorporando metodologas ms sofisticadas para el
tratamiento de datos, como la Teora de Respuesta al tem y el Anlisis Multinivel.
13.4. Es posible observar en la mayora de los pases una atencin creciente a la difusin
y uso de los resultados. Existe en la regin mayor conciencia de que no basta con
implementar una evaluacin y publicar un informe, sino que es necesario
desarrollar una estrategia de divulgacin y un conjunto de reportes apropiados a
cada una de las audiencias a las que se quiere llegar. Las Unidades de Evaluacin
tienen una mayor conciencia acerca de la existencia de usos apropiados e
inapropiados para cada tipo de evaluacin, aunque esta misma conciencia y
comprensin muchas veces no est suficientemente difundida entre quienes toman
decisiones de carcter poltico. Este aspecto ser analizado con mayor detalle ms
adelante en este documento.
13.5. Existe en la mayor parte de los pases y de los profesionales dedicados a la

evaluacin estandarizada en la regin, una preocupacin creciente por la
investigacin de los factores que inciden sobre los aprendizajes. Si bien es mucho
lo que resta por hacer en trminos metodolgicos e interpretativos para producir
buenos trabajos de investigacin, existe la conciencia de que no es suficiente con
reportar resultados, sino que es preciso avanzar en la investigacin y la
construccin de hiptesis acerca del modo en que las dinmicas de la gestin de los
sistemas educativos, los procesos escolares, las prcticas de enseanza y las
decisiones de poltica educativa influyen sobre las oportunidades de aprendizaje de
los nios y nias.
13.6. La incorporacin creciente de pases de la regin a procesos de evaluacin a nivel

regional e internacional ha tenido consecuencias positivas importantes en las
Unidades de Evaluacin y en la calidad de su trabajo. Ha coadyuvado a la
construccin y acumulacin de capacidad tcnica en evaluacin, ha facilitado el
intercambio y el desarrollo de un lenguaje comn entre pases y ha contribuido a
mejorar la calidad de diversos procesos tcnicos (elaboracin de pruebas,
incorporacin de preguntas de respuesta abierta, muestreo, control de las
aplicaciones, anlisis de datos, modos de difusin, etc.).
14. Aun con los cambios y mejoras recin indicados, persiste un conjunto importante de
debilidades que es preciso sealar. Las mismas estn enumeradas a continuacin y se
8
describen con mayor amplitud, en trminos de desafos a asumir, en el resto del

documento.
14.1. Es bastante comn que desde el nivel poltico se demande la implementacin

grandes operaciones de evaluacin sin propsitos claramente definidos y en tiempos
absolutamente insuficientes para hacerlo de manera tcnicamente apropiada. Existe
la creencia de que es posible hacer evaluaciones de manera rpida, a bajo costo y de
buena calidad. Muchas veces las demandas que formulan las autoridades no son
realizables en los tiempos en que se piden, salvo que se realicen sin la adecuada
calidad, lo cual es altamente riesgoso en evaluaciones de este tipo.
14.2. An no se tiene claro que no cualquier evaluacin sirve para cualquier propsito y a
que es necesario disear cuidadosamente el sistema de evaluacin para el largo
plazo, en funcin de unos propsitos y usos claramente establecidos. En funcin de
los propsitos y usos es necesario adoptar un conjunto de decisiones relativas a la
utilizacin de censos o muestras, a los grados y disciplinas que sern evaluados, la
periodicidad de las evaluaciones, el tipo de pruebas y escalas de reporte, etc.
14.3. Existe, en general, insuficiente discusin pblica en torno a qu debe ser evaluado
en una evaluacin estandarizada y sobre qu aspectos del currculo deben haber sido
enseados a todos los estudiantes al concluir determinados niveles educativos. En el
fondo, esto refleja el problema antes mencionado de los currculos que carecen de
metas de aprendizaje claras o estndares. Mientras no exista claridad acerca de qu
deben aprender, conocer y ser capaces de hacer todos los estudiantes, tampoco
existir claridad ni para la enseanza ni para la evaluacin. Esta tarea requiere, por
un lado, un amplio debate social y, por otro, un trabajo tcnico coordinado entre las
unidades de currculo y de evaluacin.
14.4. Es necesario realizar un esfuerzo mayor por mejorar la investigacin sobre los
factores que explican los resultados. Ello implica, por un lado, mejorar mucho los
instrumentos complementarios que se aplican junto con las pruebas y, por otro lado,
concebir diseos de investigacin ms ambiciosos: estudios longitudinales, estudios
de valor agregado, estudios cualitativos, entre otros.
14.5. Los Ministerios de Educacin han tenido, por lo general, una limitada capacidad
para concebir, formular e implementar polticas que den respuesta a los problemas
identificados en las evaluaciones. Por lo general, falta articulacin entre las
Unidades de Evaluacin y otros actores educativos relevantes, dentro y fuera de los
Ministerios de Educacin, para asumir polticas consistentes, de envergadura y
duraderas para enfrentar los problemas de aprendizaje que las evaluaciones ponen
de manifiesto. En particular, es preciso destacar la necesidad de articulacin entre la
evaluacin, el desarrollo curricular, la formacin inicial y el desarrollo profesional
de los docentes.
14.6. Si bien existe una creciente preocupacin respecto a la divulgacin y uso de los
resultados, son insuficientes an las acciones en este terreno, en particular, para
lograr que los docentes comprendan y utilicen los resultados de las evaluaciones, y
para que los resultados de este tipo de evaluaciones se incorporen a la cultura
escolar. La mayor parte de los docentes en la regin no comprende los aspectos
tcnicos involucrados en el diseo de las evaluaciones nacionales e internacionales
y los tipos de resultados que las mismas arrojan. Por tanto, difcilmente puedan
9
utilizarlos productivamente. Es necesario, por tanto, realizar un esfuerzo importante

de formacin.
14.7. Perdura an en la mayora de los pases la prctica de divulgar resultados de tipos

de escuela, escuelas individuales, estados o provincias sin una adecuada
consideracin de los contextos socioculturales en que operan las instituciones y
subsistemas educativos, lo cual conduce a interpretaciones y conclusiones errneas
o no sustentables en relacin a la eficacia educativa de dichas instituciones o
subsistemas educativos. En rigor, para este ltimo propsito, es necesario realizar
evaluaciones de valor agregado, que implican dos mediciones sobre una misma
poblacin en distintos momentos, segn se explicar ms adelante. Sobre este
aspecto la experiencia en la regin es mnima.
14.8. Persisten en muchos pases importantes debilidades y desafos de carcter tcnico

en el diseo de las evaluaciones que es necesario asumir progresivamente. Las
principales debilidades estn relacionadas con: i) la excesiva simplicidad de la
mayor parte de las preguntas que integran las pruebas y la dificultad para elaborar
preguntas que permitan evaluar capacidades cognitivas complejas; ii) la
focalizacin de las evaluaciones en los logros educativos correspondientes a un
grado especfico, lo que impide saber qu han aprendido quienes an no logran lo
esperado para dicho grado; iii) la calidad de las muestras y la forma de estimar y
reportar los errores de medicin; iv) la forma de establecer mediciones que sean
comparables en el tiempo.
14.9. Un problema importante en la regin es la insuficiencia de profesionales calificados

para el diseo y conduccin de este tipo de evaluaciones, lo que se agrava por la
falta de continuidad de los equipos tcnicos de los pases, muchas veces por razones
de ndole poltico-partidaria. Esto hace difcil acumular conocimiento y experiencia
en la regin y ha dado lugar a que muchos pases debiesen comenzar desde cero
con sus sistemas de evaluacin, algunos aos despus de haber tenido uno en
funcionamiento y haberlo desmantelado.
15. Las principales debilidades y desafos recin enumerados pueden organizarse en torno a
dos categoras principales: problemas relacionados con la estrategia de difusin y
uso de los resultados y problemas relacionados con la calidad tcnica de las
evaluaciones. Slo una evaluacin tcnicamente buena y cuyos resultados sean conocidos
y utilizados de manera apropiada, puede tener algn impacto en la mejora de los
aprendizajes. Como resulta obvio, una evaluacin cuyos resultados son poco conocidos y
utilizados supone un ejercicio estril y un desperdicio de recursos. Pero, ms graves aun,
son aquellas situaciones en que evaluaciones tcnicamente malas son ampliamente
difundidas o en que las evaluaciones son empleadas para fines diferentes de aquellos para
los cuales fueron concebidas y diseadas.
10
La tabla siguiente esquematiza esta reflexin:
Calidad tcnica
Difusin y uso Buena Mala
Aporte. Posibilidad de impacto Efectos perversos,
Adecuados a las caractersticas
en la mejora del rendimiento en interpretaciones y decisiones
tcnicas de la prueba las reas evaluadas. erradas.
Efectos perversos, Efectos perversos,
No adecuados a las caractersticas
interpretaciones y decisiones interpretaciones y decisiones
tcnicas de la prueba erradas. erradas.
Desperdicio de recursos y
Escasa o nula Desperdicio de recursos.
oportunidades.
En los tres captulos que siguen en el Documento: i) se plantean las alternativas y opciones
de poltica de evaluacin que es necesario analizar a la hora de poner en marcha o reformar un
sistema nacional de evaluacin; ii) se explicita con mayor amplitud cules son los
principales desafos tcnicos que un sistema nacional de evaluacin debe encarar; y, iii) se
plantean las condiciones necesarias para construir Unidades de Evaluacin efectivas.
III. Los propsitos y los usos de los resultados de las evaluaciones estandarizadas
16. El primer paso indispensable en la construccin o reforma de un sistema de evaluacin

es definir cul ser su propsito y para qu se usarn sus resultados. Para ello, es
preciso considerar diversas opciones, que no son necesariamente excluyentes. Un sistema
puede combinar varias de ellas, pero es importante tener conciencia de que cada opcin
requiere un determinado diseo y tiene exigencias tcnicas y de costos diferentes.
17. Lo anterior aplica antes que nada a la necesidad de establecer un adecuado balance
entre la implementacin de pruebas nacionales y la participacin en la oferta
creciente de pruebas internacionales. Las pruebas nacionales pueden ofrecer una mirada
ms apropiada acerca de qu aprenden los estudiantes de aquello que se les est
enseando. Las pruebas internacionales pueden servir para ubicar la situacin del pas en
relacin a lo que saben y son capaces de hacer los estudiantes en otras sociedades y
enriquecer el debate sobre el currculo nacional y el enfoque de la enseanza. Los pases
deberan analizar cuidadosamente en qu pruebas internacionales participar, teniendo en
cuenta lo que cada una pretende evaluar y su pertinencia en relacin a los objetivos
nacionales. Parece recomendable el ejercicio de participar al menos peridicamente en
una evaluacin regional o internacional, en el marco de la poltica de prioridades que cada
pas defina.
18. Una primera opcin a analizar, en relacin al sistema nacional de evaluacin, es si el

mismo carcter diagnstico (para alumnos, escuelas o sistema educativo) o si su
propsito ser la certificacin de los logros educativos de los estudiantes. En el primer
caso, el propsito central es generar informacin que, por alguno de los caminos que se
analizarn ms adelante, sirva para mejorar la enseanza y el aprendizaje. En el segundo
caso, el propsito central es establecer qu estudiantes han alcanzado los conocimientos y
desempeos necesarios para aprobar un curso o nivel y, en consecuencia, tomar la
determinacin de aprobar o reprobar a cada estudiante (certificacin).
11
19. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes a

travs de exmenes nacionales de alta calidad tcnica tiene las siguientes ventajas:
19.1. Hace transparente el valor de los certificados educativos ante la sociedad. En el

presente es comn que dos estudiantes que han logrado aprobar un mismo nivel
educativo en dos regiones distintas de un mismo pas, en realidad posean niveles de
conocimiento muy diferentes.
19.2. Hace responsables tanto a los docentes como a los propios estudiantes por alcanzar
los conocimientos y capacidades que son objeto de evaluacin en el examen, lo cual
tiene impactos positivos sobre el aprendizaje.
20. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes

tiene requerimientos importantes y costosos:
20.1. Las pruebas deben tener carcter censal y cada estudiante debe tener ms de una
oportunidad para rendirla, lo cual requiere implementar varios operativos de
evaluacin cada ao.
20.2. Las pruebas deben tener una amplia cobertura curricular, lo cual requiere pruebas
extensas, en lo posible, con preguntas de respuesta construida (que tienen un
importante costo de codificacin) y deben abarcar varias asignaturas o disciplinas.
21. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes puede
generar tensiones importantes que es necesario anticipar. Si las pruebas son exigentes,
ello puede conducir a niveles de reprobacin muy altos, que afectaran principalmente a
los sectores sociales ms vulnerables, que podran agudizar problemas como la desercin
y el desempleo juvenil, y que seran insostenibles desde el punto de vista social y poltico.
Por ello, es preciso acompaar este tipo de evaluaciones (en realidad todo tipo de
evaluaciones, pero estas en particular) con acciones pedaggicas de carcter
complementario y compensatorio: proponer estndares altos implica asumir
responsabilidad sistmica por proporcionar todas las oportunidades para aprender (textos,
materiales, instalaciones, preparacin de maestros, entre otros).
22. Existen diversos caminos para enfrentar este problema.
22.1. Uno que ha sido implementado en diferentes pases, consiste en que la evaluacin
estandarizada constituya slo una parte del proceso de certificacin de
aprendizajes de los estudiantes (por ejemplo, el 40% de su calificacin final). El
resto de la nota corresponde a las evaluaciones que realizan los docentes a cargo de
los estudiantes. Si bien en este caso se mantiene el problema sealado al comienzo,
respecto a la heterogeneidad de los criterios de evaluacin empleados por los
docentes, es una forma de combinar la evaluacin externa y la interna e, incluso, de
aportar a los docentes una mirada externa que les permita reflexionar acerca de sus
propios criterios.
22.2. Otro modo de encarar el problema consiste en establecer un periodo de transicin

hacia estndares nicos y universalmente aplicables. Durante dicho perodo el foco
principal se centra en la mejora o progreso de los estudiantes de cada escuela
12
respecto a su situacin anterior, y no nicamente en el cumplimiento del estndar

absoluto de certificacin.
22.3. La peor respuesta que podra darse a este problema sera establecer un porcentaje
fijo de reprobacin, por ejemplo, no debe reprobar ms del 10% de los estudiantes.
Ello implica utilizar pruebas ms fciles y, por lo tanto, enviar a estudiantes,
familias y educadores una seal equivocada respecto a las expectativas de
aprendizaje.
23. La evaluacin externa con propsitos de certificacin es ms apropiada para los ciclos
superiores del sistema educativo, sobre todo hacia el final de la educacin media.
24. Un modo diferente de encarar un sistema de evaluacin a gran escala es otorgndole

carcter diagnstico y formativo, sin consecuencias directas para los estudiantes, cuya
finalidad principal sea enriquecer con informacin de calidad las percepciones, decisiones
y acciones de diversos actores del sistema: las autoridades y cuerpos tcnicos a nivel
nacional y regional; los supervisores, directivos y docentes; los estudiantes y sus familias;
los ciudadanos.
25. Un sistema de evaluacin de tipo formativo y sin consecuencias directas para los
estudiantes tiene las siguientes ventajas:
25.1. Los costos de aplicacin de pruebas pueden ser menores, dado que las pruebas
pueden tener carcter muestral y aplicarse slo en algunos grados clave y cada
cierto nmero de aos (la opcin entre pruebas muestrales o censales con un
enfoque formativo se desarrolla en el apartado 27). Esto puede permitir destinar
ms recursos a la divulgacin y capacitacin a partir de los resultados.
25.2. Las pruebas pueden disearse con carcter matricial. Esto significa que no todos los
estudiantes responden a las mismas preguntas sino a bloques de las mismas, lo cual
hace posible trabajar con una cantidad muy grande de preguntas que permiten
obtener un anlisis ms detallado de los distintos aspectos del currculo.
25.3. Es posible definir estndares o niveles de expectativa exigentes, que operen como
punto de referencia para estudiantes, familias y educadores acerca de lo que se debe
aspirar que conozcan y sean capaces de hacer los primeros, sin que ello produzca un
fracaso generalizado.
25.4. Puede ser un modo de avanzar progresivamente en la construccin de una cultura de

la evaluacin y en la acumulacin de capacidad tcnica, de modo que cuando se
analice la posibilidad de establecer un sistema con consecuencias, existan las
condiciones para hacerlo de manera apropiada.
25.5. Una de las alternativas a considerar entre los usos de carcter formativo es la de
liberar una prueba completa, para que sea aplicada en forma autnoma por parte
de los maestros, con el fin de ayudarles a identificar dificultades de alumnos
individuales y de enriquecer su repertorio de instrumentos de evaluacin.
26. El principal problema de un sistema de evaluacin de carcter diagnstico y formativo es

que puede resultar intrascendente y carecer de impacto si no es acompaado de una
estrategia precisa y de una inversin importante para asegurar la divulgacin de los
13
resultados y su uso en acciones educativas posteriores. Este suele ser el taln de

Aquiles de este tipo de sistemas, dado que su efectividad se juega en el hecho de que los
diferentes actores reciban, comprendan y utilicen los resultados.
26.1. Para que los resultados de este tipo de evaluaciones tengan impacto sobre las
polticas educativas, debe realizarse una importante inversin de tiempo en el
anlisis y discusin de los resultados por parte de diversas reas del Ministerio de
Educacin y otros actores relevantes, en la comprensin de los problemas y
deficiencias que los resultados ponen de manifiesto y en la concepcin de acciones
e inversiones apropiadas para hacerles frente.
26.2. Las autoridades deben estar dispuestas a someter sus polticas y decisiones al
escrutinio de la ciudadana, para lo cual es necesario invertir en la comunicacin
apropiada y permanente de los resultados a la opinin pblica.
26.3. Para que los resultados de evaluaciones de carcter formativo tengan impacto sobre
las prcticas de enseanza, es imprescindible realizar una importante inversin de
tiempo en el anlisis e interpretacin de las implicancias didcticas de los
resultados: si los estudiantes no son capaces de resolver cierto tipo de situaciones,
qu es lo que se est haciendo de manera insuficiente o inapropiada en las aulas y
qu es lo que se debera hacer? Este tipo de anlisis debe ser realizado tanto por
especialistas en la didctica de las reas evaluadas como por los docentes.
26.4. Esto ltimo implica, dadas las condiciones predominantes de trabajo docente en la
regin, una inversin importante en la creacin de espacios permanentes y
sistemticos de formacin en servicio y de trabajo colectivo al interior de las
escuelas. En ausencia de estos espacios, los docentes no pueden comprender ni
apropiarse de los resultados de las evaluaciones y, por tanto, difcilmente estos
ltimos tendrn impacto sobre los modos de ensear de los docentes ni sobre los
aprendizajes de los estudiantes.
26.5. Para que los resultados de evaluaciones de carcter formativo tengan impacto sobre
la motivacin de los estudiantes y sobre la actitud de las familias hacia el
aprendizaje escolar de sus hijos e hijas, es necesario proveerles de informacin
apropiada y comprensible acerca de lo que se considera imprescindible haber
aprendido al cabo de cada grado o nivel educativo y acerca de los esfuerzos y
acciones que pueden contribuir al logro de dichos aprendizajes.
26.6. Es muy importante que los maestros puedan analizar la mayor cantidad posible de
temes6, en un contexto de concepcin de desarrollo pedaggico de los estudiantes,
para poder identificar qu temes implican un bloqueo importante para el desarrollo
de nuevos conceptos o capacidades.
26.7. Tambin es muy importante que las pruebas no se limiten a evaluar los
conocimientos y competencias correspondientes a un nico grado (aquel en que se
aplica la evaluacin), sino que incluyan una perspectiva ms amplia de niveles de
desempeo a lo largo de varios grados y que incluyan desde desempeos muy
bsicos hasta desempeos muy complejos. De este modo, es posible identificar qu
es lo que s han aprendido los estudiantes en grados anteriores y qu es lo que ahora
6
Siempre ser necesario conservar el carcter confidencial de una parte de los tems para poder realizar mediciones
comparables en el tiempo.
14
necesitan. El nfasis no estar puesto en comunicar a los docentes que los

estudiantes aprueban o desaprueban, sino en comunicar que estn en diferentes
puntos de un continuo de aprendizaje, en el que todos pueden y necesitan progresar.
27. Las pruebas pueden tener carcter muestral o censal, dependiendo de la estrategia de
cambio educativo.
27.1. Las pruebas muestrales sirven para tener un diagnstico global del sistema. El
impacto de los resultados en este caso depende principalmente de las medidas de
poltica educativa que se tomen a nivel central y de una estrategia de difusin
apropiada que llegue a todas las escuelas.
27.2. Las pruebas censales sirven para obtener informacin de cada una de las escuelas.
El impacto de los resultados en este caso depende de la devolucin de la
informacin a cada comunidad educativa, con un enfoque y un formato adecuados
para promover una mayor participacin y compromiso a nivel local.
27.3. La informacin derivada de una evaluacin censal tambin puede resultar muy til
para dirigir mejor las polticas hacia distritos o escuelas con mayores problemas, ya
que se puede contar con un mapa de resultados de todas las escuelas, zonas,
provincias, tipos de escuela, etc.
27.4. En el caso de evaluaciones de tipo muestral, es preciso disear cuidadosamente la

muestra, de modo de obtener informacin representativa para los niveles de
desagregacin en los que se desee actuar y tomar decisiones (regional, provincial,
municipal; urbano y rural; escuelas indgenas, etc.).
27.5. Segn se indic antes, tambin es posible combinar una aplicacin muestral
controlada con una distribucin censal de las pruebas para su aplicacin en forma
autnoma por parte de las escuelas, con fines formativos y de anlisis de resultados
e identificacin de estudiantes que necesitan apoyos complementarios, al interior de
cada escuela.
28. Adems de las opciones de poltica de evaluacin examinadas, existen polticas de

evaluacin estandarizada dirigidas a establecer incentivos econmicos en funcin de los
resultados o a propiciar un mercado competitivo entre las escuelas. El Grupo de Trabajo
considera importante analizar cuidadosamente las implicancias de estas alternativas
y advertir acerca de sus problemas. Tres modalidades son las principales:
28.1. Utilizar los resultados de evaluaciones estandarizadas para construir rankings de

escuelas y hacerlos pblicos, como forma de: i) fomentar la responsabilidad de las
escuelas por sus resultados; ii) entregar a las familias informacin para la toma de
decisiones sobre la escuela a la cual enviar a sus hijos; iii) promover la competencia
entre los centros educativos por obtener mejores resultados.
28.2. Utilizar los resultados de evaluaciones estandarizadas para entregar incentivos

econmicos a las escuelas que obtienen mejores resultados o mejoras en relacin a
sus resultados en evaluaciones anteriores.
28.3. Utilizar los resultados de evaluaciones estandarizadas como indicador de la calidad

del trabajo de cada docente y como criterio para otorgar incentivos econmicos.
15
29. La primera advertencia que es necesario formular en relacin a los enfoques de uso de la
evaluacin mencionados en el apartado anterior es que muchas veces se constituyen, con o
sin intencin deliberada, en un mecanismo por el cual el Estado renuncia a su
responsabilidad por los resultados del sistema educativo, responsabilidad que transfiere a
la relacin entre escuelas y familias, como si se tratase de un asunto entre actores privados
y no de un bien pblico y de un derecho que el Estado debe garantizar. En lugar de
ocuparse de crear las condiciones para que la enseanza resulte efectiva, en particular en
las escuelas que atienden a la poblacin ms desfavorecida, proveyendo los recursos
necesarios, constituyendo un elenco docente adecuadamente formado y estableciendo
mecanismos idneos para la evaluacin y la orientacin de la labor de las escuelas, el
Estado limita su accionar a la realizacin de evaluaciones, la entrega de resultados y el
establecimiento de incentivos en funcin de estos resultados. Este modo de operar no
considera la complejidad de la labor educativa, en especial en medios socialmente
desfavorecidos, y la necesidad de invertir en la creacin de capacidades como herramienta
principal para la mejora de la enseanza y el aprendizaje.
30. En los pases de la regin existe una responsabilidad fundamental del Estado respecto
a los problemas de calidad educativa, en la medida en que brinda o reconoce ttulos
habilitantes para ejercer la docencia y legitima la presencia en las aulas de docentes que,
en muchos casos, no han sido adecuadamente formados para desempear la profesin -a
quienes no acompaa ni supervisa en su ejercicio profesional-. El Estado no debera, por
un lado, aceptar esta situacin y, por otro, intentar resolver los problemas que ello genera
a travs de pruebas a los estudiantes e incentivos ligados a los resultados de las mismas.
31. Un apartado especfico merecen las comparaciones de resultados entre escuelas. Al

respecto es preciso realizar los siguientes sealamientos:
31.1. La informacin sobre resultados en dos pruebas estandarizadas (en general,

lenguaje y matemtica) no constituye por s misma una evaluacin de la calidad
educativa de las escuelas ni debera presentarse al pblico como tal. La calidad
de una escuela incluye otros aspectos relevantes y valorados por los docentes,
estudiantes y familias, tales como el desarrollo emocional, las relaciones
interpersonales, la formacin cvica y en valores, entre otros. En este sentido, la
denominacin sistema de evaluacin de la calidad de la educacin para un
sistema de pruebas estandarizadas resulta inapropiado.
31.2. Aun as, la informacin comparativa acerca de los niveles de desempeo alcanzados
por los estudiantes en diversidad de escuelas constituye informacin relevante para
los equipos docentes de las escuelas, en la medida en que enriquece la
autopercepcin de la propia labor, permitindoles ubicar los logros de sus
estudiantes en el contexto de los desempeos logrados por los estudiantes en otras
escuelas.
31.3. Para que la comparacin entre los niveles de desempeo alcanzados por los
estudiantes sea apropiada, debe tomar en consideracin sus condiciones sociales de
origen. Los resultados acadmicos de las escuelas debieran poder compararse con
los de escuelas de similar composicin social, dado que los retos y dificultades que
implica ensear a estudiantes de origen desfavorecido (o de lengua materna
indgena) son muy diferentes a los implicados en la enseanza a estudiantes
provenientes de familias con educacin secundaria completa y/o terciaria. Deben
16
ser tenidas en cuenta adems las tasas de desercin de las escuelas y sus polticas de
seleccin de estudiantes, dado que una escuela puede mejorar sus resultados a
travs de la exclusin de estudiantes con dificultades.
31.4. En rigor, si el propsito es entregar a las escuelas, familias y/o autoridades,

informacin acerca de la capacidad de ensear de los docentes y las escuelas, es
necesario medir el progreso de los estudiantes a lo largo de un perodo lectivo
(aprendizaje) y no nicamente el resultado final (logro). Slo a travs de
mediciones de aprendizaje es posible valorar adecuadamente qu tanto aportan el
docente y/o la escuela a la mejora de los conocimientos y competencias de los
estudiantes y, por lo tanto, qu tan buenos o buenas son enseando.
La diferencia entre logro educativo y aprendizaje

El aprendizaje puede ser definido como el cambio ocurrido en los conocimientos y capacidades
de cada estudiante a lo largo del ao lectivo. Su medicin requiere la aplicacin de dos pruebas,
una al inicio y otra al final. De este modo es posible constatar el progreso realizado por cada
alumno.
El logro educativo en cambio, se mide con una nica prueba y refleja la acumulacin de
conocimientos y capacidades a lo largo de toda la vida del estudiante, lo cual incluye el capital
cultural familiar y sus experiencias en otras escuelas o con otros docentes.
31.5. Debe tenerse siempre presente que el aprendizaje y el logro educativo de los
estudiantes dependen tanto de lo que hacen las escuelas y docentes, como del
esfuerzo de los propios estudiantes, del apoyo de las familias a la tarea escolar, del
contexto comunitario y cultural y de las polticas educativas. Los problemas
educativos no pueden ser resueltos apelando exclusiva ni principalmente a
mecanismos de mercado.
31.6. La mayora de rankings de escuelas transmiten una falsa imagen de

ordenamiento. Una escuela puede ocupar el primer lugar y otra el lugar nmero 40
y, sin embargo, las diferencias entre sus promedios pueden no ser estadsticamente
significativos (esto significa que no puede decirse si un promedio es realmente
superior al otro, porque las diferencias entran dentro de los mrgenes de error de la
medicin). Pero, adems, aun cuando las diferencias en los promedios sean
estadsticamente significativas, pueden ser irrelevantes en trminos de las
proporciones de alumnos que logran los niveles de desempeo esperados.
32. La divulgacin y uso de los resultados de las evaluaciones estandarizadas deberan estar
enmarcados en los siguientes criterios bsicos:
32.1. La labor educativa y la responsabilidad directa por sus resultados debe ser
compartida por diversos actores: las autoridades nacionales y regionales, los
cuerpos docentes, los estudiantes y sus familias. Debera evitarse todo uso de los
resultados con el fin deliberado o implcito de culpabilizar o responsabilizar de
manera exclusiva a ciertos actores.
17
32.2. En especial, resulta inapropiado utilizar los resultados de las pruebas estandarizadas
como indicador principal de la calidad del trabajo del docente o de la escuela, en
particular si no se ha controlado el efecto de otros factores internos y externos al
sistema educativo y si no se tiene en cuenta que el aprendizaje depende tambin de
la motivacin y esfuerzo personal del estudiante.
32.3. Al reportar las diferencias de resultados en funcin de la composicin sociocultural

del alumnado de las escuelas, se debe cuidar de no crear un sistema de expectativas
de logro diferenciado por grupos sociales. En todo caso, las diferencias deberan
producirse en las polticas para crear condiciones apropiadas para ensear a los
grupos ms desfavorecidos.
32.4. Los resultados de pruebas estandarizadas no son el nico indicador de la calidad de

la educacin, por lo cual es preciso considerarlos en conjunto con otros aspectos
relevantes como la retencin, la pertinencia y relevancia de lo que se ensea, la
formacin de valores y hbitos o la formacin ciudadana. Debe evitarse la
identificacin del trmino calidad con resultados de pruebas estandarizadas.
32.5. Se debera descartar cualquier tipo de uso de los resultados que, directa o
indirectamente, propicie la seleccin de estudiantes por parte de las escuelas a los
efectos de mejorar sus resultados. Una escuela que selecciona a sus estudiantes es
como un hospital para sanos.
32.6. Debera existir siempre una adecuada combinacin entre exigencias y apoyos a las
escuelas y a los docentes en materia de responsabilidad por los resultados. Por un
lado, es necesario que escuelas y docentes asuman su responsabilidad respecto al
objetivo de que todos los estudiantes aprendan lo que se espera de ellos.
Simultneamente, es deber de las autoridades establecer las polticas de apoyo
necesarias para que escuelas y docentes puedan desarrollar su labor de manera
apropiada. Un esquema de exigencias altas sobre escuelas y docentes sin los
correspondientes apoyos slo puede generar malestar y desnimo. Un esquema de
apoyos sin contrapartes y exigencias puede generar autocomplacencia.
32.7. Para que los procesos de evaluacin sean transparentes y para facilitar la
comprensin y uso de sus resultados, es importante dar a conocer la mayor cantidad
posible de actividades de las pruebas. No basta con ofrecer resultados numricos, es
fundamental ilustrar a los distintos actores acerca del tipo de tareas que los
estudiantes debieron resolver en las pruebas7. Si bien no se pretende que los
docentes utilicen pruebas estandarizadas para evaluar a sus estudiantes, el
conocimiento y la comprensin de las mismas puede contribuir a mejorar sus modos
de evaluar y a desarrollar una cultura de la evaluacin.
32.8. Las pruebas estandarizadas deben focalizarse en aquellos conocimientos y

capacidades que todos los estudiantes deberan desarrollar a lo largo de un
determinado ciclo educativo, ms que en nico grado, en el marco de un enfoque
dinmico y evolutivo del aprendizaje. De este modo, los docentes podrn constatar
y subsanar las deficiencias en los aprendizajes de cursos previos, que impiden a los
7
Este criterio debe combinarse adecuadamente con la necesidad de mantener el carcter confidencial de un
conjunto de preguntas, que puedan emplearse en futuras evaluaciones para establecer mediciones comparables
en el tiempo.
18
estudiantes continuar avanzando. Los resultados sern tiles no slo para los
docentes del grado evaluado, sino tambin para los de grados anteriores.
Un itinerario para la toma de decisiones

a. Para qu se quiere evaluar? Quines usarn los resultados y con qu propsitos? Qu se
espera saber que no se sepa ya?
b. Cules sern las unidades de anlisis para el reporte de resultados: estudiantes
individuales, grupo de clase / maestros, escuelas, tipos de escuela, entidades subnacionales,
sistema educativo?
c. De acuerdo a los propsitos definidos, qu es ms apropiado evaluar: aprendizaje o logro
educativo al egreso de determinados grados o ciclos?
d. Qu tipo de consecuencias tendrn los resultados y para quines?
e. De acuerdo a los propsitos definidos, es necesario trabajar en forma censal o son
suficientes evaluaciones muestrales?
f. Qu grados y qu disciplinas es importante evaluar?
g. Cada cunto tiempo es necesario y adecuado realizar las evaluaciones?
33. Teniendo como marco lo expresado acerca de las alternativas existentes para una poltica
de evaluacin, es indispensable, antes de poner en marcha un sistema de evaluacin (o de
modificar uno existente) seguir un itinerario de decisiones para definir las caractersticas
del sistema. Dicho itinerario implica responder a las preguntas incluidas en el Recuadro
adjunto, lo cual debera plasmarse en un plan de evaluacin a corto, mediano y largo
plazo, claro y explcito, que establezca con claridad qu va a ser evaluado, por qu y para
qu, y que exprese, justifique y organice las opciones tomadas. Es absolutamente
inconducente implementar un primer operativo de evaluacin si no se ha elaborado un
plan de trabajo de largo plazo.
34. En la elaboracin de dicho plan es muy importante considerar los costos en dinero
implicados en cada opcin y los recursos humanos necesarios para su adecuada
implementacin. Es necesario, en particular, balancear la inversin a realizar en la
recogida de informacin con la inversin a realizar en la difusin y uso de los
resultados. Muchos Ministerios de Educacin destinan importantes sumas de dinero a
recoger una gran cantidad de informacin todos los aos, que luego casi no se analiza, ni
se difunde ni se utiliza.
19
Algunas recomendaciones y mandatos a tener en cuenta al tomar

decisiones polticas respecto al sistema de evaluacin
No hars dao. Una de las primeras normas del juramento hipocrtico seala que el
mdico se abstendr de todo aquello que pueda generar dao o perjuicio a sus pacientes. Del
mismo modo, a la hora de pensar en un sistema de evaluacin es importante considerar los
riesgos de efectos no deseados y perjudiciales que la estrategia de evaluacin diseada podra
tener sobre el propio sistema educativo que se desea mejorar.
El consumo excesivo de este producto puede resultar perjudicial para la salud. La

evaluacin no puede estar por encima de la educacin. Segn se indic antes en este
documento, la evaluacin no produce mejoras por s misma. Debe estar alineada con otro
conjunto de elementos para que las mismas se produzcan. Se debe evitar la ingenuidad de
pensar que evaluando mucho se va a mejorar la educacin. Como ocurre con muchos
productos, el exceso de evaluaciones puede producir perjuicios para la salud del sistema
educativo, en especial si slo hay evaluaciones pero no hay polticas para dar respuesta a los
problemas que la misma pone de manifiesto.
No evaluars en vano. Otra de las tentaciones que deben ser evitadas es la de recoger
todos los aos informacin que nunca ser analizada ni utilizada. Para que un sistema de
evaluacin tenga impacto, se debe establecer una periodicidad en las mismas que garantice
que los datos recogidos puedan ser analizados, discutidos, comprendidos y utilizados.
Incorporar la nueva informacin y traducirla en decisiones y acciones lleva tiempo. Los cambios
en el sistema educativo requieren ms tiempo aun.
Vsteme despacio Sancho, que estoy apurado. Es muy importante que quienes toman
las decisiones en los Ministerios de Educacin desestimen la creencia ingenua en la existencia
de caminos fciles y rpidos. No es posible montar un programa de evaluacin serio en tres
meses. No existe coyuntura ni ventana de oportunidad que lo justifique: las consecuencias de
la improvisacin se harn sentir tarde o temprano. La evaluacin requiere reflexin cuidadosa
acerca de sus fines y usos; discusin pblica sobre qu es lo fundamental a evaluar; dilogo e
involucramiento de diferentes actores; conformacin de equipos tcnicos competentes en
diversos aspectos; e informacin previa para que los actores se involucren con la evaluacin.
20
Diez recomendaciones acerca de las evaluaciones que la regin necesita

1. La evaluacin debe ser concebida como un elemento articulado en un conjunto ms amplio de
acciones y polticas educativas. La evaluacin por s misma no produce mejoras. Deben existir
articulaciones estables entre el rea de evaluacin y las reas de desarrollo curricular, formacin
docente, investigacin, diseo de polticas, comunicacin y prensa, entre otros.
2. La evaluacin es un proceso de reflexin colectiva sobre el estado de la educacin y los

caminos para mejorarla. El primer paso para ello es la consulta y el debate pblicos acerca de qu
deben aprender los estudiantes y acerca de los propsitos y consecuencias de la evaluacin. Del mismo
modo, es fundamental la discusin pblica constructiva a partir de los resultados, con el fin de encarar
las insuficiencias e inequidades en el acceso al conocimiento por parte de los y las estudiantes. Para
ello es necesario invertir en comunicacin y difusin tantos o ms recursos que en la propia
evaluacin, antes, durante y despus de la misma.
3. La evaluacin debe estar al servicio del desarrollo de un sentido de responsabilidad

compartida por la educacin como bien pblico. Debe promover el compromiso con la educacin
de todos los actores, cada uno segn su lugar y mbito de accin. Por este motivo, debe evitarse
utilizar la evaluacin para culpabilizar a actores especficos por los problemas detectados.
4. Los sistemas de evaluacin de la regin necesitan ampliar progresivamente el abanico de fines

educativos que son objeto de evaluacin. Es importante en este sentido incluir a la formacin
ciudadana, otras disciplinas adems del Lenguaje y la Matemtica, as como un espectro ms amplio de
competencias y capacidades.
5. Los sistemas de evaluacin de la regin deberan progresivamente disear evaluaciones de

progreso de los estudiantes, dado que son las que pueden aportar mayor informacin acerca del
impacto de las polticas educativas, de las acciones de las escuelas y de las prcticas de enseanza, en
los aprendizajes de los y las estudiantes.
6. Un sistema de evaluacin es un proyecto de largo plazo que requiere de un compromiso del Estado
y de una planificacin cuidadosa del diseo del sistema. Ello exige tomar decisiones acerca de los fines,
las consecuencias, los aspectos a evaluar, las reas y los grados, la periodicidad de las evaluaciones,
entre otras cosas. Todo ello exige tiempo, por lo que no es conveniente pretender la implementacin
de sistemas de evaluacin en plazos reducidos.
7. Un buen sistema de evaluacin requiere inversin, principalmente en la conformacin de equipos

humanos calificados, as como recursos econmicos suficientes para una adecuada
implementacin de todos los procesos implicados.
8. El sistema de evaluacin debe estar sustentado en una actitud firme de transparencia en relacin
a los resultados y de rendicin de cuentas a la sociedad.
9. Los Ministerios de Educacin deben asumir un compromiso serio y consistente con los
resultados de la evaluacin, lo cual implica promover el dilogo acerca de los problemas detectados
y los modos de enfrentarlos, disear lneas de accin apropiadas para resolver los problemas e invertir
los recursos necesarios para llevarlas adelante.
10. Los sistemas de evaluacin deben ser objeto de evaluacin peridica, con el fin de analizar la
calidad tcnica de la informacin que producen y su relevancia para diversos actores educativos y
sociales.

Evaluaciones Educativas AL Necesita Preal PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Evaluaciones Educativas AL Necesita Preal PDF

Cargado por

Copyright:

Formatos disponibles

Programa de P omocin

r de la Reforma Educativa en Amrica Latina y el Caribe

Las evaluaciones educativas

Pedro Ravela, Patricia Arregui, Gilbert Valverde, Richard Wolfe,

LAS EVALUACIONES EDUCATIVAS QUE AMRICA LATINA NECESITA

Est dirigido a tomadores de decisiones ministeriales, docentes, acadmicos, empresarios,

El inters del documento se focaliza en la evaluacin estandarizada de aprendizajes y/o logros

El documento est estructurado en cinco grandes captulos. En el primero se explica por qu

Propsitos e ideas centrales del documento

I. Por qu son importantes las evaluaciones nacionales de logros educativos?

1. La realizacin de evaluaciones estandarizadas como forma de conocer mejor la dinmica

3. La educacin es una actividad opaca, en el sentido de que sus resultados no son

4. En dcadas pasadas, la equivalencia entre permanencia en el sistema educativo y acceso al

6. Como resultado de lo antedicho se corre el riesgo de propiciar una ilusin: la

7. De all la importancia de desarrollar sistemas de informacin que permitan hacer

A quines y cmo puede aportar informacin relevante un sistema de evaluacin de

8. El desarrollo de un sistema nacional de evaluacin estandarizada tiene la ventaja adicional

9.1. Es importante reconocer explcitamente que no todos los objetivos valiosos de la

9.2. En el mismo sentido, la evaluacin estandarizada de aprendizajes y/o logros

9.3. La evaluacin es condicin necesaria pero no suficiente para mejorar la

II. La situacin de la evaluacin estandarizada en Amrica Latina

11. Diecisis pases estn participando en el Segundo Estudio Regional en 3 y 6 de Primaria

13.5. Existe en la mayor parte de los pases y de los profesionales dedicados a la

13.6. La incorporacin creciente de pases de la regin a procesos de evaluacin a nivel

describen con mayor amplitud, en trminos de desafos a asumir, en el resto del

14.1. Es bastante comn que desde el nivel poltico se demande la implementacin

utilizarlos productivamente. Es necesario, por tanto, realizar un esfuerzo importante

14.7. Perdura an en la mayora de los pases la prctica de divulgar resultados de tipos

14.8. Persisten en muchos pases importantes debilidades y desafos de carcter tcnico

14.9. Un problema importante en la regin es la insuficiencia de profesionales calificados

La tabla siguiente esquematiza esta reflexin:

16. El primer paso indispensable en la construccin o reforma de un sistema de evaluacin

18. Una primera opcin a analizar, en relacin al sistema nacional de evaluacin, es si el

19. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes a

19.1. Hace transparente el valor de los certificados educativos ante la sociedad. En el

20. Un sistema de evaluacin para la certificacin de los aprendizajes de los estudiantes

22. Existen diversos caminos para enfrentar este problema.

22.2. Otro modo de encarar el problema consiste en establecer un periodo de transicin

respecto a su situacin anterior, y no nicamente en el cumplimiento del estndar

24. Un modo diferente de encarar un sistema de evaluacin a gran escala es otorgndole

25.4. Puede ser un modo de avanzar progresivamente en la construccin de una cultura de

26. El principal problema de un sistema de evaluacin de carcter diagnstico y formativo es

resultados y su uso en acciones educativas posteriores. Este suele ser el taln de

necesitan. El nfasis no estar puesto en comunicar a los docentes que los

27.4. En el caso de evaluaciones de tipo muestral, es preciso disear cuidadosamente la

28. Adems de las opciones de poltica de evaluacin examinadas, existen polticas de

28.1. Utilizar los resultados de evaluaciones estandarizadas para construir rankings de

28.2. Utilizar los resultados de evaluaciones estandarizadas para entregar incentivos

28.3. Utilizar los resultados de evaluaciones estandarizadas como indicador de la calidad

31. Un apartado especfico merecen las comparaciones de resultados entre escuelas. Al

31.1. La informacin sobre resultados en dos pruebas estandarizadas (en general,

31.4. En rigor, si el propsito es entregar a las escuelas, familias y/o autoridades,

La diferencia entre logro educativo y aprendizaje

31.6. La mayora de rankings de escuelas transmiten una falsa imagen de

32.3. Al reportar las diferencias de resultados en funcin de la composicin sociocultural

32.4. Los resultados de pruebas estandarizadas no son el nico indicador de la calidad de

32.8. Las pruebas estandarizadas deben focalizarse en aquellos conocimientos y

Un itinerario para la toma de decisiones

Algunas recomendaciones y mandatos a tener en cuenta al tomar

El consumo excesivo de este producto puede resultar perjudicial para la salud. La

Diez recomendaciones acerca de las evaluaciones que la regin necesita

2. La evaluacin es un proceso de reflexin colectiva sobre el estado de la educacin y los

3. La evaluacin debe estar al servicio del desarrollo de un sentido de responsabilidad