Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AUTORIDADES
Presidenta de la Nacin
Dra. Cristina Fernndez de Kirchner
Ministro de Educacin
Prof. Juan Carlos Tedesco
Secretario de Educacin
Prof. Alberto Sileoni
Subsecretario de
Planeamiento Educativo
Lic. Osvaldo Devries
Director Nacional de Informacin y
Evaluacin de la Calidad Educativa
Lic. EDUARDO ARAGUNDI
Elaboracin:
rea Evaluacin de la Calidad Educativa
Coordinadora:
Sonia Hirschberg
Equipo responsable:
Mirta Leon
Patricia Scorzo
Jorge Novello
Diseo Grfico:
Karina Actis
Juan Pablo Rodrguez
Coralia Vignau
ndice
Presentacin............................................................................................................................................... Pg. 5
Primera Parte.
Hacia una cultura de la Evaluacin Educativa
Evaluacin: nuevos significados para una prctica compleja,
por Alicia Bertoni, Margarita Poggi y Marta Teobaldo.............................................................................. Pg. 7
Evaluacin educativa: una aproximacin conceptual,
por Nydia Elola y Lilia Toranzos................................................................................................................ Pg. 15
La evaluacin educativa, un criterio consolidado, por IIPE Buenos Aires-............................................ Pg. 17
Evaluacin Nacional y Evaluaciones Internacionales, por el equipo de la DiNIECE................................ Pg. 21
Qu pretendemos evaluar, qu evaluamos y qu conclusiones podemos
extraer de la evaluacin?, por Alejandro Tiana Ferrer............................................................................ Pg. 27
Las evaluaciones educativas que Amrica Latina necesita, por P. Ravela, P. Arregui,
G. Valverde, R. Wolfe,G. Ferrer, F.M.Rizo,M. Aylwin y L.Wolff............................................................... Pg. 35
Una mirada tcnico-pedaggica acerca de las evaluaciones de calidad educativa,
por Felipe Martnez Rizo........................................................................................................................... Pg. 49
Segunda Parte.
El Operativo Nacional de Evaluacin 2009
Adenda
1 / Capacidades cognitivas ONE 2009....................................................................................................... Pg. 69
2 / Evaluacin Nacional y Evaluaciones Internacionales.......................................................................... Pg. 73
Glosario...................................................................................................................................................... Pg. 77
Presentacin
Esta publicacin intenta cumplir con los objetivos arriba mencionados, por un lado su amplia difusin a funcionarios, supervisores y directores de escuelas medias,
pretende contribuir a enriquecer los marcos tericos y
metodolgicos, por otro presenta los debates ms significativos que se estn dando en el mbito internacional.
El primer trabajo de Bertoni, Poggi y Teobaldo nos sealan la importancia de la participacin de los actores
en todo proceso de evaluacin. Tiana nos presenta las
preguntas que tenemos que considerar al iniciar un proceso de evaluacin y el equipo de PREAL define las caractersticas que deben tener las evaluaciones en Amrica Latina. Martnez Rizo realiza un anlisis sobre los
aspectos tcnico- pedaggicos de las evaluaciones. Por
ltimo Fasce y Leones exponen los enfoques metodolgicos relacionados con el censo en el ltimo ao de la
escuela secundaria que se realizar en nuestro pas en el
mes de septiembre de este ao.
En una adenda incorporamos algunos documentos elaborados por los equipos tcnicos de evaluacin, que
consideramos de gran utilidad para el trabajo de este
ao: el listado de las capacidades cognitivas a considerar en el censo 2009, un anlisis de las evaluaciones
nacionales e internacionales realizadas en nuestro pas
y un glosario con los trminos tcnicos que utilizamos
cotidianamente en nuestra tarea.
Esperamos que este material sea de utilidad para compartir en cada uno de los lugares de trabajo y para actualizar y enriquecer la tarea de cada uno de nosotros.
Primera Parte.
Hacia una cultura de la Evaluacin Educativa
Evaluacin:
nuevos significados para una prctica compleja
Los significados de la evaluacin
educativa: alternativas tericas
La evaluacin educativa nos confronta con el abordaje de un espacio de conflicto, que permite analizar articulaciones o fracturas entre supuestos tericos y prcticas pedaggicas. En efecto, todo proceso de evaluacin
pone en evidencia mltiples aspectos, relacionados con
las caractersticas y procesos de la institucin educativa,
los proyectos institucionales, los estilos de gestin, las
propuestas curriculares y editoriales, las particularidades
de los docentes y de los alumnos, etc. Podemos afirmar,
sin lugar a dudas, que nos enfrentamos a un punto neurlgico de la relacin educativa.
Ms all de las diferentes perspectivas que han abordado la cuestin de la evaluacin, nos parece importante sealar que sta constituye siempre una actividad
de comunicacin en la medida en que implica producir
un conocimiento y transmitirlo, es decir, ponerlo en circulacin entre diversos actores involucrados. En tanto
accin comunicativa, la evaluacin padece las mismas
vicisitudes que toda comunicacin entre los sujetos sociales implicados en ella.
Aun cuando pueda plantearse en diferentes niveles,
como el del sistema educativo, la institucin o el aula,
la evaluacin implica siempre una serie de aspectos comunes que siguen una secuencia lgica y cronolgica
aunque, en la prctica, algunos de ellos sean omitidos.
Nos referimos a:
- el relevamiento de informacin a travs de diversos
procedimientos como la observacin, los documentos, las producciones, etctera;
- el anlisis de los datos segn marcos de referencia
que orientan la lectura de stos;
- la produccin de conclusiones, en algunos casos
expresadas en juicios de valor, que traduce el anlisis en proposiciones sobre el objeto evaluado,
o, en otros casos, la produccin de datos cuantitativos, cifrados, que muestran algn otro aspecto
de dicho objeto;
- la comunicacin a los actores involucrados en el
proceso evaluativo o la divulgacin a otros de las
conclusiones elaboradas;
- aunque no necesariamente se deriva de los puntos
mencionados, la toma de decisiones para intervenir
activa e intencionalmente en los procesos y resultados sobre los cuales se emiti el juicio evaluativo.
A pesar de que las instancias mencionadas constituyen una secuencia, su ejecucin no es, necesariamente,
lineal. El anlisis de los datos, por ejemplo, puede requerir el relevamiento de alguna informacin adicional o
complementaria; la comunicacin de los resultados a los
actores implicados puede llevar a cierta reconsideracin
de las conclusiones, etctera.
Por lo dems, segn cul sea el paradigma que da sentido a la evaluacin educativa, algunos puntos se priorizarn sobre los otros o adquirirn diferentes significados.
consideran necesarios para el desempeo social, sus resultados repercuten no slo sobre el sujeto evaluado y su
entorno inmediato en las circunstancias presentes, sino
que tienen un efecto expansivo, no necesariamente
visible, sobre su insercin futura en otros campos.
Podemos ver cmo tiene lugar este proceso situando
el anlisis en el nivel del aula.
La observacin de lo que sucede con la evaluacin
de los aprendizajes en el aula permite a un observador
atento construir un entramado de relaciones entre actores y entre campos, que se constituyen con la puesta en
marcha del dispositivo de evaluar y, sobre todo, con los
resultados derivados del mismo. En este sentido, el mbito del aula involucra no slo a los protagonistas que
en buena medida lo conforman, a saber, los docentes y
los alumnos, sino tambin a otros actores sociales, cuya
visibilidad depende del grado de proximidad que guarden con los miembros de la relacin educativa: padres,
familiares, amigos, futuros empleadores, etctera.
La evaluacin, en su nivel ms visible, opera como un
eje que articula el juego entre tres tipos de actores:
docentes, alumnos y padres, o quienes desempeen el
rol sustituto de stos. Pone en contacto a los protagonistas de los actos educativos con los padres, que son
actores puente entre lo escolar y lo extraescolar. En
realidad, la evaluacin es la instancia por excelencia, en
trminos de los asuntos que suelen poner en relacin
a los tres tipos de actores, porque sus resultados tienen
repercusin sobre la trayectoria educativa de los alumnos, sobre sus posibilidades futuras ms all del campo
educativo, sobre las expectativas de los padres y sobre la
responsabilidad del maestro1.
Por esta razn, docentes, alumnos y padres entran
en relacin a propsito de las calificaciones. En la escuela juegan el juego de las notas porque en las instituciones educativas se producen, negocian y distribuyen
calificaciones, que circulan luego en otros campos, bajo
la forma de certificaciones, con valor en el mercado.
Estos procesos de produccin, negociacin y distribucin de las calificaciones asumen caractersticas particulares en el interior de las escuelas y de las aulas. Las
reglas de juego, formales o informales, explcitas o
implcitas, que se configuran entre docentes, alumnos
y padres a propsito de la evaluacin, se relacionan con
las caractersticas institucionales y con la manera en que
aquellos actores desempean sus roles, es decir, con la
manera en que juegan el juego en tanto sujetos vinculados por la evaluacin. En esto inciden las concepciones
o ideas que tienen acerca de ella, la importancia que
le asignan, las estrategias de sobrevivencia desarrolladas
para jugar el juego en las condiciones dadas, etctera.
As, por ejemplo, los docentes califican a sus alumnos
en funcin de sus concepciones sobre la evaluacin, sus
expectativas sobre los alumnos, su mayor o menor contaminacin con las rutinas escolares. Los alumnos, por
su parte, responden a las evaluaciones segn el grado
de inters que tengan por lo aprendido, segn las estrategias que hayan desarrollado para pasar una prueba
o un examen, etc. Por otro lado, los padres se interesan
por las calificaciones de sus hijos y ejercen, segn los
casos, presiones sobre stos o sobre los maestros.
10
Los resultados de la evaluacin tienen relacin directa con el objetivo de ella, con la pregunta de para qu
se evala.
En este sentido, es importante tener en cuenta que la
relacin entre quin o quines evalan y el objeto de evaluacin (los saberes de los alumnos, por ejemplo) no es
independiente del contexto en el cual aqulla se realiza.
En efecto: cualquiera sea la forma que adopte, la
evaluacin se inscribe siempre en un mbito de decisiones. Aun en sus formas ms frecuentes y simples, como
en el caso de la evaluacin implcita, que tiene lugar
en la interaccin cotidiana entre maestros y alumnos,
aqulla sirve al docente para tomar decisiones sobre sus
prcticas en el aula. Tenga o no conciencia de que la
realiza, el maestro releva una informacin a partir de
la cual organiza la interaccin con sus alumnos en trminos de lo que considera mejores condiciones para el
aprendizaje.
Cuando la evaluacin tiene carcter institucional, en
cambio, su modalidad es explcita; es un acto deliberado,
organizado, que se efecta empleando metodologas e
instrumentos de carcter variado, generalmente complejos. En este caso, el uso social externo o interno de los
resultados depender, en parte, del tipo de informacin
que permitan obtener los instrumentos empleados y, en
parte, de las decisiones previamente adoptadas, o bien
de aquellas que se adopten a partir de la obtencin de
los datos. Puede ocurrir tambin que el uso que se haga
de la informacin obtenida sea producto de una transaccin entre las decisiones iniciales y las que se derivan
Algunas observaciones
sobre la accin de evaluar
Conforme a lo que se ha venido sealando, podra
decirse que evaluar implica, siempre, tomar distancia de
la realidad que se analiza para poder pronunciarse sobre
ella en un contexto decisional dominante (Hadji, 1992).
La afirmacin poder pronunciarse acerca de la realidad requiere ciertas precisiones.
11
de la relacin pedaggica para que los resultados obtenidos a travs de la evaluacin permitan a los docentes
reorientar los procesos de enseanza.
Por otra parte, una evaluacin que opera por niveles
como los sealados facilita el anlisis de las sucesivas
transposiciones del currculum prescripto, en las expectativas de los maestros sobre lo que debera ensearse,
y en el currculum real.
De esta forma, es posible introducir, en las metodologas de evaluacin, modificaciones que tiendan a poner
los procesos evaluativos al servicio de la accin pedaggica. Slo con la construccin del referente hemos dado un
ejemplo acerca de cmo pueden comenzar a producirse
cambios respecto a lo que se pone en juego en el mbito pedaggico. Ms adelante mostraremos que la metodologa genera tambin transformaciones en los papeles
de los actores y en las reglas del juego que los relacionan.
Volviendo ahora al anlisis del proceso de evaluacin, es necesario sealar que al referente se aade un
conjunto de criterios que guan tanto la construccin de
los instrumentos de evaluacin como los procesos de valoracin posteriores.
Por otra parte, los criterios tambin operan en los
procesos de seleccin de lo que se quiere evaluar e intervienen, asimismo, en la construccin de los indicadores y
de los datos resultantes de la evaluacin.
En este sentido, tanto el objeto que se evala
como el proceso de valoracin son construidos por
el sujeto que evala.
En la evaluacin, como en cualquier otro acto de
conocimiento, no se capta nunca directa y totalmente la realidad examinada. sta es siempre objeto de un
proceso previo de definicin o de eleccin de los caracteres que permitirn aprehenderla[...]Formulado de
otra forma, no basta con decir que la evaluacin lleva
a la realidad; todava falta construir o adoptar los indicadores de la realidad considerada. Desde este punto
de vista, la evaluacin plantea el conjunto de cuestiones
planteado de forma ms amplia por los procesos de produccin de conocimientos5.
Veamos ahora, a manera de ilustracin, algunos
de los pasos necesarios en la construccin del objeto.
Una vez que el propsito de la evaluacin ha sido determinado (conocer, por ejemplo, las realizaciones de los
alumnos en un rea de conocimiento y en un nivel especfico), se hace necesario fijar los criterios para evaluar
las respuestas producidas por los alumnos y construir
los indicadores correspondientes (tipo y nivel de conocimientos esperables, competencias requeridas, etc.). En
este proceso, la seleccin de los contenidos curriculares
por evaluar supone tambin partir de criterios que permitan efectuar un recorte tcnico en relacin con los
contenidos enseados y con las respuestas valoradas
como deseables. As, la decisin implica poner en juego
una concepcin pedaggica determinada y operar con
un marco epistemolgico especfico.
12
El proceso de construccin del objeto supone, entonces, proceder por recortes sucesivos de la realidad,
los cuales se realizan conforme a criterios con independencia de que estn o no explicitados. Por esta razn,
los indicadores que se construyen no cubren nunca la
totalidad de la realidad que se evala; como se habr
comprendido, al evaluar siempre se introduce un esquema de lectura de la realidad que circunscribe, recorta,
reduce lo observable.
En cuanto a los procesos de valoracin de los resultados, nos remitimos a lo sealado anteriormente acerca
de que la evaluacin, en tanto adjudicacin de un juicio
de valor a una realidad dada, supone siempre una lectura orientada, filtrada por el referente y por los criterios que constituyen una explicitacin de este ltimo.
Es conveniente aclarar, asimismo, que los procesos
de valoracin dependen, por otra parte, de la pertinencia de los instrumentos de evaluacin construidos, es
decir, de la adecuacin entre el tipo de instrumento elaborado y las caractersticas de los procesos educativos
que se desee aprehender.
Como veremos ms adelante, la construccin del objeto y los procesos de valoracin pueden ser el resultado
de una metodologa como la que fragmentariamente
presentamos como ejemplo, de un enfoque ms cualitativo (en el cual el objeto y la valoracin se construyen
en el proceso de evaluacin) o de una combinatoria de
ambos paradigmas.
quisiramos sealar que pueden identificarse dos caractersticas que permanecen como elementos constantes
en toda actividad evaluativa:
1. Siempre constituye una lectura orientada (tanto
cuando asume formas de control como cuando se
trata de la evaluacin apreciativa con referente predeterminado o de la evaluacin interpretativa).
2. Siempre consiste en un pronunciamiento acerca
de la realidad.
Por otra parte, ms all de estas dos grandes posiciones sealadas, aparecera, en algunos de los trminos
que se asocian a la evaluacin, la idea de ayuda, sostn
o apoyo, con lo que ello implica desde el punto de vista
educativo.
La evaluacin y el control
En funcin de esta ambigedad del trmino, que refleja lo que sucede en las prcticas evaluativas, Jacques
Ardoino y Guy Berger presentan la evaluacin como un
Jano moderno con un doble perfil: un lado muestra
un perfil filosfico, en la medida en que toda evaluacin
plantea el problema del valor, del sentido y de la significacin de aquello que se evala (lo que requiere un
tratamiento cualitativo); el otro lado muestra un perfil
tcnico, ya que la evaluacin constituye un dispositivo
compuesto por mtodos, tcnicas e instrumentos empleados para dar cuenta y rendir cuenta (de manera
cuantitativa) de los resultados obtenidos. Ese perfil se
asocia con la nocin de control.
Para los autores mencionados, sin embargo, ambas
nociones pertenecen a dos rdenes diferentes y a dos
paradigmas epistemolgicos distintos. Veamos la significacin de cada uno de los trminos.
La palabra control tiene su origen en la lengua
francesa, en la contraccin de la expresin contrerle,
empleada para designar el doble registro necesario
para autenticar las escrituras. Adoptada por numerosas
lenguas, la expresin ha conservado a lo largo del tiempo el sentido administrativo de su origen.
En nuestra vida cotidiana la palabra expresa mltiples
y diversas situaciones: control administrativo, control financiero, control fiscal, control policial, control aduanero, control industrial, control de calidad, etctera.
La mayor parte de los instrumentos de medicin que
empleamos son instrumentos de control. Tambin implican operaciones de control los mecanismos cibernticos
que regulan la transmisin y recepcin de informacin
en sistemas simples o complejos.
En el campo educativo, los exmenes, el registro de
asistencias, las amonestaciones, etc., son procedimientos explcitos de control.
Esta diversidad de usos y acepciones ha conducido
a considerar el control como un sistema, un dispositivo y una metodologa, constituidas por un conjunto
de procedimientos que tiene por objeto (y objetivo) establecer la conformidad (o la no conformidad), y aun la
identidad, entre una norma, un patrn, un modelo y los
fenmenos u objetos con los que se los compara, y en
ausencia de esta conformidad o identidad, establecer la
medida de su diferencia9.
Es importante retener, para la comprensin de este
trmino y su ulterior comparacin con el de evaluacin,
que el control se efecta a partir de un elemento externo y anterior (desde el punto de vista lgico, no necesariamente cronolgico) al acto mismo del control. Los
exmenes y las amonestaciones, por ejemplo, existen,
en tanto instrumentos, con anterioridad a la instancia de
13
14
esta lnea, fundamentalmente, las orientaciones basadas en el paradigma interpretativo, que, como veremos
ms adelante, plantean la construccin del referente en
el proceso mismo de evaluacin.
La introduccin del concepto de regulacin crtica
permite separar la evaluacin estimativa de la medicin
en sentido estricto. Entre ambas existe una frontera, ya
que el objetivo de toda medicin es hacer una descripcin cuantitativa de la realidad, efectuar una lectura de
ella lo ms objetiva posible. La evaluacin estimativa,
en cambio, no tiene como nico objetivo medir, sino
emitir un juicio a partir de los datos que la medicin
provee. Este tipo de evaluacin pone de manifiesto que
la realidad que se evala no puede -en sentido estrictoser medida, pero, adems, que la intencin dominante
no es slo conocer sino regular. Recordemos el ejemplo
que dimos a propsito de este tipo de evaluacin cuando se empleaba en situaciones experimentales a partir
de la incorporacin de un nuevo programa o mtodo,
destinado a mejorar los aprendizajes. En ese caso, la informacin suministrada por la evaluacin para estimar la
medida en que la innovacin curricular o metodolgica
mejoraba los resultados estaba al servicio de la regulacin del proceso de enseanza, permitiendo as introducir modificaciones en este ltimo.
A pesar de que tanto el control como la evaluacin
cumplen una funcin de regulacin crtica para la accin, ambos procesos pueden ser necesarios porque dicha funcin tiene un carcter distinto en cada caso.
Habitualmente, sin embargo, suelen utilizarse los
conceptos de medicin y evaluacin de manera confusa
y poco discriminada. El trmino evaluacin, por ejemplo, es empleado de manera genrica y subsume prcticas muy heterogneas, que incluyen las de medicin en
el sentido estricto de control. Parece adecuado suponer,
como lo hacen Ardoino y Berger, que las connotaciones
negativas que afectan al proceso de control inhiben la
explicitacin de su uso en las situaciones en que se lo
15
Evaluacin educativa:
una aproximacin conceptual
Resulta oportuna, en trminos generales, la definicin propuesta por T. Tenbrink:
Evaluacin es el proceso de obtener informacin y usarla para formar juicios que a su
vez se utilizarn en la toma de decisiones.
a) Las funciones de la evaluacin
En trminos generales se pueden reconocer diferentes funciones frecuentemente atribuidas a la evaluacin,
las mismas no son excluyentes sino complementarias y
algunas se explican a travs de las ideas ms generalizadas que se tienen sobre la evaluacin y otras se relacionan directamente con un concepto ms completo y
complejo de estos procesos.
funcin simblica: los procesos de evaluacin
transmiten la idea de finalizacin de una etapa o
ciclo; se asocia con frecuencia la evaluacin con la
conclusin de un proceso, an cuando no sea este el
propsito y la ubicacin de las acciones evaluativas
cabe tener presente que para los actores participantes en alguna de las instancias del proceso, ste adquiere esta funcin simblica.
funcin poltica: tal como se sealara en el apartado anterior una de las funciones ms importantes
de la evaluacin es su carcter instrumental central
como soporte para los procesos de toma de decisiones. Esta funcin es claramente poltica ya que la
evaluacin adquiere un rol sustantivo como retroalimentacin de los procesos de planificacin y la toma
de decisiones sobre la ejecucin y el desempeo de
los programas y proyectos.
funcin de conocimiento: en la definicin misma
de evaluacin y en la descripcin de sus componentes se identifica como central el rol de la evaluacin
en tanto herramienta que permite ampliar la comprensin de los procesos complejos; en este sentido
la bsqueda de indicios en forma sistemtica implica
necesariamente el incremento en el conocimiento y
la comprensin de los objetos de evaluacin.
funcin de mejoramiento: en forma complementaria con la funcin de conocimiento y la identificada
como funcin poltica, esta funcin destaca el aspecto instrumental de la evaluacin en tanto permite
orientar la toma de decisiones hacia la mejora de
los procesos o fenmenos objeto de evaluacin. En
la medida que se posibilita una mayor compresin
de los componentes presentes es factible dirigir las
acciones hacia el mejoramiento en trminos de efectividad, eficiencia, eficacia, pertinencia y/o viabilidad
de las acciones propuestas.
funcin de desarrollo de capacidades: con carcter secundario, ya que no forma parte de los objetivos
centrales de cualquier accin evaluativa, los procesos
de evaluacin a travs de sus exigencias tcnicas y
metodolgicas desempean una importante funcin
en trminos de promover el desarrollo de competencias muy valiosas. Si se aprovechan adecuadamente
las instancias de evaluacin, stas contribuyen a incrementar el desarrollo de dispositivos tcnicos institucionales valiosos y poco estimulados habitualmente. Estas competencias se refieren por ejemplo a la
prctica sistemtica de observaciones y mediciones,
de registro de informacin, de desarrollo de marcos
analticos e interpretativos de la informacin, de inclusin de la informacin en los procesos de gestin,
de desarrollo de instrumentos para la recoleccin de
informacin, etc.
b)Para qu se evala
La pregunta por la finalidad de la evaluacin constituye uno de los ejes centrales junto con la definicin
del objeto a ser evaluado. En trminos generales y en
funcin de las definiciones adoptadas permiten identificar algunas finalidades principales de todo proceso evaluativo: diagnstico, pronstico, seleccin y acreditacin
estas finalidades no necesariamente se plantean como
excluyentes pero s determinan opciones metodolgicas
diferenciales.
La finalidad de diagnstico enfatiza los componentes
vinculados con la produccin sistemtica de informacin
calificada con el objeto de orientar la toma de decisiones, la gestin.
La finalidad de pronstico enfatiza el valor predictivo que pueda tener la informacin que se produce, es
decir las acciones evaluativas persiguen como propsito
la produccin de informacin con alto potencial anticipatorio y explicativo sobre los fenmenos o procesos
objetos de evaluacin.
La finalidad de la seleccin pone el nfasis en la utilizacin que tiene la informacin producida por la evaluacin
con propsitos de seleccin, un ejemplo claro de esto son
los exmenes de ingreso a diferentes instituciones educativas cuyos aspirantes superan el nmero de vacantes
disponibles. En estas circunstancias se opta por alguna
estrategia de evaluacin que con frecuencia se justifica
adjudicndole un valor pronstico a estos resultados.
16
d) A modo de sntesis
Todo proceso de evaluacin exitoso debe observar algunos requerimientos indispensables o atender a cierto
conjunto de premisas.
En primera instancia debe entenderse que toda accin evaluativa es una forma particular de intervencin
en la realidad. Cualquiera que sea la/s estrategia/s metodolgica/s adoptada/s los objetos de evaluacin sufren
algn tipo de modificacin como consecuencia de esta
intervencin. Este es un elemento que debe tener presente el evaluador, por una parte para no producir interferencias en demasa en el desarrollo habitual de las
acciones y por la otra
Para ponderar este efecto en la eleccin de las estrategias metodolgicas por ejemplo y el balance
general de los resultados de la evaluacin.
En segunda instancia toda evaluacin, por su naturaleza, requiere de criterios establecidos respecto de los
cuales se formulen los juicios valorativos. Ya se seal
anteriormente que el componente valorativo es uno de
los elementos diferenciales de la evaluacin respecto de
cualquier otro tipo de indagacin y en este sentido la
formulacin, definicin o construccin de criterios resulta un requerimiento ineludible.
En tercer lugar y teniendo en cuenta lo sealado en
apartados anteriores, dado que toda accin evaluativa
se sustenta en la produccin de informacin y en la bsqueda de indicios sobre aquellos procesos o fenmenos
17
jvenes rinden anualmente las pruebas de lengua y matemtica, cuyos resultados no tienen incidencia en el
promedio final del alumno, aunque sirven para conocer el nivel de educacin que se imparte en las aulas.
Las pruebas nacieron con la intencin de promover un
certificado nacional de estudios bsicos y la pretensin
de que sus resultados influyeran en el acceso a la enseanza superior. Pero tales ideas han sido por ahora dejadas de lado y se deleg en cada jurisdiccin provincial
la decisin de que las notas de los alumnos figuren en el
boletn de calificaciones.
Mientras se conservan en forma muestral las evaluaciones en distintas etapas del nivel primario, los mayores esfuerzos se han concentrado en el desarrollo de las
pruebas de finalizacin del secundario.
Tambin los organismos internacionales, agrega Tiana, se sumaron a esta corriente y pusieron en marcha
programas vinculados con el desarrollo de las polticas
de evaluacin educativa. Ejemplo de ello son la Unesco,
la Unin Europea, la Organizacin para la Cooperacin
y el Desarrollo Econmico (OCDE) y la Organizacin de
Estados Iberoamericanos (OEI).
Creadas inicialmente para medir el desempeo de los
alumnos en lengua y matemtica, las pruebas de evaluacin se extendieron en los ltimos aos a otras reas
(fsica, qumica, historia, geografa, educacin cvica) y a
partir del ao 2000 se incorporaron tests internacionales, con pruebas reguladas por organizaciones de alcance mundial.
En consideracin de los especialistas, Chile cuenta
con uno de los sistemas de evaluacin ms amplios y
mejor administrados de Amrica latina. El informe de
Lawrence Wolf destaca haber demostrado el mayor
compromiso de largo plazo con el desarrollo de evaluaciones. El programa se inici en 1980 y desde 1988 se
denomina Sistema de Medicin de la Calidad de la Educacin. La herramienta sirvi para acompaar el plan de
reforma que promueve la descentralizacin.
De acuerdo con ese trabajo, Mxico es el pas latinoamericano con ms larga experiencia en las evaluaciones.
Pero se caracteriza por la renuencia de sus autoridades
a divulgar sus resultados. A la medicin de los conocimientos y habilidades de 2,8 millones de estudiantes,
acompaan una evaluacin sistemtica de la capacidad
de los profesores.
Brasil comenz a desarrollar en 1990 un sistema de
evaluacin nacional, pero slo a partir de 1995 comenz
a tomar muestras. Desde esa fecha se inici la evaluacin de la enseanza superior, el primero en su tipo en
la regin. El gobierno brasileo estimula a los Estados y
municipalidades a iniciar sus propias evaluaciones.
18
a) Laboratorio de la UNESCO
b) Para qu evaluar
En octubre de 2000, la Oficina Regional de Educacin de la UNESCO para Amrica Latina y el Caribe
(OREALC) difundi los resultados de un estudio internacional comparativo sobre lenguaje, matemtica y factores asociados, para alumnos de tercer y cuarto grado de
la educacin bsica. La investigacin fue realizada por
Muchos autores coinciden en que uno de los objetivos primordiales de la evaluacin educativa es informar
y orientar la toma de decisiones. Esa idea, que habla de
una utilizacin instrumental de los resultados, es el
concepto que predomin en las primeras etapas del desarrollo histrico de la evaluacin. El autor W. J. Pophan
recuerda que en los aos 70 exista la creencia dominante de que las evaluaciones educativas deban constituir
el elemento singular ms importante para la toma de
decisiones.
Hoy, sin embargo, se tiende a considerar que la relacin existente entre evaluacin y toma de decisiones es
ms compleja. La evaluacin es uno de los elementos
que contribuyen a la toma de decisiones. Pero no el nico, advierte Tiana en sus seminarios y conferencias.
Y explica que la concepcin puramente instrumental
de la evaluacin se fue debilitando con el tiempo y abri
paso a la concepcin conceptual o iluminativa, segn
la cual la evaluacin no tendra como funcin principal la de ofrecer elementos para la toma de decisiones:
tambin contribuira a mejorar el conocimiento de los
procesos educativos. En vez de pensar en un impacto
inmediato y directo, la concepcin iluminativa considera los efectos diferidos e indirectos de la evaluacin, en
plazos de tiempo ms largos que los habituales, explica
el especialista espaol.
Algunos autores aaden una tercera concepcin.
Rossi y Freeman (1993) hablan de una utilizacin persuasiva y sostienen que la evaluacin desempeara una
funcin eminentemente argumentativa al servicio del
discurso poltico, sea ste de gobierno o de oposicin.
Muchas veces se corre el riesgo de que los gobiernos de
turno hagan pblicas slo aquellas partes del informe
que tienen un carcter halagador, advierte el especialista Miguel ngel Santos, citado por Tiana en un documento sobre Tratamiento y usos de la informacin en
evaluacin.
19
funcin fundamentalmente informativa, si desean contar con una informacin exhaustiva sobre las competencias y conocimientos de los alumnos o si prefieren
producir informacin menos detallada, limitada a cada
establecimiento.
Ante la necesidad de capacitar cuadros tcnicos para
una experiencia novedosa como la evaluacin del sistema educativo y ante la escasa masa crtica existente
en la regin, en el informe se sugiere facilitar el contacto
con especialistas de la comunidad internacional.
Tambin se considera conveniente considerar las estrategias de uso y difusin de los resultados de las evaluaciones.
Sitiografa
www.iipe.unesco.org: Oficina Internacional de
Educacin de la UNESCO.
www.iipe-buenosaires.org.ar: Sitio del Instituto
Internacional de Planeamiento de la Educacin
(IIPE), centro de formacin e investigacin creado
por la UNESCO.
www.unesco.cl/home.htm: Oficina Regional
de Educacin de la UNESCO para Amrica Latina
y el Caribe (OREALC)
www.me.gov.ar: Sitio del Ministerio de Educacin de la Nacin.
www.oei.es: Organizacin de Estados Iberoamericanos (OEI).
www.preal.cl: Programa de Promocin de la
Reforma Educativa en Amrica Latina y el Caribe
(PERAL).
www.iea.nl/Home/home.html:
International
Association for Evaluation of the Educational
Achievement (IEA) y acceso a los sitios de los
programas TIMSS, PIRLS y Civics.
www.eclac.org: Comisin Econmica para
Amrica Latina y el Caribe (CEPAL).
Bibliografa
Cmo avanzar en la evaluacin de aprendizajes en Amrica Latina?, por Pedro Ravela (editor), Richard Wolfe, Gilbert Valverde y Juan Manuel Esquivel. Grupo de Trabajo sobre Estndares
y Evaluacin GRADE/PREAL. Marzo de 2000.
La educacin secundaria. Cambio o inmutabilidad?. Anlisis y debate de procesos europeos y latinoamericanos contemporneos. Org.
Cecilia Braslavasky. Santillana. Abril 2001.
20
21
OBJETIVOS Y CARACTERSTICAS
ONE
SERCE
PISA
El Estudio PISA - Programme for International Student Assessment (Programa para la Evaluacin Internacional de Estudiantes) es una evaluacin
estandarizada diseada y coordinada
por la OCDE (Organizacin para la
Cooperacin y el Desarrollo Econmico).
22
ONE
POBLACIN EVALUADA
SERCE
PISA
n
n
n
n
n
LOS INSTRUMENTOS
PASES Y JURISDICCIONES
CICLO DE EVALUACIN
ANEXO 1
ONE
Estructura y caractersticas de los instrumentos
Cuestionarios
de Contexto
Pruebas de
conocimiento
Tipo
Nombre
Cuadernillos
Forma de
administracin
Quin lo responde?
Alumnos de 3, 6, 2/3 y 5/6
Lengua
Del 1 al 3
Matemtica
Del 1 al 3
Ciencias Sociales
Del 1 al 3 4
Ciencias Naturales
Del 1 al 3 4
Del Alumno de 6
nico
Autoadministrada
Alumnos de 6
Del Alumno de 9
nico
Autoadministrada
Alumnos de 2/3
nico
Autoadministrada
Alumnos de 5/6
Del Director
de Primaria
nico
Autoadministrada
Del Director de
Secundaria
nico
Autoadministrada
Del Docente de 6
de Ciencias Naturales
nico
Autoadministrada
Sesin colectiva
23
24
SERCE
La siguiente Tabla resume la lista de instrumentos que se aplicaron en cada escuela:
Pruebas
de Logro
Tipo
Nombre
Cuadernillos
Cdigo
Forma de
Administracin
Quin lo responde?
Alumnos de 3 y 6
Lectura
Del 1 al 6
DL3 DL6
Escritura
Del 1 al 2
DE3 DE6
Matemtica
Del 1 al 6
DM3 DM6
Ciencias
Del 1 al 6
DC6
Alumnos de 6
Del alumno de 3
nico
QA3
Alumnos de 3
Del alumno de 6
nico
QA6
Alumnos de 6
Del docente
nico
QP
Autoadministrada
Docentes de lenguaje
y matemtica del aula
evaluada
De enseanza
Cinco
Autoadministrada
De la familia
nico
QF
Autoadministrada /
Entrevista
Padres o tutores de
los alumnos de 3 y 6
evaluados
Del directivo
nico
QD
Autoadministrada
Director o miembro
del equipo directivo
Ficha de
empadronamiento
nico
FE
Entrevista
Sesin colectiva
Alumnos de 3 y 6
Alumnos de 3 y 6
25
PISA
Estructura y caractersticas de los instrumentos
Los instrumentos son de dos tipos:
n
Pruebas de rendimiento
n
Cuestionarios de contexto
Escuelas
Estudiante
1 Cuadernillo de Prueba
1 Cuestionario para
el Estudiante
1 Cuestionario para
la Escuela
Lengua
Matemtica
Ciencias
Pruebas de rendimiento
Las pruebas de rendimiento se construyen a partir
de los textos, ejercicios y preguntas aportadas por los
pases miembros de la OCDE, las que son revisadas y
seleccionadas por los rganos de la Agencia Evaluadora,
responsables del proyecto.
Las pruebas estn constituidas por tem de tres tipos:
Cuestionarios de contexto
En Argentina se aplican dos cuestionarios, uno dirigido al estudiante de 15 aos y otro al Establecimiento
Educativo, completado por el director del mismo.
PISA propone otros instrumentos de recoleccin de
datos, como ser: Cuestionario para padres y Cuestionario de Educacin Tecnolgica, que hasta el momento
Argentina no ha aplicado.
A travs de la recoleccin de datos adicionales sobre
los alumnos (actitudes y conductas) y el entorno educativo (condiciones de enseanza y de aprendizaje) PISA
2006 puede identificar factores sociales, culturales, econmicos y educativos que se cruzan con el desempeo
de los alumnos.
27
El desarrollo de polticas
nacionales de evaluacin
Las reformas de los aos 90 afectaron a diversos
aspectos de la realidad educativa, que conviene detallar.
Entre las orientaciones adoptadas por dichos procesos
de reforma, y aun sin nimo de exhaustividad, pueden
distinguirse varias lneas de actuacin que, si bien no se
dieron siempre de manera simultnea, estuvieron presentes de uno u otro modo en las diversas iniciativas
nacionales:
n
28
Ayudar a las escuelas y a los profesores a mejorar la calidad de la educacin que imparten,
proporcionndoles una informacin relevante y
significativa que les permita valorar su situacin
real y sus logros.
Conocer y valorar en qu medida se estn alcanzando los objetivos educativos o los estndares propuestos para los distintos niveles o
Forzar a las instituciones escolares y a los agentes educativos a generar dinmicas de cambio,
por medio de la comparacin o la competencia.
Establecer sistemas de incentivos para las instituciones y para los profesionales de la educacin.
Conocer y valorar la situacin del sistema educativo, as como el impacto producido por las
polticas adoptadas.
Un segundo campo que tambin atrae considerable atencin se refiere al rendimiento que
logran las instituciones educativas. El inters
que ha generado la apertura de la caja negra
que constituyen las instituciones ha estimulado
el desarrollo de diversos programas orientados
a su evaluacin. Tanto las escuelas primarias y
secundarias como las universidades han sido el
objetivo prioritario de muchos planes de evaluacin y de acreditacin puestos en marcha en
diversos pases latinoamericanos. Esos planes de
evaluacin tienen caractersticas heterogneas,
pero suelen coincidir en conceder una atencin
especial a los resultados conseguidos por los
estudiantes, aunque sin dejar generalmente de
lado el anlisis de la organizacin y el funcionamiento de la institucin de que se trata.
Un tercer campo que ha ido desarrollndose recientemente, si bien con mayores dificultades
que los dos anteriores, es el relativo al desempeo profesional de los docentes. La conviccin
de que la actuacin de los profesores est en la
base de los resultados conseguidos por los estudiantes, aunque no sea su nico determinante, ha generado un conjunto de actuaciones de
diverso tipo, entre las que tambin se cuentan
algunos programas de evaluacin. Se trata de
acciones que no han dejado de generar cierta
polmica, tanto por sus caractersticas tcnicas
como por el tipo de uso que se hace de la informacin obtenida. En muchos casos, quizs en
la mayora, se ha optado por utilizar la evaluacin docente en el marco de planes de incentivos profesionales, eludiendo sus aspectos ms
punitivos, pero en otros casos la evaluacin se
ha utilizado como instrumento de seleccin o
de promocin profesional, o incluso se ha asociado con mejoras salariales o laborales.
29
Un cuarto campo que tambin ha atrado el inters de los sistemas de evaluacin se refiere al
impacto de las polticas educativas adoptadas.
En un contexto de reformas educativas, como
las impulsadas en la regin durante los 90, no
es extrao que se haya planteado abiertamente
la pregunta acerca de los efectos y el impacto
de los procesos de cambio iniciados y de las medidas adoptadas. Desde esta perspectiva, han
coexistido dos tendencias que deben diferenciarse, aunque ninguna de ellas haya llegado a
atraer tanta atencin como las arriba mencionadas. La primera se refiere a la evaluacin de los
programas ms emblemticos de los procesos
de reforma, los denominados programas estrella, aquellos en que las autoridades educativas
han realizado una mayor inversin y depositado
mayores esperanzas. La segunda se refiere a la
evaluacin de los propios procesos de reforma,
con la pretensin de establecer un mecanismo
de seguimiento sistemtico de sus efectos. Pese
a la limitada experiencia desarrollada en ambas
direcciones, no cabe duda de que se trata de un
campo llamado a experimentar un mayor desarrollo en el futuro prximo.
30
Un primer problema tiene que ver con el contenido de las pruebas, asunto que plantea dos tipos
de dificultades. La primera se refiere a la relacin
que debe existir entre las pruebas y los objetivos
educativos. Lo deseable es que las pruebas estn
referidas a los objetivos establecidos en el sistema educativo, de manera que permitan valorar
el grado en que se alcanzan las metas previstas. Aunque este planteamiento resulta lgico y
31
Otro grupo importante de problemas estn relacionados con la explicacin de los resultados conseguidos.
La mayora de los sistemas nacionales de evaluacin no
suelen contentarse con medir los logros alcanzados por
los estudiantes, sino que tambin pretenden explicar por
qu se producen tales resultados. Sin embargo, dicho
intento de explicacin tropieza con varios problemas y
dificultades:
n
32
No obstante, esa simultaneidad no ha asegurado siempre la existencia de una adecuada coherencia entre ambos aspectos. En los casos ms
extremos, puede incluso decirse que ambos
procesos se han desarrollado en direcciones divergentes. Cuanta ms importancia se ha concedido a las pruebas, mayor ha sido su impacto
sobre el desarrollo curricular.
Un segundo problema, menos complejo pero
no menos influyente, est relacionado con el
tipo de interpretacin que permiten los diversos modelos de pruebas. Como se sealaba
ms arriba, dos son los modelos de pruebas utilizados ms habitualmente: criteriales y normativas. Las pruebas de tipo criterial proporcionan
una base slida para valorar la suficiencia de los
logros conseguidos, ya que se apoyan en una
definicin operativa de los objetivos que deben
alcanzarse. Por el contrario, las pruebas de tipo
normativo exigen alguna operacin adicional
para poder valorar la suficiencia de los logros
alcanzados, dado que se refieren a situaciones
de normalidad estadstica. La existencia de estos dos modelos alternativos obliga a considerar cuidadosamente qu usos se quieren hacer
de las pruebas, antes de decidir el que conviene
aplicar.
Un tercer problema se refiere a las dificultades
conceptuales y tcnicas que se plantean a la
hora de buscar explicaciones. Por una parte,
hay que reconocer la debilidad terica de los
modelos habituales de produccin educativa,
que en buena parte deriva del problema que
plantea la causalidad en educacin. Esa debilidad influye en la seleccin de los factores
que se consideran asociados al rendimiento,
pocos de los cuales cuentan con confirmacin
emprica slida (Scheerens, 1996). Adems, la
explicacin de los resultados se ha basado tradicionalmente en la distincin de dos tipos de
variables, unas extrnsecas y otras intrnsecas.
Mientras que las primeras (nivel socioeconmico y cultural, recursos destinados a la educacin) han sido objeto de anlisis abundantes,
las segundas (organizacin del sistema educativo, procesos institucionales, procesos de aula)
vienen resultando menos concluyentes y an
requieren investigaciones adicionales.
Un cuarto problema tiene que ver con la voluntad que a veces existe de buscar muchas vas de
explicacin de los resultados obtenidos, que puede traducirse en un exceso de datos recogidos.
Cuando ese exceso de datos va unido, como ocurre en ocasiones, con una insuficiente delimitacin conceptual de las variables seleccionadas y
con limitaciones en el anlisis estadstico de los
datos, la situacin puede llegar a resultar inmanejable. La consecuencia suele ser una evidente
A la vista del anlisis que acaba de hacerse de las pruebas nacionales de logros, se llega a la conclusin de que
constituyen la prctica de evaluacin ms habitual en la regin, encontrndose bastante asentadas en la actualidad.
No obstante, como se ha puesto de manifiesto, presentan
algunas deficiencias y problemas que debern solventarse
en el futuro, si se quiere asegurar su credibilidad y se pretende que contribuyan a mejorar la educacin.
33
Bibliografa:
-
Gajardo, M. (1999): Reformas educativas en Amrica Latina. Balance de una dcada, Santiago de
Chile, PREAL (documento de trabajo n 15).
Scheerens, J. (1996): Can the School Effectiveness Knowledge Base Guide School Management? en II International Conference on School
Management. Participative Management and
School Evaluation, Bilbao, Universidad de Deusto,
pp. 98-119.
34
35
Presentacin
Este documento aborda la importancia, propsitos y
usos de las evaluaciones estandarizadas a gran escala de
aprendizajes y/o logros educativos en Amrica Latina y
el Caribe, bsicamente en los niveles primario y medio.
Est dirigido a quienes formulan polticas educativas, docentes, acadmicos, empresarios, sindicatos, organizaciones sociales, agencias de financiamiento y medios de
prensa, con el fin de aportar al debate y decisiones sobre
la evaluacin estandarizada en los sistemas educativos.
Se entiende por evaluacin estandarizada en gran
escala a aquella que permite producir informacin comparable acerca de los desempeos de estudiantes pertenecientes a distintos contextos culturales y regionales e,
incluso, a distintos pases, y que ofrece un panorama de
la situacin de un pas o de un estado o provincia, aun
cuando ello se haga a veces a travs de una muestra no
demasiado grande (por ejemplo, 5.000 estudiantes) .
El documento se centra en evaluaciones de aprendizaje definido como el cambio ocurrido en los conocimientos y capacidades de cada estudiante a lo largo del
ao lectivo y/o de logro educativo, entendido como la
acumulacin de conocimientos y capacidades a lo largo
de toda la vida del estudiante. No se pretende orientar
aqu acerca de otros aspectos tambin importantes de la
evaluacin del quehacer educativo, como son las evaluaciones del desempeo docente, de las polticas educativas, de los centros educativos o aquellas que realizan los
docentes en las aulas, entre otras. Tampoco se pretende
incursionar en la evaluacin en el nivel terciario ni en las
pruebas de seleccin para el mismo.
Los contenidos de esta publicacin ayudarn a quienes toman decisiones de poltica educativa a comprender y analizar las diversas opciones existentes en cuanto
a los propsitos y usos de los sistemas de evaluacin y
las implicancias de cada una de ellas, de modo de orientarlos en cmo concebir una estrategia de evaluacin.
Es preciso evitar el simplismo y la ingenuidad con
que muchos piensan en la evaluacin, lo que genera sistemas mal concebidos y deficientemente implementados
y, como consecuencia de ello, efectos perversos para el
sistema educativo, malgasto de recursos y descrdito
de la evaluacin externa entre los docentes. Por el contrario, se debe reconocer la gran variedad de aspectos
que deben considerarse al momento de implementar un
sistema de evaluacin o reformar uno existente. Para
que la inversin en evaluacin valga la pena, debe tener propsitos claros, una filosofa orientada a construir
una visin de responsabilidad compartida en relacin a
la educacin, un diseo tcnico de calidad y adecuado
36
La evaluacin estandarizada ayuda a visualizar los resultados educativos del conjunto de estudiantes
Las evaluaciones estandarizadas ayudan a hacer visibles un conjunto de aspectos centrales de la labor
educativa
Entre otras cosas, las evaluaciones estandarizadas
aportan informacin sobre:
en qu medida los alumnos estn aprendiendo lo
que se espera de ellos al finalizar ciertos grados o
niveles;
Un sistema de evaluacin de aprendizajes y/o logros educativos puede aportar informacin importante a diversos actores sociales
En la medida que el sistema produzca y comunique
adecuadamente informacin sobre los aspectos antes
indicados, puede ser un instrumento clave de mejora,
enriqueciendo la comprensin de la situacin educativa
y la toma de decisiones en diversos mbitos:
Las autoridades y los encargados de formular
polticas educativas pueden comprender mejor
los problemas de la enseanza y del aprendizaje;
hacerse cargo de las carencias en que se desarrolla la labor docente y desarrollar polticas pertinentes para apoyar el trabajo de las escuelas.
Las evaluaciones tambin les permiten valorar,
sobre una base de evidencia emprica slida, el
impacto de las polticas y programas que han
impulsado y los probables efectos de las que se
proponen impulsar.
Los directivos y docentes pueden, a partir de una
mirada externa sobre los logros educativos en el
conjunto del sistema, comprender mejor lo que
estn logrando y lo que no estn logrando sus
propios estudiantes, cmo estn aprendiendo y
qu dificultades tienen. Pueden aprender de las
experiencias de otros docentes y escuelas que
trabajan con estudiantes de caractersticas tanto
similares como diferentes a los propios. Pueden
tomar decisiones ms apropiadas acerca de qu
Para no confundir
37
38
Iberoamericano de PISA, integrado por Argentina, Brasil, Chile, Colombia, Espaa, Mxico, Portugal y Uruguay.
39
40
Ms graves an son aquellas situaciones en que evaluaciones tcnicamente malas son ampliamente difundidas o en que las evaluaciones son empleadas para fines
diferentes de aquellos para los cuales fueron concebidas
y diseadas, lo cual puede tener efectos dainos para el
sistema educativo. El razonamiento segn el cual lo que
importa es evaluar y difundir resultados como mecanismo de rendicin de cuentas, sin importar la calidad de
la evaluacin, es una falacia que puede hacer retroceder
los sistemas de evaluacin e imposibilitar una discusin
seria de las ventajas y desventajas de la rendicin de
cuentas o responsabilizacin por los resultados.
III. Los propsitos y los usos de los resultados de las evaluaciones estandarizadas
Sea en la implementacin de un sistema de evaluacin o en su reforma, es necesario considerar algunas
opciones bsicas de acuerdo a lo que se espera de l.
41
Establecer un perodo de transicin hacia estndares nicos y universalmente aplicables. Durante dicho perodo, el foco principal se centra en
la mejora o progreso de los estudiantes de cada
escuela respecto a su situacin anterior, y no nicamente en el cumplimiento del estndar absoluto de certificacin.
La peor respuesta que podra darse a este problema
sera establecer un porcentaje fijo de reprobacin, por
ejemplo, no debe reprobar ms del 10% de los estudiantes. Ello implica utilizar pruebas ms fciles y, por lo tanto, enviar a estudiantes, familias y educadores una seal
equivocada respecto a las expectativas de aprendizaje.
Para que los resultados de este tipo de evaluaciones tengan impacto sobre las polticas educativas, se debe invertir tiempo en el anlisis y discusin de los mismos por parte de diversas reas
del Ministerio de Educacin y otros actores relevantes, en la comprensin de los problemas y deficiencias que los resultados ponen de manifiesto y en la concepcin de acciones e inversiones
apropiadas para hacerles frente. Las autoridades
deben estar dispuestas a someter sus polticas y
decisiones al escrutinio de la ciudadana, para lo
cual es necesario tambin invertir en la comunicacin apropiada y permanente de los resultados
a la opinin pblica.
Para que los resultados tengan impacto sobre las
prcticas de enseanza, es imprescindible asimismo invertir tiempo en el anlisis e interpretacin
de sus implicancias didcticas: si los estudiantes
no son capaces de resolver cierto tipo de situaciones, qu es lo que se est haciendo de manera insuficiente o inapropiada en las aulas y qu
es lo que se debera hacer? Este tipo de anlisis
debe ser realizado tanto por especialistas en la
didctica de las reas evaluadas como por los
docentes, creando para este ltimo efecto espacios permanentes y sistemticos de formacin
en servicio y de trabajo colectivo al interior de
las escuelas. Es muy importante que los maestros puedan analizar la mayor cantidad posible
de tems para poder identificar cules revelan un
bloqueo importante para el desarrollo de nuevos
conceptos o capacidades. Sin embargo, siempre
ser necesario conservar el carcter confidencial
42
de una parte de los temes para poder realizar mediciones comparables en el tiempo.
Para que los resultados tengan impacto sobre la
motivacin de los estudiantes y sobre la actitud
de las familias hacia el aprendizaje escolar, es
necesario proveerles de informacin apropiada
y comprensible acerca de lo que se considera
imprescindible haber aprendido en cada grado
o nivel educativo y de las acciones que pueden
contribuir al logro de dichos aprendizajes.
Evaluar con una perspectiva amplia
Es muy importante que las pruebas no se limiten
a evaluar los conocimientos y competencias correspondientes a un nico grado (aquel en que se aplica
la evaluacin), sino que incluyan una perspectiva ms
amplia de niveles de desempeo desde ms bsicos a
ms complejos a lo largo de varios grados, de modo
de identificar qu han aprendido los estudiantes en grados anteriores y qu necesitan ahora. De este modo, los
docentes podrn constatar y subsanar las deficiencias
en los aprendizajes de cursos previos, que impiden a los
estudiantes continuar avanzando y los resultados sern
tiles no solo para los docentes del grado evaluado, sino
tambin para los de grados anteriores. El nfasis no estar
puesto en comunicar a los docentes que los estudiantes
aprueban o desaprueban, sino en comunicar que
estn en diferentes puntos de un continuo de aprendizaje, en el que todos pueden y necesitan progresar.
Las pruebas de tipo diagnstico pueden tener carcter muestral o censal, dependiendo de la estrategia de cambio educativo
El carcter censal o muestral tiene diversas implicancias, aunque tambin es posible combinar una aplicacin
por muestras controlada con una distribucin censal de
las pruebas para su aplicacin en forma autnoma por
parte de las escuelas, con fines formativos y de anlisis
de resultados e identificacin de estudiantes que necesitan apoyos complementarios.
Las pruebas a base de muestras sirven para tener
un diagnstico global del sistema. Requieren de
un cuidadoso diseo de la muestra, de modo de
obtener informacin representativa para los niveles de desagregacin en los que se desee actuar
y tomar decisiones (regional, provincial, municipal; urbano y rural; escuelas indgenas, etc.). El
impacto de los resultados de estas pruebas depende principalmente de las medidas de poltica
educativa que se tomen a nivel central y de una
estrategia de difusin apropiada que llegue a todas las escuelas.
Las pruebas censales sirven para obtener informacin de cada una de las escuelas e incluso de
los alumnos. El impacto de sus resultados depende de la devolucin de la informacin a cada
comunidad educativa, con un enfoque y un formato adecuados para promover una mayor participacin y compromiso a nivel local. La informacin tambin puede resultar muy til para dirigir
mejor las polticas hacia distritos o escuelas con
mayores problemas, ya que se puede contar con
un mapa de resultados de todas las escuelas,
zonas, provincias, tipos de escuela, etc.
Es inapropiado utilizar los resultados de las pruebas estandarizadas como indicador principal de la
calidad del trabajo del docente o de la escuela
Esto es importante, en particular si no se ha controlado el efecto de otros factores internos y externos al sistema educativo y si no se tiene en cuenta que el aprendizaje depende tambin de la motivacin y esfuerzo
personal del estudiante. Adems, dado que los resultados de pruebas estandarizadas no son el nico indicador
de la calidad de la educacin, es preciso considerarlos en
conjunto con otros aspectos relevantes como la retencin, la pertinencia y relevancia de lo que se ensea, la
formacin de valores y hbitos o la formacin ciudadana. Debe evitarse la identificacin del trmino calidad
con resultados de pruebas estandarizadas.
Para facilitar la comprensin y uso de los resultados, no basta con ofrecer resultados numricos
Es fundamental ilustrar a los distintos actores acerca
del tipo de tareas que los estudiantes debieron resolver en las pruebas. Este criterio debe combinarse adecuadamente con la necesidad de mantener el carcter
confidencial de un conjunto de preguntas que puedan
emplearse en futuras evaluaciones para establecer mediciones comparables en el tiempo. Si bien no se pretende que los docentes utilicen pruebas estandarizadas
43
Para que la comparacin entre los niveles de desempeo de los estudiantes sea apropiada, se deben considerar sus condiciones sociales de origen
Los resultados acadmicos de las escuelas deberan
poder compararse con los de escuelas de similar composicin social, dado que los retos y dificultades que implica ensear a estudiantes de origen desfavorecido (o de
lengua materna indgena) son muy diferentes que en el
caso de estudiantes de familias con educacin secundaria completa y/o terciaria. Tambin hay que tener en
cuenta las tasas de desercin de las escuelas y sus polticas de seleccin de estudiantes, dado que una escuela
puede mejorar sus resultados a travs de la exclusin de
estudiantes con dificultades.
44
Las comparaciones entre escuelas deben considerar la diferencia entre medir el logro educativo y
medir el aprendizaje
En rigor, si el propsito es entregar a las escuelas,
familias y/o autoridades, informacin acerca de la capacidad de ensear de los docentes y las escuelas, es
necesario medir el progreso de los estudiantes a lo largo
de un perodo lectivo (aprendizaje) y no nicamente
el resultado final (logro). Las diferencias entre estos
dos trminos se expresan en que:
El aprendizaje puede ser definido como el cambio ocurrido en los conocimientos y capacidades
de cada estudiante a lo largo del ao lectivo. Su
medicin requiere la aplicacin de dos pruebas,
una al inicio y otra al final. De este modo es posible constatar el progreso realizado por cada
alumno.
De acuerdo a los propsitos definidos, es necesario trabajar en forma censal o son suficientes
evaluaciones en base a muestras?
luacin no puede estar por encima de la educacin. El exceso de evaluaciones puede producir
perjuicios para la salud del sistema educativo,
en especial si solo hay evaluaciones pero no hay
polticas para dar respuesta a los problemas que
estas ponen de manifiesto.
No evaluars en vano. Se debe evitar recoger todos los aos informacin que nunca ser
analizada ni utilizada. Para que un sistema de
evaluacin tenga impacto, debe tener una periodicidad que garantice que los datos puedan
ser analizados, discutidos, comprendidos y utilizados. Incorporar la nueva informacin y traducirla en decisiones y acciones lleva tiempo. Los
cambios en el sistema educativo requieren ms
tiempo an.
Vsteme despacio, Sancho, que estoy apurado. Es muy importante que quienes toman
las decisiones en los Ministerios de Educacin
desestimen la creencia ingenua en la existencia
de caminos fciles y rpidos. No es posible montar un programa de evaluacin serio en tres meses. No existe coyuntura ni ventana de oportunidad que lo justifique: las consecuencias de la
improvisacin se harn sentir tarde o temprano.
La evaluacin requiere reflexin cuidadosa acerca de sus fines y usos; discusin pblica sobre
qu es lo fundamental a evaluar; dilogo e involucramiento de diferentes actores; conformacin
de equipos tcnicos competentes en diversos aspectos; e informacin previa para que los actores
se involucren con la evaluacin.
Elaborar un referente o marco conceptual que defina con precisin los conocimientos y desempeos
que son considerados apropiados al finalizar el
grado o ciclo educativo que ser evaluado
Si bien esta construccin exige antes que nada un
debate y decisiones de carcter poltico, las definiciones
tomadas en dicho terreno deben luego ser adecuadamente traducidas en especificaciones y estndares de
carcter tcnico. Asimismo, el debate poltico-educativo
debe estar alimentado por informacin sobre los avances conceptuales recientes en cuanto a la enseanza y
a los desempeos de los estudiantes en las disciplinas
consideradas.
45
Conformar las pruebas a partir de la apropiada integracin de las actividades en bloques y cuadernillos
Este es un desafo tcnico importante y complejo,
que requiere de conocimientos especializados y experiencia. Especial atencin debe otorgarse a la decisin
de utilizar la Teora Clsica o la Teora de la Respuesta
al tem para la construccin y el anlisis de las pruebas, lo cual requiere de programas de procesamiento
modernos, analistas bien entrenados, anlisis rigurosos
y asesoramiento de alto nivel.
Definir los puntos de corte que establecen los lmites entre niveles de desempeo en una prueba
Vinculado con esto, se debe definir la metodologa a
seguir para establecer cul de los niveles debe ser considerado como aceptable para un estudiante al finalizar el
grado o ciclo educativo evaluado. Un rendimiento aceptable no puede ser establecido automticamente como
equivalente al 51% o ms del mximo posible en una
prueba.
46
Construir datos longitudinales que permitan apreciar la evolucin en el tiempo de los aprendizajes
de un mismo conjunto de estudiantes
Este tipo de datos, que exigen ms de una medicin
en el tiempo, es el que evala el aprendizaje entendido como cambio y el que mejor permite establecer cules son los procesos propiamente escolares que tienen
influencia sobre el mismo. Este enfoque es el que permitira obtener informacin ms relevante para la poltica
educativa y para la investigacin.
Establecer mecanismos de control del cumplimiento de las condiciones estandarizadas que deben regir durante la aplicacin de las pruebas
El cumplimiento de las condiciones de aplicacin de
las pruebas involucra aspectos tcnicos complejos y muchas veces descuidados. Sin embargo, son fundamentales para que la informacin sea confiable y comparable.
Esto apunta a temas como:
La necesaria transparencia
Sobre todos los procesos tcnicos debe existir informacin transparente y accesible. Es necesario dar un especial nfasis a la documentacin de los procedimientos
tcnicos seguidos en:
La construccin de los instrumentos.
La estimacin de la precisin de las mediciones (y,
por consiguiente, su margen de error).
El diseo de las muestras y la cobertura alcanzada.
La aplicacin y control de calidad de la misma.
La definicin de niveles de desempeo y puntos
de corte.
La equiparacin y comparabilidad de los resultados con mediciones anteriores.
Este periodo es necesario para llevar adelante los siguientes procesos fundamentales:
Las Unidades de Evaluacin necesitan tener una cierta estabilidad en el tiempo de sus elencos tcnicos
El desarrollo de un sistema de evaluacin requiere de
una planificacin a 10 15 aos. Si los equipos tcnicos
cambian con frecuencia, se desperdicia el conocimiento
y la experiencia acumulada en un rea compleja y se
desacreditan los procesos de evaluacin ante la sociedad
y los educadores.
Las Unidades de Evaluacin necesitan tener independencia para reportar los resultados de su trabajo
Al igual que en el caso de las Unidades de Estadsticas sociales y econmicas, las unidades que realizan las
acciones de evaluacin y la divulgacin de los correspondientes resultados no deben depender de los tiempos
e intereses poltico- partidarios. Se ha discutido mucho
respecto a si las Unidades de Evaluacin deberan estar
dentro o fuera de los Ministerios de Educacin. El argumento principal para esta ltima opcin es justamente la
necesaria independencia y transparencia. Sin embargo,
la experiencia en la regin muestra casos de pases con
unidades estables e independientes dentro de los Ministerios de Educacin y otros con unidades inestables que
no han logrado consolidar su trabajo aun estando en una
institucin externa. La respuesta a esta disyuntiva es que
no importa tanto el lugar institucional como la cultura
de continuidad y transparencia que se cree en torno a la
evaluacin. Esto se logra cuando existe un mandato claro y una institucionalidad slida en relacin a la evaluacin, lo cual implica algn tipo de estatuto jurdico para
el sistema de evaluacin. Establecer esto por ley es uno
de los caminos a considerar, dado que exige un acuerdo
amplio, en lo posible suprapartidario, que permita establecer un plan de evaluacin de la educacin de largo
plazo. En este terreno, al igual que en el econmico, se
requiere de cierta estabilidad en las reglas de juego. Si
la poltica de evaluacin cambia permanentemente, se
genera desconfianza y se pierde credibilidad.
47
48
consecuencias, los aspectos a evaluar, las reas y los grados, y la periodicidad de las evaluaciones, entre otras
cosas. Todo ello exige tiempo, por lo que no es conveniente pretender la implementacin de sistemas de evaluacin en plazos reducidos.
7. Un buen sistema de evaluacin requiere inversin, principalmente en la conformacin de equipos
humanos calificados, as como recursos econmicos suficientes para una adecuada implementacin de todos
los procesos implicados.
8. El sistema de evaluacin debe sustentarse en
una actitud firme de transparencia en relacin a los
resultados y de rendicin de cuentas a la sociedad.
9. Los ministerios de educacin deben asumir
un compromiso serio y consistente con los resultados de la evaluacin, lo cual implica promover el dilogo acerca de los problemas detectados y los modos de
enfrentarlos, disear lneas de accin apropiadas para
resolver los problemas e invertir los recursos necesarios
para llevarlas adelante.
10. Los sistemas de evaluacin deben ser objeto
de evaluacin peridica, con el fin de analizar la calidad tcnica de la informacin que producen y su relevancia para diversos actores educativos y sociales.
49
Introduccin
Las preguntas sugeridas como punto de partida para
la reflexin de esta mesa fueron tres: Qu estamos evaluando? Qu de lo evaluado resulta significativo? Por
qu las reformas educativas realizadas a lo largo de la
dcada del 90 no se ven traducidas en los resultados de
las evaluaciones?
Para aventurar la respuesta que considero debe darse a esas tres preguntas considero necesario presentar
antes la que considero apropiada para una pregunta
ms: qu deberamos evaluar de modo que la evaluacin sirva para mejorar la calidad educativa?
Organizar mi presentacin, pues, en cuatro apartados, cada uno de los cuales pretende responder una de
las cuatro preguntas mencionadas.
Logra que la ms alta proporcin posible de destinatarios acceda a la escuela, que permanezca
en ella hasta el final del trayecto previsto y que
egrese alcanzando los objetivos de aprendizaje
establecidos. Esta dimensin incluye, pues, la
cobertura y la eficiencia terminal, as como el
nivel de aprendizaje, y en trminos sistmicos
coincide con la eficacia interna del sistema.
50
Cuenta, para lograr lo anterior, con recursos humanos y materiales suficientes, y los aprovecha
de la mejor manera posible, evitando despilfarros y derroches. Es fcil apreciar que esta es la
dimensin eficiencia del sistema.
Tiene en cuenta la desigual situacin de alumnos y familias, de las comunidades en que viven
y las escuelas mismas, y ofrece apoyos especiales a quienes lo requieren, para que los objetivos educativos sean alcanzados por el mayor
nmero posible. Esta ltima dimensin es la de
equidad.
el educativo, en cada uno de los cuales hay una problemtica especfica, y oportunidades particulares de
intervencin: el aula, la escuela singular, la zona o distrito escolar, el municipio, la regin, provincia o entidad
federativa, y el pas.
Una buena evaluacin, adems, deber caracterizarse por las cualidades tcnicas de cualquier medicin
buena, que se resumen en la validez y la confiabilidad,
en sus diversas facetas: que se mida realmente lo que se
pretende medir, y que se haga de manera que los resultados sean comparables en el espacio y en el tiempo.
Subrayo que la evaluacin no puede reducirse a la
aplicacin de pruebas de aprendizaje. Estas son, sin
duda, necesarias para la medicin de los resultados de
la enseanza, pero la valoracin de otros aspectos implica la construccin de indicadores con otro tipo de datos,
tomados de otras fuentes, como los sistemas de informacin estadstica o estudios ad hoc.
Es claro que esta es una visin ideal, que en sentido
estricto es imposible llevar a la prctica, pues exigira
una cantidad de trabajo y un volumen de recursos enorme para recolectar la informacin necesaria.
Pero si no se tiene este punto de referencia es fcil
caer en el error opuesto, que en la realidad se ha dado
en muchos lugares: el de reducir el sistema de evaluacin a los elementos ms fcilmente disponibles, con lo
que slo se dispone de datos gruesos y burdos sobre el
nmero de alumnos inscritos en el sistema al inicio y al
fin de un ciclo, el de maestros y escuelas, el presupuesto
asignado a las escuelas y poco ms.
Por ello creo que es importante manejar una visin
ideal de lo que debera ser la evaluacin como referente
para el desarrollo de un sistema concreto; con tal punto
de referencia, y con ayuda de las metodologas de investigacin y evaluacin educativa desarrolladas en las
ltimas dcadas, es factible disear sistemas mucho ms
finos que los habituales, con requerimientos de recursos
al alcance de los sistemas educativos reales.
No est de ms precisar que diversos tipos de evaluacin son competencia de diversas instancias. En particular conviene distinguir la evaluacin de individuos de
la de los sistemas como tales. La evaluacin de los alumnos en lo individual, por ejemplo, es y sin duda seguir
correspondiendo a los maestros y las escuelas en que
estn los alumnos; la evaluacin de los maestros en lo
individual corresponde y corresponder seguramente a
los directores y supervisores.
La evaluacin a la que me refiero en este escrito es,
precisamente, la del sistema educativo en cuanto tal.
Se trata, pues, de una evaluacin de nivel macro, que
no sustituye a las evaluaciones individuales, sino que
las complementa, iluminando un ngulo diferente de la
realidad educativa.
Tras lo anterior, las respuestas a las siguientes preguntas sern ms breves.
Qu estamos evaluando?
Resumo mi respuesta, en forma algo simplista y cruda, diciendo que evaluamos algunas de las dimensiones
de la calidad educativa, pero dejando fuera varias de las
ms importantes, que lo hacemos de manera imprecisa,
y que no llegamos a las causas.
Hasta hace muy pocos aos, la situacin de la mayor
parte de los sistemas de evaluacin educativa de los pases de la regin era justamente la que se ha mencionado
antes: solamente se contaba con datos sobre alumnos,
maestros, escuelas y presupuestos, con lo que se podan
estimar indicadores de cobertura, eficiencia terminal y
costo alumno en forma gruesa, ya que por lo general no
se controlaba la calidad de los procesos de recoleccin
de informacin, no se manejaban datos por edad, con
lo que slo podan construirse tasas brutas y no netas y
se manejaban slo cohortes aparentes.
Los esfuerzos que han hecho muchos de nuestros
pases en la ltima dcada han incluido, por una parte,
mejoras en los sistemas de informacin y, por otra, el
desarrollo de sistemas de pruebas nacionales para valorar los aprendizajes de los alumnos. Estos esfuerzos son
importantes, sin duda, pero an estn por consolidarse
y adolecen de fallas claras, explicables por la falta de
una tradicin en el campo y la consecuente escasez de
recursos humanos especializados.
Pecando tal vez de simplismo, creo que en la regin
atendemos la cobertura y la eficiencia terminal en forma
imperfecta y el nivel de aprendizaje de los alumnos en
reas curriculares y grados clave, pero por lo general limitndose a niveles cognitivos bajos. La contraparte obvia, lo que no estamos evaluando, incluye reas curriculares adicionales, niveles cognitivos superiores, aspectos
actitudinales y valorales, procesos tanto pedaggicos
como de gestin y lo relativo a equidad.
En las escuelas se evalan muchas de estas cosas,
desde luego, pero no parece haber procedimientos para
valorar tales dimensiones o aspectos de la calidad de
manera permanente y sistemtica en el nivel nacional.
Debe aadirse que muchas veces las evaluaciones que
hacemos no tienen, en un grado suficiente, las caractersticas tcnicas mencionadas de validez y confiabilidad.
Por lo que se refiere a validez, la ausencia de controles de las variables relevantes del contexto puede hacer
que midamos en realidad pobreza, cuando creemos medir calidad de las escuelas. En este sentido en la regin
es muy raro todava el uso de las poderosas tcnicas actuales, como los modelos jerrquicos lineales, que permiten identificar la influencia de los factores del entorno
distinguindolos, por ejemplo, de los de la escuela, el
aula y el propio alumno.
En cuanto a confiabilidad, es tambin raro el uso de
metodologas psicomtricas avanzadas, como los modelos de la teora de la respuesta al reactivo, que permiten
contar con escalas ms precisas, comparables en el tiempo, que cuidan la unidimensionalidad y evitan el sesgo
de manera ms adecuada que las tcnicas de la teora
clsica de las pruebas. Debe aadirse que, hasta hace
poco tiempo, no era raro que se manejaran pruebas que
51
Qu de lo evaluado
resulta significativo?
En principio los mecanismos de evaluacin existentes
son todos significativos y, aun en ausencia de los que
se sugiere aadir, contienen potencialmente elementos
tiles para el mejoramiento de los sistemas educativos.
Sin embargo, es frecuente que an esos elementos se
desaprovechen y slo sirvan para acumular datos en
anuarios estadsticos destinados a empolvarse en los estantes, sin que los responsables de tomar decisiones, y
mucho menos los maestros, los conozcan y utilicen para
retroalimentar su quehacer.
Esto quiere decir que, adems de mejorar los actuales mecanismos de evaluacin y de enriquecerlos con
nuevos elementos, es necesario un importante esfuerzo de difusin de resultados y de capacitacin de los
usuarios para que estn en condiciones de entender y
aprovechar los resultados de las evaluaciones.
52
Conclusin
La ltima pregunta es, a mi juicio, la ms importante
de las cuatro que he tratado de responder, tanto por lo
que expresamente plantea, como por lo que sugiere de
manera implcita.
53
Segunda Parte.
a) Introduccin
Contar con estrategias para mejorar la calidad de la
educacin implica, entre otros requisitos, disponer de un
sistema de evaluacin que haga explcito su marco de
referencia y que permita conocer qu estn aprendiendo
los estudiantes.
Todo tipo de evaluacin -y en especial las educativas, exige modelos tericos precisos que la justifiquen y la
respalden. De este modo, la evaluacin resulta sostenida por nexos conceptuales slidamente relacionados,
que permiten entrelazar los distintos pasos del proceso involucrado, desde la delimitacin del objetivo de la
evaluacin a la posterior interpretacin de los hallazgos.
La seleccin de la metodologa a llevar a cabo -que incluye de modo fundamental el tipo de diseo de los instrumentos, el proceso de implementacin y el anlisis
posterior de los datos-, debe ser consecuente con este
marco general.
Existen diferentes enfoques para la elaboracin de
pruebas que tienen como objetivo la evaluacin de
aprendizajes y existen tambin distintas teoras que sustentan su medicin, as como diversos diseos entre los
cuales optar para construir las pruebas de evaluacin.
Los siguientes apartados tienen como objetivo presentar, sintticamente, el enfoque, la teora de la medicin
y el diseo, adoptados como marco de referencia del
Operativo Nacional de Evaluacin (ONE) 2009.
54
y los procesos cognitivos involucrados en los distintos niveles educativos-, constituyen la referencia de los
criterios adoptados.
Resumiendo, tanto la elaboracin de instrumentos
como la interpretacin de los resultados referida a criterios, es, sin duda, la ms adecuada en el mbito educativo, ya que es el enfoque ms congruente con los propsitos de las evaluaciones que se realizan en esta rea.
Consecuentemente, a partir de 2005, se ha seleccionado este enfoque de la medicin como marco de las
evaluaciones llevadas a cabo a travs de los Operativos
Nacionales de Evaluacin (ONE), ya que permite determinar si los alumnos han logrado un nivel predeterminado,
a partir de un criterio prefijado, en una disciplina dada.
Los instrumentos derivados de este tipo de enfoque
requieren descripciones detalladas de lo que miden, con
el fin de brindar informacin precisa sobre los logros respecto de un estndar. En la escuela y ms all de ella, la
informacin provista por instrumentos elaborados con
este enfoque resulta til, en principio, a maestros que
desean mejorar sus prcticas instruccin, a directores e
inspectores que necesiten apoyar a los profesores y a los
diseadores tanto de polticas para mejorar las escuelas,
como a los diseadores de currculum y de textos que
requieran verificar la efectividad de ambos, curriculum
y textos.
Desde el punto de vista de las distintas fases de
construccin de una prueba basada en este enfoque,
la primera y fundamental, es aquella que tiene como
objetivo explicitar el criterio lgico de seleccin de los
tems, teniendo en cuenta que el ms adecuado ser
aquel que permita separar mejor a los examinados de
acuerdo con sus niveles de desempeo en los distintos
dominios. Es digno de subrayar que los criterios deben
ser definidos a priori, y que estas definiciones son las
que permitirn el cierre del proceso de evaluacin, al
permitir la interpretacin de los resultados de los estudiantes examinados en trminos de logros del dominio
o la aptitud en cuestin.
55
56
De esta manera, las pruebas construidas con este diseo permiten evaluar un amplio rango de contenidos
curriculares distribuyendo los contenidos de un dominio
de contenido en distintas pruebas, aunque cada estudiante en particular resuelve cuestiones relacionadas
con una parte del dominio (cada uno de formatos o modelos de la prueba, que se aplica a cada estudiante est
conformado por dos bloques).
Cada bloque de tems cerrados est conformado por
15 tems. Los 8 bloques de tems cerrados se distribuyen
en forma de espiral a razn de dos por cuadernillo. De
este modo resultan 8 Cuadernillos o Modelos de tems
cerrados y 4 Cuadernillos o Modelos de tems abiertos.
Cada cuadernillo de administracin, compuesto por
tems cerrados, consta, entonces, de dos de los bloques,
que van alternando su posicin a lo largo de distintos
cuadernillos de tal forma que el que se aplic en la primera posicin aparezca en otro ocupando la segunda y
viceversa, como se ejemplifica en la siguiente tabla.
Nombre del
bloque en 1
posicin
Nombre del
cuadernillo
PM3C1
Nombre del
bloque en 2
posicin
M3_1
M3_2
PM3C2
M3_3
M3_4
PM3C3
M3_5
M3_6
PM3C4
M3_7
M3_8
PM3C5
M3_2
M3_3
PM3C6
M3_4
M3_5
PM3C7
M3_6
M3_7
PM3C8
M3_8
M3_1
Tipo de
tem
Cantidad
de tems
Cantidad
de bloques
(15 tems)
Cantidad
de Cuadernillos
Abiertos
---
Cerrados
120
57
58
Curva caracterstica del tem: viene determinada por la funcin matemtica entre el nivel
de habilidad o rasgo latente medido y la probabilidad de responder correctamente al tem.
No obstante, a pesar de la aparente novedad del trmino en un momento en que la evaluacin estaba dominada por el paradigma de las diferencias individuales,
lo que representan las PRC y su finalidad ya haba sido
puesto de relieve muchos aos antes. En 1913, Thorndike estableci una distincin similar a la de Glaser, que
fue totalmente olvidada por el desarrollo de la psicometra clsica, especialmente en el intervalo comprendido
entre las dos guerras mundiales.
En los aos sesenta empiezan a comprobarse los resultados de la enseanza programada y de otros programas de intervencin y se vio que para su evaluacin
era preciso un diagnstico previo de los sujetos antes
de la intervencin, en trminos de lo que eran capaces
de hacer. Las pruebas tradicionales con su nfasis interpretativo en el rendimiento del grupo normativo, no
servan para esta finalidad ya que no proporcionaban la
informacin necesaria sobre el rendimiento del sujeto.
Con raras excepciones, como las que representan los
trabajos de Hively (1968), Osburn (1968) y Popham y
Husek (1969), puede decirse que no fue hasta el comienzo de los aos setenta cuando comenz a trabajarse de forma sistemtica sobre este tipo de pruebas.
59
60
En cuanto a la construccin de la prueba, ambos tipos establecen los elementos en trminos de las
conductas o rendimientos que el sujeto exhibe en algn momento determinado. En ambos casos se pone
el acento en que las respuestas a valorar sean pblicas,
estandarizadas y fcilmente objetivables. En las PRN raramente se determina un dominio inicial de elementos,
considerando nicamente la teora del rasgo en la que
se basa el autor de la prueba, para determinar la calidad
de los tems. En las PRC la determinacin del dominio
de contenido o especificaciones de contenido es central
para la construccin de la prueba.
En cuanto a la seleccin de los tems, las propiedades psicomtricas consideradas para su inclusin en la
prueba son diferentes. En las PRN el objetivo es maximizar las diferencias individuales, lo que lleva a la inclusin
de un gran nmero de tem de dificultad media para
aumentar el poder discriminativo de la prueba, (para
poner de relieve las diferencias individuales, debe maximizarse la varianza de la prueba, seleccionando tem de
dificultad media y alto poder discriminativo). En las PRC
son los objetivos de la prueba los que marcan la norma
para la inclusin de los tems, as como el propsito y
la finalidad del mismo. Por ejemplo, cuando se trata de
pruebas de apto vs. no apto para la evaluacin de
los rendimientos en un programa particular, suelen incluirse elementos fciles, respondidos por el 70 u 80%
de los sujetos.
Por ltimo, otra de las diferencias se encuentra en
los significados de la puntuacin, en una PRN las respuestas son consideradas como signos del rasgo latente que se pretende medir con la prueba. En las PRC la
respuesta se considera un estimador de la conducta del
dominio (Marines Arias, Rosario 1995).
Cmo se realiza
el anlisis de los tems?
El aspecto ms crtico en la construccin de un PRC
despus de la especificacin del contenido y de los objetivos es la generacin de tem12 que se conformen a las
especificaciones del contenido y a los objetivos.
n
Anlisis estadstico de los tems: los datos obtenidos en el estudio piloto pueden utilizarse
para evaluar la eficacia de los tems en trminos
de si funcionan o no en la forma en que estaba
previsto.
Los pasos en este proceso son: seleccionar grupos criterios (se refiere a la seleccin de los estudiantes a los que se les aplicar la prueba);
calcular los estadsticos del tem (se refiere a
el ndice de dificultad, es la proporcin o el
porcentaje de personas que contestan correctamente el tem y el ndice de discriminacin,
mide los cambios en el rendimiento o las diferencias relacionadas con la instruccin); y realizar un anlisis del posible sesgo de los tem
(sern eliminados todos aquellos tem que usen
un lenguaje sesgado referido al gnero, minora
tnica o subgrupo particular).
Cmo
se establecen
los estndares o puntos de corte?
Finalmente, una de las principales funciones de las
pruebas es proporcionar datos para la toma de decisiones, especialmente cuando se utilizan TRC. En estas
situaciones suele ser necesario establecer un punto de
corte para decidir acerca del rendimiento del sujeto en
la prueba. La prctica de obtener los puntos de corte
para determinar las capacidades mnimas se conoce en
la evaluacin educativa con el nombre de fijacin de estndares. El estndar es un punto en la escala de las
puntuaciones de la prueba que sirve para clasificar a los
sujetos en dos categoras que reflejan diferentes niveles
de capacidad, con relacin a un dominio. Es frecuente
que estas categoras se expresen en trminos de apto
o no apto, pasa o falla. Shepard (1984) considera que es el taln de Aquiles de los TRC.
El tema es tan importante que fue origen de un gran
debate durante los aos setenta, de tal forma que la
revista Journal of Educational Measurement dedic
un nmero monogrfico a esta cuestin en 1978. Glass
realiz una revisin exhaustiva sobre los estndares y
puntos de corte de la que concluye que todos los procedimientos son arbitrarios o que estn basados en premisas arbitrarias (Martnez Arias, Rosario, 1995).
Clasificacin de procedimientos
Ante la multiplicidad de mtodos, fue necesario establecer algunos esquemas de clasificacin. Meskauskas
(1976) propuso dividirlos en modelos de estado y
modelos continuos, siendo los modelos de estado los
que asumen que la capacidad es binaria, ya que el sujeto
domina el tema o no lo domina; los modelos continuos
asumen que el rasgo o constructo evaluado es continuo
y que el papel de los mtodos consiste en determinar
el nivel del rasgo que determina un rendimiento competente.
Se han propuesto muchos modelos de estado, pero
apenas se han usado en las aplicaciones prcticas, dominando este mbito los modelos continuos. Hambleton y
Eignor (1980) Hambleton y Rogers (1990) hacen una clasificacin de stos en tres tipos denominados modelos
empricos, modelos de juicios y modelos combinados.
Jaeger (1989) considera que en todos est implcito el
juicio y prefiere clasificarlos en modelos centrados en
la prueba y modelos centrados en el rendimiento de
los sujetos.
61
3) Mtodos basados en los errores en las decisiones: Van der Linden (1980) no es una tcnica para establecer estndares, sino una tcnica para minimizar las
consecuencias de los errores de medida y de muestreo.
Son modelos continuos que asumen una variable latente
continua con un estndar predeterminado.
62
63
Anexos
Anexo 1
6 / Revisar la prueba.
Usar los resultados de 5- c. para la revisin.
7 / Preparar la forma definitiva de la prueba.
a) Determinar la longitud de la prueba, nmero de
formas necesarias y nmero de tem por objetivo.
b) Seleccionar tem del conjunto analizado.
c) Preparar instrucciones, ejemplos, cuadernillos, hojas de respuestas, claves de correccin, etc.
d) Especificar posibles modificaciones a las instrucciones, tiempo para alumnos con necesidades especiales, etc.
8 / Establecimiento de un estndar o punto
de corte.
a) Determinar si es necesario establecer un estndar
de rendimiento, si no lo es, pasar a 9.
b) Establecer el o los estndares, si habr ms de dos
categoras.
c) Especificar modificaciones a los estndares para
posibles casos especiales.
d) Especificar interpretaciones alternativas de las
puntuaciones de la prueba para los casos de c.
9 / Aplicacin en forma piloto de la prueba
definitiva.
a) Disear la aplicacin de la prueba para recoger datos acerca de la fiabilidad y validez.
b) Aplicar la prueba a muestras representativas de
alumnos.
c) Evaluacin del procedimiento de administracin,
tem, fiabilidad y validez.
d) Hacer las revisiones finales a partir de los datos
anteriores.
10 / Preparacin del manual de instrucciones.
a) Manual para los aplicadores de la prueba.
b) Manual tcnico.
11 / Recogida de datos adicional para el anlisis
sobre fiabilidad y validez.
64
BIBLIOGRAFA
Nunnally, Jum C. y Bernstein, Ira J. Teora Psicomtrica. McGraw-Hill/Interamericana de Mxico, 1995.
IIPE UNESCO. Evaluar las evaluaciones. Una mirada poltica acerca de las evaluaciones de la calidad
educativa. Argentina, 2003.
65
Anexo 2
Como parte de las acciones de evaluacin, se elaboran pruebas que evalan el dominio de contenidos y capacidades a fin de relevar informacin sobre el nivel de
logros y dificultades de los alumnos de un determinado
ao en distintas reas de conocimiento.
Las pruebas estn conformadas por un conjunto de
ejercicios cerrados, de respuesta fija de seleccin mltiple y por ejercicios de respuesta abierta, de desarrollo.
Cada ejercicio de seleccin mltiple est constituido por
un cuerpo y cuatro distractores. Slo uno de ellos constituye la respuesta correcta.
Los ejercicios se disean, seleccionan y organizan
de acuerdo con los contenidos y capacidades establecidos en las tablas de especificaciones (PASO 1 DEL
GRFICO 1).
Una de las formas usuales de las tablas de especifi-
66
CONTENIDOS
Y CAPACIDADES
CONdiciones
CRITERIOS
CRITERIOS
DE CALIDAD
PSICOMTRICA
67
A partir del anlisis de los logros y de los errores cometidos con mayor frecuencia en los ejercicios, se plantean recomendaciones metodolgicas para la enseanza que pueden ayudar a superar estas dificultades
(PASO 9 Y 10 DEL GRFICO I), que son enviadas a
todas las escuelas, jurisdicciones y organismos e instituciones pblicas y privadas, as como a la prensa para su
difusin (PASO 11 DEL GRFICO I).
68
69
Adenda
Descripcin
Resolucin
de problemas
Solucin de situaciones nuevas para el alumno, en las que necesita usar los
conocimientos matemticos de que dispone. La resolucin de problemas puede
requerir de los estudiantes: reconocer, relacionar y utilizar informacin; determinar la pertinencia, suficiencia y consistencia de los datos; reconocer, utilizar y relacionar conceptos; utilizar, transferir, modificar y generar procedimientos; juzgar la
razonabilidad y coherencia de las soluciones y justificar y argumentar sus acciones
Capacidades Cognitivas
Especficas
Descripcin
Reconocimiento de
datos y conceptos
Capacidad cognitiva de identificar datos, hechos, conceptos, relaciones y propiedades matemticas, expresados de manera directa y explcita en el enunciado.
Resolucin de operaciones
(mediante distintos
procedimientos)
Resolucin de situaciones
en contextos intramatemticos
y/o de la vida cotidiana
Comunicacin
en matemtica
70
Lengua
EXTRAER
INTERPRETAR
Tema, idea central, tesis.Relaciones textuales.Procedimientos de cohesin (referencia, parfrasis, elipsis, conectores,
etc.).Procedimientos textuales. Enunciacin.
Caractersticas de personajes.Vocabulario.
EVALUAR
CAPACIDADES COGNITIVAS: Operaciones mentales que el sujeto utiliza para establecer relaciones con y
entre los objetos, situaciones y fenmenos. Se logran a
travs del proceso de enseanza y del proceso de aprendizaje y cobran significado de acuerdo con la determinacin de contenidos socialmente relevantes y altamente
significativos, frente a los que se ponen en juego y a
travs de los cuales se desarrollan. En el rea de Lengua,
la capacidad general que evala nuestra prueba es la
comprensin lectora. Dentro de ella se encuentran las
siguientes capacidades:
71
Ciencias Sociales
ANLISIS DE SITUACIONES: Capacidad cognitiva
de reconocer relaciones y/o de seleccionar cursos de accin que requieren la aplicacin de conceptos y/o principios y/o informacin previamente adquiridos.
COMUNICACIN: Capacidad cognitiva de interpretar la informacin y expresar un procedimiento o un
resultado. Por razones metodolgicas, los tem que evalan la comprensin o interpretacin de la informacin
se encuentran en la capacidad de Interpretacin/
Exploracin de la tabla de especificaciones.
Los tems para evaluar la expresin de un procedimiento o de un resultado se incluyen, en la tabla, en la
capacidad llamada Comunicacin.
Las posibles alternativas para evaluar esta capacidad
son las siguientes:
- Plantear una situacin problemtica.
- Describir la solucin de una situacin
problemtica.
la disciplina.
INTERPRETACIN/EXPLORACIN: Capacidad
cognitiva de obtener y cruzar informacin proveniente
de diferentes fuentes (textos, mapas, grficos, etc.).
RECONOCIMIENTO DE CONCEPTOS: Capacidad
cognitiva de identificar conceptos y principios por medio
de ejemplos, casos, atributos o definiciones de los mismos o viceversa: identificar ejemplos, casos, atributos o
definiciones de conceptos y principios dados.
RECONOCIMIENTO DE HECHOS: Capacidad cognitiva de identificar datos y/o hechos en un conjunto de
informacin mediante la utilizacin de conocimientos
que el alumno posee.
RECONOCIMIENTO DE VALORES: Capacidad cognitiva de elegir conductas de acuerdo con valores en
situaciones vinculadas con la responsabilidad social e
identificar valores implcitos o explcitos en discursos y
prcticas.
72
Ciencias Naturales
Capacidades Cognitivas
Definicin
Reconocimiento de
datos, hechos y conceptos
Incluye:
la identificacin de caractersticas y relaciones,
la interpretacin de datos y hechos: comparando, secuenciando, agrupando
y clasificando segn criterios explicitados.
la aplicacin de conceptos cientficos.
Comunicacin
Incluye:
la interpretacin, organizacin y traduccin de informacin en distintos
formatos (tablas, grficos, diagramas, esquemas y smbolos), y
la expresin de argumentos o conclusiones a partir de evidencias tales como
datos experimentales.
Anlisis de situacin
Incluye:
el anlisis de los datos experimentales, su validez, la identificacin de patrones y el reconocimiento de las variables involucradas, y
la identificacin, interpretacin y relacin de los distintos procesos de la
investigacin cientfica.
73
A.- Antecedentes
En tres llamados distintos (02-03; 04 y 06-07) se
financiaron y asistieron tcnicamente proyectos jurisdiccionales de uso de la informacin surgida de la evaluacin de la calidad educativa.
En las revisiones que se han realizado de la propuesta, los responsables jurisdiccionales de evaluacin destacaron tres puntos:
Permiti que se implementaran propuestas que
se venan formulando durante varios aos pero
que nunca haban contado con fondos para poder realizarse.
Brind la posibilidad de expandir el ciclo de evaluacin de la calidad educativa a travs de acciones de devolucin y uso de la informacin obtenida.
Respald acciones provinciales de evaluacin
para que puedan finalizarse y ser efectivas.
Como parte de la evaluacin interna de la DiNIECE, se
destac:
La importancia de la propuesta para impulsar el
uso de informacin.
La heterogeneidad de propuestas recibidas.
La heterogeneidad en el nivel de implementacin
de los proyectos.
A lo largo de estos tres llamados se ha mejorado el
seguimiento y la sistematizacin de la experiencia. Esto
ha permitido contar con documentacin sobre los proyectos de uso de informacin de los resultados de la evaluacin de la calidad educativa en el pas y la posibilidad
de realizar un mejor seguimiento de los compromisos
asumidos por las distintas partes.
74
El primero ser entre el primer y segundo trimestre de aprobado el proyecto. El mismo reflejar
los procesos de inicio e implementacin.
El segundo describir los procesos de ejecucin y
desarrollo.
El tercero abarcar los procesos de finalizacin y
evaluacin del proyecto.
BIBLIOGRAFA
Criterios de evaluacin ONE 2005. DINIECE,
Ministerio de Educacin, Ciencia y Tecnologa de la Nacin, 2005.
Allen, David (compilador - 2000), La evaluacin del aprendizaje de los estudiantes, Buenos Aires,
Paids.
Barber Gregori, Elena (1999), Evaluacin de la
enseanza, evaluacin del aprendizaje, Barcelona, edeb.
Carrin Carranza, Carmen (2001), Valores y
principios para evaluar la educacin, Mxico, Paids.
Cano Garca, E. (1999), Evaluacin de la calidad educativa, Madrid, La Muralla.
Landsheere, G. de (1999), El pilotaje de los sistemas educativos, Madrid, La Muralla OEI.
Lpez, F. (1994) La gestin de la calidad en
educacin, Madrid, La Muralla.
SITIOGRAFA
Elola, Nydia y Toranzos Lilia, (2000) Evaluacin
educativa. Una aproximacin conceptual., Biblioteca Digital, OEI.
http://www.campus-oei.org/calidad/luis2.pdf
75
76
77
GLOSARIO
AGRUPAMIENTO DE TEMS: Conjunto de tems que evalan una misma capacidad cognitiva o un mismo contenido.
Este agrupamiento da la posibilidad de calcular un puntaje parcial de la prueba, de la cual forman parte.
ANLISIS DE SITUACIONES: Ver Capacidades Cognitivas.
ANCLAJES: Un conjunto de tems comunes a pruebas diferentes que se aplican a grupos de alumnos tambin distintos y
permiten la equiparacin de los puntajes obtenidos.
APLICACIN CENSAL: Aplicacin de una prueba de evaluacin, a la totalidad de los alumnos de una cohorte de todo el
pas. Brinda informacin relevante sobre la poblacin total.
APLICACIN MUESTRAL: Aplicacin de una prueba de evaluacin, a grupos de alumnos seleccionados de manera tal que
sus caractersticas sean representativas de la poblacin total. La
seleccin de la muestra en nuestro caso, es aleatoria y estratificada (por jurisdiccin, mbito, rgimen y modalidad).
AZAR: Ver Respuesta por Azar.
BANCO DE TEMS: Un conjunto de reactivos (interrogantes,
disparadores o ejercicios) organizados segn el criterio lgico
del rea disciplinaria, curricular o por competencia, curso o
edad de los alumnos, destinados a ser utilizados para construir
futuros instrumentos de evaluacin.
BLOQUE DE TEMS: Conjunto de tems de una prueba. Los
bloques permiten una mayor cobertura de la diversidad de contenidos y capacidades. A partir de 2009 los ONE se estructuran
en bloques.
CALIDAD (de la Educacin): Una educacin de calidad es
aquella que logra que los alumnos realmente aprendan lo que
se supone deben aprender, aquello que est establecido en los
planes y programas curriculares al cabo de determinados ciclos
del sistema educativo formal. Es trabajar atendiendo a los resultados e incrementar oportunidades de aprendizaje para todos
con la permanente intencin de ir disminuyendo las diferencias.
Es aquella que brinda medios y orienta a los equipos de supervisin, docentes y alumnos para que se realice efectivamente el
proceso de enseanza y el proceso de aprendizaje, poniendo
nfasis en las estrategias de gestin y didcticas.
CAPACIDADES COGNITIVAS: Operaciones mentales que el
sujeto utiliza para establecer relaciones con y entre los objetos, situaciones y fenmenos. Se logran a travs del proceso
de enseanza y del proceso de aprendizaje y cobran significado
de acuerdo con la determinacin de contenidos socialmente
relevantes y altamente significativos, frente a los que se ponen
en juego y a travs de los cuales se desarrollan. En las tablas
de especificaciones que enmarcan la aplicacin de nuestros instrumentos de evaluacin, quedaron establecidas hasta el momento capacidades cognitivas de acuerdo a la disciplina que se
evale (Ver Adenda).
CBC: Contenidos Bsicos Comunes. Conjunto de saberes
relevantes que integran el proceso de enseanza de todo el
pas. Son la matriz bsica para un proyecto cultural nacional;
matriz a partir de la cual, cada jurisdiccin continua actualizando sus propios lineamientos o diseos curriculares y da paso, a
78
TIMSS: Third International Mathematics and Science Study o Tercer Estudio Internacional de Matemtica y Ciencias.
Prueba de evaluacin internacional, puesta en marcha por la
IEA (international Association for the Evaluation of Educational
Achievement). Su objetivo es evaluar el nivel de rendimiento de
los alumnos, de manera conjunta en Matemtica y Ciencias. El
ncleo central del estudio es la poblacin de alumnos de 13
aos. (Ver documento Pruebas Nacionales e Internacionales
para 2001).
VALIDEZ: El grado en que un test o prueba mide lo que dice
medir o evala lo que pretende evaluar. Brinda informacin vlida con respecto al atributo que mide o evala el test.
BIBLIOGRAFA
Coll,Csar. Aprendizaje escolar y construccin del conocimiento, Barcelona, 1990.
RESPUESTA POR AZAR: Respuesta que los alumnos dan fortuitamente, sin dominar el contenido y capacidad especficos
evaluados en el tem.
SERCE: Segundo Estudio Regional Comparativo y Explicativo (SERCE 2006). El SERCE es un Estudio de Evaluacin,
producto de una construccin colectiva y participativa de los
pases latinoamericanos que conforman la red del Laboratorio
Latinoamericano de Evaluacin de Calidad Educativa (LLECE).
Cortada de Kohan, Nuria. Teoras Psicomtricas y Construccin de Tests, Buenos Aires, 1999.
Instituto para el Desarrollo de la Calidad Educativa. Documento Pruebas Nacionales e Internacionales para
2001,
Hambleton, R.K; Swaminathan, H; Jane Rogers, H. Fundamentals of Item Response Theory, United States
of Amrica, 1991.
Jacob, 1994; tomado de Cea DAncona, Ma. ngeles.
Metodologa Cuantitativa. Estrategias y Tcnicas de
Investigacin Social, Madrid, 1996.
TABLA DE ESPECIFICACIONES: En el caso de nuestras pruebas de evaluacin es un cuadro de doble entrada en el cual se
ingresan dos tipos de informacin: las capacidades y los contenidos a evaluar, Cada cruce identifica un desempeo, es decir,
una capacidad determinada en relacin con contenidos de cada
rea de conocimiento.
TEORA CLSICA DE LOS TEST (TCT): Teora basada en el Modelo Lineal de la Regresin con dos variables: teora psicomtrica
que considera como hiptesis fundamental, que el puntaje de un
sujeto en un test (observable) es funcin de dos componentes: el
puntaje verdadero (inobservable) y el puntaje de error.
TEORA DE LA RESPUESTA AL TEM (TRI): Teora basada en
la modelizacin de las probabilidades de respuestas correctas
a un tem segn las funciones de distribucin normal y logstica. Intenta dar una fundamentacin probabilstica al problema de la medicin de constructos inobservables. Considera al
tem como unidad bsica del test. Sus modelos son funciones
matemticas que relacionan la probabilidad de una respuesta
particular a un tem, con la aptitud general del sujeto.
TEORA DEL RASGO LATENTE: ver Teora de la Respuesta al
tem (TRI).
Ministerio de Cultura y Educacin de la Nacin. Contenidos Bsicos Comunes para la Educacin General
Bsica, Buenos Aires, 1995.
Ministerio de Cultura y Educacin de la Nacin. Ncleos
de Aprendizaje Prioritarios para la Educacin General Bsica, Buenos Aires, 2004 - 2006.
Ministerio de Cultura y Educacin de la Nacin. Propuesta
de Tablas de Especificaciones, Buenos Aires, 1999.
Vianna, Heraldo Marelim. Termos Tcnicos em medidas
educacionais, So Paulo, 1981.