Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Desde Los Test Hasta La Evaluación. Escorza
Desde Los Test Hasta La Evaluación. Escorza
Un siglo, el XX, de
inteso desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
DESDE LOS TESTS HASTA LA INVESTIGACIN EVALUATIVA ACTUAL. UN SIGLO, EL XX, DE INTENSO DESARROLLO DE LA EVALUACIN EN EDUCACIN
(From tests to current evaluative research. One century, the XXth, of intense development of evaluation in education)
por
Articles record
Ficha artculo
Toms Escudero Escorza
(tescuder@posta.unizar.es)
About authors
HTML format
Formato HTML
Abstract
This article presents a review and state of art about development in educational evaluation in the XXth century. The
main theoretical proposals are commented
Resumen
Este artculo presenta una revisin crtica del desarrollo
histrico que ha tenido el mbito de la evaluacin educativa durante todo el siglo XX. Se analizan los principales
propuestas tericas planteadas.
Keywords
Descriptores
Evaluacin, Investigacin evaluativa, Mtodos de Evaluacin, Evaluacin Formativa, Evaluacin Sumativa, Test,
Evaluacin de Programas
Introduccin
En cualquier disciplina, la aproximacin histrica suele ser una va fundamental para comprender su concepcin, estatus, funciones, mbito,
etc. Este hecho es especialmente evidente en el
caso de la evaluacin, pues se trata de una disciplina que ha sufrido profundas transformaciones
conceptuales y funcionales a lo largo de la historia y, sobre todo, a lo largo del siglo XX, en el
que principalmente ubicamos nuestro anlisis. En
este sentido, la aproximacin diacrnica al concepto resulta imprescindible.
El anlisis la vamos a llevar a cabo basndonos en tres planteamientos que podramos tachar de clsicos en la reciente literatura sobre
el tema y que usamos indistintamente, aunque
no tenemos la pretensin de ofrecer un planteamiento de sntesis, sino de utilizacin cabal
de todos ellos, puesto que los tres planteamientos inciden sobre los mismos momentos y
movimientos claves.
Un planteamiento, quizs el ms utilizado en
nuestro contexto (Mateo y otros, 1993; Hernndez, 1993), es el que ofrecen Madaus, Scri-
[ www.uv.es/RELIEVE ]
pag. 11
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
ven, Stufflebeam y otros autores, que en sus trabajos suelen establecer seis pocas, empezando
su anlisis desde el siglo XIX (Stufflebeam y
Shinkfield, 1987; Madaus y otros, 1991). Nos
hablan de: a) poca de la reforma (1800-1900),
b) poca de la eficiencia y del testing (19001930), c) poca de Tyler (1930-1945), d) poca
de la inocencia (1946-1956), e) poca de la expansin (1957-1972) y f) poca de la profesionalizacin (desde 1973), que enlaza con la situacin actual.
Otros autores como Cabrera (1986) y Salvador
(1992) citan tres grandes pocas, tomando como
punto de referencia central la figura de Tyler en
el segundo cuarto del Siglo XX. A la poca de
Tyler se le denomina de nacimiento, a las anteriores de precedentes o antecedentes y a la posterior de desarrollo.
Guba y sus colaboradores, sobre todo Yvonna
Lyncoln, destacan distintas generaciones. Ahora
estaramos en la cuarta (Guba y Lincoln, 1989),
que segn ellos se apoya en el enfoque paradigmtico constructivista y en las necesidades de los
stakeholders (demandantes e implicados en la
evaluacin), como base para determinar la informacin que se necesita. La primera generacin es la de la medicin, que llega hasta el primer tercio de este siglo, la segunda es la de la
descripcin y la tercera la del juicio o valoracin.
Tras el anlisis histrico, como complemento y
como revisin de sntesis del mismo, ofrecemos
un sucinto resumen de los enfoques evaluativos
ms relevantes, de los distintos modelos y planteamientos que, con mayor o menor fuerza, vienen a nuestra mente cuando intentamos acotar lo
que es hoy en da la investigacin evaluativa en
educacin
[ www.uv.es/RELIEVE ]
pag. 12
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
El objetivo era detectar y establecer diferencias individuales, dentro del modelo del
rasgo y atributo que caracterizaba las elaboraciones psicolgicas de la poca (Fernndez
Ballesteros, 1981), es decir, el hallazgo de
puntuaciones diferenciales, para determinar
la posicin relativa del sujeto dentro de la
norma grupal.
Los tests de rendimiento, sinnimo de evaluacin educativa, se elaboraban para establecer discriminaciones individuales, olvidndose en gran medida la representatividad
y congruencia con los objetivos educativos.
En palabras de Guba y Lincoln (1982), la
evaluacin y la medida tenan poca relacin
con los programas escolares. Los tests informaban algo sobre los alumnos, pero no de
los programas con los que se les haba formado.
En el campo educativo destacan algunos instrumentos de aquella poca, como las escalas
de escritura de Ayres y Freeman, de redaccin
de Hillegas, de ortografa de Buckingan, de
clculo de Wood, de lectura de Thorndike y
McCall y de aritmtica de Wood y McCall
(Planchard, 1960; Ahman y Cook, 1967; Ebel,
1977).
[ www.uv.es/RELIEVE ]
pag. 13
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Sin embargo, fue en los tests psicolgicos donde los esfuerzos tuvieron mayor impacto, siendo
probablemente la obra de Thorndike (1904) la de
mayor influencia en los comienzos del siglo XX.
En Francia destacan los trabajos de Alfred Binet,
despus revisados por Terman en la Universidad
de Stanford, sobre tests de capacidades cognitivas. Ahora hablamos del Stanford-Binet, uno de
los tests ms conocidos en la historia de la psicometra.
Aos ms tarde, con las necesidades de reclutamiento en la Primera Guerra Mundial, Arthur
Otis dirige un equipo que construye tests colectivos de inteligencia general (Alfa para lectoescritores y Beta para analfabetos) e inventarios de
personalidad (Phillips, 1974).
Tras la contienda, los tests psicolgicos se ponen al servicio de fines sociales. La dcada entre
1920 y 1930 marca el punto ms alto del testing, pues se idean multitud de tests estandarizados para medir toda clase de destrezas escolares con referentes objetivos externos y explcitos,
basados en procedimientos de medida de la inteligencia, para utilizar con grandes colectivos de
estudiantes.
Estas aplicaciones estandarizadas se acogen
muy bien en los mbitos educativos y McCall
(1920) propone que los profesores construyan
sus propias pruebas objetivas, para no tener que
confiar exclusivamente en las propuestas por
especialistas externos.
Este movimiento estuvo vigente en paralelo al
proceso de perfeccionamiento de los tests psicolgicos con el desarrollo de la estadstica y del
anlisis factorial. El fervor por el testing decreci a partir de los aos cuarenta e, incluso,
empezaron a surgir algunos movimientos hipercrticos con estas prcticas.
Guba y Lincoln (1989) se refieren a esta evaluacin como a la primera generacin, que puede
legtimamente ser denominada como la generacin de la medida. El papel del evaluador era
tcnico, como proveedor de instrumentos de medicin. Segn estos autores, esta primera generacin permanece todava viva, pues todava exis-
ten textos y publicaciones que utilizan de manera indisoluble evaluacin y medida (Gronlund, 1985).
[ www.uv.es/RELIEVE ]
pag. 14
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 15
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 16
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 17
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Si estas reflexiones de Cronbach fueron impactantes, no lo fueron menos las del ensayo de
Scriven (1967). Sus fecundas distinciones terminolgicas ampliaron enormemente el campo
semntico de la evaluacin, a la vez que clarificaron el quehacer evaluativo. Destacamos a
continuacin las aportaciones ms significativas:
f) Desde esta ptica, las tcnicas de evaluacin no pueden limitarse a los tests de
rendimiento. Los cuestionarios, las entrevistas, la observacin sistemtica y no sistemtica, las pruebas de ensayo, segn el autor,
ocupan un lugar importante en la evaluacin,
en contraste al casi exclusivo uso que se
haca de los tests como tcnicas de recogida
de informacin.
a) Se establece de forma tajante la diferencia entre la evaluacin como actividad metodolgica, lo que el autor llama meta de la
evaluacin, y las funciones de la evaluacin
en un contexto particular. As, la evaluacin
como actividad metodolgica es esencialmente igual, sea lo que fuera lo que estemos
evaluando. El objetivo de la evaluacin es
invariante, supone en definitiva el proceso
por el cual estimamos el valor de algo que se
evala, mientras que las funciones de la evaluacin pueden ser enormemente variadas.
Estas funciones se relacionan con el uso que
se hace de la informacin recogida.
b) Scriven seala dos funciones distintas
que puede adoptar la evaluacin: la formativa y la sumativa. Propone el trmino de
evaluacin formativa para calificar aquel
proceso de evaluacin al servicio de un programa en desarrollo, con objeto de mejorarlo, y el trmino de evaluacin sumativa para
aquel proceso orientado a comprobar la eficacia del programa y tomar decisiones sobre
su continuidad.
[ www.uv.es/RELIEVE ]
pag. 18
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 19
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
seala para los primeros, adems de los conocidos objetivos de describir la ejecucin del
sujeto y tomar decisiones sobre si domina o no
domina un contenido, otro objetivo como es el
de valorar la eficacia de un programa.
Desde finales de los sesenta los especialistas
se pronunciarn decisivamente a favor de la
evaluacin criterial, en cuanto que es el tipo de
evaluacin que suministra una informacin real
y descriptiva del estatus del sujeto o sujetos
respecto a los objetivos de enseanza previstos,
as como la valoracin de ese estatus por comparacin con un estndar o criterio de realizaciones deseables, siendo irrelevantes, al efecto
de contraste, los resultados obtenidos por otros
sujetos o grupo de sujetos (Popham, 1970 y
1983; Mager, 1973; Carreo, 1977; Gronlund,
1985).
En las prcticas evaluativas de esta dcada de
los sesenta se observan dos niveles de actuacin. Un nivel podemos calificarlo como la
evaluacin orientada hacia los individuos,
fundamentalmente alumnos y profesores. El
otro nivel, es el de la evaluacin orientada a la
toma de decisiones sobre el instrumento o
tratamiento o programa educativo. Este
ltimo nivel, impulsado tambin por la evaluacin de programas en el mbito social, ser la
base para la consolidacin en el terreno educativo de la evaluacin de programas y de la investigacin evaluativa.
[ www.uv.es/RELIEVE ]
pag. 20
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 21
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
pag. 22
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
coln (1982) refieren los trminos de la comparacin valorativa; de un lado, las caractersticas del objeto evaluado y, de otro, las necesidades, expectativas y valores del grupo a los
que les afecta o con los que se relaciona el objeto evaluado.
c) Pluralidad de procesos evaluativos dependiendo de la percepcin terica que sobre
la evaluacin se mantenga. Los modelos de
evaluacin citados y otros ms que pueden encontrarse en la bibliografa, representan diferentes propuestas para conducir una evaluacin.
d) Pluralidad de objetos de evaluacin. Como dice Nevo (1983 y 1989), existen dos conclusiones importantes que se obtienen de la
revisin de la bibliografa sobre la evaluacin.
Por un lado, cualquier cosa puede ser objeto
de evaluacin y sta no debera limitarse a estudiantes y profesores y, por otro, una clara
identificacin del objeto de evaluacin es una
importante parte en cualquier diseo de evaluacin.
e) Apertura, reconocida en general por todos
los autores, de la informacin necesaria en un
proceso evaluativo para dar cabida no slo a
los resultados pretendidos, sino a los efectos
posibles de un programa educativo, sea pretendido o no. Incluso Scriven (1973 y 1974)
propone una evaluacin en la que no se tenga
en cuenta los objetivos pretendidos, sino valorar todos los efectos posibles. Apertura tambin respecto a la recogida de informacin no
slo del producto final, sino tambin sobre el
proceso educativo. Y apertura en la consideracin de diferentes resultados de corto y largo
alcance. Por ltimo, apertura tambin en considerar no slo resultados de tipo cognitivo,
sino tambin afectivos (Anderson y Ball,
1983).
f) Pluralidad tambin reconocida de las funciones de la evaluacin en el mbito educativo, recogindose la propuesta de Scriven entre
evaluacin formativa y sumativa, y aadindose otras de tipo socio-poltico y administrativas (Nevo, 1983).
[ www.uv.es/RELIEVE ]
pag. 23
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
ofrecen una alternativa evaluadora, que denominan cuarta generacin, pretendiendo superar lo
que segn estos autores son deficiencias de las
tres generaciones anteriores, tales como una visin gestora de la evaluacin, una escasa atencin al pluralismo de valores y un excesivo apego al paradigma positivista. La alternativa de
Guba y Lincoln la denominan respondente y
constructivista, integrando de alguna manera el
enfoque respondente propuesto en primer lugar
por Stake (1975), y la epistemologa postmoderna del constructivismo (Russell y Willinsky,
1997). Las demandas, las preocupaciones y los
asuntos de los implicados o responsables (stakeholders) sirven como foco organizativo de la
evaluacin (como base para determinar qu informacin se necesita), que se lleva a cabo dentro
de los planteamientos metodolgicos del paradigma constructivista.
La utilizacin de las demandas, preocupaciones
y asuntos de los implicados es necesaria, segn
Guba y Lincoln, porque:
[ www.uv.es/RELIEVE ]
pag. 24
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Beneficiarios.
Victimas.
Cuando se habla de los pasos o fases de la evaluacin en esta cuarta generacin, sus proponentes citan doce pasos o fases, con diferentes subfases en cada una de estas. Estos pasos son los siguientes:
Documentos y registros.
Observacin.
Literatura profesional.
Identificacin de audiencias.
8) Recogida de informacin.
12) Reciclado/revisin.
[ www.uv.es/RELIEVE ]
pag. 25
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Los criterios paralelos, de confianza, se denominan as porque intentan ser paralelos a los criterios de rigor utilizados muchos aos dentro del
paradigma convencional. Estos criterios han sido
validez interna y externa, fiabilidad y objetividad. Sin embargo, los criterios deban ser acordes
con el paradigma fundamentador (Morgan,
1983). En el caso de la cuarta generacin los
criterios que se ofrecen son los de credibilidad,
transferencia, dependencia y confirmacin (Lincoln y Guba, 1986).
El criterio de credibilidad es paralelo al de validez interna, de forma que la idea de isomorfismo entre los hallazgos y la realidad se reemplaza
por el isomorfismo entre las realidades construidas de las audiencias y las reconstrucciones del
evaluador atribuidas a ellas. Para conseguir esto
existen varias tcnicas, entre las que destacan las
siguientes: a) el compromiso prolongado, b) la
observacin persistente, c) el contraste con colegas, d) el anlisis de casos negativos (Kidder,
1981), e) la subjetividad progresiva y f) el control de los miembros. La transferencia puede
verse como paralela a la validez externa, la dependencia es paralela al criterio de fiabilidad y la
confirmacin puede verse como paralela a la
objetividad.
Otra manera de juzgar la calidad de la evaluacin es el anlisis dentro del propio proceso, algo
que encaja con el paradigma hermenutico, a
travs de un proceso dialctico.
Pero estos dos tipos de criterios, aunque tiles,
no son del todo satisfactorios para Guba y Lincoln, que defienden con ms ahnco los criterios
que denominan de autenticidad, tambin de base
constructivista. Estos criterios incluyen los siguientes: a) imparcialidad, justicia, b) autenticidad ontolgica, c) autenticidad educativa, d) autenticidad cataltica y e) autenticidad tctica
(Lincoln y Guba, 1986).
Este anlisis de la cuarta generacin de podemos terminarlo con los rasgos con los que definen Guba y Lincoln a la evaluacin:
a) La evaluacin es un proceso sociopoltico.
[ www.uv.es/RELIEVE ]
pag. 26
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Recogiendo estas recomendaciones (Stufflebeam, 1994, 1998, 1999, 2000 y 2001), en las
que se han ido integrando ideas de diversos evaluadores tambin notables, no slo ofrecemos
una de las ltimas aportaciones a la actual concepcin de la investigacin evaluativa en educacin, sino que completamos en buena medida la
visin del panorama actual, rico y plural, tras
analizar la cuarta generacin de Guba y Lincoln.
Se parte de los cuatro principios del Joint
Committee (1981 y 1988), esto es, de la idea de
que cualquier buen trabajo de investigacin evaluativa debe ser: a) til, esto es, proporcionar
informacin a tiempo e influir, b) factible, esto
es, debe suponer un esfuerzo razonable y debe
ser polticamente viable, c) apropiada, adecuada, legtima, esto es, tica y justa con los implicados, y d) segura y precisa a la hora de ofrecer
informacin y juicios sobre el objeto de la evaluacin. Adems, la evaluacin se ve como una
transdisciplina, pues es aplicable a muchas
disciplinas diferentes y a muchos objetos diversos (Scriven, 1994).
Stufflebeam invoca a la responsabilidad del
evaluador, que debe actuar de acuerdo a principios aceptados por la sociedad y a criterios de
profesionalidad, emitir juicios sobre la calidad y
el valor educativo del objeto evaluado y debe
asistir a los implicados en la interpretacin y
utilizacin de su informacin y sus juicios. Sin
embargo, es tambin su deber, y su derecho, estar
al margen de la lucha y la responsabilidad poltica por la toma de decisiones y por las decisiones
tomadas.
La equidad. Hay que preguntarse si el sistema es justo y equitativo a la hora de proporcionar servicios educativos, el acceso a
los mismos, la consecucin de metas, el desarrollo de aspiraciones y la cobertura para
todos los sectores de la comunidad (Kellagan, 1982).
La factibilidad. Hay que cuestionar la eficiencia en la utilizacin y distribucin de recursos, la adecuacin y viabilidad de las
normas legales, el compromiso y participacin de los implicados y todo lo que hace
que el esfuerzo educativo produzca el
mximo de frutos posibles.
La excelencia como objetivo permanente
de bsqueda. La mejora de la calidad, a partir del anlisis de las prcticas pasadas y presentes es uno de los fundamentos de la investigacin evaluativa.
Tomando el referente de estos criterios y sus
derivaciones, Stufflebeam sumariza una serie
de recomendaciones para llevar a cabo buenas
investigaciones evaluativas y mejorar el sistema educativo. Estas recomendaciones son las
siguientes:
pag. 27
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
3) Las entidades educativas deben ser valoradas tanto por su mrito (valor intrnseco, calidad respecto a criterios generales) como por
su valor (valor extrnseco, calidad y servicio
para un contexto particular) (Guba y Lincoln,
1982; Scriven, 1991), como por su significacin en la realidad del contexto en el que se
ubica. Scriven (1998) nos seala que usando
otras denominaciones habituales, mrito tiene
bastante equivalencia con el trmino calidad,
valor con el de relacin coste-eficacia y significacin con el de importancia. En todo caso,
los tres conceptos son dependientes del contexto, sobre todo significacin, de manera que
entender la diferencia entre dependencia del
contexto y arbitrariedad es parte de la comprensin de la lgica de la evaluacin.
4) La evaluacin de profesores, instituciones
educativas, programas, etc, debe relacionarse
siempre con el conjunto de sus deberes, responsabilidades y obligaciones profesionales o
institucionales, etc. Quizs uno de los retos
que deben abordar los sistemas educativos es
la definicin ms clara y precisa de estos deberes y responsabilidades. Sin ello, la evaluacin es problemtica, incluso en el terreno
formativo (Scriven, 1991a).
5) Los estudios evaluativos deben ser capaces de valorar hasta qu medida los profesores
y las instituciones educativas son responsables
y rinden cuentas del cumplimiento de sus deberes y obligaciones profesionales (Scriven,
1994).
6) Los estudios evaluativos deben proporcionar direcciones para la mejora, porque no basta con emitir un juicio sobre el mrito o el valor de algo.
7) Recogiendo los puntos anteriores, todo estudio evaluativo debe tener un componente
formativo y otro sumativo.
8) Se debe promover la autoevaluacin profesional, proporcionando a los educadores las
destrezas para ello y favoreciendo actitudes
positivas hacia ella (Madaus y otros, 1991)
pag. 28
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
(Mertens, 1999). La evaluacin para el desarrollo (empowerment evaluation), que defiende Fetterman (1994), es un procedimiento, de
base democrtica, de participacin de los implicados en el programa evaluado, para promover la autonoma de los mismos en la resolucin de sus problemas. Weiss (1998) nos
alerta de que la evaluacin participativa incrementa la probabilidad de que se utilicen los
resultados de la evaluacin, pero tambin la de
que sea conservadora en su concepcin, pues
es difcil pensar que los responsables de una
organizacin pongan en cuestin el fundamento y el sistema de poder de la misma. Generalmente su inters es el cambio de cosas pequeas.
14) Los estudios evaluativos deben emplear
mltiples perspectivas, mltiples medidas de
resultados, y mtodos tanto cuantitativos como cualitativos para recoger y analizar la informacin. La pluralidad y complejidad del
fenmeno educativo hace necesario emplear
enfoques mltiples y multidimensionales en
los estudios evaluativos (Scriven, 1991)
15) Los estudios evaluativos deben ser evaluados, incluyendo metaevaluaciones formativas
para mejorar su calidad y su uso y metaevaluaciones sumativas para ayudar a los usuarios
en la interpretacin de sus hallazgos y proporcionar sugerencias para mejorar futuras evaluaciones (Joint Committee, 1981 y 1988; Madaus y otros, 1991; Scriven, 1991; Stufflebeam, 2001).
Estas quince recomendaciones proporcionan
elementos esenciales para un enfoque de los estudios evaluativos que Stufflebeam denomina
objetivista y que se basa en la teora tica de que
la bondad moral es objetiva e independiente de
los sentimientos personales o meramente humanos.
Sin entrar en el debate sobre estas valoraciones
finales de Stufflebeam, ni en anlisis comparativos con otras propuestas, por ejemplo con las de
Guba y Lincoln (1989), nos resulta evidente que
las concepciones de la investigacin evaluativa
son diversas, dependiendo del origen epistemo-
[ www.uv.es/RELIEVE ]
pag. 29
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 30
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
3) Audiencias/implicados/clientela.
4) nfasis/aspectos prioritarios o preferentes.
5) Criterios de mrito o valor.
6) Informacin a recoger.
7) Mtodos de recogida de informacin.
8) Mtodos de anlisis.
9) Agentes del proceso.
10)
11)
Informes/utilizacin de resultados.
12)
Lmites de la evaluacin.
Empricoanaltica
Susceptibles
de complementariedad
Humansticointerpretativa
Patton
(1980)
Objetivos
Guba y Lincoln
(1982)
Objetivos
Anlisis sistemas
Prez
(1983)
Objetivos
Stufflebeam y
Shinkfield (1987)
Objetivos
Anlisis sistemas
Mtodo
cientfico
CIPP
CIPP
CIPP
Crtica artstica
Crtica artstica
Crtica artstica
Autores
creadores
Tyler (1950)
Rivlin (1971)
Rossi y otros (1979)
Suchman (1967)
Stufflebeam (1966)
Adversario
Eisner (1971)
Contrapuesto
Wolf (1974)
UTOS
UTOS
Cronbach (1982)
Respondente
Respondente
Respondente
Respondente
Stake (1975
Iluminativo
Iluminativo
Iluminativo
Sin metas
Sin metas
Sin metas
Democrtico
Scriven (1967)
MacDonald (1976)
[ www.uv.es/RELIEVE ]
pag. 31
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Finalidad
evaluativa
Medicin logro
objetivos
Paradigma domiContenido de
nante
evaluacin
Cuantitativo
Resultados
Rol del
evaluador
Tcnico externo
CIPP
Stufflebeam
(1967)
Informacin
para toma
decisiones
Mixto
Tcnico externo
Figura
(countenance)
Stake (1967)
CSE
Alkin (1969)
Valoracin
resultados y
proceso
Informacin para
determinacin de
decisiones
Valoracin
proceso y
producto
Mixto
Planificacin
educativa
Cronbach
(1982)
Mixto
Mixto
C (contexto)
I (input)
P (proceso)
P (producto)
Antecedentes,
transacciones,
resultados
Centrados en
logros de
necesidades
U (unidades de
evaluacin)
T (tratamiento)
O (operaciones)
Tcnico externo
Tcnico externo
Tcnico externo
Finalidad
evaluativa
Anlisis de
necesidades del
cliente
Paradigma domiContenido de
nante
evaluacin
Mixto
Todos los
efectos del
programa
Contraposicin
Owens (1973),
Wolf (1974)
Crtica artstica
Eisner (1981)
Opiniones para
decisin
consensuada
Interpretacin
crtica de la
accin educativa
Mixto
Cualquier aspecto
del programa
Cualitativo
Contexto
Procesos
emergentes
Relaciones de
procesos
Impacto en
contexto
Rol del
evaluador
Evaluador externo
de
necesidades
del
cliente
rbitro externo
del debate
Provocador
externo de
interpretaciones
[ www.uv.es/RELIEVE ]
pag. 32
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Finalidad
evaluativa
Valoracin de
respuesta a
necesidades de
participantes
Interpretacin
educativa para
mejorarla
Paradigma domiContenido de
evaluacin
nante
Cualitativo
Resultado de
debate total
sobre programa
Rol del
evaluador
Promotor externo
de la interpretacin
por los implicados
Elementos que
Promotor externo
configuran la
de la interpretaaccin educativa
cin
por los implicados
Sistema de
Promotor externo
enseanza y me- de la interpretadio
cin
de aprendizaje
por los implicados
Iluminacin y
comprensin de
los componentes
del programa
Cualitativo
Cualitativo
Tambin Scriven (1994) ofrece una clasificacin de los modelos anteriores, previamente a
introducir su perspectiva transdisciplinar que
luego comentamos. Este autor identifica seis visiones o enfoques alternativos en la fase explosiva de los modelos, adems de algunas ms
que denomina exticas y que se mueven entre
los modelos de jurisprudencia y de experto. A
continuacin comentamos sucintamente estas
visiones y los modelos que se adscriben a
ellas.
La visin fuerte hacia la toma de decisiones
(Visin A) concibe al evaluador investigando
con el objetivo de llegar a conclusiones evaluativas que le ayuden al que debe tomar decisiones.
Los que apoyan este enfoque se preocupan de si
el programa alcanza sus objetivos, pero van ms
all, cuestionndose si tales objetivos cubren las
necesidades que deben cubrir. Esta posicin es
mantenida, aunque no la hiciera explcita, por
Ralph Tyler y extensamente elaborada en el modelo CIPP (Stufflebeam y otros, 1971).
Segn el planteamiento tyleriano, las decisiones acerca de un programa deben basarse en el
grado de coincidencia entre los objetivos y los
resultados. El cambio de los alumnos, habitual-
[ www.uv.es/RELIEVE ]
pag. 33
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
no es Marv Alkin (1969), que define a la evaluacin como un proceso factual de recogida y generacin de informacin al servicio del que toma
las decisiones, pero es ste el que tiene que tomar
las conclusiones evaluativas. Esta posicin es
lgicamente popular entre los que piensan que la
verdadera ciencia no debe o no puede entrar en
cuestiones de juicios de valor. El modelo de Alkin se conoce como CES (Centro para el Estudio
de la Evaluacin), planteando las siguientes fases: valoracin de las necesidades y fijacin del
problema, planificacin del programa, evaluacin de la instrumentalizacin, evaluacin de
progresos y evaluacin de resultados.
La visin relativista (Visin C) tambin mantiene la distancia de las conclusiones evaluativas,
pero usando el marco de valores de los clientes,
sin un juicio por parte del evaluador acerca de
esos valores o alguna referencia a otros. Esta
visin y la anterior han sido el camino que ha
permitido integrarse sin problemas en el carro
de la investigacin evaluativa a muchos cientficos sociales. De hecho, uno de los textos ms
utilizados de evaluacin en el mbito de las ciencias sociales (Rossi y Freeman, 1993), toma preferentemente esta perspectiva .
Las visiones B y C son las posiciones de los
cientficos entroncados con una concepcin libre
de valores de la ciencia. En cambio, los que participan de la visin A proceden de un paradigma
diferente, probablemente debido a su conexin
acadmica con la historia, la filosofa de la educacin, la educacin comparada y la administracin educativa.
Hace unos aos Alkin (1991) revis sus planteamientos de dos dcadas atrs, pero sigui sin
incluir los trminos de mrito, valor o vala; termina definiendo un Sistema de Informacin para
la Gestin (Management Information SystemMIS) para uso del que toma decisiones, pero no
ofrece valoraciones al respecto
Pero la forma ms simple de la visin relativista (Visin C) es la desarrollada en el modelo de
discrepancia de evaluacin de Malcolm Provus
(1971). Las discrepancias son las divergencias
con la secuencia de tareas proyectadas y la tem-
poralizacin prevista. Este modelo es muy cercano al control de programas en sentido convencional; es una especie de simulacin de una
evaluacin.
La visin de la descripcin frtil, rica, completa (Visin D) es la que entiende la evaluacin como una tarea etnogrfica o periodstica,
en la que el evaluador informa de lo que ve sin
intentar emitir afirmaciones valorativas o inferir conclusiones evaluativas, ni siquiera en el
marco de los valores del cliente como en la
visin relativista. Esta visin ha sido defendida
por Robert Stake y muchos de los tericos britnicos. Se trata de una especie de versin naturalista de la visin B, tiene algo de sabor relativista y a veces parece precursora de la visin de la cuarta generacin. Se centra en la
observacin, en lo observable, ms que en la
inferencia. Recientemente se le ha denominado
como visin de la descripcin slida, fuerte,
para evitar el trmino rica, que parece ms
evaluativa.
Stake, en su primera etapa, es tayleriano en
cuanto a concepcin evaluativa centrada en los
objetivos planteados, proponiendo el mtodo
de evaluacin de la figura (Stake, 1967), como
rostro o imagen total de la evaluacin. Esta gira
en torno a los tres componentes, antecedentes,
transacciones y resultados, elaborando dos
matrices de datos, una de descripcin y otra de
juicio. En la primera se recogen de un lado las
intenciones y de otro las observaciones y, en la
segunda, las normas, lo que se aprueba y los
juicios, lo que se cree que debe ser.
A mitad de los setenta, Stake se aleja de la
tradicin tayleriana de preocupacin por los
objetivos y revisa su mtodo de evaluacin
hacia un planteamiento que l califica como
respondente (Stake, 1975 y 1975a), asumiendo que los objetivos del programa pueden
modificarse sobre la marcha, con la finalidad
de ofrecer una visin completa y holstica del
programa y responder a los problemas y cuestiones reales que plantean los implicados. Segn Stufflebeam y Shinkfield (1987), este modelo hizo de Stake el lder de una nueva escue-
[ www.uv.es/RELIEVE ]
pag. 34
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 35
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
ejemplo, Schuman (1967) ofrece un diseo evaluativo basado en el mtodo cientfico o, al menos, en alguna variacin o adaptacin del mismo.
Owens (1973) y Wolf (1974 y 1975) proponen
un mtodo de contraposicin o discusin que
sobre un programa llevan a cabo dos grupos de
evaluadores, partidarios y adversarios, para proporcionar informacin pertinente a quienes toman decisiones. Eisner (1971, 1975 y 1981)
plantea la evaluacin en trminos similares al
proceso de crtica artstica.
El propio Scriven (1967 y 1973) propona hace
aos centrar la evaluacin en la atencin al cliente y no tanto en las metas previstas, puesto que
frecuentemente los logros no previstos son ms
importantes que los que figuran en la planificacin del programa. Por ello, se suele denominar a
su enfoque como evaluacin sin metas. El evaluador determina el valor o mrito del programa
para informar a los usuarios; se trata algo as
como de un intermediario informativo (Scriven,
1980).
La evaluacin iluminativa (Parlett y Hamilton,
1977) tiene un enfoque holstico, descriptivo e
interpretativo, con la pretensin de iluminar sobre un complejo rango de cuestiones que se dan
de manera interactiva (Fernndez, 1991). La evaluacin democrtica de MacDonald (1971 y
1976), tambin denominada holstica, supone la
participacin colaborativa de los implicados,
siendo el contraste de opiniones de los implicados el elemento evaluativo primordial.
Scriven (1994) analiza las seis visiones crticamente y se muestra ms cercano a la visin A,
la visin fuerte sobre la toma de decisiones, representada fundamentalmente por el modelo
CIPP de Stufflebeam y sus planteamientos, pues
dice que es la ms cercana de todas a la visin
del sentido comn, que es la que tienen los evaluadores trabajando con sus programas, de la
misma manera que los mdicos trabajan con los
pacientes, hacindolo lo mejor posible, independientemente del tipo y del estado general del
paciente. Scriven quiere extender esta visin con
una visin o modelo que denomina transdisciplinar y que l califica como significativamente
[ www.uv.es/RELIEVE ]
pag. 36
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Referencias bibliogrficas
Ahman, S. J. y Cook, M. D. (1967). Evaluating
Pupil Growth. Principles of Tests Measurement. Boston, Ma.: Allyn and Bacon
Alkin, M. (1969). Evaluation theory development. Evaluation Comment, 2, 1, 2-7.
Alkin, M. (1991). Evaluation theory development: II. En M. McLaughlin, y Phillips (Eds.),
Evaluation and education at quarter century
(pp.91-112). Chicago: NSSE/ University of
Chicago .
Anderson, S. B. y Ball, S. (1983). The profession and practice of program evaluation. San
Francisco, Ca: Jossey-Bass.
Arnal, J.; Del Rincon, D. y Latorre, A. (1992).
Investigacin educativa. Fundamentos y Metodologa. Barcelona: Labor
Atkin, J. M. (1968). Behavioral Objectives in
curriculum design: A cautionary note. The
Science Teacher, 35, 27-30.
Baker, L. R. (1969). Curriculum evaluation.
Review of Educational Research, 39, 339-358.
Barbier, J. M. (1993). La evaluacin en los
procesos de formacin. Barcelona: Paidos.
Berk, A. R. (Ed.) (1981). Educational evaluation methodology: The state of the art. Baltimore: The Hopkins University Press.
Blanco, F. (1994). La evaluacin en la educacin secundaria. Salamanca: Amas Ediciones.
Bloom, B. S., Engelhaut, M.D., Furst, E.J.,
Hill, W.H. y Krathwohl, D.R. (1956). Taxonomy of educational objectives Handbook I;
Cognitive domain. New York: Davis, McKay.
Bloom, B. S., Hastings, J. Th. y Madaus, F.
(1971). Handbook on formative and summative evaluation of student learning. New York:
McGraw-Hill.
[ www.uv.es/RELIEVE ]
pag. 37
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 38
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 39
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 40
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 41
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
[ www.uv.es/RELIEVE ]
pag. 42
Escudero Escorza, T. (2003). Desde los tests hasta la investigacin evaluativa actual. Un siglo, el XX, de
inteso desarrollo de la evaluacin en educacin. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm
Reference /
Referencia
Title / Ttulo
Authors / Autores
Review /
Revista
ISSN
Publication date /
Fecha de publicacin
Abstract /
Resumen
Keywords
Descriptores
Institution /
Institucin
Publication site /
Direccin
Language / Idioma
Este artculo presenta una revisin crtica del desarrollo histrico que ha tenido el mbito de la evaluacin educativa durante todo el siglo XX. Se analizan los principales
propuestas tericas planteadas..
Evaluation, Evaluation Research, Evaluation Methods; Formative Evaluation Summative Evaluation, Testing, Program Evaluation.
Evaluacin, Investigacin evaluativa, Mtodos de Evaluacin, Evaluacin Formativa,
Evaluacin Sumativa, Test, Evaluacin de Programas
Universidad de Zaragoza (Espaa)
http://www.uv.es/RELIEVE
Espaol (Title, abstract and keywords in english)
[ www.uv.es/RELIEVE ]
pag. 43