Está en la página 1de 347

Traducido del inglés al español - www.onlinedoctranslator.

com

Tx 820 098
AOR
rI'3'bS
. ¿ASPOB? XO ISBX-0-918538-18-C
'l83p.
Av1Iz•ABI•B sR stsdgepzeas , Caja 69; pinta Reyes, California 94956 ("S?.75 s1-ng1e
copia: $6.20 tco ur aore copias) ›
* 8DBS PRECIO X¥'01, Más poesía éb Xot' Disponible 1cb'• troai BDRS. .
DB80 P¥'0BS”De£ 1zi iones: ”Bvs1uat 1uno Yocbulario
"AB3¥o norte ' '° '"'.“
- “ yktc 1s C diccionario de sinónimos, de tetas usado En
eva1tzct 1 en . I t Ie no descansa T ctad ta escopa a aducat 1onc1 o
programa evc1uat 1on. II re2erc al producto bacalao pazsono•1 dnd. propuesta
evaluada también cc bien. cs 'a control de calidad cné la calificación de xork
saxp1cs. 7ha texto conta1\ss

un probar fueron eso Connecticut 1ecst a Pocos turba lclpcntc a Talleres de trabajo
o , - clases' xaquactadas Eso,
una cuenta 'corta' xcs posible: tha •cccouot xac

en 1981-8]. medias de dos


C"
BVWUATIOH
thir¢l edXlon

, MIGUEL

E@C '
VW£I&TI
QRætłtlon

TNŒAURnosotro
s

NICLIAeL
ESCRIBIR
mi
E@C '
›”
<I

Internacional Está ndar 8opk Nú mero 0-Tl5528-18-é'


F6stedik›n,'vista
Segunda edició n, septiembre de 1980
Tercera edición Diciembre UI

q Derechos de autor @ 1'981. Michael

derivadoBiblioteca de Cbngress
Número CIP 80-68775

ido part de este libro puede ser producido por cualquier


mpchani- cal, photograplúc, or elecAorúc prucesp, or in@e
formof agrabación fonográfica, ni podrá ser registrada en
una recuperación sistema. transmitido.o de otra manera
copiarA, para uso público o privado, sin permiso del
editor.
Edgep.ess
3ox ó2, R. Reyes '“

Impreso en los Estados Unidos de América


Solo cspies S7.fXl + franqueo etc 75g
tu 'o A l a b a m a metrooda, DM o fi precio y franqueo
(S6.2C cada uno, Yotal).
California impuesto para pedidos de Califómia solamente: 69'o
(46e por copia individual, 3ód por aopy en varios
pedidos.) b}astezcard oVisa aceptable. “
Fejemplares gratuitos de la cuarta edición a los contribuyentes
que se identifiquen
mi adiciones y errores de oifkani.

'
4
INTRODUCCIÓN
• AL TERCERA EDICIÓN •

EvaluaEon es una nueva pline poder vieja practica


No es solo una ciencia, aunque tiene sentido hablar de
Evaluación científica en contraste con orub-
Evaluación efectiva. La evaluación disciplinada ocurre en
las reseñas de libros académicos, los diálogos sociales, la
crítica social yen los dictámenes emitidos por los tribunales
de apelación. su car-características son la base para una
determinación de mérito, valor o valor; el control del sesgo;
el énfasis en la ló gica redonda,fundamentos fácticos y
comprensivos (nosotros cobertura. Que se ha convertido
en un sujeto sustancial lo atestigua la existencia
detenencia de varias enciclopedias, dos asociaciones
profesionales con má s de mil miembros cada una, media
docena de revistas, y decenas de antologías, textos,
monografías, etc un sujeto por derecho propio, no para
beiJiated en
subtítulos en educación, salud, aplicación de la ley anda
en; debido también podría argumentarque no hay tema
de estadísticas, solo agrícolas estadísticas, estadísticas
en
etc. Tampoco servirá para clasificar la "evaluació n bajo
Ciencias, Miscelá neas", ya que la evaluació n trasciende
con mucho las ciencias sociales. El Congreso de
Bibliotecas lo ha reconocido el añ o pasado al asignar
una clasificació n especial a las obras generales de
evaluació n, análoga a la de las obras generales de
investigació n. (La segunda edició n de este bmk fue la
paja
• ese rompió la resistencia de millones de añ os.)
Ha sido común entre los trabajadores de sorpe hablar de
”evaluación” de la investigación” en vez de ”evaliia'hor.”
para transmitir la distinción entre casual y evaluación
científica ves ciones. La redundancia es algo que en
general deberíamos dejar atrás ahora, dejando que el
contexto haga
mi
E@C '
*'“

la distinció n querida, como hacemos con términos como


"medicina", "diagnó stico" y "explicació n".
Una distinció n más importante a tener en cuenta es la que
existe entre hacer evaluaciones y desarrollar o discutir los
métodos y modelos en evaluació n. La mayoría de las
evaluaciones del período expansionista desde lamedio
have t›een merelv appli- ęatims d e , cantidad tivo
social Ciencias tecnicas a algunos norte modelo de
lo que es una evaluació n grito por ejemplo, una
prueba de hipó tesis de que se lograron los resultados
pretendidos aquí. Lo que hace que la evaluació n sea una
disciplina legítima* autó noma es darse cuenta de que tal
modelo es completamente erró neo, una conclusió n que
surge de la discusió n de modelos y métodos iniciada por
los evaluadores educativos . , no las provenientes de la
sociología, la psicología, etc. La discusió n de la
metodología evaluativa es la misma prá ctica
autoanalítica
eso condujo a hacer una ciencia de la metalurgia af}dr seis •
. mil añ os de fundició n, fundició n, recocido y para
plataformas habilidades, y a la gran prá ctica.: avances
inmediatos. La investigació n sin reflexió n sobre los
métodos y modelos es
• só lo es apropiado cuando estos ú ltimos son irreprochables y
.gilt.aJaog a tive Jnwn el inmaduro
,orgías de los añ os setenta.
Este pequeñ o trabajo puede servir como un texto en
miniatura kiyid c›f- cum-reference-guide to the field. del
término “tesauro”—más bien que el modelo de Ruget—
todavía se aplica a este trabajo mucho má s grande, má s
detallado y de mayor tamañ o: “un libro contiene un
depó sito de palabras de informació n sobre un campo
particular o una parte de los conceptos” (łYc6sfzr//
{};”una tesorería o un depó sito de conocimiento“.(0. -
Diccionario Word Engfisii). y muchos "textos se traducen
en glosas breves. Pero para la mayoría de los
consumidores, los textos y compen6ia má s grande
° ¿Tienen más de lo que quieren? *• saber ‹›r car2tnpurchase—
porque son realmente caros. Los glt»sarios, en cambio, son
demasiado breves. He aquí, pues, una guía más pequeñ a y
econó mica que las enciclopedias, pero más completa que las
glosas, ya que no se limita a la mera evaluació n educativa oa la
evaluació n de programas. También se refiere a la evaluació n de
productos, personal y propuestas, al control de calidad y la
calificació n de las muestras de trabajo, y a muchas de las
CE
“ •6
otras azeas iï'i que se practica la evaluació n disciplinada. tt
¢o s pm hcal suggesbons.and proceôures, comments'
y como así como definiciones y distinciones.
Donde funciona como un diccionario, es en la tradición de
Samuel Johnson. Diccionario ing/fsh en lugar de los
poderosos DEO, académico•pjesses no habría
aprobado
" su definición de avena ("Un grano, rico en Eyglané es
generalmente
aliado dado, a los caballos, pero en Siotland suppom los
pueblos).
* Si esto sirve como una referencia a la buena prá ctica y, no
solo al buen uso, es por supuesto má s breve que los
textos especiales o las enciclopedias, pero puede
proporcionar un buen punto de partida.
para una instrucció no que desee enfocarse en ciertos temas
en detalles considerables y proporcionar lecturas
personalizadas, asegurando al mismo tiempo que los
estudiantes tengan alguna fuente para desenredar) el
resto de la compleja red conceptual que cubre
““ ers th'este campo. Los estudiantes incluso lo han leído de cabo
a rabo como una precaució n para ver el curso de un semestre
en dos días.
Más pequeñ o que los otros textos, sí; ser má s crítico-má s
allá de la duda. Pero también posiblemente morempen
para cambiar; imprimimos tiradas cortas en Edgepress
para que la actualizació n no tengaa_Compele
inventar. Sé•N in-pousser-
mettons o sugge3tions, y reciba una copia gratuita del
siguiente
edición. TIYe rrfost sustancial o numerosas sugerencias
también ganan la elección de un hermoso libro sobre la
evaluación de nuestro stock de torres. •(En el momento de
escribir este artículo, tenemos repuestos tanto de
enciclopedias como de otros veinticinco volúmenes
importantes.)
Los criterios para la inclusió n de una entrada fueron: (a) al
menos unos pocos participantes en los talleres o en los talleres
lo solicitaron; (sujetador shert. cuenta era”posible; (C) la
cuenta se consideró “ú til, o en algunos casos—(d) el autor
pensó que debería incluirse para la” edificació n o diversió n
de profesionales y/o aficionados. Aquí hay más argot y jerga
actual de lo que normalmente sería reconocido por un
respetable.
publicació n académica, pero eso es exactamente lo que le da a
la gente la trou\de de musgo. (Y además, aunque parte del
sîang es desagradable, parte de él refleja la poesía y la
imaginació n).ness@f un nuevo campo mucho mejor que
ère pedestriaf'f' y iecbnic•J prosa).
' . En otros lugares, pero hay un poco, porque los participantes en
algunos talleres en servicio para profesionales no tienen
antecedentes estadísticos y encuentran ú tiles estas
pocas definiciones.
Hay * hundimiento tratar el proceso de contrato federal y
estatal porque esa es la forma en que se financia el régimen
de evaluación (y porque su uso es especialmente
omnipresente y misterioso). Se proporcionan algunas
referencias, pero solo unas pocas kev. porque demasiados
simplemente dejan el problema de los lectores de seleccionar
ció n sin respuesta. El scolai hará por lo general se refieren-
ences en.los pocos dados; ese fue un criterio para síyo o no
ellos. Siglas, además de un bJsic pocos, está n en un
suplemento, para reducir el desorden r. La lista deentrada
se ha beneficiado de
comparació n con la Encyclafiedia of Educational Eoeląa-
łipn (edsżAnderson, Bafi, Mu;phv et ał., Jossey-Bnss,
1976); pero aquí hay má s de 120 entradas sustantivas
que son min ESĘ. La tercera edició n tiene revisiones en
cada pá gina mpfiv de ellas extensas, y una veintena de
nuevas entradas {y varias docenas menos de errores
tipográ ficosł. Se han añ adido unas cinco mil palabras.
La Universidad de San Francisco, a través de ella
sorber rt
de el Instituto de Evaluació n, merece el primer lugar en un
listado de endeudamiento. En 1971-72, la Oficina de
Educació n de EE. UU. (encarnada en }Ohn Egerme)er tuvo la
amabilidad de apoyarme.programa de formació n
devek›pmgan‹fgiviriga en lo que luego caí en Evaluació n
Educativa Cualitativa en la Universidad de California en
Berkeley, y allí comenzaba el glosario de
que creció esta obra. Dos contratos con la IX Regió n de .
HEW, para ayudar a desarrollar la capacidad de
evaluació n del personal, me llevó de dar talleres allí a
desarrollar materiales que pueden distribuirse má s
ampliamente, ser má s detallados y usarse para referencia
posterior con má s frecuencia que las notas de seminario
de los estudiantes. Mis estudiantes y contactos en esos
cursos y talleres, como otros en Berkeley, Nova, USF,
AERA, CapitoF y en muchos campus distantes han sido
una fuente constante de mejora, = todavíanecesario para
formar y cubriendo este
más campo
espeCi
explosivo y explosivo; acabar con mis compañ eros y
clientes taa. a) Yo de estos, muchosGracias, y IO
jane Roth por su trabajo en el Eoaluafian original Saaezzs, del
que fue coautora en 1977, y a Howayd Levine por maR/
valiosas sugerencias sobre la primera edició n. Gracias también
a Sienna S'Zell y Nola Lewis por encargarse de la
comunicació n.complejidades de introducir y sacar esto de
nuestras fotocomponedoras Mergenthaler. No tienen la
culpa de un esfuerzo menor para reformar la puntuació n,
por ejemplo, mediante lusu9llv) omitiendo las comas
alrededor de "eg" ya que proporciona su propia pausa en
el
flmv;y cortando'o . uso de comillas simples, ya que
Nosotros y britá nico las acciones se invierten
Esta serie wo{kjstine oIa saldrá en 1981 -82. A lo largo
derrx›npt, solo aprovechar le en una
edició n de campo econó mica at (compuesto pero grapado
y no indexado), Nr Cogic a/ Evaluation, está completo y
estuvo disponible en e¡irly De-
cedro El frafuafirn de Instrucció n de Composició n con •Davis
and Thorñ as, un proyecto apoyado por Carnegie
Corporation, salió en noviembre. Una introducció n a la
evaluació n, que se llamará Principios y prá ctica
ció n, está prevista para febrero”8onger estudios!
pub-
• lished duripg este período infl déone oii evaluació n del
producto
en New Techniques Jor Evaluation (ed. Nick Smith,'Sage,
1981); uno sobre la evaluació n de la enseñ anza y los
maestros está en t-Mndb de 'Teacher Loaluation (ed. Jay
Millman, Sage, 19a); uno sobre la evaluació n de la
tecnología educativa está en Be FuWre of Education, (ed.
Kathryn Cirincione-Coles, Sage, 1981); y una monografía
“Overvi•w Evaluation” (foqusse‹i on education
evahiation) en Proc. No. Academia de Educatipn. Los
libros también se proyectan para este período en per-
sortnef evalualu unDtke Optiontechnology.) También
hemos publicado varios nú meros de un boletín
informativo sobre cuestiones metodoló gicas, notas de
evaluació n. Cuando en la primera de estas monografías
se proporcionan má s detalles sobre un tema al que se
hace referencia en los tesaunis, la abreviatura LV (para
Lo$;Ic de EoaluaHon) esusado. “
”fi
Tetmi escrito en negrita tiene su entrada debida; pero
esta bandera que distrae un poco no se ondea ni una sola
vez en ningú nEntrada.

RENDICIÓN DE CUENTAS' Responsabilidad para la


justificació n de gastos, decisiones o esfuerzos propios.
Esto es pr6-ers y teacL.ers s@ }ild be, se dice a
menudo,
responsables de sus costos, salarios y tiempo, o
responsables de los logros de los alumnos. 'fél término
también se usa para referirse a un movimiento hacia
aumentarased justificació n. Por lo tanto, la rendició n de
cuentas exige algú n tipo de evaluació n de la eficacia en funció n
de los costos; no es suficiente que uno pueda explicar có mo
gastó el dinero ("responsabilidad fiscal"), pero también se
espera que uno pueda ° i• stiJ esto en términos de los
resultados obtenidos.
« En ocasiones, los docentes han sido considerados totalmente
responsables de
los puntajes de rendimiento de sus estudiantes, "lo cual, por
supuesto, es completamente inapropiado ya que su
contribució n a estos sciores es só lo uno de varios factores
(apoyo de los padres, de los compañ eros y del resto de la
escuela em nment fuera del aula son las otras influencias
citadas con má s frecuencia}. Por otro lado, un maestro
puede ser apropiadamente responsable por el fracaso en
producir el mismo tipo de logros de aprendizaje en sus
alumnos que otros maestros logran con alumnos
esencialmente similares. Una falacia comú n asociada con la
rendició n de cuentas es suponer que la justicia requiere la
formulació n de metas y objetivos precisos para que haya
alguna responsabilidad; pero de hecho uno puede ser
retenido en cuenta-. capaz por lo que uno hace, incluso
dentro de las con-cepció n de profesional trabajo, por
ejemplo, para "enseñ ar estudios sociales en el
duodécimo grado", donde uno podría estar eligiendo
un tema nuevo (no prescrito) todos los días, o cada
hora, a la luz de su mejor juicio en cuanto a los eventos
sociales contemporá neos y la clase. las capacidades lo
hacen apropiado. Menos especificidad hace que la
definició n sea má s difícil, pero no imposible. Los
capitanes de los barcos son responsables de sus
acciones en circunstancias totalmente imprevistas. Es
cierto, como-nunca, que cualquier proceso de prueba tiene
que ser muy cuidadoso[y seleccionado y aplicado
tf,educativo la rendició n de cuentas debe hacerse cumplir
de manera equitativa; esto no significa que ella prueba
debe coincidir a lo que está bien fusionado lo que está
enseñ ado puede haber sido elegido incorrectamente),
pero significa que la prueba debe ser cuidadosamente
justificada, por ejemplo, por referencia
," a condiciones razonables ex 4atj9ns en cuanto a lo que
debería haber sido (o podría haber sido justificadamente)
cubierto, dada la "necesidad y habilidad de la estudiantes.
-”
ACREDITACIÓN La concesió n de credenciales, en particular
la concesió n de la afiliació n a una de las asociaciones
regionales de instituciones educativas o una de las
organizaciones profesionales que intentan mantener cierta
calidad. estándares fo mbership. El "proceso de
acreditació n" es el proceso mediante el cual estas
organizaciones determinan la elegibilidad para ser
miembro y fomentan la superació n personal para lograr
o mantener ese estatus. El proceso de acreditació n tiene
dos fases; en el primero, la institució n emprende un
ejercicio de autoestudio y autoev)uació n frente a su
propia declaració n de misió n. En la segunda fase, la
comisió n regional de acreditació n envía un equipo de
personas familiarizadas
' con instituciones similares, para examinar el autoestudio y
sus retults, y mirar a un ver}' gran nú mero de
características de la institució n, utilizando los datos que
debe proporcionar la institució n junto con una lista de
verificació n (£»afuafioe, Criteri es
4 newn‹›i estos, publicado por The National Soc
para la Evaluació n Escolar), que luego se reú nen en ar. proceso
de síntesis informal. en la primaria nivel, las escuelas
normalmente no se visitan (aunque hay uno de los handfiil
F de comisiones regionales de acreditació n que es una excepció n a
esta): en lo alto nivel escolar una visita sustancial del
equipo es involucrados, y lo mismo es cierto a nivel
universitario. Acreditar-profesional las facultades, en
particular la facultad de derecho y las facultades de
medicina, también está muy difundida y está a cargo de
las organizaciones profesionales pertinentes; opera de
manera similar. Acreditació n de escuelas de educació n
que conocen las credenciales,
por ejemplo, para la enseñ anza en escuelas elementales, es
doni por el estado; allí. es también una organizació n privada
(NCATf) que evalú aates spch escuelas. Existen graves
problemas con el proceso de acreditació n tal como se
lleva a cabo actualmente, en particular su tendencia hacia
el rechazo de las innovaciones simplemente porque son
desconocidas (naturalmente esto se niega); su uso de
equipos no calificados en los Está ndares ahora aceptados
para la evaluació n seria de programas; su desinterés en
mirar los logros de aprendizaje. contra{ con indicadores
de proceso; la inconsistencia entre su prá ctica y la
afirmació n de que acepta los fines propios de la
insù tuù on; el sfiamd-hias pfoblerrp el

rdc 11: I ›
brevedad de las visitas; el veto institucionalun dle-
de- sesgo del camino en la selecció n de los miembros del
equipo; la la
con costas: y así sucesivamente (LE). Ver
lnstitutienatfivaluntion.
ACHIEYEMŹNT vs APTITUD ÉL APTITUD/
LOGRO DISTII obvio suficiente
que hay una diferencia B dos presunciones de
Mozart há bilmente tiene una actitud má s temprana para el
piano que usted o yo, incluso si nunca le habían mostrado
uno. Pero la metodología de prueba estadística siempre ha
tenido dificultades con la distinció n porque las estadísticas
no son lo suficientemente sutiles para hacer frente a la
punto de la distinción, del mismo modo que no es lo
suficientemente sutil para hacer frente a la distinción entre
COrrqlation y causalon. Porque nadie tiene logros si no tiene
aptiNde, por definición, por lo que hay una correlación
unidireccional, y es muy difícil demostrar que alguien tiene
una aptitud sin darle una prueba que realmente mida el logro
(al menos embrionario). Los temerosos tipos de prueba han
sido llevados algunas veces a negar que haya algunaNo/
distinción, mientras que el hecho es sólo que carecen de
las herramientas para detectarlo.

calladamente simple; y la distinción entre una capacidad


(una Aptitud) y un desempeño manifestado (logro) es
conceptualmente perfectamente clara.Empíricamente, Puede
que nunca encontremos algo bueno pruebas de aptitud
eso no es pruebas de mini logros.

ACCIÓN INVESTIGAR A subcampo poco conocido en el


ciencias sociales que pueden ser vistas como precursoras de
la evaluació n.
ACTORES La jerga de las ciencias sociales (y ahora
e4aluań on) Término para aquellos que participan en una
evaluació n, típicamente evaluando uador, cliente y evaluado
(si una persona o su programa es
” siendo evaluado). Puede “también usarse para referirse a
todos los activos•
partes interesadas
ADMINISTRADOR EVALUACIÓ N Una especie de
evaluació n personal que ilustra muchos de los
problemas de teac?zer evJéatiou en el sentido de que no
existe una evaluació n superior demostrable. estilo
administrativo (e.8- Con respecto al estilo democrático versus
liderazgo autoritario), cuando el criterio de mérito es la
eficacia, en lugar del disfrute. Los tres componentes
principales de la evaluació n administrativa deberían ser:
(a) anó nimos;
mus holístico rahng nr oó serve& actuació n como un
administrador, esposa una oportunidad para dar razones o
ejemplos, por todos aquellos “significativamente
interactivos” con los individuos en cuestió n. La
identificació n de este grupo —nunca necesita má s de una
docena— se hace mediante una solicitud previa de una
lista al administrador para ser evaluada. a lo cual se
adjunta el comentario de que la bú squeda también será
instigada por los grupos en el otro extremo de la
interacció n; (b) estudio de medidas objetivas de eficacia,
por ejemplo, tiempo de vuelta. sobreurgente materiales
usados, indicadores de producció n, rotació n de personal,
etc.; y (c) pruebas de papel y lá piz o entrevistas o
simulació n de conocimientos y habilidades relevantes, en
particular de nuevos conocimientos y comprensió n que se
ha adquirido.
* Se ha vuelto importante desde el momento de la ú ltima
revisió n. Este tipo de evaluació n se puede vincular
fá cilmente con la capacitació n en el servicio, de modo
que sea una experiencia productiva y de apoyo. Lo
normal
La evaluació n del administrador de farsa pi a través del
i'rendimiento o los objetivos de comportamiento no es
del todo una oportunidad principal para el
, . con artista explotar, no es só lo indefendible•. Debido a la
gran cantidad de aportes de la mayoría de las personas que
tienen la mayor parte del conocimiento evaluativo
relevante, también es altamente destructivo.de
Maeagement mativo debido a la falta de recompensas
por
, manejando “objetivos de oportunidad”—ind&d, hay usu-
, aliado ir (âctn castigos por tratar de introducir ellos como
nuevos objetivos. (También tiene las otras debilidades
de cualquier meta y evolució n). El II es aceptable como
un cuarto componente con el mismo peso que los tres
anteriores, si se tiene cuidado.
administrado. Los administradores suelen estar nerviosos
por el tipo de enfoque enumerado como preferible aquí, haz
una pausa ellos con razón
" comprender que la mayoría de las personas con las que en-
.eract tener un bonito mala comprensión de la»8minist
extenso de ator responsabilidades y cargas. el cuestionario
debe, por supuesto, delimitar con bastante cuidado el solicita

respuesta a la calificació n (holística/) de los


comportamientos oi›sert›ados, y la rés4mf-.
la objeció n es atendida por la naturaleza integral del grupo
respondiendo (compañ eros, superiores y subordinados),
complementado por las medidas cibjective.
ADVOYF£-ADVERSARY EVALUATIO1"£ (EL ADVOYF£-
ADVERSARY EVALUATIO1"£ (EL
VERSARIO ENFOQUE tipo de evaluació n en cual, ,
durante el proceso y/o, en el informe final, presentaciones
son realizadas por individuos o equipos cuyo objetivo es tq
proporcionar
el caso más fuerte posible a favor o en contra de un punto de vista
•• particular o

I>
,¼3"
evaluació n del programa (etc.). Puede o no haber un intento
de proporcionar una síntesis, tal vez por medio de un juez o
un jurado o ambos. Las técnicas se desarrollaron muy
extensamente a principios de los añ os setenta, desde el
ejemplo inicialen el que Stake y Denny estaban el
defensor y el adversario (la evaluació n de TCITY), a
través de Bob Wolf, Murray
«Levine, Tom Owens y otros. Todavía hay grandes dife-
dificultades para responder a la pregunta: "¿Cuá ndo da
esto una mejor imagen y cuando lo hace tender falsificar la
imagen de un programa? La bú squeda de la justicia, donde
confiamos en laadxersarv approach—no es lo mismo que
la bú squeda de la verdad; sin embargo, hay grandes
ventajas en afirmar e intentar legitimar valoraciones
radicalmente diferentes, por ejemplo, el elemento
competitivo. Uno de los fenó menos reactivos má s
interesantes en la evaluació n fue el efecto del abogado-
adversario original, •.valuació n; muchos miembros de la
"audiencia" estaban extremadamente molestos por el
hecho de que el informe del adversario, muy crítico, se
había impreso como parte de la evaluació n. No pudieron
tentar esta reacció n mediante el reconocimiento de la
legitimidad igual otorgada a la posició n de abogado. La
importancia de este fenó meno es en parte que revela las
enormes presiones hacia una evaluació n insulsa, ya sea
que sean explícitas o superficiales. uno podría pensar
que no hay mucha diferencia entre dar el mismo estatus
a dos puntos de vista contradictorios y dar una
presentació n meramente neutral. Pero el efecto de la
audiencia muestra que este no es el caso; y, de hecho,
una ló gica má s orientada a la prá ctica sugiere que el
primer método de presentació n transmite informació n
importante que está ausente en el segundo, a saber, el
rsîigr de interpretaciones (scnably) defendibles. Véase
también Relativ-

ENFOQUE DE EQUIPOS ADY ATE tstufflebeam) No


debe combinarse con el enfoque de defensor/adversario
para la evaluació n. Un procedimiento para desarrollar en
detalle las principales opciones para un tomador de
decisiones, como preliminar a una evaluació n de las
mismas. Parte o la fase de entrada en el modelo de
evaluació n CIPP. Véase también Competidores críticos.
EVALUACIÓN ESTÉTICA A menudo considerado, por
ejemplo, por los científicos sociales como esencialmente
la articulació n del prejuicio, puede implicar un
componente objetivo sustancial. Ver Archi-

5
tectuzal EvaJuatźon, Ltterary Críticas
POBLACIÓ N AFECTADA Un programa, producto, etc.
impacta a los verdaderos consumidores ya su propio
personal. En la evaluació n de programas, ambos efectos
deben ser considerados, aunque son bastante diferentes.
posiciones éticas. En un momento, parecía que el
programa Headstart se justificaría (ú nicamente) por los
beneficios que aportaba a quienes lo utilizaban.
A£FECTTVfi (8 telares) sentido al
original;
dominio del afecto .. A menudo se toma como el mismo que el
domaiŚ
de sentimientos o actitudes. Dado que estos, a veces se confunden
. con creencias, cabe recordar ese efecto debería también
distinguirse de los dominios cognitivo y psicomotor. Por
ejemplo, a menudo se dice que la autoestima y el locus
xml.control son valores efectivos, pero muchos ítems o
preguntas de entrevista que se dice que los miden en
realidad llaman para la estimación de la valía personal y
tasaciones o juicios de lugar de control, que son
afirmaciones directamente proposicionales y, por lo tanto,
cognitivas. Errores como este a menudo surgen de la idea
de que el ámbito de la valoración no es apropiado. pero
meramente actitudinal, una falacia típica de la libre de valores
ideol- ,
ogv en las ciencias sociales, mientras que algunos ¡valores
personales• son actitudes evidentes y, por lo tanto, pueden ser
considerados afectos, algunos valuahń ns —ya sea que causen o
no ciertas actitudes—
son afirmaciones comprobables científicamente. Nótese la
diferencia entre “Yo(Anguila perfectamente capaz de manejar
mi propia vida, seleccionando una carrera y una pareja
apropiadas, etc.” y yo n/H perfectamente capaz, etc.” (O "1
/ee/ este programa es realmente valioso para mí" frente a
"Este programa es realmente valioso para mí".) Las
afirmaciones sobre los sentimientos son autobiográficas y
las fuentes de error mienten y carecen de conocimiento de
los elfos. Las afirmaciones sobre el mérito son externas.
afirmaciones mundiales y verificadas o falsificadas por
evaluaciones. medidas, más allá de las más simples
expresiones de placer, actualmente es extremadamente
, dudoso porque de (a), estos conceptual confusiones entre afecto
y cognición, (b) falsificación deliberada de respuestas, (c)
tergiversación inconsciente, (d) suposiciones dudosas del
intérprete, por ejemplo, que los aumentos en la autoestima son
deseables (obviamente falso más allá de un cierto
(desconocido) punto), (e) invasió n de gń vacy, (f} ausencia
de incluso
validació n bá sica, (g) alta labilidad de muchos afectos, (h)
alta estabilidad de otros afectos. No hace mucho, escuché a
un experto, sav

6
que ú ze solo kriown-valida medida de afecto se relaciona con
Izxus de conbol y Stint \s fi:xeä por la edad de dos el puede
tener

ACCIÓN AFIRMATIVA A menudo incorrectamente,


como una impoeiació n atfmmis rnä ve sobre la
evaluació n "adecuada" o "científica", o como un requisito
ético (igualmente separado
frpm el realj•mcess ot evaluació n). Este "complemento"peroep-

• 'hon es uno incluso por qué womerú ninnriä es son'todavía de


Já cİn discriminados incluso por tbpse con th4 mejor inter;-
&Respuesta Los groseros excesos de'muchos afirmaä vemin
pm
No se debe permitir que los programas oscurezcan la razó n
fundamental científica (tan web como ética) subyacente a los
procedimientos especiales que igualan el tratamiento de los
acusados de grupos contra
dLsrrímínatìon sostenida en el pasado.
Evitar el ö isbarment de
el nepotismo y evitar ine)e,vant jab-reąuú emenD son
dos ejemplos de unos términos que se requieren para
que la prueba pueda seleccionarse. (La oposició n a la
acció n afirmativa cree que representa necesariamente
una /efucció n de compromiso con
Oh mérito.) Ver
noviembre de 1998l.
ANALÍTICO (evacuació n) Por contraste con holístico
evaluació n que podría llamarse mamá alua'hon
(por analogía con la macroeconomía) la evaluació n analítica
es microevaluació n. Hay cinco variedades principales:
componente
evJuaŃon y diaienaional cvaluación. Estápensamiento oßen
que el análisis causal o las sugerencias correctivas son
parte de aną}y'ńc (típicamente formahve) evaluación, pero no
aze en hecho parte de eYaluańon en absoluto, estrictamente
hablando (£5}.
As .HORiNc ‹axcuoR æusi iænø «ai•o
que utilizan nú meros (p. ej., 1-ó , ł-ł0) o letras (AF}
normalmente deben proporcionar la traducció n de Anne del
etiquetado — la escala, o al menos las juntas finales y el
punto medio. Es comú n, al proporcionar estas anclas,
confundir el lenguaje de calificació n con el lenguaje de
escritura, por ejemplo, definiendo AF como "Excelente"....
Promedio... P‹x›r” que tiene dos absr•lute
y un descriptor relativo, por lo tanto, es inú til si la mayoría de
los evaluandos son o pueden ser excelentes (o deficientes).
Algunas, probablemente la mayoría, anclas para las
calificaciones con letras crean una distribució n asimétrica del
mérito, por ejemplo, porque el rango deactuaciones ,
que D (potencialmente) describe es má s estrecho que el ß
rango; esto, invalida (aunque posiblemente no seriamente) el
.. numérico conversió n de calificaciones con letras calificar
puntos (££). Puede que ser una virtud, se con 've rsio es iiot
esA'ntiaI. En otro pero reIate§ sentido de anclado, es@eans
croeslibraon de
por ejemplo, varias pruebas de lectura, por lo que ai para
identificar (má s o menos)
puntuaciones equivalentes.
znoxvxrrr nï preservació n del anonimato de
encuestados a veces requiere un ingenio muy grande.
Aunque incluso los sistemas a prueba de balas no
logranrespuestas de todos en evaluació n personal, porque
Debido al sesgo del contrato de aeczet, los sistemas con
fugas no obtienen la honestidad de casi nadie. Los nuevos
requisitos legales para las Gies abiertas tener más en
peligro de extinció n esta cnicial fuente de evaluació n
aporte; perono sin una adecuada base ética. El uso de un
*.“filtro“ {una persona que elimina información de
identificación, normalmente el perto•i a cargo de la
evaluació n) suele ser esencial; un buzó n de sugerencias,
un teléfono con una grabadora con la que los
encuestados pueden hablar (disfrazando su voz), listas
de verificació n que evitan la necesidad de una escritura
mal escrita (reconocible), formularios que se pueden
fotocopiar para evitar identificadores de marca de agua,
dinero en lugar de las estampillas o los sobres con
respuesta pagada (que se pueden codificar de manera
invisible) son todos Jkissibility. Otros problemas típicos:
¿Qué sucede si desea proporcionar una respuesta?
¿Có mo puede saber a quién recompensar? a un
encuestado en gran angustia)? Hay respuestas complejas,
y las preguntas
ilustrar la medida en que este problema en la evaluació n diseñ o _
nos lleva má s allá de la técnica topográ fica está ndar. res. •
APLES & NARANJAS (“Comparando manzanas
A
naranjas”) Ciertos problemas de evaluación evocan la
queja, particularmente de individuos capacitados en las
ciencias raciales tradicionales, de que cualquier solución
sería “como cortar manzanas y naranjas”. Un análisis
cuidadoso muestra que no existe un verdadero problema
de evaluación (en oposición a un ›‹nidimensionaI
• {problema de medición) implica la comparación de diferentes
cantidades, con la intención de lograr una síntesis. Es
elnaturaleza del 2›este. Por otra parte, lejos de ser
imposible, el símil mismo sugiere la solució n; hacemos de
Por supuesto comparar manzanas y naranjas en el mercado,
seleccionando ” una u otra sobre la base de varias

consideraciones,
* como tost, calidad relativa a la está ndares apropiados
para cada fruto, el valor nutricional y las preferencias de
aquellos (o a quienes estamos pux kasing. De hecho,
comú nmente consideramos dos o má s de estos factores y
amalgamamos a nivel nacional).
' acoplar los resultados en una compra adecuada. Si bien hay
ocasiones en las que las consideraciones que se acaban de
mencionar no apuntan a un solo dueñ o, y la elecció n puede
hacerse
arbitrariamente. este no suele ser el caso. Compuesto por
las manzanas y la dificultad de las naranjas es una buena señal de
que
, el quejoso no ha pensado mucho en la naturaleza de
evaluación .,
PROPORCIÓN z T‹AL TIOx, DISTRIBUCIÓNi
Los tenderos .o resultado de dividir una cantidad dada de
recursos entre un conjunto de demandas en
competencia, ej. dividir un presupuesto entre
programas; este es, de hecho, el problema definitorio de
la ciencia econó mica, pero que generalmente no se
aborda directamente o no en términos prá cticos dentro
de la economía.
literatura económica, presumiblemente porque cualquier
solución requiere hacer suposiciones sobre la llamada
"comparación interpersonal de utilidad", es decir, el valor
relativo de proporcionar
, mercancías atlifferent ir dividuals. TBus el concepto sin valor
. ció n de lo social científicos tabm para proporcionar practica ,
soluciones al problema de la distribució n. (Ah excepció nes •
el enfoque de presupuesto de base cero—difícilmente se le puede llamar
'una literatura, y rara vez se hace referencia a ella en un
texto de economía,) Apportiouvrent es un predicado de
evaluació n separado, distinto de grading y iaU»g y •cö ring
aunque todos ellos está n involucrados en él; es, como ellos,
uno muy prá ctico.manera cal de mostrar la estimació n de
uno de Norte relativo, y de todos los predicados de
evaluació n es probablemente el más cercano a la
'decisió n proceso de evaluació n modal de los creadores.
Varios
evidentemente Rons inapropiados son con bastante frecuencia
usar.',
por ejemplo, el ”a través del tablero cortar solo
recompensa el aumento de los presupuestos y, por lo tanto,
automá ticamente "conduce a in-' acolchado arrugado al añ o
siguiente, pero eso además resultados en algunos fondos a
continuación thd nivel de "masa crítica", un completo
perdida de dinero. Otro inapropiado solución implica
programa de preguntas gerentes para asegurarse niveles de
recorte: esto, por supuesto, da como resultado la estrategia de
chantaje de establecer niveles de masa crítica demasiado
altos, para obtener más de lo absolutamente necesario. El
único tipo de solución apropiado


* I lobos so' te evaluación por una persona externo al pro-,
g#aoi, típicamente en conjunto con el programa r§anagey; y
la primera tarea de talren debe ser para
eliminaranytking tkat parece gordo en el presupuesto.
Pasos posteriores en el proceso involucrar segmentafioo
de cada programa, idenfifica- ción de articulaciones
alternativas del segmenb, gzyding de .
” * la rentabilidad cd los sgsterfis progresivamente más grandes en
cada secuencia de complementos, y la consideración de las
interacciones entre n componentes del programa que
pueden reducir el costo de
cada '¢t certairi @ints. Dado un estú nate de el “valor de
retorno” del dinero, qué bueno sería si no usado forman este
conjunto de programas), y el compromiso ético (o democrático)
de primar facie igualdad de interpersonales valor, uno
entonces es un algoritmo efectivo cuatro gastando el
presupuesto disponible de la manera más efectiva camino. Por
lo general, se dará el caso de que parte de la financiación
de cada uno de los programas ocurrirá (a menos que la masa
crítica mínima sea demasiado grande), debido a la disminución
de la utilidad marginal de los servicios para cada una de las
poblaciones impactadas (semi-superpuestas), el largo plazo
.la conveniencia de retener la capacidad en cada área, y la .
consideraciones políticas involucradas en llegar a nú meros
má s grandes. El proceso que se acaba de describir, aunque
desarrollado independientemente, es similar a un
procedimiento para la presupuestació n de base cero, una
innovació n de la cual la Administració n Carterhizo un buen
trato en los primeros añ os de su presidencia; pero nunca
surgió una discusió n seria sobre la metodología, y la
prá ctica estaba naturalmente muy por detrá s de eso.
(Véase Eye/usNoo Nzz‹/s, diciembre de 1978). En el
nivel informal pero muy prá ctico, el prorrateo nos
recuerda el gne de
, los ejemplos más brillantes de la metodología de control de
sesgos en toda evasió n: la solució n al problema de dividir
un
.irregula porció n separada de comida o tierra en dos
partes justas acciones—yo dividir•<,gnd Yo elegiré. Esta es
una micro-versió n de la "velo f ign@ance “o
enfoque de probabilidad antecedente parat
jusó ficahan de justicia y ethi« en Rawls, J
Tffcozy /usficr (Harvard, 1971), y derivado, Primazy fifii
p/iy (btcGraw-£lill, t9ó6). es No sorprende que
la ética y la evaluació n compartan una frontera comú n, ya
que la justicia a menudo se analiza como un concepto
distributivo. La distribució n puede ser ló gicamente
reducible a i complejo muy complejo
combinació n de calificació n y clasificació n, en escalas
mú ltiples; pero lo contrario también es probable. En

cualquier caso, puede ser mejor usar


o Predicado posiblemente redundante al establecer los
fundamentos lógicos de la evaluación, como lo hacemos
en matemáticas o simbología.

AROIITECTURAt. EYALUA ON Como la


evaluación de historias de detectives y muchos n@els
(verVoy a crid- implica un marco
iif kigic y un ekir. de
estética; es hequendytrato, as i(.only oneé of
tljese componentes es importante. La solución a los
problemas deconservació n de energía á rida, el uso de
duradero
accesorios que no sean demasiado caros, la provisión de
espacio de piso y almacenamiento, méettng tie
mquizemmD'of exe passion, budget, security and Uh law;
estos aze lo logico

Semana Santa para lograr. Desafortunadamente, azfihitectuze


tiene un registro deficiente de aprendizaje por experiencia, es
decir, un comité de evaluación deficiente, cada nueva escuela,
el edificio incorpora errores y tipo de tamaño inactivo (por

ai'. -g,n«:•» ,., .


ejemplo, entradas en el aula, en el frente del salón). ) y colegios
d e a r q u i t e c t u r a w h e n _ d e s i g n e t t por
ellos y V'd \y
Lu :
pvaluatozg que escriben informes legibles solo por
evaluador) Es significativo que el concepto de la
Fundación Ford ción de un centro de arquitectura escolar
kas, después de varios años'agezaâan, enfurruñarse sin:
un rastro.
AROII$'ES Depósito, de registros en los que, por
ejemplo, min- actas de reuniones clave, presupuestos
antiguos, evaluaciones previas y
qthprAnnddmKamlomted.
*RGM4# AWON ¿Qué dijo que la
evaluación? es una forma de fargumentación(Epgfuaf?
qg'Wffh V'p//dify, Sage, 1'980J y, por lo tanto, esa información
al respecto. puede estar implícito enestudios de
aprendizaje sub:h como la 'Nueva Retó rica'. Se podría
agregar la literatura del movimiento i Um mci fpgfr.
ARTEFACTO para, ARTEFACTO) (de un experimento,
evaluación, procedimiento analítico o estadístico) Un resultado
artificial, uno simplemente debido a (cinado por) los señuelos
investigativos o analíticos utilizado en un experimento, un
evaluación, o análisis estadístico, y no una propiedad
real del fenómeno investigado. (Por ejemplo, efecto de
techo eee.) Típicamentedescubierto y en buenos
diseños protegidos mediante el uso de múltiples
métodos independientes de investigación/

CE
EVALUACIÓN A veces se usa como snó nimo de
evaluació n, pero a veces se usa para referirse a un
proceso que es má s centrado en enfoques cuantitativos
y/o de prueba; elcantidad puede de dinero pas en
evaluació n de bienes raíces), o nú meros y puntajes
(como en la Evaluació n Nacional del Progreso
Educativo). La gente a veces sugiere que la evaluació n
es menos un juicio y má s una medida pfoceso *
que ciertos otros tipos de evaluació n; pero podría ser ar-
adivinadoque es simplemente un caso de evaluación en
el que el juicio se construye en los resultados numéricos.
Puntuaciones brutas en unprueba de contenido o
construcció n no conocida la validez no seria' evaluación;
esoes solo cuando la prueba es (supuestamente) de nivel
bá sico
” competencia matemá tica, por ejemplo, que informar los
resultados constituye una evaluació n en el sentido apropiado
y, por supuesto, el juicio de validez es el elemento evaluativo
clave. componente en esto.
ATTZN£/ATtON (Stat.) En el sentido técnico esto se
refiere a la reducció n en la correlació n debido a errores
de
r medició n.
ACTITUD, EVALUACIÓN Ver ev u a c i ó n SLita.
ACTITUDES El conjunto de variables cognitivas y
afectivas que definen la disposició n mental de una persona
hacia otra persona, cosa o estado. Puede ser evaluativo o
simoly prefJ- rentid 1; es decir, alguien puede pensar que
correr es bueno por
.usted, o simplemente disfrutar ii, o ambos; disfrutarlo no implica
pensar que es meritorio, ni arroz escueto, contrario amuchos

Sugerí aná lisis de actitudes. Los attítidos son


comportamientos hnm inferidos, incluido el
comportamiento del habla y los estados internos.
Cualquier persona, incluida la persona cuyas actitudes
estamos tratando de determinar, es infalible sobre las
conclusiones actitudinales, aunque esa persona se
encuentre en una posició n infalible con respecto a sus
propios estados, que no son los mismos.
como actitudes. Note que no hay línea de arpa entre las
actitudes y la cognició n; Muchas actitudes se evidencian
a través de creencias (que pueden ser verdaderas o
falsas), algunas actitudes pueden evaluarse a veces como
correctas o incorrectas, o "buenas o malas", de manera
objetiva. manera (por ejemplo actitudes hacia “el mundo
debiendo uno una vida”, trabajo, mujeres (hombres),
etc.). Ver Afectivo.
ATRITIOhl La pérdida de sujetos en los grupos
experimentales o de control/comparació n durante el
período de este estudio.
Esto es a menudo tan grande como para destruir el diseño
experimental-6 I96 menos dentro'a año "no es raro en el
• escuelas. Por lo tanto, toda elecció n de nú meros en los
grupos debe basarse en una buena estimació n del desgaste
más una cantidad subetancial.margen de error.
AUDIENCIA (en el sentido de Robert Stake) Un grupo,
ya sea que sean o no los clientes, que verá o debería ver
y puede usar o reaccionar ante una evaluació n. Por lo
general, hay varias audiencias, y tca $ una
evaluació nreportero la presentación necesitará una
planificación cuidadosa para servir al
varias audiencias {\ ces razonablemente bien.
xuon, AUDVOR palmaditathe ongina sentido o
. este término, que se refiere a un cheque en los libros de una institución
ció n por un contador independiente, el uso de la evaluació n de »
el término se refiere a una evaluació n de terceros o una valoració n externa.
ció n, a menudo de una evaluació n. Por lo tanto, y este es
el uso está ndar en California, un auditpr puede ser un
evaluador mets, que normalmente desempeñ a un papel
formativo y sumativo. En el uso má s general, un auditor
puede ser simplemente un evaluador interno. trabajando
para el mismo cliente que el evaluador principal o para
otro cliente. Hay otras ocasiones
siones cuando el aud.tor está a medio camino entre el tipo
original de auditor y un auditor de evaluación; por ejemplo,
el AudjtLa Agencia de HEW (ahora HHS/ED) se creó
originalmente para
monitorear el cumplimiento de las pautas fiscales, pero su
personal está ahora ixequHil y mirando ał la metodología
y la eficacia general de las evaluaciones. Lo mismo se
aplica a las “auditorías” de GAO y OkłB.
EQUILIBRIO DE PODER Una característica deseable
del entorno social de una evaluació n, resumida en la
fó rmula: "ser poder, la relació n entre el evaluador, el
evaluado y el cliente debe ser lo má s simétrica
posible". Por ejemplo, los evaluados deben tener
derecho a tener sus reacciones a la evaluació n y
evaluador(es) adjunto(s) al informe cuando se envía
al cliente.” De manera similar, el cliente también debe
comprometerse a ser evaluado en la situació n típica
donde el contrato identifica a Alguien má s como el
evaluado.( Los administradores escolares que no
está n siendo evaluados correctamente tienen pocas
posibilidades de que los maestros sean evaluados
críticamente.)
'' I '

un equilibrio de wer, ni una pulgada de azul como se percibe


convencionalmente. Hay albañ iles tanto éticos como
políticos/prácticos para organizar un equilibrio de poder.
BASEI, fNE (datos o medidas) Datos sobre la condició n ,
tiofi o rendimiento de sujetos antes del tratamiento. El

Acercarse. La recopilación de datos de referencia es una de


las razones clave para iniciar una evaluación antes de que
comience un programa, algo que siempre parece extrañ o
para los buró cratas presupuestarios. Ver

LISTA DE VERIFICACIÓN BÁSICA El multi-punto - lista de


verificació n para evaluar productos, programas, etc., que se
encuentran en Key

OBJETOS DE COMPORTAMIENTO Geles específicos


de, por ejemplo, un pmpam,establecidos en términos que
permitan verificar su consecució n mediante la observació n
de medidas. Una idea que se presenta indistintamente como
1'984/Skinner/deshumanizante, etc., o como requisito
mínimo para evitar los verbalismos vacíos. Algunas personas
ahora usan "objetivos medibles" para evitar el miasma
asociado con las connotaciones del conductismo. Ural, las
personas son nuevas más ioléfi- ant o(objetivos que
comieron algo más abstractamente especificados„siempre y
cuando que conduce condición de verificació n/fa!sihca'tion
ciones se pueden explicar, 'de lo que eran en los primeros días de
el movimiento de los objetivos conductuales, en los añ os 10.
Esto se debe a que el intento de deletrear todo {y omitir la
declaració n de objetivos de nivel intermedio) produce
7633ser-

comportamiento objetivos por leyendo, cual es un desorden


incomprensible. Así, la investigación educativa ha redescubierto
la razó n del fracaso del movimiento precisamente análogo de los
filó sofos positivistas de la ciencia de eliminar todos los términos
teóricos en favor de términos observacionales. El ú nico requisito
científico legítimo aquí es que los términos tengan un usuario
confiable.
y s,avaricia-iipuii tontnit empírico no como/iorf traducció n en
esto ú ltimo es solo una forma al
ex y no siempre posible Por suerte, científico
la formación puede conducir al uso fiable (suficiente) de
conocimientos teóricostérminos, es decir, se pueden
descomprimir en los indicadores medibles contextualmente
relevantes a pedido. Esto evita la pérdida de los principales
organizadores cognitivos por encima del nivel taxonómico y,
por lo tanto, de toda comprensión, lo que

z3“
incluso si se
aplica la misma opinión a TÍTULO \f5€' DE SOfN9-

SEIA Una condición en una evaluación u otro diseño,


. onu
. .. .
ezazriple, una muestra de la estudiante matriculado en un la
escuela está sesgada contra los grupos económicos más bajos
si es seleccionada fñxn
mi thosé presettt,un día en particular
desdeabcenteeismratesaze por lo general h
entre los grupos económicos más bajos. Por lo
tanto, si
estamos investigando un pffec t es decir, clase nómica,
usando,su¿h a muestra \vouid ser defectuoso d 'firmar. Eso
ES común y incorrecto suponer que {fuerte) prelei-
entes a:s blases, eg :x»alguien que expresa puntos
de vista en contra del uso de autobuses para lograr
la desegregación a menudo se dice que es parcial.
(Véase el glosario de Eoein«fionSf d«r&, McGraw
Hill, 1'9&I; donde biae se deriva erróneamente como

‹oiisistcnt alif ii ymt con un punto de noveno.”) Esto es cierto solo ,
donde los puntos de vista son injustificados,
•.e„ involucran o probablemente conducirá n a errores.
Inicialmente es cierto si las vistas son
meramentepolémico- uno haría sckzcel}' azgud' que %tievers
en átomos son
negado por ChAs'han Scien'hsD. Uno seis veces necesita un
juez en una disputa que es nentml orocczpfoh/r fa etl/ortizsor to
los attdíeritrs: esto debe ser distinguido de un6i«sed. Ser
neutral es a menudo una sión de error en una disputa dada,
es decir, unasigno de sujetadores. Los paneles de
evaluación generalmente deben incluirSe evalú e a
personas reconocidas y conocedoras con fuertes
compromisos tanto a favor como en contra de cualquier
enfoque, programa, etc., que se evalú en (cuando tales
facciones existan) y no se debe intentar seleccionar solo
panelistas neutrales. al costo habitual de seleccionar
ignorantes o cobardes y preparar informes superficiales
y fá cilmente descartables. La facció n neutral, si tiene el
mismo conocimiento, debe estar representada
' como cualquier otra facció n. Seleccionar un aire neutral
puede ser una buena psicología o política (y eso es parte
de una buena evaluació n).tien diseño, también), pero no
porque es más probable que él / ella
sé un buen juez. Ver también Shared 81a, 5Kectivltyblao
PARCIALIDAD COhfTROL Una llave parte de evaluación
dcsign; estáno es un intento de excluir la influencia de puntos
de vista definidos sino de puntos de vista injustificados, por
ejemplo, prematuros o irrelevantes. Por ejemplo, el uso de
(algunos) evaluadores externos es parte del bien.
mi
E@C ' " 24
control de sesgo, nqt porque eso eliminará el elecció n de
pastel con puntos de vista dphnitas sobre el tipo de
programa que se está evaluando, sino porque tiende a
eliminar a las personas que probablemente lo favorecerán
por las razones irrelevantes (y por lo tanto conducentes a
errores) de participació n del ego o ingresos-p

ovación (ct. también Halo Ef'ect). Por lo general, sin embargo,


los gerentes de programa evitan el uso de un evaluador
externo con una negatividad conocida.
' visió n pedagó gica de programas como el suyo, incluso para la
evaluació n formativa.
ció n, que es confundir sesgo con preferencia. Los enemigos
son • una de las fuentes de prueba de la crítica ú til; es
irrelevante ese aceite no lo disfruta. Dreq si es políticamente
necesario tener en cuenta la oposició n de un gerente al uso de
un sumativo negativamente dispuesto evaluador, se debe hacer
agregando un segundo Evaluador, también informado, para
quien hay
..ninguna objeció n,
no por buscar a alguien neueal como tal, . ya que la
neutralidad tiene la misma probabilidad de estar sesgada y
má sprobable ,'
, • estar basado en la ignorancia; un punto clave El generalprincipio ›
de control de sesgo ilustrado ñ aquí el principio del equilibrio
(posible) sesgo en un grupo de evaluadores en lugar que
seleccionar só lo evaluadores "imparciales", lo que por lo general
y erró neamente interpretado como significado evaluadores
no comprometidos, es decir (con demasiada frecuencia)
ignorantes o cobardes. {Primero, por supuesto, uno
excluye a todos aquellos cuyas opiniones son ylaittlq
sesgadas, es decir, injustificadas.) Otros aspectos clave del
control de sesgos implican una mayor separació n del
canal de recompensas de la evaluació n.
reportes @ canal de firma o contratación, por ejemplo, nunca
permitir- ”
ing el monitor de la agencia para un programa q ser el
monitor (o el contrato de evaluación qn ese programa, ne' cr
permitiendo un
contratista del programa tot›e responsable de dejar que el contratar

“ para evaluar ese programa, etc. El último sesgo de las


evaluaciones contratadas reside Tennesse el hecho que las
agencias que financian programas financian la mayoría o todas
las demás evaluaciones,
por lo tanto, quieren evaluaciones favorables, un hecho del
cual los contratistas de evaluación son (generalmente
conscientes1;•) conscientes y que contribuye en gran medida
a explicar la última preponderancia de evaluaciones
favorables en un mundo de programas bastante pobres.
Incluso la GAO, aunque efectivamente más allá de esta
influencia para sus propósitos, no es inmune: lo suficiente
para que Congms los considere como totalmente creíbles,
por lo tanto, en parte, la creación de la CBO
. (Presupuesto del CongresoOtftcet. Lo posible méritos de una
evaluación "judicial", aislada de las presiones de la
vida cita, merecer consideración. otro›

dieciséis
principio de bins Control nos recuerda la inestabilidad
de independencia o externidad—el evaluador externo de
hoy es co-autor (.o colaborador rechazado).
Para má s
-detalb, véase "Evaluació n del sesgo y su control",
iriSnefrztion Studies geeie Huawei (Vol. 1, 1976, ed. G.
Glass, Sage). La posibilidad de soluciones ordenadas a los
problemas de diseñ o de control de sesgo se mantiene
viva frente a la aversidad anterior al recordar el principio
de corte de pastel: "Tú cortas y yo lo hago".

&GRAMO TIENDAS el 'kg shdpsfi en evaluació n son


los cinco a tern tkat.carry la mayoría de los grandes
contratos de evaluació n; Incluyen. Abt Asscb Tates,AIRE,
ETS, RAC, DC, SBJ, etc. Jpara las traducciones sea el
acró nimo (apéndice). Las compensaciones entre las
tiendas grandes y las tiendas pequeñ as son algo así,
asumiendo por el momento que puede pagar
, cualquiera. las grandes tiendas tienen enormes recursos de
todo tipo, desde personal hasta computadoras; tienen una
estabilidad continua que asegura bastante bien que el
trabajo se hará con al menos un mínimo de competencia;
y su reputació n es lo suficientemente importante para
ellos como para cumplir con los plazos y hacer otras cosas
buenas del tipo de papeleo como producir m u y b i e n
delimitado: Linformes, dentro del
p r e s u p u e s t o y así sucesivamente. En todos estos
aspectos, son una mejor apuesta, a menudo una apuesta
mucho mejor, que los barcos pequeñ os. Sobre por otro
lado, no sabes a quién vas a poner a trabajar para ti en un
gran skop, porque tienen que mover a sus gerentes de
proyecto como el pof negocios reflujos y fluye, y a medida
que su gente pasa a otras posiciones; ellos as bastante má s
rígido por su propio burocrático procedimientos que una
pequeñ a tienda; y es probable que sean mucho más caros por la
misma cantidad de trabajo, porque llevan a una gran cantidad de
personal a través de los intervalos entre trabajos que son
inevitables, sin importar qué tan bien se manejen. Una tienda
pequeñ a a menudo tiene gastos generales proporcionalmente
más pequeñ os durante esos momentos porque sus directores
tienen otros trabajos y pueden estar trabajando en un
establecimiento más modesto, el personal tomando parte de sus
pagos en los placeres de la independencia. valla. Es mucho más
fácil obtener una calificació n satisfactoria. estimació n de
competencia sobre las tiendas grandes que sobre las tiendas
pequeñ as; pero claro lo que si aprendes
-sobre el personal de una pequeñ a tienda es má s probable que
se aplique a las personas que hacen su trabajo. Hay un lugar
esencial para
17
ambos; solshops simplemente no pueden manejar
los grandes proyectos de manera competente, aunque a
veces lo intentan; y T
las grandes tiendas simplemente no pueden permitirse han@e
es a o ..
Los paneles gubernamentales de revisió n involucraron una
evaluació n más seria de la calidad del trabajo realizado, y la
creciente fuerza de la GAO en la metaevaluació n da algunos
promesa de esto, entonces las pequeñ as tiendas podrían Gif
mejor en el esquema de las cosas, como lo hacen en el
campo de la consultoría de gestió n y en las
especialidades médicas. Estamos comprando mucho
trabajo medi6cre por nuestro dolar de impuestos en este
momento, porque el sistema de recompensas y castigos
esta establecido para castigar a las personas que no
entregan (o reciben entrega) un informe sobre Ú nïe;
pero no para premiar a quienes producen un informe
sobresaliente en comparació n con uno mediocre.
SIMODAL(Sx.)MMe
BLACt¢ Bt3X EVALUACIÓN Término, generalmente
empleado pe}orativamente, que se refiere a Holisóc
Euounaóve evaluación, en la que se proporciona una
evaluación global y frecuentemente breve, sin
sugerencias de mejora, etc
Evaluación de caja negra ES frecuentemente
extremadamente valioso (por ejemplo, un ' evaluación de
productos de consumo); es frecuentemente mucho más válida que
cualquier evaluación analútica que pudiera hacerse dentro del
misma línea de fiempo y por el mismo presupuesto; y tiene II.e
gran adz'anlagc de brevedad. 6pero hay muchos contextos 'n
qu.‹h
* it -simplv no proporcionará la información necesaria, por
ejemplo, cuando analítico se requiere evaluación
formativa. (Nota
.¡Esa evaluación de caja negra puede incluso ser
extremadamente útil! en elformativo sesión.) Cf. £ngineezing
Modelo.
BOfLERPLJTE Pá rrafos o secciones almacenados que
se almacenan en fiFPs o informes (por ejemplo, desde el
almacenamiento en un procesador de texto) para
completarlos o cumplir con los requisitos legales. Las
solicitudes de propuestas de algunas agencias son un II
por ciento repetitivo: es difícil encontrar el material
específico en ellas.
PRESUPUESTO Independientemente de la forma
que En particular, las agencias prefieren, es deseable
desarrollar un procedimiento para la presupuestació n de
proyectos que se mantenga constante en todos los
proyectos para que su personal pueda familiarizarse con
las categorías y brindarle una base de comparació n.
Siempre se puede convertir a un formato particular

requerido si se entiende completamente. Las categorías


principales pueden ser directas
labor costos; otros costos directos (materiales.
suministros, etc.J,gastos indirectos (costes de espacio y
energía), otros gastos indirectos costos (gastos
administrativos o “gastos generales y administrativos”).
gastos generales (G&A)}. La diferencia entre ordinario
Las ediciones no son precisas, pero el inta es que los
gastos generales ordinarios deben ser aquellos costos
en los que se incurre a una tasa proporcional a los
salarios del personal en el proyecto, siendo esta
proporció n la tasa oeerfinid, por ejemplo, jubilació n,
seguro, etc.
G&A incluirá costes indirectos no directamente relacionado
cima nú mero de costos indirectos tales como servicios de
contabilidad, intereses, cargos por intereses, etc., podrían
justificarse bajo cualquiera de los siguientes categoría. Véase
Coets.
T I Instructor Asistido por Computador.. n.
computadora pre-
envía el material complementario o al menos las pruebas
sobre el mismo. Cf. O4l.
CALIBRACIONI'4 Convencionalmente se refiere al
proceso de hacer coincidir las lecturas de un instrumento
con un está ndar anterior. En la evaluació n incluiría la
identificació n de loscorte correcto ecozes (que definen los
grados) en un nuevo. Prueba Oéifiién oTa, realizada
tradicionalmente administrando la prueba anterior y la nueva
al mismo grupo de estudiantes (la mitad recibe primero la
anterior y la otra mitad la nueva). Un uso menos comú n pero
igualmente importante es con respecto a la estandarizació n de
' ytid, quienes son o por ejemplo, una visita al sitio o una
revisió n de la propuesta
panel. Deberían pasar por dos o tres ejemplos de
calibració n , especialmente construidos para ilustrar: (a)
un amplio rango de mérito; (b) dificultades comunes, p.
(en la evaluació n de la propuesta) comparando la baja
probabilidad de un gran beneficio con la alta rentabilidad
de un modesto saldar. Si bien no es cniciai lograr que todos
den la misma calificació n (interjuzgar la confiabilidad)
lidad), de hecho, presionar por ella per se disminuye la
validez, k es altamente deseable para evitar: (a)
inconsistencia grave inda-juez;
(b) compresión extrema o? las calificaciones de un
individuo, por ejemplo, en la parte superior, inferior o media,
a menos que se entiendan completamente las implicaciones
y alternativas; (c) drifi de los estándares de cada juez a
medida que “aprenden sobre la trabajo" chorro de ellos
tipo oye\ elefiz normas sobre los ejemplos de calibración);
(d) la intrusión de la dinámica de grupo posiblemente
turbulenta del paneliJolas primeras calificaciones
(deje que se estabilice durante la calibración)
período). Mientras que la tiempo-coste de la calibració n puede parecer
ser
, serio, de hecho no lo es, si el desarrollo de srales adecuados
a@ puntos de anclaje se lleva a cabo al hacer la calibración
(más, por ejemplo,
prominencia ecorin$) grmtfy aumenta s. Y, si alguien
realmente se preocupa porvalidez o responsabilidad
interpahel (es decir la calibración de los jueces es 'un paso
Antral, Sec aho Anclaje.
CASO-ESTUDIOV MZ¥ffOD El método de estudio de
caso está en lo contrario fin de los espectros de
metanfetamina de la encuesta metkod. Beth puede
involucrar pruebas intensivas de Wcasual- ing y/9r
entrevistas; observando, por otra parte. escaracterística
polar del método de estudio de casos que de los sifrveys a
escala objetivo. El enfoque de estudio de caso es típico del
clínico, a diferencia del encuestador; está más cerca del
historiador
antrólogo de lo que es a
la manifestación Causa'tion js
generalmente determinado en estudios de casos por el
método aiodd¥ opemndi, en lugar de por comparación de un
Rimental con a grupo de control aunque en principio se
podría hacer una
, pgrison ca§ afbdy de un caso emparejado. El estudio de caso
ap•Este enfoque se utiliza con frecuencia como excusa para
sustituir las conclusiones evaluativas por detalles ricos, un
riesgo inherente a la responsabilidad. sfv ue4iiiit,
oiiafevâluaUon andiBitminntiva
evaluntion. En el mejor de los casos, un estudio de Tase
puede descubrir tâusation donde ningún análisis
estadístico podría; y puede bloquear o
sugeririnterpretaciones que son mucho más profundas
de lo que pueden revelar los datos de las encuestas. Por
otro lado, los síntomas que surgen de una investigación
cuantitativa a gran escala correctamente realizada no
pueden detectarse en los estudios de casos y, por lo
tanto, los dos son naturalmente
diferentes.complementario procesos para un compW•.
investigació n de
por ejemplo, los servicios de salud o aplicació n de la ley
en una ciudad. Tenga en cuenta que los métodos
cuantitativos a menudo se pueden aplicar en un intra-
base del caso. Uno obtiene una n adecuada ya sea de
respuestas múltiples (Skinner) o de múltiples medidas
validadas independientemente (Carñpbell). Ver
tambiénNaturatiaHc. “
CAUSALIDADLa relación entre los mosquitos y las
picaduras de mosquitos. Fácilmente entendido por las
partes R•h peronunca ,
definida satisfactoriamente por filósofos o científicos.
IUNG EFECTO El resultado de marcar cerca del
topofa escala, lo que hace que sea más difícil (incluso
imposible) mejorar tan fácilmente como desde un punto
más abajo. A veces se describe como "falta de
headrmm". Las escalas en las que los evaluadores
puntúan casi todos los que se encuentran cerca de la
parte superior, en consecuencia, brindarán pocas
oportunidades para que cualquiera se distinga.
Desempeño sobresaliente (comparativo). Encendió el
lenguaje del mercado de valores, ellos (las balanzas más los
rnter) proporcionan ”all downside risk.“ (Típico de los
formularios de evaluación de docentes). Por lo general,
todos (o la forma en que se necesitan) deben recon-
estructura y lara ,El ti tflhèy representan
correctamente el

las diferencias serían simplemente un artefacto de medición.


Despuéstodos, si todos los estudiantes aciertan todas las
respuestas, hay no debería ser ningún headrmni por
encima de su gradokM su escala. (Es posible que desee
utilizar una prueba diferente, sin embargo,

TENDENCIA CENTRAL, {Me auze o0 (So ., The mis-


tecnología líder,término único para » staziséc que describe
la medio o promedio de una distribución, a diferencia de en
la medida a wkJch se extiende delgada, o grumos, siendo
este último el

CERTIFICACIÓN Un término como credencialización,


que se refiere a la obtención de un reconocimiento oficial de
la institución, generalmente se genera en un proceso de
evaluación serio o trivial. AcciedlLntion es otro cognomen.
La certificación de los evaluadores se ha discutido
recientemente más extensamente, y plantea un número o el
problema habitual: ¿quiénes serán los superevaluadores) que
deciden sobre los paseos de la evaluación? mismo (ur quien
perdió), ¿cuál sería el prr›ce- duraciones, cómo se manejaría
el costo, etc. La certificación es un proceso de dos caras
que a veces se presenta como un dispositivo de
protección del consumidor, que puede serlo, ya veces
como un dispositivo de protección del territorio para
los miembros del gremio, es decir, una restricción del
proceso comercial, lo que con frecuencia es. La
certificación médica fue responsable de expulsar a la
partera, probablemente con un costo sustancial para el
consumidor; por otro lado, también fue responsable de
evitar que una gran cantidad de completos charlatanes
explotaran al público. Ciertamente contribuyó a la
indefendible magnitud de los salarios/honorarios de
médicos y abogados; y en este sentido es consumidor-
explotador Los abusos de las grandes ligasauditores, para
tomar
otro ejemplo, están bien documentados en 42aerconnteäb
Aecaoctinfi por Abraham Briloff (1973). Cuando el estado
entra en acción, como lo hace con la certificación de
psicólogos en muchos estados, y de maestros en la mayoría,
se agregan varios abusos políticos a los anteriores.
mi 2i
E@C “ Ü(J
donde los diseñadores certificados y no certificados de
estructuras domésticas compiten entre sí, uno puede ver
«q poca
algunos ventajas para ambos dolores; pero hay
dencv_.su_ppo a en deja el amor 11
evidencia
mlusionaslnliiediiec- ción que es mejor para el citinnry,
o incluso para todo el grupo de pzactiti0 . Un enfoque de
certificación bien establecido sin duda sería lo mejor; la
trampa está siempre en los compromisos políticos
involucrados en su establecimiento; en otracotinfies, el
proceso a veces se maneja mejor y
algunas cosas peores, dependiendo de las
variaciones en la política
cal yr‹xess.
cxxcxusT xrrROACt4
CERTIFICACIÓN (para evaluación) Una
DE EVALUADORESVer lista de
Evaluación
verificación identifica ag significativo pertinente
dimensiones de valor , - aliado \norte mensurable términos y
no también proporcione para ponderarlos según su
importancia. (Esomayo también referirse a o solo a conceptos.)
El checMist proporciona una extremadamente

de actividades y productos educativos. El enfoque de lista


de verificación reduce la probabilidad de omitir un factor
crucial. Reduce la sobreponderación artificial de ciertos
factores mediante una definición cuidadosa de los
elementos de la lista de control, para evitar la
superposición (a veces indeseable, por ejemplo, cuando
resulta en mucho menos
dimensiones comprensibles). También proporciona una guía
para investigando la minuciosidad de implementacion
procedimientos y reduce el posible efecto halo y el
efecto Rorschsñh. No requiere una teoría y debe evitar
depender de una tanto como sea posible. El punto de
control, si hay muchos, debería ser g. ouped bajo
categorías que tienen sentido común tu significado
obvio, a facilitar la interpretación por. Por lo general, una
lista de verificación no incorpora la combinación
apropiada para casos en los que las dimensiones son
altamente interactivas, es decir, donde el lineal o el
app›z›ach de suma ponderada falla: tales casos son raros.
ChecMists puede enumerarJdsidezgf« o iier•s•i/o/o. Los primeros
acumulan puntos, los segundosrepresentan los estándares
mínimos necesarios. (Un punto de control (dimensión) puede
involucrar a ambos.) Es recomendable asterizar
todosabsoluto requisitos y verifíquelos primero, para
evitar extremidad desperdiciada. Ver Wet@t A Sum.
GPP Un modelo de evaluación expuesto en
fdurofiottnf

*31*'
a
'

OTATiOH It'4DEX El nú mero de veces que una


publicació n o se referencia
enal
ejemplo a esponjoso
otro ciones. si se usa

xze del campo dzsmmznates en contra de los jóvenes, en


contra de aquellos que trabajan en temas poco fiables, por
ejemplo, de hecho identifican a un tercio de los bureates de
Mbbel, etc. Puede ser usadofoz
otorgar algunos puntos de bonificación, pero solo si hay otros “
campos h4mtpt iusihie use isin evalua'bn8 the signifimnm aie ,
prarticu1ar pub katien it•iffiiti un campo, es decir, en la historia de
las ideas ieseamh; signi âtar<e en este sentido está muy relacionado

con
aodlea¢g y cozeaatec. Tennesse social evaluació n, el
término "cliente" se usa a menudo para referirse al
"consumidor", es decir,
Hietler a tiy a usar el término "clientela" tiene ese propósito.
CMANTELELa població n dizect)y servida por un m.

CI4NIC L PxRFORMAxCE EVALUA3 BUEY En


tke
campo de la salud, y en mayor medida en otros lugares (por
ejemplo, evaluación tegcfiing), el término "clínico" en ser
utilizado para stzess una especie de "práctica" siW * ion que
normalmente no es bien probado por cualquier cosa como
pruebas de papel y lápiz. Có mo- evei, c-.n ser muy bien
probado por atimilatlono apropiado, como hemos visto en
algunos de los exámenes médicos. Puedetambién ser muy
bien probado con cuidado hecho observación estructurada

un papel y lápiz testasa limitando caeeof un símuh'tron, uno


mi utiliza la enorme cantidad de la que depende, para
m@C" - 2«
i 32
para ser realista, sobre la imaginació n y las habilidades de
juego de roles que pocos de nosotros poseemos. Donde uno
examina las simulaciones está ndar, encuentra que éstas han
heredado mucho
de la artificialidad de las pruebas de papel y lá piz. Por
ejemplo, rara vez implican un "procesamiento paralelo", es
decir, la necesidad de manejar dos o tres tareas
simultá neamente. Una simulació n clínica seria iniciaría al
candidato en un problema, proporcionando grá ficos e
historias, y luego, justo cuando esto comenzaba a tener
sentido, se les lanzaría un nuevo problema con
connotaciones de emergencia, y justo antes de que llegaran
al final. En el momento de tomar una decisió n preliminar de
emergencia al respecto, se les plantearía un tercer
problema, aú n má s apremiante. Dado que existe cierta
ansiedad asociada con la realizació n de exá menes para la
mayoría de las personas, uno probablemente podría
acercarse a simular entornos clínicos en
este respeto. Hace tiempo que desarrollamos simulaciones que
implican el suministro de informació n
complementaria cuando lo solicita el sujeto de la
prueba, y parte del stoń np está vinculado a la
realizació n de las solicitudes adecuadas. Pero muy
pocos signos de un análisis țob cuidadoso aparecen en
simulaciones má s avanzadas, simplemente un
verdadero desempeñ o clínico es de los internos*
CMI Instrucció n administrada por computadora. La
computadora mantiene registros, por lo general en cada
elemento de la prueba y el desempeñ o de cada estudiante
hasta la fecha. Importante para la instrucció n
individualizada a gran escala. La computadora puede hacer
un diagnó stico en base a los resultados de las pruebas e
instruir al estudiante sobre los materiales que se deben usar
a continuació n. El alcance de la retroalimentació n al
estudiante varía considerablemente; el objetivo principal es
la retroalimentació n a los gerentes del curso).
COGNITIVO El dominio de lo proposicionalmente
cognoscible; que consiste en "conocimiento-que", o
"conocimiento-hnw" para realizarintelectual Tareas.
COHOJITO Término utilizado para designar un grupo
entre muchos en un estudio, por ejemplo, "la primera
cohorte" puede ser el primer grupo que haya pasado por
el programa de capacitació n que se está evaluando. Cf.
Escaló n.
BASADO EN LA COMPETENCIA Un acercamiento a la
ieó fihing. oformació n que se centra en la identificació n de
las competencias que necesita el alumno y en la enseñ anza
hasta el nivel de dominio en estos, enseñ ando
supuestamente sub-académico relevante s para vis niveles
de logro determinados subjetivamente.
Buena idea, pero la mayoría de los intentos no especifican
el.
2
3ü '
maestría nivel en claramente identificable términos o no nieve
por qué ese nivel debe ser considerado como el dominio nivel.

• (“Basado en el desempeñ o” es un cognomen.) CB Formació n de


docentes
tion (CUTE} fue un gran problema a mediados de los 70 butgie
catch fue que
--poder o pe es desde astuto
C 'arco ” se le ha
ocurrido poco. Siempre está el tema -
competencia de la materia requisito, por supuesto,
generalmente ignorado en formació n de maestros K-12 y
tratados como el ú nico en el Post secundario domaini
pero C8r£ estaba hablando de peda- Coq.icat competencias
—enseñ anza método habilidades. Ver también

' CLASIFICACIÓN DE CUMPLIMIENTO, REVISIÓ N DE


CUMPLIMIENTO
un aspecto de Inonito. _
COMPONENTE EVALUACIONI'4 A componente de
un evaiuand es típicamente una parte físicamente
discreta nf iL pero má s precisamente cualquier
segmento que se puede decir que se relaciona con
otros para formar el todo'evaluado. (Típicamente,
Se distinguió entre los componentes y su relació n.
barcos al hablar del evaluando como un sistema hecho de
- Pensilvania oh maíz nordeste La evaluació n de algo no
implica ninguna evaluació n de sus componentes; y una
evaluació n de los bloques de componentes no implica
automá ticamente una
. evaluació n de todo el evaluando—excelente componentes-
para un amplificador “no será un buen amplificador a
menos que está n correctamente colocados por diseñ o y
relaciones de montaje. _ Pero los componentes strié son con
frecuencia de igualdad variable,y dado que con frecuencia
buscamos diagnósticos que conduce a la mejora, la evaluación
del componente puede ser un enfoque muy útil para cvzlqation. Si
también podemos'
evaluar las relaciones, nosotros mayo tener un tipo muy útil
de evaluación (especialmente) formativa: qué tan útil
dependerá de si el "arreglos" por defectuoso los
componentes son evidentes o fácilmente determinado. La
evaluación de componentes se distingue pordhnensionzl
evaluación, otro tipo de análisis evaluació n, por el
i•.latively agua como-
Posibilidad de manipulabilidad, de forma constructiva,
de componentes en comparació n con dimeñ si0ns (que
pueden ser hechos estadísticos). Y los evaluandos sin
componentes pueden tener dimensiones, por ejemplo,
un jarró n.
cOxCEPzUAL SCxEMfi Un conjunto de conceptos
en ærms de los cuales uno puede organizar y en un sentido
mínimo entender

25
r

los datos/resultados/observaciones/evaluaciones en un
á rea de investigació n. A diferencia de las teoras, los
esquemas conceptuales
_ suposiciones de constancia referencial), pero tii_ydo nerate
hipótesis agria simplicidad descriptiva.
CONCLUSIÓN-ORIENTED INVESTIGAR

contrastado
con orientació n a la decisió n. distinció n de Cronbach y
Suppes,entre dos tipos de educació n investigació n, a
veces pensada para iluminar la diferencia entre la
investigació n evaluativa (supuestamente orientada a la
decisió n) y la investigació n académica en ciencias
sociales (orientada a la conclusió n). Esta opinió n se basa
en la falacia de. suponiendo que las conclusiones sobre el
mérito y el valor no son conclusiones, un vestigio de la
doctrina positivista libre de valores de que los juicios de
valor no son
, comprobable proposiciones, por lo tanto no científicas: y en
la falacia de suponer que toda evaluació n se relaciona con
alguna decisió n (la evaluació n de muchos fenó menos
histó ricos, por ejemplo, un reinado o q la política no.)

que se supone que nos informa sobre el siaiuffaiie nosotros


estado de otro sistema o variable. Cf. predictivo vUidit-,

CONFIDENCIALMENTE Uno de los requisitos que


surgen bajo las consideraciones del proceso legítimo
en la Lista de verificació n de evaluació n clave. La
confidencialidad, tal como se interpreta actualmente,
se relaciona con la protecció n de los datos de los
individuos de la lectura casual de otros individuos, no
con la@YOtBCtionO$ juicios evaluativos sobre un individuo de
inspecció n por parte de ese individuo. El requisito de que
los individuos sean capaces de inspeccionar un juicio
evaluativo hecho sobre ellos, o por lo menos algunos de
estos con alguna actitud.La tentació n de preservar el
anonimato del evaluador es una restricció n relativamente
reciente en la evaluació n del personal. Se cree ampliamente
que ha socavado el proceso con bastante seriedad, ya que las
personas ya no pueden decir lo que piensan del candidato si
les preocupa la posibilidad de que el candidato infiera su
autoría y tome represalias o piense mal de él (si la
evaluació n fue crítico). Debería serseñ alado que la mayoría
de los grandes sistemas de evaluació n de personal
atiop tener fallido porque la gente se estaba
desenvolviendo
para hacer esto incluso cuando se garantizaba el completo
anonimato.
CE ••
— 3ñ ,
Esto fue generalmente cierto para los sistemas de servicios
armados y los sistemas universitarios estatales de Itiany. No
hay duda de que évin entre las universidades del rango de la
fruta ha habido un efecto negativo: pero esto n}qstly
muestra un fracaso de penuitv, enla parte de los
tasadores personales, ya que hay varios
Maneras de Poeæoe anonimato, incluso bajo la
más débil leyes, a saber, aquellas que só lo borran el même y
el título de el evaluador Ver tambiénanonimato .
CONFLICTO DE INTERESES tCOll Una de las muchas
fuentes de sesgo. Un evaluador que evalú a sus propios
productos es
‹ involucrado en un conflicto de intereses, pero el resultado
aú n puede ser mejor que la evaluació n realizada por un
evaluador externo, ya que la ú ltima pérdida de conocimiento
íntimo y experiencia con el producto y con el rigor y la
metodología de evaluació n puede no compensa la falta de
implicació n del ego. Es decir, aunque el conflicto de
intereses siempre perjudica la rehabilitació n, no siempre
afecta la calidad. Pero como puede afectar fá cilmente
* validité, normalmente es mejor “usar al menos una
mezcla de evaluació n infernal y entermal. En la elecció n
de paneles para la evaluació n, el esfuerzo para recoger
tranquilo quien no tiene ningú n conflicto de intereses, por lo
general está fuera de lugar o es excesivo; es mejor elegir un
panel con una combinació n (ni siquiera un equilibrio exacto)
de intereses en conflicto, ya que es probable que sepan má s
sobre el á rea que aquellos que no tienen intereses en ella o
en contra. Los lazos financieros, personales y sociales no son
diferentes del compromiso intelectual con respecto a COI;
todos pueden producir mejores percepciones así como
peores juicios. La clave para gestionar COI es exigir que los
clientes sean pú blicos y que su valor sea analizado y votado
por aquellos con otros COI reibvantes. Ver sesgo.
t?ONFfOISSEURSHIP MOOEL Elliott Eisner no- El
método tradicional de evaluació n se basa en la premisa
de que las consideraciones artísticas y humanísticas son
má s importantes en la evaluació n que las científicas. No
se utiliza un aná lisis cuantitativo, sino que el experto-
evaluador observa de primera mano el programa o
producto que se evalú a. El informe final es una narració n
descriptiva detallada sobre el tema de la evaluació n. Cf.
Crítica literaria, Valoració n estética, Hlatuinlística,
Responsiva y Modelos.
CONSONANCIA/DISSOHIAI"ICE Los fenó menos de
consonancia y disonancia cognitiva, a menudo
asociados
‹7 3ù
con el trabajo del científico sccial Leon Festinger, son una
amenaza importante y generalmente subestimada para
la validez de las encuestas de satisfacció n del cliente y
las entrevistas de seguimiento como guías, programas o
méritos del producto. f El límite en el caso es la
tendencia a aceptar las decisiones presidenciales.) La
consonancia cognitiva, no sin relació n con la noció n má s
antigua de racionalizació n, ocurre cuando la percepció n
del sujeto sobre el mérito de X se cambia.
por haberse comprometido con X, por ejemplo,
comprándolo, dedicando tiempo a tomarlo como terapia,
etc. Por lo tanto, un Ford Pinto puede calificarse como
considerablemente mejor que un VW Rabbit después de
haber sido comprado que re, aunque no nuevo ha surgido
evidencia que„|t iustih este cambio de evaluación. Este es el
lado del conflicto de intereses de la moneda cuya otra cara es
un mayor conocimiento de, por ejemplo, el producto. Algunos
enfoques para descartar este fenómeno incluyen la separación
muy cuidadosa de la evaluación de las necesidades de la
evaluación del desempeño, la selección de sujetos que tienen
el equivalente de expertos con ambas (o varias) opciones, el
análisis veraz de tareas por parte de observadores seguros,
buscando en compradores recientes de
ambos gatos, etc. La aprobació n del campo de
entrenamiento por parte de los marines y de los crueles
ritos de iniciació n por parte de los hermanos de la
fraternidad es un caso sorprendente e importante, llamado
sesgo de "iniciació n-justificació n" en L£. (Estos fenó menos
también se aplican en el meta-nivel, produciendo falsas
evaluaciones positivas de las Evaluaciones por parte de los
clientes).
ACIDEZ DE CONSTRUCCIÓN validez de un
instrumento rrtpnt (por ejemplo, una prueba, o qjt
observadores como indicador de la presencia de (una cantidad
particular o un constructo ético. La validez de constructo de
un termómetro como indicador de temperatura es alta, si se ha
calibrado correctamente. La clave La característica de la
validez de constructo es que no puede haber una prueba
simple de ella, ya que no existe una prueba simple de la
presencia o ausencia de un constructo teórico. Solo podemos
inferir a esa presencia desde las interrelaciones entre un
número de indicadores de una teoría que ha sido
indirectamente confirmada, JTie contrasta con la validez
predictiva y concurrente, que relacionan las lecturas en un
instrumento con otro directamente observable variable. Así,
la predicción validez de prueba para la graduación exitosa de
una universidad, administrada antes de la admisión, es visible
el día de la graduación un año después. Pero no se puede
confirmar el uso de un termómetro para probar la temperatura.
mirando la temperatura; de hecho, el termómetro está más
cerca que nunca de la temperatura.
nro. Sobre la historia de termodinámica, hemos adoptado
cuatro definiciones teó ricas diferentes sucesivas de
golondrina de mar -
tute, aunque no podrías decir esto com mirando a los
termó metros. Así, lo que el termó metro ha “leído” ha
tenido cuatro constructos teó ricos diferentes y su validez
como
un indicador de uno de estos es no en todo el mismo como su
validez como indicador de otro. Ningú n termó metro lee nada en
absoluto en la regió n inmediatamente por encima del cero
absoluto, ya que todos los gases y líquidos se han solidificado en
ese punto; sin embargo, esto es una temperatura rango; e
inferimos donde la temperatura es, allí, cálculos teóricos un
poco complicados de otros variables La validez de casi todas
las pruebas q
utilizado / o evaluativo propó sitos es construir validez, porque
..el constructo al que apuntan (p. ej., “excelentes
habilidades informá ticas”) es un constructo complejo y
no observable en sí mismo. Esto obedece a la naturaleza
misma de la evaluació n, que implica una síntesis de
varias escalas de desempeñ o. Pero, por supuesto, no se
sigue que las conclusiones evaluativas sean
esencialmente menos confiables que las de las pruebas
con validez predictiva demostrada. dado que las
"valideces predictivas" dependen enteramente de la
persistencia a lo largo del tiempo (o sea, largos períodos
de tiempo) de una relació n, una dependencia que suele
ser má s inestable que la inferencia de una habilidad
intelectual como la excelencia computacional de un
serie de observaciones de un estudiante muy talentoso frente
a una variedad de tareas computacionales nunca antes vistas.
Los termómetros son muy precisos, aunque "sólo" tienen una
validez de construcción. esquema thpt lo hace tinte
involucrar a teoría; solo el
se necesita cumplir con los requisitos de mérito taxonó mico
(claridad, amplitud, perspicacia, fertilidad, etc.), no con la
confirmació n de los axiomas y leyes de la teoría. (Tales
construcciones todavía se denominan “construcciones
teó ricas”, quizás porque las esquematismos conceptuales
sombrean y evolucionan con tanta fluidez las teorías).
CONSULTOR Los consultores no son simplemente
personas contratadas para asesorar a corto plazo, como
podría suponerse por el término; incluyen un nú mero de
personas que son miembros estatales esencialmente
regulares (pero no tenues) de agencias estatales, donde
alguna restricció n presupuestaria o burocrá tica impide
la adició n de personal permanente, pero permite un
semi-
estado permanente al consultor. De ahí una
evaluació nconsultor no siempre es un evaluador externo.
El problema bá sico de ser un consultor de evaluació n,
como carrera, es que, con la excepció n de los trabajos
semipermanentes que acabamos de mencionar, tiene que
ganar lo suficiente en los días que está trabajando para
sobrevivir los días agotadores cuando No lo eres, y en el
mundo real es muy poco probable que los trabajos sean lo
suficientemente amables como para llenar tu tiempo
exactamente. Mientras tanto, algunos de sus gastos
generales, por ejemplo, secretaría (normalmente) y
alquiler, continuará n, así como sus facturas de
comestibles, etc. le pagaron en base a un salario, pero
requiere $30/hora. por tiempo de trabajo para cubrir los
períodos en blanco má s reuniones profesionales,
pastoreo, consultas, etc., es decir, 5240/día. Pero el
má ximo actual de la agencia es de unos $150 en HHS/ED,
es decir, quieren que trabajes por unos $16, tXD/añ o sin
permanencia ni beneficios complementarios. No es de
extrañ ar que los ú nicos consultores viables, así como los
má s rentables desde el punto de vista del cliente, tengan
que ser personas con trabajos de tiempo completo que
insultan como bufones.t mayo. los tuñ vetsitiew
subvencionan al gobierno y viceversa. En el campo de los
consultores de gestión, donde los honorarios son mucho más
altos que en el campo de los consultores de evaluación,
aunque no tan alto como los honorarios regulares de un
abogado—esto es menos de un problema; pero en el
programa de servicios humanos á rea de evaluació n, el costo
real de los consultores de primer nivel está mucho má s allá
de los límites presupuestarios aplicado a los honorarios de
consultoría por parte de las agencias. Debería permitirse
como alternativa algú n sistema de pago por resultados,
para que
Que habría algú n incentivo para un trabajo rápido y
extremadamente bueno con empleados de tiempo
completo, en lugar de distribuir el trabajo.
y pluriempleo. Hay o pequeños contratos de trabajo, pero
pocos. bajo ataque, y disminuyendo. Las grandes tiendas
tienen algunos evaluadores de tiempo completo en el
personal, pero solo para grandes proyectos financiados por
agencias, no como consultores para el pequeño cliente
promedio.
CON5Uhfer Los "verdaderos consumidores" de un
producto, servicio o programa son las personas que se
ven afectadas directa o indirectamente por el uso o la
recepció n de un producto o programa: la parte má s
importante de los poyula'hon afectados. Los verdaderos
consumidores son por lo general, no solo la població n
objetivo, (los "consumidores" de una evaluació n son sus

audiencias).
cochecito, pero en la producción o proporcionando etid—
nosotros controlamos eso

EVALUACIÓN BASADA EN CDNgUMZB Un


acercamiento a

exacto la población afectada Sin embargo, podría o no


ser hecho sin compromiso. cI9arIy esa es la metodo-
I ogía de la elecció n basada en el consumo basada en la
evaluació n. Será particular- lnrly'•tUcus en la identificació n
de la paja populn'noiu no objetivo, en ecualización no
deseadanorte tchmi porquet
en el

CONTENIDO ANÁLISIS El evaluativo preevaluar


aéve pzocessof syse madcally determinando zacteñst
ics de un cuerpo de mateñal o prácticas
cursos, trabajos. Se han desarrollado muchas técnicas
imitado por hacer esto, corriendo de conteos de
frecuencia en wqfds de ciertos tipos (por ejemplo,
reflejos personales), toana)ysis de la estructura de la trama
en stoñes ilustrativos para determinar si la flgura dominante
{s ej. hombre o mujer, wiii
blanco. El uso del análisis de contenido es igual de
importantedeterminar si el evaluando coincide con el
"oficial" descripción de iF, ya que está en la determinación de
lo que es y lo que ¿Es más diminuto que los involucrados en
la "verdad en pacLcging ”problema. Así, un estudios
ckart entiUed
›”Grest Aipericans“ podría ser objeto de aná lisis de
contenido en ozdez fio ‹efiertlzine si los enumerados eran en
realidad grandes americanos (la verdad en la etiqueta)
gramo}; pero incluso si pasara esa prueba, estaría sujeto a
un análisis de contenido adicional para, por ejemplo, sexo-
.sm, porque una lista tkat no ¢onain the naaws of the gfeat
women suffragisD mostraría un sentido deformado de los
valores, aunque podría ser demasiado karsh para
argumentar que svas no está correctamente etiquetado. Darse
cuenta de nada de esto se refiere a un estudio de los efectos
reales (pay-offeluctton), pero es un tipo
de legítimo valoració n de proteínas. La línea entre los dos
no es nítida, ya que las falsedades literales pueden ser el
mejor dispositivo pedagó gico para lograr que el estudiante
recuerde las verdades.
Aunque este enfoque entonces violaría el perjuicio de la
integridad científica o disciplinaria (una consideración del
proceso), esto sería excusable. sobre los terrenos ese el
ú nico objetivo del trabajo es producir efectos correctos y que la
enseñ anza el. correcto y mucho más Complicado cuenta

o
)éads to let.• aprendizaje residual preciso que enseñar' ›y '
• cuenta incorrecta. no es una exageracion tn decir•• los
cursos elementales de ciencia de mos siguen el mod•t o '=
h”” falsedades para obtener óptimo verdades en»ttII•
‹ el
cerebro de los estudiantes. Una visión más radical
sostendría que los cerebros humanos en general exigir
conocimiento para ser presentado en forma de / más bien
simple falsedades más que verdaderos complejos. En las
páginas 82 y 1 deletglacialaplaudir/t« de

CÓMT€NT VALIDITA La propiedad de los ensayos que,


después de análisis de contenido, parecen cumplir con todos
los requisitos para la congruencia entre el conb'nt
reclamado y real.
Por lo tanto, una prueba de net-izzaking abilità debe
contener una muestra ade ”quace ( wei@ted ) detodo y en/y
esos slùJls que el fabricante de redes pert exhibiciones
?'¢nota que esto es un ejemplo ufa WiainlY psicomotor dominio
de habilidades; contenido validità no se restringe a las reas
cognitivas o verbales. Contenido valido-
itv es un paso má s sofisticado que la validez aparente y un
paso menos sofisticado que la validez de constructo. Sc
puede sersido como un enfoque má s científico para
validez aparente o como un enfoque menos que integral
para la validez de construcció n. El tipo de evaluació n que
está involucrado y conduce a la acreditació n por parte
del estado de un maestro, por ejemplo, matemá ticas (en
los EE. UU.) es un contenido importante debido a su
grotesca incapacidad de requerir habilidades
matemá ticas a un nivel razonable. 1 (por ejemplo, el
mismo nivel que el segundo cuartil de estudiantes
universitarios de segundo añ o que se especializan en
matemá ticas). En general, al igual que otras formas de
evaluació n de procesos, las comprobaciones de validez
de contenido son considerablemente má s rá pidas que los
enfoques de validació n de constructo y, con frecuencia,
proporcionan un resultado de vida bastante fiable,
evitando así la necesidad de métodos má s largos.
inx'esñgañón. El}' no puede proporcionar un resultado
posińvę tan fácilmente, ya que la validez de contenido es
necesaria pero no a suficiente cendition para mí. Contenido
la validez es un buen ejemplo de un concepto desarrollado en
un entorno de evaluación (pruebas, es decir, evaluación de
estudiantes o pacientes) que se transfiere. wel a otro x'iz.
evaluación de personal (candidatos y empleados), una vez que
se empieza a pensar en la evaluación como una sola disciplina,
lógicamente hablando.

4¿
COHT£XT (de etaluatán o evaluando).Las
circunstancias ambientales no influyen o pueden
influir en el resultado; ellosincluir ottiWde:sand e
pectaâ ons, no solo el nivel de soporte

COt4TRAcr s»e. .
TIPOS DE COI'4TRAT Las categorías habituales de
tipos de contrato (esto clasificació n particular Cornes de
Eckman

más tarifa fija, costo más incentivo tarifa, costo más tée
mó vil y poderes conjuntos de Ag t. Explicar las
diferencias más allá de estos términos obvios sería
simplemente decirte lo que quieres saber, a menos que estés
a punto de ser...

'TP F P, anb ipay ser ungracias a todos ah it (Precio


superior a S30); se puede pedir en The Eckman Center, PO
8ox 621, Woodland Hills, CA 91365. Esa es la parte técnica;
pero en tke ¢zmu nivel onsense, es un good4dea tener algo
en la escritura que cubre tùebaYcs por ejemplo cuando
puymend son para
hacerse (y bajo qué condiciones no será n friade)
y wko está facultado para publicar los resultados (
dw}diez).Dan Stufftebeam tiene la lista de verificació n de
prueba para esto, en su pró ximo texto (1M2): hasta el, en su
monografía en la serie del Eva,lualion Center, Westém
Michigan.
CONTROL GBUPAgrupo que no se reserva el
"tratamiento" (por ejemplo, un servicio o un
producto) que se está evaluando. (El grupo que lo
recibe es el grupo experimental, término que se utiliza
aunque el estudio pueda ser ex poe facto y no
experimental.) La funció n del grupo de control es
determinar hasta qué punto se produce el mismo
efecto sin el tratamiento. Si la extensió n es la misma,
este
tendería a mostrar que el tratamiento no estaba causando
cualquier cambio que se observara en el experimento
grupo. Para realizar esta funció n. el grupo de control debe
ser"emparejados", es decir, elegidos de manera que
sean muy similares, ni idénticos, al grupo
experimental. Cuanto má s cuidadosamente se haga el
cálculo (por ejemplo, usando los llamados "gemelos
idénticos"), má s seguro puede ser que las diferencias
en los resultados se deban al tratamiento
experimental. Se logra una gran mejora si se puede
ranJo»ily nssign matched

mi
sub a los dos grupos, art ‹ designa arbitrariamente a uno
como grupo experimental y al otro como grupo de control.
Este es un "experimento real"; otros casos son má s débiles e
incluyen estudios a posteriori. Idealmente, la coincidencia
cubriría todos los entornos. tales variables tan weIJ como las
genéticas—aü vaúables cirepf las onç{s) experimentales—pero
en pra emparejamos ordy en las variables que creemos
que probablemente afectarán significativamente a los
demá s, por ejemplo, sexo, edad, escolaridad. El
emparejamiento de características específicas
(ntrntifytng) no es esencial, solo es eficiente: se puede
establecer un grupo de control perfectamente bueno
usando una muestra aleatoria (mucho más grande) de la
població n como grupo de control también para la
tierra.grupo experimental o de tratamiento). Por lo
tanto, se puede lograr el mismo grado de confianza en
los resultados comparando pequeñ os grupos muy
parecidos (experimentales y de control) o grandes
grupos seleccionados completamente al azar. Por
supuesto, si es probable que se equivoque, o si tiene
dudas, acerca de qué variables comparar, la muestra
aleatoria grande es una mejor opció n, aunque es má s
costosa y lenta. Cabe señ alar que, a veces, es
importante organizar varios "grupos de coito" y que,
por lo tanto, se podría llamar a todos ellos grupos
experimentales o grupos de comparació n. El grupo de
control clá sico es el grupo "sin tratamiento", pero
no es por lo general el metro pertinentea la toma de
decisiones prá cticas (ver Competidor Crítico). De hecho, a
menudo no es ..ev claro lo que es "sin tratamiento"
yo«›: por ejemplo, si retiene
I F tratamiento de a.Grupo de control en la evaluació n
psico- yo py, crean su uwn, y pueden cambiar el
comportamiento simplemente porque usted retuvo el
tratamiento: pueden divorciarse, obtener religió n,
cambiar o perder su trabajo, etc. ni siquiera sin
psicoterapia, solo sin psicoterapia de su marca
particular. Por lo tanto, es mejor tener grupos de
control que reciban uno o varios tratamientos
alternativos está ndar que "dejarlos a su suerte", una
condició n en la que el grupo "sin tratamiento" a
menudo degenera. Y en la evaluació n, ahí es
exactamente donde traes a los competidores críticos.
En medicina, por eso el grupo de control recibe un
plaeebo. Es crucial para comprender la ló gica de los
grupos de control que uno se dé cuenta de que solo
proporcionan una prueba de causalidad
unidireccional. Si hay una diferencia entre el
dependiente
variable{s) como Mtvi/een los dos gzoups (y si la coincidencia
” está loco en fauh) entonces el eg›ez§r›eutal beabsient ha sido

ficado como el tamañ o del efecto total del tratamiento,


excepto en e sittiatkin cuando el control es un grovpc
ntsoluH sin dsttment-más factible en la agricultura tlun
mamífero tesean:h.
GRUPO COi'4VERGENCE tstufflebeam). _Un
equipoguau taak istodevelop thebestversk›tiofotieaenent
trmn v Partes interesadas o drot, es decir, sugerencias. Una
generalización-'ció n de la término, a conv.ergence stssI»ts,
inatst»«idfélio«theu«ofparaue1(s«sopeval»aio>.
cubre los paces

verbigracia. la moneda de ellos diez


andanattem

lugar por los equipos separados, con eiereee (grupo) Int


es decir, pe'nt intimidació n; má s tarde puede ser mejor usar un
separado

£ 3RRECTiOhi PARA GUESSIhiG iq exá menes de


opció n mú ltiple fe n alternativas en cada pregunta, el
examinado promedio obtendría 1/n de los temas
tratar gueosingalone Por lo tanto, si un estudiante no logra
comp! En dicho examen, se ha sugerido que se debe sumar
1/nñ • del nú mero de pruebas.
.respondió preguntas sobre su calificación, a fin de obtener
una comparación justa con el puntaje oficina que responde
todos preguntas b
adivinando las que no tienen tiempo para hacer seriamente.
Hay dificultades tanto con esta sugerencia (“aplicando la
corrección por adivinar”) y con no usarla; el procedimiento
tonect dependerá de un ‹:nrefuanalysis deel caso e.at. Otra
versió n de la correcció n para adivinarCantar implica restar
t!› • r'ú mero de respuestas que uno . esperaría obtener £y
disparando desde el tokl scofe, ya sea que la prueba
se haya completado o no. Estos dos enfoques dan
esencialmente los mismos resultados (calificació n o
clasificació n pero no envío), pero: •sus efectos
pueden interactuar de manera diferente con
diferentes instrucciones en el prueba y diferentes
grados de condició n en los testículos. En general, la ética
requiere queSi
se utilizará n las correcciones sucli, será n pre-explicadas a
mi J5

CE
C gE£tATIOH La relación de ocurrencia concomitante
o variación. Su relevancia para la evaluación es ta) como
un indicio de que existe una relación causal (mostrando
que un efecto es p«rit),‹b) para establecer la validez de
un índice. El rango es límite -1 tit +l, con 0 mostrando
una relación aleatoria- barco, 1 mostrando correlación

perfecta (ltDh) (+1) o rápido


REDUCCIÓN DE COSTOS A elemento crucial en la
evaluación

ella ya que inevitablemente crean nuevos sistemas o la


posibilidad de ellos). Primero se debe considerar la
evitación de costos, el costo ahorros en los procedimientos
de traspaso en segundo lugar, aunque son todo ahorro de
costes en un sentido más general. Un procesador de textos
reduce el costo de volver a escribir el material sin
cambios, reduce el costo (la cantidad inerte y el tiempo)
de volver a escribir los borradores corregidos.
COSTOS, COST-AxALYSIS El costo es la utilidad
negativa. Los economistas lo definen relativistamente
como "el valor máximooportunidad usada
necesariamente abandonada", es decir, como oportunidad
abrigo, pero por lo general es mejor para los evaluadores
usar el sentido informal ("absoluto") ya que los clientes lo
entienden mejor y sep4r«felizmente considere la
oportunidad costos Siempre se debe preservar una
dimensión relativista, sin embargo, ya que los costos
no existen sin especificar la(s) persona(s) que asumen
el costo. Por lo tanto, el análisis de costos siempre debe
producir un matlix, con"pagar" hacia abajo en una
columna y tipos de costos en toda la filas A menudo es
útil distinguir los costos iniciales (puesta en
marcha)from•Costos de enjuague (rrmantenimiento);
bromas de capital de efectivo fluir; descontados de los
costos de rnwi directos de los costos indirectos o
generales, que incluyen depreciación, mantenimiento,
impuestos, algunos suministros, seguros, algunos
servicios, reparaciones,
• etc.; psicolgicos de costos tangibles; desembolsos de
oportunidadescostos de unidad. El enfoque de "capital
humano" o "recursos humanos" hace hincapié en un
componente no monetario. El "análisis marginal"
analiza los costos impares relativos, desde un nivel de
costo dado, y a menudo no es más relevante para las
elecciones de un tomador de decisiones en ese nivel de
costo básico, y más fácilmente.

COSTO-SEhfEF1T O BEhtEFIT-COST AhtALISIS


Costo-beneficio el análisis es un paso más allá ‹: eficacia
económica
análisis (ver más abajo) y estima el costo total y el beneficio
mi
E@C ' 4o^
respuesta: bt5æptogramorpn›ductworthttg
ritz wIah»ftheopaonshæt5+t«gte«the»æ/wt
ra"bo7(ftisogerin•tpossddetodocæt•bezefïtanaIysis, p.ej

u•œna'ocanewwtotlie‹piestkar.ls tlüs pn›gneiœpeid-


net wodi 'rte ‹xnt? Evaluador de neumáticos wfil1»ve al peso
y

COST-E5A5ÏBZCf3"'¥' ANA£VSIS Determinació n de


una base Sí/No si se puede pagar algo (este menú le
permite pagar los costos iniciales y continuos).
COSTO-RRE£ £vAEUATIox el dominio que evaiua-
Las ciones deben, si está n correctamente diseñ adas y nord,
mi ai' '• • Pueden
proporcionar hacer esto liderando
una referencia

recursos existentes desarrollos de esfuerzo. Las tablas de


equivalenciaentre costos y beneficios debe establecerse
para matdi el valores del cliente, y aceptado por tkeclîmt,
antes de que comience Ifireva1u- ption, soas :o evitar
presiones indebidas estar libre de coû t

así como la reducción de costos (si esto ú ltimo está interesado


en absoluto).'
COSTO MÁ S Otra base para calcular los ingresos de los
contratos es la base de “costo má s”, que permite la con- a
por costos má s un margen de utilidad,
dependiendo

ganar menos Ihan si el dinero estuviera en una cuenta de


ahorros y
shswæonasNaçasomeoher ,oragoeddezmo:w.
A veces los contratos de costo má s, ya que generalmente
omiten cualquier reayo controlars para mantener el
mi
cosD bajo (de hecho, a veces el
E@C “
a la inversa,•ya que el "plui" es a menudo un peroen!oge, de
la bá sic costo), unre tampoco es ideal para el
contribuyente. Esto tiene L•æ intioductlenof la
base de "correo más tarifa fija", wk thelee es fijo y no
proporcional al tamañ o del contrato. Eso a veces es mejor,
pero a veces, cuando el alcance de se amplía el trabajo
durante el proyecto, •por el
descubrimiento de dificultades o (sutilmente) por la
agencia reduce el beneficio por debajo de un nivel
razonable. El pzofit, después
todo, tiene que llevar al contratista a través de períodos en
los que los contratos no coadyuven de manera pequeñ a,
paguen el interés o. la inversió n de capital, y proxñ de alguna
recompensa por alto riesgo. La justificació n de los contratos
cnst plus es muy clara en circunstancias en las que es difícil
prever cuáles será n los costos y ningú n contratista en su
sano juicio emprenderá algo con un cst desconocido.
especialmente si la agencia desea detener la opció n de
cambiar las condiciones que son el met, el hardware que se va
a utilizar, etc., digamos a la luz de la obsolescencia de los
materiales disponibles al principio, el contrato de costo más
porcentaje puede tener sentido. La licitació n competitiva es
posible, después de todo.
CREDIBILIDAD Las evaluaciones a menudo deben ser
no solo válidas, sino que sus audiencias crean que son
vá lidas (cf. "No es suficiente que se haga justicia, etc."). ,
por ejemplo, incluso si en un caso particular no afecta de
hecho a la validez. No debe olvidarse que la credibilidad
es a menudo necesaria para la audiencia interna (el
personal) en un
. evaluació n formativa y no sólo para el(los) pú blico(s)
externo(s). La credibilidad interna es una de las principales
razones para utilizar un experto local, que conoce la jerga,
tiene un á rea temá ticaestatus, entiende "la clase que todos
tenemos", etc.
CBJTERIÓN El criterio es lo que sea que cuente como el
"y-off", por ejemplo, el éxito en la universidad se
considera el "criterio medida" contra la cual validamos una
prueba predictiva como una Examen de Ingreso a la
Universidad. Capacidad para equilibrar un cheque-bmk
podría ser un "comportamiento de excepció n" contra el
cual
evaluar un curso prá ctico de matemá ticas. (Cf. atandardl
PRUEBA cRFrœloN-gErsitxxcEo Esta escribe de
prueba
pnwides información sobre el. el conocimiento o
desempeño de un individuo (o de un grupo) sobre un
criterio específico. La pruebalas puntuaciones se
interpretan comparando ri con valores predeterminados.
Contratado ctteria rnther que por comparació n con
c iefer ccsee-Té . Eleso
de
X {METRO )señor-
='Ryihe•«e«o•-tüsía‹n;&«on,s;«aeaMeoç-
inipregmtedmiteruai, la»y-de,›endmt test—y«i el
técnica soinufrieseof la prueba. no está dentro de
anamateufs o el dominio de competencia habitual del
profesor para ‹x›nitnict sudi tfsts lér las habilidades
bá sicas o la mayoría de los principales ‹vrritulum 'si y
cuando los resultados son a menudo
anó malos.

azt‹Iefstood thequesó nonnorwkethers/ke shouldbecapaz de


responderla. Está
despejadoqueMconstrucció ndetalespruebas también
está má s allá de la capacidad o el interés de la mayoría de los
profesionales: todavía nos falta uno bueno funcional
literatura prueba. letalooe(ow o cinco IP elige hom. La
calificació n en una prueba de curso es oiozey n el caso
má s simple de un criteriozt-zefer-

esos enót3es con svlùch compazisons“ necesitar para ser


ùiado cuando un programa, grodu¢t, etc., ig está siendo
evaluado. Los competidores críticos pueden ser malos o
hipotéticos, por ejemplo, otra prueba existente o una que
fácilmente haríamos con sóssors y pasta. Se relacionan con la
pregunta wketker the/esf uaeo el

ya sea que se esté tirando la red. No solo quiere saber si este


texto 520.tD es geod; quieres saber sihay uno attxli mejor
para S20.ÏXI, o uno que es igual de gzx›d para SJ0.IXI. Esos
otros aze (dos de) el crítico com-
petidores que deben figurar en la evaluación del texto. Así
que s{touId a fihti('eso hay uno), conferencias, TV, un trabajo
o un trabajo interno, etc., si son un conjunto de ellos que
cubren material similar, El diseño de evaluación de
Tzcdióonal ha dejado de utilizar un tratamiento conbol
gtoup para la comparación, que es inconexa; “ningún
tratamiento” rara vez es la verdadera opción. es elviejo
tratarz«enforaoof/zzrinmsefïorzmr, o ambos,

(orrapeholarBhradienticfiacóinpags,soarost‹xenveetnhpinugttnz›ogeotnhéckr)a.sTst
o'efsaerusze'etzn«aasgrie«lzeevdaonrt
Los competidores críticos "creados" son a menudo los más
valiosos.
las contribuciones que hace un evaluador y las elabora
zequltes ¢reeó vity, k›ca1 conocimiento y reatismo. tn eco-
‹xineepts como centavo a menudo se definen en
términos o
mi
MI@ C
(que cantidadSe trata de ser los) competidores críticos,
pero se considera que identificarlos es fá cil. Competencia
crítica estándar, en una evaluació n de champú s para
alfombras* (por ex-'
"amplias) son fácil de identificar—todo lo que se llama
shampoo para alfombras pero los nou-standard son
los má s importantes. En este caso, Consumers Union
incluyó una solució n diluida de Tide, que superó y
redujo el costo de
‹ todos los champú s por una milla de campo.
CBITtCAL INODENIA TECHhflQUti (Flanagan) Este
enfoque, ligado al análisis de los r@rds
longitudinales , intenta identificar eventos o
tiempos significativos en Individuo.la vida de al
(o la vida de una institució n) vida, etc.) que de alguna
manera
parecen haber alterado toda la direcció n de eventos
subsecuentes". Ofrece una forma de identificar los
efectos de, por ejemplo, la escolarizació n, en
circunstancias en las que es imposible realizar un
estudio experimental completo. Está , por supuesto, lleno
de peligros. (Ref. Juan Flanagan, PAGSboletín sizoloico,
1954, págs. 327—3S8.)
TRANSVERSAL (estudio) Si quiere obtener los
Resultados que le daría un estudio longitudinal, pero
no puede esperar para hacer uno, entonces use un
estudio transversal como sustituto cuya validez
dependerá de ciertas suposiciones sobre el mundo. En
un estudio transversal, observa a los estudiantes de
primer añ o de hoy y . estudiantes que se gradú an hoy e
inferir, por ejemplo, que la experiencia universitaria ha
producido o se puede esperar que acompañ e la
diferencia entre ellos; En un estudio longitudinal,
observaría a los estudiantes de primer añ o de hoy y
esperaría a ver có mo cambian para cuando se gradú en.
El estudio transversal sustituye a los adultos mayores
que se gradú an hoy en día por una població n que no se
puede inspeccionar por otros cuatro añ os, a saber, los
adultos mayores en los que se convertirá n los
estudiantes de primer añ o o de primer añ o de hoy. Las
suposiciones involucradas son que no han ocurrido
cambios significativos en la demografía desde que los
actuales estudiantes del ú ltimo añ o se mudaron a la
clase de ingreso, y que no han ocurrido cambios
significativos en el colegio desde ese momento. (Para
ciertas inferencias, las suposiciones estará n en la otra
direcció n en el tiempo).
TÉRMINO CRTPTO-EVALUATIVO A término que aparece
ser puramente descriptivo, pero cuyo significado, en el par- ,
particularyontext—necesariamente (definitivamente) involucra
evaluació n*
conceptos ativos, por ejemplo, inteligente, tura, deducció n,
explicació n.
CULTURE-rAIR/CULTVRE-EREE Una prueba sin
cultivo evita prejuicios a favor o en contra de ciertas
culturas. Dependiendo de cuán generalmente se defina la
cultura, y de cómo las pruebas u•ed, este sesgo puede o no
invalidar la prueba. Cierto tipos de pruebas de resolución de
problemas que implican encontrar comida en un a‹fiñ‹: fial
desierto para evitar la inanición, por ejemplo, son lo más
cercano a la cultura libre como tiene sentido: pero thC, son un
poco imprácticos de usar. Descubrir que en una prueba se
determina entre, por ejemplo, razas con respecto a
los•números que pasan un determinado estándar, no tiene
absolutamente ninguna relevancia a la pregunta de si la
prueba es culturalmente justa. Si una carrera de partidos
tienesido oprimido durante un tiempo suficientemente largo,
entonces su cultura no proporcionará el apoyo adecuado para
ejercicios intelectuales (o atlético unos, dependiente al el
tipo de opresió n); eso
probablemente no proporcionará los requisitos dietéticos
previos para un desarrollo pleno; y puede que no
proporcione los modelos a seguir queestimular el logro en
ciertas direcciones. Por lo tanto, bastante nf›nrt {roin nvq
nllects uii the betw yoal, es de esperar ese ese grupo racial se
desempeñará peor en ciertos tipos de pruebas—si no
fuera así, el argumento de que ha ocurrido una opresió n
grave se debilitaría. Procedimientos sistemá ticosahora se
utilizan para 4evitar casos claros de sesgo cultural en la
prueba
elementos, pero estos son mal entendidos. Incluso educadores
distinguidos a veces señalará la aparición de un término como
"candelabro" en una prueba de lectura x'ocabulary como un
signo de sesgo cultural, con el argumento de que es poco
probable que los grupos oprimidos tengan candelabros en sus
casas. Por supuesto no lo son, pero eso es irrelevante: la
pregunta es si el término indica de manera confiable una
lectura amplia y, por lo tanto, si un número suficiente del
grupo opresor de hecho tomó el término al etiquetar un objeto
en el entorno en lugar de hacerlo.
:han a través de una amplia lectura para invalidar esa
inferencia. Esa es una pregunta empírica, no una nyri¢ri una.
Un punto similar surge al observar el uso de los puntajes
de las pruebas para la selección de admisión; la validación
de un punto de corte se basa correctamente en la experiencia
previa y puede basarse en una población principalmente
blanca. En tal caso, tenderá el uso de las mismas medidas de
corte para las minorías. a[metroArkansas ellos, como una
cuestión de hecho empírico (posiblemente porque los
esfuerzos posteriores de esos individuos reciben menos apoyo
de sus pares/casa que en la población blanca).
PLAN DE ESTUDIOS EVALUACIÓ N Evaluació n del plan de
estudios
puede ser tratado como una especie de §rMuct
e«Iuatioti, con énfasis en los estudios de outco.we de
aquellos que usan el curricu.
o puede abordarse en términos de validez de contenido.
("Canalla- riculum” puede referirse al contenido o a la
secuencia de cursos, etc.) Una falacia popular en el arra
implica la suposició n de que las buenas pruebas
utilizadas en la evaluació n de un currículo deben
coincidir con los objetivos del currículo o al menos con
sus objetivos.
contenido; de lo contrario,si han de ser pruebas del
currículo, deben ser restringidas independientemente, por
referencia encia a las necesidades de la població n usuaria
y del
dominio del currículo, sin tener en cuenta su contenido,
metas y objetivos específicos. Otra cuestió n se refiere a la
medida en que los efectos a largo plazo deberían ser los
decisivos: dado que normalmente son inaccesibles debido
a consideraciones de tiempo o presupuesto, a menudo se
piensa que las sentencias
” sobre los currículos no se puede hacer de forma fiable. Pero
esencialmente, todos los efectos a largo plazo se predicen
mejor mediante los efectos a corto plazo, que pueden
medirse. Y las inferencias causales involucradas. de temporal
datos remotos, incluso si podemos Espere estudiar el largo
plazo situació n, son mucho menos confiables que
cualquier ganancia del estudio a largo plazo
probablemente sería ilusoria. Uno de los errores má s
serios en gran parte de la evaluació n de los currículos
involucra la suposició n de que los currículos son
implementados de la misma manera por diferentes
maestros o en diferentes escuelas; incluso si se utiliza una
lista de verificació n bastante completa para garantizar la
implementació n, todavía hay una gran cantidad de errores
en el proceso de enseñ anza. En el sentido má s general de
currículo, que se refiere a la secuencia de cursos tomados
por un estudiante, el desfase ocurre a través de la
concesió n de excepciones, el uso de exá menes de desafío
menos que vá lidos, la sustitució n de diferentes
instructores por otros en excedencia, etc. Sin embargo, Los
buenos materiales del plan de estudios y las buenas
secuencias del plan de estudios deben evaluarse para
detectar diferencias importantes en su eficacia y
veracidad/comprensió n/relevancia para las necesidades
de los Estudiantes. Las diferencias entre lo bueno y lo malo
son tan grandes y comunes que, a pesar de todas las
dificultades, pueden resultar versiones y elecciones muy
mejoradas incluso de una evaluació n aproximada y leída
del contenido y la capacidad de enseñ anza. Davis identifica
los siguientes componentes en la evaluació n del currículo:
'determinar la naturaleza real del currículo (y su sistema
de apoyo de consejeros, otros currículos, catá logos, etc.)
en comparació n con Versiones y opciones muy mejoradas
pueden resultar incluso de una evaluació n aproximada y
leída del contenido y la capacidad de enseñ anza. Davis
identifica los siguientes componentes en la evaluació n del
currículo: 'determinar la naturaleza real del currículo (y su
sistema de apoyo de consejeros, otros currículos,
catá logos, etc.) en comparació n con Versiones y opciones
muy mejoradas pueden resultar incluso de una evaluació n
aproximada y leída del contenido y la capacidad de
enseñ anza. Davis identifica los siguientes componentes en
la evaluació n del currículo: 'determinar la naturaleza real
del currículo (y su sistema de apoyo de consejeros, otros
currículos, catá logos, etc.) en comparació n con
los desatptianos offxtal (por ejemplo, a través del análisis
de banscrîpt, cur-

examen de calidad Ron por su evaJugöon y revi-


sión; evaluar el aprendizaje de los estudiantes; sant
atrveysincluyendo
• Salida de exalumnos entrevistas-täcui s'
sobrevivir ofem- ". ”jugadores y
potencial empleados; s por expertos
profesionales en currículo; comparación con cualquier
sandalias proporcionado por la asociación profesional
pertinente; verificar con las principales escuelas o colegios
para ver si han mejorado.

CUTTING SC@BE Una partitura que pierde la línea


entre gzades, entre dominio y no dominio, etc. Siempre
arbitrario hasta cierto punto, es justificable en circunstancias
en las que eventualmente se sintetizará un número de tales
ecores. Pero en un informe final, solo los cortes hacen
sentido y el los grados deben indicar esto, por ejemplo, A,
A-, AB, B+, ... donde AB indica un área limítrofe.
Muchos opositores a las pruebas de competencia mínima
se quejan de la arbitrariedad de todos los puntos finales; la
respuesta debe ser usar una zona, es decir, tres grados
instgg{} de dos (claramente no desgarrado; competencia
incierta; claramente competente).
SÍNTESIS DE DAS El proceso semialgorítmico
semijuicio mental de producir hechos comprensibles a
partir de datos a través de deecripäve o inf 1 estadística e
interpretación ció n en el tenis de conceptos, hipó tesis o
teorías.

, HACEDOR DE DEGSIOH A veces es importante


distinguir entre tomar decisiones sobre el principio de
varias proposiciones y tomar decisiones sobre la
disposició n de (o acció n apropiada sobre) algo. Mientras
que el erudito automá ticamente cae en la primera
categoría, s/fte typi-sólo sirve como consultor de un
tomador de decisiones de Je
• .secfind tipo. La mayor parte de la discusión sobre los
tomadores de decisiones en el El contexto de evaluació n se
refiere a aquellos con el poder de disponer, no
simplemente Cth el poder de proponer o dibujar con-
conclusiones.
ORIENTADO A LA DECISIÓN INVESTIGACIÓN Ver
Conclusión-
Reoearclt Orientado. La distinció n es esencialmente invá lida en
mi
MI@ C“ “5ç
buena evaluació n, ya que las conclusiones son sobre el
derecho-ness de las decisiones.
DECISIÓN REGLA A IinLentre una evaluación
yacción.ej., “aquellos con una calificación inferior a C
debenrepite elcurso"; “Hvpothesis que no son
significativas al .0tel nivel será abandonado. El último
ejemplo es comúnRegla de precisió n pero ló gicamente
impropia; ver nJull Hyputhciis.)
SISTEMA DE ENTREGA El vínculo entre un
producto o service andtbe populatic = **.at necesita o lo
quiere. Es importante distinguir esto en la evaluación, porque
ayuda a evitar laerror de suponer que la existencia de
thej›eed justifica el desarrollo de algo para satisfacer las
necesidades. lo hace
‹›ii/ii si uno puede desarrollar un sistema de delirio m&w (o
hacer uso de uno existente) que llegue a los necesitados. (Un
sistema de marketing llega a quienes tienen deseos, que
pueden o noresultan ser necesidades.)
DELBHI TECXNTQUE A procedimiento utilizado
en grupo resolución de problemas, en vol ng—por
ejemplo—circulatir\ga preliminar ›'rrsión Antiguo Testamento el
problema a todos participantes, llamar- ing para
reformulaciones sugeridas (y/o soluciones preliminares).
Las reformulaciones se circulan para votar la versión que
parece más fructífera (y/o las soluciones preliminares se
circulan para ordenarlas). cuando el rango los pedidos han
sido sintetizados, I/met* se distribuyen para otro voto Se
practican innumerables variaciones de este procedimiento
bajo el título de “Técnica Delphi”, y existe una literatura
considerable al respecto. A menudo se hace en un wav
querestringe demasiado la entrada. por lo tanto, se arruina
antes de que comience.En cualquier caso, el intelecto de
organizador t#8 debe ser igual a los participantes o las
mejores sugerencias no serán reconocidas como tales. Una
llamada de conferencia telefónica puede ser más eficaz, más
rápida y más barata, tal vez con una posibilidad de que se
produzcan reflexiones posteriores por escrito. Pero un ,y‹yxf
Delphi vale la pena.
DEMOGRAFÍA Las características de una población
definida en términos de sus características de entrada,
entrando en un programa de prueba, por ejemplo: edad, sexo,
nivel de educación, ocupación, lugar de nacimiento,
residencia, etc., en contraste con los resultados. por ejemplo,
coeficiente intelectual. actitud, goleadores.
DEPENDIENTE VARIABLE Uno que representa la
resultado—el contrato es con el independiente' verdad
wafc Nosotros de Ott£ n0 Cdlt tYtADtp
Tlut deflnition ii circular y también lo son todos los demása
la distinc

DBg€BzP'rsON A menudo, el kazdestpartof aneval n


para principiantes, porque piensan que es fácil
Inbeling es
mi ! Deecržbtn normačxJudes evaluación
cerca de la cnd del zow” ki evaluar es usualmente
decir capaz de separar la zIes¢zt}›ció n de la'evaIuació n, y

,—-„, -— ——-— ———--— —— — -,


mayabo Izu5 .ctedescribtng tke bue function bfs‹xnething,
wkicJ'i sonwbtnes requiere un aná lisis profundo. (Desmbing
DNA sería oazaa funció n zefer a iD es raro festkted a
lo que se puede obedecer directamente). btiportnnt—
resbšcting it to sobresaliente feat-

inscripciones añ adidas por clinnt stu›uldbeated como


demandas de verificació n, no premisas. Stakelxilden
normalmente pro-vide mulbph descnpbons
inasistentes, todos wkxh son generalmente incorrecto (o
demasiado vago para ser aceptable). El sistema de entrega y
el sistema de apoyo s utd por lo general se irisa

DESCRfP'ZlVfi ESTADÍSTICAS El j›artofstatisticscon-


cemed con proporcionar i) tuminatirig perspectivas sobre
o re• ducciones de una masa de datos (cf. tnfexenttd
ttsttztia): tipi- Básicamente, esto se puede hacer como una
traducción, sin involucrar ttsL. Por ejemplo, calcular la
puntuación media de una clase a partir de sus puntuaciones
individuales es una deducción directa y no implica ninguna
probabilidad. Perors/iiii/i/i//,y la puntuación media de la clase de
la actuartuAlabama la media de una muestra aleatoria de la
clase es, por supuesto, Estadística inferencial.
DES\GN (evaluació n de nf; ver Diseñ o de Evduació n)
DIFUSORlOhl El proceso de difusió n de la
informació n. acerca de '(típicamente un producto (cI.
difusió n con la que
mi •'54
E@C '
la difusió n es deliberadamente á rida y algo artificialmente
con-
trasteado).
EVALUACIÓN DIkfENSIONAL A especie de evaluació n
analítica en la que el desempeñ o meritorio se divide en
un conjunto de dimensiones que tienen piopefías
estadísticas ú tiles (p. ej., independencia) o son familiares
de otros contextos y fá ciles de entender, etc. Ú til para
explicar el significado de un Reporte de evaluacion; la
evaluació n de componentes es má s ú til para explicar la
causa de un desempeñ o evaluado. Cf. Evaluació n de
componentes.
EVALUACIÓN DE DISCREPANCIA (Provus) La
evaluació n se concibe como la identificació n de las
brechas entre los objetivos minú sculos y el desempeñ o
de las acciones en las dimensiones de los objetivos. ait
elaboració n del rr,c6el o evaluació n simple de meta-
logro; una buena base para monitorear-

DISPERSIÓN (5tat.) La medida en que una


distribució n se ”distribuye” a lo largo del rango de sus
variables, a diferencia de. donde está "centrado", siendo
este ú ltimo denominado por medidas de "tendencia
central", por ejemplo, media, mediana, moda. La
dispersió n se mide en términos de, por ejemplo,
desviació n está ndar o semicuartilanillo '
DISEMINACIÓN El precio de distribuir (típicamente) un
producto en sí mismo, en lugar de informació n sobre él (ct.
difusió n) También se usa como sinó nimo de distribució n en
la jerga.
DISONANCIA Véase Consentimiento.
PRUEBAS REFERENCIADAS A OOMAIN El propó sito
de la prueba generalmente no es determinar la
capacidad del examinado para
‹ 4r ...w'er las preguntas sobre la prueba, pero para
proporcionar una base para las conclusiones. rm en un cierto
'criterio] nivel en-tvpicamente--un par- hcmldr Jirdt risirāii.
p.ej dos dígitos multiplicació n Dr * .s ligera generalizació n de
th.it para cubrir casos como str‹ social. . eso No hay criterio
Uno puede pensar en un dr.main como definido por un gran
-r1 de criterio, de n irish tomamos muestras, frascos t como—
en:el otro extremo—el txt +im*le•.s de las habilidades del
examinado. El mayor problema con DRT es definir dominios de
una MANERA ú til ' r
Popham tiene una ú til discusió n específica en su
Evaluació n Educativa, Prentice-Hall, 1975.
VERTIDO El prá ctica de descargar fondos
rá pidamente cerca del final del añ o fiscal para que no
sean devueltos a la burocracia central, lo que se
interpretaría como una señ al de que el presupuesto del
pró ximo añ o podría reducirse en esa cantidad.
cantidad ya que no era necesario. Esta hey estar hecho con
todos, los adornos de un RFJ?, es decir, a través de un
contrato, pero es una situación en la que la diferencia entre un
contrato y un la subvención tiende a evaporarse ya que el
contrato es tan inespecífico (debido a la falta de tiempo para
escribir la RfP cuidadosamente) que tiene
esencialmente el estado de una subvenció n. Desde el punto
de vista de la agencia, el dumpling es una señ al de tamañ o
inadecuado del personal, no una falta de necesidad del
trabajo que se solicita (.como el Congreso a menudo
infiere).
ESCALÓN Un término como "cohorte", soneto... sí, se
usa indistintamente con la lutera, pero es mejor
restringirlo a un grupo (o grupo de grupos) que está
escalonado en el tiempo con respecto a su entrada. Si un
nuevo grupo se incorpora cada (nuestras semanas
durante cinco meses, seguido de un intervalo de tres
meses, mientras se les capacita, y luego todo el proceso
comienza de nuevo, los tres grupos se llaman el primer
escaló n). lon; cada uno de ellos es ungrupo. '
ROL EDUCATIVO (del evaluador) Es tanto empírica
como normativamente el caso de que esta regla es de la
mayor importancia, en el peor de los casos só lo superada
por el papel de encontrar la verdad. Esto no se debe
simplemente a que se haya educado a pocas personas en
cuanto a la importancia o las técnicas de evaluació n; es
porque la disciplina probablemente siempre parecerá
sin importancia hasta que (o su descuido) te muerda. y
educació n rá pida sobre I/ini Juriitii/ar rama
.aplicació n de evaluació n n'ill entonces se convertirá muy
importante Ningú n profesional que no sea sofisticado acerca
de la evaluació n de personal, productos, productos y
programas en su campo es un profesional. pero incluso cuando
(o si) esta sofisticació n es s'idesp‹ad. No será fácil aplicarlo a
uno mismo ya los propios programas. .y el evaluador puede
ayudar a enseñ aruno có mo manejar el proceso y sus
resultados. Cuando Só crates dijo. "La vida no examinada
no vale la pena ser vivida", dijo.
ns identificándose como cv.valuator; pero no es casualidad
que sea más conocido como maestro. Tampoco es accidental
que se matara por combinar los dos roles. segundo también
VMuepNobia.
IMPORTANCIA EDUCATIVA (O GENERAL) A
get thi», el evaluador debe examinar los datos correspondientes a
cada uno de los puntos de verificació n anteriores en Key
Evaluation ChecMist: la importancia educativa representa
un totnl si//i- tlj‹sis de .all vou know. En particular, las
ganancias atribuidas al programa o producto que se está
evaluando, deben ser ñ il1i‹ntiuii- s+significativas/valiosas y
no |deberían ser estadísticamente significativas, algo que
só lo puede ser el resultado de usar una gran muestra, o
debido a ganancias de vocabulario irrelevantes, mala
construcció n de la prueba, aná lisis estadístico peculiar o
alguna otra variable insignificante. (La suma se aplica por
importancia médica, importancia social, etc.)
EFICACIA Usualmente se refiere al logro de metas.
A mediados de siglo se desarrollaron varios índices de
eficacia, cuando se pensaba que la evaluació n era
simplemente una medida del logro de objetivos para los
programas de acció n sexual. El éxito es un coyn‹Jmen, el
mérito y el valor son los má s importantes.importantes
predicados de e\ alu‹1ció n.
EFICIENCIA La eficiencia implica la ausencia de desperdicio.
para una salida yiven, puede @ aumentar aumentando t›utp.ut
por una entrada dada. Es quizá s má s una noció n micro que
la efectividad, es decir, uno puede inferir la funció n de los
componentes
\x'sin necesidad de saber los objetivos de la protecció n, t‹› que
efectividad má s obviamente relaciona
ESFUERZO, NIVEL DE Una medida utilizada en RFP y
ex .lació n como un índice de entrada de recursos de c›f —
por lo tanto, importante en ex'alu. n de, por ejemplo,
eficiencia
EIR Establecer ambiental Informe de impacto.
EMPIRISMO El d‹›ctnne cpistcmCilogical que acentú a el
prim.ar; de sensores km›w!edpe En la filosofía o la ciencia,
los positivistas (ló gicos) estaban entre los empiristas má s
principales y extremos, LiusselJ se describió a sí mismo
como un "empirista total". El contraste es con la (supuesta
lx') ex'i! trit›e tif metafísicos que tienden a ser "idealistas"
(en este sentido trcliniciil cif belit•vinp that the minc5,
la superioridad de los experimentos y las observaciones
(pú blicas) nunca un razonamiento J›riori y la introspecció n.. n..
Pero también implicó un prejuicio clave remanente de los
positivistas, es decir, el rechazo de todos los términos
evaluativos. Si bien es plausible decir que nose refieren a
propiedades observables, se llegó a concluir que carecían
de referencia objetiva ya que existe otra categoría
legítima de términos, a saber, aquellos que se refieren a
los llamados términos teó ricos, es decir, términos que se
refieren a
_unobse.rv.abtencia poder
ser inferido de (es decir, explica) los fenó menos observables.
- Los positivistas estaban originalmente dispuestos a eliminar la
mayoría de los no ob servible como entihs metafísicos, pero
rfiis lamentablemente deja uno sin taxonomías extraprilable,
explicaciones adecuadas, o guías para futuras micro
exploraciones. Los científicos sociales empiristas se deslizan
rá pidamente hacia la aceptació n de al menos teorías de nivel
medio y sus conceptos, pero se olvidaron de verificar si el tabú
es de la evaluació n.
vocabulario tivo fueron por lo tanto 1 ted. (Por supuesto,
ellosestaban usando estos términos todo el tiempo, para
distinguir buenos los diseñ os experimentales de los
malos, los buenos instrumentos de los malos, etc.) La
mejor excusa es quizá s que el lenguaje evaluativo
consiste en "términos teó ricos" que se relacionan con las
furiciones, no con las observaciones, pero también lo
hace gran parte del lenguaje de las matemá ticas y
lingü ística. El comportamiento imperdonable fue la
incapacidad de reconciliar el uso obviamente legítimo de
la evaluació n metodoló gica y la evaluació n del producto
de consumo con el continuo apoyo a la doctrina de la
ciencia social libre de valores. Véase Yaluephobîa.
LISTA DE ENEMIGOS Los peores enemigos a menudo son
los mejores críticos. Tienen dos ventajas sobre los amigos,
en el sentido de que son má s pequeñ os para ayudarte YY
rorlg, y má s experimentados con un punto de vista
radicalmente diferente. Por lo tanto, a menudo
sondeará n lo suficientemente profundo como para
descubrir suposiciones que uno no ha hecho. loco, unD
destruirv colcencC abcu t elmi impregnabilidad de uno es
inferencial estructuralmente deberíamos usar ellos
para la metaevaluació n, un el bien. Pero quien en-
* |cvs trabajando 'ith. agradeciendo y pagando a sus
enemigos?La respuesta es: Un evaluador de yuod. es una
prueba clave de ihee 'aluatinn ‹actitud“ (ver, Evaluació n
matar Qué poco sabemos realmente sobre los evaluadores
correctos de rit y có mo Muchas veces preferimos hacer la
vida má s fá cil para nuestro duende. No hay nada má s claro
que en este tema.aex por favor
es
el distribución de enseñanza-evaluación formularios a
estudiantes en una clase universitaria, normalmente se realiza
cerca del final del semestre. Pero, ¿dónde están tus enemigos
entonces? Hace mucho; sólo quedan los seIf•seIlected. Debe
distribuir los formularios a todo el cuerpo caliente que cruce el
umbral el primer día y cualquier fecha posterior; ser
entregados a su vecino de asiento cuando decidan no volver.
Son los que se fueron los que pueden decirte más, a estas
alturas ya sabes la mayor parte de lo que
ine stawaitś voluntad Ny. 11 usted vaTue/qńiiJFtv busque
sugerencias para aquellos que piensan que usted/faci it.
MODELO DE INGENIERÍA Ver modelo médico.
ES}O ORL Aunque es un error en la evaluación
educativa tratar el disfrute como primario y el
aprendizaje como algo que no merece una
inspección directa, no hay justificación para no
considerar el disfrute en absoluto (Kohlberg oilce
come ‹lted en el gran conde; evaluaciones de programas
de niñez tha. ... fue una lástima que nadie se molestara en
comprobar si al menos los niños podían hacer menos en
los centros de Headstart que en casa.) Y la situación en
ciertos casos, por ejemplo, la educación estética, es
mucho más cercana a uno
” donde el disfrute es un objetivo principal. Una falacia común es te
argumentan que dado que sería un grave error enseñar a los
niños de K-3 algunas habilidades cognitivas a expensas de
hacer que odien la escuela, por lo tanto, deberíamos hacer
>‹ir£ the'/ ni/‹›i/ school y freír para enseñarles habilidades. Esa
pńońńzańon de esfuerzo reduce el ya escaso interés en
enseñar algo valioso, y nunca ha sido validado para ganancias
en actitud positiva hacia la escuela. El maestro tiene un
conflicto de interés aquí, ya que pintar con los dedos requiere
menos preparación que desarrollar habilidades en el español.
ENTUSIASMO EFECTO Ver Efecto Hawthome.
EI"4INFORME DE IMPACTO AMBIENTAL (EIRI A
menudo
requerida por la ley antes de otorgar permisos de
construcción o de negocios o variaciones. Una forma de
evaluación centrada en los efectos del sistema. Basados
actualmente principalmente en biociencias y/o análisis de
tráfico, estos tienden a ser escasos en la evaluación de costos
de oportunidad, costos indirectos, árboles de contingencia
de ética, etc.
ERRORES DE MEDIDA Es una perogrullada que la
medició n implica algú n error; es má s interesante notar
exactamente có mo estos ermrs pueden meter a ‹›n‹ en
problemas en
estudios de evaluació n. Por ejemplo, es obvio que si
seleccionamos a los que obtuvieron puntajes bajos en
una prueba para el trabajo de recuperació n, algunos de
ellos quedará n en el grupo debido a errores de medició n
(es decir, su desempeñ o en los ítems de la prueba en
particular que se usaron). no da una imagen precisa de
su capacidad,
es decir tuvieron mala suerte—o distraídos)- Se sigue que un
inmediato zemeasurement, usando un prueba de dificultad
emparejada, probablemente los colocaría un poco más arriba.
Por lo tanto en un
eso. II EN
luciendo mejor, incluso si el tratamiento intermedio carecía
de todo mérito. Esto es simplemente un artefacto
estadístico debido a los oídos de la medició n
(específicamente, un efecto de regresió n). También
siguemínimos que coinciden dos grupos y sus
habilidades de nivel de entrada, donde planeamos "usar
uno de ellos como control en un
‹, estudio experimental interno (es decir, un estudio en el que los dos
grupos •
no se crean por asignación aleatoria) nos llevará a
problemas porque los errores de medició n en el hVO ,
No se puede suponer que los grupos sean iguales y, por lo tanto,
el efecto de regresió n será diferente en tamañ o. Otro.
desagradable
El efecto de los errores de medició n es reducir la
correlació n coeficientes; uno puede sentir intuitivamente
que si los errores de medició n son relativamente
aleatorios, deberían "promediarse" cuando uno llega a
observar las correlaciones, pero el hecho es que cuanto
mayores son los errores de medició n, menor es la
correlació n. Aparecerá n 'ns. Consulte Regresió n a la
media tLe.
FIDEICOMISO Individuo neutral o lugar seguro donde
se pueden depositar datos de identificació n hasta que se
complete una evaluació n y/o destrucció n. (Término
originado en la ley). Ver Filtro, Anonimato.
É TICA(en ex'evaluació n) Véase también Evaluació n de
responsabilidad. La ética es la ciencia social normativa
ú ltima, ú ltima porque se refiere a deberes (etc.) que
trascienden todo
‹otras ohllgatic›nS como las de la prudencia, la ciencia y la
profesionalidad. Es en un sentido una rama de la evaluació n,
en otro una disciplina que, como la historia o la estadística,
aporta un elemento clave a muchas evaluaciones. Que es
(logí-Por supuesto, una ciencia social es negada
virtualmente por todos los científicos sociales, quienes
tienen fobia a los valores incluso ante la sugerencia de
que los juicios de valor no éticos tienen un lugar en la
ciencia e hipervalorofobia a la importació n de juicios
éticos. Pero la consecuencia inexorable del desarrollo
teoría del juego y de la decisió n, aná lisis de la funció n
latente hermana, democrática. La teoría III de la ciencia
política, la economía del bienestar, la jurisprudencia
analítica, la genética del comportamiento y el enfoque de
las "buenas razones" de la teoría ética, es que todos los
ladrillos han sido cocidos para el edificio, y es
simplemente supersticioso argumentan que alguna
fuerza misteriosa prohibe poner uno encima de otro. La
Constitució n y la Declaració n de Derechos son
esencialmente proposiciones éticas, con dos
propiedades: primero, hay buenas razones para
adoptarlas; segundo, generan leyes só lidas. Los
argumentos (o ellos (por ejemplo, "On Libertv" de Mill)
son tan buenas ciencias sociales como las que
encontrará en un largo día de paseo por las revistas
profesionales, y las inferencias a leyes específicas está n
bien probadas. así como los argumentos a favor de la
existencia de los átomos son, indirectamente,
argumentos a favor de la existencia de los electrones. La
ética es simplemente una estrategia social general y no
es má s inmune a las críticas de las ciencias sociales que
la pena de muerte, los impuestos especiales, la terapia
conductual o las huelgas policiales. Actuar como si
alguna barrera ló gica le impidiera a la ciencia
argumentar a favor o en contra de "afirmaciones éticas
particulares tales como la inmoralidad de la pena de
muerte" (una cuestió n de estrategia social general), pero
no argumentar a favor o en contra de estrategias
particulares dentro de la sociedad. la economía o la
psicología es separar las ciencias seriales de las má s así
como los argumentos a favor de la existencia de los
á tomos son, indirectamente, argumentos a favor de la
existencia de los electrones. La ética es simplemente una
estrategia social general y no es má s inmune a las
críticas de las ciencias sociales que la pena de muerte,
los impuestos especiales, la terapia conductual o las
huelgas policiales. Actuar como si alguna barrera ló gica
le impidiera a la ciencia argumentar a favor o en contra
de "afirmaciones éticas particulares tales como la
inmoralidad de la pena de muerte" (una cuestió n de
estrategia social general), pero no argumentar a favor o
en contra de estrategias particulares dentro de la
sociedad. la economía o la psicología es separar las
ciencias seriales de las má s La ética es simplemente una
estrategia social general y no es má s inmune a las
críticas de las ciencias sociales que la pena de muerte,
los impuestos especiales, la terapia conductual o las
huelgas policiales. Actuar como si alguna barrera ló gica
le impidiera a la ciencia argumentar a favor o en contra
de "afirmaciones éticas particulares tales como la
inmoralidad de la pena de muerte" (una cuestió n de
estrategia social general), pero no argumentar a favor o
en contra de estrategias particulares dentro de la
sociedad. la economía o la psicología es separar las
ciencias seriales de las má s La ética es simplemente una
estrategia social general y no es má s inmune a las
críticas de las ciencias sociales que la pena de muerte,
los impuestos especiales, la terapia conductual o las
huelgas policiales. Actuar como si alguna barrera ló gica
le impidiera a la ciencia argumentar a favor o en contra
de "afirmaciones éticas particulares tales como la
inmoralidad de la pena de muerte" (una cuestió n de
estrategia social general), pero no argumentar a favor o
en contra de estrategias particulares dentro de la
sociedad. la economía o la psicología es separar las
ciencias seriales de las má s
• á rea importante en la que pueden hacer una contribució n
social. ció n Y conduce a bordes irregulares e
inconsistencias dentro de las ciencias mismas. Para una
excelente discusió n del dilema de "ética o de lo
contrario" para la teoría de la asignació n, ver
EJ Kiishan, Cost-Benefit Heaiysis, 197h, Praeger, Chapter
SS, 'The Soci.al Rationale of Welfare Economics'.
- evaluació n (por ejemplo, el Capítulo 61 se llama
"Coherencia en la evaluació n de proyectos"), ni ese término
ni la variació n "v.evaluació n" de uso frecuente del autor
aparecen en el índice. Ver Valor-fobia. •
EVALUABILIDAD Los proyectos y programas—y los
planes para ellos—está n comenzando a ser analizados
con mucho cuidado para determinar su evaluabilidad. -
por requisito de /‹i/sfir‹›i/ify. El principio subyacente

6j"
puede expresarse de varias maneras, por ejemplo, "I{ no es
suficiente que se hacen buenas obras, debe ser posible
decir que (y, lo que es má s importante, cuá ndo) no se
han hecho buenas obras". requireyien) de un
componente de evaluació n en una propuesta ha existido
por un tiempo; la novedad de wkat es un esfuerzo má s
serio para hacerlo factible y
apropiado Ese presupone más experiencia en evaluación
tailandés más+evie tu *
ittny venir. Eva\uabi)iDiv debe ser revisado y mejorado en la
planificación y pzeformativo etapas requiriendo evaluâbil- itv
de nuevo programas es análogo para requerir insertar
›icea/ii/ifytn un auto nuevo; bastante obvio, pero quien
ademas propietarios de flotas (y GSA) sabían que había por
muchos sí una diferencia de 2:1 en los costos de servicio
estándar entre Ford y GM? El Congreso puede aprender
algún día que la baja evaluabilidad tiene un alto precio.
EVALUANO Lo que se está evaluando; si es un per-hijo, el
término "evaluado" es má s apropiado.
EVALUACIÓN El proceso de determinar el mérito, el
valor o el valor de algo; o el producto de ese proceso.Las
características especiales de la evaluació n, como un tipo
particular de investigació n (distinguida, por ejemplo, de
la investigació n empírica tradicional en las ciencias
sociales), incluyen una preocupació n característica por
el costo, las comparaciones, las necesidades, la ética y las
dimensiones políticas, éticas, de presentació n y de
costo. ; y con el apoyo y la elaboració n de juicios de valor
sensatos, en lugar de la prueba de hipó tesis. El término a
veces se usa de manera má s narró tica (como "ciencia")
para significar solo una evaluació n sistemá tica y efectiva,
o solo el trabajo de personas etiquetadas como
"evaluadores". Mientras que la evaluació n en el sentido
amplio es ineludible para el comportamiento racional o
Pensado, la evaluació n profesional es / con frecuencia
inú til y costosa. La evaluació n, hecha correctamente,
puede decirse que es "una ciencia" en un sentido amplio,
como puede ser, por ejemplo, la enseñ anza, pero
también es un arte. una habilidad interpersonal, algo que
hacen los jueces y los jurados y los críticos literarios y
los asesores inmobiliarios y los tasadores de joyas, y por
lo tanto no es "una de las ciencias". Véase también
Fomiative/Sumative, Analytical/Holistic, etc.
EVALUACIÓ N EOUCATTON La educació n del
consumidor es todavía bastante débil en cuanto a la
formació n en evaluació n, que debería ser
su componente más importante. Y, por supuesto, hay
otros contextos además de aquellos en los que el papel de
uno es el de Consumidor, donde la evaluación de la
e‹juación sería más valiosa, en particular el papel de
gerente, o el papel de proveedor de servicios/profesional.
Pocos maestros, por ejemplo, tienen la menor idea de
cómo evaluar su propio trabajo, aunque éste es sin duda
el requisito mínimo de profesionalismo. Las últimas
décadas han visto un esfuerzo federal y estatal
considerable.
"- op ov mi asona le stan a s de calidad? eso proteger al
consumidor en varias áreas; no han entendido realmente
que la superposición de estándares es un pocrsustituyan la
suerte entendiendo la |ustificacion por ellos. El
entrenamiento de evaluación es la formación de
evaluadores (principalmente profesionales); La
educación para la evaluación es la formación de los
ciudadanos en técnicas de evaluación, trampas y
búsqueda de recursos, y es el único enfoque satisfactorio
a largo plazo para mejorar la calidad de nuestras vidas
sin gastos adicionales. Despilfarro ordinario de recursos.
ÉTICA DE LA EVALUACIÓN Y ETIQUETA Porque
ex'aluación en pr. ctice sc a menudo implica engañosas
relaciones interpersonalestiene mucho que aprender de la
diplomacia, el arbitraje, la mediación, la negociación y la
gestión (especialmente gestión de personal).
Desafortunadamente, la sabiduría de estos áreas está
encapsulada en materiales de aprendizaje y
capacitación, que son principalmente triviales o
anecdóticos. El enfoque correcto le parecería a Lex'ia el
refinamiento de los principios normativos y el desarrollo
colateral de extensos ejemplos de calibración, en lugar
de desarrollar la habilidad en el análisis ético aplicado
(casuística). J Un ejemplo: vuu son losslo por primera vez
en un equipo de visita a una institucin prestigiosa ción,
y }'‹›usted se da cuenta gradualmente, a medida que
pasa el tiempo en especializarse y leer o escuchar los
informes de la administración trators y ‹1dministr.ation-
selectV facultV, que ningún serio e›'alu4ti‹›n está a punto de
ocurrir a menos que yo/‹›ii d‹› algo sobre
.t. ¿Qué debe hacer? Hay .z preciso (flow-ch.artablc)solución
'que especifica una secuencia de acciones y enunciados'
6« "
ance.s, e‹zch ct›ntingent u[›on the particular ‹out of the
prex'iou/s Act, nnd th que evita el comportamiento poco
ético mientras minimiza• la angustia; matujx' profcssion‹tls
sin e\'alua-tit›n excrieilc \'ur get it right; scme muy
experimentado y reflexivo cx ‹1lu•1turs come x'ery rlose;
‹1 grupo cont‹1in-
ing ambos alcances consenso total al respecto después de
una discusió n de veinte minutos. Como tanto en la
evaluació n, esto muestra que cumple con los está ndares
del sentido comú n, aunque no está en nuestros informes
individuales. Debería ser. Otro ejemplo: una respuesta
por escrito sobre una evaluació n anó nima del personal
(erm acusa al evaluado de acoso sexual. Como persona a
cargo de la evaluació n, ¿qué debe hacer exactamente?
('Ignorar no só lo es éticamente incorrecto, es
obviamente

SVLUACIÓ N DE EVA£UACIONES. Véase Met•-


eval-

EVxLUATIOx O EVALUADORES El historial, no las


publicaciones, es la clave, pero ¿có mo se obtiene?
Véase Evalun- titirt Registry, hizo Shopo.
EVALUATtoX PREOTCATZS Las relaciones
distintivamente evaluativas o atribuciones involucradas
en la calificació n, clasificació n, stfniri$ y prorrateo, como
formas de determinar el valor, el mérito o el valor propio.
Una enorme lista de otros términos evaluativos son
apropiados para algunos contextos en lugar de éteres,
por ejemplo, validez (de pruebas o noticias), integridad
(de seguridad, sistemas o personal), adecuació n,
adecuació n, efectividad, plausibilidad. Estos predicados
pueden ser interpretado como si cumpliera una funció n
de formació n-doñ ipresió n en el lenguaje, combinando
datos de penormancia y evaluació n de necesidades o
datos de está ndares en un paquete conciso, del cual la
calificació n con letras para el trabajo de curso es el
ejemplo paradigmático.
REGISTRO DE EVALUACIÓN A concepto a medio
camino de la certificació n o licencia de evaluadores del
completo laissez-faire. Esto operaría alentando a los
evaluadores y sus clientes a presentar una copia de su
contrato conjunto o carta de acuerdo con el registro de
evaluació n al comienzo de una evaluació n; a esto se le
agregaría cualquier modificació n hecha en el camino y,
finalmente, un breve informe está ndar de cada parte,
hecho de manera independiente. evaluando la calidad
y utilidad de la evaluació n, y el desempeñ o del cliente.
Cada uno tendría la ‹oportunidad de agregar un
resumen (reacció n a la evaluació n del otro), y el
resultado final neto (2 pá ginas) estaría disponible
para su inspecció n, a cambio de una tarifa, por parte
de clientes potenciales. Este arreglo, se argumenta,
sería de má s utilidad para el cliente que pedirle a un
evaluador que sugiera

55
gq
clientes como referencias o siihplv mirando una lista de
publicaciones o informes, pero evitaría los problemas clave
con la concesió n de licencias: está ndares de cumplimiento y
financiació n. Los costos iniciales para tal registro, aunque
pequeñ os, no está n disponibles, posiblemente porque
estamos en un período de evaluació n negativa. Véase
Directory of Evaluation Consultants (The Foundation
Center, 1981).
"EVALUACIÓN 6vałuatk›n dane irLa•au-i-.
nuestra manera científica; el término es popular entre los
seguidores
del modelo de evaluació n de las ciencias sociales. Ver Introducció n
a este libro
METODOLOGÍA ESPECÍFICA DE EVALUACIÓN Gran parte
de
la metodología utilizada en los estudios de evaluació n se deriva
de otras disciplinas: la naturaleza especial de la evaluació n
es la forma en que selecciona y sintetiza estas
contribuciones en una perspectiva general adecuada, y las
obliga a influir en los diversos tipos de tareas de evaluació n.
Pero hay algunas situaciones aquí variaciones sustanciales
en se vuelven apropiados los procedimientos usuales en la
investigació n científica. T 'o instancias a'ill ô e mencionado.
En la investigació n de encuestas, el tamañ o de la muestra
está normalmente predeterminado a la luz de
consideraciones estadísticas y evidencia previa sobre los
pará metros de població n. En evaluació n, ‹Aunque hay
ocasiones en que un
»urvex' uf el tipo clá sico es aprox. 'r°, survevs son
frecuentemente' »n'‹ /i nt‹›n/ en lugar de
th.art‹J«r›‹/›tn'‹'»un'evs y luego la situació n es bastante
diferente. Supongamos que un encuestado, en una encuesta
telefó nica \nt 'dejemos' evaluar a los usuarios de un
servicio pamcu-far, encuentra un comentario totalmente
inexperto
‹›n el servicio que sugiere, digamos, comportamiento impropio
comportamiento bx' los sein hielo-prtividers. (Podría
igualmente estarlosugiere un efecto secundario inesperado y
altamente beneficioso). En el patró n está ndar de sun*e\', uno
continuaría , utilizando el mismo formulario de entrevista, a
través del resto de la muestra. En c›'aluations, une \›'ill
bastante otten
'ant tu alter the form st› as to include a explicit question t›n
this p‹›int. Uf courbe, uno ya no puede informar los resultados
deel sol'ex' »'con una muestra de cien, 'con respecto a esta
pregunta (y otros con los que su presencia podría
interactuar). Pero c›ne max 'ver' 'él él capaz de
encontrar .otro I» ents' peoylc que respondía bajo cueiny, \
x'h‹› no lo haría
han producido esto como una respuesta libre. Ese resultado es
mucho más importante. que salvar la encuesta, en la
mayoría de los casos. También apunta a otra característica
de la situació n de evaluació n, a saber, la conveniencia de
secuenciar en el tiempo las entrevistas o las respuestas a los
cuestionarios. Por lo tanto, uno debe tratar de evitar
• el uso de un solo envío masivo de correos una prá ctica
comú n en la investigació n de encuestas; mediante el uso de
correo secuencial se pueden examinar las respuestas para
posibles modificaciones del instrumento. El segundo tabú
que podemos tener buenas razones para romper se refiere
al tamañ o de la muestra. Si nos encontramos obteniendo un
muy alto
. está ndar tipo de respuesta a una pregunta bastante elaborada-
En el aire, estamos descubriendo que la població n tiene menos
variabilidad de lo que esperábamos, y deberíamos alterar
nuestra estimació n de una muestra apropiada sL.e a mitad de
camino. No tiene sentidoen continuar pescando en las
mismas aguas si no muerdes después de una hora. La
generalizació n de este punto: es a la u:‹e de diseñ os
“emergentes”, “en cascada” o “rodantes”, donde todo el
diseñ o varía en ruta segú n corresponda. (Estos términos
provienen del glosario en £oaiuafioii Stands fs.) Otra
metodología específica de evaluació n incluye el uso de
equipos paralelos que trabajan independientemente, la
calibració n de
)jueces, convergencia sesiones, "ciego" juez síntesis, la
evitació n de la recopilació n de datos a menos que los aata
sean necesarios para la replicació n o sean indicadores de
error, equilibrio de sesgos, etc. Véase también Anonimato,
Cuestionarios.
EVALUACIÓN SXILLS Hay listas de deseables
habilidades para evaluar (Stufflebeam tiene una
con 234 competencias más; en cuanto a filósofos,
casi cualquiera tipo de conocimiento especializado es
ventajoso, y J'hè hè herramienta más obvia "habilidades solas
(ver el Evaluación Xey ChecMist) están lejos más exigente que
en cualquier otra disciplina: estadística, análisis de costos,
análisis ético, administración. enseñando. terapia, contrato
de ley, gráfica, síntesis difusión (para el informe); y por
supuesto están las técnicas específicas de evaluación.
Aquí mencionamos un par que son menos obvios.
Primero, la actitud evaluativa o temperamento. A menos
que estés comprometido a la bú squeda por calidad, como lo
mejor de aquellos en ej. la lega) o las profesiones
científicas está n comprometidas con la bú squeda de la
justicia o el arco de la verdad, está s en el juego
equivocado. Se sentirá tentado con demasiada facilidad
por los encantos de "Unirse" (por ejemplo, unirse al
personal del programa; consulte Going Native); tc›t›
descontento con el papel del forastero. la virtud de

•* ›.
6C
evaluació n i//t/sf lx' su propio al rewdrd, porque las
hondas y las flechas son muy reales. (Por cierto, este valor
es un aprendizajey probablemente incluso una
característica enseñ able para muchas personas; pero
algunas personas lo adquieren de forma natural y otras
nunca lo cambiará n.) El segundo paquete de Las
habilidades reivindicadas son habilidades de "aná lisis
ló gico prá ctico", p. identificar agendas ocultas o
suposiciones desapercibidas sobre el proceso de
diseminació n; o desajustec› entre unquad-séf \ t â na
un enunciador de necesidades; de Iu‹TptioJWn ñ fi diseñ o de
evaluació n; la capacidad de proporcionar un resumen
precisomarías uno cincuenta ci el longitud del original
(precis) o a dar una descripció n totalmente no evaluativa, no
interpretativa de un programa o tratamiento La buena
noticia es que nadie es bueno en todas las habilidades
relevantes; que haya i5 espacio para los especialistas, y
también para los miembros del equipo. En parte debido a la
formidable naturaleza de la lista de habilidades relevantes,
la evaluació n es un campos aquí aprende /f /›r‹›/ ‹' malos
‹todos/i/c›t/t ‹/ son inmensamente' mejores que
- solistas. No solo son dos anuncios mejores que uno, seis
cabezas—i(Cuidadosamente'elegidos y
apropiadamente'instruidos—son mejores que fi\'e"'
EVALUACIÓN ESTÁNDARES A conjunto de principios
para
la guía de tasadores y sus clientes. El mayor
esfuerzo es el Evaluai ter Standards !ed. D. Stufflebeaq,
kJcGrau' Hill, 1980), pero la E\'aluation Itese.arch
Society'ha .\l»c› producido un conjunto. Hay algunos
«adt- nesss» compartidos, por ejemplo, ninguno
incluyeNeessm•nt— pero el
primero es mucho má s explícito acerca de la interpretació n,
dando ejemplos específicos de ‹aplicaciones, etc.
.y gener‹1l rendimiento, pero los flars han sido expresados por
iirst-r‹ank e\'aluatr›rs that thL\' may rigidifv appr‹›aches,
sofocar la investigació n, aumentar los costos (ct "defensix'e

lab tests" en
EVALUACIÓN, TEORÍA DE La “o ofc*valu‹1tion” incluye»
‹1 u'ide range t›f topic» frc›m the lc›yic c›f evaluah\'e
discurso, yenqrat da cuenta de (la naturaleza de la e\'aluació n
y ht›"' puede bt* |ustificar6 (‹axioloy\'), a través de la
sc›ciopolítica. en particular t\ pes uf medio ambiente, tt›
‹›-llamado lltd "m¿›dcls" \\ que ‹›frecuentemente son
simplemente conceptu.aliz.1- tic›ns tel o prc›cecJ viral
rrcomm‹ ndahons miedo ovalunti‹›n.
Se financia poco trabajo sobre esto; una excepció n
notable es el proyecto Rcmarch on Evaluation del NIE en
NWL, una serie de estudios sobre 'métodos' de
evaluació n radicalmente diferentes.
CAPACITACIÓN EN EVALUACIÓN Básicamente,
no existe un apoyo serio para esto en este momento,
a pesar de la gran demanda (y la mayor necesidad) de
evaluadores capacitados. tal vez una señal de una
reacción violenta en la evaluación. Los lugares de
ayuda son probablemente
• CT[tCE y el Centro de Evaluación en Western ktich\ an con
post-tot w ziï fhe Laboratorios del Noroeste. Los
cursos cortos sonancho moze)y avaiIab)e y anunciado en
qpe/upfion JVcz s. Véase también Traïaïng de Evalaadores.
EVALUAR UN TfTUtfE V e r e v o l u c i ó n
Sktlb.
EVACUADO Una persona siendo evaluada; el término
má s general, que cubre productos y programas, etc., es
"evaluar".uand.”
EJECUTIVA RESUMEN Resumen de los resultados
de un evaluació n, generalmente en lenguaje nou-
técnico.
SALIDA ENTREVISTAS
Entrevistas con sujetos a medida
que se van, por ejemplo, un programa Gaining occlínico, para
obtener datos reales y de juicio. Un muy buen momento para
estos, con respecto al curso. o evaluació n de la enseñ anza en
el escuela OY Universidad colocar- ting, es en el momento de
graduarse, C u á n d o : (a) el stu"'rit será tener algo
perspectiva sobre mbst de la educació n experto-,
encia; (b) (la tasa de retribució n es baja; (c) la tasa de respuesta
puede ser cercana al % con una planificació n cuidadosa; (d) juicios
de efectos
son relativamente sencillos por ejemplo, por trabajo-
enperirnce, como un factor extra causal; (e) la memoria
aú n está fresca. Después de esto (encuestas de ex
alumnos), las condiciones pueden deteriorarse y lo
hacen, aunque hay una compensació n parcial porque la
relevancia del trabajo puede juzgarse con mayor
precisió n.
EXPERTO Ver True Experú nent.
EXPERIMENTA' GRUPO El grupo (o persona sola,
etc.) que está recibiendo el tratamiento en estudio. Cf.c0fttf0l
gYUtnQ.

EXPLICACIÓN 1. por el contrario con evaluació n, cual


, identifica el valor de algo, explicació n implica “responder a
una pregunta de por qué o có mo al respecto, u otro tipo de
solicitud de comprensió n. A menudo, la explicació n
implica
(encontrando th• «i‹ic» de un fenó meno. rb ” es ?//‹*ñf/•
yo» (que es una parte importante de la evaluació n) \Vn<.. •
posible, 'sin poner en peligro los mv:n objetivos de lo que
puede ser holístico
ex'8luation sum‹a tive, . xid diseñ o de evaluació n trata
de descubrir m1crri -expl‹1nattons (por ejemplo, hv
identificando esos com-
componentes del currículo que está n produciendo los
mv Jor parte de los efectos, o aquellos que está n teniendo poco
efecto) El primer pnc›rit\', sin embargo, yo para resolver la
uvalua- tiun emite tl• el paquete es el mejor 'disponible? etc).
Tuo a menudola re•.‹ arch ‹›n ntació n y entrenamiento ui
et'alua tr'rs los lleva a hacer un pcx›rj‹›b en e\'uluació n porque
el\' se metió en -
?*r‹'ste'd in ex]planation [LE). Et'en entonces, una explicació n
'ntérminos c›ia conceptual esquema mayo' no lnvc lve
mucho de a d: 'er ion, »'hrreas 'e mal puede permitirse una
bú squeda de una teoría. La re.1lizotinn tL‹en la ló gica ii‹Ttii rt* y
en 'estigatom' de- m‹1nds of e x'aIu .at ion ‹1r« quitc' differen. tfOM
los de explica-nati‹›n es ‹1s impr›rtant .is thu correspondiente
realizació n con rc•spect tr› prudictiun y e |plan‹anation, que la
neo-posi- Los filó sofos de la ciencia todavía piensan que son
ló gicos los cms debajo de la piel (tcmpc••al).
2. Excl.1natic›n ‹›/ Th . ‹'iz/‹/nt/w/ está surr iendo algo más que
mavint'‹›lt'e' (‹a) .tr‹1n5l‹1pequeñ os tecnicismos, (b)
descomprimir el
. Yo no \ indica‹1 tt›r . hc›u yo me gusta identidad, I mi ,
)solo si\ tinta; Ie) exh lblhn¿ the' mm r‹›-et aluatlons on
sep‹1rate dimensiones th‹3I ‹idd up tta the glob‹a 1 rating, (d)

bi vinq com poncnt

EX POST FAST DF'5IGN Cono \x'aquí ›x'e identifica' a


L‹ ntrol yrnug ".1ftt'r el hecho". es decir, ‹después de que el
tratamiento haya
‹spurrtd '\ x'c*r\ mucn diseñ o x'e.Aker que el verdadero experi-
mento •4nce allí nz ust h.lx c hc'‹'n *r›n«'tliiii,y diferente •1b‹1u Yo
el ub|tc,s ese y‹›t el tre‹iLment 'sin siendo asignado t‹› it, en
‹›rd‹'rt‹› excl.min ›x'h\' thet' yt›t it, u‹zd ese algomt',1n• ellos 'ro
nc›t el s. mt' n• the c‹›ntr‹ I ¿rr up, In s‹›me
‹t nkn‹›tx n resgc*ct that md\' be rel.ated t‹› el tre‹1tmen I
los informes del evaluador externo es lo que determina si la
evaluació n es formativa o sumativa, cualquiera de las cuales
puede ser realizada por evaluadores externos o internos
(contrariamente a la opinió n comú n de que externa es para
sumativa, interna para formativa), y ambos deben hacerse.
por bnth.
VALIDEZ EXTERNA A diferencia de la validez interna,
se refiere a la posibilidad de generalizar los hallazgos
experimentales/de evaluació n. Aquí, las trampas que se
deben evitar incluyen la falta de identificació n de las
variables ambientales clave que resultan ser constantes
a lo largo del experimento, la disminució n de la
sensibilidad de los participantes al tratamiento en la
prueba posterior debido a la prueba previa, los efectos
de alcance del arreglo experimental o la selecció n
sesgada de los participantes. participantes que podrían
afectar la generalizabilidad del efecto del tratamiento a
los no participantes, poniendo así en peligro la validez
externa.(Á rbitro. mtal aW Cuasi-
Diseños Experimentales/o Investigación, DT Carripbeli y
JC Stanlev, Rand McNally & Co., Chicago, 1972, y Vafidi• y
fssxes m Eunfxn*fueNzsexrri, ed. Bennstein {Sage,
1976)). Las referencias discuten la concepció n clá sica de
Yalidity en la evaluació n, pero esto es solo una parte del
problema. La validez de contenido es extremadamente
importante en la evaluació n y esencialmente no se
discute en estas referencias (típicas). Ver General-

EXTRAPOLAR Inferir conclusiones sobre rangos de


Variables má s allá de los medidos. Cf. Interpolar.
ROSTRO VALIDEZser validez aparente,
típicamente ítems de prueba o de pruebas; puede haber
juicios há biles y no calificados si tienen validez aparente,
y juicios altamente calificados que se acercan mucho a la
validez de contenido, lo que requiere una
fundamentació n sistemá tica.
DESVANECIMIENTO Técnica utilizada en textos
programados, donde
‹una primera respuesta se da completa, la siguiente en p•ri con
brechas, luego, con una sola señ al, t!:ec. ‹buscado sin
ayuda Una técnica clave en la formació n y calibració n de
evaluadores.
CULPA ANÁ LISIS DE Á RBOL (CAUSA DE ANÁ LISIS DE
Á RBOL
Estos términos surgieron aixiut l96°i, originalmente' en la
literatura
‹si ciencias de la gestió n y sociologv. A veces son ú tiles en un
sentido muy técnico, pero son ú tiles en un sentido directo.
Básicamente, el modelo al que se refieren es el gráfico de
resolució n de problemas, que se encuentra en el paginas ct
nl
por ejemplo, un manual de Volkswagen. Las ramas del árbol
identifican las posibles causas de la falla (de ahí los
términos "causq" y "falla" en la frase), y este método de
representación, con varios refinamientos, se usa como
recurso para los consultores administrativos. formación en
gestión de lotes. etc. Su uso principal en la evaluación es
como base para la evaluación de necesidades.
CAMPO INICIADO Esto se refiere a propuestas o
proyectos para el financiamiento de subvenciones o
contratos que se originan de los trabajadores en el
campo de estudio, en lugar de un programa que anuncia
la disponibilidad de fondos por parte de una agencia
para trabajar en un á rea determinada (lo que se conoce
como investigació n “solicitada”). o desarrollo).
FIELD onxr ioR nzro use Un simulacro de una
prueba de un producto/programa, etc. Absolutamente
obligatorio en cualquier actividad seria de evaluació n o
desarrollo. Es esencialque en al menos una prueba de
campo de tr'ie debe realizarse en circunstancias y con
una població n que coincida con la situació n y la
població n objetivo. Es posible que los ensayos anteriores
("de invernadero") no cumplan con este estándar, por
razones de conveniencia, pero el ú ltimo debe hacerlo. A
menos que esté dirigido por evaluadores externos (muy
raro),existe un riesgo importante de sesgo en la muestra o
las condiciones o contenido o interpretaciones utilizadas por
el desarrollador en la final ensayos de campo.
FILTRAR Alguien que, o una computadora que elimina
la informació n de identificació n de la entrada evaluativa,
para preservar el anonimato del encuestado. ‹
EVALUACIÓN TISCAL El subcampo altamente
desarrollado que implica observar el valor o el valor
probable de
por ejemplo, inversiones, programas, empresas. Ver ROI,
Payback,
Descuento de tiempo. Pmfit,etc
ris ING Coloquialismo para exploratorv Iphase o0
research; ‹›• para la verdadera naturaleza de grandes
porciones de evaluación seria (por ejemplo, programa); o
para visitas a War+'ngtcn en busca de apoyo financiero
DIAGRAMA DE FLUJO Una representación gráfica de la
secuencia. o decisiones incluyendo decisiones contingentes.
que se configura para guiar al n. nagement ‹-' pru)ects (ur el
diseño de compu-ter prt›gran.s), incluida la evaluació n
protege. Usualmente mira.scomo un diagrama de
organización s'idewavs. traer una serie de

62
71
cajas y triangulos ("bloques de actividad", etc.)
conectados por líneas y símbolos que indican
actividades/puntos de decisió n simultá neos o
secuenciales, etc. El grá fico AP£RT es un grá fico especial
caso.>
ENFOCAR lo de un programa Un concepto más apropiado
para la mayoría de las evaluaciones que ”objetivo”; ambos
son conceptos teó ricos, ambos sirven para limitar las quejas
sobre cosas no hechas al á rea general donde los recursos
están disponibles/utilizados legítimamente.poder. El
enfoque de un programa a menudo mejora con una
buena evaluació n.
EVALUACIÓN FORMATIVA La evaluació n formativa
se lleva a cabo durante el desarrollo o mejora de un
programa o producto (o persona, etc.). Es una evaluació n
que se lleva a cabo por el personal in-hoc del programa y
normalmente permanece internamente; pero puede ser
realizado por un evaluador interno o externo o
(preferiblemente) una combinació n. La distinció n entre
formato y sumativo ha sido bien resumida en una frase
de Bob Stake 'Cuando el cocinero prueba la sopa, eso es
bueno; cuando los invitados prueban
la sopa, eso es summaùve.“ Por lo general, la evaluación
formativa se beneficia de evaluación znaJytic, pero fzoliético
evJua- ción más hial-and-error o asesoramiento de
expertos también funcionará y puede que algunas veces
se todo ese es posible. Arialítico la evaluación, a su vez,
puede o no involucrar/requerir/producir un análisis causal,
D por
lo que la conexión entre evaluación y
ció n es bastante remota, contrariamente a W. Edwards
comentario alt citado: "La evaluació n es un estudio de las
causas".
FOL/ND DATA Datos que ya existen, antes de la
evaluació n; el contraste es con datos experimentales o
datos de prueba y medició n.
DOCUMENTO FUGITIVO Aquel que no se publica a
través de los canales pú blicos como libro o artículo
escrito. Los informes de evaluació n han sido a menudo
de este tipo. ERIC (Centro de Informació n de Recursos
Nacionales para la Educació n) ha recogido algunos de
estos, pero dado que sus está ndares de selecció n son tan
variables y su selecció n tan limitada, el tiempo dedicado
a la bú squeda con demasiada frecuencia no es rentable.
FUMOÏNG (evaluaciones de uf) Se hace de muchas
maneras, pero aquí se describen los patrones má s
comunes. La propuesta de evaluació n puede ser
"iniciada en el campo", es decir, no solicitada, o
envió en respuesta /o(a) un anuncio de programa, (b) una
RFP (Solicitud de propuesta), (c) una solicitud directa.
Típicamente (a) resulta en una subvención, (b) en un
contrato; el primero identifica un cargo general o misión
(p.ej "desarrollar mejorado pruebas para las dimensiones
afectivas de la primera infancia”) y el último especifica más o
menos exactamente lo que se debe hacer, por ejemplo, cuántos
ciclos de pruebas de campo (y quién va a ser muestreado, el
tamaño de la muestra que se utilizará, etc.), en un "Ámbito de
trabajo". La diferencia legal es que este último es exigible por
falta de cumplimiento, el furmer (prácticamente) no lo es. Pero
apenas tiene sentido usar contratos para investigación (ya que
generalmente no se puede prever cual la forma en que irá), y
rara vez es justificable usarlos para las evaluaciones de
programas muy específicas exigidas por la ley'. Enfoque
c,“proveedor único”, elimina licitación competitiva y por
lo general sólo puede ser justificada cuando sólo un
contratista tiene mucho la mejor combinación de
‹experiencia elevada o recursos útiles o de personal; pero es
mucho más rápido y evita el absurdo común de 40 postores,
cada uno gastando 12K (S12, £ 3X1) para presentar una
propuesta por valor de 3tXIK al ganador. El desperdicio allí
(180K) proviene de los costos generales cual son finalmente
pagado por el contribuyente, o b} postores yendo rompió
porque de tonto requisitos Un buen compromiso es eldos
niveles En el sistema, todos los oferentes presentan una
propuesta preliminar de dos (o cinco o diez) páginas. los
mejores obtienen una pequeña subvención para desarrollar
una propuesta completa Los contratos pueden o no tener
que adjudicarse al postor "calificado" más bajo; la
calificación puede involucrar recursos financieros,
estabilidad, desempeño previo, etc. , así como técnico y
gestión pericia. en grandes contratos hay u»ua1lY a
'postores' conferencia" dentro de poco después de la
publicación de la RFF (a menudo se requiere que las agencias
federales publicar el RI I' en el comercio de negocios Dzzi/y y/o
el FegistPr fe‹Ieral). Semejante una conferencia oficialmente
sirve para aclarar la RFP; de hecho, puede ser un cruce entre
una estafa y un juego de póquer. Si haces preguntas
ingeniosas, otros pueden (a) estar asustados, (b) robar su
enfoque, etc. credibilidad, etc. Eventualmente, tal vez
asistiendo a una segunda conferencia de licitadores, se pedirá
a los licitadores más prometedores su mejor oferta y la final y,
sobre esta base, la agencia seleccionará una, probablemente
mediante una revisión externa posiblemente anónima.
panel para dar credibilidad a la selecció n. Después de la
primera reunió n entre el ganador y el oficial del proyecto
(el representante del agente debe llamarse monitor), a
menudo resulta que la agencia quiere o puede ser
persuadida para que quiera que se haga algo que no está
claramente en el contrato; entonces se renegociará el
precio. O si el precio era demasiado bajo (la RFP a
menudo lo especificará en términos de "Nivel de
esfuerzo" como i'4 "añ os-persona" de trabajo; esto puede
significar NX 30K o i'N S 50K en tenis en dó lares,
dependiendo sobre si los gastos generales son un
complemento) para hacer el trabajo, el contratista puede
seguir adelante hasta que se quede sin dinero y luego
pedir má s, con el argumento de que la agencia habrá
invertido tanto y estará tan irreversiblemente
comprometida ( en cuanto al tiempo) que tienen que
cumplir para "salvar su inversió n". “El contratista, por
supuesto, pierde credibilidad en las ofertas posteriores,
pero es mejor que ir a la banca; y los registros están tan
mal guardados que nadie puede acusarlos (si es que
deberían hacerlo). En los viejos tiempos, las ofertas de
lpw eran una fachada y la renegociació n con argumentos
falsos a menudo conducía a un costo muy superior al de
otro mejor postor. Dado que las evaluaciones son
difíciles de hacer en muchos sentidos, los postores deben
permitir una almohadilla en su presupuesto para
contingencias, o simplemente cruzar los dedos,
•QUÉ RÁ PIDO Guías a la quiebra De ahí otro ofon Es hacer
RFF por el mejor diseñ o y viáticos y luego dejar el contrato por
el tiempo que sea necesario para hacerlo. La forma de abuso
asociada con este costo más el enfoque es que el contratista
está motivado para extenderlo. Por lo tanto, no se obtiene un
ahorro general claro con ninguno de los dos enfoques; pero el
más gordo todavía se usa donde la agencia quiere poder
cambiar los objetivos a medida que los resultados preliminares
llegan, un punto sensato, y donde tiene un buen personal de
monitoreo a evitar excesivo excesos (fmm .vt/- irio/ que
por supuesto no son vinculantes). Una gran debilidad en todos
estos enfoques es que las propuestas innovadoras a menudo
fracasar porque la agencia que yo nombré una revisión panel
de personas comprometido a el tradicional Enfoques
quién
naturalmente, tienden a financiar "uno propio". Otra
debilidad importante es la complejidad de todo esto, lo
que significa que las grandes organizaciones que pueden
permitirse abrir sucursales en DC, pagan a redactores de
propuestas profesionales y "personal de enlace" (es
decir, lubrificadores). bvistas), tienen un tremendo
margen (pero a menudo hacen un mal trabajo, ya que la
mayoría de las mejores personas no trabajan para ellos).
Una tercera debilidad clave es que el sistema descrito
favorece el pro-

sesenta y cinco

7
conducto de papel oportuno en lugar de la solució n de
problemas, ya que eso es todo el proceso de seguimiento y
gestió n puede identificativo Miles de millones de dó lares,
millones. de puestos de trabajo, se desperdician miles de
vidas porque no tenemos un sistema de recompensa por un
trabajo realmente bueno, que produzca soluciones
realmente importantes. La recompensa es por la propuesta,
no por el producto; y la recompensa es el contrato. Una vez
obtenidos, só lo la falta de fiabilidad en la entrega o la
negligencia grave ponen en peligro las adjudicaciones
futuras. Puede ver el sistema de valores que produce este
arreglo por la forma en que todos los vicepresidentes pasan
a trabajar en la siguiente "presentació n" tan pronto como se
completa la negociació n. Seríasolo cuesta centavos para
revertir este procedimiento a través de (parcial) premios de
contingencia y Paneles de expertos para evaluar el trabajo
realizado en lugar de las propuestas.
FUTURISMO Dado que los bienes de consumo está n
diseñ ados para algunas poblaciones futuras y no (solo) para
las presentes, gran parte de la evaluació n requiere estimar
las necesidades y el rendimiento futuros. El aspecto má s
simple de esta tarea involucra la extrapolació n de datos
demográ ficos; incluso esto se hace p¢wrlv, por ejemplo. la
crisis de las inscripciones en la educació n superior solo fue
prevista por un analista (Cartter), aunque la inferencia es
bastante simple. La tarea má s difícil es predecir, por
ejemplo, los patrones reales de actuació n con veinte añ os
de antelació n. Aquí hay que caer b. ck en técnicas de
cox'enng de posibilidad, en lugar de selecció n de
probabilidad, por ejemplo, mediante la enseñ anza;
flexibilidad de actitud o generalizació n
Habilidades .capaces.
GENERALIZABILIDAD (Cf. Validez Externa) Al- aunque
la validez externa se equipara comú nmente con la generalidad
izabilidad, se refiere só lo a una parte de ella. Normalmente
uno quieregeneralizar a poblaciones (etc.) t's.Inf/in//yc//ic'r
que el probado, no solo r. trii|x›lnhly utlier; y no son solo las
diferencias de població n, sino las diferencias de tratamiento y
las diferencias de efecto
‹ (ha( son de interés. (Consulte el punto de verificació n de
generalizabilidad en la Lista de verificació n de evaluació n
clave) En resumen, la generalizabilidad de la validez eterna
es similar a la de las estadísticas inferenciales; podríamos
llamarlo s/i‹›rt-raiiy‹', ;‹'ii‹ ri//t::nti‹›ii. Pero la ciencia y la
evaluació n
.ation están constantemente empujando por Ti,;-rniiy‹• v‹
n'rnliznti‹›ii. involx'ing tenut›us inductis'e o saltos
imaginativos que requieren investigació n. La centralizació n
está, pues, a menudo má s cercaespeculahon que a rrl rnJXifi
itiiiii Y el valor de cosas/ personas es seguido crucialmente'
afectado por su s ersatilidad, es decir

75“
utilidad a través neralizació n.-
EVALUADOR DE PUBLICIDAD GENERAL Alguien con
una amplia gama de experiencia en evaluación, no
identifcado con un campo/área/disciplina en particular.
(El contraste es con una experiencia local.) ft kelps to
kave y el término también puede connotar experiencia
fuera de un tipo de evaluación, p. a¢cmditatioa tipo de
evaluación. El médico de cabecera es débil-
. La falta de conocimiento es una falta de conocimiento legal,
pero esto contrasta con la falta de sesgos locales. El mejor
arreglo es el uso de dos (o más) evaluadores. uno de I‹xal y
uno de propósito general.

GRAMO Alabama (evalua'han) Ver holístico.


-META ,El técnico El sentido de este término restringe su
uso a descripciones más bien generales del resultado
previsto; las descripciones má s específicas se conocen como
objetivos. es importante darse cuenta de que las metas no
pueden ser consideradas como características observables
de programas (o productos, sistemas de software).
A menudo hay un objetivo anunciado, oficial u original,
pero generalmente lèverai, en cuyo caso el problema de
cómo ponderar su importancia relativa aparece y rara vez
respondido con suficiente precisión para llegar a la conclusión
evaluativa correcta. Por lo general, también, diferente partes
interesadas tener diferentes metas—conscientes e
inconscientes—para un programa; y la mayoría de estos
cambian con tiempo. Lo mejor que se puede esperar es tener
una idea general del funcionamiento de un programa. metas
como construcciones teóricas a partir del rastro de papel,
entrevistas y acciones. Los principiantes a menudo piensan
que los objetivos son los objetivos originales oficiales del
instigador, al igual que piensan que la descripción correcta del
programa proviene de la misma fuente. Ambos son difíciles de
conseguir; dado que la búsqueda de la meta no solo es difícil,
sino que a menudo es innecesaria y también a menudo
sesgada, uno debe ser muy Cuidado para evitarlo siempre
que sea posible. Ver Evaluació n de goles libres.
META-MCHI MENT NIODEL (de evaluación) El
idea de que el mérito del programa (o persona) se
equipara con el éxito en el logro de una meta establecida.
Este es elversión más ingenua de la evaluación de goa)-hased.
BASADO EN OBJETIVOS EYALUATIOX (GBE)
Este tipo de
evaluación se basa y centrado en el conocimiento de los
objetivos
y ob va del programa, persona o producto. Una meta-
la evaluación basada a menudo no cuestiona el mérito de las
metas; a menudo no mira el lado del costo de la rentabilidad; a
menudo falla en buscar o localizar el apropiadocompetidores
críticos; a menudo no busca sistemáticamente los efectos
secundarios o los parámetros válidos del proceso, como la
ética; en resumen, a menudo no incluye una serie de
componentes importantes y necesarios de una evaluación.
Incluso si incluye estos componentes, son r@ernfred a los
usuarios del programa (o personales) y, por lo tanto, es
probable que el enfoque se vea envuelto en problemas
serios como la identificación de estos objetivos, el manejo
de las inconsistencias en ellos. y cambios
en ellos a lo largo del tiempo, lidiando con el déficit y el
exceso de resultados, y evitando el sesgo perceptivo de
saber acerca de ellos. GBE no es jEvduació n de logro de objetivos de
Ust——it poder, en principio, involucran la crítica de los
objetivos. Pero tales críticas
presumiblemente implicaría una evaluació n de las
necesidades de la població n impactada, y una vez que se
tiene eso, la comparació n directa con los efectos totales
del programa produce una estimació n del valor sin
referencia a las metas, es decir, GFE.
* 5o GBE es demasiado limitado o innecesario, excepto como
una reconceptualizació n conveniente de una evaluació n
para el beneficio de los empleados o gerentes que,
comprensiblemente, deben usar un trabajo de meta y
desean recibir comentarios sobre la efectividad del
programa en esos términos. GBE es iiioiia,ter- orieiiteâ
valoració n, cerca o seguimiento y lejos de consitnn'r-
rieiited evaluació n. (Ver GFE). Definir la maldad como el
estudio de la eficacia o el éxito de los programas es un
signo de aceptació n (a menudo inconsciente) de la GBE.
EVALUACIÓN SIN METAS IGFEIIn este tipo
evaluació n, al evaluador no se le dice el propó sito del
programa, sino que entra en la evaluació n con el propó sito de
averiguar qué es realmente el programa sin que se le indique lo
que debe hacer. Si el programa está logrando sus metas y
objetivos declarados, entonces estos logros deberían aparecer
(en la observació n del proceso y en las entrevistas con los
consumidores (no con el personal); si no, se argumenta que son
irrelevantes. El mérito se determina al relacionar el programa
<'((hechos a los cuernos correspondientes del oc/er/
población, en lugar de las metas del programa (es decir,
agencia o ciudadanía o congreso o gerente). Por lo tanto,
podría llamarse "evaluación basada en las necesidades" o
"evaluación orientada al consumidor" en contraste con la
evaluación basada en objetivos o orientada al administrador.
68
F
evaluació n. No sustituye los objetivos del evaluador nilas
metas del consumidor para las metas del programa; la
evaluació n debe justificar (vta la evaluació n de
necesidades) todas las asignaciones de mérito. GFE
generalmente no es del agrado de ambos
gerentes/administradores y evaluadores, por razones
bastante obvias: suscita ansiedad por su falta de
estructura predeterminada. Lo dicen los seguidores ser
menos intrusivo que GBE, más adaptable a los cambios de
objetivos a mitad de camino, mejor en encontrar lado efectos
y menos propensos a social, percepción y sesgo cognitivo. ft
es arriesgado, porque el cliente puede recibir una
desagradable sorpresa cuando llega el informe (sin que lo
tomen de la mano previamente) y rechazarlo. pagar porque se
avergonzaba ante la perspectiva de tener que pasar la
evaluación a la agencia de financiamiento. (Pero si los
hallazgos no son válidos, el cliente debe simplemente
documentarlo y solicitar modificaciones). GFE es reversible,
una ventaja clave sobre GBE; por lo tanto, un diseño de
evaluación debería (a veces) /x',gin GFE, escribir un
prelizninario reporte. luego vaya a GBE para ver si ocurrieron
errores graves u omisiones. (Corriendo un paralelo El esfuerzo
de GFE junto con un GBE reduce el lapso de tiempo.)
La reacción de choque a GFE en th. El área de
evaluación del programa (es el procedimiento estándar
utilizado por todos los consumidores que evalúan
productos) sugiere que el dominio de los sesgos de
frianagerr‹ent en el programa evaluación era muy fuerte.
y posiblemente que los gerentes sintieran que habían logrado
un control considerable sobre los resultados de las GBE. GFE
es análogo al diseño doble ciego en la investigación médica;
incluso si el evaluador le gustaría dar un informe favorable
(por ejemplo, debido a
siendo pagado por el programa. o porque con la
esperanza de seguir trabajando (rem ellos) no es
(generalmente) fá cil decirle a limb› que
"hacer trampa" bajo condiciones GFE. El riesgo de fracaso
por parte de un evaluador es, por supuesto, mayor en
GFE, lo cual es deseable ya que aumenta el esfuerzo,
identifica la incompetencia y mejora el equilibrio de
poder.
VOLVIÉ NDOSE NATIVO El destino de los evaluadores
que son cooptados por los programas que está n
evaluando. (Término originado con Expenmer.tal
Schools. Evaluació n del programa a mediados de la
década de 1960). un buen evaluador puede ser un papel
muy solitario y si empiezas a pensar
.j{iout itl tht? forma equivocada te sigues viendo a ti mismo •8s a
fuerza negativa, y quién no lo haría ¿Prefieres ser
coautor que un (mero) crítico? Una respuesta; alguien a
quien le importa má s la calidad que las felicitaciones. Ver
Evaluació n S mata. En la investigació n de campo
antropoló gica, un fenó meno estrechamente relacionado
se conoce como el síndrome de "mi tribu", caracterizado
por actitudes de propiedad hacia los temas del trabajo
de campo de uno y actitudes defensivas hacia las
conclusiones de uno sobre ellos. Ver Independencia.
PUNTUACIÓN DE EQUIVALENCIA DE GRADO A
intento bien intencionado de generar un índice
significativo a partir de los resultados de las pruebas
estandarizadas. Si un niñ o tiene un puntaje equivalente
al grado de 7.4, eso significa que está obteniendo un
puntaje en el nivel promedio (estimado) alcanzado por
los estudiantes cuatro meses después del séptimo grado.
La concepció n del concepto ha llevado a menudo a una
interpretació n no justificada de los valores medios como
norma razonable para los individuos, y
pasar por alto el puntajes brutos que puede decir una muy diferente
storv. Supongamos que un estudiante principiante de octavo
gradoestá anotando en el
nivel 7.4; los padres pueden estar bastante molestos a menos
que alguien señale que en esta prueba en particular el nivel
8.0 es el mismo que el
7.4 nivel (porque o( verano reincidencia). En lectura, un
déficit de dos entero calificación equivalentes es bastante
o(diez se recupera en pocos meses en el primer ciclo de
secundaria si un profesor logra motivar al alumno por primera
vez. Nuevamente, un estudiante puede tener un equivalente de
grado completo por debajo y estar por delante de la mayoría de
la clase, si el puntaje promedio se calcula como el nie4, no
como la mediana. De nuevo, a estudiante en el |i|tli una
calificación de 7 2 podría hundir por completo la prueba de
lectura de séptimo grado; 7.2 )simplemente significa que
puntúa cuando un estudiante de séptimo grado puntuaría en la
prueba de /i///‹ calificación. El déficit de un año de la norma de
grado Sth no es comparable al déficit de un año
de la norma de cuarto grado. Y así sucesivamente, es
decir, utilícelo con precaució n. Pero no lo tire a menos
que tenga algo mejor para el pú blico.
CALIFICACIÓN ("ftating" se usa a veces como SV£IO-
nvm./ Atribuir individuos a un conjunto ordenado
(generalmente pequeñ o) de categorías abeladas, el
orden correspondiente a ment,
por ejemplo, A -F para "calificació n de letras". Los que
está n dentro de una categoría se consideran empatados
si solo se utiliza la calificació n con letras; pero si un
comercio numérico ("detecció n") también es usrd,
pueden clasificarse como 'ithif* h' adrs. El uso de má s
«1.º menos grados simplemente equivale a usar má s
categorías. calificació n pro-
da un f›artinI clasificación, pero la clasificación no puede
proporcionar una calificación sin una suposición adicional,
por ejemplo que el mejor estudiante es lo suficientemente
bueno para una A, o que se justifica la "calificación en la
curva". Es decir, las etiquetas de calificación normalmente
tienen algún significado independiente del vocabulario derneAt
(“exce\- prestado”, etc.) y no puede ser tratado como
simplemente un secuenciado conjunto de categorías
separadas mediante cortes arbitrarios en una secuencia
clasificada de individuos. En resumen, las calificaciones son
normalmentereferenciado al criterio; esoes clasificación eso
es facilitado por las pruebas nozm-zefezenced: esa
distinción frec|uencia resulta en confusión. Por ejemplo,
calificar a un estudiante no implica la necesidad de "superar"
a otros estudiantes, no tiene por qué engendrar una
"competitividad destructiva", como se piensa a menudo. Solo
j›iih ici-‹ año/mayo u// 4 rHns joes ese. Pass/Not Pass es una
forma simple de calificación, no un sistema sin calificación.
Las calificaciones deben tratarse como estimaciones de
calidad realizadas por un experto y, por lo tanto, constituyen
retroalimentación al consumidor de cir del alumno; corromper
esa retroalimentación porque la sociedad externa hace un mal
uso de las calificaciones es una anulación del deber hacia el
alumno o consumidor, una confusión de validez con utilización.
Ver Evaluación de responsabilidad.
INJERTO Ver Financiamiento.
EFECTO DE HALO La tendencia de la Reacción de
alguien a parte o la totalidad de un estímulo (por ejemplo,
una prueba, las respuestas de un estudiante a una prueba,
de alguien personalidad) derramarse tn a su reacción a otras
partes, especialmente adyacentes, del mismo estímulo. Por
ejemplo, los jueces de exámenes que involucran varias
respuestas de ensayo intentarán calificar más alto la segunda
respuesta de un estudiante en particular si calificaron la
primera una alto de lo que sería si esta hubiera sido la
primera respuesta que leyeron de este estudiante (el error
es a menudo tanto como una calificación completa). El
efecto halo es
Esto se logra haciendo que los jueces evalúen todos los
primeros componentes, si miran alguno de los segundos
componentes, y ocultando (a partir de ellos su calificación en
el primer componente cuando llegan a evaluar). el segundo El
efecto halo recibe su nombre frc›m la tendencia suponer que
alguien que es santo en un tipo de situación debe ser santo (y
quizás también inteligente) en Todo tipo de situaciones. Pero
el efecto halo también se refiere a la transferencia ilícita de
una evaluación iie,y4/it*r. La obra I \artshome A May (Sfxdies
inEngaño, Co- lumbia, l92ft) sugiere que no hay una buena
base para este tran•f 'r
a través de categorías de inmoralidad.
DURO vs. SUAVE (enfoques de evaluació n) Manera
coloquial de referirse a la diferencia entre el enfoque
cuantitativo/de prueba/medició n/encuesta/diseñ o
experimental de la evaluació n y el
descriptivo/observacional/narrativo/entrevista/etnográ fic
o/observador participante tipo de enfoque.
HAWTHORNE, EFECTO La tendencia de un grupo o
persona que está siendo investigada, experimentada o
reevaluada, a reaccionar positiva o negativamente al
hecho de que está siendo investigada/evaluada y, por lo
tanto, a comportarse mejor (o empeorar de lo que lo
haría en la ausencia de la investigació n, lo que dificulta la
identificació n de los efectos debidos al tratamiento en sí
mismo No es realmente lo mismo que el efecto placebo,
es decir, el efecto sobre el consumidor de un proveedor
de servicios entusiasta que resulta simplemente de la
creencia evidente en el poder del tratamiento del
proveedor o del receptor, aunque el término se usa a
menudo para cubrir ambos. El efecto Hawthorne puede,
y se definió originalmente en una situació n en la que los
resultados, ocurren sin ninguna creencia en el mérito del
tratamiento. Ver John Henry Efecto.
HABITACIÓN Ver Techo Efecto.
JERÁRQUICO SISTEMAVer Dos niveles.
PUNTUACIÓN/GRAOING/EVALUACIÓN HOLÍSTICA
La
asignació n de una ú nica puntuació n/grado/evaluació n al
cará cter general o @desempeñ o de un evaluando; en
contraste con la puntuació n/calificació n/evaluació n
analítica. La distinció n holística/analítica corresponde a la
distinció n macro/micro en economía y la distinció n
molar/molecular o gestá lica/atomista en psicología. Global
es otro apodo, si —como en la salud campo—“holístico”
tiene otro, confuso
asociaciones.
HIPERCOGNITIVO o TRANSCOGNITIVO el do-
principal más allá de supercognitivo, Cuál es el estratosfera
‹›f el cogniti›'e; incluye habilidades de meditación y
concentración; cnginaliW; la dimensión intelectual de la
intuición enpática (como se evidencia en el juego de roles,
la actuación, etc.); imagen eidética; casi perfecta oh|
ectividad, racionalidad, razonabilidad, cr ”juicio” en el
lenguaje común; m‹'•al sensi-
tividad; Habilidades ESP, etc. Algo de esto se refiere
incorrectamentecomo "educació n afectiva"; parte de ella
pertenece allí; todo ello llama má s la atenció n.
PRUEBA DE HIPÓTESIS El modelo está ndar de ciencia
bú squeda en el enfoque clásico a el social ciencias, en las que
se formula una tesis antes del diseñ o del experimento, el
diseñ o se organiza para probar su verdad, y los resultados se
expresan en términos de una probabilidad estimar que los
resultados se debieron únicamente al azar (“la hipótesis nula”).
Si la probabilidad es extremadamente baja de que solo haya
estado en juego el azar, el diseño debe hacer que sea
indzctivamente muy probable que la hipótesis sea probado
era correcto ¿Qué se considera como el alto grado de
improbabilidad de que la ú nica oportunidad estuvo en el
trabajo por lo general se toma como el .05 "nivel de
significado" (una probabilidad en 20) o el .01 (una
oportunidad en un "nivel de significació n" de cientos.
Cuando se trata decon fenó menos cuya existencia está en
duda, un nivel má s apropiado es .iXil; donde la
ocurrencia del fenó meno en esta situació n particular es
todo lo que está en juego, los niveles convencionales son
má s apropiados. El nivel de significació n se usa así como
un índice crudo o el mérito de una hipó tesis, pero es
legítimo como tal solo en la medida en que el diseñ o sea
a prueba de balas. Dado que la evaluació n no es una
hipó tesis
prueba, poco de esto es de interés en la evaluación,
excepto en
verificar hipó tesis subsidiarias, por ejemplo, que el
tratamiento causó ciertos resultados.
Una distinció n importante en la prueba de hipó tesis que
se traslada al contexto de evaluació n de una manera ú til es
la distinció n entre errores de tipo 1 y tipo 2. Se trata de
un error de tipo 1 cuando concluimos que la hipó tesis
nula es falsa aunque no lo sea; un error de Tipo 2 está
involucrado cuando concluimos que la hipó tesis nula es
verdadera cuando en realidad es falsa. El uso de un nivel
de importancia de .05 significa que en alrededor del b%
de los casos estudiados cometeremos un error de tipo 1.
Como nosotros
Reforzando el nivel de significación uftr, reducimos la
probabilidad de error ufTvpe 1, pero en consecuencia
aumentamos la probabilidad de un error Tipo 2 (y 'su t›? rsn).
Es una parte clave de la evaluación observar con cuidado los
costos relativos de los errores de Tipo 1 y Tipo 2. (En la
evaluación, por supuesto, la conclusión es un mérito absoluto
en lugar de una verdad). por su fracaso o éxito en tomar en
cuenta
•' -›
@jg 8?
'

m
i
E@C
estos en realidad no lo es. no; por otro lado, considerarlo como
en las insatisfactorio cuando es realmente satisfactorio no puede
fases de costarle mucho al fabricante. r thai 'iump1e le cuesta al
análisis fabricante rpan tc› hacer Por lo tanto, ii es
, ‹ bx en interés del público y del fabricante lJis'cn la
elabora posibilidad de juicios por dañ os) para establecer .un
ción de sistema que minimice la posibilidad de tales aceptaciones,
tesis y ex'cn a expensas de un rutner I.alto nivel de tales rechazos
registro Debido a las características no mnemotécnicas totales de
. Por los términos ”Tx pe 1” y ” type 2,” es .alvv.ays A•tte: usar
ejemplo términos como aceptació n incorrecta" ad ”inc‹ rrel t
, en los rechazo›n” y convertir el refvrant en ‹r nliininl, yo a ella que
procedi el iiiiff /ii/Jx›iJi‹›i>, th‹• 1ntt'i conce it A•inp like1}' to pre›:
mientos e iinenlighteninb tt› mc›st audiencias
de ILLUhilN.CTIVO EVALUACIÓN (Pdrlett y Hamilton) W
control type c›i pute pr‹›cess c•x alu‹ation, men,' heavy' on multi-
de perspective descriphon and interycrsc›nal relat›ns, verve liy•ht t›n
calidad ju stifled t›ugh staaJards, muy fácil sobre valor- phobes .ind x
en la cm' w cll d‹•fended in Más allá de el Nuitihr•s Quimr
fabricac (41acS1ill9n 1977) Congenial tc› r•.sponsive evalua- tion así
ión de que ppc›rters, no iinlik‹• evaluació n de perspectiva excepto
drogas tTitirt' f£'l‹2ti¥ lnhti
(un tipo
de IMPACTO E¥'ALUACIÓN .An cx.aluatic›n lata enfocada
evoluci
ón),
puede I MPAC y ED POBLACIÓNla [›‹›prtl,atic›n th.zt es
ser fatal ‹ nici.zl in r't .flu.I ti‹›n, h\' ‹*‹›n I› •ht ›x itfi thL• I.ai obtener y› ›gt‹l• ti‹›M
para un .in‹lc\'t*n el verdadero consumidor. ñer' efectos de retroceso.
consum
idor INIPLEMENTACIÓ N E¥'ALUATION R 'cent reactli›n , '‹›
tht' p• 'ner.ally' unex citando rvsuits ot irrtpact cv.a 1 uatluns on
potenci
st›‹ ial ,actl‹›n prtipr.anus hash' incluido .a shift ti› .:o:e mc›ni-
al
t'›ring• ‹›f Sri›pra m c5c'lis'er\' ie implcmrntatH ›n exm lu.a titan .
identifi
\ t ›H ‹'.in t'a sl es diablillo emen t, es más difícil impriix e
car una
droga IM PPE SI ENTATIt)N M i n e r a l VALOR NS Yo
tan h‹• tr •-
satisfac
toria
cuando
tienda y lo má s deseable es que se implementen;
(b) Algunas evaluaciones no provocan, y no deben hacer, de
manera inmediata.
día recomendaciones evaluaciones de rendició n de
cuentas);
ei sin embargo tienen un potente efecto preventivo y algú n
efecto acumulativo a largo plazo, pero ninguno es
fá cilmente medible; (c) Muchas evaluaciones se encargan
de tal manera que, aun cuando se realicen de la mejor
manera posible, no será n de utilidad porque se
establecieron para ser irrelevantes para los problemas
reales que afectan al tomador de decisiones, o tienen tan
poco financiamiento que no se puede obtener una
respuesta só lida; de nuevo, es mejor que no se
implementen; (d) Algunas evaluaciones excelentes se
ignoran porque a quien toma las decisiones no le gustan
los resultados (por ejemplo, se siente amenazado por
ellos) o no asume los riesgos o problemas de la
implementació n. El concepto de “falta de
implementació n” tiene, por lo tanto, pequeñ as o grandes
implicaciones para la I...J de la evaluació n, dependiendo
enteramente de la distribució n de las causas entre estas
cuatro categorías. Difícilmente es algo por lo que
preocuparse indebidamente desde el punto de vista
profesional, ya que la evaluació n todavía tiene un largo
camino por recorrer para hacer bien su propio trabajo;
los médicos no deben preocuparse de que sus pacientes
ignoren sus consejos si un mayor celo es malo. Pero
como ao/izi'›f uno difícilmente puede evitar preocuparse
por el desperdicio colosal resultante del cuarto tipo de
situació n; He aquí una cita bastante típica de los
informes de la GAO del 1 de agosto de 1980 sobre sus
evaluaciones (normalmente muy buenas): "El Congreso
tiene una excelente oportunidad para ganar miles de
millones de dó lares al limitar el nú mero de aviones que
no son de combate a aquellos que pueden ser
adecuadamente justificado... Las justificaciones del
Departamento de Defensa [estaban] basadas en datos
poco realistas y sin la consideració n adecuada de má s
alternativas econó micas". GAO ha estado emitiendo
informes sobre este tema desde 197f› sin ningú n efecto,
por lo que los médicos no deben preocuparse de que sus
pacientes ignoren sus consejos si un mayor celo es malo.
Pero como ao/izi'›f uno difícilmente puede evitar
preocuparse por el desperdicio colosal resultante del
cuarto tipo de situació n; He aquí una cita bastante típica
de los informes de la GAO del 1 de agosto de 1980 sobre
sus evaluaciones (normalmente muy buenas): "El
Congreso tiene una excelente oportunidad para ganar
miles de millones de dó lares al limitar el nú mero de
aviones que no son de combate a aquellos que pueden
ser adecuadamente justificado... Las justificaciones del
Departamento de Defensa [estaban] basadas en datos
poco realistas y sin la consideració n adecuada de má s
alternativas econó micas". GAO ha estado emitiendo
informes sobre este tema desde 197f› sin ningú n efecto,
por lo que los médicos no deben preocuparse de que sus
pacientes ignoren sus consejos si un mayor celo es malo.
Pero como ao/izi'›f uno difícilmente puede evitar
preocuparse por el desperdicio colosal resultante del
cuarto tipo de situació n; He aquí una cita bastante típica
de los informes de la GAO del 1 de agosto de 1980 sobre
sus evaluaciones (normalmente muy buenas): "El
Congreso tiene una excelente oportunidad para ganar
miles de millones de dó lares al limitar el nú mero de
aviones que no son de combate a aquellos que pueden
ser adecuadamente justificado... Las justificaciones del
Departamento de Defensa [estaban] basadas en datos
poco realistas y sin la consideració n adecuada de má s
alternativas econó micas". GAO ha estado emitiendo
informes sobre este tema desde 197f› sin ningú n efecto,
por lo que ›f uno apenas puede evitar preocuparse por el
colosal desperdicio resultante del cuarto tipo de
situació n; He aquí una cita bastante típica de los
informes de la GAO del 1 de agosto de 1980 sobre sus
evaluaciones (normalmente muy buenas): "El Congreso
tiene una excelente oportunidad para ganar miles de
millones de dó lares al limitar el nú mero de aviones que
no son de combate a aquellos que pueden ser
adecuadamente justificado... Las justificaciones del
Departamento de Defensa [estaban] basadas en datos
poco realistas y sin la consideració n adecuada de má s
alternativas econó micas". GAO ha estado emitiendo
informes sobre este tema desde 197f› sin ningú n efecto,
por lo que ›f uno apenas puede evitar preocuparse por el
colosal desperdicio resultante del cuarto tipo de
situació n; He aquí una cita bastante típica de los
informes de la GAO del 1 de agosto de 1980 sobre sus
evaluaciones (normalmente muy buenas): "El Congreso
tiene una excelente oportunidad para ganar miles de
millones de dó lares al limitar el nú mero de aviones que
no son de combate a aquellos que pueden ser
adecuadamente justificado... Las justificaciones del
Departamento de Defensa [estaban] basadas en datos
poco realistas y sin la consideració n adecuada de má s
alternativas econó micas". GAO ha estado emitiendo
informes sobre este tema desde 197f› sin ningú n efecto,
por lo que El Congreso tiene una excelente oportunidad
para igualar miles de millones de dó lares al limitar el
nú mero de aviones que no sean de combate a aquellos
que puedan justificarse adecuadamente. . Las
justificaciones del Departamento de Defensa [eran]
basadas en datos poco realistas y sin la consideració n
adecuada de otras alternativas econó micas". La GAO ha
estado emitiendo informes sobre este tema desde 197f
sin ningú n efecto. El Congreso tiene una excelente
oportunidad para igualar miles de millones de dó lares al
limitar el nú mero de aviones que no sean de combate a
aquellos que puedan justificarse adecuadamente. . Las
justificaciones del Departamento de Defensa [eran]
basadas en datos poco realistas y sin la consideració n
adecuada de otras alternativas econó micas". La GAO ha
estado emitiendo informes sobre este tema desde 197f
sin ningú n efecto.
I.ar Ver Evaluació n de Riesgos.
IMPLEMENTACIÓ N DEL TRATAMIENTO El grado
t‹› cuyo .1 tratamiento ha sido ejemplificado en una situació n
particular, típicamente en \el ensayo de campo del tratamiento
o un experimento ment.al investig‹iti‹›n de ellaLa noció n
de un ”índice de implementació n” c‹›resib-I.ng cf un
conjunto c escalas que describen el kev Ie.zture• uf el
tre‹tLment, .y otorgá ndose ‹›ne a mí .arure la extensió n
t‹› 'que i' m‹1nifested en c.Fch dimensió n, es ú til para
‹heckinb en la implementació n, ¡absolutamente
tundamcnto! comprobar si vamos a averiguar si el
tratamiento
uno y, por lo tanto, depende de este ú ltimo para esta o
futuras tarifas, una fuente no despreciable de sesgo. Las
conexiones sociales más sutiles entre miembros de la
misma profesió n, por ejemplo, evaluadores, son una base
amplia para la sospecha sobrela verdadera independencia
de la segunda o metn-evaluatofs opinió n. El mejor
enfoque suele ser utilizar má s de una
segundo- D °r '° norte“ unD lo má s amplio posible
seleccionando estos otros evaluadores esperando de una
inspección de sus informes (escritos independientemente)
para obtener una idea de la variació n dentro del campo, a
partir de la cual se puede extrapolar tarde a una estimació n
de errores probables.
TINDEPENDIENTE VARIABLE Ver Variable Deyendeat.
tNDF1 enO Un factor, variable u observación que está
empíricamente conectada con el criterio; un correlato Por
ejemplo, el juicio de los estudiantes de que un curso ha sido
valioso ta ellos para la formación preprofesional es un
indicador (débil) de eso valor. Czitezta, por conbasto,nre, o son
iii/ioiio//y conectado con, la variable “criterio” (pago real).
Indicadores por lo tanto, incluyen pero no se limitan a los
criterios. Cuiiistriicte‹t Los indicadores (o “índices”) son
variables /fai,y/ic'/f que reflejan, por ejemplo, la salud
de la economía (un indicador social) o la efectividad de
un programa Ellos, como las calificaciones de los
cursos, son ejemplos de la necesidad frecuente para
evaluaciones concisas incluso a costa de cierta
precisión y confiabilidad. Indicadores. a diferencia de
los criterios. tienen una validez muy ágil y pueden
manipularse fácilmente.
\ESTADÍSTICAS NFERENCIALES Esa parte relacionada
con hacer inferencias de las características de
las muestras a las características de la
población de la que proviene la muestra, lo que
por supuesto solo se puede hacer con un cierto
grado de probabilidad (ct. Estadística
descriptiva). ¿Las pruebas de significación y los
intervalos de confianza son dispositivos para
indicar el grado? del riesgo involucrado en la
inferencia (o "estimación"), pero solo cubren
algunas dimensiones del riesgo. Por ejemplo, no
pueden medir el riesgo debido a la presencia de
inusuales
y posiblemente circunstancias relex'ant tales como clima
extrañ o. una incipiente escasez de gas, ESP, etc. El juicio
entra así en la determinació n final de la probabilidad de
la condició n inferida. Véase Validez externa para la
‹distinció n entre la inferencia en inferentia‹ estadística y
en generalizació n, ‹sr otra inferencia plausible
SESGO DE INICIACIÓN-JUSTIFICACIÓN (o “Boot Camp
es
Hermosa") La tendencia a argumentar que las experiencias
desagradables por las que uno pasó son buenas para los
demá s (y para uno mismo). Una fuente clave de sesgo en el
uso de entrevistas a ex alumnos para la evaluació n de
programas. Ver Consonance/Disonance.
LÓGICA INFORI}4AL Los teó ricos de la evaluació n
sexual consideran que la evaluació n es, en algunos aspectos
o formas, una especie de persuasió n o argumentació n (en
particular, Ernest House, en Eovaluando con Validilnj, Sabio,
1980). Lutérminos de esta visió n, Es relevante que haya
nuevos movimientos en la ló gica, el derecho y la ciencia que
dan más juego a lo que ha sido previamente. descartados
como factores "meramente psicoló gicos", por ejemplo,
sentimientos,
comprensión, plausibilidad, dificultad. La “lógica informal
movimiento “es paralelo al de la Nueva Retórica y natural-
metodologia isÙ c en las ciencias sociales Reff - ml Ló gica ed.
Johnson y Blair, Edgepress, 1980.
TNFORh*EO CONSENTIMIENTO El estado que se
intenta lograr en adultos conscientes y racionales como una
buena mirada haciacumplir con las obligaciones éticas de
on•• hacia los sujetos humanos. Los casos difíciles
involucran adultos semi-racionales semi-conscientes y
semi-comprensivos.
APORTE EVALUACIÓ N/EN Dualmente se refiere tt flue
unde.'sir-
Prá ctica factible de usar dualidad de ingredientes como un
índice de calidad o producció n (o uf el evaluando), por
ejemplo, proporció n deDoctorado en <a Universidad
taculto)' como ‹un índice de mérito. Eso posee a Uso
ofertado y legítimo en el modelo CIPP.
TNSTITUTONAL EVALUACIÓN Una evaluación de
cumplex
tiLlzi, lv picslls' i ri 'ul S izig the' evaluati‹›zi ‹›fa set Uf progrdiTi*
pr‹ \'tded b\' •1n institutmn más una evaluación del ovcrall
m•1n‹1gPment, public.‹\', personal policier ‹Ind ‹›f the
instituHr›n Th‹ acreditation Cf schools and û‹›ll 'ges is •s-
sc'ntial\' in titutic nal rx'‹1luatt‹›n, tht›ugh a \'ery gr ex- emple
nf t L'ne ‹›f the ke;' pr‹›blems \con inshtuH‹›nal t\'aluütlnn
Js h,ûther t‹› ct aluatt in terme r›f tht missx›n ul
*he inüHtutinn er un sc›mc ‹›laúd base. Parece ob 'ic›uslv unf‹h
a c'\ ‹1lt‹.1te an In stltu tt‹›c contra gn•1ls thJt no es tratando de
‹1 hiex'e, ‹›n el° otro fr.and, el estado mis,i‹+rt,
‹arte inusual\* m‹›stl\' rhc'tun .1n,1 x›rtuall\' unus‹1nle para
gtntr-
‹lttng cr\trria ‹›f mc'rit, ‹Ind the› ‹tre al menos potentlallv sub-
jpg tt‹› cntJcism ‹' y hec‹i use c›f ma pprn{›n.atenc'•et‹*
necesita ‹›f
clientela, inconsistencias internas, impracticabilidad con re-
respecto a los recursos disponibles, impropiedad ética, etc. Entonces ^
uno debe de hecho evaluar los guales y el desempeño
relativo a estos objetivos o hacer Evaluación sin objetivos.
La evaluación institucional siempre involucra más
que la suma de las evaluaciones de los
componentes; por ejemplo, un defecto mayor en las
universidades modernas es el financiamiento
departamental, y los costos concomitantes en la
rigidez de las trayectorias profesionales, eliminando
virtualmente el rol. modelo del generalista,
bloqueando nuevas disciplinas o
programas —y preservar los obsoletos— ya que en el
estado estable los nuevos tienen que salir del
presupuesto de los antiguos departamentos, etc. La
mayoría de las evaluaciones de schmls y universidades
no tienen en cuenta estas características del sistema. que
puede ser IOF€ que cualquier componente.
No cubre só lo calibre, etc., pero
también pruebas de papel y lápiz (especialmente
estandarizadas), y una persona utilizada para estimar, por
ejemplo, la calidad de la escritura. Ver Cali-bración,
Medida.
INTERACTIVO {evaluación) Aquella en la que los
evaluados tienen la oportunidad reaccionar al
contenido de un primer borrador de una evaluación reporte,
que se reelabora a la luz de cualquier crítica o adición válida.
Un enfoque deseable siempre que factible, siempre y cuando
el evaluador tiene el coraje de hacer las críticas apropiadas y
mantenerlas a pesar de las respuestas hostiles y defensivas, a
menos que sean refutadas. Muy pocos hdve, uno puede ver
mirando el sitio.
informes de visitas o personales que no son confidenciales,
por comparació n con los que lo son, por ejemplo,
suplementos verbales del visitantes del sitio. Ver
Equilibrio de Pñ wer.
INTERACCIÓ N Dos factores o variables interactú an, el
efecto de uno, en el fenó meno que se estudia, depende
de la magnitud del otro. Por ejemplo, la educació n
matemá tica interactú a con la edad, produce má s o
menos efecto en los niñ os dependiendo de su edad; e
interactú a con matt achiex'ement. Hay muchas
interacciones entre las variables que gobiernan; Los
sentimientos, el pensamiento y el comportamiento
humanos son extremadamente difíciles de precisar con
precisió n. El ejemplo clá sico es la bú squeda de
interacciones aptitud-tratamiento o rasgo-tratamiento
en educació n: cada uno sabe por su propia experiencia
que aprende má s de ciertos estilos de enseñ anza que de
otros, y que otros amplia d‹›

•› '8
no responde fax'orublv En los mismos sh'les Por lo tanto,
hay un interacció n entre n, el estilo de enseñ anza
(tratamiento) y el aprendizaje .shale (aftude) con respecto
al aprendizaje. Pero, de- A pesar de todo nuestro arsenal
técnico de pruebas e instrumentos de medició n, no tenemos
virtualmente resultados só lidos en cuanto al tamañ o o
incluso las NrCUiTiStances bajo las cuales estos ATI'S
ocurrir. (Ref: The Aptitude-Achievement Distinctiâ n, ed.
DR Green, Me-Graw Hill, 1974.)
IhiTERNA£ Los examinadores (o evaluaciones)
internos son (hechos por) proteger al personal, incluso si
es personal de evaluació n especial, es decir, excepto si
son externos a la producció n/escritura/
enseñ anza/servicio parte de la proyecto. Por lo general, la
evaluació n interna es parte del esfuerzo de evaluació n
formativa, pero a largo plazo los proyectos a menudo han
tenido evaluadores sumativos especiales en su personal,
a pesar de la gran credibilidad (y probablemente baja)
validitv) que resulta. Interno/externo es realmente una
diferencia de Jegrec má s que de tipo; ver Independencia.
VALIDEZ INTERNA El tipo de validez de una evaluació n o
diseñ o experimental que responde a la pregunta: ¿El diseñ o
demuestra lo que se supone que debe probar acerca de el
tratamiento oH t)it' siibJt'tfs Jftitaffq stiid«•d?» (ct.
ExternoValidez). En particular, ¿demuestra que el
tratamiento produjo el efecto en los sujetos
experimentales? Se relaciona con EOFF.CTS chc'ckp‹›int en
la lista de verificació n de evaluació n clave.Com.- on *hre.a 1s
t‹› x'alidez interna incluyen instrumentos deficientes,
maduració n de los participantes, cambio espontáneo o sesgo de
asignació n. (Ref. Experimental and Quasi-Erperi- mental
Designs {or Jtesearcit, D T. Campbell and JC Stan-
lci , R 3nd McNall›' & Co , Chicago, 1972. ) «
DIFERENCIAS INTEROCULARES A Fred Nosteller, el
gran científico prá ctico, le gusta decir que él no es
ÎfltC£C$t8‹J 1 fl SfcJ f!8ticalv significante diferencias, pero ‹só lo en
interiKular une —-así que golpeó vuu t›ctiveen los ojos.
(Oeso es »'h. t pe‹›ple ar‹' tiind uf s.wing él encuentra c›f saring.
)
tMTERFOLÄ TE lnfr*rt‹› cc›nclu icns .zb‹›ut s'aliie ‹›yo el
variables dentro del rango implcd. Cf. Extrapolable.
SERIE DE TIEMPO INTERRUPTEO Una tv pe de cuasi-
experimental desi;tn en is'hich el tratamiento se aplica 1 an J
tht•n ›s thhcld en a ‹ cierto temporal pattvm, a estañ o monja'
siiJ›¿‹'t I The' st irriinx'h.it âmbib'uo término “sc'lf-cunt rt›llec4”
solía ser utilizado para tales casés. ya que el grupo de control
es el mismo que el grupo experimental. La versió n más simple
es, por supuesto, el diseñ o de "aspirina para el dolor de
cabeza"; si el dolor de cabeza desaparece, acreditamos la
aspirina. Por otro lado, “psi-psicoterapia para una neurosis”
proporciona una inferencia débil porque la duració n del
tratamiento es tan grande y las tasas de recuperació n
espontá nea son tan altas que la posibilidad de que la
neurosis termine durante ese intervalo por otras razones
que no sean la psicoterapia es muy significativa. (Por lo
tanto, la psicoterapia a corto plazo es una mejor apuesta,
ceieris f›arihns). El siguiente diseñ o autocontrolado má s
elegante es el llamado diseñ o “ABBA”, donde A es el
tratamiento, B la ausencia de él u otro tratante. :t. Las
mediciones se realizan al principio de cada período
etiquetado y al final. aquí podemos ser capaces de
controlar la posibilidad de remisió n espontá nea y
diversos efectos de interacció n. Este es un diseñ o
bastante bueno para experimentos sobre tratamientos
de apoyo o incrementales,
por ejemplo, enseñ amos 50 palabras de vocabulario con el
método A, luego 50 má s con el método B, y para eliminar la
posibilidad de que B solo funciona cuando sigue A, ahora
invertimos el orden,
‹ y aplicarlo primero, y luego A. Obviamente, son posibles
enfoques más sofisticados utilizando el ajuste de curvas para
extrapolar (o interpolar) a un nivel futuro (o pasado) esperado
.y compárelo con el nivel real. La falacia clásica enesta zona es
probablementela del Gobernador de Conner•icut, quien
introdujo la suspensió n automá tica de la licencia para la
primera infracció n por exceso de velocidad y obtuvo una
reducció n muy grande en la tasa de muertes en las
carreteras de inmediato, de lo que alardeó un buen trato.
Pero un cambio en la x ybilidad de la tasa de mortalidad
en añ os anteriores podría haber puesto nervioso a un
estadístico y, por supuesto, la suma volvió a subir de
forma bastante aleatoria. (Ref Interrupted Time Series
Designs, Glass, rf nl Universitv uf Color.ado )
TRABAJO ANÁ LISIS :'\ brc.akdo›s'n ‹›fa jt›h int‹›
funcional
›mp‹anents, r›ften n ce»s.try con el fin de proporcionar
recomendaciones correctivas y .z marco para la
microevaluació n nr noel» ,1»sL*ssmcnt l‹›h ‹lnalvsi i» una
tarea altamente calificada,
\ 'hich, like cr›mputer yr‹›yrgmminfi„ i» usuallv' d‹›ne badly h}'
así se hned tn dt› t bye.aus<• r›f the f‹1llur‹* ut tht p.av scale t‹›
refltct tht p‹1}'-‹›(( frum dning* it well
JOHN EFECTO HENRY (término de IGary Saretskv) el
efecto correlativo a, o en un sentido extendido a 5[MCial
Cd5E de, el efecto Hawthorne, es decir, la tendencia del
grupo cuttro/ a comportarse de manera diferente solo por
darse cuenta de que ellos son el grupo de control. Por
ejemplo, un grupo de control de profesores que utiliza el
programa de matemá ticas tradicional que se está
ejecutando en comparació n con un programa experimental
puede, al darse cuenta de que el honor de defender la
radiació n recae en ///‹w/, qerlocm mucho mejor durante el
período de investigació n.
de lo que hubiera sido de otro modo, produciendo así un
artiftClal
resultado. Por supuesto, uno no puede asumir ‹que el
Hawthorneetlect (en el grupo experimental) cancela el
efecto John HenrV.
JUICIO No es accidental que el té rmino "x'valor Juicio"
vino erró neamente a pensarse de nosotros el para-
Dignidad de e reclamaciones valorativas; El juicio es una
parte muy comú n de la evaluació n, comoEs de toda
inferencia científica serious. (El ahsurdit\' ‹3f suponer que los
"juicios de valor" no pudieran tener validez, a diferencia de
todos los demá s juicios, era una y error gratuito.) La funció n de
la disciplina de evdl- uatiun puede ser seL'n •is la rgel› a
importar de reduciendo el ele- ment de juicio en c\'aluation, r›r
reduciendo el elemento de arhitranness en ‹he. necessam'
jud¿nf?'nts por ejemplo, reduciendothr source UI blas in the
|udges bv usando doble ciego diseñ os, equipos, equipos
paralelos, sesiones de convergencia, cali- bration
entrenamiento c'tc. El hecho má s importante sobre |udg-
¡hombres! es nulo que no es ?.s eb¡t' ti\'e como medida
(verdadero)hu t thut ‹›ne puede distinguir y'›‹›d |udhmont
frum bAd Judge- ment (‹ind trmn y‹x›d |udge .)
!VfODEL JUDICIAL O JURISPRUDENCIAL (de c•valu-
ati‹›n) \\'‹Término preferido de Citi y término A que se usa
a veces ic›r hls versió n ‹›r, rath*r, exten's ‹›n ‹›f ad•zocate-
adversary o\'n1uatiun IJ‹' vmph•1•i cs que la ley como z
mvtaph‹›r para c\”alu.1ti‹›n In\'t›lx'e mucho m‹›re
que ,en ..d\'ers.trial Je-
H. te — it .• I'‹› in‹ lud‹'s the' inct - ñ nding› phn e, cross -
c'x•iminatmn, t't'identmr\' And grt›ctrural rules, etc.
\'‹›l\'es un tipo ‹›i in‹iuim' gr‹x ess th•1t es markr'dl\' diferente
de la' •›c›ci. I >clentiii‹ ‹›ne, nne that in se\'eral way is t‹»lcrr'd
(‹› ncuds mt›re like th‹› u ‹›f ev‹1lu.ation (the action- rc'l ‹it‹d
dccjsit›n, the nhlig•it‹›a ' »imglifications bc'cause of time, hudy
'I .1‹1d uucJicncc limit.
|p‹1rtlc ul.t F |Udhc' nn‹J |ur}', los individuos de la iatc' ‹›i •lo que
está en juego,
etc). Wolff ve elpapel educativo del proceso judicial (enseñar
al jurado las reglas de la investigación justa) como una
característica clave de el modelo judicial y sin duda es un
fuerte analogía con evaluación.
JUICIO POR JURADO Usado en TA y evaluación. Véase
la entrada anterior.
LISTA DE VERIFICACIÓN DE LA EVALUACIÓN XEY (KEC)
¿Qué sigue?
lows no pretende ser un completo explicacion de la
llave lista de verificación de evaluación y su aplicación, algo
que sería más apropiado para un texto sobre evaluación.
Es sim- capa sirve a identificar el muchas dimensiones ese
debe ser explorado antes de la síntesis final en una
evaluación. Alt sonsuele ser muy importante.Apocas
palabras son dado para indicar el sentido en el que
se pretende cada uno de los encabezados, los
encabezados en sí se mantienen muy cortos para
que sean utilizables como mnemotécnicos; algunos se
expanden en otra parte en I I \ g T e s a u r o . Muchas
iteraciones del KEC están involucradas en un típico
evaluación, que es un proceso de aproximación sucesiva.
(Si la evaluación es estar libre de goles, al menos el
personal de campo no seguirá la secuencia dada).
El propósito de exhibir el KEC aquí es en parte td, dejar en
claro que la evaluación es una disciplina extremadamente
complicada, que uno podría llamar una multidisciplina. ¡I! No
puede ser visto como un aplicación sfraightfopvard de
estándar métodos en el tradicional ciencias sociales
repertorio. En hecho solamente siete de los quince puntos de
control se abordan seriamente en ese repertorio tradicional y, en
la mayoría de los casos, no se abordan muy bien en lo que
respecta a las necesidades de evaluación.
1. DESCRIPCION . Qué es ¿ser evaluado? El rt'n/u- m
hasta, descrito «tan neutrallv como pusible. ¿Tiene
componentes? ¿Cuáles son sus relaciones? Es útil di- vidu
descripción en cuatro p‹a rts: 11 1) el naturaleza y op-
er.1tinn, (l 2) el (uncti‹›n, (1.3) el sistema de entrega y
(l 4) el sistema de apoyo. Estos no son .nítidamente
distintos, ni ‹frs .In}' nf ellos nítidamente distintos de los
efectos y el proceso. ¿Qué d‹x•s hace? ¿Có mo lo hace J‹› p.
ej. ›vh. I es el ‹1‹'lir‹'n ›yxf‹*›/i que lo conecta con
onsumcr•? Hr›w dc›es it continue tc› do it—cuá l es el
•tij›{x›rf sl, f‹'iii. esto incluye el .mantenimiento/ servicio/
upu•atc• sv •tem. 'he° en tructinn* sistema de entrenamiento
para usuarios, el mnnit‹›nny s\ stem (si .anv) f‹›r
comprobando puede prnper

9?
uso/mantenimiento, etc. (El monitoreo, como el
mantenimiento, etc. puede ser realizado por alguien que
no sea el fabricante del proveedor/proveedor de
servicios). Cuando comienza el proceso de evaluación, el
evaluador generalmente solo tiene las descripciones del
cliente del evaluando y sus funciones, etc. A medida que
avanza la evaluación, se recopilarán las descripciones del
personal, los usuarios, los monitores, etc., y se realizarán
observaciones/pruebas/mediciones directas.
Eventualmente, solo la descripción más precisa
sobrevivirá bajo este punto de control, pero las otras son
más importantes y se mantendrán, bajo el punto de
control 3 (Antecedentes y contexto), y porque brindan
pistas importantes sobre qué problemas (por ejemplo,
malinterpretador). s, percepciones inconsistentes) deben
abordarse en la evaluación y en el informe final.
2. CLIENTE. Quien yo'. encargar la evaluación?
Elclítoris para la evaluación, quién puede o no puede h+'
el iiiitiatur ol la solicitud de evaluación; y puede o
pueden‹at ser el /H //,yn/c›r del evaluando, por ejemplo, su
fabricante o agencia de financiación o padrino leqjsl‹1; y
puede urmlv tuerca sea su ion ‹›if‹›r cg desi er de a
producto o programa Los deseos del cliente son cruciales
pero no completamente primordiales para determinar el
objetivo de la evaluación. Como una ‹1cti\'itv prfessionAl
ith .anv, las obligaciones de ética profesional ‹wcasiunallv
superven por ejemplo, uno siempre debe comprobar (al
menos bneflx') los efectos secundarios negativos en pro-
evaluación del programa e 'rn si el cliente piensa que un
informe sobre El logro de objetivos es todo lo que requiere
la evaluación.
3. ANTECEDENTES A CONTEXTO de (a) el
evaluando
y (h) el cx'aluatiun. Incluir» identificación de esperac.
(como los n‹›n-clients li»ted en 2, elsupervisor,
informes comunitarios, etc.); función prevista y
»up}›la naturaleza uf la e\'.aluand, bvliex' d perfomiance;
expectati‹›ns fr‹›m la evaluación, desea t\'pc t›f evalua -
ti‹›n (fc›rm‹1ti\'t ve sumative \'s ritualistic, holístico xs
.zn.zlYhc. I), rcpc›arting* svstem, ‹›rg.aniZAtit›r gráficos, hi.5tt›ry
‹›f proyecto, prit›re\'aluati‹›n a'ffort'•, etc.
4. RESULTADOS ‹W‹›a veces llamados ”Fortalezas r'\
s- s‹ssment" bx' cuntrA»t \x con el nttd» ‹asssment uf punto
de control 6) (.a) disp.›hlc tt› nr f‹›r use ‹›f el evaluando;
(b) a‹'.›i‹able t‹› ‹›rf‹›ru»e ‹ñ el e:'alu.atom ”fhes+' ‹yo nc›t
»'h.at lb utilizado, en ey compr‹1se t›r m.aintenAnce, pero
qu. t ‹›i//JA* The}' incluclt' n1‹›ncv, ‹*xpt'rtise, part cx-
consideraciones de experiencia, tecnología y
flexibilidad. Estos definen el rango de factibilidad y
por lo tanto delimitan la investigació n y la crítica.
5. CONSUMIDOR. ¿Quién está usando o recibiendo los
efectos del evaluando? A menudo es ú til distinguir el
grupo que necesita el evaluando desde aquellos quién lo
recibe oa quién se le podría entregar (el mercado). Incluso
puede ser ú til distinguir las poblaciones de consumidores
afectadas (mazket modificado) de las poblaciones de
consumidores real y potencialmente impactadas (los
“verdaderos consumidores”, o clientes, o beneficiarios). o
clientes para el eve.luand (a menudo llamado la clientela j.
Estos deben distinguirse del totalpoblació n receptora
impactada directa o indirectamente que constituye los
“consumidores frios”. Tenga en cuenta que el
instigador y otros (véanse 2 y 3) también se ven
afectados, por ejemplo, por tener un trabajo, pero esto
no los convierte en consumidores, en el sentido
habitual. Sin embargo, debemos considerarlos cuando
observamos los efectos totales y podemos describirlos
como parte del grupo total afectado, infectado o
involucrado: la població n {›rot•ider. (Los
contribuyentes suelen ser parte de esta població n).
Receptores + proveedores = impactados.
6. VALORES. A veces se denomina “Evaluació n de
necesidades” de las poblaciones impactadas y
potencialmente impactadas. Pero debe mirar tanto los
deseos como las necesidades; y también valores como
jtid,grd o creídos está ndares de mérito e ideales; los
objetivos definidos del programa donde se lleva a cabo
una evaluació n basada en el trabajo; cualquier
estándar validado que se aplique al campo; y las
necesidades, etc. del instigador, monitor, inventor, etc.,
ya que se ven afectados indirectamente. La
importancia relativa de estas consideraciones a
menudo conflictivas no dependerá de consideraciones
éticas y funcionales. Es solo a partir de este punto de
control que se obtiene el componente 'valor en la
evaluació n; los valores pueden aplicarse tanto en el
proceso como en el resultado.
7. PROCESO. ¿Qué restricciones y atributos se
aplican a, y qué conclusiones se pueden sacar acerca
de la normal i›|›i'rntin›t ‹›del evaluando (en oposició n
a sus efectos o UUTCOk1ES (6))? En y.›rticuIar, legal /
ético-moral /
{x›litic.al / m.anageriaI / estética / hedó nica / limitaciones
científicas? Con esta verificació n{xiint, podemos sacar
conclusiones evaluativas. Las que están aquí son las
consecuencias más inmediatas ‹.I a11, porque inx'olve lo que
se sume-

91
veces llamados valores intrínsecos (verdad, belleza,
ética). Lo llamamos el punto de control del proceso en
parte por razones de continuidad con la tradició n,
porque en la evolució n del programa/servicio, es el
proceso que bloqueamos. en mucho evaluació n
intrínseca Pero en prc›cluct evaluació n en el mismo
punto de control
.aplica—por ejemplo, miraríamos la exactitud científica
de los contenidos de un libro de texto r este
encabezado. Dando una descripció n bá sica del proceso
desde el primer punto de control y los valores (para el
punto de control 6, a veces podemos sacar una
conclusió n evaluativa inmediata, por ejemplo, "x iolates
safet\' estándar X". Hay otras cuatro razones para
analizar el proceso: para ver si lo que está sucediendo es
lo que se supone que debe estar sucediendo (el problema
de la liberació n de la implementació n, para obtener
pistas). af›cut ca“usa- h‹›n que no parecerá frorît'a black
box approach (pero que puede ser necesario para
determinar los resultados a largo plazo), para detectar
resultados inmediatos o muy rá pidos, y para buscar
indicadores que se sabe que está n relacionados con
ciertos resultados a largo plazo (cuyo surgimiento
podemos no tengo tiempo para esperar). El primero de
estos incluso tuallv da como resultado correcciones a la
DESCRIPCIÓ N; los otros alimentan intu OUTCO!VIES. Así,
algunos "fenó menos de proceso" son
‹'f/ü û /s del proyram, por ejemplo, enJovment (ins‹ant
outct›mes),
'«›me .z re /›urt of it, .y »ome son parte c•f the run/‹'. yo /
enx'ir‹›nment bvstem que lo contiene. Una iiiaiia,¿‹'ri«l prcx -
e:sx c‹›n'straint de preocupació n de significado especial el
grado nf implemen tatic›n", ic , la medida en que el real
arriba ti‹›n coincide con las estipulaciones del programa
o las creencias del patrocinador •Jhcut ité operació n Uno
›‹-/‹'///mm prcxess ct›nsid -er‹1Ù ‹›n w'c›uld bc* the use nf
cientificallv 'alidJted pro- cess iridlc‹zt‹›rs de i›'cntuJl
resultados; .otro sería el ris‹ t›f cic'ntiiic. liv (hist‹›ricallv
etc ) s‹›und material en
•1 texthtx›k. canalla mi Una ‹'tliicnl asunto haría inv‹›l\'e eso'
rel.\ti\'e ochenta ‹›f la importació n.una vez nf mechny las
necesidades
<>I need\' target p‹ |pul‹1ti‹›n peu ple .and tht' c‹1reer ‹fr estatua
nercJs ‹›ft›thcr emp.zcted-}:›t›pulati‹›n penple e y. el pn-yram
y ff
H t0LiTCO41ù ñ \\'hJt r°ffccts !lc›ny-tc'n ‹›utc‹›mes
‹›rc‹›ncurrent 'ffects) ‹1rt' pr‹›dured by the ev‹JluJnd* (lil-
tend d ‹›r unintc'nd‹'d) A m.ztrix ‹›f afecta es uscfrtl t‹› get
ose comenzó la bú squeda; població n afectada < tipo de
efecto (cognitivo/ .afectivo/ psicomotor/ sanitario/
social/ ambiental) x tamañ o de cada uno. x tiempo de
inicio (inmedia- to•, 'finalizació n del “tratamiento”
'posterior) x duració n .x e.Cada componente o dimensió n
(si se requiere evaluació n analvnica). Para algunos fines,
los efectos previstos deben separarse de los efectos no
comprendidos, p. monitoreo de programas,
responsabilidad legal), para otros; el distintivo n no debe
hacerse (prometedor summatix'c orientado al
consumidor
{* alunfî‹.›ri).
9 GEK rItALIZABiLf Y (‹›r putenMaÏ ur \ersuhlih'J to otras
personas. lugares/ tiempos 'crsions. (Carne de “gente” s!•iff •es
is'el! ‹como destinatario:•, j Estos se pueden conectar 5 con
Deli''erabiiitv,' Saieability.' Ex J› •rta!›i1ity,'
Our.ability/Slodifidbilitv
10 COSTOS Dc›liar x Psi cholcaqyical contra Personal s's.
Tiirim Initial 's .Recurrent (incluyendo Preparatii›n -N4aln -
penitencia- Imprc›s'emrnt), Directo indirecto ve
Inmediato,'

Ü t3.¥fPA fiISOKS 'con opciones alternativas— inrluc4e


opt:cans recomendado oui4 tunreciignizado. esto ahora'
hacha mal-
.capaz .y los construibles Los ie‹idin;ii to..tem4ers en th i,
field‹j son los 'crit:cci curii t›rh tors” y se identifican

Los ''normalmente' incluyen thcise th.at produ" siniiiar o


bet-
ter ef*t ètè ft›r menos vos!, .ariel mejor e fects mucho manejable
mi
E@C “
\ 14. INFORME. vocabulariov, longitud, forma I,
medio,hora, lugar, año personal para la(s)
presentació n(es) necesaria(s) Cuidado scruń ny as dpes
protecció n/pnvacv/publicidad y
'- i°iO proyecció n o circulació n de informes finales y
preliminares
draHs. “ -<
15.METAEVALUACIÓ N. La evaluació n debe evaluarse,
preferiblemente antes de la difusió n final del informe y,
ciertamente, antes de la implementació n. La evaluació n
externa es deseable, pero primero el evaluador principal
debe aplicar la Lista de Verificació n de Evaluació n Kev a
la evaluació n misma. Resultados
de la metaevaluació n debe ser usado formativamente pero
, también puede ser incorporado en el informe o de otro
modo con- veved (»umm0łi\'elv) al cliente y otros
apropiados audiencias (“preferencias” emergen en el
punto de control 5, ya que son el “mercado y los
consumidores” del e\'aluación.) ,
MATA AL MENSAJERO (fenó meno) La tendencia a
castigar al portador de malas noticias. Un aspecto de la
fobia a los valores. Gran parte de los ataques actuales o:
pruebas, por ejemplo, pruebas de competencia mínima,
son puramente KTM, como muchos de los ataques
anteriores elaboradamente racionalizados en las
calificaciones del curso. La presencia de las
racionalizaciones las identifica como ejemplos de una
suh-especie; Matar al mensajero: después de una feria,
Tnal, por supuesto.
LAISSEZ-AIRE (evaluació n) “Que tń e fartsq hable por
. ellos mismos." ¿Pero lo hacen? ¿Qué es lo que dicen? Oo
tyeyguardar lo mismo a diferentes oyentes? De vez en
cuandoenfoque está justificado, pero por lo general es
simplemente una evasió n, una negativa a hacer la dura
tarea profesional de la síntesis y su
. yo ustificació n ElEl enfoque de ląissez-faire es atractivo para
'aluephobes—anct to anvone else when ,the zesults are va a br
contrsversial. El mayor riesgo en elEl enfoque naturalista/
receptivo/ iluminativo se desliza int‹› laissez- Nombre
evaluació n, iL — para decirlo s/ty/i//y tendenciosolv—n‹›
evaluació n en absoluto.
ARNER VERlFfCATION Una frase de Ken Komnski'S,
presidente de EPIE; se refiere al proceso de (a)
establecer-que los productos educativos realmente
funcionen con la audiencia prevista, y (b) mejorarlos
sistemá ticamente en
“ la luz qf los resultados de las pruebas de campo. Ahora requerido
por ley en
.°.g. Fl‹›rida y ser considerado para ese estatus en otros lugares.
La primera respuesta de los editores fue enviar cartas de
maestros que testificaran que los materiales funcionaban. Este
no es elProceso de I+D al que se refiere el término. Algunos
de los primeros textos programados fueron buenos
ejemplos de verificació n de aprendizaje. Por supuesto, es
costoso, pero también lo son las placas de cuatro colores y
el papel brillante. Simplemente representa la aplicació n a
los productos educativos de los procedimientos de control
de calidad ydesarrollo sin el cual otros bienes de consumo son
ilegales o disfuncionales o, subó ptimamente.
NIVEL DE ESFUERZO Nivel de esfuerzo normalmente se
especifica en términos de añ os de trabajo, pero en un
proyecto pequeñ o puede especificarse en términos de
personas-meses. Se refiere a la .cantidad de "aborto"
directo que *será necesario, y es
presume que IN.e trabajo wi!! ser del nivel profesional
adecuado; la ayuda subsidiaria, como la administrativa y la
limpieza, se presupuesta de forma independiente o se
considera parte del
costo de apoyo, que es, incluido en un profesional {›persona-
añ o de trabajo. Persona-vears (originalmente man-vears) es lo
normaltjnit para especificar el nivel I de esfuerzo. El ItFP a
menudo describirá el monto má ximo de dó lares que se
contempla para la propuesta, batrnm, en lugar de
especificarlo en añ os de Terñ TseT@ron . V‹arios»
trans)aciones de una unidad de tiempo-persona a dó lares
que se utilizan; esto dependerá de la agencia. el nivel de
profesionalismo requerido, 'ya sea que los gastos generales
y el apoyo de oficina se especifiquen por separado', etc. A
veces se utilizan cifras que oscilan entre S30.000 y má s de
$50.000 por persona-añ o.
LICENCIA (de evaluadores) Ver Registro de Evaluació n.
LA CRÍTICA LITERARIA La valoració n de las obras de
literatura
eraatuendo; en muchos sentidos, es un modelo
esclarecedor para la evaluació n, un buen correctivo para el
énfasis del modelo de las ciencias sociales. V.Trib us se han
hecho intentos de
- "reforzar" la crítica literaria, de la cual el elemento de la
Nueva Crítica es quizá s "el má s conocido", pero todos
implican preferencias bastante flagrantes y justificadas de sus
miembros (es decir, sesgos), exactamente )y n'hat.the;'
fueron a1lep•ed para evitar. El tiempo puede A • ú pr volver a
intentarlo, usando lo que nom 'sabemos sobre
I
evaluación sensorial, y tal vez receptivo y ilTumin -
nativo evaluació n—para recordarnos có mo ob|ectif',' el ob-
|rectificable' 'mientras se aclara lo esencialmente subjetivo.
C‹›n- 'c mismo, se puede aprender mucho de un estudio de los
esfuerzos -
de F R. Leavis (el decano de ihe New Critics) y TS Eliot en
Ensayos críticos para precisar y objetivar la crítica. Su
* vies' que ”comparació n y aná lisis comió mi
'crítica” (Eliol, 1932), y más aú n su
muy específico y cuidadoso mensajes escogidos para hacer
puntos ii'podría encontrar fdú or' con los resp{Klsive
svaluators (y otros) tocfav. Ezra Poufid y Leavis fueron aú n
má s lejos al exhibir la instancia concreta (má s bien que el
principio general) para hacer un punto. pero en la prá ctica
fracasó en evitar varios stvl‹i o sesgos de proceso, y'tco
bfteri (por ejemplo, con Empson) se volvió valioso a
expensas de la ló gica.Uno no puede olvidar má s la ló gica
de la trama o los límites de las posibilidades en Bretton
que la ló gica de la funció n y los límites de la capacidad de
recuperació n en la evaluació n del programa.
LOCAL EXPERTO A experto lccal (usado como
evaluador) es alguien del mismo campo que el programa o
la persona ser evaluado, por ejemplo, un "evaluador del
á rea de la salud" o, má s específicamente, un evaluador
del programa de enfermería, ur, aú n má s comú nmente,
"alguien má s de Texas en educació n de enfermería".
y ció n” (pero sin experiencia en evaluació n). Las ganancias
están en el conocimiento espémfico relevante; las pérdidas
son en sesgo shazedy (usualmente) falta de conocimiento
o experienciaCon los aspectos má s serios de, por
ejemplo, la evaluació n de programas como disciplina. Si
está buscando un evaluador amigo, use uno ló gico y tal
vez le devuelvan el favor un día también. Si quiere
objetividad/validez, no vaya a la mezcla, uno loral, uno
de propó sito general, y solicite informes separados. Si
nuestro presupuesto es demasiado pequeñ o para los
costos de viaje o las tarifas de u evaluador, simplemente
encuentre un ,yroçra/›/ii u/hi /‹›r«/ evaluador general-
puíJiose o ‹en el peor de los casos un evaluador
' de otro disciplina—aquí hay un montó n arc›und —to fc›rm c
te.un con tu.”local” favorito. ,
LL*CUS DE CONTRA' l'opular "afÏective" x'•anable,
refiriéndose aproximadamente a la lcic‹ation que
alguien siente que es apropiada para el poder de corte
central en el universo ‹en ‹una escala desde "dentro de
mí" hasta ”piel, lejos avxav ” ¡Un elemento h'pical podría
preguntar abcu! la medida en que tu sujeto dice que él
controla su propio destino. De hecho, esta es a menudo
una simple prueba de conocimiento de la realidad, y una
comprensió n má s efectiva en
.*
cuanto estrés se pone como parte del sentimiento del
elemento), y cuando es afectivo, el afecto puede juzgarse
como apropiado
, o inapropiado. 5o estosLos ítems suelen malinterpretarse:
por ejemplo, al tomar “cualquier movimiento hacia la
internalizació n del locus de control como una ganancia,
mientras que puede ser un signo de pérdida de contacto
con la realidad.
ESTUDIO LONGITUDINAL Una investigació n en la
que se sigue a un individuo particular o a un grupo de
individuos durante un período considerable de tiempo,
con el fin de descubrir cambios debidos a la influencia de
una evaluació n, o maduració n, o medio ambiente. El
contraste es witWa cmss-sectional
.estudio. Teó ricamente, un estudio longitudinal también
podría ser realizado por expertos, pero ninguno de los
realizados sobre el efecto del tabaquismo en el cáncer de
pulmó n es de este tipo, aunque los resultados son casi tan
só lidos. En el área de servicios humanos, es muyprobable
que los estudios longitudinales no sean controlados,
ciertamente no controlado experimentalmente.
NCTW[MEMTCT6 se,
'a examinar los efectos de la producto después
de un
extendido pisado por el tiempo; a menudo este es el
término »mn wnahwliile. Arreglos burocráticos tales
como la dificultad
de traspasar fondos de un añ o fiscal al siguiente a menudo
hacer una investigació n de .estos efectos virtualmente
imposible
Los “estudios longitudinales” en los que un grupo es
“seguido” durante .un largo período son má s
comú nmente reconocidos como procedimiento está ndar
en las á reas médica y de drogas; un ejemplo importante
en educació n es el estudio PROJECT TALENT, ahora en
su tercera década. Consulte Sobreaprendizaje.
MACRO-EVALUACIÓN. Ver Evaluació n Holística.
M.tNECESIDAD DE TENENCIA Un asentimiento
cumplido pero continuo AÑ OS-HOMBRE
(adecuadamente, añ os-persona) Ver Nivel ct
Esfuerzo._
MERCADO La consideración del mercado en la Lista de
verificación de evaluación clave se refiere a la capacidad de
difusión del producto o programa. Muchos productos
necesarios, especialmente los educativos, no se pueden
vender por los medios disponibles. {Solo es posible
argumentar a favor del desarrollo de tales productos, si
existe un plan especial, preferiblemente probado, para
usarlos. Sin sistema de entrega, sin mercado. Sin mafket, no
se satisfacen las necesidades. (No es asi

9i
100
• “'‹'”

se sigue que la existencia de un mercado implica necesidades


satisfechas o cualquier otra base para el valor.)
-, MASAJE (los datos) término lyeverent para 4mostly)
síntesis legítima de los resultados brutos.
' NIVEL DE MAESTRÍA El nivel de rendimiento
realmente necesario en un criterio. El entrenamiento de
nivel de enfoque o maestría no acepta nada menos, y no le
importa nada má s. De hecho, el “nivel de dominio” suele
ser arbitrario. Gosely ligado a los enfoques basados en
competencias. Representa una aplicació n de criterios
referidostee'ttng

PAREO Ver Copbol Czoup.
BTATERlALES (evaluació n) Ver evaluació n del producto.
MUESTREO MATRIZ Si desea evaluar un nuevo enfoque
para la atención médica preventiva (o la educación científica),
no tiene que dar un espectro completo de pruebas (quizás un
total de diez) a todos los supuestamente afectados, o incluso a
todos.
muestra de ellos; Udspoder Te lo daré una o dos pruebas
I
a cada uno (o cada uno en la muestra), teniendo cuidado de
que cada prueba cb ponte verde a un azar sub-muestra, y
preferiblemente que se asocia aleatoriamente con cada uno de
los otros, si son administrada por pares (para reducir
cualquier sesgo debido a interacciones entre pruebas).
Esto puede producir (a) mucho menos costo para usted
que la prueba completa de toda la muestra, (b) menos
shin en cada sujeto, (c) algú n contacto con cada sujeto, en
contraste con dar todas las pruebas a un grupo má s
pequeñ o, (d) asegurar
. ing tha{ al) de un conjunto má s grande de artículos se
utilizan en algunos estudiantes. Pero, el intercambio, yoti
no podrá decir mutYi sobre cada individuo. Usted só lo
está evaluando el valor total del tratamiento. Un buen
ejemplo de la importancia de dejar clara la pregunta de
evaluació n antes de hacer un diseñ o.
MBO Gestió n por Qbjectives, es decir, establece lo que
está s tratando de hacer en lenguaje que hará •. es posible'
saber si lo has conseguido. No está mal como "guía para la
plantació n" (aunque tiende a endurecer demasiado la
institució n), pero es desastroso como modelo de
evaluació n (aunque aceptable como modelo).
'una elemento en un diseño de evaluación.) Véase Basado en
objetivos
•t
”“ MEA24 ( t ) (Cf. Mediana, Medo) El significado
ScoNon una prueba es obtenido sumando todos los
puntajes y dividiendo• por el nú mero de personas que lo
toman; uno de los varios exactossentidos de "promedio".
ElSin embargo, la media está fuertemente
• afectado por las puntuaciones de los primeros y de los
pocos de la clase y, por lo tanto, puede no ser representativo
de la mayoría.
MIDA EM£NT Determinació n de la magnitud de un
'quanti , no necesariamente, aunque típicamente. sobrea
terio-
" prueba referenciada obsoleta, qg antena
uges, o‹ en un continuo ,
escala numérica. Hay varios tipos de medidas
escala, enviada libremente, que va desde ordinal
(graduació n o clasificació n) hasta cardinal (puntuació n
numérica). El uso científico está ndar se refiere
ú nicamente a este ú ltimo. Cualquiera que sea el usuario
para hacerla medida, parte —usualmente— del
experimentador, se llama instrizrrient. Puede ser un
cuestionario, una prueba, un ojo o un aparato. En
ciertos contextos;
- tratamos e l o b s e r v a d o r como t'. .jnstrumento necesita
calibració n • O validació n. La medició n es un componente
comú n y, a veces, importante de las evaluaciones está ndar,
pero una parte muy pequeñ a de su ló gica, es decir. de la
justificació n por la dvalua- conchisiones tivas.
M DIAN (Estadístico) (Cf. Media, Moda) El
rendimiento medio en una prueba es la puntuació n
que divide al grupo en dos, tanto como sea posible; el
rendimiento "medio". Eso
” proporciona un envío exacto para el término ambiguo
"promedio". El iridiano no se ve afectado en absoluto por
el desempeñ o de los pocos estudiantes en la parte
superior e inferior de una clase (cf. Meg). Por otro lado,
como con *he mean, puede darse el caso de quenadie
anota en o cerca de la mediana, para que no identifique
a un "individuo má s representativo" en la forma en
que
- el modo lo hace. La puntuació n en el percentil S0 es ( por
lo general) lo mismo que tomar la mediana de scoie ya que
S09o está n por debajo usted y el 50% abeve.
EVALUACIÓ N MEDIADA Un término má s preciso
para lo que a veces se denomina (en un sentido
amplio) evaluació n de procesos, que significa
evaluació n de algo al observar indicadores de
evaluació n ocasionales, p. Nombre del fabricante. prn-
parte de la facultad de Ph.Ds ori, donde spmeone
quiere ir a la universidad. El término "evaluació n del
proceso" alm se refiere a lo directo. verificar, por
ejemplo, la ética del proceso. Ver Evaluació n Xey
Lista de verificació n.
EM no ‹OR ARs+TRATiO) modelo de evaluació n.
-Se ha prestado poca atenció n al interesante papel social y
habilidades del mediador o á rbitro, que en varios sentidos
proporcionan un modelo para el evaluador. la
combinació n dedistanciamiento
Con una dependencia considerable para llegar
a un acuerdo, el papel de la ló gica y persuasió n, eif ingenio y
empatía'.

MODELO MÉDICO (de evaluación) en la versión de
Sam Messick (en el es clopedia de Evaluación E zicatioual)
el contraste se traza entre el modelo de
ingeniería y los modelos médicos. El modelo de
ingeniería "se centra en las diferencias de
entrada-salida, frecuentemente en relación con el
costo". análisis, suficiente para juzgar: la
generalización del tratamiento en otros campos,
sugerencias de remediación y predicciones de
efectos secundarios. El El problema aquí es que cruzamos
los límites entre la evaluación y las investigaciones casuales
generales, dilatando así las características distintivas de la
evaluación. evasión y así expandiendo su
esperanza de hacer que los resultados sean extremadamente
difíciles de obtener. Parece .más factible apreciar los puertos
de Coosumrr Jtr- por lo que nos da, en lugar de quejarse de que
no lo hace.
darnos exp|pna/ion de los mecanismos subyacentes en los
productos y servicios que califica. Cf. H ístico y analítico
bVBlUAHOft.

MÉ RITO (Cf. Valor, É xito) Valor “intrínseco” en


oposició n a valor/valor extrínseco o basado en el sistema.
Por ejemplo, el mérito de los investigadores radica en su
habilidad y origen; su valor (para la institució n que los
emplea) incluiría los ingresos que generan.
ANÁ LISIS MSTA (Gen @culo) El nombre para un 'pnrtic-
iller ”p/›gr‹›//r/I para estudios de síntesis de urea tema
comú n, que implica el “cá lculo de un par‹zmeter especi fcr
e‹1ch ("Tamañ o del efecto"). Supromesa es elegir algo de
valor, incluso de estudios que no cumplan con los
requisitos mínimos
, normas”; su peligrosidad es a lo que se refiereen la
computadora programació n(campo como los Principios
GIGU Entra basura, sale basura. Si bien está claro que
una cantidad de estudios, ninguno de los cuales es
estadístico, si, yiiifir /t›ff, puede integrarse por
un meta-analista en un resultado altamente significativo (porque
el
- N combinado es más grande), no está claro có mo se pueden
integrar los diseñ os de iiirnfid. Ari excelente revisió n de resultados y
métodos.
se encuentra en Evaluació n en Educació n Volumen 4, No.
1,1980, un nú mero especial titulado "ReNarch
Integration: the State of the Art". El metaná lisis es un
enfoque especial de lo que se denomina el problema
general de la integració n de la investigació n (estudios) o
la síntesis de la investigació n, y este conjunto de
términos para
Refleja el hecho de que es una actividad intelectual que se
encuentra entre la síntesis de datos por un lado y la
evaluació n de la investigació n por el otro. Como señ ala
Light (ibid.), son un elemento residual del juicio
involucrado en lugares sexuales tanto en el metaná lisis
como en cualquier proceso de síntesis de investigació n; cłań
- mg la base de estos juicios es una tarea para la
evaluació nmetodó logo, y los esfuerzos de Klass para
hacerlo han llevado a la
floreciente de un muy fnŹitfzil área de (meta-)investigación. Yo soy
un
ejemplo de investigació n autorreferencial de la misma
manera que meta- evaluació n.

M£TA-EVALUACIÓ N La metaevaluació n es la
evaluació n de las evaluaciones y, por lo tanto, típicamente
involucra el uso de otra evaluació n para evaluar una
evaluació n propuesta o completada. Esta prá ctica pone al
evaluador primario en una posició n similar a la del
evaluado; ambos van a ser. evaluados en • su desempeñ o.
Se puede hacer de manera formal o sumaria. Los informes
deben ir al cliente oń ginal, copia al
° evaluador de primer nivel para rćacń on. Luego, la
metaevaluació n le brinda al cliente evidencia
independiente sobre la competencia técnica del
evaluador de pń rsary. No se generan registros infinitos
porque la extrapolació n muestra que no paga después
del primer metanivel en la mayoría de los proyectos y en
la segunda ocenía.
?vteta Cvaluació n es una obligació n profesional para los
evaluadores, como lo es el psicoanálisis para los psicoanalistas.
Un enfoque dimensional podría considerar la validez, la
capacidad, la utilidad (tiempo) en , legibilidad, relevancia),
robustez y costo. La lista de verificació n de evaluació n
clave también se puede aplicada, en tń /o wdys: ya sea
utilizá ndola para generar una evaluació n (o diseñ o)
correcta. que pueden compararse con el real (evaluació n
secundaria), o aplicando la lista de verificació n para el
evaluació n original ris a yr‹Hiict (verdadera metaevaluació n).
El ú ltimo proceso incluye al primero, como una consideració n
apropiada del proceso científico, pero también requiere que
miremos

'95
p.ej la rentabilidad eeeo°liintiou mismo, y por lo
tanto
. hace algo para ayudar al equilibrio de poder Debería, por
ejemplo, no incluir una mirada a los costos
diferenciales de Tipo Ip Errores de tipo 4 en el eVbluañ ó n.
Evalua\ior\ş rń tuerca, sin embargo, ser evaluado en
términos de su real
pw consecuencias, pero solo en condiciones de su
Consecuencias I{ " tisri f aț›ț›roț›rintely. además del kecuno podría
usar la variedad Está ndares de evaluació n o 8ob GO !"
'S•QUEMĄC -
' Acercarse. Profesionalismo en la evaluació n requiere regulació n
de la autorreferencia del sujeto y, por tanto, de la pblig ti
verdadmi meta-evaluació n. Semi tambiéno Consojjanse.(Ra ef. D
hl relleno
• • debeań i; “Metaêvaluació n: Conceptos, Normas y Usos”
rra/•°es» MethqdoJo$y: el estado de la
Arte, ed. Idiota de Rona! (Johns-Hopkins, 1981).
“ MICRO-ANAL\SÏS Esto puede referirse a: una
evaluació n que incluye evaluaciones de los componentes
del evaluando; oa la evaluació n desagregada por
dimensiones (nosotros Analytical Evaluat n); oa una
explicació n causal del desempeñ o (valorado o devaluado)
del e 'aluando, que no es (normalmente una preocupació n
del evaluador).
NIICRO-EVALUACIÓN Evahiació n Analítica de Seê.
• MÍNIMO La estrategia de decisió n de actuar con el fin de
acuñ ar
.mizar la pérdida mínima posible, por ejemplo, comprar un
seguro simplemente porque elimina el "peor de los casos" de
una "pérdida total no asegurada". independientemente del
precio del boleto o del nú mero de boletos vendidos. Se dice
que estas son alternativas significativas a la optimizació n,
que maximiza la expectativa (el producto de la unidad de un
resultado por la probabilidad de que ocurra).
no pueden justificarse en absoluto, son simplemente
casos límite, aplicables en casos especiales limitados.
£iłłgfrfrn/fy, son alternativas a las estratégicas y la gente
usa tl 'm' en todo tipo de casos; pero tii›nti nt1r‹”!¡l eso
es principalmente un signo de irracionalidad o
ignorancia- ø Rc¢ o pck decapacitació n. ,
COMPETENCIA MÍNIMA PRUEBAS Un archivo
bá sico 1
‹›f (normalmente) basiü habilidades es un mínimo
competencia El éxito en dichas pruebas ha estado ligado a la
graduació n, la promoció n de ldc, la educació n secundaria; el
fracaso ha sido ligado a la evaluació n del maestro, programa
sin financiació n, etc. Con todo este ‹ftp en juego, MCT
ha sido muy tema político candente—y uno ético, y uno de
medida. Introducido con la debida advertencia y
-apoyarlo puede representar un paso hacia el sch‹xiling
honesto; hecho sin cuidado, es un desastre. Ver Corte,
Puntuació n.
MISIÓ N PRESUPUESTO Una generalizació n del nohon
de la presupuestació n por programas (ver PPBS); la idea
es desarrollar un sistema de presupuestació n que
responda a las preguntas del tvpe, "¿Cuá nto estamos
gastando en tal o cual cosa?"
////ssio/i*” (bv contraste con gro,yrn»/, n,yt•iiry, y /›ersuH/i‹*/--
los tipos anteriores de categorías a las que asciende el
presupuesto estaban atados). Una limitació n de P)?BS ha
sido que una buena cantidad de programas se
superponen en la clientela a la que sirven y los servicios
que brindan, por lo que podemos tener una idea muy
pobre de cuá nto estamos invirtiendo, por ejemplo, en
asistencia social o educació n bilingü e. simplemente
mirando los presupuestos de las agencias o incluso las
cifras de PPBS, n8/c'ss' tenemos imá genes
extremadamente claras, que los tomadores de decisiones
rara vez pueden tener, especialmente un nuevo
Gabinete Ejecutivo—de el impacto real poblaciones y el nivel
de prestación de servicios de cada uno de los programas. Este
concepto, junto conpresupuesto base cero, era popular entre
el conde Carretero administración pero oímos hablar poco de
ello más tarde en ese régimen, al igual que la introducción de
FPBS por parte de MacNamara (en DO-D, de Ford Motor
Company) bajo una administración anterior se ha desvanecido
considerablemente.
M OEtE (Stat.) (Cf. Mean, Median) La moda es el
puntaje o intervalo de puntaje ”má s popular” (má s
frecuente). Es má s probable que un estudiante del que
no sabe nada excepto su pertenencia a este grupo
obtenga la puntuació n "modal" del grupo que cualquier
otra puntuació n. Pero puede que no sea muy probable,
por ejemplo, i( cada estudiante obtiene una puntuació n
diferente, excepto dos que obtienen 1(D de ltD, entonces
la moda es ltXl, pero no es
-muy "típica". mi una curva "normal", por otro lado, como la
(supuesta) distribució n de puntajes de CI en la població n de
EE. UU., el significado, la mediana y la moda son todas
iguales
vakie correspondiente al punto más alto de la curva. Algunas
distribuciones, o las curvas que las representan, se describen
como bimodales, etc., lo que significa que hay fz‹v (o más)
picos o modas; este es un sentido más amplio del término
modo, pero

MODELOS (de evaluació n) Un término utilizado


libremente para referirse
, a una concepció n o enfoque o, a veces, "incluso un meth‹›L'
(naturalista, libre de objetivos) de hacer evaluació n !
VIudcIs 3re a paradigmas como las hipó tesis son a teorías,
lo que significa menos general y algunas superposiciones.
Aquí se hace referencia a los siguientes, a menudo
denominados modelos: defensor-adversario, caja negra,
conocedor, CIPD, discrepancia, ingeniería, ciencia judicial,
médica, receptiva, transaccional y social. La mejor
clasificació n de estos y otros (hombres que han hecho b2c‹i
intento) es Stuiflebeam y \'Vebster's (pró ximamente, 1982)
h4ODUS OPERANDI MÉTODO procedimiento
ftir identificar la causa de un cierto efecto mediante un
aná lisis detallado de la cadena de eventos que lo preceden y
de las condiciones ambientales: a veces es factible cuando
un grupo de control es imposible, y es ú til como verificació n
o refuerzo del diseñ o incluso cuando un control el grupo es
posible. el concepto se refiere al patró n característico de
enlaces en elCadena causal a la que el criminalista se refiere
como la
‹›/›‹*rnilr/i de un cnminal. TÏtese puede ser quq,ntified e
incluso configurado, el problema de identificar la causa
puede convertirse así en una tarea de reconocimiento de
patrones para un
" computadora. El punto fuerte del enfoque es que puede
aplicarse en casos individuales, de manera informal, semi-
furmall›' (como en ann‹inaIist?cs), y fo‹waIl\' (computació n
completa). También conduce a diseñ os orientados a klOhJ.
que emplean deliberadamente "trazadores", es decir,
características reales de un tratamiento que se mostrará n
en los efectos. Un ejemplo sería el uso2 de una secuencia
particular de ítems en un cuestionario para estudiantes que
se distribuye a los docentes para su uso en el desarrollo
educativo.(Detalles en una secció n b) de este título en
Evaluació n en Educació n, ed JR Ptiphf m, McCutcheon, 1976)
NtONI1"O .”el término "monitor" era el término original
para lo que un agente suele llamar "'el oficial de proyecto",
nombra a la persona del personal que es resp. sensible por
sopen'izar el progreso y el cumplimiento” en un
|contrato o donació n particular. "M‹›nitor" fue un poco más
claro dicho término, dado que "oficial de protecció n" podría
referirse igualmente a sumeb‹›d\' 'cuyas responsabilidades
recaían en el gerente de pro}rc I, o en somebudv que
simplemente manejaba el papeleo del contrato de trabajo
(el "c‹ ›oficial de contratos", un» agente fiscal en la
•1gtncv i'• 5‹›a veces c.cobertizo) Pero es un Aparentemente
pensé
tener connotaciones de 'Bib Brother', o no reflejar
adecuadamente cuadamente la gama completa de
responsabilidades, etc Ver Mtini- hacer sonar. .
MONITOREO Un monitor (de un proyecto) es
“usualmente un representante de la agencia de financiación que
vigila el uso adecuado de los fondos, observa el progreso,
proporciona información a la agencia sobre la necesidad de
proteger y viceversa y rara vez tiene una evaluación
habilidades, si todos fueran incluso evaluadores formativos
semicompetentes, la (al menos cuasi-) externalidad podría
hacerlos extremadamente valiosos. ya que ma nV protege o bien
ausencia evaluació n personal, o tener ninguno que valga la
pena tener, o luego complementarlos con evaluació n
externa Los mt›nitt›rs tienen un rol esquizofrénico que
pocos aprenden a manejar, tienen que representar y
defender la agencia del proyecto y representar y defender
la protecció n de la agencia. y estos roles se pueden
complicar aú n má s con un intento de evaluació n. Ya se
incluyen y la ú nica pregunta es si debe hacerse
razonablemente hú medo.
MOTIVACIÓN La disposició n de un orga- nismo o
institució n a gastar dinero en una direcció n particular. es
mejormedido por un estudio de comportamiento, ya que los
autoinformes son irrítmicamente malos y ct›antetextualmente
probable que no sean confiables. Afectar.
EVALUACIÓN MOTIVACIONAL La evaluació n de tetas
de uso deliberado como una gestió n herramienta para
alterar motix'atit›n puede ser dependiente del contenido o
independiente del contenido si el la evaluació n
recomienda un empate entre aumentos y trabajo-
p salida que se le atribuye m‹aV .efecto motivació n; si cortael
(suprimido o .actual) conexió n, es probable que b2 h•1vc thu
efecto opuesto un /oti›'ation. Pero el mero anuncio de una
ev'.ilu.ació n aú n sin que ocurra, y ciertamente la presencia
de un evaluador, pueden tener efectos muy grandes.
- (b•u‹›d o b.id) efectos sobre la motivació n, como gerentes
experimentados v•' ¡I! knt»' £ nlriat‹›rs, nn la mano t›ther,
arco propenso 'a
•ri|ppc›se tbnt tht* ct›ntcnts r›t sus informes nrc \x hut c‹›unts,
‹Jr1d tc› fü rgct the re•1cti‹'e fctects, •'mientras serian

alguien má s
Estableciendo .un sebo.lloró vamos c'1 uf set(-
critica1av.'arcncss —
clefs, o simple rile-modeling seli-ei'al u.ation lYhen pec›plc
decir q u e ” e n J a p a n p r c i j e c t s . m e no
es'alu.ated para los primeros diez
v e.me” muestra un completo malentendido de es alú a - „ t'ion, no
está restringido a ”major sqmmatis'e externo re-

(mi ' ser ]ufi ltte círculos) su convertirse en Carolina del Sur bien
aceptado ese .
uno puede iiiiili ‹'H ‹' ‹›f .a !‹ing juicio prric›d antes de la parada .ind
$•o res'iess' Sería idiota hacer eso en ausencia de .i ació n p is'.i
lu‹i tis'e corrimitment rind ciintJic't‹'iici' in the n'ork g'ri›up . Ihiire
no es ss'orthw'hile comrpitment to qi inlitv is'ith-o.t
cor›.petcnt .y frecuentes autoevaluaciones
MU LT! *LE- TIER Ver dos niveles.
SÍNDROME DE LA "TRIBU H4Y". Consulte Volverse nativo.
NATURALISTA (evaluación o metodológico Un
.enfoque que minimiza niitch de la parafernalia de 'ciencia e
¿técnica |arg‹›n, previo técnico saber ie .el, st'\tisti al inference,
the eff‹›rt t‹4formuIate general law», the segaratiun of tI1 •
observador from the sub|e{t, the commit- men t tu d Single ccr
rect perspechx'e, estructuras teó ricas, Causas, predicciones y
conocimiento propusitiunal En su lugar, hay un enfoque en el
uso de metá foras, inferencias analó gicas e informales (pero
idó neas) x la identidad de la descripció n, razones explicativas.
inter-actix'e Ie s, significados, mú ltiples (legiti - i..ate) pers[›r
tix'es, t. cit knuw'Iedge. Para una excelente discusió n, véase el
Apéndice D “Ex'aluation turalistic in Eualu-o+iny z‹ si/i.
Vu/gélidamente,Casa E, Sage, l?80.) El Indiana L'nix'ersih'
yrt›up (Kufra ‹Ind Wol I particuI«rh') han pagado g0 rticuI‹1r
‹lttc'ntic›n tc› el naturalista rnoj¿eI, y ellos
‹J finiti‹ n (\\'‹›lf, pers‹›naI c‹›mmunica On) destaca que ‹1t it' • f‹1)
h‹1 mc›rc unen t.ation totx'ards ”actual y instantá neo
.«ti it«'•. Wh‹a t'iur» ‹Incl exprcssit›ns en lugar de t‹› some st‹i!
c'ni‹'nt ‹›t pre'•t•1ted f‹›rm•1I ‹›bJtctix'cs; (b) respt›n¢ts
t‹›educadores, ‹IcJnzini tr‹1'ors, I 'arners and the puhIIc's t'1terest
• in d iitcrent kin‹Js t›f inft›rm‹1tinn, ‹Ind (c) •1anunts f‹›r the
diifc'r*ntx'‹1I uc's ‹In t gtrsgectit't that exist ', it ‹1Iso str ••s .es
‹›ntcxtu•1I t‹1ct‹ r'•; no estructurado en tcm'iew.ink' nh-
sc'm'‹1ti‹›nr‹a ther th‹1n testing, me‹1nings r. tL. '• que mera
Ix'h‹1x'i‹›rs 4Juch ‹›i tht dth‹1te ‹1hc›ut the leyitM..‹1rw 'utilidad'
‹^f the natu§‹1Iistic apgr‹›.Fch recapituI.1tes the idi‹›¿r.aphic/
los ñ ei›aies en la filosofía analítica de la historia sobre el a:e
de las leyes. En esta etapa, los principales exponentes
del enfoque naturalista (por ejemplo, Stake) pueden
haber ido muy lejos en la direcció n de Inseez-faire
(cualquier interpretació n que la audiencia
machos es permisible); pero su ejemplo ha mostrado lo
impropio de muchas de las suposiciones de los formalistas
sobre
, la aplicabilidad de la modelo de ciencia social. Y está
emergiendo claramente un nuevo modelo de
excelencia, en el trabajo de Stake y en Guba y
Li...am's Evaluación efectiva (Jossey-Bass, 1981!.
NECESIDADES EVALUACIÓ N (NECESITA SEXSfNG es
un
vanant reciente) Este término ha pasado de su significado
literal a un estado de jerga en el que se refiere a cualquier
sexidy de los necesidades, subvenciones, preferencias de
mercado, valores o ideales que pueden ser relevantes,
por ejemplo, para un programa. Este sentido descuidado
podría llamarse el sentido (o proceso) de "bú squeda de
direcció n", y de hecho es perfectamente legítimo cuando
el or.e busca toda la orientació n posible en la
planificació n, o la justificació n para la continuació n de
un proceso. programa. La evaluació n de necesidades en
el sentido literal es solo una parte de esto y es la parte
má s importante, por lo tanto, incluso si se adopta el
enfoque de bú squeda de direcció n, uno debe clasificar
las verdaderas necesidades. Las necesidades brindan la
primera prioridad para la respuesta simplemente
porque en cierto sentido son necesarias, mientras que
los deseos (simplemente) son angustiosos y los ideales
son "idealistas", es decir, a menudo poco prá cticos. Por
lo tanto, es muy engañ oso producir algo como una NA
(evaluació n de necesidades) cuando en realidad es solo
una encuesta de mercado. porque sugiere que hay un
nivel de urgencia o importancia en sus hallazgos que
simplemente no existe. Las verdaderas necesidades son
considerablemente má s difíciles de establecer que los
deseos sentidos, porque las verdaderas necesidades son
a menudo desconocidas para aquellos que las tienen,
posiblemente incluso contrarias a lo que quieren, como
en el caso de un niñ o que sigue una determinada dieta y
quiere uno completamente diferente.
La definició n más utilizada de necesidad —la "definició n de
discrepancia"— no confunde las necesidades con los deseos,
sino que los confunde con los ideales. Define la necesidad
como la brecha entre el ac.cal y el ideal, o lo que sea necesario
para salvarla. Esta definició n incluso se ha convertido en ley en
algunos estados, pero la brecha entre tus ingresos reales y tus
ingresos ideales es bastante diferente (y mucho más grande)
que la brecha entre sus ingresos reales y lo que realmente

1ź0,
necesitar. Así que tenemos que dejarel uso del nivel ideal
como nivel de referencia clave en la definició n de no, lo
cual está bien, porque es muy difícil llegar a un acuerdo
sobre có mo es el plan de estudios ideal y si tuviéramos
que hacerlo.
antes de que pudiéramos argumentar a favor de cualquier
necesidad curricular, sería difícil empezar.
Un segundo defecto fatal en la definición de
discrepancia es su identificación falaz de necesidades con
uno en particular subconjunto de necesidades, a saber
insatisfecho necesidades. pero hay muchos cosas que
necesitamos absolutamente, como oxígeno en el aire, o
vitaminas en nuestro dieta—que ya están allí. Decir
nosotros necesitamos ellos es decir que son /teczss‹intentar
por ejemplo› vida o.salud, lo que los distingue de los muchos
inessezicial DelgadoGis en el entorno. Por supuesto, sobre la
discrepancia definición no son necesidades en absoluto,
porque son parte de "lo actual", no es parte de la brecha
(discrepancia) entre eso y el ideal. Eso
puede ser útil usar la terminología dietética para los números
cumplidos y no cumplidos—intensidad y incremental
necesidades. Personas
a veces pienso que es mejor concentrarse en necesidades
incrementales porque ahí es donde se requiere la
acció n' ..W; así que tal vez
—creen— la discrepancia definición no es obtener nosotros
en tcXj mucho ft'Guble. Pero, ¿de dónde obtendrá los recursos
para la acción necesaria? Algunos de ellos generalmente
provienen de la redistribución de los recursos existentes, es
decir, de robar las necesidades de Peter para pagar las de
Paul, donde las de Peter (las necesidades de mantenimiento)
son tan vitales como las de Paul. de Pablo (el incremental).
Esto lleva a un flip-flop absurdo en años sucesivos: es mucho
mejor mirar todas las necesidades en la AN, priorizarlas
(usandorepartir métodos Nuevo Testamento calificación o
clasificación) y luego ac? redistribuir viejos y nuevos
recursos.
Un mejor definición de necesidad, que podríamos
llamar la definición de diagnóstico, define Neea como algo
esencial para un modo de existencia sahsfactory, es decir,
cualquier cosa sin la cual ese modo de existencia o "nivel de
rendimiento" caería por debajo de un nivel satisfactorio o
aceptable. El término resbaladizo @ esto es, por supuesto,
"satisfactorio" y depende del contexto; Las dietas
satisfactorias en una nación atenazada por el hambre pueden
ser considerablemente más cerca del nivel de inanición que
los que se consideran satisfactorios en tiempos de
abundancia. Pero eso es parte de la
componente esencialmente pragmático en NA P*°*'"8
—es
y concepto pragmático. Las necesidades se deslizan a lo
largo del borde medio del espectro desde el desastre hasta
la utopía a medida que los recursos se vuelven
disponible. Nunca cubren los extremos del espectro-mm— -
ninguna riqueza, por grande que sea, legitima el reclamo de
todosnecesita todos los lujos posibles. '
La pró xima gran ambigü edad o trampa en el concepto de
necesidad se relaciona con la distinció n entre lo que
podemos llamar necesidades de mance y necesidades de
tratamiento. Cuando decimos que los niñ os necesitan
poder leer, estamos hablando de un nivel necesario de
rendimiento. Cuando decimos que necesitan clases de
lectura, o instrucció n en el enfoque fonético de la lectura,
estamos hablando de un tratamiento necesario. La
brecha entre los dos es enorme, y só lo puede salvarse
mediante una evaluació n de los posibles tratamientos
alternativos que podrían producir el rendimiento
supuestamente neto. Los niñ os necesitan ser capaces de
conversar, pero no se sigue que necesiten clases para
hablar, ya que lo aprenden sin ninguna. Incluso si se
puede mostrar
{que necesitan el "tratamiento" de readi clases, eso está
muy lejos de la conclusió n que se necesita un enfoque
particular para la enseñ anza de la lectura. Los puntos
esenciales sonque el tipo de NA con el que uno debe
comenzar las evaluaciones es PRRIAIICE NA: y que las
afirmaciones de necesidades de tratamiento requieren
esencialmente NA de rendimiento dental y una
evaluació n a gran escala del mérito relativo* de los
mejores candidatos en las apuestas.
Los problemas conceptuales que no se discuten aquí
incluyen el problema de si hay necesidades para lo que
no es factible y la distinció n entre necesidades
artificiales (alcohol) y necesidades esenciales
(alimentos); los problemas metodoló gicos, incluidas las
fallas en los procedimientos habituales para realizar NA,
se analizan en otra parte (££).
La pers{›ertiva crucial a retener en NA es que es un
prrms para descubrir hechos sobre organismos o
sistemas; no es una encuesta de opinió n o un viaje de
lavado. Es un hecho acerca de los niñ os, en este entorno,
que necesitan vitamina C y habilidades funcionales de
alfabetizació n, ya sea que sepan o no.pensar o
lo creen sus padres o lo mismo piensan los hechiceros o
los nutricionistas o los especialistas en lectura. Lo que lo
convierte en un hecho es que el retiro de, o la falta de
provisió n de estas cosas, resulta en ir. muy malas
consecuencias, segú n cualquier está ndar razonable de
bueno o ad. Por lo tanto, los modelos para NA deben ser
modelos para encontrar la verdad, no para lograr un
acuerdo político. El hecho de que todos ellos sean t‹x› a
menudo de este ú ltimo tipo refleja la tendencia de
aquellos que los diseñ an para pensar que el valor
* |ud{§rnents ‹son, no parte del dominio de la verdad. Para NA'‹irr
los juicios de valor son cuestiones de hecho tan
seguramente como las claves; de hecho, son la clave
''alorjuicios en la evaluació n la fuente ruut o( el valor
que evely hace de la colclusió n
una evaluació n o má s bien una unidad puramente
descriptiva. Es fá cil ver esto si comenzamos con un
enunciado que se refería a un ideal como lo hacemos
(implícitamente) con la discrepancia. definició n; o si
nosotrosestán pensando en una declaració n de
necesidad de tratamiento (ya que eso es una evaluació n).
Y es fá cil ver que si comenzamos con meras estrategias
de mercado, tendríamos una conclusió n evaluafiva, solo
una descriptiva (posiblemente describiendo la evolució n
de una població n, pero no inn£ii(ç). evaluaciones),
perodefinició n de diagnó stico latencia NAs rire nfsu
evaluativoporque requieren la identificació n del
rssriifiof, el ini{x›ttant, el que avpids land resulta. Por
supuesto, estos son a menudo juicios de valor
relativamente poco controvertidos. Las evaluaciones se
basan en NA como las teorías se basan en observaciones;
no es que las observaciones sean infalibles, soloque son
mucho má s falibles que la especulació n teó rica.
NPL No apoyando a ninguna de las facciones
waiJing,
es decir, una categoría yolitiC0l. l'sio es más probable que
tenga razó n quela V son; má s probable que sea ignorante;
no alu'avs má s probabilidades de ser objetivo. por lo tanto,
debe usarse con cuidado, no como la opció n siempre ideal
para jueces, jueces, evaluadores, etc.
. * tive ///tf,g‹m,ye también se dice que es neutral; ya no es ob|ecti\e
que janey evaluativo
Ûrifâ-terrestre “ ngs” tal vez mucho más tendencioso
Dan “Elle es una muerte br viceversa
Dt5TRIBUTlON NORMAL (Stat.) Nut the way las
cosas está n normalmente distribuidas, aunque algunos lo
son, pero un distribució n ideal que da como resultado la
conocida cura en forma de campana (que, por ejemplo, es
perfectamente simétrica aunque pocas distribuciones
reales lo sean). Una gran parte de las estadísticas
inferenciales se basa en la suposició n de que la yepulahon
de la que estamos muestreando está normalmente
distribuida. 'con respecto a los 'a\jables de interés, y es
invá lida si esta suposició n se viola con frecuencia, como
sucede con bastante frecuencia. La altura y el color de la
víspera a menudo se dan como ejemplos de variables que
se distribuyen normalmente pero que tampoco son
ejemplos bien fundamentados. (El término "distribució n de
Gaiissan" se usa a veces y no menos confuso para esta
distribució n)

CE
NORMATIVO Término técnico en las ciencias seccionales
que esencialmente ha llegado a significar “evaluativo”. Llegó a
tener ese significado (se supone) porque la única base fáctica
que los llamados “empiristas” podían ver para el lenguaje
evaluativo era como una forma de expresar un juicio de
desviación de una no (p. ej., de aceptabilidad o mérito) Decir
que un desempeño es “excelente” era decir que es una
desviación estándar o supera la norma (o promedio o
promedio). Este análisis de la suprrficia 1 llevó a prácticas tales
como “calificación sobre la marcha”, es decir, la confusión de
“mejor” con “bueno”. es, por supuesto, un término evaluativo,
pero no reducible a .statishcs —o, si es tan reducible, no es
reducible en un mucho más sophis. lo que mostraría la rcdurtioi
original. ser superficial El lenguaje de clasificación está
relacionado con la norma, el lenguaje de grai4ing no lo está
(total v) y el uso del término "normativo" confunde a los dos.
El usual contr.est de “norm.atix'e” con "descriptivo" no
tendría sentido en este aná lisis, ya que “normativo” h,as
c.arcfull\' W•er ven ‹un me.ining descriptivo. De hecho, el
contraste de ‹fo‹ “normativo” con descriptivo, en el
usudlsoci•a I scienti.sts' su.edad, porque ignoran el aná lisis y
usan “ncirmdti ve” significar “ex'.a lu.a tivo” Pero luego, por
supuesto, el término "normatix'c" es enteramente edundante,
un monumento a
.a de‹ad a na Ivsis .anc4 .a lux'c de la jerga. Al igual que el uso
igualmente confuso del término “juicio de valor” para significar
“expresarpretcrence de c›f propio", el temi "n atit'e" s‹icrifices
un útil tcma tt› a f.rise' •oc4. “Ncërm. "e" debería significar
simplemente "refiriéndose directamente a las normas, ya sean
descriptivas o ex'a1u'itix'e". c.at”, “diferente”
cfc. , as n ell .as n anpuage (que esex aHi.a tis c) tout shoti Id
ntit se refiere a “wtirthl ss”. "Perfecto." Pero no tales términos
se refieren aestandartes ic n brazos de

sentido Pero es .un Jrrelev.irjt sen•.e. “i-ti eVes .are blue” se


refiere, en ese sentido, a estándares de color; “Él es b'3” se
refiere a su postura.yo h's‹ rqi/ii'i' Isa ngti‹ape, en I pelusa sentido
taf “ntimativo” destrtw's la distinció n “Prescriptivo” es
como‹›mexvh.at t›ettcr término para u5t, .es .i ct›ntrast con
”i4estriptix'c " . w
PRUEBAS REFERENCIADAS POR NORMAS
Típicamente se estructurado para \'rendir una medida de
rendimiento /‹ifiz*ü uf el individuo (o grupo) en
comparación con el desempeño de otros individuos (o
grupos) que toman la misma prueba
ej., en términos de clasificación de percentiles (ct. Criterion-
Referenced Testsl). Eso significa descartar ítems que (casi)
todos los evaluados aciertan (o equivocan) porque esos
ítems no "extienden" la población de evaluados, es decir,
ayudan en embestida. iYhat es lett rnav o no puede dar una
in'd}Cahon muy confiable de
por ejemplo, leyendo .abilitv como sucli (en contraste con
bettfr readin„g habilidad). Dado que la forma más sencilla y,
a menudo, la mejor forma rápida de determinar si una
prueba involucra aspectos poco realistas es averiguar
cuántos estudiantes en el estado tienen éxito, enese nivel de
referencia a la norma es una parte valiosa de cualquier
programa de prueba. No es ideal como base «a/c», ya que hace
que discriminar o competir sea más importante que (o el único
significado de lograr, y debilita severamente la prueba como
indicador de dominio (o excelencia o debilidad) , que también
debe conocer. El mejor compromiso es una prueba referida a
criterios en la que también se proporcionan las normas, donde
los criterios son necesidades documentadas de forma
independiente.
N\JLL HIPÓTESISLa hipótesis de que! los resultados
sondebido al azar La estadística sólo nos habla de la hipótesis
nula; es el diseño experimental el que proporciona la base para
las inferencias a la verdad de la hipótesis científica deinteresar.
Los "niveles significativos" a los que se hace referencia en los
gastosmi úesign «e in*eIyretatiOn son las chünces que la nula La
hipótesis es correcta. Henre, cuando los resultados ”llegan
al .01nivel de significación” que significa que sólo hay una
posibilidad entre cien de que se deban al azar. Se debe ›/‹›f
rnc«anel hay un 99 por ciento de posibilidades de que ninguna
de las hipótesis sea correcta, porque, por supuesto, pueden ser
otras explicaciones del resultado que se encuentran. no ha
pensamiento de Ver Hipó tesis Pruebas.
NUT ("hacer la nuez") Consultor de gestión jar- b•un miedo a
la corteza básica de la gestión del negocio durante el año
Después de "hacer tF,e tuerca" unc m9y convertirse en un
encendido ‹• ch‹ioslcr
.sobre i 'hich id bs tt› t.akc on, .y qué tarifas establecer.
O
cuntrc»'orsial Cf. Neutral, Sesgo, Subjetividad.
OBJETIVOS El sentido técnico ui este término se refiere
°a descripción bastante específica de un resultado previsto;
el
* {Señuelo gcneraLdescription se refiere a tu como una meta.
• OBSERVACIÓN El proceso o producto de la sensación
directa Inspección de vigilancia, con la participación
frecuente de observadores capacitados. La línea hehveen
obww'ation y sus hormigas norrñales:ivm ”in•
interpretación” no es nítida y es, en cualquier caso,
contexto-
, dependiente, es decir, lo que cuenta como una observación en
un contexto ("un verbo' pretty dive") contará como una
interpretación en
. ‹ m a d r e \ u ' a q u í . l a se apelan las puntuaciones de
los jueces de clavados). Tal como
‹Es \ crv dificil conseguir aprendices en ex'aluabon, incluso
aquellos u'with formación científica considerable para
escribir non-e\'alu/s- ti -e descripciones de algo delgado}'
que se va a dañar, por lo que es difícil todavía t›bser\'rrs
para sc•e unlv lo que hay allí en lugar de sus inferencias lo
ir‹›ni. El uso de listas de verificación y capacitación c‹3 n
produ e*x'erv ;;ie‹1t in reutiliza ia reli‹1bilitv .Ind \'aliditV in
ubsec'ers; ‹›bses'.atit›n es así ‹1 mlthur
Ess, .Ind n‹›t It› *• iu‹1tec1›x'i th the.amateur's percepciones o
informes sobre ellos. 'Huld be clar‹1r de lo anterior que hay
‹1re ct›n textos en u'hich ‹Jbser\'ers, speciallv observador tmined
'eres, .un ct›rfecto)v rlpurto sus ‹observaciones en
ex'aluatl 'e t términos (An ‹›h 'it›ris epple, ›x'here r\o el
entrenamiento speci.11 es
inx'ol 'ed, estoy reportando seguros en .1 rango de rifle.'
COSTOS DE OPORTUNIDAD Oportunidad los costos .son' lo
que
junio Posee punta bx' ent;‹Jing en una actividad particular. Elmismo-
concepto .se aplica a tinta comiendo mono' o cualquier otro
recurso ThLre .jre if/«'4i/• t›pp‹›rtunitv coms: ‹›ne at menos
tiene dar ocio t‹› dr› st›thing, o dejar el trabajo para no
hacer nada, C , enjt›}' lLi»\irL• C.alcul‹1ting thc*m (como
ganancia) es .1 con tinte eptu‹1l t.1sk. .1n‹1 .In anth iTietiC
one later. En primer lugar, thcrL i» ‹1l›•'• \'s .In infinitv ›f
•1ltern‹1tives to anv ac- ti‹›n, . II ‹›t ›x'hmh t›ne bivL*'• arriba.
¿Se ajusta a la oportunidad? <yo ‹1l«'a ¿infinito? La
ct›n\'onción en que tu OC es el t'aluo t›t el iiii›st ‹•iiliinl›I‹' ot
*hcse. Su, c‹alculating ‹›ne OC ‹›itc'n in '‹›l 'c's c•1lcul‹\
ting .1 g›re‹1t m‹1nv ct›sts uf .alterna-Corbata Ella Costo.
MEJORAMIENTO La ctecisi‹›n str‹1tebv accurdir\g a
«'hich t›ne »ht›ulc1 elegir el .lltern.th 'e con la m. expectativa
xftnum (es decir producto de (la probabilidad de que el
pago sea por su utilidad, en caso de que se produzca). Es
cvalu.ativelv siempre el str.atcgv correcto si thy .analysis es

c4one ctirr‹•itlx' ej. por


t, es el momento en que se necesita el conocimiento, mientras
que tt es el final de la instrucción.al penixl
*PAD,-{°ADDINGCuando un postor sube con un presupuesto
para una propuesta, tiene que haber
—de una manera u otra—, alguna concesió n en ella para
eventos imprevistos—al menos
Si está por hacer cuenta
ing a las prácticas comerciales sanas. Estaes seguido
se refiere a "la libreta", y
la prá ctica de hacer esto es la es decir
mimo' versió n de "rellenar el presupuesto". Remar
el presupuesto también se utiliza como golondrina de mar.
para referirse a ilegítimoademás de
el presupuesto (ganancias excesivas); pero
debe(Me di cuenta de que la almohadilla es la ú nica sombrero
de recurso el contratista tiene para manejar las faltas de
confianza obvias en la predicció n el facilidad de implementar
algú n programa de prueba complicado, la eaof diseñ ando un
cuestionario eso superará los paneles de revisió n del
cuestionario, la brecha entre los contratos, etc.'huye”

PARADIGMA ‹tremelv concepció n general de una dis-


disciplina, que m•avverv influyente en sacudirlo, por ejemplo
* 'el clase nce paradigma en e alua :on.“
DISEÑ OS DE PALÉ S (en e 'aluation) T}›cse en el que
dos evaluació n interna equipos o evaluadores
prucAd independientes v (necesidad siguiente‹1ril'/
concfirrentlv). Thev a•e de gran •importa CQ porque O( la luz
que arrojan sobre lo desconocido grado ofetevaluador
convenio; porque tal proceso aumenta la carpa con
la que procede cada equipo; y debido a que el proceso de
reevaluació n (síntesis) conduce a un aná lisis má s profundo
que el que logran los examinadores de forma independiente.
nn dos equipos má s pequeñ os obteniendo la mitad
como mucho que tu uno bien financiado equipo. pe*
gerentes
no me gusta esta idea Solo #‹'iaiis‹ los equipos pueden dis gratis
—su
'verdadera virtud'
"PARALELO FORMAS \'trsiuns de una prueba que han sido
probado para ecju.ml dificultad y x'alidlty.
PANELES PARALELOS En prop‹›s.\l revise, por ejemplo,
es importante ejecutar paneles concurrentes independientes
en para obtener una idea de la confiabilidad de las
clasificaciones tljcv son productor. En las pocas r›cc‹1si‹›n
que esto ha hecho, laLos resultados han sido extremadamente
inquietantes, ya que la falta de fiabilidad garantiza la invalidez
y la injusticia. uno esperaría
una fundació n científica federal para tener suficiente
compromiso•tu ' vaIidit' y justicia para hacer cheques
rutinarios de este tipo, pero por lo general hablan mal en
lugar de buscar f‹›r 'ats para obtener \'alidiW dentro del
mismo presupuesto. En cualquier caso, la entrega de
fondos de manera irlida e injusta no se justifica
ahorrandolos, ya que costara mucho ms (o hacerlo
razonablemente bien, incluso si es cierto, ya que las
compensaciones seran mayores (de la definicin de
"hacerlo" y razonablemente bien"), y se supone que la
justicia vale un poco.
PARETO OgTIKtAL Un duro cntenon para los cambios
en\
por ejemplo, una organizació n o programa que requiere
que se realicen cambios só lo si nadie sufre y alguien se
beneficia. La característica crucial es que parece ‹evitar
el preblema de justificar las llamadas ”comparaciones
interpersonales de utilidad”, es decir, mostrar que las
pérdidas que algunos sufren como resultado de un
cambio son menos importantes que las ganancias. puja
hecha
• otrosMejorar las condiciones de bienestar elevando los
impuestos en el momento ó ptimo de Pareto, obviamente.
Pero seleccionar entre un tema y tener cambios ó ptimos de
Pareto genera dificultades relativas.y consideraciones de
beneficios. Una debilidad importante en la teoría de la
justicia de Rawls es el compromiso (O Pareto ophmalirv
PRINCIPIO DE PARETOAMáxima de gestió n
posiblemente má s esclarecedora que el Principio de
Peter y la Ley de Parkinson, a veces se describe como “el
rtil 80/20, o el “principio de los pocos vitales y el mRV
trivial”, y afirma que alrededor del 80%” es un logro
significativo (p. ej. rat a meeting) es realizada por ahuut
20a» de los presentes; ITU c›f el volumen de ventas de ?-
0%'o de los vendedores, 50°.o de la lista de tareas de
frc›ma de pago se puede lograr a partir de 20'°/o de las
tareas, etc. Vale la pena recordarlo porque ›a veces es
cierto y a menudo provoca

PARKINSON LEY “W‹ rk (y presupuestos,


cronogramas y seis miembros del personal), se expande
para llenar el espacio, el tiempo y los fondos
‹ax'ailJble.“ Si el cun\'ersc trama verdadera debería
significaba que podía hacer todo si dedicaba poco tiempo
a ello; pero como se lija es una percepció n considerable.
hcut larye ‹›rganiz.1tions. El hecho de que las ofertas en el
r‹› de ftFP estén cerca del límite e hmado puede no
ilustrar esto, ¿puede que el 'trabajo se pueda realizar • en
'.lrios niveles de th‹ ›ro i hness o th•at RFI' wnters no son
tontos
ANÁLISIS DE RUTA A procedimiento para analizar un
conjunto de relaciones matemá ticas que pueden arrojar
alguna luz sobre la importancia relativa de las variables.
Incluso puede imponer algunas restricciones a su
relació n causal. No puede identificar definitivamente a
ninguno o grupo de ellos como causa.
PAGO (PERIODO A término de evaluació n fiscal
:que se refiere al tiempo antes de que se recupere el costo
inicial; los flujos de efectivo de recuperació n deben, por
supuesto, ser descontados en el tiempo. El análisis de
recuperació n de la inversió n es lo que demuestra que
comprar un
, $12,1XD word-processpr puede ser sensato incluso si el
precio probablemente bajará a $8tQ) en un añ o; si el
período payhack es, sav; J5 meses (típico de muchas
instalaciones cuidadosamente elegidas), de hecho perderá
varios miles de dó lares esperando que baje el precio.
EVALUACIÓN DE PAGOS Evaluació n enfocada en
resultados; el método elegido aparte de los costos, la
demora y la pérdida intermedia de control o
responsabilidad (ver Evaluació n del proceso).
Esencialmente similar a la evaluació n de resultados.
CERVEZA REVISIÓN Evaluació n, por lo generaltif
propuestas o profesores universitarios, realizado por un
panel de jueces con calificaciones que se aproximan a las del
autor o candidato. El enfoque tradicional pero
extremadamente inestable. Los paneles combinados
producen resultados diferentes, fatiga, aprendizaje y efectos
de halo generalizados, etc. El proceso se puede mejorar
mucho, pero hay poco interés en hacerlo, posiblemente
porque está sirviendo principalmente como un legitimador
o simbó lico. tipo de evaluació n, no de bú squeda de la
verdad. Posiblemente la desgana se deba simplemente a la
ignorancia del costo social de los errores, ademá s del
nerviosismo acerca de los costos de tiempo para los
panelistas. Ver Calibració n,Dos niveles.
PERCÉMTIL (Estad.) “ Si u s t e d o r g a n i z a u n
g r a n grupo en el orden de sus puntajes en una prueba, y
divídalos en lUtl grupos de igual tamañ o, comenzando
con aquellos que tienen el puntaje má s bajo, se dice que
el primer grupo de este tipo consiste en aquellos en el
percentil 1 (es decir, tienen puntajes superiores al 99%
de el gr "F y así sucesivamente hasta la parte superior
{;grupo que debería llamarse el percentil 11X1: por
razones técnicas, el procedimiento real utilizado solo
distingue 99 grupos, por lo que el
lo mejor que se puede hacer es conseguir en el 99 percentil.
Con estimaciones más pequeñ as de n umhem o fur cpider, el
grupo total se divide
z*
en diez daifes; de manera similar para cuatro qtiortiles, etc.
PERFECCIÓNI$1¥J' Principio de Marks: "El precio de la
perfecció n es prohibitivo". allíno son suficientes á rboles,
días o dó lares para eso. Los documentos legales y las
obras de arte tipográ ficas pueden ser excepciones, pero
la Declaració n o la Independencia tienen dos inserciones
hechas por el escribano, por lo que hay un precedente en
un caso legal. (Citado por Bliss.)
0ERri3RMAi'4CE CONTRATACIÓN El sistema de
contratar y pagar a alguien para que brinde servicios
(por ejemplo, educativos) en funció n de los resultados.
Se les puede pagar en términos del nú mero de
estudiantes multiplicado por el nú mero de equivalentes
de grado que alcanzan sus alcances. Ampliamente
probado en añ os 60, ahora es raro. La historia habitual es
que no funcionó o funcionó solo porque el personal del
contratista hizo trampa ("enseñ ando para el examen").
La situació n real fue que los mejores contratistas no
hicieron un buen trabajo de manera constante, pero los
resultados esperados de todos los contratistas no fueron
buenos Como ocurre con la mayoría de las innovaciones,
la falta total de sofisticació n (en la evaluació n) de los que
toman las decisiones educativas trató este resultado
como motivo para darse por vencido, en lugar de
contratar a los mejores contratistas, de los cuales
podríamos haber pasado a mejores métodos de
enseñ anza para todos.Consulte la regresió n a la media
para ver un ejemplo de la necesidad de cierta
sofisticació n al establecer los términos del contrato.
EVALUACIÓN DEL PERSONAL La evaluació n personal
generalmente involucraba una evaluació n de las habilidades
relacionadas con el trabajo, en una o más de cinco formas;
primero, la observació n crítica del desempeñ o del trabajo
por parte de observadores no capacitados pero bien
situados, por ejemplo, compañ eros de trabajo; segundo, la
observació n de juicio por supuestamenteobservadores
capacitados y ciertamente má s experimentados, por
ejemplo, supervisores, gerentes de personal o
consultores; tercero, medició n directa del pará metro de
desempeñ o laboral, en el trabajo, mediante instrumentos
calibrados (humanos o, por lo general, otros); cuarto,
observació n o medició n o evaluació n del desempeñ o en
simulacros de trabajo; quinto, lo mismo en papel y
pruebas de perk:I que examinan el conocimiento o las
actitudes relevantes para el trabajo. Estos resultados
deben ser (a) sintetizados; (b) relacionado con un
aná lisis de los requisitos del trabajo (la evaluació n de
necesidades). Estas habilidades son por lo general
mucho má s difíciles de dominar que las per-
ch calificació n de f‹›rmance, y por lo general se subestiman.
Por-
estaño ev.aluatit›n no estaño en vtilvos ético ct›nstraints eqn
el ix'ay en que se debe hacer', debe .también .imnx›lve una
dimensión ética sobre la cual se puntúa el desempeño de la
persc›n La importancia de que n'ill x'•irv' dependa depende de
la cantidad de autoridad y contacto interpersonal del individuo
que está siendo evaluado.
los enfoques coinmc›n Por ejemplo, el I.iilure a Pro--
vide .appropn.a te niveles ot un nonv mid ter los
evaluadores, golpe te nt Pvt(h legislación relevante, ‹›r .I general
fenr taf

anuncio- mt›uthi ng otros porque su uso implica el pecado


referre‹J en
ju4ge ndt que en \ e él n‹Jt judycd", conduce tu .In un 'mal *
fiyncss a x'oice la crítica cx'en si merecido; este problema (que
puede resolverse) requiere una atención sostenida e ingeniosa
Los .bles usan 4 en la evaluación del personal •irc rarel\'
basado en un trabajo serio
.a ndlvsis .i nd como consecuencia poder difícilmente guante .un
.preciso -
pjCttlrC^ t›f SOfTltjtJFle'S p4jrft)rfTla FlCtj /t!ft”t'dJ1ftlfft!Ii {!ff)*tlst's Otro error
común es poner stvle x'anables en es al- u.ation (forms o reportes, en
situaciones ix'hete no satis(actorv)

supenor perform.once. thev lv picall\' cpnn‹›t be used in cv.il


u.stitin bed.i me the ccirrc lations between•'een
su presencia .i nd p•tiod per(orm.i nce son simplemente St‹Ahsttc•il.
y son así nosotros .como ilegítimos '•›lu‹ahr›n
en la' piel Ctilc›r, ss'hich tit curso st.a tisticallv con h
c4oes
s ‹a ninguno dcsir.able .inr5 'ter indesir‹able Caracteristicas. “G u llt

Evaluación sin goles:


I'ERSON-AÑOSVer Nivel de esfuerzo.
mi
E@C “
Es un nombre de estañ o, que le dio respetabilidad médica. Se
ha dicho que la psicoterapia tiene un efecto placebo ‹*i///r‹'/y
(Frank); aEl diseñ o para investigar esta visió n presenta
desafíos interesantes. En la educació n y otras á reas de
servicios humanos, el efecto placebo es equivalente al
efecto Hawthorne, que probablemente explica la mayoría
de los éxitos con la innovació n.ciones. el es tan lícito
como el trato de cabecera, tan pulmonar como no se
atribuye a la propia serpiente-uil. Pero si somos honestos
acerca de que es só lo un placebo, ¿no se evaporará el efecto
placebo? No si se preserva el contexto carismático; “el
corazó n tiene sus razones que la Razó n no conoce.” No se
debe pensar que el efecto Ha'thome (o el efecto placebo un
poco menos general) son el resultado del entusiasmo o
chansma por parte del sumidero del proveedor del servicio.
Pueden ocurrir en su ausencia. Pero el entusiasmo puede
precipitar el efecto Hawthorne/placebo (Hip); es un caso
especial. Es probablemente correcto considerarEl efecto HQ
como e(feet u( las creencias del receptor del tratamiento,
pero entonces sería muy difícil demostrarlo). porque
ciertamente no es un efecto restringido a creencias
conscientes, y el inconsciente unos son duro para
establecer. Así que aquí se define sin referencia a la creencia.
PLANIFICACIÓ N (cv.valoració n en) Ver Evaluació n
Preformativa
ción
REQUISITO DE CONSTANCIA DEL PUNTO IPCRIEl
requisito de puntuación numérica, por ejemplo, pruebas de que
se ha ganado un punto, como sea (es decir, en cualquier
elemento y para cualquier Incremento de rendimiento en un
elemento en particular). debe reflejar la misma cantidad de
‹›( mérito. Está conectado con la definición de una escala
interna.a má s puntos que perfurm‹ance 9 «Aunque, es ir '.let
terror. PCR es un requisito muy severo y rara vez incluso
.intentado en ..ny serio '.av, por lo tanto, uno debería
normalmente brrc un Gr.ldc holístico como n'ell como una
partitura para que pueda proporcionar algunos protector
.contra Fallo de la PCR. El kev tc› PCk es la rú brica en la
puntuació n de ensayo/simulació n y la coincidencia de ítems
puedeexamenes de triple opcion -
IMT DE ENTRADA El problema de pointrs uf cntrs
es-el problema ior ‹he /i‹'ii/ ‹›f cuando contratar un e 'aluatc›r
en «1 pr‹›ject, y el yrc›hIem para el «'nlunti›r oi el p‹›int en el
flujo de tiempo de declsi‹›n» cuando /él debería »t«1rt
evaluando el
el evaluador formativo, el punto de entrada correcto para
propó sitos de evaluació n es el rápido irrix'ersihfe ‹tr‹'isioii
Aunque el personal no ha pensado en la posibilidad de revertir
algunas decisiones anteriores, el evaluador formativo debe
investigar tales posibilidades y el costo/valor de las
reversiones.
ANÁLISIS DE POLÍTICAS La evaluació n de políticas,
planes, propuestas; una cuasiciencia "normativa" (mejor,
"prescriptiye"), y muy estrechamente relacionada en su
actualidad y metodología con la evaluació n como
disciplina.
POLÍTICAS DE EVALUACIÓN Dependiendo del papel
de orte y del día de la semana, une !• lix.ely a t‹ uf
política como
‹Política de la primera vez—una intrusió n en la evaluació n
científica—o como parte del ambiente rc'n/fly v•...con
demasiada frecuencia, los evaluadores son demasiado
descuidados a la hora de incluir consideraciones relevantes. Si
se tiene una actitud favorable hacia la política, o se usa el
término sin connotaciones peyorativas, se incluirán
prácticamente todos los antecedentes del programa y los
factores contextuales en la dimensió n política de la evaluació n
del programa. La vista ictericia simplemente ‹lo define como el
conjunto de presiones que no son relacionado e ‹cc'ess tu y
enseñ a a la prueba; Otras materias son c‹›mpletelx'
compradas del currículo de 1Jth ‹y 12th grado en c›rder
to rz\‹Ake ruum fci Sin embargo, m‹›re enseñ anza
repetitiva de drill- lex'el h‹isics, cfc A strong caso puede
ser mnde que //nosotros
›'ersioo de MCT dc›ee mc›re h‹arm ‹h‹an good, thcugh z seri-
La versió n ‹›uñ ciertamente podría contribuir a la veracidad
de las ‹palabras en el ‹ackaging ‹›del diplum‹ato. Esto es
p‹›litics sin pav-uff. Pero c›nm‹anv tc‹asions, la "política" es
a'h‹ I yets et]uitv int› personal ex'aluntmn. •y r‹1cismo
fuera ci el
plan de estudios, aunque también mantiene la educación mural
fuera de las escuelas públicas, un ,zible handic.1p para el
s‹wvtv. Una mejor educación sobre y en la evaluación puede
ser la mejor ruta para mejorar, sin un líder político con el
chansma
“ para persuadirnos de cualquier cosa y el cerebro para
persuadirnos de ”mejorar nuestras habilidades de autocrítica.
POBLACIÓN (Stat.) El grupo de entidades de las
que se extrae una muestra, o sobre las que se
establece una conclusión. Originalmente
significaba personas, extensión obvia a las cosas
(por ejemplo, los objetos en la línea de producción,
que es la población de la que se toma una muestra
para los estudios de control de calidad);
extensiones menos obvias a las circunstancias (una
prueba de campo muestra la población de
circunstancias bajo las cuales se podría usar un
producto); extensiones aún más sofisticadas de la
teoría estadística a posibles configuraciones, etc.
BORTFTAYALTérmino semitécnico para una
evaluación-b\'-(rica)-descripción, {quizás utilizando
imágenes, citas, fotografías, poesía, anécdotas y
observaciones. VerEvaluación Responsiva, Evaluación
Naturalista.
BOSTTEST ¿Las medidas? realizado después del
"tratamiento", para obtener ganancias absolutas o
relativas (dependiendo de si la Comparación es con
puntuaciones previas a la prueba o curaciones del grupo
de comparación).
ENERGÍA(de una prueba, diseño, análisis) Un concepto
técnico importante involucrado en la evaluación de
diseños experimentales y métodos de análisis estadístico,
relacionado con la eficiencia. Está en tensión con otros
desiderata como el tamaño muestral pequeño, como es
habitual en los criterios evaluativos.
ENERGÍA PRUEBA Una prueba de velocidad, en la que,
por ejemplo, el número de respuestas correctas en un

tiempo determinado es importante.


PF'8SSistema de planificación y presupuestación de
programas La herramienta de gestión desarrollada por
MacK‹amara y otros en ForJ Motor Companv y llevada
al Pentágono cuando MacMamara se convirtió en
Secretaria de Defensa; desde entonces ampliamente
adoptado en otra alimentados• Yo y organismos estatales.
Ventaja principal y fealre: identificación de costes bv
/›r‹›año«en y no por categorías convencionales como payr‹›ll,
inventnr\', etc. Facilita la planificación racional con respecto al
programa
continuidad, mayor apoyo, etc. Dos problemas: en primer
lugar, con demasiada frecuencia (prácticamente siempre) se
instituye
en los procedimientos de contabilidad, ¿Qué
pTOgsignificau4
un
componente digno de ese nombre, por loTa que ti• gana en la
tonelada
decisión validez no ocurra En segundo lugar,s es muy
costoso de implementar y poco confiable en la
distribució n de gastos generales y nunca parece
ocurrírsele a nadie evaluar el problema y el costo de
cambiar a PPBS antes de hacerlo, un ejemplo típico de
no entender el punto central del todo. empresa. Cf. Meta-
cvJu- ation, Mission Budgeting.
EFECTO PRÁCTICO El ol bajo específico El efecto de la
práctica se refiere al hecho de tomar una segunda
prueba con elementos iguales o muy similares. dará
como resultado una mejora en el rendimiento,
incluso si no se ha producido ninguna instrucción o
aprendizaje adicional entre las dos pruebas. Después de
todo, uno ha hecho toda la “oi ;anización de sus pensamientos”
antes de la segunda prueba. Hay un efecto de práctica. lo cual
es particularmente importante con respecto a las personas
que no han tenido mucha experiencia en la realización de
exámenes; este efecto de práctica
simplemente se refiere a mejorar las habilidades propias
para tomar exá menes a través de la prá ctica, por ejemplo, la
capacidad de controlar el tiempo dedicado a cada pregunta
para comprender la forma en que funcionan varios tipos de
preguntas de opció n mú ltiple, etc. más grave es probable
que sea el efecto de la prá ctica. El
El uso de grupos de control permitirá estimar tr. la talla de
, el efecto de la práctica. perodonde no son posibles, el uso de
un }x›stdiseño solo para pruebas para algunos de los
experimentos grupo
• lo hará muy bien, ya que la diferencia entre los dos subgrupos
en la prueba posterior dará una indicación del efecto de la
práctica, cuál luego resta de las ganancias del grupo de post-
test solo para obtener una medida de las ganancias debidas al
tratamiento.
PJTEDICTIVO VALIDEZ Consulte Validez de constructo.
BREFORMATTVfi (evaluar ‹›n) Evaluación en la fase
de planificación de un programa; típicamente implica
recopilar datos de referencia, mejorar la evaluabilidad, diseñar
la evaluación, mejorar el programa planificado, etc. Véase
Evaluación.
PREORDINATE E¥'ALUATIONVer Sensible
ev sobre.
LANZAMIENTOS Las reglas son: (1) no te molestes

128
mano (o ut la ica versió n, ex'en como un
enviar)
tecnología suplemento-
Mertf. (2) no ahí a mano o ta resumen de la !techni-
documento cal. (3) No se moleste en entregar una
declaració n que diga cosas favorables y luego las
califique; ya sea que se elimine la calificació n o el
comentario favorable. (4) lssu@solamente una
descripció n bá sica del programa en sí má s una
declaració n general ú nica, por ejemplo, “Los resultados
no muestran como veterinarios y las ventajas o
desventajas de este enfoque, porque es demasiado
extrañ o para decirlo. kfay tener una conclusió n
definitiva en n meses.” (Esa es una versió n provisional;
en una versió n final, se elimina la segunda oració n).
PRUEBA PREVIA Normalmente se dice que las pruebas
previas son de dos tipos; diagnó stico y base. En una prueba
previa de diagnó stico, la funció n pedagó gica (salud, etc.) es
identiïv la presencia o ausencia de las habilidades previas
requeridas, o los lugares donde se debe proporcionar
instrucció n de remediació n. Estas pruebas típicamente no
serán como las pruebas posteriores. En las pruebas previas de
referencia, por otro lado, estamos tratando de determinar cuál
es el nivel de conocimiento (etc.) sobre el criterio correcto o las
dimensiones de pago, y por lo tanto debería ser emparejado
exactamente, por dificultad, con la prueba posterior. Los
instructores a menudo piensan que el uso de este tipo de
prueba previa tendrá malos resultados, porque los estudiantes
tendrán una "experiencia de fracaso". pensó un la materia del
curso, en cuyo caso se pueden hacer cambios muy
completos en el contenido, o se puede permitir
"desafiar", con
• Reducció n de costos para el estudiante y posiblemente
para el instructor. Ademá s, la prueba previa brinda una
excelente y muy deseable vista previa del tipo de trabajo
que se realizará , y si se revisa cuidadosamente en clase,
como debe ser, se ha proporcionado a los estudiantes
una definició n operativa de los estándares requeridos
para paso. Ademá s, se ha creado un clima bastante ú til
para que los estudiantes se interesen en debates e.irlY,
brindá ndoles la oportunidad de tratar de resolver los
problemas con su ingenio nativo, y luego explicando
có mo el contenido del á rbol co *.e!ps les fi*ttcr. En
muchos temas, aunque no uii, tl,is constituye •. muy
deseable prueba de la importancia del curso. Por
supuesto, tratar la prueba previa como una definició n de
los primeros
curso es probable que el contenido sea ú til para la enseñ anza
al prueba si uno usa muchos de los ítems triÞm el pretest en el
postest.
Pero hay momentos en que esto es totalmente apropiado; y en
general es muy sensato tirar artículos para la prueba
posterior de un grupo que incluye los elementos de la prueba
previa, entonces que, al menos algunos de ellos serán
reexaminados. Esto fomenta el aprendizaje del material
cubierto en la prueba previa, que sin duda debe ser excluido
del curso simplemente porque ya ha sido probado. Los
instructores que comienzan a dar pruebas preliminares de CO
también comienzan a ajustar su hinQ de té en un mor•. manera
flexible a los requisitos de una clase específica, en lugar de usar
exactamente el mismo material repetidamente Por lo tanto, el
uso de una prueba previa es unaexcelente ejemplo de la
integració n de la evaluació n en
, la enseñ anza, un caso de prc›redu•gos de evaluació n que
dan sus frutos tanto a través de efectos colaterales como a
través de efectos directos (que, en este caso, sería el
descubrimiento de que los estudiantes no son capaces de
aprender ciertos tipos de material del texto; notas
.y conferencias proporcionadas sobre ese tema.) Puntos
similares se aplican a detestando en otros campos, por
ejemplo, la salud.
PRECIO El costo cobrado (cobrado por el proveedor al
consumidor o cliente). por lo general, una pequeñ a parte
del costo real y, a menudo, má s que el valor real.
PROCESO EVALUACIÓN Usualmente se refiere a la
evaluació n del tratamiento (o evacuació n) por parte de.
mirándolo en lugar del resultado. Con las excepciones que
se mencionarán, esto solo es correcto si se establece alguna
conexió n (no se establece) entre las variables de proceso y
las variables de resultado, y nunca se verifica. el enfoque
más probable porque tales conexiones, cuando existen, son
relativamente débiles, transitorias y probablemente
irrelevantes para muchas nuevas conexiones. El caso clásico es
la evaluació n de los docentes mediante la observació n en el
aula (el procedimiento universal K-12), donde existen
conexiones utilizables en la evaluació n entre el
comportamiento en el aula y los resultados del aprendizaje,
aparte del problema de que la presencia del observador -
Produce un comportamiento de enseñ anza atípico, y el
observador es normalmente alguien•uno con otro
personal relativo conel '‹profesor que son
altamente propicios para el sesgo. (La evaluació n de
.administrators no es mejor.) Ciertos aspectos de proceso
lioutil 6e lo veía, como parte de una evaluació n, no como
un sustituto de la inspecció n de ‹resultados, por ejemplo,
su legalidad, su rr.or.alidad•, su utilidad,
implementació n del tratamiento y tampoco puede
proporcionarme pistas sobre la causalidad. Es mejor
usar el término evaluació n mediada para referirse a lo
que es
descń lx d en la oració n de apertura de esta entrada, una
evaluació n de proceso de permiso para referirse a chat ‹ Im
to the dir evalua- ció n de variables de proceso como parte
de una evaluació n generallo que implica mirar los
resultados. La gente a veces supone que la evaluació n de
procesos es el método adecuado cuando se realiza una
evaluació n formativa, un ejemplo de la falacia
homeopá tica ("use un proceso para evaluar un
proceso"). La verificació n de la adecuació n de la
bú squeda bibliográ fica cae dentro del proceso; buscando
lenguaje sexista; por la presencia de un sistema de
verificació n de control de calidad; sobre los costos
ocultos y las conexiones causales; o la ética de los
procedimientos de prueba; sobre la exactitud de las
reclamaciones de garantía; sobre la validez de los
instrumentos utilizados: estas son algunas de las
comprobaciones menos obvias del proceso. Algunas de
ellas conducen a cambios en la descripció n bá sica de la
evaluació n; algunos a cambios en los resultados o costos;
algunos terminan ase.g.
PRODUCTO Interpretado muy ampliamente, por
ejemplo, puede' usarse para referirse a los estudiantes,
etc., como el "producto" de un programa *ing; un
yrurm•s pedagó gico podría ser el yr‹xfiir/ de un
esfuerzo de Investigació n y Desarrollo.
EVALUACIÓN DEL PRODUCTO El tipo mejor
desarrollado de evaluació n; Consumer Jteporfs solía ser
el paradigma
. aunque se ha deteriorado significativamente en los ú ltimos
añ os. VerLista de verificación de evaluación clave,
Á rbitro. "Evaluació n del producto"en Sin Técnicas de
Evaluació n, ed. N. Smith, Sabio, 1981.
BROFES§IONALTSM, PROFESIONALIDAD Algunas-
'aquí por encima de la competencia mínima en una
profesió n, pero Ademá s del á mbito de la ética
profesional, existe un conjunto de obligaciones, por
ejemplo, mantenerse actualizado y autoevaluarse, que
deben respaldarse y contarse en la evaluació n del
personal.
PITOFIT Este término de la evaluació n fiscal tiene la
desgracia de connotaciones naturales para los
desinformados. La gravedad del concepto erró neo se
hace evidente cuando una organizació n sin fines de lucro
comienza a hacer presupuestos serios y descubre que
tiene que introducir algo que difícilmente puede llamar
ganancias, pero
'que hace el mismo trabajo de financiar una reserva prudente,
nuevos programas y edificios, etc (Eso llamadas eso "cn
ntn§ution a matgin", en su lugar.) La tarea de definir
prufitisessentiallv a

, filosó fico. Concedido que nosotrosdebe distinguir


bruto ganancia neta tiene
cubrir todos los gastos que
generales (por ejemplo, segur
o
ance y gastos de espacio) que mayo no deje ningú n beneficio
(neto) en absoluto, ¿qué debemos hacer con el costo del capital
de inversió n y el tiempo invertido cuando ambos son
proporcionados por un propietario/gerente o por donantes? Es
un propietario que•• "ganancia real"cubre su tiempo en el
tasa de $5 por hora realmente obteniendo una ganancia
o una pérdida cuando él/ella podría ganar $20 por hora
en salario? Si el ROI de la inversió n de capital es del 3%
en un mercado que paga el 10% de los certificados de
depó sito, ¿es esto "obtener una ganancia"?
aná lisis, la respuesta es No; pero
elel aná lisis habitual dice que sí. Eso es correcto para el
Servicio de Impuestos Internos, pero no para los
empleados que está n considerando una huelga. Como de
costumbre, el análisis de coet resulta ser
conceptualmente muy complejo, aunque pocas personas
se dan cuenta de esto; en consecuencia, los errores
graves son muy comunes. Si los edificios (o el equipo) se
han amortizado por completo, ¿debería uno deducir una
porció n del pago inicial del costo de reposició n
eventualmente necesario antes de obtener una ganancia?
¿Debería permitirse una recompensa por riesgo (o
pérdidas previas) antes de que lleguemos a “ganancias”?
El aná lisis de costos/evaluació n fiscal parece pre-
•cisar porque yo cuantitativo, como las estadísticas, pero
eventualmente
los problemas conceptuales/prá cticos a los que hay que
hacer frente y '
la mayoría de las definiciones actuales le dará n
consecuencias absurdas, por ejemplo, "el negocio es
rentable, pero no puedo permitirme mantenerlo en marcha".
PROGRAMA El esfuerzo general que dirige al personal
y los proyectos hacia algunos añ os (a menudo mal)
definidos y financiados. La evaluació n pragrara es el á rea
má s grande de evaluació n autoconsciente, aunque la
evaluació n del producto puede ser el á rea má s grande de
prnchce. Gran parte de este bloque se refiere a
problemas en la evaluació n prom.am; véase, por
ejemplo, Punto de entrada, control de polarizació n.
PROGRAMADO TEXTO Uno en el que el material se
divide en todos los componentes pequeñ os ("marcos"),
r.tubing a lo largo de una oració n en pá rrafos sei•rral,
dentro de los cuales se preguntan algunas preguntas.
sobre el m.itcri.it, cp por
dejando un espacio en blanco que el lector tiene que
llenar con la letra correcta, posiblemente de una serie de
opciones prox'ididas. Esta característica mt‹'raclii'e fue
ampliamente reclamada como una gran x'irtud en sí
misma. No tenía ninguno, pero también se empleó
mucho esfuerzo en el proceso de formular el contenido
exacto y la secuencia de los marcos y las opciones
proporcionadas.
Dado que el formato b'pográ fico no revela el alcance de ”
la prueba de campo y la reescritura (y, por lo tanto, contiene el
total ausencia de él), pésimos textos programados
rá pidamente inundados
el mercado (finales de los 50) y shuw'ed que la Ley de Gresham
es una locura muerto. Como siempre,los consumidores
eran demasiado ingenuos para solicitar datos de
rendimiento y la opinió n general era que los textos
programados no eran "simplemente una moda pasajera".
De hecho, los mejores no eran herramientas de
enseñ anza extremadamente poderosas. de hecho, "a
prueba de maestros" (una frase que no les ganó el cariñ o
de un grupo de consumidores). Lumsdaine para
establecer estándares, pero el fracaso de todos los
programas de capacitació n profesional para enseñ ar a
sus graduados habilidades de evaluació n serias hace que
no haya audiencia para los está ndares. Veremos si los
nuevos está ndares de evaluació n del grupo Stuffle-beam
sufren menos mejor destino
PROYECTOS Proyectos son oportunidades limitadas
en el tiempo, a menudo dentro de un programa,
PRCIJECTIVO PRUEBAS TI1\•se son pruebas con mes
respuesta; el Rorscha h ink6lut test es un ejemplo clásico,
donde se le pregunta al sujeto tu sav \+'lo que ve en la
mancha de tinta.
• La idea detrás de las pruebas preventivas es que serían
herramientas diagnó sticas ú tiles, y parece bastante posible
que haya médicos que hagan buenos diagnó sticos a partir
de pruebas proJcrtivas. Sin embargo, la literatura sobre la
validez de las interpretaciones de Rc›rschach, i e. thc›se n
L‹ich se puede expresar x erballv
.es inequívoco rules'ttir interpretaciones, cuotas no est‹ab1ish
ubst.antial x alidit\' El nú mero es \›nft›rtugytelv truc' uf many'
uther proJectix'e testy, que fallan en mostrar Oven test- volver a
probar rel iabilih, y mucho menos interjudpe reli‹a bilitv
(asâuminy ese bi‹ss compartido se rige por el diseñ o
experimental).
‹iltinc predic tix'e voliditv Of c.curse, th‹•v'rc .a hola de tun, ‹s nd

just ix•cause hay rio uhh t dnsss'ers


PROPUESTA EVALUACION' Sée TwwTiez.
• .a.
BRCFFOCOL Ver EvJuaMon Ehqueke ''
'PSEUDO—EVALUACIONI Ver evaluación ritualista,
Rn'tionalizntlon Evalunäon.
BSEUQO-NEGATIVO mi 'FECTO Un resultado o dato
que aparecemostrar que un ex'aluand está teniendo
exactamente el efecto equivocado. cuando en realidad no lo es.
Cuatro ejemplos paradigmáticos son: la Prevención del Suicidio
Oficina cuya creació n ció n es seguida inmediatamente por un
aumento en la tasa de” suicidios informados; el programa intercultural
escolar que se traduce en un fuerte aumento de la violencia interracial;
la Universidad
servicio de mejora de la docencia de la facultad cuyos
clientes puntú an 'peor que los no clientes; la
drogaprograma de educació n (o educació n sexual) que
conduce a la "experimentació n", es decir, a un mayor uso.
(Ver texto de Principios dios Prncficies a/Evo/«A- lton,
Scriven (1982): para el tratamiento de estos ejemplos.)
EFECTO PSEUDOPOSITIVO Típicamente, un
resultado que es consistente con los objetivos del
programa, pero en circunstancias donde los objetivos
son má s tontos O esta forma de lograr
elmi Ir ak es de hecho dañ oh Fuyo PS mi 'D o una
víspera
abrumador y tipo nocivo ä $ eeee ve7
caso: programas de "educación sobre drogas" cuyo
objetivo IO y obten
inscritos que dejen la marihuana y resulten en que consuman
cigarrillos regulares o alcohol, lo que resultará en alguna
reducción en (la mayoría) artificial) crímenes por muchas más
muertes de pulmón can- o, cirrosis hepática y accidentes de
tráfico. (Un ejemplo típico de ignorar la oportunidad costes y
efectos secundarios, es decir ixad GBE.)
PSICOMOTRICES (Blocm) Aprendidas musculares
habilidades.je la distinció n entre cognitivo y
defectuoso es fLOTACIÓN siempre agudo, por ejemplo, escribir
parece psicomotor pero es muy cognitivo también. \
Ps 'ZVALLAT‹ON COLÓ GICO, Psrc+iO-THzRA-
EVALUACIÓ N PETJTtC Ejemplos particulares de
prá cticas evaluació n, la primera a menudo principalmente
taxonó mica, la segunda a menudo principalmente predictivo.
Se aplican los estándares habituales de validez, pero rara
vez se verifican; pocos estudios sugieren queincluso la
fiabilidad es muy baja, y lo que hay puede ser
en gran parte debido al sesgo compartido. El término
"evaluació n" es a menudo
tu
'”J34
usado aquí en lugar de evaluació n.
CUALITATIVO (evaluació n) Gran parte de la buena
evaluació n (por ejemplo, de personal y productos) es total
o principalmente cualitativa. Pero el término a veces
significa "no experimental" o "que no usa el método
cuantitativo".oods of the sc›cial sciences", y esto ha
confundido el tema, sinre hay una tradició n y un componente
importante en la evah ació n que se ajusta a las descripciones
recién citadas pero es quaiif:fcfit'r. a saber, la tradició n de
auditoría y el aná lisis de costos son com[›o- cientes*. Lo que
ha estado ocurriendo es una convergencia gradual de los
contadores y de los científicos ci el uso de los o'hers'
métodos nH‹f el uso de algunos cualita- tcnicas tivas de
disciplinas humanistas y de bajo estatus Ciencias smñ al (ej.
etnografía). Obviamente la evaluació n requiere todo esto y
má s, y la dicotomía entre cualitativo y cuantitativo tiene
que ser definida claramente y vista en perspectiva o es má s
confuso que complicado.focos.
GARANTÍA DE CALIDAD, CONTROL DE
CALIDAD A
televisión de seguimiento evaluativo, que se originó en el
á rea de fabricació n de productos, pero que ahora se utiliza
para referirse al seguimiento evaluativo en el á rea de
prestació n de servicios humanos. Este tipo de evaluació n es
formativa en el sentido de que la lleva a cabo el personal
responsable del producto, o sus supervisores, pero es el
tipo de evaluació n formativa que es esencialmente
"resumen de alerta temprana", porque uno se esfuerza por
garantizar que el producto, cuando llegue al consumidor,
parecerá muy satisfactorio desde el punto de vista del
consumidor. Por lo tanto, el control de calidad no es en
absoluto como un tipo comú n de evaluació n
seguimiento, que es verificar si el proyecto está en el objetivo;
esa es una forma debasado en objetivos evaluación. El control
de calidad debe ser una evaluación orientada al
consumidor, es decir, al menos complementada con una
evaluación sin objetivos y basada en las necesidades.
CUANTITATIVO (evaluació n) Usualmente se refiere al
uso de la metodología de aná lisis y medició n numérica
de la ciencia serial o (rara vez la contabilidad. Cf.
Cualitativa.
“ CUARTIL (Estadístico) Véase Percentil.
DISEÑ O CUASI-EXPERITIVO|\MENTAL (Término
debido a Don‹zld C.zmpbell) Cuando no puedo realmente
hacer un rnii‹f‹›yt iillu‹'nfi‹›ii c›f sujetos al control y grupos
experimentales,
‹rr no puede arreglar que todos los sujetos reciban el
tratamiento al mismo tiempo, nos conformamos con el
siguiente mejor para el diseñ o cuasi-experimental, donde
tratamos de simular un cierto experimental diseñ o por
cuidado, recoger a alguien o a un grupo del "grupo de
control" (es decir, aquellos que de hecho no obtuvieron
el tratamiento t) que coincide muy de cerca con el
rendimiento experimental hijo/grupo. Luego estudiamos
qué sucede a y tal vez a nuestros grupos de
"experimentador" y "control" como si
H. Dconfigurarlos al azar. Por supuesto, el problema es que
las razones (causas) por las que el grupo experimental de
hecho recibió el tratamiento pueden deberse a que son
diferentes de alguna manera que explica “la diferencia en
los resultados (si existe tal diferencia), mientras que
nosotros—no haber sido capaces de detectar ese diferencia
—voluntad pensar la diferencia en resultado se debe a la
d4ferencia en el tratamiento. Por ejemplo, se ha
argumentado que los fumadores pueden tener una
tendencia a la irritabilidad pulmonar, una irritació n que
encuentran que se reduce un poco a corto plazo al
fumar: y puede ser su irritabilidad, no fumar, lo que
vields la mayor incidencia de cá ncer de pulmó n. Só lo un
"experimento verdadero" podría excluir esta posibilidad,
pero eso probablemente se toparía con problemas
morales. Sin embargo, el peso y el r/eb de los cuasi-
experimentos en la investigació n del cá ncer
prá cticamente han excluido esta posibilidad. Ver Ex Post
Facto
QUEMAC Acró nimo de In approach tti metaevaluation
introducido por Bob Gowin, un filó sofo de la educació n
en Cornell, vv que enfatiza la identificació n de
suposiciones incuestionables en el diseñ o. (Preguntas,
Suposiciones no cuestionadas, Evaluaciones, Métodos,
Respuestas, Conceptos.)
CUESTIONARIO El instrumento bá sico para encuestas y
entrevistas estructuradas. diseñ o de ellos toma ma)o
habilidad y esfuerzo. Por lo general, dos largos, lo que reduce la
tasa de respuesta y la validez (porque fomenta respuestas
estereotipadas, omitidas o superficiales). ser probado en el
campo; por lo general una segunda prueba de campo
todavía descubre problemas, por ejemplo, de ambi-'quid.
Surgen pr‹›blcms interesantes con respecto a los
cuestionarios de evaluació n, por ejemplo, frente a qué
tipo de usar en la evaluació n del personal cuando la
respuesta en verso resulta ser t›ra 6 en una escala de 7
puntos, lo que proporciona una inadecuada
discriminació n al alza.
puedo usar cadenacr anclas; ‹ir expresar de otro modo
como .a clasificación

1.36
cuestionario; o proponer una metodología de
calificació n-o, :he-r• v ,^-sort), poniendo límites al n›‹m!
•i .ziJ• 7's o 6's de anv onr' respondió I; tu orrzi

instrucciones .ionarias o svst ns El primero y ú ltimo de t.


intrc'Juce
!css distorsió n donde los niveles de ment son realmente
altos; los Estados Unidos
Air Force una vez rar. en una rebelió n menor cuando adoptó
-la tercera alternativa. Véase también Escalas de calificació n,
Simetría.
RANOOM Un concepto "primitivo" o ú ltimo de
estadística y probabilidad, es decir, uno que no puede
definirse en términos de cualquier otro excepto circularlv.
Los textos a menudo definen una muestra aleatoria {de una
població n como una elegida de una manera que da
everr inaividii.1 yon la pop•t[ició n un e ,cal prubabtlitV de
ser elegido, pero uno no puede definir la "probabilidad igual"
sin fuera la referencia a la aleatoriedad o un cognado. Un
diStinr.tly trickvnoció n . No es de extrañ ar que las primeras
tres “tablas de nú meros aleatorios” resultaran haber sido
dibujadas porsus autores. Aunque supuestamentegenerado
(en completelx diferentes ceras)—b\' procedimientos
mecánicos y matemáticos—que cumplían con la
definición justa yi\'en, ‹1oc- tored int‹› no aleatoriedad, ej.
porque las páginas o columnas que tenían una
preponderancia sustancial de un dígito en particular
‹›r Se eliminó un déficit de un par de dígitos en particular,
mientras que nf cursos<• tales páginas deben aparecer en
aproximaciones a una lista completa cf. III combinaciones
posibles. Nr› tabla finita cdn hc• aleatorio segú n la definició n
anterior La mejor definició n ció n es rel.atlvi ti an‹1
pragmá tica; .a chulce es aleatorio conreg‹1er tu el x'ariable
X si no se ve afectado signlficantlv hv I ar‹1ble'• que
si¿nific.Intl}' afecta X. Por lo tanto, un troquel o corte de
‹irds ‹ r gire ‹›i el rf^uIette un hec°l es aleatorio ›•'con
respecto a
el interés ‹›t the t›!.a\'ers si el número que sale es
R. ie‹1 t‹› d‹› s‹› h ' '.Sri.files 'hich no están bajo la gripe t'n‹-
c° ‹ f the pI.Jx'ers' intere ts Tahles of r‹1ndc›m number .are
r‹1nr1c›m ‹›nl\' » on respect to ccrt‹air\ kind ‹›t bi.as (que c›ne
sh.‹full sta tc) ‹anlt ccrt‹1in range* ‹›f tamaño simple.
CLASIFICACIÓN, ORDEN DE RANE Colocando
indis'idu.Els en ‹in urc4cr, usr caly de mérito, ten la base ut
su rel.ctive [aerturm.ance' ‹›n (ts'pic.a 11s') .a prueba o
medida u obscr- i .itu›n Huh r‹ranking dcics not al!caw' ties
ie twci ur more
in‹li‹'idu‹a 1s Lo esh elmi Sammi corrió k (“cc1 tuyo esto.i”),
partl.al r.ink- mps rhu's, it mu\' then, in they lim:t cases, i
here there ‹arc l‹a roe numA'rs of tie•s .anc4 ‹a em .todos
los ›f ›grupos ›distintos,
I>
@jg 1 S;'
no ser diferente de clasificación
CLASIFICACIÓNUsualmente igual que clasificación
ESCALAS DE CALIFICACIÓN Dispositivo para
estandarizar las respuestas a las solicitudes de juicios
(tvpicallv evaluahve). Ahi hay
.ha habido algú n intento en el literatura de investigació n
para identificaciones el
nú mero ideal de pcint» en una escala de calificació n. Un
nú mero parcontrarrestar si t ndencv de algunos evaluadores
para usar el punto medio para todo, al obligarlos a saltar de
un lado a otro, se elimina lo que a veces es la ú nica
respuesta correcta. Las escalas con 10 o má s puntos
generalmente resultan confusas y disminuyen la
confiabilidad; con 3 o menos (Aprobado/No aprobado es
una escala de dos puntos), demasiada informació nció n se
tira a la basura Cinco y (especialmente) siete puntos se asienta
generalmente bien. Cabe señ alar que la escala AF es
semánticamente como vmrr'.etwc‹1l cuando se usa con los
puntos de anclaje habituales, ya que no dará una
distribució n normal (en el sentido técnico) de las
calificaciones para una població n en la que el talento /.• se
distribuye normalmente. .) Con + y — y valla-,
complementos sentados (A +, A,.X —,AB,B+,B,B—,BC .), se
llega a )9 puntos y con el douse + (dci capaz — ), tiene 29
pintas y los refinamientos se vuelven est.,.talmente
ritualistas. Tenga en cuenta que la traducció n de las
calificaciones de letras en nú meros, por ejemplo, para
calcular un promedio de calificaciones, implica suposiciones
sobre la igualdad de los intervalos (de mérito, entre las
calificaciones y sobre la ubicació n del punto cero, que
normalmente no se cumplen (LEj. Véase también
Cuestionario, Requisito de constancia de puntos.
RACIONALIDADVer Mejoramiento.
.RACIONALIZACIONi'4 Pseudo-Justificaciones,
generalmente proporcionadas ex }x st facto. Vé ase
Consonancia.
RACIONALIZACIÓN EVALUACIÓN Una evaluació n
es a veces perfc›rmcd para proporcionar una racionalizació n
fcr una decisió n predeterminada. Esto es mucho má s fá cil
de lo que parece, y muchos gerentes saben muy bien có mo
hacerlo. Si no tienen un prt gram derribado, contratan a un
pistolero, si no son elogiados o protegidos, contratan
<a dulzura, El en' n‹» y los evaluadores ‹ag•‹1in son traídos
por clientes que› los han trotado en la categoría equivocada y
el borde ea' discusiones ‹frs likclv to Lx' vergonzoso, anno‹'ing

13
o divertido, dependiente pan lo mal que necesitabas el
trabajo. (El “blanqueo” de Suchman fue un ejemplo).
PUNTUACIONES BRUTAS La puntuación real de una
prueba, antes de que sea
convertido porcentajes fntp, equivalentes de calificaciones, etc.
Investigación y Desarrollo RAD; el lic básico (iter- atîye)
proceso de mejora, por ejemplo, de materiales educativos o
productos de consurțier: investigar, diseñar y preparar,
probar ejecutar, investigar (evaluar) los resultados,
diseñar mejoras, ejecutar una versión mejorada, etc.
Normalmente es una calificación evaluativa, ya que los
puntos generalmente se otorgan para la calificación de
una respuesta, lo que significa que muchos datos (p. ej.,
puntajes brutos) son evaluativos.
es decir, el qu. .lńtańve Ciencias descansa sobre lo
cualitativo morir- línea c1.
RDDA E Investigación, desarrollo, Difusión (o Dis-
Seminal* •1) y Evaluación. Un acrónimo más elaborado
para el proceso de desarrollo.
REACTIVO EFECTO Un fenómeno debido a (un artefacto
o el procedimiento de medición utilizado: una especie de
artefacto de evaluación o investigación. Tiene dos
subespecies, efectos de contenido-reacción y efectos de
proceso-reacción. Las reacciones de contenido de la
evaluación incluyen casos en los que el evaluado toma en serio
una crítica en un borrador preliminar de una evaluación y
conduce a una mejora instantánea, por lo que “invalida” la
evaluación. Las reacciones del proceso de evaluación incluyen
casos en los que la mera ocurrencia{o incluso la perspectiva)
del material de evaluación afecta el comportamiento de los
evaluados, por lo que la evaluación a realizar no será tópica del
programa en sus estados preevaluados. El proceso rearńvit\' es
independiente de su contenido. Aunque reacńve iiiotsur ›ir›i/
no haberlo hecho anteriormente sido así» subdividida, la
distinción aplica allí y no sólo para la evaluación;' pero es
menos significativo. En ambos casos, los enfoques discretos
pueden ser apropiados para evitar la reactividad del
proceso;pero, por otro lado, la apertura puede ser un requisito ético
propio.
jardines. La apertura puede ser con respeto al contenido «
con respecto al proceso yr ambos. Ver Razones para la
evaluación. Eampe: Haw&ome ENeŁ
RAZONES PARA LA EVALUACIÓN Dos traseros
comunes son para iittyrøv‹• algo Iformative evaluación) y
para tomar varias decisiones prácticas ulimi algo (siimma-

13ú
evaluació n de tiye). Puro interés en determinarlos mentos
de algo es un tipo más complicado de evaluació n
suma{nafiva. (Lin- colns ex'aluation de los cinco generales
de los que eligió Ulises S. Grant es una evaluació n
sumativa del tipo aplicado (decision.mrientéd); .: la
evaluació n de ellos por parte del historiador
contemporá neo es pura investigació n de evaluació n
(orientada a la conclusió n), es decir, e. del segundo tipo.
Los dos son diferentes só lo en funció n, no
intrínsecamente).son también lo que podría llamarse
razones independientes del contenido para hacer una
evaluació n
por ejemplo, como una racionalizació n o excusa (para un
trabajo de hacha o para financiar un fax'orite) o para la
motivació n (para trabajar con má s cuidado o má s duro). En
el caso de excusa, la naturaleza del contenido del examen
debe ser conocida o arreglada con anticipació n.
por ejemplo, contratando a un conocido "asesino" o
"cariñ o". Se realiza una evaluació n ritual só lo porque es
necesaria. Otras razones, no totalmente independientes de
las anteriores, sonahiI\h', promoció n, ventaja política, un
aplazamiento (Tal hombre miente, es decir, para ganar
tiempo
DESTINATARIOS. Ver estafa -er, Efectos de
recuperació n.
RECOMENDACIONES En un sentido trivial, una
evaluació n implica una recomendació n implícita: que la
evaluació n
.y ser visto/tratado en el n'av apropiado al valor que WA5
d€'iCfTFiined a h a x ' e p o r th.ee\'aluahon. Pero en lo especi-
ic sense ‹›ften .assumeci .u sea apropiado donde
"recomendació n" es llevar a la comida "r‹'ii«'ili, -I
nc/espeluznante", las evaluaciones no pueden llevarlos a ‹x'r'i si
mueren. tal má s costlv.) Que en rev cdiotion las
recomendaciones son tuerca lw. vs pos••lhIe, t t •: gallina
evaluació n es posible, es r›hvious en medicina y pc›duct eval
°'inn; pero porquela ló gica no ha sido Bien pensado, se
supone ampliamente que es un signo de un coche de
diseñ o deficiente, una ausencia de humanidad cuando
las variaciones personales o del programa no conducen
a
ellos —o ex'en u cuando ellos.no le‹1c1 para garantizar.anteed-
to-be-
recomendació n exitosa. Pero hay algunas personas que son
irremediables en 1\' inc.›mpetent en un complejo biven
tarea ep tvachinb tn a “car zur.e' schocl, y ni siquiera el
pr‹›¿rt'ss t›f +. tance 'ill ,al*er that r}u.alitative (.act if it
m.»' alter tLi• pcicerit•a ye th.‹I can be tr.lined It is .a
x'erv yr.at e destyn Jecisio a in ot'aluatiun tt› «›mmit a
desiyn tu

discutir explicaciones, eso ma;' mere.tee costo •anc4 la


oportunidad
de falla hi liXD por ciento. Pero la mayoría de las
evaluaciones se derivan de algunas recomendaciones
ú tiles sin mucho esfuerzo. El principal obstá culo para
hacer má s que esto es que la remediació n requiere no
só lo conocimientos locales sino habilidades muy
especiales. Un alimentador de caminos no es un
mecá nico; un evaluador no es un solucionador de
problemas de gestió n.
EFECTOS DE RETROCESO Cuando un cazador
acorrala a un ciervo, él (sic) a veces se lastima el hombro.
Los programas afectan tanto a su personal como a la
clientela. El efecto es de importancia secundaria en
comparació n con lo que sucede con los venados o la
clientela, pero debe incluirse en la evaluació n del
programa. El personal se ve afectado, pero no es una
població n receptora.
REGRESAR›O« ro niE MEr.N Usted puede tener un
ruri de suerte en la ruleta, cebo no deseará ; su índice de
éxito retrocederá (retrocederá ) a la media. Cuando se
elige a un grupo de sujetos para un trabajo de
recuperació n sobre la base de calificaciones bajas en las
pruebas, algunos de ellos habrá n obtenido calificaciones
bajas solo por "mala suerte", es decir, el muestreo de sus
habilidades producido por (los ítems en) esta prueba
está en orden. hecho no típico. Si pasan por el
entrenamiento y se vuelven a evaluar, obtendrá n
mejores puntajes simplemente porque cualquier
segunda prueba (casi con certeza) resultará en que
muestren sus habilidades de manera má s impresionante.
Este fenó meno da un impulso automá tico pero falso a los
logros de los "contratistas de rendimiento" si se les paga
sobre la base de la mejora de los que obtienen
puntuaciones bajas. Si tuvieran que mejorar el puntaje
de una muestra aleatoria de estudiantes, la regresió n
dà irii a la media compensaría la regresió n a la media que
acabamos de discutir. Pero normalmente son llamados
para ayudar a los estudiantes que “má s lo necesitan” y
elegir ese grupo por testinp resultará en la inclusió n de
un nú mero que no necesita ayuda. (También e.xCluü e
algunos que â o.) Las pruebas mú ltiples o má s largas o la
adició n de evaluaciones de maestros (juez experto)
reducen esta fuente de error.
RELATIVISMO/SUBJETIVISMO Hablando en términos
generales, el Nuevo que no existe una realidad objetiva
sobre la cual el evaluador deba determinar la verdad,
sino solo varias perspectivas o «enfoques o respuestas,
entre las cuales la selecció n es bastante arbitraria o
depende de criterios estéticos y psicoló gicos».
consideraciones psicoló gicas má s que científicas. El
punto de vista de la conUa se denominaría naturalmente
como
absolutismo u objetivismo; en un sentido técnico usado en
filosofía, lo opuesto al subjetivismo se llama la doctrina del
realismo. La falacia ló gica fundamental que confunde
muchas discusiones sobre este tema es la incapacidad de
ver todas las implicaciones del hecho de que el relativismo
es una doctrina que se refuta a sí misma, es decir, "el
relativismo es verdadero". no puede ser más verdadero que
"ratix*.em es falso", y por lo tanto el relativismo
difícilmente puede representar envió una Gran Verdad, ya
que se refuta a sí misma. Una implicació n muy
importante de este punto para la prá ctica de la
evaluació n es la siguiente: en una situació n en la que son
posibles varios enfoques, metodologías o perspectivas
diferentes sobre un programa en particular (por
ejemplo) y todos son igualmente plausibles, es Se deduce
que cualquiera de ellos constituiría •una evaluació n
defendible. Lo ú nico que sigue es que dar ninguno de
ellos y la declaració n de que todos ellos son igualmente
defendibles, constituiría una evaluació n defendible. En el
momento en que uno ha visto que los enfoques
alternativos generales está n igualmente bien
justificados, aunque produzcan resultados
incompatibles, uno ha visto que ninguno de ellos puede
pensarse como só lido en sí mismo. só lo k*tisr la
afirmació n incondicional de cualquiera de ellos implica
la negació n de los demá s y esa negació n es, en tal caso,
ilegítima. De ahí que la afirmació n de cualquiera de ellos
por sí sola sea ilegítima. Si, por el contrario, las
diferentes posiciones no son incompatibles, ¡aú n deben
hacerlo! t›c dado para presentar una imagen completa de
lo que sea que se esté evaluando.
.ado En ninguno de los dos casos, entonces, es dar uno
solo de estos
perspectivas defendibles. En resumen, las grandes
dificultades deestablecer una conclusió n de evaluació n
por comparació n con otras no puede evitarse eligiendo
arbitrariamente una, sino só lo probando la superioridad
de una o incluyendo todas como perspectivas, término
que, usado correctamente, implica la existencia de una
calidad que es só lo parcialmente revelado en cada vista.
Así convierte informes incompatibles en
complementarios, es decir, convierte el relativismo en
objetivismo. Simplemente dando varios relatos
aparentemente incompatibles en
.un evaluador es incompetente; mostrando có mo
puedenser reconciliados, es decir vistos como
perspectivas, también se requiere. (Si no
(Creo que uno tiene razó n). La presuposició n de que hay una
sola realidad no es arbitraria, como tampoco lo es la
suposició n de que el futuro será algo así como el pasado; estas
son las verdades petroleras mejor establecidas ahuut
el mundo. . Determinismo fue igualmente bien establecido y
ahora hemos tenido que calificarlo ligeramente debido al
Principio de Incertidumbre. Todavía no nos hemos encontrado
obtuve razones para calificar los supuestos del realismo y la
inducció n (los nombres técnicos de los dos mencionados
anteriormente).
Como fin práctico de estas consideraciones, debe ser
reco que incluso las evaluaciones basadas en ú ltima
instancia en "simpleslas preferencias fi pueden ser todavía
completamente objetivas. Hay que distinguir claramente
entre el hecho de que la base ú ltimaEl mérito en tales
casos es la mera preferencia, en la que el efecto es la
má xima autoridad, y la falacia de suponer que el sujeto
debe ser, por lo tanto, la fuente ú ltima de autoridad
sobre los efectos negativos de cualquier cosa que se esté
evaluando. Incluso en el dominio del gusto puro, es
posible que el sujeto simplemente no haya investigado
correctamente la gama de opciones, o que no haya
evitado los efectos de sesgo de las etiquetas y la
publicidad, o las recomendaciones de amigos, por lo que
el evaluador puede
ser capaz de identificar competidores críticos que superan el

• asignaturas candidato favorito, m tennis of//ie si‹#jrc/'s ini'ii tnste.


Y, por supuesto, identificar Best Buys para un individuo
implica una segunda dimensió n (costo) que el evaluador
a menudo puede determinar y combinar de manera má s
confiable que el aficionado. En el momento en que nos
alejamos un poco de las á reas donde la superioridad es
unidimensional, instantá nea y depende en gran medida
del gusto —esencialmente las á reas preevaluativas, ya
que no es la superioridad sino la mera preferencia lo que
se juzga—, entonces encontramos que el sujeto comienza
a tomar decisiones. errores de síntesis al juntar dos o
tres dimensiones de preferencia (halo o efectos de
secuenciació n, por ejemplo), o al extrapolar a gusto
continuado; errores que todo evaluador puede reducir o
eliminar mediante un diseñ o experimental apropiado, lo
que a menudo lleva a una conclusió n muy diferente de la
que se había formado el sujeto. Un paso má s allá , y w'
cuestió n de si las variaciones de rendimiento entre
productos superan las variaciones de preferencia entre
consumidores. Las enormes variaciones en la preferencia
pueden ser completamente borradas por la tremenda
superioridad de un solo producto sobre otro, de tal manera
que "punta" tanto en varias dimensiones a las que todos los
demá s les otorgan un valor significativo.consumidores
relevantes, que incluso los gustos extravagantes
(ponderaciones) de algunos de los consumidores con
respecto a algunas de las otras dimensiones no pueden
elevar ninguno de los productos de la competencia al
mismo nivel de puntuació n total, incluso para aquellos
con gustos atípicos. Por lo tanto, las enormes diferencias
interpersonales en las preferencias de nll tln• ri•levatit
sí que demuestran el relativismo de las ‹r•nliiatiotis que
dependen de ellas. Ver pec-

FIABILIDAD (Estad.) La confiabilidad en el sentido literal


es la coherencia con la que un instrumento o una persona
mide lo que está diseñ ado para evaluar. Si un termó metro
siempre dice RI grados centígrados cuando se coloca en
ebullició nagua destilada a nivel del mar, es 1IXI%
"confiable", aunque inexacto. Es ú til distinguir la
confiabilidad test-retest (el ejemplo que se acaba de dar)
de la confiabilidad entre jueces (que se exhibiría si varios
termosímetros dieran la misma lectura). Hay muchas
pruebas psicoló gicas que son confiables test-retest pero
no entre jueces. es decir, interadministrador) confiable:
lo contrario es menos comú n. En el sentido general,
confiabilidad significa lo mismo que el término técnico
validez; diríamos que un termó metro que marca OOO C
cuando debería indicar 1If› C no era muy confiable Esta
situació n confusa podría haberse evitado fá cilmente
usando el término "tonsistencv" en lugar de introducir
un uso técnico de confiabilidad, pero eso fue en los días
en que )argon se pensaba que era un signo de
sofisticació n científica. Tal como es, la fiabilidad lo es.
una condició n necesaria pero no suficiente para la
validez, por lo que vale la pena verificarla primero ya
que en su ausencia la validez no puede existir.
(Desafortunadamente, hay una excepció n técnica hvprr a
esto).
FIABILIDAD (de evaluació n) Una cantidad en gran
parte desconocida, fá cilmente obtenida ejecutando
réplicas de evaluaciones; ya sea en serie o en paralelo.
Los pocos datos sobre estos dejan en claro que la
confiabilidad (aparte de los efectos espurios tales
.como compartido sesgo) no es nc hI¿•h. El utilice los ejercicios de
calibració n c›i
y chetklisti y evaluadores capacitados pueden mejorar
esto enormemente. Faul Diederich mostró có mo hacer
esto con la evaluació n de la instrucció n de composició n,
y ese paradigma se generaliza.
REMEDIACIÓN Una recomendació n específica para la
mejora, característica de, y ciertamente deseable en, una
evaluació n laxante en lugar de sumativa. Pero lata
formativa. ser ú til sin ninguna sugerencia de
remediació n, y es
en general más difícil (a veces completamente imposible) y
más costosa si apunta a la remediación. Ver
tambiénRecomendación.
REPLICACIÓN Un fenó meno raro en los campos de
estudios humanos aplicados, contrariamente a los
informes, principalmente porque las personas no toman
la noció n de pruebas serias para la implementació n (por
ejemplo, mediante el uso de un índice de
implementació n) como un requisito automá tico en
cualquier supuesta replicació n. Incluso el método de
replicació n está mal pensado; por ejemplo, si el
replicador debe tener algú n conocimiento detallado de
los resultados en el sitio primario. Dicho conocimiento
está seriamente sesgado; por otro lado, simplifica
significativamente las preparaciones para los rangos de
medició n, etc. Probablemente sea bastante importante
organizar al menos algunas réplicas en las que el (p. ej.)
programa que se va a reproducir se describa simplemente
en términos operativos, tal vez con la observació n
incidental de que ha demostrado "resultados
prometedores" en el sitio primario.
REPORTE ESCRITURA/GIV Una de varias á reas en
evaluació n donde la creatividad y OngÎflaÎiiÿ son
realmente importantes, así como el conocimiento acerca
de la difusió n y diseminació n. Los informes deben
adaptarse a la audiencia, ya que las necesidades del
cliente pueden requerir una evaluació n menor de sus
propias necesidades. Las versiones mú ltiples, a veces
utilizando diferentes medios, así como diferentes
vocabularios, suelen ser apropiadas. Los informes son
productos y deben verse en términos de KEC: probarlos
en el campo de ninguna manera es inapropiado. ¿Quién
tiene tiempo y recursos para todo esto? fl depende de si
está realmente interesado en la implementació n de la
evaluació n. ¿Lo escribirías en griego? No, entonces n'hy
iisstiiii‹' que no lo está s escribiendo en el «ytiirnl‹'Ht del
griego,
.en lo que respecta a sus audiencias?

1 16
INVESTIGAR El campo general de investigació n
disciplinar, que abarca las humanidades, las ciencias.
jurisprudencia, etc. La investigació n evaluativa es una
subdivisió n, no hay forma de distinguir otra investigació n
de la evaluació n (aparte del contenido) excepto
distorsionando una u otra. La "investigació n de evaluació n"
suele ser solo un nombre engreído para una evaluació n
seria; sería mejor utilizarlo para referirse a la investigació n
sobre la metodología de evaluació n, o investigació n que:
empuja hacia fuera lafronteras de la evaluació n, o en la
investigació n lcesf que implica considerable dificultad de
investigació n u originalidad. Cf. artes escénicas ve. Artes
creativas.
INVESTIGACIÓ N tMTEGRA7ION, INVESTIGACIÓ N
S\'NTTH-
SIS Ver Metanálisis.
EVALUACIÓN DE LA INVESTIGACIÓN Evaluar la
calidad y/o el valor y/o la cantidad de investigació n
(propuesta o realizada) es crucial, por ejemplo, para las
decisiones de financiació n y la evaluació n del personal
universitario. Involucra la distinció n valor/oierit
—"valor" aquí se refiere a los beneficios sociales o
intelectuales de la investigació n, "mérito" a su calidad
intrínseca (profesional). Si bien siempre hay algo de
juicio involucrado, eso no es excusa para permitir el
proceso de juicio, que generalmente no es demasiado;
uno puede cuantificar y objetar de otras maneras el
mérito y el valor de casi todos los resultados de la
investigació n para la evaluació n del personal. (La
solució n no está en el uso de Ciktioníndice.) .
CONJUNTO DE RESPUESTA Tendencia a responder de
manera parcular, independientemente de los méritos del
caso parcular. Algunos encuestados tienden a calificar
“todo muy alto en una escala de méritos, otros califican
todo bajo y otros ponen todo en el medio. No se puede
argumentar fuera de contexto que tales patrones son
incorrectos: hay muchas situaciones en las que
esos son exactamente las respuestas correctas. Cuando
estamos hablando
.sobre el conjunto de respuestas, sin embargo, nos
referimos a los casos en los que estos patrones rígidos de
respuesta surgen de hábitos generales y no de una
consistencia bien pensada.
EVALUACIÓN DE RESPONSABILIDAD Evaluació n que
se orienta a la identificació n del responsable(5) o grado
de responsabilidad. y por lo tanto por lo general el grado
de culpabilidad o ment. La responsabilidad tiene
causalidad como condició n necesaria pero no suficiente.
C ulpabilitv similar.arly

++ Hz
presupone responsabilidad pero implica ulteriores cc
'aciones de la ética. Los científicos sociales como la mayoría
de las personas sin experiencia en derecho o casuística
suelen estar totalmente confundidas acerca de tales
cuestiones, por ejemplo, suponiendo que ciertas
evaluaciones no deberían hacerse (opublicados) porque
”pueden ser objeto de abuso”. el abuso es culpable; pero yo
también es /9i/itrr publicar (profesional- calidad trabajo de
algunos principios {arie valor intelectual o social) (por
ejemplo, el caso de Jensen) Un tipo diferente de ejemplo
implica mantener a los maestros realmente malos en un
distrito escolar a cambio de la alternativa de intentar el
despido implica esfuerzo, no es popular entre los ahion y,
por lo general, sin éxito. La responsabilidad es de th•.
alumnos que son sacrificados a razó n de
?D por añ o por mal maestro; y esa responsabilidad es tan
grande que usted (el superintendente o la junta) tiene que
intentar eliminarlo porque (a) no tendrá éxito, (b) los
efectos puede ser uii hifauce gocd por ejemplo, puede haber
una ganancia en general moti 'a ció n incluso si vt›u pierde el
caso, (c) puede aprender có mo para hacerlo mejor la pró xima
vez. La evaluació n de las escuelas debería (normalmente)
hacerse só lo en términos de las variables sobre las cualesla
escuela tiene Control. A corto plazo y con frecuencia a largo
plazo, esto no incluye puntajes en pruebas estandarizadas. (Ver
SEP). La evaluación de las evaluaciones nunca debe hacerse en
términos de resultados, porque el evaluador no se
responsabiliza de la ejecución; pero debería hacerse en
términos de resultados i{implementado. Árbitro. Filosofía
primaria, Scriven, McC raw-Colina, 1066
EVALUACIÓN REACTIVA La aplicació n actual de Bob
Stake proarh, que contrasta con lo que él llama ex'aiuació n
”preordenada”, donde hay un diseñ o de evaluació n
predeterminado. En la evaluació n responsiva, uno toma
cualquier turnoarriba y tratos›vi)h como parece apropiado,
a la luz de la knuwn an6 envolvente intereses de las diversas
audiencias. El énfasis está en la n-ésima descripció n, no
probando El riesgo es, por supuesto, un ausencia de
estructura o de prueba válida, pero el intercambio es la
evitació n de el riesgo de a evaluació n predeterminada: un
resultado rígido y limitado de poco interés para las audiencias.
Véase Evaluació n, Metodología específica de la evaluació n,
Evaluació n naturalista, Evaluació n perspecti-tivismo
REGRESO SOBRE LA TARIFA DE INVERSIÓ N Una de
las medidas de mérito o trabajo en la evaluació n fiscal,
¡habitual!
como una tasa de porcentaje anual
RIESGOSI, EVALUANDO Se dice convencionalmente
que el enfoque clá sico de la expectativa en el que se
comparan los productos de la probabilidad de cada
resultado por su utilidad, convirtiendo así las
dimensiones bajas de riesgo y utilidad en una (de
expectativa) tiene ciertas debilidades Por ejemplo,
ignora el valor variable de rick en sí mismo para
diferentes iÎidivid ü als; al jugador le gusta, muchos otros
buscan minimizarlo. Sin embargo, uno puede poner una
funció n nsk-utility. A veces se critica el análisis de
expectativas con el argumento de que "la gente no piensa
de esa manera". La discusió n de las estrategias minimax
o sahsficing a menudo se presenta como un paso hacia
"un análisis má s sofisticado de la toma de decisiones".
Este tipo de comentario a menudo confunde la ciencia
descriptiva con la ciencia normativa. Minimax y
satisfactor son simplemente métodos sofisticados para
tomar decisiones. aunque pueden ser má s comunes, y
aquí se convierten en objetos apropiados para el estudio
de los científicos descriptivos (y la jerga
correspondiente). La ”gestió n de riesgos” es un tema que
ha comenzado a aparecer cada vez con mayor frecuencia
en los temas de formació n en planificació n y gestió n. Una
de las razones por las que las evaluaciones no se
implementan es porque el evaluador no ha visto que los
riesgos tienen un significado diferente para los
implementadores en comparació n con los consumidores;
un programa o política (etc.) que debe implementarse,
en términos de su probable beneficio para los
consumidores, puede ser uno que conlleve un alto riesgo
para los implementadores, porque su programa de
recompensas a menudo es radicalmente diferente al del
consumidor. (normalmente como resultado de una mala
planificació n y gestió n de un nivel superior) Dos
ejemplos clá sicos de Ossie son la clasificació n de
documentos como Top Secret, . y_la contratació n de
personal sobre el cual se tenga sospecha. En cada
situació n, el implementador obtiene
za ped b\' res'ie p.combustibles ejercicio JIX1 por ciento
comprensió n retrospectiva
.después de .un desastre si existe el menor rastro de .un
indicador negativo, .y en ninguno de los casos hay una
recompensa por asumir un riesgo razonable; en realidad,
nunca hay una revisió n p.fuel to lix›k .it tus grandes ganadores
En consecuencia, las utilidades del pú blico
Los neumá ticos de arco está n optimizados y, a menudo, se
invierten. El presente
politic.il-plus-medi•a ambiente en los EE.UU. mayo bc uno
para el que la configuració n de nsk el riad a la Presic4encia (o
la 1egisl.atura) es sri diferente de lo que se requiere para hacer
el Trabajo rib•ht de tu gu•ar.antee la elecció n de sus titulares

CE ”°
14fi
quienes fueron grandes candidatos.
DERECHO A f¢ N@W El dominio legal del acceso a
la información de las poblaciones impactadas; mucb
aumentó en car-
,ter período, por ejemplo, a través de la legislación de "archivo
abierto". Disminución en keagan perioci.
RETÓRICA, EL NZW El título de un libro de C.
Perelman y L. Olbrechts-Tyteca (Notre Dame, 19ô9),
que intentaba desarrollar una nueva lógica de
persuasión, reviviendo el espíritu de los esfuerzos
preramistas. (Desde Ramus (1572), la vista de la
retórica como el arte de la persuasión vacía e ilógica ha sido
dominante; El concepto de "análisis lógico", separado de la
retórica, es ramista) .en Evaluar con Validar Sabio, 1980), ben
causa de la medida en que las evaluaciones tienen,
ya sea intencionalmente o no, la función de
persuasión y no solo informar. TP.e Nueva Retórica surgido
del contexto de estudio del razonamiento jurídico donde se
obtiene la misma situación y fue mal reconocida, el mismo
impulso de reevaluación y nuevos modelos ha ocurrido en la
lógica (ver informaciónrmla logica, eds. Blair y johnson,
Fdgepress, 1980), y en las ciencias sociales con el
movimiento hacia la metodología naturalista. Todo es
parte de la reacción violenta contra el filósofo
neopositivista de la ciencia y la adoración del modelo
newtoniano/matemático de la ciencia. El destino de la
evaluación miente claramentecon los nuevos
movimientos.
ONDA EFECTOS Seeckle efectos
RITUAL (ISTtC) o SIMBÓLICO EVALUACIÓN Una
de las razones para hacer una evaluación que no tiene
nada que ver con el contenido de la evaluación (y por lo
tanto es diferente formativo y evaluación sumativa o de
racionalización.ción) es la función ritual, es decir,
hacer una evaluación porque se requiere, aunque
nadie tenga la menor intención de hacerlo bien o de
tomar en cuenta lo que se ahorra. Los evaluadores
son llamados con bastante frecuencia a situaciones
como esta, aunque ni siquiera pueden ser reconocidos
como casos de evaluación ritual por parte del cliente.
(Actualmente, la evaluación en el área de la educación
bilingüe es mayormente ritualista.) Es una parte importante de
las discusiones preliminares en la evaluación seria aclarar
exactamente qué tipo de implementación es.
planeado, bajo varias hipó tesis acerca de lo que el contenido
del informe de evaluació n podría ser; a no ser que, por
supuesto, , tiene tiempo de sobra, necesita el dinero y no está
engañ ando a audiencias remotas. La tercera condició n
esencialmente se aplica siempre. Ver también EvJuació n
Motivacional, EHect Reactivo.
ROBUSTEZ (Stat.) Las pruebas y técnicas estadísticas
dependen en mayor o menor grado de suposiciones,
especialmente acerca de la població n de origen. Los h:•
dependen de tales suposiciones, los •...' rr son robustos.
Por ejemplo, la prueba I asume z\orma!idad, mientras
que las estadísticas no paz'amétricas ("libres de
distribució n") suelen ser considerablemente má s só lidas.
Uno podría traducir “robusto” como “estable bajo
condiciones de variació n”. El concepto también es
aplicable y es má s importante en la evaluació n de
diseñ os experimentales.
‹y yo\ae\'aIuatiot\. Los diseñ os deben configurarse para
dar i;t‹]iitit‹• awers a al menos algunas de las i›/cst
iitt|›nrtaiit preguntas sin importar có mo resulten los datos,
un asunto bastante diferente de t!ieir rentabilidad, potencia
o elegancia (esta ú ltima es una especie de caso límite de
eficiencia o potencia).
La evaluación debe configurarse para "ir a la yugular", es
decir, obtener una respuesta adecuadamente confiable a la (s)
pregunta (s) clave de evaluación href, agregando los recortes
más adelante si / nada sale mal con Parte Una. esto afecta el
presupuesto, el personal y la planificació n del tiempo. Y
tiene ‹un costo al igual que la robustez en stahshcs;
por ejemplo, los enfoques robustos no será n lo má s ele-
gant o rentable si todo va bien. Pero la metaevaluació n
normalmente mostrará que se requiere un enfoque
minimax, lo que significa una evaluació n robusta.
ROL (de evaluador) El evaluador juega má s roles que
Olivier, o debería hacerlo. los principalesincluido

erapista/ confesor, educador, á rbitro, coautor “el


enemigo”. solucionador de problemas, jurv, juez,
abogado.
EFECTO RORSCHACH Una evaluació n
extremadamente compleja, si no se sintetiza con cuidado
y racionalmente en un informe de resumen ejecutivo,
proporciona una masa confusa de comentarios positivos
y negativos, y el cliente no calificado y/o fuertemente
sesgado puede fá cilmente «›i »‹ (“ver en”,
. r‹aticnalize from) tal teló n de fondo dondequiera que pc'rCeptinn s
/ él tenía originalmente.
RÚ BRICA Puntuació n nr comercio ‹›r (posiblemente)
clasificació n
kev piel una prueba. Término incluido en el campo de la
evaluació n de las composiciones de los estudiantes y
comú nmente se refiere a un intercambio de preguntas u
otras respuestas de ensayo.
PROMINENCIA PUNTUACIÓN
La prá ctica de rc'questing re- “
Es prudente (por ejemplo, al calificar las propuestas) usar solo
aquellas escalas que, sintieron, los influyeron má s
significativamente.
Examina la atenció n en las características más importantes de
lo que se está calificando y reduce en gran medida el tiempo
de procesamiento.
sAnsnc«vc Término de Herbert Simon para un
rommo'\ política de gestió n de elegir algo aceptable en lugar
de la ”mejor opció n” (optimizació n). Ver Riesgos.
ESCALA*' SerMedida.
BURLA DE TRABAJO Esta es la parte de una RFP o una
propuesta que describe exactamente lo que se debe hacer,
al nivel de la descripció n que se refiere a las actividades
como podrían ser vistas por un visitante a través de
métodos metodoló gicos especiales. habilidades o
perspicacia, en lugar de a sus objetivos, logros, proceso o
propó sito. “La declaració n del tipo de trabajo es una parte
importante para hacer posible la rendició n de cuentas en
un contrato,
.y es por lo tanto un g‹trt importante de t'}jg especificaciones en
un ItFfl t›ra propuesta
PUNTUACIÓ N Aslgr‹en¿ nú meros a un ex'aluand
(generalmente
.1 pcrf‹ rmanct'), usu‹1llv de una escala de intervalo, es decir,
uno en
›x hich Lhe puinta all ha 'e equal \'alzie Nú meros a la misma
hora
‹se usan como grados, con el compromiso de señ alar la
constancia, pero esto es engañ oso. el ‹alttmpt t‹› ct›nvertirlos
a nú meros, por ejemplo, tc› calcular
Los pines de 3€ deberían protestar 4 a menos que el punto de
construcció n se mantenga en 1‹'ast a un •i ›pruxim.atu›n ese

vx'ill no yo gano errores IU I


ment o investigació n, ya sea por r • aná lisis de los datos o
reconsideració n de la interpretació n de nueva fecha.
normalmente constituiría replicació n; pero hay casos
intermedios. A veces se usa para referirse a revisiones de
un gran nú mero de estudios; Ver Metaná lisis, Evaluació n
Secundariaación
EVALUACIÓN SECUNDARIA (Cocinero)' Reaná lisis de
original —u original más r, A—datos para producir un nueva
evaluació n de un proyecto en particular (etc.). Russell Sage
Foundation encargó una serie de t›c›uks en los que se
trataron evaluaciones famosas en este n'av, comenzando
con la evaluació n secundaria de Sesame Street de Tom
Cook. Extremadamente importante porque (a) les da a los
clientes potenciales alguna base para estimar la
confiabilidad de los evaluadores (en elcaso que se acaba de
citar, la estimación sería bastante baja, (s) da a los evaluadores
la oportunidad de ident{ficar y aprender de sus errores. Las
evaluaciones se han encontrado con demasiada frecuencia en
documentos fugitivos y, por lo tanto, no han recibido el
beneficio de una discusión posterior en "la literatura" como lo
haría un informe de investigación publicado en una
revista; .una debilidad en el campo. (Problema similar se aplica
al material clasificado). Cf. Metaevaluación.
CONTRATO SECRETO PARCIALIDAD En
projx›s.al. personal,
.y particu‹arlv evaluació n institucional y de programas de
formació n Los evaluadores de ticnlr a menudo son indulgentes con
el uso de t hey k: how that the rolrs ixafl ser invertido en ‹otra
ocasió n y ellos piensan o
tFI(U!t th.at si todo el mundo ve th.at. y actú a acordei•s!* “•'•' !
.todos salen oliendo a rosas.” Típico poco profesional
cc›nduct ivpical de la prr›frssion Un buen contrapeso
es'ould A• para calificar c•x'en uno en t$•-plazo validez de
sus apareamientos. Un control má s factible es el uso de extem•il
dnd/terIluminadores para vehículos recreativos de uso
general Ver Acreditació n.
SESGO DE SELECTIVIDAD. Surge en prcigr•im ex
aluation cuando la selvcticin ‹af control t›r experiment.at
los miembros del grupo está influenciada por un
unnv›ticccf conm•ctic›n Auth deem.able out- cr›mes
lrrc1‹*v'.int tc' stucJics es'con asignació n aleatoria. 11

control pri›up, the p‹assibiliti' c›f sv1ectit'itY bias reemeryes


c•vcn in your randorruzcd desi$•n tscu ”Problemas en el
análisis de S‹'1eCti vits' Blue”, B.arn‹›xv vt •a1 , Ev iluatlon
SWñ ies Reuters› it umum, s' 5, l98tL S.ate)
RANGO SEMI-IMTERCUARTIL (Sta› } H.todas las in-
intervalo entre la puntuació n que marca la puntuació n má s alta
del cuartil má s bajo o del primer cuartil (es decir, del cuartil má s
bajo del grupo siendo estudiados, después de haber sido
clasificados de acuerdo con el variable de interés, por ejemplo,
puntajes de exá menes), y el puntaje que marca el tup uf la
tercera quarhle. Esta es una medida ú til
del rango de una variable en una població n, especialmente
cuando
no es una distribució n normal (a*l\ere la ”desviació n
está ndar‹1- hon” normalmente se usaría). Equivale a
promediar elintervalos entre la mediana y los individuos que
son hasta la mitad de los extremos de la distribució n, uno
en cada direcció n Por lo tanto, no se ve afectado por ‹xtdities que
ocurren en el extremos de la distribució n, su principal
ventaja sobre la desviació n está ndar, ‹ventaja que retiene
incluso en el caso de una pcpul.ació n normal.
EVALUACIÓ N SENSORIAL Cata de vinos al finalizar
científicamente, las mejores reseñ as de restaurantes, el
informe de la Unió n de Consumidores en botella ›vater, nos
recuerdan la importante diferencia entre descartar algo como
una "mera cuestió n de gusto" y hacer una evaluació n mejor
valorada que no lo hace.
‹'Iiiiiinifl‹' dependencia de la preferencia, pero mejora la confianza
hilitv u( los juicios de preferencias, y mejora la ex
‹aluatix'ei n f e r e n c i a e j . p o r eliminando distractores
(tales como'• l• heIs), usando mú ltiples evaluadores
independientes y conjuntos estandarizados de rritena
SERVICIO EVALUACIÓN Ret 5eniice EvaluatiOtt,
¥'c›l 1, nts 1, Full 19Si, Center iur .he Studv of Services,
Sulte 4(fi, 1?al‹8 K St , KW , W‹ashinyton, DC 2ŒH5
SEP.M‹ ht›t› Ei ‹flu.atit›n Prt›file) Xn instrumento para e
'alu.atinb el pertt›rmaoce de sch‹»ls (y hcncv distncts,
princip‹a 1s etc ). i› hich lotiks ‹ml y at tht›se vat rabies the
schr›t›l controles Ver Evaluació n de responsabilidad.
SECUENCIACIÓ N EFECTO A través de la influencia del orc4er o
SESGO COMPARTIDO El problema principal con el
uso de la opinió n de mú ltiples expertos para la
validació n de evaluaciones es que el acuerdo (si lo hay)
puede deberse a un error comú n; ejemplos obvios y
serios ocurren en la revisió n por pares de propuestas de
investigació n, donde los panelistas tienden a reflejar las
modas actuales en el campo en detrimento de los
innovadores, y en la acreditació n. El mejor antídoto es a
menudo el uso de intelectualmente y no só lo
institucionallv exterior jung. radical Críticas O(
el campo La tnferencia de recuperabilidad la validez debe
salvar el ch.Msm del sesgo compartido. El significado es
evidente.abolladura, las .aplicaciones no lo son. El sesgo
compartido es la razó n principal por la cual la
coasistencia interjuzgada o entre los demá s, es decir, la
fiabilidad en el sentido técnico, no sustituye a la validez.
Un ejemplo típico ocurre en la acreditació n, cuando el
departamento de educació n vial es revisado (por
ejemplo, de una escuela secundaria) para la persona con
educació n vial en el equipo visitante. Hay poco consuelo
en el descubrimiento de que: (a) a ambos les gusta el
departamento, y el visitante no recomienda su abolició n,
aunque hay razones muy serias para dejarlo.tales
departamentos cuando el dinero es ligero, por ejemplo. no
reducen las tasas de accidentes. (b) un segundo panel
visitante está de acuerdo con el dictamen del primero sobre
la educació n del conductor (porque su dictamen
es'.como formado por un miembro más de .un egoísta; grupo).
Consulte Control de polarizació n.
EFECTOS Los efectos secundarios son el bien no
intencionado del programa o producto que
se está examinando.
A veces el término se refiere a los efectos ese estaban
previstos pero no formaban parte de los objetivos del
programa, por ejemplo, empleo de personal si en cualquiera
de los dos c.ise, la V mayo o puede no tener sido cx-
pectc‹J, pre‹Jictcd o .anticip.atec4 (un punto menor). En la Lista
de verificació n de evaluació n clave, se hace una distinció n
entre los efectos secundarios, incluidos los efectos estándar en
la població n no objetivo afectada.

SIGMA (Et. t ) crt't'k s\ mh‹ yo


n•amc para Stan-
desviació n dardo.
SIG NIFICANTE, SIG NIFICANCIA sobre.todo,
svnthe-
tamañ oCcyo c‹›nc1 usitin otn cx',ilti‹alion, m‹ax- ttC staci‹il o
la intervención puede ser considerable, por ejemplo, si no tiene
efectos en las direcciones previstas, que pueden ser ganancias
cognitivas o de salud; Puede haber empleado a muchas
personas, haber aumentado la conciencia general sobre los
problemas y producido otros beneficios. La ausencia de efectos
‹ommlI significativos también puede @ debido a la dilución de
los efectos de gcud en un }x›ol de programas deficientes
pru‹Jucing sin efectos: uno no puede inferir que se vislumbra
un nulo general para nulos individuales. Por esta razón, los
"diseños de agrupamiento" son mucho menos deseables que los
"diseños de división" en los que se realizan estudios separados
* muchos sitios o subtratamientos (ver Replicación, Meta-
análisis). Estadísticas omega y Glass' "Tamaño del efecto
estandarizado" son un intento de producir medidas más
cercanas. refl«ct Lrue importancia que las cuotas el nivel p de
latamaño absoluto de los resultados. Véase Importancia
estadística,Significado educativo.
SIVUL CIONES Recreaciones de situaciones tvpica •›
proporcionar una prueba realista de aptitudes o habilidades.
Ver Pruebas de Desempeño Clínico, Evaluación del
Personal.
PRUEBA DE SONRISAS (de un programa) A la gente le
gusta. Típico
ejemplo de sustitución de deseos por necesidades
INDICADOR SOCIAL Ver Indicador.
SOCIAL MODO CIENCIA L (de eve1 u..t on) El
(Yi‹aix'e) ›' es decir» ' esa evolución es una aplicación uf »tanñard
Metodología de las ciencias sociales Una mirada al esfuerzo
habitual del sc‹cnti»t social. une, 'gallina volcar una
evaluación, es suficiente tu aclarar 'hv esto es n.cinco. La
relación de este modelo de ciencia scTal conel* modt'l
multidisclplinarv muiti-trait multt-field (PM) implícito en m.1n\'
entradas En este x'‹›rk es como th‹at heW'ecn cl•1s'•ic •1l st•
1ti4tics ‹y cJecision thcon' th‹' I, ttvr is a suh- tanz‹al
yenor.Mhz.ation cal el primero; inx'‹›lx'cs metro. seis nuevo ¿Pie?
L'Arth Art,ñ¿, ‹1pp|lL'x ['ttc*r ttJ pF.1Ctl¿t1l tc1xL'1, b7tL# OS IO a lnrder
numbc'r ‹›t oth‹'r cT let i[›lines; flu/ docs n‹›t ink'.alid‹zt‹'
el tt›rTner r°e Evaluación
SUAVE (‹ippruoch tu evoluat ›n) 1-Usa la implementación
d.at.a ter de la prueba de sonrisas. S‹•e Duro.
ÚNICO FUENTE “Stälc- ‹›tu eny" tu ‹›ntr‹1ct es un
nltcrn- “ ‹lttve tc› “putting it c›ut t‹› hui,” \'1‹a puL°Iishing .an RFI* St›lr•
hc3rlFc!!^. es ‹›pun t‹› el° • bu•c th. t the' c‹›ntr.ac I ‹Oficial fr‹›m
la agencia puede permitir contratos a sus amigos sin
importar si el precio es excesivo o la calidad no es buena.
satisfactorio; en cambio es mucho má s rá pido, cuesta menos si
se tiene en cuenta el tiempo de preparació n de las RFP's
‹y propuestas en los casos en que a x'e Un gran nú mero de
estos se destinarían a una RFP muy compleja y, a veces, es
obligatorio cuando es comprobable que las habilidades y/o los
recursos requeridos está n disponibles de un solo contratista.
dentro del plazo necesario. Controles simples pueden
prevenir el tipo de abuso mencionado.
ESPECIAt.IST EVALUADOR Consulte Experto local.
ACELERADO (pruebas) También llamadas [›pruebas de
potencia o pruebas cronometradas; Estas pruebas tienen un
límite de tiempo (el tiempo que toma cada individuo
generalmente no se registra). É stos son a menudo
mejoresinstrumentos de evaluació n o predicció n que la misma
prueba lo haría sin límite de tiempo, generalmente porque el
comportamiento del cliente implica hacer algo bajo la
presió n del tiempo, pero a veces, como en las pruebas de
coeficiente intelectual, só lo como una cuestió n de empírica
hecho. Una prueba se define a veces como acelerada si solo
el 75 [por ciento termina a tiempo.
DERRAME (£•efectos) Consulte Efectos de goteo.
PATROCINADOR (de evaluación) iYhoever o
v.'cualesquiera fondos o organiza la financiació n o facilita la
liberació n de personal y sp.ice: denominado "instigador" en
KEC. Cf. Cliente.
APODERADOR Una parte interesada en una evaluació n e
¿ .1 político que apoyó el programa original.
ESTÁ NDAR(es) El nivel de desempeñ o asociado con una
calificació n particular ur "grado" en .a gi 'en un criterio o
dimensió n sentarse de logros; p.ej. El 80 por ciento de éxito
puede ser elS t y rd f‹›r paso el ›x'ntten pó rticoJn (dimensió n)
tel el dn ver's licencia tt' IA corte '•corr define un está ndar,
pero st‹1ndar c‹1n he gl›'‹ n in man-quantitative trading c‹›n-
textos, c. g bv yrot'iding exemplars/ as in I1c›list c grading, tel
t›m[›csiti‹›ns,1mples
DESVIACIÓ N ESTÁ NDAR (St‹1t) Una medida técnica
seguro ‹›f dispersió n, En .una distribució n normal, , Lout
tv•'‹› tercios de la' cachorro ila fi‹›n mentiras dentro un
stand•1ro desviació n r›f the menn, medi‹zn, ‹›r mode (que
son los s• me en este
«isc» ) La SD es simplemente la media de los cuadrados de las
de 'naciones, es decir, las c[istancias de la media.

ERROR ESTÁNDAR DE MEDIDA (St.at.)


Hay varias definiciones alternativas de este té rmino, todas
ellas en su intento de dar un elogio me.ining a la noció n de
la inexactitud intrínseca del instrumento, tvpicallv una
prueba
ESTÁNDAR S RE Onginallv, puntajes definidos como
viaciones del destete, divididas ñ ›' la desviació n stanJ•Jrd.
(Tamaño del efecto es un ejemplo.) Má s casualmente,
varias transformaciones lineales del ‹abcvo (puntuaciones
Z) tenían como objetivo evitar puntuaciones negativas.
PRUEBA ESTANDARIZADA Las pruebas
estandarizadas son unes con instrucciones estandarizadas
para la administració n, uso, clasificació n e interpretació n,
formas y contenido impresos está ndar, a menudo con
propiedades estadísticas estandarizadas, que han sido
›'aliJ‹ados en un largu > mple de un definido població n. Los
'son hola//y norma-referenciada, en el moi'ento, perolos
términos ‹ no son sinó nimos ya que .z están referidos al
criterio La prueba también se puede estandarizar. Tener las
normas (etc.) en un punto de prueba significa que está
estandarizado en un aspecto, pero no significa que sea una prueba
a la que se hace referencia /H fa noml en el técnicosentido;
"puede" (también) ser un criterio: en referencia, lo que implica
un diferente enfoque técnico para su construcció n y ndt solo
‹!Finalidad diferente e.
ESTANINAS (o partituras de estaninas) Si vuu son
peryerse t'nc›uth para di‹'ide n dJstributirin en nueve
partes iguales en lugar de diez (ver decil), son estaninas
c.filadas y las ranuras cortantes que dem‹ arc‹ate ellos son
c.archivado stanirze puntuaciones Thev
<son numerado desde el bcttom hacia arriba. Véase también
ESTADÍSTICA1 -ICA,NCE (St. t ) Cuando la dll-
preocuparse
'een
encia es prub.able' n‹›t debido tt› ch.ance El ”Iex'el ‹›f signrh-
c‹1ncv” dctermin‹w th dcbrcc c›f cvrt‹iintv ter confianza con el que
nosotros c.zn reliquia c›ut ch‹1n e (es decir, regla c›ut tht• ”m II
h›'p‹›tesis”). Desafortunadamente, sive‹1rg‹' s.amplr's son usrd r\
esLas diferencias de estaño se vuelven st.ahsticall\' significativas
aunque pueden no tener valor social, educativo o ‹›ther 'en .todas
las estadísticas Omeya proc ides a‹artial c‹›rrecti‹›nf‹›r esta C/
Interocula/ Diferencia. El litro‹1ttlre ‹›n el ”sibnific.onceprueba
CE Percentiles.
pre-
suponer cualitativas, y es de hecho un ejemplo de la
evaluación de medidas cuantitativas. Ver tambiénHipótesis
”Pruebas, Puntuaciones Brutas.
MADRE El texto de un ítem de prueba de opción múltiple
que precede a la enumeración de las posibles respuestas.
• ESTRATEGIA También llamada "función de
decisión" o "riesgo de respuesta". Un conjunto de
pautas (u opciones que pueden ser
———- , ‹ -oorviene en
elecciones tempranas, o incluso puramente exploratorias,
es decir, preliminares a las principales rhokœ.Véase
OpômWzüon.
S TIFICACIÓN Se dice que una muestra está
estratificada si ha sido elegida deliberadamente para
incluir un número apropiado de entidades de cada uno
de varios subgrupos de población. Por ejemplo, se
suele estratificar la muestra de estudiantes en las
evaluaciones educativas K con respecto al género,
apuntando al 50 por ciento hombres y el 50 por ciento
hembras Si uno selecciona una muestra aleatoria de hembras
para formar la mitad de
el experimental y la mitad del grupo control y una
muestra aleatoria de varones para la otra mitad,
entonces se tiene una “muestra aleatoria estratificada”.
Si estratifica en demasiadas variables, es posible que no
pueda hacer una selecció n aleatoria de sujetos en un
estrato en particular; puede que no haya ningú n
candidato elegible o solo uno. Si uno estratifica en muy
pocas o ninguna variable, uno tiene que usar muestras
aleatorias má s grandes para com-
pensar La estratificación sólo se justifica con respecto a
variables que probablemente int actúe con la variable de
tratamiento, y solo aumenta la eficiencia, no validité a menos
que lo haga además a usar grandes números, es decir,
abandonar las ganancias de eficiencia que hace posible: de
hecho, corre el riesgo de reducir la validez porque puede nu/
cubrir una variable clave (por ignorancia) y tu reducido el
tamaño de la muestra puede no cuidarlo.
EVALUACIÓN DE FORTALEZAS reserva en los
recursos disponibles, incluyendo tiempo, talento,
fondos, espacio, define el “rango de lo posible” y, por
lo tanto, es importante en la evaluació n de las
necesidades y la identificació n de competidores críticos,
así como en la formulació n de sugerencias de
remediació n. y evaluació n de la responsabilidad.
INVESTIGACIÓN DE ESTILO investigaciones de tipo Lwc;
ri//n•r investigaciones descriptivas de las
características reales
tics de personas en, por ejemplo, ciertas profesiones como la
enseñ anza o la n1anagin@ ‹›r investigaciones de las
correlaciones entre ciertas características de estilo y
resultados exitosos. El segundo tipo de investigació n es de
gran importancia para la evaluació n, ya que los
descubrimientos de correlaciones sustanciales permitirían
adoptar ciertos tipos de evaluació n sobre la base de un
proceso, queactuallvri solo se puede hacer
legítimamente mirando los resultados f (Sin embargo, la
evaluació n del personal estar de esa manera, incluso si la
correlació nns fueron descubiertos.) El primer tipo de
investigació n—un ejemplo típico es estudiar la frecuencia
con la que los maestros formulan preguntas en comparació n
con oraciones u ó rdenes declarativas—es pura
investigació n, y extremadamente difícil de justificar como de
interés intelectual o social a menos que el segundo se puede
hacer algú n tipo de conexió n. En general, la investigació n de
estilo ha arrojado decepcionantemente pocos ganadores.
(Realmente, el tiempo de aprendizaje es probablemente el
má s importante y posiblemente la ú nica excepció n). Sin
duda, las interacciones entre la persona, el estilo, la edad y el
tipo de destinatario y el tema. lTiatter previene cualquier
resultado simple; pero los pobresLos resultados de la
investigació n sobre las interacciones sugieren que las
interacciones son tan fuertes como para borrarlas en
recomendaciones muy limitadas. menció n». En su lugar,
debemos retroceder to' treahny positivo resulta como 1›ssffi/c*
r‹'iiIr‹Tf‹'s, no ›rufi#ñ /e /H‹firoturs ‹›t ifit'rit

É XITO Logro de metas defendibles. Un


*lem avaluativo, pero nuez. orbe ul el má s importante. Cf.
ñ4erit, Valor.
SUMATIVO EVALUACIÓN sumativo evaluació n
‹›fa pr‹›añ o‹1m (etc ) es c‹›inducida nt/rr finalizació n y t‹›r el
fx'neftt de »c›me ‹ it‹'riinl audiencia ‹›r tomador de decisiones
(ey fundy• agent›', hrstt›nan, o posibles usuarios futuros),
aunque m‹a›' sea ‹/‹›i/‹' h\' ya sea internos o externos
e›'aluat‹›rs o una mezcla F‹›r re‹1 toneladas cf rrc'dibilitv, es
mucho má s probable}' te› involv'‹' vx ttrnal t' 'aluaturh than
iaf‹›rm‹1tive evalualu•3ti‹Jn. No debe confundirse con el
resultado evaluación, hola
es 'imgl\' •1n t*\'alunti‹›n /‹›‹-‹/>‹*‹/ ‹›H resultados en lugar de
th‹an on pr‹wes'— que podría bt* ya sea f‹›rmahve o
sù mm,ahve (Así, la confusió n c›ccurs En la intrt›ducció n t‹› el
EI2S Eve/u- estándares de ación, 1980 Field EJiticn) 5hr›uld
not A• con- fusiblea'ith hot ist ic ev.liu. ti‹›n -— ma›' be h‹›listîç
‹›ranalítico.
LEGISLACIÓN SUHS£T Compromiso legal de cierre
automá tico de un programa después de un período fijo a
menos que se reembolse específicamente. Un
reconocimiento inteligente de la importancia de cambiar
la carga de la prueba y, por lo tanto, análogo a la
presupuestació n de base cero.
SUP5RCOGNTTTVfi El dominio de desempeño en
habilidades cognitivas (o de
información/comunicación) que es un salto cuántico
más allá normal niveles, por ejemplo, lectura rápida,
relámpago cálculo, dominio de la memoria. speedspeak o
fastalk, trilingüismo, estenotipia, taquigrafía. Cf. Hiper-

MÉTODOS DE ENCUESTA (en evaluació n) Ver


Evaluació n
Metodología específica.
SIMBÓ LICO EVALUACIÓ NOtra término para
Ritual-
Evaluación ística.
SIMETRÍA de indicadores evaluativos. Es un error
comú n suponer (o sin saberlo arreglar) que lo contrario
o la ausencia de un indicador de mérito es un indicador
de demérito. Esto se ilustra con la suposició n de que los
elementos de los cuestionarios evaluativos pueden
reescribirse positiva o negativamente para adaptarse al
requisito de configuració n de frustrar las respuestas
estereotipadas. Pero "miente con frecuencia" es un
fuerte indicador de demérito: mientras que "no miente
con frecuencia" ni siquiera es un indicador débil de
mérito (destacado). (Mérito destacado, es decir,
comportamiento encomiable, es lo que uno recompensa,
no "ser mejor de lo peor que podría ser".) Lo anterior es
un punto epistemoló gico sobre la simetría (relacionado
con la disunció n de virtud/supererogació n iii ética).
También hay asimetrías metodoló gicas, por ejemplo, un
ítem que solicita un Aegon sobre ausencias e. gramo.
"Estaba ausente a veces sin permiso" puede ser
respondido afirmativamente por los encuestados que a
menudo no estaban allí pero que observaron una o má s
de esas ausencias por parte del evaluado; pero "Rara vez
estuvo ausente sin nosotros" será marcado como "No sé"
por los mismos encuestados, ya que requiere
conocimiento que no saben.poseer. ›
SÍNTESIS (de estudios) La integració n de mú ltiples
estudios de investigació n en un cuadro general es un
campo que recientemente ha recibido una atenció n
considerable. Estas ”revisiones de
la literatura” no son solo evaluaciones en sí mismas, con —
resulta— alguna metodología bastante compleja y
alternativas viables involucradas en el camino hacia un
resultado final; pero también son un elemento clave en el
repertorio del evaluador, ya que proporcionan la base para
identifcar, por ejemplo, los efectos secundarios de los
competidores críticos y posibles. Ver Meta-andysis.
SÍNTESIS (en evaluació n) t. El proceso ‹›fcombin-
iztg z.sñ t'of calificaciones en varios dioteosi izrta avmra!!
e\'aluatton. Por lo general, es necesario y defendible, a
veces es inapropiado porque requiere una decisió n sobre el
peso relativo, a veces es imposible. Esas ocasiones
requieren dar só lo las calificaciones en las dimensiones
separadas. Es deseable exigir una declaració n lícita y una
justificació n del procedimiento de síntesis, ya que esto a
menudo expondrá : (a) suposiciones arbitrarias; )
aplicaciones inconsistentes. En la evaluació n del ejemplo
del profesorado, la mala ponderació n de la investigació n
frente a la docencia también suele estar má s cerca:1 en las
instituciones
cuya retórica reclama pantv; pero puede variar
ampliamente entre departamentos o entre cátedras
sucesivas en el mismo departamento. La evaluación del
trabajo del curso de los estudiantes mediante la
calificación con letras se cita a menudo como un ejemplo
de síntesis indefendible; De hecho, es una evaluación
sumativa perfectamente defendible, aunque no es
posible para la retroalimentación fcrmatija para el
estudiante. ”Síntesis por Sali • resumen” ilustra otra
trampa, ‹un maestro es calificado con oi-. 35 escalas por
estudiantes y
-el printt›ut solo muestra casos ‹›f estadísticamente significativos
salidas de los rahnys de las normas. Esto parece plausible-
. suficientemente ible, pero dado que las dimensiones no han
interpolado indepen- pendentlv v.aliddted, (‹ind are next
independent) nDt only ink r›lx cs se enfoca en stvle
ch.aracteristics que están siendo piraistd en ‹i /›ri‹›ri motivos,
pero también invt›lves all el confusiones de clasificación en
lugar de calificación. La importancia tit s\ nthesis correcta
es ilustrado tratar " psiquiatría puede el
personal en el ñ nix'ersit Y o M i n n e s ‹ › t a ' h o
b o c . a m e l u g e n d a m ' tor rcqucshnp una subvenció n
para que un estudiante de posgrado pueda ” tirar de su
investigació n resultados tob•éter”, su ”investigació n.arq
resultados” siendo •a
completo colocar teta ta ped grabaciones taf flve ve.son c;f terapia *
F.valoradores que.están tentados a t‹› ”título el yo.actú a sobre tu el'
de•cisit›n-marcadores. ‹y deja entrar a lli‹nii. Toma los juicios de valor”
debería recordar eso eval.ati‹ins ‹son interpret.atit›ns th.at '
' iulrc aceite el ptt›fe»sional habilidades en el repertorio, <a
ciencia-
el papel de tist dobs n(›t cnd con t›bserx'atic›n ‹y mc•isiiremcnt
Suma ponderada la síntesis es síntesis lineal y por lo general
funciona bien. En raras ocasiones, como en la evaluación
de postaciones de tableros backgaitimon o en la
evaluación de patentes en el MMPl, necesitamos reglas
de síntesis no lineal. La síntesis es quizás la
. Deje que la habilidad cognitiva en evaJuatio, n; cubre la
evaluación invocada por la frase "equilibrada". juicio"
como así como manzanas y naranjas dificultades. Sus primos
aparecen en el seno de toda actividad intelectual; en
ciencia, no solo en teorizar e identificar la presencia de
una construcción teórica kom los datossino en síntesis de
investigación. Enevaluación, el deseo de evitar se
manifiesta sí mismo en laissez-faire evaluación extremo
formularios de El enfoque naturalista. Oponerse a la síntesis
final es a menudo (no siempre) oponerse al juicio de
valor. en sí mismo y cercano a valuephobia.
SÍNTESIS también puede referirse al proceso de
reconciliació n
mú ltiples evaluaciones independientes. En este sentido, es un
proceso muy abusado y de gran importancia. e, yo [dr Las
evaluaciones independientes deben ser enviadas al cliente
pri‹›r a la sesión de síntesis grupal, los resultados finales
son muy diferentes a aquellos donde no se cumple este
requisito. propuesto (por la necesidad de luchar por una
conclusión ya "pública" •). VerDiseños Paralelos, Convergencia.
ANÁ LISIS DE SISTEMAS El término se usa
generalmente en forma intercambiable con enfoque de
sistemas y teoría de sistemas. Este enfoque coloca el
producto o programa que se está examinando en el
contexto de un sistema total. Aná lisis de sistemasvsis
incluye .3 Una investigació n de có mo interactú an los
componentes del programa/producto que se está evaluando y
có mo entorno (sistema) en el que el progrsoy/el producto
existe
.efecto El ”tot.al svstem” no está claramente definido, varía
de •z institució n particular tc› el universo en general, por lo
tanto El enfoque tiende a ser una mera orientació n más que
una f‹›rmula y los resultados ‹›t Su uso r‹1nye desde lo abismal
trim ial t‹› dc'ep insights (ttef C \\' Churchman, The Desigu
a(Sistemas de consulta .
Evaluació n de tecnología de TA Una evaluació n,
particularmente con respecto al impacto probable, de
tecnologías (usualmente nuevas) Discutido con má s detalle
en Tecnología
OBJETIVO POBLACIÓ N Los destinatarios previstos o
consumidores Cf. impactadoPoblació n.,
TAXONOMÍAS Clasificaciones, sobre todo las
taxonomías de Bloom de los objetivos educativos, una
gran cantidad de literatura ha crecido en torno a estas
taxonomías, que son bastante simplistas en sus
supuestos y excesivamente complejas en sus
ramificaciones. Pero un arte ú til para un diseñ o de
evaluació n.
PROFESOR EVALUACIÓN Los profesores no
siempre están maestros (a veces son investigadores, y a
veces simplemente fracasos) y no todos los maestros están
en el acultv (por ejemplo, administradores, consejeros y
enfermeras). Los "maestros" son normalmente personal
que se supone que debe enseñ ar pero puede tener otras
funciones Por lo tanto, la "evaluació n de los docentes"
requiere má s que simplemente evaluar su enseñ anza (ver
Evaluació n del personal, Investigació n de estilos). Primero
paso, requiere identificar los otros
deberes y ponderarlos en relació n con la docencia. La
evaluació n de la enseñ anza misma requiere evidencia
sobre: (a) la calidad de lo que se enseñ a (su correcció n,
actualidad y amplitud); (b) la cantidad que se aprende; (c)
la profesionalidad y ética del proceso de enseñ anza. La ética
se refiere, por ejemplo, a la justicia en la calificació n y la
evitació n del racismo, favoritismo y crueldad; la
profesionalidad se refiere a la posesió n y el uso de
habilidades apropiadas en, por ejemplo, la disciplina, la
construcció n de elementos de prueba, en ortografía y por
escrito en una pizarra o boleta de calificaciones.sorpresa,
primero, la profesió n no incluye la mayoría
de los whR'b*t›es en cursos "mathcxJs", porque poco se ha
validado. (El tiempo se habría dedicado mejor a tratar de
mejorar la competencia de los profesores en la materia o en
las pruebas). En segundo lugar, la profesionalidad no
incluye la obligació n de tomar talleres sobre nuevos
materiales/teorías/enfoques de la enseñ anza, sino la
obligació n de autoexaminarse constantemente, por
ejemplo, utilizando cuestionarios de los estudiantes,
obtener puntajes siempre que sea necesario. posible, los
maestros podrían evolucionar en el amc^urtt de ie.am-

hluul-¿rush yo y tardío -‹ r‹ritos I (es decir, compuesto por al azar


s‹amplin$ frtim ‹a lar}ie item pool n'ith external v•alidatit›n)
Nunca deberían ex alu‹ate'd en el pcrf‹irmnncc Gif su estudiantes
cuando el nivel de entrada y apoyo no está controlado Dec
Synthesis, Re( Handbook o[ Enciilly Evaluation, ed.
}.av Millman (J1951)
yo•1seguro de qué es realmente tau h ' •f teshng
learning in the d‹1main abc‹Jt which conclu. .. será o
necesitará ser borrado Pruebas de un programa de lectura
que solo usa palabrasac tualli' cubierto tn .s voluntad dar una
imagen falsa Antiguo Testamento leyendo habilidades no es "enseñar
para el examen", esta situación no
ser impropio en el caso extremo en que la enseñanza abarque todo el
dominio.

PRUEBA SABIA Dicho de un sujeto que ha adquirido sub-


habilidades sustanciales en la toma de exámenes, por ej.
aprender a decir "Falso" en todos los ítems que dicen
"siempre" o "nunca", ‹›r (t‹› dar un ejemplo sofisticado)
aprender a no adivinar en los ítems que uno no tiene tiempo
para pensar, si un"corrección por adivinación" se está
utilizando, pero a dc› sc› si no lo está
TEORÍAS Relatos generales de un fenómeno sostenido,
generando al menos explicaciones y, a veces, también
predicciones, a menudo, pero no necesariamente,
resolviendo elementos teóricos que no son directamente
observables. Un ltixurv para el evaluador, ya que los\' no son
e 'en essenhal para explicaciones, y ex- las platicaïns ‹1 no
son 'esenciales para (99 por ciento de todas) la evaluación
ti‹›tis Es i° ‹a ¿r‹›ss sin embargo fTequen. blunder tu
support that “‹ nv n c*js un teoría' ‹›t aprendizaje con el fin
para evaluar la enseñanza ing línea d‹›cs n‹›t nee‹J tr km»'
cualquier cosa sobre Es decir* tronlc> en r›rJcr para
et”alu‹ate tipo electrónico 'nters, ex en t‹›m .atix el} , anot tinta
hzx semejante sé 'cornisa uften n 1‹›ei vender tic° t .a
sum›nati \ ¢' t*\'‹1lu.ación Ver Esquema ConrepNal.
ROL TERAPÉUTICO IOR MODELI DE LA EVAL-
UATOR La › er\ naturaleza de la situación de evaluación r
rr'afrs pressure» !hat s‹›mehmer• mold it intu a terapeuta-
g•ztler1t ‹›r ¿r‹›ug ther•zpv interacción, particularlv pero no
‹›arreglar verdadero' ›s'ith con respecto a tu ex temal e 'aluahon.
Primero, hayi> — en •uñh • c•ise - la barbilla Me siento agotada por
sus fuerzas, y necesito ayuda por desesperación, tal vez por
desesperación. dile c'c‹›nd. allí En el aur‹1 de excrhse y esuteric‹z
›x hich +urr‹›und' el ext c° rn‹a expulso Thirc‹, están los
tecnología me.i1 di‹4jin‹›ses <y mágico ritos prescrito bv el
la cena testimonial del cliente extasiado puede tener que
regresar a escondidas para echar un vistazo un añ o má s
tarde si quiere tener una idea general de si el retroceso/las
recomendaciones fueron correctas. (a) soluciones al
problema. ; (b) adoptado; (c) apoyado. Por lo tanto, los
estudios de seguimiento, lamentablemente carentes de
investigació n en psicoterapia (o evaluació n innovadora) y,
a menudo, devastadores cuando se realizan, son
igual de importante en la metaevaluació n.
DESCUENTO DE TIEMPO A Término de evaluació n
fiscal que se refiere al proceso sistemá tico de descontar
beneficios futuros, por ejemplo, ingresos por el hecho de
que son futuros y, por lo tanto, (independientemente del
riesgo, una fuente esencialmente independiente de
reducció n de costos futuros meramente probables).
A'benefits) pierden los ingresos que esos dineros
producirían si estuvieran disponibles ahora, en el
intervalo antes de que de hecho se materializaran. El
descuento de tiempo se puede hacer con referencia a
cualquier plaga o momento futuro, pero se suele hacer
intentar calcular todo en términos de valor presente
verdadero.
GESTIÓN DEL TIEMPO Un aspecto de la consultoría
gerencial con el cual el evaluador médico general debe
estar familiarizado. va desde lo trivial hasta lo muy
valioso. Los psicó logos, desde William James hasta BF
Skinner, se encuentran entre los que han hecho
contribuciones valiosas a él y produce ganancias de
producció n muy sustanciales a un costo muy pequeñ o
tanto para el evaluador como para los clientes o
evaluados. Fue J‹ames quien sugirió enumerar las tareas
a realizar en orden decreciente de enloy.a bilitv y
comenzando en el ottoiti, tal vez
ya que eso te da la mayor reducció n de culpa y la
mayor J;ain en r dañ o para la lista restante. (Referencias. James
McKay, The Mrnagrmriif o/ Time, Prentice Hall.)
SERIES DE TIEMPO Consulte Aná lisis de series
temporales interrumpidas.
CAPACITACIÓN DE LOS EVALUADORES Los
evaluadores, como los filó sofos ophers, ‹1 y a diferencia
de virtualmente todos los demá s ki»a de pros- sional, si se
considera que tiene la obligació n de kn‹atv ‹1 tanto ‹como
sea posible, a\›cortar tanto como sea posible Mientras es
fe‹1siblc ‹ n‹1 de hecho qulte comú n para c'v‹1luatt›rs a
especializarse en una metodología p‹articular o en particular
las ‹á reas temá ticas, el costo‹ de hacer esto siempre son
más bien c›bvirius en su urk Es *rub.af›ly d consecuencia de el
pariente yoiith de cv.flu.a ció n como a disciplina cosa la
bú squeda de illumin.sting ‹analr J•,ies de otras disciplinas es

},t;§ '"16f›
Todavía tan pruductix'e, pero la razón nther fur versattlit}'
a'iIl q]$$'Q\*$ pi th us, es decir, que le permite a uno
hacerlo mejor como evaluador en un rango tan amplio
gama de áreas temáticas como sea posible La
Universidad de Columbia solía tener un requisito de que
los estudiantes no podían ser aceptados para el
doctorado en
|phlIosuph\' a menos que tuvieran un título de yeso en otra
materia, y ‹En un requisito análogo podría ser bastante
deseable en e\'alu‹1tIun Sin embargo, se afirma
comúnmente que el grado preliminar debe ser en
estadísticas, pruebas y mediciones. El problema con ese
requisito es que deja a un encadenado prefertnna) blas
en la práctica eventual c›f el professic›nnl. Si bien la
habilidad en el método q›Jantitative Vies es altamente
deseable, no tiene que ser .1/›r‹'/i»imnn/ I
•capacitació n sobre gripe; la se]uencia inversa ma;' ser pre/er-
. '!r Una fó rmula simple para convertirse en un buen
evaluador es aprender a hacer todo lo que está
recomendado por el Kev E\.1Iuatlr›n Ch ckTlst . Aunque la
fó rmula es simple, el t‹1sk no lo es; pero podría ser mejor
especificar el nú cleo de la capacitació n en evaluació n en
este ›vav en lugar de enumerar com|:›etennes en términos
de 'su supuesto estado de prerrequisito »'con respecto a I'.›
et '‹1luatiori Las personas llegan a ser evaluadores de gocJ
por un gran nú mero de rutas L1f, y el retenido
probablemente se beneficiaría aumentando este nú mero en
lugar de estandarizar las rutas Ver E» Habilidades de
evaluació n.
INTERCONEXIÓ N RASGO-TRATAMIENTO A menos
›•'idyl› - u ü r*J término f‹›r interacció n aptitud-tratamiento,
aunque es •zct tt, tja' un término má s ‹preciso

Evaluació n maliva.
TRA NSCOG f'4ITI VE t°‹›m posec4 ‹ › l
S u p e r c o g i • i t i tengo un ru) ii, percognitiv•.
en particular, lo que sea que se esté aplicando o
suministrando, o realizado por, el grupo experimental que
se pretende distinguir ellos de el(los) grupo(s) de
comparació n. Usar una marca particular de pasta de
dientes o cepillo de dientes, leer un anuncio o un libro de
texto o ir a la escuela son ejemplos de tratamientos.
“EvaJuand” cubre estos, pero también productos, planes,
personas, etc.
TRANGULACIÓ N Originalmente, el procedimiento
utilizado por los topó grafos para ubicar ("fijar") un
punto en una cuadrícula. en evaluació n, nuestra
investigació n científica en general, se refiere al intento
de obtener un fenó meno de cana fijo acercá ndolo desde
má s de una ruta basada independientemente. Por
ejemplo, si desea determinar el alcance de los
estereotipos sexuales en una empresa, realizará
entrevistas a niveles reales, examinará manuales de
capacitació n y memorandos entre oficinas*, observará
las investigaciones y archivos del personal, analice las
coincidencias de trabajo/sexo/cualificació n,
descripciones de puestos, anuncios, colocació n, etc. En
resumen, evita depender de la validez de cualquier
fuente mediante el proceso de triangulació n. Nó tese que
esto es bastante diferente de observar mú ltiples
rasgos/dimensiones/cualidades para sintetizarlos en
una conclusió n evaluativa general. La triangulació n
proporciona una medició n “redundante” (realmente,
confirmatoria); no implica la fusió n de cualidades
ontoló gicamente diferentes en estimaciones de ni‹'rif
(valía, valor, etc.)
EFECTOS TRICXLE Efectos indirectos: los efectos
indirectos y dominó son sinó nimos aproximados.
CONSUMIDOR VERDADERO Alguien que, directa o
indirectamente, recibe los servicios, etc. proporcionados
por el evaluando. No incluya a los proveedores de
servicios aunque también son parte de la població n
impactada. ¿Es generalmente un grupo muy diferente de
la població n objetivo (consumidores previstos)?
CIERTO EXPERIMENTARUn “experimento verdadero”
o un “diseñ o experimental verdadero” es aquel en el que
los sujetos se emparejan en pares por grupos lo má s
cerca posible; como sea posible y el de cada p•air ur un
grupo es rniid‹›iiifi/ ossi,yii‹'J al control y el otro al grupo
experimental. Los nú meros má s flexibles y má s grandes
se saltan el paso de coincidencia y simplemente asignan
los elementos aleatoriamente a cada grupo. (Cf. diseñ o
ex post facto

'1b$
y cuasi-experimental diseñ o
SISTEMA DE DOS NIVELES (también llamado Multi-Tier
Syste.n, y HierarChical Sistema)A sistema de
evaluació n, a veces utilizado en la evaluació n de propuestas
(pero también con un potencial considerable en la
evaluació n de personal) donde se intenta reducir el costo
social total de la RFP ordinaria - sistema mediante el
requisito de dos rondas de competencia La primera , cuál es
el ú nico RFUd, implica estrictas res- sanciones de longitud
propia de la propuesta, que se supone que indica
)só lo el enfoque general y, por ejemplo, personal
disponible.
Estos breves bocetos luego son revisados por paneles que
pueden a través de ellos x'erv banquete, y un
pequeñ o nú mero de prom-
se identifican los ing. Las subvenciones se hacen
(algunas veces) IO los autores de esta "lista corta" de
licitadores con el fin de cubrir sus costos en el desarrollo
de propuestas completas. El número relativamente
pequeño de propuestas completas es luego revisado por
un grupo más pequeño de revisores o paneles de
revisión: el segundo nivel del sistema de revisión. Las
matemáticas de esto varían de un caso a otro, pero es
'orth lock king en un ejemplo. Supongamos que
simplemente apagamos el tipo habitual de RFI para
mejorar laciencia universitaria t8aclaing l‹at›oratones Nosotros
iTlight obtener de vuelta 6€0 o 1,2(J0 prop‹›sals, con un promedio
de quizás 50 o 60 páginas en longitud F‹›r cc›nvenIence vamos a
saber ellos uno 'era 50 páginas y e obtener '.,00 I ‹›f ellos.
1”h.Son 50,1 KJ paginas de propuestas tubeleer, .anal I'll, nJ
Qfipes de prf›posuls to be wri tten Incluso si Los revisores
pueden "maquillar" JtXl o 2IXl páginas ‹En h‹›ur, todavía lo
estamos escribiendo 2III-Sal* horas de lectura de propuesta,
lo que significa
.alrededor de 6tJ personas-días de lectura, iea panel de 15
trabajando fcir f‹iur d.rvs, tu't› p.anvls tit 15 trabajando dos
días, o diez
mosquiteras txt f› laboral por tono da}' T'ne problema es ese
vc›u
‹ no recibir rrvicn'ers helados durante cuatro días, y los
paneles pequeñ os
cinco p.apt•rs. n'hich es b, tl0tl paginas, •y v•'e's c
inmediatamente•diatelv
Propuestas que vienen en ‹en la longitud de 50 pá ginas,
n'que puede ser manejado con bastante rapidez, y de
hecho .Stich con má s cuidado, por el mismo panel, vuelto
a convocar para ese propó sito. Tenga en cuenta también
que la velocidad de lectura para el primer nivel de
propuestas puede ser mayor, ya que todo lo que los
lectores tienen que hacer es asegurarse de que no se
pierdan una propuesta prometedora, en lugar de
ordenar la clasificació n para la adjudicació n final. Note el
ahorro triple que está involucrado: los proponentes
pueden ahorrar alrededor del 9% de sus costos (puede
que no sea tan alto, porque las propuestas má s cortas
requieren má s que una cantidad prorrateada por pá gina
de recursos, pero sigue siendo sustancial ); el
.agencY s.eves ‹una gran cantidad de costos en la
pavimentació n de calificadores o
panelistas, y él•avv personal trabajo costos; y la confiabilidad
del proceso, así como la calidad de los jueces disponibles aumenta
significativamente Por lo tanto, el pequeñ o subsidio para
el prc ml de segundo piso está má s que justificado, tanto
fiscalmente como en términos de incentivar las entradas
de personas que de otro modo no podrían.
.pagárselo; ‹Encuentre mejores entradas de sose que puedan
ESCRIBE SI ERRORES TIPO 2 SP Contraste de Hipó tesis.
RESULTADOS IMPREVISTOS A menudo se usa como
¥ no vm para efectos secundarios, pero solo vagamente
equivalente, ya que los resultados pueden ser
imprevistos para los planificadores inexpertos, pero
fá cilmente predecibles para los experimentados; Los
efectos que yo anticipé pero no las metas son (a veces)
todavía efectos secundarios, y a veces no (por ejemplo,
tener que alquilar oficinas).
INCERTIDUMBRE, Evaluació n Ver Riesgo.MEDICIÓN
DISCRETA Lo contrario de re-
activo medició n Uno que no produce ningú n efecto
reactivo, p. al servicio de la cantidad relativa de desgaste de
la alfombra en Iron I de las pantallas interactivas en una
ciencia museo como un medida de cantidades relativas de uso
A veces poco ético, y a veces éticamente preferible a una
evaluació n intrusiva ("Obtruslvc" no es necesariamente
"intrusivo"; puede ser obvio
‹›nosotros pero no interrumpimos)
UTILIDAD (Econó mico) El ›'aluc' ‹›f «›methiny a alguien
‹›r tL› sonlu inshtuti‹›n. "lnttrptrst›n‹1I c‹›mpanson uf utility"
en el tumbling-hl‹vk ‹›f (welfare) ecoi inmics A veces se mide
en los tinitos h\ pe›thcticnl uf ”utiles” Ver Appor- miento,
Costo.
UTILIZACIÓN (u( evaluaciones) Esto se refiere a ‹if/t‹'•
al esfuerzo por mejorar la implementació n de las
recomendaciones de una evaluació n oa un enfoque
metaevaluativo en la medida en que las evaluaciones han
sido optimizadas. La utilizació n/implementació n debe
planificarse en las evaluaciones desde el primer momento;
de hecho, si el cliente no está en condiciones de utilizar los
resultados de manera adecuada, surge una pregunta ética
sobre si se debe realizar la evaluació n. Los procedimientos
está ndar incluyen poner representantes de los evaluados
en el equipo de evaluació n o panel asesor; solicitar y usar
sugerencias de toda la població n impactada sobre el diseñ o
y los hallazgos, identifcar y enfocarse en los beneficios
positivos de la evaluació n implementada; usar lenguaje,
extensió n y formatos apropiados en el informe(s);
establecer un equilibrio de poder frente a amenaza; y, lo
má s importante, un fuerte énfasis en explicar/enseñ ar
sobre las ventajas particulares y generales c›f ev‹3Iu‹a hon
Ver también Implementació n de evaluaciones. Carol Weiss
sensihlv sugiere "uso" como un sustituto de
"utilizació n"Medidas de uso
.1re tnckv, los problemas comienzan con el "uso conceptual",
es decir
'Las ideas prendieron incluso si las recomendaciones no se
implementaron después. Luego está el problema de si la
implementació n de malas sugerencias debería "marcar un
punto a favor o en contra".
VALIDEZ Una prueba es vá lida si realmente mide lo que
pretende medir. Puede ser confiable (en el sentido técnico)
sin ser vá lida, hasta que puede ser vá lida sin ser criticable.
(es \'alid tiene que ser confiable—si el termó metro es
x'alicJ, debe decir UI) etc. rees Centigrade t‹'/i‹'›i-
‹-‹'‹'i pl.hed en bo4ing w.1tcr y por lo tanto debe estar de
acuerdo 'con él mismo, es decir, ser confiable. Hay varias
subespecies de vnlid - ltv en el J.Argon (especi.altv face,
content, construct, and predictive › .alictity), pero
representan una inflació n de
puede no estar bien presentado o ser creíble (ver
Meta•ttvalua- tion). La validez se refería originalmente a la
propiedad de la argumentació n.mentos que son ló gicamente
impr ble, ya sea retó ricamente impresionante o no, el presente
sentido es una extensió n natural, aunque molesta a los ló gicos.
Ver Validez Externa, General-

RENDIMIENTO VALORADO A descriptivo imbuido de


valor x anable, imbuido de valor por el cniit‹.x Por
ejemplo, en el contexto de evaluar hot rods, el pie- El
tiempo de inicio de un cuarto de milla es la principal
medida de evaluació n, el rendimiento v.Glued. Por un lado,
es totalmente fá ctico/descriptivo; por otro lado, está
contextualmente imbuido de valor y es tratado
exactamente como si involucrara ló gicamente el concepto
de mérito. Cf Término criptoevaluativo.
CONCEPCIÓN SIN VALOR DE LA CIENCIA El ser-
creencia de que la ciencia, y en particular las ciencias sociales,
deben no pueden inferir propiamente conclusiones
evaluativas, sobre la base de consideraciones puramente
científicas. Erró neamente se supuso que era una
consecuencia del empirismo, aunque de hecho requiere la
premisa adicional (erró nea) de que la inferencia a partir
dehechos a valores es imposible; el error es precisamente
análogo al error de suponer que no se puede inferir para
concluirsiones sobre construcciones teó ricas a partir de
observaciones. (El ataque simplista de Popper a la
inducció n es, por lo tanto, en parte responsable del
continuo apoyo de la doctrina libre de valores).
Evaluació n científica justificada de diseñ os de
investigació n, deestimaciones, de ajuste, de instrumentos, de
expl.znatinns, de investigació n qu.a1itv, de teorías. Que el
v.blue-freeposició n se mantuvo frente a estas
consideraciones, requiere una explicació n en términos de
fobia a los valores. Ver evaluació n de necesidades-mei‹t‹y
LE.
IMPUESTO DE VALOR TÉRMINO Consulte
Rendimiento valioso.
JUICIO DE VALOR A afirmació n sobre el mérito, el
valor o el valor de algo, originalmente (‹y todavía
típicamente) que involucra a Juclpmen/ pero luego se
extendió a t‹› cc›vcr dll afirmaciones sobre el valor,
muchas de las cuales son observacionales/
mrnsurational (como en las afirmaciones leves ‹sobre la
bú squeda de rendimientos atléticos—“Ese dix'e no vale
menos de 6 puntos—como cualquiera podría ver“) Dado
que
ex'aluAhun I\'picically inx'olx'es mulh-attribute integración, no
es sorprendente que el juicio a menudo está involucrado, a
través de la ponderación de los diversos atributos. Pero la
idea de queLos juicios de valor siempre deben ser
arbitrarios/subjetivos/no científicos, ya que sólo están
integrados en el concepto como la doctrina de la ciencia
libre de valores puede sostenerse y representa un error
de césped, ya que las medidas de múltiples atributos
pueden ser fácilmente definidas de forma objetiva y
automática. VerRelativismo.
YALUEPHOBtA La resistencia a la evaluación que
generó el mito de la ciencia x'alue-kev, los ataques a
las prueba o curso 8radlng (ver Mata al Mensajero), sobre
evaluaciones de programas para la rendición de cuentas y
sobre la evaluación de profesores universitarios es viejo más de
lo que cualquier explicación racional puede cubrir. Usamos el
término "fobia a los valores" para cubrirlo sin ninguna
implicación de neurosis, solo irracionalidad. Por supuesto, la
defensa natural estrategia (ataque cualquier cosa eso es
una amenaza) es parte de ella, pero parte de ella es más
profunda, en la punwillin};ness para enfrentar hechos
posiblemente desagradables sobre uno mismo, incluso si se
trata de grandes Ion n b e n e f i c i o s . (Este
fenómeno —relacionado con la "negación"— se ve en
personas que no van al médico porque no quieren hablar
de imperfecciones). La fobia a los valores conduce a
muchos abusos, por ejemplo, garantías patéticas de que
una evaluación mal hecho "sólo para ayudar, no para
criticar" (si no hay válido críticas, rara vez hay alguna
justificación para la ayuda de programas/ejecuciones que
involucren a profesionales),/o la sustitución de la
supervisión de la implementación por supervisión basada
en resultados. evaluaciones de programas; a la negativa de
las asociaciones profesionales a utilizar normas profesionales
en sus propios procedimientos de acreditación o de
enriquecimiento; a excesivo intervención de e'aluahon
personal con el programa ctrl( ("para reducir la ansiedad o
"para mejorar implementa hon"") que con frecuencia
produce pablum evaluación
‹›aciones, & (estoy hecho) para la absurda rzitio ‹›f fax'ornble
to desfavornhle program eva!uations—absurd gix'on what we
re-
•1ll\' kn‹›w aA›ut la proporción ‹›de malos programas, la clínica
El estado de la fobia a los valores como fenómeno cultural de
los EE. UU. es muy obvio para los visitantes de, por ejemplo,
Inglaterra, donde las críticas muy duras en la academia no se
toman como algo personal, como lo es aquí, y es en este país
donde La Unicin de Consumidores vras catalogada por la
Fiscala General de la Nacin como subversiva
‹organizació n .y (independientemente) prohibido kom
publicidad en perió dicos Pero la ubicuidad de v‹aluephot›ia
1s má s
importante; Só crates fue asesinadopor su enseñ anza y
aplicació n La falta de habilidades evaluativas y los
dictadores de hoy no parecen menos inclinados a
asesinar a sus críticos que la “democracia” griega. La
humildad puede interpretarse mejor no como la
evitació n de la autoestima, sino como la valoració n de la
crítica, y este estado también debe valorarse como el
resultado de un "tratamiento" exitoso (con suerte,
educativo en lugar de terapéutico) para la x'aluefobia. .
Debería combinarse con cierta capacidad para distinguir
las buenas (de las malas críticas. Véase Rol educativo,
empirismo.
VALORES (en evaluació n; & medició n de) La V
que hacen que las evaluaciones sean má s que meras
descripciones pueden provenir (de una variedad de
diferentes fuentes. Pueden tomarse de un conjunto
relevante y probado de, por ejemplo, está ndares
profesionales. Pueden provenir de una evaluació n de
necesidades que podría mostrar que los niñ os se enferman
gravemente sin un componente dietético particular (es
decir, lo necesitan). a partir de una lógico y pragmático
análisis de la función de algo (Procesando velocidad en un
comp›Jter es una virtud,
ceteris p4ri5tis.) Incluso pueden provenir de como teñido de
deseos
y qI la ausencia de (ética impedimentos a yo err
(cumplimiento (p. ej. gJ e n c o n s t r u c c i ó n a mejor
montañ a rusa.) en ch o( estos
casos, los fundamentos son de hecho y razonando
es ló gico,
nada viene en que un científicodebería
avergonzarse de Pero algo flota en el fondo que los
científicos son vergonzosamente incompetentes para
manejar, a saber, la ética. sin hacer ética,sin embargo , la
mayoría de las evaluaciones se pueden validar
simplemente revisando las consideraciones éticas má s
destacadas que podrían anular el razonamiento no ético.
Los valores/preferencias que a vecesC e en la
evaluació n como la ú ltima fuente de datos:};e en
visibilidad desde lo obvio (votos políticos) hasta lo muy
inaccesible (actitudes hacia la seguridad laboral,
supervisoras mujeres, ccns 3r moda de pornografía) La
mayoría de los instrumentos para identificar los má s
sutiles a@ de muy dudosa validez; se infieren mejor a
partir del comportamiento; aunque esa inferencia
también es difícil, comienza con el tipo de evento en el
que (generalmente) esperamos influir. Algunas
simulaciones son tan buenas que probablemente
provocan valores verdaderos, especialmente si no son
muy importantes; deben utilizarse situaciones reales Ver

“'” 174
VARIABILlDAD La medida en que la fpulació n se extiende
a lo largo de su rango, en lugar de concentrarse cerca de
uno o unos pocos lugares (o modos), la característica que
valora dispersió n.
PESO AJ"4D SUMALa proceso tradicional de síntesis
en la evaluació n: se otorgan puntos por desempeñ o en cada
dimensió n x'. en una escala del 1 al 5, y la dimen -siones
'iluminado por su importancia relativa {e p. sobre
a escala 1-3, 1-5 o 1-10), luego los productos de los n'ochos
y los puntajes de desempeñ o ‹se suman para cada
candidato. clanfving, hay muchas posibilidades Algunos
ejemplos: si se mantiene un equilibrio cuidadoso entre el
peso má ximo, la puntuació n má xima de rendimiento y el
nú mero de dimensiones, un montó n de trivialidades
pueden inundar factores cruciales; Los requisitos de
"compromiso nc›" deben usarse como un requisito
preliminar.
na rv fil ter, no pesa tanto factores ted; lineantv de util -it›
(puntos) ‹a través del rendimiento•no se deben asumir
x'ariables, las interacciones necesitan un análisis separado, sit
r;›fus perfor- m•ince en dimensiones sin umbrales sin ci
romise deben ser separados un telv n octavado
(posiblemente no muy pesado): eventualmente, en! una
tabla de 7nulti-candidatos puede usarse como un primer
basculante bá sico. Véase Eualuotion News fVcal 2, no. I,
febrero de 1981,

WHITEWASH (Suchman) Véase Rationalizatinn Eval-


uació n
INTEGRAL Alterrianve ortografía de holístico.
QUIÉ N OENY Una conferencia sobre el personal de una
agencia de financiació n que pueden solicitar los licitadores
no ganadores en una RFP
‹y en el que se les informa sobre las razones por las que ú ltimo
fuera Una de las consecuencias de la reciente mudanza a-
apertura de las salas. Desafortunadamente, la falla en el uso de
prominenciapuntuació n y otro svstem‹ático procedimientos
medio ese re- Los comentarios de la audiencia y del personal
son muy difíciles de interpretar en un ú til ii.ay.
CABLEADO Se dice que un contrato o una RFP está
"cableado" si, ya sea a través de su diseñ o y requisitos o
mediante un acuerdo informal entre las cosas de la
inversió n y un particular.
contratista, está dispuesto para que vaya a ese contratista.
, Ciertamente ilegal, y casi siempre inmoral. El mero hecho
de que la RFP, con buenas razones intrínsecas, antes de la
medició nmina el contratista, por ejemplo, porque el de
hecho, el problema solo puede ser manejado por un
equipo con dos computadoras Cray, no constituye
cableado.
VALOR Valor del sistema en contraste con el valor
intrínsecomérito); por ejemplo, el valor de mercado es
una funció n del mercado, no de las propias virtudes del
evaluando. El valor de un profesor está en funció n de la
matriculació n en sus clases, la obtenció n de
subvenciones, la relació n con la misió n de la
universidad, la funció n de modelo a seguir para mujeres
futuras/actuales o estudiantes de la minoría.abolladuras,
a««e// segú n su mérito profesional. Este ú ltimo es
uncondició n necesaria pero no suficiente para la primera.
Cf. É xito.
PRESUPUESTO BASE CERO (ZBB) A sistema o( bud-
obtenció n de la cual n// gastos deben justificarse en lugar
de n‹JJfi‹»in/ gastos (es decir, variaciones del ”nivel de
financiació n”). Temporalmente de moda en Washington en
los añ os 70, sus méritos para la evaluació n sumativa son
abrumadores; las dificultades prá cticas se manejan con
facilidad, pero las bromas políticas de los programas
arraigados pueden ser má s difíciles de abordar.
.envejecer. La referencia original es el br›ok de Peter Pyrrh de
este título.
Ver Prorrateo.
ACRÓNIMO
S
& AB¥?
i1EVIÉ CIONES

AA Audit Agency=-una divisió n de HHS/ED que


informa directamente al Secretario y realiza auditorías
internas (cf. GAO) que equivalen a evaluaciones de
programas y contratos, incluida la evaluació n. Ha pasado
de la orientació n de CPA a un enfoque mucho má s amplio
y las cuotas son muy competentes.
»'trabajo (aunque extender un poco delgado); todavía
no parece un .g. validez de los instrumentos de prueba
utilizados.
AAHE Asociació n Argentina de Educació n Superior.
ABT correctamente, Abl As.sociates. Tienda grande con
fuerte capacidad de evaluació n nacional; sede Cambridge,
Massa-Chiisetts
ACTUAR ,/tmenéan Pruebas universitarias
AERA Asociació n Estadounidense de Investigació n
Educativa AID Agencia para el Desarrollo
Internacional
AIR American Institutes f.ir itcsearch, un contratista
ubicado en el norte de California con cierta capacidad de
evaluació n
ANCOVA Aná lisis de covarianza
ANOVAAn•ilvsis de varianza
ATI Interacció n aptitud-
tratamiento AVAudiovisual
AVLINE Base de datos ‹audiovisual‹al en línea mantenida
por el Nació n Biblioteca de Medicina
CAI Instrucción asistida por computadora
C‹›nyre»sion.II Budget Off“i‹e Pr‹›x'ides analvsis n nd
e›'‹aluatiun scm'ices al Congreso, como lo hace la GAO para la
administración
CBTE, €-ffTT, CBTP Com{ etency Sesgo Teacher Edu -
c‹zción, Formación o Preparación
CDCC‹›ntr‹›l D, en. C‹ rpor‹ation, ‹›nc ‹›f the top tive com-
yu ter coma señora.
CEEB Entrada Culleye Kx.wtiinatlc›n Bardo
CEDR Centrar miedo E'alu.ati‹›n, 4 de diciembre y Re-
búsqueda (‹en Phi Delta Ka pp.a)

CtPP Del nmi Modelo de Stufflebenm ‹y E¿‹›n G uba


› alto distingue >F ex. contexto tiun
pero pr aeit pr‹JcJuct —nll designuc1 t‹› delinear, ob- tn
in, ‹Ind Crcdc1c ruuful irif‹›rm.atinn for the decisi‹ n -
akv
CIRCEh AnJ Cur-
r crlum E\ ‹Jlu•1ti‹›n, T 'nix'ersi'x' ut lllin‹›is, Urb‹ana, Illinois
CMHC Centro de salud o clínica de Cummunlt\' 'Vlcntal
CMIC‹›mputadora 41.zn.old lnstr@tion
CNConsii/t‹infs se acerca, the h Uh \ indcpendt'nt news-
lettc'r elf the ni‹ ‹1¿emcn tc‹›nsuIting area, run h}' talented
nc r J na Kc nneclx

CE
DEd lpmperly Departamento EDI de Educació n (ex-
usoE)
Departamento de Defensa
Departamento de
Defensa Departamento DOEO
de energía
ORG. Divisió n de Becas de
Investigació n DRTOumam-re.
prueba .encedida
disfunció n eréctil Departamento de educació n
EIR Informe de Impacto Ambiental
Ei"4 Et›qfuafion Nrws, el boletín Journal ‹ f the Ex
aluarion Metwor>
en rrafu‹ifion noirs, ‹ new'sletter tin evaluatit›n meth-
‹xlulogv publtske‹J bv Fdgepress
ENet Evaluati•an Network, una ‹asociació n profesional de
evaluadores
EPTE Educ‹hc›n Informació n de prcdur ts ExCharge
ERIC Educational Rescurr•.s Inft›rmution Center; una
red de informació n sobre nanonudos tiene su base en
Ashing-ttin, DC y 15 cleannghouse• en diversas fijaciones
en los EE. UU. Disponible como base de datos en línea
ERS Ev.aluation ficsearch Stxietx', una evaluación de
profesiones›-
I.lOn de t•i'‹3lU8 ltHS

tiSEA Elemenlarv ‹and Sevundan' Education Act of 1'H5


YTS Ed tiga tic›nal Testing Serv vo, sede en
f'rinveton, j - salvado Sí en flerkelev, AUonta, etc.
GIGO Garbage In, Garbage Out (programació n de
computadora frcm; ver metaná lisis)
médico de cabecera
Propósito general (evaluar r)
GPA Promedio de 1 grado
GPO Oficina de Planificació n del Gobierno,
W‹ashington, DC Examen de graduació n GRE
Gradu‹›te
Departamento HEW de Salud, Educació n y Bienestar,
nov dividido en E D. y H HS
HHS Departamento de Salud y S‹•rxaccs Humanos
I BM Má quinas de negocios internacionales
IOXInstruccional C Intercambio de ectivos
k 51000 como en ”16K para evaluació n ” ,
K- 12 Kindergarten thr‹›uyh hlgll schu‹›l › e.mrs K-
6 The dc›m.am cf '”Elementarv Educahun"
LE7he Loyic de £unlution, .an ‹ i›ug aph b\' the pros-
enI ‹luthci
LEALa.al Educ.zticn AuthL›nty (ej. sch‹x›l distrito)
LSAT .a••' Schuul Admissic›n Test
METRO Fhous‹i nd, ‹como en”S1f›S1 ftir ci'•alti‹at ion”

NCATE fia tit›nal t"‹iu rii il It›r \ccrec4it•itn›ri ter I'm'.ichr r


Eciuc.it ió n
ANI Instituto Nacional sobre el Envejecimiento
NtCHD Instituto Nacional del Niñ o. Salud y Desarrollo
Humano
NIE Instituto Nacional de Educació n (en ED)
yo HH I n s t i t u t o s N a c i o n a l e s d e
S a l u d (incluye NlMl-1, NiIA, etc.), nr Not Invented Here
(así que no desaconseje su uso)
NIJ Instituto Nacional de Justicia
NIMH Nat:ona1 lnstiti:te de Mei ‹1 Salud
NLM !Biblioteca Nacional de 'medicina
NSF Fundació n Nacional de Ciencia
NWL Northwest Lab, Portlarfl, Oregó n Uno de los
nuevos laboratorios federales y centros de I+D; tiene la
evaluació n má s fuerte fradihon (Worthen, Saunders,
Smith)
Oficina de Educació n de OE
OHDS Office of Human Dex'elc›pment Ver wcs
OUT Instrucció n en el trabajo
OGP O(hce ..‹ Gestió n y •.d Presupuesto
OPB Office c›f Planificació n y
Presupuesto
L+NROficina de Investigació n Naval, 5p‹›nscr de
p. ej. Encía
cfopedio a/ Educofzonof Eoof'‹otion
OTA Oficina de Tecnología Asessmer›t
P & E Planificació n y Evaluació n, un dix'isit de
HEW/HHS, incluidas las oficinas regionales, donde
informa directamente a los Oirertors Regionales en ED,
actualmente llamado OPB
PBTE (Educació n del maestro basada en el rendimiento)
PDKPhi Delta Kappa. el influyente y c}u.alitv-
‹orientado a la edu•atit›n.al honor.iy' que publica el KaPpan
PEC Lista de verificació n de evaluació n de Prtrd urt
FERT Prc›gram E\'‹1luatiL.n nd itet'i«w Técnica ublic
PHS Health Seo'i‹'e
PLATÓ N por má s grande fi \ I proyecto alguna vez, ‹inbi
n.ul cabeza-
cuartos en la Universidad de lili. c›i /Champaiyn totalmente
financiado por NSF en fase de desarrollo, ahora controlado por
COC.
PPBSPlanificació n Sistema de Programació n Presupuestaria
PSIPersuralizado Sistema de Instrucción (también
conocido como El Plan Keller)
PTi Texto programado
RANOBid con sede en Santa Mónica investigación
cuiztract y traje de análisis de ex'aluación y polio'. Por lo
general, un EE.UU.'criatura' de la Fuerza Aérea (diario de
submarinos civiles), creado porque el}' cc›uldn't aún bastante
s[›talert ecmlized de 'dentro del rangos—el nombre proviene
de INVESTIGACIÓN Y DESARROLLO Ahora es una
organización independiente sin fines de lucro, aunque aún
funciona la suma para la USAF
RFP Pet uest para propels.zI
Prueba de Aptitud Académica SAT \VicIelv utilizada (en
‹admisiones
COSUDE Systems Dr , cl‹›pment C‹›rporahr›n tn Santa
k1onic.a, an‹›ther (‹urge shoy like ftanv1 v'ith. sustancial
et'al- uat t›n tap.JbiliL'.
MAR Autoridad Estatal de
Educació n SEPSch‹xil E:'alii.ation
Prutil SSE
Sc›ciix•conc›rruc ;estado
SMERC San .v..a teo Educatitin.ii Res‹ Centro urccs —ar Centro
de informació n que alberga numerosas colecciones de materiales
didá cticos para satisfacer las necesidades de informació n.
educació n


ci dores en sexo i ra I st‹ites que rodean Calilomi‹i I' inst
colecciones son ”in-htitise” b 4t fik4ERC .lista› tiene éxito en los
archivos ERIC SMERC es 1'›c.elemento en Re‹4s•. t›‹ 4 Ciudad,
Ct
Prueba de Aprobación Temática TAT
CIUDAD Instituto de Ciudades Gemelas para Jóvenes Talentosos Sitio de la
primera evaluación defensor-adx'ersario (Stake & Dennv)

US OF Fuerza Aérea de los Estados Unidos. Compromiso


fuerte (y bastante competente) en I+D, como la Armada y
diferente del Ejército.
USDA Departamento de agricultura de los Estados Unidos
EE.UU. Oficina de Educació n de los Estados Unidos,
ahora ED o DEd (Departamento de Educació n)
QUE Cá mara de compensació n interestatal
occidental de Higher Educació n

También podría gustarte