Está en la página 1de 36

COMIT ORGANIZADOR

SEMINARIO REGIONAL DE
EVALUACIN DE LA EDUCACIN ZONA NORTE
INSTITUTO COLOMBIANO PARA EL FOMENTO
DE LA EDUCACIN SUPERIOR ICFES
GENISBERTO LPEZ CONDE - Director General (e)
ARACELI MORA - Asesora Direccin General

UNIVERSIDAD AUTNOMA DEL CARIBE


SILVIA BEATRIZ GETTE PONCE - Rectora
TAMID TURBAY ECHEVERRA - Vice Rector
ESTELA VANEGAS DE BRIEZ - Directora Acadmica
SANDRA OSORIO BASTOS - Dir. Prog. Administracin de Empresas Tursticas y Hoteleras
BELINDA GARCA JIMNEZ - Dir. Prog. de Comunicacin Social-Periodismo
SILVIA GUTIRREZ PAREJO - Dir. Prog. de Direccin y Produccin de Radio y Televisin
JOHN PEZ SANTAMARA - Dir. del Centro de Desarrollo de Sistemas
MARYORIE AMAYA VILLALOBOS - Dir. del Centro de Produccin de Radio y Televisin

RECONOCIMIENTOS
El Comit Organizador del Seminario Regional de Evaluacin de la
Educacin Zona Norte expresa sus ms sinceros agradecimientos al grupo
de profesionales del Instituto Colombiano para el Fomento de la Educacin
Superior - ICFES, por su desinteresada y constructiva participacin en la
realizacin de los talleres que se dieron en el marco de este encuentro.
Igualmente, reconoce el aporte y apoyo prestado por la Universidad Autnoma
del Caribe, sin el cual no hubiera sido posible lograr los propsitos del
seminario.

DISEO MATERIAL TALLER

Sara Esperanza Bohrquez Rodrguez


Martha Castillo Balln
Ernesto Cuchimaque Daza
Hctor Orlando Daz Ramrez
Moravia Elizabeth Gonzlez Pelez
Myriam Gonzlez Buitrago
Cristina Hennig M.
Zandra A. Parra Nio
Flor Patricia Pedraza Daza
Martha Rocha G.
Mnica Roldn Torres
Claudia Luca Senz Blanco

ZONA NORTE: Taller Elaboracin de tems

EJERCICIO DE ENTRADA INSTRUCCIN


1. Teniendo en cuenta la informacin que le brinda el siguiente
texto y haciendo uso de la plantilla, construya un tem que
pueda servir para evaluar un saber hacer en la disciplina o
campo de su especialidad.
2. Haga la caracterizacin del tem atendiendo a la informacin
que exige la plantilla.

1. EJERCICIO DE ENTRADA

plazo, la ministra de esta cartera, Sandra


Surez, explic que es necesario hacer esta
disminucin de manera gradual, por falta de
recursos econmicos para lograrlo. Colombia
es un pas subdesarrollado que no puede
cumplir con el estndar. Se necesitaran
inversiones muy altas y el pas no las tiene.
Para el neumlogo Jairo Roa, las personas
seguirn enfermndose por los altos niveles
de contaminacin, y la industria, amparada en
la norma y en los supuestos elevados costos
para la conversin industrial, no tomar
medidas antes del 2011.

ELABOREMOS UN TEM
Lea atentamente el siguiente texto:

Gobierno expide nuevo decreto que


busca mejorar la calidad del aire
La norma busca reducir las partculas grandes
de humo, tierra, polvo y txicos que expulsan las
fbricas a la atmsfera. Estos agentes llamados
material particulado PM10, son los mayores
contaminantes del aire. Actualmente, en el pas
se registran ndices de contaminacin anuales
de 70 microgramos/metro cbico (mg/m3),
mientras que el lmite internacional es de 50.
La nueva norma de calidad de aire, expedida
ayer por el Ministerio de Ambiente, Vivienda y
Desarrollo Territorial, busca reducir a 60 mg/m3
la contaminacin para el 2009 y a 50 para el
2011. Hasta el momento, Colombia no contaba
con una reglamentacin clara al respecto, pese
a que los costos relacionados con efectos
en la salud pblica ascienden a 1,5 billones
de pesos (principalmente por enfermedades
respiratorias), es decir el 0,80 por ciento del PIB,
segn un estudio del economista ambiental
Bjorn Larsen (del 2004).

Entonces, el dao ser incalculable; tendremos


un aire sin ningn tipo de calidad, pues el
estndar internacional (50) de por s es malo,
resalt Roa.
El decreto establece procedimientos de medicin
de la calidad del aire, a travs de nuevas
estaciones de monitoreo, a cargo del Ideam. Y
encarg a las autoridades ambientales de cada
jurisdiccin elaborar programas de reduccin de
contaminacin, enfocados en la modernizacin
del parque automotor, la ampliacin de reas
verdes y la prevencin en salud, entre otras.
Para quienes infrinjan lo estipulado habr multas
hasta por 300 salarios mnimos mensuales;
suspensin del registro, licencia, permiso o
autorizacin de funcionamiento, y cierre temporal
o definitivo.

Ante la polmica que desat entre


ambientalistas y mdicos el fijar metas a largo


PLANTILLA PARA ELABORACIN DE TEMS


CONTEXTO/ ENUNCIADO

OPCIONES DE RESPUESTA

CLAVE:
JUSTIFICACIN DE LAS OPCIONES

ZONA NORTE: Taller Elaboracin de tems

OBJETO DE EVALUACIN
Categora disciplinar

Categora cognitiva

Tarea de evaluacin


POBLACIN OBJETIVO

Edad:
Nivel educativo:

EXPECTATIVA DE
DIFICULTAD

Probabilidad de respuesta
correcta (entre 0 y 1)

Gnero:
Observaciones:

JUICIO DE EXPERTOS/
APLICACIN PILOTO
Pertinencia frente a estructura
de prueba/correlacin
ALTA MEDIA BAJA

Observaciones:

OBSERVACIONES O RECOMENDACIONES
EDICIN:
APLICACIN:
CALIFICACIN:
OTRAS:


AUTOR

FECHA DE
ELABORACIN

CDIGO O IDENTIFICADOR

Reglas para la construccin de tems


REGLAS GENERALES
Verificar que el tem corresponda con los
propsitos de la evaluacin, la estructura de
la prueba y con las dimensiones disciplinares
Todas las preguntas de una prueba deben
ser independientes entre s.

lectura, disminuyen el tiempo de respuesta


y fatigan.
Garantizar la coherencia interna del enunciado
y de este con las opciones de respuesta.

La informacin de un tem no debe servir de


pauta para contestar otra, ni la respuesta a
un tem debe depender de haber encontrado
primero la de otra anterior.

REGLAS SOBRE LAS OPCIONES


Las opciones de respuesta deben pertenecer
al mismo campo semntico.

Evitar los tems que pueden contestarse por


sentido comn y aquellos cuya respuesta
dependa nicamente de recordar un trmino,
un smbolo, un dato o la fecha en que ocurri
un evento.

Las opciones de un tem no deben dar


indicaciones sobre la clave por ofrecer un
cierto contraste evidente de:
- longitud precisin / imprecisin
- uso comn / tcnico
- generalizacin/particularizacin

Evitar expresiones rebuscadas que puedan


confundir. Se recomienda emplear un lenguaje
directo, sencillo y comprensible.

No se deben repetir expresiones en las


opciones de respuesta, si stas se pueden
incluir en el enunciado del tem. Repetir la
misma palabra del enunciado en cualquiera
de las opciones lleva a que sea elegida como
respuesta, sin serlo necesariamente.

Los tems no deben tener juicios de valor


explcitos o implcitos.

REGLAS SOBRE LOS ENUNCIADOS


Los enunciados deben ser afirmativos, en
caso de ser necesaria la negacin, se debe
resaltar para llamar la atencin hacia la
formulacin negativa. La doble negacin
afecta la comprensin (No es cierto que no
procedan los recursos).

Debe evitarse en las opciones las expresiones


todas o ninguna de las anteriores, en su
lugar es necesario construir alternativas de
respuesta plausibles para las personas que
no tengan el dominio conceptual que exige el
tem.

Evitar enunciados demasiado extensos


y poco atractivos ya que desmotivan la

Realizar una revisin gramatical y ortogrfica


de cada uno de los tems.

10

ZONA NORTE: Taller Elaboracin de tems

TEMS PARA ANLISIS

11

12

ZONA NORTE: Taller Elaboracin de tems

13

14

MARTHAZONA
JEANETH
CASTILLO
BALLN*
NORTE: Taller
Elaboracin
de tems

La pregunta por el conocimiento y


su accin pragmtica
ICFES
en el campo o dominio trae la revisin de los
postulados existentes y probablemente la nueva
experiencia genera nuevos consensos sobre
nuevos criterios.

Si reflexionamos sobre lo que hacemos


cuando queremos saber si otra persona tiene
conocimientos en un dominio dado, descubrimos
que buscamos un comportamiento o accin
adecuados de esa persona en ese dominio,
al plantear una pregunta implcita o explcita
dentro de un dominio. Si consideramos que el
comportamiento o la accin (o la descripcin del
posible comportamiento o accin) dados como
respuesta a nuestra pregunta resulta adecuada
o efectiva en el dominio que especificamos,
afirmamos que la persona sabe. Si, por el
contrario, consideramos que tal comportamiento
o accin no resultan adecuado o efectivo en el
dominio estipulado por la pregunta, afirmamos
que la persona no tiene conocimiento de ese
dominio.

Contrario a lo que se percibe en el campo de


la investigacin cientfica, en el contexto escolar
el referente en una pregunta se ve mediado
por la accin pedaggica de un docente que
construye los criterios, ya no desde la experiencia
consensuada sino, desde su experiencia
individual en la enseanza de un rea, bajo la
concepcin de una estructura que crea a travs
de la experiencia de indagar o preguntarse sobre
el cmo ensear, por ejemplo la matemtica o la
biologa. En este caso, el conocimiento se trata
de un comportamiento aceptado o adecuado en
la medida en que la accin o comportamiento
del observado coincida con la estructura creada
desde la experiencia individual del docente.
Lo anterior hace que la pregunta en la escuela
limite la actuacin frente a un dominio a los
criterios disciplinares. Algo que es vlido en
la medida en que sea comprendido como
uno de los mltiples caminos por los cuales el
observador puede determinar la validez o no del
comportamiento de un observado frente a una
problemtica que remite a un campo, es decir
a un dominio ms amplio que el disciplinar.
Las ciencias no se desenvuelven en un terreno
virgen, no brotan misteriosamente de una fuente
de primigenia epistemolgica de carcter puro.
Las ciencias proceden de fuentes que no son
ellas mismas sino en la medida en que hacen
parte de las otras.

El conocimiento es entonces el comportamiento


aceptado? O es algo que le subyace al
comportamiento del observado que remite a un
referente conceptual y procedimental aceptado
desde un dominio en un campo? En los dos
casos de dnde se sacan los criterios para
determinar si un comportamiento o accin
es adecuado o inadecuado? Para muchos,
en el contexto de la investigacin cientfica, el
conocimiento es el comportamiento aceptado
como adecuado por parte de un observador, u
observadora, que participa de una comunidad
en el campo o dominio determinado, luego el
criterio o los criterios son consensuados en una
comunidad que comparte ciertas experiencias
frente aciertos fenmenos y postulados, tanto
as, que la diferencia de algn exponente

Profesional Especializado en el rea de lenguaje del ICFES

15

El preguntar desde las reas para valorar el


comportamiento adecuado de un sujeto frente a
un dominio ignora la dialctica de las ciencias.
Esta dialctica incluye tanto contradicciones
internas a la ciencia (de unas ciencias con otras
ciencias, as como de una ciencia consigo misma)
como contradicciones externas, dadas en las
intersecciones con los contextos extracientficos.
La pregunta por el conocimiento debe dar lugar
a explicitar las convergencias y contradicciones
entre las ciencias y en una misma ciencia frente
aun fenmeno o problema.

se transforman por los enfrentamientos entre


las fuerzas que constituyen el campo todo
campo es un lugar de lucha con el objeto de
alcanzar la autoridad. La estructura del campo
dice Bourdieu es un estado de relaciones
de fuerza entre los agentes o las instituciones
comprometidas en la lucha o, si se prefiere,
de la distribucin de capital especfico que,
acumulado en el curso de las luchas anteriores,
orienta las estrategias ulteriores.
Por tal motivo, la relacin difana de las
ciencias en el campo de la ciencia es compleja
y obedece a d l complica cuando al interior de
las disciplinas aparecen subcampos o dominios
correspondientes a las llamadas reas de
inters. La ciencia especial se diversifica por
el hecho de abarcar al menos una parte de
distintos dominios disciplinarios que cooperan
en dar una respuesta a determinadas preguntas.
Este es el caso de la ciencia cognitiva y de
cualquiera otra aproximacin cientfica que
requiera sobrepasar los lmites entre disciplinas
para alcanzar explicaciones ms iluminadoras
de determinados fenmenos. Este tipo de
aproximacin se visualiza hoy da como una
necesidad al interior de ciertas disciplinas que
se han percatado de las mltiples dimensiones
de los fenmenos que estudian y que, en
consecuencia, requieren que sus hiptesis
reflejen la complejidad de los fenmenos de
que se ocupan. Sin embargo, hoy parece que
por lo menos en el campo de la evaluacin, los
mismos promotores y cultores de este tipo de
aproximacin a la pregunta por el conocimiento
no tienen a menudo la suficiente claridad para
dar cuenta de los fundamentos y caractersticas
de lo que efectivamente debemos hacer para
interrogar por un problema que convoque
a las reas en procura de una explicacin o
solucin.

Ms que evaluar una teora o disciplina


estableciendo patrones normativos generales,
lo que se persigue, por una parte, es captar la
importancia filosfica de la misma. Esto significa
exigir de la teora en cuestin un punto de vista
que nos permita una mejor comprensin de un
sector de la realidad que debiera ser coherente
con una concepcin de la totalidad de la misma.
Ello implica el establecimiento de una relacin de
cooperacin entre las disciplinas que componen
el campo de las ciencias.
La nocin de campo ha sido planteada por
Bourdieu para dar cuenta del conjunto de
relaciones objetivas en las que histricamente se
encuentran ubicados los agentes y con la cual
intenta sobrepasar las arbitrarias oposiciones
entre estructura e historia, entre conservacin y
transformacin.
En primer lugar, los campos se presentan
como espacios estructurados de posiciones
(o de puestos), cuyas propiedades dependen
de su posicin en esos espacios y pueden
ser analizadas independientemente de las
caractersticas de sus ocupantes.
En segundo lugar se encuentra la cuestin de
los lmites del campo. Las fronteras entre los
campos no pueden determinarse por fuera de
los campos: slo los efectos del campo y no
las cualidades intrnsecas de los participante
puede definir el espacio de un campo. En este
sentido los efectos del campo slo pueden
ser determinados por la investigacin emprica.
En tercer lugar, los campos se mantienen o

Una leccin general que se deriva de lo anterior


es que si el razonamiento interdisciplinario se
basa en la interdependencia entre fenmenos,
entonces se requiere, adems de la existencia del
vnculo de interdependencia, que el constructor
de la evaluacin y por ende el que se va a deba
estar bien informado acerca del tratamiento que
se hace de los fenmenos y del progreso que se
16

ZONA NORTE: Taller Elaboracin de tems


hace en las disciplinas que han servido de base
a su construccin, en otras palabras asegurarse
que al accin pedaggica de las disciplinas est
encaminada a la cooperacin.

conocimiento, es decir no hace preguntas para


obtener respuestas nicas y verdaderas, pues
rechaza que su mente sea un receptculo o
cajn vaco en el que se puedan introducir las
distintas verdades; para Scrates es el discpulo
quien extrae de s mismo, de sus experiencias
y conjeturas el conocimiento. Subrayar que,
en la accin que busca contradecir toda
opinin, y al lograrlo, el otro se ve beneficiado
por la duda y la explicacin desde diferentes
experiencias, aparecen las ideas primarias de
la interdisciplinariedad. En efecto, e el mtodo
se alude esencialmente a tomar como punto de
partida los problemas y no las perspectivas de
disciplinas particulares, hecho que sustenta el
hacer en el conocimiento y el cuestionamiento por
el conocimiento. Se trata de renovar el dilogo
roto por una cierta modernidad entre el orden de
los hechos y el orden de los valores, facilitando
el dilogo de los cientficos, los filsofos, los
telogos y los actores del mundo econmico,
a fin de comprender mejor la articulacin entre
las implicaciones de la investigacin cientfica y
la bsqueda de sentido. En trminos generales
lo que se busca es un conocimiento sobre
el conocimiento que permita encuadrar los
diferentes conocimientos en un marco general
que les da sentido y les pone en relacin con
los valores centrales de la vida humana. No
tendramos que preguntar desde las reas sino
desde los problemas para encontrar soluciones
desde diferentes reas o campos.

Actualmente, para la mayora de nuestros los


estudiantes, la pregunta por el conocimiento,
tanto en la educacin bsica como en la superior,
est marcado por la presencia del concepto
de rea como ciencia en si y para s, pues a
s estn formuladas las polticas educativas, los
programas de estudio.
La intencin de llegar al conocimiento de la
esencia o rasgos universales de las cosas,
ya estaba desde el mtodo socrtico de la
enseanza, el cual estaba basado en el dilogo
entre maestro y discpulo, sealaba la necesidad
de romper con la particularidad como unidad del
conocimiento e ingresar al origen por la pregunta
del conocimiento, un origen cuya fuente es de
carcter interdisciplinar. Recordemos que el
mtodo consista esencialmente en emplear
el dilogo para llegar al conocimiento. Aunque
Scrates nunca sistematiz la mayutica, se
podra afirmar que el dilogo era la estrategia
para asegurar que a partir de una pregunta
inicial se suscitara en el discpulo la ambigedad
y la contradiccin, que finalmente lo llevaran
hacia una posible respuesta. Este momento de
confusin e incomodidad por no ver claro algo que
antes del dilogo se crea saber perfectamente
es condicin necesaria para el aprendizaje,
para preguntarse por el conocimiento. La
intencin del mtodo mayutico es acercarse
progresivamente a definiciones cada vez ms
generales y precisas de la cuestin que se
investiga; la discusin concluira cuando el
alumno, gracias al tipo de interrogante que hace
el maestro, consigue alcanzar el conocimiento
preciso, universal y estricto de la realidad que
se investiga (aunque en muchos dilogos de
Platn no se alcanza este ideal y la discusin
queda abierta e inconclusa).

Sin duda, esto duele, pues algunos vivimos


an en el naturalismo metodolgico de las
disciplinas, sin embargo es posible que los
jvenes cibernticos, los que manejan el lenguaje
del hipertexto y el hipervnculo lo comprendan
mejor que nosotros.
Hoy en da coexisten diversos perfiles
relacionados con la gestin del conocimiento,
por ejemplo el perfil del documentalista,
traductor, terminlogo, lexicgrafo o lingista.
Todos comparten en mayor o menor medida
el tratamiento y la difusin del lenguaje
como actividad comn. Un perfil que recoge

La idea bsica del mtodo socrtico consiste


en que el maestro no inculca al alumno el
17

perfiles con una indicacin del aspecto del


conocimiento en que cada perfil se centra
(produccin, transmisin, tratamiento o gestin
en general).

Estas son algunas posibilidades, sin mencionar el


trabajo relacionado con la creacin de ontologas,
dentro de la Ingeniera del Conocimiento, donde
Lingstica, Ingeniera y Lgica confluyen
produciendo unas herramientas valiossimas
para los investigadores.

Algunas actividades que hoy en da requieren,


por ejemplo, la colaboracin de lingistas y
documentalistas en un enfoque interdisciplinar, o
que al menos se pueden ver favorecidas por sta,
son: La elaboracin de herramientas de apoyo
a la traduccin; la elaboracin de documentos
secundarios, como ndices y abstracts; la creacin
de herramientas lexicogrficas y terminolgicas,
como tesauros multilinges, diccionarios, glosarios,
vocabularios normalizados y terminologas.

Qu hacer con la pregunta por el conocimiento


en la escuela? Lo que est claro es que el
futuro de la Ciencia pasa ms que nunca
por la interdisciplinariedad y que hoy resulta
esencial la construccin de un lenguaje
comn para indagar desde diferentes reas
por problemas que tocan al hombre en su
estar en el mundo.

REFERENCIAS
AGUADO, GUADALUPE y PILAR DURN. 2001. La investigacin en lenguas aplicadas: un enfoque
multidisciplinar. Madrid: Fundacin Gmez Pardo- UPM.
CELIS, ANGELA. 2002a. Del texto al hipertexto, o la nueva e-misin en el proceso comunicativo.
Comunicacin al Congreso Computers, Literature & Humanities (CLiP 2002). El reto de la
internacionalizacin de la comunicacin. Albacete, Diciembre 2002.
SILVESTRI ADRIANA Y BLANCK GUILLERMO. Bantny Vigotski: la organizacin semitica de la
conciencia. Antropos 1993.
GMEZ HERNNDEZ, JOSE ANTONIO y JUDITH LICEA DE ARENAS 2002. La alfabetizacin en
informacin en las universidades. Revista de Investigacin Educativa, 20 (2), 469-486.
MATURANA. R HUMBERTO .1996. La realidad:objetiva o construida?. II. Fundamentos biolgicos
del conocimiento. Anthropos, Mxico 1996.
SALAGER-MEYER, FRANOISE. 2002. Crtica del discurso acadmico: diacrona y cultura.
Conferencia plenaria.I Congreso Internacional de AELFE. Lenguas con Fines Especficos: La
sociedad del conocimiento en el marco internacional. Madrid, Septiembre, 2002.

18

ZONA NORTE: Taller Elaboracin de tems

DISEO DE PRUEBAS EVALUACIN EDUCATIVA


REGLAS PARA ELABORAR TEMS DE
SELECCIN MLTIPLE CON NICA RESPUESTA
Martha C. Rocha Gaona
Carlos A. Pardo Adames

AGRADECIMIENTOS
A todas las personas que tuvieron la deferencia de leer este documento con sentido crtico y formularon
inquietudes y observaciones que nos orientaron para trabajar en su cualificacin: Sara Esperanza Bohrquez,
Libardo Barrera, Myriam Gonzlez, Patricia Pedraza, Ana Atorresi y Martha Castillo.

INTRODUCCIN
El formato de seleccin mltiple con nica
respuesta es uno de los ms utilizados para
formular tems en las evaluaciones educativas
de carcter masivo, especialmente por la
facilidad de su aplicacin y calificacin. Sin
embargo, sera errneo creer que la facilidad es
tambin una caracterstica de su elaboracin;
por el contrario, son muchas las condiciones
que deben ser cumplidas para que un tem se
considere de buena calidad. Elaborar buenos
tems de seleccin mltiple es una labor que
exige mucho compromiso y prctica, y, por
sobretodo, de un profundo conocimiento del
objeto de evaluacin y de la poblacin que va
a ser evaluada, todo esto articulado con una
rigurosa aplicacin de las tcnicas que grupos
de expertos en distintas partes del mundo han
perfeccionando a travs de la prctica.

aplicables a otros formatos de tems. El primer


apartado destaca que la elaboracin de tems es
una de las etapas del diseo de pruebas y, como
tal, debe estar articulada con las dems etapas del
proceso para asegurar la calidad y pertinencia de
la evaluacin; se resalta el requerimiento de que los
elaboradores de tems dominen los planteamientos
del marco conceptual del instrumento, as como
las especificaciones tcnicas del mismo, para
que cada tem aporte su mximo potencial al
propsito de evaluacin planteado. El segundo
apartado recoge las reglas de elaboracin de
tems que gracias al trabajo de grupos de expertos
de instituciones especializadas en diseo de
instrumentos de evaluacin de distintos pases, as
como de comunidades acadmicas estudiosas del
tema, se han decantado a lo largo de los ltimos
30 aos. En el tercer apartado se propone un
ejercicio prctico de anlisis de algunos ejemplos
de tems con fallas de elaboracin, a fin de que
el lector ponga en prctica la apropiacin de las
tcnicas descritas en el apartado 2.

Este documento describe las tcnicas de


elaboracin de tems de seleccin mltiple con
nica respuesta, las cuales, en gran parte, son

Integrante del Grupo de Evaluacin de la Educacin Superior del ICFES - Colombia

19

I. FASES DEL DISEO DE PRUEBAS

necesidad de contar con un instrumento de


evaluacin para unos propsitos particulares1
y, ms all de la fase de aplicacin, trasciende
a las etapas de anlisis de tems, calificacin y
divulgacin de resultados, pues de ellas puede
derivarse informacin importante para cualificar
un nuevo ciclo del proceso.

El proceso de diseo de pruebas integra


diferentes etapas: desde la elaboracin de un
marco que integre los conceptos sobre los
cuales se fundamentar el instrumento hasta
el momento en el cual se considera que ha
alcanzado la calidad suficiente como para
ser aplicado. En realidad puede decirse que
el diseo se origina con el surgimiento de la

La siguiente grfica presenta de manera global


las fases del diseo de pruebas.

1. FUNDAMENTACIN CONCEPTUAL

El objeto de evaluacin (qu se evala?)


Las caractersticas de la poblacin objetivo
(a quin se evala?)
Los usuarios de la evaluacin (a quin le
ser til la evaluacin y de qu manera?)

Es la fase en la cual se aborda conceptualmente el


objeto de evaluacin y, en general, se desarrollan,
desde una perspectiva terica, los elementos
contextuales, legales, disciplinares, metodolgicos,
etc., que darn sustento y significado al proceso
de evaluacin. Entre los elementos que hacen
parte de la elaboracin conceptual estn:

En esta etapa, como en la mayora de las


subsiguientes, el trabajo interdisciplinario y el
concurso de expertos se hace imprescindible
para lograr productos de excelente calidad.
Tratndose del diseo de instrumentos de

El propsito de la evaluacin (para qu la


evaluacin?)

Pardo, C. (1998). El diseo de pruebas para los Exmenes de Estado: un proceso de investigacin permanente. Bogot:
ICFES.
1

20

ZONA NORTE: Taller Elaboracin de tems


evaluacin educativa es usual contar con
expertos en aspectos relacionados con el
objeto de evaluacin (tanto en lo relacionado
con cognicin humana como en lo disciplinar)
y con expertos en diseo de instrumentos de
evaluacin quienes tienen las responsabilidad
de investigar, reflexionar, discutir y establecer
acuerdos para dar respuesta a las preguntas
enunciadas arriba y a otras ms que sea
necesario abordar, y constituir as las bases
conceptuales y los lineamientos tcnicos que
orientarn el trabajo de las dems fases del
proceso.

de tems que van a ser usados. Estos dos


elementos se conocen, respectivamente, como
ESTRUCTURA DE PRUEBA y ESPECIFACIONES
PSICOMTRICAS.
La estructura de prueba es una matriz que
representa la integracin de las distintas
dimensiones del objeto de evaluacin que se
desea medir. Generalmente las evaluaciones
educativas integran, como mnimo, una
dimensin disciplinar y una dimensin referida
a procesos de pensamiento (cognitiva). Ambas
dimensiones pueden ser categorizadas de
distinta forma, de acuerdo con el enfoque terico
que se haya elegido.

2. ESPECIFICACIONES DE PRUEBA

La grfica siguiente muestra un esquema


bsico de una estructura de prueba en la cual
se evala la dimensin cognitiva desde un
enfoque de competencias2. En relacin con la
dimensin disciplinar, el objeto corresponde a la
Biologa y las 3 categoras (clula, organismos
y ecosistemas) pretenden dar cuenta del objeto
de estudio de esta disciplina.

Puede entenderse como una descripcin


detallada de las caractersticas del instrumento,
la cual incluye, por una parte, una desagregacin
del objeto de evaluacin en dimensiones o
categoras susceptibles de ser evaluadas,
conforme a su conceptualizacin previa, y, por
otra, la delimitacin de especificidades tcnicas
del instrumento, tales como longitud y formatos

La conceptualizacin de la dimensin cognitiva competencias en categoras interpretacin argumentacin y proposicin,


as como las categoras de la biologa, corresponden al modelo utilizado por el ICFES en las evaluaciones nacionales de
estudiantes que van a ingresar a la educacin superior. En el anexo 1 se describe la forma en que en el ICFES se han
conceptualizado estas categoras
2

21

La estructura de prueba debe contener,


adems de la explicitacin de las dimensiones
y sus categoras, la descripcin de las tareas
de evaluacin a partir de las cuales ser
posible materializar, en tems, el propsito de
evaluacin; las tareas de evaluacin son la
operacionalizacin del objeto de evaluacin.
Una tarea de evaluacin es la descripcin
precisa de lo que se va a evaluar una celda
de la estructura, entendiendo que cada celda
corresponde a la interseccin entre categoras
de las distintas dimensiones de dicha estructura.
Las tareas de evaluacin deben ser claramente
definidas para orientar la fase de elaboracin de
tems y debe verificarse que sean susceptibles
de exploracin a partir de los formatos de
tems que se planea utilizar. Adems, es
necesario clarificar los niveles de dificultad
que se espera tengan las tareas, considerando
tanto el propsito de la evaluacin como
las caractersticas de la poblacin objetivo.
Idealmente el instrumento debe incluir tareas
de distintos niveles de dificultad de tal forma
que se cubra con holgura la gama de niveles
de habilidad que es probable encontrar en los
evaluados.

Como parte de las especificaciones


psicomtricas se debe clarificar el nmero de
tems que tendr el instrumento en su totalidad
y en sus celdas (es posible que algunas
celdas no quieran o no puedan ser evaluadas
con el instrumento); adems, se define el o
los formatos de tems que sern incluidos y
sus respectivas instrucciones de respuesta;
la distribucin de los tems en la prueba (si se
organizarn en bloques o secciones de acuerdo
con algn criterio de contenido, de forma, de
organizacin logstica, etc.); el tiempo del cual
dispondrn los evaluados para responder la
prueba -y sus partes, si es pertinente aclararloy todos los dems lineamientos que aseguren
una adecuada conformacin o ensamblaje del
instrumento y que contribuyan a clarificar las
condiciones en las cuales debe realizarse la
aplicacin.

3. DESARROLLO DE PRUEBAS
Esta fase cobija todas las acciones orientadas
a obtener el arte final de un instrumento
de evaluacin, listo para su aplicacin,
que corresponda a los propsitos y a las
especificaciones, definidos en las fases
anteriores.

A manera de ejemplo, una de las celdas


del grfico anterior muestra el cruce entre
la categora clula de la dimensin
disciplinar y la categora argumentacin
de la dimensin procesos de pensamiento;
los evaluadores deben hacer explcitas las
acciones, susceptibles de evaluacin a travs
del instrumento que se est elaborando, que
permitirn inferir si el evaluado ha desarrollado
niveles de argumentacin (en el sentido en el
cual se haya definido argumentacin en el
marco de fundamentacin) esperables (para el
propsito de la evaluacin) en lo que refiere al
saber sobre la clula (en el sentido en el cual
se haya definido saber sobre clula en el
marco de fundamentacin conceptual). En la
celda se describe una de las mltiples tareas de
evaluacin posibles de ser incluidas como parte
del instrumento. Es deseable plantear tareas de
evaluacin en forma un tanto general y que sean
los tems los que reflejen las especificidades de
cada tarea.

La elaboracin de tems constituye una labor


trascendental dentro de esta fase y, dado que
a travs de ella se materializa el propsito de
evaluacin, exige la ms alta calidad tcnica.
Por tal razn, es indispensable que quienes
participen en la elaboracin de tems (no
necesariamente sern las mismas personas
que trabajaron en la fase anterior) conozcan
con profundidad las consideraciones del marco
de fundamentacin conceptual, las intenciones
evaluativas subyacentes en la estructura de
prueba y las especificaciones psicomtricas del
instrumento que se pretende desarrollar.
Es fundamental adems destacar que el
propsito de esta fase es producir un instrumento
de evaluacin y no un agregado de tems. Esta
diferencia es crucial porque pretende asegurar
que el equipo desarrollador de los tems se
comprometa alrededor de un propsito comn
22

ZONA NORTE: Taller Elaboracin de tems


y adelante un trabajo articulado, armnico, con
el cual se logre que cada tem verdaderamente
aporte a la intencin evaluativa fijada.

de ajuste del instrumento en trminos del nivel


de dificultad de los tems elaborados (establecer,
por ejemplo, si los tems resultaron demasiado
fciles o demasiado difciles para la poblacin).
Las condiciones de la aplicacin piloto deben
guardar la mayor similitud posible con las
condiciones que tendr la aplicacin definitiva
(edicin del instrumento, instrucciones para
responder, tiempo disponible, etc.).

Las tcnicas para la elaboracin de tems


son objeto del captulo II de este documento;
no obstante es pertinente mencionar aqu
que el proceso de elaboracin de tems exige
dinmicas de reflexin y discusin entre pares,
as como el apoyo de expertos, con los cuales
se busca garantizar la calidad y pertinencia de
cada tem. Despus de elaborar los tems, se
ensambla el instrumento de acuerdo con las
especificaciones psicomtricas y se somete
a una revisin final, generalmente por parte
de expertos en evaluacin y en el objeto de
evaluacin, que sirve al doble propsito de
controlar calidad evaluativa y verificar adecuadas
condiciones editoriales del instrumento.

Una alternativa a la estrategia de realizar


una aplicacin piloto consiste en someter el
instrumento a lo que se denomina un juicio
de expertos, sobre cuya metodologa de
implementacin existe literatura disponible.
En forma breve, un juicio de expertos es un
procedimiento a travs del cual un equipo de
personas, expertas en el objeto de evaluacin y
en procesos de evaluacin, califican los tems de
un instrumento, a la luz de las consideraciones
del marco de fundamentacin conceptual, en
trminos de su coherencia con los propsitos de
la evaluacin y de su pertinencia con la estructura
de prueba, as como de las especificaciones
psicomtricas y las caractersticas de la
poblacin objetivo; adems, valoran su grado
de dificultad, su claridad y ofrecen sugerencias
para su afinamiento. Ya sea a travs de la
aplicacin piloto o de un juicio de expertos, el
instrumento debe ser sometido a esta fase de
revisin y ajuste con el propsito de asegurar su
calidad y, por ende, la de los datos (respuestas)
recogidos a travs de su aplicacin; as, fase tras
fase del proceso, se consolidan los cimientos
sobre los cuales se funda la validez del mismo.

En esta etapa se prepara tambin la


documentacin que servir para orientar a la
poblacin objetivo sobre las caractersticas
del instrumento: temticas que se abordarn,
formatos de tems que se usarn conviene
incluir algunos ejemplos de tems-, nmero
de tems que debern responder y toda la
informacin que se considere prudente dar a
conocer sobre el proceso adelantado para su
elaboracin; tambin se informa a la poblacin
sobre las condiciones de la aplicacin y sobre la
forma y el momento en que se darn a conocer
los resultados de la evaluacin. Obviamente
esta documentacin debe ser divulgada entre la
poblacin objetivo con suficiente anticipacin al
momento de la aplicacin.

5. APLICACIN (DEFINITIVA)

4. APLICACIN PILOTO

Es la fase en la cual la poblacin objetivo responde


a los tems del instrumento de evaluacin
elaborado. Su realizacin, dependiendo del
tamao y la ubicacin geogrfica de la poblacin
objetivo, puede demandar la disposicin de
considerable cantidad de recursos humanos,
fsicos, materiales, tecnolgicos, etc. La
logstica de aplicacin depende del modelo de
aplicacin que previamente se haya definido.

En esta fase el instrumento es aplicado a


una muestra representativa de la poblacin
objetivo para estimar indicadores estadsticos
que permitan corroborar la calidad tcnica del
instrumento y el grado de pertinencia de los
tems para la poblacin. Esta aplicacin tambin
permite aproximarse a la elaboracin de una
escala de calificacin y reconocer necesidades
23

Segn el medio para evaluar: lpiz y papel


o por computadora; segn el calendario de
aplicaciones: por oferta o por demanda;
segn la cobertura poblacional: censal o a una
muestra representativa de la poblacin; segn
la organizacin de aplicadores y centros de
aplicacin: centralizada o descentralizada.

Se dispone de una gama de indicadores


estadsticos que permiten valorar la calidad de
los tems; no obstante, es importante resaltar
que el anlisis de tems trasciende la simple
verificacin del cumplimiento de criterios
estadsticos; su propsito es facilitar y orientar
la toma de decisiones en cuanto a la seleccin
de tems cuyo funcionamiento brinde confianza
para proceder o bien al proceso de armada
de la prueba definitiva o bien al proceso de
calificacin. No necesariamente un tem que
exceda los lmites establecidos como criterio de
aceptacin de un indicador estadstico es un tem
que debe descartarse del proceso; el evaluador
que conoce a profundidad el instrumento, sus
especificaciones y propsitos y que conoce,
adems, a la poblacin objetivo sabr valorar
en qu casos el tem debe ser descartado y en
qu casos debe mantenerse.

Cualquiera que sea ese modelo de aplicacin,


la equidad es una condicin indispensable
del proceso. La divulgacin oportuna de los
materiales gua para la presentacin de la
prueba, los cuales fueron preparados en la fase
de desarrollo del instrumento, permitirn que los
evaluados conozcan con anticipacin la situacin
de evaluacin: los requerimientos, condiciones
y propsitos del proceso. Igualmente, durante
la fase de aplicacin, debe asegurarse que
todos los evaluados reciban las mismas
instrucciones para abordar el instrumento y que
tengan igualdad en cuanto a las condiciones
de espacio, tiempo, iluminacin, materiales de
trabajo, etc.

Los indicadores utilizados para el anlisis


de tems y la forma en que ellos se calculan
depende del modelo de procesamiento de
datos que se utilice. En evaluacin se cuenta
fundamentalmente con dos modelos: la Teora
Clsica de los Test y la Teora de Respuesta al
tem, sta ltima con mltiples ventajas sobre la
primera. Entre los indicadores ms comnmente
usados para evaluar tems estn: el nivel de
dificultad, el grado de ajuste al modelo, la
distribucin de respuestas entre las opciones
de respuesta, la correlacin tem-medida y el
error de medicin; la valoracin del instrumento
se realiza por lo general con base en datos
como el promedio y la desviacin estndar de
puntuacin, el ajuste al modelo, la confiabilidad
y el error de medicin.

6. ANLISIS DE TEMS Y DE PRUEBA


Esta fase en realidad se realiza en dos
momentos: a) luego de la aplicacin piloto y b)
luego de la aplicacin definitiva. En el primer
caso el fin es seleccionar los tems que mejor
respondan al propsito de la evaluacin y
conformar con ellos el instrumento definitivo;
tambin es fundamental esta fase para tomar
decisiones en relacin con posibles ajustes a los
tems para su futura aplicacin. En el segundo
caso, el anlisis de tems permite decidir cules
tems incluir y cules excluir para la generacin
de escalas de calificacin.

7. ESCALAS DE CALIFICACIN

Luego de la aplicacin (piloto o definitiva) se toma


como insumo las respuestas de los evaluados
para calcular indicadores estadsticos que
permiten valorar si el instrumento como totalidad
y cada uno de los tems que lo constituyen fueron
abordados segn lo esperado por quienes
elaboraron el instrumento.

La asignacin de valores de medida, de


acuerdo con ciertas reglas, a caractersticas
del mundo real, se suele denominar escala de
medicin3. La construccin de escalas es la fase
en la que se definen las reglas de asignacin
de esos valores, tendientes a asegurar que

Fenton, N.E. y Pfleeger, S.L. (1997) Software metrics. A rigurous and practical approach. Boston: PWS Pub.

24

ZONA NORTE: Taller Elaboracin de tems


las interpretaciones de los resultados de la
evaluacin sean comprensibles y pertinentes.

de inters (por ejemplo: institucin, municipio,


regin, etc.). Un reporte o informe de evaluacin
debe ser veraz, claro y orientador; esto es, debe
entregar informacin que sea consistente con
el propsito de la evaluacin y esta informacin
debe posibilitar al evaluado reconocer su
desempeo en el proceso y orientarle para
planear acciones de cualificacin necesarias y
pertinentes.

Una escala de calificacin permite asignar


una puntuacin particular a cada evaluado, de
acuerdo con sus respuestas a los tems del
instrumento. Es importante reconocer que cada
tem tiene asociado un nivel de dificultad particular
que debera ser considerado en el momento
de asignar la calificacin a cada evaluado; los
modelos modernos de procesamiento de datos
se fundamentan en formulaciones matemticas
que consideran el nivel de dificultad de
cada tem para producir una calificacin. Es
deseable que las escalas generadas permitan
la comparabilidad de resultados entre distintas
aplicaciones del mismo instrumento, as
como entre los miembros de la poblacin
objetivo en una misma aplicacin; para esto es
necesario implementar procedimientos tcnicos
especficos (equating/comparabilidad) sobre
los cuales existe abundante literatura disponible
pero no son objeto de este documento.

Una vez producidos los reportes, se procede


a implementar las estrategias de divulgacin,
las cuales debern ser adecuadas a las
caractersticas de la poblacin objetivo (nivel
acadmico, ubicacin geogrfica, acceso a
medios) y a la disponibilidad de recursos por
parte del evaluador.
Es usual que el evaluador adquiera un compromiso
de confidencialidad con el evaluado que le
obliga a mantener bajo reserva los resultados
individuales. Esto no constrie posibilidades de
preparar y dar a conocer reportes globales de la
poblacin objetivo y sub-agrupaciones de sta,
para atender requerimientos de informacin de
otros usuarios del proceso.

8. PRODUCCIN Y DIVULGACIN DE
RESULTADOS
Es una fase crucial del proceso en la cual
los evaluados -y los dems usuarios de la
informacin derivada de la evaluacin- pueden
llegar, o no, a reconocer a ste como un
proceso til, importante e incluso necesario. Un
compromiso importante de todo evaluador debe
ser que los evaluados y dems usuarios de la
evaluacin realicen interpretaciones adecuadas
de los resultados presentados en los informes
que prepara; por esta razn, el diseo de
informes es una labor que amerita dedicacin y
anlisis crtico a fin de lograr la mayor claridad
en la comunicacin de los resultados.

II. DESARROLLO DE PRUEBAS


Un instrumento de evaluacin o prueba es
un conjunto intencionalmente articulado de
tems a travs de cuya aplicacin se infiere el
desempeo de quienes son evaluados, en
relacin con el objeto de evaluacin. Una prueba
es ms que la simple suma de los tems que
la conforman, aunque su poder evaluativo se
deriva de la potencia para evaluar que tengan
todos y cada uno de ellos. Se espera que un
instrumento de evaluacin sea una unidad
evaluativa completa, armnica, que responda
efectivamente a los propsitos planteados en
su marco de fundamentacin conceptual y a las
caractersticas definidas en las especificaciones
de prueba. Siendo as, la elaboracin de tems
se entiende como una fase crucial en la cual se
materializan esos propsitos y caractersticas.

Producir los resultados consiste en aplicar


las escalas de calificacin -definidas en la
etapa previa- a la poblacin evaluada, con el
fin de generar bases de datos que nutran los
reportes de resultados. Estos reportes pueden
ser individuales y/o agrupados segn criterios
25

Producir esa unidad evaluativa integral que es


la prueba demanda planeacin, organizacin
y permanente revisin y cualificacin
del producto. No se logra a partir de la
agregacin, a posteriori, de tems elaborados
aisladamente, aunque aparentemente stos
tengan relacin con el objeto de evaluacin.
Cada tem debe ser construido con la intencin
clara de evaluar una tarea que es parte
integral del objeto de evaluacin y que est
descrita dentro de la estructura de prueba,
complementando a los dems tems; es decir,
cada tem debe constituirse en pieza esencial
del instrumento.

evala competencias busca evidenciar lo que el


evaluado es capaz de hacer con lo que sabe, en
contraste con un tem tradicional que buscara
verificar cunto l sabe.
No es simple realizar la caracterizacin de un
tem que evala competencias frente a uno
tradicional; no obstante, parecer haber cierto
nivel de acuerdo en que el tem tradicional es
poco contextualizado y, en muchas ocasiones,
soslaya aspectos como la pertinencia o la utilidad
en la vida cotidiana de aquello por lo cual indaga;
un tem tradicional comnmente se inspira
en visiones disciplinares fundamentalmente
temticas y pondera procesos como el recuerdo
de categoras propias de dicha visin disciplinar
(definiciones, frmulas, acontecimientos, etc.),
ms que en la capacidad para analizar tales
categoras y aplicarlas en la resolucin de
problemticas.

Hacer tems de buena calidad implica, adems,


conocer las caractersticas de los distintos
formatos de tems susceptibles de utilizacin,
aplicar las reglas para su correcta elaboracin y
evitar los factores que pueden alterar su validez.
Quizs, por todo esto, elaborar tems ajustados
a las especificaciones de prueba es la tarea ms
difcil en el proceso evaluativo4.

De otra parte, un tem para evaluar competencias


o un tem de competencias, como suele
denominrsele, es contextualizado, es decir,
se plantea a partir de situaciones o problemas
reales, pertinentes e interesantes y ofrece
informacin que no se considera obligatorio
conocer de memoria (especialmente en
la actualidad, cuando son diversas las
posibilidades de acceso a la informacin)
y que permite circunscribir el problema
alrededor de ciertas variables o condiciones
de inters; en el tem de competencias el
contexto sirve para situar conceptualmente
al evaluado. Con un tem de competencias
se pretende valorar la capacidad de usar el
conocimiento sobre un tema, teora o hecho
para resolver problemticas, para plantear
hiptesis, para proponer explicaciones, para
interpretar, utilizar y evaluar ese tema, teora o
hecho bajo circunstancias distintas, etc. As,
elaborar un tem de competencias supone una
postura educativa en la cual el conocimiento
es objeto de conocimiento y se considera que
es un objeto til, susceptible de anlisis y en
permanente transformacin. Por eso, en los

1. CONTENIDO DE LOS TEMS


La estructura de prueba y, especficamente,
las tareas de evaluacin definidas en ella
orientan al elaborador en relacin con
cules son los aspectos tpicos, temas,
problemticas, etc.- sobre los que debe
formular sus tems. Actualmente los procesos
de evaluacin educativa tienden hacia el
reconocimiento de competencias ms que a
la verificacin de la apropiacin de datos o
contenidos aislados.
Si bien es cierto que el concepto de competencias
es complejo y polismico, desde una postura, ms
o menos generalizada en el campo de la medicin
y la evaluacin, se puede decir que elaborar
un tem para evaluar competencias supone
indagar si ha habido un proceso de formacin
que haya potenciado en el evaluado el uso del
conocimiento, ms que la mera acumulacin
del mismo; dicho en otros trminos, el tem que

Hambleton, R. y Zaal, J. (1994). Advances in educational psychological testing. Boston: Kluwer Academic Publishers.

26

ZONA NORTE: Taller Elaboracin de tems


tems de competencias se suele indagar por el
cmo?, por el por qu?, por el para qu?,
por el qu pasara si...?, por el qu significa?,
ms que por el qu?, cundo? y quin?
Un tem de competencias debe promover la
reflexin sobre el conocimiento y no la repeticin
del conocimiento.

2. FORMATOS DE TEMS

En un instrumento es posible incluir variedad de


formatos. Cada uno de ellos tiene unos requisitos
particulares de elaboracin y ofrece distinto
potencial evaluativo. Es importante, eso s, que
cada formato utilizado en un instrumento est
debidamente acompaado de las instrucciones
que orientan la manera de responderlo.
Adems, por consideracin con el evaluado,
generalmente se procura incorporar un nmero
significativo de tems de un mismo formato, de
tal manera que la lectura de instrucciones que a
veces puede resultar dispendiosa, dependiendo
del formato- no desplace la intencin evaluativa
central. Es importante reconocer que los

formatos determinan en gran parte el proceso


de calificacin. Los tems de seleccin mltiple
con nica respuesta, por ejemplo, se califican
como correcto o incorrecto; 1 0, dado que
slo admiten una opcin como respuesta; otros
formatos de seleccin admiten calificacin de
crdito parcial (cada opcin tiene un peso en
la calificacin); los formatos de produccin de
respuesta (por ejemplo los ensayos) exigen
el establecimiento de criterios de calificacin
respaldados en el saber sobre el objeto de
evaluacin y demandan juiciosos procesos de
entrenamiento a los calificadores para asegurar
precisin y equidad en la calificacin.

Como su nombre lo indica corresponde a la


forma en la cual se estructuran los tems. La
siguiente grfica muestra una clasificacin de
formatos de tems basada en lo que un evaluado
hace cuando se enfrenta a un tem: seleccionar
o producir una respuesta.

27

En este documento se trabaja esencialmente


la tcnica de elaboracin de tems del formato
seleccin mltiple con nica respuesta; de
cualquier manera, es de sealar que muchas de
las reglas para su elaboracin son pertinentes
tambin para otros formatos.

3. PARTES DE UN TEM DE SELECCIN


MLTIPLE CON NICA RESPUESTA

CONTEXTO
Es la informacin que sita conceptualmente
al evaluado. Provee elementos necesarios y
suficientes para focalizar la tarea de evaluacin.
En un sentido amplio, el contexto abarca todo
el saber previo del evaluado sobre el objeto
de evaluacin; no obstante, en el proceso
de elaboracin de un tem, es usual que el
evaluador encuentre pertinente y necesario
presentar un texto u otro tipo de informacin
que contribuya a precisar las condiciones
del problema, las variables que es prudente
considerar, o para ubicar en el tiempo y en
el espacio la problemtica, etc. El contexto
puede ser un texto por ejemplo, en tems de
comprensin de lectura-, una grfica, un dibujo,
una tabla o cualquier otra forma de presentacin
de la informacin a partir de la cual se deriva
el enunciado. La seleccin o elaboracin del
contexto es una labor exigente en cuanto su

propsito es justamente contextualizar y no


confundir al evaluado; debe estar articulado con
la tarea de evaluacin y no debe convertirse en
factor que disminuya del tiempo disponible para
responder; es decir, su extensin y complejidad
deben considerarse, tambin, a la luz de las
condiciones logsticas de la evaluacin.

Las partes bsicas de un tem de seleccin mltiple


son el contexto, el enunciado y las opciones de
respuesta, como se muestra en el grfico.

ENUNCIADO
Es el planteamiento, propiamente dicho, de la
problemtica que se espera sea resuelta por el
evaluado5. En el enunciado se hace explcita la
tarea de evaluacin y, por tanto, dirige el esfuerzo
del evaluado para generar o seleccionar una
respuesta, por lo cual es fundamental que est
escrito en lenguaje claro y preciso.
Tradicionalmente los enunciados de tems de
seleccin mltiple se plantean en forma de
pregunta, o como una proposicin. En el primer

AERA, APA, NCME. (1999). Standards for educational and psychological testing. Washington: AERA.

28

ZONA NORTE: Taller Elaboracin de tems


caso, las opciones se redactan como respuestas
a la pregunta; en el segundo caso, el enunciado
constituye la primera parte de una proposicin
y cada una de las opciones debe completar
coherentemente el enunciado.

opcin de respuesta es ponderada de acuerdo


con su grado de validez o pertinencia; es lo
que se denomina tems de crdito parcial, y su
elaboracin supone que todas las opciones son
respuestas vlidas, aunque cada una en distinto
grado, dependiendo de diferentes condiciones
planteadas o posibles de inferir del contexto y del
enunciado. Se busca con este tipo de tems, ms
que valorar, en una categorizacin dicotmica,
si el evaluado respondi o no respondi a la
tarea de evaluacin, que sea posible identificar
perfiles o estilos de desempeo.

La utilizacin de una u otra forma de plantear


el enunciado es decisin del evaluador y
generalmente tiene que ver con la facilidad para
redactar, tanto el enunciado como las opciones.
Conviene tener en cuenta, eso s, que la redaccin
en forma de pregunta resulta mucho ms clara para
poblaciones infantiles; es decir, los nios parecen
responder mejor a la tarea de evaluacin cuando
el enunciado es una pregunta que cuando es una
proposicin incompleta. Cualquiera sea la forma
en que se redacte el enunciado, es importante
verificar su claridad, precisin y articulacin con
las opciones de respuesta.

4. REGLAS PARA LA ELABORACIN DE


TEMS DE SELECCIN MLTIPLE CON
NICA RESPUESTA
La experiencia propia de varios aos en el
desarrollo de instrumentos de evaluacin,
combinada con la de entidades extranjeras
dedicadas a la misma labor y con los hallazgos
de numerosos estudios realizados sobre las
tcnicas que conducen a mejorar la calidad de los
tems6 7 8 9 10 ha hecho posible que en la actualidad
se cuente con un conjunto de reglas que orientan
la correcta elaboracin de tems. A continuacin
se presenta un compendio de dichas reglas.

OPCIONES DE RESPUESTA
Las opciones son posibles respuestas a la
problemtica planteada en el enunciado. En
el formato de seleccin mltiple con nica
respuesta, como su nombre lo indica, slo una
de estas opciones es verdaderamente pertinente
y completa para solucionar el problema tarea
de evaluacin-; las dems opciones, aunque
pueden ser vistas como respuestas plausibles
por los evaluados que no dominan la tarea de
evaluacin, no responden en forma completa o
pertinente a la problemtica formulada.

ASPECTOS GENERALES
No es recomendable trabajar contrarreloj cuando
se busca tener un instrumento de calidad. Haga
una programacin juiciosa de todas las fases
del diseo del instrumento y, particularmente, de
la fase de elaboracin de tems contemplando
tiempos de revisin, ajustes y edicin.

Otros formatos de seleccin admiten ms


de una opcin como respuesta vlida. En
la actualidad, cada vez con ms frecuencia,
los instrumentos de evaluacin educativa
incorporan formatos de tems en los cuales cada

Conforme el equipo de trabajo con base en las


competencias de cada miembro y en su saber

Haladyna y Downing. (1989). A taxonomy of multiple choice tem writing rules. En Apply Measurement in Education. Vol. 1.

Haladyna, T. (1994). Development and validatin multiple choice test tems. New Jersey: Lawrence Earlbaum Associates.

Cheung, D. Y Bucat, R. (2002). How can we construct good multiple choice tems? Hong Kong: Sciens and Technology
Education Conference.
8

ICFES. (2004). Estndares para la construccin de pruebas. Grupo de Evaluacin de la Educacin Superior. Bogot:
ICFES.
9

Cohen, A. y Woollack, J. (2004). Helpful tips for creating reliable and valid classroom test. En Handbook on Test
Development. U. Wisconsin.
10

29

sobre el objeto de evaluacin; el dominio en


la disciplina o campo que se evaluar debe
combinarse con el conocimiento en medicin
y evaluacin. En lo posible, cuente con el
apoyo de alguien con experiencia en el tema.

cules son algunas de las situaciones que


llevan a percibir los tems como confusos11;
entre stas estn:
a) Contenido trivial

Planee sesiones de induccin para quienes


vayan a elaborar tems y asegrese de que
comprenden el propsito del instrumento y los
dems planteamientos bsicos del marco de
fundamentacin y de las especificaciones de
prueba. Si se trata de personas sin experiencia,
deben ser entrenados adems en las tcnicas
de elaboracin de tems.

b) Presencia de informacin irrelevante


c) Presentacin ambigua de las opciones de
respuesta
d) Discriminacin muy fina difcil de percibir
entre las opciones de respuesta
e) Presentacin de informacin en modo
distinto a como ha sido aprendida por la
poblacin evaluada, dentro de su proceso
educativo.

Un buen tem, por lo general, ha experimentado


toda una metamorfosis desde su versin
original. Durante la fase de elaboracin de
los tems, realice sesiones de socializacin o
anlisis conjunto de los tems elaborados por
cada miembro del equipo, con el fin de que
cada uno tenga oportunidad de hacer aportes
a la cualificacin de todos los tems (tanto en
lo que refiere a la forma como al contenido).

Cada tem debe corresponder a una tarea


de evaluacin definida en la estructura de
prueba.
Evite evaluar el mismo aspecto especfico con
varios tems. Aproveche cada tem para hacer
cada vez ms completa la evaluacin.

Evite usar eufemismos y prefiera un lenguaje


directo, sin sacrificar el nivel tcnico y
acadmico del proceso. La claridad y
concrecin en el lenguaje debe ser una
consideracin permanente; utilice dibujos,
grficos o tablas slo si estos en realidad
aportan a la comprensin de la tarea de
evaluacin; tenga en cuenta el tiempo que el
evaluado debe emplear para leer instrucciones,
contextos, enunciados y opciones, y el tiempo
total del cual dispone para responder.

Plantee una sola problemtica en cada tem.


Evite tems que incluyan posiciones
ideolgicas o prejuicios; tenga en cuenta
que las proposiciones prejuiciosas pueden
resultar en una ofensa para cualquiera de los
evaluados. Se excepta esta recomendacin
si justamente dichas posiciones son el objeto
de evaluacin; entonces ser obligatorio
incluirlas.
El vocabulario utilizado debe ser adecuado
para la poblacin objetivo.

Asegrese de que en ninguna parte del


instrumento (portada, textos, instrucciones,
tems, etc.) haya errores de ortografa, de
gramtica o de puntuacin, que no se
incluya incorrectamente abreviaciones, citas,
nombres, cifras, fechas, etc.

Cada tem debe ser independiente y no


proveer informacin para responder a otros.
No utilice tems que aparezcan en libros,
revistas u otros documentos, como base para
sus tems. Elabore tems originales.
Evite tems en los cuales se indague la opinin
(parecer no argumentado) del evaluado (a
menos que el instrumento justamente pretenda
servir para un sondeo de opinin).

REGLAS SOBRE EL CONTENIDO DE LOS


TEMS
Evite elaborar tems que confunden al
evaluado. Diferentes estudios han establecido

11

Roberts, D. (1993). An empirical studying on the nature of trick questions. Journal of educational measurement. Vol 30.

30

ZONA NORTE: Taller Elaboracin de tems


Evite plantear tems cuya respuesta vlida se
determine segn la opinin de quien la elabora.

- Ninguno de los anteriores


- A y B son correctas (o cualquier combinacin
de opciones)
- No s
Redacte las opciones en forma positiva, es
decir, evite negaciones. Si debe colocar una
negacin, resltela (use negrilla o maysculas
sostenidas).

Balancee la complejidad de los tems para que


el instrumento cubra los niveles de habilidad de
la poblacin objetivo, es decir, la prueba debe
incluir tems de dificultad alta, media y baja.
REGLAS SOBRE CONSTRUCCIN DEL

ENUNCIADO
Si plantea el enunciado en forma de proposicin
incompleta asegrese de usar conjugaciones
verbales, gnero y nmero adecuados para
las opciones de respuesta que plantear. Si
lo escribe en forma de pregunta asegrese de
usar adecuadamente signos de interrogacin
y la estructura gramatical de una pregunta.

No repita en las opciones frases contenidas


en el enunciado.
Elabore tems con 4 opciones de respuesta.
Elaborar opciones plausibles es dispendioso;
seguramente ganar calidad en las que
redacte si no son demasiadas. Hay referencia
de distintos estudios que analizaron la cantidad
de opciones tiles para los propsitos de
evaluacin12 13; si bien no existe consenso
alrededor de un nico nmero de opciones,
se encuentra a menudo conveniente, en
cuanto a facilidad de redaccin y capacidad
de discriminacin, trabajar con 4 opciones;
para poblaciones de infantes puede ser
conveniente usar 3 opciones.

Presente en el enunciado la tarea de evaluacin.


Escriba con claridad.
Evite texto excesivo.
Redacte el enunciado en forma positiva; es
decir, evite negaciones.

Evite en las opciones el uso de adverbios


como:

REGLAS SOBRE CONSTRUCCIN DE OPCIONES


DE RESPUESTA
Asegure la concordancia gramatical entre la
proposicin del enunciado y cada opcin.

-
-
-
-
-

Organice las opciones en un orden lgico


(alfabtico, longitud, etc.) o numrico.
Mantenga la independencia entre las opciones.
stas no deben solaparse o intersectarse y no
deben ser sinnimas.

Siempre
Nunca
Totalmente
Absolutamente
Completamente

La posicin de la opcin vlida debe


balancearse entre todos los tems del
instrumento. Es recomendable que aparezca
proporcionalmente en cada posicin posible.

Refirase en todas las opciones al problema


planteado en el enunciado. Evite opciones
fcilmente descartables.

Evite que la opcin vlida pueda ser identificada


fcilmente por contraste con las dems opciones,
por alguna de las siguientes situaciones:

Elabore opciones de respuesta de longitud


similar.

- tener la mayor longitud


- ser la proposicin de mayor precisin o
imprecisin

Evite colocar como opcin:


- Todos los anteriores

12

Haladyna, T. y Downing, S. (1995). How many options is enough for a multiple choice test tem. New Jersey: LEA.

13

Pardo, C. (1994). Nmero til de opciones de respuesta en las pruebas Saber. Documento de trabajo. Bogot: ICFES.

31

- estar redactada en un tipo lenguaje diferente


(tcnico o comn)
- tener el mayor nivel de generalizacin o de
particularidad
- tener las mismas palabras que el enunciado
- referirse a una problemtica o tema diferente

y decisiones sean verdaderamente posibles de


derivar de la evaluacin que realiza.
La rigurosidad acadmica y tcnica en la
elaboracin de los tems (y, por supuesto, en
las dems etapas del diseo del instrumento)
aporta para que los resultados de la evaluacin
sean pertinentes con su propsito. Las reglas de
elaboracin de tems descritas en este documento
tienen la pretensin de orientar al evaluador para
que los tems que elabora evalen realmente el
objeto de evaluacin que se pretende; en este
sentido, la aplicacin de tales reglas contribuye a
consolidar la argumentacin alrededor de que lo
que los resultados indican es verdadero.

Justifique adecuadamente cada una de las


opciones para garantizar que slo hay una vlida
y que las dems son plausibles para quienes no
dominan completamente la tarea de evaluacin

5. SOBRE LA VALIDEZ
El concepto moderno de la validez es global, a
diferencia del clsico que consideraba distintos
tipos de validez. Se reconoce que la validez
no es del instrumento, sino de las inferencias
e interpretaciones realizadas a
partir de las
puntuaciones obtenidas en un proceso de
evaluacin.

En resumen, en lo que concierne a la elaboracin


de tems, los siguientes son factores que afectan
negativamente la validez:
La tarea a la cual se enfoca el tem no es
relevante para la evaluacin del objeto definido
en el marco de fundamentacin.

La validez se entiende como un juicio evaluativo


del grado en el cual la evidencia emprica y
terica sustentan la pertinencia y conveniencia
de las inferencias acerca de los resultados en un
instrumento de medicin, as como las acciones
que se realizan a partir de dichos resultados14.

En el tem se incluye informacin que la facilita o la


dificulta, ms all del propsito de evaluacin.
Ahora bien, en la fase de elaboracin de tems
no basta con aplicar las reglas de elaboracin
para contribuir a la validez; es necesario
garantizar que quienes van a ser evaluados
con dichos tems no lleguen a responderlos
correctamente por circunstancias distintas a su
propia capacidad o competencia.

Dicho de otra forma, la validez hace referencia


a qu tan fuertes son los argumentos y las
evidencias que respaldan las interpretaciones
hechas acerca del objeto de evaluacin (por
ejemplo, la competencia) a partir de los resultados
obtenidos. En tal sentido, la validez compromete
a todas las etapas del diseo de pruebas: desde
la definicin y caracterizacin del objeto de
evaluacin hasta la divulgacin de resultados.

As, entonces, otro factor determinante de la


validez es la confidencialidad del instrumento,
antes de su aplicacin. Con ello se asegura que
las condiciones en las cuales los evaluados
se enfrentan a la aplicacin del instrumento
son equitativas y, por ende, que las escalas de
calificacin que se generen y los resultados que
se divulguen reflejan genuinamente el objeto de
evaluacin. Los anexos 2 y 3 son ejemplos de
mecanismos utilizados en el ICFES con miras a
guardar la confidencialidad de los tems durante
el proceso de elaboracin.

El evaluador debe reconocer que el usuario


directo de la evaluacin el evaluado-, as como
los usuarios indirectos de la misma, utilizarn los
resultados para comprender y analizar procesos,
para emitir juicios, para tomar decisiones, etc.,
y, por tanto, es su responsabilidad tica y
social asegurarse de que tales anlisis, juicios

14

Messick, S. (1989). Validity. In R.L. Linn (Ed.), Educational measurement (3rd ed., pp. 13-103). New York: Macmillan.

32

ZONA NORTE: Taller Elaboracin de tems

III. EJERCICIO PRCTICO PARA


APLICAR LAS REGLAS DE
ELABORACIN DE TEMS

B. 2
C. 3
D. 4

Una vez trabajado este documento y lograda la


familiarizacin con las reglas de elaboracin de
tems, se sugiere realizar, preferiblemente en grupo,
la lectura de los siguientes ejemplos de tems, con
el fin de identificar, en cada uno de ellos: a) qu
se pretende evaluar, b) cules son las reglas de
elaboracin de tems que se aplican correctamente,
c) cules reglas se pasaron por alto y, despus de
este proceso, proponer conjuntamente formas
de cualificacin de cada tem; para esto, el grupo
de elaboradores deber adelantar reflexiones y
discusiones, con base en argumentos acadmicos
y tcnicos, sobre el propsito de evaluacin que
tendran dichos tems.

tem 3.
El mayor componente del gas natural que se
usa en los hogares en Hong Kong es
A. Monxido de carbono
B. Nafta gaseosa
C. Hidrgeno
D. Metano

tem 4.
El zinc es mejor que el latn si se quiere evitar el
xido en una pieza de hierro por electroplatinado
porque

Tenga en cuenta que no hay una frmula nica


y universal para mejorar la calidad de un tem, ni
hay una nica versin que pueda considerarse
exclusivamente correcta; cada grupo de
evaluadores que realice el ejercicio podr llegar
a plantear diferentes versiones, todas de mucha
calidad. Por lo anterior, en este documento no
se incluye una propuesta de ajuste; adems,
intencionalmente se ha seleccionado un grupo de
tems redactados con un enfoque tradicional (no
de competencias) dado que, tanto su enunciado
como sus opciones, son menos elaboradas y
extensas, lo cual facilita el ejercicio propuesto.

A. El zinc es ms barato que el latn


B. El latn es txico
C. El zinc puede prevenir que el hierro entre en
contacto con el agua y el aire
D. El zinc es ms reactivo que el hierro y por
lo tanto se previene la oxidacin aunque el
electroplatinado se rompa.

tem 5.
Para la mayora de los plsticos es cierto que
A. No reaccionan con cidos
B. Se pueden moldear fcilmente

tem 1.
Los extinguidores con base en agua NO son
apropiados para apagar fuegos de

C. Son inflamables
D. Todas las anteriores

A. Alcohol
B. Algodn

tem 6.
Si una persona consume exceso de
carbohidratos es probable que la temperatura
de su cuerpo

C. Papel
D. Madera

A. Se incremente

tem 2.
Las bebidas gaseosas como la coca-cola tienen
un pH cercano a

B. Permanezca igual
C. Se decremente
D. Se altere

A. 1
33

tem 8.
La investigacin ha encontrado que asignar
tareas en el proceso educativo es

tem 7.
El mejor equipo de ftbol en la liga colombiana
es
B. Nacional

A. Una estrategia de enseanza efectiva si la


tarea es relevante para el aprendizaje

C. Santaf

B. Mejor, mientras ms tareas se asignen

D. Cruzeiro

C. til, si se asignan todos los das, excepto


el viernes

A. Millonarios

D. Innecesaria si se ensea bien

ANEXO I
EJEMPLO DE CARACTERIZACION DE COMPETENCIAS
EN EL ICFES15
Interpretar
Hace referencia a las acciones que realiza una persona, con el propsito de comprender una situacin
en un contexto especfico. La interpretacin implica dar cuenta del sentido de un texto, de una
proposicin, de un problema, de un evento o de una grfica, mapa, esquema o simbologa propia
de la disciplina objeto de evaluacin, e involucra acciones tales como:
Identificar las variables involucradas en una situacin problema y sus relaciones
Describir el estado, las interacciones o dinmica de un sistema, en trminos grficos o simblicos.
Traducir informacin de un sistema de representacin a otro (identificar el esquema ilustrativo
correspondiente a una situacin dada o, identificar la descripcin ms apropiada para determinada
grfica)
Plantear conclusiones vlidas a partir de un conjunto de datos o eventos

Argumentar
Hace referencia a las acciones que realiza una persona con el propsito de fundamentar o sustentar
un planteamiento, una hiptesis, un diseo, el uso de un procedimiento, la solucin a un problema
o una decisin. Esta competencia exige explicitar los por qu de lo que se hace, e involucra
acciones tales como:
Fundamentar la ocurrencia de determinados fenmenos con base en planteamientos tericos
Sustentar conclusiones para diferentes eventos o fenmenos, mediante el establecimiento de
cadenas de relaciones entre conceptos, postulados o principios tericos.
Sustentar conclusiones a partir de datos o procedimientos experimentales.
Argumentar cul es la informacin relevante para la resolucin de un problema.

Gonzlez, M. Espndola, C. y otros. (2005). Manual para la construccin de preguntas ECAES de Biologa. Documento
de trabajo: ICFES - Acofacien.
15

34

ZONA NORTE: Taller Elaboracin de tems

Proponer
Hace referencia a las acciones que realiza una persona, con el propsito de plantear alternativas
de decisin o de accin; establecer lo que puede ocurrir en un sistema o situacin cuando
cambian las condiciones y dilucidar relaciones o vnculos no evidentes entre eventos o conceptos.
Esta competencia involucra acciones tales como:
Predecir el comportamiento de un sistema o situacin si se realizan cambios en las interacciones
o en sus condiciones iniciales
Conjeturar, a partir de un estado final, las condiciones o estados precedentes que lo hicieron
posible.
Plantear el diseo experimental o la estrategia ms adecuada y pertinente para realizar determinado
estudio o contrastar una hiptesis
Establecer regularidades vlidas para un conjunto de situaciones aparentemente desconectadas
Plantear hiptesis

ANEXO II
SUGERENCIAS PARA GARANTIZAR LA CONFIDENCIALIDAD DEL
MATERIAL DE PRUEBA16
Restringir el acceso a toda la prueba o a partes de la misma y a la armada de la prueba, a un grupo
pequeo de personas que garantice la confidencialidad del proceso. Se sugiere encargar a una sola
persona de ser el responsable de la seguridad de archivos magnticos e impresos de los tems.
Cuidar que no queden en circulacin colectiva las versiones en papel o las copias de los tems
generadas durante el proceso de elaboracin. Finalizado este proceso, las versiones que no vayan
a ser incluidas en la prueba deben ser destruidas; los tems aprobados debern ser mantenidos
bajo custodia del responsable de la seguridad.
Si los tems se encuentran en archivos magnticos, stos debern tener una clave o password
para lectura y para modificacin. Dicha clave solo podr ser conocida por el responsable de la
seguridad de los tems.
Ninguna persona que elabore tems podr guardar o copiar los tems hechos por otros ni de los
elaborados por ella misma.
Los talleres realizados con el fin de revisar y ajustar tems debern contemplar mecanismos de
seguridad que eviten que los tems sean conocidos por personas ajenas al grupo responsable de
la elaboracin. Cuando asesores o expertos conozcan los tems con el propsito de revisarlos,
deber asegurarse que devuelven todo el material de prueba que les haya sido entregado.

16

Grupo de Evaluacin de la Educacin Superior. (2003). Estndares para la construccin de pruebas. Bogot: ICFES.

35

ANEXO III
MODELO DE ACTA DE COMPROMISO17
PROGRAMA

UNIVERSIDAD
CIUDAD
Yo,
, identificado(a) con cdula de ciudadana
nmero
me comprometo a cumplir con las labores asignadas
de acuerdo con los ms altos estndares de competencia tica e integridad profesional, teniendo
debida consideracin a la naturaleza y propsito del trabajo desarrollado. Tambin me comprometo
a no revelar directa o indirectamente a ninguna persona, ni durante la vigencia de este trabajo ni
despus de su terminacin, ninguna informacin que hubiera obtenido durante el mismo y que no
sea de dominio pblico.

Firma
CC. No.

Fecha

Documento diseado y usado por el Grupo de Evaluacin de la Educacin Superior del ICFES en procesos de contratacin
para elaboracin de pruebas.
17

36

También podría gustarte