Está en la página 1de 12

;{y\

Robert L. Tkorndike
Teachers College,
Colum.bia University

MarWo en C1encia.i de Ir Facultad de Qulmica dc la Universidad


Nrcionrl Auibnomr dc Sltaico. Ingeniero con mcnci62 honorlficu
de la Evuelr Supcrior ale Ingeniera Meclnicr y El6cirica dcl
Insiiiuio Poliitcnlrx, N.r:iunal dc MCxico. .ingeniero Nuclcar del
Iniiiiuio Tecnolbglu, d: Mrssrchu$elis y de Ir Bscuclr Superior dc
Fhlu, y Mriemlilcrs del IPN dc Mtaim.

Ilocior en I1sictili~gI:i de Ir IJiiivcrsit1;itl tle '1'cx:i.i en Aiisiiii.


Proleaor 'l'liuliir tle 'l'icmpo (;iirnplctt~.J c k del 1)eprri;iiriciiiri
de Pslcologh (;r.iicr~l Experinicntrl tlc la 1)ivislbn rlc Esiiidiiir
de Posgrrdo Jr 11 Frculird tle I ' s l i o ~ i ~ gde
h I;I Univcrsid;itl
Naslonal Auihnr~mxde Ml;xicri.

Thorndike R.L. (1989). Psicometra


Aplicada. Mxico: Limusa.

EDITORIAL
M~XICO

ESPA~~A
COLOMBIA

.
VENEZUELA

LIMUSA
ARGENTINA

PUERTO PICO

p"

. -!

[-)

-.

m1

Captulo 2

UCII

uaui ~

a ig u n rriumcnw

res mejor conrmnrarias:antes ac empezar

El desarrollo de una prueba, un cuestionario, u otro instrumento de medi.


cin, destinado para puh,licacin y mercado, es un proceso complejo que
requierc.de la tonia de muchas decisiones, y se divide en varias etapas. Por
tanto, es deseable tener una idea, tan clara como sea posible, de la secuen.
cia completa de las operaciones, antes de que se inicie el trabajo en el ins.
trumento, de modo que cada etapa pueda orientarse ms efectivainente hacia
el objetivo final. TambiCn es deseable establecer un programa de trabajo
viable, para producir el instrumento en cuestibn dentro del plazo fijado.
El diseo de un plan indudablemente formal, y de un programa para el desarrollo de la prueba ofrece dos ventajas principales. l ) Requiere que quienes
elaboren las pruebas -tengan una idea clara de lo que planean hacer, y de
cmo hacerlo. (El pensamiento confuso se vuelve mas obvio cuando los ela.
boradorcs de pruebas intentan ser explcitos acerca.de cada paso del proce.
so de desarrollo.) 2) Facilita la comunicacin entre todhlas personas que
de
intervienerr en la elaboracin de las pruebas. Debido a que e~'liesarrollo
un instrumento requiere frecuentemente la participacin de muchas personas diferentes (redactores de items, editores, examinadores de campo, ana.
listas; ptrsonal de ventas), un: plan para el desarrolla de prueba o el programa
de pruebas, redactado con claridad, ayudara a garantizar que todos traba.
jen solidaria y eficientemente persiguiendo un solo fin.
! : A continuacin K muestran los compoiientes de un plan, cada uno de
los*cuales se expone mas adelante en este captulo:

Definicibn inicial del dominio, CJ del atributo latente. que se vaya


a evaluar con el instrumento.
25

U L F ~ N ~ C IDEL
~ N ATRIBUTO LATENTE O DOMINIO DE LA PRUEBA

2. Un enunciado de los uso p a r - los que se destina el,iiistrumento,


Iddi&&& ~.'&'&h~&qal
qJC se i$li&H Y lds.Lipt$ &e decisiones que se roma& cqn basc en los, resultados.
:, .
S. Una indicacin da'@ rab-itcidne~~tf~tiern~o,
medios y condicio-

nes de prueba coi'las &;les sedesea aplicar el instrumento.


4. Un conjunto de especificaciones del contenido, indicando los temas a estudiar, las habilidades que se van a detectar, o 12s subhabilidades que se van a probar. Algunas veces a este conjunto se le llama
plan dcbodo de la prueba
5. La especificacin del formato de los tems de prueba, indicando la
naturaleza de los materiales de estimulo, el tipo de respuesta del
sujeto y el procedimiento para calificar.
6. Un plan de pruebas de eficacia de los items propuestos y del anali.
sis de los resultados de las pruebas, para seleccionar los tems que
deban incluirse en el instrumento final.
7. La especificacin de los parmetros eshdsticos que se dcben in.
cluir en la prueba terminada, para asegurar el logro del nivel reque.
rido de dificultad y confiabilidad
1.8.. La formulacinde lospracedinicntos que se van a htilizar para es':,.
!. tandarizar las pruebaa'y p a n llevar a cabo los anlisis cstadisticos
.""!
, ,.. ;, p a n prepad'lok criterios nodativos.
1 1 . ~..) 9 - 1Un b & & t o ~ d ' b m
actividades de recopiiacih del informacin y
...,:.
. anlhi~
queadeban Ilevaric a cabo para evaluar valitiell; desviacin
. > . ; l l i , : h,.:1i.T~, \ ' ' i . [ I I . . . '
I . : . I L . ' ::)ilyisimil~esa
.:.:
;41'11,if?
I;I.%
. . .:
,:?J90..,Un plan p a r i ~ h
org;i'izicibn del hanual.de la pruebd, y cualquier
.'LL'c~;
1 i::. 1. i
. >I
oktro: materia ! & u % i l i & ' ~ u enecesario.:
,~~
. .

.'

.:'l

* a

'

I ti.

#\:

' ,

, il., l : . ; .

. :., , ,,

(
.:

,la,;:

..

)<B

1,:

. ,;,

i1:

:*

, .
J .

.!

& .

... I(;

el*

::,

,~.,.!,,,1.1

'...#i1
.1:,,,,

. l . ,

DEFINIU~N.DEL ATRKkUTO UTENTE 9 DOMINIO DE LA PRUEBA


. ~ l ! \ . o ~ ! . .~l \;o~l . * l .~ . , ; , I $
8

:..;,. .

. .

i n ~ ;,

, 1.1,

,\~]r.,,;

,:.,

. ~ r o b ~ b l h e n t c triirid.deeir.qu&
&s
antes de que se inicie el desarrollo de '
-2tnarpfil'iba.u~ k . i ~ h f u r h ' e n t ~debe
, . s t conocer qu4"es'ld que se dessea' pro'bar.i'Quiz&iio ts tan trivial 'decir que sedebe poder expresar esa intencin
tan?cl?r;il)t.cxplfcitamtnteieomeber
posible;La intencin se expresa en for.
-rn%gencaic~rei~ricimbre
que%&d d d auibutb o doniinio: "tiabilidad vera maysculas
~ b a l ~ d a b e&'tl
z a taJcuI'6 'i,ntlco";"hiaestra ai,SIuso de I
exblos-nombretpropias",~"eficicncia en mtcanografia", "intetCs por I mecnica" o "impulsividad": Sin e h b u g o , la.$etiquetad puedtn'significar, ms
,-l)led(!co& dift?tntes,bata petronas difermces. Incluso' algo tan especifico
y tangible como "destteh'tn' el clculo a ~ t m t i c o "puede
~
significar vtloci.
dad y exactitud de ciculor simples con rirneros enteros, y mientras que
fp~.\rttl;!higr&Wla'hibiiidaa pui:litvar a taboi'de principi?ih'fin c;klm.
los largos y complejos con empleo de fracciones; decimale$ y pYHntesis. Las
dos cosas pueden constituir atributos notablemente dilerentes y una perso.

.:

.,

27

na que es sobresaliente en una, tal vez slo sea tipica en la otra. Por esta
razn, es deseable alguna especificaciSn y restriccin adicionales.
La. espec'ificacin pormenorizada y objetiva del atributo se da en la eta.
pa de preparar el plan detallado de la prueba. En este punto, se intenta del-nitar
- -con detalle_.las
.. caractersticas del contenido y del proceso mental que
se
va
a
detectar,
media.iitc1os
Sin embargo, al pen.
__... -.---.
..----.-.
..
_..ejerciCta3-dt5li'pruu.
.
.
sar en un p r o y e c t o ~ d e s a r r o I l ode pruebas, el primer paso ser precisar
y aclarar el significado del atributo. A continuacin se presentan algunos
ejemplos de rasgos o dominios definidos.
<

Habilidad vrrBa2, evidenciada por el conocimiento de significados de


un gran nmero de palabras y eleccin de la palabra ms adecuada
para un contexto dado.
Desaeua m tl cdlculo arilmlico, mostrada por la velocidad y exactitud
con que se llevan a cabo operaciones numericas simples.
Mae~lrbm el uso dc las may.mlas en los nombres propios, cuando se le
da a uri sujeto un prrafo en prosa donde no aparecen maysculas,
quien recorioce con 90% de exactitud los nombres propios que las
requieren. (ObsCtvese que en este caso se define ms bien un domi.
nio especifico, junto con el nivel aceptable de maestra; una tpica
interpretacin de referencia al criterio).
Ejiciencia m mecanografia, evidenciada al mecanografiar con rapidez
y exactitud una cuartilla con formato y espaciamiento apropiados co.
piada de un borrador escrito a mano.
InietCs m tn mcdnka, manifestado cn el gusto por las actividades rela. .
cionadas con la construccin, mantenimiento, reparacin u opera.
cin de artefactos mecanices y preferencia por dichas actividades
sobre aquellas relacionadas con palabras, nmeros o contactos inter.
personales.
La irnfilsividad se manifiesta en una tendencia a autodescribirse con
frases que implican decisiones rpidas y precisas para actividades no
planteadas, rracidas del momento, a diferencia de las frases autodes.
criptivas que implican deliberacin, tendenciahaciala planeacin cuidadosa y reprimida.

Con estas definiciones desarrolladas de los atributos o dominios se lo.


gran dos objetivos. Por una parte, describen un poco ms lo que se sugiere
con la designacin del atributo. Por la otra, da una primera idea de las operaciones de piueha, mediante las cuales se va a evaluar el atributo. El proceso de preparar la pmeba es de interaccin continua en que se va hacia atrs
y adelaiite clarificando la definicin de un atributo, conforme se emprende
el desarrollo de procediriiieritos de evaluacin y Cstos se modifican a medi.
da que se va clarificando la coticepcin del atributo. Desde luego, la con. c ~ f f i h u a . e r n e r g e n~.simplemente
,
delmodo de pensar de un
solo elabora&rdt. p?-&as, sino ms bien
antecedentes de
----de
_..los
- _ ---- la investi-

*.

-^

28

"

'

.
.

. . ! 1.J

'~

P U N U C I ~DE
N W E U B O R A C I ~ NDE PRUEBAS

pci6n'i.ealizada sobre e18ahibutoen cuestin. Por lo tanto; para iir, rasgo


como impulsivi&d, hiy una amplia bibiiografa, fnito de investigaciones

OBJETIVOS DE UNA PRUEBA

les, que la cornposicibn de una prueba y el nivel de dificultad de sus ejercicios dependen en forma considerable de los tipos de decisiones para las
cuales sc van a usar los resultados. Se consideran los siguientes tipos:
insfwcici. Aqu la alternativa tpicamente es si un individuo (o un grupo) tiene maestra en ciertas habilidades, de modo
que vale la pena presentar un nuevo tema en clase, o ya sea que una
persona (o grupo) haya alcanzado suficiente maestria de dominio en
un coriocimiento o habilidad que precisamente se acaba de ensear,
para que sea posible pasar a una nueva unidad de instruccin.
DecYiunes & diugdstico. El objetivo en este caso es identificar las de&
ciencias particulares, o los errores en el aprendizaje de una persona,
con objeto de iniciar a-ccic'ries correctivas. Para ambas decisiones de
instruccin y de diagnstico, las pruebas se enfocan por lo general
en el grado de maestria de uno o ms dominios definidos con bastante precisin.
Decisionu & sekccin. stas son decisiones para admitir o excluir en
un grupo, para contratar o no. Ordinariamente son, cuando menos
en cierto grado, decisiones de comparaciJn y competencia cuando
el nmero de vacantes esta limitado y la prueba se lleva a cabo con
objeto de admitir a los candidatos m;ls proinisorios.
Deciiioncs de coloeacidn. Este ttrmino usualmente se refiere a una je.
rarquizacibn de programas o posiciones de entrenamiento. El pro.
blenia es determinar dbndc se puede ubicar rns ventajosamente a
cada sujeto en la jerarqua. A cul nivel debe entrar un estudiante
transferido, durante el aiio escolar, a otra escuela? En qu tipo y nivel de estudio de lenguas. o de un programa de maiemticas, tendr
mayor aprdvechamiento un alumno de nuevo ingreso? Qu tan coin.
plejas son las tareas que deben asignarse a un nuevo empleado de
oficina o negocio?
Decisiorm & clasifcacin. stas difieren d e las decisiones de colocacin
en que la decisidn es de tipo, ms bien que de nivel. ;A cul curso
de entrenamiento debe asignarse un nuevo recluta en el ejrcito? Se
capacitar esta persona ins fcilmente como oficinista o como mecnico, como cocinero o conio chofer?

1. Ilecisiune@

,"

. . ,

U* instrumepo
.
,

&;bae$b
deberfa fer, plane=do con;.svi
un grupo
de sjeui. en pa&u& y.
definidos d e deci$4n. ~ d ~ h edeb i
dculo,a+n&tic+ puede di,rigirsc a alumnos,del quinio grado, para identifi& individuo? b n deficiencias, y diagnoqticar la naturaleza de esas dcfi.
pa& de &I programa de sdyci6n para
dencias,,,~,pk& .~s+-u!~c.&z~
contra* a j e @ ,de banco:' U& p m e b d e ,mecanogmfa,puede scr parte
de un examen de, cuno pru? una d b de mecanografa en ~ e c u n d a t ho,
una p h e b a p u a ididtantea de un puesto iecr.etarial. Al piancar una prue.
ba,'er importanti tener en m&. el h p o d cual se aplicar4 y los tipos de
decisin que u van a bas& en los.resultadosde la pruebi ha'especificacio.
nes puz. el contenid? de Ia pruebi, il nivel de diticulta$ la duracirin de
la pitjba, lu pu,ntuacioner que w v&,a obtener,y para la forma en la cual
se van a reportar, t o d b dependen del grupo que.= desee Probar y ,lasdeci.
,,
siones que se podrm tomar con b y en ellas.
+,',
>+,\
L anterior .ayudad a que',elresuit;rdo final sea i i
claro posible en
definicin de los grupo's q " r:
~
probar. Qu nivela dk Edad o grado se repre?ent+n? ~ ~ s u f n ~ r ~ ~ r ~
iaj~personas
~ i t a d con
a s la gama coni.
pleta del atributo? Se sele&onad el p p o de alguna f o 6 i en particular?
(Los'grupoa,~leccionados
pyedcn ,yprconstituidos por ptt-i~nascon habilidCd .robresaliente, p&nq q u c , m candidatos a becas o patrocinios,
O
'?*+CI, p q r i l p e r y * ~ l t 9 ~ ~ p ~ ~ i ,marginal,
idad
que ,&'califican para
$sp4ilc+ ;(Los sujeto; de examen perteneinsqcci6fi ?n+ui,dudo,
cen a grupos especiales de lenguaj o cultura? Coi1 quC mocivacibn tornai..~
. ..
rnlaprueba? .
.: .Tambin u importantec o i n ~ ede'antemano
r
el uso de lbs resultados de
la prueba <Estdiseiiada la prueba simplemente como una herramienta de
investi@ei6n;u:decir: panicolom -a todos los sujetos de examen, thn exacsu posiblei,en:la d a del atributo datetite, de.tnodo que
tamente~como.
a t e atributo pueda estudiarse en telaci6n con'otras caractrtistieas del india
viduor.o,en-reladnlcon lodiatamitntos que K le estC aplicandoi .o bien
se.destinar para usar 1os'~esultados
como base de decisian endguna spli.
caci6n7 Si,= tnu d lo ltimo,'P quC tipo de aplicaci6n? Se'pueden identi.
fi-:varios.tipor de apli&aoner @eiequieren diseos bien,diferentes del
instrumento d c pruebz.Que&dui>,!confomese exponen terna adiciona.

'

L . ,'l.

<.

os

2.

'

Y.

4.

3 ,

U,

.I

5.

En las decisiones de seleccin, colocacin y clasificacin usual.


mente el inters se orienta hacia la medicin de atributos, que pare.
cen ser buenos elementos, para predecir el nivel general dcl
comportamiento posterior, en algn tipo de progranla de entrena.
miento o de trabajo.
4 . Decisiorus a2 orirntoci01i.Esta categora cubre una gran variedad de de.

cisiones que una persona, quizi con ayuda profesioiial. ioma acerca

36
,'
-1

,
1,s

PLANUCI~N DE U EUBOMCI~N DE PRUEBAS

d e su propiolfutuio: Por ejemplo tomar cprsos d e cyatro aos en un


colegio, O acudir =un tiPo d e escuela u otro, inscribirse en un p r o
.fb'ghma d e humani&tits, o en un c u n o de capacitacibn para el traba.
jo, o e n u n programa tcnico; o bien considerar una carrera de
relaciones pblicas o un trabajo d e tipo industrial.
<,
' ' 1 -,
r
.l.

d *

*'

RES3iRICCIONES DE UNA PRUEBA


1y

i ,

i .:t

'

-{.

,
r

Cualquier pnieba debe llevarse a cabo dentro de los limites establecidos me.
diante restricciones aplicables. Es importante que quien elabore la prueba
estmento a estas restricciones y haga los ajustes necesarios.
La resacci6n ms obvia es l a del tiempo. El tiempo requerido para la
pruebafrecuentemente K concede a disgusto. En las escuelas, los maestros
tienden a cbnsiderar ei tiempo d e las pruebas como tiempo robado a su pro.
grama de estudios, y los administradores con frecuencia ven el programa
d e pruebas como un i.iconveniente que interrumpe el tranquilo flujo del
dia escolar. En lu agencias d e empleos, los candidatos pueden espsrar dedi.
car sblo un tiempo limitado al proce.w de presentar la solicitud de empleo.
La presin por el requisito de breiedad en las pruebas es muy autkntica. Pero
la presibn por la precisibi. en~laslevaiuacionesde la prueba esa igualmente
verdadera y el elaborador 'de pruebas est en conflicto perenne pues debe
producir una prueba~sufi'cientementebreve para que sea aceptabieGporlos
usuarios, y que a la vez profiorcione informacibn considerablemente exacta
para permitir decisiones tiles. En la planeacibn d e una prueba; el elabora.
dor debe estar consciente d e lasresuicciones de tiempo, d e modo que la es.
pecificacibn de tiempo se ajuste a estos limites requeridos por los usuarios.
Una segunda restriccin, que es frecuente, seria que la prueba se deba
administrar a un p p o , y n o a unkdividuo. Un corolario comn en la apli.
cacibn a un p p o , aunque n o absolutamente necesario, es que la prueba
se limite d material impreso en un folleto. Si tiene lugar esta rcstriccibn,
1
debe respetarse e inciuinc en el plan d e la prueba.
Aun cuando una prueba se aplique individualmente, es necesario tener
en cuenta las condicimes q u e un examinador tipico, con un nivel i!iedio
de entrenamiento y habilidad, pueda mangar. {Ser dificil manipular el material de prueba? {El examinador tendri que tomar decisiones rpidas accrca de la secuencia en que se van a presenar las tareas? {Deben hacerse juicios
al vuelo, corrigiendo las respuestas conforme se est re~lizandola prueba?
;Qu tan complejo es el registro d e rapucstm que debe hacer el examinador?
,,Puede ser p v ve ni ente imponer otras restriccp+nes al' diseo de
la prueba As, en ~ n a * ~ r u edbea lectura se puede desear especificar que
el contenido no se facilite ms a personas d e uno de los dos sexos, y
que el contenido sea apropiado para lar minorias o grupos d e bajo nivel
socioeconmico.~nel qso d e una prueba d e rendimiento en ciencias, qiie

ESPEClFlCAClONES DEL CONTENIDO O P l A N DETALLADO

31

se va a usar en una escuela secuiidaria, se puede especificar qi;c la dificiil.


tad del material d e lectura no rebase el nivel del sexto grado, de modo que
la prueba no constituya simplemente una prueba de lectura. En la prueba
de razonamiento verbal, puede ser necesario especificar que las palabras usa.
das se tomen de las 5000 ms comunes en una cuenta de ocurrencias de pa
labra, de modo que la dificultad resida en las relaciones expresadas, y no
en el desconocimiento de las palabras mismas.
Aquellas restricciones dentro de las cuales deba aplicarse la priieba, ya
sean externas y d e forma, o internas y d e fondo. deben reconocerse y hacer.
se wplcitas. Solamente ponderando todo esto se puede juzgar si es factible
elaborar una prueba que sea psicomi.tricamente efectiva y prctica de usar
en las circiinstancias para las cuales se disefi.
ESPECIFICACIONES DEI. CONTENIDO O PLAN DETALLADO
1.a especificacltin con cierto dctallc tlc los temas y procesos qiie se \.an a iii.
cluir en una prueba, es la base de la plaiieacicin dc la iiiisiii;~,y iilg~iii;isveccs
representa lo que las personas entienden c~)aiidohablan d e un plan para
una prueba. E1 plan detallado tiendc a ser iiiis explcito y iiinyoriiicntc cl;i
borado para el caso d e una prueba de investigacin del rendiiiiieiito en al.
guna matxia acadmica. Una prueba de este tipo se conteiiipla usiialiiieiite
con dos dintensiones: la d e coriteiiiao. que expresa lo que se ha enseii;iclo.
y la d e proceso, que indica lo que se espera que haga el exaniinado coi1 ese
contenido. Es comii preparar una red de dos dimensiones que iiiuestra e n
una, 10s teinasque se van a incluir, y en la otra los tipos de operaci6n qiie
se aplican a ese contenido. La tabla 2.1 es un ejemplo de dicha red.
Las categoras d e contenido en un plan detallado son, por supuesto, es.
pecificas del rea del tema particular. y no tienen nada en comn con otras
reas. Sin embargo, se ha tratado de producir taxonomas uniformes para
expresar los diversos niveles del proceso que se va a probar. El que ha recibido mayor publicidad fue preparado por un comit de !a Americati Educa.
lionol Research Associalion presidida por Benjamn Bloom (1934), y enlista las
siguientes jerarquas de objetivos para la eilucacih:
S

Coiiociinienio

* Comprensin

Aplicaciii
AnAlisis
Sntesis
Evaliiaci6ii

Esta jerarqirizacih proporciona un iiiarco de trabajo p x i I;i prepariicitiii


de los ejercicios de la prueba y gua a quienes la elaboran hacia el desiirro-

s o i u a u a ~ ! p a usol ap soso!xJe3
sopunua sol a3!j!iuapl
sP.U!3![JaU
SR[ 3P qRY133PRU! O
opan3apa 01 a? a p u a p p a
al aliu:, anlu!is!a

Obj&ivos del proceso


;.t,

I<I.:I

~ i ; . ,';,

A,, Nutricin, 40%,


.a,

,;

t i

"

.,,,,

Identifica diem bien balinceadas


r a N:.
~~!~l.lCsilcul~
las caloriu.necesrrlas
. :
dc las dietas para perder o ganar peso

1 ~ 1 1~ :

,:: ,,, t.

'

.i,.

* I : . I / > 1 i i 1 1 /:iI>~.li..;-..

5. Aplica principia y gcneniizaclones 1


a situaciones nuevas

.:

..

.,

..,
m

,
,

..$.

Eni'crmedadcs
n o conia~ioiras,20%

Reconoce las condicionc.r


pr(ibal>lcsque pucclan I.vi~rccci
la propagacih de
enfermedades coiiiagiosas
Identifica los mtodos
apropiados para esicrilirar
objetos
Da raroncs apropiadas
p;ira reglamentacihn, proccsos
y tratamientos

Prcdicc I;is cc~nsccuciiciastlc los


c;inrl>ioscn I;t ~~ccrccii,ri
de
cicrias Irciriiionas
dc
Prcdicc I;i ~m~l)aI>ili<la<l
heredar condiciones
arrorinalcs

(1.

Niincrci
dc iicrns

--

'

Uo .de tems que obligan d sujeto a hacer ms que simpleme& &ordar


hechos, o saber nombres, fechar,.defjniciones y cosas parecidas. Qcbido a
que con frecuencia es ,dificiljuzgar a qu preciso nivel d e la jerarqua perte.
nece un tem dado, algunos. investigadores han encontrado !prctico traba.
jar con categoras un poco ms simples y descriptivas, como las dadas en
.,
. . , ,.:.
la tabla 2.1.
.En ellboceto del .contenid8 d e una' prueba d e rendimiento, se, espera
l
qu$sta refleje lo que se ha enseado, o lo que deba haberse enseado,
en Un pen'odo dado del pro&ma escolar. Si la prueba es piSa h curso
de un solo insr(;;r,,l?te
deber ?er capaz d e especfi:arl lo que se trat6
. 11
:n clase, e n que y pvso,&nf+jq,y.qu'6e espera que los estudiantes iia)lan
aprendido y,reteqido. i)-!una
prueba que se vaya a usar mas ampliamente.
quien la e j a b o q debe,apoyane .en textos de uso general, planes de estu.
dio, as como en lar crticas y sugerencia de personas que ensean el tema. En
el ltimo aniisk laldelineaci6n de1:contenido representa. unlconjunto d e
juicios aobre lo que debera iiabei-se enseado y aprendido.
Cuando se principia a desarrollar un instrumento 4e mediciiin que se
vaya'a usar como una prueba'lc'ma!shia, o como una prueba coti'referencia
I

B. Erif'ermcdades
ccin~agiosas,40%

a criterio, para evaluar la maestra de un dominio especifico, la caracicristica clave del plan detallado dehe especificar muy claramente el tloininio que
se va a estudiar. la especificacitin dehe indicar 1) la forma del estimulo quc se
presenta a los sujetos, 2) la forma de respuesta que se va a solicitar, y 3) el
estrldar (inevitahlemente arbitrario) qiie se usar para reprcsciitar I;i miles.
tra satisfactoria.
Por ejernplo, se puede especificar: "Cuaiido sc prescrita una niiicsirn de
'LO multiplicaciones con el li)rmato ri x b
?, el sujcto escri1)c I;i rvspticsta
correcta a cuando menos !8", "I);itlos 4 prratiis sin puiituacin. c;id;i uno
compuesto d e 5 frases simples, y dadas las instruccioncs para m a i n r cualquier puntuacim necesaria, pone puntos al final de 16 o ms oraciones".
El plan debe indicar cmo se cstal)lcce el mucstreo dcl dominio. lo niis.
ino que cualquier reszriccin adicional y de limiiacihn del doiiiinio. Por cjcm.
pio, en el caso d e Ir multiplicaciiin, se puedc especificar que "cada u n o de
los 10 digitos aparezca el mismo nmero de veces". En el segundo ejemplo,
se puede especificar que "la lorigitud dc la frase no exceda de 10 palabras,
y quc el vocabulario se limite a las Y000 palahras ms comunes en la lengua
de que sc trate. El propi)sito de dicha cspecificacii)n adicional es: 1 ) hacer
:S:

ESFECIFICACIONES DEL FORMATO


*

Que el dive1 de +ficultrei djh muestra iguale 1; m6i p s i b l t el nivel del


dominio total y S) especificarl dominio tan claramente, que cualquier per'
'mna pueda entender pfeCi+hnf;e t maeiuia en el mismo.
~ ~ ~ ' l k l ' p l n ' dpaih
e ~ dtni
o prueba de eficiencia en el tnbajo es. en rnw
-&as fonnas, pafeddu irde Sia pmeba-de findimiento acadniiEo. Sin ern-F~Terf~~FG~iobTeUti-a6aj0:Pa~~
red& t a r se pre'jktai 2 C
preparad611 debe t t n a u h a persotr?y qu debe hacer en este trabajo? @ies
y habilidades mn necesario, para el rendimiento adecuado
--&nodinientos
en d'frabajo? L i r E r i t i i i ' d e I ~ ~ ~ i i c que
i n se consultan sobr el'kdi.
mientb en el trabajo,,mn muy diferenten de aquellas tilea,para especificar
el tontenido de una prueba-.derendimiento acadmico:El anlisis ocupadonal'que dice 'hles conocimientos y habilidades son necesarios yaia' la
realizacin rati~actoria~iCtlmbajijo;'ac
b&a prindpalineiite en la 'expcrien.
cia de los empleados mi3 hbileL'ydc loi supervisores. El pl& parP. una p h e .
ba de eficiencia en el trabajo tiend'i' cintnrse en la eficacia h'piciorial'tser
capaz de rcaiizar tarea dificiles), en ver de sobre conocimie,ntps abstiiztos.
#."
. . .
que subyacen a t a eficada en la prctica.
, ,. ., .. .,,;l. ., . .
La especifiacin del contenido para una prueba de aptitud tambin
tiene un matiz un poco diferente, y tiende a ser menos especifica. que la de
una pmeba de eficiencia o de rendimiento. Debido a que una prueba conio
sta se disea para medir una caracterstica ms bien general y persistente
dela persona, y no el resultado'dd un programa especfico de instruicin,
el conjunto no constituye un rea bien definida a la cual referirse. Con fre.
uenda.especifican t i p de tems. Por ejemplo, se puede especificar que una
Prueba 'de habilidad verbal st compuesta de analogas verblei, sinnimo.
&tnimo, e tems de completar frascs. Se puede entonces indicar cuando
&os van a aparecer como pruebas parciales reparadas, o cuando sern apli
@dos globalmente. Se pueden tambin indicar ciertos aspectos generales
de' balance del contenido. Por ejemplo; si "comprensiii de la lectura fuera
parte, de.una prueba, =:podra e~pecificarque los pasajes se eligieran en
proporcionu semejante? de las reasacadtrnicw de ciencias naturales, cien.
Sias s&ides y literatura". Una prueba del razonamiento mecnico puede
gpe,cificycuntos items se fefiereii a la palarica, cuantos a la rueda; cuan.
tos~~,to~,illoi.~un~os.
a 1a.polea; y as sucesivamente. . .. .I : . . . .
...
.
<:;;!,Laespecifi.cacin del contenjdo para pruebas de inters, temperamentb y actitud,son susceptibles .de ser.aceptableniente esquematidas. Al definir
el.rasgo.latente, una definicin amplia tiende frecuentemente a indicai.al.
gunoqdClos aspectos del contenido-Por esto, las definiciones de impulsivi.
dad,,enlja pagina 27, sugierenacomo contenido frases que tnten con lo
: 1 . . ',.L.
, I . c .,
s'iguient~,, .,:i;,!, ,, : i .I'
.
... * ,.
. .. .
,:
G,i:.:;,,j,;,
.
:: : . ..:. .
1.
'i.
.' ." '.
b.,;,~,lr~pidez"dedecisin
.ii.l;:;~,
., . , , . . . . ,
,., ,?,\Gusto por. las actividades :no':planeadas
;.! ! , :,:ni
,
.
. ,, l
'
. . ,.. . . \ . .
;

.o

Sin limites de restrisci6a o inhibicin


Desagrado por la planeacin cuidadosa

"

Si se reflexioria sobre la lmpulsividad, es casi seguro que se encontraran otros


aspectos del atributo que deben agregarse a la lista. El constructor de pruebas hace un juicio inicial valorando cuanto nfasis (cuantos tems) debe de.
dicarse a cada aspecto.
ESYECXFICACIONES DEL FORMATO

c..

; ,

.'

,O;

'

>

'

a',

' V I

"

'

, ,:L.

.\

En una etapa relativamerite temprana de la planeacin, el constructor de


pruebas debe iriformar con claridad cual formato van a tener los ejercicios
de la prueba En pruebas de habilidad, la prinkra y mas importante decis i h es sobre si el sujeto deber redactar la respuesta a los items, o si deber5
seleccionar la mejor respuesta o la m k correcta de entre un conjunto dado de
alterriativar. Durante los pasados 50 aos se ha preferido usar respuestas
de eleccin mlt.iple, en vez de respuestas a redactar. Con tems de selec.
cin de respuesta, el sujeto puede manipular mas preguntas en un perodo
determinado, y las respuestas pueden calificarse mucho mas rpida y objetivamente. Lo mis probable es que prevalezcan estas consideraciones.Por otra
parte, con el desarrollo de los rastreadores pticos y lectores de documen.
tos, parece que se abren ciertas opciones para formatos de tems y patrones
de respuesta, que no haban sido prcticos en el pasado. Un lector de docu.
rnentos puedc 'leer' nmeros escritos sobre un lugar especificado en u n for.
maco de bloques estandar y esto permite calificar mecanizadamente una
respuesta a un problema aritmtico que pueda tener algn valor numrico.
Asimismo, un lector de documentos puede registrar cualquier palabra sub.
rayada en un pasaje, de modo que se pueda presentar al sujeto un pasaje
desprovisto de maysculas con la instruccin de subrayar cada palabra que
deba escribirse con stas.
Durante los pasados 30 40 aos, el formato de items de eleccin ml.
tiple ha sido el ms usado. Esto es, debido 1) a la rapidez con la cual este
formato se califica con maquina, 2) y a la flexibilidad del formato para pro.
bar una gran variedad de contenidos y procesos mentales. Exceptuando las
pruebas usadas por nios pequeos, el nmero tpico de alternativas es de
4 a 5 No hay nada de sagrado en esta cifra, pero parece ser una soliicin
razonable cuando, por un lado, se desea reducir la probabilidad de recibir
una respuesta correcta por casualidad, y por el otro, tener que preparar uria
cantidad de respuestas alternativas que sean suficientemente plausibles para que las escojan los sujetos que no conocen la respuesta correcta. Sin embargo, quien elabora una prueba no debe decidirse automticamente por
los tems de eleccin mltiple, debe considerar, tanto distinguir entre dos

alternativas (s-noo cie':rtbfalscr)icomo algn.otroftmato +e se adapte me.


jor pata medir el atributo, o.el-,dominiode conqcimiento.quqsc est probando:Para las mediciones de personalidad especialmente, un formato til
ha sido el de itcmr ta;lodcuales I~~alternativas
ron: si-ho..de,amerd~en
desacuerdo, mp gustarno;me.gusta,:,o en. una:escai? .de: .perfectamente .de
a ~ e r d b d ,acuerdwn
e
,duda$qdesamerdo-absolutamen te.eq desacuerdo;
Con frecuencia se deben preparar las especificaciones de. formato de
los materiales auxiliares de estmulo, en los cuales se van a basar los ejercicios
de la prueba. Estor incluyen cosas tales como pasajes, escritos,'gr~ficas,mapas, diagramas y t a b l a Si tales materiales u .vana necesitar,.el plan deber
especificarlos, y deber d;scribir cualquier propiedad que deba tener. Por
ejemplo,. determinar la lorigitud, .nivel de dificultad,. el ;dpo de contenido
de lectup de lo$ pasajes,_o.b'ien&nmero y tipo de mapa* y grficas quc
% . i q $ i q p . ~nmero
,
de,ej'erqi+.os d c p u e b a que se basen en cada pasaje.
Rapa.* grica.puede est?+l~ysew m o gula del:nm,ero.que ser necaa: .,t
Ropr.p~,r.y.enmyar.,L,r.~!-~,:;ri:...
, ' l . . , , . . ,,; :h : . : ,. ,.'
,; li.2peste punto. debr.tpmurc.una decisin respecto a los.formatos para
r,cg+trir las respues.
y los procedimientos de calificacin:La decisin ms
importante es determinaf.&ndo.e va.a usar una hoja separadalde respiies.
t+, O s i > a s r e s p u e s ' , i d idirectamiente en el bloque de la prueba. Las
b,ojasseparadas de respuestassqn mtc fcilesde calificar y econ0micu, p que
l,o?.bloquesse.pueden volvq,+ umr,~.t;ienen
aceptacin casi universal en tos
ni,velp,!deenseqza, ?fin,eqbargo<la hoja separada de respuestas tiende
q,fi.mitar el formato de Ips ltems,y,reducirlos a items de eleccin mirltjple,
coa Jo que a u m e n t t J i g e ~ e n t la
e posibilidad de que el sujeto sg eqiiivo.
~ u ahriotar
q
sus pspuestas. Guand0.i~consideran indeseables estas limita.
cionu. las respuestas pueden p
m o escribirse sohre el bloque que pueda
.. ,
califican( a mano, o ,por,medio.dc un rastreador 6ptico. . .
..i: ,. 01" decisin clave por'tomarse es sobre si usas yna calificacin que
r@
?e~.sixpplement~,el
ntlniep de rwpuegas correctas, u &
a: que exija un car
tig'o por errores. Los problemas relacionados con esta decisin, ,f. los argu.
mentor e<favor de cada altemativa; u considerarn con ciertadetalle como
una page del,anlisir de t,cms que re presenta e n . 4 captulo 4. ,. ,
. . . , l : l b ) . ! +,!.!;!li~;'.:~,:! ;.)
:.:,
::
/,q,,7?,1
,
,
,
;
:
P&
PARA E*ISAYAR~SELECCIONAR
S

4,.

lf>

>.,

,8.

,!$,

l.

8 :

. b C < I l ! ,,,

,;,;!S

,,

'

. * ,

1,,,;*

l . . .

Los tem-diseiados p a p medir. Un rasgo latente deben ensayarse, con!el


c-&jeto.dedeterminar su nivel de.dificultad,.as como tu capacidad para di.
f&nciar,entre quienes caiifiquen.aitoyquiknes bajo en el,atributo latente.
E q u a ; etapa ma bien. tcmpranadeli decarrol?~de la prueba eslnectsado
rcgppnden las siguientes preguntas:. :.. . . .
I
.::, .,
. .;j , .!. :
(,T.

,
.

. kl,:-u!,, -

, ,..!

.;,f{;\?\,

.,

,S,-.

..

; l : y ) ! \

!; q

:y!.31:

c.

,:

,,:

',

#a,141[

.;.,la

grado. se van a ensayar, los q a eriJe*


1.,,<A P A ~ .piyeles &edad
2. Qu tam'do de la'muestra de ensayo se desea en cada nivel?

.:

S. Cules subgrupos determinados (sexo, socioeconmico, tnico u otro)


se van a aislar para un anlisis especial?
4.. Qu tan extensas van a ser las pruebes de ensayo?
5. Cunto tiempo debe darse pira las pruebas de ensayo?
6. Cul puntuacin de la prueba se va a usar como criterio para eva.
,luar cada item?

Una vez tomadas estas decisiones, la siguielite etapa de la preparacin im.


plica hacer los arreglos necesarios para seleccionar la muestra con las escudas, patrones u otras fuentes de muestra Esta no es parte directa del
ensayo; .pero es necesaria, y en consecuencia requiere dedicacin.
Con rcspecto al nivel de edad o grado, el principio general es que los
grupos de ensayo sean tan parecidos como sea posible a aquellos en los cuales se usar finalmente la prueba. Por lo tanto, se extraen muestras de esa
poblacin, cubriendo el espectro de edades o grados, y hasta donde sea posible tengan el mismo nivel de habilidad (u otro atributo) que caracterice
a aquellos en quienes se va a usar la prueba. Como se ver en los ltimos
captulos, las csiadsticas de ltems S: pueden ajustar para tomar en cuenta
las diferencias entre la muestra de ensayo y la poblacin que finalmente se
va a probar, pero es preferible que tales ajustes sean pequeos y, desde luego, es ms simple si no tienen que hacerse en absoluto.
En forma ideal, el grupo de ensayo debe extraerse de varias escuelas o
localidades, de modo que las estadsticas de ltems no se distorsionen por
las peculiaridades de tina sola localidad. Por lo tanto, un item especfico,
digamos un item de nmeros primos, puede ser demasiado fcil en una escuela, si el tema se aca5a de ensefiar la semana anterior. El uso de diversas
fuentes tien& a disniinuir dichos efectos locales. Se puede obtencr una mues.
tra altamente representativa cuando se pueda incorporar una seccin del
material de ensayo a una pnlepa operacional que se use, por ejemplo, con
alguno de los programas ilacionales de pruebas. Sin embargo, el elaborador
de pruebas con frecuencia debe contentarse con una muestra "en trozos"
que viene quiz de una media docena de escuelas o empresas. Cuando esta
es la situacin, es mas deseable que los grupos sean heterogneos, pcro rc.
presentando el mismo espectro geogrfico, de habilidad, o de especializa.
cin, que podr encontrarse cuando se use la prueba.
No es fcil especificar nmeros mnimos. Evidentemente mientras ms
grandes sean las muestras de ensayo, mas seguras sern las estimaciones del
g a d o de dificulta,d y de los parmetros de discriminacin. Para una prueba
que se va a usar con grandes grupos, el milimo que se debe considerar adecuado para.proporcionar parmetros de lteins tiles de 200 a 300 en cada
grupo de edad o grado.
Debido al interCs reciente en la "equidad" de los ejercicios de pruebas
para grupos con deficiencias culturales sociocconmicas, se sostiene algunas
veces que los niateriales de prueba deban cnsayarse en grupos especiales

que representen a las minoras mica's o a las de baja nivel eclonmico. El


objetivo de dichos ensayoJ1esidentificar ciertos tems especficos que son,
ya sea particularmente difciles para el grupo especial, o que no sean adecuados para diferenciar'? los ms capaces de los menos, entre lob sujetos
de examen en esevgrupo.Se supone que la mayora de los tems qtle Inclu.
yan trminos y contenido inadecuados para el gmpo especial!ya fuefan iden.
tificados por los revisores, particularmente por los miembros del grupo en
cuestin, sin embargo, el ensayobuede servir para complementar o, en al.
gunos casos, reemplazar dicha.revinin. Si se desea que la informacibn del
ensayo con los grupos especiales sea til, las muestras de esos grupos deben
ser lo suficientemente grandes, para axgurar que las propiedadcs aparente.
mente desfavorables de ciertos Zums no representan simplemerite fluctua.
ciones alcatoriaa en los g m p capedales. En general, parecera que el tamatio
mnimo para los grupos especiales do debiera ser menor que el mnimo pa.
ra la muestra general de ensayo. En la prctica con frecuencia es dificil ob,
., ,
. ,,
tener muestras adecuadaa de eso&grupos.
Los aspectos de la extensin de los cuadernillos de ensayo (er. tCrminos
del nmero de iums) y los limites de tiempo para un ensayo, estn relacionados estrechamente. El princlpio que determina a ambos, es que se desea,
tanto como sea posible. hacer que cada sujeto intente resolver cada'item. Si
el lmite de tiempo es tan corto, con telaci6n a la exttnsinldr: la prueba,
que algunos sujetos no han tenido tiempo de intentar los ltimos itemi, las
estadisticas para esos items resu1t;irAn disto\-sionadas. Algunas veced no se
toman.medidas para diferenaar entre 103 tems que fueron leidos pero que no
tuvieron respuesta y los items queeno se alcanzaron a leer. L b s dos casos
no son equivaleotes, y no es deseahie que se traten como tal, pero aun cuan.
do se den instrucciones para identificar y excluir estos casos, p6r lo general
los sujetos que responden los ltimos items tienen una capacidad mayor que
quienes no los respondieron.'Por lo tanto. puede dars tiempo suficiente,
o bien acortarse suficientemente las pruebas para que.casi todos4puednn
leer,e intentar responder cada item. Debido a que los grupos para el erisayo no pueden ertar disponibles porims de 40 6 45 minutos de periodo de
clase, eq una buena idea preparariiin material de ensayo compuesto de va.
rias,,pmebas 'conas .y, paralelas, de modo que el material presentado a
un sujeto no exceda lo quq pueda manipular en un solo perodo. Frecuente.
mente resulta m k fcil multiplicar el nmero de sujetos por 2, 3 6 4,'que
qultiplicar el tiempo de'- ensayo por el mismo factor. ..
j, Otra,decisi6n kmprana.,tes 1a:eleccin del sistema de ca~iticaci6n.que
selva,a'+sar romo criteri~,,conel cual se juzga la efectividad de cada tem,
paqpwier, diferenciar ajos sujetos con ms atributo lattntc de aquelloslcon
menos aaibuto. En los casos en los que se ensayen nuevos itemk agregados
?.uq pFQgi;ama regular de pruebas,,Son objeto de desarrollar iiuevas formas
de,prueb.a'para cate programa, t l prbcedimiento normal y msdatisfactorio
es ,usar+ sistema_decrilifkacin de la prueba ya existente, o alguria seccin
*

especfica de ella, como criterio para juzgar el nuevo tem. Sin embargo, debido a que el sistema de puntuaciin que se usa en dichas pruebas, rara vez
est. al alcance del investigador, por lo general se debe usar la puntuacin
total como criterio para el conjunto de tems de la forma de ensayo. Aun
cuando pueda haber unos tems deficientes, que disminuyan la precisih del
bloque de ensayo como medida del atributo latente, este efecto es general.
mente pequeiio, y la piintuaci6n total proporciona un criterio razonablemente
confiable.
PLANEs PARA ANALIZAR Y USAR LA INFORMACI~N

DEL ENSAYO
Una vez tomadas !as decisior;es sobre las muestras que se van a probar, debe
formularse un plan para el anlisis y el uso de los resultados del ensayo.
iCules anlisis estadisticos deben aplicarse? QuC uso se har6 de los resul.
tados estadsticos? Que significado tienen los resultados en relacin con
el contenido y la cobertura representativos del dominio que se va a evaluar
cor. la prueba?
El interbs se centra ahora (como se expone con tlciallc cn el capiiilo
4) sobre la dificultad del tem y su validez para diferenciar a quiencs califi
quen alto de quieries califiquen ms bajo en el atributo latente, como se de.
fine basndose en el criterio de calificacin usado para rcpresent;ir csc
atributo. Tambin puede ser de inters, en ciertas pruebas de habilidad, en.
contrar cuntos sujetos seleccionaron todas las respuestas equivocadas, y as
como en qu proporcin eligieron cada una de las mismas, aquellos sujetos
menos capaces. Esva ltima informacin es til, principalmente si quien cla.
bora la prueha se propone revisar el tem con objeto de mejorar su cfectivi.
dad. Las opiniones difieren acerca de cunto beneficio se obtiene al tratar
de salvar un tem mal redactado. Algunos elaboradores consideran que la
energa se invierte mejor al escribir nuevos items, en lugar dc iraiar tlc rc.
forzar los dbiles. No obstante, si se emprende tal operacin de rescate, la in
formacin sobre el funcionamiento de cada una de las elecciones errbncas
(suponiendo'un tem de eleccin mltiple) resulta de, mucha utilidad.
Deben eliminarse los tems que no 3on tiles, para diferenciar entre los
examinados mas capaces y los nienbs, especialmente aquellos que muestran
una discrimiriacin inversa. Merece dar cierta atencin a la seleccin de items
que discriininan en forma tan marcada como sea posible, pero por lo general, el principal uso de los indices de discriminacin, es excluir los tems
defrctuosos. Con el criterio de calificaci6n se puede establecer un nivel mninio de correlacin por debajo del cual se rechazarn los tems. Este mni.
mo tiende a descender para grupos homogneos que, segn se espera, tierieii
poca variacin en el atributo latentr y tambin en el caso de tems muy diversos, con un solo factor comiin, no predominante. Por el contrario, el ni-

PLANUCI~N
DE U E L

iI

42

~ ~ ~ O DE
~ CPRUEBAS
I ~ N

ve1 ser&dt cuando la pob,Iacin se; heterogtnea. o cuando haya muchos


tems diseados para representa+ a un solo rasgo bsico. Por ejemplo, en
una i);ruebade v~cabulario's~~~le,~iplicada
a un'muestreo aleatorio en ni.
rios'de '0 aos de edad, puedk'esp~riricque los items muestren ndices de
discriminacin telativamtntc altos, para los que se puede establecer un coeficiente de correlaci6n biserial ninima de 0.40, o hasta de 0.50. Por el contrario, un conjunto de terh que 1) t x k a un espectro amplio y ,variado de
aplicacin de conocimientos en medicina, y 2) se aplique a un p p s selecto
de graduados de una escuela de medicina, probablemente arrojad indices
considerablemente ms bajos para,diferenciar a los mas capaces de los me.
nos; entonces se establecer un cocficknte de correlacin biserial..mnima,
con el criterio de calificacin tan baja como 0.30, o incluso ile'0.20.'
En cuanto a los lteins que sobrepasan el mnimo establecido, el plan puedc especificar que'si les da& prefer'encia, iinicamerite 5i satisfacen los r&
quisitos de la repie,~cnt&indel contenido. as como el nivel apropiado de
.lI
:
dificultad.
.
Al fo&nular l
u especificacione?'de dificultad del 'te& es importante
consideku cmo se van a usar los resultados de la prueba. $ules decisiones,se basaran en ellos? Si hay algn plinto eri la escala del atributo latente
que sea un punto dave de decisibn, los ltems deben escogerse de manera que
las pruebas rnues.cn diferencias, tan marcadas como sea posible, entre quie:
nes quedan debaj?s!os que quedan por encima de dicho piinto:,~nG n t i
sea posible, todos los.t&& se esfogerln.de modo que la & h a cancteristica
de tems tenga una marcada pendiente, esto es, que el porcentaje de los q u ~
acierten aumente bruscamente en este punto critico. En e! moddo quese
II debe y t a r o muy c e r e n o o en
presenta en el capitulo l., el p&ch-o
el nivel en el cual incida la decisi6n crltica. Este puede ser el, caso' de, un
examen que K va a aplicar p a n otorgar un nmem limitado de 6Fcas +anl
do hay dn gran nmero de mlicitantes,'.~en el otro extremo, pin'ideltifi.
car un grupo de estudiarites coi1 bajo,rcndimie,nto,que deban recibir algn'
. . ,. ,.
.
.,
tipkde '~nsrmccin,especial. Sin embargo, fkcuentern,en&, ,&pna"que
los items.de una prueba midancon uya precisin casi igual,.uii,nngo bar.,
unte amplio del a,tributolaten te, y entonces el plan p a h nonhar,l~sdificul.,
rada de'loi tem,s d$x se;*&, que &tda lograr,erte objeii* El i&bleini
y considebr$
....
en.mayor::de,td)e
.,: .. .
. . . en
..:.,el .~apftulo
4. '
>! , : '.
'. , l , L ,
'

II

ie,

II

>

,/{

' :, ,

.!' :

. ! ,

,.!

,.

:,

.:,i,i

.;

t !

.,, .

t . .

::

,o.

;.

..! * .

. .

m * ?

..

...

. , i

.,,,,.

<

1>

i . ;

';.">.

Cuando,la.funcin he yna, pnieba sea definir Ia.p~si,ci6ndc cad? s,ujeto,en


..
< ,
cierto atfbu,o latenie, es ' d
. ) . . s
. e.;.
a b !~tener.rnedios
. ,~
, . . ... .
p a b ubkar ?,es?;persoria
, . ,.! a'.il
Ia$dems,n a . e s c a i + : h s vecesw dispone,de una 7spI.a abso.
reipecto
l u k o preestablecida, ~ i + i + a & b + ~ ' i o i ncnhpr~nsi6n
o
de k c t ~ i ~ ~ . , ~ i s ~ a i i .
zacin eip'acial,' conocimiento de" los principios mecnicos, y as
.

PLANES PARA RECABAR I N F O R ~ I A C ~ O:JORhlA'I'IVA


N

43

sucesivamente. El daminio de tareas susceptibles de ser cuzntificadas no tiene


lmites claros, y el rango de posiciones posibles en el atributo latente no tiene punto cero as como ningn liinite superior defiiiido. Por esta razhn, Iiis
bases de referencia para expresar el rendimiento de un individuo dado, se
toman del comportamiento de grupos de personas de edades. niveles de edu.
cacin y antecedentks o experiencias diferentes.
Este no siempre es el caso. En el iniiestreo con prueba de dominio, el
dominio est limitado y demarcado en fornia bien precisa. y la posicin dc
la persona cn la escala puede describirse en trminos absolutos, refiriiido
se a su iiivel de maestra en el dominio en cuestin. Por lo tanto, puede de.
cirse: "Dado un pasaje con 20 nombres propios a los cuales'se requiere poner
maysculas, el examinado identifica cuando menos 18 nombres corrccta
mente". Esta es un muestra satisfactoria de maestra, y se dice que en esta
prueba con referencia al criterio, cuando se le aplic al sujeto ste demostr maestria al cnlo>arles las maysculas a los nombres propios. Un logro
tan especifico como ste puede ser til para p i a r las decisiones del instructor, respecto a !o que el sujeto ha aprendido y lo que ahora se le deba ense.
fiar. Sin embargo, para las pruebas de habilidad de mayor alcance se
necesitan normas para reunir los grupos apropiados de sujetos.
El grupo de referencia apropiado es aquel con el cual el individuo o
el grupo de estudio se puedan comparar de la manera ms significativa y
exacta posible. Para un propsito determinado, ste puede ser el grupo de
todos los candidatos para ingresar eri un tipo particular de trabajo o para
un tipo particular de entrenami;nto. Por lo tanto, en los EE.UU., el Comiti.
de Exmenes de Admisin a Universidades ha desarrollado noriiias porcen.
tuales para los solicitanies de admisin a estudios superiores. que hacen In
Prueba de Aptitud Escolstica en un aiio dado, de modo que cada individuo pueda comparar sus resultados con los de aquel grupo. Algunas veces
el grupo normativo puede representar una regin en particular, o un tipo
especfico de escuela o de comunidad, por ejemplo: cuando un editor que
publica pruebas desarrolla "normas de grai: ciudad". Por lo general, se es.
pera que el grupo normativo sea una muestra representativa a nivel nacio
nal, que reproduzca con exactitud las caractersticas del pas entero. Las
formas eri las cuales los resultados de esta prueba se van a usar determinan
qu tipo de poblacih constituye el grupo de comparacin ms significativo.
Cuando se llega a una decisi6ii sobre la poblacin con la cual pucden
hacerse mejor las comparacioiies, entonces se debe 1) diseiiar un procedi.
miento de muestre0 para reproducir las caractersticas de la poblaci6n en
forma fiel y siii desviacibn, y 2) llevar a cabo el diseo con tan poca "dispersin" como sea posible. Las instrucciones de diseo de muestras se expondrn con miis detalle en el capitulo 5. Sin embargo, la muestra de ms
ingenioso diseno es de poca utilidad, a menos que los grupos solicitados en
la muestra puedan, de Iiecho, ser examinados. Por lo tanto. los arreglos para Iiacer llegar las pruebas a los individuos o los grupos apropiados para

.
,

44

' P ~ M C I ~DENU EXABOUACI~NDE PRUEBAS

la muestra planeada requlereli' di: aptitud d e organizacin y tiahilidad ad


ministrativa. Uno d e los requisitos de la planeacin consiste en obtener la
colaboracin de personas c.la localidad qtie supervisen y lleven a cabo la
pmeba, siguiendo los proctcJimientos especificados, cumpliendo coh los programas establecidos y reintegrando ai tiempo debido los resultados a la cene
tral de procesamiento d e los datos. Un programa que se ciirnpla rin
contratiempos se debe planear con meticuloso detalle.
Al mismo tiempo que se planeen las normas se debe tratar de visualizar
todos los anlisis que se realimrn con el conjunto d e los datos obtenidos.
El programa para estos anlisis debe desglosarse en detalle para tet:er la se.
guridad de que se recabaron todos los datos necesarios. De otro modo, se
puede encontrar por ejemplo, que se deseaba hacer anlisis separados para
nios de diferentes p p o s Ctnicos, pero que no se solicit informacin so*
bre el p p o itnico d e cada nio. Si se establecen normas para una nueva
forma de prueba, el plan d t b e incluir un diseo de prueba que permitir
el ajuste de la prueba nueva a las ya existentes. En el capitulo 5 se exponen
varios ejemplos de tales modelos. Si se requieren anlisis de correlacin de
las calificaciones parciales, deben hacerse planes para calificar cada parte
por separado.
Por supuesto, la planeacin debe incluir decisiones sobre los tipo:. de
calificaciones convcrtidas que se van a requerir (percentiles, puntuaciones
estndar, puntuaciones en una escala bkica del atributo latente). Una ver
tomadas estas decisiones, debe establecerse, paso por paro, el programa de
los anlisis estadsticos de los resultados de la prueba, que se requerirn para convertir las puntuacione.
MANUAL DE LA PRUEBA Y MATEMALES DE A P O Y O
SI se prepara una prueba que usarn otras personls, quien la elabore preparar uno o ms manuales para los usuarios de la prueba. La pla~eacin
debe incluif la especificacin del contenido de dichos manuales. Esta pla.
neacin ayuda a garantizar que el manual quedar completo, y.que el conjxnto de datos necesarios para producirlo estar disponible conforme se
necesite. Entre los elementos que deben incluirse en el manual estn los si,
11
guientes:
l

1I

1. Indicacin d e los usos para los cuales se destina.


2. Instrucciones completas para aplicai la prueba.
: ,
3. Tablas de normas para convenir la puntuaciri parcial en valores estndar con el fin de'interpretarlas.
' '
4. Evidencia d e la confiabilidad d e la prueba y precisin de la medida.
5. Evidencia de la validez de la prueba para lograr los objetivos desea.
dos. (Esto puede incluir la evidencia de validez predictiva en forma
<,

de correlaciones del criterio con las variables especficas. Con fre.


ciiencia se incluye una amplia variedad de evidencias que demues.
tren que la construccin de la prueba es vlida conio una medida
del atributo latente que se intenta evaluar, y que abarca las correla
ciones con otras pruebas, anlisis factorial y evidencia de las diferen.
cias de grupos o del efecto de intervenciones experime~tales.)
6. Si se consideran necesarias, guas y sugerencias para el uso de los
resulta2os de la prueba.
Se necesita preparar los materiales de soporte para diferentes personas:
las que aplicarn la prueba. las que harn uso prctico de los resultados.
y aquellas que evaluarn la validez de la prueba para usos diferentes, o que
llevarn a cabo investigaciones con base en sta. Ser necesario entonces
que se preparen diferentes tipos de documentos de soporte, tales como: un
manual para el examinador, uno para el consejero o administrador y iin
manual tecnico. ..

Un gran nmcro Jc pruebas se elaboran con el requisito de que c s t h <lis.


ponibles para aplicarse en una fecha cspccifica. Esta exigencia es coiiiii cn
los exmenes que forman parte d e un servicio de exmenes peridicos, co.
mo los de colegios, o divcrsas formas de exmenes de licenciatura. as como
en los de cursos o qxmeiies de conocimientos generales en escuelas y un.
versidades. Adems. cualquier examen publicado con fines conierciales, tie.
ne una fecha fija en la cual debe ofrecerse al pblico. En la iiiayora de las
pruebas son esenciales las fechas lmite y si se desea ciii:iplir este plazo cs
menester establecer un progTaina de produccin apegado a la realidad.
La forma norrnal de generar un programa es trabajar "hacia ati-is". dcs.
de la fecha en que la prueba debe estar lista para usarse. se establece la fc.
cha del da del examen, nienos tantos das, semanas c meses durante los cuales
deba tcrininarse cada paso preliminar. I.ic secuencia dc los pasos variar
un poco. de acuerdo con el tipo de prueba. As como el paso de preparar
normas adicionales. el cual puede representar la mayor parte del trabajo
en pruebas destinadas a distribucin comercial, tal vez sera innecesario en
un examen de licenciatura o para candidatos a puestos administrati~os.Aun
cuando un prograina debe ser principalmeiite lineal, con un paso siguiendo al otro, siempre habr pasos paralelos y algunas actividades que puedan
realizarse en forma concurrente.
En cualquier programa, hay momentos crticos dererininados por la se.
cueticia de eventos fuera del control de quien elabora la prueba. Supngase
que se van a establecer normas para griipos acadiiiicos al principio del aiio
escolar. Dichos griipos cst;in disponibles solaiiiente una \.ez al aiio, de 1110.