Está en la página 1de 44

CONSTRUCCIN DE PRUEBAS

PSICOLGICAS

NDICE
DEDICATORIA.................................................................................................. 4
INTRODUCCIN.............................................................................................. 5
1.

CONSTRUCCIN DE PRUEBAS..................................................................6

2. FINALIDAD DE UN TEST............................................................................... 7
2.

CONTENIDO DE LA CONSTRUCCIN DE PRUEBAS....................................9


2.1.

Tener bien estructurados los contenidos sobre los que se va a hacer el test
9

2.2.

Seleccionar el contenido del test...........................................................10

2.3.

Cuantos tems debe tener un test?......................................................10

3.

FORMATO DEL TEST............................................................................... 11

4.

ELABORACION DEL PRETEST..................................................................11


4.1.

Elaboracin de los tems......................................................................11

4.2.

Redaccin de las Instrucciones.............................................................11

4.3.

Elaboracin del Material del Pretest.......................................................12

4.4.

Elaboracin de la Calificacin...............................................................12

4.5.

Juicio de Expertos............................................................................... 12

4.6.

Aplicacin al Grupo Piloto....................................................................12

4.7.

Ingreso de datos al Programa del SPSS.................................................13

REGLAS GENERALES................................................................................. 13
REGLAS SOBRE LOS ENUNCIADOS............................................................13
A.
4.

Clasificacin de los tems segn su forma..................................................13


EL ITEM.................................................................................................. 14

4.1. COMPONENTES:.................................................................................. 15
4.2. TIPOS DE ITEM POR SU RESPUESTA....................................................16
4.3. VALIDACION DE ITEMS.........................................................................16
5.

CONSTRUCCION PROVICIONAL DE UN CUESTIONARIO...........................16


5.1. TIPOS DE PREGUNTAS A UTILIZAR EN UN CUESTIONARIO:...................17
5.2. CONSTRUCCIN DEL CUESTIONARIO..................................................20
5.3. ELABORACIN DEL CUESTIONARIO.....................................................23

5.

ELABORACIN DE UNA PRUEBA..............................................................24


5.1.

DEFINICION DE LA PRUEBA...............................................................25

5.2.

ELECCION DEL METODO DE ESCALAMIENTO....................................25

5.2.1.

METODOS DE ESCALAMIENTO REPRESENTATIVOS....................26

5.2.1.1.

Ordenamientos de expertos.....................................................26

5.2.1.2.

Escalas Likert........................................................................27

5.2.1.3.

Escalas de Guttman...............................................................28

5.2.2.

ELABORACIN DE LOS REACTIVOS............................................29

5.2.2.1.

Preguntas iniciales en la elaboracin de la prueba......................29

5.2.2.2.

La tabla de especificaciones....................................................30

5.2.2.3.

Formatos de los reactivos........................................................31

5.2.3.

ANLISIS DE LOS REACTIVOS....................................................34

5.2.4.

REVISIN DE LA PRUEBA...........................................................34

5.2.4.1.
5.2.5.

Validacin cruzada.................................................................35

PUBLICACIN DE LA PRUEBA.....................................................35

5.2.5.1.

Produccin de los materiales de evaluacin...............................36

5.2.5.2.

Manual tcnico y manual del usuario.........................................36

CONCLUSIONES............................................................................................ 38
SUGERENCIAS.............................................................................................. 39
REFERENCIAS BIBLIOGRFICAS...................................................................40
ENLACES WEB.............................................................................................. 40

DEDICATORIA

El presente trabajo est dedicado a todos


nuestros compaeros del VIII ciclo de psicologa,
a nuestro docente del curso por impartirnos
nuevas enseanzas.

INTRODUCCIN

La Psicologa reconoce en la Psicometra esa rama que se ocupa de las


cuestiones relacionadas con la medicin.
Los procesos operacionales de medicin en Psicologa asociados a las escalas
de medida: el objetivo de la Psicometra ser hallar la mejor manera de
observar,

clasificar

transformar

categoras

manifiestas

en

escalas

cuantitativas partiendo de la aceptacin del isomorfismo entre propiedades


atribuidas a las categoras psicolgicas y las propiedades atribuidas a los
nmeros que las representan (Stevens, 1951).
Postularemos a la evaluacin psicolgica como un proceso de toma de
decisiones cuyo objetivo es apuntar, con precisin y validez, a la tarea de
psicologa aplicada para solucionar problemas individuales, sociales y
ambientales.
Quienes se dedican a elaborar pruebas, brindan una amplia variedad de
antecedentes y detalles respecto del proceso de elaboracin. Sin embargo, la
APA (American Psychological Association) estima que ms de 20.000 pruebas
nuevas se elaboran cada ao y abarcan pruebas elaboradas para un estudio
de investigacin especfico, revisiones de anteriores publicadas , etc.
Consideramos de importancia la construccin de pruebas psicolgicas, puesto
los test psicolgicos forman parte de los instrumentos de trabajo de la
evaluacin psicolgica. Aqu conoceremos sobre la construccin de pruebas, la
finalidad del test, el contenido de construccin, la elaboracin del pre test, a
cerca del tem, sobre el cuestionario, y por ultimo aprenderemos cuales son los
pasos a seguir para elaborar una prueba psicolgica.
Habiendo realizado una breve exposicin sobre los temas a tratar a
continuacin, y que ello permitir un mayor aprendizaje de parte de los
estudiantes de psicologa, recomendamos una lectura compresiva y profundizar

a partir de la bibliografa o referencias sobre el tema tratar con la finalidad de


conocer sobre la construccin de pruebas.

1. CONSTRUCCIN DE PRUEBAS
Un buen instrumento de evaluacin debe ser construido de una forma
rigurosa si queremos que sea adecuado para los usos a los que est
dirigido. En la prctica, el desarrollo de un test es una tarea laboriosa que
requiere de la colaboracin entre expertos en la materia o constructo a
evaluar y expertos en medicin. Los tests pueden desarrollarse en el marco
de dos grandes modelos, conocidos como Teora Clsica de los Tests
(TCT) y Teora de Respuesta al tem (TRI).
En psicometra, se denomina construccin de tests o construccin de
pruebas al conjunto de procedimientos de planificacin, diseo, control,
normalizacin y estandarizacin de pruebas o tests psicolgicos. La
construccin de un test psicolgico puede enmarcarse en la teora clsica o
realizarse de acuerdo a la teora de respuesta al tem (tambin llamada
teora probabilstica). Si se concibe el test como instrumento medicin
ajustado a criterios cientficos, su construccin es un proceso complejo,
que consta de varias fases o pasos en los que se aplican pruebas o
procedimientos estadsticos. Las fases se realizan sucesivamente, de
modo que cada una se basa en los resultados obtenidos en la fase anterior.
Toda prueba psicolgica es construida de tal manera que represente o
pueda predecir una determinada conducta. Segn Brown (1980) una
prueba psicolgica es una representacin cuando sus reactivos son
similares a la conducta que desea medir y es predictiva cuando sus
reactivos, aunque no son similares a la conducta, pueden predecirla.
Por lo tanto, la construccin de los reactivos de una prueba es
fundamental, as como su anlisis y comprobacin. Conocer exactamente
lo que se quiere medir es muy importante para la construccin de "buenos
reactivos".
Al elaborarse una prueba, se proponen inicialmente una buena cantidad de
reactivos, de los cuales solo se quedan aquellos que realmente miden lo
que se pretende medir. Bacher (1981) advierte sobre los errores

sistemticos que ocurren en la construccin de reactivos y hace varias


sugerencias, entre ellas:
(a) el vocabulario debe ser simple, accesible a todos,
(b) se deben evitar los trminos tcnicos y palabras cuyo sentido vare
segn la regin o el grupo social,
(c) se deben evitar formulaciones muy abstractas pues pueden ser mal
comprendidas,
(d) se deben evitar reactivos muy largos, sobre todo cuando son
formulados en la forma interrogativa o cuando contengan negaciones,
(d) en la formulacin de los reactivos, se debe evitar favorecer
determinadas respuestas volviendo las dems menos probables,
(e) no debe figurar en la formulacin de un reactivo ms de una idea
pues, es imposible saber a cul de ellas contesta el sujeto.

2. FINALIDAD DE UN TEST
El desarrollo de un test comienza con la delimitacin del objetivo del test y el
constructo o dominio que se pretende medir. En este terreno, un primer paso es
considerar cules son las poblaciones a las que est destinado y el tipo de
decisiones que se tomarn con las puntuaciones obtenidas.
Con respecto a la primera cuestin debern determinarse las edades de los
sujetos (o los cursos en muchos de los tests de rendimiento), si el test se
aplicar a todos los sujetos o a grupos seleccionados de alguna forma (tests
para la poblacin general o destinados a grupos especiales), requisitos de
lenguaje que deben tener los sujetos (pueden establecerse tambin
modificaciones o adaptaciones permisibles), si se necesita o no una motivacin
especial para realizar el test, etc.
Con respecto a los posibles usos de las puntuaciones, sin nimo de ser
exhaustivos, entre los tipos de decisiones ms frecuentes encontramos:
a) Decisiones relativas al nivel de instruccin o habilidad. El objetivo
consiste en determinar si los sujetos poseen dominio de ciertos

conocimientos o destrezas predeterminados de antemano. Suelen ser


decisiones propias de los llamados Test Referidos a Criterio.
b) Decisiones de diagnstico. Tienen como objetivo la identificacin de
fallos o deficiencias en el comportamiento para emprender alguna
intervencin o tratamiento. Aunque las puntuaciones suelen compararse
con datos normativos, este tipo de decisin tambin es propia de los
Tests Referidos a Criterio.
c) Decisiones de seleccin. El objetivo en este caso es la seleccin de
los sujetos ms capaces en algn sentido o materia. Las puntuaciones
de los sujetos en el test se usan para admitir o excluir, emplear o
rechazar.
d) Decisiones de asignacin. El objetivo es determinar en qu lugar debe
colocarse una persona dentro de una jerarqua. Esta jerarqua puede ser
de carcter profesional (qu puesto de trabajo corresponde a un
determinado sujeto), de carcter formativo (dentro de un programa de
formacin qu nivel le correspondera), etc.
e) Decisiones de clasificacin. El objetivo radica tambin en asignar a los
sujetos a ciertas categoras pero, en este caso, las asignaciones son de
tipo en lugar de nivel. Por ejemplo: dentro de qu categora diagnstica
clnica clasificamos a un sujeto?
f) Decisiones de consejo. El objetivo es orientar al sujeto con respecto a
algn aspecto de su comportamiento futuro, abarcando una gran
cantidad de decisiones que el sujeto toma con ayuda de un profesional
de la psicologa o la psicopedagoga.
g) De screening (deteccin rpida): tiene como finalidad la deteccin
rpida de algn tipo de trastorno, deficiencia o anomala. El objetivo es
proveer una herramienta sencilla, de rpida aplicacin que permita
detectar personas que potencialmente puedan presentar un determinado
trastorno, deficiencia, etc., sirviendo como criba antes de la aplicacin
de otras pruebas de carcter ms exhaustivo.

2. CONTENIDO DE LA CONSTRUCCIN DE PRUEBAS


La Psicologa reconoce en la Psicometra esa rama que se ocupa de las
cuestiones relacionadas con la medicin, y si bien es cierto que las ciencias
atraviesan una poca de crisis de paradigmas y en especial las ciencias
sociales y conductuales, an as podemos encontrar contenidos tradicionales
en la Psicometra que son punto de acuerdo entre la mayora de los autores e
investigadores de la Psicologa. Se podran sintetizar en tres ejes:
a Los procesos operacionales de medicin en Psicologa asociados a
las escalas de medida: el objetivo de la Psicometra ser hallar la mejor
manera de observar, clasificar y transformar categoras manifiestas en
escalas cuantitativas partiendo de la aceptacin del isomorfismo entre
propiedades atribuidas a las categoras psicolgicas y las propiedades
atribuidas a los nmeros que las representan (Stevens, 1951)
b Confiabilidad o precisin de los instrumentos de medida en
Psicologa: es uno de los tres problemas de medida asociados a las
escalas de medida que merecen atencin ya que si una prueba
psicomtrica no es confiable en su medicin, su inconsistencia
repercutir negativamente no solo en la validez del instrumento sino en
todos los procesos relacionales que se incluyan.
c Validez de una prueba: es la propiedad fundamental en tanto permite
decir de una prueba que mide lo que pretende medir y es un valor social
sobresaliente que asume una funcin tanto cientfica como poltica
(Messick, 1995)
2.1.

Tener bien estructurados los contenidos sobre los que se va a


hacer el test
Es imprescindible tener bien

determinada la

estructura de

contenidos, porque esto nos permitir:


No dejar de incluir ningn aspecto importante.
Incluir ms tems de los apartados ms amplios.

los

Ponderar cada apartado en funcin de su relevancia.


Si

se

quisiera se

podra ofrecer puntuaciones

diagnsticos diferenciados de los distintos contenidos.


2.2.

Seleccionar el contenido del test

La tabla anterior es una especie de plano que permite saber qu se


debe incluir en el test. Sin embargo, en ocasiones, incluir todos los tems
que corresponderan a esa tabla es imposible porque saldra un
examen demasiado largo. Entonces

se

debe

muestra de los mismos. Ahora bien, esa


dos

seleccionar una

muestra debe

tener

caractersticas: suficiencia y representatividad.

SUFICIENCIA: el nmero de elementos debe ser al menos aquel


que permita incluir a todos los grandes bloques, en contenidos y
objetivos.
Ejemplo: Si tenemos 3 grandes apartados
trabajamos

con

de contenidos y

5 objetivos, debera haber, al menos, 3x5= 15

elementos.

REPRESENTATIVIDAD. Ni todos los objetivos son igualmente


importantes ni todos los contenidos son igualmente relevantes y la
representatividad de

los

tems

debe

tener en

cuenta

estos

aspectos. Esto puede conseguirse:


Atribuyendo a los grandes bloques un mayor numero de tems
(dando a todos igual valoracin)
Valorando ms los tems referidos a tales
contenidos, aunque a cada

bloque se atribuya el mismo

nmero de tems.
2.3.

objetivos

Cuantos tems debe tener un test?

3. FORMATO DEL TEST

4. ELABORACION DEL PRETEST


4.1.

Elaboracin de los tems.

Qu es un tem?
-Conjunto de enunciado, cuyo objetivo es medir las caractersticas de un
constructo.
- Es una unidad bsica de informacin de un instrumento de evaluacin
y generalmente consta de una jerarqua y de una respuesta cerrada o
abierta.
Elaboracin de tems. Se confecciona una tabla de doble entrada
especificando los contenidos de la variable o constructo a medir,
garantizando una muestra representativa de todos los posibles reactivos
de generar.

4.2.

Redaccin de las Instrucciones.

Deben de describir el proceso de la respuesta de los examinados. Debe


ser claro y especifico.
Instrucciones:

A continuacin encontrar una serie de frases. Lea atentamente cada


una de ellas y conteste de la siguiente manera:

Si le parece que es verdad lo que en la frase dice o esta de acuerdo con


ella marque la respuesta SI.

Si la frase le parece mas falsa que cierta o si esta en desacuerdo con


ella marque en la respuesta NO.

Asegrese de haber contestado todas las frases al finalizar.

4.3.

Elaboracin del Material del Pretest.

Se proceder a crear los tems que conformar el pre test de la


prueba psicomtrica.

Posteriormente se realizar la hoja del test propiamente dicho,


tomando en cuenta el orden de dificultad de los tems.

4.4.

Elaboracin de la Calificacin.

Si las respuestas son dicotmicas:


SI y NO. La calificacin, se colocar un punto (1) a las respuestas
que son indicadores de la variable a estudiar y con cero (0) a aquellos
indicadores que no expresan la caracterstica del mismo.
Si las respuestas son de tipo Likert:
Si el enunciado mide el indicador de la variable la calificacin seria TA: 5
A:4 I: 3 D: 2 TD: 1, si no mide el indicador seria TA: 1 A:2 I: 3 D: 4 TD: 5
4.5.

Juicio de Expertos

Tiene la finalidad de contrastar la validez de los tems.

Consiste en preguntar a personas expertas en el dominio que miden los


tems, se refiere al grado en que la medicin representa al concepto
medido.
4.6.

Aplicacin al Grupo Piloto

Es la aplicacin al grupo de sujetos que presenta los indicadores a


medir.

4.7.

Ingreso de datos al Programa del SPSS

Se crea la base de variables para posteriormente ingresar la base de


datos al programa del SPSS

REGLAS GENERALES
1 Verificar que el tem corresponda con los propsitos de la evaluacin, la
estructura de la prueba y con las dimensiones disciplinares. Todas las
preguntas de una prueba deben ser independientes entre s.
La informacin de un tem no debe servir de pauta para contestar otra,
ni la respuesta a un tem debe depender de haber encontrado primero la
de otra anterior.
2 Evitar los tems que pueden contestarse por sentido comn y aquellos
cuya respuesta dependa nicamente de recordar un trmino, un
smbolo, un dato o la fecha en que ocurri un evento.
3 Evitar expresiones rebuscadas que puedan confundir. Se recomienda
emplear un lenguaje directo, sencillo y comprensible.
4 Los tems no deben tener juicios de valor explcitos o implcitos.

REGLAS SOBRE LOS ENUNCIADOS


1 Los enunciados deben ser afirmativos, en caso de ser necesaria la
negacin, se debe resaltar para llamar la atencin hacia la formulacin
negativa. La doble negacin afecta la comprensin (No es cierto que no
procedan los recursos).
2 Evitar enunciados demasiado extensos y poco atractivos ya que
desmotivan la lectura, disminuyen el tiempo de respuesta y fatigan.
3 Garantizar la coherencia interna del enunciado y de este con las
opciones de respuesta.

A Clasificacin de los tems segn su forma.


a. Composicin de un tems
Los test psicomtricos se componen de una serie de tems.
En los test de las pruebas de ejecucin mxima u optima los tems
puede ser variados de acuerdo a lo que se quiere medir.
b. Nmero de tems
Como regla general se considera que el nmero mnimo de tems para
evaluar un constructo seria de 10 tems, pero el numero puede ir desde
los 10 a 90, de manera que puedan abarcar de forma proporcional cada
una de las dimensiones definidas , a priori en el constructo. Se
recomienda realizar el doble de tems de los que van a necesitarse en la
versin definitiva del cuestionario.
c. Puntuacin de los tems
Esta en funcin al numero de opciones o tipo de respuestas:
Dicotmicas: SI/NO. Verdadero/Falso
Politmicas: Opcin mltiple.
La puntuacin puede ser simple o ponderado. Se dice que son tems
simple cuando la puntuacin directa se obtiene con el sumatorio de
respuestas acertadas o de los valores que se hayan dado en cada
opcin. Se habla de tems ponderados cuando el valor de cada opcin
de respuesta no es la misma o no se otorga el mismo valor a todos los
aciertos.

4 EL ITEM
Un tem es cada una de las partes individuales que conforman un conjunto. En
este sentido, en un documento escrito, el tem se refiere a cada uno de los
artculos o captulos en que este se subdivide. Por extensin, como tem
tambin se conoce cada una de las unidades en que se dividen listas,
formularios, pruebas o test.
La palabra tem, como tal, proviene del latn tem, y significa del mismo modo
o tambin. De all que tem tambin pueda emplearse, en registros de habla

muy formal, para expresar una adicin o una aadidura que se hace sobre
algo.
En este sentido, tem es equivalente a adems o tambin. Por esta razn, en
textos antiguos de carcter jurdico o de un nivel muy culto, tem era usado
para aadir indicar que se estaba aadiendo informacin a un escrito. Del
mismo modo, la expresin tem ms se utiliza para significar adems.
Es la unidad bsica de observacin de una prueba objetiva. Se utiliza para
medir conocimientos formales, habilidades cognitivas adquiridas a travs de la
experiencia y aprendizajes complejos producto de las dos primeras. No
requiere de juicios personales del evaluador o de interpretaciones para calificar
las respuestas correctas. Posee una respuesta nica previamente establecida
y acordada de manera colegiala.
4.1. COMPONENTES:
El tem se integra por:
La base o cuerpo: Expresa una situacin o problema en forma de
proposicin.
Las opciones de respuesta: Son alternativas de respuesta a la base, de
las cuales solo una es correcta; las dems son distractores plausibles que
tienen como funcin que el examinado demuestre que es capaz de
discriminar la respuesta correcta.
Las argumentaciones: Son explicaciones que dan sustento a cada una de
las opciones de respuesta.
CARACTERISTICAS:

Evala contenidos vigentes.

Es una creacin original del elaborador.

Mide contenidos que no se responden por sentido comn.

Emplea situaciones comprensibles y un vocabulario adecuado para la


poblacin objetivo.

Est libre de informacin que puede ser ofensiva para algn grupo
social.

No favorece a un grupo determinado.

No da pistas que conduzcan a la respuesta correcta.

Presenta estmulos claros que no se presten a ms de una


interpretacin.

Incluye nicamente la informacin necesaria y relevante para el


planteamiento del problema y su solucin.

Est redactado de forma clara.

Es independiente de otros tems, la informacin contenida en uno no


debe sugerir la solucin ni debe ser requisito para contestar otro.

Utiliza opciones de respuesta distintas a las de otros tems.

4.2. TIPOS DE ITEM POR SU RESPUESTA


Alternativa diferenciada: Con base en el cuerpo del tem slo una
opcin es la correcta, las dems son distractores plausibles.
Respuesta optima: En la base de muestra el problema a ser resuelto en
donde las opciones de respuesta son parcialmente correctas, pero una
de ellas es ms adecuada que las dems.
4.3. VALIDACION DE ITEMS
Es el proceso en el cual los tems son sometido a una valoracin
cualitativa en la que, a juicio de un trabajo colegiado asignado a un
grupo (dos o tres expertos), determinan a travs de ciertas rubricas si

son pertinente y relevantes para los propsitos del examen; vigilan que
estn libres de errores conceptuales, gramaticales o de redaccin.
Asimismo, determinan la complejidad de manera a priori del tem y que
estos no sean respondidos por sentido comn. Al finalizar dictaminan si
son

aprobados,

candidatos

ser

aceptados

condicionados

modificaciones o descartados.

CONSTRUCCION PROVICIONAL DE UN CUESTIONARIO

El cuestionario consiste en un conjunto de preguntas, normalmente de varios


tipos, preparado sistemtica y cuidadosamente, sobre los hechos y aspectos
que interesan en una investigacin o evaluacin, y que puede ser aplicado en
formas variadas, entre las que destacan su administracin a grupos o su
envo por correo.
La finalidad del cuestionario es obtener, de manera sistemtica y ordenada,
informacin acerca de la poblacin con la que se trabaja, sobre las variables
objeto de la investigacin o evaluacin. Al utilizar esta tcnica, el evaluador y
el investigador, tienen que considerar dos caminos metodolgicos generales:
estar plenamente convencido de que las preguntas se pueden formular con la
claridad suficiente para que funcionen en la interaccin personal que supone
el cuestionario y dar todos los pasos posibles para maximizar la probabilidad
de que el sujeto conteste y devuelva las preguntas.

5.1. TIPOS DE PREGUNTAS A UTILIZAR EN UN CUESTIONARIO:


Para obtener la informacin deseada es necesario recurrir a varios tipos de
preguntas:
5.1.1. Segn el modo de formularse, las preguntas pueden ser
cerradas y abiertas.
Las cuestiones cerradas ofrecen al usuario que va a ser evaluado todas
las alternativas posibles, o al menos todas aquellas que mejor responden
a la situacin que deseamos conocer. El sujeto no tiene sino elegir

alguna o algunas, poniendo una seal convenida: una cruz, rodear con
un crculo, subrayar.... Suelen ser preguntas con la opcin afirmativa y
negativa, y, a veces, no s/sin opinin. Ejemplo n 1:
Tiene en su domicilio acceso a Internet? S ( ) No ( )
En otras ocasiones las preguntas estn categorizadas. Al usuario se le da
a elegir entre un abanico de opciones. Ejemplo n 2:
Cuntos habitantes tienen la ciudad donde vive?
Menos de 2.000. ( ) De 2.001 a 5.000 ( ) De 5.001 a 10.000 ( )
De 10.001 a 20.000 ( ) De 20.001 a 50.000 ( ) De 50.001 a 100.000 ( )
De 100.001 a 200.000 ( ) De 200.001 a 1.000.000 ( ) Ms de 1.000.000 ( )
Las respuestas o categoras que se ofrezcan a este tipo de preguntas han
de reunir dos condiciones esenciales: que sean exhaustivas y
excluyentes. 4 Las categoras o respuestas sern exhaustivas si abarcan
todos los casos que pueden darse. En ese caso, ningn encuestado
puede dejar de responder por no encontrar su categora. Y sern
excluyentes, cuando ningn sujeto al contestar al cuestionario, pueda
elegir vlidamente dos respuestas distintas de la misma pregunta.
Algunas

preguntas

se

presentan

bajo

una

escala

cuantitativa,

correspondiente al nmero de veces que se repite una accin


determinada. En este caso es conveniente elegir un nmero par de
opciones, cuatro o seis, con objeto de evitar que el encuestado puede
responder a la opcin central, sin esforzarse en reflexionar. As ocurre en
el ejemplo n 3.
En las clases tericas del curso de formacin que est haciendo, toma
apuntes o notas de lo que dice el monitor o formador?
Nunca ( ) Pocas veces ( ) Con frecuencia ( ) Siempre ( )
Las preguntas abiertas no ofrecen ninguna categora para elegir. Slo
contienen la pregunta y no ofrecen ningn tipo de respuesta, dejando sta
a la consideracin del sujeto que completa el cuestionario. Ejemplo n 4:

Qu le parecen las Unidades Didcticas de Evaluacin que tiene en sus


manos?
5.1.2. Preguntas de hecho y opinin. Segn la naturaleza del contenido
de las preguntas stas pueden ser: de hecho, de opinin, de
identificacin, de accin, de informacin, de intencin, de aspiraciones, de
expectativas ante el futuro, y de motivaciones y creencias y actitudes.
Segn la realidad que intentan descubrir las preguntas pueden
clasificarse en preguntas sobre hechos y preguntas sobre opiniones.
Las preguntas de hechos solicitan informacin que el encuestado suele
conocer mejor que nadie y que no admite dudas. No obstante, algunos
hechos como la edad, tem frecuente en muchos cuestionarios, puede
necesitar ser contrastado con otras fuentes documentales, por un posible
inters en no ser veraz en el dato. No obstante, hay hechos que no
pueden ser contrastados, porque slo conoce el sujeto. Veamos el
ejemplo n 5:
Cuantas veces a la semana consulta en su casa el material didctico
que le han entregado en el curso?
Ninguna ( ) Alguna vez ( ) Tres/cuatro veces ( ) Diariamente ( )
Las preguntas ms frecuentes son las de opinin y stas, a su vez, se
concretan en una amplia gama: preguntas para descubrir las creencias,
las preferencias y las estimaciones. Estas preguntas son muy frecuentes
en las investigaciones sociolgicas de los medios de comunicacin y las
casas comerciales con objeto de consultar los gustos del pblico, para
observar el grado de aceptacin de sus productos y reorientarlos de
acuerdo con la demanda de la audiencia. En la evaluacin de programas
este tipo de preguntas pueden ser muy importantes con vistas a conocer
las expectativas de los usuarios con respecto al programa, la satisfaccin
con el mismo, la opinin que les merecen los monitores de formacin o su
metodologa, etc.

5.1.3. Segn su finalidad se puede hablar de preguntas directas e


indirectas.
En los tems de hecho y en los de opinin, hay que tener en cuenta la
posible negativa del sujeto o su deseo de deformar su propia imagen y
hacerla coincidir con las expectativas del evaluador de un programa, o
simplemente trate de ocultar una realidad que no desea dar a conocer.
Una misma encuesta, sobre temas econmicos, puede concluir resultados
diferentes si se piensa que hay motivaciones relacionadas con los
impuestos o se refieren a una situacin de catstrofe, por ejemplo, donde
se piensa que el individuo pudiera recibir beneficios.

5.2. CONSTRUCCIN DEL CUESTIONARIO.


La construccin de un cuestionario es una tarea cuidadosa y compleja.
Cuidadosa porque de la perfeccin con que se haga depender, en buena
parte, el xito de la evaluacin o de la investigacin. Su complejidad radica en
la dificultad que supone expresar en indicadores concretos los aspectos de la
realidad (variables), que sean significativos en relacin con el objeto de esa
evaluacin o investigacin. A esta dificultad se le suman otros problemas, entre
los que destacan los lingsticos y psicolgicos.
El carcter sistemtico y complejo que supone la construccin de un
cuestionario, nos lleva a concluir que el formador de formadores habr de
considerar, siempre que sea posible, que su elaboracin sea una tarea de
equipo, por ejemplo dentro de RR.HH.
En los planes y proyectos de formacin hay algunos procesos que pueden
evaluarse directamente, los que son de orden fsico. Por ejemplo, el nmero de
piezas a la hora, que un obrero realiza con un dispositivo automatizado, antes y
despus de un programa de formacin sobre la utilizacin de esa mquina.
Pero la mayora de los aspectos que abarca la formacin requieren de una
evaluacin indirecta, a travs de indicadores, descriptores o atributos. La
dificultad fundamental para evaluar un programa de formacin, a travs de un
cuestionario, radica en hacer la traduccin de las variables empricas, sobre las
que deseamos obtener informacin, a preguntas concretas sobre ese programa

o proceso de formacin implementado en una empresa concreta; y al mismo


tiempo, hacer que esas preguntas sean capaces de suscitar respuestas
sinceras y claras. Partiendo de ese supuesto, el formador de formadores ha de
ser consciente de las etapas bsicas que se pueden distinguir en la
preparacin del cuestionario:
La secuencia que suele seguirse al elaborar un cuestionario es la siguiente:
- Determinar con precisin qu tipo de informacin necesitamos,
- seleccionar los aspectos ms relevantes para obtenerla,
- decidir la modalidad del cuestionario ms adecuada,
- efectuar una primera redaccin,
- someterla a crtica por algunos expertos,
- ponerla a prueba con un grupo experimental,
- reelaborarla y establecer los procedimientos para su aplicacin.
Sierra Bravo, sintetiza estas fases en: formulacin de hiptesis, determinacin
de variables a observar, con sus dimensiones e indicadores, y planificacin del
contenido del cuestionario.
Formulacin de objetivos. La formulacin de hiptesis, slo tiene razn de
ser en los cuestionarios de recogida de datos para una investigacin
experimental. En la evaluacin de un Programa de Formacin hemos de hablar
de objetivos y hara referencia a prever el sentido y utilidad del cuestionario, a
decidir lo que se va a buscar con cada pregunta, lo que se pretende saber o
conocer a travs del citado cuestionario.
Un cuestionario supone un intento de recoger toda la informacin necesaria y
relevante acerca del Programa de formacin que pretendemos evaluar; pero
slo la necesaria. Si se comienza la evaluacin por la construccin del
cuestionario, sin haber precisado claramente los objetivos de la evaluacin,
podemos incluir muchos elementos que supongan un esfuerzo baldo e incluso
perjudiciales, porque pueden restar claridad a las variables investigadas.
Determinacin de las dimensiones, variables e indicadores.

Desde el punto de vista de la investigacin social, las preguntas de un


cuestionario son la expresin, en forma interrogativa de las variables
empricas, o indicadores respecto de los cuales interesa obtener informacin.
(Gonzlez Ro, 1997)
En cualquier trabajo de investigacin o de evaluacin es necesario hacer
operativas las variables sobre las que vamos a recabar informacin. Cuando
trabajamos con variables en un proceso de investigacin descriptiva, o de
evaluacin, solemos operativizarla en dimensiones, (para algunos autores
categoras), variables e indicadores de esta variable. Dimensiones que suelen
estar presentes en casi todos los cuestionarios son: la edad, sexo, estudios,
profesin, etc. A ellas hay que sumarle las categoras especficas relacionadas
con el tema de evaluacin.
Planificacin del contenido del cuestionario.
Al planificar el contenido del cuestionario se pretende:

la especificacin del tipo de preguntas ms adecuadas, cerradas,


categorizadas, etc., para obtener de la poblacin encuestada los datos
o informaciones que sealan los indicadores establecidos;

las categoras, en su caso, que ms convengan a cada pregunta y a


los objetivos que se persiguen con ellas.

La determinacin del nmero de preguntas y de su orden y


disposicin dentro del cuestionario.

Las decisiones a tomar sobre los dos primeros pasos han de tener en cuenta:
lo que se pretende conocer con cada tem, las caractersticas de la poblacin
estudiada, la naturaleza y aplicaciones de cada pregunta, y la forma de
aplicacin del cuestionario (aplicacin grupal, por correo o mediante entrevista).
Las preguntas o tems categorizados hay que agruparlos y sistematizarlos en
tablas. A cada respuesta ha de corresponder una columna, por ello es
conveniente tener en cuenta, en la planificacin del cuestionario, que un
nmero excesivo de respuestas da lugar a tablas difciles de comprender por
los sujetos a los que va destinado el cuestionario.

En cuanto al nmero de tems que debe de contener un cuestionario, el


formador de formadores habr de considerar que aqul deber de tener todas
las preguntas necesarias, pero ni una ms. Es recomendable hacer
solamente las preguntas necesarias para obtener la informacin deseada o
medir la variable. Si es muy corto se pierde informacin si resulta largo puede
resultar tedioso.
Un cuestionario largo, salvo que sea absolutamente necesario, produce fatiga y
rechazo en el sujeto que lo completa, con el riesgo aadido que se quede
incompleto o se conteste sin la debida reflexin.
Se suele considerar que 30 tems es un tamao ideal y que a medida que nos
alejamos de l presenta mayores inconvenientes. No obstante, cuando las
preguntas sean fciles y puedan responderse con un s o un no, se puede
incrementar notablemente aquel nmero; que pueden sobrepasar la centena.
Por el contrario, las preguntas abiertas, muy pocas, fundamentales y
verdaderamente reveladoras, son suficientes.
En cuanto al tiempo empleado en contestar al cuestionario, la literatura
cientfica suele recomendar la regla de que pueda ser contestado entre media
y una hora, ello se debe a que se suelen aplicar a grupos, utilizando mdulos
horarios de la educacin formal o de la formacin en la empresa. Si se aplica
por correo, conviene reducir notablemente ese tiempo.
Es conveniente que el formador de formadores tenga presente que el nmero
de tems y el tiempo empleado en su completamiento dependen del grado de
informacin de que disponga el usuario de formacin y del inters que tenga en
participar en completar el cuestionario.
5.3. ELABORACIN DEL CUESTIONARIO.
La elaboracin formal del cuestionario abarca dos aspectos bsicos: la
redaccin de las preguntas y la determinacin de los aspectos formales del
cuestionario.
Redaccin de las preguntas.
Una vez definida la estructura del cuestionario se puede comenzar con la
redaccin de las preguntas. Es el momento decisivo, y el que lleva ms tiempo
y condiciona ms la evaluacin o la investigacin.

La forma de redactar la pregunta depende de la cuestin que investiguemos,


de la preparacin que posea la poblacin a encuestar, del tratamiento
estadstico programado, as como del modo de aplicacin. La redaccin de las
preguntas, segn la tesis defendida por Sudman y Bradburn (1982), es el
elemento esencial para maximizar la validez de los datos obtenidos en la
evaluacin o en la investigacin por encuesta. De hecho, se sabe que cambios
aparentemente pequeos en la redaccin de las preguntas pueden causar
grandes diferencias en los diversos porcentajes de respuestas a la misma.
Reglas para la formulacin de preguntas:
Se consideran reglas bsicas de esta redaccin: que no se pierdan nunca de
vista los objetivos de la investigacin y que, previamente a la formulacin de
cada pregunta, nos preguntemos sobre la necesidad y oportunidad de la
misma, y sobre el grado en que nos servir para lograr los objetivos
propuestos. (Sierra Bravo, 1988: 317)
Una pregunta est bien formulada cuando no ejerce influencia en el sentido de
la respuesta y no incita a una respuesta inexacta, que no corresponde con la
informacin buscada.
Determinacin de los aspectos formales del cuestionario.
Todo cuestionario suele constar de una serie de datos sobre la persona que
lo cumplimenta, que constituyen una serie de categoras a tener en cuenta en
la evaluacin del programa de formacin: edad, sexo, nivel educativo,
profesin, lugar de residencia, clase social e ingresos y todas las categoras
necesarias para la identificacin educativa y social de encuestado.
Nunca ha de figurar el nombre, como garanta para mantener el anonimato del
cuestionario. En algunas ocasiones, las preguntas se refieren a otros: familia,
compaeros de trabajo y/o formacin, vecinos, miembros de asociaciones a las
que pertenece, etc.
Es importante que antes de comenzar a responder el cuestionario figuren las
instrucciones de cmo se han de ir cumplimentando las respuestas.
Segn Zarkowich, son tan importantes como el cuestionario, puesto que
suponen el medio para obtener una normalizacin de las respuestas recogidas
y de evitar la introduccin de elementos subjetivos en las mismas.

Las instrucciones se deben redactar con gran claridad y esmero. Se ha de


procurar que sean autosuficientes, resolviendo todas las dudas que pudieran
plantearse. Sobre todo ha de cuidarse que no induzcan a la confusin, para
evitar una posible causa de sesgo. En estas instrucciones es necesario incluir
las advertencias, que se consideren necesarias o convenientes realizar sobre
la forma general de cumplimentar el cuestionario y de consignar las respuestas,
segn los distintos tipos de preguntas que comprenda. Hernndez Sampieri33
y otros (2000) ofrecen ejemplos ilustrativos, al respecto.

5. ELABORACIN DE UNA PRUEBA


La elaboracin de una nueva prueba es tanto una ciencia como un arte. El
responsable de su desarrollo debe elegir estrategias y materiales, y luego
tomar cada da decisiones de investigacin que van a influir en la calidad del
instrumento resultante.
La elaboracin de pruebas consta de seis etapas entrelazadas:
1.
2.
3.
4.
5.
6.

Definicin de la prueba
Eleccin del mtodo de escalamiento
Elaboracin de los reactivos
Anlisis de los reactivos
Revisin de la prueba
Publicacin de la prueba

Fuente: Gregory, R. (2012). Pruebas psicolgicas.

5.1.

DEFINICION DE LA PRUEBA

Para elaborar una nueva prueba, su creador debe tener una idea clara de lo
que esta debe medir y en qu debe diferenciarse de los instrumentos
existentes. Puesto que la medicin psicolgica est entrando en su segundo
centenario y se han publicado miles de pruebas, es claro que la labor de
demostrar que el instrumento propuesto es diferente y mejor que los ya
existentes recaen sobre los creadores.
5.2.

ELECCION DEL METODO DE ESCALAMIENTO

El propsito inmediato de la medicin psicolgica es asignar nmeros a las


respuestas en una prueba de modo que pueda juzgarse si el examinado
posee la caracterstica medida en mayor o menor grado. Las reglas por
medio de las cuales se asignan nmeros a las respuestas definen el mtodo
de escalamiento. Los constructores de las pruebas seleccionan un mtodo
de escalamiento que se adapte de manera ptima a la forma en que
conceptualizaron el rasgo o rasgos medidos por su instrumento.
Ningn mtodo de escalamiento es invariablemente mejor que los otros.
Para algunos rasgos, la clasificacin ordinal de jueces expertos puede ser el
mejor mtodo de medicin; para otros rasgos, el escalamiento complejo de
los datos de autoinforme tal vez produzca las mediciones ms vlidas.
5.2.1. METODOS DE ESCALAMIENTO REPRESENTATIVOS
5.2.1.1.

Ordenamientos de expertos
Suponga que deseamos medir la profundidad del estado de coma
en pacientes que sufrieron una lesin enceflica reciente que los
dej inconscientes. Una escala de profundidad del estado de
coma sera muy importante para predecir el curso de la mejora,
porque es bien sabido que un periodo prolongado de inconciencia
entraa un mal pronstico para la recuperacin final. Adems, el
personal de rehabilitacin tiene la necesidad prctica de saber si
un paciente est sumido en un coma profundo o en un estado
parcialmente comunicativo de semi conciencia.

Una aproximacin al escalamiento de la profundidad del coma


sera confiar en los ordenamientos conductuales de los expertos.
Ello a travs de la Escala de Coma de Glasgow que se califica
observando al paciente y asignando el nivel ms alto de
funcionamiento en cada una de tres subescalas. En cada
subescala se supone que el paciente exhibe todos los niveles de
conducta por debajo del nivel calificado. Por consiguiente, desde
el punto de vista psicomtrico, la escala consta de tres subescalas
(ojos, respuesta verbal y respuesta motriz), cada una de las
cuales produce una clasificacin ordinal de la conducta.

Fuente: Gregory, R. (2012). Pruebas psicolgicas.

5.2.1.2.

Escalas Likert
Likert (1932) propuso un mtodo sencillo para el escalamiento de
actitudes que todava se utiliza ampliamente en la actualidad. Una
escala Likert presenta al examinado cinco respuestas ordenadas
sobre

un

continuo

de

acuerdo/

desacuerdo

de

aprobacin/desaprobacin. Por ejemplo, un reactivo de una


escala que evala las actitudes hacia la pertenencia a la iglesia
podra decir:
Los servidos religiosos me dan inspiracin y me ayudan para dar
lo mejor de m durante la siguiente semana.

Est usted:

Dependiendo de la redaccin de un reactivo individual, una


respuesta extrema de totalmente de acuerdo o totalmente en
desacuerdo indicar la respuesta ms favorable en la actitud
subyacente medida por el cuestionario.
Likert (1932) asign una puntuacin de 5 a esta respuesta
extrema, 1 al extremo opuesto, y 2, 3 y 4 a las respuestas
intermedias. Para obtener la puntuacin total de la escala se
suman las puntuaciones de los reactivos individuales, de ah que
una escala Likert se conoce tambin como una escala sumativa.
5.2.1.3.

Escalas de Guttman
En una escala de Guttman los participantes que apoyan una
afirmacin tambin coinciden con afirmaciones ms moderadas
relacionadas con el mismo continuo subyacente (Guttman, 1947).
Por consiguiente, si se conoce la afirmacin ms extrema del
continuo con que puede coincidir un examinado, tambin es
posible reconstruir las respuestas intermedias. Las escalas de
Guttman se producen por medio de la seleccin de reactivos que
caen en una secuencia ordenada en trminos del aval que reciben
del examinado. Los errores de medicin hacen difcil obtener una
escala de Guttman perfecta, pero aun as es una meta adecuada
para ciertos tipos de prueba.
Por ejemplo, Beck utiliz el escalamiento tipo Guttman para
producir los reactivos individuales de su inventario de depresin
(Beck Depression Inventory, BDI; Beck, Steer y Garbin, 1988). Los
reactivos del inventario de Beck son parecidos a los siguientes:
( ) A veces me siento triste o melanclico.

( ) A menudo me siento triste o melanclico.


( ) La mayor parte del tiempo me siento triste o melanclico.
( ) Siempre me siento triste y no puedo soportarlo.
Se pide a los clientes que en cada grupo marquen la afirmacin
que sientan que mejor los describe. Es casi seguro que un cliente
que muestra su aprobacin por la alternativa extrema (por
ejemplo, Siempre me siento triste y no puedo soportarlo)
tambin estar de acuerdo con afirmaciones ms moderadas.
5.2.2. ELABORACIN DE LOS REACTIVOS
La elaboracin de los reactivos es un procedimiento arduo y laborioso que
pone a prueba la creatividad de los constructores de las pruebas. El
redactor de los reactivos se confronta con una gran cantidad de preguntas
iniciales:
El contenido de los reactivos debe ser homogneo o variado?
Qu rango de dificultad deben abarcar los reactivos?
Cuntos reactivos iniciales deben elaborarse?
Qu procesos cognoscitivos y dominios de los reactivos deben
utilizarse?
Qu tipo de reactivos de examen debern usarse?
5.2.2.1.

Preguntas iniciales en la elaboracin de la prueba

La primera pregunta se refiere al tema de la homogeneidad contra la


heterogeneidad

del

contenido

del

reactivo.

En

gran

medida,

la

homogeneidad o diversidad del contenido depende de cmo haya definido


el creador de la prueba el nuevo instrumento. Considere una prueba de
inteligencia general con una carga cultural reducida; dicho instrumento
podra incorporar reactivos variados en la medida que las preguntas no
supongan una educacin especfica. El creador de la prueba podra tratar
de incluir nuevos problemas que sean igualmente desconocidos para todos
los examinados. Por otro lado, con una prueba de pensamiento espacial

basada en una teora, se requeriran sub pruebas en que los reactivos


tengan un contenido homogneo.
El rango de dificultad de las preguntas debe ser suficiente para permitir la
diferenciacin significativa de los examinados en ambos extremos. Por
ende, las pruebas ms tiles son las que incluyen una serie graduada de
reactivos muy sencillos que puedan ser aprobados casi por todos, as como
un grupo de reactivos gradualmente ms difciles que casi nadie pueda
aprobar. Se observa un efecto de lmite superior cuando grandes
cantidades de examinados obtienen puntuaciones perfectas o casi
perfectas. El problema con un

efecto de lmite superior es que no es

posible distinguir entre los examinados con altas puntuaciones, aunque


estos presenten diferencias considerables en el rasgo subyacente que
mide la prueba.
Se observa un efecto de lmite inferior cuando cantidades significativas de
examinados obtienen puntuaciones cercanas en la parte inferior, o cerca de
la parte inferior, de la prueba. Po r ejemplo, la escala WAIS-R posea u n
grave efecto de lmite inferior ya que no lograba discriminar entre los
niveles moderado, grave y profundo de retraso mental: todas las personas
con discapacidades graves del desarrollo eran incapaces de responder
prcticamente todas las preguntas.
5.2.2.2.

La tabla de especificaciones

Los diseadores profesionales de pruebas de aprovechamiento y capacidad


suelen utilizar uno o ms esquemas de redaccin de reactivos para
asegurar que su instrumento tome en consideracin una mezcla de
procesos cognoscitivos y dominios de contenido. Por ejemplo, un esquema
muy

simple

de

redaccin

podra

indicar

que

una

prueba

de

aprovechamiento sobre la Guerra Civil estadounidense debera constar de


10 reactivos de opcin mltiple y 10 preguntas de completamiento, la mitad
de cada tipo sobre cuestiones factuales (por ejemplo, fechas, batallas
importantes) y la otra mitad sobre temas conceptuales (por
diferentes perspectivas sobre la esclavitud).

ejemplo,

Antes de iniciar el desarrollo de una prueba, los redactores suelen recibir


una tabla de especificaciones, la cual especifica la informacin y las tareas
cognoscitivas en que debe evaluarse a los examinados. Es posible que la
tabla de

especificaciones ms comn sea la matriz de contenido por

proceso, la cual incluye el nmero exacto de reactivos en reas relevantes


de contenido y detalla la combinacin

precisa de reactivos que debe

ejemplificar diferentes procesos cognoscitivos (Mlman y Greene, 1989).


Al proporcionar una tabla de especificaciones antes de la etapa de
redaccin de los reactivos, el creador de la prueba puede garantizar que el
instrumento resultante contenga un equilibrio apropiado de la cobertura de
temas y que toque el rango deseado de habilidades cognoscitivas. (Ver
tabla)

Fuente: Gregory, R. (2012). Pruebas psicolgicas.

5.2.2.3.

Formatos de los reactivos

Cuando se trata del mtodo por el cual deben evaluarse los atributos
psicolgicos, el creador de la prueba se enfrenta a docenas de opciones.
En el caso de las pruebas grupales de inteligencia o de aprovechamiento, la
tcnica preferida es la pregunta de opcin mltiple. Por ejemplo, un reactivo

de una prueba de aprovechamiento sobre la historia estadounidense podra


incluir esta combinacin de planteamiento y opciones:
Quin era el presidente de Estados Unidos durante la Guerra Civil?
a) Washington
b) Lincoln
c) Hamilton
d) Wilson
Los defensores de la metodologa de opcin mltiple sostienen que los
reactivos bien elaborados pueden medir no solo el conocimiento factual sino
tambin el conceptual. Adems, las pruebas de opcin mltiple permiten la
calificacin rpida y objetiva con la ayuda de una mquina. Por otro lado, la
equidad de las preguntas de opcin mltiple puede demostrarse (o en
ocasiones refutarse) con procedimientos muy sencillos de anlisis de
reactivos que vamos a revisar ms adelante. Las principales desventajas de
las preguntas de opcin mltiple son, primero, la dificultad de escribir
buenas opciones distractoras y, segundo, la posibilidad de que la presencia
de la respuesta pueda llevar a la respuesta correcta a un examinado con u
n conocimiento insuficiente. En la tabla 4.6 se presentan pautas para la
redaccin de buenos reactivos de opcin mltiple.

Fuente: Gregory, R. (2012). Pruebas psicolgicas.

Las preguntas de aparejamiento son comunes en la evaluacin dentro


del aula, pero presentan graves deficiencias psicomtricas. El siguiente
es un ejemplo de una pregunta de aparejamiento:
Utilice las letras presentadas a la izquierda para relacionar el nombre
con su logro:

El problema ms grave de las preguntas de aparejamiento es que las


respuestas no son independientes: fallar en una relacin por lo general
induce al examinado a fallar en otra. Otro problema es que en una
pregunta de aparejamiento las opciones deben estar estrechamente
relacionadas o la pregunta ser demasiado sencilla.

Para las pruebas de aplicacin individual el procedimiento preferido es el


reactivo objetivo de respuesta corta. De hecho, los tipos ms simples de
preguntas suelen poseer la mayor confiabilidad y validez. Un buen
ejemplo es la subprueba de Vocabulario de la WAIS-IV, la cual consiste
simplemente en pedir al examinado que defina palabras. Esta subprueba
tiene una confiabilidad muy alta (.96) y suele considerarse la mejor
medida individual de la inteligencia general en la prueba.
Las pruebas de personalidad suelen utilizar preguntas de verdadero o
falso porque resultan sencillas de entender para los sujetos. A la mayora
de la gente le resulta sencillo responder reactivos de verdadero o falso
como el siguiente:
V

-----

-----

Me gustan las revistas deportivas.

Los crticos de este mtodo han sealado que las respuestas a dichas
preguntas pueden reflejar ms la deseabilidad social que los rasgos de
personalidad (Edwards, 1961).
Un formato alternativo diseado para contrarrestar este problema es la
metodologa de eleccin forzada en que el examinado debe elegir entre
dos opciones igualmente deseables (o indeseables).
Qu preferira hacer?
_____ Limpiar un galn de almbar del piso.
_____ Ofrecerse como voluntario a pasar medio da en un asilo.
Aunque el mtodo de eleccin forzada tiene muchas propiedades
psicomtricas deseables, los creadores de las pruebas de personalidad
no se han apresurado a adoptar esta interesante metodologa.
5.2.3. ANLISIS DE LOS REACTIVOS
Los psiclogos esperan que muchos de los reactivos del conjunto original
sean descartados o corregidos a medida que avanza el desarrollo de la
prueba. Por esta razn, los creadores de las pruebas al principio elaboran
muchos reactivos de ms, tal vez el doble del nmero que pretenden usar.

Cmo se selecciona entonces la muestra final de preguntas a partir del


conjunto inicial de reactivos? Quienes elaboran la prueba usan el anlisis de
reactivos, un conjunto de procedimientos estadsticos, para identificar
cules son los mejores. En general, el objetivo de dicho anlisis es
determinar qu reactivos deberan conservarse, cules hay que corregir y
cules deben eliminarse. Al realizar un anlisis cuidadoso de los reactivos,
el creador de la prueba puede utilizar los ndices de dificultad, de
confiabilidad y de validez del reactivo, as como la curva caracterstica y el
ndice de discriminacin del mismo.
5.2.4. REVISIN DE LA PRUEBA
El siguiente paso en el desarrollo de la prueba consiste en reunir nuevos
datos de una segunda muestra. Desde luego, esos examinados deben ser
similares a aquellos a quienes se dirige en ltima instancia el instrumento.
El objetivo de recabar datos adicionales es repetir los procedimientos de
anlisis de reactivos. Si los nuevos cambios son ajustes menores, el
creador de la prueba puede decidir que esta es satisfactoria y que se
encuentra lista para un estudio de validacin cruzada, un asunto que se
analiza en la siguiente seccin. Si se requieren cambios importantes, es
deseable recabar datos de una tercera e incluso de una cuarta muestras.
Pero en cierto punto deben concluir los ajustes psicomtricos; el creador
debe proponer un instrumento terminado y proceder al siguiente paso, la
validacin cruzada.
5.2.4.1.

Validacin cruzada

Cuando se utiliza una muestra para determinar si una prueba posee


validez relacionada con el criterio, la evidencia es bastante preliminar y
tentativa. En el desarrollo de una prueba es prudente buscar una
confirmacin nueva independiente de la validez del instrumento antes de
proceder a su publicacin. El trmino validacin cruzada se refiere a la
prctica de usar la ecuacin de regresin original en u n a nueva
muestra para determinar si la prueba predice el criterio tan bien como lo
hizo en la muestra original. Ghiselli, Campbell y Zedeck (1981) describen
la razn de la validacin cruzada:

Ya sea que los reactivos sean elegidos con base en una clave
emprica o que sean corregidos o ponderados, los resultados
obtenidos deben considerarse especficos de la muestra usada
para el anlisis estadstico, a menos que se recaben datos
adicionales. Esto es necesario porque probablemente los
resultados hayan obtenido provecho de los factores de azar que
operaban en ese grupo y, por ende, solo sean aplicables a la
muestra estudiada.

5.2.5. PUBLICACIN DE LA PRUEBA


El proceso de elaboracin de la prueba no termina con la obtencin de los
datos de validacin cruzada. El creador del instrumento tambin debe
supervisar la produccin de los materiales de evaluacin, publicar un
manual tcnico y redactar el manual del usuario.

5.2.5.1.

Produccin de los materiales de evaluacin


Los materiales de evaluacin deben ser sencillos de usar si se
pretende que sean aceptados por psiclogos y educadores. Por
consiguiente, una primera sugerencia para la produccin de la
prueba es que la presentacin fsica de los materiales permita una
aplicacin rpida y sin complicaciones.

5.2.5.2.

Manual tcnico y manual del usuario


Los datos tcnicos acerca de un nuevo instrumento por lo general
se resumen con las referencias apropiadas en un manual tcnico.
El posible usuario puede encontrar aqu informacin acerca de los
anlisis de reactivos, la confiabilidad de las escalas, los estudios
de validacin cruzada y asuntos semejantes. En algunos casos
esta informacin se incluye en el manual del usuario, el cual,
adems de d a r las instrucciones para la aplicacin, ofrece
directrices para la interpretacin de la prueba.
Los manuales de la prueba cumplen muchos propsitos, como se
explica en los Estndares para la evaluacin educativa y
psicolgica (AERA, APA y NCME, 1985,1999). El manual de estos
influyentes Estndares sugiere que los manuales de las pruebas
cumplan las siguientes metas:
Describir la base y los usos recomendados para la prueba.
Hacer advertencias especficas en contra de los usos
inadecuados de la prueba que se anticipan.
Citar estudios representativos concernientes a los usos
generales y especficos de la prueba.
Identificar cualificaciones necesarias para administrar
interpretar la prueba.
Proporcionar las revisiones,

las

enmiendas

e
los

complementos necesarios.
Usar material de promocin que sea preciso y que se base en
la investigacin.
Citar relaciones cuantitativas entre las puntuaciones obtenidas
en la prueba y los criterios.

Informar sobre el grado en que son intercambiables los modos


alternativos de respuesta (por ejemplo, folleto contra hoja de
respuestas).
Dar materiales interpretativos adecuados al examinado.
Proporcionar evidencia de la validez de cualquier
interpretacin automatizada de la prueba.
Por ltimo, los manuales de la prueba deben incluir los datos esenciales
sobre la confiabilidad y validez en vez de referir al usuario a otras
fuentes, una prctica desafortunada que se encuentra en los manuales
de algunas pruebas.

CONCLUSIONES

SUGERENCIAS

REFERENCIAS BIBLIOGRFICAS

Costa, N. K. M. (1996). Manual de pruebas de inteligencia y aptitudes. Mxico:


Plaza y Valds, S.A. de C.V.. Retrieved from http://www.ebrary.com
Gregory, R. (2012). Pruebas psicolgicas. 1 Edicin en espaol. Mxico:
Pearson Educacin. p. 648
Martnez, A. M. R., & Hernndez, L. M. V. (2014). Psicometra. Espaa:
Larousse - Alianza Editorial. Retrieved from http://www.ebrary.com
Meneses, J. (2014). Psicometra. Espaa: Editorial UOC. Retrieved from
http://www.ebrary.com

ENLACES WEB
file:///D:/Nueva%20carpeta/153484497-5-Elaboracion-Del-Pre-Test.pdf
http://biblio3.url.edu.gt/Libros/tests_p/2.1.pdf
http://23118.psi.uba.ar/academica/carrerasdegrado/psicologia/informacion_adici
onal/obligatorias/059_psicometricas1/tecnicas_psicometricas/archivos/f2.pdf
http://portal.fagro.edu.uy/docs/uensenia/Univ.%20Navarra%20_Pruebas
%20objetivas.pdf