Está en la página 1de 17

Universidad Central de Venezuela

Facultad de Humanidades y Educación


Escuela de Psicología
Cátedra de Psicometría
Psicometría I

Baremo para pruebas


de items binarios

Autores:

Alexis La Cruz Luisa E. Lezama


Baremo

En el análisis de los items de una prueba psicométrica debemos recurrir a la


consideración conjunta de una amplia variedad de estadísticos (media,
varianza, intercorrelaciones, correlaciones 𝑟𝑝𝑏 , etc.), con el objetivo de decidir
cuáles items son elegibles para la prueba y cuáles descartables.

El constructor decide, en atención a aspectos como a la variable que se


examina con la prueba, la homogeneidad de la misma, sus objetivos, la
dificultad, etc. cuáles son los valores óptimos de esos estadísticos de los
items, para que puedan ser catalogados como elegibles.

Considerando que esos estadísticos son muchos, se puede proceder a


ponerle pesos altos a los valores ideales de los estadísticos y valores bajos a
los menos favorables, para finalmente totalizarlos en un indicador único.

Los mejores items para la prueba serán aquellos que tengan, al mismo
tiempo, los mejores valores de sus estadísticos.
Procedimientos para construir
un baremo
Construcción de baremo

1 El constructor debe considerar construir el baremo y luego proceder a analizar la corrida de


los datos.

2 Debe decidir qué estadísticos va a utilizar para evaluar la calidad de los reactivos de
la prueba que está diseñando, centrándose solo en la respuesta correcta. Para el
análisis de los mismos sólo se podrán correr uno de los siguientes grupos de
estadísticos, si se corren todos, se obtendrán resultados redundantes o repetitivos.
o Media (índice de dificultad), Desviación Típica (Capacidad discriminativa) y
Coeficiente de correlación puntobiserial (correlación item-test).
o Media (índice de dificultad), Varianza (Capacidad discriminativa) y Coeficiente de
correlación puntobiserial (correlación item-test).
o Asimetría (índice de dificultad), Desviación Típica o varianza (Capacidad
discriminativa) y Coeficiente de correlación puntobiserial (correlación item-test).
o Kurtosis (índice de dificultad), Desviación Típica o varianza (Capacidad
discriminativa) y Coeficiente de correlación puntobiserial (correlación item-test).
Construcción de baremo Respuesta Correcta

3 Especificar, por estadístico, los rangos que considere idóneos para la evaluación de los
reactivos.

Ejemplo 1
El constructor de prueba de conocimiento en historia universal
establece que ésta debe contener únicamente items con dificultad
moderada, con una elevada capacidad discriminativa. Esto implica que
se prefieren items de dificultad media y alta correlacionen con la escala
total, en consecuencia, construye el siguiente baremo:

Estadístico Rangos Puntaje Note que lo que


requiere la prueba es
Entre 0.40 y 0.60 2 lo que tiene el mayor
pi Entre 0.30 y 0.39 o Entre 0.61 y 0,70 1
peso: Se da mayor
peso (2 puntos) a la
≤0.39 y ≥ 0.71 0 dificultad media (0.40
≥0.80 2 y 0.60) y a las
correlaciones altas
rpbj Entre 0.50 y 0.79 1 alta (≥0.80)
≤0.49 0
Construcción de baremo Respuesta Correcta
Continuación del punto 3
Tenga en cuenta que los rangos por estadístico serán establecidos en función del propósito que
persiga la prueba.

Ejemplo 2

Un psicólogo está diseñando una prueba para seleccionar aspirantes a un cargo, estableciendo
que ésta debe contener únicamente items con dificultad alta, y se mide una variable
heterogénea. Es así que prepondera los valores de los estadísticos en los siguientes términos

Estadístico Rangos Puntaje


Nótese que se En comparación con
≤0.20 2 prefieren items el ejemplo 1,
difíciles (2 observe que los
pi Entre 0.21 y 0.30 1
puntos a p pesos por estadístico
≥0.31 0 menores de .20) variaron en función
≥0.80 0 y de baja de los
correlación (2 requerimientos de la
rpbj Entre 0.50 y 0.79 1
puntos a rpb prueba.
≤0.49 2 menores de .49)
Construcción de baremo Distractores
4 Todo item binario de opción múltiple, tiene aparte de la respuesta correcta, un abanico
de opciones de respuesta, llamadas distractores.
Al construir un baremo es indispensable considerar la calidad de los distractores ya que
son parte de la estructura del item. Decimos que los distractores son de calidad cuando:

Son escogidos por un cantidad relativamente igual de examinados. Lo cual


implicaría p similares entre los distractores
Item 17
Opciones número de personas que escoge cada opción p
A Opción Correcta 450 0,60
B Opción Incorrecta 100 0,13
C Opción Incorrecta 98 0,13
D Opción Incorrecta 102 0,14

Correlacionan de manera negativa con la escala total (𝒓𝒑𝒃 ), lo cual implica que
quienes escogen un distractor (respuesta incorrecta) tienen un pobre desempeño
en la prueba.
Item 17
Opciones 𝒓𝒑𝒃
A Opción Correcta 0,89
B Opción Incorrecta -0,20
C Opción Incorrecta -0,50
D Opción Incorrecta -0,18
Construcción de baremo Distractores
Continuación del punto 4

Para el análisis de los distractores de los items de la prueba, se incluye en el baremo una fila como
se muestra en el siguiente ejemplo:
Observe que para la
Estadístico Rangos Puntaje primera situación, los
distractores son de
p=p=p 2 calidad al poseer un
porcentaje
p p=p≠p 1 relativamente igual de
personas que
p≠p≠p 0 escogieron las
opciones incorrectas,
Todas las 𝑟𝑝𝑏 bajas y negativas 2
además, deben tener
un coeficiente 𝒓𝒑𝒃 bajo
y negativo. Se
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
consideran indeseables
Ninguna 𝑟𝑝𝑏 baja y negativa
0
aquellos distractores
con un valores de p
desiguales y con un
coeficiente 𝒓𝒑𝒃 mayor
El número de p y rpb va en función de la cantidad de distractores que posee el item, por ejemplo, que 0,11
si un item tiene 5 opciones incorrectas, en el baremo deberían aparecer cinco p o rpb.
Construcción de baremo
5 En lo que respecta al peso o puntaje que se le asigna a los rangos por estadístico
escogido, convención, siempre el rango que es considerado como el ideal o excelente
tendrá el mayor peso. Es decisión del constructor establecer el puntaje de inicio.
En n el baremo ejemplo, a lo “ideal” se le asignó un puntaje de 2, lo “regular 1 y lo
“menos deseable” 0.
Estadísti
Rangos Puntaje
co

≥0.70 2

Respuesta Correcta
pi Entre 0.40 y 0.69 1
≤0.39 0

≥0.80 2
Recapitulando rpbj Entre 0.50 y 0.79 1
≤0.49 0
p=p=p 2
p p=p≠p 1
Distractores

p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Construcción de baremo Totalizando puntaje para cada item

6 Luego de asignar un peso a cada uno de los elementos requeridos para el análisis,
corresponde asignarle un puntaje único al item como totalidad.
Nótese que en el baremo ejemplo el puntaje límite por cada rango es 2, y
como estamos considerando cuatro aspectos ( p, rpb, de la Respuesta
Correcta y p, rpb de los distractores) lo máximo que puede totalizar un item
son 8 puntos (todos sus estadísticos tienen los valores ideales) y lo menos
que puede puntuar es cero (todos los estadísticos tiene los valores menos Total Decisión
favorecedores).
6a8 Aceptado
Lo anterior implica que cada item puede calificar entre 0 y 8 puntos y lo que
hace ahora el constructor es presentar las decisiones a tomar según el
puntaje recibido por cada reactivo, que puede ser como se muestra en el
siguiente ejemplo
4o5 Modificable

0 1 2 3 4 5 6 7 8 0a3 Rechazado

Item Item sujeto a Item


rechazado modificación aceptado
Aplicando el baremo a los items
A Una vez culminado el baremo, el constructor corre los estadísticos establecidos por él y se
evalúan los items con atención al baremo propuesto.
Ejemplo 1
Un item conformado por cuatro opciones de respuesta (A, B, C y D) donde B la respuesta correcta y
resto distractores. Prestando atención a la respuesta correcta, se puede apreciar que posee una p igual
a 0,71, entonces, evaluando este resultado de
Estadísti
acuerdo con el baremo establecido, este item Rangos Puntaje
co
obtiene 2 puntos, porque su p es mayor que 0,70,
ahora, prestando atención a su coeficiente rpb, éste ≥0.70 2
se encuentra entre 0,50 y 0,79, logrando obtener 1

Respuesta Correcta
pi Entre 0.40 y 0.69 1
punto. Culminada la evaluación de la respuesta
≤0.39 0
correcta del item, se procede a la evaluación de los
distractores que lo constituyen; como se puede ≥0.80 2
observar, sus p son parecidas entre ellas, por ende, rpbj Entre 0.50 y 0.79 1
se obtienen 2 puntos, y finalmente, en relación con
sus rpb, poseen índices que se ubican dentro del ≤0.49 0

rango -0,01 y -0,30, asignando, en este sentido, 2 p=p=p 2


puntos. p p=p≠p 1
Distractores

p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Aplicando el baremo a los items

Ejemplo 2
En este ejemplo se puede apreciar que la respuesta correcta del item tiene una p igual a 0,24, contrastando este
resultado con el baremo, este item obtiene 0, porque su p es menor que 0,39; con relación con su coeficiente rpb,
éste se encuentra por debajo de 0,49, por lo que logra obtener 0. Tomando en consideración los distractores que
conforman el item en cuestión, sus p son desiguales
Estadístico Rangos Puntaje
entre ellas, por ende, el reactivo obtiene un puntaje
igual a 0, y en relación con sus rpb, poseen índices ≥0.70 2

Respuesta Correcta
que se ubican dentro del rango -0,01 y -0,30, pi Entre 0.40 y 0.69 1
asignando, en este sentido, 2 puntos. ≤0.39 0

≥0.80 2
rpbj Entre 0.50 y 0.79 1
≤0.49 0
p=p=p 2
p p=p≠p 1
Distractores

p≠p≠p 0
Todas las 𝑟𝑝𝑏 bajas y negativas 2
rpb Algunas las 𝑟𝑝𝑏 bajas y negativas 1
Ninguna 𝑟𝑝𝑏 baja y negativa 0
Aplicando el baremo a los items
B Al culminar con la evaluación cada item, se puede proceder a preparar una
tabla como la que se muestra a continuación, la cual incluiría los resultados
obtenidos en cada estadístico, con sus puntuaciones individuales, puntaje total
y decisión final.

Respuesta Correcta Distractores

p rpb
items p Ptos rpb Ptos Ptos Ptos Puntaje Total Condición

D1 D2 D3 D1 D2 D3

1 0,71 2 0,77 1 0,09 0,10 0,09 2 -0,15 -0,13 -0,15 2 7 Aceptado

2 0,24 0 0,20 0 0 0,48 0,28 0 0 -0,15 -0,10 2 2 Rechazado

Nota: D1=Distractor 1, D2=Distractor 2 y D3=Distractor 3


Lo que informa un baremo

Si tomamos como ejemplo el item 1 de la sección previa, el mismo tiene un índice de


dificultad bajo, ya que el 71% de los evaluados lo responde de manera correcta, al
mismo tiempo, posee una buena capacidad para diferenciar entre los que tienen un
buen desempeño y los que tienen un pobre desempeño en la prueba (𝑟𝑝𝑏 ).

En lo que respecta a sus distractores, tienen un porcentaje relativamente igual de


evaluados que los seleccionan, contando con una correlación negativa, lo que significa
que los examinados que escogen estos distractores tienen un pobre desempeño en la
prueba, siendo, en este sentido, distractores de buena calidad.

Entonces, el item 1 al cumplir con estas características, se considera óptimo para el


proceso de medición de la variable en cuestión, por ende, es aceptado.
Lo que informa un baremo

Un baremo nos ofrece una visión sistémica del funcionamiento de los reactivos de una prueba, por
ejemplo, si la versión preliminar de una prueba estaba constituida por 50 reactivos y luego de pasar
a través de un baremo quedó con 25, se nos informa, como constructores de prueba, que 25 items
no cumplen con los requerimientos exigidos, por lo tanto, son catalogados como deficientes.

Una vez que el constructor ha culminado


con la evaluación de todos los items de la
prueba, es conveniente presentar un gráfico 25,00%
que resuma el resultado de dicho proceso.

Para ello se puede elaborar un gráfico de


sectores, como el del ejemplo, en el que se
puede apreciar una situación hipotética en la
que el 25% de los items fue rechazado de la 10,00%
versión preliminar de la prueba, ya que no 65,00%
cumplen con las condiciones exigidas, el
10% está sujeto a modificación y el 65% fue
aceptado, ya que, para los fines de la
prueba, cumplen con los requerimientos
estipulados.
Items Rechazados Items Modificables Items Aceptados
Consideraciones finales

El baremo en sí es un procedimiento que permite efectuar un estudio exhaustivo de


las propiedades de los reactivos de una prueba, siendo una manera objetiva de
determinar aquellos reactivos que formarán parte de su versión final y descartar los
que no son pertinentes.

Simultáneamente a que se examinan los estadísticos de los items a través del baremo,
es menester que se lean los textos de los mismos; será el juicio aguzado del
constructor, conformado a la luz del manejo teórico del constructo teórico que se
evaluará con la prueba y su conocimiento acerca de los objetivos de la misma lo que
llevará a tomar las decisiones pertinetes.
Ventajas y desventajas de un baremo

Ventajas
o Permite realizar una evaluación objetiva de la calidad de los reactivos que constituyen una prueba.

o Permite determinar, independientemente del juicio o gusto del constructor, cuáles reactivos contribuyen
con el proceso de medición de la variable y cuáles no.

o Ofrece una visión integral del funcionamiento de los reactivos, ya que se evalúa, simultáneamente tanto
su respuesta correcta como sus distractores considerando la multiplicidad de estadísticos disponibles.

Desventajas

o Requiere de una adecuada comprensión de los estadísticos de los items y de la prueba ya que un
conocimiento deficiente puede llevar a tomar decisiones erradas o a cometer sesgos.

o En ocasiones es menester desconsidera algunos estadísticos en aras de darle parsimonia al baremo


diseñado.

o Conduce a omitir el texto de los items, por lo que un constructor poco ducho podría desestimar
aspectos conceptuales relevantes..

También podría gustarte