Está en la página 1de 8

Página 1 de 8

ACTIVIDAD 5: ANÁLISIS DE UNA PRUEBA

SOL VERÓNICA PADILLA MIRANDA

ID: 100051175

LUISA MARÍA RAMIREZ RODRIGUEZ

ID: 100039144

PSICOMETRÍA

COORPORACION UNIVERSATARIA IBEROAMERICANA

FACULTAD DE EDUCACIÓN CIENCIAS HUMANAS Y SOCIALES

PROGRAMA DE PSICOLOGÍA VIRTUAL

MAYO 2020
Página 2 de 8

Análisis de las características psicométricas del instrumento

1. ¿Cuál es el índice de dificultad de cada reactivo?

Backhoff, Larrazolo y Rosas (2000) señalan que:

La dificultad de un ítem se entiende como la proporción de personas que


responden correctamente un reactivo de una prueba. Entre mayor sea esta
proporción, menor será su dificultad. Lo que quiere decir que se trata de una
relación inversa: a mayor dificultad del ítem, menor será su índice (Wood, 1960).
Para calcular la dificultad de un ítem, se divide simplemente el número de
personas que contestó correctamente el ítem entre el número total de personas que
contestó el ítem (correcta o incorrectamente).

Para cada reactivo de este instrumento se calcularon dos índices de dificultad; un índice
de dificultad normal y un índice de dificultad corregido el cual suele usarse en ítems de
elección múltiple como el del actual instrumento.

El índice de dificultad normal se realizó de acuerdo a la siguiente ecuación:

Donde:

A= Número de personas que aciertan el ítem

N= Número total de personas que responden al ítem

Así mismo se calculó el índice de dificultad corregido con la siguiente ecuación:

Donde:

p = Proporción de aciertos (índice de dificultad sin corregir)

q = Proporción de fallos

k = Número de alternativas del ítem

Así entonces la dificultad de cada ítem se muestra en la tabla 3, de acuerdo a las


respuestas concentradas en la base de datos adjunta en la guía de la actividad.

La dificultad de cada ítem puede ir desde altamente fáciles hasta altamente difíciles tal
como se muestran en las tablas 1 y 2.
Página 3 de 8

Tabla 1. Criterios de índice de dificultad normal

P= Evaluación del reactivo


˃ 0,86 Altamente fáciles
0.74 – 0.86 Medianamente fáciles
0.53 – 0.73 Dificultad media
0.33 – 0.52 Medianamente difíciles
˂ 0.32 Altamente difíciles
Fuente: (Pérez Tapia, Acuña Aguilar, & Arratia Cuela, 2008)

Tabla 2. Criterios de índice de dificultad corregido

Altamente fáciles ID ˃ 0,75


Medianamente fáciles ID 0,55 – 0,75
Dificultad media ID 0, 45 – 0, 54
Medianamente difíciles ID 0,25 – 0, 44
Altamente difíciles ID ˂ 0,25
Fuente: (Pérez Tapia, Acuña Aguilar, & Arratia Cuela, 2008)

Tabla 3. Nivel de dificultad y evaluación de cada reactivo


R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24
N° de aciertos 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
p 0,68 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
ID 0,6 0,89 0,75 0,79 0,56 0,58 0,79 0,85 0,62 0,81 0,45 0,89 0,47 0,83 0,72 0,77 0,56 0,55 0,58 0,72 0,26 0,58 0,92 0,55
Fuente: Elaboración propia

2. ¿Cuáles son los reactivos más fáciles y cuáles los más difíciles?

En relación a los resultados obtenidos en hoja de cálculo de Excel (Tabla 3) los reactivos
más fáciles según el índice de dificultad normal son los reactivos R2, R8, R12, R14 Y
R23. Según el índice de dificultad corregido son los reactivos R2, R3, R4, R7, R8, R10,
R12, R14, R16 Y R23.

En cuanto al índice de dificultad más difícil, podemos decir que corresponde al reactivo
R21 para ambos criterios de dificultad. Cabe señalar que los reactivos R11 y R13 se
encuentran en un índice de dificultad media, pero se aproximan más al límite de
dificultad “difícil”.

3. ¿Cuál es el índice de discriminación de cada reactivo?


De acuerdo a la tabla 3 los reactivos más fáciles según el índice de dificultad normal son
los reactivos R2, R8, R12, R14 Y R23. Según el índice de dificultad corregido son los
reactivos R2, R3, R4, R7, R8, R10, R12, R14, R16 Y R23.
Página 4 de 8

De igual manera el índice de dificultad más difícil es el correspondiente al reactivo R21


para ambos criterios de dificultad. Cabe señalar que los reactivos R11 y R13 se encuentran
en un índice de dificultad normal pero tocando el límite del nivel de dificultad “difícil”.

1- ¿Cuál es el índice de discriminación de cada reactivo?

Backhoff, Larrazolo y Rosas (2000) afirman que:


Si la prueba y un ítem miden la misma habilidad o competencia, podemos esperar
que quien tuvo una puntuación alta en todo el test deberá tener altas probabilidades
de contestar correctamente el ítem. También debemos esperar lo contrario, es
decir, que quien tuvo bajas puntuaciones en el test, deberá tener pocas
probabilidades de contestar correctamente el reactivo. Así, un buen ítem debe
discriminar entre aquellos que obtuvieron buenas calificaciones en la prueba y
aquellos que obtuvieron bajas calificaciones.

Para calcular este índice se utilizó la siguiente fórmula:

Donde:

Di = Índice de discriminación del reactivo i


GA= Número de aciertos del 27% de los sujetos con mejor calificación
GB= Número de aciertos del 27% de los sujetos con peor calificación
N= 27% de sujetos totales (para nuestro caso fueron 18)

“Entre más alto es el índice de discriminación, el reactivo diferenciará mejor a las


personas con altas y bajas calificaciones. Si todas las personas del GA contestan
correctamente un reactivo y todas las personas del GB contestan incorrectamente,
entonces D = 1 (valor máximo de este indicador); si sucede lo contrario, D = -1 (valor
máximo negativo); si ambos grupos contestan por igual, D = 0 (valor mínimo de
discriminación)” (Backhoff et al., 2000).

Ebel y Frisbie (1986) nos dan la siguiente regla de “dedo” para determinar la calidad de
los reactivos, en términos del índice de discriminación. La Tabla 4, muestra los valores
D y su correspondiente interpretación. Asimismo, en la tabla se señalan las
recomendaciones para cada uno de estos valores.
Página 5 de 8

Tabla 4. Poder de discriminación de los reactivos según su valor D


D= Calidad Recomendaciones
˃ 0,39 Excelente Conservar
0,30 – 0,39 Buena Posibilidades de mejorar
0,20 – 0,29 Regular Necesidad de revisar
0.00 – 0,20 Pobre Descartar o revisar a profundidad
˂ – 0, 01 Pésima Descartar definitivamente
Fuente: (Backhoff, E., Larrazolo, N., & Rosas, M., 2000).

Los índices de discriminación de cada reactivo se muestran en la tabla 5

Tabla 5. Índices de discriminación para cada reactivo


R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24
N° de aciertos 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
D 0,44 0,28 0,39 0,5 0,56 0,72 0,33 0,33 0,56 0,33 0,28 0,22 0,28 0,33 0,67 0,5 0,5 0,72 0,56 0,56 0,33 0,5 0,17 0,28
Fuente: Elaboración propia

4. ¿Cuáles son los reactivos que mejor y que peor discriminan?

De acuerdo a la tabla 5 los reactivos que mejor discriminan son los reactivos R1, R4,
R5, R6, R9, R15, R16, R17, R18, R19, R20 y R22 ya que presentan un índice de
discriminación mayor a 0,39. De igual forma el reactivo que peor discrimina es el R23
por lo que se recomienda descartar o revisar a profundidad.

5. ¿Cuál es el alfa de Cronbach del instrumento en lo general?

“El alfa de Cronbach es un índice usado para medir la confiabilidad del tipo consistencia
interna de una escala, es decir, para evaluar la magnitud en que los ítems de un
instrumento están correlacionados” (Oviedo & Campo, 2005, p. 575). En otras palabras,
el alfa de Cronbach es el promedio de las correlaciones entre los ítems que hacen parte
de un instrumento.

Como criterio general, George y Mallery (2003, p. 231) sugieren las recomendaciones
siguientes para evaluar los coeficientes de alfa de Cronbach:

Tabla 6. Criterios de alfa de Cronbach

Valores de α Interpretación
˃0,9 Se califica como satisfactoria
0,8 – 0,89 Se califica como adecuada
0,7 – 0,79 Se califica como moderada
0,6 – 0,69 Se califica como baja
0,5 – 0,59 Se califica como muy baja
˂0,5 Se califica como no confiable
Fuente: George y Mallery (2003, p. 231)
Página 6 de 8

La ecuación propuesta por Cronbach es la siguiente:

Donde:
K= Número de ítems

Si2= Sumatoria de Varianzas de los ítems


ST2= Varianza de la suma de los ítems
α = Coeficiente de alfa de Cronbach

A continuación en la “Tabla 7” los cálculos del Alfa de Cronbach


Tabla 7. Varianza de cada reactivo
R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24 Respuestas correctas
Varianza 0,22 0,08 0,16 0,14 0,23 0,23 0,14 0,11 0,21 0,13 0,25 0,08 0,25 0,12 0,18 0,15 0,23 0,23 0,23 0,18 0,25 0,23 0,06 0,23 18,31
Fuente: elaboración propia

Para este instrumento en lo general el alfa de Cronbach es de 0,80 con lo cual, de


acuerdo a la tabla 6 la fiabilidad se califica como adecuada.

6. ¿Qué se puede decir acerca de la confiabilidad de este instrumento?

Para poder determinar que este instrumento es confiable, debe presentar una propiedad
en las puntuaciones obtenidas, bajo condiciones específicas, aunque las puntuaciones en
una prueba varían, ya sean por la ocasión o por la situación. Lo que genera que una prueba
probablemente no sea confiable para ser usada en describir o evaluar a una persona.

Entonces para determinar que el instrumento es confiable requiere de métodos como:


test- retest, formas paralelas y consistencia interna. Que trabajan desde los efectos
circunstanciales.
Página 7 de 8

7- ¿Qué se puede decir acerca de la validez de este instrumento?

Podemos decir que el instrumento es válido dependiendo de los propósitos específicos


para los que fue diseñado. Donde se deben emplear diferentes métodos de validez como:
análisis de contenido de la prueba, cálculos de correlación entre la calificación de la
prueba y calificación de los criterios y características psicológicas particulares o
constructos medidos. Entonces podemos decir que el instrumento puede ser confiable,
pero no necesariamente será válido, si no profundiza en sus diferentes medos de validez.

8- En general, ¿qué fortalezas y debilidades tiene este examen?

Podemos decir que, si nos fijamos en las fortalezas de este examen, se puede rescatar
que, al desglosar esta prueba de conocimiento, en sus indicadores de confiabilidad,
validez y dificultad hay varios ítems que cumplen con la función lo cual hace que en
medida este examen pueda brindar una idea no precisa, pero muy cercana de lo que los
estudiantes han aprendido sobre ese tema.

En un sentido no tan amplio ni profundo, otras de las ventajas que se pueden destacar en
este examen, es que antes de realizarse presenta detalladamente el contenido del mismo,
dando una explicación clara y específica de lo que será el examen como: tiempo, número
de preguntas y porcentaje.

En cuanto a las debilidades podemos decir que todas las preguntas presentan múltiples
respuestas lo cual puede ser confuso para el estudiante al momento de escoger una
respuesta.

9- ¿Hay algún reactivo que requiera ser reconsiderado? ¿Qué sugerencias


concretas se harían para mejorarlo?

El reactivo que requiere ser reconsiderado es el R23 ya que se presenta un índice de


discriminación pobre.

Se sugiere que los estudiantes refuercen a un más su preparación académica en este tema
para afianzar el conocimiento y lograr despejar dudas a la hora de realizar un otro
examen en el que nuevamente se realicen preguntas referidas al tema.

Es imperativo que los estudiantes adquieran un rigor de investigación detallada frente a


temas en los que serán evaluados, esto ayudara a extender las posibilidades de
aprobación en cualquier prueba de conocimiento.
Página 8 de 8

Referencias

- Backhoff, E., Larrazolo, N., & Rosas, M. (2000). Nivel de dificultad y poder de
discriminación del Examen de Habilidades y Conocimientos Básicos (EXHCOBA).
Revista Electrónica de Investigación Educativa [serie en Internet]. 2(1). Disponible
en: http://redie.uabc.mx/vol2no1/contenido-contenido.html

- Ebel, R.L. y Frisbie, D.A. (1986). Essentials of Education Measurement.


Englewood Cliffs, NJ: Prentice Hall.

- George, D., & Mallery, P. (2003). SPSS for Windows Step by Step
- A Simple Guide and Reference Fourth Edition 11.0 update (4th ed.). Boston: Allyn
& Bacon. p. 231. Recuperado de:
https://es.scribd.com/document/338206972/George-and-Mallery-2003-pdf

- Pérez Tapia, J., Acuña Aguilar, N., & Arratia Cuela, E. (2008). Nivel de dificultad
y poder de discriminación del tercer y quinto examen parcial de la cátedra de cito-
histología 2007 de la carrera de medicina de la UMSA. Revistas Bolivianas, 53(2).
Recuperado de: http://www.revistasbolivianas.org.bo/scielo.php?pid=S1652-
67762008000200003&script=sci_arttext

- Examen
http://aulavirtual.iberoamericana.edu.co/repositorio/Cursos-
Matriz/Psicolog%C3%ADa/Psicometria/MD/Examen.pdf

- Base de datos
http://aulavirtual.iberoamericana.edu.co/repositorio/Cursos-
Matriz/Psicolog%C3%ADa/Psicometria/MD/Basededatos_UNIDAD%203_AC
T_05_PSICOMETRIA.xlsx

Bibliografía

- Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall


(Cap. 1.). Recuperado de:
http://aulavirtual.iberoamericana.edu.co/repositorio/Cursos-
Matriz/Psicolog%C3%ADa/Psicometria/MD/Aiken.%20Test%20psicol%C3%B3gi
cos%20y%20evaluaci%C3%B3n.pdf

- Brown, F. (2000) Principios de la medición en psicología y educación. México:


Manual Moderno. (Cap. 1). Recuperado de:
http://aulavirtual.iberoamericana.edu.co/repositorio/Cursos-
Matriz/Psicolog%C3%ADa/Psicometria/MD/Brown_principios-de-la-medicion-en-
psicologia-y-educacion-frederick-g-brown.pdf

También podría gustarte