Actividad 5 - Análisis de Una Prueba

ACTIVIDAD 5 – ANALISIS DE UNA PRUEBA
PEREZ TEJADA JEIMY LUZ
CÒDIGO BANNER: 100063018
DOCENTE: SANDRA FAGUA
CORPORACION UNIVERSITARIA IBEROAMERICANA
PSICOLOGIA QUINTO SEMESTRE
PSICOMETRÌA
MONTELIBANO CÒRDOBA
MARZO 2021
ANALISIS DE UNA PRUEBA

Adjunto link de archivo de Excel donde se realizaron los cálculos pertinentes de dicha actividad.
https://drive.google.com/file/d/1j2XS9Bu5io8lv4_4e4zv1pSSELtgUBWu/view?usp=sharing
Situación: Un profesor del curso de "Introducción a la Metodología de la Investigación"
(asignatura que se imparte en un Programa de Psicología) diseñó un examen parcial para
evaluar el aprendizaje de sus alumnos en las primeras dos unidades del curso. El examen
estuvo compuesto por 24 reactivos de opción múltiple.
Link examen: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog%C3%ADa/
Psicometria/MD/Examen.pdf
Después de aplicar el examen a 66 alumnos, sus respuestas se concentraron en una base de
datos.
Link base de datos: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog
%C3%ADa/Psicometria/MD/Basededatos_UNIDAD%203_ACT_05_PSICOMETRIA.xlsx
Acciones por realizar: El profesor pide la ayuda de ustedes, estudiantes de psicometría de la
Corporación Universitaria Iberoamericana, para realizar el siguiente análisis:
a) Un análisis acerca de las características psicométricas del instrumento:
¿Cuál es el índice de dificultad de cada reactivo?
El índice de dificultad de un ítem es la proporción de sujetos que, habiendo intentado
resolverlo, lo resuelven correctamente. Existen parámetros para la aceptación de un ítem de
acuerdo con su nivel de dificultad, el establecido por Guilford (1975). En este caso se divide
el número de los aciertos entre el total de participantes.

Si el valor mínimo del índice de dificultad es cero “0”, se concluye que ninguno de los
individuos acertó el ítem. Si el valor máximo del índice de dificultad es uno “1”, se concluye
que todos los individuos acertaron el ítem. Se tiene entonces que, si el índice de dificultad se
acerca a cero, el ítem es difícil, si el valor se acerca a uno el ítem es fácil, y si este se
aproxima a 0.5 el ítem tiene dificultad media.

¿Cuáles son los reactivos más fáciles y cuáles los más difíciles?
El número de ítems difíciles o fáciles de una prueba depende de lo que quiere conseguir la
persona que la diseña. Sin embargo, en general, se aconseja que la mayoría de los ítems deban
tener dificultad moderada.
Teniendo en cuenta la interpretación de la tabla anterior, podemos clasificar los ítems en la
siguiente tabla.
Criterio de clasificación Ítem
Muy difícil No aplica
Difícil No aplica
Moderado R11, R13, R21
Fácil R1, R3, R4, R5, R6, R7, R9, R10, R15, R16,
R17, R18, R19, R20, R22, R24
Muy fácil R2, R8, R14, R23

¿Cuál es el índice de discriminación de cada reactivo?
Se dice que un ítem tiene poder discriminativo si distingue, discrimina, entre aquellos
sujetos que puntúan alto en el test y los que puntúan bajo, es decir, si discrimina entre los
eficaces y los ineficaces. Clasificamos a un grupo superior (GS) y al grupo inferior (GI),
teniendo en cuenta la mediana, en los resultados individuales de cada individuo. En este caso
la mediana calculada es:
Mediana 18
Grupo superior: aquellos individuos que obtuvieron más de 18 aciertos.
Grupo inferior: aquellos individuos que obtuvieron 18 aciertos o menos.
Calculamos el índice de discriminación de cada reactivo con la siguiente operación:
GS−GI
D=
N
2
Donde:
GS: aciertos del grupo superior
GI: aciertos del grupo inferior
N: total de participantes
Obteniendo los siguientes valores:
Ebel y Frisbie (1986) nos dan la siguiente regla de “dedo” para determinar la calidad de los
reactivos, en términos del índice de discriminación. La siguiente tabla, muestra los valores D
y su correspondiente interpretación. Asimismo, en la tabla se señalan las recomendaciones
para cada uno de estos valores.

En la prueba podemos observar que se tiene el 46% (11 de 24) de ítem con calidad
excelente, 42% (10 de 24) de ítem con calidad buena, el 8% (2 de 24) de ítem regular y 4% (1
de 24) ítem pobre, lo que significa que el índice de discriminación, diferencia mejor a los
estudiantes con altas y bajas calificaciones, como el índice es altamente positivo (46% + 42%)
88%, se considera que la mayoría de las preguntas se deben conservar y se ajustan al objetivo
de la prueba.
¿Cuáles son los reactivos que mejor y que peor discriminan?
Discriminación Reactivos
Excelente R!, R4, R6, R9, R10, R15, R16, R18, R19,R20, R22
Pobre R21
¿Cuál es el alfa de Cronbach del instrumento en lo general?
Utilizamos la siguiente formula:
K ∑Vi
α= (1− )
K−1 Vt
Donde:
α Alfa
K: número de ítems (24)
Vi: Varianza de cada ítem (21,3)
Vt: varianza total (23,1)
α=
24
24−1(1−
21,3
23,1 )
=0,08
Teniendo en cuenta la siguiente tabla
Y el resultado de nuestro alfa Cronbach el instrumento no es confiable.
¿Qué se puede decir acerca de la confiabilidad de este instrumento?
La confiabilidad hace referencia a la consistencia y precisión a las medidas arrojadas por
una prueba y los métodos más frecuentemente utilizados para estimarla con el test- retest, la
correlación entre formas paralelas o entre dos mitades que utiliza el algoritmo de Spearman
Brown como forma de estimación de la confiabilidad total del instrumento (Brown, 2000).
Calculamos usando la fórmula:
K Vt −∑ PQ
Hr= ( )
K−1 Vt
Hr=
24−1 (
24 18,3−4,26
18,3
=0,85)
Podemos decir que la confiabilidad aplicada a la prueba realizada a 66 alumnos es de 0,85,
por lo tanto, el instrumento tiene una confiabilidad de 0,85, esto significa que la confiabilidad
es alta.
¿Qué se puede decir acerca de la validez de este instrumento?

La correlación del Test- Criterio nos arroja un valor de validez del instrumento de 0,0534
En general, ¿qué fortalezas y debilidades tiene este examen?
El examen consta de instrucciones clara para los estudiantes, Los reactivos son descritos de
forma clara y completa, en las opciones de respuesta se encuentra la información necesaria
para poder responder, las preguntas no están cargadas con información irrelevante, son
puntuales y cada reactivo cumple su función de preguntar y evaluar la temática requerida. Con
relación a las debilidades, podemos decir que esta prueba solo da opciones de respuesta para
que el estudiante escoja, pero no da la opción de respuestas abiertas, en el que el estudiante se
ve obligado a responder con sus propias palabras y en base al conocimiento que tenga, pues
cuando solo se hacen preguntas de selección múltiple, en el que una de las respuestas es la
correcta, el estudiante puede llegar contestarla correctamente sin saber la respuesta, porque la
respuesta correcta ya está allí entre las opciones, así que utilizando algo de sentido común y
un poco de suerte, tendría la probabilidad de responder preguntas acertadamente sin saber la
respuesta.
¿Hay algún reactivo que requiera ser reconsiderado?
La pregunta 21, es la que menos respuestas acertadas obtuvo, talvez, porque involucra
manejo de terminología poco usual “investigación fáctica”, y también porque hace referencia
a unos lineamientos (Manual de estilo de publicaciones de la APA), los cuales son
actualizados año tras año, implicando esto que el estudiante este en constante revisión
bibliográfica y algunas veces llegando a confundir, inclusive, hasta a los mismos docentes que
las exigen.
¿Qué sugerencias concretas se harían para mejorarlo?
Es recomendable aclarar en el texto “investigación fáctica (es decir, empírica)”, de esta
forma el evaluado se siente más familiarizado con el lenguaje usado en el reactivo.
Se recomienda especificar el contexto que abarca cada uno de los reactivos, para evitar
caer en mal interpretaciones por parte del estudiante, puesto que podrá ocasionar confusión en
el evaluado y llegase a contestar erradamente.
Mejorar la construcción semántica de las preguntas, para que de esta manera se interpreten
mejor, es decir, usando frases más cortas pero específicas, que transmitan el sentido de lo que
se quiere preguntar, de esta manera las preguntas serán precisas, concretas y claras, y podrán
ser respondidas sin generar problemas de comprensión en los evaluados.
Consideramos que la prueba es pertinente, presenta aspectos como la validez y fiabilidad,
pues cumple con el objetivo de medir lo que debe medir, además presenta características
importantes como la integración de la teoría y la práctica en los ítems relacionados, es
coherente con lo que evalúa, pero falla en la parte lingüística, toda prueba debe tener una
construcción semántica y gramatical impecable, de otra manera será imposible para el
evaluado ser eficiente al momento de desarrollar o responder la prueba. Es fundamental que
no se caiga en el error de utilizar palabras complejas que, al no ser entendidas o al desconocer
su significado imposibilitan al estudiante poder tener un panorama claro de la pregunta,
finalmente evitar la construcción de oraciones muy largas en las preguntas, porque también
dificultan su entendimiento, se recomienda en toda prueba el uso de palabras puntuales y
oraciones o frases cortas que contengan solamente lo que se requiere preguntar. En

conclusión, respecto al análisis de las preguntas consideramos que en general muestra una
confiabilidad satisfactoria, y el general existe comprensión del evaluado en el momento de la
realización como se muestra que alrededor del 86% lograron superar la prueba.
BIBLIOGRAFIA
Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall (Cap. 1.)
Recuperado de http://www.ebooks7-24.com.ibero.basesdedatosezproxy.com/?il=4323
Abad, F., Garrido, j., Olea, J. (2006). Introducción a la psicometría. Teoría Clásica de los Test
y Teoría de la Respuesta al Item. Universidad Autónoma de Madrid.
Recuperado de: https://www.uam.es/personal_pdi/psicologia/cadalso/Docencia/Psico
metria/Apuntes/tema1TyP_4.pdf
Backhoff Escudero Eduardo. 2000. Nivel de dificultad y poder de discriminación del Examen
de Habilidades y Conocimientos Básicos (EXHCOBA). Revista Electrónica de Investigación
Educativa.
Recuperado de: https://www.redalyc.org/pdf/155/15502102.pdf
Brown, F. (2000) Principios de la medición en psicología y educación. México: Manual
Moderno. (Cap. 1)
Recuperado de http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog
%C3%ADa/Psicometria/MD/Brown_principios-de-la-medicion-en-psicologia-y-educacion-
frederick-g-brown.pdf
González, F. (2007). Instrumentos de evaluación psicológica. Editorial Ciencias Médicas.
Recuperado
de: http://newpsi.bvspsi.org.br/ebooks2010/en/Acervo_files/InstrumentosEvaluacionPsic
ologica.pdf
Clavijo Baquero Deisy Edith, Vargas Bustos Bibian Andrea. 2016. Análisis psicométrico de
una prueba de matemáticas aplicada a estudiantes de grado sexto, utilizando la teoría clásica
de los tests. Fundación Universitaria los Libertadores
Recuperado de: https://repository.libertadores.edu.co/bitstream/handle/11371/625/
ClavijoBaqueroDeisyEdith.pdf?sequence=2
Hurtado Mondoñedo Luis Leoncio. 2018. Relación entre los índices de dificultad y
discriminación. Revista Digital de Investigación en Docencia Universitaria
Recuperado de: http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S2223-
25162018000100016
Duve Alex. 2018. Como calcular e interpretar el Alfa de Cronbach con Excel para
un instrumento de investigación 2019. Youtube.
Recuperado de: https://www.youtube.com/watch?v=nIZgDNVQEWE

Actividad 5 - Análisis de Una Prueba

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad 5 - Análisis de Una Prueba

Cargado por

Copyright:

Formatos disponibles

ACTIVIDAD 5 – ANALISIS DE UNA PRUEBA

PEREZ TEJADA JEIMY LUZ

CÒDIGO BANNER: 100063018

DOCENTE: SANDRA FAGUA

CORPORACION UNIVERSITARIA IBEROAMERICANA

PSICOLOGIA QUINTO SEMESTRE

ANALISIS DE UNA PRUEBA

Situación: Un profesor del curso de "Introducción a la Metodología de la Investigación"

(asignatura que se imparte en un Programa de Psicología) diseñó un examen parcial para

estuvo compuesto por 24 reactivos de opción múltiple.

Link examen: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog%C3%ADa/

Después de aplicar el examen a 66 alumnos, sus respuestas se concentraron en una base de

Link base de datos: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog

Acciones por realizar: El profesor pide la ayuda de ustedes, estudiantes de psicometría de la

Corporación Universitaria Iberoamericana, para realizar el siguiente análisis:

a) Un análisis acerca de las características psicométricas del instrumento:

¿Cuál es el índice de dificultad de cada reactivo?

El índice de dificultad de un ítem es la proporción de sujetos que, habiendo intentado

resolverlo, lo resuelven correctamente. Existen parámetros para la aceptación de un ítem de

el número de los aciertos entre el total de participantes.

aproxima a 0.5 el ítem tiene dificultad media.

tener dificultad moderada.

Teniendo en cuenta la interpretación de la tabla anterior, podemos clasificar los ítems en la

Criterio de clasificación Ítem

Muy difícil No aplica

Moderado R11, R13, R21

R17, R18, R19, R20, R22, R24

Muy fácil R2, R8, R14, R23

la mediana calculada es:

GS: aciertos del grupo superior

GI: aciertos del grupo inferior

Obteniendo los siguientes valores:

y su correspondiente interpretación. Asimismo, en la tabla se señalan las recomendaciones

para cada uno de estos valores.

¿Cuáles son los reactivos que mejor y que peor discriminan?

¿Cuál es el alfa de Cronbach del instrumento en lo general?

Utilizamos la siguiente formula:

K: número de ítems (24)

Vi: Varianza de cada ítem (21,3)

Vt: varianza total (23,1)

Teniendo en cuenta la siguiente tabla

Y el resultado de nuestro alfa Cronbach el instrumento no es confiable.

¿Qué se puede decir acerca de la confiabilidad de este instrumento?

La confiabilidad hace referencia a la consistencia y precisión a las medidas arrojadas por

¿Qué se puede decir acerca de la validez de este instrumento?

En general, ¿qué fortalezas y debilidades tiene este examen?

forma clara y completa, en las opciones de respuesta se encuentra la información necesaria

que el estudiante escoja, pero no da la opción de respuestas abiertas, en el que el estudiante se

un poco de suerte, tendría la probabilidad de responder preguntas acertadamente sin saber la

¿Hay algún reactivo que requiera ser reconsiderado?

a unos lineamientos (Manual de estilo de publicaciones de la APA), los cuales son

¿Qué sugerencias concretas se harían para mejorarlo?

Es recomendable aclarar en el texto “investigación fáctica (es decir, empírica)”, de esta

forma el evaluado se siente más familiarizado con el lenguaje usado en el reactivo.

el evaluado y llegase a contestar erradamente.

ser respondidas sin generar problemas de comprensión en los evaluados.

Consideramos que la prueba es pertinente, presenta aspectos como la validez y fiabilidad,

importantes como la integración de la teoría y la práctica en los ítems relacionados, es

construcción semántica y gramatical impecable, de otra manera será imposible para el

evaluado ser eficiente al momento de desarrollar o responder la prueba. Es fundamental que

no se caiga en el error de utilizar palabras complejas que, al no ser entendidas o al desconocer

su significado imposibilitan al estudiante poder tener un panorama claro de la pregunta,

dificultan su entendimiento, se recomienda en toda prueba el uso de palabras puntuales y

oraciones o frases cortas que contengan solamente lo que se requiere preguntar. En