Está en la página 1de 16

ACTIVIDAD 5 – ANALISIS DE UNA PRUEBA

PEREZ TEJADA JEIMY LUZ

CÒDIGO BANNER: 100063018

DOCENTE: SANDRA FAGUA

CORPORACION UNIVERSITARIA IBEROAMERICANA

PSICOLOGIA QUINTO SEMESTRE

PSICOMETRÌA

MONTELIBANO CÒRDOBA

MARZO 2021

ANALISIS DE UNA PRUEBA


Adjunto link de archivo de Excel donde se realizaron los cálculos pertinentes de dicha actividad.
https://drive.google.com/file/d/1j2XS9Bu5io8lv4_4e4zv1pSSELtgUBWu/view?usp=sharing

Situación: Un profesor del curso de "Introducción a la Metodología de la Investigación"

(asignatura que se imparte en un Programa de Psicología) diseñó un examen parcial para

evaluar el aprendizaje de sus alumnos en las primeras dos unidades del curso. El examen

estuvo compuesto por 24 reactivos de opción múltiple.

Link examen: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog%C3%ADa/

Psicometria/MD/Examen.pdf

Después de aplicar el examen a 66 alumnos, sus respuestas se concentraron en una base de

datos.

Link base de datos: http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog

%C3%ADa/Psicometria/MD/Basededatos_UNIDAD%203_ACT_05_PSICOMETRIA.xlsx

Acciones por realizar: El profesor pide la ayuda de ustedes, estudiantes de psicometría de la

Corporación Universitaria Iberoamericana, para realizar el siguiente análisis:

a) Un análisis acerca de las características psicométricas del instrumento:

¿Cuál es el índice de dificultad de cada reactivo?

El índice de dificultad de un ítem es la proporción de sujetos que, habiendo intentado

resolverlo, lo resuelven correctamente. Existen parámetros para la aceptación de un ítem de

acuerdo con su nivel de dificultad, el establecido por Guilford (1975). En este caso se divide

el número de los aciertos entre el total de participantes.


Si el valor mínimo del índice de dificultad es cero “0”, se concluye que ninguno de los

individuos acertó el ítem. Si el valor máximo del índice de dificultad es uno “1”, se concluye

que todos los individuos acertaron el ítem. Se tiene entonces que, si el índice de dificultad se

acerca a cero, el ítem es difícil, si el valor se acerca a uno el ítem es fácil, y si este se

aproxima a 0.5 el ítem tiene dificultad media.


¿Cuáles son los reactivos más fáciles y cuáles los más difíciles?

El número de ítems difíciles o fáciles de una prueba depende de lo que quiere conseguir la

persona que la diseña. Sin embargo, en general, se aconseja que la mayoría de los ítems deban

tener dificultad moderada.

Teniendo en cuenta la interpretación de la tabla anterior, podemos clasificar los ítems en la

siguiente tabla.

Criterio de clasificación Ítem

Muy difícil No aplica

Difícil No aplica

Moderado R11, R13, R21

Fácil R1, R3, R4, R5, R6, R7, R9, R10, R15, R16,

R17, R18, R19, R20, R22, R24

Muy fácil R2, R8, R14, R23


¿Cuál es el índice de discriminación de cada reactivo?

Se dice que un ítem tiene poder discriminativo si distingue, discrimina, entre aquellos

sujetos que puntúan alto en el test y los que puntúan bajo, es decir, si discrimina entre los

eficaces y los ineficaces. Clasificamos a un grupo superior (GS) y al grupo inferior (GI),

teniendo en cuenta la mediana, en los resultados individuales de cada individuo. En este caso

la mediana calculada es:

Mediana 18
Grupo superior: aquellos individuos que obtuvieron más de 18 aciertos.
Grupo inferior: aquellos individuos que obtuvieron 18 aciertos o menos.
Calculamos el índice de discriminación de cada reactivo con la siguiente operación:

GS−GI
D=
N
2

Donde:

GS: aciertos del grupo superior

GI: aciertos del grupo inferior

N: total de participantes

Obteniendo los siguientes valores:

Ebel y Frisbie (1986) nos dan la siguiente regla de “dedo” para determinar la calidad de los

reactivos, en términos del índice de discriminación. La siguiente tabla, muestra los valores D

y su correspondiente interpretación. Asimismo, en la tabla se señalan las recomendaciones

para cada uno de estos valores.


En la prueba podemos observar que se tiene el 46% (11 de 24) de ítem con calidad

excelente, 42% (10 de 24) de ítem con calidad buena, el 8% (2 de 24) de ítem regular y 4% (1

de 24) ítem pobre, lo que significa que el índice de discriminación, diferencia mejor a los

estudiantes con altas y bajas calificaciones, como el índice es altamente positivo (46% + 42%)

88%, se considera que la mayoría de las preguntas se deben conservar y se ajustan al objetivo

de la prueba.

¿Cuáles son los reactivos que mejor y que peor discriminan?

Discriminación Reactivos
Excelente R!, R4, R6, R9, R10, R15, R16, R18, R19,R20, R22
Pobre R21

¿Cuál es el alfa de Cronbach del instrumento en lo general?

Utilizamos la siguiente formula:

K ∑Vi
α= (1− )
K−1 Vt
Donde:

α Alfa

K: número de ítems (24)

Vi: Varianza de cada ítem (21,3)

Vt: varianza total (23,1)

α=
24
24−1(1−
21,3
23,1 )
=0,08

Teniendo en cuenta la siguiente tabla

Y el resultado de nuestro alfa Cronbach el instrumento no es confiable.

¿Qué se puede decir acerca de la confiabilidad de este instrumento?

La confiabilidad hace referencia a la consistencia y precisión a las medidas arrojadas por

una prueba y los métodos más frecuentemente utilizados para estimarla con el test- retest, la

correlación entre formas paralelas o entre dos mitades que utiliza el algoritmo de Spearman

Brown como forma de estimación de la confiabilidad total del instrumento (Brown, 2000).
Calculamos usando la fórmula:

K Vt −∑ PQ
Hr= ( )
K−1 Vt

Hr=
24−1 (
24 18,3−4,26
18,3
=0,85)
Podemos decir que la confiabilidad aplicada a la prueba realizada a 66 alumnos es de 0,85,

por lo tanto, el instrumento tiene una confiabilidad de 0,85, esto significa que la confiabilidad

es alta.

¿Qué se puede decir acerca de la validez de este instrumento?


La correlación del Test- Criterio nos arroja un valor de validez del instrumento de 0,0534

En general, ¿qué fortalezas y debilidades tiene este examen?

El examen consta de instrucciones clara para los estudiantes, Los reactivos son descritos de

forma clara y completa, en las opciones de respuesta se encuentra la información necesaria

para poder responder, las preguntas no están cargadas con información irrelevante, son

puntuales y cada reactivo cumple su función de preguntar y evaluar la temática requerida. Con

relación a las debilidades, podemos decir que esta prueba solo da opciones de respuesta para

que el estudiante escoja, pero no da la opción de respuestas abiertas, en el que el estudiante se

ve obligado a responder con sus propias palabras y en base al conocimiento que tenga, pues

cuando solo se hacen preguntas de selección múltiple, en el que una de las respuestas es la

correcta, el estudiante puede llegar contestarla correctamente sin saber la respuesta, porque la

respuesta correcta ya está allí entre las opciones, así que utilizando algo de sentido común y

un poco de suerte, tendría la probabilidad de responder preguntas acertadamente sin saber la

respuesta.

¿Hay algún reactivo que requiera ser reconsiderado?

La pregunta 21, es la que menos respuestas acertadas obtuvo, talvez, porque involucra

manejo de terminología poco usual “investigación fáctica”, y también porque hace referencia

a unos lineamientos (Manual de estilo de publicaciones de la APA), los cuales son

actualizados año tras año, implicando esto que el estudiante este en constante revisión
bibliográfica y algunas veces llegando a confundir, inclusive, hasta a los mismos docentes que

las exigen.

¿Qué sugerencias concretas se harían para mejorarlo?

Es recomendable aclarar en el texto “investigación fáctica (es decir, empírica)”, de esta

forma el evaluado se siente más familiarizado con el lenguaje usado en el reactivo.

Se recomienda especificar el contexto que abarca cada uno de los reactivos, para evitar

caer en mal interpretaciones por parte del estudiante, puesto que podrá ocasionar confusión en

el evaluado y llegase a contestar erradamente.

Mejorar la construcción semántica de las preguntas, para que de esta manera se interpreten

mejor, es decir, usando frases más cortas pero específicas, que transmitan el sentido de lo que

se quiere preguntar, de esta manera las preguntas serán precisas, concretas y claras, y podrán

ser respondidas sin generar problemas de comprensión en los evaluados.

Consideramos que la prueba es pertinente, presenta aspectos como la validez y fiabilidad,

pues cumple con el objetivo de medir lo que debe medir, además presenta características

importantes como la integración de la teoría y la práctica en los ítems relacionados, es

coherente con lo que evalúa, pero falla en la parte lingüística, toda prueba debe tener una

construcción semántica y gramatical impecable, de otra manera será imposible para el

evaluado ser eficiente al momento de desarrollar o responder la prueba. Es fundamental que

no se caiga en el error de utilizar palabras complejas que, al no ser entendidas o al desconocer

su significado imposibilitan al estudiante poder tener un panorama claro de la pregunta,

finalmente evitar la construcción de oraciones muy largas en las preguntas, porque también

dificultan su entendimiento, se recomienda en toda prueba el uso de palabras puntuales y

oraciones o frases cortas que contengan solamente lo que se requiere preguntar. En


conclusión, respecto al análisis de las preguntas consideramos que en general muestra una

confiabilidad satisfactoria, y el general existe comprensión del evaluado en el momento de la

realización como se muestra que alrededor del 86% lograron superar la prueba.
BIBLIOGRAFIA

Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall (Cap. 1.) 

Recuperado de http://www.ebooks7-24.com.ibero.basesdedatosezproxy.com/?il=4323

Abad, F., Garrido, j., Olea, J. (2006). Introducción a la psicometría. Teoría Clásica de los Test

y Teoría de la Respuesta al Item. Universidad Autónoma de Madrid.

Recuperado de: https://www.uam.es/personal_pdi/psicologia/cadalso/Docencia/Psico

metria/Apuntes/tema1TyP_4.pdf

Backhoff Escudero Eduardo. 2000. Nivel de dificultad y poder de discriminación del Examen

de Habilidades y Conocimientos Básicos (EXHCOBA). Revista Electrónica de Investigación

Educativa.

Recuperado de: https://www.redalyc.org/pdf/155/15502102.pdf

Brown, F. (2000) Principios de la medición en psicología y educación. México: Manual

Moderno. (Cap. 1)

Recuperado de http://aulavirtual.ibero.edu.co/repositorio/Cursos-Matriz/Psicolog

%C3%ADa/Psicometria/MD/Brown_principios-de-la-medicion-en-psicologia-y-educacion-

frederick-g-brown.pdf

González, F. (2007). Instrumentos de evaluación psicológica. Editorial Ciencias Médicas.

Recuperado

de: http://newpsi.bvspsi.org.br/ebooks2010/en/Acervo_files/InstrumentosEvaluacionPsic

ologica.pdf
Clavijo Baquero Deisy Edith, Vargas Bustos Bibian Andrea. 2016. Análisis psicométrico de

una prueba de matemáticas aplicada a estudiantes de grado sexto, utilizando la teoría clásica

de los tests. Fundación Universitaria los Libertadores

Recuperado de: https://repository.libertadores.edu.co/bitstream/handle/11371/625/

ClavijoBaqueroDeisyEdith.pdf?sequence=2

Hurtado Mondoñedo Luis Leoncio. 2018. Relación entre los índices de dificultad y

discriminación. Revista Digital de Investigación en Docencia Universitaria

Recuperado de: http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S2223-

25162018000100016

Duve Alex. 2018. Como calcular e interpretar el Alfa de Cronbach con Excel para

un instrumento de investigación 2019. Youtube.

Recuperado de: https://www.youtube.com/watch?v=nIZgDNVQEWE

También podría gustarte