Actividad 5 - Análisis de Una Prueba

ANÁLISIS DE UNA PRUEBA
ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181
ANDRES FELIPE SUAREZ MEJIA ID: 100071153
KAREN GISETH GALEANO HOYOS ID: 100067890
LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471
MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418
CORPORACIÓN UNIVERSITARIA IBEROAMERICANA
FACULTAD DE CIENCIAS HUMANAS Y SOCIALES
PSICOLOGÍA - MODALIDAD VIRTUAL
PSICOMETRÍA
2021
ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181
ANDRES FELIPE SUAREZ MEJIA ID: 100071153
KAREN GISETH GALEANO HOYOS ID: 100067890
LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471
MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418
DOCENTE: SANDRA FAGUA
CORPORACIÓN UNIVERSITARIA IBEROAMERICANA
FACULTAD DE CIENCIAS HUMANAS Y SOCIALES
PSICOLOGÍA - MODALIDAD VIRTUAL
PSICOMETRÍA
2021
Análisis de una prueba
¿Cuál es el índice de dificultad de cada reactivo?
Para resolver esta pregunta, recurrimos a obtener una sumatoria del total de personas que contestaron correctamente cada uno de los
reactivos. Posteriormente, se obtiene una proporción, donde se divide cada total por el número de personas a quienes se les realizó la
prueba (en este caso, siendo 66 estudiantes). Por lo tanto:
Sujetos R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24
Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,68 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
P corresponde al índice de dificultad de cada uno de los reactivos.
¿Cuáles son los reactivos más fáciles y cuáles los más difíciles?
Apoyados en la información anterior, se puede tener en cuenta que los reactivos número 1, 5, 6, 11, 13, 17, 18, 19, 21, 22 y 24 tienen
una dificultad intermedio. Y los reactivos número 2, 3, 4, 7, 8, 9, 10, 12, 14, 15, 16, 20 y 23 son fáciles, esto es, porque se acercan al 1.
Es decir, que la mayoría pudieron contestar estos reactivos por su baja dificultad.
3
¿Cuál es el índice de discriminación de cada reactivo?
De acuerdo con los datos, obtenemos Q que es el restante de P – 1. Posteriormente, obtenemos un coeficiente de correlación entre el
total de los participantes que contestaron correctamente cada reactivo y el total de respuestas contestadas por cada estudiante, teniendo
como resultado la siguiente tabla:
Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,68 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
Q 0,32 0,09 0,2 0,17 0,35 0,33 0,17 0,12 0,3 0,15 0,44 0,09 0,42 0,14 0,23 0,18 0,35 0,36 0,33 0,23 0,59 0,33 0,06 0,36
D 0,46 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26
Según los datos evaluados, obtenemos que el resultado abarca desde 0.1 hasta 0.62.
¿Cuáles son los reactivos que mejor y que peor discriminan?
De acuerdo con los resultados, obtenemos un nivel de discriminación medio-bajo. En el cual, 3 de los reactivos no están evaluando lo
que deberían evaluar, mientras que el resto de los reactivos, de manera intermedia, logran cumplir con el propósito de evaluar acerca
de la metodología de investigación. No obstante, estos datos se encuentran, en su mayoría, muy debajo de lo esperado, por lo que,
pueden existir errores en la prueba que afectan su validez.
4
¿Cuál es el alfa de Cronbach del instrumento en lo general?
Para ello, recurriremos a la fórmula del alfa de cronbach. Y con los datos anteriores también requerimos obtener la varianza de cada
uno de los datos, y la tomamos por columnas, es decir, por el número de estudiantes que contestaron bien los reactivos.
Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,682 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
Q 0,318 0,09 0,2 0,17 0,35 0,33 0,17 0,12 0,3 0,15 0,44 0,09 0,42 0,14 0,23 0,18 0,35 0,36 0,33 0,23 0,59 0,33 0,06 0,36
D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26
Varianza 0,22 0,08 0,16 0,14 0,23 0,23 0,14 0,11 0,21 0,13 0,25 0,08 0,25 0,12 0,18 0,15 0,23 0,23 0,23 0,18 0,25 0,23 0,06 0,23
Suma-
Varianzas
Individuales 4,32
Suma-
Varianzas
Totales 18,31
K 24
𝟐𝟒 𝟒, 𝟑𝟐
𝜶= [𝟏 − ] Siendo así, tenemos como resultado que el alfa de
𝟐𝟒 − 𝟏 𝟏𝟖, 𝟑𝟏
cronbach es de 0,80.
𝜶 = 𝟏, 𝟎𝟒[𝟎, 𝟕𝟔]
𝜶 = 𝟎, 𝟖𝟎
5
¿Qué se puede decir acerca de la confiabilidad de este instrumento?
Para responder a esta pregunta, Brown F. menciona que: "Otro grupo de estimaciones de confiabilidad se enfoca en la consistencia de
la ejecución a través de los reactivos que constituyen la prueba, es decir, la consistencia interna de la prueba. En este caso, tratamos
de determinar, en esencia, si todos los reactivos de la prueba miden el mismo rasgo o la misma característica". (1999, p. 65)
De acuerdo con el alfa de cronbach, podemos concluir que su confiabilidad es alta. Es decir, al indicar un valor que sobrepasa el dato
intermedio, significa que, aunque los reactivos sean intermedios y el índice de dificultad una buena cantidad de los ítems resultan ser
fáciles, señala que la mayoría todos los reactivos están midiendo el tema a evaluar que en este caso es la metodología de investigación,
la consistencia interna de la prueba es medianamente sólida y por lo tanto, podría poseer una alta confiabilidad. Los ítems presentan
homogeneidad y esto podría asegurar la buena calidad de la prueba.
¿Qué se puede decir acerca de la validez de este instrumento?
Teniendo en cuenta el índice de discriminación, que es el siguiente:
D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26
De acuerdo con Alvarado, J., hace mención en que “Además, distinguirá entre la validez del test y su poder predictivo, definiendo este
6
último como la correlación entre puntuaciones observadas en el test y las puntuaciones observadas en el criterio; y distinguirá ambas
de lo que denominó relevancia o correlación entre las puntuaciones verdaderas, tanto del predictor como del criterio”. (2012, p. 18)
Apoyados en esta premisa, es posible inferir que su validez es baja porque, es probable que algunas preguntas no estén midiendo
específicamente el tema que se pretende evaluar, por la existencia de errores en el predictor. 3 ítems de ellos tienen un índice de
discriminación bajo, por lo que, podrían estar midiendo un tema completamente diferente.
Por ejemplo, en el reactivo número 11, la prueba señala que:
Un investigador quiere revisar los artículos publicados sobre investigaciones empíricas que se han realizado sobre un tema
determinado. De las siguientes, ¿cuál recomendación es la más adecuada para este fin?
Opciones:
a) Comparar los estudios realizados con uno que sirva como estudio de "control".
b) Realizar una investigación ex–post–facto.
c) Llevar a cabo un estudio etnográfico que compare las diversas culturas de cada uno de los estudios realizados.
d) Conducir un meta–análisis.
e) Realizar una consulta en ProQuest Education Complete para investigar qué artículos hay sobre el tema.
Respuesta: (e)
7
En este caso, el enunciado indica un concepto que hace referencia más al meta-análisis, en el cual consiste en un proceso de revisión
sistemática donde se obtienen diferentes artículos donde se evidencian estudios relacionados a un tema en específico. Por lo que, se
puede inferir que la respuesta es incorrecta. Y algunos estudiantes, posiblemente reconocían que la respuesta correcta era la d, y podría
parecer incluso que la respuesta era incorrecta, cuando probablemente la respuesta estipulada no era la indicada. Allí se presentaría un
error.
En general, ¿qué fortalezas y debilidades tiene este examen?
En cuanto a fortalezas, es posible asegurar que la mayoría de ítems son fáciles o están bien formulados de manera que los estudiantes
pueden comprender lo que este solicita y por lo tanto acercarse a una respuesta en específico. Además, en las instrucciones, a pesar de
que se hace mención de que el estudiante puede escoger la que considere mejor entre 2 posibles opciones, es un enunciado que
despistaría dado que los reactivos tienen una sola respuesta a escoger y podrían ser confusas las respuestas considerando que miden lo
mismo cuando realmente sólo una respuesta es la correcta.
El tiempo de ejecución de la prueba es óptimo para 24 reactivos. Siendo 60 minutos pertinentes para resolver estos ítems.
Por otro lado, como debilidades, se evidencia que la validez de las preguntas es intermedia, es decir, que podrían estar midiendo
algunas lo que respecta a metodología de la investigación como pueda que no. Teniendo en cuenta el total de los estudiantes que
8
aprobaron satisfactoriamente, aprobaron con un puntaje intermedio y quienes perdieron, podemos apoyarnos en la siguiente tabla,
teniendo en cuenta que, para pasar esta prueba, de manera convencional, se logra con la mitad de las respuestas resueltas. Es decir, 12.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Total 19 10
24 21 20
22 16 19
11 Aprobado 40
17 16 Intermedio
15 22 18 aprobado 19
10 18 20 Reprobado 7
19 15 23 Total 66
14 21 9
12 22 16
19 14 11
13 17 19 Con estos datos, podemos concluir que, a pesar de que la
21 19 12
22 mayoría de estudiantes hayan aprobado la prueba de manera
20 22
23 23 18 satisfactoria e intermedia, siendo un total de 59. El nivel de
18 18 19
18 9 21
discriminación es intermedio, por lo que podría aún fortalecerse
18 23 17
18
algunas preguntas, puesto que aunque gran parte de las
17 22
20 18 22 preguntas tengan un nivel de dificultad fácil, no implica que
4 16 23
24 13 estén siendo propiamente relacionadas con el tema que se está
19
15 23 15 evaluando o que estén bien formuladas.
15
9
¿Hay algún reactivo que requiera ser reconsiderado? ¿Qué sugerencias concretas se harían para mejorarlo?
De acuerdo con el índice de discriminación:
D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26
Podemos inferir que los reactivos que requieren ser eliminados corresponden a los números 11, 21 y 24. Es posible que estos no sean
congruentes con el tema que se pretende evaluar. En cuanto al resto de reactivos, estos presentan un nivel de discriminación
intermedio, lo que significa que podrían mejorarse de acuerdo con la formulación de cada pregunta. Pudiese ser que estén midiendo
temas específicos a la unidad 1 y 2 como lo ha indicado el profesor. No obstante, estos podrían plantearse de una manera óptima para
que los estudiantes puedan no considerar dos posibles respuestas sino una en concreto e ir más directamente con la respuesta indicada.
10
REFERENCIAS BIBLIOGRÁFICAS
Aguilera Eguía, R. (2014). ¿Revisión sistemática, revisión narrativa o
metaanálisis?. Revista de la Sociedad Española del Dolor, 21(6), 359-
360. https://dx.doi.org/10.4321/S1134-80462014000600010
Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall
(Cap. 1.). Recuperado de http://www.ebooks7-
24.com.ibero.basesdedatosezproxy.com/?il=4323
Alvarado Izquierdo, J. (2012). La validez en la medición psicológica. UNED -
Universidad Nacional de Educación a Distancia. Recuperado de:
https://elibro.net/es/ereader/biblioibero/48544?page=16
Brown, F. (2000) Principios de la medición en psicología y educación. México:
Manual Moderno. (Cap. 1). Recuperado de:
https://drive.google.com/file/d/1qXysPkGX5OsqLBv1H8n1MW2ycF4GvPu
a/view?usp=sharing

Actividad 5 - Análisis de Una Prueba

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad 5 - Análisis de Una Prueba

Cargado por

Copyright:

Formatos disponibles

ANÁLISIS DE UNA PRUEBA

ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181

ANDRES FELIPE SUAREZ MEJIA ID: 100071153

KAREN GISETH GALEANO HOYOS ID: 100067890

LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471

MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418

CORPORACIÓN UNIVERSITARIA IBEROAMERICANA

FACULTAD DE CIENCIAS HUMANAS Y SOCIALES

PSICOLOGÍA - MODALIDAD VIRTUAL

ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181

ANDRES FELIPE SUAREZ MEJIA ID: 100071153

KAREN GISETH GALEANO HOYOS ID: 100067890

LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471

MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418

DOCENTE: SANDRA FAGUA

CORPORACIÓN UNIVERSITARIA IBEROAMERICANA

FACULTAD DE CIENCIAS HUMANAS Y SOCIALES

PSICOLOGÍA - MODALIDAD VIRTUAL

ANÁLISIS DE UNA PRUEBA

¿Cuál es el índice de dificultad de cada reactivo?

prueba (en este caso, siendo 66 estudiantes). Por lo tanto:

P corresponde al índice de dificultad de cada uno de los reactivos.

¿Cuál es el índice de discriminación de cada reactivo?

como resultado la siguiente tabla:

¿Cuáles son los reactivos que mejor y que peor discriminan?

pueden existir errores en la prueba que afectan su validez.

¿Cuál es el alfa de Cronbach del instrumento en lo general?

¿Qué se puede decir acerca de la confiabilidad de este instrumento?

homogeneidad y esto podría asegurar la buena calidad de la prueba.

¿Qué se puede decir acerca de la validez de este instrumento?

Teniendo en cuenta el índice de discriminación, que es el siguiente:

Por ejemplo, en el reactivo número 11, la prueba señala que:

b) Realizar una investigación ex–post–facto.

En general, ¿qué fortalezas y debilidades tiene este examen?

mismo cuando realmente sólo una respuesta es la correcta.

De acuerdo con el índice de discriminación:

Aguilera Eguía, R. (2014). ¿Revisión sistemática, revisión narrativa o

metaanálisis?. Revista de la Sociedad Española del Dolor, 21(6), 359-

Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall

(Cap. 1.). Recuperado de http://www.ebooks7-

Alvarado Izquierdo, J. (2012). La validez en la medición psicológica. UNED -

Universidad Nacional de Educación a Distancia. Recuperado de:

Brown, F. (2000) Principios de la medición en psicología y educación. México:

Manual Moderno. (Cap. 1). Recuperado de:

También podría gustarte