Está en la página 1de 11

ANÁLISIS DE UNA PRUEBA

ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181

ANDRES FELIPE SUAREZ MEJIA ID: 100071153

KAREN GISETH GALEANO HOYOS ID: 100067890

LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471

MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418

CORPORACIÓN UNIVERSITARIA IBEROAMERICANA

FACULTAD DE CIENCIAS HUMANAS Y SOCIALES

PSICOLOGÍA - MODALIDAD VIRTUAL

PSICOMETRÍA

2021
ANÁLISIS DE UNA PRUEBA

ANDREA PAOLA RODRIGUEZ ORTIZ ID: 100068181

ANDRES FELIPE SUAREZ MEJIA ID: 100071153

KAREN GISETH GALEANO HOYOS ID: 100067890

LAURA DAYANA BÁEZ RODRÍGUEZ ID: 100064471

MARILIN BIBIANA CARDOZO ORTIZ ID: 100068418

DOCENTE: SANDRA FAGUA

CORPORACIÓN UNIVERSITARIA IBEROAMERICANA

FACULTAD DE CIENCIAS HUMANAS Y SOCIALES

PSICOLOGÍA - MODALIDAD VIRTUAL

PSICOMETRÍA

2021
Análisis de una prueba

ANÁLISIS DE UNA PRUEBA

¿Cuál es el índice de dificultad de cada reactivo?

Para resolver esta pregunta, recurrimos a obtener una sumatoria del total de personas que contestaron correctamente cada uno de los

reactivos. Posteriormente, se obtiene una proporción, donde se divide cada total por el número de personas a quienes se les realizó la

prueba (en este caso, siendo 66 estudiantes). Por lo tanto:

Sujetos R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24
Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,68 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64

P corresponde al índice de dificultad de cada uno de los reactivos.

¿Cuáles son los reactivos más fáciles y cuáles los más difíciles?

Apoyados en la información anterior, se puede tener en cuenta que los reactivos número 1, 5, 6, 11, 13, 17, 18, 19, 21, 22 y 24 tienen

una dificultad intermedio. Y los reactivos número 2, 3, 4, 7, 8, 9, 10, 12, 14, 15, 16, 20 y 23 son fáciles, esto es, porque se acercan al 1.

Es decir, que la mayoría pudieron contestar estos reactivos por su baja dificultad.

3
Análisis de una prueba

¿Cuál es el índice de discriminación de cada reactivo?

De acuerdo con los datos, obtenemos Q que es el restante de P – 1. Posteriormente, obtenemos un coeficiente de correlación entre el

total de los participantes que contestaron correctamente cada reactivo y el total de respuestas contestadas por cada estudiante, teniendo

como resultado la siguiente tabla:

Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,68 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
Q 0,32 0,09 0,2 0,17 0,35 0,33 0,17 0,12 0,3 0,15 0,44 0,09 0,42 0,14 0,23 0,18 0,35 0,36 0,33 0,23 0,59 0,33 0,06 0,36
D 0,46 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26

Según los datos evaluados, obtenemos que el resultado abarca desde 0.1 hasta 0.62.

¿Cuáles son los reactivos que mejor y que peor discriminan?

De acuerdo con los resultados, obtenemos un nivel de discriminación medio-bajo. En el cual, 3 de los reactivos no están evaluando lo

que deberían evaluar, mientras que el resto de los reactivos, de manera intermedia, logran cumplir con el propósito de evaluar acerca

de la metodología de investigación. No obstante, estos datos se encuentran, en su mayoría, muy debajo de lo esperado, por lo que,

pueden existir errores en la prueba que afectan su validez.

4
Análisis de una prueba

¿Cuál es el alfa de Cronbach del instrumento en lo general?

Para ello, recurriremos a la fórmula del alfa de cronbach. Y con los datos anteriores también requerimos obtener la varianza de cada

uno de los datos, y la tomamos por columnas, es decir, por el número de estudiantes que contestaron bien los reactivos.

Suma 45 60 53 55 43 44 55 58 46 56 37 60 38 57 51 54 43 42 44 51 27 44 62 42
P 0,682 0,91 0,8 0,83 0,65 0,67 0,83 0,88 0,7 0,85 0,56 0,91 0,58 0,86 0,77 0,82 0,65 0,64 0,67 0,77 0,41 0,67 0,94 0,64
Q 0,318 0,09 0,2 0,17 0,35 0,33 0,17 0,12 0,3 0,15 0,44 0,09 0,42 0,14 0,23 0,18 0,35 0,36 0,33 0,23 0,59 0,33 0,06 0,36
D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26
Varianza 0,22 0,08 0,16 0,14 0,23 0,23 0,14 0,11 0,21 0,13 0,25 0,08 0,25 0,12 0,18 0,15 0,23 0,23 0,23 0,18 0,25 0,23 0,06 0,23
Suma-
Varianzas
Individuales 4,32
Suma-
Varianzas
Totales 18,31
K 24

𝟐𝟒 𝟒, 𝟑𝟐
𝜶= [𝟏 − ] Siendo así, tenemos como resultado que el alfa de
𝟐𝟒 − 𝟏 𝟏𝟖, 𝟑𝟏
cronbach es de 0,80.
𝜶 = 𝟏, 𝟎𝟒[𝟎, 𝟕𝟔]

𝜶 = 𝟎, 𝟖𝟎

5
Análisis de una prueba

¿Qué se puede decir acerca de la confiabilidad de este instrumento?

Para responder a esta pregunta, Brown F. menciona que: "Otro grupo de estimaciones de confiabilidad se enfoca en la consistencia de

la ejecución a través de los reactivos que constituyen la prueba, es decir, la consistencia interna de la prueba. En este caso, tratamos

de determinar, en esencia, si todos los reactivos de la prueba miden el mismo rasgo o la misma característica". (1999, p. 65)

De acuerdo con el alfa de cronbach, podemos concluir que su confiabilidad es alta. Es decir, al indicar un valor que sobrepasa el dato

intermedio, significa que, aunque los reactivos sean intermedios y el índice de dificultad una buena cantidad de los ítems resultan ser

fáciles, señala que la mayoría todos los reactivos están midiendo el tema a evaluar que en este caso es la metodología de investigación,

la consistencia interna de la prueba es medianamente sólida y por lo tanto, podría poseer una alta confiabilidad. Los ítems presentan

homogeneidad y esto podría asegurar la buena calidad de la prueba.

¿Qué se puede decir acerca de la validez de este instrumento?

Teniendo en cuenta el índice de discriminación, que es el siguiente:

D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26

De acuerdo con Alvarado, J., hace mención en que “Además, distinguirá entre la validez del test y su poder predictivo, definiendo este

6
Análisis de una prueba

último como la correlación entre puntuaciones observadas en el test y las puntuaciones observadas en el criterio; y distinguirá ambas

de lo que denominó relevancia o correlación entre las puntuaciones verdaderas, tanto del predictor como del criterio”. (2012, p. 18)

Apoyados en esta premisa, es posible inferir que su validez es baja porque, es probable que algunas preguntas no estén midiendo

específicamente el tema que se pretende evaluar, por la existencia de errores en el predictor. 3 ítems de ellos tienen un índice de

discriminación bajo, por lo que, podrían estar midiendo un tema completamente diferente.

Por ejemplo, en el reactivo número 11, la prueba señala que:

Un investigador quiere revisar los artículos publicados sobre investigaciones empíricas que se han realizado sobre un tema

determinado. De las siguientes, ¿cuál recomendación es la más adecuada para este fin?

Opciones:

a) Comparar los estudios realizados con uno que sirva como estudio de "control".

b) Realizar una investigación ex–post–facto.

c) Llevar a cabo un estudio etnográfico que compare las diversas culturas de cada uno de los estudios realizados.

d) Conducir un meta–análisis.

e) Realizar una consulta en ProQuest Education Complete para investigar qué artículos hay sobre el tema.

Respuesta: (e)

7
Análisis de una prueba

En este caso, el enunciado indica un concepto que hace referencia más al meta-análisis, en el cual consiste en un proceso de revisión

sistemática donde se obtienen diferentes artículos donde se evidencian estudios relacionados a un tema en específico. Por lo que, se

puede inferir que la respuesta es incorrecta. Y algunos estudiantes, posiblemente reconocían que la respuesta correcta era la d, y podría

parecer incluso que la respuesta era incorrecta, cuando probablemente la respuesta estipulada no era la indicada. Allí se presentaría un

error.

En general, ¿qué fortalezas y debilidades tiene este examen?

En cuanto a fortalezas, es posible asegurar que la mayoría de ítems son fáciles o están bien formulados de manera que los estudiantes

pueden comprender lo que este solicita y por lo tanto acercarse a una respuesta en específico. Además, en las instrucciones, a pesar de

que se hace mención de que el estudiante puede escoger la que considere mejor entre 2 posibles opciones, es un enunciado que

despistaría dado que los reactivos tienen una sola respuesta a escoger y podrían ser confusas las respuestas considerando que miden lo

mismo cuando realmente sólo una respuesta es la correcta.

El tiempo de ejecución de la prueba es óptimo para 24 reactivos. Siendo 60 minutos pertinentes para resolver estos ítems.

Por otro lado, como debilidades, se evidencia que la validez de las preguntas es intermedia, es decir, que podrían estar midiendo

algunas lo que respecta a metodología de la investigación como pueda que no. Teniendo en cuenta el total de los estudiantes que

8
Análisis de una prueba

aprobaron satisfactoriamente, aprobaron con un puntaje intermedio y quienes perdieron, podemos apoyarnos en la siguiente tabla,

teniendo en cuenta que, para pasar esta prueba, de manera convencional, se logra con la mitad de las respuestas resueltas. Es decir, 12.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Total 19 10
24 21 20
22 16 19
11 Aprobado 40
17 16 Intermedio
15 22 18 aprobado 19
10 18 20 Reprobado 7
19 15 23 Total 66
14 21 9
12 22 16
19 14 11
13 17 19 Con estos datos, podemos concluir que, a pesar de que la
21 19 12
22 mayoría de estudiantes hayan aprobado la prueba de manera
20 22
23 23 18 satisfactoria e intermedia, siendo un total de 59. El nivel de
18 18 19
18 9 21
discriminación es intermedio, por lo que podría aún fortalecerse
18 23 17
18
algunas preguntas, puesto que aunque gran parte de las
17 22
20 18 22 preguntas tengan un nivel de dificultad fácil, no implica que
4 16 23
24 13 estén siendo propiamente relacionadas con el tema que se está
19
15 23 15 evaluando o que estén bien formuladas.
15

9
Análisis de una prueba

¿Hay algún reactivo que requiera ser reconsiderado? ¿Qué sugerencias concretas se harían para mejorarlo?

De acuerdo con el índice de discriminación:

D 0,462 0,52 0,41 0,57 0,47 0,58 0,36 0,33 0,53 0,43 0,19 0,32 0,33 0,42 0,62 0,51 0,38 0,45 0,52 0,5 0,27 0,43 0,46 0,26

Podemos inferir que los reactivos que requieren ser eliminados corresponden a los números 11, 21 y 24. Es posible que estos no sean

congruentes con el tema que se pretende evaluar. En cuanto al resto de reactivos, estos presentan un nivel de discriminación

intermedio, lo que significa que podrían mejorarse de acuerdo con la formulación de cada pregunta. Pudiese ser que estén midiendo

temas específicos a la unidad 1 y 2 como lo ha indicado el profesor. No obstante, estos podrían plantearse de una manera óptima para

que los estudiantes puedan no considerar dos posibles respuestas sino una en concreto e ir más directamente con la respuesta indicada.

10
REFERENCIAS BIBLIOGRÁFICAS

Aguilera Eguía, R. (2014). ¿Revisión sistemática, revisión narrativa o

metaanálisis?. Revista de la Sociedad Española del Dolor, 21(6), 359-

360. https://dx.doi.org/10.4321/S1134-80462014000600010

Aiken, L. (2003) Test psicológicos y evaluación. 11 edición. México: Prentice Hall

(Cap. 1.). Recuperado de http://www.ebooks7-

24.com.ibero.basesdedatosezproxy.com/?il=4323

Alvarado Izquierdo, J. (2012). La validez en la medición psicológica. UNED -

Universidad Nacional de Educación a Distancia. Recuperado de:

https://elibro.net/es/ereader/biblioibero/48544?page=16

Brown, F. (2000) Principios de la medición en psicología y educación. México:

Manual Moderno. (Cap. 1). Recuperado de:

https://drive.google.com/file/d/1qXysPkGX5OsqLBv1H8n1MW2ycF4GvPu

a/view?usp=sharing

También podría gustarte