Está en la página 1de 41

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE EDUCACIN UNIDAD DE POST GRADO

TCNICAS PARA CONTRUIR PRUEBAS

DR. ELAS MEJA MEJA


19/02/2013

MEDICIN

Es un proceso que consiste en asignar numerales a determinados fenmenos o eventos, siguiendo reglas previamente establecidas.
19/02/2013

MEDICIN Medir es asignar nmeros a las cosas de tal modo que stos expresen las propiedades que realmente poseen dichas cosas. Esta es la condicin llamada isomorfismo con la realidad. No toda propiedad de un objeto se puede medir o expresar numricamente. Slo se expresan numricamente las magnitudes.
19/02/2013

MEDICIN Las propiedades susceptibles de medicin se llaman magnitudes. Son ejemplos de magnitudes: La masa y la longitud de los cuerpos. La duracin de los sucesos. La temperatura y la densidad de las sustancias. La inteligencia y el conocimiento. La calidad del servicio que brindan las organizaciones. 19/02/2013

NIVELES DE MEDICIN
NIVEL NOMINAL: Consiste en asignar nombres a los sujetos o fenmenos de la realidad.
NIVEL ORDINAL: Incorpora la idea del orden o prelacin en que se hallan los sujetos. NIVEL DE INTERVALO: Establece distancias iguales entre los intervalos de una escala. NIVEL DE RAZN: Parte del concepto de cero y permite mediciones sobre cero o bajo cero.
19/02/2013

NIVELES DE MEDICIN
6 7 4 6 2 5 5 4 13 3 2 7 1 Nominal

Ordinal

Intervalo
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Razn
-7 -6 -5 -4 -3 -2 -1
19/02/2013

2 3

CUALIDADES DE LAS PRUEBAS

CONFIABILIDAD: Es la seguridad, exactitud, precisin o consistencia de una prueba. VALIDEZ: Es la capacidad de las pruebas de medir lo que se proponen medir.
OBJETIVIDAD: Cuando la prueba arroja los mismos resultados independientemente de quien sea el evaluador.
19/02/2013

CUALIDADES DE LAS PRUEBAS

AMPLITUD: pruebas.

Es

la

extensin

de

las

PRACTICABILIDAD: Es la posibilidad de aplicarse. ADECUACIN: Si es apropiada para el fin perseguido.

19/02/2013

MTODOS PARA DETERMINAR LA CONFIABILIDAD DE LAS PRUEBAS MTODO DE PRUEBAS PARALELAS: Se elaboran dos pruebas iguales o paralelas y se correlaciona los resultados obtenidos en cada una de ellas.
MTODO DE MITADES EQUIVALENTES: Se correlacionan los resultados obtenidos en cada una de las mitades de la prueba. MTODO MATEMTICO: Se procede de acuerdo con la frmula respectiva.
19/02/2013

CONFIABILIDAD: MTODO LAS MITADES


HOJA DE RESPUESTAS 1 3 5 7 a a a a b b b b c c c c d d d d 2 4 6 8 a a a a b b b b c c c c d d d d

9
11 13

a
a a

b
b b

c
c c

d
d d

10
12 14

a
a a

b
b b

c
c c

d
d d

15
19/02/2013

16

NDICE DE CONFIABILIDAD

Cf
Donde:

n x (n - x ) = ------- [ 1 ------------ ] n-1 ns2

Cf = Coeficiente de confiabilidad n = Puntaje mximo alcanzado x = Promedio s = Desviacin standard de las puntuaciones de la prueba
19/02/2013

NDICE DE CONFIABILIDAD
Datos: n = 18 x = 14,27 s = 3,1
18 Cf = --------18 - 1

[1
[1

14,27 (18 14,27 ) ----------------------------18 (3,1) 2 53,2271 ---------------172,98

Cf = 1,0588 x

Cf = 0,73
19/02/2013

NDICE DE CONFIABILIDAD
TABLA DE KUDER RICHARDSON

0,53 a menos 0,54 a 0,59 0,60 a 0,65 0,66 a 0,71 0,72 a 0,99 1,0

= = = = = =

Confiabilidad nula Confiabilidad baja Confiable Muy confiable Excelente confiabilidad Confiabilidad perfecta

Cf hallado de 0,73 : Excelente confiabilidad

19/02/2013

TIPOS DE VALIDEZ
VALIDEZ DE CONSTRUCTO: Es la correspondencia con el concepto. VALIDEZ DE CONTENIIDO: La prueba debe contener reactivos que sean la muestra representativa del universo de reactivos. VALIDEZ PREDICTIVA: Es la capacidad de predecir desempeos futuros. VALIDEZ ESTADSTICA: Es un clculo matemtico. VALIDEZ CONCURRENTE: Se produce cuando una prueba tiene varios tipos de validez.
19/02/2013

VALIDEZ DE CONSTRUCTO
Grado de correspondencia entre los resultados de una prueba y los conceptos en los que se basan los temas que se pretenden medir.
Trata de establecer en qu medida la prueba tiene en cuenta los aspectos implcitos en la definicin terica del tema a medirse. Si se trata de un test de Anatoma, pues debe medir conocimientos de Anatoma. Por eso se llama validez de elaboracin o de hiptesis de trabajo Se establece mediante el juicio de expertos.
19/02/2013

VALIDEZ DE CONTENIDO
Es la validez lgica o de muestreo. Es el grado de fidelidad con que una prueba representa el universo de reactivos del que se extrajeron los tems. Universo de reactivos: concepto terico que alude a todos los posible temes que se podran elaborar sobre un determinado tema. Para establecer la validez de contenido se analiza el universo de contenidos respectivo y se extrae una muestra representativa. Luego se decide qu contenidos debe abarcar la prueba y qu proporcin de temes debe asignarse a cada uno de los aspectos de la materia que se evala.
19/02/2013

CRITERIOS PARA ESTABLECER LA VALIDEZ DE CONTENIDO


CRITERIO CURRICULAR O PROGRAMTICO: Los contenidos a evaluar deben estar presentes en el currculo. Se establece con una Tabla de Cotejo.

CRITERIO BIBLIOGRFICO: Los contenidos a evaluar deben aparecer en los diferentes textos sobre la materia.

19/02/2013

CRITERIOS PARA ESTABLECER LA VALIDEZ DE CONTENIDO


CRITERIO DE PERTINENCIA: Los contenidos deben adecuarse a las capacidades intelectuales del sujeto. De aqu la necesidad de establecer el grado de dificultad y el ndice de discriminacin de la prueba y de los temes. CRITERIO DE UTILIDAD SOCIAL: La prueba debe tener significado para la vida practica.

19/02/2013

VALIDEZ PREDICTIVA
Es la capacidad de una prueba de predecir acontecimientos futuros.
PROCEDIMIENTO:

Se administra la prueba.
Se espera que se produzcan los desempeos esperados.

Se compara los puntajes de la prueba con los desempeos reales del sujeto.
19/02/2013

VALIDEZ CONCURRENTE
Es la correlacin entre las puntuaciones logradas en una aplicacin con respecto a las puntuaciones logradas por los mismo sujetos en otras mediciones realizadas anteriormente en materias cuyas pruebas ya fueron validadas.

El procedimiento es el mismo que en el caso anterior solo que la correlacin puede hallarse casi de inmediato.

19/02/2013

VALIDEZ ESTADISTICA O EMPIRICA


Es la correlacin entre los resultados de la prueba y la situacin real del sujeto en los aprendizajes cuyos resultados se mide.

19/02/2013

TCNICA PARA CONSTRUIR PRUEBAS


Determinacin de los propsitos. Identificacin del objeto a evaluar. Elaboracin de la estructura de la prueba. Seleccin y elaboracin de los tems. Eleccin de la escala de medicin. Asignacin de puntajes de la prueba. Asignacin de pesos a los componentes. Jerarquizacin lgica de los tems. Elaboracin de una tabla de especificaciones.
19/02/2013

ESTRUCTURA DE LA PRUEBA
Objet. Cont.

Inform. 3 2 2 7 1 7

Compr. 4 3 4 11 2 22

Aplic. 2 3 2 7 3 21

Totales 9 8 8 25

Puntaje 17 17 16

I Unid. II Unid. III Unid Totales Pesos Puntaje


19/02/2013

50

GRADO DE DIFICULTAD DE LA PRUEBA

x Gd = ------ x 100 Pm
Donde: Gd = Grado de dificultad de la prueba = Promedio de los puntajes obtenidos x Pm = Puntaje mximo posible de alcanzar en la prueba

19/02/2013

GRADO DE DIFICULTAD DE LA PRUEBA

Datos: Promedio = 13,27 Puntaje mximo = 20

13,27 Gd = --------- x 100 20

Gd = 66 %

19/02/2013

GRADO DE DIFICULTAD DE LA PRUEBA


TABLA DE KUDER RICHARDSON
81 % a ms 61 a 80 % 51 a 60 % 31 a 50 % 11 a 30 % Debajo del 10 % = = = = = = Muy fcil Relativamente fcil Dificultad adecuada Relativamente difcil Difcil Muy difcil

Gd hallado del 66 % = Relativamente fcil

19/02/2013

NDICE DE DISCRIMINACIN DE LA PRUEBA pgs pgi Id = ------------- x 100 PT


Donde: Id = ndice de discriminacin de la prueba pgs = Puntaje del grupo superior pgi = Puntaje del grupo inferior PT = Puntaje total de la prueba
19/02/2013

NDICE DE DISCRIMINACIN DE LA PRUEBA

Datos: Puntaje del grupo superior Puntaje del grupo inferior Puntaje total de la prueba

= 18 = 11 = 20

18 11 Id = ------------- x 100 = 35 % 20
Id = 35 %
19/02/2013

NDICE DE DISCRIMINACIN DE LA PRUEBA

TABLA DE KUDER RICHARDSON


40 % a mas 30 al 39 % 20 al 29% Menos del 19 % = = = = Buen ndice de discriminacin Razonable ndice de discriminacin Regular ndice de discriminacin Deficiente ndice de discriminacin

Id hallado de 35 % = Razonable ndice de discriminacin

19/02/2013

TEMS DE RESPUESTA CERRADA

De pareamiento. De respuesta corta. De oraciones incompletas. De uso de ilativos. Verdadero falso. De alternativa mltiple. De anlisis de relaciones. De informacin suficiente.

19/02/2013

VARIACIONES DE LOS TEMS DE ALTERNATIVA MLTIPLE

De respuesta correcta. De mejor respuesta. De trmino excluido. De plan de redaccin. De eliminacin de oraciones. De utilizacin de grficos. De seleccin mltiple con mltiple respuesta.

19/02/2013

TEMS DE USO DE ILATIVOS

Hay especies de araas que utilizan sus colores .. cazar su alimento ocultarse de sus posibles depredadores. a) b) c) d) e) tanto para no tanto para no slo para en para como para como por sino ms bien para y en junto con

19/02/2013

TEMS DE USO DE ILATIVOS

En una hiptesis, las variables independientes . las posibles causas, . las dependientes son los posibles efectos. a) b) c) d) e) son por y junto a sobre mientras que para tanto que por por tanto

19/02/2013

TEMS DE TRMINO EXCLUIDO

Tregua a) b) c) d) e) receso intermedio parntesis pausa detencin

19/02/2013

TEMS DE TRMINO EXCLUIDO

Evaluacin a) b) c) d) e) medicin valoracin desaprobacin apreciacin estimacin

19/02/2013

GRADO DE DIFICULTAD DE LOS TEMS

Gd = -------- x 100 N

S Rc

Donde: Gd = Grado de dificultad S = Sumatoria Rc = Respuestas correctas N = Nmero de alumnos examinados


19/02/2013

GRADO DE DIFICULTAD DE LOS TEMS

Datos: Sumatoria de respuestas correctas = 10 Numero de alumnos examinados = 40

10 Gd = -------- x 100 = 25 % 40
19/02/2013

GRADO DE DIFICULTAD DE LOS TEMS

TABLA DE KUDER RICHARDSON 85% de respuestas correctas 50 al 84% de respuestas correctas 15 al 49% de respuestas correctas Menos del 15 % de respuestas correctas = = = = Muy fciles Relativamente fciles Relativamente difciles Muy difciles

Grado de dificulta hallado de 25 % = tem relativamente fcil

19/02/2013

NDICE DE DISCRIMINACIN DE LOS TEMS

rcs - rci Id = ------------ x 100 N


Donde: Id = ndice de discriminacin rcs = Respuestas correctas del grupo superior rci = Respuestas correctas del grupo inferior N = Nmero total de alumnos

19/02/2013

NDICE DE DISCRIMINACIN DE LOS TEMS

Datos: Respuestas correctas del grupo superior = 25 Respuestas correctas del grupo inferior = 12 Nmero de alumnos examinados = 50

25 - 12 Id = ------------ x 100 = 26 % 50
19/02/2013

NDICE DE DISCRIMINACIN DE LOS TEMS

TABLA DE KUDER RICHARDSON 40 % a mas 30 al 39 % 20 al 29 % Menos del 19 % = = = = Buen ndice de discriminacin Razonable ndice de discriminacin Regular ndice de discriminacin Deficiente ndice de discriminacin

ndice hallado de 26 % = Regular ndice de discriminacin

19/02/2013