P. 1
2 Desarrollo de Pruebas

2 Desarrollo de Pruebas

|Views: 19|Likes:
Publicado porOrlando Javier

More info:

Published by: Orlando Javier on Apr 22, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

02/20/2014

pdf

text

original

DESARROLLO DE PRUEBAS

No todas las pruebas son creadas de la misma forma. La creación de una buena prueba no es una cuestión accidental, sino el producto de la aplicación a conciencia y sólida de los principios establecidos para su elaboración. No todas las pruebas se crean igual. La creación de una prueba no es una cuestión fortuita, es el producto de una aplicación mediata y sólida de principios establecidos de elaboración de pruebas. El proceso de elaboración de una prueba ocurre en cinco etapas: CONCEPTUALIZACIÓN DE LA PRUEBA CONSTRUCCIÓN DE LA PRUEBA ENSAYO DE LA PRUEBA ANÁLISIS DE LOS REACTIVOS REVISIÓN DE LA PRUEBA Conceptualización de la prueba: Elaboración del proyecto de investigación (incluye selección de la teoría, definición de constructos) Estudio piloto con entrevistas no estructuradas. La intención es conocer cómo medir mejor el constructo que se tiene como objetivo. Construcción de la prueba. Determinación de la escala (likert, escalograma de Guttman, diferencial semántico) Elaboración de la tabla de especificaciones. Elaboración de ítems. Validez de contenido. Estandarización (procedimiento para uniformizar los criterios de aplicación, calificación e interpretación) Ensayo de la prueba. Aplicación a grupo piloto para determinar si los ítems son comprendidos. Aplicación a la muestra. . Análisis de reactivos. Determinación de la validez. Determinación de la confiabilidad. Normas de baremos. Para medidas de ejecución máxima: Índice de dificultad. Análisis de distractores. Revisión de la prueba. Selección de los mejores ítems. Revisión (ajuste) de la prueba y tabla de especificaciones. Validación cruzada (realizar nuevamente procedimiento de validez con una nueva muestra de la misma población) Interpretación.

Una vez que se concibe la idea para una prueba (conceptualización), se hace un borrador de los reactivos que contendrá (construcción). Luego, este primer borrador se ensaya en un grupo muestra de personas que la vayan a responder (ensayo). Una vez que se tiene los datos del ensayo se analiza el desempeño de quienes la respondieron en su totalidad y cada uno de los reactivos. Se emplearan procedimientos estadísticos, a los que nos referiremos en forma colectiva como análisis de reactivos, para ayudar a hacer juicios respecto a cuáles son convenientes tal como están, cuáles necesitan ser revisados y cuáles deben descartarse. El análisis de los reactivos de la prueba puede incluir un

estudio acerca de su confiabilidad y validez y dependiendo del tipo de prueba que sea, su nivel de dificultad. Con base en el análisis de los reactivos y en consideraciones relacionadas, se hará una revisión o segundo borrador de la prueba, esta versión revisada será ensayada en una nueva muestra de evaluados; se analizaran los resultados, si es necesario se revisara de nuevo la prueba y así se continua.

CONCEPTUALIZACION DE UNA PRUEBA: El surgimiento de algún fenómeno social o patrón de comportamiento podría servir como estímulo para el desarrollo de una nueva prueba, así como en respuesta a una necesidad de evaluar el dominio de una ocupación o profesión recién creada (ejemplo: la ingeniería ambiental, las comunicaciones inalámbricas y las redes computacionales). Sin importar cuál sea el estímulo para la elaboración de una nueva prueba, el futuro constructor de pruebas enfrenta de inmediato diversas interrogantes:          ¿Qué es lo que va a medir la prueba según su diseño? ¿Cuál es el objetivo de la prueba? ¿Existe la necesidad para esta prueba? ¿Quién usará esta prueba? ¿educadores? ¿otros? ¿para qué propósito será usada? ¿Quién tomara esta prueba? ¿Para quién es? ¿para qué rango de edades será aplicable? ¿En qué medida este contenido es específico para una cultura? ¿Cómo se aplicara la prueba? ¿Qué diferencias existen en su aplicación grupal e individual? ¿Estará diseñada para aplicarse por medio de computadoras? ¿Cuál será el formato ideal de la prueba? ¿Deberá ser en forma de verdadero o falso, ensayo, opción múltiple o alguna otra? ¿Quién se beneficia con la aplicación de la prueba? ¿Cómo se asignara significado a las puntuaciones de esta prueba?

Son necesarios diferentes enfoques para la elaboración de la prueba y para los análisis de los reactivos individuales dependiendo de si la prueba terminada esta diseñada con referencia a una norma o a un criterio. PRUBAS REFERIDAS A LA NORMA: En estas pruebas los sujetos que resolvieron la prueba determinan las normas para establecer el significado de la puntuación de un individuo. Considere la norma como el nivel distintivo en el desempeño de un grupo específico. Al comparar la puntuación en bruto de un individuo (el número real de

respuestas correctas) con la norma, determinaremos si la puntuación está arriba, por debajo o alrededor del promedio de ese grupo. Existen por lo menos tres tipos de grupos normativos (grupos de comparación) en la educación: El grupo o la escuela misma, el distrito escolar y las muestras nacionales. Las pruebas referidas a la norma cubren una amplia gama de objetivos generales, en vez de evaluar un número limitado de objetivos específicos. Son especialmente útiles para medir el aprovechamiento general del estudiante. Estas pruebas son adecuadas también cuando tan solo los mejores candidatos serán admitidos en un programa. Limitaciones: Los resultados de tales pruebas no indican si los alumnos están listos para pasar a un material más avanzado. Ejemplo: el hecho de saber que un estudiante está ubicado dentro del 3 por ciento superior de la clase en una prueba de conceptos de algebra, no le indica que este preparado para estudiar matemáticas avanzadas; es probable que todos los miembros de la clase tengan una comprensión limitada de los conceptos de algebra. Estas pruebas tampoco se recomiendan para medir valore afectivos o psicomotores. LAS PRUEBAS Y EVALUACIONES CON BASE EN UN CRITERIO : pruebas cuyas puntuaciones se comparan con parámetros de desempeño establecido. Se emplean por lo común en el contexto de la autorización de una licencia ya sea para practicar la medicina o para conducir un automóvil. Los enfoques con referencia a un criterio también se emplean en contextos educativos en los que se debe demostrar el dominio del material particular antes de que el estudiante pase a un material avanzado o estructurado, desde un punto de vista conceptual, en base a conocimientos o habilidades existentes o ambos.

Las pruebas referidas a un criterio miden el dominio de objetivos muy específicos. Los resultados de una prueba referida a un criterio deberían indicarle al profesor exactamente lo que los estudiantes son capaces y no son capaces de hacer. Problemas para la elaboración de reactivos de pruebas referidas a normas contra pruebas con base en un criterio Generalmente en estas pruebas, la persona que tiene puntuaciones altas, tiene correcto un reactivo en particular, y quienes sacan bajos puntajes, suelen fallar en el mismo reactivo. De manera ideal, cada reactivo orienta a la prueba con un solo fin, pueden existir excepciones a la regla.

ESTUDIO PILOTO: Se refiere en general a la investigación preliminar en torno a la creación de un prototipo de prueba. Los reactivos de esta pueden ser estudiados en el piloto para valorar si deben ser incluidos en la forma final del procedimiento. En el estudio piloto, generalmente, quien elabora la prueba intenta determinar cómo medir mejor el constructo que tiene como objetivo. El proceso puede implicar la creación, revisión y eliminación de muchos reactivos de la prueba; al igual que reseñas literarias y experimentación, entre otros. Una vez completado el estudio piloto, comienza el proceso de elaboración de la prueba.  Estudio piloto (entrevistas abiertas para captar información, estudios fisiológicos en las personas). Al realizar el estudio piloto, el proceso implica la creación, revisión, y eliminación de reactivos, todo por el bien del estudio para mejorar el constructo que se tiene como objetivo. Al finalizar esto, se da paso a la elaboración de la prueba Investigación piloto (estudio de reactivos de prueba) Trabajo piloto Estos son los pasos preliminares para la creación de un prototipo de la prueba Construcción de prueba “Elaboración de escalas” Generalmente son con una asignación numérica, y se define como el proceso de definición para establecer las reglas de los estudios. Thurstone es un expositor que acredita la vanguardia de insturmentar métodos de elaboación de escalas que sean solidas en el sentido metodológico. Kenneth Merrell “El mejor consejo para lo futuros elaboradores, es poner todo tu esfuerzo y recursos para hacer bien el trabajo”. Sí haces bien la etapa planeación y elaboración, será mucho más efectivo y seguro el resultado, propiedades psicométricas mas solidas para su prueba. Tipos de escalas: se clasifican por tipologías, son diversas (unas pueden medir peso, kilos, etc) Método para elaborar escalas: Generalmente el que tengas más o menos puntos, va a tener más o menos características depende lo indique el método y el tipo de escala. Los tipos de métodos pueden ser:     Verdadero y Falso Del 1 al 10 Excelente / Insatisfactoria Caras (feliz, normal, triste)

 

La escala de estimación se puede usar para registrar juicios, ya sean de uno mismo, de otros, de experiencias o de objetos, y adoptar varias formas. Existe una escala de estimación sumatoria de Likert, generalmente se usa para medir actitudes. Cada reactivo se evalúa con 5 respuestas alternativas El uso de escalas de estimación de todo tipo, da como resultado, datos a nivel ordinal. Algunas escalas son unidimensionales (una respuesta subyace en las estimaciones), otras son multidimensionales (más de una respuesta subyace en las estimaciones). *Otro método que elabora escalas que produce datos ordinales, es el método de comparaciones apareadas. ( se presentan pares de estímulos como fotos, 2 objetos, 2 afirmaciones, y se les piden que las compare, luego deben seleccionar un estimulo más atractivo que el otro.

*Otro sistema es la elaboración de escalas categóricas. Los estímulos se colocan en una de dos o más categorías alternativas que difieren en forma cualitativa con respecto algún continuo. *Una escala Guttman, otro método de elaboración de escalas que produce medidas en el nivel ordinal. Los reactivos varían en forma secuencial de expresiones más débiles a otras más fuerte de actitud, creencia o sentimiento. Thurstone aplica criterios para crear una escala.      Se recopilan cantidades razonablemente grandes para determinar algo como positivo y negativo Los expertos dictaminan cada afirmación que realiza la persona evaluada, se les pide que sean objetivos en las evaluaciones y que no consideren sus propias opiniones. Se calcula una media y una desviación estándar. Se juntan todos los datos, y se sacan promedios para estandarizar Los reactivos se seleccionan para su inclusión en la escala final, se dbeen reflejar com una amplia gama de actitudes para determinar algo. La escala al contar con estos puntos, esta lista para ser aplicada.

ELABORACION DE ESCALAS: Anteriormente se definió medición de escalas “como la asignación de números (valores) de acuerdo con reglas. La elaboración de escalas puede ser explicada como el proceso para establecer reglas y con ellos lograr la asignación numérica en la medición realizada con base en el constructo, o también proceso por el cual se diseña y calibra una dispositivo de medición, y la forma en que se asignan números (u otros índices), valores

de escala, a diferentes cantidades del rasgo, atributo o característica que se este midiendo.

TIPOS DE ESCALA: En psicometría la escala se usa para medir un rasgo, una característica o un atributo psicológico. Cuando pensamos en tipos de escalas, pensamos en las distintas maneras en que las escalas pueden ser clasificadas.

Ejemplos: Escala de clasificación del reactivo A ¿Cómo te sentiste con lo que viste en la televisión?

Las caritas sonrientes como se ilustra en el reactivo A se han usado en la investigación sociopsicologica con niños y adultos con alguna discapacidad en torno al lenguaje. Las caritas se usan en vez de palabras como triste, feliz y neutral.

Escala de clasificación del reactivo B Creo que me gustaría trabajar como guardabosques Verdadero Falso (encierre en un círculo su respuesta).

Escala de clasificación del reactivo C

Por favor, clasifique al empleado según su disposición para cooperar y relacionarse con sus compañeros de trabajo: Excelente ____ / ______ / _____ / _____ / _____ / _____ / _____ Insatisfactorio

Quienes elaboran pruebas diseñan el método de medición que creen se adapta mejor a la conceptualización de la medición del rasgo (o lo que sea) que se desee medir.

METODOS PARA ELABORAR ESCALAS: Escala de estimación: La cual puede definirse como el agrupamiento de palabras, afirmaciones o símbolos a través de los cuales el evaluado indica la intensidad de sus juicios relativos a un rasgo, actitud o emoción particular. Las escalas de estimación pueden ser usadas para registrar juicios personales o de otros individuos, experiencias objetos y pueden adoptar formas diversas. Ejemplo: Haría trampa en el pago del impuesto si tuviera oportunidad:

1 Nunca Se justifica

2

3

4

5

6

7

8

9

10 Siempre se justifica

Escala de Likert: Es un tipo de escala de estimación sumatoria, se usa en forma extensa dentro de la psicología, por lo general para escalas de actitud. Cada reactivo ofrece cinco alternativas de respuesta (a veces siete), usualmente en algún tipo de sucesión entre acuerdo y desacuerdo o aprobación y desaprobación. Haría trampa en el pago de impuestos si tuviera la oportunidad (marque una opción) __________
Nunca se justifica

__________
rara vez se justifica

________
a veces se justifica

__________
usualmente se justifica

_________
siempre se justifica

Escala Ordinal (método de comparación por pares): A los examinados se les presentan pares de estímulos (dos fotografías, dos objetos, dos afirmaciones) y se les pide que los comparen. Luego deben seleccionar uno de ellos de acuerdo con una regla; por ejemplo, la regla de que están más de acuerdo con una afirmación que con la otra o la regla de que encuentran un estímulo más atractivo que el otro. Seleccione el comportamiento que considere más justificado: a) Hacer trampa en la declaración de impuestos si tiene la oportunidad. b) Aceptar un soborno durante el cumplimiento de nuestros deberes. Por cada para de opciones los evaluados recibirían una mayor puntuación si seleccionaran la opción considerada más justificable por la mayoría de un grupo de jueces.

Otra escala ordinal es la Escala Guttman: Los reactivos en ella varían en forma secuencial, de las expresiones más débiles a las más fuertes, todas ellas basadas en la actitud o sentimiento que se mide. Esta de acuerdo o en desacuerdo con cada una de las siguientes:
a) Todas las personas deberían tener derecho a decidir si desean terminar con su vida.

b) Las personas con enfermedades terminales y que sufren de dolor deberían tener la opción de que un médico les ayude a terminar con su vida. c) Las personas deberían tener la opción de rechazar el uso de equipo para mantener la vida en forma artificial antes de enfermarse más gravemente. d) Las personas tienen derecho a una vida confortable.

REDACCION DE REACTIVOS:

Aquí se tiene que ver el rango que cubren los reactivos, cuales deben emplearse para dicha evaluación y cuantos reactivos deben utilizarse (cantidad). Un muestre general proporciona una base para la validez de contenido de la versión final de la prueba. La elaboración de reactivos, puede basarse en experiencias personales, o conocimiento académico de la materia, también se busca ayuda en otros incluyendo a expertos.

En el proyecto completo de la construcción de una prueba, las consideraciones relacionadas con la redacción final de los reactivos de la prueba van de la mano con las consideraciones de la elaboración de escalas. Tres preguntas a las que se enfrenta el redactor de pruebas o de reactivos son:   

¿Qué rango de contenidos deben cubrir los reactivos? ¿Cuál de los muchos tipos diferentes de formatos de reactivos deben emplearse? ¿Cuántos reactivos deben redactarse?

La meta principal de la planificación de la prueba es la preparación de un bosquejo detallado, como una tabla de especificaciones que sirva como guía al elaborar los reactivos con los que se van a evaluar o predecir ciertos objetivos. Todos los reactivos representan procedimientos para obtener información acerca de los individuos, pero la cantidad y los tipos de información varían con la naturaleza de las tareas planteadas por diferentes tipos de reactivos. Preguntas cerradas Preguntas precisas, que no den chance a extenderse, para ello hay que generar buenos reactivos, es por eso la importancia de los estudios pilotos. Pueden darse reactivos en forma dual, falsos o verdaderos, etc. Preguntas abiertas Son abiertas, se les pueden dar 3 reactivos para que responda, con todo tipo de opción. La desviación estándar generalmente se encuentra una medida útil. Comparar y redactar Comparar y contrastar las respuestas Calificación de reactivos La lógica de esta prueba es ser acumulativa donde mayor puntuación indica que tiene mas rasgos o capacidad en lo que se le pregunta. Generalmente se clasifica a la persona luego de ser evaluada. Ensayo de la prueba Ya creado el borrador, se debe ensayar con personas que pongan a prueba esta evaluación, que sirvan de crítica y de referente para saber cómo se aborda. Es importante con quien y con cuantos se toma esta prueba. No deben ser menos de 5 sujetos, en su preferencia 10, donde los reactivos les pongan a prueba. Se debe ejercer el ensayo, lo más cercano a lo que se pretende utilizar el día de mañana. Análisis de reactivos Se deben seleccionar los reactivos más efectivos, implementar un índice de dificultad de cada reactivo, un índice de validez, índice de confiabilidad, e índice de discriminación. Aquí se evalúa como lograr las metas a corto plazo.

RESERVA DE REACTIVOS: Es el deposito o provisión de donde se seleccionaran o descartaran los reactivos para la versión final a utilizar. REACTIVOS DE ENSAYO La ventaja principal de los reactivos de ensayo es que pueden medir la habilidad personal para organizar, relacionar y comunicar, conductas que no son fáciles de evaluar con los reactivos objetivos. Las pruebas de ensayo tienen las ventajas de que requieren menos tiempo para su elaboración y reducen la probabilidad de que los examinados respondan en forma correcta a los reactivos por simple adivinación.

FORMATO DE REACTIVOS: son las variables tales como la forma, plan, estructura, arreglo y disposición de los reactivos de pruebas individuales. 

Formato de selección de respuesta: requieren que quienes respondan la prueba elijan una respuesta entre una serie de alternativas.

Reactivo de Relación: se le presentan dos columnas de respuestas al examinado, premisas a la izquierda y respuestas a la derecha. La tarea de quien presenta el examen es determinar cuál respuesta se asocia mejor con cual premisa.

Reactivo de completar: también puede llamarse de respuesta breve, requiere que el examinado proporcione una palabra o frase que complete una oración.

Reactivo de Ensayo: el examinado responde escribiendo una composición, por lo general una que demuestre que hay rememoración de hechos, entendimiento, análisis o interpretación.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->