Está en la página 1de 57

TEMA: INSTRUMENTOS DE MEDICION EN EL CAMPO DE

LA EVALUACIÓN
1. TIPOS DE INTRUMENTOS

2. ETAPAS DE CONSTRUCCION

3. VALIDEZ Y CONFIABILIDAD

CATEDRATICO: HORACIO GARCIA ALDAPE M.E


Instrumentos de Medición en el campo de la
Evaluación

1) MEDICIÓN 2) EVALUACIÓN
Medir es averiguar la cantidad de Evaluar es apreciar el valor de una
una cosa, de un fenómeno, de una cosa, de un fenómeno, de una
característica o de un producto. característica o de un producto.
Hay medición cuando se compara Hay evaluación cuando decimos
una cosa cualquiera con otra que que un alumno es deficiente o
se ha elegido como unidad de aprovechado, después de haber
medida. Ejemplo: Determinar en medido el rendimiento de su
metros el largo de un salón, el peso aprendizaje mediante una prueba y
de una persona en kilogramos, el haber comparado el resultado con
nivel de inteligencia de un alumno, un criterio previamente establecido,
los resultados del aprendizaje como la escala del rendimiento del
mediante un test. aprendizaje.
Instrumentos de Evaluación

Cuaderno de La
Clase Observación

Portafolios La Entrevista

Pruebas de Técnicas
Rendimiento Sociométricas

Cuestionarios,
Inventarios,
Test
LA OBSERVACIÓN
Instrumento
PRODUCTO COMPORTAMIENTOS REPRESENTATIVOS

Hablar, escribir, escuchar, lectura oral, realizar


experimentos en el laboratorio, dibujar, tocar un
Habilidades
instrumento musical, bailar, gimnasia, habilidades de
trabajo, habilidades de estudio y habilidades sociales.
Tiene gran aplicabilidad en el proceso de evaluación,
Efectividad en la planeación, uso del tiempo, uso de
ya que proporciona información que permite realizar equipo, uso de recursos; la demostración de rasgos como
juicios de valor apropiados sobre las diferentes facetas Hábitos de trabajo
la iniciativa, la capacidad creadora, la persistencia, la
de la vida en el salón de clase. capacidad para infundir en otros la confianza en él.

Preocupación por el bienestar de otros, respeto a las


leyes, respeto a la propiedad ajena, sensibilidad ante las
Actitudes sociales
cuestiones sociales, preocupación por las instituciones
sociales, deseo de trabajar en pro de la mejoría social

No solo en forma individual, sino el grado de Mente abierta, voluntad de detener todo juicio final,
interacción de un grupo, características sociales, las Actitudes científicas sensibilidad para las relaciones mecánicas, estéticas,
científicas, sociales, recreativas, vocacionales.
relaciones docente - estudiante y estudiante -
estudiante. Para Lafourcade lo esencial en la Sentimientos expresados con respecto a varias
elaboración de instrumentos y la aplicación de Intereses actividades educacionales, mecánicas, estéticas,
científicas, sociales, recreativas, vocacionales.
técnicas adecuadas, que enriquezcan la información
sobre aspectos de la conducta que se escapan a Sensación de satisfacción y goce que se expresa con
otros procesos de medición, estriba en la delimitación Aprecios respecto a la naturaleza, la música, el arte, la literatura, la
de funciones. habilidad física, las contribuciones sociales notables.

Relación con los iguales, reacción ante el halago y la


Ajustes crítica, reacción ante la autoridad, estabilidad emocional,
adaptabilidad social.
Entre los principales instrumentos que el docente puede utilizar
para registrar los datos obtenidos mediante la observación se
encuentran:

• Listas de cotejo.
• Escalas de clasificación o
calificación.
• Entrevista
• Listas de corroboración
• Registros de desempeño.
• Pautas para medir productos.
• Diario de campo.
• Registro anecdótico.
Listas de Cotejo
 LAS ESCALAS DE CALIFICACIÓN:
 Es un conjunto de características o comportamientos por
evaluar, de forma gradual. El docente debe especificar
Son listas de palabras, frases u de antemano su atención en las características
previamente señaladas.
oraciones que expresan conductas
Se pueden usar para evaluar procedimientos, productos
dicotómicas (sí - no, logrado - no 
finales y desarrollo personal.
logrado y otras). Se emplean para  El docente usa la escala para indicar la cualidad,
valorar aspectos específicos. cantidad o nivel de lo observado.

 Una escala de calificación sirve para varias funciones


importantes:

La lista proporciona información en  dirige la observación hacia aspectos específicos y


claramente definidos.
la que se señala si una
suministra un cuadro común de referencia para
característica dada está presente 
comparar a todos los alumnos según el mismo conjunto
o no. Su mayor valor es ser fácil de de características.

construir y aplicar, y objetiva  ofrece una forma conveniente para registrar información.
Tipos de escalas:

CRITERIOS
5 4 3 2 1
INDICADORES

Utiliza correctamente las formulas notables

Consiste en una lista de


números con claves:
ambos permanecen
constantes de un aspecto Trabaja en orden los procedimientos
a otro. Es uno de los tipos
de escala más sencillos. El
docente marca en las
casillas correspondiente el
Escala Numérica: número que indica el
Interpreta adecuadamente los resultados
grado hasta donde se
presenta la característica
o rasgo que se ofrece en
forma de indicador; se
asignan valores
generalmente de 1 a 5, se
utiliza una clave común de
5 excelente a 1 deficiente.

TOTAL

Cuando se utiliza una escala de calificación numérica se


deben indicar los criterios de evaluación, por ejemplo:
5- Excelente 4- Muy Bueno 3-Bueno 2- Regular 1-
Deficiente
Escala Gráfica:
Muy A Rara
CRITERIOS INDICADORES Siempre Nunca
Frecuente Menudo vez
Implica una breve descripción
del aspecto por observar. Se
marca la opción que a criterio
del observador, describe mejor Utiliza correctamente las formulas notables

el aspecto.

Trabaja en orden los procedimientos

Aunque la línea de la escala


gràfica hace que sea posible Interpreta adecuadamente los resultados
calificar en puntos intermedios,
el uso de palabras solas para
identificar la categorías no
tienen gran ventaja sobre el uso
de números.. TOTAL
Escala Descriptiva:
Implica una descripción más amplia que la de la escala gráfica. Se emplea un orden gráfico. Se debe ser conciso, claro y utilizar
términos observables.
A cada enunciando sigue una escala que represente con frases descriptivas los distintos grados del atributo en observación.

Interpreta
CRITERIOS Utiliza correctamente Trabaja en orden los
adecuadamente los
INDICADORES las formulas notables procedimientos
resultados

Nunca participa, es pasivo-callado

Participa tanto como cualquier otro miembro del grupo

Participa más que cualquier otro de los miembros del


grupo

TOTAL
Escala de apreciaciones:

 Es un tipo de escala de calificación en la que


se miden los distintos grados de un aspecto Criterios
5
4 3
2 1
Totalmente En Totalmente en
determinado. Indicadores
de acuerdo
De acuerdo Incierto
desacuerdo desacuerdo

 Para elaborar una escala de apreciaciones se


siguen los siguientes pasos:
• determinar los indicadores
• escribir las instrucciones para su aplicación
• ordenar los valores
• enunciar los indicadores
TOTAL

• indicar la forma de obtener la puntuación total.


ENTREVISTA:
Instrumento

 Es una técnica de observación que por medio de


una conversación formal o informal el docente interactúa
con el estudiante, permitiéndole profundizar en aspectos
relevantes, como opiniones preferencias, actitudes,
intereses y otros La entrevista puede ser estructurada o no.
se recomienda una guía flexible que oriente la
conversación.
 Las informales, es decir conversaciones durante el
recreo o actividades extra clase, son fundamentales, ya que
brindan información importante,.
 La flexibilidad de la técnica, permite obtener datos
imposibles de lograr por medio de otras técnicas, ya que,
independiente de lo que el alumno niegue o afirme, se
puede observar como lo afirma o como lo niega (acento,
gestos, inhibiciones, temores).
LISTAS DE CORROBORACIÓN

 La lista de corroboración es semejante en su forma y función a


la escala de calificaciones. La diferencia básica entre ellas
esta el tipo de juicio que se pide.
 Para elaborar una lista de corroboración para la evaluación
de procedimientos deben tomarse en cuenta los siguientes
aspectos.
 identificar y describir cada uno de los actos específicos que
desea evaluar.
 añadir a la lista aquellos actos que representan errores
comunes que puedan identificarse claramente.
 ordenar los comportamientos que de desean evaluar y los
errores probables en el orden aproximado en que se espera
que ocurran.
 proporcionar un procedimiento sencillo para numerar los
comportamientos en secuencia o para tachar cada
comportamiento según va ocurriendo.
 Además de usarse en la evaluación de procedimientos,
también puede utilizarse la lista de corroboración para evaluar
productos. Para esto debe establecerse una lista de
características que debe poseer el producto determinado.
Para evaluar el producto, el docente verifica si cada una de
las características esta presente o no.
REGISTRO DE DESEMPEÑO:

 Se utiliza en la evaluación formativa con el propósito de apreciar la forma como se ejecuta el aprendizaje
de una destreza o habilidad y así poder realimentar el proceso. Para evaluar como se desarrollan las
actividades y los resultados de ellas, ejemplo: el manejo de un aparato o un equipo. Para elaborar un
registro de desempeño se siguen los siguientes pasos:
• establecer los aspectos importantes por observar
• establecer la secuencia de dichos pasos
• anotar las observaciones pertinentes
• obtener la puntuación total.
 Ejemplo:
 Nombre del estudiante_____________________________________________________
 Lugar donde se realiza la
observación______________________________________________________________
 Tiempo de observación__________________ Fecha ____________________________
 Actividad________________________________________________________________
Pautas para Evaluación de Productos y Diario de Campo

• PAUTAS PARA LA EVALUACIÓN DE • EL DIARIO DE CAMPO:


PRODUCTOS:
 El diario de campo es un instrumento de
 Las acciones educativas persiguen la obtención recopilación de datos, con cierto sentido
de resultados visibles de la actividad individual o íntimo, que implica la descripción detallada
grupal como por ejemplo un informe escrito, un de acontecimientos, y se basa en la
periódico mural, etc., en donde el alumno pueda observación directa de la realidad; por eso
tener una referencia para saber qué no estuvo se denomina "de campo".
bien de su trabajo y qué hacer para mejorarlo.
 Para el docente, el diario de campo es un
Para elaborar una pauta se siguen los siguientes
instrumento de reflexión y análisis del
pasos:
trabajo de aula y la realidad en la cual está
• establecer los aspectos que se deben tomar en inmersa la institución, que permite la
cuenta, descripción y explicación y valoración, de
los niveles de significación de su práctica
• establecer la escala en la cual se apreciará su educativa.
cumplimiento.
REGISTRO ANECDÓTICO.

Las técnicas más habituales son:

Observado.................................................... Fecha................
1.- Los anecdotarios: Sirven para recoger de forma episódica los hechos
Hora................. más sobresalientes que se producen en el desarrollo de una
determinada acción relativa al campo de las aptitudes, de las actitudes,
Observador.................................................. Lugar................ de los intereses, de las reacciones temperamentales, de sociabilidad o de
cualquier otro tópico que nos interese. No debe recoger opiniones ni
Contexto, situación: Durante una clase de educación física
juicios de valor debe exclusivamente describir los hechos o las acciones.
Incidente, anécdota: El observado, tras un intercambio de palabras con
un compañero suyo, le agrede verbalmente, le amenaza, se marcha
violentamente de la clase, anunciando que los amigos de su pandilla
tendrán conocimiento de lo que allí se ha hablado.

Observaciones: Sus compañeros no le dieron demasiada importancia,


siguieron como si no hubiera sucedido nada importante, incluso el
amenazado dijo: no os preocupéis, no hará nada.
Los pasos a seguir serían: seleccionar al campo de observación (clase,
taller; oficina, relaciones informales, bar, hogar...), seleccionar los
observados (todos, sólo algunos), tiempo (un día, una semana, un
mes), elaborar una ficha de registro más o menos estandarizada,
registrar las observaciones, archivarlas. Cada anécdota debe plasmarse
en una ficha
Instrumentos de Medición

3.- Listas de control.


2.- Los diarios y los informes Son listados enumerativos, la mayoría de las veces bastante
largos, de conductas abiertas o ya determinadas con las que
el observador debe estar habituado. En ellas debe anotar si
tal conducta, comportamiento, hábito, costumbre,...
aparece, se manifiesta, o no. Exigen una buena preparación
por parte del observador; grandes dotes de observación y
mucho tiempo, no admite matizaciones. Pueden dirigirse
las observaciones y las anotaciones tanto a grupos como
individualmente.
Constituyen unos instrumentos de Modelo (Identificación (nombre o grupo observado)
recogida de información que pueden (Señale con una X la columna correspondiente) SI NO
ser más o menos sistematizados.
Respecto a su cumplimiento
Pueden oscilar desde una simple Es puntual a la hora de iniciar el trabajo
relación o enumeración de Es puntual a la hora de finalizar el trabajo
Busca excusas para abandonar el trabajo
actividades realizadas o pueden estar Entabla conversaciones innecesarias

ya estructurados y referidos a campos Respecto a sus compañeros


Siempre está dispuesto a ayudar
concretos e incluir valoraciones, Es sincero
Se muestra alegre
pensamientos, reflexiones. Presta sus herramientas o útiles de trabajo
Respecto a sus superiores
Es sumiso
Busca las razones de las órdenes
Es respetuoso
Respecto a
Escalas de valoración
Estas escalas son prácticamente las mismas que las de control, si bien en ellas se pueden incluir
matizaciones respecto al grado de acuerdo o desacuerdo, existencia o no de una determinada
cuestión, comportamiento, etc. Son clásicas las escalas de Likert, Thurstone, Osgood y Guttman.

Muy de En Sencillamente Muy de


Acuerdo Desacuerdo de Acuerdo Acuerdo

Considero que
Escalas de Likert o de mi lugar de
puntuaciones sumadas. trabajo es
Permiten la agradable
cualificación y la
cuantificación, su Pienso que mis
compañeros
presentación puede ser
descriptiva, gráfica o
numérica. La escala en
Modelo son serviciales

Normalmente
su totalidad sería un
listado de ítems,
Descriptivo me encuentro a
gusto en mi
preguntas o gráficos trabajo
referidos a todos los
aspectos
Contemplados en
dicha escala.
Las escalas de Thurstone

 (Lea todas estas afirmaciones y señale aquella


-una- con la que se sienta más
Identificado(a)).
Suponen, para quien las elabore, realizar
una lista de rasgos respecto a un  1.-El trabajo para el hombre es el mayor bien
aspecto, persona o fenómeno, en la que del que puede gozar, una bendición.
el primer ítem encierre una descripción o
calificación excelente y el último una  4.-El trabajo es una fuente de satisfacciones.
descripción o calificación muy negativa
y en medio unos quince o veinte niveles
intermedios ordenados progresivamente.  10.-El trabajo es un medio para poder subsistir.
La lista así elaborada se da para ser
respondida a las personas escogidas por  15.-El trabajo, si no existiera mejor.
la muestra. Su respuesta se limita a
señalar la frase con la que está más de  20.-(Ultima) El trabajo es una maldición, una
acuerdo, una vez leídas todas. Su
construcción es bastante complicada,
verdadera desgracia.
redacción de ítems, graduarlos,
nivelarlos.
Las escalas de Osgood

 Modelo
 Tópico: Mi lugar de trabajo es...
 Agradable 6 5 4 3 2 1 Desagradable
 Diverso 6 5 4 3 2 1 Monótono
 Acogedor 6 5 4 3 2 1 Frío
 Seguro 6 5 4 3 2 1 Peligroso
Al igual que las anteriores sirven para acceder a determinadas informaciones,
que por otros medios serían difícil de alcanzar; sus datos pueden ser  Tópico: Mi superior es...
analizados comparativamente, para establecer procesos de seguimiento o
evolución, etc. Al igual que las escalas de Likert, pueden presentar distintos  Simpático 7 6 5 4 3 2 1 Antipático
grados o niveles en las matizaciones. Normalmente se establecen grados
impares (3, 5 ó 7 posibilidades de respuesta) para mejor ajuste a las curvas de  Justo 7 6 5 4 3 2 1 Injusto
normalidad (Gauss), aunque también pueden establecerse niveles pares (2,4,
6 u 8 opciones de respuesta) si nos interesa detectar Informaciones fácilmente  Locuaz 7 6 5 4 3 2 1 Parco
dicotomizables, del tipo «buenos» «malos», «cumplidores» «no
cumplidores»,«rápidos» «lentos»,  Nervioso 7 6 5 4 3 2 1 Tranquilo
 Cordial 7 6 5 4 3 2 1 Hostil
 Innovador 7 6 5 4 3 2 1 Tradicional
Las escalas de Guttman

 (Señale con X las respuestas correctas, o con las que esté


más de acuerdo, puede responder a más de una. En otros
casos resuelva los problemas que se le plantean).
 1. ¿Cuántos días tiene de vacaciones al año?

son otro tipo de escalas,  Mas de treinta


apropiadas para evaluar  Entre quince y treinta
actitudes, aunque también
 Menos de quince
pueden ajustarse a otros
requerimientos. Son escalas  2. ¿Cuántos días de sus vacaciones pasa fuera de su residencia habitual?

acumulativas, puesto que la  Más de treinta


primera respuesta debe  Entre veinte y treinta
incluir a las restantes. Son
 Entre diez y diecinueve
bastante complicadas de
formular si se quiere respetar  Menos de diez

esa condición en algunos  1. Respecto a sus compañeros de trabajo cree que


casos. Pueden dirigirse a  Todos son buenos
varios campos de estudio o  La mayoría son buenos
ser monográficas.
 Sólo algunos lo son

 2. Respecto a sus superiores

 Todos son muy competentes

 La mayoría lo son

 Solamente algunos
Las escalas de
producción.

Evaluar por escalas de producción  Nivel de producción 1: Realismo, colorido,


supone llevar a cabo comparaciones
de trabajos realizados con modelos o
profundidad, sombreado y detalles.
escalas graduados lo cual posibilita la
localización de un determinado
 Nivel de producción 2: Realismo, detalles, colorido y
trabajo en un nivel determinado que le sombreado.
es adjudicado en función de las
coincidencias o similitudes con un nivel  Nivel de producción 3: Realismo, bastantes detalles,
de esa escala. Por ejemplo, algunos colores no bien logrados y falta de profundidad.
modelos existentes para valorar la
escritura. En algunos casos, existen  Nivel de producción 4: Falta de perfección en las
escalas de producción publicadas e formas, pocos detalles, poca luminosidad y escasa
incluso tipificadas, pero en otros deben
construirse a partir de las propias profundidad.
producciones de los alumnos de
acuerdo con unos criterios.
CUESTIONARIOS, INVENTARIOS Y TEST

 (Cuestionario sobre el ambiente de trabajo, Escriba o


señale con X donde corresponda)
Los cuestionarios son unos instrumentos  1.-Exponga brevemente cómo percibe el ambiente donde
que permiten la recogida rápida y usted trabaja (Pregunta abierta)
abundante de información respecto a los  5.-Retiraría usted los ceníceros de las mesas de trabajo en
temas más variados, tanto tomados de aquellas salas donde trabajaran más de uno:
forma aislada, como conjunta. Los  SI NO (Pregunta cerrada)
cuestionamos pueden ser monotemáticos
o politemáticos según intenten cercar un  10.-Si el ambiente de su trabajo no es del todo bueno ¿a
qué cree que se debe? (Puede señalar más de una):
objeto de estudio desde varias
problemáticas. Son presentaciones  Al mucho trabajo que hay.
escritas en las que el sujeto anota sus  Siempre se va con prisas.
apreciaciones. Se presentan en forma  No hay buenas relaciones con los jefes.
abierta o cerrada; en el primer caso
No hay buenas relaciones con los compañeros.
puede escribirse lo que se quiera, en el 

segundo caso, quien responde al  Existe mucha competitividad interna.


cuestionario debe ceñirse a las respuestas  Otras ¿Cuáles?
que se le ofrecen.
Los Inventarios
Los inventarios son un tipo especial de
cuestionarios; se diferencian en que tienen
una presentación mucho más
estandarizada y reiterativa; algunos de ellos,
con el tratamiento y requisitos necesarios, se
convierten en test de personalidad, test de
intereses actitudinales, aptitudinales y
vocacionales.
Modelo

Se considera una persona cumplidora


SI NO ?
Se considera una persona ambiciosa
SI NO ?
Se considera una persona autoritaria
SI NO ?
Los ítems se prestan a varias formalizaciones
pero las más usuales responden al siguiente
esquema: Ante distintas afirmaciones se
debe contestar en la casilla del SI, del NO o
de una casilla con ?, que significa una
posición dudosa, ambivalente...
Los Test

Los Test son pruebas de evaluación de la más diversa


índole. Existen test de aptitudes mentales: inteligencia,
memoria, atención, etc; de personalidad; de intereses
vocacionales; de instrucción, etc. Todos ellos se
configuran a partir de una serie de preguntas o tareas
las cuales una vez respondidas o realizadas permiten
ser puntuadas y establecer categorías en base a las
diferencias individuales, la mayoría de las veces según
criterios y requisitos estadísticos rigurosos

su función es más diagnóstica que formativa o


sumativa
EL PORTAFOLIOS (Carpeta) y el Cuaderno de Clase

El Portafolios.
El cuaderno de clase
es un instrumento muy extendido en los
centros escolares y resulta de gran
Señala que la evaluación por portafolios, también llamada
evaluación por carpetas, consiste en una colección de trabajos de
utilidad para la evaluación formativa.
los alumnos que busca demostrar, por medio de la mejora No es un a prueba de evaluación en
progresiva, lo que son capaces de hacer en un área o contenido sentido estricto ya que no supone un
específico. trabajo adicional para el alumno, ya
que simplemente recoge el trabajo de
cada día, tanto el de clase como el
Se trata de un conjunto particular de selecciones de actividades y desarrollado en casa. El cuaderno de
trabajos que recoge, entre otras, las mejores producciones de los clase, además de un instrumento
alumnos, personal del alumno, es un medio de
comunicación, cuya eficacia
dependerá del nivel de colaboración
que el profesor promueva en los textos
Este sistema de evaluación no se presenta como una forma escritos de los alumnos
alternativa de valoración de los aprendizajes escolares, sino como
un complemento
LAS TÉCNICAS SOCIOMÉTRICAS

Las técnicas sociométricas tienen como


finalidad el obtener información acerca de la
posición de los individuos dentro de un grupo
así como de las relaciones que entre ellos se
establecen. Son técnicas que permiten
conocer y evaluar situaciones personales o
grupales en temas tales como: participación,
Determinar la situación sociométrica. Debe ser
liderazgo, aceptación, rechazo, etc. distinta para cada caso, aunque se
mantengan ciertas constantes. No es la misma
situación la que se brinda si la pregunta se
refiere a jugar a trabajar; a divertirse, a
estudiar, etc. Suelen distinguirse tres campos:
de la afinidad (por igualdad de intereses), el
de la efectividad (por la seguridad de
El sociograma se aplica a grupos con una alcanzar un objetivo) y el de la afectividad
cierta estabilidad y continuidad. No es útil (ligado a cuestiones afectivas).
cuando se trate de grupos inestables, de
poca duración y de escaso conocimiento
entre ellos
PRUEBAS AUTOMATIZADAS

EVALUACION MOODLE EVALUACION HOT


POTATOES JQUIZ
LAS PRUEBAS DE RENDIMIENTO

Los exámenes
Los exámenes permiten a los alumnos elaborar sus
respuestas de acuerdo con sus conocimientos y estilo
personales. Gracias a ellos se puede comprobar
directamente la calidad y las características de las
respuestas, su profundidad y los procesos mentales
implícitos en ellas. Puede detectarse aspectos tales como.
el dominio terminológico, la fluidez verbal , el nivel léxico,
la sistematización del discurso las estructuras
conceptuales, las fuentes de conocimiento, el manejo de
técnicas, la originalidad y creatividad.
Las ventajas de los exámenes radican en la facilidad de su
elaboración y bajo costo, en permitir una elaboración de
respuestas personales, en la gran cantidad de información
que puede recogerse, y en que permiten preguntar a todos
los alumnos las mismas cuestiones (en el caso de
exámenes escritos)
Exámenes Orales
Los exámenes orales
Pueden presentar un mayor o menor nivel de estructuración
(rigidez de la técnica en sí); piénsese en un examen oral que
consiste en dar contestaciones a un cuestionario cerrado
previamente preparado por el profesor; o en la evaluación de
un debate participativo. Las formas de un examen oral según
Rodríguez Diéguez (l980) son:
a) Desarrollo oral de un tema sacado a suerte o elegido por
el profesor.
b) Tema elegido por el alumno.
Ambas formas pueden permitir su realización con tiempo de
preparación o sin él. Realizarse de forma autónoma y
enteramente personal o con realización de preguntas por
parte del profesor
c) Interrogatorio efectuado por el profesor.
d) Debate entre alumnos, tanto individuales como grupales.
e) Entrevistas con diferentes grados de estructuración.
f) Ponencias o presentación de trabajos preparados
previamente.
Etapas de Construcción de un instrumento de medición

 ETAPAS DE CONSTRUCCION DE UN INSTRUMENTO DE MEDIDA

 1. Marco general del instrumento de medida


 - Justificación y motivación
 - Contexto de aplicación
 - Uso e interpretación de las puntuaciones

 2. Definición operativa de la variable medida


 - Definición operativa
 - Definición sintáctica y semántica
Etapas de Construcción de un instrumento de
medición
3. Especificaciones del instrumento de medida
 - Requerimientos de administración
 - Tipo, número, longitud, formato, contenido y distribución de los ítems
 - Especificaciones e instrucciones en la entrega del material
 - Aspectos de seguridad

4. Construcción de los ítems


 - Directrices para la construcción de ítems de elección múltiple
 - Principios generales para la construcción de ítems

5. Producción, base de datos, normas de puntuación y corrección


 - Composición
 - Edición
 - Puntuación y corrección
Etapas de Construcción de un instrumento
de medición

6. Estudio piloto cualitativo y cuantitativo


 - Selección de la muestra piloto (cualitativo y cuantitativo)
 - Análisis y resultados del estudio piloto (cualitativo y cuantitativo)
 - Depuración, revisión, modificación o construcción de ítems
 - Producción de una nueva versión del instrumento de medida

7. Selección de otros instrumentos de medida convergentes


 - Obtener información convergente
 - Utilizar pruebas ya validadas
Etapas de Construcción
8. Estudio de campo
 - Selección y tamaño de la muestra y tipo de muestreo
 - Administración del instrumento de medida
 - Control de calidad y seguridad de la base de datos

9. Estimación de las propiedades métricas


 - Análisis de ítems (cualitativo y cuantitativo)
 - Dimensionalidad
 - Estimación de la fiabilidad
 - Obtención de evidencias de validez
 - Tipificación

10.Versión definitiva, informe final y manual del instrumento de medida


 - Prueba fina propuesta
 - Manual
Para elaborar un instrumento de medición válido y confiable es
recomendable seguir los siguientes pasos:

 1. Determinar cuál es la variable que se desea medir.


 2. Definir la variable.
 3. Determinar indicadores válidos de la variable
 4. Seleccionar una muestra de esos indicadores.
 5. Estructurar el Instrumento
 6. Determinar la validez y confiabilidad del instrumento.
Validez
Es el grado en que un instrumento realmente mide la variable que
desea medir.

¿Qué tipo de
¿Qué es lo
variable es:
que quiero
cualitativa o
medir?
cuantitativa?

¿Cuál es la variable
que quiero analizar,
estudiar o
descomponer?

Una variable en cuestión, nunca se debe observar con subjetivismo, ni caer en


aproximaciones, ya que es muy común que el investigador , no profundiza sobre la
complejidad que desea medir y al no conocer la variable que se desea medir, puede
caer en instrumentos de medición no validos.
Validez de contenido

Evidencias de Validez Validez de criterio

Validez de constructo
Validez de contenido
•Se da cuando el instrumento de medición contiene
representados en sí, todos los ítems del dominio y no solo
los elementos del contenido.

•Por ejemplo: una prueba de conocimientos sobre las


canciones de “Los Beatles” no deberá basarse solamente
en sus álbumes Let it Be”y “Abbey Road”, sino que debe
incluir canciones de todos sus discos.
• El instrumento debe contener todos los aspectos o ítems del dominio de la
variable que se esta midiendo, y se construye de acuerdo con la teoría.
• Su finalidad es garantizar que el test constituye una muestra adecuada y
representativa del contenido que éste pretende evaluar.
Ejemplo de baja validez de contenido
Veamos un ejemplo sobre empleo, donde generalmente se utiliza la validez de
contenido.
Una escuela quiere contratar a un nuevo profesor de ciencias y un panel de directores
comienza a analizar a los distintos candidatos. Elaboran una lista acotada y luego
diseñan una prueba, donde escogen al candidato con la mejor puntuación.
Lamentablemente, éste demuestra ser un maestro de ciencias extremadamente
mediocre.
Después de ver la prueba, la junta de educación comienza a ver en qué se equivocó.
La gran mayoría de las preguntas fueron sobre física entonces, obviamente, la escuela
encontró al mejor profesor de física.
Sin embargo, estaban buscando que el profesor de ciencias enseñara biología,
química y psicología. La validez de contenido de la prueba fue pobre y no representó
plenamente el constructo de "ser un buen profesor de ciencias".
Avergonzada, la escuela rediseñó la prueba y la sometió a un panel de expertos en
educación. Después de pedirles a los candidatos que completaran el nuevo examen,
la escuela encontró a otra persona que demostró ser una profesora de ciencias
excelente y completa. Esta prueba tuvo una validez racional mucho más elevada y
representó totalmente cada elemento del constructo.
Validez de criterio
•Es una comparación entre nuestra situación de medida y un
estándar al que se le llama criterio.

•Es disponer de otra situación de la que conozco su validez. Pero se


requiere de consenso entre la comunidad científica, se trabaja en
relación al criterio.
Por ejemplo, probar la inteligencia de un
validez de criterio concurrente: grupo de estudiantes por medio de un test de
inteligencia y un par de días más tarde realizar
una nueva prueba de inteligencia sería
perfectamente aceptable.

Si la prueba se lleva a cabo una cantidad de


validez de criterio predictiva: tiempo considerable después de la prueba inicial,
entonces se considera validez predictiva.
Validez de Constructo
Un constructo se refiere a una "construcción psicológica teórica".

La validez de constructo se refiere a si una escala o prueba mide el


constructo correctamente. Un ejemplo es la medición del cerebro humano,
como la inteligencia, el nivel de emoción, la competencia o la habilidad.

Algunos ejemplos específicos podrían ser el dominio de la lengua, la


capacidad artística o el nivel de agresión mostrado. Estos conceptos son
abstractos y teóricos, pero se han observado en la práctica.

Un ejemplo podría ser un médico que realiza pruebas sobre la eficacia de


los analgésicos en los enfermos crónicos de espalda.
Validez de Constructo
La validez de constructo incluye tres etapas:

1.- Se establece y especifica la relación teórica entre los conceptos.


2.- Se correlacionan ambos conceptos y se analiza cuidadosamente la
correlación.
3.-Se interpreta la evidencia empírica de acuerdo a qué tanto clarifica la
validez de constructo de una medición en particular.
VALIDEZ DE VALIDEZ DE VALIDEZ DE
VALIDEZ TOTAL DE VALIDEZ CONTENIDO CRITERIO CONSTRUCTO

Entre mayor evidencia de validez de contenido, validez de criterio y validez de


constructo tenga un instrumento de medición; éste se acerca más a representar la
variable o variables que pretende medir.

Un instrumento puede ser fiable pero no valido, puede medir consistentemente un aspecto , más
no medir lo que pretende medir.
Confiabilidad
•Es la precisión o exactitud de un instrumento de evaluación. El
análisis de la confiabilidad busca que los resultados de un
cuestionario concuerden con los resultados del cuestionario en otra
ocasión. Métodos para determinarla:
Medida de estabilidad

Consistencia interna

Método de formas alternativas o paralelas

Con el mismo observador

Diferentes observadores
Medida de estabilidad
test - retest

Un mismo instrumento de medición se aplica dos o mas


veces a un mismo numero de personas.

Si la correlación entre resultados es altamente positiva, el


instrumento se considera confiable.
Medida de consistencia interna
Alfa de Crombach

Sirve para comprobar si el instrumento que se está evaluando


recopila información defectuosa o si se trata de un
instrumento fiable que hace mediciones estables y
consistentes.

Se trata de un índice de consistencia interna que toma


valores entre 0 y 1
Interpretación

Alfa de Cronbach:

0.53 a menos Confiabilidad nula


0.54 a 0.59 Confiabilidad baja
0.60 a 0.65 Confiable
0.66 a 0.71 Muy confiable
0.72 a 0.79 Excelente confiabilidad
1.0 Confiabilidad perfecta

Los ítems cuyos coeficientes de correlación son menores a 0,35 deben ser o recodificados
reformulados o desechados (Cohen –Manion, 1990).
Método de formas alternativas o paralelas. En este procedimiento no se administra el
mismo instrumento de medición, sino dos o más versiones equivalentes de éste. Las versiones son
similares en contenido, instrucciones, duración y otras características. El instrumento es
confiable si la correlación entre los resultados de ambas administraciones es significativamente

positiva. Los patrones de respuesta varían poco entre las aplicaciones.


Con el mismo observador:
hay consistencia en el mismo observador .

Diferentes observadores:
hay acuerdo entre diferentes observadores, se realiza con el coeficiente Kappa.
FACTORES QUE PUEDEN AFECTAR LA
CONFIABILIDAD Y LA VALIDEZ

• La improvisación
• El no estar validados en el contexto donde se aplican.
• El instrumento es inadecuado o no es empático.
• El cuarto factor lo constituyen las condiciones en que se aplica el
instrumento.
• El quinto factor se refiere a los aspectos mecánicos.
CONCLUSIONES
Un instrumento de medición si no es confiable ni valido, no consigue los
objetivos de evaluación .

Si un instrumento de medición es confiable, pero no valido.


Podemos medir con precisión, pero si medimos el objeto incorrecto, la
información obtenida no será válida para describir o explicar la población.

Un instrumento es valido cuando mide lo que en realidad trata de medir. Y


es confiable al esperar en forma razonable que los resultados de dicha
medición sean sistemáticamente precisos.

También podría gustarte