Está en la página 1de 16

1 DE AGOSTO DE 2023

Fundamentos psicométricos
UNIDADES: 1, 2, 3, 4, 5 y 6

MATEO VALENTÍN MeNDEZ


Universidad católica de Santiago del estero
UNIDAD 1
Prueba Psicológica: Es un procedimiento estandarizado, el cual sirve para obtener una
muestra de la conducta y describirla en categorías o puntuaciones. La mayoría de las pruebas
incluyen normas (reglas) que permiten utilizar los resultados para predecir, además, otras
conductas. Las pruebas cognoscitivas y de personalidad son algunos ejemplos de los tests
psicológicos.

Principales características:
- Procedimientos estandarizados: Los procedimientos para la aplicación del test son
uniformes de un examinador a otro, u de una situación a otra.
- Consideran una muestra de la conducta: Es de interés, sólo si permite que el examinador
haga referencias acerca del dominio total de conductas relevantes.
- Permiten obtener puntuaciones o derivar categorías: Se resume el desempeño en número
o clasificaciones.
- Contemplas normas o estándares: Permiten que el examinador determine el grado en que
se desvía una puntuación respecto a las expectativas.
- Predicen conductas no evaluadas: Permiten que el examinador determine conductas
adicionales, diferentes a las que se muestran directamente en una prueba.

Tipos de tests:
- Tests de ejecución: Demandan a los examinados que respondan de la forma más eficiente
que puedan frente a tareas problemáticas.
→ Miden la inteligencia, las aptitudes y las habilidades.
- Tests de comportamiento: Ninguna respuesta se puntúa como correcta o incorrecta. Se
evalúa el comportamiento habitual de los examinados, recurriendo a distintas afirmaciones
ante las cuales el examinado debe indicar su nivel de acuerdo o desacuerdo.
→ Miden la motivación, las actitudes y la personalidad.

Áreas en donde pueden ser aplicadas las pruebas psicológicas:


- Área clínica.
- Área educacional.
- Área deportiva.
- Área laboral.
- Área de investigación.

¿Qué es fundamento de medición psicológica?: La medición en Psicología constituye una


herramienta que le permite al psicólogo cuantificar características humanas y objetivizar
procesos de evaluación.

1
Los principios básicos de las pruebas psicológicas:
- Objetividad: Asegura que la interpretación sea imparcial.
- Validez: Mide si la prueba evalúa lo que pretende medir.
- Confiabilidad: Se refiere a la consistencia de los resultados.
- Estandarización: Se refiere a la aplicación uniforme de la prueba en una muestra
representativa de la población.

Normas y estadísticas para evaluar pruebas psicológicas:


1. Normas de aplicación: Seguir las instrucciones y condiciones establecidas por el
creador o editor del instrumento, lo cual incluye: Tiempo de administración, ambiente
adecuado e instrucciones precisas para los participantes.
2. Puntuaciones estándar: Utiliza puntuaciones estándar para interpretar los resultados.
Esto implica convertir las puntuaciones brutas en puntuaciones que se puedan
comparar con una muestra representativa de la población.
3. Descriptivos estadísticos: Emplea estadísticas descriptivas, como la media, la mediana y
la desviación estándar, para resumir y comprender la distribución de los resultados de
la prueba.
4. Validez y confiabilidad: Evalúa la validez y confiabilidad de la prueba para asegurarte de
que mide lo que pretende medir y produce resultados consistentes.
5. Análisis comparativos: Realiza análisis comparativos para establecer diferencias
significativas entre grupos o para evaluar cambios en un individuo a lo largo del
tiempo.
6. Interpretación clínica: Considera el contexto clínico y los factores individuales al
interpretar los resultados de la prueba. No basar decisiones importantes únicamente
en los resultados de una sola prueba.
7. Consideraciones culturales: Asegúrate de que la prueba sea culturalmente adecuada y
no sesgada en su aplicación y resultados.
8. Confidencialidad: Resguarda la confidencialidad y privacidad de los participantes
durante el proceso de evaluación.
La interpretación adecuada de los resultados requiere capacitación y experiencia en la
utilización de dichas pruebas. Siempre es recomendable contar con la supervisión de un
profesional.

¿Qué es una escala?: Se utilizan para medir y cuantificar características o comportamientos


específicos de los individuos.

Diferentes tipos de escalas:


- Escala de depresión.
- Escala de ansiedad.
- Escala de inteligencia.
- Escala de personalidad.

2
- Escala de estrés.
- Escala de autoestima.
- Escala de afrontamiento.
- Escala de agresión.
- Escala de empatía.
- Escala de calidad de vida.

Distribución de frecuencias: Es una herramienta estadística que se utiliza comúnmente en


pruebas psicológicas para organizar y resumir los resultados obtenidos de los participantes.
Esta distribución muestra la frecuencia con la que ocurre cada valor o categoría en un
conjunto de datos.
Esta distribución es útil para identificar patrones, tendencias y características clave del
grupo evaluado. Además, puede ayudar a calcular estadísticas descriptivas como la media, la
mediana y la desviación estándar, que proporcionan información adicional sobre la
distribución de los puntajes y la variabilidad de los resultados.

¿Qué es el rango?: Es una medida estadística que proporciona información sobre la


extensión o amplitud de los datos. Es la diferencia entre el valor más alto y el valor más bajo
en un conjunto de puntuaciones o datos. En otras palabras, es el intervalo entre el valor
máximo y el valor mínimo.
El cálculo del rango es bastante sencillo. Primero, ordenas las puntuaciones de menor a
mayor y luego restas el valor más bajo del valor más alto; el resultado es el rango.
El rango puede ser útil para tener una idea general de la variabilidad de los datos en una
muestra, pero a menudo se considera una medida limitada, ya que solo toma en cuenta dos
valores extremos.

¿Qué son los percentiles en pruebas psicológicas?: Son una medida estadística que se
utiliza para interpretar los resultados de un individuo en comparación con una muestra
normativa o de referencia. Los percentiles indican la posición relativa de un valor o
puntuación con respecto al resto de los datos en una distribución.
Cuando se obtiene un resultado en una prueba psicológica, se puede calcular el percentil
correspondiente para determinar qué porcentaje de personas en la muestra de referencia
obtuvo un resultado igual o inferior al del individuo evaluado. Por ejemplo, si un individuo
obtiene un percentil 75 en una prueba, esto significa que su puntuación es igual o mayor que
el 75% de las personas en la muestra normativa.
Los percentiles son útiles porque proporcionan información sobre el rendimiento relativo
del individuo en comparación con otros en la muestra normativa.
Es importante tener en cuenta que los percentiles no representan un puntaje absoluto, sino
que dependen de la muestra de referencia utilizada.

3
Correlación entre variables en pruebas psicológicas: Es una medida estadística que busca
establecer la relación o asociación entre dos o más variables. Es común utilizar la correlación
para analizar la relación entre diferentes constructos o características que se miden en una
muestra de individuos.
El coeficiente de correlación más utilizado es el coeficiente de correlación de Pearson, que
mide la relación lineal entre dos variables cuantitativas; varía de -1 a 1.
En pruebas psicológicas, la correlación puede ayudar a comprender cómo diferentes
constructos o características se relacionan entre sí. Por ejemplo, se podría estudiar la
correlación entre la autoestima y el bienestar emocional para determinar si existe una
relación entre estos dos aspectos de la personalidad. La correlación también se utiliza para
validar pruebas y evaluar la consistencia interna de sus ítems.

Algunos conceptos esenciales:


1. Prueba psicológica: Es un instrumento o herramienta utilizada para medir y evaluar
características psicológicas, como habilidades cognitivas, rasgos de personalidad,
aptitudes, intereses, entre otros.
2. Validez: Se refiere a la capacidad de una prueba para medir de manera precisa y
adecuada lo que pretende evaluar.
3. Confiabilidad: Se refiere a la consistencia y estabilidad de los resultados de una prueba.
Una prueba confiable debería arrojar resultados consistentes cuando se aplique a la
misma persona en diferentes momentos o cuando sea administrada por diferentes
evaluadores.
4. Estandarización: Es el proceso de desarrollo de normas y procedimientos uniformes
para la administración y puntuación de una prueba, con el fin de asegurar que todos
los participantes sean evaluados en condiciones similares.
5. Normas: Son datos de referencia obtenidos a partir de una muestra representativa de
la población a la que se aplicará la prueba.
6. Puntuaciones estándar: Son puntuaciones que permiten comparar el rendimiento de
un individuo con la muestra de referencia, transformando las puntuaciones originales
en unidades comparables.
7. Escala de puntuación: Es el conjunto de reglas que se utilizan para asignar valores a las
respuestas o rendimiento de los individuos en la prueba, permitiendo obtener una
puntuación final.
8. Sesgo cultural: Refiere a la influencia de factores culturales en el rendimiento de una
prueba, lo cual puede afectar la interpretación y validez de los resultados en ciertos
grupos.
9. Corrección de ítems: Es el proceso de revisar y seleccionar cuidadosamente los ítems o
preguntas que compondrán la prueba, asegurando su pertinencia y validez.
10. Puntaje bruto: Es el resultado numérico de un test, carece de significación. Los
puntajes brutos deben ser transformados en puntajes derivados para ser
interpretados.
11. Puntaje derivado: Puntajes que se transforman a escalas de propiedades conocidas y
tienen una media y una desviación típica determinada lo que permite interpretar las
puntuaciones en función de dónde se ubican en la escala.

4
12. Media: Promedio de las puntuaciones obtenidas por un grupo en un test; se obtiene
mediante la suma de las puntuaciones y la división entre el número de ellas.
13. Desviación estándar: Expresan la posición del sujeto en términos de desviaciones
típicas por encima o por debajo de la media.
14. Baremo: Es un patrón estándar de referencia que se utiliza para calificar y evaluar los
resultados obtenidos.
15. Curva de gauss: Es una curva que se dibuja sobre un eje horizontal y representa la
distribución de datos alrededor de la media, es decir, el punto en el que se concentra la
mayoría de las frecuencias con las que se encuentran los valores.

5
UNIDAD 2
Fundamentos Psicométricos
Evaluación Psicológica: Este método se basa en la observación natural y el tratamiento
estadístico de los datos. Es muy útil para descubrir si diferentes características de las
personas o grupos tienen algún vínculo común, con el objetivo de predecir su
comportamiento o el impacto sobre la esfera psicológica.

Evolución histórica de las evaluaciones psicológicas:


- Del SXV al SXVIII: Surge el interés por el aprendizaje y la creatividad.
- Comienzos del SXIX: Los registros de Bessel favorecen la idea de que algunas capacidades
humanas pueden cuantificarse.
Wundt se interesa por medir propiedades psicológicas, con el fin de formular leyes
científicas generales.
Galton es el responsable del comienzo del movimiento psicométrico (construye un
laboratorio antropométrico). Construye varios tests de discriminación sensorial. Además, es
el primer investigador en adaptar algunas técnicas estadísticas para el análisis de los
resultados.
Catell elabora tests de tiempos de reacción y otras funciones mentales simples. Gracias a él,
se propulsan los test en los E.E.U.U. Aunque su principal aporte es el de introducir el término
“test mental” en la literatura psicológica.
- Finales del SXIX: Se inicia el estudio científico por las diferencias individuales sobre las
habilidades y rasgos de personalidad. Los tests se elaboran en el contexto de la teoría de la
evolución de las especies y las fases tardías de la Revolución Industrial; interés en las
diferencias de carácter hereditario (importa el entorno).
- 1895: Binet critica los tests existentes por sus escasas capacidades predictivas en relación
con criterios externos relevantes. De este modo, propone crear tests de medición de
funciones mentales más complejas (como el juicio, memoria y razonamiento).
- Comienzos del SXX: Wissler crea medidas psicológicas más parecidas a las actividades de la
vida cotidiana. Gracias a esto, se crea la primera escala de inteligencia.
- 1905: Binet y Simon utilizan por primera vez una escala para identificar la debilidad mental
en estudiantes de primer grado.
- 1908: Binet y Simon desarrollan la noción de edad mental. Además, se constituye una
escala de inteligencia más refinada.
En esta época, también surge el concepto de Cociente Intelectual.
Spearman plantea su teoría de dos factores, en la cual sostiene que las puntuaciones de los
tests pueden explicarse de forma general y de forma específica. Este autor, junto con
Thorndike, concibe la teoría de la confiabilidad.
- 1914 – 1918 (PGM): Se elaboran los primeros tests colectivos que medían la inteligencia
para el reclutamiento del ejército, se denominan como “Alfa” y “Beta”. Además, Woodworth,

6
desarrolla su Personal Data Sheet, con el objetivo de detectar trastornos psicológicos en los
soldados.
En esta época, Rorschach publica una técnica psicodiagnóstica basada en láminas de
manchas de tinta.
- 1935 (año bisagra – entre el período histórico y el moderno): Se funda la Sociedad
Psicométrica, acompañada de la primera publicación especializada en la medición
psicológica: “Psychometrika”.
Thurstone realiza aportes a la lógica y los fundamentos matemáticos del análisis factorial, lo
cual facilita la medición de aptitudes más específicas.
- 1939 – 1945 (SGM): Se construyen tests de aptitudes específicas con el objetivo de
reclutar soldados.
- 1950: Se considera como una fase madura de la teoría de los tests, ya que aparecen
textos, los cuales, más adelante, serían clásicos. Los trabajos importantes aquí elaborados se
enfocan en los principios y fundamentos de la medición en psicología, los problemas de
validez y confiabilidad y la construcción de una teoría psicométrica.
- 1960: Se critica la concepción clásica de la teoría de los test, dado esto, aparecen teorías
alternativas. Se originan dos modelos: Maestría del Dominio (Test con Referencia a Criterio) y
el de Rasgo Latente (Teoría de Respuesta al Ítem).
- 1980: Se incrementa el uso de computadoras en Psicometría.
- Finales del SXX: Se acerca la Psicometría a la Psicología Cognitiva, y se elaboran nuevos
modelos.
Además, continúa vigente la utilización de computadoras, las cuales llevan al extremo la
estandarización y objetividad de un test.

Paradigmas de las pruebas psicométricas:


- Teoría Clásica de los Test (TCT): Surge gracias a Spearman, pero se consolida por
Thurstone, Gulliksen, entre otros.
Se deriva de la función de distribución normal con media cero. Esta teoría sostiene que la
puntuación verdadera es un concepto matemático, es decir, puede ser probabilístico, pero
alude a que no se puede predecir con certeza cuales serán las puntuaciones observadas y los
errores.
Su postulado es: “Oi = Vi + Ei”. Aquí se entiende que la puntuación observada de un
individuo es similar a la puntuación verdadera, más el error.
- Teoría de la Generalizabilidad (TG): Elaborada por Cronbach y Gleser. Esta critica que el
concepto de confiabilidad en el contexto de la TCT es limitado, ya que no tiene en cuenta las
posibles fuentes de error.
Aquí, el coeficiente de confiabilidad se re-denomina como “coeficiente de
generalizabilidad”. Este concepto significa a cuán preciso podemos generalizar el puntaje
observando todas las posibles condiciones de administración de los tests.

7
- Teoría de la Respuesta al Ítem (TRT): La clasificación de estas respuestas brinda datos a
partir de los cuales inferimos el nivel de un individuo en un dominio o en un constructo o
rasgo inobservable; esta teoría permite superar inconvenientes de la TCT.
La TRI presenta un interés mayor en los ítems individuales que en los grupales.

Instrumentos de medición en Psicología: Son herramientas utilizadas para determinar los


niveles de funcionamiento y las necesidades de los pacientes. Estos instrumento evalúan la
inteligencia, comportamiento, memoria, estado emocional y otros factores importantes.

Tipos de instrumentos de medición:


- Tests de habilidades: Determinan la inteligencia y el nivel de habilidades de una persona. Los
resultados de estas pruebas se utilizan para determinar el nivel de conocimiento de una persona.
- Escalas de actitudes: Miden el nivel de satisfacción de una persona con respecto a un área
determinada. Estas escalas se utilizan para determinar el nivel de satisfacción de una persona
con respecto a un área determinada.
- Pruebas de aptitudes: Evalúan el nivel de habilidades de una persona. Estas pruebas se
utilizan para determinar el nivel de habilidades de una persona en un área determinada,
como la lectura o la matemática.
- Cuestionarios: Evalúan el nivel de conocimiento de una persona sobre un tema específico.

Pruebas psicométricas y proyectivas: Si bien ambas son instrumentos que utiliza el


psicólogo, las técnicas psicométricas buscan medir rasgos puntuales de la personalidad,
mientras que, por otro lado, las técnicas proyectivas pretenden lograr una descripción
completa de la misma.

8
UNIDAD 3
Confiabilidad
Confiabilidad: La fiabilidad (también llamada técnicamente confiabilidad) es una propiedad
psicométrica que hace referencia a la ausencia de errores de medida, es decir, al grado de
consistencia y estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de
medición con un mismo instrumento.

Tipos de confiabilidad:
1. Estabilidad temporal o coeficiente de estabilidad: Grado en que un instrumento de
medida arrojará el mismo resultado en diversas mediciones concretas, midiendo un
objeto o sujeto que ha permanecido invariable.
2. Formas paralelas o coeficiente de estabilidad y equivalencia: Consiste en aplicar la
segunda vez una forma paralela o alterna del test y de esta forma se evitarán dos
tipos de errores: Los debidos a distintos reactivos y los errores derivados de las dos
ocasiones diferentes de aplicación.
3. División por mitades o coeficiente de consistencia interna: Consiste en dividir la
prueba, una vez administrada, en dos mitades (ítems pares e impares, o bien mitad
y mitad) y calcular la correlación entre los resultados de ambas partes.
4. Consistencia interna pura: Medida basada en las correlaciones entre distintos ítems
dentro de la misma prueba. Mide si los distintos ítems producen resultados similares
en el supuesto general.

Coeficiente de confiabilidad: Es un coeficiente de correlación entre dos grupos de puntajes


e indica el grado en que los individuos mantienen sus posiciones dentro de un grupo. Abarca
valores desde 0 a 1. Cuanto más se acerque el coeficiente a 1, más confiable será la prueba.
El coeficiente de confiabilidad señala la cuantía en que las medidas del test están libres de
errores casuales o no sistemáticos. Por ejemplo, un coeficiente de 0.95 quiere decir que en la
muestra y condiciones fijadas de aplicación del test el 95% de la varianza de los puntajes
directos se debe a la auténtica medida, y sólo el 5%, a errores aleatorios.

Procedimientos para determinar la confiabilidad de los tests:


1. Test-retetest: Se trabaja con un test (se aplica con un grupo homogéneo). Pasado un
cierto tiempo, se volverá a hacer la prueba; confiando en que volverán a salir los
puntajes de modo similar.
2. Pruebas paralelas o equivalentes: El investigador crea un test y trata de compararlo con
uno que mida, más o menos, lo mismo.
3. Partición en mitades: Se le toma al sujeto el test completo, pero luego (a la hora de
relacionar) se lo divide; normalmente en pares e impares. Se introduce, a veces, el
acuerdo de jueces; para ver la confiabilidad.

¿Qué es un error?: Variabilidad o inexactitud en las mediciones realizadas en pruebas


psicométricas. Se deben minimizar los errores para obtener resultados más fiables y válidos.

9
Tipos de error:
- Sistemáticos (sesgos): Se asocia con debilidades del diseño metodológico o la ejecución
del estudio, afectando su validez. Puede valorarse cualitativamente y ser evitado.
- Aleatorios: Se relaciona con variaciones debidas al azar, estas comprometen la
confiabilidad de la investigación.

10
UNIDAD 4
Validez
Validez: Indica el grado de exactitud de un test con el que mide el constructo teórico que
pretende medir y si se puede utilizar con el fin previsto. Es decir, un test es válido si "mide lo
que dice medir".

Tipos de validez:
1. Validez de constructo: Exactitud con la que el instrumento de medida mide lo que, en
principio, se propone medir.
2. Validez de contenido: Grado en que un instrumento de medida contiene ítems
representativos del constructo o contenido que pretende evaluarse.
3. Validez predictiva: Permite establecer predicciones con respecto al comportamiento, a
partir de la comparación entre los valores de instrumentos y el criterio.
4. Validez concurrente: Tanto la medición como la comprobación del criterio se llevan a
cabo al mismo tiempo, permitiendo relacionar ambos elementos y valorar el estado
actual del sujeto.
5. Validez retrospectiva: El ítem o método de evaluación valora la existencia de un
determinado valor o rasgo en el pasado. El criterio es tomado antes de la medida del
test.
6. Validez convergente: Obtenida a partir de la relación de dos instrumentos de medida.
Indica la existencia de una relación entre dos test que evalúen lo mismo.
7. Validez discriminante: Grado en que dos tests o instrumentos difieren, reflejando que
ambos se asocian a constructos o elementos diferentes. Es decir, refleja que los dos
tienen diferentes resultados.

Distinción entre la validez y la confiabilidad: La distinción entre confiabilidad y validez se


basa en lo que consideramos como error. En la validez, interesan los errores constantes o
sistemáticos, y, en la confiabilidad, los errores aleatorios o no sistemáticos.

11
UNIDAD 5
Construcción de Pruebas
Pruebas objetivas: Propuestas de evaluación que se construyen a
partir de un conjunto de preguntas claras y precisas, que demandan del
estudiante una respuesta limitada a una elección entre una serie de
alternativas o, en su caso, una respuesta breve.
Las preguntas pueden ser orales o escritas.
Diferentes tipos de preguntas:
1. Preguntas de opción simple: Una respuesta correcta y el resto falsas.
2. Preguntas de opción múltiple: Varias respuestas correctas.
3. Preguntas de selección de la mejor respuesta: Una respuesta más correcta que las
demás.
4. Preguntas de selección de la respuesta incorrecta: Una respuesta es incorrecta, y debe
identificarla.
5. Preguntas de base común: Se formulan una serie de preguntas a partir de una misma
información (de un texto o un gráfico).
6. Preguntas de ordenamiento: Aparecen conceptos desordenados, y debe organizarlos
de acuerdo con un criterio específico.
7. Preguntas de identificación de gráficos y localización en mapas: Debe localizarse los
elementos que se indican en las instrucciones.
8. Preguntas de verdadero o falso: Existe un conjunto de afirmaciones, y debe señalarse
cuales son correctas y cuáles no.
9. Preguntas de emparejamiento: Se conforman por dos columnas con ideas o conceptos
relacionados entre sí, debe señalarse esas relaciones.
10. Preguntas de problemas científicos-matemáticos: Se presenta una premisa a resolver y
posibles respuestas numéricas que den cuenta de esa solución.
11. Completar ideas: Hay un planteamiento incompleto, debe incluirse la información que
le dé coherencia y sentido.
12. Preguntas abiertas de respuesta única: Debe formularse una respuesta concreta.

Tipos de prueba objetiva:


- Prueba individual: El examinador evalúa a un individuo, es decir, que solo puede ser
aplicada a una sola persona.
- Prueba grupal: Con esta prueba es posible que un mismo examinador evalúe a varias
personas al mismo tiempo.

¿Qué significa distractor?: Respuestas que son plausibles (válidas) pero no correctas.

Para utilizar pruebas objetivas con el fin de evaluar, es necesario:


- Clarificar los contenidos a evaluar en relación con el aprendizaje esperado.
- Definir el tipo de preguntas más adecuadas.

12
- Determinar los criterios de evaluación.

Al formular las preguntas, se debe considerar que:


- Los contenidos estén en el plan de estudios.
- Los reactivos o preguntas incluyan los puntos relevantes de dominio.
- El número de reactivos o preguntas para cada aspecto del dominio, sea proporcional a la
relevancia de los contenidos.

Cuatro requisitos para el diseño de las pruebas objetivas:


- Objetividad: La no intervención del juicio personal.
- Validez: Que cada pregunta mida lo que debe evaluar. Esto conduce al logro del propósito
de la evaluación.
- Confiabilidad: Grado de exactitud con el que cada pregunta mide el aspecto que se desea
evaluar.
- Claridad: Cualidad que deben tener las instrucciones, preguntas y respuestas para ser
precisas.
Para evaluar las pruebas objetivas, es necesario que se asigne un valor a cada reactivo
(ítem) o pregunta. La clasificación se obtiene a partir de la suma de los valores de los
reactivos correctos.
Cabe aclarar, que el número ideal de las alternativas es de cuatro a cinco, nunca menos de
tres.

¿Cómo se construye una prueba objetiva?:


- Se analiza un aspecto.
- Se define el marco teórico.
- Se construyen actividades y se toman en un grupo homogéneo (con
características/variables en común).
- El error se presenta con alfa 0,01, una en 100. 0,05, 5 en 100. 0,10 10 de 100. Es el margen
de error que crea el investigador.
- Se debe hacer estandarizados; si se aplica a ese grupo o no.
- Traducción de pruebas.
- Hay conceptos psicológicos entendidos solo en el área. El traductor debe saber. Copia en
todos los idiomas, se debe aplicar en cada uno y las respuestas de estos tienen que coincidir,
para mantener una línea en común.
- El resultado de esta prueba es un dato numérico.

13
¿Cómo se aplican las pruebas objetivas en la evaluación formativa?: Por sus
características, son adecuadas, tanto al inicio del curso, como al final del proceso de
aprendizaje.

Ventajas de las pruebas objetivas:


- Fácil aplicación y corrección.
- Objetividad en la corrección.
- Posibilita la identificación y cuantificación del nivel de cumplimiento de los objetivos.
- Abarcamiento de amplios dominios de aprendizaje.

Críticas de las pruebas objetivas:


- Este tipo de pruebas evalúa, esencialmente, conocimientos memorísticos.
- El azar puede resultar un elemento de distorsión.
- La brevedad y estereotipación de las pruebas puede facilitar la copia entre estudiantes.
- La preparación y el diseño es costoso por su propia presentación.

Dos índices para determinar la calidad de la prueba dentro de la Teoría Clásica de los Test
(TCT):
- Índice de dificultad (I.D.): Relación entre el número de alumnos que responden
correctamente el ítem y el número de alumnos que intentaron resolverlo.
Este índice varía de 0 (pregunta muy difícil que ha sido respondida incorrectamente por
todos los alumnos o no respondida) a 1 (muy fácil ya que ha sido respondido por todos los
alumnos).
→ I.D. = A (aciertos) / N (total de alumnos)
- Índice de discriminación: (I.Disc.): Es posible diferenciar entre los estudiantes que han
llegado a dominar un objetivo propuesto y los estudiantes que no alcanzan a dominarlo.
Este índice varía de 0 a 1.
- Los ítems cuyo índice de discriminación sea menor que 0.20 se consideran no
satisfactorios.
- Los ítems cuyo índice de discriminación esté entre 0.20 y 0.29 se consideran poco
satisfactorios.
- Los ítem cuyo índice de discriminación sea mayor que 0.40 se consideran con buena
discriminación.
→ I.Disc. = Grupo alto – Grupo bajo
N/2

14
Otro índice de discriminación es la correlación-punto biseral de los ítems. Esta demuestra la
relación existente entre el puntaje de cada ítem alcanzado por un estudiante y el puntaje
total que dicho estudiante obtiene en la prueba.

¿Qué significa “puntuación directa”?: La suma de las puntuación parciales que se da en el


caso de máxima homogeneidad de la prueba, que se le aplicará un punto a cada ítem o igual
puntuación a cada uno.

Escala de Likert: Rara vez están en pregunta, suelen estar en sentencia. Tiene más de 1100
años, pero es la más utilizada, se contesta con facilidad, generando gran cantidad de
información.
Es un instrumento psicométrico para mostrar datos dentro de una escala ordenada y
unidireccional. Son frases, y se debe indicar el grado para contestar. Pueden ser 5/7
respuestas. (De acuerdo, no de acuerdo) es el grado de opinión de un tema. Siempre es de
menos a más. Se usa para medir la frecuencia, satisfacción, nivel de acuerdo, probabilidad,
importancia.

Ventajas:
- Fácil diseño
- Se puede comprar con otros administrados con anterioridad a las mismas personas
- No hay respuestas abiertas, pero permite valorar rasgos
- Sencilla de contestar

Desventajas:
- Para establecer con precisión respuestas negativas o positivas
- Imposible controlar los sesgos
- Preguntaron tendenciosas para que el sujeto elija alguna, así le sirve al administrador para
un fin

Sesgos: Tema recurrente, es un estilo de respuesta.


- Respuesta aquiescente: Responde a todo que es importante, independientemente cual sea
el contenido.
- Respuesta extrema: Totalmente de acuerdo o desacuerdo.
- Respuesta intermedia: Todas las neutras, evitando los extremos.
- Respuesta socialmente deseable: Tiene miedo a que se le juzgue.

15

También podría gustarte