Documentos de Académico
Documentos de Profesional
Documentos de Cultura
★ Psicometría hoy:
- Podríamos definir el periodo entre los años 30 y 60 como la época dorada de la psicometría. En
este periodo es cuando se publican, además, los libros y manuales más importantes que la
vertebrarían. Entre los manuales hay que destacar The reliability and validity of tests, de
Thurstone (1931), que sistematizaba lo que se había desarrollado hasta el momento en relación
con la teoría de los tests y sugería el papel central de la fiabilidad como requisito para la validez de
las medidas en la psicometría.
★ Teoría clásica de los test (Spearman): sobre la estimación de los errores de medida. La TCT
propone un nuevo enfoque basado en el concepto de puntuación verdadera. Partiendo de la
puntuación empírica obtenida mediante los tests, y siguiendo un conjunto determinado de
supuestos, el objetivo es descomponerla en dos partes fundamentales para valorar el error
asociado al proceso de medida y, así, inferir el valor real que se pretende medir.
★ Medir: Consistía en cuantificar, es decir, determinar la magnitud con la que un atributo está
presente en un objeto.
- Teoría sustantiva : sólida y bien establecida sobre el comportamiento de las personas –ej:
una teoría de la inteligencia–, que dará el soporte teórico necesario para definir los
elementos críticos que conforman estos fenómenos y determinará los comportamientos
implicados que serán empleados como evidencias observables en el proceso de medida.
- Teoría de los tests: permite establecer las inferencias sobre los fenómenos psicológicos no
observables a partir de las puntuaciones obtenidas en el proceso de medida.
- Test de habilidad o de potencia: tienen como objetivo evaluar la competencia, la aptitud o
los conocimientos de los individuos a partir del acierto o la calidad de sus respuestas. Son
pruebas que discriminan respuestas correctas e incorrectas y esta es la base para puntuar las
ejecuciones individuales.
- Test de personalidad: tienen un objetivo diferente y pretenden conocer de manera general
las motivaciones, preferencias, opiniones o actitudes de los individuos frente a un
determinado estímulo. Este segundo tipo de tests no tienen respuestas correctas y por lo
tanto no sirven para evaluar el acierto o el error de los individuos.
- Batería: test compuesto por varias partes, como a una selección de diferentes tests
administrados conjuntamente por un profesional en una evaluación psicológica determinada.
29/04/2020
- Coeficiente de correlación: entre los dos resultados de un test, el coeficiente de correlación debe
estar cercano a 1, aunque es muy sospechoso que de 1 exacto, por lo general da 0,9 o 0,7.
- El coeficiente de correlación se saca con Excel
-
- =coeficiente de correlación (resultados de aplicación 1: resultados de aplicación 2)
- La diferencia entre un test y otro me dará el margen de error.
- Teoría clásica de los test de Spearman:
★ Tipos de errores de medida: Estos errores están relacionados con las puntuaciones de los sujetos
individualmente consideradas. El error de medida es la diferencia entre la puntuación obtenida por un
sujeto en el test y su puntuación verdadera en la característica medida por este test.
★ La consistencia interna hace referencia al grado en que cada una de las partes de las que se
compone el instrumento es equivalente al resto.
★ Método de las dos mitades: si dividimos un test en dos mitades, estas deben ser equivalentes para
garantizar una adecuada consistencia interna. El grado de equivalencia de las dos mitades se puede
evaluar calculando la correlación entre las puntuaciones de los sujetos en estas dos mitades.
★ Spearman-Brown: el número de ítems que componen un test incide en su fiabilidad. Cuantos más
ítems contiene un test más elevada es su fiabilidad. Este efecto de la longitud de un test sobre el
coeficiente de fiabilidad hay que tenerlo presente al aplicar el método de las dos mitades.
Confiabilidad:
● Un coeficiente de confiabilidad es un índice de confianza, una proporción que indica la razón
entre la varianza de la puntuación verdadera en una prueba y la varianza total.
● Grado en que un instrumento produce resultados consistentes y coherentes. Es decir en que su
aplicación repetida al mismo sujeto u objeto produce resultados iguales.
● Es la precisión con que el test mide lo que mide, en una población determinada y en las
condiciones normales de aplicación.
● Un instrumento de medida psicológica será confiable si al evaluar a los mismos sujetos con el
mismo instrumento o con uno equivalente, las medidas obtenidas en la segunda aplicación son muy
similares a las obtenidas en la primera, esto es, son estables a través del tiempo, lo cual indicaría que los
errores de medición serían mínimos y, por lo tanto, la confiabilidad sería aceptable.
★ Errores de medida:
- Medida de confiabilidad entre evaluadores: La confiabilidad entre evaluadores es el grado de
acuerdo o consistencia que existe entre dos o más evaluadores.
- Consistencia interna: Grado en que los ítems que hacen parte de una escala se correlacionan
entre ellos, la magnitud en que miden el mismo constructo. Se mide a través de los estadísticos:
- Alfa de cronbach: que se considera como la media de todas las correlaciones que pudieran
obtenerse al dividir la prueba en todas las posibles mitades
- KR-20: Estadística utilizada para determinar la consistencia entre reactivos de tipo dicotómicos,
sobre todo aquellos que pueden ser calificados como correctos o incorrectos.
Modelos psicométricos:
TCT: Teoría de la puntuación verdadera
•X=V+e
• Modelo lineal aditivo
● El psicólogo debe garantizar que el instrumento que utilice mida con precisión y poco error. El
error está mezclado con la verdadera puntuación.
TRI: • Teoría del rasgo latente
• Reactivos individuales darán cuenta de la cantidad del rasgo.
TG: • Las puntuaciones obtenidas por una persona varían de una prueba a otra debido a variables en la
situación de aplicación.
Error estándar de medida: (desviación estándar) Es la herramienta que se usa para estimar o inferir la
distancia hasta la cual una puntuación observada se desvía de una puntuación verdadera.
Validez: Una prueba puede ser confiable sin ser válida. Sin embargo, para que la medida sea válida,
necesita primero ser confiable.
● No se valida el instrumento, sino la interpretación de los datos obtenidos por un procedimiento
específico.
- Psicología científica: Es el estudio de la conducta humana y las leyes que la rigen. Como ocurre
con cualquier otra realidad, para una comprensión adecuada de la conducta humana hay que
entender tanto sus aspectos cualitativos como cuantitativos.
- Medir es inherente a todas las ciencias, y la psicología no es una excepción.
- El fin general de toda teoría de la medición, trátese de la ciencia que se trate, es estimar los
errores aleatorios de las mediciones, pues toda medición, mayor o menor, conlleva un cierto error.
¿Cuáles son las características esenciales que definen a lo psicológico como campo de estudio?
- Interacción entre la mente del organismo (aspectos neurobiológicos) y el ambiente (aspectos
socioculturales).
- Hay que comprobar que las mediciones son fiables y válidas
Inicios de la medición.
- Fechner fue el responsable de los primeros intentos de medición, investigó sobre la estimulación
y las sensaciones físicas.
- La tradición psicofísica constituye un campo con grandes implicaciones aplicadas. En la
actualidad gran parte de las investigaciones psicofísicas se llevan a cabo dentro del marco general de
la Teoría de la Decisión y de la Teoría de la Detección de Señales.
- La conducta humana responde a las leyes de la psicología y no de la lógica, por eso se ocupan de
ella los psicólogos y no los expertos en lógica.
- Otro campo de la medición psicológica en la que desembocan estos estudios psicofísicos es la
medición de las actitudes, en cuyo caso desaparece el continuo físico. Medir actitudes es averiguar
las preferencias de las personas hacia determinados estímulos, bien sean objetos, ideas o conceptos.
Las actitudes constituyen un entramado clave para entender a los humanos, son el cristal a través del
que miramos el mundo.
- La otra gran línea de progreso de la medición son los tests. El origen de éstos hay que ubicarlo en
las primeras pruebas sensomotoras utilizadas por Galton en su famoso laboratorio antropométrico
de Kensington. El primero en utilizar la palabra “test mental” será James McKeen Cattell.
- El verdadero inicio de los tests se producirá tras la primera guerra mundial. Estados Unidos
decide entrar en la guerra pero no dispone de ejército, y la selección y clasificación de los soldados se
lleva a cabo confiando en los test Alfa y Beta, diseñados a tal efecto por un comité dirigido por el
psicólogo Yerkes.
- Escalamiento de estímulos (Psicofísica y Actitudes) y escalamiento de sujetos (Tests).
¿Qué condiciones deben de reunir esas mediciones para que su uso sea el adecuado?
- Fiabilidad: Son los métodos y técnicas utilizadas por los psicólogos para estimar el grado de
precisión con el que están midiendo sus variables.
- Para el caso de las variables psicológicas, la propuesta pionera y más fructífera para la estimación
de los errores fue hecha ya a principios de siglo por Spearman (1904, 1907, 1913) y la denominamos
hoy Modelo Lineal Clásico, dando origen a todo un enfoque general sobre los tests que suele
conocerse como Teoría Clásica de los Tests.
- Modelo lineal clásico: A partir del modelo, mediante los desarrollos correspondientes, que aquí
se omiten, va a ser posible llegar a fórmulas operativas para la estimación de los errores (e), y por
ende de las puntuaciones verdaderas (V) de los sujetos.
- A principios del siglo XX Spearman propone un modelo muy simple para las puntuaciones de las
personas en los test: el modelo lineal clásico.
- Este modelo consiste en asumir que la puntuación que una persona obtiene en un test, que
denominamos su puntuación empírica, y que suele designarse con la letra X, está formada por dos
componentes. El primero, es la puntuación verdadera (V) y el segundo el error (e). Este último puede
ser debido a muchas causas que no podemos controlar. Es por eso que la TCT se ocupa de determinar
precisamente el error de medición.
- Esto podría expresarse de la siguiente manera: X = V + e
Hay tres razones por las cuales suceden los errores en la medición psicológica:
a. la propia persona evaluada, que viene con determinado estado de ánimo, actitudes y temores
ante el test, ansiedad, o cualquier tipo de evento previo a su evaluación, todo lo cual puede influir en
la cuantía de los errores.
b. el instrumento de medida utilizado, que con sus características específicas puede influir
diferencialmente en los evaluados.
c. la aplicación, corrección e interpretación hecha por los profesionales.
Percepción trinitaria.
Validez aparente: Es un juicio concerniente a cuán relevantes parecen ser los reactivos de la
prueba. Si una prueba definitivamente parece medir lo que pretende medir. Los juicios son
considerados desde quien responde la prueba.
Validez de contenido: hace referencia a que los ítems que componen el cuestionario sean
representativos de aquello que se pretende evaluar. Es el grado en que un instrumento
abarca una muestra representativa de las conductas de un objeto de evaluación. Se realiza
un análisis (de dificultad) de los ítems/reactivos lo realizan los jueces expertos, quienes
miran 4 características del ítem:
- Pertinencia: en relación al indicador, que el reactivo pertenezca al indicador para el cual
fue diseñado.
- Relevancia: que tan importante es ese reactivo, con respecto al atributo que esté
midiendo.
- Claridad: Está relacionado con la redacción del ítem enfocada a la población a la que va
dirigida.
- Suficiencia: ¿Son suficientes esos reactivos?
Validez relacionada con el criterio: Está relacionada a que el test sirva para predecir. Se
utiliza para estimar a futuro una conducta, a la que se llama criterio una vez determinado el
criterio, se elaboran los reactivos que estarán correlacionados con él. Se suele realizar la
comparación del instrumento con otras variables ya sea, un grupo, un Dx o una prueba. Se
hace un análisis de los resultados.
Validez de constructo: Debe explicar el modelo teórico empírico que subyace a la variable
de interés. Técnicas estadísticas:
- Análisis factorial exploratorio: explora como se agrupan los ítems. Interesa conocer los
factores que componen la prueba, cuántos son esos factores y después nos fijamos
cuantos factores quedaron conformados.
- Análisis factorial confirmatorio: confirma la estructura factorial de análisis a partir de la
respuesta de los evaluados.
- Matriz tipo Varimax:
Validez convergente: correlación entre puntuaciones del test con otras medidas del mismo
constructo realizadas a partir de diferentes técnicas o indicadores.
Validez concurrente o simultánea: Obtendremos validez concurrente al obtener valores
altos de coeficientes de correlación entre las puntuaciones del test y del criterio. Por tanto,
nos permite validar el test, inicialmente elaborado para la medida de otra variable, para la
medida del criterio.
Validez retrospectiva: La validez concurrente entre uno o varios tests y el criterio, que
puede ser útil para la predicción futura de la variable criterio, también en ciertas situaciones
puede servir para, dadas ciertas consecuencias medidas a través del criterio, encontrar las
causas a los valores obtenidos.
1. Validez de contenido: Los ítems que constituyen el test son relevantes y representativos del
constructo psicológico que se desea medir.
2. Validez aparente: es el proceso que siguen las personas al contestar al test permite extraer
respuestas indicadoras de lo que se quiere evaluar.
3. Validez de constructo: Las relaciones de los ítems entre sí son congruentes con el modelo
teórico empleado a la hora de definir el constructo que evaluar.
4. Validez de criterio: Las relaciones que se establecen entre el constructo que se evalúa y
otros constructos son las esperadas según el marco teórico en el que se haya definido el
constructo que evaluar.
5. Evidencia basada en las consecuencias de aplicación: Las consecuencias tanto positivas
como negativas que se extraen al emplear un test son las previstas. Los tests se aplican
esperando que de la información obtenida se extraiga algún tipo de beneficio (poder
seleccionar el mejor tratamiento terapéutico, ubicar a los trabajadores de una empresa en
el puesto más adecuado, mejorar las técnicas didácticas empleadas, etc.). Uno de los
propósitos fundamentales de la validación es indicar en qué casos se pueden obtener estos
beneficios.
Funciones
1. Ayuda a prever errores que se han cometido anteriormente
2. Permite la definición de dimensiones y la elaboración de la matriz de la prueba
3. Provee un marco de referencia para interpretar resultados
4. Orienta sobre cómo habrá de llevarse a cabo el estudio.
Operacionalizar el constructo
Una definición operacional proporciona el significado a un constructo o a una
variable especificando las actividades u “operaciones” necesarias para medirlo.
Una definición operacional de un constructo se refiere a las operaciones mediante
las cuales un investigador determina la presencia o la ausencia de un fenómeno.
Se operacionaliza el constructo para poder estudiarlo.
Proceso de elaboración
1. Conceptualización: elaboración del marco teórico va a tener unas características
particulares que van a dar respuesta a elementos tales como: Atributo/Constructo,
alcance, clasificación, restricción e interpretación de resultados.
2. Construcción
3. Ensayo
4. Análisis de reactivos
5. Revisión de la prueba: confiabilidad y validez
6. Manual de la prueba: cuadernillo de instrucciones para el evaluador.
Características del MC
Describir: definir al fenómeno, sus características y componentes, así como definir las
condiciones en que se presenta y las distintas maneras en que puede manifestarse.
Consistencia: Es decir, las proposiciones que la integran deberán estar interrelacionadas
(no puede contener proposiciones sobre fenómenos que no están relacionados entre sí),
ser mutuamente excluyentes (no puede haber repetición o duplicación) y no caer en
contradicciones internas o incoherencias (Black y Champion, 1976).
Perspectiva: Se refiere al nivel de generalidad (Ferman y Levin, 1979). Una teoría posee
más perspectiva cuanto mayor cantidad de fenómenos explique y mayor número de
aplicaciones admita.
Fructificación es “la capacidad que tiene una teoría de generar nuevas interrogantes y
descubrimientos” (Férman y Levin, 1979, p. 34).
Una teoría parsimoniosa es una teoría simple, sencilla. Éste no es un requisito, sino una
cualidad deseable de una teoría. Desde luego, sencillez no significa superficialidad.
Elaboración de escalas
La elaboración de escalas puede ser explicada como el proceso para establecer reglas y con
ello lograr la asignación numérica en la medición realizada con base en el constructo. Dicho
de otra manera, la elaboración de escalas es el proceso por el cual se diseña y calibra un
dispositivo de medición, y la forma en que se asignan números (u otros índices) valores de
escala, a diferentes cantidades del rasgo, atributo o característica que se esté midiendo.
Redacción de reactivos
Selección del tipo de reactivo (típica o máxima)
Reserva de reactivos/banco de ítems
Claridad
• Calidad de los elementos semánticos y sintácticos de la pregunta.
• Adecuación del lenguaje al nivel de la población
• Precisión en las instrucciones.
Pertinencia
• Relación del ítem con lo que la prueba pretende medir.
• Se considera que un ítem es pertinente si está en armonía con el plan general de la prueba y
si pertenece al dominio definido o al atributo que mide la prueba.
Relevancia
• Hace referencia al contenido específico de la pregunta en relación con la estructura de prueba.
Se asimila a significancia en contraste con detalles superficiales, observaciones incidentales o
comentarios tangenciales de acuerdo con la definición del dominio o atributo.
Características de los ítems (consistencia)
Dificultad: Apreciación del nivel de maestría o magnitud de atributo necesario para responder la
pregunta. (Alta – Media – Baja)
Discriminación: Es el grado en que, como unidad, permite diferenciar algunos grupos de interés,
para quienes tiene alta habilidad en el dominio de quienes no, o quienes poseen mayor
magnitud del atributo de quienes poseen menos.
Transformación de variables
Es un dato único aislado que me permite transformarlo para que me hable de una generalidad.
Transformar las puntuaciones de una medida
Los percentiles: es esa información que me permite revisar esa posición que ocupa el sujeto
en una muestra en nivel de porcentajes. El percentil 50 indica que el sujeto está 50 % por
encima de la población general.
Es una medida de posición en porcentaje (medidas de posición de un dato con respecto a un
grupo de referencia) Se saca con Excel.
Qué posición ocupa el sujeto con respecto al resto de la población.
Cuartiles: Dividen una distribución en cuatro partes. Se suelen identificar como cuartil 1,
cuartil 2 y cuartil 3. Coinciden con los percentiles 25, 50 y 75, respectivamente.
Los quintiles, que al dividir la distribución en cinco partes se equiparan a los percentiles 20,
40, 60 y 80.
La división de la distribución indica si la puntuación fue baja, media o alta.
Puntuación estandarizada: La puntuación estandarizada o puntuación típica es aquella que
permite expresar cuántas desviaciones típicas por encima o por debajo de una media se sitúa
una observación. Este proceso de estandarización tiene su sentido cuando la distribución de
valores objeto de interés se ajusta esencialmente a una curva normal.
Puntuación z: es la puntuación estandarizada y se revisa cuantas desviaciones por encima o
por debajo se encuentra un sujeto. Es cuanto se alejó el dato en relación a la mediana.
Se lee: se alejó 2 desviaciones, se alejó 3 desviaciones.
Las inferencias a las que podemos llegar mediante el uso de estas puntuaciones dependen de
la muestra que es empleada, dado que es de ella de donde se obtienen la media y desviación
típica que permiten el cálculo de las puntuaciones transformadas. Elegir cuidadosamente la
muestra de referencia resulta imprescindible.
Puntuaciones T: Consiste en partir de una constante, en este caso 50, y sumarle diez
veces el valor de la puntuación típica z. Para interpretar debidamente esta puntuación
solo hay que tener presente que la media de esta puntuación es 50 y su desviación típica
10.
Pasos
1. Sumatoria de los datos, puntuación directa
2. Se sacan medidas de tendencia central, lo que se suele utilizar es la mediana (punto medio, nos
va a dar información sobre el percentil)
3. Desviación estándar
Baremación
Es un proceso de escalamiento, y se debe hacer de forma rigurosa para la interpretación de
los datos.
La baremación, también conocida como escalamiento de una medida, es un elemento de gran
relevancia en el proceso de elaboración y uso de un instrumento de medida. Como se ha visto
en el presente capítulo, la transformación de una puntuación ayuda al usuario a inyectar
significado a un determinado valor de acuerdo con el comportamiento de un conjunto de
observaciones.
Para hacer un buen proceso de baremación se recomienda en este caso hacer todo un trabajo
para la selección de la muestra. La selección de la muestra va a tener unas características
fundamentales. Debe ser una muestra:
Relevante: significa que esa población que yo elija debe ser significativa de acuerdo con el
atributo que se vaya a medir. Es población debe tener el atributo.
Representativa: que sea un número de personas significativo que represente la muestra.
Homogénea: personas que serán evaluadas mediante una determinada medida deberían ser
comparables a las personas que formaron parte de la muestra de participantes que
constituyeron el baremo de esta. Es decir una población con características iguales para la
medición del atributo.
Cuando voy a baremar una prueba, lo que hago es retomar toda esa muestra
representativa.
Cada prueba tiene un proceso de baremación diferente.
Los baremos deben ser actualizados constantemente, ya que se asume que por defecto,
los datos contenidos en un baremo caducan. Se suelen usar baremos muy viejos. Las
pruebas deben ser utilizadas con muchísimo cuidado.
Las pruebas, al igual que sus baremos deben ser actualizados constantemente. Cada que
se vaya a trabajar con un prueba, es necesario revisar su actualidad.
Es recomendable no usar cualquier prueba de internet sin antes conocer a profundidad
su marco teórico y su proceso de administración. Se recomienda más fácil, realizar una
buena entrevista que permitirá recoger mucha información.
Equiparación de puntuaciones
Equiparar las puntuaciones de dos o más medidas consiste en establecer una correspondencia
entre las puntuaciones de estas. Esta estrategia debe permitir que, recogida la puntuación en
una de las medidas, sea posible estimar la puntuación de las otras medidas.
Las variables van a ser esos elementos que hacen parte del constructo, van a restringir la
medición del constructo teórico. ES todo eso que yo tengo en cuenta al momento de hacer una
prueba
Conceptos de psicometría
Matriz
ATRIBUTO FACTORES ITEMS
Estrés Fisiológico 1, 2, 3, 4, 5, 6, 7, 8, 17, 26,
Cognitivo 10, 14, 15, 21, 24,
Social 9, 11, 12,
Emocional 13, 16, 18, 19, 20, 22, 23, 24, 25, 27, 29, 31
Conductual 26, 28, 30
Consistencia Interna.
Estadísticos que se utilizan para el análisis de los datos: Sirve para revisar la
correlación de los ítems.
Alfa de cronbach: Es un análisis de consistencia interna en donde se utiliza la
fórmula de alfa de Cronbach. Cuando se utiliza esta prueba se asume que se hace
una calificación mucho más grande de las pruebas. Permite hacer un análisis de
valores más grandes, no solo limitar la prueba a unos y ceros. Alfa de cronbach
incluye unos y ceros y pruebas que se califican con escala de Likert.
Kuder Richardson (KR-20): ítems que se pueden calificar como ceros y unos (0 y 1). A
partir de la sumatoria de toda la dificultad puedo dar la información de kr-20. Es ver
como se comportó la prueba. Análisis de dificultad del ítem.
Spearman Brown: Longitud del ítem
Para revisar la consistencia interna de la prueba primero se revisa el ítem.
Pruebas paralelas: Son dos pruebas que han sido construidas para ser aplicadas al mismo
sujeto y medir un mismo constructo o se tiene dos versiones de la misma prueba. Sirve para
revisar que no existan errores en la formulación de los ítems de la prueba.
Mitades.
Factores que afecta la fiabilidad:
Variabilidad: que tanta variación que tanta diferencia se puede establecer en la respuesta
que dan los sujetos. Variabilidad o cambios en los resultados de una prueba. Se busca la
diferencia para determinar cuales tienen el atributo y cuáles no. La variabilidad son las
diferentes respuestas que hay en una prueba. Permite determinar si el atributo está o no. La
variabilidad se revisa desde alfa de cronbach, kr20 no me permite revisar variabilidad, es
una formula básica.
Cuando no hay variabilidad: cuando todos ganan o cuando todos pierden.
¿Qué se necesita para revisar la confiabilidad/ consistencia interna de una prueba (alfa de
cronbach/KR20)?
Lista de chequeo
2. El atributo
3. Número de ítems
4. Como fue contestado el ítem (1 o 0, o varias opciones de respuesta)
5. Tamaño de la muestra
6. Características básicas del tributo
7. Estabilidad del ítem: test retest, paralelas o alternas)
8. Conocer si la prueba es homogénea o heterogénea
9. El objetivo de la prueba
10. Atributo estable o no estable en el tiempo