Está en la página 1de 38

Introducción a Elaboración de

Instrumentos
Licenciatura en Psicología
Concepto de Psicometría
-El sustantivo “psyke”, que es sinónimo de “alma”.
-El término “metron”, que es equivalente a “medida”.
-El sufijo “-ia”, que se emplea para indicar “cualidad”.

Es la rama de la Psicología en la que se basan los


procesos de medición: el diseño, la construcción, el
ajuste y la puesta en marcha de pruebas psicológicas,
así como los aspectos éticos de su aplicación.

”Área de la psicología que se ocupa de los


procedimientos de medición del comportamiento
humano, incluyendo los test psicométricos”.
(Tornimbeni, y otros, 2004, p . 9)

Es la rama de la Psicología que se encarga de la medición y


cuantificación de los procesos psicológicos y las
capacidades cognitivas.
¿Cuál es el objetivo de la medición en
psicología?

Identificar diferencias en Propiedades o Atributos psicológicos:


 Capacidades
 Habilidades
 Rasgos de personalidad
 Actitudes
 Emociones
Atributo Psicológico
“Características particulares de los objetos de medición” (Nunnally y
Berstein, 1995, como se citó en Tornimbeni, 2004, p . 10)

 Es una propiedad inherente al sujeto.


 Una propiedad que caracteriza a una persona.
 El conjunto de atributos dan la personalidad y capacidades.
 Se encuentran en diferentes niveles y a eso se le asignan
puntuaciones.
Síntesis Psicometría

 Etimológica: medición de las capacidades y rasgos psicológicos


 La función de las pruebas psicológicas ha sido medir las diferencias entre individuos o
entre las reacciones de la misma persona en circunstancias distintas.
 La posición epistemológica de la psicometría se sustenta en el paradigma hipotético
deductivo.
 Una prueba psicológica es una medida objetiva y estandarizada de una muestra de
conducta.
 Para ello, la prueba debe reunir dos importantes propiedades psicométricas: validez y
fiabilidad.
¿Cómo mido?

“Mide lo que es medible y


haz medible lo que no lo
es”.
Atribuido a Galileo Galilei
Concepto de Medición
Entre los año 30´s y 40´s debate de medición psicológos y Thurstone (1947): Multiple factor analysis, que a
físicos partir de los trabajos de Spearman, Kelley y Burt
proporciona el soporte estadístico necesario para
¿La medida psicológica podía ser encuadrada dentro del la construcción y validación de los tests durante
modelo general de medida de los atributos físicos? Medir las siguientes décadas.
consistía en cuantificar, es decir, determinar la magnitud
con la que un atributo está presente en un objeto.

Medición= Atributos físicos observables y manipulables

Stevens (1946): con su trabajo“On the theory of scales of


measurement” dio el primer paso para el modelo
representacional de medida psicométrica..
Base Científica:
Concepto de Medición en Psicología la Medición

El objetivo final de toda ciencia


es describir, explicar y predecir
Es una herramienta que permite cuantificar características los fenómenos que estudia; para
humanas y objetivizar procesos de evaluación (Malo, 2008). lograr este objetivo, la ciencia
debe recoger y comparar datos
que permitan fundamentar sus
La medición es la asignación de puntajes a un atributo teorías. La medida es el
psíquico de los individuos para que los puntajes representen componente esencial de este
alguna característica. La medición psicológica se puede proceso.
lograr en una amplia variedad de formas, incluidas medidas
de autoinforme, conductuales y fisiológicas (Jhangiani etl
al., 2020)”.
La medida permite que los
modelos matemáticos se puedan
La medición es la asignación de números a las propiedades aplicar a la ciencia psicológica.
de los fenómenos en estudio, según ciertas reglas específicas
(Stevens, 1949)

MALO SALAVARRIETA, D. A. (2008). La medición en psicología como herramienta y como


reflexión ética en el ejercicio del psicólogo. Psicogente, 11(19).
Un test es objetivo cuando

¿Qué es una prueba psicológica? todos los examinadores


asignan el mismo valor a
una ejecución determinada
(Cronbach, 1968).

 Es una prueba estandarizada y normalizada para Anastasi y Urbina (1998): Es un instrumento de


medir un atributo psicológico. evaluación cuantitativa de los atributos psicológicos de un
 Una medida objetiva y tipificada de una muestra individuo.
de conducta. Graham y Lilly: Es una muestra estandarizada de
conductas de la que pueden inferirse o predecirse otras
 Evidencias de validez y confiabilidad. conductas importantes (Tornimbeni, 2004).
 Uniformidad de criterios en la aplicación. APA (1999): Un procedimiento evaluativo por medio del
cual una muestra de comportamiento de un dominio
 Procedimiento tipificado de calificación. especificado es obtenida y posteriormente evaluada y
 Tipificación interpretativa de la puntuación. puntuada empleando un proceso estandarizado .
(Tornimbeni, 2004, p . 13)
 Son utilizados en diversos contextos (clínico,
educativo, laboral, vocacional).
Propiedades Psicométricas

Validez

Los instrumentos deben Confiabilidad

de poseer evidencias de: Estandarización


Normalización
Validez y Confiabilidad

 La validez proporciona una comprobación directa de que tan bien cumple una prueba su función.
 Para determinarla se requiere de criterios independientes y externos de lo que la prueba intenta
medir. No solo nos indica el grado en que la prueba cumple con su función, pues al estudiar los
datos de la validación podemos determinar qué es lo que mide el instrumento.
 Es preciso definir la validez como el grado en que sabemos que es lo que mide la prueba.
La validez hace referencia a la capacidad de un instrumento para cuantificar de forma
significativa y adecuada el rasgo para cuya medición ha sido diseñado. Es decir, que mida
la característica (o evento) para el cual fue diseñado y no otra similar. 
 La confiabilidad es la consistencia de las puntuaciones obtenidas por las mismas personas
cuando se les aplica la misma prueba o una forma equivalente.
 Se comparan las puntuaciones obtenidas por las mismas personas en diversos momentos con
diferentes conjuntos de reactivos, examinadores
Validez
El instrumento mide lo que pretende medir.
El test mide el atributo para el que fue construido.

Es el grado en que toda la evidencia acumulada respalda la Constructo


interpretación prevista de los puntajes de una prueba para el uso Definición Operacional
propuesto.

Validez va en relación a las interpretaciones


La validez de la prueba particulares para usos específicos.

Siempre el creador de la prueba debe especificar las


interpretaciones.
Evidencias de validez referidas a…

La estructura interna: Sobre su construcción La estructura externa: Siempre es con un


criterio externo
que realmente el constructo que pretender
Concurrente: con un criterio en el momento.
medir esté plenamente explorado a través de
Correlacionar los puntajes de ese instrumento
los indicadores (reactivos o tareas) que tiene y
con otro instrumento ya probado.
sean pertinentes a lo que pretende medir.
Juicio clínico: Escala clínicas con un juicio
Al contenido: Que todo lo que se pregunte sea
clínico
realmente de esa propiedad que se desee medir
y la sature (sea suficiente). Es un contraste con
Predictiva: Con un criterio a futuro (EXANI)
la teoría.
Validez de construcción: Ya probado en
población se vea que es acorde a la teoría
(unidimensional, multidimensional).
Evidencias de Confiabilidad
Los resultados obtenidos tras la aplicación de un test/ prueba
son consistentes y estables en el tiempo y en diferentes sujetos

La fidelidad en el rasgo medido.


 Estabilidad en la medida
 Que los resultados sean consistentes a través del tiempo.
Si varían de una vez a otra
cuando medimos el mismo
 objeto entonces diremos que no
Consistencia Interna: Sobre la consistencia y la agrupación.
es fiable

El coeficiente alfa refleja la
interrelación existente entre sus
elementos y la medida en que
todos miden bien una misma
cosa.
Estandarización

 Una prueba mide la capacidad o rasgo específico en una muestra de la conducta actual.
 La estandarización supone la uniformidad de los procedimientos en la aplicación y
calificación de la prueba.
 Las condiciones del examen tienen que ser las mismas para todos. Para asegurar la
uniformidad de las condiciones de prueba, quien la elabora proporciona instrucciones
detalladas para la aplicación de cada nuevo instrumento. Esto es parte importante de la
estandarización.
 Procedimiento para la estandarización, la prueba se aplica a una muestra grande y
representativa de las personas a las que va dirigida.
Norma

 Es la actuación media o normal del comportamiento en la población, de la variable o


variables que el test mide.
 Sin normas, no es posible interpretar las puntuaciones del test.
 La puntuación de un individuo sólo puede valorar compárandola con las obtenidas por
otros.
 La puntuación que obtiene una persona en un test no tiene ninguna significación hasta que
se valora en función de un adecuado conjunto de normas.

Es necesaria la aplicación a una gran muestra


de personas = muestra de tipificación para
crear la norma y grados de desviación.
Normalización

 El desarrollo de normas de calificación e interpretación son esenciales para el diagnóstico


y evaluación

 Este grupo sirve para establecer las normas, que indican no solo el desempeño promedio
sino también la frecuencia relativa de las desviaciones por encima y por debajo del
promedio
Tipo de
Calidad del
validez / Criterios en el que basa la Procedimient
instrument Técnica de cálculo
confiabili validez o
o
-dad

Entre Validez por


Proporción de
sinergias y jueces o
acuerdos
concepto expertos
Correspondenci
Validez
a teórica Correlación
Entre ítems convergente
y concepto Validez
Correlación
discriminante

Mide el Validez Entre ítems Validez de


Correlación
evento que de y la criterio o
instrumento
se quiere construct experiencia empírica
criterio
medir o presente concurrente

Entre ítems Validez de


Correlación
Correspondenci y la criterio o
instrumento
a empírica experiencia empírica
criterio
futura predictiva

Entre Correlación ítem-


sinergias y el Validez sinergia
evento estructural
observado Análisis factorial

Abarca las
Mide todo Validez
Exhaustividad áreas, los Validez por
el de Proporción de
de los contenidos jueces o
evento de contenid acuerdos
contenidos o los expertos
estudio o
conceptos

Pruebas correlación
Tipos de validez de un instrumento

Validez
convergente
y validez
discriminant
e
• C
C o
o
• cI
V
n

n
a n u
l• D tr
fi ec er
id on re
e ten n
az id at
b• D e
o

•ei ec E P
i n on x
x r
l t stru te
e cto ed
i r ri
n n c
d a at
a i
d v
a
Tipo de validez interna y confiabilidad interna

Validez de •Correspondencia entre dimensiones e indicadores con


constructo teórico
contenido •Validez interjueces / Índice de proporción de acuerdos

Validez de •Sinergia: coordinación e integración entre dimensiones e indicadores


•Análisis factorial: estructura factorial en congruencia con teoría, porcentaje de
varianza explicada
construcción •Validez convergente y discriminante Correlación

Fiabilidad • Consistencia Interna.


•Correlación entre ítems /correlación entre factores
interna •Alfa y Omega de Mcdonals
Validez Externa Criterio externo

Concurrente

• Correlación entre puntajes obtenidos en el instrumento y otro instrumento o criterio, en el mismo


tiempo

Predictiva

• Correlación con la medición de un criterio externo a través del tiempo


Teorías de Medición
Teoría clásica

Teoría operacional

Teoría representacional
Error de medición: Se representa y
controla a partir de ajustes estadísticos y
hace referencia a la influencia que pueda
Teoría Clásica tener cualquier variable sin controlar
sobre la puntuación obtenida en un test

 Se basa en el modelo lineal propuesto por Spearman en el que las variables se relacionan
de forma directa, la puntuación observable de una persona en un test es una función -
lineal- de dos componentes, su puntaje verdadero (inobservable, el atributo en tanto tal) y
el error de medición implícito en la prueba.
 Desde esta teoría se estiman los posibles errores que se pueden que se pueden inducir al
usar un test para medir variables psicológicas con el objetivo de lograr la exactitud en la
medida, es decir, que el resultado de la prueba de cuenta de manera muy cercana a lo que
verdaderamente es el atributo.
Teoría Operacional

 La teoría operacional propone un proceso para


reconocer el objeto de medición diferenciándolo del
entorno construido por la experiencia empírica.
 Esta teoría busca llevar los constructos teóricos a
conceptos observables para definirlos
operacionalmente, especificando las actividades u
operaciones necesarias para medir la variable.
 Bridman y Campbell son los principales impulsores
de esta teoría.
Teoría Representacional

 Impulsada por Stevens.


 Lo esencial son las propiedades de la escala, en donde el
componente empírico y el formal se unen de manera
comprobada y el papel de los números es representar el
atributo, brindando información que permite la
interpretación de los datos.
 Plantea un sistema relacional entre entidades, considerando
que las entidades empíricas son aquellas variables
identificables y que las entidades abstractas son los números
. Usando así los números para representar relaciones de
identidad o de diferencia entre los atributos.
Teoría de la Generabilidad

Tests refridos
al criterio Cronbach .Estimación del error
en ámbito educativo

•Qué tanto se •Análisis


posee una factorial •Desempeños
capacidad •Alfa •Capacidades
•No detectar •Correlacione •Ci
diferencias s
Teoría de la Respuesta al Item

Modelos matemáticos
aplicados a modelos Procedmientos
teóricos
•Relación funcional entre los valores del •Estimación del error por medio de Modelos
matemáticos Ecuaciones estructurales
ítem y la capacidad de acertar al Item •Modelo no lineal
•Modelos unidimensionales que permiten •Permite inferir inavarianzas en las mediciones,
la discriminación del índice de dificultad invarianzas en las propiedades del test, correlación
del item entre ítem y test
•Modelos muestrales grandes (≥ 500) y diferentes
•Modelos multidimensionales para cada fase de validez (exploratoria y
•Modelos de escalas de actitudes confirmatoria)
Antecedentes de Evaluación
Durante la dinastía Tang (618-907) y Ming (1368-1644): los primeros sistemas
de evaluación de los individuos en función de su habilidad, que permitió la
selección y promoción de los funcionarios de los diferentes departamentos de
la Administración

Educación Formal principalmente universitaria: Selección competitiva de los


estudiantes.

Evaluación Psiquiatrica: Lesiones Cerebrales

Administración de pruebas institucionales basadas en una autoridad imparcial, que objetivaba


las destrezas y los conocimientos requeridos en los ámbitos educativo y administrativo.
PERO… aún no inicia la Psicometría
La frenología (1824) también conocida como la doctrina del cerebro,
Todo inicia… creada por Gall y desarrollada y popularizada por Caspar Spurzheim y
Combe.
Estudio Sistemático de las diferencias
Gall estudió cientos de cráneos humanos y animales, para generar
humanas.
trabajos craneométricos (Arias, 2018), con un análisis inicial de 27 facultades
Friedrich W. Bessel (1784-1846) y Carl F. que fueron expandidos a 35 facultades y tendencias (Wasserman, 2012).
Gauss (1777-1855)
Gustav T. Fechner (1801-1887) Esta doctrina retomó y popularizó la fisiognomía, que tiene la creencia de que los
Hermann von Helmholtz (1821-1894) rasgos y expresiones faciales tienen implicaciones en la forma de ser de las personas.

Psicofísica: Sistematización de la medida La frenología tenía premisas claras:


de las sensiones psicológicas producias por El cerebro es el órgano de la mente.
la estimulación física (Boring, 1978).
La mente tenía ciertas facultades innatas. L
Las facultades eran llevadas a cabo en partes específicas del cerebro.
Se perfeccionaron los métodos de
El cráneo era moldeado por la forma del cerebro y, por tanto, los frenólogos
presentación de los estímulos y el registro
de las respuestas, se trabajó en la mejora de podían examinar las facultades y su desarrollo a través de la examinación del cráneo
la precisión de las medidas y se adoptaron (Wasserman, 2012).
condiciones controladas para su
consecución.

Combe (1830) en el cerebro además de poder localizar las facultades


mentales, también se podían hallar los sentimientos.
Después de la frenología… surge la antropometría
Galton
Propone la antropometría: la medición del hombre.
Él creía y defendía la medición científica objetiva.

Galton (1883) partía de la certeza de que el intelecto es diferente entre las


personas, pero como tal nunca estableció que pretendiera evaluar la
inteligencia, sino la precisión de los sentidos, ya que éstos son los que Galton da la posibilidad de la medición de aspectos
conducen la información, bajo la premisa de que una mejor percepción, mentales de forma científica, así como ser el precursor
conduce a un mejor juicio e inteligencia. del concepto de grupo control en la investigación y
métodos estadísticos de regresión y correlación
(Wasserman, 2012).
Con un laboratorio que le permitía tener suficientes datos para su
investigación, fue el primero en usar baterías de pruebas y Los estudios de Galton fijaron precedentes que
cuestionarios como medios para la obtención de datos. impulsaron una diversidad de investigaciones en Estados
Unidos (Cattell y Farrand, 1896; Gilbert, 1894) y Europa
La medición la realizó a través de indicadores físicos (agudeza visual y con Binet, Ebbinghaus y Kraepelin.
auditiva, altura, peso, capacidad respiratoria, fuerza) y de exámenes de
rendimiento académico. Los indicadores físicos le permitían saber si una
persona podría tener éxito en una ocupación que requeriría de un estilo Spearman (1904) generar su teoría con la premisa de un
activo o si sería sedentario. A estas mediciones les construyó distribuciones factor de inteligencia general, las aproximaciones para
normativas, valores y rangos percentiles específicos para cada rango de medirla se dividieron entre los tests de inteligencia
edad y por género. general o los tests asociados a procesos mentales
(Wasserman, 2012).
En Estados Unidos… Cattell

Cattell inicialmente investigó varios procesos mentales y el Las pruebas diseñadas por este autor aún siguen utilizándose
momento en el cual se generaban (Cattell, 1886). como la cancelación de letras, memoria de dígitos y nombrar
colores rápido.
Cattell estudió los tiempos de reacción con sus propios
instrumentos, trabajó con Wundt, pero redirigió la mirada La batería diseñada tenía una mezcla de evaluaciones
experimental. También trabajó con Galton en el laboratorio antropométricas, y mediciones de procesos mentales de orden
antropométrico. Más tarde en 1891, inició el laboratorio psicológico superior y bajo. Cattell consideró que los resultados de la
experimental en la Universidad de Columbia, donde fue tutor de más batería correlacionaban con los logros a largo plazo de los
de 40 estudiantes doctorales, entre estos, Edward Thorndike, estudiantes.
Woodworth y Hollingworth. Cattell fue presidente de la APA, al
igual que siete de sus alumnos.
Cattell fue el primero en utilizar el término test mental,
comprendía las diferencias entre las ciencias exactas y
sociales, y en la búsqueda de la objetividad encontró la
experimentación y medición de pruebas a un gran número de
individuos, que permitiría encontrar la constancia de los
procesos mentales y las variaciones dependientes de las
circunstancias.

Cattell (1890) realmente creía que para los evaluados esta información
además de interesante, sería útil para su formación, modo de vida o si
indicaba una enfermedad
Cattell (1891)
Batería desacreditada
1º Test mental: Pruebas
Cattell-Columbia por Sharp (1899) la
Evaluar procesos mentales medición de procesos
por medio de: básicos no resultaban
Pruebas sensoriales, tiempos relevantes, se deben
de reacción, motrices y
examinar los procesos
cognitivas, evaluación
académica, cuestionario de complejos, y no tenían
salud, cuestionario de relación con el
hábitos e intereses. rendimiento académico.

Inteligencia
Neuropsicología
Binet: El padre de los tests de Algunas de las tareas que utilizó, aún
inteligencia. siguen vigentes, como las
El trabajo de Binet inició con la composiciones a través de imágenes,
publicación de tres documentos descripciones de objetos, reproducción
acerca de sus hijas, a quienes de diseños, cancelación de letras, la
observó detenidamente y evalúo, a repetición de dígitos, el recuerdo de
través de tareas de inteligencia y palabras con y sin sentido y de
personalidad. imágenes.

Se centró en cómo evaluar la La batería además de ser aplicada a El proyecto para crear una prueba que
información obtenida a través sus hijas, también se utilizó con midiera la inteligencia, empezó en 1895, y
de estos tests, y clasificó las adultos, dichas observaciones abordaba diez facultades mentales:
respuestas verbales como permitieron ver el desarrollo mental memoria, imaginación, imaginería, atención,
personales, no elaboradas, y pensar que esta progresión comprensión, sugestión, sentimiento
abstractas o imaginativas. evalúo debería reflejarse en el estético, sentimiento moral, fuerza
el recuerdo y los procesos de rendimiento de las tareas . muscular y habilidad motora/coordinación
pensamiento bajo criterios Se percató que las tareas complejas y ojo-mano. Su interés radicaba en las tareas
específicos. También hizo multidimensionales son más sensibles de orden superior, para poder hacer las
observaciones cualitativas del al cambio de desarrollo y a las diferencias entre personas respecto a la
rendimiento de sus hijos diferencias individuales (Binet y Henri, inteligencia.
(Wasserman, 2012). 1895).
En 1904, la educación en Francia recibía críticas y presión por
no aplicar las leyes de educación pública hacia niños que se
consideraban “anormales”, con alguna discapacidad como
ceguera, sordos, mudos, o que se encontraban atrasados,
situación que generó la creación de una comisión integrada
por Binet, entre otros.
Con esta comisión Binet vio la oportunidad para formar un
parámetro que sirviera para el diagnóstico y la toma de
decisiones educativas.

Binet y Simon publicaron una revisión en 1908,


[siguieron varias revisiones aún después de la muerte de
Binet (Cohen y Swerdlik, 2000)], de la Escala Métrica de
la Inteligencia (Binet y Simon, 1908) que contenía 56
tests ordenados por nivel de dificultad, y cada prueba
tenía un nivel, la cual el 75% de los niños a una
determinada edad debían lograr, y permitía obtener un
nivel mental.
Binet y Simon: Entre sus Ideación de nuevos La evaluación la El formato tenía
aportes, fue utilizar una métodos, que por un lado inteligencia tiene una flexibilidad que
variedad de tareas cognitivas permitieran observaciones y perspectiva de
permitía decidir en que
que permitieran una mediciones objetivas, y por desarrrollo: tareas
estimación global de la otro, que abordarán la secuenciadas de faciles nivel se iniciaba la
inteligencia (DuBois, complejidad de la persona. a dificiles (Binet y prueba y con una
1970). Simon, 1908) modalidad de cambios
rápidos entre tareas.

Procesos básicos son


parte de la Inteligencia:
Tiempo de reacción
(Jensen, 2006)
Discriminación
Perceptual (Deary et
al., 1994).
Historia de la Psicología

 Otra influencia que la psicología experimental del siglo XIX ejerció en el curso del movimiento psicométrico se manifiesta en
su insistencia por ejercer un control riguroso de las condiciones en las que se realizan las observaciones.
 Galton fue el principal responsable del inicio del movimiento psicométrico. Se intereso por la herencia humana. Se dio cuenta
de la necesidad de medir las características de personas que estaban y no emparentadas. Fue pionero en la aplicación de escalas
de calificación y cuestionarios, así como en el uso de la técnica de asociación libre que posteriormente fue utilizada con
diversos propósitos.
 Cattell ocupa una posición prominente en el adelanto de las pruebas psicológicas. En su trabajo se combinan la psicología
experimental y el movimiento psicométrico. El termino test mental apareció por primera vez en un artículo escrito por el en
1890, que describe una serie de pruebas que cada año se aplicaban a los estudiantes universitarios para determinar su nivel
intelectual. Sus pruebas son características de los instrumentos desarrollados en la última década del siglo XIX, que se
aplicaban a escolares, universitarios y adultos.
 Binet y sus colaboradores se dedicaron a la investigación de las formas de medir la inteligencia. En 1905 Binet preparo con
Simón la primer escala de Binet-Simon. Las técnicas proyectivas han demostrado un crecimiento notable. Estos instrumentos
presentan al cliente un estimulo no muy estructurado, lo que permite una considerable libertad en su solución. La suposición
que fundamenta este método es que el individuo proyectara mediante el estímulo su estilo característico de respuesta.
Procedimiento de Diseño y validez de un
instrumento psicológico

También podría gustarte