Está en la página 1de 61

ESCALAS DE MEDICIÓN

EN PSICOLOGÍA
Investigación Cuantitativa

Docente: Ps. Juan Andrés Reyes P


GENERALIDADES

○ Una vez que hay claridad respecto al problema a investigar, su naturaleza teórica y el
diseño por el cual se abordará la pregunta de investigación, es crucial obtener datos de
forma confiable y válida.

○ En psicología muchas veces los constructos que se desea cuantificar no son


observables de forma directa.

○ Se requiere instrumentos de medición especiales, los cuales actúan como regla de


correspondencia para asignar valores y cuantificar las propiedades que deben ser
medidas.

○ Existe una metodología específica para la creación de estos instrumentos.

2
ELABORACIÓN DE
ESCALAS DE MEDICIÓN
En psicología
ESCALAS DE MEDICIÓN

○ Las escalas son instrumentos muy utilizados para medir constructos psicológicos,
actitudes o fenómenos sociales.

○ Una escala se define como una serie de ítems que han sido cuidadosamente
seleccionados, de forma que constituyan un criterio válido, fiable y preciso para
medir fenómenos en ciencias sociales.

○ Existe una metodología para la construcción de escalas y también distintas


modalidades para construir los ítems de medición.

4
SECUENCIA PARA LA ELABORACIÓN DE UNA ESCALA DE MEDICIÓN EN PSICOLOGÍA

Identificación y Identificación y
Determinación y
definición delimitación Construcción
operacionalización
teórica teórica

Reactivo

Hipótesis Dimensiones Indicadores Reactivo

Reactivo

Problema de Escala
Constructo Dimensiones Indicadores Reactivo
investigación final

Reactivo

Objetivos Dimensiones Indicadores


Reactivo
PASO 1: DELIMITACIÓN TEÓRICA
DEL CONSTRUCTO A MEDIR

○ Considerando el problema de investigación se debe realizar una revisión teórica


exhaustiva de la literatura para delimitar el constructo a medir.

○ También resulta útil revisar otras escalas de medición similares.

○ El producto de esta revisión debe permitir elaborar una definición conceptual del
constructo que será medido.

○ Esta definición además contiene la perspectiva teórica que se va a adoptar para


interpretar las mediciones realizadas por el instrumento.

6
PASO 1: DELIMITACIÓN TEÓRICA DEL
CONSTRUCTO A MEDIR

○ Ejemplo: Escala de Resiliencia 14 ítems (RS-14) versión en español (Wagnil, 2009)

Se considera como una


característica de personalidad
DEFINICIÓN CONCEPTUAL
positiva que le permite la
DE RESILIENCIA
adaptación del individuo a
situaciones adversas

7

Es muy frecuente que un constructo
sea lo suficientemente grande como
para tener varias dimensiones
teóricas incluidas en su definición

8
PASO 2: DELIMITACIÓN TEÓRICA DE LAS
DIMENSIONES DEL CONSTRUCTO A
MEDIR

○ Considerando la definición teórica del constructo que se quiere medir,


se deben extraer las dimensiones teóricas que permitan comprender el
constructo en su totalidad.

○ Esto es importante, pues a partir de las dimensiones teóricas


encontradas se definirán los indicadores que permiten operacionalizar la
medición del constructo que se desea medir.

9
PASO 2: DELIMITACIÓN TEÓRICA DE LAS
DIMENSIONES DEL CONSTRUCTO A
MEDIR

○ Ejemplo: Escala de Resiliencia 14 ítems (RS-14) versión en español (Wagnil, 2009)

Definición conceptual
Dimensiones o factores
(teórica)

Dimensión 1 Competencia personal: Se define como la


capacidad de mostrar autoconfianza, independencia,
Resiliencia: Se considera como una decisión, ingenio y perseverancia
característica de personalidad
positiva que le permite la
adaptación del individuo a
situaciones adversas Dimensión 2 Aceptación de uno mismo y de la vida: Se
define como la capacidad de mostrar adaptabilidad,
balance, flexibilidad y una perspectiva estable de la vida

10
PASO 3: DETERMINACIÓN DE LOS
INDICADORES
OPERACIONALIZABLES

○ Desde cada dimensión teórica definida, se deben extraer una serie de


indicadores que permitan operacionalizar (observar) cada dimensión.

○ Acá es fundamental ser exhaustivos y excluyentes, pues cada dimensión


constituye una categoría teórica de la cual está formado el constructo a
medir.

○ Por lo tanto, los indicadores deben dar cuenta de forma completa de la


dimensión que intenta operacionalizar.

11
PASO 4: CONSTRUCCIÓN DE LOS
REACTIVOS O ÍTEMS

○ Una vez obtenidos los indicadores, es posible comenzar a construir los reactivos
que puedan dar cuenta de cada indicador.

○ Usualmente se construyen al menos tres reactivos distintos por cada indicador,


para así tener un pool de reactivos desde donde escoger aquellos que serán parte
de la versión preliminar de la escala.

○ Existen distintos tipos de reactivos o ítems y además existen varias reglas para su
construcción.

12
PASO 4: CONSTRUCCIÓN DE LOS
REACTIVOS O ÍTEMS

Ejemplo: Escala de Resiliencia 14 ítems (RS-14) versión en español (Wagnil, 2009)


TIPOS DE REACTIVOS
Escalas de Medición Psicológica

14
REACTIVOS CERRADOS DICOTÓMICOS

○ Las preguntas cerradas contienen categorías u opciones de respuesta que han


sido previamente delimitadas. Cuando sólo tienen dos alternativas de respuesta
se les denomina dicotómicas.

○ Ejemplo:

Me considero a mi mismo/a como una persona empática con los demás

( ) Si

( ) No

15
REACTIVOS CERRADOS POLITÓMICOS

○ Se trata de ítems cerrados que contienen más de dos categorías u opciones de


respuesta que han sido previamente delimitadas.

○ Ejemplo:

Como usted sabe, todos los países desarrollados reciben inmigrantes. ¿Cree que,
en términos generales, la inmigración es más bien positiva o más bien negativa
para estos países?

( ) Positiva
( ) Ni positiva ni negativa
( ) Negativa
( ) No sabría qué decir

16
REACTIVOS TIPO LIKERT

○ Consiste en un conjunto de ítems presentados en forma de afirmaciones o juicios,


ante los cuales se pide la reacción de los participantes, eligiendo alguna de las
alternativas presentadas.

○ Fueron creadas por Rensis Likert (1932) y originalmente medían actitudes.

○ Una actitud es una predisposición aprendida para responder coherentemente de


una manera favorable o desfavorable ante un objeto, ser vivo, actividad,
concepto, persona o símbolo.

17
REACTIVOS TIPO LIKERT

○ Usualmente las alternativas de respuestas reflejan un gradiente de acuerdo o


desacuerdo / frecuencia o infrecuencia u otro tipo de escalamiento en sus
respuestas.

18
REACTIVOS TIPO LIKERT

○ Ejemplo 1:

Siento que la universidad me apoya en todo momento

( ) Siempre
( ) Casi siempre
( ) A veces sí a veces no
( ) Casi nunca
( ) Nunca

19
REACTIVOS TIPO LIKERT

○ Ejemplo 2:

La educación en Chile debe ser gratuita

( ) Muy de acuerdo
( ) De acuerdo
( ) Ni de acuerdo ni en desacuerdo
( ) En desacuerdo
( ) Muy en desacuerdo

20
REACTIVOS DE DIFERENCIAL
SEMÁNTICO

○ Consiste en una serie de adjetivos extremos que califican al objeto de actitud,


ante los cuales se solicita la reacción del participante.

○ El sujeto debe calificar al objeto de actitud a partir de un conjunto de adjetivos


bipolares.

○ Los adjetivos son “extremos” y que entre ellos hay siete opciones de respuesta.
Primeramente es importante definir con claridad los adjetivos a utilizar para
calificar el objeto.

21
REACTIVOS DE DIFERENCIAL
SEMÁNTICO

○ Ejemplo:

Se definen una serie de cualidades de un candidato presidencial

Débil – fuerte
Capaz – Incapaz
Honesto – Deshonesto
Sincero - Hipócrita

22
REACTIVOS DE DIFERENCIAL
SEMÁNTICO

○ Ejemplo:

Cómo considera usted al candidato ”A”

Débil :_____|_____|_____|_____|_____|_____|_____: Fuerte

Capaz :_____|_____|_____|_____|_____|_____|_____: Incapaz

Honesto :_____|_____|_____|_____|_____|_____|_____: Deshonesto

Sincero :_____|_____|_____|_____|_____|_____|_____: Hipócrita

23
REGLAS PARA
CONSTRUIR REACTIVOS
Escalas de Medición Psicológicas

24
CARACTERÍSTICAS DE LOS REACTIVOS

1. Los reactivos tienen que ser claros, precisos y comprensibles para los sujetos
encuestados.

2. Los reactivos deben ser lo más breves posible.

3. Los reactivos deben referirse preferentemente a un solo aspecto o una relación


lógica a la vez.

4. Los reactivos no deben inducir una respuesta en los sujetos.

5. No es bueno utilizar preguntas redactadas en negativo.

25
SISTEMAS DE PUNTUACIÓN
Escalas de Medición Psicológica

26
PUNTUACIÓN Y ESCALAS

○ Lo más común es que las escalas de medición sean sumativas, es decir


utilizan la suma de los puntajes de cada reactivo.

○ La primera definición es el nivel de medición de la escala, que usualmente es


discreta (intervalar) o continua.

○ Luego se debe definir qué cosa reflejará una mayor menor puntuación en la
escala total.

27
PUNTUACIÓN Y ESCALAS

○ Ejemplo:

Se tiene una escala para medir A mayor puntaje más rasgos


rasgos ansiosos ansiosos tiene el sujeto

Se tiene una escala para medir A mayor puntaje más positiva es la


actitud hacia el consumo de actitud del sujeto hacia el consumo
Cannabis

Se tiene una escala para medir A menor puntaje menos


experiencias de discriminación discriminación ha sufrido el sujeto

28
PUNTUACIÓN Y ESCALAS

○ Luego se debe definir la puntuación para cada uno de los ítems o reactivos.
Diferenciando aquellos reactivos positivos de aquellos negativos

○ Ejemplo:

Se tiene una escala para medir síntomas de TDAH, a mayor puntaje mayor indicador de hiperactividad

1. A pesar de las indicaciones se para de su banco 2. Es capaz de seguir instrucciones


constantemente
( 0 ) Siempre
( 4 ) Siempre
( 1 ) Casi siempre
( 3 ) Casi siempre
( 2 ) A veces sí a veces no
( 2 ) A veces sí a veces no
( 3 ) Casi nunca
( 1 ) Casi nunca
( 4 ) Nunca
( 0 ) Nunca
PUNTUACIÓN Y ESCALAS

○ Es cada vez más común que los instrumentos de medición utilicen sus puntajes
brutos como número de interpretación.

○ Usualmente definen al menos dos intervalos de clase para poder clasificar a los
sujetos dependiendo del resultado de la puntuación final de la escala.

○ También es común que los puntajes brutos sean convertidos a puntajes típicos o
estandarizados, que permiten la comparación del sujeto con un grupo de
referencia normativo (como medida de posición).

○ A este proceso se le llama normalización

30
METODOLOGÍA PARA LA
VALIDACIÓN ESCALAS
DE MEDICIÓN
En psicología
SECUENCIA PARA LA VALIDACIÓN DE UNA ESCALA DE MEDICIÓN EN PSICOLOGÍA

Análisis de
Aceptabilidad Normalización
Elaboración Validez confiabilidad y
de la versión y análisis
de reactivos aparente análisis de
preliminar factorial
reactivos

Matriz
operacional Primero pilotaje
Revisión de Revisión por Pilotaje
(muestra
expertos sujetos normativa) poblacional

Escala
final

Construcción
Versión Versión piloto Versión piloto Versión final
primer
preliminar 1 2 estandarizada
borrador
PROPIEDADES PSICOMÉTRICAS
Escalas de medición en psicología

33
PROPIEDADES PSICOMÉTRICAS

Análisis de
Confiabilidad Validez
reactivos

34
CONFIABILIDAD

○ En teoría clásica de medición, los puntajes observados de un sujeto en una


prueba están compuesta por una puntuación real más algún error no
sistemático de medición.

○ Este error es producto del azar, estados internos temporales del sujeto o
situaciones externas del ambiente que afectan la medición.

○ En un conjunto de puntajes la puntuación real está constituida por la


varianza sistemática más la varianza error y se le denomina varianza observada

35
CONFIABILIDAD

○ En estadística la confiabilidad se define como la proporción de la varianza


observada que es explicada por la varianza real (sistemática).

○ En otras palabras la confiabilidad es la capacidad que tiene un instrumento


de medir sin error.

○ Indica el grado en que el instrumento produce resultados iguales en un


mismo individuo o grupo de individuos a través del tiempo.

36
ANÁLISIS DE LA
CONFIABILIDAD
Propiedades psicométricas

37
1. CONSISTENCIA INTERNA

1.1 Coeficiente alfa o 𝛂 de Cronbach

○ Se trata de una formula general para estimar la confiabilidad de una prueba y es el


estadígrafo más utilizado para evaluar la confiabilidad de un instrumento.

○ Se debe aplicar tanto para los puntajes totales como para las subescalas que existan por cada
dimensión.

○ En la práctica es un coeficiente de correlación y su valor está entre 0 y 1.

○ Interpretación: El valor mínimo aceptado es de 0,7 y valores inferiores indican baja


confiabilidad. Se aceptan valores entre 0,8 y 0,9. Valores superiores a 0,9 indican
redundancia en la prueba.

38
1. CONSISTENCIA INTERNA

1.2 Método de las dos mitades

○ Una vez aplicada la escala esta se divide en dos mitades aleatorias y se calcula el
coeficiente de correlación de Pearson corregida mediante la fórmula de
Spearman-Brown.

○ Es un método útil para reemplazar los métodos test- retest, es más barato y con
menores riesgos.

○ Interpretación: Al ser un coeficiente de correlación entre las dos mitades,


también acepta valores entre 0,8 y 0,9.

39
1. CONSISTENCIA INTERNA

1.3 Método de Kuder-Richardson (KR-20)

○ Dado que teóricamente una escala puede dividirse en varias mitades pueden
existir distintos resultados en los coeficientes de confiabilidad.

○ Para resolver este dilema, K-R propone calcular el promedio de los coeficientes
de confiabilidad obtenidos en todas las divisiones por mitades y así obtener un
estimado global de confiabilidad.

○ Interpretación: Al ser un coeficiente de correlación entre las dos mitades,


también acepta valores entre 0,8 y 0,9.

40
2. MÉTODO TEST – RETEST

2.1 Coeficiente de estabilidad o Coeficiente de confiabilidad test-retest

○ Una vez construida la versión piloto de la escala, se escoge una muestra normativa y se aplica
el test dos veces en momentos diferentes. El intervalo de tiempo usualmente es de 7 días de
diferencia, pero puede ser incluso con meses o años de diferencia.

○ Luego se correlacionan los puntajes obtenidos en ambas aplicaciones. Es usual que el


coeficiente de confiabilidad test-retest sea mayor cuando el intervalo entre la prueba inicial y
final es corto.

○ Sin embargo, tiene varios inconvenientes: Aprendizaje de los sujetos, mortalidad


experimental y variabilidad del rasgo a lo largo del tiempo.

41
2. MÉTODO TEST – RETEST

Continuación

2.1 Coeficiente de estabilidad o Coeficiente de confiabilidad test-retest

○ Se pueden utilizar tres estadígrafos para calcular el coeficiente:

• Pearson y correlaciones interclase para variables cuantitativas y

• Spearman-Brown para variables cualitativas.

○ Interpretación: Al ser un coeficiente de correlación entre dos grupos de puntajes (antes y


después) se aceptan valores entre 0,8 y 0,9.

42
3. MÉTODO DE LAS PRUEBAS
PARALELAS

3.1 Coeficiente de formas paralelas o Coeficiente de equivalencia

○ Para prevenir el fenómeno de aprendizaje, se construyen dos versiones de la misma escala,


pero con reactivos similares, pero no iguales (usualmente se redactan de forma distinta).

○ Esta nueva escala es una forma paralela de la original y al igual que el método test-retest se
aplica al mismo grupo normativo en periodos diferentes, que pueden ser relativamente
cortos.

○ Para calcularlo se utiliza correlación de Pearson entre ambas pruebas.

○ Interpretación: Al ser un coeficiente de correlación entre dos grupos de puntajes paralelos,


se aceptan valores entre 0,8 y 0,9.

43
FACTORES QUE AFECTAN LA
CONFIABILIDAD

○ Dado que se obtiene del análisis de la varianza, el tamaño de la variabilidad


puede afectar la confiabilidad. La variabilidad aumenta haciendo la escala más
larga.

○ A mayor longitud de la prueba mayor confiabilidad.

○ Otro factor que la afecta es la heterogeneidad de la muestra, dado que esto


también afecta la variabilidad de los puntajes.

○ A mayor heterogeneidad de la muestra mayor confiabilidad.

44
VALIDEZ
Propiedades psicométricas

45
VALIDEZ DE UNA ESCALA

○ La validez se define como el grado en que la prueba mide lo que


pretende medir y para lo cual fue diseñada.

○ Existen muchas clasificaciones sobre los tipos de validez de una escala,


puesto que efectivamente existen muchas formas de contrastar la
validez de un instrumento de medición.

46
1. VALIDEZ DE CONTENIDO

○ De modo general, la validez de contenido se refiere al grado en que el


instrumento refleja un dominio específico de contenido.

○ Se concentra en conocer si las respuestas obtenidas son representativas del


dominio al cual se refiere el instrumento.

○ Existen dos tipos de métodos para comprobar la validez de contenido: El


juicio de expertos y el análisis factorial exploratorio.

47
1. VALIDEZ DE CONTENIDO

1.1 Validez de apariencia (lógica)

○ Se refiere principalmente al uso del juicio de un grupo de expertos para validar dos
niveles:

• La apariencia de la escala (su correcta redacción y organización de los reactivos),


la cual requiere el juicio de expertos en metodología.

• El contenido de la escala, la cual requiere el juicio de expertos en el dominio que


desea medir la escala.

○ En tal sentido se trata de un método cualitativo, mediante el cual se pueden introducir


mejoras a los reactivos de la escala para mejorar su validez lógica antes del pilotaje.

48
1. VALIDEZ DE CONTENIDO

1.1 Análisis Factorial Exploratorio

○ Este tipo de validez de contenido busca comprobar que los diferentes ítems o reactivos
de la escala representan adecuadamente los dominios del constructo que pretende
medir.

○ Se preocupa de determinar si la estructura de la escala es la adecuada (la relación entre


los reactivos respecto a las dimensiones del constructo que se desea medir)

○ Desea confirmar que el fenómeno estudiado esté representado de forma exhaustiva y


adecuada por la escala.

49
1. VALIDEZ DE CONTENIDO

Continuación

1.1 Análisis Factorial Exploratorio

○ El análisis factorial exploratorio (AFE) se utiliza para obtener evidencia estadística respecto a
las dimensiones que están presentes en el instrumento. Cada dimensión es llamada
componente o factor.

○ El análisis factorial permite explicar las correlaciones entre los ítems de una escala,
agrupándolos en distintos factores dependiendo de su peso estadístico.

○ De este procedimiento se obtiene un modelo factorial, el cual debería coincidir con las
dimensiones teóricas de la escala.

50
2. VALIDEZ DE CRITERIO

○ La validez de criterio establece el grado en que los puntajes obtenidos en una escala
son válidos, al compararlos con un estándar o patrón de referencia que se utiliza como
criterio.

○ El patrón de referencia usualmente es otra escala que mide un constructo parecido y


que tiene las mejores condiciones de validez, confiabilidad y validación para la
población objetivo.

○ Para obtener este tipo de validez, es fundamental aplicar la escala original con el
estándar de referencia a la misma muestra objetivo.

○ A veces la validez de criterio se utiliza para validar un atributo en términos empíricos.

51
2. VALIDEZ DE CRITERIO

2.1 Validez concurrente o convergente

○ Busca establecer el grado de correlación entre los resultados obtenidos en una escala y los
puntajes obtenidos en otra escala de referencia, la cual se utiliza como criterio de
comparación.

○ Dependiendo del nivel de medición y la distribución de los datos se puede utilizar el


coeficiente de Pearson (paramétrico) o de Spearman (no paramétrico).

○ Interpretación: Al ser un coeficiente de correlación entre dos grupos de puntajes (escala y


estándar) se aceptan valores entre 0,8 y 0,9

52
2. VALIDEZ DE CRITERIO

2.2 Validez predictiva

○ Busca establecer el grado en que los puntajes de una escala son capaces de predecir los
puntajes obtenidos por otras escalas, usualmente un estándar de referencia.

○ La validez predictiva o prueba externa debe contestar al siguiente interrogante: ¿Predicen las
puntuaciones del test un rendimiento o conducta futura?

○ Por lo tanto, la comparación de los puntajes de la escala y el estándar suelen ocurrir de forma
diacrónica. Dependiendo del nivel de medición y la distribución de los datos se puede utilizar
el coeficiente de Pearson (paramétrico) o de Spearman (no paramétrico).

○ Interpretación: Al ser un coeficiente de correlación entre dos grupos de puntajes (escala y


estándar) se aceptan valores entre 0,8 y 0,9

53
2. VALIDEZ DE CRITERIO

2.3 Validez divergente o validez discriminante

○ Busca establecer el grado de los puntajes de una escala son diferentes de los puntajes de otra
escala que mide un constructo teóricamente diferente.

○ Si se comprueba que dos escalas que miden constructos diferentes no correlacionan entre sí,
existe validez discriminante.

○ Usualmente se utiliza la comparación entre las correlaciones de ambos grupos de puntaje.


También se puede utilizar la comparación entre la varianza compartida y la varianza extraída
mediante análisis factorial.

54
3. VALIDEZ DE CONSTRUCTO

○ Se refiere al grado en que el instrumento mide un constructo particular que dice medir.
Este tipo de validez garantiza que los puntajes obtenidos en la escala pueden ser
considerados como válidos para el constructo estudiado.

○ Por lo tanto, la validez de constructo evalúa el grado en que el instrumento refleja la


teoría subyacente o constructo que alimenta la medición de la escala en cuestión.

○ Requiere la elaboración previa de un marco conceptual teórico que permita la


interpretación de los resultados. Usualmente este marco pertenece a la definición
conceptual del constructo y la definición de sus dimensiones teóricas.

55
3. VALIDEZ DE CONSTRUCTO

○ Actualmente el proceso más aceptado para conocer la validez de constructo de una


escala es el uso de análisis factorial confirmatorio (AFC).

○ Acá se somete a análisis un modelo de factores que se había explorado previamente,


esta vez ajustado en sus cargas estadísticas. Cada factor está conformado por los ítems
que más correlacionan entre sí con dicho factor.

○ Este modelo factorial debe coincidir con el modelo teórico del marco de referencia de
la escala.

56
ANÁLISIS DE ÍTEMS
Propiedades psicométricas

57
ANÁLISIS DE ÍTEMS

○ Existen al menos tres indicadores relevantes para analizar los ítems de una escala:

1. Correlación ítem-total

2. Índice de dificultad: Indica la proporción de aciertos en la muestra,


utilizando el 50% del total (los dos 25% con puntuaciones totales extremas,
altas y bajas).

3. Índice de discriminación: Expresa en qué medida cada pregunta o ítem


diferencia a los que más y menos saben.

58
CORRELACIÓN ÍTEM - TOTAL

○ También se le conoce como índice de homogeneidad.

○ El análisis de las correlaciones ítem-puntuación total permite valorar la


relevancia y la utilidad de cada ítem dentro de la escala.

○ En la práctica se trata de correlaciones lineales entre el puntaje del ítem y el


puntaje total de la escala, sin considerar el puntaje del ítem evaluado,
señalando la magnitud y dirección de la correlación.

59
CORRELACIÓN ÍTEM - TOTAL

○ Interpretación:

• Si el ítem analizado correlaciona positivamente con el puntaje total, el índice de


homogeneidad será alto: Los sujetos que puntúan alto en el ítem también puntuarán
alto en la escala y viceversa.

• Si el ítem analizado tiene correlaciones bajas con el puntaje total, se infiere que el ítem
está midiendo algo diferente a la escala en su conjunto y probablemente deba ser
eliminado.

• Dado que es una correlación (0 a 1), coeficientes menores a 0,5 deben ser revisados.
Coeficientes menores a 0,2 deben ser eliminados de la escala.

60
Preguntas y
Comentarios

61

También podría gustarte