Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(Curso 2009-10)
UNIDAD DIDÁCTICA 6
PROFESOR: José Ant. López Pina
SPSS es uno de los pocos paquetes estadísticos de propósito general que permite analizar
las características psicométricas de los tests psicológicos por lo que es una herramienta de gran
ayuda para abordar todos los problemas metodológicos que plantea la construcción de tests
psicométricos. Así, con SPSS podemos realizar un análisis de las características psicométricas de
cada uno de los ítems de un test; podemos analizar la fiabilidad de las puntuaciones y determinar la
validez del test completo, construido desde distintas perspectivas: empírica, a través de la
correlación y regresión (simple y múltiple), y de constructo, a través del análisis factorial. SPSS
incorpora las técnicas de análisis factorial más comúnmente utilizadas en la investigación con tests
psicométricos: componentes principales, ejes principales iterados y máxima verosimilitud; a eso se
une distintos procedimientos de rotación (ortogonal y oblicua) que permiten presentar la estructura
del test de una forma clara al investigador. También SPSS permite construir baremos (percentiles,
puntuaciones típicas, eneatipos) normativos para interpretar los resultados de la población.
En Psicometría estudiamos que un test es un conjunto de ítems que se supone mide uno o
más rasgos psicológicos. El test psicométrico debe validarse, debe buscarse su fiabilidad, debemos
estudiar qué mide y ante todo debe estar engarzado en una teoría psicológica; pero el primer paso
que se da cuando tenemos las respuestas de un grupo de personas a los ítems de un test es analizar
precisamente las características psicométricas de los ítems. En Psicometría, este tema se conoce
como Análisis de Ítems. Allí vimos que bajo el modelo clásico de tests existen tres perspectivas que
evidencian básicamente la calidad del ítem: (1) el Índice de Dificultad (ID), que es la media del
ítem; si el ítem es dicotómico se define como la razón entre el número de sujetos que acierta el ítem
y el número de sujetos que lo contesta; (2) el Índice de Homogeneidad (IH) que expresa en qué
medida el ítem revela el constructo junto con el resto de ítems; y (3) el Índice de Validez (IV) que
expresa en qué medida el ítem revela el criterio externo elegido. SPSS permite conocer
directamente el ID y el IH de cada ítem, pero no el IV, aunque éste último puede evaluarse con
ciertas modificaciones cuando sea necesario. El hecho de que no se calcule directamente el IV
obedece a que generalmente no es fácil que se disponga de un criterio externo de suficiente calidad
para conocer la validez empírica, pero una razón aún más poderosa quizás sea que, en la actualidad,
se considera más importante evaluar en qué medida el conjunto de ítems mide un constructo único y
los datos en la muestra evaluada son fiables, que en evidenciar una correlación alta con un criterio
externo de dudosa calidad. El estudiante no debe olvidar que actualmente el devenir de la
construcción de un test psicológico depende de la teoría en la se enmarca; sin teoría, un test
psicológico no es nada, sólo un conjunto de ítems que no sabemos qué mide, aunque las
puntuaciones obtenidas sean fiables. El estudiante no debe olvidar tampoco que el modelo clásico
de tests se apoya en supuestos débiles, tanto que permiten utilizarlo como una metodología sin una
base teórica que lo sustente; es decir, el modelo clásico de tests permite (y lo ha permitido hasta
ahora) diseñar test fiables con una validez desconocida.
1
dividir el test en dos partes iguales (medias y varianzas) a través de seleccionar partes equivalentes
de los ítems, por ejemplo, pares-impares o primera parte vs. segunda parte. Un caso extremo
consiste en considerar que cada ítem es una forma paralela del test y calcular el coeficiente alfa.
SPSS permite emplear los siguientes procedimientos para calcular la fiabilidad de las puntuaciones:
alfa, dos mitades, Guttman, paralelo y paralelo estricto. La selección de un procedimiento para
obtener la fiabilidad de las puntuaciones depende de los supuestos que se hagan sobre las mitades
propuestas, aunque los procedimientos más comunes son los métodos: alfa y dos mitades. Ahora,
podemos pasar los veinte ítem del test de depresión a la ventana de análisis y realizar un estudio de
la fiabilidad con el procedimiento alfa; además, podemos obtener los estadísticos de los ítems
seleccionando en la vetana de estadísticos descriptivos para: Elemento, escala y escala si se elimina
el elemento. La primera tabla informa del número de casos y si hay casos ausentes:
N %
Casos Válidos 294 100,0
Excluidos(a) 0 ,0
Total 294 100,0
a Eliminación por lista basada en todas las variables del procedimiento.
Estadísticos de fiabilidad
Alfa de N de
Cronbach elementos
,893 20
Como se aprecia el coeficiente de fiabilidad del test de depresión CES-D es elevado. Recuérdese
que el coeficiente de fiabilidad varía entre 0 y 1, donde 0 indica mínima fiabilidad y 1 máxima
fiabilidad.
La tercera tabla corresponde a los estadísticos básicos (media y desviación típica) de los ítems:
Desviación
Media típica N
Siento que no puedo
quitarme la depresión de ,36 ,744 294
encima
Me siento deprimido ,57 ,810 294
Me siento aislado ,55 ,902 294
He tenido periodos atroces
,18 ,567 294
Me siento triste ,55 ,819 294
Me siento temeroso ,26 ,634 294
Pienso que mi vida ha sido
un fallo ,25 ,659 294
Siento que fui tan bueno
como cualquier otra ,35 ,777 294
persona
2
Me siento esperanzado en
el futuro ,57 ,913 294
He sido feliz ,46 ,786 294
Me gustaba vivir ,37 ,702 294
Me he molestado por
cosas que usualmente no ,51 ,761 294
me molestan
No me siento con ganas de
comer; tengo poco apetito ,35 ,723 294
La media del ítem nos informa de en qué lugar del continuo se sitúan las personas que han
contestado ese ítem. Si los ítems son politómicos con escala de 0 (mínima depresión) a 3 (máxima
depresión), cada una de las medias indican que las personas analizadas en esta muestra se movieron
entre la categoría 0 (Nada) y 1 (Algo). La tabla siguiente presenta otros estadísticos de los
elementos; el más interesante aparece en la tercera columna como Correlación elemento-total
corregida.
Estadísticos total-elemento
3
Me siento esperanzado en
el futuro 8,34 71,466 ,404 ,891
He sido feliz 8,45 69,027 ,680 ,882
Me gustaba vivir 8,54 71,082 ,588 ,886
Me he molestado por
cosas que usualmente no 8,40 72,644 ,409 ,890
me molestan
No me siento con ganas de
comer; tengo poco apetito 8,55 73,852 ,334 ,892
EJERCICIO 1: Determina los tres ítems con mayor índice de homogeneidad. Intenta dar una
interpretación de estos resultados con el contenido de los ítems en la mano.
EJERCICIO 2: Determina los tres ítems con menor índice de homogeneidad. Intenta dar una
interpretación de estos resultados con el contenido de los ítems en la mano.
Una vez que hemos examinado el IH podemos examinar la media (ID) de cada ítem. En
este análisis ninguno de los ítems ha alcanzado un valor mayor de 1, por lo que parece que estamos
tratando realmente con índices de dificultad, pero no debemos olvidar que la media del test total ha
sido muy baja, por lo que es perfectamente posible que se obtengan estos resultados para los ítems.
Si el grupo hubiera estado formado realmente por sujetos con muy baja, baja, media, elevada y muy
elevada depresión, el modelo clásico ‘pronostica’ una media de (3 x 20 ítems / 2) 30, pero la media
ha sido de 8,908, indicando que en este grupo hubieron muy pocos con una elevada o muy elevada
depresión. De acuerdo con el modelo, como los ítems han sido evaluados en una escala de 0 a 3, el
resultado esperado en cada uno de ellos es 1,5. Por debajo de este valor, el ítem es un bajo indicador
de la depresión, ya que los sujetos con elevada depresión le dan puntuaciones bajas; por encima de
4
este valor, el ítem es un elevado indicador de la depresión, ya que los sujetos con depresión elevada
lo señalan con puntuaciones altas. En nuestro caso todos parecen indicar baja depresión, aunque los
resultados son un efecto claro de la incapacidad del modelo clásico para separar su método de
evaluación de calidad de los ítems de las características del grupo normativo.
EJERCICIO 3: Señalar los tres ítems cuya media sea más baja.
EJERCICIO 4: Señalar los tres ítems cuya media sea más alta.
Análisis de la fiabilidad
Estadísticos de fiabilidad
En este caso, SPSS nos ofrece el coeficiente alfa para cada una de las partes, la correlación
entre ambas formas, el coeficiente de Spearman-Brown (longitud igual y desigual) y el coeficiente
Dos mitades de Guttman; Además, nos informa de los ítems que formaron cada una de las mitades.
El coeficiente alfa para cada mitad se obtiene como se explicó arriba y el coeficiente de Spearman-
Brown es el resultante de calcular la correlación de Pearson entre las dos mitades y aplicar la
ecuación de Spearman-Brown para el caso de longitud doble. Recuérdese que si el test se divide en
dos partes iguales, la correlación de Pearson entre ambas es el coeficiente de fiabilidad del test
5
mitad. En este caso, el coeficiente de Spearman-Brown ha resultado ligeramente más bajo (0,825)
que el coeficiente alfa obtenido arriba. Por regla general, una misma matriz de datos tendrá diversos
coeficientes de fiabilidad cuyo resultado no coincidirá, aunque los valores estarán muy cercanos
entre sí.
La fiabilidad no es una propiedad del test sino de las puntuaciones del grupo donde se ha
aplicado. Eso supone que un test puede tener tantos coeficientes de fiabilidad como grupos en los
que se aplica; generalmente, los manuales de los tests comerciales suelen presentar algunos
coeficientes en uno o más grupos evaluados, aunque estos deben tomarse sólo como indicios
estadísticos de que el test será fiable en nuestra aplicación si los sujetos a los que se lo aplicamos
pertenecen a la misma población de referencia en la que se baremó el test. Por ello, no es extraño
que los constructores de tests, una vez que han seleccionado los ítems, apliquen el test a diversos
grupos y evalúen la fiabilidad en ellos, o tomen distintas variables como las de nuestro estudio y
evalúen en función de las características que representan el coeficiente de fiabilidad. Así, podemos
evaluar la fiabilidad del test de depresión en función de la variable SEXO. ¿Será la fiabilidad del
test igual o distinta en ambos sexos? Para ello, debemos seleccionar cada una de las categorías de
SEXO y repetir el análisis de la fiabilidad. En primer lugar, debemos seleccionar SEXO = 1, por lo
que en SPSS, seleccionamos Datos Seleccionar casos Si se satisface la condición Si y en la
pantalla en blanco escribimos Sexo = 1. Así, para las mujeres, el coeficiente de fiabilidad será:
N %
Casos Válidos 182 100,0
Excluidos(a) 0 ,0
Total 182 100,0
a Eliminación por lista basada en todas las variables del procedimiento.
Estadísticos de fiabilidad
Alfa de N de
Cronbach elementos
,902 20
el coeficiente de fiabilidad ha resultado ligeramente mayor que para el grupo completo. Ahora
volvemos a Datos Seleccionar casos Si se satisface la condición Si y sustituimos 0 por 1.
Entonces, para los varones, el coeficiente de fiabilidad será:
N %
Casos Válidos 112 100,0
Excluidos(a) 0 ,0
Total 112 100,0
a Eliminación por lista basada en todas las variables del procedimiento.
Estadísticos de fiabilidad
Alfa de N de
Cronbach elementos
6
,859 20
Por lo que parece que la muestra de varones ha resultado ligeramente menos fiable que la de
mujeres.
Análisis de la validez
Correlación de Pearson
En nuestro archivo del test de depresión no disponemos de una medida externa como otro test de
depresión, aunque ya dijimos en Psicometría que es una mala estrategia de validación utilizar un
test como criterio externo, pero sí existen algunas variables que pueden ayudarnos a establecer
algún correlato empírico del test como, por ejemplo, SALUD. Esta variable tiene cuatro categorías
7
y podríamos utilizarla para experimentar la validación externa del test de depresión. Para ello,
entramos en Analizar Correlaciones Bivariadas y seleccionamos Pearson. Introducimos las
variables PUNTUACIÓN TOTAL y ESTADO DE SALUD y el resultado es:
. Correlaciones
Puntuación Estado de
total salud
Puntuación total Correlación de Pearson 1 -,214(**)
Sig. (bilateral) ,000
N 294 294
Estado de salud Correlación de Pearson -,214(**) 1
Sig. (bilateral) ,000
N 294 294
** La correlación es significativa al nivel 0,01 (bilateral).
SPSS presenta el resultado como una matriz, donde en la diagonal principal tenemos la correlación
de cada variable consigo misma, y en los elementos de fuera de la diagonal la correlación entre los
pares de variables. En este caso la correlación es -0.214, por lo que no parece que el test de
depresión pueda ser un buen indicador del estado declarado de salud del paciente.
Análisis de regresión
A veces podemos estar interesados en realizar un pronóstico del estado futuro de la persona
en el criterio externo en función de la puntuación en el test. Aunque en la práctica psicológica, los
procesos de predicción no se utilizan con profusión, es conveniente abordar la aplicación de esta
estrategia con la intención de conocer entre qué límites se puede encontrar el estado del individuo
en un criterio externo bien establecido. Para ello, SPSS permite obtener la ecuación de regresión
entre dos (regresión simple) o más variables (regresión múltiple) con la idea de posibilitar estos
pronósticos. Aunque la correlación entre SALUD y PUNTUACION TOTAL no ha sido elevada,
podemos intentar establecer una ecuación de regresión simple entre ambas variables. Para ello,
picamos en Analizar Regresión Lineal.
A la izquierda como siempre los nombres de las variables; a la derecha debemos introducir,
arriba la variable dependiente (SALUD) y abajo la variable independiente (PUNTUACIÓN
TOTAL); manteniendo el resto de opciones por defecto el resultado será el siguiente:
Variables introducidas/eliminadas(b)
Variables Variables
Modelo introducidas eliminadas Método
1 Estado de
. Introducir
salud(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: Puntuación total
8
Resumen del modelo
ANOVA(b)
Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 9,357 1 9,357 13,993 ,000(a)
Residual 195,272 292 ,669
Total 204,629 293
a Variables predictoras: (Constante), Puntuación total
b Variable dependiente: Estado de salud
Coeficientes(a)
Coeficientes
Coeficientes no estandarizado
estandarizados s
Esta salida es más compleja que las anteriores por lo que su interpretación debe realizarse
con cuidado. En la segunda tabla aparece la correlación (simple) 0,214, que es la misma correlación
que hemos calculado anteriormente; en realidad es la correlación simple entre las dos variables, solo
que SPSS emplea el mismo formato para la salida del análisis de regresión simple y múltiple, por lo
que en este caso esa correlación se corresponde con la correlación simple entre las dos variables. A
continuación, aparece un ANOVA que nos indica que la diferencias en la variable pronosticada ha
resultado significativa en función de la variable independiente, y en la última tabla aparecen los
efectos con sus coeficientes a partir de los cuales podemos construir la ecuación de regresión como
SALUD = 2.401 - 0.020 * CTOTAL 1, donde SALUD es la variable dependiente y CTOTAL es la
variable independiente; el valor 3.401 es la constante o intercepción en el origen y el valor 0.020 es
la pendiente de la recta de regresión; ya que la correlación entre ambas variables es muy baja,
también lo es la pendiente y su posibilidad de pronóstico. Al final de los efectos, en la tabla, aparece
una prueba t de Student para evaluar la significación tanto de la intercepción en el origen como la
pendiente de regresión; ya que el valor de probabilidad p al que resultó significativo el valor
encontrado es 0.000, podemos afirmar que ambos valores no se han producido por azar.
La regresión múltiple es una extensión de la regresión simple donde existe más de una variable
independiente. El planteamiento es: ¿podemos realizar el pronóstico en una VD a partir de dos o
1
Recuerda que la estructura de una ecuación de regresión es y’ = a + b*X, donde X es la VI, y’ es el
pronóstico en Y (VD), a es la intercepción en origen y b es la pendiente de la línea de regresión.
9
más VIs? Supongamos que deseamos evaluar el posible efecto de dos VIs (EDAD e INGRESOS)
conjuntamente en la variable PUNTUACION TOTAL. Entonces, recurrimos a la misma pantalla
anterior, sólo que ahora en la ventana de Independent(s) debemos introducir EDAD e INGRESOS.
El resultado será el siguiente:
Variables introducidas/eliminadas(b)
Variables Variables
Modelo introducidas eliminadas Método
1 Nivel de
ingresos, . Introducir
edad(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: Puntuación total
ANOVA(b)
Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 1438,991 2 719,496 9,686 ,000(a)
Residual 21615,883 291 74,281
Total 23054,874 293
a Variables predictoras: (Constante), Nivel de ingresos, edad
b Variable dependiente: Puntuación total
Coeficientes(a)
Coeficientes
Coeficientes no estandarizado
estandarizados s
10
EJERCICIO 10: Construir e interpretar la ecuación de regresión múltiple para
PUNTUACION TOTAL (VD) con NIVEL EDUCATIVO e INGRESOS como VIs.
Variables introducidas/eliminadas(a)
Variables Variables
Modelo introducidas eliminadas Método
1
Por pasos
(criterio:
Prob. de F
para entrar
tipo empleo .
<= ,050,
Prob. de F
para salir
>= ,100).
Por pasos
(criterio:
Prob. de F
para entrar
edad .
<= ,050,
Prob. de F
para salir
>= ,100).
Por pasos
(criterio:
Prob. de F
Nivel de para entrar
.
ingresos <= ,050,
Prob. de F
para salir
>= ,100).
11
a Variable dependiente: Puntuación total
La tabla de arriba presenta las tres variables seleccionadas cuyos pesos han resultado significativos
para pronosticar la variable dependiente.
Resumen del modelo
En esta tabla, aparece el coeficiente de correlación múltiple de cada modelo. Para el modelo
1, la correlación es simple, ya que es la correlación de la variable TIPO DE EMPLEO con
PUNTUACIÓN TOTAL en depresión. El modelo 2 supone que el coeficiente de correlación
múltiple ha aumentado después de añadir la variable EDAD, y el modelo 3 supone otro aumento
después de añadir la variable NIVEL DE INGRESOS.
ANOVA(d)
Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 1021,882 1 1021,882 13,699 ,000(a)
Residual 21633,173 290 74,597
Total 22655,055 291
2 Regresión 2054,352 2 1027,176 14,410 ,000(b)
Residual 20600,703 289 71,283
Total 22655,055 291
3 Regresión 2448,142 3 816,047 11,631 ,000(c)
Residual 20206,913 288 70,163
Total 22655,055 291
a Variables predictoras: (Constante), tipo empleo
b Variables predictoras: (Constante), tipo empleo, edad
c Variables predictoras: (Constante), tipo empleo, edad, Nivel de ingresos
d Variable dependiente: Puntuación total
Coeficientes(a)
Coeficientes
Coeficientes no estandarizado
estandarizados s
12
3 (Constante) 14,226 1,613 8,822 ,000
tipo empleo 1,498 ,373 ,237 4,014 ,000
Edad -,117 ,028 -,240 -4,136 ,000
Nivel de ingresos -,081 ,034 -,138 -2,369 ,018
a Variable dependiente: Puntuación total
Variables excluidas(d)
Estadísticos de
colinealidad
Correlación
Modelo Beta dentro T Sig. parcial Tolerancia
1 Edad -,221(a) -3,806 ,000 -,218 ,936
Nivel de ingresos -,104(a) -1,747 ,082 -,102 ,931
nivel educativo -,051(a) -,827 ,409 -,049 ,879
tipo de religión ,023(a) ,401 ,688 ,024 1,000
2 Nivel de ingresos -,138(b) -2,369 ,018 -,138 ,912
nivel educativo -,082(b) -1,355 ,176 -,080 ,864
tipo de religión ,003(b) ,055 ,957 ,003 ,991
3 nivel educativo -,034(c) -,520 ,603 -,031 ,744
tipo de religión ,006(c) ,104 ,917 ,006 ,991
a Variables predictoras en el modelo: (Constante), tipo empleo
b Variables predictoras en el modelo: (Constante), tipo empleo, edad
c Variables predictoras en el modelo: (Constante), tipo empleo, edad, Nivel de ingresos
d Variable dependiente: Puntuación total
EJERCICIOS DE EVALUACIÓN:
13