Está en la página 1de 13

EVALUACIÓN DE PROGRAMAS

(Curso 2009-10)
UNIDAD DIDÁCTICA 6
PROFESOR: José Ant. López Pina

Análisis de la Fiabilidad de los tests psicométricos

SPSS es uno de los pocos paquetes estadísticos de propósito general que permite analizar
las características psicométricas de los tests psicológicos por lo que es una herramienta de gran
ayuda para abordar todos los problemas metodológicos que plantea la construcción de tests
psicométricos. Así, con SPSS podemos realizar un análisis de las características psicométricas de
cada uno de los ítems de un test; podemos analizar la fiabilidad de las puntuaciones y determinar la
validez del test completo, construido desde distintas perspectivas: empírica, a través de la
correlación y regresión (simple y múltiple), y de constructo, a través del análisis factorial. SPSS
incorpora las técnicas de análisis factorial más comúnmente utilizadas en la investigación con tests
psicométricos: componentes principales, ejes principales iterados y máxima verosimilitud; a eso se
une distintos procedimientos de rotación (ortogonal y oblicua) que permiten presentar la estructura
del test de una forma clara al investigador. También SPSS permite construir baremos (percentiles,
puntuaciones típicas, eneatipos) normativos para interpretar los resultados de la población.

En Psicometría estudiamos que un test es un conjunto de ítems que se supone mide uno o
más rasgos psicológicos. El test psicométrico debe validarse, debe buscarse su fiabilidad, debemos
estudiar qué mide y ante todo debe estar engarzado en una teoría psicológica; pero el primer paso
que se da cuando tenemos las respuestas de un grupo de personas a los ítems de un test es analizar
precisamente las características psicométricas de los ítems. En Psicometría, este tema se conoce
como Análisis de Ítems. Allí vimos que bajo el modelo clásico de tests existen tres perspectivas que
evidencian básicamente la calidad del ítem: (1) el Índice de Dificultad (ID), que es la media del
ítem; si el ítem es dicotómico se define como la razón entre el número de sujetos que acierta el ítem
y el número de sujetos que lo contesta; (2) el Índice de Homogeneidad (IH) que expresa en qué
medida el ítem revela el constructo junto con el resto de ítems; y (3) el Índice de Validez (IV) que
expresa en qué medida el ítem revela el criterio externo elegido. SPSS permite conocer
directamente el ID y el IH de cada ítem, pero no el IV, aunque éste último puede evaluarse con
ciertas modificaciones cuando sea necesario. El hecho de que no se calcule directamente el IV
obedece a que generalmente no es fácil que se disponga de un criterio externo de suficiente calidad
para conocer la validez empírica, pero una razón aún más poderosa quizás sea que, en la actualidad,
se considera más importante evaluar en qué medida el conjunto de ítems mide un constructo único y
los datos en la muestra evaluada son fiables, que en evidenciar una correlación alta con un criterio
externo de dudosa calidad. El estudiante no debe olvidar que actualmente el devenir de la
construcción de un test psicológico depende de la teoría en la se enmarca; sin teoría, un test
psicológico no es nada, sólo un conjunto de ítems que no sabemos qué mide, aunque las
puntuaciones obtenidas sean fiables. El estudiante no debe olvidar tampoco que el modelo clásico
de tests se apoya en supuestos débiles, tanto que permiten utilizarlo como una metodología sin una
base teórica que lo sustente; es decir, el modelo clásico de tests permite (y lo ha permitido hasta
ahora) diseñar test fiables con una validez desconocida.

La evaluación de de la fiabilidad del test y la obtención de los estadísticos de los ítems se


realiza en Analizar  Escalas  Análisis de la Fiabilidad . Existen distintos procedimientos para
evaluar la fiabilidad de un test: test-retest, formas paralelas y dos mitades. La evaluación de la
fiabilidad por los procedimientos test-retest y formas paralelas se realiza a través del coeficiente de
correlación de Pearson directamente obtenible en Analizar  Correlaciones, por lo que SPSS
emplea esta pantalla para el procedimiento de las dos mitades. Este procedimiento consiste en

1
dividir el test en dos partes iguales (medias y varianzas) a través de seleccionar partes equivalentes
de los ítems, por ejemplo, pares-impares o primera parte vs. segunda parte. Un caso extremo
consiste en considerar que cada ítem es una forma paralela del test y calcular el coeficiente alfa.
SPSS permite emplear los siguientes procedimientos para calcular la fiabilidad de las puntuaciones:
alfa, dos mitades, Guttman, paralelo y paralelo estricto. La selección de un procedimiento para
obtener la fiabilidad de las puntuaciones depende de los supuestos que se hagan sobre las mitades
propuestas, aunque los procedimientos más comunes son los métodos: alfa y dos mitades. Ahora,
podemos pasar los veinte ítem del test de depresión a la ventana de análisis y realizar un estudio de
la fiabilidad con el procedimiento alfa; además, podemos obtener los estadísticos de los ítems
seleccionando en la vetana de estadísticos descriptivos para: Elemento, escala y escala si se elimina
el elemento. La primera tabla informa del número de casos y si hay casos ausentes:

Resumen del procesamiento de los casos

N %
Casos Válidos 294 100,0
Excluidos(a) 0 ,0
Total 294 100,0
a Eliminación por lista basada en todas las variables del procedimiento.

La segunda tabla informa del coeficiente de fiabilidad del total de la escala:

Estadísticos de fiabilidad

Alfa de N de
Cronbach elementos
,893 20

Como se aprecia el coeficiente de fiabilidad del test de depresión CES-D es elevado. Recuérdese
que el coeficiente de fiabilidad varía entre 0 y 1, donde 0 indica mínima fiabilidad y 1 máxima
fiabilidad.

La tercera tabla corresponde a los estadísticos básicos (media y desviación típica) de los ítems:

Estadísticos de los elementos

Desviación
Media típica N
Siento que no puedo
quitarme la depresión de ,36 ,744 294
encima
Me siento deprimido ,57 ,810 294
Me siento aislado ,55 ,902 294
He tenido periodos atroces
,18 ,567 294
Me siento triste ,55 ,819 294
Me siento temeroso ,26 ,634 294
Pienso que mi vida ha sido
un fallo ,25 ,659 294
Siento que fui tan bueno
como cualquier otra ,35 ,777 294
persona

2
Me siento esperanzado en
el futuro ,57 ,913 294
He sido feliz ,46 ,786 294
Me gustaba vivir ,37 ,702 294
Me he molestado por
cosas que usualmente no ,51 ,761 294
me molestan
No me siento con ganas de
comer; tengo poco apetito ,35 ,723 294

Cada cosa supone un


esfuerzo para mí ,72 ,972 294
Mi sueño ha sido inquieto ,68 ,900 294
No podría ponerme en
marcha ,75 ,900 294
Tengo problemas para fijar
mi mente en lo que estoy ,62 ,889 294
haciendo
Hablo menos de lo usual ,31 ,654 294
Las personas son poco
amistosas ,25 ,571 294
Creo que no le gusto a las
personas ,24 ,576 294

La media del ítem nos informa de en qué lugar del continuo se sitúan las personas que han
contestado ese ítem. Si los ítems son politómicos con escala de 0 (mínima depresión) a 3 (máxima
depresión), cada una de las medias indican que las personas analizadas en esta muestra se movieron
entre la categoría 0 (Nada) y 1 (Algo). La tabla siguiente presenta otros estadísticos de los
elementos; el más interesante aparece en la tercera columna como Correlación elemento-total
corregida.

Estadísticos total-elemento

Media de la Varianza de la Alfa de


escala si se escala si se Correlación Cronbach si
elimina el elimina el elemento-total se eleimina el
elemento elemento corregida elemento
Siento que no puedo
quitarme la depresión de 8,54 69,792 ,659 ,883
encima
Me siento deprimido 8,34 67,529 ,777 ,879
Me siento aislado 8,35 68,236 ,636 ,883
He tenido periodos atroces
8,72 72,842 ,555 ,887
Me siento triste 8,36 68,544 ,686 ,882
Me siento temeroso 8,65 72,712 ,500 ,888
Pienso que mi vida ha sido
un fallo 8,66 70,315 ,703 ,883
Siento que fui tan bueno
como cualquier otra 8,56 74,780 ,234 ,896
persona

3
Me siento esperanzado en
el futuro 8,34 71,466 ,404 ,891
He sido feliz 8,45 69,027 ,680 ,882
Me gustaba vivir 8,54 71,082 ,588 ,886
Me he molestado por
cosas que usualmente no 8,40 72,644 ,409 ,890
me molestan
No me siento con ganas de
comer; tengo poco apetito 8,55 73,852 ,334 ,892

Cada cosa supone un


esfuerzo para mí 8,18 70,307 ,446 ,890
Mi sueño ha sido inquieto 8,22 70,311 ,490 ,888
No podría ponerme en
marcha 8,16 70,408 ,484 ,889
Tengo problemas para fijar
mi mente en lo que estoy 8,29 70,051 ,517 ,888
haciendo
Hablo menos de lo usual 8,60 73,621 ,399 ,890
Las personas son poco
amistosas 8,66 75,230 ,300 ,893
Creo que no le gusto a las
personas 8,67 72,686 ,561 ,887

Este estadístico es el índice de homogeneidad del ítem y se obtiene de calcular la


correlación entre el patrón de respuestas obtenido en el ítem con la puntuación total excluido las
puntuaciones del ítem que se correlaciona. Si el ítem es politómico (como es este caso) se obtiene
con la correlación de Pearson; si el ítem es dicotómico, se obtiene con la correlación biserial-
puntual. El rango del IH está entre 0 y 1, donde 0 indica mínima homogeneidad y 1, máxima
homogeneidad. Generalmente, un ítem es adecuado para incluirse en un test psicométrico si su IH
se encuentra entre 0,3 y 0,7. Si el IH está por debajo de 0,3, el ítem se debe eliminar o modificar; si
está por encima de 0,7, también se debe modificar, ya que es un indicador de que por sí mismo es
capaz de medir lo mismo que el test.

EJERCICIO 1: Determina los tres ítems con mayor índice de homogeneidad. Intenta dar una
interpretación de estos resultados con el contenido de los ítems en la mano.

EJERCICIO 2: Determina los tres ítems con menor índice de homogeneidad. Intenta dar una
interpretación de estos resultados con el contenido de los ítems en la mano.

Una vez que hemos examinado el IH podemos examinar la media (ID) de cada ítem. En
este análisis ninguno de los ítems ha alcanzado un valor mayor de 1, por lo que parece que estamos
tratando realmente con índices de dificultad, pero no debemos olvidar que la media del test total ha
sido muy baja, por lo que es perfectamente posible que se obtengan estos resultados para los ítems.
Si el grupo hubiera estado formado realmente por sujetos con muy baja, baja, media, elevada y muy
elevada depresión, el modelo clásico ‘pronostica’ una media de (3 x 20 ítems / 2) 30, pero la media
ha sido de 8,908, indicando que en este grupo hubieron muy pocos con una elevada o muy elevada
depresión. De acuerdo con el modelo, como los ítems han sido evaluados en una escala de 0 a 3, el
resultado esperado en cada uno de ellos es 1,5. Por debajo de este valor, el ítem es un bajo indicador
de la depresión, ya que los sujetos con elevada depresión le dan puntuaciones bajas; por encima de

4
este valor, el ítem es un elevado indicador de la depresión, ya que los sujetos con depresión elevada
lo señalan con puntuaciones altas. En nuestro caso todos parecen indicar baja depresión, aunque los
resultados son un efecto claro de la incapacidad del modelo clásico para separar su método de
evaluación de calidad de los ítems de las características del grupo normativo.

EJERCICIO 3: Señalar los tres ítems cuya media sea más baja.

EJERCICIO 4: Señalar los tres ítems cuya media sea más alta.

Análisis de la fiabilidad

La fiabilidad de un test se evalúa teóricamente a través de la razón entre las varianzas


verdadera y empírica como expresión de la formulación general del modelo clásico, pero es
necesario recurrir a un método empírico para obtener una expresión real del coeficiente de
fiabilidad de un test, ya que las puntuaciones verdaderas son desconocidas. SPSS dispone por
defecto del método de las dos mitades (o pares-impares) y ofrece dos coeficientes de fiabilidad:
Spearman-Brown y coeficiente alfa de Cronbach. Ambos son expresión de conceptos de fiabilidad
ligeramente diferentes; el primero es una expresión de la estabilidad de las puntuaciones y la
adecuada colocación de los ítems en los tests de rendimientos y capacidades; y el segundo es una
expresión de la fiabilidad como correlación entre todos los ítems o consistencia de todos los ítems
para una medida común. Un error común entre los psicólogos aplicados es interpretar el coeficiente
alfa como una expresión de que todos los ítems miden lo mismo (unidimensionalidad), pero esto no
es cierto, ya que los ítems pueden medir varias dimensiones y el coeficiente alfa ser elevado. Para
comparar los resultados, podemos obtener ahora el coeficiente de fiabilidad con las dos mitades.
Los resultados son:

Estadísticos de fiabilidad

Alfa de Cronbach Parte 1 Valor ,867


N de elementos 10(a)
Parte 2 Valor ,767
N de elementos 10(b)
N total de elementos 20
Correlación entre formas ,702
Coeficiente de Spearman- Longitud igual ,825
Brown Longitud desigual ,825
Dos mitades de Guttman ,818
a Los elementos son: Siento que no puedo quitarme la depresión de encima, Me siento deprimido, Me siento
aislado, He tenido periodos atroces, Me siento triste, Me siento temeroso, Pienso que mi vida ha sido un fallo,
Siento que fui tan bueno como cualquier otra persona, Me siento esperanzado en el futuro, He sido feliz.
b Los elementos son: Me gustaba vivir, Me he molestado por cosas que usualmente no me molestan, No me
siento con ganas de comer; tengo poco apetito, Cada cosa supone un esfuerzo para mí, Mi sueño ha sido
inquieto, No podría ponerme en marcha, Tengo problemas para fijar mi mente en lo que estoy haciendo,
Hablo menos de lo usual, Las personas son poco amistosas, Creo que no le gusto a las personas.

En este caso, SPSS nos ofrece el coeficiente alfa para cada una de las partes, la correlación
entre ambas formas, el coeficiente de Spearman-Brown (longitud igual y desigual) y el coeficiente
Dos mitades de Guttman; Además, nos informa de los ítems que formaron cada una de las mitades.
El coeficiente alfa para cada mitad se obtiene como se explicó arriba y el coeficiente de Spearman-
Brown es el resultante de calcular la correlación de Pearson entre las dos mitades y aplicar la
ecuación de Spearman-Brown para el caso de longitud doble. Recuérdese que si el test se divide en
dos partes iguales, la correlación de Pearson entre ambas es el coeficiente de fiabilidad del test

5
mitad. En este caso, el coeficiente de Spearman-Brown ha resultado ligeramente más bajo (0,825)
que el coeficiente alfa obtenido arriba. Por regla general, una misma matriz de datos tendrá diversos
coeficientes de fiabilidad cuyo resultado no coincidirá, aunque los valores estarán muy cercanos
entre sí.

Consistencia de los coeficientes de fiabilidad

La fiabilidad no es una propiedad del test sino de las puntuaciones del grupo donde se ha
aplicado. Eso supone que un test puede tener tantos coeficientes de fiabilidad como grupos en los
que se aplica; generalmente, los manuales de los tests comerciales suelen presentar algunos
coeficientes en uno o más grupos evaluados, aunque estos deben tomarse sólo como indicios
estadísticos de que el test será fiable en nuestra aplicación si los sujetos a los que se lo aplicamos
pertenecen a la misma población de referencia en la que se baremó el test. Por ello, no es extraño
que los constructores de tests, una vez que han seleccionado los ítems, apliquen el test a diversos
grupos y evalúen la fiabilidad en ellos, o tomen distintas variables como las de nuestro estudio y
evalúen en función de las características que representan el coeficiente de fiabilidad. Así, podemos
evaluar la fiabilidad del test de depresión en función de la variable SEXO. ¿Será la fiabilidad del
test igual o distinta en ambos sexos? Para ello, debemos seleccionar cada una de las categorías de
SEXO y repetir el análisis de la fiabilidad. En primer lugar, debemos seleccionar SEXO = 1, por lo
que en SPSS, seleccionamos Datos  Seleccionar casos  Si se satisface la condición  Si y en la
pantalla en blanco escribimos Sexo = 1. Así, para las mujeres, el coeficiente de fiabilidad será:

Resumen del procesamiento de los casos

N %
Casos Válidos 182 100,0
Excluidos(a) 0 ,0
Total 182 100,0
a Eliminación por lista basada en todas las variables del procedimiento.

Estadísticos de fiabilidad

Alfa de N de
Cronbach elementos
,902 20

el coeficiente de fiabilidad ha resultado ligeramente mayor que para el grupo completo. Ahora
volvemos a Datos  Seleccionar casos  Si se satisface la condición  Si y sustituimos 0 por 1.
Entonces, para los varones, el coeficiente de fiabilidad será:

Resumen del procesamiento de los casos

N %
Casos Válidos 112 100,0
Excluidos(a) 0 ,0
Total 112 100,0
a Eliminación por lista basada en todas las variables del procedimiento.

Estadísticos de fiabilidad

Alfa de N de
Cronbach elementos

6
,859 20

Por lo que parece que la muestra de varones ha resultado ligeramente menos fiable que la de
mujeres.

EJERCICIO 5: Evaluar la fiabilidad en función de la Regularidad en la Bebida. Interpretar


los resultados.
EJERCICIO 6: Evaluar la fiabilidad en función de si tiene tratamiento o no indicado por el
médico.

Análisis de la validez

La validez es un aspecto crucial de la evaluación de la calidad de un test psicológico.


Messick afirma que la validez es un concepto unificador que podemos abordar desde distintas
estrategias de análisis que permiten obtener evidencias de la validez de los datos que ofrecen los
tests. Como sabemos de Psicometría, la validez de los tests psicométricos se puede abordar desde
distintas estrategias cuya finalidad es confluir en la evidencia de la existencia de uno o más rasgos
psicológicos entre las que podemos destacar: a) la perspectiva orientada a la búsqueda de un
correlato empírico a través de evaluar en qué medida el test evidencia uno o más criterios externos
y/o es capaz de discriminar entre distintos grupos de la población en función de las características
de interés; b) la perspectiva del análisis de la estructura dimensional del test construido a través de
estudios de análisis factorial y matrices multimétodo-multirrasgo, y c) la perspectiva del contenido
que atiende a en qué medida los ítems son capaces de revelar los procesos subyacentes del rasgo
medido. Evidentemente esta última perspectiva atiende más a una valoración teórica y un
conocimiento exhaustivo de la teoría psicológica en la que se enmarca el test, y la abordaremos
como práctica en la elaboración del test que debemos construir; para las perspectivas empírica y de
evaluación de la dimensionalidad disponemos de varios procesos estadísticos que permiten
evidenciar si el test que hemos construido es una evidencia más o menos real, tanto como lo permite
el modelo clásico, de un rasgo psicológico bien establecido en alguna teoría psicológica.

Estrategias de validación empírica de los tests

Correlación de Pearson

Ua estrategia para validar empíricamente un test psicométrico consiste en calcular la


correlación de Pearson entre las puntuaciones del test y un criterio externo, supuesto que tanto las
puntuaciones en el test como en el criterio externo están en una escala de intervalo. Aunque así se
considera en el test, raramente las puntuaciones en un criterio externo están en una escala de
intervalo, a no ser que ese criterio externo sea otro test. Generalmente, un criterio externo suele ser
un examen, las calificaciones del profesor, una evaluación clínica por expertos en torno a una escala
graduada de 1 a 5 ó similar; es decir, a veces la construcción del criterio externo es tan débil, en sus
fundamentos teóricos y procedimiento de medida, que es difícil, en la actualidad, considerarlo como
un buen método de validación. En cualquier caso, sí es cierto que una correlación elevada entre las
puntuaciones en un test y una medida externa al mismo, que represente aunque sea de forma grosera
el comportamiento real de la persona, es una clara evidencia de que la existencia de ese constructo o
rasgo como una fuente de diferenciación entre los sujetos de la población estudiada.

En nuestro archivo del test de depresión no disponemos de una medida externa como otro test de
depresión, aunque ya dijimos en Psicometría que es una mala estrategia de validación utilizar un
test como criterio externo, pero sí existen algunas variables que pueden ayudarnos a establecer
algún correlato empírico del test como, por ejemplo, SALUD. Esta variable tiene cuatro categorías

7
y podríamos utilizarla para experimentar la validación externa del test de depresión. Para ello,
entramos en Analizar  Correlaciones  Bivariadas y seleccionamos Pearson. Introducimos las
variables PUNTUACIÓN TOTAL y ESTADO DE SALUD y el resultado es:

. Correlaciones

Puntuación Estado de
total salud
Puntuación total Correlación de Pearson 1 -,214(**)
Sig. (bilateral) ,000
N 294 294
Estado de salud Correlación de Pearson -,214(**) 1
Sig. (bilateral) ,000
N 294 294
** La correlación es significativa al nivel 0,01 (bilateral).

SPSS presenta el resultado como una matriz, donde en la diagonal principal tenemos la correlación
de cada variable consigo misma, y en los elementos de fuera de la diagonal la correlación entre los
pares de variables. En este caso la correlación es -0.214, por lo que no parece que el test de
depresión pueda ser un buen indicador del estado declarado de salud del paciente.

EJERCICIO 7: Calcular la correlación de Pearson entre las variables PUNTUACIÓN


TOTAL, EDAD y NIVEL EDUCATIVO. Interpretar los resultados.

EJERCICIO 8: ¿Existe alguna relación entre el tipo de empleo y la depresión?

Análisis de regresión

A veces podemos estar interesados en realizar un pronóstico del estado futuro de la persona
en el criterio externo en función de la puntuación en el test. Aunque en la práctica psicológica, los
procesos de predicción no se utilizan con profusión, es conveniente abordar la aplicación de esta
estrategia con la intención de conocer entre qué límites se puede encontrar el estado del individuo
en un criterio externo bien establecido. Para ello, SPSS permite obtener la ecuación de regresión
entre dos (regresión simple) o más variables (regresión múltiple) con la idea de posibilitar estos
pronósticos. Aunque la correlación entre SALUD y PUNTUACION TOTAL no ha sido elevada,
podemos intentar establecer una ecuación de regresión simple entre ambas variables. Para ello,
picamos en Analizar  Regresión  Lineal.

A la izquierda como siempre los nombres de las variables; a la derecha debemos introducir,
arriba la variable dependiente (SALUD) y abajo la variable independiente (PUNTUACIÓN
TOTAL); manteniendo el resto de opciones por defecto el resultado será el siguiente:

Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 Estado de
. Introducir
salud(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: Puntuación total

8
Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,214(a) ,046 ,042 8,680
a Variables predictoras: (Constante), Estado de salud

ANOVA(b)

Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 9,357 1 9,357 13,993 ,000(a)
Residual 195,272 292 ,669
Total 204,629 293
a Variables predictoras: (Constante), Puntuación total
b Variable dependiente: Estado de salud

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta t Sig.


1 (Constante) 2,401 ,068 35,474 ,000
Puntuación total -,020 ,005 -,214 -3,741 ,000
a Variable dependiente: Estado de salud

Esta salida es más compleja que las anteriores por lo que su interpretación debe realizarse
con cuidado. En la segunda tabla aparece la correlación (simple) 0,214, que es la misma correlación
que hemos calculado anteriormente; en realidad es la correlación simple entre las dos variables, solo
que SPSS emplea el mismo formato para la salida del análisis de regresión simple y múltiple, por lo
que en este caso esa correlación se corresponde con la correlación simple entre las dos variables. A
continuación, aparece un ANOVA que nos indica que la diferencias en la variable pronosticada ha
resultado significativa en función de la variable independiente, y en la última tabla aparecen los
efectos con sus coeficientes a partir de los cuales podemos construir la ecuación de regresión como
SALUD = 2.401 - 0.020 * CTOTAL 1, donde SALUD es la variable dependiente y CTOTAL es la
variable independiente; el valor 3.401 es la constante o intercepción en el origen y el valor 0.020 es
la pendiente de la recta de regresión; ya que la correlación entre ambas variables es muy baja,
también lo es la pendiente y su posibilidad de pronóstico. Al final de los efectos, en la tabla, aparece
una prueba t de Student para evaluar la significación tanto de la intercepción en el origen como la
pendiente de regresión; ya que el valor de probabilidad p al que resultó significativo el valor
encontrado es 0.000, podemos afirmar que ambos valores no se han producido por azar.

EJERCICIO 9: Determina la función de regresión de la variable PUNTUACIÓN TOTAL


(VI) en función de la EDAD (VD). Interpreta los resultados.

La regresión múltiple es una extensión de la regresión simple donde existe más de una variable
independiente. El planteamiento es: ¿podemos realizar el pronóstico en una VD a partir de dos o
1
Recuerda que la estructura de una ecuación de regresión es y’ = a + b*X, donde X es la VI, y’ es el
pronóstico en Y (VD), a es la intercepción en origen y b es la pendiente de la línea de regresión.

9
más VIs? Supongamos que deseamos evaluar el posible efecto de dos VIs (EDAD e INGRESOS)
conjuntamente en la variable PUNTUACION TOTAL. Entonces, recurrimos a la misma pantalla
anterior, sólo que ahora en la ventana de Independent(s) debemos introducir EDAD e INGRESOS.
El resultado será el siguiente:

Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 Nivel de
ingresos, . Introducir
edad(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: Puntuación total

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,250(a) ,062 ,056 8,619
a Variables predictoras: (Constante), Nivel de ingresos, edad

ANOVA(b)

Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 1438,991 2 719,496 9,686 ,000(a)
Residual 21615,883 291 74,281
Total 23054,874 293
a Variables predictoras: (Constante), Nivel de ingresos, edad
b Variable dependiente: Puntuación total

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta t Sig.


1 (Constante) 15,516 1,624 9,555 ,000
Edad -,096 ,028 -,196 -3,387 ,001
Nivel de ingresos -,114 ,034 -,197 -3,405 ,001
a Variable dependiente: Puntuación total

Efectivamente, ahora sí tenemos la correlación múltiple de EDAD e INGRESOS con


PUNTUACIÓN TOTAL, y su valor es 0,250, y la ecuación de regresión múltiple correspondiente
es: PUNTUACION TOTAL = 15.516 - .096 * EDAD - .114 * INGRESOS. Para eliminar el
efecto de la diferencia en la escala de medida de las variables es más aconsejable utilizar los
coeficientes estandarizados, por lo que la ecuación de regresión múltiple será PUNTUACIÓN
TOTAL = -.196 * EDAD - .197 * INGRESOS. Observa ahora que los coeficientes estandarizados
han resultado negativos lo que indica que por cada unidad de cambio en EDAD e INGRESOS se
reduce la puntuación en PUNTUACION TOTAL (Depresión).

10
EJERCICIO 10: Construir e interpretar la ecuación de regresión múltiple para
PUNTUACION TOTAL (VD) con NIVEL EDUCATIVO e INGRESOS como VIs.

Análisis de Regresión por pasos


A veces, no tenemos una idea clara de cuáles son las variables que debemos utilizar en la
ecuación predictiva, o simplemente nos interesa obtener la ecuación múltiple predictiva que menor
pronostica la variable dependiente. En este caso, una buena estrategia es emplear el análisis de
regresión por pasos. Esta técnica consiste en seleccionar un conjunto de variables independientes y
decirle a SPSS que las introduzca paso a paso en la ecuación de regresión si el coeficiente beta
resulta significativo, es decir, suficientemente interpretativo para pronosticar la variable
dependiente. Para ello, entramos de nuevo en Analizar  Regresión  Lineal. Ahora, introducimos
PUNTUACIÓN TOTAL en Dependiente y EDAD, NIVEL DE INGRESOS, NIVEL
EDUCATIVO, TIPO DE EMPLEO y TIPO DE RELIGIÓN en Independientes, y cambiamos
Método por Pasos suc. El resultado es el siguiente:

Variables introducidas/eliminadas(a)

Variables Variables
Modelo introducidas eliminadas Método
1

Por pasos
(criterio:
Prob. de F
para entrar
tipo empleo .
<= ,050,
Prob. de F
para salir
>= ,100).

Por pasos
(criterio:
Prob. de F
para entrar
edad .
<= ,050,
Prob. de F
para salir
>= ,100).

Por pasos
(criterio:
Prob. de F
Nivel de para entrar
.
ingresos <= ,050,
Prob. de F
para salir
>= ,100).

11
a Variable dependiente: Puntuación total

La tabla de arriba presenta las tres variables seleccionadas cuyos pesos han resultado significativos
para pronosticar la variable dependiente.
Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,212(a) ,045 ,042 8,637
2 ,301(b) ,091 ,084 8,443
3 ,329(c) ,108 ,099 8,376
a Variables predictoras: (Constante), tipo empleo
b Variables predictoras: (Constante), tipo empleo, edad
c Variables predictoras: (Constante), tipo empleo, edad, Nivel de ingresos

En esta tabla, aparece el coeficiente de correlación múltiple de cada modelo. Para el modelo
1, la correlación es simple, ya que es la correlación de la variable TIPO DE EMPLEO con
PUNTUACIÓN TOTAL en depresión. El modelo 2 supone que el coeficiente de correlación
múltiple ha aumentado después de añadir la variable EDAD, y el modelo 3 supone otro aumento
después de añadir la variable NIVEL DE INGRESOS.

ANOVA(d)

Suma de Media
Modelo cuadrados Gl cuadrática F Sig.
1 Regresión 1021,882 1 1021,882 13,699 ,000(a)
Residual 21633,173 290 74,597
Total 22655,055 291
2 Regresión 2054,352 2 1027,176 14,410 ,000(b)
Residual 20600,703 289 71,283
Total 22655,055 291
3 Regresión 2448,142 3 816,047 11,631 ,000(c)
Residual 20206,913 288 70,163
Total 22655,055 291
a Variables predictoras: (Constante), tipo empleo
b Variables predictoras: (Constante), tipo empleo, edad
c Variables predictoras: (Constante), tipo empleo, edad, Nivel de ingresos
d Variable dependiente: Puntuación total

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta T Sig.


1 (Constante) 7,545 ,619 12,180 ,000
tipo empleo 1,344 ,363 ,212 3,701 ,000
2 (Constante) 11,962 1,309 9,137 ,000
tipo empleo 1,696 ,367 ,268 4,624 ,000
Edad -,107 ,028 -,221 -3,806 ,000

12
3 (Constante) 14,226 1,613 8,822 ,000
tipo empleo 1,498 ,373 ,237 4,014 ,000
Edad -,117 ,028 -,240 -4,136 ,000
Nivel de ingresos -,081 ,034 -,138 -2,369 ,018
a Variable dependiente: Puntuación total

En la tabla de arriba aparecen las correspondientes ecuaciones de regresión múltiple para


cada uno de los tres modelos encontrados. Así, si utilizamos el coeficiente beta estandarizado, el
modelo 3 supone que un aumento de una unidad en el test de depresión depende de un cambio de
0,237 unidades en el TIPO DE EMPLEO, un decremento de -0.240 en la EDAD y un decremento
también de -0,138 en el NIVEL DE INGRESOS.

Variables excluidas(d)

Estadísticos de
colinealidad
Correlación
Modelo Beta dentro T Sig. parcial Tolerancia
1 Edad -,221(a) -3,806 ,000 -,218 ,936
Nivel de ingresos -,104(a) -1,747 ,082 -,102 ,931
nivel educativo -,051(a) -,827 ,409 -,049 ,879
tipo de religión ,023(a) ,401 ,688 ,024 1,000
2 Nivel de ingresos -,138(b) -2,369 ,018 -,138 ,912
nivel educativo -,082(b) -1,355 ,176 -,080 ,864
tipo de religión ,003(b) ,055 ,957 ,003 ,991
3 nivel educativo -,034(c) -,520 ,603 -,031 ,744
tipo de religión ,006(c) ,104 ,917 ,006 ,991
a Variables predictoras en el modelo: (Constante), tipo empleo
b Variables predictoras en el modelo: (Constante), tipo empleo, edad
c Variables predictoras en el modelo: (Constante), tipo empleo, edad, Nivel de ingresos
d Variable dependiente: Puntuación total

EJERCICIOS DE EVALUACIÓN:

EVALUACIÓN 1: Evaluar la fiabilidad en función de si el paciente tiene Médico de


Cabecera.

EVALUACIÓN 2: En el archivo de lectura, determina la función de regresión múltiple


utilizando LECTURA como variable dependiente y VOCABULARIO, CI y MEMORIA como
variables independientes.

EVALUACIÓN 3: Construye la mejor función de regresión para pronosticar la variable


LECTURA.

13

También podría gustarte