Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inteligencia
Horas de estudio
Nivel social
Calificacin
Sexo
Supongamos que deseamos conocer la incidencia del conjunto de variables (Inteligencia, Horas
de estudio y Nivel Social) sobre las calificaciones obtenidas. Nos dirigimos al comando
regresin/lineal y hacemos la siguiente seleccin
Nos ofrece el siguiente conjunto de resultado que iremos desmenuzando. Comencemos por el
resumen del modelo:
Resumen del modelo
Modelo
1
R
,950a
R cuadrado
,902
R cuadrado
corregida
,884
Error tp. de la
estimacin
,58900
El modelo explica un 90.2%, que una vez corregido por el efecto de la muestra y de las variables
independientes resulta ser 88.4%. Por otro lado, el error tpico de la estimacin (raz cuadrada de
la varianza no explicada) resulta ser de 0.589.
La prueba de anlisis de la varianza, que nos muestra si la varianza explicada por la regresin es
significativamente distinta ( y superior) a la varianza no explicada es:
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
51,101
5,551
56,652
gl
3
16
19
Media
cuadrtica
17,034
,347
F
49,100
Sig.
,000a
Coeficientesa
Modelo
1
(Constante)
Inteligencia
Horas de estudio
Nivel Social
Coeficientes no
estandarizados
B
Error tp.
-6,938
1,335
7,729E-02
,014
,196
,027
,290
,163
Coeficient
es
estandari
zados
Beta
,597
,580
,200
t
-5,197
5,350
7,272
1,787
Sig.
,000
,000
,000
,093
Siendo:
Y: Calificacin acadmica
X1: Inteligencia
X2: Horas de estudio
X3: Nivel Social
Tal como est expresada la ecuacin anterior parecera que la Inteligencia tiene poca
importancia. Se debe a que la magnitud de su escala es mucho ms alta que las restantes
variables y su peso especfico por unida es menor. No obstante, la ecuacin de regresin en
estandarizadas nos mostrar todas las variables en la misma dimensin. As:
Se observa que aqu el peso especfico de la Inteligencia es superior a los restantes. Si nos
atenemos al valor de t que nos indica la significacin estadstica de los distintos coeficientes
observaremos un valor mximo para la Horas de estudio (t=7.272), seguido de la Inteligencia
(t=5.35), y por ultimo le nivel social (t=1.787).
Variables introducidas/eliminadas
Modelo
1
Variables
introducidas
Variables
eliminadas
Inteligencia
Horas de
estudio
Mtodo
Por
pasos
(criterio:
Probabili
dad de F
para
entrar <=
,050,
Probabili
dad de F
para salir
>= ,100).
Por
pasos
(criterio:
Probabili
dad de F
para
entrar <=
,050,
Probabili
dad de F
para salir
>= ,100).
Se nos indica las opciones que hay por defecto (subcuadro de dilogo opciones). Para entrar una
variable debe ser inferior a una significacin de 0.05 y para salir, superior a 0.1.
En la siguiente tabla aparecen las variables que configuran los diferentes modelos:
Resumen del modelo
Modelo
1
2
El primer modelo est formado slo con el predictor Inteligencia y al segundo se le aade la
variable Horas de estudio. El primer modelo explica una proporcin de 0.577, y el segundo de
0.882, lo que implica una mejora de 0.305 puntos. Vemos ms cosas, tales como los cambios en
el cociente F, grados de libertad y la significacin de F.
Adems se nos proporciona un anlisis de la varianza para cada uno de los modelos:
ANOVAc
Modelo
1
Regresin
Residual
Total
Regresin
Residual
Total
Suma de
cuadrados
32,695
23,957
56,652
49,994
6,658
56,652
gl
1
18
19
2
17
19
Media
cuadrtica
32,695
1,331
24,997
,392
F
24,565
Sig.
,000a
63,824
,000b
Modelo
1
2
Horas de estudio
Nivel Social
Nivel Social
Beta dentro
,553a
,046a
,200b
t
6,646
,207
1,787
Sig.
,000
,839
,093
Correlacin
parcial
,850
,050
,408
Estadstic
os de
colinealid
ad
Tolerancia
,999
,505
,487
Se observa que en el primer modelo, las Horas de estudio tenan un peso importante (t=6.646),
cosa que no ocurre con el Nivel social ni un modelo ni con el otro, por lo que es definitivamente
eliminada. Otros estadsticos tales como correlacin parcial y colinealidad lo trataremos en las
prximas pginas.
Las correlaciones parciales y semiparciales tienen especial inters por permitir conocer las
contribuciones especificas de las distintas variables al margen al margen de lo que comparten
con otras variables. Frecuentemente las predictores estn correlacionados entres s y es
importante saber deslindar lo que aportan unos y otros. No es fcil saber a donde atribuir la parte
compartida, y frecuentemente son criterios tericos sustantivos del tema en cuestin- y no
criterios estadsticos los que nos permiten asignar las contribuciones de los diferentes regresores
a la explicacin de la variable dependiente.
Vamos a ver en primer lugar el conjunto de correlaciones existentes en estos datos. Vamos la
comando Correlaciones/bivariadas:
Inteligencia
Inteligencia
Horas de estudio
Nivel Social
Calificacin
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
,038
,873
20
,703**
,001
20
,760**
,000
20
Horas de
estudio
-,108
,651
20
,581**
,007
20
Nivel Social
Calificacin
,557*
,011
20
Veamos qu ocurre ahora si eliminamos de todas las variables la variabilidad que aporta la
Inteligencia. Vanos para ello al comando Correlaciones/parciales:
- - -
P A R T I A L
Controlling for..
C O R R E L A T I O N
C O E F F I C I E N T S
- - -
INT
HORAS
NSOCIAL
CALIF
HORAS
1,0000
(
0)
P= ,
-,1895
(
17)
P= ,437
,8498
(
17)
P= ,000
NSOCIAL
-,1895
(
17)
P= ,437
1,0000
(
0)
P= ,
,0500
(
17)
P= ,839
CALIF
,8498
(
17)
P= ,000
,0500
(
17)
P= ,839
1,0000
(
0)
P= ,
Obsrvese el poco efecto que tiene ahora el Nivel social sobre la variable Calificacin. Los
clculos han consistido en eliminar tanto de la variable dependiente (Calificacin) como del
regresor Nivel Social, la variabilidad de la Inteligencia. Es una correlacin, digamos, entre los
residuos de ambas variables una vez eliminada de ellas la participacin de la Inteligencia.
10
11
Obtendremos:
a
Coeficientes
Coeficient
es
Coeficientes no
estandari
estandarizados
zados
Modelo
B
Error tp.
Beta
1
(Constante)
-4,922
2,629
Inteligencia9,423E-02
,029
,727
Nivel Social6,637E-02
,321
,046
t
-1,872
3,283
,207
Correlaciones
Sig.
Orden cero Parcial Semiparcial
,078
,004
,760
,623
,517
,839
,557
,050
,033
Obsrvese como la correlacin simple (de orden cero) de Nivel social con Calificacin es 0.557,
la parcial la observada en la tabla anterior y la semiparcial 0.033. Esto significa que la variable
Nivel social contribuye (ella sola, sin lo que comparte con Inteligencia) en una proporcin de
0.0332 = 0.001, o sea 0.1% a las calificaciones. Por el contrario, la Inteligencia, cuando se le
elimina lo que comparte con Nivel social, sigue contribuyendo en un 0.5172 = 26.72% a las
Calificaciones.
Conviene aclarar la diferencia entre correlacin semiparcial y parcial. Supongamos que tenemos
dos regresores X1 y X2, correlacin semiparcial (al cuadrado) de la variable X2 es la proporcin
de variabilidad de Y debida exclusivamente a X2. Es lo que aporta X2 a X1 hasta llegar a R2y.12.
Ms formalmente:
2
y 2.1
R y2.12 R y21
1 R y21
1 Ri2
Siendo Ri2 la correlacin multiple alcuadrado de dicho regresor con los restantes.
Para que haya multicolinealidad dicha correlacin ha de ser alta, o lo que es lo mismo la
tolerancia baja. Adems otro ndice relacionado con ste y que nos da una idea del grado de
aumento de la varianza se denomina Factor de Inflacin de la Varianza, y es precisamente el
recproco de la tolerancia. Su valor es:
VIFi =
1
1 R y21
Para que no haya multicolinealidad el denominador tiene que valer cerca de la unidad, por tanto
un poco ms de 1 el valor de VIF. Cuanto mayor sea de este valor mayor multicolinealidad
habr.
La varianza de los estimadores tiene que ver con (XX)-1, donde X es la matriz de regresores.
Cuando las columnas de X son colineales, la matriz es singular y no tiene inversa. En este
sentido los autovalores de la matriz XX (normalizada) nos puede proporcionar informacin del
grado de singularidad de la misma. A este respecto, disponemos del Indice de Condicin, cuyo
valor es la raz cuadrada del cociente entre el mximo autovalor y el mnimo de la matriz XX:
Indice de condicin =
Autovalormax
Autovalormin
Se considera que a partir de un valor de 20 hay cierta multicolinealidad y que sta es alta a partir
de 30.
Podemos conocer adems qu variables presentan multicolinealidad analizando la proporcin de
varianza de los estimadores de los coeficientes de regresin en los componentes con un ndice de
condicin alto. Variables, cuya proporcin de varianza en dichos componentes, sea superior a 0.5
son indicativos de colinealidad.
13
Coeficient
es
Coeficientes no
estandari
estandarizados
zados
Modelo
B
Error tp.
Beta
1
(Constante)
-6,938
1,335
Inteligencia
7,729E-02
,014
,597
Horas de estudio
,196
,027
,580
Nivel Social
,290
,163
,200
t
-5,197
5,350
7,272
1,787
Sig.
,000
,000
,000
,093
Estadsticos de
colinealidad
Tolerancia
FIV
,492
,963
,487
2,031
1,039
2,052
Se observa que se ha aadido a lo que ya conocemos otros indicadores tales como la Tolerancia
y el FIV. La variable Horas d estudio presenta una alta tolerancia y por tanto una pequea FIV,
lo que nos indica que no presenta colinealidad. Por el contrario las otras dos variables,
Inteligencia y Nivel social son colineales.
En esta tabla se nos indica qu variables son colineales pero no con cuales, aunque con tres
variables y una que no lo es, no es difcil imaginarse lo que pasa. Pero puede haber ms
variables. Para ello recurrimos al Indice de condicin y a la proporciones de varianzas en los
distintos componentes. As:
14
Diagnsticos de colinealidada
Modelo
1
Dimensin
1
2
3
4
Autovalor
3,840
,119
3,742E-02
4,023E-03
Indice de
condicin
1,000
5,685
10,129
30,893
(Constante)
,00
,00
,09
,91
Proporciones de la varianza
Horas de
Inteligencia
Nivel Social
estudio
,00
,01
,00
,00
,29
,29
,02
,70
,30
,97
,00
,41
Se<observa que hay un ndice de condicin asignado al cuarto componente que vale 30.893,
resultado de dividir 3.840 entre 0.004023 y extraer la raz cuadrada. En ese componente hay dos
variables con una alta proporcin: la constante, Inteligencia. El Nivel social no llega a rebasar el
umbral de 0.5. La constante es el estimador del coeficiente ligado a la primera variable de la
matriz X, que est formado precisamente por un vector de 1. Si trabajamos con variables
centradas, resolveremos algunos problemas de multicolinealidad. As si restamos a cada una de
las variables explicativas su media y realizamos de nuevo la regresin, obtendremos en
diagnsticos de colinealidad:
Diagnsticos de colinealidada
Modelo
1
Dimensin
1
2
3
4
Autovalor
1,707
1,011
1,000
,282
Indice de
condicin
1,000
1,299
1,306
2,461
Proporciones de la varianza
(Constante)
INT2
HORAS2 NSOCIAL2
,00
,14
,00
,14
,00
,01
,93
,00
1,00
,00
,00
,00
,00
,85
,07
,86
Se observa que el mayor ndice de condicin es muy bajo (2.461) y por tanto no hay
multicolinealidad, al menos en un sentido importante, que altere la estimacin mnimo cuadrtica
de nuestro modelo.
15