P. 1
El análisis de correlación en la regresión múltiple

El análisis de correlación en la regresión múltiple

4.4

|Views: 10.042|Likes:
Publicado porjjgibaja
Transparencias para un curso de regresión lineal múltiple
Transparencias para un curso de regresión lineal múltiple

More info:

Published by: jjgibaja on Nov 11, 2007
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PPT, PDF, TXT or read online from Scribd
See more
See less

06/25/2013

pdf

text

original

Análisis de correlación en regresión múltiple

Calidad del modelo de ajuste
• Si SCR = 0 el modelo de ajuste será perfecto.
ˆ SCR = 0 ⇒ e' e = 0 ⇒ e = 0 ⇒ Y = Y

• Si SCR ≠ 0 el modelo de ajuste no será perfecto. El vector de los residuos no será nulo y, en consecuencia, los valores observados y estimados serán diferentes entre sí.

Calidad del modelo de ajuste (II)
• Si SCR es pequeña, la calidad del modelo de ajuste será buena pero ¿cómo sabremos si SCR es grande o pequeña? • Tendremos que comparar SCR con otra “suma de cuadrados”. Para obtener esa otra suma llevaremos a cabo un análisis de la desviación de cada observación respecto a la media.

Análisis de la desviación de cada observación
• Dada una observación cualquiera podemos expresar la desviación de la variable dependiente respecto a la media del siguiente modo:

yi − y
• Esta desviación la podemos descomponer en dos partes:

ˆ ˆ yi − y = ( y i − y ) + ( yi − y i )

Análisis de la desviación de cada observación (II)
• •

variables explicativas ˆ • yi − yi es el residuo o la desviación que no explican las variables explicativas

yi − y es la desviación respecto a la media ˆ yi − y es la desviación que es explicada por las

Cuadrados de las desviaciones
• Si calculamos los cuadrados de las desviaciones:

( yi − y )

2

ˆ i − y ) 2 + ( yi − yi ) 2 + 2( yi − y )( yi − yi ) ˆ ˆ ˆ =(y

• Esta expresión se cumple para todos los individuos. Por tanto, si las sumamos para todos ellos:

∑( y
i =1

n

i

ˆ ˆ ˆ ˆ − y ) = ∑ ( yi − y ) + ∑ ( yi − yi ) + 2∑ ( yi − y )( yi − yi )
2 2 2 i =1 i =1 i =1

n

n

n

Sumas de cuadrados de las desviaciones
• Pero, como se puede comprobar fácilmente,
ˆ ∑( y
i =1 n i

ˆ − y )( yi − yi ) = 0

• Y en consecuencia:

ˆ ˆ ( yi − y ) 2 = ∑ ( y i − y ) 2 + ∑ ( yi − yi ) 2 ∑
i =1 i =1 i =1

n

n

n

Sumas de cuadrados de las desviaciones (II)
• Suma total de cuadrados (STC): es una medida de la variabilidad de la variable dependiente cuando no tomamos en consideración la información que nos proporcionan las variables explicativas.

( yi − y ) 2 ∑
• Suma de cuadrados de los residuos (SCR): es una medida de la variabilidad de la variable dependiente cuando tomamos en consideración la información que nos proporcionan las variables explicativas. n
i =1

n

ˆ ( y i − yi ) 2 ∑
i =1

• Suma de cuadrados explicada (SCE): es la parte de la variabilidad de la variable dependiente que es explicada por las variables n independientes. 2

ˆ ∑( y
i =1

i

− y)

Sumas de cuadrados de las desviaciones (III)

∑( y
i =1

n

i

− y)

2

( yi − y ) 2 ∑ˆ
i =1

n

ˆ ( y i − yi ) 2 ∑
i =1

n

Coeficiente de determinación
• Es la proporción de la variabilidad de la variable dependiente que queda explicada por las variables independientes:
SCE SCR R = = 1− = 1− STC STC
2

ˆ ( yi − yi ) 2 ∑

n

( yi − y ) 2 ∑
i =1

i =1 n

0 ≤ R ≤1
2

Coeficiente de determinación (II)
• Es una medida de la calidad del ajuste:
– Si R 2 ≈ 0 la calidad del ajuste no es buena y, en principio, las variables explicativas no explican la variabilidad de la variable dependiente. – Si R 2 ≈ 1 la calidad del ajuste es buena y, en principio, las variables explicativas explican la variabilidad de la variable dependiente.

Coeficiente de determinación (III)
• Cuando añadimos una nueva variable explicativa al modelo de ajuste R2 siempre aumenta (¿por qué?):
R 2 ( X 1 ,..., X j ) ≤ R 2 ( X 1 ,..., X j , X j +1 )

• Para poder comparar modelos con un número diferente de variables explicativas utilizaremos otro coeficiente al que llamaremos coeficiente de determinación corregido (o ajustado).

Coeficiente de determinación corregido
ˆ ( yi − yi ) 2 ∑
i =1 n n

R = 1−
2

n − k −1

( yi − y ) 2 ∑
i =1

s2 = 1− 2 sy

n −1

cuenta la información de las variable explicativas. •
2 sy

s 2 : varianza estimada de la variable dependiente cuando tomamos en

: varianza estimada de la variable dependiente cuando no tomamos en cuenta la información de las variables explicativas.

Coeficiente de correlación parcial
(k=2)

RY2 / X 1 : Porcentaje de variación explicado por X1

1 − RY2 / X 1 : Porcentaje de variación no explicado por X1 • RY2 / X 1 , X 2 : Porcentaje de variación explicado por el conjunto {X , X } • 1 2 RY2 / X 1 , X 2 − RY2 / X 1 : Diferencia entre los porcentajes de variación •
explicados por X1 y por el conjunto {X1, X2}
2 1 − RY / X 1 , X 2 2 2 RY / X 1 , X 2 − RY / X 1 2 1 − RY / X 1

R

2 YX 2 / X 1

= 1−

1− R

2 Y / X1

=

Coeficiente de correlación parcial(II)
(k=2)
2 RYX 2 / X1 = 1 − 2 1 − RY / X1 , X 2

1− R

2 Y / X1

=

2 2 RY / X 1 , X 2 − RY / X1 2 1 − RY / X 1

2 1 − RY / X 1

2 1 − RY / X 1 , X 2

RY2 / X 1

RY2 / X 1 , X 2

Coeficiente de correlación parcial(III)
(k=2)
2 RYX 2 / X1 = 1 − 2 1 − RY / X1 , X 2

1− R

2 Y / X1

=

2 2 RY / X 1 , X 2 − RY / X1 2 1 − RY / X 1

2 1 − RY / X 1

2 1 − RY / X 1 , X 2

2 RY2 / X 1 , X 2 − RY / X 1

Coeficiente de correlación parcial
(caso general)

2 RY / X 1 ,..., X j−1 : Porcentaje de variación explicado por el conjunto {X1,..., Xj-1}

1 − RY2 / X 1 ,..., X j −1 : Porcentaje de variación no explicado por {X1,..., Xj-1} •
2 RY / X 1 ,..., X j : Porcentaje de variación explicado por {X ,..., X , X } • 1 j-1 j 2 RY2 / X 1 ,..., X j − RY / X 1 ,..., X j−1 • : Diferencia entre los porcentajes de variación

explicados por {X1,..., Xj-1 , Xj} y por {X1,..., Xj-1}
2 1 − RY / X 1 ,..., X j 2 2 RY / X 1 ,..., X j − RY / X 1 ,..., X j−1 2 1 − RY / X 1 ,..., X j−1

2 RYX j / X 1 ,..., X j−1 = 1 −

1− R

2 Y / X 1 ,..., X j −1

=

Coeficiente de correlación parcial (II)
(caso general)
2 RYX j / X1 ,..., X j −1 = 1 −

1 − RY2 / X1 ,..., X j
2 1 − RY / X1 ,..., X j −1

=

2 2 RY / X1 ,..., X j − RY / X1 ,..., X j−1 2 1 − RY / X 1 ,..., X j−1

2 1 − RY / X 1 ,..., X j−1

2 1 − RY / X1 ,..., X j

2 RY / X 1 ,..., X j−1

2 RY / X 1 ,..., X j

Coeficiente de correlación parcial (III)
(caso general)
2 RYX j / X1 ,..., X j −1 = 1 −

1 − RY2 / X1 ,..., X j
2 1 − RY / X1 ,..., X j −1

=

2 2 RY / X1 ,..., X j − RY / X1 ,..., X j−1 2 1 − RY / X 1 ,..., X j−1

2 1 − RY / X 1 ,..., X j−1

2 1 − RY / X1 ,..., X j

2 RY / X 1 ,..., X j − RY2 / X 1 ,..., X j−1

Coeficiente de correlación parcial (IV)
(caso general)

2 rYj = RYX j / X 1 ,..., X j −1 = 1 −

2 1 − RY / X 1 ,..., X j

1− R

2 Y / X 1 ,..., X j −1

=

2 2 RY / X1 ,..., X j − RY / X1 ,..., X j−1 2 1 − RY / X 1 ,..., X j −1

Ejercicio
En el ejemplo de los alquileres, calcular los coeficientes de correlación parcial de las variables explicativas.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->