Está en la página 1de 26

Econometría

El coeficiente de determinación
El coeficiente de correlación

Fernando Gonzales Fernández


Bondad del ajuste

Suma Total de Cuadrados, STC

 (Y i −Y ) = (
2
 ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Ahora discutiremos la bondad del ajuste. Una medida de la variación de Y es la suma de las
desviaciones cuadradas alrededor de la media de la muestra, a menudo descrito como la suma
total de cuadrados, STC.
22
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Vamos a descomponer STC utilizando el hecho de que el valor verdadero de Y en cualquier


observación es igual a la suma de su valor ajustado y el residual.

23
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Sustituimos para Yi.

24
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Podemos volver a organizar la expresión como se muestra.

25
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Expandimos los términos al cuadrado en el lado derecho de la ecuación.

26
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

Expandimos el tercer término del lado derecho de la ecuación.

27
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

 Yˆ e
i i =0 e i =0

Los dos últimos términos son ambos cero, dado las propiedades de la recta de regresión
vistas anteriormente.

28
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

STC = SEC + SRC

 (Yi − Y ) = SEC, suma explicada de cuadrados


2
ˆ

Así, hemos demostrado que STC, la suma total de los cuadrados de Y se puede
descomponer en SEC, la suma “explicada” de cuadrados, y SRC, la suma residual
('inexplicable') de las cuadrados
29
Bondad del ajuste

ei = Yi − Yˆi  Yi = Yˆi + ei

 (Y i −Y ) = (
2
ˆ  2
ˆ 
Yi + ei − Y ) =  ( Yi − Y + ei )
2


=  (Yi − Y ) +  ei2 + 2 ( Yˆi − Y ei )
ˆ 2

=  (Yi − Y ) +  ei2 + 2 Yˆi ei − 2Y  ei
2
ˆ

STC = SEC + SRC

 (Yi − Y ) = SEC, suma explicada de cuadrados


2
ˆ

Las palabras explicada e inexplicable se ponen entre comillas porque la explicación puede
ser en realidad falsa. Y realmente podría depender de alguna otra variable Z, y X podría
actuar como un proxy para Z. Sería más seguro utilizar la expresión aparentemente
explicada en lugar de la explicada 29
Bondad del ajuste

 (Y −Y ) =  (Yi − Y ) +  ei2
2
i
2
ˆ STC = SEC + SRC

R =
2 SEC
=
 i
(Yˆ − Y ) 2

STC  (Yi − Y )2

El principal criterio de bondad del ajuste, formalmente descrito como el coeficiente de


determinación, mejor conocido como R2, se define como la relación de la SEC a la STC, es
decir, la proporción de la varianza de Y explicada por la ecuación de regresión.
31
Bondad del ajuste

 (Y −Y ) =  (Yi − Y ) +  ei2
2
i
2
ˆ STC = SEC + SRC

R =
2 SEC
=
 i
(Yˆ − Y ) 2

STC  (Yi − Y )2

Obviamente nos gustaría encontrar la línea de regresión para hacer que la bondad de ajuste
sea lo más alta posible. ¿Esto condiciona el uso de los mínimos cuadrados principales para
determinar b1 y b2?
32
Bondad del ajuste

 (Y −Y ) =  (Yi − Y ) +  ei2
2
i
2
ˆ STC = SEC + SRC

R =
2 SEC
=
 i
(Yˆ − Y ) 2

STC  (Yi − Y )2

R2 =
STC − SRC
= 1−
 ei
2

STC  (Yi − Y )2

Afortunadamente, no hay problema. Para ver esto, vuelva a escribir la expresión para R2 en
términos de SRC como se muestra.

33
Bondad del ajuste

 (Y −Y ) =  (Yi − Y ) +  ei2
2
i
2
ˆ STC = SEC + SRC

R =
2 SEC
=
 i
(Yˆ − Y ) 2

STC  (Yi − Y )2

R2 =
STC − SRC
= 1−
 ei
2

STC  (Yi − Y )2

Los coeficientes de regresión MCO se eligen de tal manera que se minimice la suma de los
cuadrados de los residuos. Por lo tanto se deduce automáticamente que maximizan R2.

34
Bondad del ajuste

R =
2 SEC
=
 i
(Yˆ − Y ) 2

=
 i
ˆ
y 2

STC  (Yi − Y ) 2
 i
y 2

R2 =
 i
ˆ
y 2

=
ˆ22  xi2
= ˆ22
i
x 2

y 2
i  i
y 2
 i
y 2

 S x2 
R = ˆ  2 
2 2
S 
2
 y

(  xy)
2
i i
R 2
=
x y 2
i
2
i

El R2 puede expresarse también de acuerdo a estas formulas. En la primera la vemos como


la razón entre lo estimado y lo observado. En la segunda como la razón entre las
independientes y la dependiente, medida por el coeficiente de regresión (b2). En la tercera
tiene que ver con las varianzas de Y e X. Y en la ultima respecto a la relación a la
34
correlación
Bondad del ajuste

Los diagramas muestran en a) Y no depende de X, R2=0; b) X afecta poco a Y R2=0,10; d) X


afecta a Y, R2=0,50; e) X afecta mucho a Y, R2= 0,90 f) X afecta en su totalidad a Y,
prácticamente son iguales R2=1
34
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yi − Y )  (Yˆ − Y )
2 2
ˆ
i
= = = R2
 (Y −Y )  (Y − Y )
2 2
i i

Otro criterio natural de bondad de ajuste es la correlación entre los valores reales y
estimados de Y. Vamos a demostrar que esto es maximizado usando los principio de
mínimos cuadrados para determinar los coeficientes de regresión
35
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yˆ − Y )2
 ( ˆ
Yi − Y )2

  
= (Y − Y ) (Yˆ −2 Y=) = ( Yˆ + e2 =− Y R
(Y −i Y )i )(Yˆi − Y )
i 2
 i (Y − Yi )
 i i

=  ( Yˆ − Y  + e )(Yˆ − Y )
i i i

=  (Yi − Y ) +  eiYˆi − Y  ei
2
ˆ

=  (Yi − Y )
2
ˆ

Vamos a comenzar con el numerador y el sustituto del valor real de Y en el primer factor.

36
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yˆ − Y )2
 ( ˆ
Yi − Y )2

  
= (Y − Y ) (Yˆ −2 Y=) = ( Yˆ + e2 =− Y R
(Y −i Y )i )(Yˆi − Y )
i 2
 i (Y − Yi )
 i i

=  ( Yˆ − Y  + e )(Yˆ − Y )
i i i

=  (Yi − Y ) +  eiYˆi − Y  ei
2
ˆ

=  (Yi − Y )
2
ˆ

Nos reorganizamos un poco.

37
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yˆ − Y )2
 ( ˆ
Yi − Y )2

  
= (Y − Y ) (Yˆ −2 Y=) = ( Yˆ + e2 =− Y R
(Y −i Y )i )(Yˆi − Y )
i 2
 i (Y − Yi )
 i i

=  ( Yˆ − Y  + e )(Yˆ − Y )
i i i

=  (Yi − Y ) +  eiYˆi − Y  ei
2
ˆ

=  (Yi − Y )
2
ˆ
 Yˆ e
i i =0 e i =0
Expandimos la expresión Los dos últimos términos son ambos cero (por las propiedades
de la recta de regresión)

38
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yˆ − Y )2
 ( ˆ
Yi − Y )2

  
= (Y − Y ) (Yˆ −2 Y=) = ( Yˆ + e2 =− Y R
(Y −i Y )i )(Yˆi − Y )
i 2
 i (Y − Yi )
 i i

=  ( Yˆ − Y  + e )(Yˆ − Y )
i i i

=  (Yi − Y ) +  eiYˆi − Y  ei
2
ˆ

=  (Yi − Y )
2
ˆ

Por lo tanto el numerador se simplifica a la suma de las desviaciones al cuadrado de los


valores ajustados.

39
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yi − Y )  (Yˆ − Y )
2 2
ˆ
i
= = = R2
 (Y −Y )  (Y − Y )
2 2
i i

Tenemos la misma expresión en el denominador, bajo una raíz cuadrada. Cancelando, nos
quedamos con la raíz cuadrada en el numerador.

40
Bondad del ajuste

 (Yi − Y )(Yˆi − Y )  (Yi − Y )


2
ˆ
rY ,Yˆ = =
 (Yi − Y )  (Yˆi − Y )  Yi − Y  (Yˆi − Y )
( )
2 2 2 2

 (Yi − Y )  (Yˆ − Y )
2 2
ˆ
i
= = = R2
 (Y −Y )  (Y − Y )
2 2
i i

Así, el coeficiente de correlación es la raíz cuadrada de R2. De ello se desprende que se


maximiza el uso de los principio de mínimos cuadrados para determinar los coeficientes de
regresión.
41
Bondad del ajuste

n X iYi − (  X )(  Y )
r=
 n X 2 − ( X )2   n Y 2 − ( Y )2 
  i  i    i  i 

Una forma diferente de presentar el coeficiente de correlación es la siguiente, a menudo es


muy usada pues no necesita presentar el desvio de las variables, sino lo hace de forma
directa.
Bondad del ajuste

En los diagramas de dispersión se observa como se comporta el coeficiente de correlación

También podría gustarte