Está en la página 1de 65

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

Fecha: 2007- 09- 06

Análisis de la regresión múltiple: problema de la estimación

Se analiza el modelo de tres variables: una dependiente y dos explicativas; y con modelos lineales en los parámetros, que puedan ser o no lineales en las variables.

“Cabe anotar que el texto de Damodar Gujarati, posee un diferenciación con la notación universal”.

Modelo de tres variables: notación y supuestos

La FRP:

parcial. Los supuestos fundamentales son:

Y

i

 

0

1

X

1

i

2

X

2

i

u

i

en donde

1

y

2

son los cocientes de regresión

Supuesto 1: El valor medio de las perturbaciones

u

i

es igual a cero.

E(u

i

\

X

1i

,

X

2i

)

= 0 Se habla de las perturbaciones, es decir distancias.

Supuesto 2: No existe autocorrelación entre las distribuciones

u

i

.

Cov(u

i

\

u

j

)

= 0 Cuando se habla de distribuciones queremos referirnos a una

curva de distribuciones.

Supuesto 3: Homoscedasticidad o igual varianza en las distribuciones de

(

Var u

i

)

=

2

u

i

.

Supuesto 4: La covarianza entre la distribución cero.

u i y cada variable X es igual a

(

Cov u

i

,

X

1i

)

=

Supuesto 5

(

Cov u

i

,

X

2i

)

= 0

El modelo de regresión está correctamente especificado

Supuesto 6

No hay multicolinealidad perfecta entre

X

1

y

X

2

.

“Cuando hay multicolinealidad, el software no nos proporciona un resultado” “En matrices para obtener los reagresores hay que dividir para los determinares de esa matriz.”

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 1

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

Linealmente Independientes: v 1 v 2 v v 1??? 2
Linealmente Independientes:
v
1
v
2
v
v
1???
2

Linealmente Dependientes:

Cuando dos vectores utilizan la misma línea de acción los dos son linealmente dependientes.

v 1
v
1

v

2

v

v

2

2

  2v v

2

1

1

0

Multicolinealidad perfecta existe cuando las variables dependientes.

X

1

1

i

X

2

2

i

0

X 1 i

 

2

1

X 2

i

Por ejemplo: si

Y X 2 X X X

i

2

i

0

1

i

1

1

i

2

2

1

i

i

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 2

X

1

y

X

2 son linealmente

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

Y

i

Y

i

Y

i

0

0

0

1

X

1

i

1

X

1

i

2

2

X

2

2

X

1

i

i

1

i

i

i

Donde

2

1

2

X

1

i

y

X 2

i sobre Y.

, no hay forma de estimar la influencia separada de

En la práctica, en los datos para el análisis empírico siempre habrá un nivel de correlación entre las variables explicativas; lo que re requieres es que no sean exactas.

Fecha: 2007- 09-11

Estimación de los Coeficientes de Regresión Parcial

Traer el ejercicio de la tabla 6.4

La FRP en este caso es la siguiente:

Y

i

 

0

1

X

1

i

2

X

2

i

u

i

Notación Universal:

respectivamente. En el texto de Damodar Gujarati existe una diferencia, en cuanto a la notación.

corresponden a la primera y segunda variable

1

y

2

La FRM es la siguiente:

ˆ

Y

i

0

1

donde

ˆ

Y

i

0

1

i

ˆ X

ˆ

X

2

1

ˆ ˆ

1

y

uˆ

i

Y Yˆ

i

i

.

X

2

i

i

ˆ

2

uˆ

X

i

2

,

i

,

Entonces, mediante la utilización del método de Gauss:

( u ˆ

2

)
i

)

ˆ

(

Y

i

2

 

1

ˆ

Y

i

)

( u ˆ

2

i

( Y

i

ˆ

X

1

i

ˆ

0

(

Y

i

0

Y n

i

0

ˆ ˆ

1

X

2

(

ˆ

ˆ

 

0

1

Y

i

X

1

ˆ

ˆ

 

0

1

i

ˆ

2

X

2

i

ˆ

2

X

2

1

i

ˆ

2

i

)

0

X

2

i

0

X

)(

1

i

1)

ˆ

2

X

0

2

i

)

2

Es necesario igualar a cero.

Y n

i

0

ˆ ˆ

1

X

1

i

ˆ

2

X

2

i

Primera Ecuación Normal

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 3

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

( u ˆ

i 2 )

ˆ

1

2

( Y

i

ˆ ˆ

 

0

1

X

1

ˆ

(

Y

i

0

ˆ

 

1

X

1

i

ˆ

2

X

2

i

X

Y i X

Y i

1

i

0

1 i

ˆ

0

ˆ

X

1

i

X

1

i

ˆ

1

ˆ

1

)(

X

X

2

i

1

X

2

i

1

i

ˆ

2

X

2

i

)(

X

1

i

)

0

1

i

)

ˆ

2

ˆ

2

0

X

X

2

i

X

1

i

2

i

X

1

i

0

Segunda Ecuación Normal

( ˆ

u

2 )

i

ˆ

2

2

( Y

i

X

X

X

ˆ

ˆ

(

Y

i

 

0

1

1

i

Y i X

2

i

0

2

i

Y

i

2 i

ˆ

0

X

2

i

ˆ

ˆ ˆ

 

0

1

X

1

ˆ

2

X

2

i

)(

X

ˆ

1

ˆ

1

X

1

i

X

1

i

ˆ

2

X

2

i

)(

X

2

i

)

0

2

i

)

0

i

X

2

i

X

2

i

ˆ

2

ˆ

2

X

2 0

2

i

X

2

2

i

Tercera Ecuación Normal

Resolviendo el sistema de ecuaciones llegamos a:

“En el semestre pasado teníamos dos ecuaciones con dos incógnitas, ahora tenemos tres ecuaciones y tres incógnitas su resolución es imposible. Para resolver se debe hacer desviaciones con respecto a la media.”

ˆ Y ˆ X ˆ X

0

1

1

2

2

ˆ

1

y

i

x

1

i

x

2

2

i

y x

i

2

i



x

1

i

x

2

i

 

x

2

1

i



x

2

2

i

x

1

i

x

2

i

2

 

ˆ

2

y

i

x

2

i

x

2

1

i

y x

i

1

i



x

1

i

x

2

i

 

2

x 1 i



x

2

2

i

x

1

i

x

2

i

2

Varianzas y errores estándar de los coeficientes de regresión parcial

ˆ

Var (

0

)

 

1

X

2

1

x

2

2 i

X

2

2

x

2

i

1

2

X X

1

2

x

1

i

x

2

i

2

n

 



 

x

2

1 i

x

2

2

i

x

1

i

x

2

i

2

ˆ

Var (

1

)

 

2

2 i

x

2

 

x

2

2i

 

 

2

x

1 i



2

2

x

i

x

1

i

x

2

i

2

 

va a ser pasado a dividir.

2 r 12     x 2 x 2    
2
r 12
 

x
2
x
2
 
 
1 i
2
i

 

x

1

i

      x 1 i x 2   i  2 

x

2

 

i

2

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 4

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

ˆ

2

2

Var (

1

)

2

1 i

x

 

x

1

i

x

2

i

2

 

2

*

1

 

x

1

i

x

2

i

2

2

1 i

x

x

1 i

 

2

x

1 i



x

2

2

i

Var (

ˆ

1

)

2

 

x

2

1 i



1

2

12

r

ˆ

Var (

2

)

 

2

1 i

x

2

   

 

2

x

1 i



2

2

x

i

x

1

i

x

2

i

2

 

ˆ

 

 

Var

(

2

)

2

2

x 2 i



1

2

12

r

Cov (

ˆ ˆ

,

 

1

2

 

)

 

 

2

12

r

2

 

(1

2

12

r

)

x

2

1 i

1/ 2

x

2

2 i

1/ 2

2   u i ˆ 2  ˆ ( n  3)
2  
u i
ˆ 2
ˆ
(
n 
3)

Es 3 por que tenemos tres regresores.

Propiedades de los estimadores de MCO

1. La recta de regresión pasa por las medias de

Y , X

1

, X

2

; en general:

Yi X X

0

1

1

i

2

2

i

k

X

ki

u

i

ˆ

0

Y

ˆ X

1

1

ˆ X

2

2

 

ˆ X

k

k

 

2.

La media de Yˆ es igual a la media de los Y observados Y .

ˆ

Yi

ˆ ˆ

0

1

X

1

i

ˆ

2

X

2

i

 

ˆ

Yi

( ˆ ˆ ) ˆ

Y

1

X

1

2

X

2

1

X

1

i

ˆ

2

X

2

i

Yˆi

ˆ

 

Y

1

X

1

i

X

1

ˆ

2

X

2

i

X

2

 

ˆ

Yi

 ˆ ˆ

Y

1

x

1

i

2

x

2

i

 

ˆ

Yi

nY

ˆ

1

x

1

i

ˆ

2

x

2 i

 

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 5

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

  0  x x 1  0 i 2 i Yˆi  nY
 0
 x
x 1
0
i
2
i
Yˆi  nY
1
ˆ
Y  Y
n
i

Nota:

 

ˆ

Y

i

 ˆ ˆ

Y

1

x

1

i

2

x

2

i

 

y ˆ

i

ˆ ˆ

1

x

1

i

2

x

2

i

 

y

i

yˆ

i

uˆ

i

 

y

i

ˆ

1

1

i

2

ˆ x

x

2

i

uˆ

i

   

3. La media de los residuos

uˆ

i es cero.

2

i

Y

i

2

i

0

2

Y

i

 

0

1

Y Y  0

u ˆ

i

i

i

0

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Y

i

Y

i

X

1

i


 

Y

i

0

2

X

2

i

0

1

X

1

i

1

2

X

1

X

2

i

i

Página 6

2

1

X

2

i


0

2

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

4. Los residuos

uˆ

i no están correlacionados con los residuos

X 1

i y

X

2

i

2

 

u

i

1

Y

 

i

0

Y

Y

i

i

u

i X

1

i

0

 

u

2

i

2

2

2

 

 

Y

i

0

1

X

1

i

1

X

1 i

X

1

i

0

2

X

2

i

X

1

i

0

Y

i

 

0

1

X

1

i

2

X

2

i

Y

Y

i

i

 

 

0

Y

1

i

X

2 i

i X

u

2

i

0

X

1

i

0

2

X

2

i

X

2

i

0

2 X

2

i

 

X 0

1

i

X 0

2

i

5.

Los residuos

uˆ

i

no están correlacionados con

y

i

i

y

y i

1

x

1

i

2

x

2

i

i

 

x

1

1

i

x

2

2

i

i

1

 

y

i

 

i

1

x

1 i

0

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

x

1

i

2

x

2

i

Página 7

Yˆ

i

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

2

x

2 i

0

y

i

i

0

6. De las ecuaciones para obtener las varianzas de

acerca

multicolinealidad perfecta.

a

1,

las

varianzas

Fecha: 2007- 09-15

aumentan

y

tienden

ˆ ,ˆ

1

2

hacia

se observa que a medida que

el

infinito,

que

es

el

caso

2

12

r

de

se

la

Coeficiente de Determinación R 2 : Mide el porcentaje de explicación de las variables independientes sobre la dependiente, es decir indica cuán cerca está Yˆ de Y:

STC = SEC +SRC

y

i 2

R

2

y ˆ

i 2

SEC

y ˆ

u ˆ

2

i

i 2

STC

y

2

i

Si SRC = 0

SEC =

STC

R

Si SRC ≠ 0

SEC < STC

R

2

2

1

Ajuste perfecto.

1

Porcentaje de ajuste.

0  R  2 1 STC  SRC R 2  STC u i
0
 R 
2
1
STC
 SRC
R
2
STC
u i
ˆ 2
ˆ
2  
(
n 
3)
y i
2
Sy
2  
(
n 
1)
 

u ˆ

2

i

 

SRC

 

1

 

1

 

 

2

STC

 

y

i

 

uˆ

2

(n 3)ˆ

2

 

i

y

2

(n

2

i

1)Sy

 
( n  3) ˆ  2 R 2   1 ( n 
( n 
3) ˆ
2
R
2
 
1
( n
 1)
Sy
2

La raíz cuadrada de R 2 es el coeficiente de correlación, que es una medida del grado de asociación entre Y, y todas las variables explicativas conjuntamente, que en la práctica tiene poca importancia.

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 8

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

El R 2 ajustado (

R

2

)

Una propiedad importante del R 2 es que a medida que aumenta el número de variables explicativas, aumenta casi invariablemente hacia 1.

R  

2

1

SRC

STC

1

u ˆ

2

i

y

2

i

La

si en un modelo aumenta, la

aumenta el número de variables explicativas, disminuye.

y

2

i

Y

i

Y

2 , es independiente del número de variables explicativas; es decir

y

2

i

permanece constante. Pero la

u ˆ

2

i

a medida que

Para comparar dos R 2 se debe tomar en cuenta el número de variables explicativas en el

modelo; esto se puede hacer con el R 2 ajustado (

R

2

).

R  

2

1

ˆ

u

2

i

/(

n k /(

n

)

y

2

i

1)

Donde k es igual al número de regresores en el modelo incluyendo la intersección. El

término ajustado significa ajustado por los grados de libertad.

R

2

 

1

ˆ

2

Sy

2

Donde

de Y.

ˆ

2

es la varianza homocedástica de la regresión y

R  

2

1

SRC

/(

n k

)

STC

/(

n

1)

 

1

(

STC

SEC

)/(

n

k

)

STC

/(

n

1)

Sy

2 es la varianza muestral

R  

2

1

R

2

 

1

  1 SEC   1

n

 

STC

n k

1

R

2

n

1

 

n

k

Si k=1es decir el modelo sin intersección de la regresión simple

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 9

(ˆ 0); R

1

2

R

2

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

Si k>1 a medida que aumenta el número de variables explicativas el menos que el R 2 .

R

2

aumenta

En

términos generales, la finalidad de un modelo de regresión no es maximizar el R 2 .

Un

R 2 elevado no es evidencia en favor del modelo, y un R 2 bajo no es evidencia en su

contra.

Ejemplo: Considerando la información de la tabla 6.4:

EQ01: MI C PIB TAF

MI = 263,6416 0,005647PIB 2,231586TAF

(11,59318)

22,74109

R 2 = 0,707665

(0,002003)

(0,209947)

-2,818703

-10,62927

R

2

=

0,698081

Incrementos en el PIB y en el TAF ejercen impactos negativos en la MI. Si el PIB se incrementa en 100usd, manteniendo a la TAF constante, el número de muertes de niños menores de 5 años se reducirá 5,6 por cada 1000 nacimientos vivos.

Si la TAF sube en un 1% manteniendo al PIB constante, el número de muertes de niños

menores de 5 años disminuirían a 2,23 por cada 1000 nacimientos vivos.

se

visualizar.

coeficientes de regresión parcial, veamos como se puede

1

y

2

conocen

como los

Eliminemos la influencia que TAF ejerce sobre la mortalidad infantil y el PIB.

EQ02: MI C TAF

MI = 263,8635 2,390496TAF

(12,22499)

21,58395

R 2 = 0,669590

(0,213263)

-11,20917

R

2

=

0,664261

EQ03: PIB C TAF

PIB = -39,30328 + 28,14268TAF

(734,9526)

(12,82111)

-0,053477

2,195027

R 2 = 0,072108

R

2

=

0,057142

Si ahora se hace la regresión de R02 SOBRE R03,

influencia de TAF.

Daniel Carrasco. Felipe Lemarie. Jorge Salgado. Juan C. Serrano.

Página 10

que están purificadas de la

31/01/2008

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA II ECONOMISTA LINCOLN MAIGUASHCA

EQ04: R02 R03

R02 = -0,005647R03

(0,001971)

-2,864538

R 2 = 0,115238

R

2

=

0,115238

Que es el regresor del PIB en la regresión multivariada (EQ01). Por otro lado, eliminando la influencia que el PIB ejerce sobre la MI y TAF.

EQ05: MI C PIB

MI = 157,4244+ 0,011364PIB

(9,845583)

15,98935

R 2 = 0,166217

(0,003233)

-3,515661

R

2

=

0,152769

EQ06: TAF C PIB

TAF = 47,59716 + 0,002562PIB

(3,555330)

(0,001167)

13,38755

2,195027

R 2 = 0,072108

R

EQ07: R05

R06

2

=

0,057142

R05 = -2,231586 R06

(0,206588)

-10,80212

R 2 = 0,649388