Está en la página 1de 71

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

UNIVERSIDAD NACIONAL DE COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIVERSIDAD DISTRITAL FRANCISCO JOSE DE CALDAS

FACULTAD DE INGENIERIA

NOTAS ECONOMETRIA

I. INTRODUCCIÓN

a. Econometría: (Medición en la economía) Es la aplicación de métodos estadísticos y matemáticos al análisis de datos económicos, con el fin de confrontar empíricamente la teoría (Económica).

Pero, ¿Qué es la economía?

Nota: En el momento de usar las herramientas aprendidas en Estadística I y II en datos económicos estamos haciendo econometría, pero no basta con hacer un intervalo de confianza, o correr una regresión, es necesario que todo lo que hagamos este soportado por la teoría económica:

Teoría Económica Confrontación
Teoría
Económica
Confrontación

Datos

No son los datos los que arman la teoría sino que a partir de la teoría se intenta hacer investigación empírica. Es decir, intentar a través de un conjunto de datos verificar aquellas relaciones que se deben dar, de acuerdo al cuerpo teórico en el cual estamos.

Ejemplo 1. Engel

Gasto alimentos vs. Y

% GASTO ALIMENTO
% GASTO
ALIMENTO

Tomo o utilizo una muestra, donde se tiene la siguiente información

1

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Notas Econometría Profesores: Carlos E. Melo y Oscar O. Melo 1 Y= Ingreso Gasto alimento 2

1

Y= Ingreso

Gasto alimento

Carlos E. Melo y Oscar O. Melo 1 Y= Ingreso Gasto alimento 2 % GASTO ALIMENTO

2

% GASTO

ALIMENTO

3 Gasto total

Y1 Y= Ingreso Gasto alimento 2 % GASTO ALIMENTO 3 Gasto total b. Un poco de

b. Un poco de Historia.

Históricamente la aplicación de muestras estadísticas a datos económicos se da por primera vez en 1699 por Charles Davemant, que fue un programa de demanda empírica, 1907 Rodolfo Emiri realiza estudios de demanda, pero es a partir de 1930 con la conformación de la Sociedad Econométrica y posterior publicación de la revista Econometrics que tiene un impulso importante el uso de métodos estadísticos y matemáticos dentro de la economía, desarrollo que toma gran auge después de mitad de siglo y con la aparición del computador.

El intento de un econometrista es describir el mundo (fenómeno), y una forma de aproximarse a esta descripción es mediante un modelo.

Ejemplo 2. Comportamiento el ingreso en latino América.

Ejemplo 2. Comportamiento el ingreso en latino América. !! No es que el fenómeno se comporte

!! No es que el fenómeno se comporte como una gamma si no que la gamma se aproxima bastante bien a la realidad.

Ejemplo 3. Relación Gasto Ingreso El fenómeno son los puntos. G = a +βY
Ejemplo 3. Relación
Gasto
Ingreso
El fenómeno son los puntos.
G = a +βY

2

Notas Econometría

Este modelo se aproxima bastante al fenómeno.

Profesores: Carlos E. Melo y Oscar O. Melo

Definición 1. Modelo es una representación simplificada de un fenómeno.

Dos características que se destacan de un modelo son que:

1. Sea sencillo, lo más simple posible.

2. Describa en buena forma el fenómeno y tenga supuestos realistas.

Ejemplo 4. C n = Consumo Naranjas, P n = Precio Naranjas,

C

n

=

f ( P

n

)

es poco realista

Modelo Económico: Es un conjunto de suposiciones que describen de forma aproximada un proceso económico. Modelo Econométrico: Es un sistema de ecuaciones que se derivan del modelo económico, y incluye variables observadas y algunas perturbaciones. En este modelo se destacan dos características importantes, a saber:

1. Se acepta la existencia de un error en las observaciones y

2. Un modelo estadístico acerca del comportamiento de las distorsiones.

Ejemplo 5. Modelo Económico

q = Demanda de Atún

p c = Precio de la Carne

p a = Precio del Atún p p = Precio del Pollo

q = F(p a , p c , p p ).

Esto quiere decir que la demanda de atún es función del precio de la carne, el precio del atún y el precio del pollo.

El modelo econométrico es:

1.

2.

3.

q

=

α β

0

+

1

p

a

+

β

2

p

c

+

β

3

p

p

+

U

(Distribución)

E (U / p a , p c , p p ) = 0, Los errores U son independientes.

Distribución de los errores: U N (0, σ 2 )

c.

-

Clasificación de Variables.

Por Nivel de Medida tenemos. Nominal: Sólo clasifica. Ejemplos: Genero, Color de Ojos, Tipo de Sociedad, etc. Ordinal: Clasifica y Ordena.

3

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Ejemplos: 1. Comportamiento de la Economía:

Pésimo, Malo, Regular, Bueno, Excelente. 2. Crecimiento de un país: Bajo, mediano, Alto Intervalo: Clasifica, Ordena e introduce una noción de distancia. No tiene cero absoluto. Ejemplos: Temperatura, no se puede decir que un objeto con 40º C, esta el doble de caliente que otro cuya temperatura es 20º C, por que al cambiar de escala esta relación no se mantiene.

Razón: Clasifica, Ordena, introduce una noción de distancia, y nos permite hablas en términos de razones entre las cantidades. Tiene un cero fijo. Ejemplos: Peso, estatura, PIB, M1, etc.

- De acuerdo a los valores que toma. Discretas: Son aquellas que toman un numero finito o infinito numerable de valores Ejemplos: Número de hijos, asistencia a primaria, genero, etc.

Continuas: Son aquellas que pueden tomar cualquier valor de un intervalo. Ejemplos: Peso, estatura, PIB, M1, etc.

II. INTRODUCCION AL MODELO LINEAL

Los primeros que se hicieron del modelo lineal, fueron en astronomía y física por Laplace - Gauss. La palabra regresión viene de los trabajos de Galton en biología, finales del siglo XIX. Quien estudió la relación entre la estatura de los padres y los hijos.

Denotemos las variables de interés como: Y = Estatura hijos, El modelo planteado se puede escribir de la forma:

y

t

=

β β

0

+

1

x

t

+ e

t

t=1,2,

,n

T: número de observaciones en el modelo

X = Estatura padres

(1)

Galton observó que padres altos tenían hijos altos, pero de estatura inferior a los padres, que los padres bajos tenían hijos bajos, pero de estatura mayor a sus padres, es decir:

regresa

La estatura de los hijos →

1. Partes del modelo de regresión:

a X (media poblacional).

Las partes del modelo planteado en la ecuación (1) son:

Y t : Variable dependiente o explicada.

4

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

X t : Variables independiente o explicativa. β 0 , β 1 : Parámetros e t : Error del modelo, perturbación, este término lleva todo aquello que no podemos explicar de Y usando X.

2. Supuestos del modelo: Todos los supuestos son acerca de los errores e t .

i. E(e t )=0

ii. E(e t 2 )=σ 2 .

iii. E(e t e s )=0.

iv. e t Normal (los errores tienen distribución normal).

(2)

El último supuesto se hace con el propósito de realizar inferencia.

El análisis de regresión simple es una herramienta para la descripción y evaluación de la relación entre una variable dependiente o explicada (Y) y una variable independiente (X) (explicativa), cuando usamos este modelo, se esta pensando en que se puede tener el valor de X y con este se puede estimar el valor de Y, usando el modelo lineal de regresión.

El modelo de regresión se utiliza fundamentalmente para:

1. Estimar valores de Y fuera del rango muestral. (Ej.: no hay hijos en el estudio para padres con estaturas entre 1.70 y 1.80 metros, entonces se puede estimar estas estaturas usando el modelo).

2. Para realizar predicción.

En el siguiente gráfico, veamos que es lo que estamos ajustando. El ajuste que estamos realizando lo muestra el siguiente gráfico

Diferencia:

Errores (e t )

= β β + x y t o 1 t Observaciones y =β +β x
=
β β
+
x
y t
o
1
t
Observaciones
y
=β +β
x
t
o
1
t
5

+ e

t

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

De acuerdo a los supuestos y observando este gráfico lo que se desea es que:

i. La diferencia (el error), entre el modelo de regresión lineal (la recta) y las observaciones sea cero

ii. Tenga varianza constante

iii. Los errores sean independientes

Agregado a lo anterior que estos errores giren alrededor de cero de acuerdo a una distribución normal.

a. Modelo visto en Forma Matricial.

El modelo que se tiene es:

y

t

=

β β

0

+

1

x

t

+ e

t

t=1,2,

,n

Escribiéndolo en forma matricial cada una de la observaciones, se llega a la siguiente expresión:

Lo anterior es equivalente:

y


 

 

1

y

2

= 

y

n   

β

0

β

0

β

0


 

+ 

  

β

1

β

1

x

x 2

1

β

1

x

n

 

 

x

2 x

1   1

1

  

 

 

2

x n

y

y

y n

= 

 

1

1

β

0

β

1

   +

  e

+ 

  

1

e

e n

2

  e


 

1  

e

2

e n

  

 

  

y finalmente (4) se puede expresar como:

Y = Xβ + e

(3)

(4)

Donde, Y y e son vectores de tamaño nx1 y X es una matriz nx2 .

Los supuestos dados en el modelo (2), observación por observación, se convierten, para el modelo en forma matricial, en:

i.

E(e)=0 nx1

ii.

E(ee´)=σ 2 I.

(5)

iii.

e Multinormal (el vector de errores tienen distribución multinormal).

6

Notas Econometría

Donde I es la matriz identidad de tamaño nxn .

Profesores: Carlos E. Melo y Oscar O. Melo

Nota: E(ee´) = σ 2 I es la matriz de varianza de los errores.

Así se tiene el modelo lineal de regresión:

Y = Xβ + e

con eMN(0 nx1 , σ 2 I)

(6)

Los parámetros del modelo serán β y σ 2 , que son desconocidos, y nuestra primera tarea será estimarlos.

b. Estimación de los Parámetros.

Método de Mínimos Cuadrados

Mínimos Cuadrados Ordinarios (MCO). La filosofía de los MCO, es hallar un estimador de β, tal que el tamaño de los errores sea mínimo, es decir, minimizar los residuales.

Trabajo con Matrices

El criterio de desea e t 1 0, lo cual se logra si se hace e t 2 0, y para minimizar todos los

i 2 (al minimizar la suma estamos

errores al mismo tiempo basta minimizar

n

e

i = 1

minimizando cada una de sus componentes, que es el objetivo).

Ahora,

n

e

i = 1

i 2 (

=

e

1

e

2

e

n

e  

2

n   

1



  

)

     )

e

e

De (6) se tiene que e = Y Xβ , así

t

e e

=

(Y

β

X

t

) (Y

β

X

)

= e

t

e

(7)

Dados Y y X fijos, hallar β ˆ , bajo la filosofía de MCO se convierte en:

1 Léase cercano a cero

7

Notas Econometría

t

Minimizar e e

Profesores: Carlos E. Melo y Oscar O. Melo

Minimizar f(β) Minimizar ( Y

β

X

t

) ( Y

β

X

) .

Este un problema de cálculo diferencial vectorial.

t

e e

=

t

(Y Y

β

t

X

t

Y

Y X

t

β β

+

t

t

X X

β

)

β

 

β

 
 

= (

2

β

t

X

t

Y +

β

t

X X

t

β

)

 

β

 
 

= 2

X

t

Y

+ 2

t

X Xβ

 

Si suponemos que existe β ˆ , tal que es punto crítico de f(β), entonces:

t ∂ e e t t =−2 X Y + 2 X X β ˆ
t
∂ e e
t
t
=−2
X Y
+ 2
X X
β
ˆ
= 0
(8)
β
ˆ
2
t
e e
ˆ
t
−1
t
t
De aquí
β =
( X
X )
X
Y
. Pero ¿Cómo saber que es un mínimo?.
=
2 X X
que es
ˆ
2
β
una matriz definida positiva, por lo tanto se ha hallado un mínimo 2 .
Conclusión: El estimador de MCO para el vector β esta dado por:
ˆ
t
−1
t
β =
( X
X )
X
Y
.
(9)
Veamos como lo anterior se puede ver en términos no de vectores y matrices sino de las
observaciones.
Trabajo con Sumas (observación por observación).
De la ecuación (8) se llega a las ecuaciones normales (E.N.).
t
ˆ
t
X
X
β =
X
Y
(10)
Con
1
x
 y
1 
1
1
x
y
β
2
1
X =
,
Y =
2 = 
,
β
.
β
2
1
x
y
n
n

2 Bibliografía: Matrix Differential Calculus with Applications in Statistical Econometrics; Magnus, J. John Wiley, New York, 1988.

8

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Reemplazando en (10), se obtiene:

n

n

i = 1

β β

0

+

1

ˆ

β

0

n

i = 1

x

i

+

x

i

ˆ

β

1

n

i

= 1

ˆ

ˆ

x

2

i

=

 

n

i

= 1

n

i

= 1

y

i

x y

i

i

Es decir,

ˆ

β

0

y

ˆ

β

1

son tal que cumplen con las ecuaciones normales:

n

β β

0

+

1

ˆ

ˆ

n

i =

1

x

i

=

ˆ

β

0

n

i = 1

x

i

+

ˆ

β

1

n

=

1

i

x

n

=

1

i

y

2

i

=

i

n

=

1

i

x y

i

i

(11a)

(11b)

ˆ

ˆ

n

i 2 usando derivadas

parciales, y mostrar que cumplen con las ecuaciones normales (11a) y (11b), y por lo tanto son los mismos. Este trabajo, además aporta el entender lo que nos están diciendo los

estimadores

Lo que se hará a continuación es hallar

β

0

y

β

1

que minimizan

i = 1

e

ˆ

β

0

ˆ

β

1

.

y

n

i =

1

e

2

i

=

n

i

= 1

( y

i

β β

0

x

i

1

Hallemos el mínimo para f(β 0 ,β 1 ).

n

i = 1

( y

i

β

0

x

i

β

1

)

2

β

0

=

n

i = 1

)

2

=

2

( y

i

f (

β β

0

,

1

β

0

x

i

)

β

1

)

Igualando a cero se obtiene

n

β β

0

+

1

ˆ

ˆ

n n

i =

1

x

i

=

i

=

1

y

i

De igual forma derivando con respecto a β 1 , e igualando a cero se llega a (11b), lo cual se deja como ejercicio al lector.

De las ecuaciones (11a) y (11b), se tiene que los estimadores en forma de sumas son:

-

-

Despejando β 0 de (11a), β 1 se obtiene.

ˆ ˆ β = −β y x 0 1
ˆ
ˆ
β = −β
y
x
0
1

, reemplazando en (11b) y despejando

ˆ

β

1

=

n

i = 1

x y

i

i

nyx

n

i = 1

x

2

i

2

nx

=

n

i = 1

( x

i

x )( y

i

y )

n

i = 1

( x

i

x )

2

=

S

xy

S

xx

9

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Es importante notar:

a. El estimador de β 0 se puede pensar como una corrección de la media de Y. Si la variable X tiene media cero, el estimador β 0 será la media de Y.

b. El estimador de β 1 es la covarianza estimada entre X e Y, dividido por la varianza estimada de X.

c. En todo el trabajo se supone que los valores x i no son aleatorios sino fijos.

d. En la ecuación (9), se supone que X t X es no singular.

Método de Máxima Verosimilitud

Otro criterio para estimar los parámetros del modelo lineal es el de máxima verosimilitud.

Criterio de Máxima Verosimilitud (MV). La filosofía de MV es hallar un estimador de β, tal que la probabilidad de obtener los datos que se tienen sea máxima. En otras palabras, es darle la mayor posibilidad de aparición a los datos que se tienen en la muestra.

Ejemplo 6. Si lanzo una moneda una vez y sale cara, para que la probabilidad de que salga cara sea máxima basta pensar que la moneda esta marcada con cara por ambos lados, esto sería lo que concluiríamos si usamos el criterio MV.

Conceptos Previos

En estadística I y II se estudio la normal univariada. Dada la variable X, se dice que tiene distribución normal con media µ y varianza σ 2 si su función de densidad esta dada por:

f ( x ) =

1

2 πσ
2
πσ

exp

− ( x

µ

)

2

2

σ

2

- ∞< <∞

x

(12)

La función de distribución o función de probabilidad acumulada se definía como:

F(x)=P(Xx)

Estos conceptos dados para una variable se pueden extender de una manera natural para

varias variables, si se piensa en cuál es la probabilidad de que conjuntamente X 1 <x 1 ,

X 2 <x 2 ,

X k <x k , se obtiene:

F( x )

=

P( X

1

x ,X

1

2

x

2

,

,X

k

x

k

)

Un ejemplo de esto es pensar: ¿Cuál es la probabilidad de que un colombiano pese menos de 80 Kgs., y mida menos de 1.65 mts?.

10

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

De la misma forma, se puede pensar en una función de densidad conjunta, en este caso no interesará la normal multivariada o multivariante. Entonces dado un conjunto de variables

n con media µ i y varianza σ i 2 , tienen distribución

normal multivariada, sí su función de densidad esta dada por:

aleatorias independientes W 1 ,W 2 ,

,W

f ( w

)

=

n

i = 1

f ( w

i

)

=

1

(

2

πσ

2

)

n /

2

exp

− 1


n

i = 1

( w

i

µ

i

)

2

2

σ

2

i

con w=(w 1 ,w 2 ,

,w

n

)

Para nuestro modelo

y

i

=

β + β +

0

1

x

1

e ,

i

i

= 1 2

,

,

,n , con e

i

~ IID

N(

0

,

σ

2

)

.

Se puede mostrar

independientes. Aplicando la formula (12), se tiene que la distribución conjunta para Y 1 ,Y 2 , por:

con y = (y 1 ,y 2 ,

fácilmente

que

y

i

~ N(

β

0

+ β σ

1

x ,

i

2

)

,

i

=

,

1 2

,

,n

1

(

2 πσ

2

)

n /

2

 − 1

2 σ

2

n

i = 1

)

2


f ( y ) =

exp

( y

i

β β

0

1

x

i

y

que

son

,Y n , esta dada

,y

n )

Volviendo a máxima verosimilitud, se desea maximizar esta función, que se denominará la función de verosimilitud y se notará por L(β,σ 2 ). Recordando un poco nuestros cursos de matemáticas, recordaremos que el máximo de una función es el mismo que el máximo del logaritmo de la función.

Aplicando esto, a el problema en cuestión no se hallara el máximo de L(β,σ 2 ), sino que primero se aplicara el logaritmo y luego se derivara.

ln( L(

βσ

,

2

) =−

n

ln(

2

π

)

n

ln

σ

2

2

2

1

2

σ

2

n

( y

i = 1

i

β β

0

1

x

i

)

2

En el momento de derivar con respecto a β 0 y β 1 basta observar que maximizar esta función con respecto a estos parámetros es equivalente a minimizar la suma pues el resto de esta función no depende de ellos.

Si se compara la suma con la función a maximizar en MCO se debe notar que son la misma. Por lo tanto los estimadores de MV para β 0 y β 1 , son los mismos que los hallados usando el criterio de MCO.

ˆ

ˆ

β = −β

0

y

1

x

11

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

n

ˆ

β

1

 

i = 1

( x

y )

i

x )( y

i

 

n

 

i = 1

( x

 

x )

2

i

)

n

1

n

 

=−

 

i = 1

 

2

σ

2

2

σ

4

=

=

( y

Sólo falta el estimador de σ 2 ,

ln( L(

βσ

,

2

σ

2

i

S

xy

S

xx

β β

0

1

Igualando a cero

De donde se obtiene

n ( y

2 ˆ

σ

2

2

ˆ

σ

4

1

n

i = 1

i

β β

0

1

ˆ

ˆ

x

i

)

2 = 0

ˆ

σ

2

=

n

i = 1

( y

i

β β

0

1

ˆ

ˆ

x

i

)

n

2

i

= 1

i

2

=

n n

x

i

)

2

Propiedades de los Estimadores

1. Insesgados: ¿Qué es insesgamiento?

Veamos si los estimadores de β 0 , β 1 y σ 2 son insesgados.

ˆ Se comenzara con β : 1 n n n n    
ˆ
Se comenzara con
β
:
1
n
n
n
n
 
x y
nyx 
E 
x y
nyx 
x E( y
)
xE
y
i
i
i
i
i
i
i
i = 1
i
= 1
i =
1
i
=
1
E(
β ˆ
) = E
=
=
1
n
n
2
n 2
2
2
2
2
x
nx
∑ x
nx
x
nx
i
i
i
i = 1
i
= 1
i = 1
n
n
n
n
2
2
x (
β β
+
x
)
x
E( y
)
β
x
+
β
x
nx
β
n
β
x
i
0
1
i
i
0
i
1
i
0
1
i =
1
i
=
1
i =
1
i
= 1
E(
β ˆ
) =
=
1
n
n
2
2
2
2
x
nx
x
nx
i
i
i = 1
i = 1
n
2
2
β
x
nx
1
i
i = 1
=
=
β
n
1
2 2
∑ x
− nx
i

i = 1

12

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Para

ˆ

β

0

:

E(

β ˆ

0

)

= E

(

y

β =

1

x

ˆ

)

n

E( y

i )

i =

1

xE(

n

β ˆ

1

) =

n

i = 1

β

1

n β

0

x

i

+

n

n

β

1

x =

β

0

Para

herramientas que no tenemos aún.

σˆ

2 se presentará más adelante debido a que para esta demostración se necesita

Se puede mostrar de forma análoga:

V(

V(

ˆ

β

0

ˆ

β

1

Cov(

) =

σ

2

1

2

x

+

n

S

xx

) =

σ

2

S

xx

β β

0

,

1

ˆ

ˆ

x

S

xx

) =− 

σ

2

Conclusión: los estimadores de β 0 y β 1 (se halla vía MCO o MV) son insesgados. Su valor esperado es el parámetro poblacional.

2 Consistencia. Una segunda propiedad de interés acerca de cualquier estimador de un parámetro es la consistencia, propiedad que es: a medida que aumenta el tamaño de la muestra la distribución del estimador tiende a concentrarse alrededor del verdadero parámetro poblacional.

Definición: considérese un problema en donde se selecciona una muestra aleatoria de

converge en

probabilidad a Θ. Gráficamente:

una distribución con parámetro Θ. Se dice que Θ

ˆ

ˆ

es consistente si Θ

a Θ . Gráficamente: una distribución con parámetro Θ . Se dice que Θ ˆ ˆ
a Θ . Gráficamente: una distribución con parámetro Θ . Se dice que Θ ˆ ˆ
a Θ . Gráficamente: una distribución con parámetro Θ . Se dice que Θ ˆ ˆ

Θ

13

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

ˆ

ˆ

son estimadores

consistentes, lo cual significa que a medida que aumenta el tamaño de la muestra, su varianza sea hace menor.

Volviendo al modelo de regresión, los estimadores

β

0

y

β

1

ˆ

ˆ

3. Mínima varianza: Los estimadores

son los estimadores de mínima varianza

dentro de los estimadores lineales insesgados, lo cual es bueno porque mejora la calidad de las predicciones.

β

0

y

β

1

Inferencia sobre los Parámetros del Modelo de Regresión Lineal Simple

Para obtener los estimadores de MV, se ha tenido que agregar el supuesto de normalidad sobre los errores, este supuesto además de servir para obtener estimadores puntuales, nos sirve para obtener estimadores por intervalo y realizar pruebas de hipótesis sobre ellos. Basados en los supuestos:

v. E(e t )=0

vi. E(e t 2 )=σ 2 .

vii. E(e t e s )=0. t s

viii. e t tiene distribución normal.

ˆ

Se puede mostrar que

siguientes parámetros. β =(

ˆ

β

0

y

ˆ

β

0

,

ˆ

β

1

ˆ

β

1

tienen distribución normal bivariada (NB), con los

)NB( β ,Σ), donde

V(

β ˆ )

=

 

 

σ

2

 

 

2

1 x

+

n

S xx

σ

2

  x

S

xx

   x

 

 

  −

S

xx

σ

2

 

σ

2

S

xx

 = 

 

Σ

11

Σ

21

Σ

12

Σ

22

De esta manera, se podría plantear intervalos de confianza o regiones de confianza (que se verán más adelante) conociendo σ 2 .

Predicción (Propiedades)

Si se necesita realizar predicción (o estimación) usando el modelo de regresión lineal simple, basta conocer x p , aplicar la ecuación

ˆy

p

ˆ

ˆ

=β +β

0

1

x

p

Para obtener una predicción o estimación de y p , p indica el período para el cual se desea calcular el valor.

14

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Veamos las bondades de esta predicción.

i) E( ˆy

p

y

p

)

=

E

{

ˆ

ˆ

β β

0

+

1

x

p

(

+ x + e )}=

β β

0

1

p

p

= E(

=

ˆ

β 0

)

β β

0

+

1

+

x

E(

p

ˆ

β

1

)x

p

β β

0

1

x

p

E( e

p

)

β β

x E(e ) = E(e ) = 0

0

1

p

p

p

Así la predicción apunta en valor esperado al verdadero valor, es decir, es insesgada.

ii) V ( ˆy

p )

=

= E(

(

)

=

ˆ

E{(

ˆ

β

2

0

ˆ

p

β

y

σ

2

2

 

 

σ

2

1

}

+

xx

0

+β β β x

1

x

p

0

1

p

)x

p

e

p

)}

)

E{(

x

2

1

x

p

β

1

2

p

ˆ

+

E( e

β

1

2

2

p

)e

)

p

+ 2

}x

E{(

p

ˆ

β

0

2

 

 

σ

2

  x

 

 

S

xx

σ

2

S

xx

 

 = 

Σ

E{( ˆy

2 }

ˆ

=

E(

β ˆ

ˆ

e

p

)

2

p

β β + β β

0

)

1

1

0

2

β ) +

0

E(

ˆ

ββ

E{(

0

β

0

)e

x

2

p

+σ

 

p

+ 2

+ 2Σ

12

1

x

n S xx

  x

S

ˆ

β ββ

0

)(

1

1

=Σ +Σ

11

22

Recordando:

Σ

12

Σ

22

V = 

11

Σ

21

)}x

p

Reemplazando por esta expresión, se obtiene finalmente que:

E{( ˆy

p

y

p

)

2

}

=

σ

2

1

+

1

+

( x

p

x )

2

n

S

xx

Es importante notar que la varianza de la predicción depende en gran manera de σ 2 , por lo que debemos dedicarle un momento para verificar las propiedades del estimador de este parámetro.

Propiedades del Estimador de σ 2 .

Antes de entrar a ver las propiedades de este estimador necesitamos los dos siguientes teoremas.

Teorema 1. Distribución de Formas Cuadráticas: Dado Z’=(Z 1 ,Z 2 ,

v.a. iid N(0, 1), y dada la matriz A simétrica, idempotente y de rango r, entonces la variable

aleatoria Y= Z’A Z tiene distribución chi – cuadrado con r grados de libertad.

15

n ), con Z 1 ,Z 2 ,

,Z

,Z

n

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

Teorema 2. Independencia de Formas Cuadráticas: Dado Z vector estocástico con las condiciones del teorema 1, y dadas las matrices A 1 y A 2 simétricas, idempotentes con rangos r 1 y r 2 y A 1 A 2 =0. Sean Y 1 = Z’A 1 Z y Y 2 = Z’A 2 Z, entonces Y 1 y Y 2 son

independientes con distribución

2

χ

( r

1

)

y

2

χ

( r

2

)

respectivamente.

Nota.

- Idempotencia: se dice que una matriz L es idempotente si LL=L. - Simetría: Una matriz J es simétrica si J’=J.

De acuerdo al criterio de MV, tenemos que un estimador de σ 2 es:

ˆ

σ

2 e ˆ' e ˆ

=

n

Donde e es el vector de residuales (errores estimados).

con M

=

e

I

=

Y

Y ˆ

=

X(X' X)

Y

1

X'

Xβ ˆ

=

Y

X(X' X)

1

X' Y

=

(I

X(X' X)

1

X' )Y

=

MY

Veamos las propiedades de M.

M'

=

(

I

X(X' X)

1

X'

)'

=

I

'

(

X(X' X)

1

X'

)'

=

I

X(X' X)

1

X'

=

M

Es decir, M es una matriz simétrica.

MM

= ( I − =

(

I

X(X' X)

1

X(X' X)

1

X'

X'

)(

)

=

I

M

X(X' X)

1

X'

) = I 2

X(X' X)

1

X'

+

X(X' X)

1

X'

Conclusión M es simétrica e idempotente.

Ahora, eˆ' eˆ = Y' MY , se puede mostrar entonces que

Rango de M. = Ran( I

X(X' X)

1

X' )

=

Ran( I )

e' ˆ e ˆ

σ

2

~

2

χ ( r )

, con r rango de M.

Ran( X(X' X)

1

X' )

=

n

2 . De donde

e' ˆ e ˆ

σ

2

~

2

( n

χ

2

)

y por lo tanto

E

e' ˆ e ˆ

σ

2

= n 2

Volviendo a nuestro estimador:

16

Notas Econometría

Profesores: Carlos E. Melo y Oscar O. Melo

E( ˆ

σ

2

)

=

E   e ˆ' e ˆ  = n

σ

2

n

E   e ˆ' e ˆ  = 

σ

2

σ

2

( n

2

)

n

Por lo tanto el estimador para la varianza de los errores no es insesgado. Entonces

corrijámoslo.

ˆ

σ

2 e ˆ' e ˆ

= n 2

Fácilmente se puede mostrar que esta corrección lograr el insesgamiento.

Medidas de Bondad de Ajuste.

Una medida que nos indica el nivel de ajuste del modelo al fenómeno es el coeficiente de determinación R 2 . Por ahora lo importante es saber:

a. 0R 2 1.

b. Si R 2 =0 indica que el modelo no explica, no se acerca, en nada al fenómeno.

c. Si R 2 =1 indica que el modelo explica perfectamente el fenómeno.

El R 2 lo que mide es: cuanta variabilidad de los datos recoge el modelo. La ecuación para el calculo de R 2 esta dada por:

R

2

=

n

t

= 1

(

ˆy

t

y )

2

n

t

= 1

(

y

t

y )

2

= 1

n

t

= 1

(

y

t

ˆy

t

)

2

n

t

= 1

(

y

t

y )