Está en la página 1de 6

MAGCEA Econometria IN709 - Otoo 2009

Universidad de Chile
Departamento de Ingeniera Industrial
Profesor: Mattia Makovec (mmakovec@dii.uchile.cl)
Auxiliares: Andrs Barrera (andres.abarrera@gmail.com), Carlos Pulgar (pulgroso@gmail.com)
1. Introduccin: el modelo lineal general
(Versin preliminar, no difundir)
1. Introduccin
La econometria es una ciencia social que utiliza herramientas de la teora economica, de la matematica y
de la inferencia estadstica para analizar fenomenos economicos. Mientras los modelos teoricos basicos de la
micro y de la macroeconoma llevan a predicciones deterministicas sobre el comportamiento de los agentes y
las relaciones entre las variables economicas consideradas (por ejemplo entre ingreso y consumo individual o
entre tipo de cambio y exportaciones en una economa abierta), el enfoque econometrico supone que no sea
posible observar en los datos relaciones deterministicas entre variariables economicas, si no que las variables
economicas se relacionan de forma estocastica o aleatoria, a causa de la aleatoriedad de las decisiones de los
agentes, de los errores de medida en las variables observadas y de los errores de especicacin en los modelos
estimados (por ejemplo por omisin de variables relevantes). El objectivo principal de la econometria es
desarrollar metodos de estimacin de estas relaciones para testear la validez y las implicaciones de los modelos
economicos. El problema general consiste en analizar una poblacin de interes con caracteristicas observables
A
1
, A
2
, A
3
....A
j
, donde con poblacin se entiende por ejemplo un conjunto de individuos, empresas o paises.
Ejemplo 1: la poblacin de interes consiste en individuos (por ejemplo la poblacin chilena en un dado
ao), y las caracteristicas de esta poblacin son caracteristicas observables de los individuos, por ejemplo:
A
1
= nivel de educacin
A
2
= genero
A
3
= ingreso total anual
A
4
= ocupacin
....
A
j
= regin de residencia
...
Ejemplo 2: la poblacin de interes es una poblacin de empresas y las caracteristicas observables pueden
denirse como:
A
1
= ventas
A
2
= numero de empleados
A
3
= sector de actividad
A
4
= inversin en recursos humanos
....
A
j
= exportaciones
...
Ejemplo 3: la poblacin de interes es una poblacin de paises y las caracteristicas observables pueden
1
denirse como:
A
1
= PIB
A
2
= numero de habitantes
A
3
= tasa de inacin anual
A
4
= tasa de desempleo anual
....
A
j
= tipo de cambio
...
En general, cuando la unidad de observacin es un individuo o una empresa, hablaremos de microdatos; los
microdatos estan normalmente organizados en datos de corte transversal (o seccin cruzada, o en ingls,
cross-section), cuando las unidades de observacin son observadas en el mismo instante, o en datos de panel
(panel data en ingls) cuando cada unidad de observacin es seguida por mas de un periodo de tiempo. Las
variables que representan indicadores macroeconomicos (PIB, tasa de inacin, tasa de desempleo, etc.)
son normalemente datos de series temporales (time series en ingls), es decir una unidad de observacin
observada a lo largo del tiempo. El anlisis de microdatos es el objectivo de la microeconometria, mientras
la macroeconometria y la econometria nanciera se basan tipicamente en el anlisis de series temporales.
Se pueden obtener datos de panel basados sea en microdatos que en datos macroeconomicos, por ejemplo
los indicadores macroeconomicos principales de un conjunto de paises observados a lo largo del tiempo.
Adems, las unidades de observacin en caso de datos de panel no varian necesariamente con respecto al
tiempo, como en el caso de una base de datos que contiene observaciones sobre las caracteristicas de un
conjunto de empresas y tambin sobre las caracteristicas de los trabajadores que trabajan en cada empresa.
Estaremos interesados en analizar la relacin entre una particular caracteristica de la poblacin de interes,
denida variable endogena o dependiente y indicada convencionalmente con 1 , e un subconjunto de
caracteristicas observables denominadas variables explicativas, o independientes o exogenas o regresores:
A
1
, A
2
, A
3
....A
k
. Haremos el supuesto que esta relacin dependa de un parametro 0, que nos permita analizar
1 como )n:ci o: de las caracteristicas A
1
, A
2
, A
3
....A
k
:
1 = )(A
1
, A
2
, A
3
....A
k
; 0)
Es importante subrayar que la funcin ) describe una relacin c: |a jo/|aci o: y que esta relacin es
desconocida siendo el verdadero valor del parametro 0 desconocido c: |a jo/|aci o:. El objectivo del
econometrista ser entonces c:ti:ar la relacin existente entre 1 y A
1
, A
2
, A
3
....A
k
utilizando una par-
ticular rca|i.aci o: de la poblacin de interes observable a travez de una muestra de observaciones de
tamao (por ejemplo: en la muestra disponible hay observaciones sobre la caracteristica r
1
de la
poblacin: r
11
, r
12
, ....r
1N
). Indicaremos con las letras diminutas fj, r
1
, r
2
, r
3
....r
k
g una particular real-
izacin muestral de f1, A
1
, A
2
, A
3
....A
k
g en una muestra de tamao , y haremos el supuesto que las
variables observadas fj, r
1
, r
2
, r
3
....r
k
g sean vectores aleatorios indipendientes y identicamente distribuidos
(cada uno de dimensin ), sin necesariamente especicar el tipo de distribucin. El problema fundamental
de la econometria y mas en general de la inferencia estadstica es que la relacin entre 1 y A
1
, A
2
, A
3
....A
k
no es observable para el econometrista. Lo que es observable para el econometrista (en una dada muestra)
son datos generados para una relacin estocastica, donde cada observacin sobre la variable dependiente j
depende de una componente deterministica y una componente estocastica, denida como termino de error,
o perturbacion aleatoria o ruido:
j = )(r
1
, r
2
, r
3
....r
k
; 0) + -
Por cada obsrvacion i:
j
i
= )(r
i1
, r
i2
, r
i3
....r
ik
; 0) + -
i
El termino de error - escoge varios factores: la variables relevantes omitidas en la especicacin del modelo;
la aleatoriedad en el comportamiento de las unidades de observacin (individuos, empresas, paises etc.); los
errores de especicacin y de medida. Se introducen entonces en seguida una serie de supuestos convenientes
sobre ), 0 y - que permiten obtener un c:ti:ador de 0 con propiedades particularmente deseables.
2
2. Conceptos basicos: estimacin y estimadores
2.1 Propriedades de los estimadores en muestras nitas
Un estimador
^
0 del parametro 0 es una funcin de los datos muestrales:
^
0 =
^
0(r
1
, r
2
, r
3
....r
k
)
Una estimacin de 0 es un valor particular tomado para
^
0 dada una realizacin particular de los datos
(r
1
, r
2
, r
3
....r
k
). Los estimadores se clasican sugn dos tipos de propiedades: propiedades de muestra nitas,
validas indipendientemente del tamao de la muestra observada, , y propiedades de muestra grandes o
innitas, validas solo por ! 1. Las principales propiedades de muestra nita de un estimador son la
insesgadez y la eciencia.
Insesgadez
Sea
^
0 un estimador de 0.
^
0 se dene estimador insesgado de 0 si 1(
^
0) = 0. Si 0 es un vector, la insesgadez
implica que 1(
^
0) = 0 por cada elemento del vector 0.
Eciencia
Se dene en terminos relativos entre estimadores insesgados. Sean
^
0
1
y
^
0
2
estimadores insesgados de 0;
^
0
1
se
dene estimador mas eciente que
^
0
2
de 0 si \ ar(
^
0
1
) < \ ar(
^
0
2
). Si 0 es un vector,
^
0
1
es mas eciente que
^
0
2
si la diferencia entre las dos matrices de varianza y covarianza: \ ar(
^
0
2
) \ ar(
^
0
1
) = es una matriz
semidenida positiva (no hace falta imponer la condicin mas fuerte que sea denida positiva).
2.2 Error cuadratico medio
No siempre la eciencia es el unico criterio para elegir entre dos estimadores, en particular si los estimadores
estan sesgados. En este caso, es util utilizar un otro crierio, denido error cuadratico medio, que dene el
riesgo o la perdida asociada a estimar el parametro 0 con
^
0 :
1C' = 1[(
^
0 0)
2
]
Se demuestra que:
1C' = 1[(
^
0 0)
2
] = \ ar(
^
0) + [:c:qo(
^
0)]
2
donde :c:qo(
^
0) = 1(
^
0 0)
La prueba es sencilla:
1C' = 1[(
^
0 0)
2
] = 1[(
^
0 1(
^
0) + 1(
^
0) 0)
2
]
= 1[(
^
0 1(
^
0))
2
+ (1(
^
0) 0)
2
+ 2(
^
0 1(
^
0))(1(
^
0) 0)]
= 1[(
^
0 1(
^
0))
2
]
| {z }
=var(
^
)
+ (1(
^
0) 0)
2
| {z }
=[sesgo(
^
)]
2
+ 21[(
^
0 1(
^
0))(1(
^
0) 0)
| {z }
]
=0
1C' = \ ar(
^
0) + [:c:qo(
^
0)]
2
Si 0 es un vector, el error cuadratico medio se expresa como:
1C' = \ ar(
^
0) + [1(
^
0 0)][1(
^
0 0)]
0
= \ ar(
^
0) + :c:qo(
^
0):c:qo(
^
0)
0
3
3. El modelo lineal general: supuestos basicos
El modelo lineal general se basa en el supuesto que la variable dependiente j se pueda expresar como funcin
lineal del vector de parametros desconocidos, que ahora vamos a llamar ,. Podemos entonces escribir por
cada observacin i en la muestra:
j
i
= ,
1
r
i1
+ ,
2
r
i2
+ ..... + ,
k
r
ik
| {z }
k regresores
+ -
i
Donde ,
1
, ,
2;
.....,
k
son los parametros que queremos estimar.
3.1 Supuestos basicos del modelo lineal general:
H1. Linealidad
Se supone que la variable dependiente sea una funcion lineales de los parametros en el modelo, es decir ) es
una funcion lineal:
j = )(r
1
, r
2
, r
3
....r
k
; 0) + -
se puede expresar como:
j
i
= ,
1
r
i1
+ ,
2
r
i2
+ ..... + ,
k
r
ik
| {z }
k regressores
+ -
i
donde el subindex i indica la observacin sobre la unidad i, r
1
...r
k
son las variables explicativas y -
i
el
termino de error. Escribiendo el modelo lineal por todas las observaciones se obtiene:
2
6
6
6
6
4
j
1
j
2
j
N
3
7
7
7
7
5
N1
=
2
6
6
6
6
4
r
1;1
r
2;1
..
..
r
N;1
3
7
7
7
7
5
N1
,
!
+
2
6
6
6
6
4
r
1;2
r
2;2
..
..
r
N;1
3
7
7
7
7
5
N1
,
2
+ ..... +
2
6
6
6
6
4
r
1;k
r
2;k
..
..
r
N;k
3
7
7
7
7
5
N1
,
k
+
2
6
6
6
6
4
-
1
-
2
-
N
3
7
7
7
7
5
N1
O en forma vectorial:
y = x
1
,
1
+x
2
,
2
+ ..... +x
k
,
k
+ "
donde y, x
1
, x
2
..." son vectores (N1). Igualemente es posible expresar el modelo en forma de matriz:
2
6
6
6
6
4
j
1
j
2
..
..
j
N
3
7
7
7
7
5
(N1)
=
2
6
6
6
6
4
r
1;1
r
1;2
.. .. r
1;k
r
2;1
r
2;2
.. .. r
2;k
.. .. r
3;3
.. ..
.. .. .. .. ..
r
N;1
r
N;2
.. .. r
N;k
3
7
7
7
7
5
(Nk)
2
6
6
6
6
4
,
1
,
2
..
..
,
k
3
7
7
7
7
5
(k1)
+
2
6
6
6
6
4
-
1
-
2
-
N
3
7
7
7
7
5
(N1)
es decir:
j = A, + -
(N1) (NK)(K1) (K1)
donde ahora A es la matriz de datos. Si hacemos el supuesto que el primer regresor sea un termino constante,
la primera columna de la matriz X ser una columna de 1:
j
i
= ,
0
+ ,
1
r
i1
+ ,
2
r
i2
+ ..... + ,
k1
r
ik1
| {z }
k1 regressores
| {z }
k coecientes
+ -
i
2
6
6
6
6
4
j
1
j
2
j
N
3
7
7
7
7
5
N1
=
2
6
6
6
6
4
1
1
..
..
1
3
7
7
7
7
5
N1
,
0
+
2
6
6
6
6
4
r
1;1
r
2;1
..
..
r
N;1
3
7
7
7
7
5
N1
,
1
+ ..... +
2
6
6
6
6
4
r
1;k1
r
2;k1
..
..
r
N;k1
3
7
7
7
7
5
N1
,
k1
+
2
6
6
6
6
4
-
1
-
2
-
N
3
7
7
7
7
5
N1
4
2
6
6
6
6
4
j
1
j
2
..
..
j
N
3
7
7
7
7
5
(N1)
=
2
6
6
6
6
4
1 r
1;1
.. .. r
1;k1
1 r
2;1
r
2;2
.. r
2;k1
.. .. .. .. ..
.. .. .. .. ..
1 r
N;1
.. .. r
N;k1
3
7
7
7
7
5
(Nk)
2
6
6
6
6
4
,
0
,
1
..
..
,
k1
3
7
7
7
7
5
(k1)
+
2
6
6
6
6
4
-
1
-
2
-
N
3
7
7
7
7
5
(N1)
Los modelos siguientes son admisibles en la categoria de los modelos lineales:
j
i
= ,
1
+ ,
2
r
2
i
+ -
i
j
i
= ,
1
+
,
2
r
i
+ -
i
Es posible tambin estimar de forma lineal el siguiente modelo:
j
i
= r

1
i1
r

2
i2
c
"i
transformando el modelo inicial tomado logaritmos por ambos lados:
log j
i
= log r

1
i1
+ log r

2
i2
+ log c
"i
log j
i
= ,
1
log r
i1
+ ,
2
log r
i2
+ -
i
El modelo obtenido es lineal en los parametros ,
1
y ,
2
. Mientras no es lineal el modelo siguiente:
j
i
= ,
1
r

2
i
+ -
i
H2. Identicacin
Esta condicin implica che la matriz de datos A tiene rango completo de columnas: ra:qo(A) = /. Esto
signica que no pueden existir dos o mas columnas de la matriz A linealmente dependientes. Una conse-
cuencia importante de esta condicin es que la matriz simetrica (/ /) A
0
A es invertible; en particular
la matriz inversa (A
0
A)
1
presenta la siguiente propiedad: su traspuesta coincide con la matriz (A
0
A)
1
misma, dado que por la propiedad de la traspuesta, la traspuesta de una matriz inversa es igual a la inversa
de la matriz traspuesta:
[(A
0
A)
1
]
0
= [(A
0
A)
0
]
1
= (A
0
A)
1
H3. 1(") = 0
Esta condicin signica que los errores asociados a cada observacin i tienen promedio igual a cero: 1(-
i
) = 0
8i = 1.....
H4.Matriz de varianza y covarianza de los errores escalar
Esta condicin signica:
\ ar(-
i
) = o
2
8i (heterocedasticidad)
Co(-
i
, -
j
) = 0 8i 6= , (ausencia de autocorrelacin)
Que en forma de matriz se puede expresar como:
1(--
0
) = o
2
1
N
1(--
0
) =
2
6
6
4
co(-
1
, -
1
) co(-
1
, -
2
) ... co(-
1
, -
N
)
co(-
2
, -
1
) co(-
2
, -
2
) ... co(-
2
, -
N
)
... ... ... ...
co(-
N
, -
1
) ... ... co(-
N
, -
N
)
3
7
7
5
=
2
6
6
4
ar(-
1
) co(-
1
, -
2
) ... co(-
1
, -
N
)
co(-
2
, -
1
) ar(-
2
) ... co(-
2
, -
N
)
... ... ... ...
co(-
N
, -
1
) ... ... ar(-
N
)
3
7
7
5
=
2
6
6
4
o
2
0 ... 0
0 o
2
... 0
... ... ... ...
0 ... ... o
2
3
7
7
5
= o
2
2
6
6
4
1 0 ... 0
0 1 ... 0
... ... ... ...
0 ... ... 1
3
7
7
5
= o
2
1
N
5
Notese que por la denicin de covarianza:
Co(-
i
, -
j
) = 1[(-
i
1(-
i
))(-
j
1(-
j
))] = 1(-
i
-
j
)
dado que 1(-
i
) = 0 8i = 1.....
H5. X no estocsticos
Este supuesto es principalmente una herramienta didactica que nos permitir derivar las propiedades de
un estimador particular de ,, el estimador de mnimos cuadrados ordinarios, utilizando una notacin mas
simple. De momento, se puede interpretar como si los valores observados de A fueran jos en muestras
repetidas.
H6. Normalidad de los errores
Esto es un supuesto adicional necesario solo para determinar la distribucin exacta en muestras nitas del
estimador de mnimos cuadrados ordinarios de ,. Implica que el termino de error asociado a cada observacin
i tenga una distribucin normal con media igual a 0 y varianza igual a o
2
, y que los terminos de error
independientes tengan una distribucin conjunta normal multivariante con vector de medias igual a 0 y
matriz de varianza y covarianza escalar igual a o
2
1
N
:
-
i
s (0, o
2
) 8i
" s (0, o
2
1
N
)
Derivaremos el estimador de mnimos cuadrados ordinarios del parametro , que, bajo los supuestos H1-H5,
tendr unas propiedades particularmente deseables.
A lo largo del curso, entenderemos como el objectivo de un trabajo econometrico sea llevar a cabo
las etapas siguientes : 1) especicacin, donde se postula una forma funcional para )(.) y se eligen las
variables eplicativas relevantes para el modelo en base a la teoria economica; 2) estimacin: se estima el
parametro desconocido , utilizando los datos ; 3) validacin: se hace inferencia sobre la signicatividad
de las estimaciones obtenidas y se elige entre diferentes especicaciones del modelo inicial; 4) se utiliza el
modelo elegido en las etapas anteriores para hacer prediccin.
6

También podría gustarte