Está en la página 1de 195

ECONOMETRA

APUNTES
DE CLASE




Profesores:

Vernica Gil Aroztegui
Aldo Lema Navarro




Agosto 2004
Pontificia Universidad Catlica de Chile




Estos apuntes estn en permanente revisin por lo cual sugerencias o correcciones sern bienvenidas.
E-mails: vgila@afpprovida.cl y alema@security.cl


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

1

INDICE

1. INTRODUCCIN............................................................................................................................................ 1
1.1 ORGEN Y CONCEPTO....................................................................................................................................1
Definiciones................................................................................................................................................................ 1
Diferencias entre un econometrista y un estadstico:......................................................................................... 2
1.2 MODELO ECONOMTRICO. .........................................................................................................................2
1.3 OBJETIVOS DE LA ECONOMETRA...........................................................................................................3
1.4 METODO DE LA ECONOMETRA. ..............................................................................................................3
1.5 DATOS, VARIABLES Y MODELOS. ............................................................................................................5
DATOS. ....................................................................................................................................................................... 5
RELACIONES. ........................................................................................................................................................... 7
VARIABLES................................................................................................................................................................ 7
FORMAS FUNCIONALES (Introduccin) ........................................................................................................... 8
ANEXO 1: RECORDANDO DE INFERENCIA.....................................................................................................................9
Variable Aleatoria..................................................................................................................................................... 9
Notacin:..................................................................................................................................................................... 9
Distribucin de Probabilidades.............................................................................................................................. 9
ANEXO 2: UN REPASO DE MATRICES .................................................................................................................11
3.1.1 Operaciones matriciales:.............................................................................................................................11
3.1.2 Valores y vectores propios...........................................................................................................................16
3.2 ALGUNOS EJERCICIOS DE MATRICES..................................................................................................................19
3.2.1 Operaciones con matrices............................................................................................................................19
3.2.2 Determinantes...............................................................................................................................................19
3.2.3 Matriz Inversa ...............................................................................................................................................20
3.2.4 Valores y Vectores propios..........................................................................................................................20
2. REGRESIN SIMPLE..............................................................................................................................22
2.1 EL MTODO DE MNIMOS CUADRADOS ORDINARIOS (MICO). .......................................................................22
2.1.1 Definicin de anlisis de regresin............................................................................................................22
2.1.2 Especificacin de la Regresin Simple......................................................................................................23
2.1.3 Ejemplo:..........................................................................................................................................................23
2.1.4 Fuentes de Error ........................................................................................................................................25
2.1.5 Funcin de regresin poblacional y muestral.........................................................................................25
2.1.6. MICO para una regresin simple..............................................................................................................29
2.1.7 Ejemplo de clculo de


1
y


2
..................................................................................................................31
2.1.8 Expresin de las formulas en desvos. .......................................................................................................32
2.1.9 Corolarios de los estimadores MICO. .......................................................................................................33
2.1.10. Coeficiente de determinacion (R
2
)..........................................................................................................38
2.1.11 Algunas Regresiones Particulares...........................................................................................................40
2.1.12. Cmo seleccionar entre estimadores? .................................................................................................42
2.2 SUPUESTOS CLSICOS DEL MODELO DE REGRESIN. .....................................................................................45
1. La variable explicativa X est dada (es no estocstica o no aleatoria)..............................................46
2. E(
i
/X
i
)=0 i ...............................................................................................................................................46
3. No autocorrelacin Cov(
i
, u
j
)=0 i j...............................................................................................46
4. Homocedasticidad V(
i
/X
i
)=
2
...........................................................................................................48
5. El modelo est bien especificado...............................................................................................................49
6. Normalidad
i
N( 0 ,
2
) ..................................................................................................................49

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

2
2.3 PROPIEDADES ESTADSTICAS DE LOS ESTIMADORES MICO.............................................................................49
2.3.1 Linealidad.................................................................................................................................................50
2.3.2 Insesgamiento...........................................................................................................................................50
2.3.3 Eficiencia..................................................................................................................................................52
2.4 INFERENCIA ESTADSTICA EN EL MODELO DE REGRESIN LINEAL SIMPLE..................................................62
2.4.1 Repaso Breve de algunos teoremas de Inferencia...................................................................................62
2.4.2 Qu Consecuencias tiene suponer
i
~ N(0,
2
)?.................................................................................65
2.4.3 Intervalos de Confianza para
1
y
2
. ....................................................................................................67
2.4.4 Prueba de hiptesis......................................................................................................................................68
2.4.5 Recordando de inferencia:...........................................................................................................................70
2.4.6 Ejemplos de Test De Hiptesis....................................................................................................................71
2.5 ANALISIS DE VARIANZA.......................................................................................................................................76
Grados de Libertad.................................................................................................................................................78
2.6 PRUEBA DE NORMALIDAD......................................................................................................................................80
3. MODELO DE REGRESIN MULTIPLE..........................................................................................................81
3.1 DEFINICIONES...................................................................................................................................................81
Modelo de regresin poblacional mltiple...............................................................................................81
Modelo de regresin muestral mltiple....................................................................................................82
3.2 ESTIMADORES MICO......................................................................................................................................84
3.2.1 Primera forma de derivacin.....................................................................................................................84
3.2.2 Otra forma de encontrar

...................................................................................................................87
3.2.3 Deduccin de los estimadores MICO en el modelo simple...................................................................89
3.2.4 Una interpretacin de los estimadores MICO. ......................................................................................93
3.2.5 Corolarios de los Estimadores MICO......................................................................................................95
3.3 SUPUESTOS CLSICOS.........................................................................................................................................101
Explicacin.............................................................................................................................................................102
3.4 PROPIEDADES ESTADSTICAS DE LOS ESTIMADORES MICO..........................................................................105
3.5.1 Linealidad....................................................................................................................................................105
3.5.2 Insesgamiento..............................................................................................................................................105
3.5.3 Eficiencia......................................................................................................................................................105
3.5.4 Consistencia.................................................................................................................................................111
3.6 INFERENCIA EN EL MODELO GENERAL...............................................................................................................112
3.6.1 Distribucin de

......................................................................................................................................112
3.6.2 Distribuciones derivadas de ...................................................................................................................112
3.6.3 Distribucin de
2
'

e e
.................................................................................................................................113
3.6.4 Prueba de Hiptesis en el Modelo Mltiple............................................................................................115
3.5.5 Test General Para Probar Restricciones Lineales de Parmetros.....................................................117
3.5.6 Estabilidad y Cambio Estructural ............................................................................................................123
3.6 PREDICCION ......................................................................................................................................................131
Cul es el valor esperado del error de prediccin?...........................................................................132
Cul es la varianza de e
0
?.......................................................................................................................132
Cmo se distribuye e
0
?............................................................................................................................133
Intervalo de confianza para el error de prediccin..............................................................................133
Intervalo de confianza para Y
0
.................................................................................................................134
4. VARIABLES FICTICIAS O DUMMY O BINARIAS O DICOTMICAS.............................................135
4.1 MODELOS ALTERNATIVOS. .......................................................................................................................135
Ejemplo 1: Unica Variable Explicativa es una variable dummy. .................................................................135

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

3
Ejemplo 2: Una variable cualitativa y otra cuantitativa................................................................................136
Ejemplo 3: Dos variables cualitativas...............................................................................................................137
Ejemplo 4: Interaccin entre una variable cuantitativa y una cualitativa..................................................137
Ejemplo 5: Variables Cualitativas Politmicas...............................................................................................138
4.2 VARIABLES DUMMY PARA DESESTACIONALIZAR.........................................................................140
4.3 VARIABLES DUMMY PARA DETECTAR CAMBIO ESTRUCTURAL............................................143
4.4 VARIABLES DUMMY PARA CORREGIR OUTLIERS. ........................................................................145
5. MULTICOLINEALIDAD....................................................................................................................................147
5.1 INTUICIN..........................................................................................................................................................147
5.2 TIPOS DE MULTICOLINEALIDAD.............................................................................................................148
Multicolinealidad perfecta...................................................................................................................................148
Multicolinealidad imperfecta..............................................................................................................................150
Por qu importa el determinante?....................................................................................................................151
5.3 EFECTO DE LA MULTICOLINEALIDAD A NIVEL EMPRICO........................................................152
En el modelo con dos variables explicativas...................................................................................................152
En el Modelo General...........................................................................................................................................152
Efectos prcticos de la multicolinealidad:........................................................................................................153
5.4 FORMAS DE DETECTAR LA MULTICOLINEALIDAD.........................................................................153
Por sus efectos sobre los test...............................................................................................................................153
5.5 FORMAS DE SOLUCIONAR LA MULTICOLINEALIDAD...................................................................154
No hacer nada........................................................................................................................................................154
Incorporar informacin adicional......................................................................................................................154
6. HETEROCEDASTICIDAD...................................................................................................................................157
6.1 CMO SE AFECTAN LAS PROPIEDADES DEL ESTIMADOR MICO CUANDO EXISTE
HETEROCEDASTICIDAD? ....................................................................................................................................158
Qu ocurre si se estima por MICO sin tener en cuenta la heterocedasticidad?......................................160
6.2. MTODO DE MNIMOS CUADRADOS GENERALIZADOS................................................................................160
Derivacin de MCG en el caso simple ..............................................................................................................162
Derivacin de MCG en el caso mltiple. ..........................................................................................................162
6.3. CMO DETECTAR LA HETEROCEDASTICIDAD? ..........................................................................163
Naturaleza del problema:..........................................................................................................................164
Mtodo grfico:...........................................................................................................................................164
Prueba de Park............................................................................................................................................164
Prueba de Glesjer .......................................................................................................................................164
Goldfeld - Quant .........................................................................................................................................165
Test de White. ..............................................................................................................................................166
6.4 CMO SOLUCIONAR HETEROCEDATICIDAD? ..............................................................................166
Ejemplo en caso general ......................................................................................................................................167
7. AUTOCORRELACIN.........................................................................................................................................169
7.1 INTRODUCCIN................................................................................................................................................169
7.2 CAUSAS MS FRECUENTES DE AUTOCORRELACIN....................................................................170
Ciclos o tendencias en las variables, .................................................................................................................170
Autocorrelacin espacial,....................................................................................................................................170
Influencia prolongada de shocks:.......................................................................................................................170
Inercia:....................................................................................................................................................................170
Mala especificacin..............................................................................................................................................170
Quiebre o cambio estructural..............................................................................................................................171
7.3 ALGUNAS DEFINICIONES.............................................................................................................................172
Autocovarianza ......................................................................................................................................................172

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

4
Coeficiente de Autocorrelacin...........................................................................................................................172
EJEMPLO...............................................................................................................................................................172
7.4 PROPIEDADES DE LA ESTIMACIN MICO BAJO AUTOCORRELACIN ...................................175
7.5 CMO DETECTAR AUTOCORRELACIN?...........................................................................................................176
Mtodo grfico:.....................................................................................................................................................176
Estadstico de Durbin-Watson (1951)................................................................................................................176
Test de Breusch - Godfrey (1978).......................................................................................................................179
Ejemplo de utilizacin de los test en Eviews. ...................................................................................................179
7.6 FORMAS DE CORREGIR POR AUTOCORRELACION ......................................................................181
7.6.1 Conozco la forma de la autocorrelacin y conozco .....................................................................181
7.6.2 . No conocemos ...............................................................................................................................184
8. ESPECIFICACION DE MODELOS...................................................................................................................186
8.1 ATRIBUTOS DE UN BUEN MODELO.........................................................................................................186
8.2 TIPO DE ERRORES DE ESPECIFICACIN................................................................................................186
8.3 CONSECUENCIAS DE LOS ERRORES DE ESPECIFICACIN. .........................................................186
8.3.1 Variables Omitidas......................................................................................................................................186
8.3.2 Inclusin de una Variable Irrelevante (Variables Intrusas)................................................................189
Conclusin para Especifi car Modelos...............................................................................................................190

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

1
1 1. . I IN NT TR RO OD DU UC CC CI I N N
1.1 ORGEN Y CONCEPTO
Algunos economistas Europa S. XIX
Otros S. XX (como movimiento organizado)
1930 fundacin de la Sociedad Economtrica (Revista, 1933)

La Econometra se nutre de:
Economa (Teora)
Matemticas (especificaciones y tools)
Estadstica (Tcnicas)

Definiciones.
Es lo que hacen los econometristas
Etimolgicamente: Economa Medida
Sin embargo, este es un concepto vago, porque medir el PIB, el empleo, la oferta de
dinero, etc., no es econometra. El concepto es ms amplio que este.
Maddala:
Es la aplicacin de mtodos estadsticos y matemticos al anlisis de los datos
econmicos con el propsito de otorgar contenido emprico a las teoras econmicas,
verificndolas o refutndolas
Kennedy:
Los desacuerdos permitiran escribir un paper
La confusin proviene de que los econometristas son al mismo tiempo:
i) Economistas: interpretan (o crean teora) para probar empricamente.
ii) Matemticos: formulan matemticamente su teora
iii) Estadsticos aplicados: buscando datos para sus variables y gastando horas
frente al computador tratando de estimar relaciones econmicas y prediciendo.
iv) Estadsticos tericos: aplicando su habilidad para desarrollar tcnicas
estadsticas apropiadas a los problemas empricos.
La econometra no significa lo mismo que estadstica econmica, tampoco es lo que
conocemos como teora econmica, ni es la aplicacin de las matemticas a la
economa. Econometra es la unificacin de estas tres reas.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

2
Diferencias entre un econometrista y un estadstico:
La preocupacin del econometrista est en los problemas causados por la violacin de
supuestos estadsticos clsicos; la naturaleza de las relaciones econmicas y la falta de
experimentos controlados

1.2 MODELO ECONOMTRICO.

i) MODELO: representacin simplificada de la realidad, recurriendo a un nmero
limitado de conceptos formalizados.
Crticas:
Sobre-simplificacin. El contra-argumento es que se puede partir con un modelo
sencillo y luego complicarlo.
Supuestos poco realistas. Sin embargo, se podra argumentar como lo hace
Friedman, que lo importante no es cun reales sean los supuestos, sino que tan
buenos son como aproximacin al fenmeno a explicar.
Se basa en un nmero limitado de datos
ii) MODELO ECONMICO, conjunto de supuestos que aproximadamente describen
el comportamiento de una economa (o de un sector)
Ej. La funcin de produccin Cobb-Douglas, Y= A K

, establece la relacin
exacta, deterministica, que existe entre los insumos y el producto, basndose en una
serie de supuestos. Pero, si quisiramos testear cun bueno es este modelo para
explicar la evolucin del PIB en Chile, tendramos algunos problemas.
Sin importar lo sofisticado que sea nuestro modelo de produccin, no nos servir
para explicar hechos como la cada de la produccin por inundacin o sequa, los
momentos de huelga, etc.
Para poder testear este modelo, es necesario incorporarle elementos estocsticos.
Esto lo convertir de un modelo econmico en uno economtrico.
iii) MODELO ECONOMTRICO: es un set de ecuaciones de comportamiento
derivadas de un modelo econmico que involucra:
- variables observables
- elementos estocsticos o shocks, que recogen errores de medicin en las
variables observadas y factores que no pueden ser recogidos por el modelo.
Esto hace que la variable objetivo vare no slo porque lo hacen las variables
explicativas, sino por cierta aleatoriedad del comportamiento humano o del
contexto.
El modelo determinstico Y= A K

se transforma en
El modelo economtrico Y= A K



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

3
El trmino e

ser una variable aleatoria con determinadas propiedades que veremos
en el curso, por lo que deberemos especificar la distribucin de probabilidad de y
las consecuencias de estas sobre la estimacin.

1.3 OBJETIVOS DE LA ECONOMETRA

i) Formulacin de modelos economtricos (o sea modelos econmicos en una forma
testeable empricamente). Objetivo: DESCRIPTIVO representar la realidad
Usualmente hay diversas formas de formular un modelo economtrico a partir de un
modelo econmico ya que debe elegirse forma funcional
especificacin de la estructura
estocstica de las variables, etc.
ii) Estimar y testear los modelos con datos. Objetivo: INTERPRETAR.
iii) Usar los modelos con fines predictivos y de poltica.

De lo anterior se infiere que LA ECONOMETRIA
Es una ciencia?
Aplicacin de modelos estadsticos para intentar verificar modelos econmicos que
representan el funcionamiento de la economa

1.4 METODO DE LA ECONOMETRA.
i) Diagrama que resume la Metodologa de la econometra (Cuadro 1)
1. Teora
Econmica o
Modelo
Econmico
3.Informacin
apriori
2. Modelo
Economtrico 4. Datos
5. Estimacin
del Modelo
6. Testeo de
Hiptesis
sugeridas por
el Modelo
Econmico
7.Prediccin y
Polticas


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

4
Para el ejemplo que veamos antes:










ii) Crticas:
- Hay feedback entre 1 y 6 (no es cierto que slo se testean teoras)
- Hay feedback entre 2 y 5 con 3 (tambin hay aportes en datos)
- Hay feedback entre 6 y 2 (como resultado de los test economtricos es posible
replantear modelos economtricos)
Por tanto hay retroalimentacin (Cuadro 2)
Es el modelo adecuado?
si
no
Prueba de alguna hiptesis
Uso del modelo para prediccin y polticas
Teora Econmica
Modelo Economtrico
Estimacin
Pruebas de Especificacin y
examen de Diagnstico
Datos


1. Y=AK


2. Y=AK


3. Revisin de
resultados
obtenidos en
otros estudios
similares,
nacionales e
internacionales
4. Conseguir
los datos de
PIB (Y) y
Empleo (L)
del Banco
Central.
Construir una
serie de
capital (K).
5. Estimacin de
y
6. Verifico hiptesis
respecto a los
parmetros. Ej: Test
+=1
7. Prediccin: dadas las estimaciones de K y L, cual ser el PIB del
prximo ao

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

5
los resultados economtricos influyen en la teora
del modelo economtrico hacia los datos
De los test de especificacin hacia la revisin de la especificacin del modelo.

Qu constituye un test para la teora econmica?
- Signos de los coeficientes son correctos. Problema: diferentes estudios
economtricos llegan a conclusiones contradictorias.
- El test ms vlido: que una teora econmica genere mejores predicciones que
una alternativa.
- Estabilidad de los coeficientes estimados (Crtica de Lucas).
- IMPORTANTE: La econometra no es un elemento para derribar teoras, sino
para conocer la realidad, y ver si los datos que tenemos se ajustar a la teora.
- SI LOS DATOS NO SE AJUSTAN LO NICO QUE SE PUEDE DECIR
ES QUE ESTOS DATOS NO VERIFICAN LA TEORA.
- Error muy comn: concluir que la equivocada es la realidad, si esta no coincide
con el modelo.
- Sin embargo pueden haber ciertas fuentes de error en la elaboracin del
modelo:
- El modelo no se ajusta a la realidad.
- Mala formulacin del modelo
- No se dispone de buena cantidad y/o calidad de datos.

1.5 DATOS, VARIABLES Y MODELOS.
DATOS.
Hay tres tipos:
i. Datos de cross-section (seccin cruzada): son observaciones de una variable para
varias unidades individuales en un momento de tiempo. Por ejemplo, la tasa de
crecimiento del PIB para el ao 1991, para distintos pases de Amrica Latina.
1991
ARGENTINA 8.9
BOLIVIA 5.1
BRASIL 0.3
CHILE 6.8
COLOMBIA 1.8
ECUADOR 4.9
MEXICO 3.6
PARAGUAY 2.3
PERU 2.6
URUGUAY 3.2
VENEZUELA 9.7

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

6
ii. Datos de series temporales: son observaciones de una determinada variable a lo
largo de cierto perodo de tiempo. Por ejemplo en PIB del perodo 1976-1997

PIB de CHILE a precios constantes
(escala logartmica)

iii. Pool-Data: es la mezcla de datos de cross-section y series temporales. Ejemplo:
tasas de crecimiento de varios pases de Amrica Latina en el perodo 1991-1995.
Un tipo especial son los datos de panel (Panel Data), donde a la unidad de corte
transversal se la sigue en el tiempo.

1999 2000 2001 2002 2003


Argentina -3.1 -0.5 -4.4 -10.9 8.4
Brasil 1.0 4.5 1.5 1.6 0.0
Colombia -4.5 2.8 1.4 1.5 3.3
Chile -1.0 4.4 2.8 2.1 3.5
Mxico 3.5 6.9 -0.3 0.9 1.1
Per 3.8 3.6 0.2 5.2 4.0
Venezuela -7.2 3.2 2.7 -8.9 -10.0
Ecuador -7.3 2.3 5.6 3.4 2.3
Guatemala 3.8 3.6 1.8 2.3 2.5
Rep.Dominicana 8.0 7.8 3.0 3.5 -3.0
Uruguay -3.2 -1.1 -3.1 -10.8 2.5

15.6
16.0
16.4
16.8
17.2
17.6
60 65 70 75 80 85 90 95 00

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

7
RELACIONES.
i) Uniecuacionales:
Es aquella en que la variable dependiente est determinada por variables
explicativas.
C= f(Y,r,G), donde C (Consumo) es la variable dependiente e Y(Ingreso) , r (tasa de
inters) y G (Gustos) las variables independientes.
ii) Multiecuacionales
Es cuando para explicar un fenmeno se requieren varias ecuaciones.
Ej: Consumo Durables =f(Ingreso Permanente, tasa de inters)
Consumo No Durables: f(Ingreso Transitorio)
El tratamiento de las ecuaciones puede ser en forma separada o conjunta.
iii) Ecuaciones simultneas.
Es cuando dos o ms variables vienen determinadas simultneamente por un
cierto nmero de variables explicativas.
En los casos anteriores, el ingreso (Y) es dado para una familia individual, pero
en la economa como un todo no se puede considerar que el ingreso est dado
Para un consumidor individual el precio de un bien viene dado. Para toda la
economa, los precios y las cantidades vienen determinadas simultneamente por las
condiciones de oferta y demanda.
Q
d
= f (p,x)
Q
s
= f (p,z)
Q
d
=Q
s

Donde Q
d
es la cantidad demandada, Q
s
es la cantidad ofrecida, X es la variable de
escala en la demanda (Ingreso) y Z es la variable de escala en la oferta (tecnologa).

VARIABLES.
En general:
Variable dependiente: Y
Variables independientes: X
1
, X
2
......X
k

Sin embargo, reciben tambin otros nombres:
Y X
1
, X
2
......X
k

a) Predicha Predictores
b) Regresandos Regresores
c) Explicada Explicativas
d) Dependiente Independientes
e) Causada Causante
f) Endgena Exgena
g) Objetivo Control

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

8
La primera denominacin surge de la posibilidad de efectuar predicciones. La terminologa
de las letras b, c y d son las usualmente utilizadas cuando se habla de modelos de
regresin. En los estudios de causalidad se utiliza la expresin e). Se habla de variables
exgenas y endgenas cuando se quiere distinguir entre aquellas variables que se
determinan dentro del sistema (endgenas) y aquellas que se determinar fuera (exgenas).
Por ejemplo en modelos de gran escala para explicar la economa de un pas las variables
exgenas son las determinadas fuera del pas, como precios internacionales, tasas de
inters, movimientos de capitales, etc.
En problemas de control, se utiliza g). Por lo general las objetivo son aquellas que se desea
influenciar.

FORMAS FUNCIONALES (Introduccin)

i) Lineal C= + Y
ii) Log-Lineal ln C= + ln Y
Tambin se le llama Doble Logartmica. Elasticidad Constante.
iii) Semi-logartmica ln C= + Y Elasticidad Variable
iv) Lineal-Recproco C= + (1/Y)
v) Log-Recproco ln C= + (1/Y)
vi) Lineal Log C= + lnY

En iv y v, la relacin entre C e Y no es lineal.

Qu significa linealidad?
i) En las variables: la relacin entre la variable dependiente y las variables
independientes es lineal. Y= + X
ii) En los parmetros: la relacin es lineal en por ejemplo, si dicho coeficiente
aparece con potencia 1 y no est multiplicado ni dividido por otro parmetro.
Y= + X (lineal en variables y parmetro )
Y= + (1/X) (lineal en parmetro, pero no en las variables).

Cuando se habla de linealidad en este curso se hace referencia a la LINEALIDAD EN
LOS PARMETROS.

TAREA: de los modelos anteriores determine cules son lineales en los
parmetros, en las variables o en ambos.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

9
ANEXO 1: RECORDANDO DE INFERENCIA
Variable Aleatoria
Una variable aleatoria es una funcin que asocia un nmero real a cada elemento de un
espacio muestral.
En particular X es una V.A si para cada numero real a, existe una probabilidad P(X a) de
que X tome un valor menor o igual que a.
Notacin:
X,Y,Z para variables aleatorias, x,y,z para los valores particulares que toman las
variables aleatorias X,Y,Z.
P(X=x) es la probabilidad de que la variable aleatoria X, tome el valor x.
P(x
1
X x
2
) es la probabilidad de que la variable X tome valores entre x
1
y x
2
.

Hay dos tipos de variables aleatorias:
i) Variables aleatorias discretas:
Si la variable aleatoria toma un conjunto finito de valores o un conjunto contable
de valores infinitos.
Ej: el nmero de clientes que arriban en una hora a una tienda.
ii) Variables aleatorias continuas
Si en un cierto rango pueden adoptar infinitos valores. Ej. Ingreso de una familia en
Chile.

Distribucin de Probabilidades.
Discreta: Lista de los posibles valores que una variable aleatoria discreta puede tomar
conjuntamente con sus probabilidades asociadas.
Ej. X es el nmero que sale en la cara superior al tirar un dado.
x P(X=x)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

10
Continua: se le denomina funcin densidad: f(x)
Las probabilidades se discuten solo para intervalos, no para valores concretos. La
probabilidad de obtener un valor exacto es cero.
Las variables aleatorias continuas son una creacin muy til. Dentro de ellas la ms
utilizada es la normal, que tiene la siguiente funcin densidad:
f(x)

X
Donde es la media y es el desvo estndar.

Tarea:
Revisar INFERENCIA
Leer Apndice A de Gujarati.


b
a
dx ) x ( f ) b X a ( P
2
) x (
2
1
2
e
2
1
) x ( f


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

11
ANEXO 2: UN REPASO DE MATRICES
1


DEFINICIN: una matriz es un arreglo rectangular de elementos a
ij
donde i representa la
fila en que se encuentra el elemento y j representa la columna en que se encuentra. El orden
de una matriz es la cantidad de filas y columnas que esta tiene. Por ejemplo, la matriz
A=

,
_

3 1 2
4 3 1
, se dir que es de orden 23. El elemento a
21
=2
3.1.1 Operaciones matriciales:
Igualdad
A=B, si a
ij
=b
ij

Transposicin
La traspuesta de la matriz A
mn
, es una matriz A
nm
, que tiene por filas las columnas de
A.
Propiedades:
(A)=A
(A+B)=A+B
(AB)=BA
(A)=A, si es un escalar y A una matriz.
Si A=A, entonces se dice que A es simtrica.
Suma y Resta
Sea A
mn
y B
mn
, entonces C
mn
=A+B es tal que c
ij
=a
ij
+b
ij
Sea A
mn
y B
mn
, entonces D
mn
=A-B es tal que d
ij
=a
ij
-b
ij
Propiedades:
A+B+C=A+(B+C)=(A+B)+C
A+B=B+A



1
Este anexo repasa solamente algunas propiedades de matrices. Mas detalles en:
Econometra. Alfonso Novales. Segunda Edicin. Captulo 1
Mtodos de Econometra. J. Johnston. Captulo 4
Introduccin a la Econometra. G.S. Maddala. Segunda edicin. Apendice al Captulo 2.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

12
Producto de matriz por escalar
Sea A
mn
una matriz y una constante, entonces B
mn
=A, es tal que b
ij
= a
ij
Producto de matriz por matriz
Sea A
mn
y B
pq
, el producto AB solo se puede calcular si n=p (matrices conformables),
C
mq
=AB es tal que c
ij
se obtiene multiplicando elemento a elemento de la fila i-esima
de A por la columna j-esima de B y sumando estos productos. Es decir

n
1 s
sj
b
is
a
ij
c .
Propiedades:
AB BA
La nica matriz que se puede multiplicar por si misma es la matriz cuadrada.
Si AA=A se dice que A es idempotente.
Si A
n1
, entonces AA es un escalar igual

n
1
2
i
a , mientras que AA ser una matriz
cuadrada y simtrica de orden n

n.
A(BC)=ABC=(AB)C
A(B+C)=AB+AC

Traza
La traza de una matriz cuadrada es igual a la suma de los elementos de la diagonal
principal.
Propiedades:
Tr(A+B)=Tr(A)+Tr(B)
Tr(ABC)=Tr(CAB)=Tr(BCA)

Matriz identidad.
Se denota como I
n
a la matriz cuadrada de orden n, que tiene elementos 1 en la
diagonal y cero en el resto.
I
2
=

,
_

1 0
0 1


Propiedades:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

13
Sea A
mn
, luego, I
m
A=AI
n
=A


Diferenciacin Matricial
Si b
n1
, entonces
[ ]
[ ]
[ ]
[ ]
1
1
1
1
1
1
1
1
1
]
1

n
2
1
b
) b ( f
.
.
b
) b ( f
b
) b ( f
b
) b ( f

Ejemplos:

[ ]
a
b
b ' a



[ ]
Ab 2
b
Ab ' b



[ ]
A 2
b
Ab 2


Determinante de una matriz

El determinante es una funcin que asocia un nmero real a una matriz cuadrada.
Procedimiento de Laplace:
1. Elija cualquier fila o columna de una matriz y para cada uno de los elementos
calcule el cofactor. El cofactor de un elemento a
ij
ser c
ij
=(-1)
i+j
M
ij
.
2. M
ij
(matriz menor) es el determinante de la matriz que surge de eliminar la fila i y la
columna j de la matriz original.
3. Multiplique cada elemento a
ij
de esa fila (o columna) por su cofactor c
ij

4. Determinante de A=|A|=

n
1 j
ij ij
i c a



Ejemplos:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

14
1.

,
_

22 21
12 11
a a
a a
A
12 21 11 11
c a c a A +
c
11
=(-1)
1+1
M
11
=(-1)
2
(a
22
)=a
22

c
21
=(-1)
2+1
M
21
=(-1)
3
(a
12
)= -a
12


12 21 22 11 12 21 22 11
a a a a ) a ( a a a A +

2. A=

,
_

1 1 2
5 0 3
3 1 2

31 21 11
c 2 c 3 c 2 A + +
c
11
=(-1)
1+1
M
11
=(-1)
2
1 1
5 0
=5
c
21
=(-1)
2+1
M
21
=(-1)
3
1 1
3 1
=(-1)(-1-3)=4

c
31
=(-1)
3+1
M
31
=(-1)
4
5 0
3 1

=5
32 ) 5 ( 2 ) 4 ( 3 ) 5 ( 2 A + +
Propiedades:
' A A
Intercambiar 2 filas (o columnas) cambia el signo del determinante
Si una fila de un determinante se multiplica por k, el determinante queda
multiplicado por k.
La adicin de un mltiplo de una fila a otra no altera el valor del determinante.
Si una fila (o columna) es combinacin lineal de otra fila (o columna) el
determinante de la matriz es cero. Una matriz con determinante cero se denomina
singular.

Matriz inversa
Dada la matriz cuadrada A
n
,
1
n
A

es su matriz inversa si
n
1
n n
I A A



Procedimiento de calculo:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

15
A de e eterminant d
uesta transp cofactores de matriz
A
)' A (
A
c
1


La matriz de cofactores se forma de sustituir cada elemento de la matriz por su
correspondiente cofactor c
ij
. Donde c
ij
=(-1)
i+j
M
ij
, siendo M
ij
(menor) el determinante
de la submatriz que se forma cuando a la matriz A se le elimina la fila i y la columna j.

Ejemplo:

,
_

0 1 0
1 0 0
0 0 1
A
31 21 11
c 0 c 0 c 1 A + + = 1
c
11
=(-1)
1+1
M
11
=(-1)
2
0 1
1 0
=-1
) 1 ( A

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

,
_

0 1 0
1 0 0
0 0 1
1
0 1 0
1 0 0
0 0 1
1
'
0 1 0
1 0 0
0 0 1

1
'
) 0 )( 1 ( ) 1 )( 1 ( ) 0 )( 1 (
) 1 )( 1 ( ) 0 )( 1 ( ) 0 )( 1 (
) 0 )( 1 ( ) 0 )( 1 ( ) 1 )( 1 (
1
'
0 0
0 1
) 1 (
1 0
0 1
) 1 (
1 0
0 0
) 1 (
1 0
0 1
) 1 (
0 0
0 1
) 1 (
0 1
0 0
) 1 (
1 0
0 0
) 1 (
0 0
1 0
) 1 (
0 1
1 0
) 1 (
A
)' A (
c

Propiedades:
Siempre existe
1
A

? No, la matriz A debe ser cuadrada y no singular


A ) A (
1 1



La inversa (si existe) es nica.

1 1 1
A B ) AB (


)' A ( ) ' A (
1 1



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

16
Rango de una matriz
Una matriz A
mn
puede interpretarse como una coleccin de m vectores fila de
dimensin n, o como una coleccin de n vectores columna de dimensin m. Entonces,
podemos hablarse de filas linealmente independientes (LI) o linealmente dependientes
(LD).
Se denomina rango de la matriz al mximo nmero de columnas (o filas) LI.
Propiedades:
El nmero mximo de filas LI es igual al nmero mximo de columnas LI
Rango (A
mn
)=min (m,n)
Rango A=Rango A
Si rango A
mn
=m=n, entonces A es no singular y su inversa existe y es nica.

3.1.2 Valores y vectores propios
Dada una matriz cuadrada A
n
, entonces existe una constante y un vector x (no nulo), tal
que satisfacen la siguiente ecuacin:
Ax=x y que reciben el nombre = valor propio de A
x= vector propio de A

Ax=x es una ecuacin que tiene implcita dos incgnitas, un vector y un escalar. Las
soluciones vendrn en parejas, a cada le corresponde un vector x
Procedimiento de clculo:
Ax=x
Ax-x=0
(A-I)x=0
Si A-I es no singular, entonces la nica solucin a la ecuacin anterior es la trivial (x=0).
Entonces, para que la solucin sea no nula, el determinante de A-I debe ser igual a cero.
A esta se le conoce como ecuacin caracterstica y tiene n soluciones a las que se denomina
valores propios. Para cada valor propio existe un vector propio que se obtiene sustituyendo
el valor de en la ecuacin (A-I)x=0.
Ejemplo:

1
]
1

5 . 0 5 . 0
1 0
A
i) Encontramos los valores propios de la matriz A:
Debemos resolver: det( A-I)=0

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

17

1
0 5 0 5 . .
= (-)(0.5-)-0.5= -0.5+
2
-0.5 =0
0.5t
2
) 5 . 0 ( 4 5 . 0
2

=(0.5t1.5)/2=
1
0 5

'

.

Los valores propios son 1 y 0.5

ii) Vectores propios:
Para =1 (A-
1
I)x
1
=0 (A-(1)I)x=0
1
]
1

1
]
1

1
]
1

0
0
b
a

5 . 0 5 . 0
1 1

-a+b=0 a=b
0.5a-0.5b=0 a=b
Dado que las dos ecuaciones son iguales el vector propio es un vector genrico
x
1
=
1
]
1

1
]
1

a
a
b
a

Cualquier vector que tenga dos componentes que sean iguales verifica esta
ecuacin. En particular se puede normalizar el vector haciendo que su longitud sea
1, es decir, haciendo que a
2
+b
2
=1
Luego, a=b=
2
1
con lo que

,
_

2
1
2
1
1
x
Para =-0.5 det(A-
2
I)x
2
=0 (A- 0.5I)x
2
=0
1
]
1

1
]
1

1
]
1

0
0
d
c

1 5 . 0
1 5 . 0

0.5c+d=0 c= -2d
05c+d=0 c= -2d

,
_

,
_

d
d 2
d
c
2
x
Normalizando tenemos dos ecuaciones: c
2
+d
2
=1 y c= -2d , con lo que:
(-2d)
2
+d
2
=1 4d
2
+d
2
= 1 5d
2
=1 5 / 1 d

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

18
c= -2d 5 / 2 c

,
_

,
_

5
1
5
2
d
c
2
x

Propiedades:
Los valores propios de una matriz simtrica son reales.
Los vectores propios correspondientes a distintos valores propios de una matriz
simtrica son ortogonales entre si. Es decir que su producto es cero. 0 x2 x1'
Sea B una matriz que tenga por columnas los vectores propios de A y D una matriz que
tiene los valores propios en la diagonal y cero en el resto.
B=

,
_

| | |
| | |
x . . x x
| | |
| | |
n 2 1
y D=

,
_

n
2
1
0 0
0 . 0 0
0 . 0 0
0 0
0 0

La propiedad anterior asegura que BB= BB=I
n
, esto implica que B es la inversa de B
(B es ortogonal).

D AB ' B , es decir que la matriz B (de vectores propios) diagonaliza a A.
Si A es una matriz simtrica, definida positiva, existe una matriz no singular P tal que
A=PP
La suma de los valores propios de una matriz A es igual a la traza de A
El producto de los valores propios de una matriz A es igual al determinante de A
Una matriz es singular si y solo si al menos un valor propio es cero.
El rango de una matriz es igual al nmero de valores propios no nulos de ella.
Los valores propios de la matriz A
2
son el cuadrado de los valores propios de A.
Los valores propios de A
-1
son los inversos de los valores propios de A, los vectores
propios son los mismos que los de A.
Los valores propios de una matriz idempotente son cero o uno.
El rango de una matriz idempotente es igual al nmero de valores propios iguales a 1 e
igual a su traza.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

19
Sea una matriz A de orden m, definida positiva, y P una matriz de mn, de orden m, el
producto PAP es una matriz definida positiva.
Los elementos de la diagonal principal de una matriz definida positiva son estrictamente
positivos, mientras que los elementos de la diagonal principal de una matriz
semidefinida positiva son no negativos.

3.2 ALGUNOS EJERCICIOS DE MATRICES
2


3.2.1 Operaciones con matrices
a) Dadas los siguientes matrices,
A

_
,

3 5 8
4 0 2
B

_
,

3 8 0
2 1 4
3 2 1
C

_
,

4
2
1

Calcular: (ABC), (C`A`); (AC)` ; (B`C)` ; (C`B)

b) Dadas las matrices:
A

_
,

1 3 4
2 0 7
5 6 9
B

_
,

10 2 0
7 1 3
4 5 6

Calcular (A+B); (A-B); (4A+7B)

3.2.2 Determinantes
a. Dadas las matrices cuadradas:

A

_
,

1 0
3 1
B

_
,

4 1
0 2

,
_

1 2
2 1
C
Comprobar:
A B A B
A B C A B C
. .
. . . .



2
Recomendables para quienes el tema de matrices resulte nuevo o olvidado.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

20
b. Dada la siguiente matriz cuadrada:
A

_
,

1 0 1
2 3 0
0 4 1

Comprobar:
A A
kA k A
n

'
probar con k=2
c. Calcular los siguientes determinantes:
t 1 1 1
z 2 1 1
y 1 2 1
x 1 1 2
B
a 1 0
0 a 1
1 0 a
A



3.2.3 Matriz Inversa
a. Hallar la inversa de las siguientes matrices:

A

_
,

2 2 3
1 0 3
3 4 0
B

_
,

3 1 1
1 2 2
1 2 4

b. Dadas tres matrices A, B y C cuadradas cualquiera, verificar:
(ABC)
-1
= C
-1
B
-1
A
-1


3.2.4 Valores y Vectores propios.
a) Encontrar los valores y vectores propios de:

,
_

2 2 1
2 1 1
4 0 3
A y mostrar que

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

21
i) la suma de las races caractersticas (valores propios) es igual a la suma de
los elementos de la diagonal de A
ii) el producto de las races caractersticas es igual al determinante de A.
b) Dada la matriz:
A

_
,

1 4
1 1

i) Encontrar los vectores propios de A
ii) Calcular A
2
y comprobar que
2
es un valor propio de A
2
.
iii) Calcular A
-1
y comprobar que 1/ es un valor propio de A
-1

c) Dada la siguiente matriz:

A

_
,

2 1
1 2

i) Encontrar los valores y vectores propios
ii) Probar que x
1
es ortogonal a x
2
(x
1
x
2
)=0
iii) Formar B y D y probar que el determinante de A es igual al determinante
de D (es obvio?), que el rango de A es igual al rango de D y que A y D
tienen la misma ecuacin caracterstica.
iv) Probar que B diagonaliza A BAB=D

d) Dado que X=

,
_

3
1
2
1
1
1
1
1
, calcular A=[ ] ) ' X ) X ' X ( X ( I
1
4

. Demostrar que A es idempotente
y determinar su rango. Calcular los valores propios de A y obtener la matriz que
diagonaliza a A.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

22
2 2. . R RE EG GR RE ES SI I N N S SI IM MP PL LE E
2.1 EL MTODO DE MNIMOS CUADRADOS ORDINARIOS
(MICO).

2.1.1 Definicin de anlisis de regresin.
Se vincula a la descripcin y evaluacin de la relacin entre una determinada variable
(dependiente o explicada) y una o ms variables denominadas explicativas o
independientes.

Significado del trmino de regresin (Francis Galton, 1886): la estatura promedio de los
nios que nacan de padres con una determinada estatura tenda a moverse o regresar
hacia la altura promedio de la poblacin total. Ello an cuando exista una tendencia a que
los padres altos tuvieran hijos altos y padres bajos tuvieran hijos bajos. Galton dijo que
exista una regresin a la mediocridad.

Actualmente se denomina regresin al estudio de la dependencia de una variable (la
variable dependiente) de una o ms variables (las explicativas) con la perspectiva de
estimar y/o predecir el valor poblacional medio de la primera en trminos de los valores
conocidos de las segundas.

Si k=2 Regresin Simple
Si k>2 Regresin Mltiple

Donde en general X
1
no representa una variable, sino que es una columna de unos que
permitir calcular la constante del modelo.

Ej. Y = gasto en consumo de una familia
X
2
= ingreso de la familia
X
3
= activos financieros de la familia
X
4
= tamao de la familia

Objetivos del Anlisis de Regresin:
Predecir el valor poblacional medio de Y dado los valores fijos de las X
Analizar los efectos de polticas que alteren las X
Saber si las X tienen o no efectos sobre la Y (y si estos efectos son significativos).
) X ,....., X , X ( f Y
k 2 1


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

23
2.1.2 Especificacin de la Regresin Simple.
Antes habamos hablado de relacin entre variables dependientes e independientes.

Y= f (X)
Esta puede ser de dos tipos:

i) determinstica o matemtica.
De este tipo de relacin se preocupa la economa matemtica.
Ej: Y=1+X
Y queda determinada exactamente dado el valor de la variable X.

ii) estocstica o estadstica
De este tipo de relacin se preocupa la Econometra. Para valores de X no podemos
determinar Y en forma exacta, sino probabilsticamente.
Y=1 + X+
Donde , conocido como RESIDUO, es una variable aleatoria. Representa la
ignorancia residual, por lo tanto podemos atribuirle las propiedades ms
convenientes al problema en cuestin.

2.1.3 Ejemplo:

Relacin deterministica
Y=K
0.3
L
0.7

Divido entre L,
3 . 0
3 . 0
3 . 0 3 . 0 3 . 0
7 . 0 3 . 0
L
K
L
1
K L K
L
L K
L
Y

,
_




Aplico logaritmo: LN(Y/L) =0.3 LN(K/L)
Dados los valores de K/L (relacin capital/trabajo), existe un nico valor de producto por trabajador
(Y/L).

LN(K/L) LN(Y/L) Y/L
12 3.6 36.6
14 4.2 66.7
20 6 403.4
5 1.5 4.5
10 3 20.1

0
1
2
3
4
5
6
7
0 5 10 15 20 25
LN (K/L)
L
N

(
Y
/
L
)

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

24
0
1
2
3
4
5
6
7
8
0 5 10 15 20 25
LN (K/L)
L
N

(
Y
/
L
)
Relacin estocstica
Y=K
0.3
L
0.7
e


Divido entre L,

e
L
K
e
L
1
K e L K
L
e L K
L
Y
3 . 0
3 . 0
3 . 0 3 . 0 3 . 0
7 . 0 3 . 0

,
_





Aplico logartmo: LN(Y/L) =0.3 LN(K/L) +
Ahora el valor final de LN(Y/L) no depende solamente del valor de LN(K/L) sino tambin del valor
de . Sabemos que es una variable aleatoria, pero an no conocemos su distribucin.
Supongamos que tiene la siguiente distribucin:

'
+

1/2 de ad probabilid con 1 -


1/2 de ad probabilid con 1

Entonces para cada valor de K/L tendramos dos valores posibles de Y/L

LN(K/L)
X
LN(Y/L) si =1
Y
LN(Y/L) si =-1
Y
12 4.6 2.6
14 5.2 3.2
20 7 5
5 2.5 0.5
10 4 2

Supongamos ahora que es una variable aleatoria continua que tiene
una distribucin normal estandarizada (con esperanza cero y varianza 1). Entonces por cada valor
de K/L tendremos infinitos valores para Y/L, dependiendo del valor de . El grfico que
obtendramos sera algo similar a esto:


Valor posible de LN(Y/L) para un valor dado de
K/L





La relacin entre LN(Y/L) y (K/L), ahora es
estocstica.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

25

En trminos generales en econometra tendremos relaciones estocsticas entre la variable
dependiente (Y
i
) y la explicativa (X
i
).

Y
i
=+X
i
+ tiene dos componentes
componente determinstico: +X
i
,
donde y son los parmetros o coeficientes de la regresin. Sus valores
sern estimados a partir de los datos disponibles para X e Y.
componente estocstico:

2.1.4 Fuentes de Error

i) Elementos impredecibles y aleatorios en las respuestas humanas.
Por ejemplo Consumo=f(ingreso), pero las personas no siempre responden de igual
forma para iguales valores del ingreso.
ii) Variables Omitidas:
En el trmino de error se resume la incapacidad de identificar la influencia de ciertas
variables o en otros casos imposibilidad de representarlas en valores (por ser de
difcil cuantificacin).
iii) Errores de medida en la variable dependiente.
Cuidado: estos errores de medida tienen ciertos problemas que estudiaremos ms
adelante.

2.1.5 Funcin de regresin poblacional y muestral.
Dado que el objetivo del anlisis de regresin es estimar o predecir el valor medio o
promedio (poblacional) de la variable dependiente basndose en los valores fijos o
conocidos de las variables explicativas, distinguiremos algunos conceptos.

Funcin de Regresin Poblacional (FRP):
es la recta que surge de unir las esperanzas condicionales de la variable dependiente para
los valores fijos de la variable explicativa.
Dado que para cada Xi, existe una poblacin de
valores de Y, se puede calcular la esperanza
condicional de los valores de Y, condicional a cada
Xi. A la unin de las esperanzas condicionales se le
denomina FRP.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

26
Del grfico podemos concluir que E(Y/Xi) es una funcin de Xi, y esa ser una funcin
lineal de Xi. Recordar: la linealidad puede ser en las variables y en los parmetros.
Lo que nos interesa es que la relacin sea lineal en los parmetros.

variables las en ni , parmetros los en ni lineal es no
2
i
X
2 1
)
1
X / Y ( E
variables las en no , parmetros en lineal es
2
i
X
2 1
)
i
X / Y ( E
+
+
Modelos Linealizables:
2
i
X
1
)
i
X / Y ( E


ln E(Y/X
i
) = ln
1
+
2
X
i


No Linealizables
i
X
2
e )
i
X / Y ( E
2 1

+


Qu forma tiene esta funcin?
Para saberlo hay que recurrir a la teora, pero podra ser por ejemplo E(Y/Xi)=
1
+
2
Xi
Existe una relacin lineal entre Xi y E(Y/Xi), en el caso del grfico esta relacin es
positiva. Pero, cmo es la relacin entre cada Yi y el Xi correspondiente?
Para cada Xi dado, un Yi en particular se desva de la E(Y/Xi), por un trmino de error, i.

Es decir, i= Yi - E(Y/Xi) o
Yi= E(Y/Xi) + i ,

Por lo que Yi=
1
+
2
X
i
+
i

Para el ejemplo que veamos antes:
Ln (Y/L) =
1
+
2
Ln (K/L) + u
i
, lo que indica que para encontrar cada valor particular de
producto por trabajador debo sumar dos componentes, el primero representa el promedio de
producto obtenido dado el nivel de capital utilizado [
1
+
2
Ln (K/L)], el segundo que
indica cunto hay que sumarle o restarle a ese promedio para alcanzar el valor de Y/L
particular.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

27
Funcin de Regresin muestral (FRM).
Hasta ahora nos hemos referido a los valores poblacionales de Y correspondientes a los
valores fijos de X. Al hacer econometra nuestro inters es estimar
1
y
2
, pero el primer
obstculo que enfrentamos es que no conocemos la poblacin, sino una muestra de ella.

Antes (poblacin) Ahora (una muestra)








As como tenemos esta muestra, podramos tener otra.
Dado que no conocemos la poblacin sino muestras, la estimacin de la E(Y/X
i
) depender
de la muestra elegida. Cul es la verdadera? No lo sabemos.


Nuestro objetivo es conocer E(Y/X
i
) lo sabemos si tenemos
1
+
2
X
i
pero en realidad
no conocemos
1
y
2
(parmetros poblacionales o tericos), por lo que debemos
estimarlos:

estimada recta la ser X

Y

X Y
i 2 1 i
i i 2 1 i
+
+ +



i i 2 1 i
i i i
e X

Y
e Y

Y
+ +
+

donde

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

28

1

estimacin para
1

2

estimacin para
2


Estimamos

Y
i



1
+


2
X
i
donde los


i
- son los valores resultantes (estimaciones)
a partir de estimadores (frmulas o algoritmos).
Modelo terico
2

Y
1
i 2 1 i
X ) X / Y ( E +
1

2
Y
2
Xi
Yi
X
1
X
2
Modelo estimado

1
1

i 2 1 i
X

Y

+
E(Y/X
i
)=
1
+
2
X
i
2

X
1
1
Y

E(Y/X
1
)
Y
1

1
e
1

2


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

29
Diferencias entre
i
y e
i

i= Yi - E(Y/Xi)
X

Y e
Y

Y e
i 2 1 i i
i i i




-es no observable
-es una variable aleatoria a la que se le supone cierta distribucin de probabilidad

e
-es observable (se dispone de valores)
- satisface ciertas propiedades que veremos ms adelante.

Cmo calcular
1
y
2
?
Mtodo de momentos?
Mxima Verosimilitud?
Mtodo de Mnimos Cuadrados Ordinarios (MICO)?

2.1.6. MICO para una regresin simple
Utilizaremos un mtodo llamado Mnimos Cuadrados Ordinarios (MICO).

Idea: Pasar la recta de regresin a travs de los puntos del grfico de forma que est lo
ms prxima posible a la urbe de puntos. Trataremos que las distancias verticales
(errores) sean lo ms pequeas posible.

i
X
2 1

i
Y
i
e
i
Y

i
Y
i
e



Se trata de elegir


1
y


2
tal que la diferencia sea mnima.
Minimizaremos e
i
2
(para dar peso equivalente a residuos ms grandes). O sea,
minimizaremos la suma de los cuadrados de las distancias verticales desde los puntos de
la recta.

Q ( Y
i


Y
i
)
2
(Y
i



1



2
X
i
)
2
f (


1
,


2
)
Debemos minimizar Q, es decir que debemos encontrar las condiciones de mnimo

CNPO CNSO
mnimo de s condicione
0
2
)
2

(
Q
2
0
2

Q

0
2
)
1

(
Q
2
0
1

>

>



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

30


0 ) X

Y (
0 ) 1 ( ) X

Y ( 2

Q
) 1 (
i 2 1 i
i 2 1 i
1



0 X

Y
i 2 1 i




0 X

n
n

Y
2 1




1
Y


2
X (*)

Alternativamente podramos expresar (1) de la forma

0 e 0 ) 1 ( e 2
i i
, esta es la
primera condicin que se debe cumplir para minimizar la suma de cuadrados de los
residuos.

Y
i
X
i



1
X
i



2
X
i
2
0


Sustituyo
1

por (*)



2

Y
i
X
i
n X Y
X
i
2
n X
2

(**)

Alternativamente podramos expresar (2) de la forma

0 X e 0 ) 1 ( X e 2
i i i i
,
esta es la segunda condicin que se debe cumplir para minimizar la suma de cuadrados de
los residuos. A las dos condiciones se le llama generalmente ECUACIONES NORMALES.

La frmula (**) la podemos transformar para interpretarla mejor.

0 ) X )( X

Y ( 2

Q
) 2 (
i i 2 1 i
2


0 X

X ) X

Y ( X Y
2
i 2 i 2 i i



+
2
i 2 i 2 i i
X

X ) X

Y ( X Y

+
2
i 2
2
2 i i
X

X n

Y X n X Y

+
2
i 2 2 i i
X

X n ) X

Y ( X Y
) X n X (

Y X n X Y
2 2
i 2 i i
+


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

31
Recordando de Inferencia:
S
xy
cov(X,Y)
(X
i
X )(Y
i
Y )
n

( X
i
Y
i
X
i
Y X Y
i
+ X Y )
n


X
i
Y
i

n
Y
X
i

n
X
Y
i

n
+ X Y
n
n



Este ltimo es el trmino que tenemos en el numerador de (**). El denominador es
parecido a la formula de la varianza muestral,
1 n
) X X (
S
2
i
2
x


.

Por lo que (**), para muestras grandes, se puede expresar:

X de muestral ianza var
Y e X entre muestral arianza cov

S
S

S n
nS

X n X
Y X n X Y

2
x
XY
2
x
XY
2 2
i
i i
2


donde:



1
- ordenada en el origen



2
- coeficiente angular o pendiente


2.1.7 Ejemplo de clculo de


1
y


2

Supongamos que conocemos los datos de produccin y horas trabajadas de 10 trabajadores
de una fbrica en un momento de tiempo (corte transversal). Definimos Y = producto , X =
horas de trabajo

X Y
X
2
Y
2

XY
1 10 11 100 121 110
2 7 10 49 100 .
3 10 12 100 . .
4 5 6 25 .
5 8 10 64
6 8 7 64
7 6 9 36
8 7 10 49
9 9 11 81
10 10 10 100
80 96 668 952 789
6 , 9 Y
8 X


Y
i



1
+


2
X
i
+ e
i



1
Y


2
X 9,6


2
8 9,6 0,75(8) 3,6

n
X Y n Y X
Y X Y X X Y
n
Y X

i i i i

+

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

32


2

X Y n X Y
X
i
2
n X
2


789 10(8) 9,6
668 10(8)
2
0,75

Y
i



1
+


2
X
i


Y
i
3, 6 + 0, 75 X
i

Y
i



1
+


2
X
i
+ e
i



Por ejemplo:
1
Y

=3,6+0,75(10)=7,5+3,6=11,1
2
Y

= 3,6 + 0,75(7)= 8,85


e
1
= 1 , 0 1 , 11 0 , 11 Y

Y
1 i
e
2
= 15 . 1 85 , 8 0 , 10 Y

Y
1 i

0
5
10
15
0 2 4 6 8 10 12
Y
X
Intercepto: 3.6
Pendiente: 0.75
e1=-0.1
e2=1.15

Tarea: Verificar que en el ejemplo se cumplen los corolarios de las ecuaciones
normales
0 X e
0 e
i i
i




2.1.8 Expresin de las formulas en desvos.
Veremos una segunda forma de expresar los resultados anteriores:
X

2 1
(*)


2
i
i i
2
X
XY
2 2
i
i i
2
) X X (
) Y Y )( X X (
S
S

X n X
Y X n Y X

(**)
Definamos las variables en desvos respecto a su media


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

33
Y Y y
X X x
i i
i i




Entonces, (**) la podemos expresar


2
i
i i
2
x
y x

(***), donde las variables en minsculas representan desvos respecto a la


media de la variable.

TAREA: demostrar CNSO
2.1.9 Corolarios de los estimadores MICO.

1. De las ecuaciones normales se desprende
0) (media compensan se errores los


0 e 0 e 2

Q
i i
1

0 X e 0 X e 2

Q
i i i i
2




2. La regresin siempre pasa por el punto Y , X .
Y
i



1
+


2
X
i
+ e
i

Sumando para todo i, tenemos:

Y
i
N


1
+


2
X
i
+ e
i


Dado que

0 e
i


Y


1
+


2
X
,
Con lo que el punto Y , X verifica la recta de regresin.

3. El valor medio de Y estimado es igual al valor medio de Y observado.


i i 2 1 i
e X

Y + + Sumando para todo i,

i i i
e Y

Y +

i
i i
e Y

Y

+
0
n
Y

Y
i
+


Y

Y


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

34
4. La regresin se puede expresar en desvos:

Como e
i
= 0

(1)
i i 2 1 i
e X

Y + + , sumando para todo i,



+ +
i i 2 1 i
e X

n Y , recordando que e
i
= 0 y dividiendo entre n

(2) X

Y
2 1
+

Restando (1) (2) X

e X

Y Y
2 i i 2 1 1 i
+ +

i i 2 i
e ) X X (

Y Y +

Expresado en desvos
i i 2 i
e x

y +

Similarmente se podra verificar que
i 2 i
x




5. 0 ) e , X ( Cov ) e , Y

( Cov

Los residuos no estn correlacionados con el valor estimado de Y
i
, ni con los valores
explicativos.

Para demostrar este resultado debemos recordar la propiedad 1 y su corolario 0 e
Cov(X,e)= ) e ( ) X X (
n
1
) e e ( ) X X (
n
1
i i i i



[ ] [ ] 0 e X 0
n
1
e X e X
n
1

i i i i




De este resultado se deriva que
i i
e x tambin es igual a cero.
1
]
1


1
]
1


i i i i i i
e Y

e Y

n
1
e Y

e Y

n
1
) e e ( ) Y

(
n
1
) e , Y

( Cov

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

35
Analizando la ltima expresin, comprobamos que el segundo trmino es cero. Y
como se observa debajo tambin lo es el primero.

[ ] [ ]
i i 2 2 i i 2 1 i
e X

) X

Y (
n
1
e ) X

(
n
1
e Y

n
1


+ +

[ ] 0 e X

e X

e Y
n
1
i i 2 i 2 i
+




6. Descomposicin en Suma de Cuadrados

Veamos un resultado previo. Sabemos que:


Y

Y
e Y

Y
i i i

+

Restando las dos expresiones anteriores, obtenemos
i i i
e Y

Y Y + , lo que en
desvos respecto a la media, se puede expresar:


i i i
e y

y + y dado que
i 2 i
x

entonces
i i 2 i
e x

y +

Con lo que:

i i i i 2 i
e y

e x

y + +


Se eleva al cuadrado:


2
i i i
2
i
2
i i i 2
2
i
2
2
2
i
2
i i
2
i i 2
2
i
e e y 2 y e e x

2 x

y
) e y ( ) e x

( y
+ + + +
+ +


Se aplica :

( )

+ + + +
2
i i i
2
i
2
i i i 2
2
i
2
2
2
i
e e y

2 y

e e x

2 x

y



+ + + +
2
i i i
2
i
2
i i i 2
2
i
2
2
2
i
e e y

2 y

e e x

2 x

y


+ +
2
i
2
i
2
i
2
i
2
2
2
i
e y e x

y
, (****) dado que los dos trminos de


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

36
productos cruzados se hacen cero por algunas de las propiedades anteriores.

Definimos:


SSR residuales cuadrados de Suma SCR e
SSE SCE explicados cuadrados de Suma x

SST CT S totales cuadrados de uma S y


2
i
2
i
2
2
2
i
2
i




Entonces el resultado (****) SCT=SCE+SCR

Una expresin alternativa para SCE, se deriva a continuacin:


2
i
2
2
x

SCE
[ ]
[ ]
[ ]


1
1
]
1



i i 2
2
i
2
i i
2
i
2
2
i
2
i i
2
i
2
2
i
i i
2
i
2
2
2
i
i i
2
y x

x
y x
x
x
y x
x
x
y x
x

SCE

x
y x

Como


Ejemplo.
Supongamos que el consumo de los hogares se explica por su nivel de ingreso. En el
diagrama de dispersin (Grfico1) cada punto (Xi,Yi) indica la combinacin de ingreso y
consumo del hogar. Podramos partir explicando el consumo de una cierta familia por el
consumo medio observado de la muestra. Para cada familia cometeramos un error dado por
Y
i
Y .
Si realizamos una regresin y estimamos los parmetros
2 1

por MICO, el error que


cometemos al asignar a la familia Xi cuyo verdadero consumo es Yi, la media de los
consumos, se divide ahora en dos partes (Grfico 2). Una de ellas nos indica la parte del
error que ha sido explicada por el modelo ( Y Y

i
). La otra mide el error que an subsiste
(e
i
)
Esto se puede generalizar obteniendo medidas resumen para todas las observaciones (o sea
para toda la muestra). Estas medidas son las sumas de cuadrados que vimos antes: la suma
de cuadrados totales (SCT) puede descomponerse en una parte explicada por la regresin
(SCE) y otra parte que an no logramos explicar o residual (SCR).




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

37
Grfico 1: Desvo respecto a la media
X
Y
*
*
* *
* *
*
Y Y
i
Es el desvo total (DT)
respecto a la media.
(X
i
,Y
i
)
Y

DR DE ) Y Y

( ) Y

Y ( Y Y

Y DT
, Y

restamos y sumamos le ) Y Y ( DT Al
i i i i i i
i i
+ + +



Grfico 2: Desvo Total, Desvo Explicado y Desvo Residual

DT= Y Y
i

DR=
Y

Y
i

DE=
Y Y

i

i
Y

Y

i
Y * *

*
* *
* *

(X
i
,Y
i
)
i 2 1
X

+
Y
X
X
i
X



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

38
2.1.10. Coeficiente de determinacion (R
2
)

Esta descomposicin da lugar a una medida de la bondad de ajuste de modelo de
regresin


SCT
SCR
1
SCT
SCR SCT

SCT
SCE
R
2



Consideraciones:
1. Es una medida de bondad absoluta del modelo ya que mide qu proporcin de la
varianza total (la varianza de Y) es explicada por el modelo de regresin (por X).
Cuanto mayor sea la relacin entre X e Y, mayor ser este indicador.
2. Es una medida de bondad relativa entre modelos. Por ejemplo, permite comparar si
la capacidad explicativa es mayor incluyendo X como variable independiente
respecto a incluir Z.
3. 0 R
2
1
(Si el modelo no explica nada SCR = SCT R
2
= 0)
(Si el modelo explica todo SCE = SCT R
2
= 1)

* * *
* * * *
Y
Y
X
X
R
2
=1
R
2
=0
Y
X
Todas las observaciones coinciden con la lnea No existe relacin alguna que
de regresin ajuste perfecto (imposible) sea expresable linealmente

Otras formas de expresarlo:

( )
2
y , x
2
y
2
x
2
xy
2
i
2
i
2
i i
2
i
2
i
2
2
i
i i
2
i
2
i
2
2
2
i
2
i
2
r
S S
S

x y
y x

y
x
x
y x

y
x


y
y


SCT
SCE
R

,
_



Es decir, en el modelo de regresin simple el R
2
es igual al cuadrado del coeficiente de

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

39
correlacin muestral simple entre X e Y.
Recordar que
y x
y , x
2
i
2
i
i i
XY
S S
S
y x
y x
) Y ( V ) X ( V
) Y , X ( Cov
r

, era una medida de la


asociacin lineal que existe entre X e Y.

Debemos recordar que el concepto de covarianza nos da una primera aproximacin del
grado de asociacin que tienen X e Y.

n
xy
n
) Y Y )( X X (
S
xy




Y
Y
X
X

< 0 xy

> 0 xy

> 0 xy

< 0 xy
Esto se cumple si los puntos muestrales
se concentran predominantemente en
estos cuadrantes.
Puede pasar que exista una relacin, pero
pequea, entre las dos variables, en ese
caso los puntos estarn dispersos en los
cuatro cuadrantes.

Desventajas de trabajar con

xy :

a. Su valor puede aumentar simplemente agregando ms observaciones. La solucin es
dividir por el tamao muestral, con esto se obtiene S
xy

b. La covarianza depende de las unidades en que se miden X e Y. Por ejemplo si pasamos
variables de dlares a centavos, la covarianza aumenta en 10000. Por esta razn, la
covarianza se escala dividiendo por la desviacin estndar de las variables en cuestin.
Por eso trabajamos con
2
y
xy 2
XY
S
S

) Y ( V ) X ( V
) Y , X ( Cov
r

. El signo de r
XY
depender del signo
de la covarianza.



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

40
Propiedades de r:
a. Est entre 1 y 1
b. Simetra r
xy
=r
yx

c. Es independiente del origen y de la escala.
d. Si X e Y son estadsticamente independientes, entonces r=0. Pero r=0, no implica
independencia.
e. Como es una medida de asociacin lineal, no tiene sentido utilizarlo para describir
relaciones no lineales.
f. No dice nada de las relaciones causa-efecto. Para eso se utiliza el test de Granger.

2.1.11 Algunas Regresiones Particulares
Regresin que incluye slo Constante (o sea no incluye X)

2
1 i
2
i
i 1 i
1 i
i 1 i
)

Y ( e Q
e

u Y

+

+


0 ) 1 )(

Y ( 2

Q
1 i
1



Y
n
Y

Y
i
1
1 i

1


La regresin que pasa por el origen (incluye X, pero no constante)


+

) X

Y ( e Q
) X

Y ( e
u X Y
2
i 2 i
2
i
i 2 i i
i i 2 i

0 ) X )( X

Y ( 2

Q
i i 2 i
2


0 X

X Y 0 X ) X

Y (
2
i 2 i i i i 2 i



2
i
i i
2
X
X Y


Tarea: verificar qu
propiedades se cumplen para
esta regresin. .
Tarea: calcular R
2
, verificar
las restantes propiedades.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

41

Caractersticas:

0 X e
0 e
i i
i




Modelo doble logartmico


i 2 1
u X ln Y ln + +


X en porcentual cambio
al respecto , Y de porcentual cambio

X a respecto Y de d elasticida
X ln
Y ln

2 YX





Modelo Semilogartmico

i 2 1
u X Y ln + +

. X en unidad una en cambio el por Y en cambio de tasa : cidad semielasti

. X en absoluto cambio un por Y en relativo cambio
ln
2

X
Y

Ejemplo: el tiempo como variable explicativa

Supongamos que tenemos el siguiente modelo para representar la evolucin de una cierta
economa:

PIB=Ae
r t
(Ver Recuadro)
Donde A es un trmino constante, r es la tasa de crecimiento anual (que se supone
constante) y t es el tiempo (1,2,3.......).
Para estimar esta ecuacin debemos linealizarla e incorporarle el componente aleatorio:
PIB
t
=Ae
rt
e


ln PIB
t
= ln A + rt+
i


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

42
ln PIB
t
=
0
+
1
t+
i
(*)

Luego de estimar (*) con los datos de un cierto pas, obtenemos:
ln PIB
t
= 6,96 + 0,0269 t +e
i

Esto significa que la tasa de crecimiento del PIB promedio en el perodo de esta economa
es 2.69%.

Supongamos que el PIB crece a una tasa de 3% anual.
Matemticamente esto significa que:

PIB 03 . 0
dt
dPIB

Esta es una ecuacin diferencial que se puede reescribir como:

dt 03 . 0 dPIB
PIB
1
. Si integramos a ambos lados de la ecuacin, tenemos:

dt 03 . 0 dPIB
PIB
1
y resolviendo ambas integrales:
2 1
c t 03 . 0 c PIB ln + +

Con lo que: c t 03 . 0 PIB ln + . Encontrando el antilogaritmo de esta ecuacin:

PIB(t)=e
0.03t
e
c


2.1.12. Cmo seleccionar entre estimadores?

Hasta ahora hemos derivado los estimadores MICO para
2 1

. Tambin hemos derivado


sus propiedades. En este punto nos preguntamos qu criterios podemos aplicar para saber
que tan buenos son estos estimadores.
Pese a que MICO es el mtodo ms popular para estimar los parmetros de un modelo,
minimizar la suma de los errores al cuadrado, no dice nada sobre la relacin del estimador y
el verdadero valor del parmetro. Puede pasar que la minimizacin sea vlida para una
muestra en particular.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

43
MICO siempre minimiza e
i
2
, pero esto no garantiza que se cumplan otras propiedades.

Mayor R
2

Tiene sentido decir que los estimadores tendrn buenas propiedades si hacen que el R
2
sea
el mayor posible?
No, MICO minimiza e
i
2
para una muestra en particular y esto es equivalente a
maximizar R
2
.
El R
2
no es vlido como criterio para "buena" estimacin, sino como indicador ajuste de la
regresin a la muestra seleccionada. Ver Seccin 2.1.10
Insesgamiento
)

( E

Esto no quiere decir que

, sino que se calcula el estimador correspondiente para


muestras repetidas, "en promedio" estaremos sobre el parmetro poblacional.
Minimizar e
i
2
puede aplicarse sin requerir casi ninguna informacin sobre la
forma en que los datos han sido generados. Este no es el caso del criterio de insesgamiento.
Para verificar si el estimador MICO es insesgado, deberemos realizar ciertos supuestos
sobre la forma en que se extrajo la muestra con la que trabajamos.

Eficiencia
Cmo elegimos entre estimadores que son todos insesgados?
Ser mejor el que tenga la varianza ms pequea, es decir el que sea ms eficiente.



Veremos qu supuestos deben plantearse para que se cumpla con esta propiedad.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

44
Ahora, si tengo un estimador con mnima varianza, estar seguro que es el mejor
estimador? No, depende del sesgo.
Error Cuadrtico Medio

ECM (

) =
2
)

( E = Var (

)+ [Sesgo (

)]
2


)

(
) ( f
*

E(
)
*
En este caso * es sesgado,
pero con menor varianza,
mientras

es insesgado pero
con mayor varianza. Para
poder elegir entre ellos debo
comparar el ECM, que
resume varianza y sesgo.
Debieramos elegir el
estimador con menor ECM.


Consistencia
En muchos problemas econometricos es imposible encontrar estimadores con las
propiedades anteriores. Sin embargo, muchas veces se puede justificar la utilizacin de un
estimador en base a sus propiedades asintticas.
La distribucin muestral de un estimador muchas veces cambia en la medida que cambia el
tamao muestral. Es posible que el sesgo de un estimador se haga cada vez mas pequeo
en la medida que aumenta n. Por esta razn al analizar las propiedades deseables de un
estimador se deben tener en cuenta las propiedades asintticas o de muestras grandes del
mismo:

1. Si la distribucin asinttica de

se concentra en un valor k en la medida que n tiende a


infinito, se dice que k es el lmite en probabilidad de

(plim

=k). Si plim

= se dice
que el estimador es consistente.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

45
2. La varianza de la distribucin asintotica de

se denomina varianza asinttica de

. Si

es consistente y su varianza asinttica es menor que la varianza asinttica de otros


estimadores, se dice que

es asintticamente eficiente.
f(x)

40
)

( f
100
)

( f
20
)

(
En el grafico vemos un ejemplo en que a medida que aumenta n (de 20 a100) la
distribucin se concentra respecto a mientras la varianza del estimador va
disminuyendo.
En conclusin: cuando no se encuentra un estimador con buenas propiedades para muestras
pequeas es deseable elegir un estimador con buenas propiedades para muestras grandes.

2.2 SUPUESTOS CLSICOS DEL MODELO DE REGRESIN.

Recordemos que para derivar las frmulas de los estimadores MICO, no fue necesario
realizar supuestos sobre la forma en que se extrajo la muestra o sobre la distribucin de
probabilidad de .

Sin embargo para verificar las propiedades estadsticas que tienen estos estimadores si
requeriremos ciertos supuestos. Los supuestos usuales que se requieren y que por tanto
reciben el nombre de SUPUESTOS CLSICOS, son los siguientes:


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

46
1. La variable explicativa X est dada (es no estocstica o no aleatoria).
Este supuesto implica que si se repitiera la seleccin de muestras se podra
considerar que las variables independientes seran las mismas. Como se ve este
supuesto es muy fuerte.
Dado que X es no estocstica, la COV(X, )=0.
2. E(
i
/X
i
)=0 i

i
es una perturbacin aleatoria que puede tomar valores positivos o negativos, pero
no existe razn para esperar que sea sistemticamente positiva o negativa. Por el
contrario, suponemos que los errores a la larga se compensan.

Dado que la X es fija y teniendo en cuenta este supuesto:

E(Y
i
/X
i
)= E(
1
+
2
X
i
+
i
)=
1
+
2
X
i

Con lo que este supuesto tambin implica que todo lo que no est incluido
explcitamente en el modelo (todo lo que ignoramos sobre los determinantes de la
variable Y), se supone que no afecta en forma sistemtica el valor promedio de Y,
porque se compensan los errores negativos y los positivos.


3. No autocorrelacin Cov(
i
, u
j
)=0 ij

Se supone que los errores cometidos en dos momentos distintos en el tiempo no estn
correlacionados. Esto significa que en repetidas muestras no existe ninguna tendencia a
que los errores asociados con una observacin estn relacionada a los errores de otra.
Si en un momento de tiempo o en un individuo de la muestra se genera un error
positivo, esto no nos da ninguna informacin sobre si el prximo error ser positivo o
negativo.
Este supuesto implica que los errores no tienen un patrn de comportamiento
sistemtico.

[ ][ ] { }

0 ) , E(
1 supuesto el dado y ) ( E ) ( E E ) , ( COV
j i
j j i i j i



Cuando los trminos de error correspondientes a perodos diferentes estn
correlacionados, diremos que existe autocorrelacin. Ms tarde en el curso
estudiaremos MICO bajo autocorrelacin.

Ejemplo:


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

47
Cuando se trabaja con series de tiempo en economa es muy comn que se presenten
fenmenos que tienen inercia y si esta no es recogida por el modelo, se genera
autocorrelacin en el error. Por ejemplo, los efectos de la crisis de 1982 generalmente
son difciles de recoger en su totalidad por un modelo, por lo que se genera un error que
estar correlacionado con el error cometido en el perodo siguiente.


* *
* *
* * *
* *
*
* *
* *
*
* *
*
*
* * *
* * **
* *

i
-
i
-
j

j

i
-
j

j
-
i
Correlacin
Positiva
Correlacin
Negativa
-
j

j
-
i

i
No existe
Correlacin

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

48
4. Homocedasticidad V(
i
/X
i
)=
2

Se supone que las perturbaciones se distribuyen con igual dispersin (varianza)
respecto a la media.
2 2
i
2
i i
2
i
) E( a e equivalent es 1 supuesto el dado y )) ( E ( E ) ( V
Cuando este supuesto no se cumple, decimos que existe heterocedasticidad.

X
1
X
2
X
3
) ( f
X
Y
E(Y/X
i
)=
1
+
2
X
i
Homocedasticidad.
Y
X
1
X
2
X
3
) ( f
X
E(Y/X
i
)=
1
+
2
X
i
Heterocedasticidad

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

49
Ejemplo: supongamos que deseamos explicar el gasto en consumo de las familias en
funcin de su ingreso. Si los datos se refieren a una muestra de corte transversal, el
supuesto de homocedasticidad no tiene mucho sentido, ya que indica que independiente
del nivel de ingreso, los gastos de cada familia se desvan del modelo con la misma
dispersin. Lo lgico es pensar que a mayores niveles de ingreso, hay un mayor espacio
para que las familias distribuyan su ingreso.

5. El modelo est bien especificado.

Es decir que no hay errores en la especificacin:
No hay omisin de variables ni variables en exceso
La forma funcional es la correcta
No hay supuestos estocsticos incorrectos.

Esto evitar errores en la estimacin de los parmetros.
6. Normalidad
i
N( 0 ,
2
)

Los errores son normales, idntica e independientemente distribuidos. Es decir que cada
error es una extraccin aleatoria independiente de una distribucin normal con media
cero y varianza
2
.


X
1
X
2
X
3

1
N(0,
2
)
) ( f
X
Y
E(Y/X
i
)=
1
+
2
X
i

2
N(0,
2
)
2.3 PROPIEDADES ESTADSTICAS DE LOS ESTIMADORES MICO


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

50
En base a algunos de los supuestos clsicos anteriores, veremos ahora que propiedades
estadsticas tienen los estimadores MICO. Son insesgados? Son eficientes? Tienen el
menor ECM?

2.3.1 Linealidad


2
i
i i i
2
i
i i i
2
i
i i
2
i
i i
2
x
x Y Y x

x
Y x Y x

x
) Y Y ( x

x
y x


Dado que la x
i
=0
x
Y x

2
i
i i
2

(*)

Si definimos
x
x
k
2
i
i
i

como un tipo especial de ponderador que cumple las siguientes


propiedades:
a) no estocstico
b) 0 k
i


c)


2
i
2
i
x
1
k
d) 1 X k x k
i i i i




Esto nos permite volver a (*) y expresar Y k

i i 2
(**)
Esta expresin muestra que
2

es un estimador que puede expresarse como


combinacin lineal de la variable Y
i
(donde k
i
son las ponderaciones de esa
combinacin lineal).

2.3.2 Insesgamiento
Sabemos que
i i 2 1 i
X Y + + y por (**) sabemos que Y k

i i 2
,
entonces
Tarea: Verificar estas cuatro
propiedades

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

51
i i i i 2 i 1 2
i i i 2 i 1 i 2
i i 2 1 i 2
k X k k

k X k k

) X ( k

+ +
+ +
+ +




0 1
por a) por d)

+
i i 2 2
k

(***)

Esta expresin es muy til porque expresa al estimador como la suma del verdadero
parmetro
2
ms una suma ponderada de errores aleatorios que puede resultar
positiva o negativa, pero cuyo valor esperado es 0.


2
)
2

( E si insesgado es
2



Tomando esperanza a (***)


0 ) ( E : 2 Supuesto ) ( E k )

( E
aleatorio no , fijo es k que dado ) k ( E ) ( E )

( E
) k ( E )

( E
i i i 2 2
i i i 2 2
i i 2 2
+
+
+




2 2
)

( E

El estimador es insesgado, esto es, aunque para una muestra en particular
2

se puede alejar
de
2
en algo positivo o negativo (


i i 2 2
k

), si repetimos muchas veces el


experimento, estaremos en promedio sobre el verdadero valor del parmetro. Recordar: que
el estimador sea insesgado no nos garantiza que sea el "mejor" estimador.
Tarea: Chequear para
1




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

52
2.3.3 Eficiencia
2.3.3.1 Clculo de varianzas y covarianzas.
Para verificar cuan concentrado o disperso (respecto al verdadero valor) se
encuentra el estimador MICO necesitamos calcular las VARIANZAS:
Recordar ( )
2
i
) X ( E X E ) X var(
( )
2
2 2 2 2 2
2
2 2 2
)]

[( E )

( VAR luego, )

( E pero , )

( E

E )

( VAR
De (***) sabemos que
k

i i 2 2
+


k

i i 2 2


, con lo que:

( ) [ ]
( )( ) [ ]
[ ] + + + + + +
+ + + + + +
+ + +

k k k . . . k k k k k E )

( Var
k . . . k k k . . . k k E )

( Var
k . . . k k E ) k ( E )

( Var
1 1 2 2
2
2
2
2 3 1 3 1 2 1 2 1
2
1
2
1 2
n n 2 2 1 1 n n 2 2 1 1 2
2
n n 2 2 1 1
2
i i 2


nos quedan

j i j
) 1 n ( n
1
i j j i i
2
i
n
1
2
i
2
i
2
i
k k 2 ) k k 2 ( trminos
2
) 1 n ( n

k k terminos n



1
1
1
]
1

n
1
2
) 1 n ( n
1
j i j i
2
i
2
i 2
k k 2 k E )

( Var
Recordando

'



0 ) ( E
) ( E
aleatorio no k
j i
2 2
i
i

) ( E k k 2 ) ( E k ) ( E k k 2 ) ( E k )

( Var
2
) 1 n ( n
1
j i j i
n
1
2
i
2
i j i j
2
) 1 n ( n
1
i
2
i
n
1
2
i 2

+ +


2
i 0

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

53

,
_


2
i
2
2
i
2 2
i
2
2
x x
1
k )

( Var

por c),


2
i
2
i
x
1
k
Tarea: verificar que
1
1
]
1

n
1
x
X
x n
X
)

( Var
2
i
2
2
2
i
2
i
2
1


COV( )

2 1


( )( ) [ ]

)

( E )

( E

)

( )

( E )

( E

( E

E )

( COV
2 2 1 1
2 2 1 1 2 2 1 1 2 1




Pero, X

2 1
, con lo que

1 2 2 1 1 1
X

+ + , y por tanto,
+ )
2

2
(
1

X
+ )
2 2

(
1 1

X
Entonces,


[ ][ ] { }
[ ] [ ]

1
]
1

+ + + + + + +

1
1
]
1

+
+
+
i
i
n n n
i
i i
i
k
x
X
k k k
N
E
x
X
k
N
E E X
E X E
X E COV
2
2
2
2 2 1 1 2 1
2
2
2
2 2
2 2 2 2 2 2
2 2 2 2 2 1

) . . . )( . . . (
1

) )( ( )

(
)

( )

( )

) )

( )







Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

54


2
i
2
2 1
x
X )

( COV

Caractersticas de la varianza
La varianza de
2

es directamente proporcional a
2
(varianza de
i
) e inversamente
proporcional a

2
i
x (varianza de variable X)
Dado
2
, cuanto mayor sea la variabilidad de la variable X, ms centrado estar el
estimador del verdadero valor.
Dada la varianza de X
i
, a mayor
2
(mayor variabilidad de los datos a explicar o
mayor variabilidad del error aleatorio), mayor ser la varianza del estimador.
Y
X
variabilidad
de Y no
explicada
por X
variabilidad
de X
variabilidad comn, en el sentido
que se puede explicar una por otra.
Cuanto mayor esta rea, mayor la
informacin empleada por el
procedimiento de estimacin para
calcular la pendiente , entonces,
menor su varianza.

2
La amplitud
de esta rea
es
2

Caractersticas de la covarianza
Implica que
2 1

dependen entre s
0 )
2

,
1

( cov 0 X
0 )
2

,
1

( cov 0 X si , X de depende signo


> <
< >

Tanto las varianzas y como la covarianza de los estimadores quedan dependiendo de datos
conocidos( )

X , n , X , X
2
i i
y de un parmetro desconocido
2
.
Cmo no conocemos
2
(es un parmetro poblacional), no conoceremos los valores de

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

55
las verdaderas varianzas. Estimaremos
2
y eso nos permitir estimar las varianzas de
2 1

.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

56
2.3.3.2 Estimador de
2

(1)
i i 2 1 i
X Y + +
(divido entre n y sumo para todo i)

n n
X

n
Y
i i
2 1
i

+ +
(2) + + X Y
2 1

(1)-(2) + +

) X X ( Y Y
i i 2 1 1 i
, expresado en desvos:

(3) ) ( x y
i i 2 i
+
Recordando que:
(4)
i
x
2

i
y
i
y

i
y
i
e
Sustituyendo (3) en (4)
(5)
i
x
2

i i
x
2 i
e +
(6) +
i
)
i
x )(
2 2

(
i
e

Se eleva (6) al cuadrado
[ ]
2
2
i

i
)
i
x )(
2 2

( e +
(7) ) ( )

( x 2 ) ( )

( ) x ( e
i 2 2 i
2
i
2
2 2
2
i
2
i
+

Sumando para todo i
(8) )
i
( )
2 2

(
i
x 2
2
)
i
(
2
)
2 2

(
2
i
x
2
i
e

+

Aplicando esperanza a (8)
(9) [ ] )
i
( )
2 2

(
i
x E 2
2
)
i
( E
2
)
2 2

(
2
i
x E )
2
i
e ( E
1
]
1

+
1
]
1


(10) [ ]
4 4 4 4 4 3 4 4 4 4 4 2 1
4 4 3 4 4 2 1
4 4 4 3 4 4 4 2 1
C
)
i
(
i
x )
2 2

( E 2
B
2
)
i
( E
A
2
)
2 2

( E
2
i
x )
2
i
e ( E
1
]
1

+

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

57
(11) C B A )
2
i
e ( E + +

Desarrollando A
( )
2
2
i
x
2

2
i
x
2
2

2

E
2
i
x A


Recordar que


2
1
2
2
x
)

( V
Desarrollando B

,
_

,
_

,
_

,
_

,
_

,
_

+
,
_

+
,
_

,
_

,
_

,
_


) 1 n (
2 2
n
n
1

2
n
2
n
1

2
2
)
2
i
( E
2
n
1
n
2


2
n
2
i
E n
2
2
n
i
E n
2
)
2
i
( E
2
E n
2
i
E
2
n
2
i
E
2
n 2
2
n
2
i
E n 2
2
n
2
i
E
i
2
2
n
2
i
E
i
2
2 2
i
E )
2
i
2
2
i
( E
2
)
i
( E B
3 2 1
3 2 1
Desarrollando C

( ) ( )
{
[ ] [ ]
2
2
1
i
x
i
k
2
2
2
i
x
i
k 2

0
)
1 n n
( E
1 n
x
n
k
2
)
2
n
( E
n
x
n
k
2
)
2
2
( E
2
x
2
k
2
)
2
1
( E
1
x
1
k 2
)
n n
x
2 2
x
1 1
x )(
n n
k
2 2
k
1 1
k ( E 2
i i
x
i i
k E 2
0
i
x
i i
x
i i
k E 2 )
i
(
i
x
i i
k
2 2

E 2 C

1
1
1
1
]
1

+ +


+ +

1
1
1
]
1

,
_


1
1
1
1
]
1



3 2 1
4 43 4 42 1 3 2 1 3 2 1 3 2 1
43 42 1

Entonces ahora (11)

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

58

(12) ) 2 n ( ) 2 1 n 1 ( 2 ) 1 n ( C B A ) e ( E
2 2 2 2 2 2
i
+ + + +



(13) ) 2 n ( ) e ( E
2 2
i



Definamos que el estimador de
2
es
2 n
2
i
e

2


, el resultado (13) nos asegura que
estamos definiendo un estimador insesgado de
2
.
Esto porque
2
ser insesgado si:
2
) 2 n (
2

2 n
1

) 2 n (
2

2
i
e E
2 n
1

2 n
2
i
e
E )
2

E( y
2 2

,
_

,
_


,
_

43 42 1


El estimador insesgado de
2
ser
2 n
2
i
e

2




2.3.3.3 Varianzas estimadas

Sabemos que
2 n
e

y
x
)

( V
2
i 2
2
i
2
2

, luego,


2
i
2
i
2
i
2
i
2
i
2
2
2
x ) 2 n (
e

x
2 n / e

x

( V

2

o alternativamente

2
i
2


y anlogas para


1
,
1
1
]
1

n
1
x
X
x n
X
)

( Var
2
i
2
2
2
i
2
i
2
1

Tarea: para el
ejemplo 2.1.7,
calcular las
varianzas y
covarianzas
estimadas.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

59
1
1
]
1

n
1
x
X

x n
X
~
)

( V

2
i
2
2
2
i
2
i 2 2
1
1


2.3.3.4 Teorema De Gauss-Markov

HIPTESIS: Si se cumplen los siguientes supuestos clsicos:
1. La variable explicativa X est dada (es no estocstica o no aleatoria).

2. E(
i
) = 0 i
3. y 4.

'

,
_

j i si 0
j i si
2

j
u ,
i
u E homocedasticidad y no autocorrelacin
5. No hay errores de especificacin

TESI S: Los estimadores MI CO son de mnima varianza entre los estimadores lineales e
insesgados MI CO son los mejores estimadores lineales insesgados (MELI ).


Demostracin
Sabemos que
2

es lineal (


i
Y
i
k
2

) e insesgado ( )

( E
2 2
).
Adems
x
)

( V
2
i
2
2


Supongamos que existe otro estimador
*
2
lineal de
2
.
Entonces para que ser lineal
*
2
deber ser igual a
i
Y
i
w
*
2
donde w
i
es alguna
ponderacin.
Calculemos )
*
2
( E y veamos que condicin debemos exigirle a w
i
para que
*
2
sea
insesgado.
i i 2 i 1
i 2 1 i i i 2 1 i i 2
X w w
) X ( w ) X ( E
i
w ) Y ( E w )
*
( E
+
+ + +



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

60
El trmino entre parntesis es
cero, ya que para que exista
insesgamiento se requiere que
1 w x


para que
*
2
sea insesgado se debe cumplir:

1 x w X w
0 w
i i i i
i


Veamos las condiciones que tiene que cumplir w
i
para que la varianza sea mnima


2
i
w
2 2

2
i
w
2
)
i
Y ( Var
2
i
w )
i
Y
i
w ( Var
*
2
Var
43 42 1

Sumando y restando

2
i
x
i
x
al trmino con sumatoria,
=
2
2
i
x
i
x

2
i
x
i
x

i
w
2
2
2
i
x
i
x

2
i
x
i
x

i
w
2

1
1
1
]
1

,
_

,
_



1
1
1
1
]
1

,
_

,
_

,
_

,
_


2
i
x
i
x
2
i
x
i
x
i
w 2
2
2
i
x
i
x

2
2
i
x
i
x

i
w
2

,
_

,
_

,
_


2
)
2
i
x (
2
i
x

2
i
x
i
x
i
w

2
2
2
2
i
x
i
x
2
2
2
i
x
i
x

i
w
2

,
_

+ +

,
_

2
i
2
i
i i
2
i
2
i
2 2
i
x
x
x w
x
1

2
2 x
) x (
1
2
2
2
i
x
i
x

i
w
2


,
_


2
i
x
2

2
2
i
x
i
x

i
w
2
)
*
2
( Var


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

61
quiero minimizar esto, pero el segundo sumando nmero un es
2
i
x
2

, es una constante,
Entonces, minimizar Var(
2
*
) es equivalente a minimizar
2
)
2
i
x
i
x

i
w (


y este cuadrado se minimiza cuando la base es igual a cero se minimiza cuando



2
i
i
i
2
i
i
i
x
x
w cuando o 0
x
x
w

La condicin que minimiza la varianza es que

2
i
i
i
x
x
w , que es una condicin igual a la
de MICO, por lo que
*
2 2



Este teorema asegura que si existe otro estimador (
2
*
) con similares propiedades al que
tiene MICO (linealidad e insesgamiento), para que la varianza de
2
*

sea mnima, este
estimador debe ser el estimador MICO.
Como consecuencia, MICO es el mejor estimador entre los estimadores lineales e
insesgados.


Hasta este punto hemos demostrado que los estimadores MICO tienen propiedades
importantes:
linealidad
insesgamiento
mnima varianza dentro de la familia de estimadores lineales e insesgados (eficientes
entre los estimadores lineales e insesgados)

De los seis supuestos clsicos solo hemos utilizado los cinco primeros, es decir, para
determinar estas propiedades no hemos requerido ningn supuesto sobre la distribucin de
los errores.
Tarea: verificar qu supuestos son necesarios para determinar cada una de las
propiedades

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

62
2.4 INFERENCIA ESTADSTICA EN EL MODELO DE REGRESIN
LINEAL SIMPLE

Recordar: Para obtener estimadores de
1
y
2
que sean MELI no se requiere suponer
ninguna distribucin de probabilidades de .

Ahora, para tener intervalos de confianza para los parmetros y testear cualquier
hiptesis requerimos el supuesto 6:

) , 0 ( N
2
i
i

Nos interesa saber:
Qu tan cerca estn
2 1

de los parmetros poblacionales?


Qu tan cerca est
i
Y

del verdadero E(Y/X


i
)?

2.4.1 Repaso Breve de algunos teoremas de Inferencia.

TM1 Teorema Central de Lmite:
Si X es la media de una muestra aleatoria de tamao n que se toma de una
poblacin con media y varianza finita
2
, entonces

n
) 1 , 0 ( N ~
n /
X
z de ite lm


TM2 ) , ( ntes Independie e Normales ~ Z
2
i i i
y Z
1
, Z
2
, ..., Z
n
son variables
aleatorias
Entonces,


) k , k ( N Z k Z
2 2
i i i i i
i

TM3 Una covarianza nula entre dos variables aleatorias que se distribuyen normal, implica
independencia estadstica.
f(x, y) = f(x) f(y)

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

63

TM4. Formacin de la distribucin Chi-Cuadrado
2
n
2
n
2
2
2
1
2
i
i
n 1
~ Z Z Z Z
ntes independie ), 1 , 0 ( N ~ Z
. A . sonV Z Z Si
+ + +


0
2

>

) ( P
2 2
la probabilidad de que
cualquier valor de la chi-cuadrado sea mayor a
2

es igual al rea que se acumula arriba y a


la derecha de
2

Exactamente el 95% de una distribucin chi-cuadrado caen entre


2
0.025
2
975 . 0
y .
TM5 Si Z
i
son variables aleatorias independientes y
2
k i
i
~ Z

Entonces,

2
k i
i
~ Z

TM6 Si S
2
es la varianza de una muestra aleatoria de tamao n tomada de una poblacin
normal que tiene la varianza
2
, entonces el estadstico
2
2
2
S ) 1 n (

tiene una
distribucin chi-cuadrado con n-1 grados de libertad.

TM7 Formacin de la distribucin t- student.
k
2
1
2
1
2 1
2
k 2
1
t ~
Z
k Z

k / Z
Z
t
ntes independie son Z y Z
~ Z
) 1 , 0 ( N ~ Z



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

64
0
-t

/2
t

/2
/2
P(-t

/2
< t < t

/2
) = 1-

TM8 Si X es la media de una muestra aleatoria de tamao n que se toma de una poblacin
normal con media y varianza finita y desconocida
2
, pero varianza estimada S
2
,
entonces el estadstico
1 n
t ~
n / S
X
t


, se distribuye t con n-1 grados de libertad.


TM9 Formacin de la distribucin F de Fischer
2 1 2
1
k k
2 2
1 1
2 1
2
k 2
2
k 1
, F ~
k / Z
k / Z
F
Z de nte independie es Z
~ Z
~ Z

>

) F F ( P
la probabilidad de
que cualquier valor de la F sea mayor a
F

es igual al rea que se acumula arriba


y a la derecha de F

TM 10
t
k
2
F
1
, k


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

65
2.4.2 Qu Consecuencias tiene suponer
i
~ N(0,
2
)?

1.
i
normal e incorrelacionados son independientes.

2.
i i 2 1 i
X Y + +

Por lo que Y
i
es una combinacin lineal de variables aleatorias que se distribuyen
normal Yi se distribuir normal

E(Y
i
)= E(
1
+
2
X
i
+
i
)=
1
+
2
X
i

V(Y
i
) = V (
1
+
2
X
i
+
i
)=V(
i
)=
2


Por lo que
) , X ( N ~ Y
2
i 2 1 i
+

3. Recordemos que
i i 2 2
k

+



2

tambin es C.L. de VA normales


2


es una variable aleatoria que se
distribuye normal



2
i
2
2
2
2 2
x
)

( V
)

( E
2





2
~ N (
2
,


2
2
)


4. Estandarizando,
) 1 , 0 ( N ~

Z
2

2 2
2



) 1 , 0 ( N ~

Z
1

1 1
1





Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

66

2
) , ( N
2
2 2
2


0
0
Z
2
=
2

2 2
2


~ N(0,1)

5. Recordando el teorema 6, podramos probar que:
(1)
2
2 n
~
2
2

) 2 n (



6. Sabemos que


2
i
2
i
2

2 2
x
x
con ) 1 , 0 ( N ~

2
2

Entonces, ) 1 , 0 ( N ~
x )

(

x

2
i 2 2
2
i
2 2


(2)
Podramos probar que (1) y (2) son independientes. Entonces:
t ~
2 n

) 2 n (
x )

(
t
2 n
2
2
2
i 2 2

(3)

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

67
Expresando (3) de otra forma y simplificando:

x )

x )

(

) 2 n (
1
) 2 n (

x )

(
t
2
i 2 2
2
2
2
i 2 2
2
2
2
i 2 2



=
2
2

2 2

2
i
2 2
2
i 2 2

x )


Es decir que:
2 n

2 2
t

(
2


y por similar procedimiento, 2 n

1 1
t

(
1



Esto nos permitir obtener intervalos de confianza y realizar test de hiptesis sobre
1
y
2
.

2.4.3 Intervalos de Confianza para
1
y
2
.
Estamos buscando , + 1 )

( P
2 2 2
, es decir que la probabilidad de que
2

est entre dos valores sea 1-.
Notacin:
(1-) % nivel de confianza
nivel de significancia
El intervalo ser aleatorio (depende de la muestra), pero despus que se utiliz una muestra,
el intervalo queda fijo y por tanto la probabilidad de que el verdadero valor est en el
intervalo es cero o uno (est o no est)
Dado que
2 n

2 2
t ~


, entonces exactamente el 1- de esta distribucin t con n-2
grados de libertad, estar entre los valores -t
/2
y t
/2
.


1 ) t t t ( P
2 / 2 n 2 /

1 ) t

t ( P
2 /

2 2
2 /
2


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

68


1 )

t ( P
2 2
2 / 2 2 2 /

+

1 )

( P
2 2
2 / 2 2 2 / 2

Por lo que finalmente:
+

1 )

( P
2 2
2 / 2 2 2 / 2

Esto implica que el intervalo de confianza para
2
es:
2
2 / 2 2

IC

t

Y en forma similar:
1
2 / 1 1

IC

t


2.4.4 Prueba de hiptesis
Nos interesa verificar si las observaciones muestrales son compatibles con determinada
hiptesis. Por ejemplo:

b ) H
b ) H
2 1
2 0



Para eso desarrollamos un procedimiento que nos permita decidir si se rechaza o no esa
hiptesis en base a la informacin muestral.
Hay dos enfoques de la prueba de hiptesis:
Enfoque del intervalo de confianza.
Supongamos que construimos un intervalo de confianza para
2
. Luego es posible discutir
si el valor b que me estoy planteando como hiptesis nula cae o no dentro del intervalo.
Es decir buscamos un intervalo
2
2 / 2 2

IC

t y luego
Si b IC No rech H
0

Si b IC Rech Ho.

Rech H0 No rech H0 Rech H0

2
2 / 2 2


2
2 / 2 2

+


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

69
Enfoque de pruebas de significacin.
El procedimiento se basa en utilizar un estimador y su distribucin, considerando que sta
se cumple bajo la hiptesis nula.
Sabemos que
2 n

2 2
t ~


, entonces bajo la hiptesis nula
2 n

2
t ~

1 ) t

t ( P
2 /

2
2 /
2



1 )

t b

t ( P
2 2
2 / 2 2 /

+

1 )

t b

t b ( P
2 2
2 / 2 2 /

Por lo que finalmente:
+

1 )

t b

t b ( P
2 2
2 / 2 2 /

Esto determina la regin de aceptacin y rechazo de la hiptesis:

2
2 /

t b : aceptacin egin r

t
0
-t
c
t
c
/2
Bajo Ho,
2


~ t
n-2
Acepto la hiptesis nula (Ho)
No rech H
0
Rech Ho >
2

b +
2

/2
Rech Ho <
2

b -
2

/2
Entonces rechazamos H
0
si

t >t
c
t < t
c

Rech H
0
si | t | > t
c


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

70
Como
2

, entonces
Rech H
0
si
c

2
t


2
>


2.4.5 Recordando de inferencia:
1. Diferencia entre test a una o dos colas, viene dada por la hiptesis alternativa.
Una cola
t
c

b : H
b : H
2 2 1
2 2 0
>

Rech H
0
si t > t
c
Dos colas
t
c
/2
b : H
b : H
2 2 1
2 2 0


Rech H
0
si |t| > t
c
/2
- t
c
Si
2

cae en alguna de las colas de la distribucin (Rech H


0
), puede ser por dos
razones
a. La hiptesis nula es cierta, pero se ha elegido una muestra equivocada.
b. La hiptesis nula es efectivamente falsa.

H
0
cierto H
0
falso
Rech H
0

Error I Ok
No Rech H
0

Ok Error II
Al hacer test de hiptesis, estoy fijando en , la probabilidad de cometer error I.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

71

2
bajo H
0

2
bajo H
1

= P(Error Tipo I) = P(Rech H
0
/H
0
es cierto)
Al minimizar la probabilidad de error I , se aumenta la probabilidad de cometer
error II.
= P(Error Tipo II) = P(No Rech H
0
/H
0
es falso)

3. La hiptesis nula ms comn utilizada:
0 : H
0 : H
2 1
2 0


, luego, bajo la hiptesis nula
2 n

2
t ~

t
2


Objetivo: Evaluar si
2
es significativamente distinto de cero. Si lo es se dice
que la variable X es significativa o relevante.
2.4.6 Ejemplos de Test De Hiptesis
Ejemplo 1
El caso ms comn es probar

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

72
H
0
:
2
= 0
H
1
:
2
0
Para el ejemplo 2.1.7, tenamos que
i
X 75 . 0 6 . 3 Y

+ y los desvos estndar de los


coeficientes eran:
256 . 0
09 . 2

2
1


Nos interesa saber si la variable X es estadsticamente significativa, esto es probar la
hiptesis nula de que
2
= 0
Esto se puede hacer de dos maneras:

Por medio de un intervalo de confianza.

t
/2, 8
= t
0,025
= 2,306
IC
2
0,75 (2,306)(0,256)
2
0,75 + (2,306)( 0,256)
0.16
2

1.34
IC 95%
Como el cero no pertenece al intervalo, rechazo la hiptesis nula a un 95% de nivel de
confianza. Esto significa que de cada 100 intervalos que se realicen, 95 contendrn el
verdadero valor de
2
. Pero luego de calculado uno (0,16; 1,34), la probabilidad de que
2

est contenido en l es 1 o 0. (o est o no est).

Cmo podemos producir intervalos menores?
aumentar el nivel de confianza (reduciendo ).
ampliar el tamao de la muestra buscando reducir la varianza.










Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

73
Por medio de una prueba de significacin.

0
-2.306 2.306
0.025
Rech Ho si |t |>2.306
0

2
H . rech 3 , 2 93 , 2
256 , 0
75 , 0

t
2
>

2.93

Rech
2
=0
2
es significativamente distinto de cero, X es significativo o
relevante para explicar Y.
Regla 2t
Cuando n = 20, P(t > 2,085) = 0,025 si
i

2,0 estamos seguros que


rechazamos H
0
y el coeficiente
i
es significativamente distinto de cero.


Salida de E-Views para este ejemplo:
Nos interesa ver solo la parte de la salida que hemos estudiado hasta ahora.
LS // Dependent Variable is Y
Date: 08/25/98 Time: 09:51
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 3.600000 2.090177 1.722342 0.1233
X 0.750000 0.255738 2.932692 0.0189
R-squared 0.518092 Mean dependent var 9.600000
Adjusted R-squared 0.457854 S.D. dependent var 1.837873
S.E. of regression 1.353237 Akaike info criterion 0.781855
Sum squared resid 14.65000 Schwarz criterion 0.842372
Log likelihood -16.09866 F-statistic 8.600683
Durbin-Watson stat 2.346416 Prob(F-statistic) 0.018920




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

74
La salida tiene tres partes:
i) La primera indica la variable dependiente (Y), el perodo muestra utilizado (sample)
y su tamao (nmero de observaciones).
ii) La segunda parte plantea las estimaciones de los coeficientes y sus varianzas. Se
muestran cinco columnas:
Variable: variables explicativas (siempre se identifica el intercepto con la letra C)
Coefficient: muestra los coeficientes estimados.
Std. Error: indica las estimaciones de los desvos estndar de los coeficientes (
i

).
t-Statistic: presenta el valor del estadstico t (
i
i
t

) para la hiptesis nula


i
=0. Para
el ejemplo, vemos que el estadstico t del intercepto es menor que dos, por lo que
podramos decir que la constante no es significativa.
Prob: el p-value, o sea, el nivel de significancia () mximo ex post que requerimos
para no rechazar la hiptesis nula. En este ejemplo, si trabajamos con =1.8%, no
rechazamos la hiptesis de que
2
=0.
iii) La tercera parte de la salida presenta indicadores de ajuste y otros estadsticos
veremos ms adelante en este curso. Los que conocemos hasta ahora son:

R-squared: es el R
2
de la regresin e indica que la regresin logra explicar el 51% de la
variacin total de Y.
S.E. of regression: desvacin estndar de la regresin=
2 n
e

2
i




Sum squared resid: suma al cuadrado de los residuos:

2
i
e
Mean dependent var: Y
S.D. dependent var: desvacin estndar de la variable dependiente:
1 n
) Y Y (
2
i




Ejemplo 2: Relacin Error I y Error II
Rech H
0
/H
0
Error de tipo I , P(Error I)=
no rech H
0
/H
1
Error de tipo II

Ejemplo:
Considere el siguiente modelo:
Y
i
=
1
+
2
X
i
+
i

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

75
donde a priori se sabe que la varianza verdadera de
i
es 40 (
2
= 40).
Dado una muestra de 10 observaciones, se sabe que X
i

20 y X
i
2

50.
Usted est interesado en probar la hiptesis nula de que
2
= 1, versus la hiptesis
alternativa de que
2
> 1, con un nivel de significacin de 5%. Si el verdadero valor
de
2
es 4, cul es la probabilidad de que usted rechace correctamente la hiptesis
nula?


Sabemos que
i i 2 1 i
X Y + +

H
0
)
2
= 1
H
1
)
2
> 1
Se pide calcular la Probabilidad de rechazar H
0
correctamente. Esto es, la probabilidad de
que rechacemos que
2
=1, dado que en realidad es 4.
Debemos calcular Prob (rech H
0
/
2
=4)
Bajo H
0
,
1


~ N(0,1), porque se conoce la verdadera varianza de
i

Bajo H
0
,
2~ N(1, )
2

Bajo H
1
,
2~ N(4, )
2

No rech Ho Rech Ho
1 4
El rea achurada es la que se nos pide
calcular, es la P(rech H
0
, dado H
1
) y es
igual a 1-P(no Rech H
0
, dado H
1
)=1-
Lo primero que debemos calcular es el rea de rechazo. Sabemos que rechazamos H
0
si
c

> , Rech. H
0
si 645 , 1
1

2
>


Dada la informacin que conocemos:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

76
2 4
4
10
40

) 2 ( 10 50
40
X n X
1

) X X (
1

x
1

50 X
20 X
10 n
40

2
2 2
1
2
2
i
2
2
1
2 2

2
i
i
2
2

2


Rech. H
0
si 645 , 1
2
1

2
>


Rech Ho si
29 . 4 1 2 * 645 , 1

2
+ >

Rech Ho si
29 . 4

2
>

Luego,

,
_


>

>
2
4 29 , 4

2
4

P ) 4 / 29 , 4

( ob Pr ) 4 2 / chH (Re ob Pr
2
2 2 0

= P(Z > 0,145) = 0,4443
4443 , 0 ) 4 2 /
0
chH (Re ob Pr


2.5 ANALISIS DE VARIANZA

ANOVA Es un test de significancia global del modelo en su conjunto.
Intenta medir el ajuste de la recta de regresin con el conjunto de datos
proveniente de la muestra.

La hiptesis a probar es
3
:
H
0
:
2
= 0
H
1
:
2
0
Trataremos de encontrar un nuevo estadstico que nos permita verificar esta hiptesis.

3
En el caso de la regresin simple, tanto la hiptesis a probar como el estadstico que utilizaremos son
coincidentes con un test de significancia. Esto debido a que solo existe una variable explicativa. Este
resultado no ser igual en un modelo general.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

77
Sabemos que:

) 1 , 0 ( N ~

2 2


(1)
Si elevamos (1) al cuadrado, tenemos que (2) se distribuye chi-cuadrado con un grado de
libertad.
( )
2
1
2

2
2 2
~

(2)
Transformando (2):
( )
2
1
2
2
i 2 2
2
i
2
2 2
~
x


x
1

(3)
Por otro lado sabemos que:
2
2 n
2
2
i
2
2 n
2
2
~
e
~
) 2 n (



(4)

Se puede demostrar que (3) y (4) son independientes y pueden formar una nueva expresin
que se distribuye F.

( )
2 n , 1
2
u
2
1
2
2
i
2
2 2
F ~
2 n
e

1
x

(5)
Simplificando (5)

( )
2 n , 1
2
1
2
i
2
2 2
F ~
2 n
e
x

(6)
Bajo H
0
:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

78
2 n , 1
2
1
2
i
2
2
F ~
2 n
e
x

(7)
Analizando esta expresin, vemos que el numerador coincide con la suma de cuadrados
explicados (SCE), y el denominador es la SCR dividida por sus grados de libertad.

2 n , 1
F ~
2 n / SCR
SCE
F

(8)


0

Rechazo H
0
, si el valor calculado del
estadstico
2 n / SCR
SCE
F

es mayor
que

2 n , 1
F
F


Este test indica que el modelo es significativo en su conjunto, si el "efecto explicado por el
modelo" es suficientemente grande respecto al "ruido", a lo residual.
Si
0
H . ch Re ) 2 n , 1 ( F
2 n / SCR
SCE
F >



Rechazo que
2
= 0, si obtengo un valor del "aporte de X" respecto al residuo que
sea considerable. Cun considerable? El lmite nos lo da el valor de tabla.

Grados de Libertad
Asociado a cada suma de cuadrados hay grados de libertad; (valores que pueden elegirse
arbitrariamente).
Suma de cuadrados Totales (SCT): tiene n-1 grados de libertad. Esto surge como
consecuencia de la prdida de un grado de libertad, necesario para calcular Y.
Suma de cuadrados residuales (SCR): tiene n-2 grados de libertad. Se pierden dos grados
de libertad que son necesarios para asegurar que se cumplan las ecuaciones normales. Estas

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

79
condiciones son: 2 - n
0 X e
0 e
i i
i


Suma de cuadrados explicados (SCE): g.l 1 tiene SCE calculo

dado
2


Antes veamos que al realizar una regresin, esto nos permita dividir la variacin total en
dos partes, la parte explicada por la regresin y la parte residual. Es decir que existen
distintas fuentes en que se descompone la variacin total. Esto se puede resumir en esta
tabla a la que generalmente se conoce como TABLA ANOVA.


FUENTES DE VARIACION:

Suma de Cuadrados Grados de Libertad Suma Promedio de
Cuadrados
Regresin


2
i
2
2
x

SCE
1 SCE/1
Residuo

2
i
e SCR
n-2 SCR/n-2
Total
SCT y
1
2


n-1


Existe una forma alternativa de expresar (8) que tambin permite realizar el test:

2 n , 1
2
2 2
F ~
R 1
R ) 2 n (

) 2 n ( SCT
SCE SCT
R

SCT
2 n
SCE SCT
SCT / SCE

2 n
SCE SCT
SCE

2 n / SCR
SCE
F



Verifiquemos ahora que este test, para el caso del modelo de regresin simple, es
equivalente a un test de significancia de
2
.
Sabemos que
2 n , 2 /
t

2
i
x
2


2
i
x /

si
0
H ch Re

>




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

80
Elevamos esta expresin al cuadrado,

2 n , 1
F
2 n /
2
i
e
2
i
x
2
2

2
i
x
2
2

si
0
H ch Re

>


Esta expresin es la misma de (7).
Debemos recordar que el cualquier valor de la tabla t para k grados de libertad, elevado al
cuadrado es igual al valor de la tabla F en 1, k grados de libertad. En
particular
2 n , 1
2
2 n
F t

.
Este resultado no se verifica en regresiones con mayor nmero de variables explicativas.

2.6 PRUEBA DE NORMALIDAD
Las pruebas de hiptesis e intervalos de confianza estudiados, tienen como punto de partida
el supuesto de normalidad del residuo, si no es normal, estas pruebas no son validas.
Existen test que permiten verificar si los residuo calculados para una muestra en particular
(e
i
) provienen de una distribucion normal. Uno de ellos es el test de Jarque-Bera
Esta es una prueba asinttica que se basa en el tercer y cuarto momento de la distribucin
(asimetra y curtosis respectivamente).
coeficiente de simetra: S=
( )
3
3
i
n
X X


coeficiente de curtosis: C=
( )
4
4
i
n
X X


Para una ditribucin normal el coeficiente de asimetria es cero y el coeficiente de curtosis
es 3.

Bajo la hiptesis nula de que los residuos estan normalmente distribuidos, Jarque y Bera
demostraron que asintticamente el estadistico
1
]
1


+
24
) 3 C (
6
S
n JB
2 2
sigue una
distribucin chi-cuadrado con dos grados de libertad. Si el valor JB es grande comparado
con el valor de una distribucin chi-cuadrado con dos grados de libertad, rechazo la
hiptesis nula, rechazo normalidad.



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

81
3 3. . M MO OD DE EL LO O D DE E R RE EG GR RE ES SI I N N M MU UL LT TI IP PL LE E

3.1 DEFINICIONES

En algunas aplicaciones cientficas (medicina, agronoma) los modelos de regresin
generalmente utilizados tienen una nica variable explicativa (modelo simple). En
economa, sin embargo, es difcil tener un fenmeno explicado por una sola variable
explicativa. Generalmente,

Y = f(X
1
, X
2
, ...., X
k
,
i
) a este tipo de modelo lo llamamos modelo mltiple.

Ejemplo: Vtas Empresa = f (PIB, tasa de inters real, Gastos Publicidad)


Modelo de regresin poblacional mltiple

(1) Y
i
=
1
+
2
X
i2
+
3
X
i3
+ ......................+
k
X
ik
+
i
para i =1,2, ....n
y donde X
ik
representa la observacin i de la variable k.

(1) es equivalente a:

(2)

'

+ + + + +
+ + + + +
+ + + + +
n nk k 3 n 3 2 n 2 1 n
2 k 2 k 23 3 22 2 1 2
1 k 1 k 13 3 12 2 1 1
X . . . X X Y

X . . . X X Y
X . . . X X Y


(2) es la forma abreviada de n ecuaciones con k incgnitas y por tanto se puede
escribir:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

82
(3)
1
1
1
1
1
]
1

+
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
]
1

n
2
1
k
2
1
nk 3 n 2 n
k 2 23 22
k 1 13 12
n
2
1
.
.
.
.
X . X X 1
. . . . .
. . . . .
X . X X 1
X . X X 1
Y
.
.
Y
Y


Definiendo las siguientes matrices:


1
1
1
1
1
]
1

n
2
1
1 n
Y
.
.
Y
Y
Y
1
1
1
1
1
1
]
1

nk 3 n 2 n
k 2 23 22
k 1 13 12
k n
X . X X 1
. . . . .
. . . . .
X . X X 1
X . X X 1
X
1
1
1
1
1
]
1



k
2
1
1 k
.
.

1
1
1
1
1
]
1



n
2
1
1 n
.
.

Podemos expresar (3) de la siguiente forma:

(4)
1 n 1 k k n 1 n
X Y

+


Modelo de regresin muestral mltiple

(5)
ik k 3 i 3 2 i 2 1 i
X

. . . X

X

Y

+ + + + para i=1,2,.....n

Nuevamente tenemos un sistema de n ecuaciones, que puede transformarse en:


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

83
(6)

'

+ + + +
+ + + +
+ + + +
nk k 3 n 3 2 n 2 1 n
k 2 k 23 3 22 2 1 2
k 1 k 13 3 12 2 1 1
X

. . . X

X

Y

. . . X

X

Y

. . . X

X

Y



Utilizando las definiciones matriciales anteriores y agregando:
1
1
1
1
1
1
]
1

n
2
1
1 n
Y

.
.
Y


1
1
1
1
1
1
]
1



k
2
1
1 k

.
.



(6) se puede transformar en:

(7)
1 k k n 1 n

X Y




Adems tenemos que:
(8)
i ik k 3 i 3 2 i 2 1 i
e X

. . . X

X

Y + + + + +

Con lo que definiendo
1
1
1
1
1
1
]
1

n
2
1
1 n
e
.
.
e
e
e , lo podemos transformar en forma matricial como
(9)
1 n 1 k k n 1 n
e

X Y

+

De la diferencia entre (9) y (7), sale la definicin del error:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

84
(10)
1
1
1
1
1
1
]
1

X Y Y

Y
e
.
.
e
e
e
n
2
1
1 n

Entonces:
Y

X Y

X e Y

( X

X u X e

X Y e

X Y

X Y
+ +

+ +



+


3.2 ESTIMADORES MICO
Al igual que antes se trata de minimizar

2
i
e

3.2.1 Primera forma de derivacin.

2
ik k 3 i 3 2 i 2 1 i
2
i
) X

X

Y ( min e min Q min


Ahora tenemos k ecuaciones normales
(11)
0 ) X )( X

X

Y ( 2

Q
) k (

0 ) X )( X

X

Y ( 2

Q
) 2 (
0 ) 1 )( X

X

Y ( 2

Q
) 1 (
ik ik k 3 i k 2 i 2 1 i
k
2 i ik k 3 i 3 2 i 2 1 i
2
ik k 3 i 3 2 i 2 1 i
1

'



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

85

Trabajando:
(12)
X

X X

X Y ) k (

X X

X Y ) 2 (
X

X

N Y ) 1 (
2
ik
k ik 2 i 2 ik 1 ik i
2 i ik k
2
2 i 2 2 i 1 2 i i
ik k 2 i 2 1 i

'

+ + +
+ + +
+ +





Matricialmente podemos expresar esto de la siguiente manera (Demostrarlo):

(13)
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

.



k
2
1
2
ik ik 2 i ik
ik 2 i
2
2 i 2 i
ik 2 i
n
2
1
k 2 k 1
2 n 22 12

.
.

X . . X X X
. . . . .
. . . . .
X X . . X X
X . . X n
Y
.
.
Y
Y
X . . X X
. . . . .
. . . .
X . . X X
1 . . 1 1
nk


Y dadas las definiciones anteriores,

1
1
1
1
1
1
]
1

nk 3 n 2 n
k 2 23 22
k 1 13 12
k n
X . X X 1
. . . . .
. . . . .
X . X X 1
X . X X 1
X
1
1
1
1
1
1
]
1

nk
X . . X X
. . . . .
. . . .
X . . X X
1 . . 1 1
X
k 2 k 1
2 n 22 12
'
n k


1
1
1
1
1
1
]
1




2
ik ik 2 i ik
ik 2 i
2
2 i 2 i
ik 2 i
X . . X X X
. . . . .
. . . . .
X X . . X X
X . . X n
X ' X
Entonces (13) puede expresarse:
(14)

X ' X Y ' X Esta expresin representa el conjunto de ecuaciones normales.



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

86

la matriz XX tiene las siguientes caractersticas:
- simetra
- de dimensin k x k (cuadrada)
- en la diagonal principal aparecen la suma de cuadrados de cada variable y en el
resto las sumas de productos cruzados.

Si (XX)
-1
existe puedo postmultiplicar (14) por (XX)
-1

(15)


X ' X ) X ' X ( Y ' X ) X ' X (
1 1
, con lo que:
(16)

I Y ' X ) X ' X (
1

(17)
Y ' X ) X ' X (
1




Esta es la frmula matricial que estabamos buscando y que resume los k estimadores
MICO.


Pero, necesitamos algn supuesto para obtener los

?

S, necesitamos que XX sea invertible
Cundo una matriz es invertible?
- Si es cuadrada
- Si no se pueden expresar las filas o las columnas como combinacin lineal
entre s la matriz es de rango completo el determinante de la matriz
es distinto de cero.

Esto implica que para poder calcular

, las variables explicativas que son las que forman


XX, tendrn que cumplir con determinadas condiciones que aseguren que la matriz sea
invertible.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

87
3.2.2 Otra forma de encontrar


Queremos minimizar

2
i
e y esto es equivalente a minimizar ee, porque

,
_

2
i
n
2
1
n 1
e e ' e
e
.
e
e
) e e (
Como :
e = Y - X


ee = (Y - X

) (Y - X

) Debemos minimizar ee

Algunas propiedades de operaciones con matrices:
- (A + B) = A + B
- (A B) = BA
- (A) = A
- (A
-1
) = (A)
-1

- zAz es una forma cuadrtica Az 2
z
Az ' z

X Y ( )'

X Y ( min e ' e min e min

2
i

X ' X '

Y ' X '

X ' Y Y ' Y )

X Y )( ' X '

' Y ( )

X Y ( )'

X Y ( min
*
4 4 3 4 4 2 1


A qu son iguales estos dos trminos (*)?
escalar

X ' Y
1 k k n n 1


por ser de orden 11
escalar Y ' X '

1 n n k k 1


por ser de orden 11
Son escalares y uno es el transpuesto del otro puedo sustituirlo por Y ' X '

2

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

88
Debemos +

X ' X '

Y ' X '

2 Y ' Y minQ






+


+

X ' X '

) Y ' X '

2 (

Y ' Y

Q
=0


+

X ' X '

) Y ' X '

2 (

Q
=0
Queremos encontrar

) Y ' X '

2 (



,
Sea a un vector de constantes,
a

,
_

,
_

+ +

k
2
1
k
1
k k 2 2 1 1
a
a
a
b
b
) b a b a b a (
b
) b ' a (
M
M
L

Luego,

) Y ' X '

2 (



= -2XY


X ' X '

(

Sea A una matriz de constantes simtrica,
A=

,
_

kk k 2 k 1
k 2 22 12
k 1 12 11
a a a
a a a
a a a
L
L L L L
L
L
, entonces:
bAb=
2
k kk
k 2 2k 3 2 23
2
2 22
k 1 k 1 3 1 13 2 1 12
2
1 11
b a

b b 2a b b 2a b a
b b a 2 b b a 2 b b a 2 b a
+
+ + + + +
+ + + + +
O
L
L


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

89
Ab 2 b 2
2
2
b a b a b a ( 2
b a b a b a ( 2
b
b
b
) Ab ' b (
k kk 2 k 2 1 k 1
k k 1 2 12 1 11
k
2
1

,
_

,
_

,
_

+ + +
+ + +

1
1
1
1
]
1

k
1
k
1
a
a
b a
b a
M M
L
M
L
M

Luego,

X ' X 2

X ' X '

(

0

X ' X 2 Y ' X 2

Q
+


Con lo que:
existe ) X ' X ( Si Y ' X

X ' X
Y ' X 2

X ' X 2
1



Y ' X ) X ' X (
1

Condiciones de segundo orden
X ' X 2
)'

)(

(
Q
2


Las condiciones de mnimo implican que esta matriz debe ser definida positiva. Para
comprobar esto definamos d cualquier vector no nulo de k elementos y c un vector de n
elementos tal que c=Xd. Como X es de rango completo por columna esto implica que c sea
no nulo (de lo contrario habra dependencia lineal entre las columnas de X).
Por lo tanto,
cc= dXXd >0 y entonces XX es definida positiva.

3.2.3 Deduccin de los estimadores MICO en el modelo simple.

Y ' X ) X ' X (
1

i 2 i 2 1 i
X Y + +
Cmo son las matrices para este caso en particular?

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

90
1
1
1
1
]
1

1
1
1
]
1

1
1
1
1
1
1
]
1

n
1
2 n 22 12
2 n
12
12
Y
:
:
Y
Y
X X X
1 1
' X
X 1
: :
: :
X 1
X 1
X

1
]
1

1
1
1
1
1
1
]
1

1
]
1

2
2 i 2 i
2 i
2 n
22
12
2 n 22 12
X X
X n
X 1
. .
. .
X 1
X 1
.
X . . X X
1 . . 1 1
X ' X
Recordar:
A de te determinan
uesta transp cofactores de matriz
A
)' A (
A
c
1


La matriz de cofactores se forma de sustituir cada elemento de la matriz por su
correspondiente cofactor C
ij
. Donde Cij=(-1)
i+j
M
ij
, siendo M
ij
(menor) el determinante de
la submatriz que se forma cuando a la matriz A se le elimina la fila i y la columna j.
1
1
]
1

n X
X X
) X ( X n
1
) X ' X (
2 i
2 i
2
2 i
2
2 i
2
2 i
1



1
1
1
1
1
1
]
1

2
2 i
2
2 i
2
2 i
2
2 i
2 i
2
2 i
2
2 i
2 i
2
2 i
2
2 i
2
2 i
1
) X ( X n
n
) X ( X n
X
) X ( X n
X
) X ( X n
X
) X ' X (

1
]
1

1
1
1
1
]
1

1
]
1

i 2 i
i
n
1
2 n 22 12
Y X
Y
Y
:
:
Y
.
X . . X X
1 . . 1 1
Y ' X
Reemplazando en la frmula encontrada para

, tenemos:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

91

1
1
1
]
1

1
1
1
1
1
1
]
1

i 2 i
i
2
2 i
2
2 i
2
2 i
2
2 i
2 i
2
2 i
2
2 i
2 i
2
2 i
2
2 i
2
2 i
1
Y X
Y
) X ( X n
n
) X ( X n
X
) X ( X n
X
) X ( X n
X
Y ' X ) X ' X (


Multiplicando:

1
1
1
1
1
1
]
1

2
2 i
2
2 i
i 2 i i 2 i
2
2 i
2
2 i
i 2 i 2 i i
2
2 i
1
) X ( X n
Y X n Y X
) X ( X n
Y X X Y X
Y ' X ) X ' X (



Reemplazando

X n X y Y n Y
i i y dividiendo entre n, obtenemos:


1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
]
1

2 2
2 i
i 2 i
2 2
2 i
i 2 i
2
2 i
2 2
2 i
i 2 i
2 2
2 i
i 2 i
2
2 i
1
X n X
Y X Y X n
X n X
Y X X Y X
) X n ( X n
Y X n Y n X n
) X n ( X n
Y X X n Y n X
Y ' X ) X ' X (


1
1
1
1
1
1
1
]
1


2 2
2 i
i 2 i
2 2
2 i
i 2 i
2
2 i
X n X
Y X n Y X
X n X
Y X X Y X



En la segunda fila obtenemos una formula que es idntica a la que tenamos en el modelo
simple.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

92
1
1
1
1
1
]
1

+



2
2 2
2 i
i 2 i
2
2 i

X n X
) Y X n Y X n Y X ( X Y X


1
1
1
1
1
1
1
]
1

1
1
1
1
1
]
1


2
2 2
2 i
i 2 i
2 2
2 i
2 2
2 i
2
2 2
2 i
i 2 i
2 2
2 i


X n X
) Y X n Y X ( X
X n X
Y X n Y X

X n X
) Y X n Y X ( X Y X n Y X


Simplificando:
1
1
]
1

1
1
1
1
1
1
1
1
]
1

,
_

,
_

2
2
2
2 2
2 i
i 2 i
2 2
2 i
2 2
2 i

X Y


X n X
Y X n Y X
X
X n X
X n X
Y



Con lo que:

1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
]
1

2
2 i
i 2 i
2
2 2
2 i
i 2 i
2
x
y x
X

Y
X n X
Y X n Y X
X



Para el caso de la regresin con intercepto y dos variables:
i 3 i 3 2 i 2 1 i
X X Y + + +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

93
1
1
1
1
1
1
]
1

3 n 2 n
23 22
13 12
3 n
X X 1
. . .
. . .
X X 1
X X 1
X
1
1
1
]
1




2
3 i 3 i 2 i 3 i
3 i 2 i
2
2 i 2 i
3 i 2 i
X X X X
X X X X
X X n
X ' X
1
1
1
]
1

i 3 i
i 2 i
i
Y X
Y X
Y
Y ' X

3.2.4 Una interpretacin de los estimadores MICO.

En el modelo simple
i 2 i 2 1 i
e X

Y

+ + nos interesaba medir el efecto de la variable


explicativa sobre la variable explicada. Este efecto se cuantifica a travs de
2

.
Cuando tenemos un modelo mltiple,
i ik k 3 i 3 2 i 2 1 i
e X

. . . X

X

Y + + + + + , los
coeficientes
i

estimados miden el efecto parcial de la variable X


i
sobre Y
i
. Esto es, el
efecto de X
i
sobre Y
i
luego de eliminados los efectos de las otras variables sobre X
i
.
Para entender esto veamos algunos diagramas de Ballentine.
Supongamos que el modelo es
i i 1 i
e X

Y

+ +
X
. En el diagrama que sigue el circulo Y
representa la variacin de la variable dependiente y el circulo X representa la variacin de
la variable explicativa. El rea achurada donde se sobreponen los dos crculos, representa la
variacin que es comn entre X e Y y que por tanto puede ser explicada por MICO. Esta
rea representa la informacin que es utilizada para calcular
x

. Cuanto mayor esta rea,


mayor la informacin y por tanto menor la varianza del coeficiente.
X

Y

Consideremos ahora que se incluye una nueva variable explicativa Z, de forma que el
modelo es
i i z i x i
e Z

X

Y

+ + +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

94
X

Y
Z
*
* * *
* * * *











En general existir una zona (tringulos y rayas) en que X y Z se overlapan. Si Y fuera
explicada slo por X, para calcular

x
se utilizara la informacin comn entre X e Y
(rayas y asteriscos). Si Y fuera explicada slo por Z, para calcular

z
se utilizara la
informacin comn entre Y y Z (rayas y puntos).
En la regresin mltiple se incluyen X y Z como variables explicativas. Para calcular

x
se usa la interseccin entre X e Y, luego de eliminar la interseccin entre Xy Z. Es
decir que el estimador es calculado usando slo la informacin representada por el rea
marcada con asteriscos. En forma anloga, la informacin contenida en el rea con puntos
es la nica utilizada para calcular

z
. La informacin contenida en el rea rayada no es
utilizada porque al reflejar la variacin en Y que es determinada en conjunto por X y Z no
permite aislar sus efectos y asignarlos a cada estimador.
Debe notarse que al agregara variables explicativas los parmetros del modelo son
calculados utilizando cada vez menos informacin. Esto provocar un incremento de las
varianzas de los estimadores.
Adems, debe tenerse en cuenta que la informacin utilizada en la estimacin de los
parmetros (y por tanto su varianza) depender de cuanta informacin comn exista entre
las variables explicativas utilizadas.
Cuanto mayor el rea comn entre X y Z (mayor colinealidad entre las variables
explicativas), menor resultarn las reas de puntos y asteriscos y por tanto mayor la
varianza de los estimadores. Si la colinealidad es perfecta los crculos X e Z se overlapan
completamente haciendo imposible la estimacin.
Por el contrario, si no existe ningn rea comn entre X y Z (si son ortogonales) no existe
zona rayada y por tanto los estimadores encontrados en la regresin mltiple seran los
mismos que en dos regresiones simples (una respecto a X y otra respecto a Z).


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

95
3.2.5 Corolarios de los Estimadores MICO
Ortogonalidad del residuo
(1)

X Y Y

Y e
(2) e

X Y +
De las ecuaciones normales sabemos que:
e ' X

X ' X

) X ' X (
) e

X ( ' X

) X ' X (
Y ' X

) X ' X (
+
+



Con lo que: 0 e ' X

Qu significa?

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

0
.
0
0
0
X e
.
X e
X e
e
e
.
e
e
e
X . . X X
. . . . .
. . . .
X . . X X
1 . . 1 1
e ' X
ik i
3 i i
2 i i
i
n
3
2
1
k 2 k 1
2 n 22 12
nk

La igualdad de la primera fila implica que si la regresin tiene constante 0 e .
Los elementos restante indican que la correlacin muestral entre los residuos y cada
variable X
i
es cero. En trminos matriciales esto implica que el vector de errores es
ortogonal a la matriz X de variables del modelo.

Recordar: dos vectores a y b son ortogonales si 0 b ' a . Un vector como e, que es
ortogonal a cualquier vector del hiperplano generado por las columnas de X, se dice que es
normal al hiperplano.

El hiperplano de regresin pasa por el punto determinado por las medias muestrales de
todas las variables involucradas en el modelo. ( ) Y , X ,...., X , X
k 3 2
, siempre que ste posea
intercepto.
Esto debido a que la primera ecuacin de (12) implica que
k k 3 3 2 2 1
X

.... X

X

Y + + + +


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

96
Descomposicin en suma de cuadrados.
Recordar que en el modelo lineal simple:
SCT=SCE+SCR

+ +
2
i
2
i
2
i
2
i
2
2
2
i
e y

e x

y
Ahora:
SCT
Y n Y ) Y Y ( y SCT
2 2
i
2
i
2
i



Dado que ( )

1
1
1
1
1
1
]
1

,
_

2
i
n
2
1
n 2 1
Y
Y
.
.
Y
Y
Y . . Y Y Y ' Y

Luego,
2
Y n Y ' Y SCT

Definiendo: )' Y Y ( ' y , SCT tambin es igual a
2
Y N Y ' Y y ' y

SCE


) Y

( y

SCE
2
i
2
i

Dado que Y Y

(demostrarlo de tarea) y que

X Y


= Y N

X ' X '

Y N Y

' Y

Y n Y
2 2 2 2
i


Y N

X ' X '

SCE
2

SCR SCR= e ' e e
2
i


Demostracin:
) e

X ( Y +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

97
e ' e

X ' e e ' X '



X ' X '

) e

X ( ) ' e ' X '

( Y ' Y
) e

X ( )' e

X ( Y ' Y
+ + + + +
+ +

Dado corolario 1 0

X ' e y 0 e ' X '



Luego: e ' e

X ' X '

Y ' Y + (*)

Finalmente, restando a ambos lados
2
Y n

e ' e Y n

X ' X '

Y n Y ' Y
2 2
+ (**)
Obtenemos el mismo resultado anterior:
SCT= SCE+SCR es decir que en el modelo mltiple tambin es posible dividir la suma
de cuadrados totales en dos partes, una explicada por el modelo y otra residual.

Otra forma de expresar este resultado:
Dado:
Y ' X ) X ' X (
1

(*) Es equivalente a:
e ' e Y ' X '

e ' e Y ' X ) X ' X ( X ' X '

Y ' Y
I
1
+ +

4 43 4 42 1

( ) e ' e Y ' X ) X ' X ( X ' Y e ' e Y ' X ' Y ' X ) X ' X ( Y ' Y
1 1
+ +


El modelo en desvos.
k k 3 3 2 2 1
i ik
k
3 i
3
2 i
2 1
i
i ik k 3 i 3 2 i 2 1 i
X

........ X

X

Y
n
e

n
X

........
n
X

n
X

n
Y

(1) e X

........ X

X

Y
+ + + +

+ +

+ + + + +



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

98

k k 3 3 2 2 1
X

........ X

(2)

Sustituyendo (2) en (1):
( )
i k ik k 3 3 i 3 2 2 i 2 i
i ik k 2 i 2 k k 2 2 i
i ik k 2 i 2 k k 2 2 i
i ik k 2 i 2 1 i
e ) X X (

........ ) X X (

) X X (

Y Y
e X

...... X

........ X

Y Y
e X

........ X

........ X

Y Y
e X

........ X

Y ) 1 (
+ +
+ + + +
+ + + +
+ + + +

i ik k 3 i 3 2 i 2 i
e x

........ x

y + + + + el modelo se puede expresar en desvos.


Cmo son las matrices?
1
1
1
1
1
1
]
1

1
1
1
1
1
]
1

n
2
1
n
2
1
y
.
.
y
y
Y Y
.
.
Y Y
Y Y
y
1
1
1
1
]
1

1
1
1
1
]
1


nk 2 n
k 2 22
k 1 12
k nk 2 2 n
k k 2 2 22
k k 1 2 12
) 1 k ( n
x . . x
. . . .
x . . x
x . . x
X X . . X X
. . . .
X X . . X X
X X . . X X
x
1
1
1
1
]
1



k
3
2
*
1 ) 1 k (


Con lo que e

x y
*
+

*

x y


Notar que el vector

* no incluye
1


Derivacin de MICO en desvos:

x ' x '

y ' x '

2 - y y'

x ' x '

y ' x '

x ' y y ' y )

x y ( )'

x y ( e ' e

x y y y e

x y
* * * * * * * *
*
*
+ +




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

99

y ' x ) x ' x (

x ' x y ' x
0

x ' x 2 y ' x 2

e ' e
1 *
*
*

+
+

si xx es invertible
Es decir que la frmula de calculo de los estimadores no cambia al utilizar las variables en
desvos respecto a la media. A esto debe agregarse:
k k 3 3 2 2 1
X

........ X

+ + +
Suma de cuadrados en desvos:
e

x y
*
+

e ' e

x ' x '

e ' e

x ' e e ' x '



x ' x '

) e

x )( ' e ' x

( ) e

x ( )' e

x ( y ' y
* * * * * * * * * *
+ + + + + + + +
Con
e ' x
=
x ' e
= 0

SCR SCE e ' e

x ' x '

y ' y
e ' e SCR

x ' x '

y ' y SCE
y ' y SCT
* * * *
+ +


Notar que cuando las variables estn expresadas en desvos, no es necesario restar el
trmino
2
Y n para el clculo de la suma de cuadrados totales y de la suma de
cuadrados explicados.

Coeficiente de determinacin: R
2

y ' y
e ' e
1
Y n Y ' Y
e ' e
1
SCT
SCR
1
SCT
SCR SCT
R
y ' y
y ' x '

y ' y

x ' x '


Y n Y ' Y
Y n Y ' X '


Y n Y ' Y
Y n

X ' X '


SCT
SCE
R
2
2
* *
2
2
2
2
2






El R
2
corregido.

El R
2
mltiple tiene un problema

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

100
(1)
i 2 i 2 1 i
X Y + +
(2)
i 3 i 3 2 i 2 1 i
X X Y + + +
Y
i
es la misma qu ocurre con SCT? es la misma ya que no cambia la muestra.

'

+
+
2 2 2
1 1 1
SCR SCE SCT
SCR SCE SCT


Sin embargo, slo por agregar una nueva variable (algo explica), la SCR
2
disminuye,
provocando un aumento R
2
cuando aumenta k. Por esta razn, para comparar el R
2
de dos
regresiones, estas deben tener igual numero de variables.
Para evitar este problema se define un R
2
corregido por grados de libertad
1 n
y ' y
k n
e ' e
1
1 n
Y n Y ' Y
k n
e ' e
1 R
2
2
c



Qu relacin tiene R
2
y
2
C
R ?

k n
1 n
) R 1 ( 1
Y n Y ' Y
1 n

k n
e ' e
1 R
2
2
2
c


= ) R 1 (
k n
1 n
1 R R
2 2 2

,
_

+
=

,
_

+
,
_

+
k n
1 n
1 ) R 1 ( R ) R 1 (
k n
1 n
) R 1 ( R
2 2 2 2 2

=

,
_


,
_

+
+
k n
1 k
) R 1 ( R
k n
1 n k n
) R 1 ( R
2 2 2 2

,
_


k n
1 k
) R 1 ( R R
2 2 2
C

Otra formula:

,
_

k n
n 1
R
k n
k 1
R
2 2
c

Para entender esto:
Supongamos que tenemos dos observaciones:


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

101
La recta va a tener que pasar por los dos puntos minimizar la e
2
i
implica que
0 e
2
i

, con lo que 1
y
e
1 R
2
1
2
i 2

. Esto significara un ajuste perfecto, sin embargo,


no tiene ninguna significancia estadstica. El
2
C
R est indeterminado.
1 n / y
0
0
1
1 n / y
2 n / e
1 R
2
i
2
i
2
i 2
c




.

Algunas propiedades:
i)
2
C
R < R
2
, son iguales cuando la correlacin es perfecta.
ii) Si aumenta el tamao muestral, dado k, el
2
C
R tiende al R
2

iii) Dado n, al aumentar el nmero de variables explicativas, (R
2
-
2
C
R ) aumenta.
iv)
2
C
R puede ser negativo.


3.3 SUPUESTOS CLSICOS
Al igual que en el modelo simple, requerimos una serie de supuestos (supuestos clsicos)
para determinar las propiedades estadsticas de los estimadores MICO.
Estos supuestos clsicos para el modelo de regresin mltiple son equivalentes a los del
modelo simple y se pueden expresar en notacin escalar o matricial.
Y = X +


Notacin escalar Notacin matricial

1. X
2
.... X
k
son no estocsticas

X
nxk
es no estocstica

*
*
Y
X
Y
X
i i 2 1
X Yi + +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

102

2. E(
i
) = 0 i

E() = 0
n1
donde
n1



3. Homocedasticidad y no autocorrelacin
COV(
i
,
j
)=

'


j i
j i 0
) ( E
2 j i


E() =
2
I




4. Ausencia de multicolinealidad perfecta.
Las X
i
no son combinacin lineal exacta entre
s

Rango de X=(X) = k



5. u
i
~ N(0,
2
) i

u ~ N(0,
2
I)


Explicacin
1. Todo nuestro anlisis est condicionado a conocer X que se supone se mantiene fija
en distintas muestras. Esto implica que la nica fuente de variacin de Y viene dada
por
i
. Este supuesto se puede relajar suponiendo X estocsticos, pero
independientes de .


2. 0 ) ( E
1 nx
n
2
1
n
2
1
0
0
.
0
0

) ( E
.
) ( E
) ( E

.
E ) ( E

,
_

,
_

,
_


Esto permite calcular:
E(Y/X) = E(X + ) = X + E() = X
Es decir que se cometen errores pero en promedio estaremos sobre el plano de
regresin.

3. E() =
2
I
En general
Varianza de X = [ ] [ ] )' X )( X ( E ))' X ( E X ))( X ( E X ( E

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

103
( )
1
1
1
1
1
1
]
1

,
_

n 2 1
n
2
1
X . . X X
X
.
.
X
X
E

,
_

2
)
n
X (
. .
. . . . .
. . .
2
)
2
X ( .
)
n
X )(
1
X ( . . )
2
X )(
1
X (
2
)
1
X (
E

,
_

2
)
n
X ( E
. .
. . . . .
. . .
2
)
2
X ( E .
)
n
X )(
1
X ( E . . )
2
X )(
1
X ( E
2
)
1
X ( E


) X ( VAR
.
.
. ) X , X ( Cov
) X , X ( Cov ) X , X ( Cov ) X ( VAR

n
2 1
n 1 2 1 1

,
_


=matriz varianza y
covarianza


En nuestro caso la variable aleatoria es y su esperanza es 0. Por lo tanto,
E() = ( )
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

,
_

2
n
2
2
n 1 2 1
2
1
n 2 1
n
2
1
.
.
. .
E . .
.
. E


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

104
1
1
1
1
1
1
]
1


1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1 0
0 .
1
1 0
0 . . 0 1
.
.
0 . . 0
) ( E
.
.
) ( E
) ( E . . ) ( E ) ( E

2
2
2
2
2
n
2
2
n 1 2 1
2
1


E()=
2
I
nxn

4. El rango de X es k.
Este es un requisito que permite invertir XX y que es necesario para obtener
estimadores MICO

en forma nica.

Rango de una matriz
Una matriz A
mn
puede interpretarse como una coleccin de m vectores fila de
dimensin n, o como una coleccin de n vectores columna de dimensin m. Entonces,
podemos hablarse de filas linealmente independientes (LI) o linealmente dependientes
(LD).
Se denomina rango de la matriz a mximo nmero de columnas (o filas) LI.

Propiedades:
El nmero mximo de filas LI es igual al nmero mximo de columnas LI
Rango (A
mn
) min (m,n)
Rango A=Rango A
Si rango A
mn
=m=n, entonces A es no singular y su inversa existe y es nica.
Rango (XX) = Rango (XX) = Rango de X

5. ~ N (0,
2
I) es normal multivariante.


105
3.4 PROPIEDADES ESTADSTICAS DE LOS ESTIMADORES MICO.

3.5.1 Linealidad
Y ' X ) X ' X (
1

El estimador es lineal en Y, ya que cada elemento de

es una combinacin lineal


de los elementos de Y. Las ponderaciones son funciones de los datos X, que son no
estocsticos.


3.5.2 Insesgamiento
I

' X ) X ' X ( ' X ) X ' X ( X ' X ) X ' X (

) X ( ' X ) X ' X (

Y ' X ) X ' X (

1 1 1
1
1

+ +
+


' X ) X ' X (
1
+




[ ]
) ( E ' X ) X ' X ( )

( E
' X ) X ' X ( E ) ( E )

( E
1
1
+
+

( E
Es insesgado

3.5.3 Eficiencia
3.5.3.1 Matriz de Varianzas y Covarianzas.

[ ] ))'

( E

( ))

( E

( E )

( V )

( Cov Var
Como +

' X ) X ' X (
1
y )

( E
Entonces:


' X ) X ' X (

( E
1



106
( ) ( )
I

) X ' X ( X ' X ) X ' X ( ) X ' X ( X I ' X ) X ' X ( ) X ' X ( X ) ' ( E ' X ) X ' X (
) X ' X ( X ' ' X ) X ' X ( E )' ' X ) X ' X (( ) ' X ) X ' X ( E
1 1 2 1 2 1 1 1
1 1 1 1





) X ' X ( )

( V )

( Cov - Var
1 2


Para el caso de dos variables:

,
_

,
_



n 2 1
n
1
1 2
X . . X X
1 . . 1 1
' X
X 1
. .
. .
. .
X 1
X ) X ' X ( )

( V

1
]
1

1
1
1
1
1
1
]
1

,
_

,
_

2
i i
i
n
1
n 2 1
X X
X n
X 1
. .
. .
. .
X 1
X . . X X
1 . . 1 1
X ' X

,
_


n X
X X

) X ( X n
1
) X ' X (
i
i
2
i
2
i
2
i
1



n X
X X

) X n ( X n
n X
X X

) X ( X n
)

( V
i
i
2
i
2 2
i
2
i
i
2
i
2
i
2
i
2

,
_

,
_





( )

n X
X X
x n
n X
X X

X n X n
)

( V
i
i
2
i
2
i
2
i
i
2
i
2 2
i
2

,
_

,
_




107

x

x n
X
x n
X

x n
X
x n
n X
x n
x n
X
X
x n
)

( V
2
i
2
2
i
2
2
i
2
2
i
2
i
2
2
i
2
i
2
i
2
2
i
i
2
2
i
2
i
2

,
_

,
_



Tarea: Chequear con las encontradas en el caso simple.
Al igual que en el caso simple tanto las varianzas como las covarianzas dependen de
2
,
parmetro poblacional desconocido que es necesario estimar.

3.5.3.2 Un estimador de
2

Debemos estimar
2
, la varianza del trmino de error. Como los valores de no se pueden
observar, el estimador se basar en los residuos e.
Sabemos que:

X Y e y dado que Y ' X ) X ' X (


1

Y ' X ) X ' X ( X Y e
1
, con lo que se puede sacar Y de post-factor comn, de forma que:
( )Y ' X ) X ' X ( X I e
1
, y definiendo ' X ) X ' X ( X I M
1
, luego:
MY e
La matriz M es especial por cumplir las siguientes propiedades:
Es cuadrada (nn)
Es no estocstica
Es simtrica (M=M)
( ) M ' X ) X ' X ( X ' I ' ' X ) X ' X ( X I ' M
1 1



Es idempotente (M.M=M)
( )( )

' X ) X ' X ( X I ' X ) X ' X ( X I MM
1 1

' X ) X ' X ( X ' X ) X ' X ( X ' X ) X ' X ( X ' X ) X ' X ( X I
1 1 1 1
+
M ' X ) X ' X ( X I ' X ) X ' X ( X ' X ) X ' X ( X ' X ) X ' X ( X I
1 1 1 1
+


MX=0


108
0 X X X ' X ) X ' X ( X X X ) ' X ) X ' X ( X I ( MX
1 1




+ + M M MX ) X ( M MY e
Luego, M ' MM ' M ' M ' e ' e
M ' e ' e

Deseamos conocer ) M ' ( E ) e ' e ( E
( )
1
1
1
1
1
1
]
1

,
_

,
_


n
2
1
nn 2 n 1 n
n 2 22 21
n 1 12 11
n 2 1
.
.
a a a
.
.
a . . a a
a . . a a
. . E ) M ' ( E ) e ' e ( E
( ) ( )

+ + +
1
1
1
1
1
1
]
1

,
_


in i n 2 i i 2 1 i i 1
n
2
1
in i 2 i i 1 i i
a ... a a E
.
. a . . a a E
[ ] ) a ... a a ( ... ) a ... a a ( ) a ... a a ( E
nn n n 2 2 n 1 1 n 2 n n 22 2 12 1 2 1 n n 21 2 11 1 1
+ + + + + + + + + + + +

Al aplicar el trmino de esperanza y dado el supuesto de no autocorrelacin, los trminos
cruzados se hacen cero.
( ) ) M Traza ( ) a ... a a ( ) ( E a ... ) ( E a E a
2
nn 22 11
2 2
n nn
2
2 22
2
1 11
+ + + + + +
Recordando que traza:
La traza de una matriz es la suma de los elementos de la
diagonal principal
Tr(AtB)=Tr(A) tTr(B)
Tr(ABC)=Tr(CBA)=Tr(BAC)
Si A es una matriz idempotente, entonces Tr(A)=rango(A)



109
= ( ) [ ] [ ]
1 2 1
n
2 1
n
2
) X ' X ( X ' X n ' X ) X ' X ( X Tr ) I ( Tr ) ' X ) X ' X ( X I ( Tr
[ ] [ ] k n ) I ( Tr n
2
k
2

Con lo que :
[ ] k n ) M ' ( E ) e ' e ( E
2


Luego si definimos:
k n
e ' e


, tendremos un estimador de la varianza del trmino de
perturbacin que cumple la propiedad de ser insesgado. Esto porque:
2 2 2
) k n (
k n
1
) e ' e ( E
k n
1
k n
e ' e
E )

( E


,
_



3.5.3.3 Teorema de Gauss-Markov

Sabemos que +

' X ) X ' X ( Y ' X ) X ' X (
1 1
, es un estimador lineal e insesgado de .
En esta expresin ' X ) X ' X (
1
es una matriz de nmeros fijos.

a. Supongamos que existe *, otro estimador lineal de , tal que:
[ ]Y C ' X ) X ' X ( *
1
+

, donde C es una matriz de constantes de orden kn.
Dado que Y=X+,
[ ] [ ] + + + + + +

C CX ' X ) X ' X ( X ' X ) X ' X ( ) X ( C ' X ) X ' X ( Y C ' X ) X ' X ( *
1 1 1 1
+ + +

C CX ' X ) X ' X ( *
1


b. Qu condiciones se deben cumplir para que * sea insesgado?
) ( CE CX ) ( E ' X ) X ' X ( *) ( E
1
+ + +


+ CX *) ( E
Luego, para que * sea insesgado se debe cumplir que CX=0

c. Calculemos la varianza de *
[ ] *))' ( E * ( *)) ( E * ( E )

( V
Dados los resultados de a y b sabemos que :
E(*)=


110
+

C ' X ) X ' X ( - *
1

Luego,
[ ] [ ] )' C ' X ) X ' X (( ) C ' X ) X ' X (( E )' * ( ) * ( E *) ( V
1 1
+ +


[ ] ) ' C ' ) X ' X ( X ' ( ) C ' X ) X ' X (( E *) ( V
1 1
+ +

[ ] ' C ' C ) X ' X ( X ' C ' C ' ' X ) X ' X ( ) X ' X ( X ' ' X ) X ' X ( E *) ( V
1 1 1 1
+ + +


' C ) ' ( CE ) X ' X ( X ) ' ( CE ' C ) ' ( E ' X ) X ' X ( ) X ' X ( X ) ' ( E ' X ) X ' X ( *) ( V
1 1 1 1
+ + +

Recordando que E()=
2
I
' CC ) X ' X ( CX ' C ' X ) X ' X ( ) X ' X ( X ' X ) X ' X ( *) ( V
2 1 2 1 2 1 1 2
+ + +


Dado que CX=0 y simplificando, obtenemos:
' CC ) X ' X ( CX ' C ' X ) X ' X ( ) X ' X ( *) ( V
2 1 2 1 2 1 2
+ + +


' CC ) X ' X ( *) ( V
2 1 2
+


' CC )

( V *) ( V
2
+

d. Dado que C es una matriz de constantes de orden kn,

,
_

,
_

kn n 2 n 1
2 k 22 12
1 k 21 11
kn 2 k 1 k
n 2 22 21
n 1 12 11
c . . c c
. .
. .
c . . c c
c . . c c
c . . c c
.
.
c . . c c
c . . c c
' CC

,
_




2
ki ki i 2 ki i 1
ki i 2
2
i 2 i 2 i 1
ki i 1 i 2 i 1
2
i 1
c . . c c c c
. . . .
. . . .
c c . . c c c
c c . . c c c
' CC

Los elementos de la diagonal principal son positivos o cero, por lo que
necesariamente se cumple que )

( V *) ( V . Con esto se concluye que si existe un


estimador lineal e insesgado de , para que ste sea el de menor varianza
(eficiente), debe ser el estimador MICO.
Si tenemos un estimador lineal e insesgado distinto de MICO, necesariamente tiene
mayor varianza que MICO. Con lo que demostramos que MICO es el mejor
estimador lineal e insesgado. MICO es MELI.


111
3.5.4 Consistencia
Sabemos que :
' X ) X ' X (
1
+

luego, multiplicando y dividiendo entre n

n
' X
) X ' X
n
1
(

,
_


+


plim
n
' X
) X ' X
n
1
( plim ) ( plim

1
1
]
1

,
_


+


=
n
' X
plim ) X ' X
n
1
( plim
1

,
_


+


=
n
' X
plim )) X ' X
n
1
( plim (
1

,
_


+


La matriz ) X ' X
n
1
( consta de las medias cuadrticas y de las medias de los productos
cruzados de las variables explicativas. Como la matriz X es constante para repetidas
muestras, entonces,
lim ) X ' X
n
1
( = ) X ' X
n
1
(
El limite en probabilidad de la matriz

,
_


n
' X
=
1
1
1
1
1
1
1
1
]
1

,
_

,
_

,
_

i ki
i i 2
i
X
n
1
plim
X
n
1
plim
n
1
plim
M

,
_

i
n
1
plim =plim ( ), como E( )=0 y var( )=
n
2

, se deduce que plim ( )=0


,
_

i ki
X
n
1
plim , se cumple que E

,
_

i ki
X
n
1
=0 y
var(
n
X
n
X
n
1
ki
2
2
i ki

,
_

, con lo que plim var( 0 X


n
1
i ki

,
_

,
luego, plim

,
_


n
' X
=0
asi, 0 ) X ' X
n
1
(
1
+

, con lo que el estimador MICO es consistente.


112
3.6 INFERENCIA EN EL MODELO GENERAL
Hasta ahora no hemos usado el supuesto de que las siguen una distribucin normal
multivariante. Si suponemos ) I , 0 ( N ~
2
podremos derivar algunas distribuciones.

3.6.1 Distribucin de


+

' X ) X ' X (
1
, con lo que

por ser combinacin lineal de variables aleatorias es


tambin una variable aleatoria que se distribuye normal multivariante.
Esperanza: )

( E
Varianza:

,
_



kk k 1
22 12
k 1 12 11
2 1 2
a . . . a
.
.
a a
a . . a a
) X ' X ( )

( V
Luego ) ) X ' X ( , ( N ~
1 2


Esto es, ) a , ( N ~

ii
2
i i
donde a
ii
es el i-simo elemento de la diagonal principal de
(XX)
-1
.
As:
) 1 , 0 ( N ~
a

ii
i i



Este resultado no es muy til por si mismo, porque no conocemos
2
.

3.6.2 Distribuciones derivadas de
Dado que ) I , 0 ( N ~
2
, esto significa que cada
i
se distribuye normal e independiente
con media cero y varianza
2
.
Luego,
2
n
2
2
n
2
2
2
2
2
1
~ ......

, con lo que
2
n
2
~ '
1


2
n
1 2
~ ) I ( '





113
Este resultado, nos sirve para recordar como se forman las distribuciones derivadas de una
normal multivariante. Sin embargo, tampoco es til por si mismo ya que no conocemos .

3.6.3 Distribucin de
2
'

e e

Hemos visto los siguientes resultados:
M e , como ) I , 0 ( N ~ u
2
, por lo que e tambin se distribuye normal.
M ' e ' e
' X ) X ' X ( X I M
1
, siendo simtrica e idempotente.
Tr(M)=Rg(M)=n-k . Como M es idempotente de aqu se deriva que M tiene n-k
valores propios.
Sea B una matriz que tenga por columnas los vectores propios de M y D una matriz
que tiene los valores propios en la diagonal y cero en el resto.
B=

,
_

| | |
| | |
x . . x x
| | |
| | |
n 2 1
y D=

,
_

n
2
1
0 0
0 . 0 0
0 . 0 0
0 0
0 0

Sabemos que:
BB=BB=I
n

D MB ' B
Dado que los valores propios de una matriz idempotente son cero o uno,
sabemos que D tiene n-k valores propios 1 y k valores propios igual a cero.
D=

,
_

,
_

k k
k k n
0 0
0 I
0 . . . . . 0
. .
0 .
1 .
. . . .
. . 1 0
0 . . . . 0 1

Definamos:
y= B
Luego, premultiplicando por B tenemos que, By=B B=I
y B


114

Dado que y= B, y ser una variable que se distribuye normal multivariada.

Encontremos la esperanza y la varianza de y.
Esperanza: E(y) =E( B)=BE()=0
Varianza: V(y) =E{[y E(y)][y E(y)]}= E(yy)= E(B B)= BE( ) B=
= B
2
IB=
2
BB=
2
I

Es decir que y ~ N (0,
2
I) , con lo que cada N(0,1) ~
i

y
se distribuye normal tipificada e
independiente.

Sabemos que:
( )

,
_

,
_


+
+
n
1 k n
k n
2
1
n 1 k n k n 2 1
D
y
.
y
y
.
y
y
0 . . . . . 0
. .
0 .
1 .
. . . .
. . 1 0
0 . . . . 0 1
y . y y . y y
MB ' B ' M ' e ' e y y
3 2 1


=

+ + + + +
k n
1
2
i
2
k n
2
2
2
1
y 0 .... 0 y .... y y

k n
1
2
i
y e ' e

Como N(0,1) ~
i

y
, luego
2
k - n
k n
1
2
i
~
,
_

y




2
k - n
2
k n
1
2
i
2
2
k n
2
2
2
2
2
1
~
y
y
.....
y y




115

2
k - n
2
~
'

e e


3.6.4 Prueba de Hiptesis en el Modelo Mltiple

Pruebas Individuales

Tenemos:

i) ) 1 , 0 ( ~

N
a
ii
i i


pero es desconocida

ii)
2
k - n
2 2
~
) /( '
) (
'


k n e e
k n
e e


iii) puede demostrarse que i) y ii) son independientes:

Definimos:
ii
i i ii
i i
2
ii
i i
a

k n
e ' e
a


t
n-k


Prueba de Significacin global en el Modelo Mltiple: ANLISIS DE VARIANZA

ANOVA Es un test de significancia global del modelo

H
0
:
2
=
3
=............=
k
= 0
H
1
: Algn
i
distinto de 0
i) SCE/
2

2
1 - k



116
ii)
2
k - n
2 2
~
SCR '



e e

iii) Puede demostrarse que i) y ii) son independientes.

k n k
F
R k
R k n
k n SCT
SCE SCT
R
SCT
k n
SCE SCT
SCT
k n
SCR
k n
SCR
F

, 1
2
2
2
2
2
~
) 1 )( 1 (
) (

) (
1 - k

/
1 - k
SCE

1 - k
SCE

/
1 - k
SCE/



Recordar diferentes expresiones para la SCE

0

Rechazo H
0
, si el valor calculado del
estadstico
SCR ) 1 (k
SCE ) k n (

es mayor que

K n K
F
, 1
F


Este test indica que el modelo es significativo en su conjunto, si el "efecto explicado por el
modelo" es suficientemente grande respecto al "ruido", a lo residual. Si el F calculado es
mayor que el F de tabla, rechazo que
2
=
3
=............=
k
= 0, o sea el "aporte de las X"
respecto al residuo es considerable. Cun considerable? El lmite nos lo da el valor de
tabla.

TABLA ANOVA
Variacin Suma de Cuadrados Grados de Libertad Suma Promedio de
Cuadrados
Regresin SCE k-1 SCE/(k-1)
Residuo SCR n-k SCR/(n-k)
Total SCT n-1 SCT/ (n-1)



117
Grados de Libertad
Asociado a cada suma de cuadrados hay grados de libertad; (valores que pueden elegirse
arbitrariamente).
Suma de cuadrados Totales (SCT): tiene n-1 grados de libertad. Esto surge como
consecuencia de la prdida de un grado de libertad, necesario para calcular Y.
Suma de cuadrados residuales (SCR): tiene n-k grados de libertad. Se pierden k grados de
libertad que son necesarios para asegurar que se cumplan las ecuaciones normales. Estas
condiciones son:
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1

0
.
0
0
0
X e
.
X e
X e
e
e
.
e
e
e
X . . X X
. . . . .
. . . .
X . . X X
1 . . 1 1
e ' X
ik i
3 i i
2 i i
i
n
3
2
1
k 2 k 1
2 n 22 12
nk


Suma de cuadrados explicados (SCE): tiene k-1 grados de libertad ya que se encuentra en
funcin de todos los parmetros estimados, excepto el intercepto.

3.5.5 Test General Para Probar Restricciones Lineales de Parmetros
i. Introduccin

Supongamos que estamos interesados en estimar una funcin de produccin Cobb-Douglas:
lnY
i
=
1
+
2
lnL
i
+
3
lnK
i
+
i


Repasemos distintas hiptesis a probar:
Ejemplo 1:
Si queremos testear
H
0
:
2
= 0
H
1
:
2
0
podemos expresar esta restriccin en forma matricial
H
0
: C

= r
H
1
: C

r


118

donde C = [0 1 0]

C = [ ]
1
1
1
]
1

3
2
1
0 1 0

=
2

r = 0
Ejemplo 2:
Si queremos testear
H
0
:
2
+
3
= 1
H
1
:
2
+
3
1

debemos definir la matriz C y el vector r:

H
0
: C

= r
H
1
: C

r

donde C = [0 1 1]

C = [ ]
1
1
1
]
1

3
2
1
1 1 0

=
2
+
3

r = 1 (en este caso un vector de 1x1, o sea un escalar)

Ejemplo 3:
Si queremos testear


119
H
0
:
2
=
3

H
1
:
2

3


H
0
: C

= r
H
1
: C

r

donde C = [0 1 -1]
C = [ ]
1
1
1
]
1

3
2
1
1 1 0

=
2
-
3

r = 0

Ejemplo 4:

H
0
:
2
=
3
= 0
H
1
: Algn
i
distinto de 0

C =
1
1
1
]
1

1
]
1

3
2
1

1 0 0
0 1 0
=
1
]
1

3
2

r =
1
]
1

0
0


Ejemplo 5:
lnY
i
=
1
+
2
lnL
i
+
3
lnK
i
+
4
lnZ
i
+
5
lnW
i
+
i




120
H
0
:
4
=
5
= 0
H
1
: Algn
i
distinto de 0
C =
1
1
1
1
1
1
]
1

1
]
1

5
4
3
2
1

1 0 0 0 0
0 1 0 0 0
=
1
]
1

5
4


r=
1
]
1

0
0


ii. Desarrollo del Test
Existen distintas formas de desarrollar el test.
Mediante el desarrollo del test

C ?

Sabemos que:
) ) ' ( , ( ~

1 2
X X N
La distribucin de probabilidad de una combinacin lineal de

ser tambin normal.


Debemos encontrar los parmetros de la distribucin.

C )

( CE )

C ( E

[ ] [ ] ) ' C ' ' C '

)( C

C ( E )' C

C )( C

C E )

C ( V
[ ] [ ] ' C )'

)(

( C E ' C ) ' '

)(

( C E
[ ] ' C ) X ' X ( C ' C )'

)(

( CE
1 2


) ' C ) X ' X ( C , 0 ( N ~ C

C
) ' C ) X ' X ( C , C ( N ~

C
1 2
1 2





Si H
0
es cierta: C = r ) ' C ) X ' X ( C , 0 ( N ~ r

C
1 2


Se puede demostrar que dado:


121
i. [ ]
2
R
1
1 2
~ ) r

C ( ' C ) X ' X ( C )' r

C (

[Estamos sumando R normales(0,1)


elevadas al cuadrado]

donde R es el nmero de restricciones involucradas bajo la hiptesis nula.

ii.
2
k n
2 2
2
~
e ' e

) k n (




iii. i y ii son independientes

Entonces:

[ ]
k n , R
2
1
1 2
F ~
) k n (
e ' e
R / ) r

C ( ' C ) X ' X ( C )' r

C (





k n , R
1 1 2
F ~ ) r

C ( ) ' C ) X ' X ( C ( )' r

C (
R
1



Rech H si F calculado > F
de tabla
0




Volvamos al Ejemplo 1

Siguiendo con el ejemplo de la funcin de produccin Cobb-Douglas, retomemos la prueba
de algunas hiptesis importantes:

H
0
:
2
= 0
H
1
:
2
0

C = [0 1 0]
r = 0
R = 1



122
k n , R
1 1 2
F ~ ) r

C ( ) ' C ) X ' X ( C ( )' r

C (
R
1



3 n , 1 2
33 32 31
23 22 21
13 12 11
2
2
F ~

0
1
0

a a a
a a a
a a a
) 0 1 0 (

1
1
1
1
]
1

1
1
1
]
1

,
_

,
_


( )
3 n , 1 2
1
0
1
0
23 22 21
2
2
F ~

a a a

,
_

1
1
]
1


[ ]
3 n , 1 2
1
22
2
2
F ~






2
2

2
a
22
~ F
1, n3



Mediante el clculo de los residuos libres y restringidos.

Se puede demostrar que:

[ ] ) C

C ( C ) X ' X ( C )' C

C ( e ' e e
~
' e
~
1
1 1



donde e
~
' e
~
es suma de cuadrados restringida, es decir, los obtenidos de la regresin en la
que se impone H
0
(la restriccin).
Entonces, tenemos que:

2
k n
2
2
) R k ( n
2
~
e ' e
y ~
e
~
' e
~



Por lo que
2
R
2
) k n ( ) R k ( n
2
~
e ' e e
~
' e
~




k n , R
2
2
2
k n 2
2
R
2
F ~
k n /
e ' e
R /
e ' e e
~
' e
~

ntes independie
~
e ' e

~
e ' e e
~
' e
~



Con lo que:



123
k n , R
F ~
k n / e ' e
R / ) e ' e e
~
' e
~
(



Etapas:
1. Se estima regresin restringida (imponiendo que se cumpla la hiptesis nula) y se
obtiene la SCR restringida e ' e

2. Se estima regresin libre (sin imponer que se cumpla la hiptesis nula) y se obtiene
la SCR libres e' e'

3. Se calcula el estadstico
) k n /( e ' e
R / ) e ' e e
~
' e
~
(
F



Si F > F
TABLA
rech H
0
(Rech que la restriccin sea valida si la suma se reduce mucho al
calcular dicho estadstico)
rech H
0

Mediante el coeficiente de determinacin, R


2

Una tercera forma equivalente de probar la misma hiptesis es:



k n
y R 1 (
R
y ) R 1 ( y ) R
~
1 (

k n
e ' e
R
e ' e e
~
' e
~
2 2
2 2 2 2


[ ] [ ]
) k n /( ) R 1 (
R / R 1 R
~
1

) k n /( ) R 1 (
R / ) R 1 ( ) R
~
1 (

2
2 2
2
2 2

+




k n , R
2
2 2
F ~
) k n /( ) R 1 (
R / ) R
~
R (



3.5.6 Estabilidad y Cambio Estructural
Volvamos al ejemplo de la funcin de produccin para Chile en el perodo 1960-97
lnY
i
=
1
+
2
lnL
i
+
3
lnK
i
+
i



124

Tenemos la hiptesis a priori que la funcin de produccin difiere segn perodos; por
ejemplo:
1960-74
I
1
,
I
2
,
I
3

1975-97
II
1
,
II
2
,
II
3



n = 38 y tenemos dos submuestras: n
I
= 15 y n
II
= 23

Y
I
= X
I

I
+
I
Y
II
= X
II

II
+
II

II I
0
II I
0
: H
: H






Modelo restringido: los parmetros del primer perodo coinciden con los del segundo.

+
1
1
]
1

1
]
1

+
X
X

Y
Y
X Y
II
I
II
I


Es decir se supone que hay un solo modelo a lo largo del perodo y se obtiene SCR
restringida, e
~
' e
~

Modelo libre (no restringido):

Se corren dos regresiones: una para el primer perodo y otra para el segundo.

1
]
1

+
1
]
1

1
]
1

1
]
1

II
I
II
I
II
I
II
I

X 0
0 X

Y
Y



SCR libre = e'e = SCR
I
+ SCR
II
= (e'e)
I
+ (e'e)
II



125

Asumiendo la distribucin bajo la nula, V(
I
) = V(
II
) =
2

Luego:


k 2 n , k
F ~
k 2 n
e ' e
R
e ' e e
~
' e
~



Grados de Libertad

Numerador: R = nmero de restricciones (k, se impone que los k parmetros sean iguales
entre perodos).
Tambin puede deducirse como: gl de e
~
' e
~
- gl de e'e

gl de e
~
' e
~
= n - k
gl de e'e = gl de (e'e)
I
+ gl de (e'e)
II
= n
1
k + n
2
k = n
1
+ n
2
2k = n-2k

gl numerador = n - k (n-2k ) = k

Denominador: gl de e'e = n-2k

El Test de Chow es un caso particular del test de cambio estructural. Chow discuti dos
situaciones peculiares: n
II
= k y n
II
< k.

iv. Un Ejemplo Numrico del test C

Supongamos que estamos interesados en estimar el siguiente modelo:
Y
i
=
1
+
2
X
i2
+
3
X
i3
+
i

con los siguientes datos:


126
1
1
1
1
1
1
]
1

5
3
8
1
3
Y
1
1
1
1
1
1
]
1

6 4 1
4 2 1
6 5 1
4 1 1
5 3 1
X , luego
1
1
1
]
1

5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26
) X ' X (
1


Con estos datos se estima la regresin:
LS // Dependent Variable is Y
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
C 4.000000 4.474930 0.893869 0.4657
X1 2.500000 0.866025 2.886751 0.1020
X2 -1.500000 1.369306 -1.095445 0.3876
R-squared 0.946429 Mean dependent var 4.000000
Adjusted R-squared 0.892857 S.D. dependent var 2.645751
S.E. of regression 0.866025 Akaike info criterion -0.003973
Sum squared resid 1.500000 Schwarz criterion -0.238310
Log likelihood -4.084760 F-statistic 17.66667
Durbin-Watson stat 1.666667 Prob(F-statistic) 0.053571

y podemos calcular SCE=26.5 y SCT=28

Ejemplos:
1. Significacin conjunta de X
2
y X
3


Ho:
2
=
3
=0

F= 67 . 17
3 5
5 . 1
1 3
5 . 26
k n
SCR
1 k
SCE



Como F
0.95
(2,2)=19, la F muestral es menor que el valor critico no rechazo Ho.
2. Significacin de X
3


Ho:
3
=0

Una forma de probarlo es con un test de hiptesis simple. Observando la salida de E-Views
se concluye que este parmetro es no significativo.


127
Otra forma de probar esto es estimando la regresin restringida (es decir aquella donde se
supone vlida la hiptesis nula).

LS // Dependent Variable is Y
Included observations: 5
Variable Coefficient Std. Error t-Statistic Prob.
C -0.800000 0.938083 -0.852803 0.4564
X1 1.600000 0.282843 5.656854 0.0109
R-squared 0.914286 Mean dependent var 4.000000
Adjusted R-squared 0.885714 S.D. dependent var 2.645751
S.E. of regression 0.894427 Akaike info criterion 0.066031
Sum squared resid 2.400000 Schwarz criterion -0.090194
Log likelihood - 5.259770 F-statistic 32.00000
Durbin-Watson stat 1.366667 Prob(F-statistic) 0.010938

Como ahora la SCR=2.4 ' e
~
' e
~
=2.4

Luego, podemos utilizar el estadstico:
F= 2 . 1
3 5
5 . 1
1
5 . 1 4 . 2
k n / e ' e
R / ) e ' e e
~
' e
~
(


F
0.95
(1,2)=18.51, la F muestral es menor que el valor critico no rechazo Ho.

3. Los coeficientes de X2 y X3 son de igual magnitud pero de signo opuesto
Ho:
2
+
3
=0
o en trminos generales:

C=[ ] 1 1 0 r=0 con R=1
Sabemos que:
F=
k n , R
1 1 2
F ~ ) r

C ( ) ' C ) X ' X ( C ( )' r

C (
R
1




F= ( ) ( )
1
1
1
]
1

,
_

'

,
_

1
1
1
]
1

1
1
1
]
1

,
_

1 1 0
1
1
0

875 . 1 125 . 1 6
125 . 1 75 . 0 37 . 3
6 37 . 3 02 . 20
) 1 1 0 ( ' 0

1 1 0
1
1
3
2
1
1
3
2
1



128
( ) ( ) ( ) 5 . 1 5 . 2
1
1
0
875 . 1 125 . 1 125 . 1 75 . 0 6 37 . 3 ' 5 . 1 5 . 2
1

1
1
1
]
1

,
_


F= [ ] 66 . 2
375 . 0
1
1 875 . 1 125 . 1 125 . 1 75 . 0 1
2
1
+


Dado que el valor del test F es muy pequeo, rechazo la hiptesis nula.

4. Regin de confianza conjunta para
2
y
3


Sabemos que
k n , R
1 1 2
F ~ ) C

C ( ) ' C ) X ' X ( C ( )' C

C (
R
1


, luego podemos utilizar
este resultado para construir regiones de confianza de los test. Distintas especificaciones de
R, darn diferentes regiones de confianza para grupos de parmetros.
Supongamos que nos interesa conocer la regin en que se cumple que
2
y
3
son
conjuntamente significativos.
Ho:
2
=
3
=0
Luego,

,
_

1 0 0
0 1 0
C y R=2
F=
k n
e ' e
R
) C

C ( ) ' C ) X ' X ( C ( )' C

C (
) C

C ( ) ' C ) X ' X ( C ( )' C

C (
R
1
1 1
1 1 2






F=
75 . 0
2

1 0 0
0 1 0

1 0
0 1
0 0
5 . 2 5 . 1 8
5 . 1 1 5 . 4
8 5 . 4 7 . 26
1 0 0
0 1 0
'

1 0 0
0 1 0

3
2
1
3
2
1
1
3
2
1
3
2
1
1
1
1
]
1

1
1
1
]
1

,
_

,
_

,
_

'

,
_

1
1
1
]
1

,
_

1
1
1
]
1

1
1
1
]
1

,
_

,
_

,
_



F= ( )

,
_

'

,
_

,
_

3 3
2 2
1
3 3 2 2

1 0
0 1
0 0
5 . 2 5 . 1 8
5 . 1 1 5 . 4


5 . 1
1




129
F= ( ) ( )

,
_

,
_

,
_

,
_

3 3
2 2
3 2
3 3
2 2
1
3 3 2 2

4 6
6 10
5 . 1 5 . 2
5 . 1
1

5 . 2 5 . 1
5 . 1 1

5 . 1
1


F=
5 . 1
4 10 12 18 32 5 . 26
2
3
2
2 3 2 3 2
+ + +

Eligiendo, por ejemplo, el valor crtico de F al 5 por ciento tenemos:
Pr {F<F
0.95
}=0.95, y F(2,2)=19
Entonces, haciendo
F= F
0.95
se tiene
5 . 1
4 10 12 18 32 5 . 26
2
3
2
2 3 2 3 2
+ + +
=19, es decir
0 2 18 32 12 4 10
3 2 3 2
2
3
2
2
+ + .
Esta es la ecuacin de una elipse.
Este procedimiento permite establecer una elipse de confianza al 95% para los parmetros
que son desconocidos. La elipse est centrada en el punto estimado 5 . 2

2
y 5 . 1

3
.
3


El origen (0,0) se encuentra dentro de la elipse, lo que significa que, con un 95% de
confianza, no se puede rechazar la hiptesis de que ambos parmetros son cero en forma
conjunta.



130
Es importante observar :

que la elipse cambia de forma en funcin de la covarianza entre los parmetros
estimados
2

y
3

. Si 0 )

cov(
3 2
< la elipse se inclina hacia la izquierda, mientras
que si 0 )

cov(
3 2
> se inclina hacia la derecha.
que los lmites que se obtienen en forma conjunta para
2

y
3

son distintos a los que se


obtienen en intervalos de confianza individuales. Es perfectamente posible que
utilizando test individuales se concluya que los parmetros son individualmente no
significativos, pero testeando conjuntamente la hiptesis de que ambos parmetros son
cero esta sea rechazada por obtener un elipse tal que el punto (0,0) este fuera de la
misma. En ese caso uno puede decir que al menos uno de los parmetros tiene
suficiente influencia sobre la variable explicativa, pero no puede asignar esa influencia
a uno de los parmetros en particular.




131
3.6 PREDICCION

Para predecir debemos recurrir a los parmetros estimados dentro de la muestra:

ik k 3 i 3 2 i 2 1 i
X

. . . X

X

Y

+ + + + i = 1 ....... n
1 k k n 1 n

X Y




El inters en general es pronosticar el valor de Y en un perodo posterior a n (por ejemplo el
perodo que denominaremos 0).

Si el inters est en predecir Y
0
se hablar de prediccin individual. Si, alternativamente, se
predice E(Y
0
/X), hablaremos de prediccin media o promedio. Ambas alternativas dan
lugar a la misma prediccin puntual, pero diferentes intervalos de confianza, ya que
difieren en la varianza del error de prediccin. Ello por cuanto en ambos casos se utiliza
para predecir la siguiente ecuacin:

k 0 k 03 3 02 2 1 i
X

. . . X

X

Y

+ + + +

Es fcil probar que
0
Y

es un estimador insesgado de E(Y


0
/X)
) Y ( E ) Y

( E
0 0
(porque
0
Y

e Y
0
son V.A.)

0 k 0 k 02 2 1 0
u X X Y + + + + (verdadero valor)
k 0 k 02 2 1 0 k 0 k 02 2 1
0 k 0 k 02 2 0 0
X X ) u ( E X X
) u X X ( E ) X / Y ( E
+ + + + + + +
+ + + +


k 0 k 02 2 1
k 0 k 02 2 1
k 0 k 02 2 1 0 0
X X
X )

( E X )

( E )

( E
) X

X

( E ) X / Y

( E
+ + +
+ + +
+ + +




132
Es decir:

Y
0
en promedio estar sobre Y
0
promedio.

El punto clave es realizar una proyeccin correcta de las variables explicativas y verificar si
es correcto usar


i
histricos hacia adelante.

Que E(
0
Y

) = E(Y
0
) (no hay sesgo), no implica que no exista error de prediccin,

Error de prediccin = e
0
= Y
0
-
0
Y

(escalar)

1 x 1
0
1 kx xk 1
'
0 0
k 0 k 02 2 1 0 k 0 k 02 2 1 0
u )

( X e
X

X

u X X e
+
+ + + +


Cul es el valor esperado del error de prediccin?
[ ] 0 ) u ( E )

( X E ) u )

( X ( E ) e ( E
0
'
0 0
'
0 0
+ +
E(e
0
) = 0

Cul es la varianza de e
0
?
V(e
0
) = ) u )

( X ( V
0
'
0
+
= [ ] [ ]
0
'
0 0
'
0
u )

( X Cov 2 ) u ( V )

( X V + +

La covarianza est en funcin de dos variables aleatorias (

y
0
).

es funcin de los (i=1


hasta n) y
0
es un error aleatorio posterior a n. Por lo tanto, COV (
i
,
0
)=0 por el supuesto
de no autocorrelacin de los errores y [ ]
0
'
0
u ),

( X Cov =0
= [ ]
2 '
0
)

( X V +
= [ ][ ] { }
2 '
0
'
0
' )

( X )

( X E +
= [ ]
2
0
'
0
X )'

)(

( X E +
=
2
0
'
0
X )'

)(

( E X +
=
2
0
'
0
X )

( V X +
= X ) X ' X ( X
2
0
1 2 '
0
+




133
= [ ] 1 X ) X ' X ( X
0
1 '
0
2
+



Cmo podemos obtener un intervalo de confianza para Y
0
?
Cmo se distribuye e
0
?
0
'
0 0
u )

( X e +
) I , 0 ( N ~ u
2

) ) X ' X ( , ( N ~

1 2

[ ]
[ ] ) e ( V , 0 N ~ e
) 1 X ) X ' X ( X ( , 0 N ~ e
0 0
0
1 '
0
2
0
+



1 X ) X ' X ( X ) e ( DS
0
1 '
0 0
+



k n
0
1 '
0
0
2
k n 2
2
2
0
0 0
t ~
1 X ) X ' X ( X

e
~ ) k n (

k n
e ' e

) 1 , 0 ( N ~
) e ( DS
) e ( E e


Con lo que
k n
0
0
t ~
) e (

DS
e



Intervalo de confianza para el error de prediccin.
Esto nos permite hacer un intervalo para el error de prediccin.
[ ]

1
]
1




1 ) e (

DS t e ) e (

DS t P
1 t
) e (

DS
e
t P
0 2 / 0 0 2 /
2 /
0
0
2 /


) e (

DS t ) e ( INT
0 2 / 0
t



134
Intervalo de confianza para Y
0

Como e
0
= Y
0
-

Y
0
, podemos obtener un intervalo de confianza para Y
0
INT (e
0
) = INT (Y
0
-

Y
0
)
) e (

DS t ) Y

Y ( INT
0 2 / 0 0
t
) e (

DS t Y

) Y ( INT
0 2 / 0 0
t

Tarea: Demostrar que el intervalo de prediccin para una regresin simple es

+ + t

2
i
2
0
2 / 0 0
x
) X X (

N
1
1 t Y

Y
En algunos casos interesa predecir ) X / Y

( E

X ) Y ( E
'
0 0

)

( X

X X ) Y

( E ) Y ( E e
'
0
'
0
'
0 0 0 0

[ ]
0
1 '
0
2
0
1 2 '
0
'
0 0
X ) X ' X ( X X ) X ' X ( X )

( X V ) e ( V



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

135
4 4. . V VA AR RI IA AB BL LE ES S F FI IC CT TI IC CI IA AS S O O D DU UM MM MY Y O O B BI IN NA AR RI IA AS S O O
D DI IC CO OT T M MI IC CA AS S
Variable dependiente = f (variables cualitativas como sexo, raza, religin, nacional o
extranjero, etc)
En estos casos se utiliza una variable explicativa dicotmica. solo puede adoptar dos
valores. 1 o 0. Si la variable adopta ms de dos valores, tambin puede convertirse
fcilmente en dicotmica.

4.1 MODELOS ALTERNATIVOS.
Ejemplo 1: Unica Variable Explicativa es una variable dummy.

'

mujer es alumno el si 1
hombre es alumno el si 0
S
i

N
i
=
1
+
2
S
i
+
i
para i =1,2, ....n
donde N
i
es nota en curso de Econometra y S
i
es una variable dummy (nica variable
explicativa) que representa el sexo del alumno.
Nota esperada para alumnas mujeres?
E(N
i
/mujer) = E(N
i
/ S
i
=1) =
1
+
2
(nota esperada para una mujer)

Nota esperada para alumnos hombres?
E(N
i
/hombre) = E(N
i
/ S
i
=0) =
1
(nota esperada para un hombre)

Cmo se prueba que no hay diferencias de notas asociadas al sexo?
H
0
:
2
0
H
1
:
2
> 0 (las mujeres muestran en mayor nota promedio)
Podemos estimar
1
y
2
y luego realizar una prueba de hiptesis sobre diferencia de
resultados segn sexo.
2 n
2 2
t ~
)

DS




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

136
Observacin
Ni
E(Ni)
1

2 1
+ con
2
> 0
2


Ejemplo 2: Una variable cualitativa y otra cuantitativa
Variable Dependiente = f(Intercepto, Variable Cualitativa, Variable Cuantitativa)
La nota en econometra podra ser funcin del PPA.

N
i
=
1
+
2
S
i
+
3
PPA
i
+
i
para i =1,2, ....n
E(N
i
/mujer) = E(N
i
/ S
i
=1) =
1
+
2
+
3
PPA
i
(nota esperada para una mujer)
E(N
i
/hombre) = E(N
i
/ S
i
=0) =
1
+
3
PPA
i
(nota esperada para un hombre)
H
0
:
2
0
H
1
:
2
> 0 (las mujeres muestran en mayor nota promedio)

PPA
i
nota
i 3 1
PPA +
i 3 2 1
PPA + +
2

Supuestos:

2
> 0

3
igual para ambos sexos

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

137

Ejemplo 3: Dos variables cualitativas
Variable Dependiente = f(Intercepto, dos Variables Cualitativas)
La nota en econometra podra ser funcin del sexo y de la nacionalidad (por ejemplo
extranjero versus chileno).

N
i
=
1
+
2
S
i
+
3
E
i
+
i
para i =1,2, ....n

'

extranjero es alumno el si 1
chileno es alumno el si 0
E
i


E(N
i
/hombre, chileno) = E(N
i
/ S
i
=0, E
i
=0) =
1
(nota esperada para un hombre
chileno)
E(N
i
/hombre, extranjero) = E(N
i
/ S
i
=0, E
i
=1) =
1
+
3
(nota esperada para un hombre
extranjero)
E(N
i
/mujer, chilena) = E(N
i
/ S
i
=1, E
i
=0) =
1
+
2
(nota esperada para una mujer
chilena)
E(N
i
/mujer,extranjera) = E(N
i
/ S
i
=1, E
i
=1) =
1
+
2
+
3
(nota esperada para una mujer
extranjera)

Ejemplo 4: Interaccin entre una variable cuantitativa y una cualitativa.
Con la especificacin planteada en el ejemplo 2, se esta suponiendo que el efecto
diferencial asociado al sexo es constante, independiente del nivel de PPA
i
.
Es posible que la PPAi dependa del sexo.
N
i
=
1
+
2
S
i
+
3
PPA
i
+
4
PPA
i
* S
i
+
i
para i =1,2, ....n

H
0
:
2
=
4
= 0 (hombres y mujeres tienen nota similar)
H
1
: Algn
i
0 (el sexo explica diferencias de notas)


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

138
Otra hiptesis a probar es si la influencia de la PPA en la nota en Econometra es la misma,
independiente del sexo.

H
0
:
4
= 0 (hombres y mujeres tiene nota similar)
H
1
:
4
0 (el sexo genera efecto diferencial de la PAA)

PPA
nota
i 3 1
PPA +
2

Supuestos:

2
> 0

4
> 0
1

i 4 3 2 1
PPA ) ( ) ( + + +


Ejemplo 5: Variables Cualitativas Politmicas

'

resto el en 0
nce costarrice es alumno el si 1
CR
i

'

resto el en 0
uruguayo es alumno el si 1
U
i

'

resto el en 0
ad nacionalid otras de es alumno el si 1
R
i


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

139
Uruguayo
.Resto
Costa Rica
Nota
Uru
CR Resto

i i 4 i 3 i 2 1 i
u CR UR R N + + + +
Sin embargo, la regresin anterior no puede estimarse porque la matriz X no es de rango
completo por columnas.
1
1
1
1
1
1
1
1
]
1

1 0 0 1
1 0 0
0 1 0
0 1 0
0 0 1 1
0 0 1 1
X
i
CR
i
UR
i
R


R
i
+ U
i
+ CR
i
= 1 (las tres variables dummy sumadas dan lugar a la columna 1)
r (X) < k XX no es invertible

Posibles soluciones
i) Eliminar el intercepto
i i 4 i 3 i 2 i
u CR U R N + + +
ii) Eliminar una de las variables dummy.
i i 3 i 2 1 i
u CR U N + + +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

140
Cules son las notas esperadas?
En la alternativa i):
2 i i i i
resto) del alumno , 0 CR , 0 U , 1 R / N ( E
3 i i i i
uruguayo) alumno , 0 CR , 0 R , 1 U / N ( E
4 i i i i
nce) costarrice alumno , 0 U , 0 R , 1 CR / N ( E

En la alternativa ii):
1 i i i i
resto) del alumno , 0 CR , 0 U , 1 R / N ( E
2 1 i i i i
uruguayo) alumno , 0 CR , 0 R , 1 U / N ( E +
3 1 i i i i
nce) costarrice alumno , 0 U , 0 R , 1 CR / N ( E +

Qu diferencia tiene i) y ii)? De interpretacin de los coeficientes.
i)
3
refleja la nota esperada para un alumno uruguayo.
ii)
2
refleja en cunto difiere la nota de un uruguayo de la de un alumno resto.
Cmo realizar algunas pruebas de hiptesis? Con pruebas individuales o conjuntas.

4.2 VARIABLES DUMMY PARA DESESTACIONALIZAR
En general, toda serie econmica contiene cuatro componentes:
Z = C + T + S +I
donde :
Z es la serie original
C es el ciclo (podra aproximarse por funciones trigonomtricas)
T es la tendencia (en funcin del tiempo)
S es la estacionalidad o el efecto en la variable originado por factores asociados al
calendario (por ejemplo la actividad econmica declina en febrero producto de las
vacaciones)
I es la parte irregular o ruido blanco que no responde a ningn patrn determnistico.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

141
Identifiquemos en la serie dinero real estos componentes.

DINERO: DISTINTOS COMPONENTES
200000
250000
300000
350000
400000
450000
500000
550000
600000
650000
700000
8
6
-
I
8
7
-
I
8
8
-
I
8
9
-
I
9
0
-
I
9
1
-
I
9
2
-
I
9
3
-
I
9
4
-
I
9
5
-
I
9
6
-
I
9
7
-
I
9
8
-
I
M1A serie original Ciclo Tendencia


Sabemos que el comportamiento de largo plazo del dinero (componente tendencia-ciclo)
depende de una variable de escala (ingreso) y del costo de mantenerlo (tasa de inters
nominal). Pero adems la trayectoria del dinero esta afectada por factores estacionales (por
ejemplo aumenta fuertemente en septiembre por fiestas patrias o en diciembre, etc).

(M/P)
d
= f(ingreso, tasa de inters, factores estacionales, componente irregular)
Los efectos estacionales pueden aproximarse a travs de variables dummy.

ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+
7
D
4i
+
i

'

resto el en 0
primero el es trimestre el si 1
D
1

'

resto el en 0
segundo el es trimestre el si 1
D
2

'

resto el en 0
tercero el es trimestre el si 1
D
3

'

resto el en 0
cuarto el es trimestre el si 1
D
4


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

142

Sin embargo, la regresin anterior no puede estimarse porque la matriz X no es de rango
completo por columnas.
D
1
D
2
D
3
D
4

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
]
1

1 0 0 0 i Y ln 1
. . . . . . .
. . . . . . .
. . . . . . .
1 0 0 0 i Y ln 1
0 1 0 0 i Y ln 1
0 0 1 0 i Y ln 1
0 0 0 1 i Y ln 1
1 0 0 0 i Y ln 1
0 1 0 0 i Y ln 1
0 0 1 0 i Y ln 1
0 0 0 1 i Y ln 1
X
n n
8 8
7 7
6 6
5 5
4 4
3 3
2 2
1 1


D
1
+ D
2
+

D
3
+

D
4
= 1 (las cuatro variables dummy son una combinacin lineal que dan
lugar a la columna 1)

r (X) < k XX no es invertible

Posibles soluciones
i) Eliminar el intercepto

ln (M/P) =
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+
7
D
4i
+
i

E[ ln(M/P)/ D
1i
=1; D
2i
= 0; D
3i
= 0; D
4i
= 0] =
2
lnY
i
+
3
i
i
+
4

E[ ln(M/P)/ D
2i
=1; D
1i
= 0; D
3i
= 0; D
4i
= 0] =
2
lnY
i
+
3
i
i
+
5

E[ ln(M/P)/ D
3i
=1; D
1i
= 0; D
2i
= 0; D
4i
= 0] =
2
lnY
i
+
3
i
i
+
6

E[ ln(M/P)/ D
4i
=1; D
1i
= 0; D
2i
= 0; D
3i
= 0] =
2
lnY
i
+
3
i
i
+
7




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

143
ii) Eliminar una de las variables dummy

ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+
7
D
4i
+
i

En este caso si existe estacionalidad en el cuarto trimestre, el efecto ser captado por el
intercepto.

E[ ln(M/P)/ D
1i
=1; D
2i
= 0; D
3i
= 0] =
1
+
2
lnY
i
+
3
i
i
+
4

E[ ln(M/P)/ D
2i
=1; D
1i
= 0; D
3i
= 0] =
1
+
2
lnY
i
+
3
i
i
+
5

E[ ln(M/P)/ D
3i
=1; D
1i
= 0; D
2i
= 0] =
1
+
2
lnY
i
+
3
i
i
+
6

E[ ln(M/P)/ D
1i
=1; D
2i
= 0; D
3i
= 0] =
1
+
2
lnY
i
+
3
i
i


iii) Suponer que la suma de los efectos estacionales es cero.

4
+
5
+
6
+
7
= 0

ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+ (-
4
-
5
-
6
) D
4i
+
i
ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
(D
1i
- D
4i
) +
5
(D
2i
- D
4i
) +
6
(D
3i
- D
4i
) +
i

iv) Desestacionalizar las series utilizadas.
Por ejemplo en E-Views el comando SEAS elimina los efectos estacionales.
SEAS Y YSA
donde YSA es la series desestacionalizada.

Luego se corre la regresin con las series desestacionalizadas. Por ejemplo:
ln (M/PSA
i
) =
1
+
2
lnYSA
i
+
3
iSA
i
+
i

4.3 VARIABLES DUMMY PARA DETECTAR CAMBIO
ESTRUCTURAL

Recordar test de cambio estructural

CP
i
=
1
+
2
Y
i
+
i
Chile 1960 - 1997


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

144
II I
II I
H
H


:
:
1
0



Supongamos que intuimos que hubo cambio estructural en 1974 producto del proceso de
apertura comercial iniciado por el pas.

1960-74
I
1
,
I
2

1975-97
II
1
,
II
2



Podramos definir:

'

) 97 75 ( abierta es economa si 1
) 74 60 ( cerrada es economa si 0
D
i


Planteamos un modelo ms general:
C
i

1
+
2
D
i
+
3
Y
i
+
4
D
i
Y
i
+ u
i
E(C
i
/ D
i
0, Y
i
)
1
+
3
Y
i

E(C
i
/ D
i
1, Y
i
) (
1
+
2
) + (
3
+
4
) Y
i


2
es el intercepto diferencial

4
es la pendiente diferencial

H
0
:
2
=
4
0
H
1
: Algn

0

Efectuar la prueba de la hiptesis anterior es absolutamente equivalente al test de cambio
estructural presentado anteriormente. Sin embargo, utilizar variables dummy para verificar
cambio estructural tiene una ventaja importante: indica en forma precisa cul parmetro es
diferente. En el ejemplo anterior podramos identificar si cambi el intercepto o la
pendiente o ambos. El procedimiento basado en los residuos o en el test C slo reportaba
si haba estructural, sin especificar en qu parmetro(s) se produjo.

Tambin es posible efectuar pruebas individuales e identificar en que parmetro se produjo
el cambio estructural.

H
0
:
2
= 0
H
1
:
2
0

H
0
:
4
= 0

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

145
H
1
:
4
0

4.4 VARIABLES DUMMY PARA CORREGIR OUTLIERS.

Un outlier es un error anormal. Su valor absoluto es largamente superior al desvo estndar
de la regresin. Los parmetros estimados pueden estar fuertemente distorsionados
considerando la presencia del outlier.
ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+
7
D
4i
+
8
D
5i
+
9
D
6i
+
9
D
7i

+
10
D
8i
+
11
D
9i
+
12
D
10i
+
13
D
11i
+
i

Aqu utilizamos 11 dummies para captar estacionalidad por tratarse de datos mensuales.
ECUACIN ESTIMADA PARA LA DEMANDA POR DINERO
-0.05
0.00
0.05
0.10
0.15
0.20
12.0
12.5
13.0
13.5
87 88 89 90 91 92 93 94 95 96 97 98
Residual Actual Fitted

Se percibe que en marzo de 1992 tenemos un residuo anormal: casi 0.15 en circunstancias
que el desvo estndar de la regresin es de 0.023. Existe justificacin para controlar ese
residuo anormal a travs de la inclusin de una dummy.

'

resto. el en 0

1992 de marzo i si 1
923 D

ln (M/P) =
1
+
2
lnY
i
+
3
i
i
+
4
D
1i
+
5
D
2i
+
6
D
3i
+
7
D
4i
+
8
D
5i
+
9
D
6i
+
9
D
7i

+
10
D
8i
+
11
D
9i
+
12
D
10i
+
13
D
11i
+
14
D923 +
i


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

146


ECUACIN ESTIMADA PARA LA DEMANDA POR DINERO (Incluyendo la Variable
Dummy D923)
-0.04
-0.02
0.00
0.02
0.04
0.06
12.0
12.5
13.0
13.5
87 88 89 90 91 92 93 94 95 96 97 98
Residual Actual Fitted

A primera vista, parecera que el numero de outliers hubiera aumentado. Sin embargo, debe
considerarse que la banda se estrech producto de la disminucin del desvo estndar de la
regresin (desde 0.023 a 0.017).

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

147
5 5. . M MU UL LT TI IC CO OL LI IN NE EA AL LI ID DA AD D
5.1 INTUICIN
El estimador MICO de un parmetro especfico del vector , no involucra solamente las
observaciones de la variable correspondientes a ese , sino tambin el resto de las variables
independientes.
Esto es porque, para obtener estimaciones precisas de la influencia de una variable sobre
otra, se debe tomar en cuenta la influencia simultnea de las otras variables explicativas.
Hacer esto asegura que el elemento
j
refleja la influencia de la variable independiente j,
cuando el efecto de las otras variables se mantiene constante.
Si el modelo a estimar es Y
i
=
1
+
2
X
i
+ u
i

Y
X

Y = variacin de Y
X = variacin de X
= variacin comn de Y y X.
es la informacin utilizada para estimar la pendiente
2
(cuanto mayor sta
rea, mayor informacin es usada y menor su varianza).
Si el modelo incorpora una variable adicional, generalmente habr una zona en que
estas dos variables tienen variabilidad comn, lo que denominaremos multicolinealidad o
colinealidad ( + ).


Y
X
Z

Y
i
=
1
+
2
X
i
+
3
Z
i
+ u
i

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

148
En la regresin mltiple de Y respecto a X y Z, el estimador MICO utiliza el rea ( )
para estimar
2
y el rea ( ) para estimar
3
.
Esto implica que el rea comn ahora es desechada, esto es porque no es posible saber
a-priori a qu variable (X o Z) atribuirlo.
Si las variables X y Z son ortogonales [covarianza (X, Z) = 0] no hay reas comunes
y los estimadores MICO utilizan slo los datos de la variable X para estimar
2
y slo Z
para X
3
.
Si las variables X y Z son muy colineales, el rea es muy grande y las reas ( )
y ( ) son pequeas, lo que implica que para estimar
2
y
3
se utiliza muy poca
informacin. Esto provoca que las varianzas estimadas de estos coeficientes son muy
elevadas.
Si hay colinealidad perfecta entre X y Z, el rea comn abarca todo el crculo (no
hay rea ( ) y ( )esto implica que no es posible hacer estimaciones.
Veamos estos resultados con mayor rigurosidad

5.2 TIPOS DE MULTICOLINEALIDAD
Multicolinealidad: es el fenmeno que se produce cuando las variables explicativas tienen
alta correlacin.
Distinguiremos entre dos casos:
1. Multicolinealidad perfecta: la relacin entre las variables X y Z es perfecta (Ej X =
XZ).
2. Multicolinealidad imperfecta: la correlacin entre las variables X y Z es alta, pero
no perfecta.

Multicolinealidad perfecta
Es el fenmeno presente cuando tenemos

1
X
1
+
2
X
2
+ +
k
X
k
0
con algn
i
0 relacin perfecta entre variables X
i
.
Ej. :Supongamos el siguiente modelo expresado en desvos:
+ + x x y
3 3 2 2
donde se tiene que x
3
= x
2


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

149
1
1
1
]
1

1
1
1
1
1
1
]
1

1
]
1




2
3 i 3 i 2 i
3 i 2 i
2
2 i
3 n 2 n
23 22
13 12
3 n 23 13
2 n 22 12
x x x
x x x

x x

x x
x x
x x x
x x x
x ' x
Como x
3
= x
2

1
1
1
]
1

1
1
1
]
1




2
2
2 i
2
2 i 2 i 2 i
2 i 2 i
2
2 i

1
x
) x ( x x
x x x
x ' x
Luego, el determinante de xx es igual a cero (o el rango de x es uno) No se puede
obtener una solucin nica para


Ms an, de las ecuaciones normales sabemos:
1
1
1
]
1

+
+

1
1
1
]
1

1
1
1
]
1


1
1
1
]
1

1
1
1
]
1

)

( x
)

( x

x

1

) x ' x (

1
y x
y x
y x
y ' x
: donde y ' x

) x ' x (
3 2
2
2 i
3 2
2
2 i
3
2
2
2 i
2
2 i
3 i
2 i

Por lo que:
: estimar permiten nos y una son ecuaciones dos las
y x )

( x
y x )

( x
2 i 3 2
2
2 i
2 i 3 2
2
2 i

+
+


+
2
2 i
2 i
3 2
x
y x


es estimable la combinacin, pero no


2
y


3
.
La presencia de multicolinealidad perfecta hace imposible el clculo de


2
y


3
en forma
independiente. Solo es posible estimar una combinacin lineal de esos estimadores.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

150
Otra forma de verlo:
2 3
3 3 2 2
x x
) ( x x y

+ +


) ( x ) ( y
) ( x x y
2 3 2
2 3 2 2
+ +
+ +

Si definimos
3 2
+ , el nico parmetro que podremos estimar ser


x
i2
y
x
i2
2


Multicolinealidad imperfecta
Hay fuerte asociacin entre variables explicativas
en la regresin simple: el coeficiente de correlacin simple
2 1
x x
r es alto
en la regresin mltiple: el coeficiente de determinacin
2
resto
x ,
j
x
R de una regresin
en que una de las variables explicativas x
j
es explicada por el resto de las variables
explicativas
j
k 2 1 j
sin x
) x _____ x , x ( f x

es alto

Ejemplo:
Supongamos el mismo modelo anterior expresado en desvos
+ + x x y
3 3 2 2
donde ahora se tiene que x
i3


x
2i
+ v
i
. Es decir que hay
una relacin entre x
i3
y x
i2
, pero esta no es perfecta. v
i
es un trmino estocstico.


1
1
1
]
1

+ +
+

1
1
1
]
1





2
i 2 i i 2 i 2 i
i 2 i 2 i
2
2 i
2
3 i 3 i 2 i
3 i 2 i
2
2 i
) v

x ( ) v x

( x
) v x

( x x

x x x
x x x
x ' x


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

151
[ ]




+
1
1
]
1

1
1
]
1

+ +
+

2
i
2
2 i
2
2 i
2
2 i
2 2
i
2
2 i
2
2
i
2
2 i
2 2
2 i
2
2 i
2
2 i
i 2 i
2
i
2
2 i
2
i 2 i
2
i
i 2 i
2
i
2
2 i
v x x x

v x

x ' x det
v x

x
x ' x
0 v x que dado y


v x

v x x

v x x

x
x ' x


Supongamos que x
2
x
3
son ortogonales
1
1
1
]
1

2
3 i
2
2 i
x 0
0 x
x ' x
luego,

2
3 i
2
2 i
x x x ' x det

Sabemos que ) v x

x regresin la de SCR la es v porque ( x v


i 2 3
2
i
2
3 i
2
i
+ <

y
siempre SCT> SCR
Entonces, concluimos que x x v x
2
3 i
2
2 i
2
1
2
2 i
< y por tanto el determinante
cuando existe colinealidad es menor que el determinante bajo Ortogonalidad.
A mayor colinealidad ms pequeos el determinante ( cuanto ms grande sea R
2
, ms
pequeo ser

2
3 i
2
i
x a respecto v
Por qu importa el determinante?
Porque,

1
1
1
]
1

x x x
x x x

) x ' x det(
1
) x ' x (
2 i 3 i 2 i
3 i 2 i
2
3 i
1


y este resultado se utiliza no solo para calcular

, sino tambin para var-cov (

).


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

152
5.3 EFECTO DE LA MULTICOLINEALIDAD A NIVEL EMPRICO
En el modelo con dos variables explicativas.
El principal efecto de la emprico de la multicolinealidad se deriva del resultado anterior:

2
3 2
2
2 i
2
3 i
2
2 3 2
3 2
2
3
1
) x x ( x x D
x x x
x x x

D
1
) x ' x (




1
1
]
1


2
3 i
2
3 i 2 i
2
2
2
2
3 i 2 i
2
2
2
3
2
3
2
2
x
) x x (
x


) x x ( x x
x

Var
( )

,
_


2 3
2
2
3 2
2
2
2
3
2
3 2
2
2
2
x var x var n
x var ) x x cov( n
x var n
x var n
) x x ( cov n
x var n

Var
y recordando
3 x 2 x
3 x , 2 x
) 3 x , 2 x cov(
r


( ) ( )

r 1 x r x var n x var n

Var
2
x , x
2
2 i
2
2
x , x 2 2
2
2
3 2 3 2

es decir que la varianza que


2

queda dependiendo del grado de correlacin entre las variables explicativas (r


x
2
, x
3
).
Ceteris paribus, a mayor correlacin, mayor varianza del parmetro (intuitivamente este era
un resultado conocido)

En el Modelo General

) R 1 )( X ( var n
)

( V
2
j j
2
j

Tarea: demostrarlo

2
j
R = coeficiente de determinacin de una regresin entre las variables j y el resto de
las variables explicativas.
Cuando R
j
2
aumenta, la varianza aumenta. Si )

( V 1 R
j
2
j

Importante:
Esta colinealidad puede compensarse por alta varianza X
i
o por elevado n.
Si X
i
es de baja varianza, el efecto sobre la varianza ser igual al que produce la
colinealidad.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

153
Un modelo con alta correlacin ( R
2
alto), pero
2
bajo, puede tener estimaciones
confiables para V(


j
) .
Efectos prcticos de la multicolinealidad:
1. Crecimiento varianzas y covarianzas.
2. Intervalos de confianza se amplan.
3. Test t se reducen
. bajos t test
) ( V

( V )

( var
j
j
j j


Que los resultados de los test sean mas bajos no necesariamente quiere decir que
hay que excluir una variable explicativa. Este resultado puede ser efecto de la
multicolinealidad.
4. El R
2
del modelo es alto y los test t de los coeficientes son bajos.
5. Errores numricos por redondeos de dgitos.

5.4 FORMAS DE DETECTAR LA MULTICOLINEALIDAD
Por sus efectos sobre los test.
R
2
altos y test ms bajos.
Esto no significa que la multicolinealidad aumente el R
2
.
Cuidado:
1. A mayor multicolinealidad no implica mayor R
2
.
2. Alta multicolinealidad no siempre implica test t ms bajos, puede
compensarse por otros efectos.
3. No es una condicin necesaria, ni suficiente para que exista
multicolinealidad.
Test sobre R
2
j

Donde R
2
j
, es el R
2
de la siguiente regresin
i 1 j 1 j 1 j 1 j 2 2 1 j
... X X ... X X + + + + + +
+ +


Se calcula :

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

154
) 1 k ( n , 2 k
2
j
2
j
j
F
) 1 k ( n / ) R 1 (
2 k / R
: F


cero a diferente una lg a : H
0 , , , : H
i
1 k 3 2 0



Si F>F tabla, se rechaza H
0
hay multicolinealidad.
Factor de Inflacin de Varianza
VIF (


i
)
1
1 R
i
2

donde R
i
2
es el coeficiente de correlacin mltiple entre x
i
y las dems variables
explicativas.
VIF sera la razn entre la varianza real de


i
con la que tendra


i
sin correlacin.
Esta comparacin lo nico que da es la relacin entre la realidad y lo ideal, pero no
ms que esto. Tampoco ayuda a solucionar el problema.
Conclusin:
No hay un test nico que me permita detectarlo, adems en caso de hacerlo, solo son
medidas de lo mal que estn las cosas respecto a la situacin ideal.
5.5 FORMAS DE SOLUCIONAR LA MULTICOLINEALIDAD
No hacer nada
Dado que la multicolinealidad (imperfecta) no afecta las propiedades de la
estimacin, los estimadores siguen siendo MELI, aunque la varianza sea grande
(aunque mnima), una solucin es no hacer nada.
Es asumir que la realidad es as, que la muestra utilizada, tiene estos problemas.
Asumir que multicolinealidad es un problema muestral.
Hay dos reglas prcticas en este sentido:
1. No preocuparse por la multicolinealidad si el R
2
de la regresin total es mayor
que el R
2
de las regresiones de las variables explicativas entre s.
2. No preocuparse si los test t son mayores que 2.
Incorporar informacin adicional
a) Aumentar el tamao muestral (n).
Esto va en dos sentidos ya que aumenta n y puede aumentar var x
i
.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

155

) R 1 )( x var( n
) ( V
2
j j
2
j


b) Aumentar n intentando maximizar la Ortogonalidad en los datos.
No es fcil de realizar en ciencias sociales,

c) Utilizar datos en primeras diferencias:

1 i 3 1 i 3 1 i 2 2 1 1 i
i 3 i 3 i 2 2 1 i
X X Y
X X Y

+ + +
+ + +

_____________________________________

i i 3 3 i 2 2 i
1 i i 13 i 3 i 3 1 i 2 i 2 2 1 i i
v X X Y
) X X ( ) X X ( Y Y
+ +
+ +


Ahora explicamos las variables en cambios y no en niveles correlacin disminuye
en cambios.
Para que esto sea aplicable v
i
debe cumplir supuestos clsicos.

d) Utilizar informacin a priori suministrada por la teora.
Ej.:
i 3 i 3 2 i 2 1 i
X X Y + + +
donde X
i2
y X
i3
son correlacionadas
pero la teora dice que 1
3 2
+

i i 2 i 3 3 1 i 2 i
i i 3 3 i 2 3 i 2 1 i
i i 3 3 i 2 3 1 i
) X X ( X Y
X X X Y
X X ) 1 ( Y
+ +
+ + +
+ + +


i i 3 1 i
W Z + +
Problema: Si la restriccin es falsa, se genera sesgo.
Empricamente: se hace un test F para saber si se acepta la restriccin.

e) Combinacin de series de tiempo y series de corte transversal.
Esto es, ocupar informacin para algn parmetro en un momento de tiempo e

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

156
imponerla como vlida en toda la muestra.
Ej.:
t t 3 t 2 1 t
I ln P ln Y ln + + + , pero entre P e I hay multicolinealidad .

Pero, de otro estudio sabemos que para un momento de tiempo
3
= 1,02.

t t 2 1 t t
t t t 2 1 t
P ln I ln 02 , 1 Y ln
I ln 02 , 1 P ln Y ln
+ +
+ + +

Si la restriccin es vlida, soluciono el problema de multicolinealidad.

f) Eliminacin de una variable.
Supongo que un
i
es cero. Esto tiene problemas si la variable no tiene coeficiente
cero en el modelo terico (verdadero).
Modelo verdadero:
i i 3 3 i 2 2 1 i
X X Y + + +
Pero ajusta:
i i 2 2 1 i
u X b b Y + +

2
i
i i
2
x
y x
b


+ + x x y
i i 3 3 i 2 2 i

+ +
+ +

+ +

2
2 i
i 2 i
2
2 i
3 i 2 i
3 2
2
i 2
i 2 i 3 i 2 i 3 2
2
i 2
2
i 2
i i 3 3 i 2 2 2 i
2
x
) u u ( x

x
x x


x
) u u ( x x x x


x
) u u x x ( x
b


E(

b
2
)
2
+

3
x
i2

x
i3
x
i2
2


salvo en el caso de Ortogonalidad, el estimador de

b
2
es sesgado al excluir una
variable que debe ir en el modelo.
g) Mtodo de componentes principales
No lo veremos, pero es un mtodo ms completo de solucin del problema


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

157
6 6. . H HE ET TE ER RO OC CE ED DA AS ST TI IC CI ID DA AD D
Uno de los supuestos clsicos que hemos mantenido hasta ahora es:

I ) ' ( E
) ( E
2
2 2
i


o en trminos matriciales
Es decir que la varianza del trmino de error es constante
i
. Esto se refleja en una
varianza constante para la regresin
2
i
) Y ( V .
Este supuesto es irreal en algunos casos:

En estudios de corte transversal es ms fcil imaginar ejemplos donde la varianza del
trmino de error aumenta (o disminuye) con una variable explicativa. Ello debido a la
convivencia de unidades heterogneas. Esta heterogeneidad generalmente est asociada
al comportamiento de una o mas variables explicativas.

Ejemplo: explicamos el consumo en funcin del ingreso. Pero a medida que el
ingreso aumenta, aumentan los posibles usos de ste por lo que si nuestra regresin
es del tipo
i i 2 1 i
Y C + + , la varianza del error no ser constante sino que ser
creciente con el nivel de ingreso.

Y
i
C
i

recta de regresin estimada



Ejemplos de aprendizaje-error; en la medida que se produce aprendizaje los errores de
comportamiento se reducen (
i
disminuye).


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

158
tiempo de aprendizaje
errores al tirar
penales


Otro ejemplo es el de mejoras en el procesamiento de datos. En series de tiempo que
son recolectadas por una entidad,
2
i
tiende a disminuir por aprendizajes en la
recoleccin de la serie.

6.1 CMO SE AFECTAN LAS PROPIEDADES DEL ESTIMADOR
MICO CUANDO EXISTE HETEROCEDASTICIDAD?
Supongamos que exista una relacin positiva entre el valor absoluto de los residuos y una
variable explicativa.
En este caso, ampliar la muestra al final, afectar la recta de regresin fuertemente hacia la
derecha (si la observacin agregada es positiva) o hacia la izquierda (si la observacin
agregada es negativa).
X
i
Y
i


En muestas repetidas, estos casos se compensarn, y el estimador MICO seguir siendo
insesgado, pero la varianza de los estimadores ser mayor.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

159
Veamos esto en el caso simple:
i i 2 1 i
X Y + +
Pero con
2
i
2
i
) ( E
+ +

) X ( k Y k y k
x
y x

i i 2 1 i i i i i
2
i
i i
2

k X k k

i i i i 2 i 1 2
+ +


y dadas las propiedades de k
i

i i 2 2
k

+


insesgado siendo sigue )

( E
2 2

) k k k k ( E ) k ( E )

( E )

( V
2 1 2 1
2
n
2
n
2
1
2
1
2
i i
2
2 2 2
+ + +

0 .... 0 ) k ( E ) k ( E ) k ( E
2
n
2
n
2
2
2
2
2
1
2
1
+ + + + +

2
i
2
i
2
n
2
n
2
2
2
2
2
1
2
1
k ) ( E k ) ( E k ) ( E k
2
n
2
2
2
1
+ + +


3 2 1 3 2 1 3 2 1


1
1
]
1

2 2
i
2
i
2
i 2
i
2
2
i
i
) x (
x

x
x


Antes tenamos que


2
i
2
2
x
)

( V , por lo que las varianzas de los estimadores


cambian relajar el supuesto de homocedasticidad.

Veamos que ocurre en el modelo general:
Matricialmente:

,
_

,
_


0


0
0


0
) ' ( E ) ( E
2
n
2
1
2
2
n
2
2
2
1
2
i

+ +

' X ) X ' X ( X ' X ) X ' X ( ) X ( ' X ) X ' X ( Y ' X ) X ' X (
1 1 1 1

+

' X ) X ' X (

1


E(

)


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

160
[ ] ( )
1 1 2
1 2 1 1 1
1 1
) X ' X ( X ' X ) X ' X (
) X ' X ( X ' X ) X ' X ( ) X ' X ( X ) ' ( E ' X ) X ' X (
) X ' X ( X ' ' X ) X ' X ( E )'

)(

( E )

( V







Por lo que:
El estimador sigue siendo
insesgado.
Las varianzas deben ser corregidas para incorporar heterocedasticidad.

Qu ocurre si se estima por MICO sin tener en cuenta la heterocedasticidad?
La varianza estimada con la frmulas anterior

,
_

1 2
2
i
2
) X ' X ( o
x
es un
estimador sesgado de la varianza corregida. Ser sobreestimada o subestimada,
dependiendo de la naturaleza de la relacin de
2
i
y X
i
.
El sesgo surge de que el estimador de
2
,

,
_



2 n
e

2
i
2
, deja de ser insesgado bajo
heterocedasticidad.
Esto implica que usar los procedimientos habituales de MICO puede provocar serios
errores. Por eso se utiliza un mtodo alternativo: Mtodo de Mnimos Cuadrados
Generalizados
Se recomienda ver ejercicio 6.18 de la Gua.
6.2. MTODO DE MNIMOS CUADRADOS GENERALIZADOS
Idea: Utilizar una tcnica que presta menos atencin a los residuos asociados con
observaciones con alta varianza. Esto se hace asignando menos "peso" a esas
observaciones, dado que stas dan una indicacin menos precisa del lugar donde
pasa la verdadera recta de regresin.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

161
X
i
Y
i

Partamos del modelo simple:


(1)
i i 2 1 i
X Y + +
Otra forma de expresarlo es
(2) X X Y
i i 2 i 0 1 i
+ + , donde X
0i
=1 para todo i.
Supongamos que se conoce
2
i
y se divide (2) por
i
:

*
i
*
i
*
2
*
01
*
1
*
i
i
i
i
i
2
i
i 0
1
i
i
X X Y ) 4 (

X

X

Y
) 3 (
+ +

,
_

,
_



Calculemos ahora la varianza del trmino de error de la regresin en que los datos
fueron transformados:
1 ) ( E
1
E ) ( E ) ( Var
2
i
2
i 2
i
2
i
2
i
i 2 *
i
*
i

,
_



Este mtodo implica que ahora el error es homocedstico, la
varianza es 1. En este caso se cumplen todos los supuestos clsicos es
MELI.
Aplicar MICO a variables transformadas es lo mismo que aplicar
MCG.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

162
Derivacin de MCG en el caso simple
2
i
i
*
i
*
02
2
* *
01
*
1 i
i
i
i
i *
2
i
01 *
1
i
i
1
w Sea
e X

Y
e

X

+ +


2
i
*
2
*
1 i i
2
i i
2
i
2
i
2
i
i 2 *
i
) X

Y ( w min
) e w ( min
e
min
e
min e min

,
_



0 ) 1 )( X

Y ( w 2

e w
0 ) 1 )( X

Y ( w 2

e w
i
*
2
*
1 i i
*
2
2
i i
i
*
2
*
1 i i
*
1
2
i i



2
i i
2
1 i i
i i i i i i i i
*
2
*
2
*
i
) X w ( ) X w )( w (
) Y w )( X w ( ) X Y w )( w (

* X * Y



Derivacin de MCG en el caso mltiple.
+ X Y donde hay heterocedasticidad,
2
) ' ( E
Quisiramos transformar el modelo y queremos que al transformar las
variables se cumpla que el error sea homocedstico.
Supongamos que existe una matriz T, que transforma los datos:

v TX T TX TY + +

Requerimos que E(vv') =
2
I, donde v = Tu
Como ' T T ' T T ' T ) ' ( TE ) ' T ' T ( E ) ' vv ( E v Var
2 2

y se requiere I ' T T ,
Luego,
1 1
) ' T ( T



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

163
T ' T
1

(*)
Es decir que T, debe ser una matriz que satisfaga (*)

Para obtener los estimadores MCG, aplicamos MICO al modelo transformado;
v TX TY +
( )
+
+ +




' X ) X ' X (
' X ) X ' X ( X ' X ) X ' X ( ) X ( ' X ) X ' X (
Y ' X ) X ' X ( TY ' T ' X ) TX ' T ' X ( TY )' TX ( TX )' TX (

1 1 1
1 1 1 1 1 1 1 1 1
1 1 1 1 1
MCG

)

( E
MCG

( )( ) [ ] ( ) ( ) [ ]
( ) ( ) [ ] ( ) ( ) [ ]
( ) ( ) [ ] ( )
1
1 2
1
1 1 1
1
1 2
1
1 1 2 1
1
1
1
1 1 1
1
1
1
1 1 1
1
1
MGB
X ' X X ' X X ' X X ' X
X ' X X ' X X ' X X ' X X ) ' ( E ' X X ' X
X ' X X ' ' X X ' X E '

( E )

( V






Se puede demostrar que esta varianza cumple el teorema de Gauss Markov.
El estimador de
2
es:

MCG
2

TX TY v
k n
v ' v



k n
)

X Y ( )'

X Y (

k n
)

X Y ( T ' T )'

X Y (

k n
)

TX TY ( )'

TX TY (

MCG
1
MCG
MCG MCG MCG MCG 2



Este mtodo se conoce generalmente como mnimos cuadrados ponderados.
Cuando existe heterocedasticidad, el mtodo que verifica TM Gaus Markov es MCG y no
MICO.

. H . C
) MICO ( var ) MCG ( var <

6.3. CMO DETECTAR LA HETEROCEDASTICIDAD?
La mayora de los mtodos para detectar la heterocedasticidad se basan en el anlisis de los
residuos. Esto se hace esperando que los e
i
sean buenos estimadores de
i
, lo que se puede

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

164
cumplir si la muestra es relativamente grande.
Naturaleza del problema:
hay casos en que desde el comienzo de la investigacin conocemos que hay
problemas.
Mtodo grfico:
intentar detectar la presencia de un patrn sistemtico en los residuos.
Prueba de Park
Supone que
2
i
es funcin de una variable X
i

i i
2 2
i
v
i
2 2
i
v X ln ln Ln
e X
i
+ +



Dado que
2
i
es desconocida, se propone usar
2
i
e
) i ( v X ln e ln
v X ln ln e ln
i i
2
i
i i
2 2
i
+ +
+ +


La idea es hacer un test:
Si es significativo heterocedasticidad
no significativo homocedasticidad
Para hacerlo hay 2 etapas:
1) Aplicamos MICO a la regresin original (que queremos testear), calculamos e
i

2) Corremos regresin (i) y hacemos test de hiptesis.
Problemas:
vi no satisface las propiedades para aplicar MICO

Prueba de Glesjer
Es similar al mtodo anterior pero se realiza testeando con diferentes formas
funcionales:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

165
i i 2 1 i
i
i
2 1 i
i
i
2 1 i
i i 2 1 i
i i 2 1 i
v X e
v
X
1
e
v
X
1
e
v X e
v X e
+ +
+ +
+ +
+ +
+ +

Problema:
El residuo tiene como propiedades: E(vi) 0, correlacionado y heterocedstico.
Pero para nuestras grandes pueden ocuparse las 4 primeras formas.
Ventaja: trata de estimar la verdadera forma de la heterocedasticidad.
Goldfeld - Quant
2
i
2 2
i
i i 2 1 i
X
X Y

+ +


Pasos:
1. Ordenar las observaciones de acuerdo a X
i

2. Omitir observaciones centrales (c). Nos quedan 2 grupos de
2
c n
observaciones cada uno.
3. Aplicar MICO a las dos submuestras y obtener SCR
I
y SCR
II

4. Calcular
icidad Homocedast rech Si
F ~ ocedstico hom y N ~ si
l de g / SCR
l de g / SCR

2
,
2
i
i
ii
k 2 c n k 2 c n
>



F



Idea: Si existe heterocedasticidad del tipo supuesto, con la ordenacin la varianza
del trmino de error ser mayor hacia el final de la muestra SCR
II
> SCR
I
Si

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

166
> F rechaza homocedasticidad.

Test de White.
Es vlida para n grande.
Pasos:
(1) Aplicamos MICO a la regresin original calculo e
i
.
(2) Se hace la regresin de ) X , X , X X , X , Constante ( f e
2
3
2
2 3 2 2
2
i
, es decir,
i
2
3 6
2
2 5 3 2 4 3 3 2 2 1
2
i
X X X X X X e + + + + + +

(3) Bajo la hiptesis nula de ausencia de heterocedasticidad
(
2
=
3
=
4
=
5
=
6
=0) asintticamente el estadstico nR
2
~
2
1 p

donde p son la cantidad de parmetros del modelo (2)

Idea: Mientras n crece, R
2
tender a cero bajo la hiptesis nula de
homocedasticidad. El R
2
no tiende a cero, si la varianza del e
i
depende de las
variables explicativas del modelo en ese caso nR
2
>
2
.


6.4 CMO SOLUCIONAR HETEROCEDATICIDAD?
Bajo heterocedasticidad MICO ya no es eficiente
Se conoce
2
i

si se conoce
2
i
estimo por MCG transformo los datos de forma que el
residuo sea homocedstico.
Se desconoce
2
i
. Lo primero es estimar
2
i
, segn la forma de la heterocedasticidad,
ser la forma de transformar los datos.


1) Supongo
2
i
2 2
i
X ) ( E
La forma es dividir datos por X
i


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

167

vi
X
1

X
Y
X X X
Y
X Y
2 1
i i
i
i
i
2
i
1
i
i
i i 2 1 i
+ +

+ +

+ +


2
2
i
2
i 2 2
i
2
i
2
i
i 2
i
i
i
i

X
X
) ( E
X
1

X
E ) v ( E
0
X
E ) v ( E

,
_

,
_


2) Supongo
i
2 2
i
X ) ( E
Mejor transformacin

i i 2
i
1
i
i
i 2
i
1
i
i
i
i
i
i
2
i
1
i
i
v X
X
1

X
X
X
1

X
Y
X
X
X X X
Y
+ +

+ +


0
X
E ) v ( E
i
i
i

,
_




2
i
i 2 2
i
i
2
i
2
i
2
i
i
i

X
X
) ( E
X
1

) X (
E
X
E ) v ( E

,
_

,
_



Ejemplo en caso general
Supongamos un modelo de corte transversal

t t t
X Y + + para t = 1....n
u
t
homocedstico
Pero solo tenemos acceso a datos agrupados en m grupos con n
i
observaciones en cada
grupo i.
i
2
i
i i i
n
) var(
X Y


+ +


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

168

n / 1 . . 0
. . . .
. . n / 1 0
0 . 0 n / 1

m
2 2 2
1
1
1
1
]
1



1
1
1
1
1
1
]
1

m
2
1
1
n
n
n

1
1
1
1
1
1
1
1
]
1



m
2
1
1
n



n
n
T
T ' T



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

169
7 7. . A AU UT TO OC CO OR RR RE EL LA AC CI I N N
7.1 INTRODUCCIN
La heterocedasticidad es solo una de las formas en que se puede levantar el supuesto
de E() =
2
I. La segunda manera es suponer que los errores presenten estn
correlacionados entre s E(
i

j
) 0 para i j
Esto provocara que la matriz de varianzas y covarianzas de los errores presentar trminos
distintos de 0 fuera de la diagonal principal:

1
1
1
1
1
1
1
1
]
1




0
2
0 1
2 1 0






) ' ( E donde
s
= E(
i

i-s
)
A este fenmeno se le denomina autocorrelacin y est presente fundamentalmente en
estudios de series de tiempo, donde un shock en el perodo i, genera errores en los prximos
perodos.
En lo anterior, se est suponiendo que la covarianza entre dos errores depende slo de la
distancia temporal entre las observaciones.
A su vez, como todos los trminos de la diagonal principal se tiene el mismo valor, se est
suponiendo homocedasticidad
0
= E(
i

i-0
)= ) ( E
2
i

2
0


En trminos grficos:
x
x
x
x
x
x
x x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
u
i
u
i
e
i
t t


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

170
7.2 CAUSAS MS FRECUENTES DE AUTOCORRELACIN

Ciclos o tendencias en las variables,
Es decir rachas de valores altos o bajos provocados por shocks o innovaciones no esperados
que son difcilmente captados por las variables explicativas.

Autocorrelacin espacial,
En datos de cross-section un shock aleatorio que afecta la actividad de una regin puede
causar actividad econmica en regiones adyacentes (ej.: mal tiempo).
Tambin ocurre efecto vecindad o efecto demostracin.


Influencia prolongada de shocks:
En las series de tiempo, los shocks en general persisten por ms de un perodo.


Inercia:
Debido a la inercia o a fenmenos psicolgicos, las acciones pasadas muchas veces tienen
efecto en el presente. Si al modelo le falta incorporar dinmica presente en la realidad, a
travs de rezagos, los residuos tendrn patrones autocorrelacionados.

Mala especificacin
i) Omisin de una variable relevante
La omisin de una variable relevante que es autocorrelacionada provocar un residuo
autocorrelacionado.
Si el modelo es
i 3 3 2 2 1 i
X X Y + + +
pero estimamos
i 2 2 1 i
v X Y + +
Entonces,
3 3 i i
X v +
Si X
3
presenta autocorrelacin, entonces, v
i
la presentar aunque u
i
no est
autocorrelacionado.
Si esta es la razn para un patrn de este tipo, entonces lo correcto es
corregir la mala especificacin, incorporando X
3
al modelo.


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

171

ii) Forma funcional inadecuada.
f. funcional
estimada
verdadera forma
errores positivos
o negativos

Quiebre o cambio estructural
Si se produjo un cambio estructural en la muestra, los residuos pueden presentar patrones
sistemticos antes y despus del cambio estructural.

forma verdadera
forma estimada

Entonces, es muy importante detectar la razn de patrones de comportamiento
autocorrelacionados en los residuos, porque ello determinar la mejor forma de corregir
este problema.
En adelante, supondremos que la autocorrelacin no est provocada por errores de
especificacin, ni de quiebre estructural, ni ausencia de rezagos, sino que por alguna
razn distinta de estas, los residuos se encuentran correlacionados entre s.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

172
7.3 ALGUNAS DEFINICIONES
Autocovarianza
Definimos autocovarianza entre
i
y
i-s
como ) , ( E
s s i i


para s=0, t1, t2...
Si
2
0
2
i s i i
) ( E ) , ( E 0 s


Entonces, podemos E( ) ' se puede expresar:

1
1
1
1
1
1
]
1




. .
. .
.
) ' ( E
0
0 1
2 1 0

Coeficiente de Autocorrelacin
Definimos

0
s
0
s i i
0 0
s i i
2
s i
2
i
s i i
s

) . ( E

) . ( E

) ( E ) ( E
) , ( Cov
r



s
2
s s 0 s
0
s
s
r r r


Si s=0,
2
0

Luego, tambin podemos expresar E( ) ' :

1
1
1
1
1
1
]
1


1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1



2
1
2 1
2
2
2
1
2
2
2
1
2 2
0
0 1
2 1 0
) ' ( E
1
1 .
. .
1 r
. r r 1
. .
. .
r
. r r

. .
. .
.
) ' ( E

Esta es la forma genrica de la matriz. Para distintos casos de autocorrelacin tendremos
distintas matrices de E('). Para encontrar cada forma en particular debemos calcular los
i


EJEMPLO
Encontremos E(') para el caso ms comn de autocorrelacin que es
AUTOCORRELACION DE PRIMER ORDEN [AR(1)].

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

173
Esta ocurre cuando el residuo en un perodo es proporcional al residuo en el perodo
anterior ms un residuo bien comportado
i 1 i i
+


i 1 i i
+

donde ) I , 0 ( N ~
2
i

Calculo de
0
2 2
i 0
) ( E



.......
..... ) (
) (
3 i
3
2 i
2
1 i i
i 1 i 2 i
2
3 i
3
i 1 i 2 i 3 i
2
i 1 i 2 i
2
i 1 i 2 i i 1 i i



+ + +
+ + + + + +
+ + + + +
0 .......) E( ) ( E
3 i
3
2 i
2
1 i i i
+ + +


0 ) ( E
i
(i)
[ ]
[ ] + + + + +
+ + + + + +


( E
) )( ( E ) ( E
2 i 1 i
3
1 i i
2
2 i
4 2
1 i
2 2
i
2 i
2
1 i i 2 i
2
1 i i
2
i

) 1 ( 0 0
4 2 2 2 4 2 2 2
+ + + + + + + +


El segundo trmino es la suma de una progresin geomtrica .
2
1
1
. G . P . S

, por lo que
entonces,
2
2
2
i
1
) ( E



(ii)
Por definicin
2
0
2
i
) ( E

, por lo que (ii) implica:

2
2
2
0
1

(iii)
Calculo de
1
) , ( E
1 i i 1

pero como:
.....
3 i
3
2 i
2
1 i i i
+ + +
y .....
4 i
3
3 i
2
2 i 1 i 1 i
+ + +
[ ]
2
2
4 2 2
2 5 2 3 2 2
3 i
5 2
2 t
3 2
1 i 2 i i 1 i i
2
3 i
5 2
2 t
3 2
1 i 2 i i 1 i i 3 i
2
2 i 1 i 2 i
2
1 i i
1 i i 1
1

) 1 (
.. .. 0 0 .. ) ( E ) ( E ) ( E .. ) ( E ) ( E
..) .. ( E ..) ..)( ( E
) , ( E


+ + +
+ + + + + + + + + + +
+ + + + + + + + + + +


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

174
2
2
1
1






(iv)
Por induccin:
2 s
2
s 2
s
2
2
2
1
2
2
2
0

1



1



1


M

Entonces,


1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
]
1



2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
0
0 1
2 1 0
1
1
. .
. .
1
. 1

1



1
. .
. .

1 1
.
1 1 1
. .
. .
.
) ' ( E

Recordar:
s
2
2
s
2
s
s
r


Con autocorrelacin el supuesto E(') = I se cambia por E(') =
2
. En el caso AR(1),
toma la forma que acabamos de derivar.
En otros casos de autocorrelacin, se debe ver que forma toma .
1 t t t
t 2 t 2 1 t 1 t
) 1 ( MA
) 2 ( AR


+
+ +




Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

175
7.4 PROPIEDADES DE LA ESTIMACIN MICO BAJO
AUTOCORRELACIN
1. Estimando por MICO una regresin que presente autocorrelacin en el residuo,
obtendremos un estimador cercano a la verdadera lnea poblacional. Estimando en
repetidas muestras, el promedio del valor estimado estar sobre el verdadero valor, pero
la alta varianza de las distintas estimaciones llevar a que la varianza del estimador sea
mayor que la que obtendramos con errores no correlacionados.
Y ' X ) X ' X (

1
seguir siendo insesgado, pero la varianza estimada ser mayor
que la que podramos obtener si ponderamos las observaciones (si aplicamos MCG)

k n
e ' e

2

subestima la verdadera varianza


2
y esto hace que la varianza estimada
para una muestra

V (


2
)
[ ]
sea menor que la verdadera varianza. Por tanto, los test t
no son adecuados.
El R
2
est sobreestimado.
2. Si se estima por MICO, pero se corrige la varianza asumiendo autocorrelacin:
[ ] [ ] ) X ' X ( X ' X ) X ' X ( ) X ' X ( X ' ' X ) X ' X ( E )'

)(

( E )

( V
' X ) X ' X (

1 1 2 1 1
1


+
Si utilizamos esta varianza el estimador obtenido tampoco ser un estimador eficiente .
3. Mtodo Mnimos Cuadrados Generalizados (MCG)
Como vimos antes (heterocedasticidad), cuando no se cumple el supuesto clsico de
E()=I, el estimador eficiente es MCG.
Este mtodo consiste en realizar transformaciones a los datos de forma de conseguir
un error que sea bien comportado.

T ' T donde ) X ' X ( )

( V
Y ' X ) X ' X (

1 1 1 2
MCG
1 1 1
MCG





Para el caso AR(1), donde
t 1 t t
+



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

176

1
1
1
1
1
1
]
1



2
2
2
2
2
2
1
1
. .
. .
1
. 1

1
) ' ( E


1
) 1 ( 0
) 1 (
0 0 1

1
1
1
1
1
1
1
]
1

+
+

M O M M
L
L


7.5 CMO DETECTAR AUTOCORRELACIN?

Mtodo grfico:
el simple anlisis de los residuos obtenidos puede confirmar la presencia de errores mal
comportados.
Estadstico de Durbin-Watson (1951)
Consiste en el clculo del coeficiente

2
i
2
1 i i
e
) e e (
d
Este estadstico es calculado con los residuos de la regresin MICO y es usado para
testear autocorrelacin de primer orden.
El test es vlido bajo las siguientes condiciones:
1) En la regresin hay constante

0 e
i

2) La matriz X es no estocstica
3) Solo sirve para testear procesos AR(1).
4) No es vlido cuando la variable dependiente est rezagada.


Derivacin:

2
i
1 i i
2
1 i
2
i
2
i
2
1 i i
e
e e 2 e e

e
) e e (
d

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

177
como

2
1 i
2
i
e e
(*)

e
e e
1 2
e
e e

e
e
2
e
e e 2 e 2
d
2
i
1 i i
2
i
1 i i
2
i
2
i
2
i
1 i i
2
i

,
_

,
_



El trmino (*) corresponde a la estimacin de


en un proceso
AR(1). Esto porque en AR(1) r r
s
s

) 1 ( 2
e
e e
1 2 d
e
e e

) e e (
) e e )( e e (

) e ( VAR
) e , e cov(

2
i
1 i i
2
i
1 i i
2
i
1 i i
i
1 i i
0
1

,
_


Entonces,
) 1 ( 2
e
e e
1 2 d
2
i
1 i i

,
_




La hiptesis nula del test es que no existe autocorrelacin
H
0
) No hay autocorrelacin = 0 d = 2
H
1
) Hay autocorrelacin
El estadstico d no tiene una distribucin conocida. Por eso Durbin y Watson tabularon la
distribucin del test. Para cada valor de k y n (al 5% y al 1%) se obtienen dos valores
crticos: d
u
y d
L

que permiten establecer zonas en que se rechaza la hiptesis nula, zonas
en que se acepta y zonas de indecisin

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

178
2 4-d
U
d
U
d
L
4-d
L
Autocorrelacin positiva Autocorrelacin negativa
El criterio no decide El criterio no decide
No hay Autocorrelacin
Supongamos DW indica errores de autocorrelacionados que hacemos? Estimamos por
MCG? Depende, esto puede deberse a una variable omitida, a una forma funcional
incorrecta o a falta de dinmica en la especificacin. Solo si se ha verificado que el
error no se debe a ninguna de estas causas es necesario aplicar MCG.
Test H de Durbin
Sirve para testear autocorrelacin cuando la variable dependiente rezagada se incluye
entre las explicativas.

i 1 i i
k k r 1 1 r r i r 2 i 2 1 i 2 1 i
u donde
X X Y Y Y Y
+
+ + + + +

+ +

H
0
) = 0
H
1
) 0 solo es vlido para muestras grandes


)]

( [var n 1
n
h
2


n - tamao muestral

- estimacin de
2

var - varianza del coeficiente asociado a Y


t-1
.
Bajo la hiptesis nula h ~ N (0, 1), por lo que:
P [ -1,96 < h < 1,96 ] = 0,95
por lo que si h calculado (bajo alguna estimacin de ) es mayor en valor absoluto que
1,96 rechazo H
0
al 5%.
Caractersticas de la prueba:

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

179
1. No importa cuantas veces est rezagada Y
t
, solo necesito la varianza del coeficiente
asociado a Y
t-1
.
2. La prueba no es vlida si n
2

var > 1.
3. La prueba solo es vlida si la muestra es grande.
Test de Breusch - Godfrey (1978)
Este test permite verificar autocorrelacin de orden mayor que uno.
El modelo general al que se aplica al test es:
(*)
t k k r 1 1 r r t r 2 t 2 1 t 1 0 t
X X Y Y Y Y + + + + + + + +
+ +

donde r son los rezagos de la variable dependiente
La hiptesis nula es que no hay autocorrelacin
H
0
) ) I , 0 ( N ~
2
i

H
1
)
i
presenta errores mal comportados.
Pasos
i) Se realiza la regresin (*) por MICO y se extraen los residuos e
i
.
ii) Usando los residuos calculados en i) se realiza la siguiente regresin:
e
i
= f(e
i-1
, e
i-2
, ........, e
i-p
, Y
i-1
, Y
i-2
..........Y
i-r
, X
1
........ X
k
)
iii) El estimador (n-p)R
2
bajo la hiptesis nula se distribuye
2,p
, con lo que si
(n-p)R
2
>
2,p
() se rechaza la hiptesis nula. Donde n es el tamao de la
muestra de la regresin principal.

Ejemplo de utilizacin de los test en Eviews.
En E-Views podemos realizar fcilmente alguno de estos test. Para los datos del ejercicio
2.1.7 tenemos la siguiente salida:

LS // Dependent Variable is Y
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 3.600000 2.090177 1.722342 0.1233
X 0.750000 0.255738 2.932692 0.0189
R-squared 0.518092 Mean dependent var 9.600000
Adjusted R-squared 0.457854 S.D. dependent var 1.837873

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

180
S.E. of regression 1.353237 Akaike info criterion 0.781855
Sum squared resid 14.65000 Schwarz criterion 0.842372
Log likelihood -16.09866 F-statistic 8.600683
Durbin-Watson stat 2.346416 Prob(F-statistic) 0.018920
Corresponde al valor calculado del estadstico de DW. Este valor hay que
contrastarlo con los valores de d
U
y d
L
de la tabla

k=2 (k=1) n=10 d
U
=1.32 , d
L
=0.879
2 2.68 1.32 0.879
3.121
Autocorrelacin positiva Autocorrelacin negativa
El criterio no decide El criterio no decide
No hay Autocorrelacin
2.34
Por DW, no rechazo H0 (no rechazamos que sea cero).


Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.245626 Probability 0.789711
Obs*R-squared 0.756792 Probability 0.684959

Test Equation:
LS // Dependent Variable is RESID
Date: 11/24/98 Time: 13:02
Variable Coefficient Std. Error t-Statistic Prob.
C -0.572430 2.461777 -0.232527 0.8239
X 0.076530 0.304399 0.251415 0.8099
RESID(-1) -0.301095 0.448296 -0.671642 0.5268
RESID(-2) -0.148734 0.428825 -0.346841 0.7406
R-squared 0.075679 Mean dependent var -4.22E-16
Adjusted R-squared -0.386481 S.D. dependent var 1.275844
S.E. of regression 1.502293 Akaike info criterion 1.103159
Sum squared resid 13.54130 Schwarz criterion 1.224193
Log likelihood -15.70518 F-statistic 0.163751
Durbin-Watson stat 2.006501 Prob(F-statistic) 0.916964

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

181
p=2, n=10
El estimador nR
2
bajo la hiptesis nula se distribuye
2,p
, con lo que si
nR
2
>
2,p
() se rechaza la hiptesis nula.
) 05 . 0 (
2
2
=5.9
nR
2
=0.75
Por tanto no se rechaza la hiptesis nula (podamos intuir este resultado por la falta de
significancia de los coeficientes asociados a los residuos).


7.6 FORMAS DE CORREGIR POR AUTOCORRELACION

7.6.1 Conozco la forma de la autocorrelacin y conozco

7.6.1.1 AR(1)
Sabemos que
t 1 i i
+

y supongamos que conocemos .

1
1
1
1
1
1
]
1



2
2
2
2
2
2
1
1
. .
. .
1
. 1

1
) ' ( E

1
) 1 ( 0
) 1 (
0 0 1

1
1
1
1
1
1
1
]
1

+
+

M O M M
L
L

Sabemos que la regresin debe ser con los datos transformados, de forma que el residuo sea
bien comportado

v X T T X T TY
X Y
t 1 t t
+ +
+ +



Para que v sea bien comportado, se debe cumplir que T'T =
-1

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

182
Entonces, T debe ser igual a:


1
1
1
1
1
1
]
1

1 0 0
0
0 0 1 0
0 0 1
0 0 1
T
2
L
O O M M
L
L L


por tanto

1
1
1
1
1
1
1
1
1
]
1

Y Y




Y Y
Y Y
Y 1
TY
1 n n
2 3
1 2
1
2

1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
]
1








1








1
T
n
3
2
2
1 n n
2 3
1 2
1
2


1
1
1
1
1
1
1
1
1
1
1
]
1

k , 1 n nk 2 , 1 n 2 n
k 1 k 2 12 22
k 1
2
12
2 2
X X X X 1




X X X X 1
X 1 X 1 1
TX
Observacin:
Si partimos de:
(1)
i ik k 2 i 2 1 i
X X Y + + + +
donde
i
=
i-1
+
i
Entonces, para el rezago de (1) se cumple
(2)
1 i k , 1 i k 2 , 1 i 2 1 1 i
X X Y

+ + + +

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

183
multiplicando (2) por ,
(3)
1 i k , 1 i k 2 , 1 i 2 1 1 i
X X Y

+ + + +
Restando (1) - (3), tenemos:
(4)
i
1 i i k , 1 i ik k 2 , 1 i 2 i 2 1 1 i i


) X X ( ) X X ( ) 1 ( Y Y

+ + + +


Correr la regresin (4), es muy parecido a aplicar el procedimiento anterior, con la
diferencia de la primera observacin.
Este ltimo mtodo es ms utilizado, pero menos eficiente para corregir autocorrelacin.

7.6.1.2 AR(2)

i 2 i 2 1 i 1 i
+ +


Una alternativa es definir ,

-1
, T y multiplicar TY = T X + T.
Otra forma es proceder como sigue,
(5)
i ik k 2 i 2 1 i
X X Y + + + +
Rezago (5)
(6)
1 i k , 1 i k 2 , 1 i 2 1 1 i
X X Y

+ + + +
Rezago (6)
(7)
2 i k , 2 i k 2 , 1 i 2 1 2 i
X X Y

+ + + +
Multiplico (6) por
1
y (7) por
2

(8)
1 i 1 k , 1 i 1 k 2 , 1 i 1 2 1 1 1 i 1
X X Y

+ + + +
(9)
2 i 2 k , 2 i 2 k 2 , 2 i 2 2 2 1 2 i 2
X X Y

+ + + +
Resto (5) - (8) - (9) nos queda,
(10)
2 i 2 1 i 1 i k , 2 i 2 k , 1 i 1 ik k
2 , 2 i 2 2 , 1 i 1 2 i 2 2 1 1 2 i 2 1 i 1 i
) X X X (
) X X X ( ) 1 ( Y Y Y


+ + +
+ +
L
donde el ltimo trmino es
i


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

184
Correr la regresin (10) dar un resultado aproximadamente igual.

Es decir que si conocemos la forma de la autocorrelacin y los , es fcil aplicar MCG y
obtener los parmetros, pero generalmente no conocemos , entonces primero hay que
estimarlo y luego aplicar los mtodos anteriores para calcular MCG.

7.6.2 . No conocemos .
Hay mtodos para calcularlos
7.6.2.1 Mtodo de posiciones extremas
Como no conocemos , podramos partir de alguno de los dos casos extremos. Esto es
suponer que = 1 o = - 1.
Si =1 la ecuacin (4) nos queda,
) X X ( ) X X ( Y Y
i k , 1 i ik k 1 i 2 i 2 1 i i
+ + +


X X Y
i ik k 2 i 2 i
+ + +
Es decir que hay que estimar con los datos expresados en primeras diferencias
Si =-1 la ecuacin (4) nos queda,

i
3 , 1 i 3 i
3
2 , 1 i 2 i
2 1
1 i i
i 3 , 1 i 3 i 3 2 , 1 i 2 i 2 1 1 i i

2
X X

2
X X

2
Y Y
) X X ( ) X X ( 2 Y Y
+ +

,
_

+
+

,
_

+
+
+
+ + + + + + +



Es decir que hay que estimar con los datos expresados en promedios.

El problema de este mtodo, es que si 1 o -1 el remedio puede ser peor que la
enfermedad.
7.6.2.2 Mtodo basado en estadstico d de Durbin y Watson

d 2 (1

)



1 d \ 2 esto solo es vlido si n es grande



Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

185
7.6.2.3 Procedimiento iterativo de Cochrane - Orcutt
i. Se estima el modelo por MICO y se obtienen los residuos e
i

ii. Estimamos por MICO la siguiente regresin:
v e e
t 1 i i
+



iii. con estimado, corregir los datos y correr la ecuacin (4)
1 i i k , 1 i ik k 1 i 2 i 2 1 1 i i
u u ) x x ( ) x x ( ) 1 ( Y Y

+ + + +
iv. como no sabemos si
es buena estimacin de , volvemos a la regresin
original utilizando los coeficientes estimados en la iii etapa y obtenemos
e
i
*
.
v.
t
*
1 i
*
i
w e

e +


con esta estimacin de

, se vuelve a repetir desde la etapa iii.
El mtodo es iterativo y se para cuando en dos corridas sucesivas los
estimados difieren poco.
7.6.2.4 Mtodo de Durbin
La ecuacin (4) se puede escribir como:

t 1 t 1 t 2 t 2 2 1 t
Y X X ) 1 ( Y + + + +


i) Partir de esta ecuacin regresando Y
t
en X
t
, X
t-1
, ..., Y
t
y utilizar el valor
estimado del coeficiente de Y
t-1
como estimacin de (el estimador es
segado, pero consistente).
ii) Luego de tener
, transformar los datos y correr la regresin (4).
7.6.2.5 Mtodo de la malla - Hildreth y Lu.
Se define un conjunto de valores posibles de (entre -1 y 1), donde los
intervalos entre los distintos valores de son de 0,1.
Para cada
se corre la ecuacin (4) y se computa la
e
i
2

. Se elige el valor de

que minimice la suma de cuadrados residuales (maximice R
2
).

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

186
8 8. . E ES SP PE EC CI IF FI IC CA AC CI IO ON N D DE E M MO OD DE EL LO OS S
8.1 ATRIBUTOS DE UN BUEN MODELO

Un modelo que est bien especificado tiene los siguientes atributos:
Parsimonia: esto implica que hay que maximizar la explicacin del fenmeno,
maximizando la simplificacin.
Identificabilidad: dadas las observaciones los coeficientes estimados deben ser nicos.
Bondad del Ajuste: R
2
alto, coeficientes correctos, etc.
Cuidado con Data Mining: Uso indiscriminado de variables con la nica finalidad de
aumentar el R
2
.
Ames y Reiter (1961) en promedio el R
2
de una regresin entre una variable
econmica y su rezago es 0,7.
Plausibilidad Terica : Coeficientes con signos correctos, etc. Implica consistencia
con el modelo terico planteado.
Poder Predictivo: el R
2
es un indicador del ajuste dentro de muestra.
Importa predecir fuera de muestra dentro y fuera del perodo.
Estabilidad de la Ecuacin Estimada: inexistencia de cambio estructural (test de
Chow, CUSUM y CUSUM cuadrado)

8.2 TIPO DE ERRORES DE ESPECIFICACIN
Omitir una variable relevante (variables omitidas)
Inclusin de variables irrelevantes (variables intrusas)
Forma funcional incorrecta
Errores de medicin.

8.3 CONSECUENCIAS DE LOS ERRORES DE ESPECIFICACIN.
8.3.1 Variables Omitidas
8.3.1.1. Introduccin
Supongamos que por alguna razn no es posible estimar el verdadero modelo y se
estima uno alternativo:
(**) v X Y X sin Estimacin estimado Modelo
(*) X X Y Modelo Verdadero
i i 2 2 1 i 3
i i 3 3 i 2 2 1 i
+ +
+ + +


Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

187
Expresando (*) y (**) en desvos:

) v v ( x y
) ( x x y
i i i 2 2 i
i i 3 3 i 2 2 i
+
+ +

Al estimar
2

de la segunda ecuacin:

+
+
+ +

+ +

2
i 2
i 2 i i 3 i 2 3
2
2
i 2
i i 2 i 3 i 2 3
2
i 2 2
2
i 2
i i 3 3 i 2 2 i 2
2
i 2
i i 2
2
x
x ) ( x x

x
) ( x x x x

x
) x x ( x

x
y x

+
2
i 2
i 2 i 3 3
2 2
x
x x
)

( E
Entonces se dan los siguientes casos:
Si x
3
y x
2
fueran ortogonales nto Insesgamie 0 x x
i 2 i 3


En los dems casos hay sesgo y este es una funcin de la relacin o covarianza
entre variable omitida y la incluida.
Ejemplo: Estimamos la demanda por algn bien y se omite el precio de un sustituto.

+
2
2
3 2
3 2 2
x
x x
)

( E
donde
2
= coeficiente del precio "del bien" esperamos signo negativo

3
= coeficiente del precio del sustituto esperamos signo positivo
) Causalidad No (
. iables var entre asociacin de do gra cierto existe porque , 0
x
x x
2
2
3 2
>


Luego, al estimar sin el precio del sustituto, el coeficiente estimado queda
sesgado y el sesgo es positivo.
8.3.1.2. Consecuencias
Si X
3
esta correlacionada con X
2
ambos estimadores son sesgados
inconsistentes (es decir que el sesgo no desaparece para muestras grandes)
Si X
2
y X
3
no estn correlacionados el estimador de la pendiente es
insesgado, pero el del intercepto sesgado.

2


est mal estimado si omito variables

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

188
Sesgo
) r k ( N
e ' e
E
2
>
1
]
1




Esto porque ee es mayor , mientras el efecto sobre el denominador es
marginal.
Como consecuencia del punto anterior la varianza de los estimadores es sesgada

estimada mal

) X ' X ( )

( V
1 2



Intervalos de confianza y pruebas de hiptesis incorrectas conclusiones
erradas.
8.3.1.3. Test para detectar Variables Omitidas
Bondad de ajuste y plausibilidad terica
R
2
, t , signos de los coeficientes

Examen de los residuos: pueden presentar cierto patrn determinstico.

Prueba d de Durbin-Watson.
Si existe correlacin positiva en los errores significa que estos no son aleatorios y
que pueden estar asociados a alguna variable no incluida en el modelo.

Otra forma de Usarlo:
- Se corre el modelo original.
- Se obtienen los residuos.
- Si se piensa que se excluye una variable explicativa relevante,
ordenar los residuos segn el orden ascendente de dicha variable.
- Se calcula

2
i
2
1 i i
e
) e e (
d
- Se compara el d con el d de tabla (con los grados de libertad
originales).
Prueba Breusch-Godfrey
Prueba Reset de Ramsey
- Se corre la regresin original se obtienen los Y

i
se extrae el

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

189
R
2
.
- Se vuelve a correr la regresin, introduciendo como variables
explicativas formas funcionales de
[ ]
2
*
3
i
2
i i
R obtiene se . etc , Y

, Y

ejemplo por Y

.
- H
0
) Modelo Bien Especificado.
H
1
) Modelo Mal Especificado.
-
Nuevo Modelo Variables Nmero n / ) R 1 (
s Adicionale Variables de Nmero / ) R R (
F
2
*
2 2
*


- Si F> F
tabla
, rechazo H
0
, por tanto rechazo que que modelo est bien
especificado.

8.3.2 Inclusin de una Variable Irrelevante (Variables Intrusas)
Supongamos que
i i 2 2 1 i
X Y + + sea el Modelo Verdadero pero se corre,
i i 3 3 i 2 2 1 i
v X X Y + + + , donde X
3i
es una variable intrusa.

Consecuencias
i ) Estimadores insesgados y consistentes
ii)
2


se computa correctamente

) s k ( n
e ' e
E
2

,
_

+
esto porque la cada en ee no es muy grande, porque la
variable
donde s es el N
KO
de Variables Intrusas.
Hay que distinguir "computar" de la estimacin que se encuentra.
Se "computa" correctamente porque el estimador que se usa
e' e
N K


_
,
sigue siendo
un estimador insesgado.
Puede haber, sin embargo, un error de estimacin (pequeo) por agregar una
variable que no deba ir.
iii) Intervalos y pruebas de hiptesis son vlidos.
iv) Pero la varianza estimada para los parmetros son ms grandes que las del modelo
original.

Econometra E-250: Apuntes de Clase Profesores Vernica Gil y Aldo Lema Agosto 2004

190
v(


2
)

2
x
2i
2

(Modelo original)
v(


2
)

2
x
2i
2
(1
2,3
2
)
(Modelo estimado)


V(


2
)
V(


2
)

1
1 2,3
2

Como 0 r
2, 3
2
1
v(


2
)
v(


2
)
> 1

Cuidado: De este anlisis no se concluye que la introduccin de variables
irrelevantes sea poco costosa.

Conclusin para Especificar Modelos
Conviene siempre comenzar por un modelo general (que incluya todas las posibles
variables) e ir eliminando variables segn los tests t.
Ello por cuanto la inclusin de variables irrelevantes no sesga la estimacin de ?
2
.
Econometra Inglesa: Se parte de un modelo general y se eliminan variables.
Econometra estadounidense: se parte de un modelo particular y se agregan variables.