Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APUNTES DE
INTRODUCCION A LOS
MODELOS
ECONOMETRICOS
[Escribir el subttulo del documento]
NARCISO GUARAMATO PARRA
2009
INTRODUCCION
El presente trabajo tiene como objetivo principal, ayudar a todas aquellas
personas con conocimientos limitados de Estadstica y Economa, especialmente a los
alumnos involucrados en esta ctedra. Aportndoles una herramienta que les
proporcione un conocimiento bsico de la Econometra.
A lo largo de mi experiencia docente en la Escuela Nacional de Administracin y
Hacienda Pblica I.U.T, y en la Universidad Santa Mara, he observado con
preocupacin lo difcil y problemtico que le resulta al estudiantado, el inicio del
estudio de la Econometra.
Entre los factores que explican esta situacin, destacan la deficiencia que traen
algunos alumnos en materias imprescindibles para el estudio del tema, como son la
Estadstica y la Economa. La Econometra involucra todo un bagaje de nuevo
vocabulario que dificulta en una primera etapa su entendimiento.
Se ha utilizado la claridad de algunos autores para tratar algunos temas
especficos y mi experiencia enseando la materia, para lograr un texto donde se
combinen los fundamentos tericos bsicos de la Econometra con unos ejemplos
prcticos, que permitan ver en una forma sencilla sus aplicaciones, usando en varios
de ellos el Software economtrico Eviews
En referencia al contenido del texto, inicialmente, en el captulo I, se hace
referencia a los conceptos bsicos que se deben manejar en la Econometra. En los
captulos II, III, IV y V se tratan los fundamentos de la regresin mnimo cuadrtica. En
los captulos VI, VII y VIII se tocan las diferentes violaciones a los supuestos del
modelo mnimo cuadrtico Y finalmente en los captulos IX y X se hacen referencia a
algunos temas complementarios.
Es importante sealar que este trabajo, de ninguna manera constituye un
tratado de la materia, debido a que en el mercado existen muchos de una excelente
calidad. Lo que se ha tratado es de que sin abandonar la formalidad en el tratamiento
de los temas, el estudiante pueda tener en sus manos un texto didctico que le
permita iniciar con xito el estudio de los modelos economtricos
Finalmente, quiero agradecerle a la Escuela Nacional de Administracin y
Hacienda Pblica I.U.T. por haberme invitado como profesor de la materia durante los
aos 2000 y 2001, y a la Universidad Santa Mara, donde dicto actualmente
Econometra I y II, y en especial a todos mis alumnos por que me permitieron ordenar
mis apuntes, fuente de este trabajo.
CONTENIDO
I ECONOMETRIA
1.
2.
3.
4.
5.
6.
Definicin de econometra
Evolucin histrica de la econometra.
Modelos
Modelos Economtricos
Tipos de modelos Economtricos
Formas Funcionales.
5. TIPOS DE MODELOS
5.1 Segn el nmero de variables:
a) Modelo de regresin simple: este modelo contiene solamente dos variables,
una variable dependiente y una sola variable explicativa.
Yt X t ut
b) Modelo de regresin mltiple: contiene ms de una variable explicativa.
Yt 0 1 X 1t 2 X 2t 3 X 3t ut
5.2 Segn el nmero de ecuaciones:
a) Modelos uniecuacionales: son los modelos que contienen una sola ecuacin
Qi Pi ui
b) Modelos de ecuaciones simultneas: contienen ms de una ecuacin.
PIBt INVt ut
INVt TI t t
5.3 Atendiendo a la forma de las relaciones, los modelos pueden clasificarse en;
a) Modelos lineales. Cuando e habla de modelos lineales, hacemos referencia a
dos sentidos de linealidad: en las variables o en los parmetros. En la prctica, la
linealidad de los parmetros es la ms importante, especialmente al momento de
a aplicacin de los mtodos de estimacin de los mismos. La linealidad de las
variables generalmente se consigue facilmente aplicando alguna transformacin
al modelo.
b) Modelos no lineales.
15
Y i Xi U i
u Y Y
es igual al valor
16
Tambin es conocido con las siglas de ELIO (Estimador Linealmente Insesgado Optimo). O con sus
siglas en ingles BLUE (Best Linear Umblased Estimator)
23
4. TEOREMA DE GAUSS-MARKOV
Dados los supuestos del modelo clsico de regresin lineal, los
estimadores de mnimos cuadrados, dentro de la clase de estimadores lineales
insesgados, tienen varianza mnima, es decir son MELI.
24
Y N X 0
^
Y N X
^
N X
N
N
N
Y X
Y X
u 2 (Y X ) 2
u 2
^
2 (Y X )( X )) 0
^
(2) (Y X )( X ) 0
`^
(Y X )( X ) 0
^
(YX X X
^
)0
YX X X
^
YX X X
0
2
YX (Y X ) X X
YX Y X X X X
YX Y N X X N X X
26
El perodo en que se desarrolla esta ltima etapa, esta condicionada por el aumento
de los precios energticos y la consiguiente crisis econmica que sufrieron la mayora
de los pases desarrollados que, por primera vez, vieron aumentar al unsono sus
niveles de paro e inflacin sin que la teora econmica disponible fuera capaz de de
ofrecer una explicacin adecuada al respecto.
En lo estrictamente economtrico, los distintos modelos elaborados hasta la fecha
comenzaron a fallar sistemticamente en sus predicciones, y se puso en duda lo que
hasta el momento haba sido el baluarte que sustentaba todos los desarrollos
aplicados, y que era su capacidad predictiva.
Partiendo de esta aparente inutilidad de los desarrollos economtricos para adaptarse
y anticiparse al nuevo orden econmico mundial, surgir un nuevo incentivo para los
econmetras que ha marcado todos los desarrollos posteriores de la disciplina y que
podemos asimilar como la caracterstica diferenciadora de esta etapa.
Para solventar los problemas antes sealados se desarrollaron aplicaciones cuya
justificacin ltima es la obtencin de buenos resultados empricos en cualquiera de
las funciones esenciales de los trabajos economtricos (explicacin de relaciones
econmicas, prediccin o simulacin de escenarios alternativos); es decir, la economa
toma un cariz estrictamente funcional y las distintas alternativas metodolgicas y
aplicaciones prcticas se empiezan a juzgar por su capacidad explicativa o predictiva.
En este contexto empieza a surgir mltiples fuentes de crtica a la modelizacin
tradicional , representada por los grandes modelos macroeconomtricos de
ecuaciones simultaneas, y que sirvieron como incentivo para el desarrollo de nuevos
contrastes, especificaciones alternativas y nuevas tcnicas para abordar el anlisis
econmico aplicado. Esta diversidad de planteamientos constituye el segundo de los
factores diferenciadores que delimitan esta ltima etapa de la historia economtrica.
Por ltimo, los inicios del siglo XXI, el instrumental terico sobre anlisis economtrico
ha sido fortalecido por un desarrollo exponencial de la tecnologas informticas, las
cuales han aportado poderosas herramientas computacionales que han permitido el
uso de sistemas de resolucin muy complejos en perodos muy cortos, Asimismo, los
lenguajes de programacin amigables han facilitado a los investigadores la posibilidad
de generar sus propias herramientas de cmputo, lo que ha diversificado
enormemente las posibilidades de aplicacin terica.
Etapa 5
EVOLUCION HISTORICA
DE LA ECONOMETRIA
Box-Jenkis
Time Series Analysis
Etapa 4
Monografa N 10
Etapa 3
Econometric Society
Revista Economtrica
Cowles Commision
Etapa 2
H.Moore
Economic Cycles:
their Law and Causes
Etapa 1
1914
1930
1959
1970
3. MODELOS.
Un Modelo es una representacin simplificada de la realidad, en el cual se
sealan los aspectos principales o fundamentales para su anlisis.
En forma particular un modelo econmico se define como una expresin lgica,
verbal, grfica o matemtica de las relaciones entre variables econmicas. 9
Los modelos econmicos se pueden clasificar en:
a) Cuantitativos:
i) Opinin de expertos.
ii) Encuestas
b) Causales.
i) Economtricos.
ii) Vectores Autorregresivos (VAR).
c) Series de Tiempo.
i) Box Jenkis (ARIMA).
ii) Funcin de transferencia.
Un modelo econmico-matemtico es un conjunto de relaciones que
representan un proceso econmico, expresadas en forma matemtica. 10
Lpez Casuso, Rafael. Clculo de Probabilidades e Inferencia Estadstica. 3ra. Edic. Universidad
Catlica Andrs Bello. Caracas.2000.p.483.
10
Lpez Casuso, Rafael. Ob.cit. p484.
10
Y = mX+b
m
4. MODELOS ECONOMETRICOS.
El modelo bsico o llamado tambin Modelo Clsico, es muy parecido al
modelo de la lnea recta:
Y X
Donde:
Coeficiente intercepto 11.
Coeficiente pendiente,
11
Es de uso generalizado en econometra. El uso de letras griegas para sealar los coeficientes
(constantes), por ejemplo: alfa ; beta , gamma ; delta ; psilon ; theta
lamda ; pi ; ro ; sigma
etc.
11
(3.1)
(3.2)
12
Daz Fernndez, Montserrat y Mara del Mar Llorente Marrn. Econometra. Ediciones Pirmide.
Madrid.1998. p.27
12
dY X
dX Y
La
inelstica
elasticidad
es
La elasticidad es unitaria
La
elstica
elasticidad
es
dY X 1
x
dX Y1
dY X
x
dX Y
Y la promedio:
46
dY
, por lo tanto las
dX
Puntual E
a)
Xi
Yi
300
0,862
177,154
Y
111
E 0,509
0,332
X
170
3. MODELO LOGARITMICO
Yi 0 X i1 e ui
Este modelo es conocido como el modelo de regresin exponencial, el cual
presenta la dificultad de no ser lineal en los parmetros ( 1 , es de por s un
exponente), por lo tanto no le es posible aplicar el mtodo de los mnimos cuadrados
ordinarios. Para poder hacerlo, tenemos que transformar la ecuacin en una lineal, lo
cual haremos aplicando logaritmos.
ln Yi ln 0 X i1 e ui
ln Yi ln 0 ln X i1 ln e ui
47
5. TIPOS DE MODELOS
5.1 Segn el nmero de variables:
a) Modelo de regresin simple: este modelo contiene solamente dos variables,
una variable dependiente y una sola variable explicativa.
Yt X t ut
b) Modelo de regresin mltiple: contiene ms de una variable explicativa.
Yt 0 1 X 1t 2 X 2t 3 X 3t ut
5.2 Segn el nmero de ecuaciones:
a) Modelos uniecuacionales: son los modelos que contienen una sola ecuacin
Qi Pi ui
b) Modelos de ecuaciones simultneas: contienen ms de una ecuacin.
PIBt INVt ut
INVt TI t t
5.3 Atendiendo a la forma de las relaciones, los modelos pueden clasificarse en;
a) Modelos lineales. Cuando e habla de modelos lineales, hacemos referencia a
dos sentidos de linealidad: en las variables o en los parmetros. En la prctica, la
linealidad de los parmetros es la ms importante, especialmente al momento de
a aplicacin de los mtodos de estimacin de los mismos. La linealidad de las
variables generalmente se consigue facilmente aplicando alguna transformacin
al modelo.
b) Modelos no lineales.
15
6. FORMAS FUNCIONALES
A continuacin se muestra un cuadro con los principales tipos de modelos con
que generalmente se trabaja en la prctica as como sus representaciones grficas.
Modelo
Ecuacin
Lineal
Y X u
Pendiente
dY
dX
|
LnY LnX u
X
LnY X u
Log-Lin
Y
Y LnX u
Lin-Log
1
x
Recproco
1
1
Y u
2
X
X
Fuente: Damodar Gujarati, Econometra, Mc Graw Hill.
Log-Lin
O Log-Log
16
Elasticidad
dY X
.
dX Y
X
Y
X
1
Y
1
XY
2
Y X X U
Y X U
2
Y X X U
Y X U
X
Y LnX U
Y
LnY LnX u
Y LnX U
LnY LnX u
1
U
X
LnY X U
1
U
X
X
LnY X U
X
17
CAPITULO II
MODELO DE REGRESION LINEAL UNIECUACIONAL (MODELO CLASICO)
1. SUPUESTOS.
1.1.
Y X u
Como se indica en el supuesto los parmetros son los que deben ser lineales
(elevados a la uno) sin importar que forma tomen la variable dependiente y la variable
explicativa
S
No
No
MRL
MRLN
MRL
MRLN
Y e X u
(b)
(c)
ln Y
(d)
1.2.
1
1 e X u
1
u
X
Y 2X u
LOS VALORES DE X SON FIJOS EN MUESTREO REPETIDO.
Los valores que toma la variable explicativa (X) son considerados fijos en muestreo
repetido. Ms tcnicamente, se supone no estocsticos.
Cuando estamos analizando un evento econmico lo deseable es que se tengan
diferentes muestras, para poder as observar el comportamiento promedio de los
18
parmetros. Este supuesto nos indica que para todas las muestras analizadas, los
valores que tome(n) la(s) variable(s) explicativa(s), deben ser los mismas para todas
las muestras.
1.3.
1.4.
E u i2 / X i por el supuesto 3
2
Donde var significa varianza 15. Como se observa 2 no posee ningun subndice
con lo cual la varianza se considera una constante.
14
La esperanza matemtica (tambin llamada valor esperado) de una variable aleatoria X cuyos valores posibles
x x1 , x2 ,..., xn
f x , se escribe como E X
y se define como
E X x1 f x1 x2 f x2 ... xn f xn
En la ecuacin anterior se observa que el valor esperado de X se define como un promedio ponderado de
sus posibles valores, en donde las ponderaciones son las probabilidades que se le asocian.
Al valor esperado de una variable aleatoria a menudo se le denomina como promedio o valor promedio y se
denota por la letra . Por ejemplo, E Z Z y E X X . El promedio de una variable es una medida de
su tendencia central; si el experimento se realiza un gran nmero de veces, el promedio es el valor que podemos
esperar que sea la media aritmtica de la variable sobre todos los experimentos.
Algunas propiedades de la esperanza matemtica son las siguientes propiedades:
a) El valor esperado de una constante es igual a la constante
KX KE X
c) E X 1 X 2 X 3 E X 1 E X 2 E X 3
E K K
b) E
15
En el anlisis de una serie de datos no podemos conformarnos con el simple conocimiento de los promedios,
sino que es necesario determinar como varan o se dispersan el resto de los valores de la serie con relacin al
promedio elegido o seleccionado.
Es decir, un promedio es un valor representativo de un conjunto de datos, pero necesitamos conocer cmo
se alejan o se acercan del mismo, la totalidad de los datos de una serie a fin de considerar la mayor o menor
representatividad del promedio seleccionado.
19
A mayor valor de una medida de variacin o de dispersin menos concentrados estarn los datos de una
serie con relacin al promedio de la misma y por tanto menor representatividad tendr el promedio de la
distribucin.
A menor valor de una medida de variacin o dispersin mas concentrados estarn los datos alrededor del
promedio, siendo ste por tanto ms representativo.
Lo ideal o utpico sera que al calcular una medida de variacin sta nos resulte igual a cero, lo cual nos
indicara que no existe alguna dispersin entre los datos y su promedio, siendo por tanto todos los valores de la
serie iguales y alcanzando el promedio de la misma una representatividad ptima.15
Entre las principales medidas de dispersin tenemos a la Desviacin Tpica o Error Estndar
Varianza
y la
La desviacin Tpica se define como la raz cuadrada positiva del promedio aritmtico de los cuadrados de
los desvos con respecto a la media aritmtica.
2
Sean
X 1 , X 2 , X 3 ,... X N
X 1 X , X 2 X ,..., X N X
X 1 X X 2 X X 3 X ... X N X
X
X
i
N
2
i
donde
d X X
Xi X
2
N
x2 E X E X 2
20
d
N
2
i
son
b)
79
1.7.
covX i X j 0
donde i j
1.9.
No todos los valores de X en una muestra dada deben ser iguales, Tcnicamente,
var(X), debe ser un nmero positivo finito.
Y i X i u i
22
Y i Xi U i
u Y Y
es igual al valor
16
Tambin es conocido con las siglas de ELIO (Estimador Linealmente Insesgado Optimo). O con sus
siglas en ingles BLUE (Best Linear Umblased Estimator)
23
4. TEOREMA DE GAUSS-MARKOV
Dados los supuestos del modelo clsico de regresin lineal, los
estimadores de mnimos cuadrados, dentro de la clase de estimadores lineales
insesgados, tienen varianza mnima, es decir son MELI.
24
Lo que este teorema nos indica es que siempre y cuando se cumplan los
supuestos del modelo clsico (no autocorrelacin, no multicolinealidad,
homocedasticidad, etc,), los parmetros estimados mediante el mtodo de los mnimos
cuadrados ordinarios, sern los mejores estimadores linealmente insesgados (MELI),
lo que nos permite a partir de un Modelo de Regresin Muestral realizar conclusiones
vlidas sobre una posible relacin de causalidad a nivel poblacional.
Y X u
^
u Y X
u 2 (Y X ) 2
^
u 2 (Y X ) 2
b) Ahora tenemos una funcin con dos incgnitas. A continuacin realizaremos
las derivadas parciales de la funcin con respecto a los dos coeficientes, e
igualaremos a cero ambas derivadas.
u 2
^
2 (Y X )(1) 0
(2) (Y X ) 0
^
(Y X ) 0
25
Y N X 0
^
Y N X
^
N X
N
N
N
Y X
Y X
u 2 (Y X ) 2
u 2
^
2 (Y X )( X )) 0
^
(2) (Y X )( X ) 0
`^
(Y X )( X ) 0
^
(YX X X
^
)0
YX X X
^
YX X X
0
2
YX (Y X ) X X
YX Y X X X X
YX Y N X X N X X
26
YX N Y X N X
X2
^
2
2
YX
N
Y
X
X
N
X
YX N Y X
X N X
^
yx
x
2
donde y Yi Y y x X i X
EJERCICO N 1
X
50
25
75
125
100
375
Yi X i u i (FRP)
27
0,8541 1
0,2607 2
0,9823
Y
'
X
X
'
X
Y
'
X
54,4587
298,7202
243,4130
LnQ t
Ln Qt
4,3820
4,5539
4,6052
4,7875
5,0106
5,1059
5,1930
5,1648
5,1358
5,2470
5,2730
4,3703
4,4766
4,8795
4,8280
5,0161
5,0373
5,0640
5,0895
5,1525
5,2505
5,2942
0,0117
0,0772
-0,2744
-0,0405
-0,0055
0,0687
0,1289
0,0753
-0,0167
-0,0035
-0,0212
u 'u 0,1108
R2 1
Y 'Y 270,5988
Y
n
4,9508
0,1108
0,8875
2
270,5988 114,9508
0,1108
0,0139
11 3
0,9923
0,2213
ee( ) Var
0,1713
101
Y($) X($)
70
80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260
Yi X i u i (FRP)
0
^
Yi X i u i (FRM)
Y($) X($)
YX
70
80
5.600
65
100
6.500
90
120 10.800
95
140 13.300
110
160 17.600
115
180 20.700
120
200 24.000
140
220 30.800
155
240 37.200
150
260 39.000
1.110 1.700 205.500
1110
Y
111
10
X2
6.400
10.000
14.400
19.600
25.600
32.400
40.000
48.400
57.600
67.600
322.000
1700
X
170
10
205500 (10)(111)(170)
0,5091
322000 (10)(170) 2
Yi 24,4545 0,5091X i
29
6. COEFICIENTE DE DETERMINACION R 2
El coeficiente de determinacin nos indica el porcentaje de variaciones de la
variable dependiente que son explicados por el modelo. A medida que el porcentaje es
mayor, nos indica en que medida el modelo se ajusta a los datos, motivo por el cual a
este estadstico tambin se le conoce con el nombre de BONDAD DE AJUSTE.
Sea:
STC = suma total de cuadrados =
Y Y
Yi
u
2
2
i
Entonces.
STC = SEC+ SCR
U i = Debido al residuo
Yi
FRM
Y total
X i
Yi
Y i Y Debido a la regresin
R2
STC
STC
STC
30
u i 0 , por lo que SEC = 0. En este caso SCR = STC y por lo tanto r 2 =1. Puesto que,
YI sera una perfecta combinacin lineal de. Por lo tanto todos los puntos del diagrama
de dispersin entre YI y X i debern caer sobre la lnea.
En el otro extremo, si la ecuacin de regresin no explica nada, SEC asume su
valor mximo; es decir SEC = STC. Notemos que SCR = 0 y por lo tanto r 2 = 0. Por tal
motivo, debido a que SCR = 0, debemos tener que Yi Yi para todo i. Esto implica
que.
En los casos ms tradicionales, la ecuacin de regresin responde para algunos
de los valores de, pero no para todos; el valor de r 2 cae entre cero y la unidad.
Mientras mayor sea la explicacin de la ecuacin a variaciones de YI (por ejemplo
mientras los puntos caigan ms cerca de la lnea de regresin), ms se acercar r 2 a
la unidad, y conforme se debilite la relacin entre YI y, el valor de r 2 se acercar a
cero. Por lo tanto, r 2 indica la fraccin de la variable dependiente a la que puede
responder la ecuacin estimada; por ejemplo, si r 2 = 0,63 decimos que la relacin
estimada puede explicar el 63 por ciento de las variaciones de la variable dependiente.
La frmula general para el coeficiente de determinacin en regresin simple es:
yx
covYi X i 2
varYi var X i y 2 x 2
2
R 2
yx yx
x y
2
yx YX NYX
y
Y NY
2
31
r 2 0,509
Y($)
X($)
XY
70
65
90
95
110
115
120
140
155
150
1.110
80
100
120
140
160
180
200
220
240
260
1.700
5.600
6.500
10.800
13.300
17.600
20.700
24.000
30.800
37.200
39.000
205.500
6.400
10.000
14.400
19.600
25.600
32.400
40.000
48.400
57.600
67.600
322.000
4.900
4.225
8.100
9.025
12.100
13.225
14.400
19.600
24.025
22.500
132.100
205500 10(111)(170)
16800
0,509
0,962
2
132100 10(111)
8890
Lo que nos indica que el 96,20% de las variaciones del gasto de consumo familiar
son explicados por el modelo, el otro 3,80% es explicado por otras variables u i
R 2 1 1 R2
NN K1
De acuerdo con la ecuacin se hace entendible que para k>1, R 2 R 2 , lo cual implica
que a medida que el nmero de variables X aumenta, el R 2 aumenta menos que R 2 , y
el R 2 puede ser negativo, aun cuando el R 2 es necesariamente un valor positivo. En
caso de que el R 2 resulte ser negativo en una aplicacin, su valor se toma como cero.
32
r r2
yx
y x
covYX
varY var X
YX NYX
Y NY X NX
2
Pr t / 2ee t / 2ee 1
33
122
Ejemplo:
ee 42,23
337,82
42,23
10 2
2
332000 10170
42,23
0,036
33000
5% 0,05
t / 2 2,306
0,426 0,592
La interpretacin de este intervalo de confianza es: dado el coeficiente de
confianza de 95%, (1-0,05)%, en el largo plazo, en 95 de cada 100 casos intervalos
como (0,426; 0,592) contendrn el verdadero valor. Es de hacer notar que no se
puede decir que la probabilidad de que el intervalo especfico (0,426; 0,592) contenga
el verdadero valor sea de 95% porque este intervalo es ahora fijo y no aleatorio; por
consiguiente se encontrar o no dentro de el. La probabilidad de que el intervalo
especficamente fijado incluya al verdadero valor de es 1 o 0.
35
H0 : 0
H1 : 0
Por qu cero?. qu implica que aceptemos la hiptesis nula de que el
coeficiente estimado estadsticamente sea igual a cero?. El valor cero denota no^
multiplicarse por cero, este se anulara, es decir, la variable explicativa no tiene una
presencia real en el modelo. En otras palabras no existe relacin entre X y Y.
Seguidamente calcularemos un estadstico t:
t
ee
t
ee
36
2,5%
H1
t
2,5%
H0
H1
t
/ 2
/ 2
5%
95%
2,5%
H0
H1
-2,306
2,5%
H1
2,306
H0 : 0
H1 : 0
Ejemplo:
37
0,10
0,20
0,05
0,10
0,025
0,05
.
.
.
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893
6 0,718 1,440 1,943 2,447 3,143 3,707 5,208
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785
8 0,706 1,397 1,860 2,306 2,896 3,355 4,501
9 0,703 1,383 1,833 2,262 2,821 3,250 4,297
10 0,700 1,372 1,812 2,228 2,764 3,169 4,144
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025
.
.
.
NOTA: La primera columna corresponde a los
grados de libertad, y la primera fila coresponde a
los niveles de significacin
Como se puede ver la tabla t nos indica que el estadstico para una prueba de
dos colas, con un 5% de significancia ( 0,05) y 8 grados de libertad n k 10 2
es igual a 2,306.
0,509
14,139
0,036
Yi 24,454 0,509 X i
6,414 0,036
3,813 14,139
r 2 0,902
donde el primer nmero entre parntesis debajo de cada coeficiente, corresponde
al error estndar del coeficiente, y el segundo parntesis corresponde a la t calculada
de cada coeficiente.
38
APENDICE 1
RESOLUCION DE EJERCICIO MEDIANTE EL PAQUETE Eviews 5.0 17
A continuacin realizaremos el ejercicio de la pgina 36 a travs del paquete
economtrico Eviews 5.0 .
Men principal
Ventana de comandos
Ventana de
Objeto activo
Ventana de
Workfile
17
Para una ms amplia explicacin, se puede consultar: Pulido, Antonio y Ana Mara Lpez. Prediccin
y Simulacin Aplicada a la Economa de Empresas. Ediciones Pirmide S.A.. Madrid. 1999.
Carrascal A, Ursicino, Yolanda Gonzlez G. Y Beatriz Rodrguez P. Anlisis Economtrico con Eviews.
RA MA Editorial. Madrid. 2001
39
40
3. CONSECUENCIAS DE LA MULTICOLINEALIDAD
En el caso de la multicolinealidad perfecta, la consecuencia directa es que no
se pueden estimar los coeficientes, Al aplicar las ecuaciones mnimo cuadrticas,
estas nos darn cero sobre cero o lo que es lo mismo, indeterminado. Por ejemplo,
dado el siguiente modelo:
Yt 0 1 X 1t 2 X 2t u t
tenemos que:
x y x x y x x
x x x x
2
2
2
1
1 2
2
2
1 2
x y x x y x x
x x x x
2
x 2 y x 22 x 2 y x 22
x x
2
2
2
2
2
2
2 2
2
2
2
0
in det erminado
0
Desde el puntos de vista matricial al haber una relacin lineal entre dos o ms
columnas de la matriz X, la determinante de la matriz XX es igual a cero, por lo tanto,
es una matriz singular, y no se puede calcular su inversa, lo cual imposibilita el clculo
de los coeficientes de la ecuacin ( ( X ' X ) 1 X 'Y ).
En el caso de la multicolinealidad imperfecta, tenemos las siguientes consecuencias:
1 A diferencia del caso de multicolinealidad perfecta, si se pueden estimar los
coeficientes.
133
5. Los coeficientes pueden tener signo opuesto al esperado o una magnitud poco
creble.
Es importante hacer resaltar que pese a la presencia de multicolinealidad en el
modelo, si este presenta un coeficiente de determinacin elevado, el modelo
conservara su capacidad de estimar valores de la variable dependiente.
el cual nos indica que el consumo(C) de un bien esta en funcin lineal de los
niveles de ingreso (Y) y de los niveles de ahorro (S), puede esta bien planteado
desde el punto de vista terico (cuando una persona piensa comprar un vehculo
siempre toma en consideracin sus niveles de ingreso, para el pago de las
mensualidades y de sus ahorros para la inicial), Pero a nivel economtrico
sabemos que el ingreso y el ahorro no pueden esta conjuntamente como variables
explicativas dado que la teora econmica nos indica que el ahorro esta en funcin
directa de los niveles de ingreso.
2. Un segundo mtodo es a travs de las pruebas de significancia individual y global.
Si en un modelo estimado se rechaza la hiptesis H 0 : 1 2 ... n 0 a travs
de la prueba F y algunos coeficientes ( o todos) son individualmente no
significativos, mediante la prueba T. Esto da indicios de un posible problema de
multicolinealidad. Por ejemplo dado el siguiente modelo:
134
X2
X1
70
65
90
95
110
115
120
140
155
150
80
100
120
140
160
180
200
220
240
260
810
1009
1273
1425
1633
1876
2052
2201
2435
2686
Yi 0 1 X 1i 2 X 2i u i
1 0 2 0
Yi 0 1 X 1i 2 X 2i u i
b)
X1
70
65
90
95
110
115
120
140
155
150
1110
80
100
120
140
160
180
200
220
240
260
1700
X2
810
1009
1273
1425
1633
1876
2052
2201
2435
2686
17400
X 2Y
X1Y
5600
56700
6500
65585
10800 114570
13300 135375
17600 179630
20700 215740
24000 246240
30800 308140
37200 377425
39000 402900
205500 2102305
X1
X2
X
N
X
N
X1 X 2
64800
100900
152760
199500
261280
337680
410400
484220
584400
698360
3294300
X1
6400
656100
10000
1018081
14400
1620529
19600
2030625
25600
2666689
32400
3519376
40000
4210704
48400
4844401
57600
5929225
67600
7214596
322000 33710326
1700
170
10
17400
1740
10
137
X 22
4900
4225
8100
9025
12100
13225
14400
19600
24025
22500
132100
Dado los resultados obtenidos en donde tenemos que los dos coeficientes
individualmente no son significativos y globalmente si lo son, se puede sospechar la
existencia de multicolinealidad en el modelo. Por lo cual estimaremos el coeficiente de
correlacin entre las dos variables explicativas para reafirmar o no la sospecha.
rX 1 X 2
cov( X 1 X 2 )
var X 1 var X 2
x x
x x
1 2
2
1
2
2
336300
0,9989
330003434326
El coeficiente de correlacin nos da un valor bastante alto lo que indica una fuerte
relacin entre las variables explicativas. Lo que reafirma la sospecha de la existencia
de multicolinealidad en el modelo
5. COMO SOLUCIONAR EL PROBLEMA DE MULTICOLINEALIDAD
1. El problema de multicolinealidad se reduce, de forma esencial, a una falta de
informacin suficiente que permita estimar de forma ms o menos exacta los
parmetros individuales. En algunas ocasiones podemos estar interesados en unos
parmetros ms que en otros y, si existe un elevado grado de multicolinealidad
entre las variables que forman parte de la regresin, podemos tratar de excluir una
de ellas y estimar los parmetros correspondientes al resto.
Al aplicar esta metodologa hay que tener mucho cuidado ya que al excluir o
eliminar una de las variables explicativas se puede correr el riego de que el modelo
se vea afectado en mayor medida que con la presencia de multicolinealidad. Se
puede dar el caso de que la variable eliminada sea importante para explicar el
comportamiento de la variable dependiente, motivo por el cual el nuevo modelo
regresado (sin la variable) pierda capacidad predictiva, lo cual se ve reflejado a
travs de una reduccin en el valor del coeficiente de determinacin y el posible
surgimiento de autocorrelacin. Cuando se presenta esta condicin se dice que el
modelo est mal especificado.
2. Algunos autores afirman que el problema de multicolinealidad es el mismo que se
presenta cuando se tienen pocos datos, y es el de tener unas varianzas muy
grandes. Por lo tanto, una forma de atenuar (no eliminar) el problema es
aumentando el tamao de la muestra.
3.
Y2 Y1
Y
X 2 X 1 X
var iacin
dY
dX
dY
m
dX
Lo cual significa que en el modelo clsico el coeficiente beta (el que acompaa a
la X) es la pendiente de la ecuacin, y el mismo indica el nmero de unidades en que
vara la variable dependiente, cuando se incrementa en una unidad la variable
explicativa.
En el ejemplo que hemos estado trabajando YI 24,454 0,509 X I podemos
interpretar que por cada unidad monetaria en que se incrementa X, la variable Y se
incrementar (signo positivo) en 0,509 unidades monetarias. Mas especficamente por
cada dlar en que se incremente el ingreso familiar semanal, el gasto de consumo
familiar se incrementar en 0,509 dlares.
2.ELASTICIDAD
La elasticidad de una funcin es una medida de variacin relativa y nos indica el
grado de sensibilidad de una variable dependiente ante cambios en la variable
explicativa. Su frmula de clculo resulta de dividir el cambio relativo o porcentual en
la variable dependiente entre el cambio relativo o porcentual en la variable explicativa.
Para una funcin discreta la elasticidad viene definida por:
Y2 Y1
Y Y X1
Y1
var iacin.%.Y
E
2 1
X 2 X 1 X 2 X 1 Y1
var iacin.%. X
X1
Para una funcin continua:
45
dY X
dX Y
La
inelstica
elasticidad
es
La elasticidad es unitaria
La
elstica
elasticidad
es
dY X 1
x
dX Y1
dY X
x
dX Y
Y la promedio:
46
~
ee 1
1
X NX 2
2
u i 0 1 X i i
1
i
Xi
1
u i 0 1
i
Xi
u i 0 1
Prueba de Glejser
valor absoluto
151
R 2 0,964613
Este grfico permite observar que a niveles bajos de PIB existe pequea volatilidad en
la ocupacin y, sin embargo, la dispersin aumenta a medida que lo hace el PIB:
En segundo lugar, se puede analizar tambin de forma grfica la relacin existente
entre los residuos y la variable explicativa:
153
Elasticidad
Variacin marginal
dY
dX
Y
Y
1
X
X
EJERCICIO N 3
. ELASTICIDADES 18
18
Tomado de: Prez Amara, Teodosio, Pablo Amors Gonzlez y Silvia Relloso Pereda. Ejercicios de
Econometra Empresarial. Mc Graw Hill, Espaa. 1993. p.1
49
i2 2 X i2
donde 2 es la varianza Homocedstica.
bajo esta hiptesis de Heterocedasticidad, si se trata de restablecer la igualdad
de varianza en, se tendra que transformar el modelo dividiendo el modelo original
por, con lo que la especificacin a estimar sera
Yi
u
0 1 i
Xi Xi
Xi
comprobacin:
u
var i
Xi
u
E i
Xi
E U i
i2
2 2
2
Xi
EX i
i2 2 X i
con lo que el modelo con el mismo propsito que anteriormente resultara:
Yi
Xi
0
Xi
1 X i
157
ui
Xi
Como se puede observar en el grfico, existe una tendencia que implica una relacin
inversa entre los residuales y el ingreso lo cual es indicativo de la precencia de
heterocedasticidad en el modelo.
b) Prueba de Park
Lnui2 0 1 ln X i i
160
donde:
AHORROT
SI
YI2
INVINGRESO 2
INVINGRESO
1
YI2
1
YI
165
OBSERVACIONES
Pimiento
Acelga
Ajo
Alcahofa
Batata
Berenjenas
Calabaza y calabacn
Cardo
Coliflor
Escarola
Guisantes verdes
Habas verdes
Judas verdes
Lechuga
Meln
Pepino
Sanda
7.338
702
2.063
3.341
329
1.367
2.430
270
2.747
535
567
890
2.473
9.535
8.528
3.357
6.046
25.243
3.283
30.548
23.556
1.779
4.208
6.739
1.050
13.903
2.504
10.398
12.393
25.526
33.797
50.514
7.083
23.217
170
CAPITULO VIII
AUTOCORRELACIN
1. DEFINICION
Y XU
cov U
;U
Y XU
cov U
;U
Uno de los supuestos del modelo clsico nos indica que: covu i ; u j 0 que nos
indica que la covarianza entre las perturbaciones de un modelo debe ser igual a cero,
ms concretamente el supuesto indica que no debe existir ninguna relacin entre dos
o ms observaciones diferentes de la variable estocstica. Si este supuesto no se
cumple, se dice que el modelo presenta problemas de autocorrelacin o correlacin
serial.
Por lo tanto el trmino autocorrelacin se puede definir como la correlacin existente
en el trmino de perturbacin ( u ).
De manera simplificada se puede decir que un modelo presenta problemas de
autocorrelacin cuando el trmino de perturbacin (la variable aleatoria) est
absorbiendo algn elemento que es importante para explicar el comportamiento de la
variable dependiente, que no est planteado en forma explcita en el modelo.
Son causas de autocorrelacin:
a) Problemas en la especificacin del modelo, que pueden ser de 2 tipos: forma
funcional incorrecta y omisin de variables.
En el primer caso se dice que un modelo est mal especificado cuando no tiene la
forma funcional correcta, por ejemplo, la teora de costos nos indica que la curva de
costo medio est representada por una funcin cuadrtica.
C 0 1 X 2 X 2 u
171
5%
95%
2,5%
H0
H1
-2,306
2,5%
H1
2,306
H0 : 0
H1 : 0
La t calculada es mayor que el valor crtico (3,2891>2,306), por lo tanto
rechazamos la hiptesis nula y aceptamos la alternativa de que el coeficiente es diferente a
cero, con lo cual concluimos que el coeficiente 1 es significativamente diferente a cero, o
simplemente, el coeficiente es significativo.
EJERCICIO N 5
Los tericos cuantitavistas o monetaristas sostienen que el ingreso nacional est
fundamentalmente determinado por la cantidad de dinero. Para probar esta hiptesis,
con los datos que se presentan a continuacin, estime un modelo que permita
determinar la elasticidad del ingreso nacional con respecto a la oferta monetaria y
compruebe la significancia individual del parmetro pendiente...
TRIMESTRE
1972:01
1972:02
1972:03
1972:04
1973:01
1973:02
1973:03
1973:04
1974:01
1974:02
1974:03
1974:04
PNB
(MMUS$)
1127,0
1156,7
1181,4
1219,4
1365,0
1287,8
1319,7
1352,7
1370,9
1391,0
1424,4
1441,3
55
OFERTA
MONETARIA
(MMMUS$)
237,5
242,3
247,4
252,9
257,6
261,7
265,3
268,7
272,7
276,5
279,4
282,2
para lo cual tendremos que estimar el valor del coeficiente de autocorrelacin, la cual
se realizar a travs de la identidad:
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
AO
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
u u
u
t
t 1
2
t
0,3614
0,337
1,0735
U t
U tU t 1
0.2876
-0.0902
-0.0753
-0.2069
0.1014
-0.0444
-0.0747
-0.0301
0.0188
0.3758
-0.0584
-0.0475
-0.2386
-0.1194
-0.3587
-0.3615
-0.0735
0.1980
0.6269
0.0491
-0.0260
0.0068
0.0156
-0.0210
-0.0045
0.0033
0.0022
-0.0006
0.0071
-0.0220
0.0028
0.0113
0.0285
0.0428
0.1297
0.0266
-0.0146
0.1241
0.3614
U t2
0.0827
0.0081
0.0057
0.0428
0.0103
0.0020
0.0056
0.0009
0.0004
0.1412
0.0034
0.0023
0.0569
0.0143
0.1286
0.1307
0.0054
0.0392
0.3930
1.0735
186
1,4245
2
0,0355
371,925 125,5669
_________
________
La elasticidad del ingreso nacional con respecto a la oferta de dinero es igual a 1,4245,
por cada 1% que aumente la oferta monetaria el ingreso nacional aumentar en
1,4245%.
A continuacin chequearemos la significancia individual de 1
________ ________
.
LNOM
LNPNB
N
LNOM LNPNB
XY
N
X
Y
2
r 1
1
2
2
2
_________
Y NY
LNPNB 2 N LNPNB
r 2 1,4245
0,0506
0,0506
1,4245
0,9242
2
0,0779
616,8648 127,1693
1 r2
2
u
ee 1 u2
N K
0,0059
0,00059
12 2
1
0,00059
0,0166 0,12899
2
0,0355
X NX
2
57
5%
95%
2,5%
2,5%
H0
H1
-2,228
H1
2,228
H 0 : 0
H 1 : 0
1 1 1,4245 0
11,0428
0,12899
ee 1
58
194
IMPORTACIONES
PNB
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
23,2
23,1
25,2
26,4
28,4
32,1
37,7
40,6
47,7
52,9
58,5
64,2
75,9
94,4
131,9
126,9
155,4
185,8
217,5
260,9
506,1
523,3
563,8
594,7
635,7
688,1
753,1
796,3
868,5
935,5
982,4
1063,4
1171,1
1306,6
1412,9
1528,8
1702,2
1899,5
2127,6
2368,5
Se pide:
a) Estimar una funcin que relacione las importaciones con el PNB.
b) Determinar la posible existencia de autocorrelacin en el modelo mediante:
b.1) Contrastes Grficos.
b.2) Contraste de Durbin Watson.
c) En caso de ser necesario corregir el problema
47
Tomado de: Salvatore, Dominick. Econometra. Serie Schaum. McGraw-Hill.. Mexico. 1983. P161
198
VENTAS t 1 D1 2 D2 3 D3 4 D4 u t
Donde: D1 = 1 para el primer trimestre, 0 de lo contrario.
D2 = 1 para el segundo trimestre, 0 de lo contrario.
D3 = 1 para el tercer trimestre, 0 de lo contrario.
D4 = 1 para el cuarto trimestre, 0 de lo contrario.
203
Aos
S
Y
1965
20
100
1966
25
110
1967
25
130
1968
30
140
1969
33
160
1970
38
170
1971
35
170
1972
45
200
1973
43
240
Respuesta:
St 3,734 0,184Yt
(3,271) (0,019)
(1,141) (9,756)
R 2 0,9224
62
1974
50
250
CAPITULO IV
1. MODELO DE REGRESION MULTIPLE (2 VARIABLES EXPLICATIVAS)
Cuando hablamos de un modelo de regresin mltiple, nos estamos refiriendo
a un modelo de regresin con ms de una variable explicativa.
Yt 0 1 X 1t 2 X 2t 3 X 3t 4 X 4t ... n X nt u t
x y x x y x x
x x x x
2
2
2
1
1 2
2
2
1 2
x y x x y x x
x x x x
2
1
2
1
1 2
2
2
1 2
0 Y 1 X 1 2 X 2
donde x X i X = desvos de X;
y Yi Y = desvos de Y
El coeficiente de Determinacin R 2
R2
1 x1 y 2 x 2 y
Errores estndar:
ee1 2
2
2
x x x x
2
1
63
2
2
1 2
ee2 2
2
1
x x x x
2
1
2
2
1 2
x y X Y NX Y
1
y X 2 Y NX 2 Y
x x
X 1 X 2 NX 1 X 2
1 2
2
1
2
2
X 12 NX 12
X 22 NX 22
Y 2 NY 2
EJERCICIO N 11
El siguiente cuadro incluye informacin acerca de la tasa de inflacin observada Y(%),
tasa de desempleo X 1 (%) y tasa de inflacin esperada X 2 para los Estados Unidos,
en el perodo 1970-1982.
Ao
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
Y
5.92
4.30
3.30
6.23
10.97
9.14
5.77
6.45
7.60
11.47
13.46
10.24
5.99
X1
4.9
5.9
5.6
4.9
5.6
8.5
7.7
7.1
6.1
5.8
7.1
7.6
9.7
X2
4.78
3.84
3.13
3.44
6.84
9.47
6.51
5.92
6.08
8.09
10.01
10.81
8.00
Yt 0 1 X 1t 2 X 2t u t
a)
Ao
(Y)
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
5.92
4.30
3.30
6.23
10.97
9.14
5.77
6.45
7.60
11.47
13.46
10.24
5.99
100.84
(X1)
4.90
5.90
5.60
4.90
5.60
8.50
7.70
7.10
6.10
5.80
7.10
7.60
9.70
86.50
(X2)
(X1)Y
(X2)Y
29.01
25.37
18.48
30.53
61.43
77.69
44.43
45.80
46.36
66.53
95.57
77.82
58.10
677.11
28.30
16.51
10.33
21.43
75.03
86.56
37.56
38.18
46.21
92.79
135.95
110.69
47.92
747.47
4.78
3.84
3.13
3.44
6.84
9.47
6.51
5.92
6.08
8.09
10.10
10.81
8.00
87.01
X1
X2
Y
N
x y X Y NX Y
1
86,50
6,654
13
87,01
6,693
13
(X1)^2
(X2)^2
23.42 24.01
22.66 34.81
17.53 31.36
16.86 24.01
38.30 31.36
80.50 72.25
50.13 59.29
42.03 50.41
37.09 37.21
46.92 33.64
71.71 50.41
82.16 57.76
77.60 94.09
606.90 600.61
(X1)(X2)
100,84
7,757
13
65
22.85
14.75
9.80
11.83
46.79
89.68
42.38
35.05
36.97
65.45
102.01
116.86
64.00
658.40
Y^2
35.05
18.49
10.89
38.81
120.34
83.54
33.29
41.60
57.76
131.56
181.17
104.86
35.88
893.25
x x X X
1 2
2
1
2
2
x y x x y x x
x x x x
2
2
2
1
1 2
2
2
1 2
x y x x y x x
x x x x
2
1
2
1
2
2
1 2
1 2
b)
b.1) Anlisis econmico: Los signos de los coeficientes estn acordes con la hiptesis
inicial. Existe una relacin inversa entre la tasa de desempleo y la tasa de inflacin
observada. Por cada punto porcentual en que se incrementa la tasa de desempleo, la
66
R2
R2
1 x1 y 2 x 2 y
1,3926,114 1,46572,541
111,026
97,762
0,881
111,026
u 1 R y
2
1 0,881111,026 13,312
N K
ee1 2
13,212
1,321
13 3
2
2
x x x x
2
1
2
2
1 2
76,049
ee1 1,321
0,089 0,299
1.122,477
ee2 2
2
1
x x x x
2
1
67
2
2
1 2
25,026
ee2 1,321
0,029 0,172
1.122,477
5%
95%
2,5%
2,5%
H0
H1
-2,228
H1
H0 : i 0
2,228
i 1,2
H1 : i 0
t1
1 1 1,392 0 1,392
4,656
0,299
0,299
ee 1
t2
2 2 1,465 0 1,465
8,517
0,172
0,172
ee 2
68
2. CAMINATA ALEATORIA
El ejemplo mas simple de una serie de tiempo estocstica es el proceso de caminata
aleatoria o Random Walk 59. En el proceso ms simple de caminata aleatoria cada
cambio sucesivo en y t es extrado en forma independiente de una distribucin de
probabilidad con media 0. Por tanto, y t est determinado por:
y t y t 1 t
3. ESTACIONARIEDAD
Cuando se comienza a desarrollar modelos para series de tiempo, se desea saber si
es posible suponer que el proceso estocstico subyacente que gener la series es
invariable con respecto al tiempo. Si las caractersticas del proceso estocstico
cambian con el tiempo; es decir, si el proceso no es estacionario, en general ser
difcil representar la serie de tiempo durante intervalos de tiempo pasados y futuros
con un modelo algebraico simple. Por el contrario, si el proceso estocstico est fijo en
el tiempo; es decir, si es estacionario, entonces podemos modelar el proceso a travs
de una ecuacin con coeficientes fijos que pueden estimarse a partir de datos
pasados.
Grfico N 2
61
El ejemplo es tomado de Pulido, Antonio y Ana Mara Lpez. Ob.Cit. y el mismo consiste en una serie
de tiempo que abarca el periodo 1980-1998, con periodicidad mensual de un indicador de renta salarial
real para la economa espaola.
217
2 1 1, 446 1
1, 65
0, 271
2
3.
H 0 : 3 0,5
H1 : 3 0,5
5, 02
0,197
3
t 5, 02 2,365
71
k cov arianza.al.rezago.k
0
var ianza
221
225
11
.
.
.
0.25
0.10
1.49
3.29
1.60
2.92
1.60
2.73
1.59
2.61
0.05
0.01
0
0.25
0.10
0.05
0.01
4.96
10.00
4.10
7.56
3.71
6.55
3.48
5.99
1.47
3.23
4.84
9.65
1.58
2.86
3.98
7.21
1.58
2.66
3.59
6.22
1.57
2.54
3.36
5.67
Es decir cuando
1 / 3 1
0,5
1 1 / 13 3 0
lim F
R 2 1
EJERCICIO N 13
Un investigador estim una funcin de COBB-DOUGLAS para el sector agrcola de
Taiwan durante 1958-192, obteniendo los siguientes resultados.
^
R 2 0,8705
g de l = 12
74
75
5%
95%
2,5%
2,5%
H0
H1
-2,179
H1
H0 : i 0
2,179
i 1,2
H1 : i 0
6,268 2,179 y 4,801 2,179 . En ambos casos la T calculada cae en la cola, es decir
en la zona de significancia o zona de rechazo. Por lo tanto rechazamos la hiptesis
nula y aceptamos la alternativa de que los coeficientes son diferentes a cero.
Finalmente concluimos que ambos coeficientes pendientes si son significativamente
diferente a cero.
Significancia global.
Puntos porcentuales de la distribucin F (continuacin)
g. de l
para el
denominador
(N-K)
Pr
0.25
0.10
1.46
3.18
1.56
2.81
1.56
2.61
1.55
2.48
1.54
2.39
1.53
2.33
1.52
2.28
0.05
0.01
4.75
9.33
3.89
6.93
3.49
5.95
3.26
5.41
3.11
5.06
3.00
4.82
2.91
4.64
0.25
0.10
0.05
0.01
1.45
3.14
4.67
9.07
1.55
2.76
3.81
6.70
1.55
2.56
3.41
5.74
1.53
2.43
3.18
5.21
1.52
2.35
3.03
4.86
1.51
2.28
2.92
4.62
1.50
2.23
2.83
4.44
.
.
.
12
13
.
.
.
76
5%
95%
5%
H0
H1
3,89
H 0 : 1 2 0
H1 : 1 2 0
R 2 / K 1
0,8705 / 3 1
0,435
39,545
2
1 R / N K 1 0,8705 / 15 3 0,011
19
232
b)
79
EJERCICIO N 15
A continuacin se presentan algunos modelos ya regresados, Para todos se requiere
que se analice: a) desde un punto de vista econmico y b) estadsticamente.
1)
2)
R 2 0.8953 ; N= 20
donde Md = Oferta monetaria; I= tasa de inters; Y = ingreso nacional; L= tenencia de
activos lquidos.
3)
80
11
12
13
14
15
16
17
18
0.25
0.10
0.05
0.01
1.49
3.29
4.96
10.00
1.60
2.92
4.10
7.56
1.60
2.73
3.71
6.55
1.59
2.61
3.48
5.99
1.59
2.52
3.33
5.64
1.58
2.46
3.22
5.39
1.57
2.41
3.14
5.20
0.25
0.10
0.05
0.01
1.47
3.23
4.84
9.65
1.58
2.86
3.98
7.21
1.58
2.66
3.59
6.22
1.57
2.54
3.36
5.67
1.56
2.45
3.20
5.32
1.55
2.39
3.09
5.07
1.54
2.34
3.01
4.89
0.25
0.10
0.05
0.01
1.46
3.18
4.75
9.33
1.56
2.81
3.89
6.93
1.56
2.61
3.49
5.95
1.55
2.48
3.26
5.41
1.54
2.39
3.11
5.06
1.53
2.33
3.00
4.82
1.52
2.28
2.91
4.64
0.25
0.10
0.05
0.01
1.45
3.14
4.67
9.07
1.55
2.76
3.81
6.70
1.55
2.56
3.41
5.74
1.53
2.43
3.18
5.21
1.52
2.35
3.03
4.86
1.51
2.28
2.92
4.62
1.50
2.23
2.83
4.44
0.25
0.10
0.05
0.01
1.44
3.10
4.60
8.86
1.53
2.73
3.74
6.51
1.53
2.52
3.34
5.56
1.52
2.39
3.11
5.04
1.51
2.31
2.96
4.69
1.50
2.24
2.85
4.46
1.49
2.19
2.76
4.28
0.25
0.10
0.05
0.01
1.43
3.07
4.54
8.68
1.52
2.70
3.68
6.36
1.52
2.49
3.29
5.42
1.51
2.36
3.06
4.89
1.49
2.27
2.90
4.56
1.48
2.21
2.79
4.32
1.47
2.16
2.71
4.14
0.25
0.10
0.05
0.01
1.42
3.05
4.49
8.53
1.51
2.67
3.63
6.23
1.51
2.46
3.24
5.29
1.50
2.33
3.10
4.77
1.48
2.24
2.85
4.44
1.47
2.18
2.74
4.20
1.46
2.13
2.66
4.03
0.25
0.10
0.05
0.01
1.42
3.03
4.45
8.40
1.51
2.64
3.59
6.11
1.50
2.44
3.20
5.18
1.49
2.31
2.96
4.67
1.47
2.22
2.81
4.34
1.46
2.15
2.70
4.10
1.45
2.10
2.61
3.93
0.25
0.10
0.05
0.01
1.41
3.01
4.41
8.29
1.50
2.62
3.55
6.01
1.49
2.42
3.16
5.09
1.48
2.29
2.93
4.58
1.46
2.20
2.77
4.25
1.45
2.13
2.66
4.01
1.44
2.08
2.58
3.84
243
dl
0.203
0.268
0.328
0.389
0.447
0.502
0.554
0.603
0.649
0.692
0.732
0.769
0.804
0.837
0.868
0.897
0.925
0.951
0.975
0.998
1.020
1.041
1.061
1.080
1.097
1.114
1.131
1.146
1.161
1.175
1.238
1.291
244
K=6
du
3.005
2.832
2.692
2.572
2.472
2.388
2.318
2.257
2.206
2.162
2.124
2.090
2.061
2.035
2.012
1.992
1.974
1.958
1.944
1.931
1.920
1.909
1.900
1.891
1.884
1.877
1.870
1.864
1.859
1.854
1.835
1.822
22
X
Y
o 22
a) la COV
b) E | E
Las varianzas y las covarianzas de las variables aleatorias X 1 , X 2 ,..., X t , se definen como:
Var ( X i ) E ( X i i ) 2 , i 1, 2,.., T
Cov( X i , X j ) E ( X i i )( X j j ) , i j; i, j 1, 2,..., T .
entonce, si se define el vector x - y se escribe la eperanza matemtica de este vector multiplicado por
su transpueto, esto e:
E (x - )(x - )
se obtiene
( X 1 1 )
( X 2 2 )
E ( x )( x ) E
( X 1 1 ) ( X 2 2 ) ( X T T )
( X T T )
( X 1 1 )2
2
E ( x2 2 )( x1 1 ) ( X 2 2 )
E ( xT T )( x1 1 )
E ( x1 1 )( xT T )
E ( x2 2 )( xT T )
( X T T )2
puede observarse cmo en esta expresin los elementos de la diagonal principal incluyen las varianzas
de las variables X i , mientras que el resto de los elementos incluyen las covarianzas. En concreto, el
elemento
A esta matriz se le denomina matriz de varianzas y covarianzas del vector x , y se denota como V(x)
o :
V(x) = E (x - )(x - ) =
Var (u i | ) 2
i 1,..., n
para
(supuesto de Homocedasticidad)
Cov u i , u j |
para i j
1 0 ... 0
0
1
...
0
. . ... .
2
2
. . ... .
... .
. . ... .
... .
...
0 0 ... 1
0
0
.
Var
u 2 u1 u 2 u 2 ... u 2 u i
.
.
.
... u i E
.
.
.
.
.
.
u u u u ... u u
i 2
i i
i 1
...
...
...
El supuesto de que
84
2 0
0 2
.
.
.
.
.
.
0
0
u2
X
u
u
u1
u2
.
E u1
.
.
u
i
Var
Notacin escalar
para todo i
E u i u j 0 i j
E u i 2
3.- X1, X2, ,Xn son fijas o no explicativas
2
Notacin matricial
1.- E (u ) 0 donde u y 0 son vectores n x
1, siendo 0 un vector nulo.
2.- E uu 2 I donde I es una matriz
identidad n x n
85
Dado el modelo
i=1
i=1
ui2 = Y - Xi
= uu
u1
u2
.
n
2
2
2
... ui
u1 u 2 ... u n ui2
.
i 1
.
u
n
u1 u 2
X , tenemos que:
si u i Yi Y y Y
' YY
Y X ' Y X
uu Y Y
u ' u Y ' ' X ' Y X Y ' Y Y ' X B ' X ' Y ' X ' X
Para minimizar una funcin de varias variables, en este caso u ' u funcin de
1 , 2 ,... k , la condicin de primer orden es que las derivadas parciales sean iguales a
cero. En forma matricial:
u ' u
2X ' Y 2X ' X 0
X ' X X ' Y
23
'
86
X X
'
1
X ' X X ' X X 'Y
X' X
X' Y
X
'
X
PROPOSICION: E (e) 0
= E(y) - E(X)
= X - X = 0
E(e) = E(y - X)
PROPOSICION: Xe = 0
= Xy - XX
Xe = X(y - X)
= Xy - XX XX -1 Xy
Xe = X(y - X)
24
Se dice que una matriz es no singular cuando es una matriz cuadrada que tiene inversa
Lpez Casuso, Rafael. Clculo de Probabilidades e Inferencia Estadstica, con Tpicos de
Econometra. Universidad Catlica Andrs Bello. Caracas. 2000. P.518.
25
87
E
1
X ' X X ' Y
como Y X u
1
X ' X X ' X u
1
1
X ' X X ' X X ' X X ' u
1
X ' X X ' u
E E X ' X X ' u
1
1
E E E X ' X X ' u
1
E X ' X X ' Eu
como Eu 0
nos queda que
E
3.2 MINIMA VARIANZA
Para demostrar que los estimadores mnimos cuadrticos son de mnima varianza, hay
que calcular la varianza de los estimadores, expresndola en trminos de la matriz de
covarianzas.
88
Por definicin:
2
'
Var E E
1
1
como se vio anteriormente X ' X X ' u X ' X X ' u
1
1
Var E X ' X X ' uu ' XX ' X
1
1
Var X ' X X ' Euu ' XX ' X
1
1
Var X ' X X ' 2 IXX ' X
1
Var 2 X' X
Var 1
Cov 2 , 1
Var
Cov ,
k
1
Cov 1 , 2
Var 2
...
...
...
.
.
Cov k , 2
...
...
...
Cov 1 , k
Cov 2 , k
Var k
es decir la Var es un matriz en la cual la diagonal principal est conformada por las
Varianzas de los coeficientes estimados y los elementos distintos a la diagonal
principal, son las covarianzas.
A continuacin se demostrar que cualquier otro estimador insesgado de tiene una
mayor varianza que .
89
1
En efecto, consideremos otro estimador lineal de , digamos * X ' X X ' C Y ,
siendo C una matriz de constantes y Y X u
1
* X ' X X ' C X u
1
1
* X ' X X ' X X ' X X ' u CX Cu
1
* CX X ' X X ' u Cu
E( * ) CX
para que E * , CX 0
1
* X ' X X ' u Cu
1
* X ' X X ' u Cu
'
Var * E * *
Var * E X ' X
X ' u Cu X ' X
'
X ' u Cu
1
1
Var * E X ' X X ' u Cu u ' XX ' X u 'C '
C IC
1
1
1
1
Var * E X ' X X ' uu ' XX ' X X ' X X ' uu ' C ' Cuu ' XX ' X Cuu ' C '
1
1
1
1
Var * E X ' X X ' 2 IXX ' X X ' X X ' 2 IC ' C 2 IXX ' X
90
'
Var * E 2 X ' X
X' X X' X
2 CX X ' X
CXX X
1 '
'
2 CC '
1
Var * 2 X ' X 2 CC'
La matriz CC' es semidefinida positiva y con eso Var * es por lo menos igual o mas
grande que Var . Por lo tanto podemos afirmar que en el modelo clsico de
u 'u
nk
en efecto se tiene
u Y X
1
si, Y X u , y X ' X X ' Y
u X u XX ' X X ' X u
1
26
u X u X XX ' X X ' u
1
u u XX ' X X ' u
1
u I XX ' X X ' u u
luego
E ( 2 )
27
2 n k
E u ' u
2
n k
nk
nxm
2
en que
a ij a ji para todo i j .
28
92
5. COEFICIENTE DE DETERMINACIN
Como se vio anteriormente el coeficiente de determinacin nos indica el
porcentaje de variaciones de la variable dependiente que son explicados por el
modelo. A medida que el porcentaje es mayor, nos indica en que medida el modelo
se ajusta a los datos, motivo por el cual a este estadstico tambin se le conoce con el
nombre de BONDAD DE AJUSTE.
Sea:
STC = suma total de cuadrados =
Y Y
Y 'Y nY 2
Y 'Y Y 2
YI
u
2
2
I
u ' u
Entonces.
STC = SEC+ SCR
Para medir la capacidad de explicacin de la ecuacin de regresin requerimos
una medida que indique toda la variacin en Yi que la regresin puede explicar. Una
medida tal es:
R2
1
STC
STC
STC
R2 1
u 'u
Y ' Y nY 2
29
Pulido San Romn, Anonio y Julin Prez Garca. Modelos Economtricos. Ediciones
Pirmide.Madrid. 2001. p.182.
93
X n
1 X1
X
X
Y
X
X
X
.
n
.
xi
.
X n
1
.
.
.
1
x
x
i
2
i
Dado que es una matriz simtrica, coincidir con su transpuesta y calculando la matriz
conjugada y dividiendo por el valor de la determinante:
X
X
X
X
X X
X X
Obtenemos:
n xi2 xi n xi x
n xi x
xi2
xi
xi
Por su parte
Y
X
1
x1
y1
.
1 yi
.
x n xi y i
.
y
n
Resultando
Y
X
X
X
n xi x
xi2
xi
xi2 y i xi xi y i
n xi x
n xi y i x i y i
2
n xi x
94
xi y i
n xi y
1
2
EJERCICIO N 16
Un pas 30, que tiene que importar todo el petrleo que consume, est interesado en
realizar una poltica de construccin de viviendas tal que reduzca el consumo de
petrleo destinado a la calefaccin. Se tienen datos referidos a los ltimos siete aos
de las siguientes variables: consumo anual de petrleo en miles de bidones (Y),
temperatura promedio en invierno, en grados centgrados (X1), y cantidades de
aislamiento exigidas en las paredes, en pulgadas (X2).
Consumo
Petrleo
Temperatura
Aislamiento
216
200
230
240
203
190
200
12
12
10
7
11
11
10
6
8
6
8
4
3
7
216 1
200 1
230 1
240 1
203 1
190 1
200 1
30
12
12
10
7
11
11
10
8
6 1
8 2
4 3
3
Ejercicio tomado de: Martin, Guillermina; Jos Mara Labeaga y Francisco Mochn. Ob.Cit. p. 91
95
X
'
X
1
1 1 1 1 1 1 1 1
12 12 10 7 11 11 10 1
6 8 6 8 4 3 7 1
X
'
X
12
12
10
7
11
11
10
8
6 7 73 42
8 73 779 431
4 42 431 274
3
0,02
0,80 0,06
0,53 0,02
0,05
Y
'
X
216
200
1 1 1 1 1 1 1 230 1.479
12 12 10 7 11 11 10 240 15.295
6 8 6 8 4 3 7 203 8.978
190
200
Y
'
X
X
'
X
216
200
230
240
203
190
200
201,57
207,09
213,94
238,01
202,23
199,47
216,70
14,43
-7,09
16,06
1,99
0,77
-9,47
-16,70
96
u
'
u
14,43
7,09
16,06
9,47
16,70
Y
'
Y
216
200
230
190
200
Yi
Y
n
211,29
7
u
'
u
Y
'
Y
R2 1
nY
314.465 7 211,29
u
'
u
X
'
X
Var 2
nk
889.61
0,5492
889,61
222,40
73
97
si ee( ) Var ( )
si
H0 : 0
H1 : 0
t
t1
ee
259,21
2,76
6,18
5,102 ; t 2
1,632 ; t 3
0,812
3,79
3,40
50,81
R2
0,5492
3 1
F k 12
2,437
1 0,5492
1 R
73
nk
Resultados
Yi =259,21 - 6,18 X1 + 2,76 X2
(50,81) (3,79)
(3,40)
(5,102) (-1,632) (0,812)
98
R2 = 0,5492
F = 2,437
EJERCICIO N 17
Durante el perodo 1986-1996, la evolucin de la produccin 31, Q, capital invertido, K,
y el nivel de empleo, L, en el sector agrario del pas Z ha sido recogida en la tabla
siguiente:
p
y
p
g
p
capital invertido y nivel de empleo en el sector agrario del paz Z
durante el perodo 1986-1996
Ao
Produccion
Q
Capital
K
Empleo
L
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
80
95
100
120
150
165
180
175
170
190
195
200
210
240
150
260
230
245
250
295
300
300
50
55
80
86
90
95
96
98
100
110
115
Qt 1 K t 2 Lt 3 e ut
t 1986,...,1996
Ejercicio tomado de: Daz Fernndez, Montserrat y Mara del Mar Llorente Marrn. Ob.Cit. p.133.
99
Ao
LnQ
LnK
LnL
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
4,3820
4,5539
4,6052
4,7875
5,0106
5,1059
5,1930
5,1648
5,1358
5,2470
5,2730
5,2983
5,3471
5,4806
5,0106
5,5607
5,4381
5,5013
5,5215
5,6870
5,7038
5,7038
3,9120
4,0073
4,3820
4,4543
4,4998
4,5539
4,5643
4,5850
4,6052
4,7005
4,7449
5,2983
5,3471
5,4806
5,0106
5,5607
5,4381
5,5013
5,5215
5,6870
5,7038
5,7038
X
'
X
1
1
1
1
1
1
1
1
60,2527 49,0093
11
X
'
X
4,3820
4,5539
4,6052
4,7875
5,0106
5,1059
5,1930
5,1648
5,1358
5,2470
5,2730
100
3,9120
4,0073
4,3820
4,4543
4,4998
4,5539
4,5643
4,5850
4,6052
4,7005
4,7449
12,3237
1,5802
3,5352
0,7839 1,5802
2,1186
0,8541 1
0,2607 2
0,9823
Y
'
X
X
'
X
Y
'
X
54,4587
298,7202
243,4130
LnQ t
Ln Qt
4,3820
4,5539
4,6052
4,7875
5,0106
5,1059
5,1930
5,1648
5,1358
5,2470
5,2730
4,3703
4,4766
4,8795
4,8280
5,0161
5,0373
5,0640
5,0895
5,1525
5,2505
5,2942
0,0117
0,0772
-0,2744
-0,0405
-0,0055
0,0687
0,1289
0,0753
-0,0167
-0,0035
-0,0212
u 'u 0,1108
R2 1
Y 'Y 270,5988
Y
n
4,9508
0,1108
0,8875
2
270,5988 114,9508
0,1108
0,0139
11 3
0,9923
0,2213
ee( ) Var
0,1713
101
t1
0,8541
0,9823
0,2607
0,861; t 2
1,178 ; t 3
5,735
0,9923
0,2213
0,1713
0,8875
3 1
F
1 0,8875 31,560
11 3
Resultados generales
LnQt = -0,8541 + 0,2607 LnKt + 0,9823 LnLt
(0,9923) (0,2213)
(0,1713)
(-0,861) (1,178)
(5,735)
R2 = 0,8875
F = 31,560
Comprobacin de resultados mediante Eviews
102
u i | X ~ N 0, 2 I
f u (22 n/2 2
n/2
exp 2 u u
2
~
~
1
n
n
L ln2 ln 2 2 y X y X
2
2
2
~
El mximo de esta funcin respecto a coincide con el mnimo del tercer sumando,
~
que es el nico que depende de , pero esta ltima es precisamente la expresina
minimizar por el criterio de mnimos cuadrados.
~
Igualando a cero las derivadas con respecto a y 2 , se tiene:
~
LnL
1
2X y X 0
32
La funcin de densidad para una normal n-variante tal que u ~ NEu , es:
1/2
1
n/2
f u 2 exp u - Eu 1 u Eu
2 ; Eu 0; 1
n
103
1
I
2
~
~
LnL
n
1
2 4 y X y X 0
2
2
2
Luego
~
1
X X X y
~
~
y X y X u u
104
APENDICE 2
ELEMENTOS BASICOS DE MATRICES
1.- CONCEPTO DE MATRIZ
Se llama matriz a un conjunto ordenado de nmeros, variables, funciones, etc.,
dispuestos en m filas y n colummas..
Las lineas horizontales reciben el nombre de filas u las lineas vericales se llaman
columnas. El nmero de filas puede ser menor, igual o mayor al nmero de columnas.
Am x m
a11
a 21
.
a m1
a12
a 22
.
.
am 2
... a1n
... a 2 n
... .
... .
... a mn
s12
es una matriz cuadrada de orden 2
s 22
105
1 3 5
A 2 8 5
8 10 0
Diagonal
principal
A 0 8 5
0 0 6
1 0 0
A 2 8 0
8 10 7
H 0 0 0
0 0 3
0 0 0
0 0 0
K
0 0 0
0 0 0
106
I3 0 1 0
0 0 1
N 2 3 3
1 3 4
N es una matriz simtrica, ya que cumple que n12 n 21 2 ; n13 n31 1 ; n23 n32 3
11.- VECTOR FILA
Es una matriz formada por una fila, su orden es 1, n .
T13 0 2 1
5,33
4,67
Y41
2,05
6,87
107
0
Y 0
0
O 32
0 0
0 0
0 0
Dado A
1 0 4
3 1
A 8 0
9 4
'
108
b)
traspuestas.
c)
3
A 4 1 0
7 8 9 1
0 0 1 2
B 3 1 0 4
0 1 1 1
2 0 3 0 2 1 0 2 2 3 1 2
A B 4 3 1 1 0 0 3 4 7 2 0 1
7 0 8 1 9 1 1 1 7 9 10 0
Propiedades:
a) A + B = B + A
b) (A + B) + C = A + (B + C)
c) A + 0 = A
18. MULTIPLICACION DE UN ESCALAR POR UNA MATRIZ
Sean la matriz A = (aij ) de orden mxn , y el escalara . Se denomina producto de
109
A (a1 j )
Ejemplo:
4
3
1
12 9
3x 4
3 x3 3
4
3 3 x1
1
Propiedades:
d) (A + B) = A + B
e) A = A + A
19.- MULTIPLICACION DE MATRICES
19.1.- Vector fila por vector columna
Sean el vector fila X= x1 , x 2 , x3 , ..., x n de orden (1, n) , y el vector columna
y1
y2
.
Y
.
.
y
n
de orden (n,1)
110
X.Y x1
x2
y1
y2
.
n
... xn
x1 y1 x2 y2 ... xn yn xi yi
.
i 1
.
y
n
Comentarios:
a) Para que el producto XY pueda efectuarse, se requiere que los dos vectores
sean conformables. Esto es, ambos deben estar formados por el mismo
nmero de elementos. En este caso, el orden del vector fila X es (1, n) y del
vector columna Y es , por lo que el requisito se satisface.
b) El resultado del producto XY es un nmero real (un escalar) y no un vector.
El orden del producto es (1,1), esto es tantas filas como el vector X y tantas
columnas como el vector Y.
Ejemplo:
4
1
Sean los vectores X 1 2 3 4 y Y
2
1
4
1
XY 1 2 3 4 1(4) 2(1) 3(2) 4(1) 4 2 6 4 12
2
1
111
a11
a 21
A .
.
a
m1
a12
a 22
.
.
am2
... a1n
... a 2 n
... .
... .
... a mn
y1
y2
Y .
.
y
n
a11
a 21
AY .
a m1
a12
a 22
.
.
am2
...
...
...
...
...
a1 j y j
a1n y1 j 1
n
a2n y2 a2 j y j
. . j 1
.
. .
n .
a mn y n
a mj y j
j 1
Comentarios:
a) Para que el producto AY pueda efectuarse, se requiere que ambos factores
sean conformables. Esto es que el nmero de columnas de la matriz A sea
igual al nmero de filas del vector Y. En este caso el orden de la matriz es
(m, n) y el vector es (n,1) , por lo que el requisito se satisface.
b) El orden del producto AY es (n,1) , esto es un vector columna con tantas
filas como la matriz A y tantas columnas como el vector Y.
Ejemplo:
Sean:
1 2 1 0
A 2 0 1 1
3 1 2 0
4
1
Y
2
1
Para efectuar el producto AY, supondremos que la matriz A est formada por los
siguientes vectores filas de orden (1,4):
112
a1 1 2 1 0
a 2 2 0 1 1
a3 3 1 2 0
Multiplicamos cada vector fila de la matriz A por el vector columna Y, es decir que
multiplicamos los componentes correspondientes y sumamos los productos parciales,
como sigue:
4
1
a1 Y 1 2 1 0 1(4) 2(1) 1(2) 0(1) 4
2
1
4
1
a 2 Y 2 0 1 1 2(4) 0(1) 1(2) 1(1) 11
2
1
4
1
a3 Y 3 1 2 0 3(4) ( 1)(1) 2(2) 0(1) 17
2
1
4
1 2 1 0 4
1
AY 2 0 1 1 11
3 1 2 0 2 17
113
Sea :
1 2
2 0
A
3 1
1 1
Q 1 2 3 4
2
QA 1 2 3 4
3
2
0
1 2 3 4
1
1
1
2
1
1
1 2 3 4
2
0
QA 1(1) 2(2) 3(3) 4(1) 1(2) 2(0) 3(1) 4(1) 1(1) 2(1) 3(2) 4(0)
QA 18 3 9
B 0 1 2
1 0 1
1 2 3
A
4 5 6
114
1 2 3 0
1
AB
1
4 5 6 0
1
1 2 3 2
1 4 4 0
1 10 13 0
4 5 6 2
1
2
1 2 3 1
0
2
4 5 6 1
0
tr A aii
i 1
115
a12
a 22
A a 21
a
31
a12
a 22
a32
a13
a 23
a33
det A a11 a 22 a33 a 21 a32 a13 a12 a 23 a31 a13 a 22 a31 a 23 a32 a11 a12 a 21 a33
Propiedades:
a) Una matriz cuadrada y su traspuesta tienen el mismo determinante.
b) Si una matriz tiene dos filas o columnas iguales entre si, su determinante es
cero. Una matriz con determinante igual a cero se dice singular.
c) Una matriz con una lnea de ceros tiene determinante igual a cero.
d) El determinante del producto de dos matrices cuadradas de igual orden es
igual al producto de sus respectivos determinantes.
e) Si se multiplica una lnea de una matriz n x n por una constante, del
determinante queda multiplicado por esa constante. Si se multiplica una
matriz cuadrada por una constante, su determinante queda multiplicado por
dicha constante elevada a la potencia n-sima
23.- MTRICES INVERSAS
En el conjunto de los nmeros reales, para todo nmero c 0 existe un nmero b ,
llamado inverso multiplicativo (o recproco9, que verifica la propiedad
116
ab ba 1
1
a
a12
a 22
a) Se calcula la determinante de A
C
b) Se calcula la matriz de cofactores C1 j 11
C 21
C12 a 22
C 22 a12
a
C11 11
a21
a12
a22
a22
a
C12 11
a21
a12
a
a
a21 C22 11 12 a11
a22
a21 a22
a
C21 11
a21
a 21
a11
a12
a12
a22
C ' adj A
C ' 22
a 21 a11
117
d) Se calcula la inversa, A 1
1
adjA , como se puede observar para que
A
Ejemplo:
3 2
Hallar la inversa de A
1 0
C 12
C 22
0 1
2
3
0 2
adj A
1 3
A 1
1
1 0 2 0
1
adj A
2 1 3 1 / 2 3 / 2
a
Hallar la inversa de B 0 3 2
3 0 7
Como B 99 0 , B 1 existe.
3
0
1
C
0
1
2
0 2
0 3
7
3 7
3 0
21 6 9
4 1
4 1
1
7 31 3
7
3 7
3 0
5 8 12
1
4 1
4 1
2
0 2
0 3
118
21 7 5
adj B 6 31 8
9 3 12
B 1
21 7 5 21 / 99 7 / 99 5 / 99
1
1
adj B 6 31 8 6 / 99 31 / 99 8 / 99
B
99
9 3 12 9 / 99 3 / 99 12 / 99
119
APENDICE 3
CALCULO DE MATRICES CON EXCEL
1. Multiplicacin de matrices.
Para que la operacin de multiplicacin de matrices sea posible, se requiere que estas
sean conformables, es decir que consten de un nmero adecuado de filas y columnas.
En general, para que los factores sean conformables, el primero de ellos debe tener el
mismo nmero de columnas que el nmero de filas de la segunda matriz. O sea que si
A es de orden (m, n) y B es de orden ( s, t ) , el producto AB puede efectuarse
nicamente si n s . En caso contrario, cuando n s , la multiplicacin no esta definida
y no puede efectuarse.
El orden de la matriz producto es (m, t ) , es decir tantas filas como la matriz A y tantas
columnas como la matriz B.
Dado las siguientes matrices en Excel.
120
Para dar inicio al proceso de multiplicar dos matrices ubicamos el cursor en la celda a
partir de la cual queremos que aparezca el resultado de la multiplicacin (area de la
matriz producto) y luego activamos el comando de Pegar Funcin
Con lo que aparecer una primera ventana de dilogo, en la cual se buscara la funcin
MMULT, la cual est ubicada en la categora de funciones Matemticas y
trigonomtricas:
121
122
123
Definidos los rangos de las dos matrices, procedemos a hacer click en el botn
Aceptar, con lo cual nos aparecer el resultado en la celda selecionada.
124
126
127
128
129
3. Otras operaciones
Otra funcin importante que trae el Excel es el clculo de la determinante de una
matriz, cuyo procedimiento es similar a los casos anteriores.
130
131
CAPITULO VI
MULTICOLINEALIDAD
1. DEFINICION
Uno de los supuestos del modelo clsico es: cov( X i , X j ) 0 , es decir, entre dos
o ms variables explicativas del modelo no debe existir ninguna relacin. Si se viola
este supuesto, se presenta un hecho que se denomina multicolinealidad.
Se conoce como multicolinealidad
a una situacin en la que, como
consecuencia de una fuerte interrelacin entre las variables explicativas, es difcil
desligar los efectos que cada variable tiene, de forma individual sobre la variable
dependiente.
Por lo tanto podemos indicar que un modelo sufre de multicolinealidad cuando
hay presencia de una relacin lineal entre dos o ms variables explicativas del modelo,
como por ejemplo:
X 1 2 X 2 3 X 3
en las cuales la relacin entre las variables explicativas no es lineal (en el ejemplo
anterior, es cuadrtica) no violan el supuesto de no multicolinealidad.
Existen dos clases de multicolinealidades, la perfecta y la imperfecta. Existe
multicolinealidad perfecta cuando existe una relacin lineal entre dos a ms variables
explicativas del modelo, como por ejemplo: X 1 X 2 , es decir el comportamiento de
una de las variables explicativas es explicado en un 100% de los casos por otra
variable explicativa. Hay multicolinealidad imperfecta, cuando una variable explicativa,
es explicada en un porcentaje menor al 100% por otra(s) variable(s) explicativa(s), por
ejemplo: X 1 X 2 , donde v es una variable aleatoria o estocstica.
2. NATURALEZA DE LA MULTICOLINEALIDAD
A pesar que la definicin plantea que la multicolinealidad surge cuando existe
una relacin lineal entre las variables explicativas, lo ms comn que suceda en la
prctica, es que al recopilar los datos para las variables explicativas del modelo, nos
132
3. CONSECUENCIAS DE LA MULTICOLINEALIDAD
En el caso de la multicolinealidad perfecta, la consecuencia directa es que no
se pueden estimar los coeficientes, Al aplicar las ecuaciones mnimo cuadrticas,
estas nos darn cero sobre cero o lo que es lo mismo, indeterminado. Por ejemplo,
dado el siguiente modelo:
Yt 0 1 X 1t 2 X 2t u t
tenemos que:
x y x x y x x
x x x x
2
2
2
1
1 2
2
2
1 2
x y x x y x x
x x x x
2
x 2 y x 22 x 2 y x 22
x x
2
2
2
2
2
2
2 2
2
2
2
0
in det erminado
0
Desde el puntos de vista matricial al haber una relacin lineal entre dos o ms
columnas de la matriz X, la determinante de la matriz XX es igual a cero, por lo tanto,
es una matriz singular, y no se puede calcular su inversa, lo cual imposibilita el clculo
de los coeficientes de la ecuacin ( ( X ' X ) 1 X 'Y ).
En el caso de la multicolinealidad imperfecta, tenemos las siguientes consecuencias:
1 A diferencia del caso de multicolinealidad perfecta, si se pueden estimar los
coeficientes.
133
5. Los coeficientes pueden tener signo opuesto al esperado o una magnitud poco
creble.
Es importante hacer resaltar que pese a la presencia de multicolinealidad en el
modelo, si este presenta un coeficiente de determinacin elevado, el modelo
conservara su capacidad de estimar valores de la variable dependiente.
el cual nos indica que el consumo(C) de un bien esta en funcin lineal de los
niveles de ingreso (Y) y de los niveles de ahorro (S), puede esta bien planteado
desde el punto de vista terico (cuando una persona piensa comprar un vehculo
siempre toma en consideracin sus niveles de ingreso, para el pago de las
mensualidades y de sus ahorros para la inicial), Pero a nivel economtrico
sabemos que el ingreso y el ahorro no pueden esta conjuntamente como variables
explicativas dado que la teora econmica nos indica que el ahorro esta en funcin
directa de los niveles de ingreso.
2. Un segundo mtodo es a travs de las pruebas de significancia individual y global.
Si en un modelo estimado se rechaza la hiptesis H 0 : 1 2 ... n 0 a travs
de la prueba F y algunos coeficientes ( o todos) son individualmente no
significativos, mediante la prueba T. Esto da indicios de un posible problema de
multicolinealidad. Por ejemplo dado el siguiente modelo:
134
5%
95%
2,5%
H0
H1
-2,365
2,5%
H0 : i 0
H1 : i / 0
H1
2,365
i 1,2
135
5%
95%
5%
H0
H1
4,74
H 0 : 1 2 0
H1 : 1 2 0
0,9635 / 3 1
0,482
R 2 /( K 1)
96,40
2
1 R / N K 1 0,9635 / 10 3 0,005
EJERCICIO N 18
En el siguiente cuadro se tiene una Informacin hipottica sobre el gasto de consumo
Y (US$), el ingreso X 1 (US$) y la riqueza X 2 (US$.
136
X2
X1
70
65
90
95
110
115
120
140
155
150
80
100
120
140
160
180
200
220
240
260
810
1009
1273
1425
1633
1876
2052
2201
2435
2686
Yi 0 1 X 1i 2 X 2i u i
1 0 2 0
Yi 0 1 X 1i 2 X 2i u i
b)
X1
70
65
90
95
110
115
120
140
155
150
1110
80
100
120
140
160
180
200
220
240
260
1700
X2
810
1009
1273
1425
1633
1876
2052
2201
2435
2686
17400
X 2Y
X1Y
5600
56700
6500
65585
10800 114570
13300 135375
17600 179630
20700 215740
24000 246240
30800 308140
37200 377425
39000 402900
205500 2102305
X1
X2
X
N
X
N
X1 X 2
64800
100900
152760
199500
261280
337680
410400
484220
584400
698360
3294300
X1
6400
656100
10000
1018081
14400
1620529
19600
2030625
25600
2666689
32400
3519376
40000
4210704
48400
4844401
57600
5929225
67600
7214596
322000 33710326
1700
170
10
17400
1740
10
137
X 22
4900
4225
8100
9025
12100
13225
14400
19600
24025
22500
132100
Y
N
x y X Y NX Y
1
1110
111
10
x x X X
1 2
2
1
2
2
x y x x y x x
x x x x
2
1
1 2
2
2
1 2
2
2
x y x x y x x
x x x x
2
1
2
1
2
2
1 2
1 2
138
b) Anlisis.
b.1) Anlisis econmico: El signo del coeficiente que acompaa a la variable ingreso
es el esperado y nos indica que por cada dlar adicional de ingreso el consumo
aumentar en 0,9415 dlares. El signo del coeficiente que acompaa a la variable
riqueza no es el esperado lo cual puede indicar que hay cierto problema en los datos.
Este coeficiente tal como est nos indica que por cada dlar adicional de riqueza el
consumo disminuir en 0,0424 dlares.
b.2) Anlisis estadstico:
b.2.1) Coeficiente de determinacin R 2
R2
R2
1 x1 y 2 x 2 y
8890
u 1 R y
2
1 0,96358890 324,4459
N K
324,4459
46,3494
10 3
139
ee1 2
2
2
x x x x
2
1
ee1 46,3494
ee2 2
2
2
1 2
3434326
0,8229
235068000
2
1
x x x x
2
1
ee2 46,3494
2
2
1 2
33000
0,0807
235068000
5%
95%
2,5%
H1
-2,365
T1
2,5%
H0
H0 : i 0
H1 : i / 0
H1
2,365
i 1,2
1 1 0,9415 0 0,9415
1,1441
0,8229
0,8229
ee1
140
T2
2 2 0,0424 0 0,0424
0,5254
0,0807
0,0807
ee2
0,9635 / 3 1
0,4818
R 2 / K 1
92,6538
2
1 R / N K 1 0,9635 / 10 3 0,0052
5%
95%
5%
H0
H1
4,74
H 0 : 1 2 0
H1 : 1 2 0
:
Como 92,6538 4,74 entonces rechazamos la hiptesis nula y aceptamos la
alternativa de que los coeficientes son diferentes a cero, por lo que se concluye que
los coeficientes globalmente si son significativamente diferentes a cero.
141
Dado los resultados obtenidos en donde tenemos que los dos coeficientes
individualmente no son significativos y globalmente si lo son, se puede sospechar la
existencia de multicolinealidad en el modelo. Por lo cual estimaremos el coeficiente de
correlacin entre las dos variables explicativas para reafirmar o no la sospecha.
rX 1 X 2
cov( X 1 X 2 )
var X 1 var X 2
x x
x x
1 2
2
1
2
2
336300
0,9989
330003434326
El coeficiente de correlacin nos da un valor bastante alto lo que indica una fuerte
relacin entre las variables explicativas. Lo que reafirma la sospecha de la existencia
de multicolinealidad en el modelo
5. COMO SOLUCIONAR EL PROBLEMA DE MULTICOLINEALIDAD
1. El problema de multicolinealidad se reduce, de forma esencial, a una falta de
informacin suficiente que permita estimar de forma ms o menos exacta los
parmetros individuales. En algunas ocasiones podemos estar interesados en unos
parmetros ms que en otros y, si existe un elevado grado de multicolinealidad
entre las variables que forman parte de la regresin, podemos tratar de excluir una
de ellas y estimar los parmetros correspondientes al resto.
Al aplicar esta metodologa hay que tener mucho cuidado ya que al excluir o
eliminar una de las variables explicativas se puede correr el riego de que el modelo
se vea afectado en mayor medida que con la presencia de multicolinealidad. Se
puede dar el caso de que la variable eliminada sea importante para explicar el
comportamiento de la variable dependiente, motivo por el cual el nuevo modelo
regresado (sin la variable) pierda capacidad predictiva, lo cual se ve reflejado a
travs de una reduccin en el valor del coeficiente de determinacin y el posible
surgimiento de autocorrelacin. Cuando se presenta esta condicin se dice que el
modelo est mal especificado.
2. Algunos autores afirman que el problema de multicolinealidad es el mismo que se
presenta cuando se tienen pocos datos, y es el de tener unas varianzas muy
grandes. Por lo tanto, una forma de atenuar (no eliminar) el problema es
aumentando el tamao de la muestra.
3.
EJERCICIO N 19
En la pagina 82 se estim una regresin lineal para las ventas para la compaa
petrolfera Campsol, obtenindose los siguientes resultados.
Como se puede observar se tienen por lo menos tres (3) coeficientes individualmente
no son significativos, pero el Coeficiente de Determinacin o Bondad de ajuste arroja
un resultado bastante alto (0,921833) y finalmente la prueba de significancia global
nos indica que los coeficientes son globalmente significativos. Estos resultados nos
dan un primer indicio sobre la existencia de multicolinealidad en el modelo.
Para profundizar en el anlisis de la posibilidad de existencia o no de multicolinealidad,
procedemos a chequear la matriz de correlaciones:
143
144
145
R X2 1 / X 2 .... X K
Xt
RENTA
PRECIOS
VEHICULOS
INDICE
0,993621
0,917979
0,992940
0,935342
Cono se puede observar todos los R 2 dan valores cercanos a 1, lo que nos indica una
fuerte relacin entre las variables explicativas.
Por todo lo anterior, podemos decir que hay indicios de la presencia de
multicolinealidad en el modelo. La solucin al problema conlleva a la eliminacin de
aquellas variables causantes del problema, ya que observa que la relacin lineal entre
ellas es muy fuerte. Dado que en este caso, todas las variables explicativas guardan
relacin entre ellas, el proceso de eliminacin debe hacerse por tanteo hasta lograr un
modelo que cumpla con los requerimientos.
Por ejemplo, una estimacin tentativa, sera eliminando las variables. VEHICULOS e
INDICE, cuyo coeficiente de correlacin simple es uno de los mas elevado, aunque
hay que hacer la acotacin de que como se ver mas adelante puede presentar
problemas de autocorrelacin.
146
EJERCICIO N 20
CONS
RA
WA
RNA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
55,2
62,2
58,6
56,6
51,1
51,1
54,0
57,2
62,8
65,0
63,9
67,5
71,3
76,6
86,3
95,7
98,3
100,3
103,2
108,9
4,39
4,60
3,25
2,61
1,67
2,44
2,39
5,08
3,93
5,48
4,37
4,51
4,90
6,37
8,42
9,27
8,87
9,30
6,95
7,15
39,21
42,31
40,37
39,15
34,00
33,59
36,88
39,27
45,51
46,06
44,16
47,68
50,79
57,78
78,97
73,54
71,92
74,01
75,51
80,97
17,73
20,29
18,83
17,44
14,76
13,39
13,93
14,67
17,20
15,92
17,57
18,49
18,49
19,18
19,12
19,76
17,55
19,17
20,20
22,12
34
Ejercicio tomado de Pena Trapero, J. Bernardo, Julio A Estavillo D, Mara E. Galindo F., Mara J.
Leceta R. Y Mara del Mar Zamora S. Cien Ejercicios de Econometra. Ediciones Pirmide. Madrid.
1999. P.219.
147
CAPITULO VII
HETEROCEDASTICIDAD
1. DEFINICION
El supuesto de Homocedasticidad 35 nos indica que:
var(U i ) constante 2
AHORRO
GASTO
var(U i ) 2
HOMOCEDASTICIDAD
INGRESO
Lo cual significa nos indica que todos los trminos de perturbacin tienen la misma
varianza. Sin embargo, puede darse el caso de que no todos los trminos de
perturbacin tengan la misma varianza. Esta condicin de varianza inconstante se
conoce con el nombre de Heterocedasticidad 36. Como por ejemplo, al estudiar los
niveles de gasto de consumo de las familias a diferentes ingresos disponibles,
podemos encontrar que la varianza en el consumo se eleva con el nivel de ingresos.
Tal es el caso por el cual familias con mayores ingresos pueden tener mayor
flexibilidad respecto al consumo.
Otro ejemplo sera si queremos cuantificar una relacin en la que nos preocupe
explicar los gastos en innovacin que una empresa realiza, mediante diferentes
variables explicativas como el capital, o la estructura de empleo, es muy probable que
35
36
AHORRO
GASTO
var(U i ) i2
HETEROCEDASTICIDAD
INGRESO
Por otra parte, si pretendemos ajustar una regresin con datos regionales per
cpita en la que estamos interesados en contratar la relacin entre los gastos de
inversin en estructura y la renta de las regiones, es muy posible que los errores
presenten Heterocedasticidad por el hecho de que para obtener los valores de la
variable dependiente y explicativa hemos dividido los datos agregados por la poblacin
de cada regin, por lo que posiblemente las varianzas sean proporcionales a la
poblacin de cada regin que se ha utilizado para promediar dichos datos.
El problema de Heterocedasticidad es probablemente ms comn en la
informacin de corte transversal que en la informacin de series de tiempo. En la
informacin de corte transversal, generalmente se trata con miembros de una
poblacin en un momento dado del tiempo, tal como los consumidores individuales o
sus familias, empresas, industrias, o subdivisiones geogrficas tales como estados,
pases, ciudades, etc. Adems, estos miembros pueden ser de diferentes tamaos
como por ejemplo empresas pequeas, medianas o grandes o de ingresos bajos,
medios o altos. En las series de tiempo, por el contrario, las variables tienden a ser
datos de magnitud similares por que generalmente se recopila informacin sobre el
mismo fenmeno o hecho durante un perodo de tiempo (das, meses, aos, etc. Son
ejemplos el PIB, el gasto pblico, el empleo en Venezuela, durante el perodo 1960
2000.
149
2. CONSECUENCIAS DE LA HETEROCEDASTICIDAD
Para un modelo con perturbaciones heterocedsticas aceptaremos que cada
trmino del error u i est distribuido en forma normal con varianza, donde la varianza
2
i
i2 N K
de los coeficientes y las pruebas F y T. qu sucede con estos valores, son validos o
no?.
~
ee 1
1
X NX 2
2
u i 0 1 X i i
1
i
Xi
1
u i 0 1
i
Xi
u i 0 1
Prueba de Glejser
valor absoluto
151
EJERCICIO N 21
OBSERVACIONES
Andalucia
Aragn
Asturias
Baleares
Canarias
Cantabria
Castilla y Len
Castilla-La Mancha
Catalua
Comunidad Valenciana
Extramadura
Galicia
Madrid
Murcia
Navarra
Pas Vasco
La Rioja
Ceuta y Melilla
PIB
EMPLEO
6.895.665
1.747.221
1.338.540
1.150.586
1.830.265
660.038
2.980.371
1.846.983
9.511.088
4.949.357
963.305
2.752.518
7.935.591
1.240.645
840.372
3.251.025
384.298
135.876
1.834,1
412.3
351.2
252.9
446.4
162.3
841.6
528.3
2.222,9
1.276,7
302.6
1.012,8
1.636,0
317,0
183.9
708.5
90.3
29.7
38
Tomado de: Pena Trampero J. Bernardo, julio A. Estavillo D. Y y otros autores. Cien ejercicios de Econometra.
Ediciones Pirmide S.A. Madrid 1999.
152
R 2 0,964613
Este grfico permite observar que a niveles bajos de PIB existe pequea volatilidad en
la ocupacin y, sin embargo, la dispersin aumenta a medida que lo hace el PIB:
En segundo lugar, se puede analizar tambin de forma grfica la relacin existente
entre los residuos y la variable explicativa:
153
para que la probabilidad de rechazar la hiptesis nula siendo cierta sea menor al 5%
rechazaremos la hiptesis nula de Homocedasticidad.
queramos
detectar
la
presencia
de
155
Y obtenemos:
156
i2 2 X i2
donde 2 es la varianza Homocedstica.
bajo esta hiptesis de Heterocedasticidad, si se trata de restablecer la igualdad
de varianza en, se tendra que transformar el modelo dividiendo el modelo original
por, con lo que la especificacin a estimar sera
Yi
u
0 1 i
Xi Xi
Xi
comprobacin:
u
var i
Xi
u
E i
Xi
E U i
i2
2 2
2
Xi
EX i
i2 2 X i
con lo que el modelo con el mismo propsito que anteriormente resultara:
Yi
Xi
0
Xi
1 X i
157
ui
Xi
EJERCICIO N 22
UNIDAD
FAMILIAR
AHORRO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
RENTA
DISPONIBLE
12,2
14,2
17,9
21,4
23,7
24,9
27,1
31,6
35,4
37,5
40,7
42,5
45,0
47,7
51,0
53,7
38,3
43,5
53,5
60,8
66,4
71,2
77,2
86,1
94,6
102,4
109,9
115,6
121,0
127,0
129,9
134,7
S i 0 1Yi u i
40
Tomado de: Daz Fernndez, Monserrat y Mara del Mar Llorente Marrn. Ob.Cit. p.255
158
159
Como se puede observar en el grfico, existe una tendencia que implica una relacin
inversa entre los residuales y el ingreso lo cual es indicativo de la precencia de
heterocedasticidad en el modelo.
b) Prueba de Park
Lnui2 0 1 ln X i i
160
ui 0 1Yi i
u i 0 1 ln Yi i
161
u i 0 1Yi 2 i
ui 0 1
162
1
i
Yi
t 4,9051 .
u i 0 1Yi 2 i ,
163
E ui2 2Yi 4
siendo,
1
1 u
Si
0 2 1 I2
2
YI
YI
YI YI
la transformacin a realizar, dado que
2
u
1
E i2
E Yi 2
Yi
E ui2
164
1
E ui2 2
4
Yi
donde:
AHORROT
SI
YI2
INVINGRESO 2
INVINGRESO
1
YI2
1
YI
165
Cov (u ) E uu 2 (1)
.
41
PY PX PU ,
O bien:
X
U
(2)
Y
Donde
PY, X
PX, U
PU
Y
0 y
Con: EU
E U
U
PE UUP 2 PP 2 PPP 1 P 2 I
Var U
X
U
es:
en Y
X
X
1 X
Y
XPPX 1 XPPY
X 1X
X 1Y
Var Y 2 X 1X
167
2
cov(u)
2
2
2n
-1
1
22
..
1
2n
Es decir, la matriz cuyos elementos diagonales son los recprocos de las varianzas
correspondientes de los trminos de perturbacin estocstica. Esta es la matriz
inversa que en teora, debe ser empleada en el estimador MCG para el caso de
heterocedasticidad. Si las n varianzas estn dadas, este estimador puede ser
calculado.
Desde otro punto de vista:
1
-1 PP donde P
1
2
1
n
La matriz P es una matriz diagonal cuyos elementos en la diagonal principal son los
recprocos de las desviaciones estndar correspondientes de los trminos de
perturbacin, por lo tanto se puede deducir que tanto la variable dependiente como las
variables explicativas son ponderadas en cada observacin por el recproco de la
desviacin estndar de la variable dependiente (o trmino de perturbacin estocstica)
en esa observacin. As, en este caso, la estimacin MCG puede interpretarse como
168
una estimacin MCO para la cual los datos son reemplazados por los datos
transformados:
y1
1
y
2
2
.
PY
.
.
yn
x1
1
x
2
2
.
PX
.
.
xn
EJERCICIO N 23
42
OBSERVACIONES
Pimiento
Acelga
Ajo
Alcahofa
Batata
Berenjenas
Calabaza y calabacn
Cardo
Coliflor
Escarola
Guisantes verdes
Habas verdes
Judas verdes
Lechuga
Meln
Pepino
Sanda
7.338
702
2.063
3.341
329
1.367
2.430
270
2.747
535
567
890
2.473
9.535
8.528
3.357
6.046
25.243
3.283
30.548
23.556
1.779
4.208
6.739
1.050
13.903
2.504
10.398
12.393
25.526
33.797
50.514
7.083
23.217
170
CAPITULO VIII
AUTOCORRELACIN
1. DEFINICION
Y XU
cov U
;U
Y XU
cov U
;U
Uno de los supuestos del modelo clsico nos indica que: covu i ; u j 0 que nos
indica que la covarianza entre las perturbaciones de un modelo debe ser igual a cero,
ms concretamente el supuesto indica que no debe existir ninguna relacin entre dos
o ms observaciones diferentes de la variable estocstica. Si este supuesto no se
cumple, se dice que el modelo presenta problemas de autocorrelacin o correlacin
serial.
Por lo tanto el trmino autocorrelacin se puede definir como la correlacin existente
en el trmino de perturbacin ( u ).
De manera simplificada se puede decir que un modelo presenta problemas de
autocorrelacin cuando el trmino de perturbacin (la variable aleatoria) est
absorbiendo algn elemento que es importante para explicar el comportamiento de la
variable dependiente, que no est planteado en forma explcita en el modelo.
Son causas de autocorrelacin:
a) Problemas en la especificacin del modelo, que pueden ser de 2 tipos: forma
funcional incorrecta y omisin de variables.
En el primer caso se dice que un modelo est mal especificado cuando no tiene la
forma funcional correcta, por ejemplo, la teora de costos nos indica que la curva de
costo medio est representada por una funcin cuadrtica.
C 0 1 X 2 X 2 u
171
2 X 2 u
C 0 1 X
En segundo lugar, un modelo est mal especificado cuando se omite una variable
explicativa en el modelo que es importante para explicar las variaciones de la
variable dependiente.
Por ejemplo, si tenemos una funcin en que la demanda de un bien est explicada
por el precio del bien y por el ingreso familiar:
C 1 P 2Y u
1 P u
172
U , U
U ,U
0
tiempo
U , U
tiempo
U ,U
tiempo
tiempo
Patrones de autocorrelacin
u t u t 1 t
173
U t
U t
U t 1
U t 1
174
u
t 2
u t 1
u
t 1
2
t
u
d
2
t
u
d
2u t u t 1 u t21
2
t
2
t
2 u t u t 1 u t2
2
t
2
t
2 u t2 2 u t u t 1
2
t
u t u t 1
21
2
u
t
si definimos que
175
u u
u
t
t 1
2
t
d 21
tenemos que
La anterior identidad nos da una aproximacin de los valores que puede tomar el
estadstico Durbin Watson.
Si 1
d 4
Si 0
d 2
Si 1
d 0
El cuadro nos indica que el estadstico de Durbin - Watson siempre ser un valor
positivo y menor o igual que cuatro, pero en el mismo solo se presentan las casos
extremos de perfecta autocorrelacin positiva y negativa, y el caso de que no haya
autocorrelacin, pero generalmente el estadstico tendr un valor comprendido entre
estos valores extremos, como podra ser por ejemplo: d = 1,34. Para poder decidir
sobre la existencia o no de autocorrelacin dado un valor del Durbin Watson,
utilizaremos como herramienta complementaria, el grfico del Durbin Watson:
ZONA DE
INDECISION
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
dl
du
4-du
4-dl
176
RESULTADO
Se acepta la presencia de autocorrelacin
positiva.
Resultado indeterminado.
No hay autocorrelacin.
Resultado indeterminado.
Se acepta la presencia de autocorrelacin
negativa.
Los valores de los lmites dl y du son determinados a travs de la tabla del estadstico
Durbin Watson:
Por ejemplo para un modelo con 3 variables explicativas y 20 observaciones, los
valores de dl y du son:
20
21
22
23
.
.
.
1.411
1.420
1.429
1.437
1.201
1.221
1.239
1.257
1.100
1.125
1.147
1.168
1.537
1.538
1.541
1.543
0.897
0.933
0.967
2.104
2.060
2.023
177
1.964
1.940
1.920
ZONA DE
INDECISION
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
0,998
1,676
2,324 3.002
EJERCICIO N 24
1.328
1.338
1.383
1.658
1.659
1.666
50
55
60
65
.
.
.
1.585
1.601
1.616
1.629
1.421
1.452
1.480
1.503
1.674
1.681
1.689
1.696
1.503
1.528
1.549
1.567
1.462
1.490
1.514
1.536
1.628
1.641
1.652
1.662
ZONA DE
INDECISION
1.273
1.285
1.336
1.722 1.218
1.721 1.230
1.720 1.287
1.789
1.786
1.776
1.724 1.374
1.727 1.408
1.731 1.438
1.768
1.767
1.767
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
1,378
1,721
2,279 2,622
a) d = 1,05
43
0<1,05<1,378
EJERCICIO N 25
Y
699
730
763
749
766
858
438
1021
1084
1161
1257
1314
1385
1490
1580
1652
1778
X
776
811
791
825
986
1206
1321
1495
1846
2140
2356
2694
3227
4006
4960
5940
6941
Respuesta:
Primeramente regresamos el modelo, para poder obtener los valores de los
residuales recordando que un residual es igual a la diferencia existente entre el valor
de Y observado y el valor de Y estimado: U t Yt Yt
Yt 0 1 X t u t
1 0
Yt 0 1 X T uT
179
XY NXY
X NX
2
0,188
2
58.936.000
164.292.835 172.489,47
YT 633,45 0,188 X T
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
AO
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
Y
X
XY
699.00
776.00
542,424.00
730.00
811.00
592,030.00
763.00
791.00
603,533.00
749.00
825.00
617,925.00
766.00
986.00
755,276.00
858.00 1,206.00 1,034,748.00
438.00 1,321.00
578,598.00
1,021.00 1,495.00 1,526,395.00
1,084.00 1,846.00 2,001,064.00
1,161.00 2,140.00 2,484,540.00
1,257.00 2,356.00 2,961,492.00
1,314.00 2,694.00 3,539,916.00
1,385.00 3,227.00 4,469,395.00
1,490.00 4,006.00 5,968,940.00
1,580.00 4,960.00 7,836,800.00
1,652.00 5,940.00 9,812,880.00
1,778.00 6,941.00 12,341,098.00
18,725.00 42,321.00 57,667,054.00
180
602,176.00
657,721.00
625,681.00
680,625.00
972,196.00
1,454,436.00
1,745,041.00
2,235,025.00
3,407,716.00
4,579,600.00
5,550,736.00
7,257,636.00
10,413,529.00
16,048,036.00
24,601,600.00
35,283,600.00
48,177,481.00
164,292,835.00
AO
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
Y
699.00
730.00
763.00
749.00
766.00
858.00
438.00
1,021.00
1,084.00
1,161.00
1,257.00
1,314.00
1,385.00
1,490.00
1,580.00
1,652.00
1,778.00
18,725.00
U t
U t U t 1
779.34 -80.34
785.92 -55.92
782.16 -19.16
788.55 -39.55
818.82 -52.82
860.18
-2.18
881.80 -443.80
914.51 106.49
980.50 103.50
1,035.77 125.23
1,076.38 180.62
1,139.92 174.08
1,240.13 144.87
1,386.58 103.42
1,565.93
14.07
1,750.17 -98.17
1,938.36 -160.36
0.00
24.42
36.76
-20.39
-13.27
50.64
-441.62
550.29
-2.99
21.73
55.39
-6.54
-29.20
-41.45
-89.35
-112.24
-62.19
(U t U t 1 )2
2
U t
6,454.19
596.34
3,126.82
1,351.30
367.03
415.83
1,564.20
176.04
2,789.74
2,564.41
4.74
195,028.22 196,956.66
302,816.88
11,340.12
8.93
10,712.66
472.11
15,682.55
3,068.27
32,624.31
42.82
30,303.15
852.87
20,988.48
1,718.27
10,696.11
7,983.78
197.96
12,597.82
9,637.35
3,867.35
25,714.69
533,561.24 379,160.78
u
t 2
u t 1
u
t 1
2
t
533.561,24
1,407
379.160,78
1.381
1.391
1.401
1.015 1.536
1.046
1.074
1.535
1.536
0.897
0.933
0.967
181
1.710
1.696
1.685
0.779
0.820
0.859
1.900 0.664
1.872 0.710
1.848 0.752
2.104
2.060
2.023
ZONA DE
INDECISION
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
1,015
1,536
2,464 2,985
(1)
(2)
Yt 1 0 1 X 1 u t 1
(3)
182
Yt Yt 1 0 (1 ) 1 ( X t X t 1 ) u t u t 1
Yt Yt 1 0 (1 ) 1 ( X t X t 1 ) t
d
2
183
u u
u
t
t 1
2
t
EJERCICIO N 26
En la siguiente tabla tenemos los datos sobre importaciones (Y) y el Producto Interno
Bruto (X) para un determinado pas.
AO
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
Y
8.5324
8.9014
8.4803
8.8930
9.1000
9.6888
9.7070
9.8690
9.9479
10.3831
11.2380
11.1803
11.3324
11.6282
12.4099
12.4775
12.6901
13.2535
13.9578
14.6620
184
X
23.5138
24.2506
24.1241
25.2862
26.2759
27.0954
27.5747
28.1368
28.2368
29.3655
30.8207
31.9207
32.3333
33.7559
35.6920
36.5885
37.2184
38.0230
39.2874
40.0920
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
AO
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
X2
Y
X
XY
8.5324 23.5138
200.6289
8.9014 24.2506
215.8642
8.4803 24.1241
204.5795
8.8930 25.2862
224.8692
9.1000 26.2759
239.1103
9.6888 27.0954
262.5212
9.7070 27.5747
267.6689
9.8690 28.1368
277.6823
9.9479 28.2368
280.8963
10.3831 29.3655
304.9051
11.2380 30.8207
346.3638
11.1803 31.9207
356.8823
11.3324 32.3333
366.4140
11.6282 33.7559
392.5189
12.4099 35.6920
442.9322
12.4775 36.5885
456.5317
12.6901 37.2184
472.3066
13.2535 38.0230
503.9385
13.9578 39.2874
548.3631
14.6620 40.0920
587.8270
218.3324 619.5915 6,952.8041
552.8983
588.0901
581.9741
639.3924
690.4208
734.1607
760.3646
791.6784
797.3157
862.3338
949.9149
1,018.9305
1,045.4449
1,139.4581
1,273.9160
1,338.7191
1,385.2086
1,445.7478
1,543.4967
1,607.3645
19,746.8299
Y
8.3617
8.6138
8.5705
8.9682
9.3069
9.5874
9.7514
9.9438
9.9780
10.3643
10.8622
11.2387
11.3799
11.8667
12.5293
12.8361
13.0517
13.3270
13.7597
14.0351
Ut
Ut U t 1
0.1707
0.2876
-0.0902
-0.0753
-0.2069
0.1014
-0.0444
-0.0747
-0.0301
0.0188
0.3758
-0.0584
-0.0475
-0.2386
-0.1194
-0.3587
-0.3615
-0.0735
0.1980
0.6269
0.0000
(U t U t 1 ) 2
0.1169
-0.3779
0.0150
-0.1316
0.3083
-0.1458
-0.0304
0.0446
0.0489
0.3569
-0.4342
0.0109
-0.1910
0.1191
-0.2392
-0.0029
0.2880
0.2715
0.4289
0.0137
0.1428
0.0002
0.0173
0.0951
0.0212
0.0009
0.0020
0.0024
0.1274
0.1885
0.0001
0.0365
0.0142
0.0572
0.0000
0.0830
0.0737
0.1839
1.0602
U t2
0.0292
0.0827
0.0081
0.0057
0.0428
0.0103
0.0020
0.0056
0.0009
0.0004
0.1412
0.0034
0.0023
0.0569
0.0143
0.1286
0.1307
0.0054
0.0392
0.3930
1.1026
1,0602
0,962
1,1026
ZONA DE
INDECISION
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
1,100
1,537
2,463 2,900
0 <0,962 <1,100 con lo cual se concluye que hay evidencia de autocorrelacin positiva
en el modelo.
Para eliminar el problema de autocorrelacin, estimaremos el modelo de diferencias
generalizadas:
Yt Yt 1 0 (1 ) 1 ( X t X t 1 ) t
185
para lo cual tendremos que estimar el valor del coeficiente de autocorrelacin, la cual
se realizar a travs de la identidad:
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
AO
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
u u
u
t
t 1
2
t
0,3614
0,337
1,0735
U t
U tU t 1
0.2876
-0.0902
-0.0753
-0.2069
0.1014
-0.0444
-0.0747
-0.0301
0.0188
0.3758
-0.0584
-0.0475
-0.2386
-0.1194
-0.3587
-0.3615
-0.0735
0.1980
0.6269
0.0491
-0.0260
0.0068
0.0156
-0.0210
-0.0045
0.0033
0.0022
-0.0006
0.0071
-0.0220
0.0028
0.0113
0.0285
0.0428
0.1297
0.0266
-0.0146
0.1241
0.3614
U t2
0.0827
0.0081
0.0057
0.0428
0.0103
0.0020
0.0056
0.0009
0.0004
0.1412
0.0034
0.0023
0.0569
0.0143
0.1286
0.1307
0.0054
0.0392
0.3930
1.0735
186
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
AO
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
Y
X Yt 0,337Yt 1 X t 0,337 X t 1
8.5324 23.5138
8.9014 24.2506
6.0260
16.3264
8.4803 24.1241
5.4805
15.9517
8.8930 25.2862
6.0351
17.1564
9.1000 26.2759
6.1031
17.7544
9.6888 27.0954
6.6221
18.2404
9.7070 27.5747
6.4419
18.4436
9.8690 28.1368
6.5977
18.8441
9.9479 28.2368
6.6220
18.7547
10.3831 29.3655
7.0307
19.8497
11.2380 30.8207
7.7389
20.9245
11.1803 31.9207
7.3931
21.5341
11.3324 32.3333
7.5646
21.5761
11.6282 33.7559
7.8092
22.8595
12.4099 35.6920
8.4912
24.3162
12.4775 36.5885
8.2953
24.5603
12.6901 37.2184
8.4852
24.8881
13.2535 38.0230
8.9769
25.4804
13.9578 39.2874
9.4913
26.4736
14.6620 40.0920
9.9582
26.8521
218.3324 619.5915
141.1631
400.7864
187
X*Y*
98.3829
87.4234
103.5405
108.3564
120.7895
118.8120
124.3285
124.1941
139.5567
161.9332
159.2031
163.2151
178.5136
206.4732
203.7361
211.1811
228.7360
251.2694
267.3989
3057.0438
X *2
266.5521
254.4567
294.3412
315.2190
332.7135
340.1649
355.1002
351.7382
394.0116
437.8351
463.7182
465.5267
522.5579
591.2793
603.2093
619.4156
649.2504
700.8522
721.0358
8678.9778
EJERCICIO N 27
AO
N DE
TRANSACCIONES
PNB
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
699
730
763
749
766
858
438
1021
1084
1161
1257
1314
1385
1490
1580
1652
1778
776
811
791
825
986
1206
1321
1495
1846
2140
2356
2694
3227
4006
4960
5940
6941
Yt 0 1 PNBt ut
Trataremos de detectar y en su caso corregir, un posible problema de Autocorrelacin.
Para realizar el anlisis de la posible existencia de autocorrelacin en los residuos, es
necesario estimar el modelo original
44
Tomado de: Daz Fernndez, Monserrat y Mara del Mar Llorente Marrn. Ob.Cit. p.218
188
189
190
ZONA DE
INDECISION
K=5
dl
0,505
0,562
0,615
0,664
0,710
0,752
du
2,296
2,220
2,157
2,104
2,060
2,023
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
NEGATIVA
1,133
1,381
2,619 2,867
1,40667
dado que dl 1,133 d 1,40667 du 1,381 diremos que nos hemos situado en una
zona de indecisin, en la que nada podemos decir acerca de la presencia o no de
autocorrelacin en el modelo.
c) Por ltimo dado que suponemos que el esquema de autocorrelacin mediante el
cual se genera la variable aleatoria es de primer orden, podemos contrastar la
presencia de autocorrelacin, analizando la significatividad estadstica del
parmetro en la regresin.
u t u t 1 t
191
EJERCICIO N 28
AO
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
PIBPM
28.200.885
32.323.992
36.143.972
40.158.739
45.044.128
50.145.195
54.927.320
59.104.986
60.952.584
64.811.535
69.780.058
73.743.261
77.896.586
CP
4.498.034
4.740.221
5.159.905
5.368.137
5.813.462
6.197.776
6.543.696
6.808.095
6.971.511
6.948.140
7.074.014
7.141.101
7.239.097
CPt 0 1 PIBPM t ut
Trataremos de detectar y en su caso corregir, un posible problema de Autocorrelacin.
45
193
194
ZONA DE
INDECISION
K=6
dl
0,203
0,268
0,328
0,389
0,447
du
3,005
2,832
2,692
2,572
2,472
ZONA DE
INDECISION
AUTOCORRELACION
AUTOCORRELACION
NO HAY AUTOCORRELACION
POSITIVA
1,010
0,343122
NEGATIVA
1,340
2,660 2,990
u t u t 1 t
195
46
197
IMPORTACIONES
PNB
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
23,2
23,1
25,2
26,4
28,4
32,1
37,7
40,6
47,7
52,9
58,5
64,2
75,9
94,4
131,9
126,9
155,4
185,8
217,5
260,9
506,1
523,3
563,8
594,7
635,7
688,1
753,1
796,3
868,5
935,5
982,4
1063,4
1171,1
1306,6
1412,9
1528,8
1702,2
1899,5
2127,6
2368,5
Se pide:
a) Estimar una funcin que relacione las importaciones con el PNB.
b) Determinar la posible existencia de autocorrelacin en el modelo mediante:
b.1) Contrastes Grficos.
b.2) Contraste de Durbin Watson.
c) En caso de ser necesario corregir el problema
47
Tomado de: Salvatore, Dominick. Econometra. Serie Schaum. McGraw-Hill.. Mexico. 1983. P161
198
CAPITULO IX
VARIABLES FICTICIAS, MODELOS DE REZAGOS DISTRIBUIDOS Y
MODELOS AUTORREGRESIVOS.
1. VARIABLES FICTICIAS O CUALITATIVAS (VARIABLES DUMMY)
En la especificacin del modelo de regresin lineal hemos considerado, hasta
ahora, que las variables seleccionadas son de carcter cuantitativo, es decir, variables
que toman de forma continua valores reales.
Factores como el sexo, estado civil o la localizacin geogrfica constituyen
variables de carcter cualitativo que desempean un papel protagonista en el estudio
de los fenmenos econmicos, que hasta ahora no hemos considerado en el modelo
de regresin. Cuando queremos construir un modelo economtrico que, por ejemplo,
describa las pautas de consumo con relacin a un determinado bien, la consideracin
de factores como la localizacin, rural o urbana, de las unidades familiares o la
situacin de la cabeza de familia con relacin al empleo, el componente estacional,
adems de las variables cuantitativas habituales, constituyen variables a tener en
cuenta para explicar el comportamiento de la variable dependiente.
Los factores de naturaleza cualitativa no slo se incluyen dentro de la categora
de variables explicativas, sino que tambin pueden aparecer en el modelo como
variable a explicar o dependiente. El anlisis de la influencia de la localizacin
geogrfica, rural o urbana, en el comportamiento electoral de una determinada
poblacin constituyen un claro ejemplo con relacin a esta cuestin. El tratamiento de
estas situaciones requiere la construccin de unas variables artificiales que permitan
cuantificar las variaciones cualitativas de los distintos factores considerados. En
trminos economtricos, estas variables se denominan variables ficticias y nicamente
toman los valores de 1 y 0. Tomarn el valor de 1 cuando en el elemento muestral
correspondiente se constate la presencia del atributo considerado, y el valor 0, cuando
aquel no est presente en la correspondiente unidad muestral. En otras palabras
valores 1 y 0 para denotar la presencia o ausencia, respectivamente, del atributo
considerado.
Estas variables reciben tambin la denominacin de variables binarias o
dicotmicas, con relacin a los dos valores que toman, 1 y 0. En ocasiones se utiliza
tambin la denominacin inglesa, variables dummy, para su consideracin. 48
Un ejemplo de un modelo que utilice variables ficticias sera:
48
Yt o 1 X 1t 2 X 2t 3 Dt u t
Donde D es la variable ficticia. Es de uso prctico utilizar la letra D (dummy) para las
variables ficticias y as poder diferenciar a simple vista, una variable cualitativa de una
cuantitativa
Para considerar la interpretacin que en un modelo economtrico se debe dar a
los coeficientes de las variables ficticias plantearemos un ejemplo muy sencillo.
Supongamos que tenemos una muestra con los salarios de N individuos y una
caracterstica ocupacional que representa si el individuo es un trabajador es un
profesional universitario o no. Se pretende explicar el nivel de salarios de los
individuos y para ello se plantea la siguiente regresin simple:
Yi 0 1 Di u i
200
1, si1, el
trabajador
es
si el
trabajador es
licenciado
universitario
tcnico superior
D2i D1i
0, si no lo es
0, si no lo es
D1i
D2i
Licenciado
Tcnico Superior
No universitario
TRABAJADOR
si
0 1
0 2
si
si
D1i = 0
D2i = 0
D1i = 1
D2i = 0
D1i = 0
D2i = 1
201
EJERCICIO N 30
AO
1968
1969
1970
1971
1972
1973
I
1.564
2.129
1.381
1.304
1.398
1.382
TRIMESTRES
II
III
1.654
1.658
1.039
1.288
1.176
888
1.607
1.428
975
1.108
1.099
933
IV
1.994
1.503
1.230
1.446
1.219
1.156
49
50
VENTAS t 1 D1 2 D2 3 D3 4 D4 u t
Donde: D1 = 1 para el primer trimestre, 0 de lo contrario.
D2 = 1 para el segundo trimestre, 0 de lo contrario.
D3 = 1 para el tercer trimestre, 0 de lo contrario.
D4 = 1 para el cuarto trimestre, 0 de lo contrario.
203
sucede
con cierto nmero de perodos de diferencia, por la tanto es importante
especificar en un modelo este hecho. Tal especificacin lo podemos realizar a travs
de un modelo de rezago distribuido, el cual es un caso particular de las series de
tiempo.
Un modelo de rezagos distribuidos se caracteriza por incluir no solamente los
valores actuales sino adems los valores rezagados (pasados) de las variables
explicativas:
Yt 0 X t 1 X t 1 2 X t 2 ... k X t k u t
i 0
0 1 2 ... k
51
Xt
X t 1
10
20
30
40
50
.
.
.
100
---10
20
30
40
.
.
.
90
X t 2
X t 3
------10
20
30
.
.
.
80
X t n
---------10
20
.
.
.
70
---------------.
.
.
10
52
Gujarati. Ob.cit.
205
EJERCICIO N 31
Para tal fin vamos agregando un retardo por vez al modelo y vamos observando los
estadsticos antes sealados.
En la tabla que se presenta a continuacin, se recogen para cada uno de los modelos
estimados, el nmero de retardos utilizados (M), el nmero total de observaciones (N*
= N M), el valor del coeficiente de determinacin ajustado (CDA), el criterio de
informacin de Akaike (AIC) y el criterio de Schwarz (SBC).
53
54
n 1
R 2 1 R2
n k 1
La ventaja que presenta este coeficiente frente al R2 es que permite comparar la capacidad explicativa
de modelos referidos a una misma muestra de la misma variable endgena con distinto nmero de
variables explicativas.
- El criterio de informacin de Akaike (Akaike info criterion) y el Criterio de Schwarz (Schwarz criterion),
son dos estadsticos que sirven para analizar la capacidad explicativa de un modelo y permite realizar
comparaciones a este respecto entre modelos anidados.
206
T*
CDA
AIC
SBC
0
1
2
3
4
5
6
7
8
25
24
23
22
21
20
19
18
17
0,782131
0,793596
0,790627
0,770240
0,827643
0,919698
0,966824
0,979235
0,972380
19,45869
19,48690
19,55606
19,70695
19,49262
18,81132
18,00576
17,59055
17,78463
19,55620
19,63416
19,75353
19,95491
19,79105
19,15982
18,40342
18,03573
18,27476
Los resultados de la tabla llevan a seleccionar el modelo que incluye siete retardos de
la variable IMPORTACIONES, ya que es el que presenta el mayor coeficiente de
determinacin ajustado y el menor valor en los criterios de Akaike y de Schwarz.
207
3. MODELOS AUTORREGRESIVOS
EJERCICIO N 32
55
Tomado de: Carrascal A. Ursicino. Yolanda Gonzalez G. Y Beatriz Rodrguez. Anlisis Economtrico
con Eviews. RA-MA. Madrid. 2001. p.296.
208
PIBCF 80 t 0 1 I 80 t 2 PIBCF 80 t 1 u t
obtenindose los siguientes resultados:
209
210
En las series de tiempo, una de las hiptesis que suponemos cumple el modelo de
regresin es que los coeficientes se mantienen constantes para todo el perodo
muestral. Sin embargo, es posible que existan submuestras para las que el
comportamiento del modelo, su estructura, sea diferente, siendo necesario contrastar
esta posibilidad.
Una de las pruebas ms populares para identificar un cambio estructural en el modelo,
es la Prueba de CHOW.
Dada una muestra de tamao N, se dividir en la unidad temporal en la que se
produce el cambio estructural de los coeficientes, obtenindose dos submuestras de
tamao n1 y n2 , respectivamente. El contraste de estabilidad en el comportamiento
estructural del modelo se plantear comprobar si los coeficientes se mantienen
constantes para las dos submuestras, o por el contrario, se mantienen constantes para
las dos submuestras.
Dado
211
H 0 : 1 1
H1 : 1 1
Si el modelo presenta un comportamiento estable, se estimara el modelo (1) con una
muestra de N = n1 + n2, observaciones. Si no presenta un comportamiento estable,
necesariamente hay que estimar un modelo para cada submuestra, es decir los
modelos (2) y (3).
Denominando SRC, a la suma de residuos mnimo-cuadrticos de la muestra de
tamao N, y SRCn1 y SRCn2, respectivamente, la suma de residuos al cuadrado de
cada submuestra individualmente, se calcula el estadstico F siguiente:
SRC N SRC n1 SRC n2
k
F
SRC n1 SRC n2
n1 n 2 2k
212
213
214
CAPITULO X
ESTACIONARIEDAD
Segn Jos Otero 56, una serie de tiempo o serie cronolgica, es una sucesin de
valores observados de una variable referidos a momentos o a periodos de tiempo
diferentes, generalmente regulares. La caracterstica distintiva entre una serie de
tiempo , en contraposicin a las observaciones de corte transversal, es que los datos
aparecen ordenados cronolgicamente.
Una serie de tiempo est conformada por las siguientes partes 57:
1.PROCESOS ESTOCASTICOS
Un proceso estocstico X t , para t = 1,2,3,..., se define como una coleccin de
variables aleatorias, X t , ordenadas de acuerdo con el parmetro discreto , que en
2. CAMINATA ALEATORIA
El ejemplo mas simple de una serie de tiempo estocstica es el proceso de caminata
aleatoria o Random Walk 59. En el proceso ms simple de caminata aleatoria cada
cambio sucesivo en y t es extrado en forma independiente de una distribucin de
probabilidad con media 0. Por tanto, y t est determinado por:
y t y t 1 t
3. ESTACIONARIEDAD
Cuando se comienza a desarrollar modelos para series de tiempo, se desea saber si
es posible suponer que el proceso estocstico subyacente que gener la series es
invariable con respecto al tiempo. Si las caractersticas del proceso estocstico
cambian con el tiempo; es decir, si el proceso no es estacionario, en general ser
difcil representar la serie de tiempo durante intervalos de tiempo pasados y futuros
con un modelo algebraico simple. Por el contrario, si el proceso estocstico est fijo en
el tiempo; es decir, si es estacionario, entonces podemos modelar el proceso a travs
de una ecuacin con coeficientes fijos que pueden estimarse a partir de datos
pasados.
Grfico N 2
61
El ejemplo es tomado de Pulido, Antonio y Ana Mara Lpez. Ob.Cit. y el mismo consiste en una serie
de tiempo que abarca el periodo 1980-1998, con periodicidad mensual de un indicador de renta salarial
real para la economa espaola.
217
ESTACIONARIA
Tiene una
NO ESTACIONARIA
Muy pocas series econmicas de tiempo son estacionarias. Los motivos de la falta de
estacionariedad suelen ser:
a) Se presenta una tendencia.
b) La varianza no es una constante.
c) Hay variaciones estacionales.
La presencia de variaciones estacionales se traduce en una variabilidad de la media
del proceso, lo que es contrario a la hiptesis de estacionariedad. Afortunadamente, es
posible transformar muchas series econmicas de tiempo en otras estacionarias,
sometindolas a operaciones algebraicas.
218
X t BX t at
1 B X t at
B X t at donde B 1 B
1 B 0 1 B
1
(la raz est fuera del circulo unitario)
-1
-1
1 1
El caso de mayor inters es cuando , esto es, cuando existe raz unitaria, y se puede
probar que cuando esto ocurre, la varianza de Xt no es finita, en otras
palabras, la serie es no estacionaria. De all que la relacin fundamental que siempre
se ha de tener en cuenta es: EXISTENCIA DE RAICES UNITARIAS EQUIVALE A NO
ESTACIONARIEDAD
219
NO ESTACIONARIEDAD
EXISTENCIA DE
RAICES
UNITARIAS
CRECIMIENTO EXPLOSIVO
SI
X t X t 1 at
X t X t 1 at = caminata aleatoria
proceso integrado
no estacionario
Saber que existen races unitarias provee de la transformacin necesaria para superar
el problema de la no estacionariedad. Considerando nuevamente una representacin
autorregresiva para Xt, si existe raz unitaria se tiene que:
X t X t 1 at :
X t X t 1 at
220
k cov arianza.al.rezago.k
0
var ianza
221
Grfico N 4
62
63
A. Dickey y W.A. Fuller. Distribution of the Estimators for Autoregressive Time Series with a Unit
Root. Journal of the American Statistical Association. Vol. 4 1979.
223
se
modifica
la
ecuacin
Yt 1 2 t Yt 1 1 Yt i u t
i 1
224
225
226
Para que sea ruido blanco, los residuales no deben estar autocorrelecionados. En el
correlograma se puede observar que los primeros 6 coeficientes de correlacin no son
significativos, con lo cual podramos interpretar que el trmino de perturbacin u t es
un ruido blanco, por lo tanto la prueba del Dickey-Fuller es vlida En el caso de que no
fuera un ruido blanco, se realiza una nueva prueba de Dickey-Fuller aumentada,
incluyendo rezagos de la variable en diferencias.
EJERCICIO N 33
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SEPTIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE
1996
1997
1998
1999
2000
2001
290,00
290,00
290,00
360,47
468,89
471,25
470,75
474,20
476,12
470,01
471,57
474,73
476,84
474,40
478,40
479,25
483,27
485,63
491,25
495,90
496,79
498,62
499,93
502,80
507,29
514,64
520,90
530,08
537,05
542,00
557,39
570,19
584,42
571,25
569,25
566,19
568,84
577,10
579,40
587,29
595,63
602,13
610,56
615,22
624,48
630,19
634,15
643,35
652,15
658,51
666,12
672,01
679,53
680,55
685,21
688,89
690,08
692,46
695,31
698,34
699,70
702,58
705,52
709,64
714,39
716,69
722,00
730,82
742,94
743,07
744,73
751,91
FUENTE: B.C.V.
227
2002
761,55
884,21
947,22
876,54
965,48
1196,74
1328,98
1373,93
1457,20
1452,32
1366,60
1320,67
autocorrelacin cercano a uno (0,93). Este grfico puede considerarse como indicativo
de la no estacionariedad de la serie, es decir, presenta raz unitaria.
229
GRAFICO N 7
CORRELOGRAMA DE
LOS RESIDUOS
230
Mientras que la prueba ADF corrige la correlacin serial de orden elevado aadiendo
ms retardos del trmino diferenciado de la serie original en el lado derecho de la
ecuacin, el test PP realiza una correccin del estadstico t sobre el coeficiente en la
regresin AR(1) para considerar la correlacin serial en el trmino .
La distribucin asinttica del estadstico t del test PP es la misma que la del estadstico
t de la prueba ADF y se contrastan los resultados del test con los valores crticos de
Mackinnon. Igual que en la prueba ADF tenemos que especificar si incluimos una
constante, constante mas trmino de tendencia o nada en la regresin, para el test PP
adems hay que especificar el numero de perodos de correlacin serial a incluir.
64
232
CAPITULO XI
OTROS TEMAS DE ECONOMETRIA
1. ERROR DE ESPECIFICACION. DEFINICION
Hasta el momento los modelos economtricos estudiados, se han basado, en
gran parte, en el supuesto de que el modelo que se va a estimar est especificado en
forma correcta. Una vez que se asume la especificacin correcta del modelo, la
estimacin y prueba del mismo se hacen relativamente sencillas. Sin embargo, en
realidad, nunca podemos estar seguros de que un modelo determinado est
especificado en forma correcta. Generalmente se examinan ms de una probable
especificacin, intentando encontrar la especificacin que describa en mejor forma el
proceso bajo estudio.
Los principales errores que se pueden cometer en el momento de especificar un
modelo son:
a) Omisin de una variable relevante.
b) Inclusin de una variable innecesaria.
(2.1)
Donde se especifica que la cantidad demandada del bien Yi est en funcin del
precio de dicho bien X 1i y la publicidad del mismo X 2i .
Ahora bien, por equivocacin o ignorancia de la relacin verdadera, estimamos
el siguiente modelo:
Yi 0 1 X 1i u i
(2.2)
233
relacin existente entre las dos variables explicativas. Precio y publicidad, y del poder
explicativo de la publicidad en funcin de demanda, es decir el coeficiente. Si la
publicidad est correlacionada positivamente con la demanda, y el precio aparece
correlacionada positivamente con la publicidad, el estimador mnimo cuadrtico 1
tomar valores mayores que lo realmente debiera, es decir, se sobrestimar.
Esquemticamente, las consecuencias de omitir una variable explicativa relevante en
el modelo son las siguientes:
a) Si la variable excluida X 2 est correlacionada con la variable incluida, 0 y 1 son
sesgados como tambin inconsistentes. Es decir E 0 0 y, independientemente
del tamao de la muestra.
b) Aun cuando X 1 y X 2 no estn correlacionadas, 0 es aun segado, aun cuando 1
sea ahora insesgado.
c) La varianza de la perturbacin 2 est incorrectamente estimada.
d) La varianza del coeficiente 1 es un estimador sesgado de la varianza verdadera
de.
e) En consecuencia, es probable que el intervalo de confianza usual y los
procedimientos de prueba de hiptesis conduzcan conclusiones equivocadas sobre
la significancia estadstica de los coeficientes estimados.
Este sesgo de especificacin cuantitativamente ser igual a:
E 1 1 1 2
(2.3)
x x
x
1 2
2
2
1 2
X X
X
1
2
2
2
NX 1 X 2
NX 22
234
DECISION
Yi 0 1X1i Ui
Yi 0 1X1i Ui
Yi 0 1X1i 2 X 2i Ui
Yi 0 1X1i 2 X 2i Ui
OMISIO
VARIABL
(2)
DE
Estimado
mnim RELEVANTE:Estima
(1)
Mco con
cuadrtico insesgado y
restriccione sesgado con meno
varianza que en
(3) INCLUSIO DE VARIABL
IRRELEVANT
Estimado (4) Estimado
MCO insesgad con varianz insesgado y
mayor que en
65
mnim
cuadrtic
Martn Guillermina, Jos Mara Labeaga y Francisco Mochn. Introduccin a la Econometra. Prentice
Hall. Espaa.1997.
235
Ejercicio 66N 34
En un estudio de la demanda de dinero a largo y a corto plazos, Gregory Chow
estim la siguiente ecuacin de demanda (los errores estndar estn entre parntesis
y todos los datos son trimestrales):
M t 0,1365 1,069Ypt 0,1321Yt 0,7476 Rt
(0,148) (0,139)
(0,054)
R 2 0,9965
66
(0,143)
(0,094)
(0,059)
(0,067)
R 2 0,9988
5. EVALUACION DE MODELOS
En captulos anteriores, se plante que para realizar la evaluacin de un modelo
economtrico es necesario utilizar el coeficiente de determinacin R 2 y las pruebas
T y F . A continuacin se completar el proceso de evaluacin mediante ciertas
medidas que es posible establecer, bien en la fase de construccin del mismo, o bien,
durante la aplicacin del modelo.
a) Medidas sobre los errores: error cuadrtico medio, Error medio absoluto y
porcentaje de error.
En referencia a las medidas establecidas sobre los errores o residuos., a parte del
ui2 se pueden
estimador insesgado de la varianza de las perturbaciones 2
nk
analizar los errores absolutos y relativos (porcentajes de error), as como las
correspondientes medias y desviaciones tpicas.
Dado los supuestos del modelo clsico, se debe cumplir que
0 y por lo tanto
que u 0 con lo que el error cuadrtico medio S u2 coincidir con la varianza residual
S u2 2
2
u
u
2
2
i
Dada la nulidad del error medio, puede interesar conocer el error medio absoluto:
237
u i
yi
238
Para analizar la fiabilidad del modelo se toma en cuenta la mayor o menor distancia de
los valores estimados y reales, y observando el error sistemtico (puntos situados
principalmente en la zona de sub o sobreestimacin).
c) Coeficiente de desigualdad de Theil..
para el caso de una prediccin perfecta no slo supondr que R 2 1 , sino que deber
cumplirse que 0 y 1 , a fin de que coincidan punto a punto ambas series de
valores. Concretamente, el coeficiente de determinacin as obtenido no aporta
ninguna informacin adicional.
Basndose en estos supuestos, Theil establece el coeficiente de desigualdad que
nos va a permitir,. Mediante su aplicacin, analizar la bondad de prediccin. Definimos
U , como el coeficiente de desigualdad entre y i e y i , a partir de la siguiente expresin
aplicada a los porcentajes de cambio respectivos.
1
y i yi 2
n
1
1 2
y i2
yi
n
n
El valor del coeficiente esta comprendido entre 0 y 1, excepto en el caso de que tanto
las predicciones como los valores reales sean todos cero, ya que entonces el
coeficiente ser indeterminado.
En caso de que U 0 , implicara que los valores de prediccin coinciden con los
reales, es el caso de prediccin perfecta.
En caso de que U 1 , implicara una prediccin totalmente errnea. Este valor puede
obedecer: i) Predicciones nulas para valores reales distintas a cero; ii) Predicciones no
nulas sobre valores iguales a cero; iii) que
las predicciones equivoquen
sistemticamente el signo del cambio.
239
TABLAS
240
241
0,001
0,002
318,310
22,327
10,214
7,173
5,893
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,232
3,160
0.25
0.10
0.05
5.83
39.90
161.00
7.50
49.50
200.00
8.20
53.60
216.00
8.58
55.80
225.00
8.82
57.20
230.00
8.98
58.20
234.00
9.10
58.90
237.00
0.25
0.10
0.05
0.01
2.57
8.53
18.50
98.50
3.00
9.00
19.00
99.00
3.15
9.16
19.20
99.20
3.23
9.24
19.20
99.20
3.28
9.29
19.30
99.33
3.31
9.33
19.30
99.30
3.34
9.35
19.40
99.40
0.25
0.10
0.05
0.01
2.02
5.54
10.10
34.10
2.28
5.46
9.55
30.80
2.36
5.39
9.28
29.50
2.39
5.34
9.12
28.70
2.41
5.31
9.01
28.20
2.42
5.28
8.94
27.90
2.43
5.27
8.89
27.70
0.25
0.10
0.05
0.01
1.81
4.54
7.71
21.20
2.00
4.32
6.94
18.00
2.05
4.19
6.59
16.70
2.06
4.11
6.39
16.00
2.07
4.05
6.26
15.50
2.08
4.01
6.16
15.20
2.08
3.98
6.09
15.00
0.25
0.10
0.05
0.01
1.69
4.06
6.61
16.30
1.85
3.78
5.79
13.30
1.88
3.62
5.41
12.10
1.89
3.52
5.19
11.40
1.89
3.45
5.05
11.00
1.89
3.40
4.95
10.70
1.89
3.37
4.88
10.50
0.25
0.10
0.05
0.01
1.62
3.78
5.99
13.70
1.76
3.46
5.14
10.90
1.78
3.29
4.76
9.78
1.79
3.18
4.53
9.15
1.79
3.11
4.39
8.75
1.78
3.05
4.28
8.47
1.78
3.01
4.21
8.26
0.25
0.10
0.05
0.01
1.57
3.59
5.59
12.20
1.70
3.26
4.74
9.55
1.72
3.07
4.35
8.45
1.72
2.96
4.12
7.85
1.71
2.88
3.97
7.46
1.71
2.83
3.87
7.19
1.70
2.78
3.79
6.99
0.25
0.10
0.05
0.01
1.54
3.46
5.32
11.30
1.66
3.11
4.46
8.65
1.67
2.92
4.07
7.59
1.66
2.81
3.84
7.01
1.66
2.73
3.69
6.63
1.65
2.67
3.58
6.37
1.64
2.62
3.50
6.18
0.25
0.10
0.05
0.01
1.51
3.36
5.12
10.60
1.62
3.01
4.26
8.02
1.63
2.81
3.86
6.99
1.63
2.69
3.63
6.42
1.62
2.61
3.48
6.06
1.61
2.55
3.37
5.80
1.60
2.51
3.29
5.61
242
11
12
13
14
15
16
17
18
0.25
0.10
0.05
0.01
1.49
3.29
4.96
10.00
1.60
2.92
4.10
7.56
1.60
2.73
3.71
6.55
1.59
2.61
3.48
5.99
1.59
2.52
3.33
5.64
1.58
2.46
3.22
5.39
1.57
2.41
3.14
5.20
0.25
0.10
0.05
0.01
1.47
3.23
4.84
9.65
1.58
2.86
3.98
7.21
1.58
2.66
3.59
6.22
1.57
2.54
3.36
5.67
1.56
2.45
3.20
5.32
1.55
2.39
3.09
5.07
1.54
2.34
3.01
4.89
0.25
0.10
0.05
0.01
1.46
3.18
4.75
9.33
1.56
2.81
3.89
6.93
1.56
2.61
3.49
5.95
1.55
2.48
3.26
5.41
1.54
2.39
3.11
5.06
1.53
2.33
3.00
4.82
1.52
2.28
2.91
4.64
0.25
0.10
0.05
0.01
1.45
3.14
4.67
9.07
1.55
2.76
3.81
6.70
1.55
2.56
3.41
5.74
1.53
2.43
3.18
5.21
1.52
2.35
3.03
4.86
1.51
2.28
2.92
4.62
1.50
2.23
2.83
4.44
0.25
0.10
0.05
0.01
1.44
3.10
4.60
8.86
1.53
2.73
3.74
6.51
1.53
2.52
3.34
5.56
1.52
2.39
3.11
5.04
1.51
2.31
2.96
4.69
1.50
2.24
2.85
4.46
1.49
2.19
2.76
4.28
0.25
0.10
0.05
0.01
1.43
3.07
4.54
8.68
1.52
2.70
3.68
6.36
1.52
2.49
3.29
5.42
1.51
2.36
3.06
4.89
1.49
2.27
2.90
4.56
1.48
2.21
2.79
4.32
1.47
2.16
2.71
4.14
0.25
0.10
0.05
0.01
1.42
3.05
4.49
8.53
1.51
2.67
3.63
6.23
1.51
2.46
3.24
5.29
1.50
2.33
3.10
4.77
1.48
2.24
2.85
4.44
1.47
2.18
2.74
4.20
1.46
2.13
2.66
4.03
0.25
0.10
0.05
0.01
1.42
3.03
4.45
8.40
1.51
2.64
3.59
6.11
1.50
2.44
3.20
5.18
1.49
2.31
2.96
4.67
1.47
2.22
2.81
4.34
1.46
2.15
2.70
4.10
1.45
2.10
2.61
3.93
0.25
0.10
0.05
0.01
1.41
3.01
4.41
8.29
1.50
2.62
3.55
6.01
1.49
2.42
3.16
5.09
1.48
2.29
2.93
4.58
1.46
2.20
2.77
4.25
1.45
2.13
2.66
4.01
1.44
2.08
2.58
3.84
243
dl
0.203
0.268
0.328
0.389
0.447
0.502
0.554
0.603
0.649
0.692
0.732
0.769
0.804
0.837
0.868
0.897
0.925
0.951
0.975
0.998
1.020
1.041
1.061
1.080
1.097
1.114
1.131
1.146
1.161
1.175
1.238
1.291
244
K=6
du
3.005
2.832
2.692
2.572
2.472
2.388
2.318
2.257
2.206
2.162
2.124
2.090
2.061
2.035
2.012
1.992
1.974
1.958
1.944
1.931
1.920
1.909
1.900
1.891
1.884
1.877
1.870
1.864
1.859
1.854
1.835
1.822
K=6
dl
du
1.334 1.814
1.372 1.808
1.404 1.805
1.433 1.802
1.458 1.801
1.480 1.801
1.500 1.801
1.518 1.801
1.535 1.802
1.550 1.803
1.651 1.817
1.707 1.831
245
BIBLIOGRAFIA
-
DHRYMES, PHOEBUS J. Mathematics for Econometrics. Third Edition. Springer Verlag New York Inc. 2000.
246
de
Econometra.
247
Segunda
Edicin.
VICENS
NOVALES, ALFONSO.
Espaa.1993.
Econometra.
248
Segunda
edicin.
Mc.
Graw
Hill.
249