Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes de Econometria - Andes
Apuntes de Econometria - Andes
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
ISSN 1909-4442
9 771909 444004
03
APUNTES DE CLASE
INTRODUCCIN A LA ECONOMETRA
3
OCTUBRE
DE
2006
CEDE
CEDE
ISSN 1909-4442
Introduccin a la econometra
2006
OCTUBRE DE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
Universidad de los Andes
APUNTES DE CLASE
CEDE
ISSN 1909-4442
INTRODUCCIN A LA ECONOMETRA
3
OCTUBRE
DE
2006
CEDE
INTRODUCCIN A LA ECONOMETRA
Resumen
La econometra es una de las importantes aplicaciones de la
estadstica matemtica, y una herramienta fundamental en la
investigacin econmica, el diseo y anlisis de poltica. El presente
documento desarrolla para aquellos que inician el estudio de la
economa, los elementos tericos bsicos sobre la modelacin
economtrica. Se aborda el modelo clsico de regresin lineal y sus
supuestos, y la manera de efectuar hiptesis. Este documento se
considera un desarrollo preliminar para la posterior iniciacin en
temas ms avanzados de econometra.
Palabras claves: anlisis de correlacin, mnimos cuadrados
ordinarios, modelo economtrico, pruebas de hiptesis.
Clasificacin JEL: C01, C10 y C20.
Este documento hace parte de las notas de clase del curso Mtodos Cuantitativos para las
especializaciones de Economa, Economa Social, Economa del Riesgo y la Informacin, y de
Evaluacin Social de Proyectos de la Facultad de Economa Universidad de Los Andes.
**
Ph. D. en Economa Agrcola, Profesor Asociado de la Facultad de Economa de la
Universidad de Los Andes. Bogot, Colombia. Correo electrnico: rrosales@uniandes.edu.co.
***
Magster en Economa y Magster en Economa del Medio Ambiente y de los Recursos
Naturales, Profesor Instructor de la Facultad de Economa. Universidad de Los Andes. Bogot,
Colombia. Correo electrnico: jobonill@uniandes.edu.co.
INTRODUCTION TO ECONOMETRICS
Abstract
Econometrics is one of the most important applications to the
mathematical statistics and a fundamental tool in the economic research
and in the design and analysis of economic policy. The present
document develops the basic theory concepts of the econometric
modeling for those that begin the study of economics. The specification,
assumptions, estimation, hypothesis testing and predictions for the
classical regression model are the principal topics presented in this text.
The concepts, the tools and their applications developed in this
document are relevant for tackling many practical problems in todays
world and for the introduction in advanced econometric courses.
Key words: correlation analysis, least squares estimation, econometric
model, hypothesis tests.
JEL classification: C01, C10 y C20
TABLA DE CONTENIDO
1. LA MODELACIN Y LA ECONOMETRA ........................................................................................... 5
1.1.
Mtodos Cuantitativos de la Economa...................................................................................... 5
1.2.
Definiciones de la Econometra.................................................................................................. 6
1.3.
Objetivo de la Econometra ........................................................................................................ 7
1.4.
El Procedimiento Economtrico................................................................................................. 7
1.5.
El Modelo ................................................................................................................................... 8
1.6.
El Modelo Econmico ................................................................................................................ 8
1.7.
El Modelo Economtrico .......................................................................................................... 10
1.8.
Elementos que componen el Modelo ........................................................................................ 12
1.9.
Clasificacin de las Variables .................................................................................................. 13
1.10.
Clasificacin de las Ecuaciones ............................................................................................... 13
1.11.
Clasificacin de los Modelos.................................................................................................... 14
2. ORGANIZACIN DE DATOS Y ESTADSTICA DESCRIPTIVA ...................................................... 15
2.1. Objetivos de la Estadstica.............................................................................................................. 15
2.2. Divisiones de la Estadstica ............................................................................................................. 16
2.4. Poblacin y Muestra ........................................................................................................................ 17
2.5. Parmetros Poblacionales y Estadsticos Muestrales ..................................................................... 18
2.6. Medidas de Tendencia Central y de Dispersin .............................................................................. 18
2.7. Mtodos y Diagnsticos Grficos. ................................................................................................... 18
2.8 Ejercicios de computador ................................................................................................................. 21
3. ANALISIS DE CORRELACION ............................................................................................................ 22
3.1. Diagrama de Dispersin.................................................................................................................. 22
3.2. Coeficiente de Correlacin Lineal................................................................................................... 23
3.3. Pruebas de Hiptesis ....................................................................................................................... 25
3.4. Ejercicios de computador ................................................................................................................ 28
4. REGRESION SIMPLE LINEAL Y NO LINEAL.................................................................................... 29
4.1. Objetivo del anlisis de regresin ................................................................................................... 29
4.2. Funcin de regresin muestral y poblacional ................................................................................. 30
4.3. Supuestos del modelo de regresin .................................................................................................. 32
4.4. Mtodo de estimacin de mnimos cuadrados ordinarios................................................................ 35
4.5. Varianzas y errores estndar de los estimadores ............................................................................ 36
4.6. Intervalos de confianza .................................................................................................................... 37
4.7. Pruebas de hiptesis ........................................................................................................................ 37
4.8. Prediccin........................................................................................................................................ 40
4.9. El Coeficiente de Determinacin ..................................................................................................... 40
4.10. Modelos de regresin simple no lineal en las variables ................................................................ 41
4.11. Ejercicios de Computador ............................................................................................................. 42
5. REGRESION MULTIPLE LINEAL Y NO LINEAL .............................................................................. 45
5.1. Expresin del modelo en forma matricial........................................................................................ 45
5.2. Supuestos del modelo....................................................................................................................... 46
5.3. Mtodo de estimacin de mnimos cuadrados ordinarios................................................................ 46
5.4. Matriz de varianzas y covarianzas de los estimadores .................................................................... 46
5.5. Pruebas de hiptesis ........................................................................................................................ 47
5.6. Coeficiente de determinacin ajustado R 2 .................................................................................. 48
5.7. Intervalos de confianza. ................................................................................................................... 49
5.8. Modelos de regresin mltiple no lineal en las variables................................................................ 49
5.9. Ejercicios de Computador. .............................................................................................................. 50
6. INCUMPLIMIENTO DE LOS SUPUESTOS DEL MODELO............................................................... 56
6.1. Multicolinealidad............................................................................................................................. 56
( )
6.2. Heteroscedasticidad......................................................................................................................... 61
6.3. Autocorrelacin ............................................................................................................................... 66
6.4. Error de especificacin.................................................................................................................... 70
6.5. No Normalidad de los errores ......................................................................................................... 73
6.6. Ejercicios de computador. ............................................................................................................... 75
7. INTRODUCCIN A VARIABLES CUALITATIVAS .......................................................................... 83
7.1. Regresin con variables independientes cualitativas ...................................................................... 83
7.2. Regresin con variable dependiente cualitativa .............................................................................. 89
INTRODUCCIN
El curso de Econometra hace parte del rea de mtodos cuantitativos en economa
y se constituye en una herramienta importante en la investigacin econmica, el
diseo y anlisis de poltica. El contenido y el desarrollo del curso son a nivel
introductorio y su inters es la aplicacin de los conceptos tericos. El curso busca
proporcionarle al estudiante las bases iniciales para el manejo de los mtodos y
modelos economtricos, los elementos necesarios para el manejo de la informacin,
anlisis de resultados e interpretacin de las salidas del computador, y familiarizarlo
en sus aplicaciones, tales como la investigacin y la evaluacin de medidas de
poltica.
El documento se encuentra dividido en siete secciones. La primera presenta la
definicin de la econometra, sus objetivos, el concepto del modelo y su
caracterizacin. La segunda trata de la organizacin de datos y la estadstica
descriptiva. La seccin tres aborda los aspectos bsicos del anlisis de
correlacin. La seccin cuatro presenta el modelo formal de regresin lineal
simple. La quinta seccin muestra el modelo de regresin lineal mltiple. La sexta
seccin presenta la teora relacionada con el incumplimiento de los supuestos del
modelo. La seccin siete efecta una introduccin al anlisis transversal de
regresin con variables independientes cualitativas y de variable dependiente
cualitativa. Al final del documento se incluye un anexo que desarrolla el
procedimiento general de manipulacin de datos en el paquete economtrico
Eviews 4.1.
1. LA MODELACIN Y LA ECONOMETRA
1.1.
Definiciones de la Econometra
Estas tres definiciones nos indican que la econometra es cuantitativa y que est
en estrecho contacto con la realidad.
Objetivo de la Econometra
El Procedimiento Economtrico
El Modelo
El Modelo Econmico
(1)
(2)
Est relacin puede ser correcta. Sin embargo, cuando no se conoce si el insumo X2
es determinante en forma lineal sobre Y, puede ocurrir error de especificacin.
Tambin se debe resaltar que este modelo hace nfasis en un nmero relativamente
pequeo de
variables
se
puede
expresar
1.7.
El Modelo Economtrico
(3)
10
Existen diferentes razones por las cuales los modelos economtricos deben
considerar el trmino de error, destacndose como las ms importantes las
siguientes:
a) Datos: en muchos casos el grado de control que se puede tener sobre las
variables de inters es bajo. Adicionalmente, aunque se desea obtener los
verdaderos valores de las variables, se debe aceptar que puede existir cierto
error en la medicin.
No obstante, el
11
Los elementos que componen el modelo son: las variables, las ecuaciones y los
parmetros.
Una variable es una caracterstica de una poblacin que puede tomar diferentes
valores. Solo son de inters aquellos valores de la variable que tienen un significado
econmico. Por ejemplo las variables: precio, produccin, ingreso, y cantidad de
insumo utilizado tienen regin econmicamente factible en los nmeros reales
positivos.
Una ecuacin es una igualdad conformada por una expresin matemtica que
establece relaciones entre variables. La ecuacin contiene no solo las variables de
inters sino tambin los coeficientes que afectan estas mismas. A estas ltimas
magnitudes se les denomina parmetros desde el enfoque estadstico, los cuales en
un modelo lineal actan como factores de ponderacin de cada variable explicativa y
12
Desde el punto de vista econmico las variables se pueden clasificar como variables
endgenas y exgenas. Las variables endgenas son aquellas cuyos valores se
determinan o calculan dentro del modelo. En contraste, las variables exgenas se
caracterizan por que sus valores estn determinados fuera del modelo.
13
14
15
Existen dos tipos de variables aleatorias: discretas y continuas. Las primeras son
aquellas cuyo nmero de valores que pueden tomar es contable (ya sea finito o
16
infinito) y pueden arreglarse en una secuencia que corresponde uno a uno con los
enteros positivos; mientras las segundas toman valores dentro de un intervalo de
recta de los nmeros reales. Si se tienen dos variables aleatorias, por ejemplo: el
nmero de hijos por familia y el consumo de energa elctrica; la primera, se
encuentra dentro del grupo de variables aleatorias discretas, y la segunda, dentro del
conjunto de variables aleatorias continuas.
una
caracterstica
en
comn.
La
poblacin
debe
definirse
17
Bogot. Para este caso, la poblacin corresponde a todos los hogares de la ciudad,
mientras que la muestra estar constituida por aquellos hogares que pueden ser
seleccionados de manera aleatoria, como un grupo representativo de todos los que
habitan en Bogot.
18
Con los datos agrupados de una variable aleatoria es posible construir histogramas
de frecuencias, los cuales pueden ser comparados con las representaciones grficas
de distribuciones de probabilidad ya conocidas de variables aleatorias. En la mayora
de los casos, estos histogramas se comparan con la distribucin normal, donde por
inspeccin es posible identificar sesgos o apuntamientos en la distribucin.
19
Datos agrupados
k
Media
x=
xi
i =1
x=
f i xi
i =1
, donde n =
fi
i =1
Mediana
Mediana = L + c( j f m )
Valor central de la
distribucin (el 50% de los
datos se encuentran por
encima de este valor).
Moda
Valor ms frecuente
Medida Numrica
Varianza
s = ( x i x ) ( n 1)
2
Datos agrupados
i =1
xi
n
xi2 i =1
n
2
i =1
s =
n 1
Desviacin Estndar
s=
s2 =
(x x)
s2 =
i =1
(n 1)
i =1
xi
i =1
n
2
i =1
s= s =
n 1
n
s = s2 =
2
i
Recorrido o Rango
Max-min.
20
f i xi
f i xi2 i =1
n
n 1
i =1
k
f i xi
f i xi2 i =1
n
n 1
DX
PX
PZ
PW
37
38
18
50
22
55
42
29
63
13
60
62
36
7
6
10
4
9
2
8
8
2
12
3
3
6
5
7
3
9
3
12
5
5
18
2
9
10
5
7
5
13
4
11
3
8
9
3
15
5
5
6
6
8
3
18
3
21
2
19
20
6
12
5
26
Donde:
DX: es la demanda del bien X
PX: es el precio del bien X
PZ: es el precio del bien Z
PW: es el precio del bien W
I:
es el ingreso
ESTADSTICAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y NORMALIDAD
Mean
Median
Maximum
Minimum
Std. Dev.
Sum
Observations
DX
40.38462
38.00000
63.00000
13.00000
16.89940
525.0000
13
PX
6.153846
6.000000
12.00000
2.000000
3.210560
80.00000
13
PZ
7.153846
5.000000
18.00000
2.000000
4.431820
93.00000
13
21
PW
7.230769
6.000000
15.00000
3.000000
3.811252
94.00000
13
I
11.46154
8.000000
26.00000
2.000000
8.272599
149.0000
13
3. ANALISIS DE CORRELACION
La figura a) muestra una posible relacin lineal directa entre las variables; mientras,
22
la figura b) seala una relacin lineal de tipo inversa. Las figura c) y d) revelaran
posibles relaciones cuadrticas entre las variables, exhibiendo un mximo y un
mnimo para la primera y segunda de estas figuras, respectivamente. La figura e)
mostrara una tendencia de tipo cbico entre las variables. La figura f) es un ejemplo
en el cul no puede identificarse por inspeccin algn tipo de relacin entre las
variables, pues aparentemente ella no existe.
3.2. Coeficiente de Correlacin Lineal
Si bien es cierto que el diagrama de dispersin permite visualizar la existencia o no
de una posible relacin lineal entre las variables, el investigador debe soportar sus
conclusiones en trminos de alguna medida estadstica. El coeficiente de correlacin
lineal es un estadstico que mide el tipo de relacin (signo) y la fuerza (magnitud del
coeficiente) de asociacin lineal entre dos variables. Usualmente el coeficiente de
correlacin lineal, representado por la letra r, bajo las condiciones de un muestreo
aleatorio ideal se considera una buena representacin del coeficiente de correlacin
poblacional ( ). La frmula para calcular r es la siguiente:
^
rXY
rXY =
Cov( X , Y )
=
S X SY
(x x )( y y )
(x x ) ( y y )
i
rXY =
x y
( x )
i
x i 2
( x )( y )
i
(
yi )
2
y i
[ x
x y
i
2
i
n( x y )
n(x )
][ y
2
i
n( y )
( 1 rXY
23
Si r tiende a 1 como seria el caso de la figura a) estara indicando una relacin lineal
positiva o directa entre las variables. Si r tiende a -1, existira una relacin lineal
negativa o inversa entre las variables. Cuando r es exactamente igual a 1 o -1 la
relacin lineal es perfecta, siendo posible ajustar todos los puntos a travs de una
lnea recta con pendiente positiva (ver figura g) o negativa (ver figura h),
respectivamente. Si r es cero no hay relacin lineal entre las variables y una lnea
horizontal une todos los pares de valores localizados en el diagrama de dispersin
(ver figura i).
24
25
Paso 1:
Paso 2:
Planteamiento de la hiptesis:
Ho:
=0
Ha:
Paso 3:
tC =
(r
n 2
1 r2
~. t
2, n 2
26
puede
Paso 4:
Paso 5:
tabulado t
2, n 2
(tC )
contra el estadstico
27
28
MATRIZ DE COVARIANZAS
VARIABLE
DX
PX
PZ
PW
I
DX
263.6213
-47.98225
60.01775
-53.78107
47.89941
PX
-47.98225
9.514793
-11.63905
10.73373
-12.99408
PZ
60.01775
-11.63905
18.13018
-12.65089
16.69822
PW
-53.78107
10.73373
-12.65089
13.40828
-16.18343
I
47.89941
-12.99408
16.69822
-16.18343
63.17160
PW
-0.904592
0.950308
-0.811397
1.000000
-0.556062
I
0.371175
-0.530011
0.493410
-0.556062
1.000000
MATRIZ DE CORRELACION
VARIABLE
DX
PX
PZ
PW
I
DX
1.000000
-0.958056
0.868137
-0.904592
0.371175
PX
-0.958056
1.000000
-0.886170
0.950308
-0.530011
PZ
0.868137
-0.886170
1.000000
-0.811397
0.493410
29
1.
2.
3.
4.
30
Por otro lado, cuando la lnea de regresin es construida con los datos muestrales
recibe el nombre de funcin de regresin muestral. Como todo procedimiento de
inferencia estadstica, lo que se pretende es que la muestra sea una buena
representacin de la poblacin. En este sentido, la funcin de regresin muestral
constituye una representacin de la funcin de regresin poblacional. A s mismo,
en la prctica, las muestras de variables aleatorias son usadas para inferir sobre
las caractersticas de la poblacin.
La siguiente grfica presenta un ejemplo de dos lneas de regresin muestral para
el gasto en consumo semanal de un hogar versus el ingreso.
31
32
Por lo tanto los factores que no estn incluidos en el modelo y que por
consiguiente, estn incorporados en ui , no afectan sistemticamente el valor de la
media de Y.
Yi
Var[Yi / X i ] = 2 .
33
E[u i ] = 0
E[ X i ] _ no _ estocastica
E[u i ] = 0
Cov[u i , X i ] = 0
34
Yi = 1 + 2 X i + e i
Yi = Yi + e i
e i2 = (Y i Yi ) = (Y i 1 2 X i )
35
e i2 = min (Y i 1 2 X i )
2 =
n X i Yi ( X i )( Yi )
n X i ( X i )
Cov ( X , Y )
Var ( X )
1 = Y 2 X
4.5. Varianzas y errores estndar de los estimadores
As como existen medidas de dispersin para las variables tambin las hay para
los estimadores, por lo tanto, es necesario siempre presentar una medida de
precisin de los estimadores de los parmetros del modelo. Esta medida es el
error estndar e indica la confiabilidad de las estimaciones (si son pequeas dejan
ver que los parmetros muestrales van a ser muy parecidos a los poblacionales).
La principal utilidad de los errores estndar de los estimadores es la construccin
de intervalos de confianza y la prueba de hiptesis. A continuacin se presenta la
forma de calcular la varianza y error estndar de cada estimador del modelo de
regresin lineal simple:
( )
Var 1 =
X i2
se 1 =
2
n ( X i X )
X i2 2
2
n (X i X )
( )
( )
Var 2 =
( )
se 2 =
(X i X )
36
(X i X )
( )]
( )
Pr 2 t 2 se 2 2 2 + t 2 se 2 = 1
( )
Pr 1 t
( )
( )
se 1 1 1 + t
( )
( )]
se 1 = 1
1 t 2 se 1
( )
el intervalo 2 t 2 se 2 , 2 + t 2 se 2
2.
37
Prueba
de
relevancia:
la
prueba
de
relevancia
consiste
en
evaluar
(X )
aporta informacin
Paso 1:
Planteamiento de la hiptesis.
Ho:
i = 0
Ha:
i 0
Paso 2:
Nivel de significancia ( ) :
Paso 3:
tC =
Paso 4:
i
~. t
se ( i )
2, n 2
38
Paso 5:
2, n 2
se
39
4.8. Prediccin
Una aplicacin del modelo de regresin es la prediccin o el pronstico de la
variable dependiente, de acuerdo con valores dados de las variables
independientes. Hay dos tipos de predicciones: la prediccin media y la prediccin
individual. A continuacin se presentan estos dos casos:
Prediccin media: es la prediccin del valor medio condicional de Y,
correspondiente a un determinado valor de X, denotado como X0, el cual
representa un punto sobre la lnea de regresin poblacional.
Si se desea predecir E (Y / X 0 ) , la estimacin puntual de la prediccin media es
2
(
X0 X )
2 1
.
Y0 = 1 + 2 X 0 y la varianza de Y0 : Var Y0 = +
2
n (X i X )
( )
40
respecto a que tan bien la lnea de regresin muestral se ajusta a los datos. Para
el caso de un modelo de regresin lineal simple se denota como r 2 y se calcula:
e ui
41
42
Dependent Variable: DX
Method: Least Squares
Date: 10/03/06 Time: 16:38
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
71.41791
-5.042910
3.130854
0.454825
22.81100
-11.08759
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.917870
0.910404
5.058427
281.4646
-38.43407
2.267643
40.38462
16.89940
6.220627
6.307542
122.9346
0.000000
Los resultados del modelo lineal muestran que la variable precio cuenta con el
signo esperado y es relevante al 1%, 5% y 10% de significancia. El valor del R2 es
0.918, es decir, el 92% de la variacin de la demanda del bien X esta explicada
por la variable precio. Adicionalmente se observa la existencia de dependencia
conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=122.935). El
coeficiente de la variable PX es interpretado como un efecto marginal, por lo tanto,
un incremento en una unidad del precio de X disminuye en promedio su demanda
en 5.04 unidades, manteniendo todos los dems factores constantes.
C
9.802248
-1.273019
43
PX
-1.273019
0.206866
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PX)
4.799536
-0.722024
0.208899
0.118417
22.97538
-6.097307
0.0000
0.0001
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.771676
0.750919
0.249094
0.682526
0.708676
2.124425
3.597486
0.499106
0.198665
0.285581
37.17715
0.000078
COEFICIENTE
C
LOG(PX)
C
0.043639
-0.023345
44
LOG(PX)
-0.023345
0.014023
y1
y
Y = 2
M
yn
x11
x
, X = 21
M
xn1
x12 L x1k
x22 L x2 k
xn 2 L xnk
, = 2
M
k
= 2
M
n
Por lo tanto las n ecuaciones que representan y i como funcin de las x i j , los y
45
1.
Y = X +
2.
3.
E ( X) = 0
4.
E (' ) = 2 I Cov( i j ) = 0 , i j .
5.
X es no estocstica.
6.
( X )
E (Y / X) = X
~. N (0, 2 I)
S = 2 = ' = (Y X ) ' (Y X )
MCO = (X ' X )
(X ' Y )
46
1. Suma
de
cuadrados
de
los
errores.
Puede
ser
calculada
as:
Matriz
47
siguiente manera: F = (' X' Y nY 2 )(n k ) [(Y' Y ' X' Y)(k 1)] .
2. p valor. Arroja el nivel mnimo de significancia para rechazar la hiptesis
nula. En el procedimiento se requiere el valor obtenido de F, los grados de
libertad del numerador (k 1) y grados de libertad del denominador (n k ) .
5.6. Coeficiente de determinacin ajustado (R 2 )
El trmino ajustado se refiere a que es corregido por los correspondientes grados
de libertad. El R 2 mide la bondad de ajuste del modelo de regresin (porcentaje
de explicacin de la variable dependiente por las variables independientes), as
como lo hace el R 2 convencional, sin embargo el R 2 tiene la particularidad de
que permite comparar modelos de regresin mltiple en los que se incluyen
variables adicionales. No obstante, se debe considerar que la comparacin tiene
validez cuando en cada modelo la variable dependiente y el tamao de la muestra
sean iguales. La forma de calcular el R 2 se presenta a continuacin:
R 2 = 1 1 R2
48
) nn k1
( )
( )]
Pr k t 2 se k k k + t 2 se k = 1
( )
k t 2 se k
( )
( )
( )
49
Bajo el esquema matricial los coeficientes del modelo transformado pueden ser
obtenidos a travs del mtodo de mnimos cuadrados ordinarios usando la frmula
de clculo presentada en el numeral 5.3. El coeficiente k , k = 2,3, K , K
representa la elasticidad de Y respecto a Xk y tiene la misma interpretacin que en
el caso del modelo de regresin simple doblemente logartmico del captulo
anterior. Por lo tanto, se tendrn k 1 elasticidades en regresin mltiple al
estimarse una funcin tipo Cobb-Douglas. Por otro lado, cabe destacar que
ejercicios de estimacin diferentes al modelo Cobb-Douglas no permiten obtener
directamente elasticidades constantes. Por ello es necesario tener en cuenta la
forma que toman las variables en el modelo transformado antes de efectuar
interpretaciones de los coeficientes.
50
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
PZ
I
72.73351
-4.588739
-0.386460
0.471929
-0.409388
10.83288
1.778623
1.214240
0.688867
0.201019
6.714142
-2.579939
-0.318273
0.685080
-2.036558
0.0002
0.0326
0.7584
0.5127
0.0761
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.947105
0.920657
4.760208
181.2767
-35.57419
1.436480
40.38462
16.89940
6.242183
6.459471
35.81046
0.000037
Los resultados del modelo lineal muestran que la variable precio cuenta con el
signo esperado y es relevante al 5% y 10% de significancia. El valor del R2 es
0.947, es decir, el 95% de la variacin de la demanda del bien X esta explicada
por las variables independientes. Adicionalmente se observa la existencia de
dependencia conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=35.810).
El coeficiente de la variable PX es interpretado como un efecto marginal, por lo
tanto, un incremento en una unidad del precio de X disminuye en promedio su
demanda en 4.59 unidades, manteniendo todos los dems factores constantes.
Vale la pena aclarar que la variable ingreso an cuando es relevante al 10% de
significancia, el signo de su coeficiente no es consistente con la teora economa
relacionada con un bien normal.
51
COEFICIENTE
C
PX
PW
PZ
I
C
117.3513
-11.56233
1.349073
-6.616478
-0.600013
PX
-11.56233
3.163501
-1.826424
0.777287
-0.022642
PW
1.349073
-1.826424
1.474379
-0.192430
0.052888
PZ
-6.616478
0.777287
-0.192430
0.474538
-0.014848
I
-0.600013
-0.022642
0.052888
-0.014848
0.040409
obs
1
2
3
4
5
6
7
8
9
10
11
12
13
Actual
37.0000
38.0000
18.0000
50.0000
22.0000
55.0000
42.0000
29.0000
63.0000
13.0000
60.0000
62.0000
36.0000
Fitted
37.8104
43.2972
22.0098
49.7111
27.3714
59.4627
34.4728
27.1267
62.7036
10.3593
56.3697
59.7074
34.5979
Residual
-0.81044
-5.29718
-4.00977
0.28890
-5.37143
-4.46267
7.52721
1.87326
0.29637
2.64072
3.63029
2.29265
1.40211
52
Residual Plot
| . *|
. |
| *.
|
. |
| .* |
. |
| .
*
. |
| *.
|
. |
| *
|
. |
| .
|
. *
| .
| * . |
| .
*
. |
| .
| * . |
| .
| *. |
| .
| * . |
| .
|* . |
Coefficient
Std. Error
t-Statistic
Prob.
C
LOG(PX)
LOG(PW)
LOG(PZ)
LOG(I)
3.042978
0.115482
-0.336166
0.671764
-0.103431
1.646616
0.301528
0.436617
0.400484
0.084847
1.848020
0.382991
-0.769933
1.677382
-1.219025
0.1018
0.7117
0.4635
0.1320
0.2576
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.902417
0.853626
0.190953
0.291703
6.234096
1.510399
3.597486
0.499106
-0.189861
0.027427
18.49542
0.000418
Los resultados del modelo doblemente logaritmo no son satisfactorios, dado que
ninguna de las variables incorporadas como regresores son significativas.
Asimismo, las variable LOG(PX) y LOG(I) no presentan los signos esperados,
limitando la validez terica del modelo.
MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODELO
DOBLEMMENTE LOGARTMICO
COEFICIENTE
C
LOG(PX)
LOG(PW)
LOG(PZ)
LOG(I)
C
2.711343
-0.229656
-0.565544
-0.638982
-0.061003
LOG(PX)
-0.229656
0.090919
-0.022785
0.064962
0.001807
LOG(PW)
-0.565544
-0.022785
0.190634
0.121451
0.014976
53
LOG(PZ)
-0.638982
0.064962
0.121451
0.160387
0.008270
LOG(I)
-0.061003
0.001807
0.014976
0.008270
0.007199
obs
1
2
3
4
5
6
7
8
9
10
11
12
13
Actual
3.61092
3.63759
2.89037
3.91202
3.09104
4.00733
3.73767
3.36730
4.14313
2.56495
4.09434
4.12713
3.58352
Fitted
3.50939
3.80097
3.07102
3.91411
3.11501
4.10808
3.59355
3.32110
4.38551
2.69990
3.84781
4.00914
3.39174
Residual
0.10153
-0.16339
-0.18064
-0.00209
-0.02396
-0.10075
0.14412
0.04619
-0.24237
-0.13495
0.24653
0.11799
0.19178
Residual Plot
| .
| * . |
| .*
|
. |
| .*
|
. |
| .
*
. |
| .
*|
. |
| . * |
. |
| .
|
*. |
| .
|*
. |
|*.
|
. |
| . * |
. |
| .
|
. *
| .
| * . |
| .
|
* |
Ejemplo 2.
Ahora considere la siguiente informacin de una firma sobre los costos de
produccin y la cantidad producida de un bien para estimar una funcin de costos
cbica:
TABLA No. 3. COSTOS SEGN EL NIVEL DE PRODUCCIN
Obs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Q
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
54
CT
5
14
23
28
33
36
41
45
48
50
55
61
66
72
77
86
97
110
127
147
169
Donde:
CT:
Q:
Mean
Median
Maximum
Minimum
Std. Dev.
Observations
Q
10
10
20
0
6.204837
21
Q2
136.6667
100
400
0
128.5365
21
Q3
2100
1000
8000
0
2488.431
21
CT
66.19048
55
169
5
43.49899
21
Prob.
0.000200
0.000000
0.000000
0.000000
66.19048
43.49899
3.538952
3.737908
7408,618
0
C
Q
Q2
Q3
C
0.925616
-0.336905
0.032823
-0.000934
Q
-0.336905
0.182340
-0.020705
0.000640
55
Q2
0.032823
-0.020705
0.002534
-0.000082
Q3
-0.000934
0.000640
-0.000082
0.000003
describen
de
manera
general
los
conceptos
de
multicolinealidad,
6.1. Multicolinealidad
La multicolinealidad tiene que ver con la relacin lineal entre algn conjunto de
variables independientes en un modelo de regresin. Supngase el siguiente
modelo con cuatro variables independientes:
Cualquier relacin lineal entre las variables independientes de este modelo, por
ejemplo X2 con X3, o X2 con X5 y X4 puede generar problemas de
multicolinealidad. Por lo general, existen dos tipos de multicolinealidad:
56
El
problema
de
multicolinealidad
es
un
problema
ocasionado
por
las
= (X' X )1 (X' Y )
57
estndar de , por lo que el valor de los estadsticos "t" para cada uno de los
parmetros
del
modelo
sern
mucho
menores
que
en
ausencia
de
X' X ; si el valor obtenido de X' X es muy cercano a cero, puede concluirse que
es muy probable la existencia de multicolinealidad alta.
58
tC =
(r
X 2,X 3
n 2
1 (rX 2 , X 3 )
~. t
2, n2
2, n2
dado
que
permite
evaluar
la
multicolinealidad
ocasionada
59
60
6.2. Heteroscedasticidad
El problema de heteroscedasticidad se presenta cuando es violado el supuesto de
varianza
constante
de
los
errores
de
la
funcin
de
regresin.
La
heteroscedasticidad tiene que ver con la relacin entre una o ms de las variables
independientes del modelo y el cuadrado de los errores estimados a partir de la
regresin. Este problema se manifiesta en un crecimiento o decrecimiento de la
varianza del modelo.
61
de
heteroscedasticidad.
En
este
sentido,
la
presencia
de
62
t2 = Yt Y
t
t2 = 0 + 1 X 1t + 2 X 2t + 3 X 1t 2 + 4 X 2t 2 + 5 X 1t X 2t + t
La prueba de hiptesis relacionada con el modelo anterior es:
Ho:
1 = 2 = 3 = 4 = 5 = 0
Ha:
1 2 3 4 5 0
63
64
que
el
nuevo
modelo
cumpla
con
el
supuesto
de
( )=
EUt
X t2
Donde vt =
Ut
. Puede verificarse que:
Xt
E (v t ) = E (U t X t ) = (1 X t ) E (U t ) = 0
65
( ) = E[(U
E vt
] (
) ( ) = (1 X )
X t ) = 1 X t2 E U t
2
2
t
X t2 = 2 .
6.3. Autocorrelacin
El problema de autocorrelacin se presenta en una regresin cuando los errores
de las diferentes observaciones estn relacionados en el tiempo. Esto indica que
el efecto de los errores en el tiempo no es instantneo sino por el contrario es
persistente en el tiempo. La autocorrelacin es ms comn en series ordenadas
en el tiempo que en informacin proveniente de encuestas en un tiempo fijo
(seccin cruzada). La autocorrelacin puede estar relacionada con los ciclos
econmicos; generalmente sta se presenta en un modelo con variables
macroeconmicas donde en el tiempo ocurre un evidente comportamiento
tendencial.
66
generada en casos donde se usa una forma funcional incorrecta del modelo, esto
hace que los datos se ajusten a una forma funcional que no es la ms adecuada.
67
Ho:
Ha:
t 1
t 1
68
de
autocorrelacin
para
averiguar
si
el
problema
de
69
Por otro lado existe el mtodo de correccin a travs del Durbin Watson.
Mediante esta tcnica, aunque no se conoce
el
valor
de
las
variables
son
transformadas
para
70
medidas empricas son tiles para probar si un modelo cuenta con error de
especificacin.
71
(R
R 2o ) j
F=
(1 R 2 aux ) (n g )
2
aux
~. f j , n g
72
73
22 gl
E(X )
A=
[Var ( X )]
3
2
y K=
E ( X )4
[Var ( X )]2
74
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
PZ
I
72.73351
-4.588739
-0.386460
0.471929
-0.409388
10.83288
1.778623
1.214240
0.688867
0.201019
6.714142
-2.579939
-0.318273
0.685080
-2.036558
0.0002
0.0326
0.7584
0.5127
0.0761
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.947105
0.920657
4.760208
181.2767
-35.57419
1.436480
40.38462
16.89940
6.242183
6.459471
35.81046
0.000037
A. Prueba de Multicolinealidad
75
MATRIZ DE CORRELACION
VARIABLE
PX
PZ
PW
I
PX
1.000000
-0.886170
0.950308
-0.530011
PZ
-0.886170
1.000000
-0.811397
0.493410
PW
0.950308
-0.811397
1.000000
-0.556062
I
-0.530011
0.493410
-0.556062
1.000000
Dependent Variable: PX
Method: Least Squares
Date: 10/05/06 Time: 09:48
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PZ
PW
I
3.654915
-0.245705
0.577343
0.007157
1.624021
0.099796
0.121443
0.037598
2.250535
-2.462068
4.754039
0.190365
0.0510
0.0360
0.0010
0.8532
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.942092
0.922789
0.892115
7.162817
-14.57190
1.511932
76
6.153846
3.210560
2.857216
3.031046
48.80600
0.000007
Coefficient
Std. Error
t-Statistic
Prob.
C
PW
PX
PZ
14.84857
-1.308833
0.560323
0.367451
17.26790
1.965637
2.943420
1.135704
0.859894
-0.665857
0.190365
0.323545
0.4122
0.5222
0.8532
0.7537
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.317173
0.089564
7.893449
560.7588
-42.91442
2.341199
11.46154
8.272599
7.217603
7.391434
1.393498
0.306773
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
I
-0.915011
1.238775
0.130516
-0.035872
2.958162
0.260573
0.184036
0.053873
-0.309317
4.754039
0.709189
-0.665857
0.7641
0.0010
0.4962
0.5222
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.911829
0.882439
1.306773
15.36890
-19.53428
1.807371
77
7.230769
3.811252
3.620658
3.794489
31.02476
0.000045
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PW
I
13.94298
-1.637987
0.405510
0.031290
2.424163
0.665289
0.571794
0.096710
5.751669
-2.462068
0.709189
0.323545
0.0003
0.0360
0.4962
0.7537
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.797402
0.729869
2.303399
47.75081
-26.90300
1.468360
7.153846
4.431820
4.754308
4.928139
11.80764
0.001791
respectivamente.
Estas
2
salidas
economtricas
presentan
Lo
78
B. Prueba de Heteroscedasticidad
Con el objeto de verificar si los errores del modelo tienen varianza constante se
desarrolla la prueba de Heteroscedasticidad de White (sin trminos cruzados):
PRUEBA DE WHITE
White Heteroskedasticity Test:
F-statistic
Obs*R-squared
0.714607
7.648476
Probability
Probability
0.682884
0.468539
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 10/05/06 Time: 09:43
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PX^2
PZ
PZ^2
PW
PW^2
I
I^2
-35.46343
-8.022919
1.668258
12.89670
-0.473441
6.476469
-0.834719
-5.747052
0.175578
183.3230
26.87381
2.339704
20.37802
0.701913
18.61942
1.273948
4.094526
0.151639
-0.193448
-0.298540
0.713021
0.632873
-0.674500
0.347834
-0.655222
-1.403594
1.157870
0.8560
0.7802
0.5152
0.5612
0.5370
0.7455
0.5481
0.2331
0.3113
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.588344
-0.234967
18.21512
1327.162
-48.51422
1.980651
13.94436
16.39096
8.848341
9.239460
0.714607
0.682884
79
0.641758
1.091746
Probability
Probability
0.449407
0.296085
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 10/05/06 Time: 09:26
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
PW
I
RESID(-1)
0.348096
0.196375
0.037411
-0.171777
-0.047910
0.305911
11.09241
1.836272
0.706375
1.260744
0.214196
0.381864
0.031381
0.106942
0.052962
-0.136250
-0.223672
0.801098
0.9758
0.9178
0.9592
0.8955
0.8294
0.4494
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.083980
-0.570319
4.870508
166.0530
-35.00402
1.837887
-1.01E-14
3.886694
6.308311
6.569057
0.128352
0.980963
80
81
0.240234
0.438664
Probability
Probability
0.639025
0.507768
Test Equation:
Dependent Variable: DX
Method: Least Squares
Date: 10/05/06 Time: 09:42
Sample: 1 13
Included observations: 13
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PX
PZ
PW
I
FITTED^2
52.50613
-2.010581
-0.058048
-1.026028
-0.245060
0.005793
42.81102
5.582463
1.301350
1.825321
0.396301
0.011819
1.226463
-0.360160
-0.044606
-0.562108
-0.618368
0.490137
0.2597
0.7293
0.9657
0.5916
0.5559
0.6390
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.948860
0.912331
5.003739
175.2618
-35.35486
1.543094
40.38462
16.89940
6.362286
6.623031
25.97566
0.000221
82
D. Prueba de Normalidad
Para probar si los residuos del modelo de demanda siguen distribucin normal a
se realiza el histograma de los errores y la prueba Jarque Bera. Los resultados de
estos procedimientos son los siguientes:
83
GENERO
1
=
0
Si es hom bre
Si es mujer
Por otro lado, un ejemplo de una variable que puede ser representada en escala
ordinal es el estrato econmico. El nombre de ordinal se refiere a que en la
estructura de registro el orden tiene gran relevancia. El investigador puede
conformar la variable de la siguiente manera:
1
2
3
ESTRATO =
4
5
Si
Si
Si
Si
el
el
el
el
hogar pertenece
hogar pertenece
hogar pertenece
hogar pertenece
Si el hogar
Si el hogar
al
al
al
al
estrato
estrato
estrato
estrato
1
2
3
4
pertenece al estrato 5
pertenece al estrato 6
84
SALARIO:
Ingreso laboral
GENERO:
1
2
Re gin = 3
4
Oriental
Pacfica
Central
Atlntica
El resto
85
De acuerdo con ello, las dummy pueden ser entonces utilizadas para mostrar la
existencia de cambio estructural. Por ejemplo para periodos de tiempo (D=1 para
datos tomados en o despus de 1970 y D=0 para datos antes de 1970).
86
W blanco
= e 0, 26
W otra raza
W blanco = 1.297 W otra raza
Lo anterior que quiere decir que el salario de una persona de raza blanca es
29.7% ms alto que el de otra raza. Cuando la variable dependiente del modelo
esta transformada en logaritmo este procedimiento resulta til, el cual se resume
1 , donde j es el coeficiente de la
E (Y X , D1 = 0, D2 = 0) = 0 + 1 X
E (Y X , D1 = 1, D2 = 0) = 0 + 1 X + 1
E (Y X , D1 = 0, D2 = 1) = + 1 X + 2
87
E (Y X , D1 = 0, D2 = 0) = 0 + 1 X
E (Y X , D1 = 1, D2 = 0) = 0 + 1 X + 1
E (Y X , D1 = 0, D2 = 1) = 0 + 1 X + 2
E (Y X , D1 = 1, D2 = 1) = 0 + 1 X + 1 + 2 + 3
De nuevo este esquema generan solo cambios en intercepto, dado que 1 , 2 y
E (Y X , D = 0 ) = 0 + 1 X
E (Y X , D = 1) = 0 + 1 X + 1 + 2 X
88
E (Y X , D = 1) = ( 0 + 1 ) + ( 1 + 2 )X
Esta ecuacin es til para mostrar si existe cambio estructural en intercepto y/o
pendiente, dependiendo de la significancia de los coeficientes 1 y 2 . Por ejemplo
si 1 = 2 = 0 el resultado sugiere la no ocurrencia de cambio en pendiente e
intercepto en la regresin.
7.2. Regresin con variable dependiente cualitativa
Existen otra clase de modelos en econometra llamados modelos de variable
dependiente cualitativa. Estos se dividen en dos clases: los modelos de
probabilidad y los modelos de eleccin discreta para ms de dos alternativas.
89
puede interesar el tipo de transporte que las personas utilizan para llegar a su
lugar de trabajo: bus, automvil, taxi, transmilenio, bicicleta, etc.; cada una de
estas alternativas es distinta.
La forma funcional de los modelos con variable dependiente cualitativa y su
interpretacin, resulta ser ms compleja que la de los modelos con variables
independientes cualitativas. Todos los modelos de este tipo, a excepcin del
modelo de probabilidad lineal no son lineales en los parmetros y se estiman por
el mtodo de mxima verosimilitud.
90
BIBLIOGRAFA
91
ANEXOS
92
ANEXO 1.
REGRESIN LINEAL MLTIPLE EN EL PAQUETE
ESTADSTICO EVIEWS 4.1
Ejemplo
De acuerdo con la siguiente base de datos:
TABLA No. 4. VARIABLES PARA LA ESTIMACIN DE LA DEMANDA LINEAL DEL BIEN X.
Obs.
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
DX
22
20
19
18
16
14
13
11
9
7
6
5
I
10
11
13
14
16
17
18
19
20
21
23
25
PW
8
9
12
13
15
17
19
21
23
24
25
27
PX
3
5
6
8
9
10
11
13
15
17
18
20
PZ
9
9
8
7
6
5
4
3
2
2
1
1
Dx = 0 + 1 I + 2 Pw + 3 Px + 4 Pz + U
Donde:
Dx:
I:
Pw:
Px:
Pz:
U:
93
Desarrollo
Este ejercicio ser desarrollado en el paquete estadstico Econometrics Views 4.1.
A continuacin se muestra todo el procedimiento para estimar el modelo de
demanda lineal siguiendo los supuestos del modelo clsico de regresin lineal
normal.
A. Importar la base de datos.
Este paquete estadstico puede importar datos en hoja electrnica guardados
con extensin wks, wk1 y Excel. Una vez se inicia la sesin en E-views se
debe generar un nuevo archivo de trabajo.
94
Se selecciona el archivo a
importar; en este caso
corresponde a dem1.xls
del subdirectorio donde se
haya almacenado.
95
96
97
APUNTES DE CLASE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
ISSN 1909-4442
9 771909 444004
03
APUNTES DE CLASE
INTRODUCCIN A LA ECONOMETRA
3
OCTUBRE
DE
2006
CEDE
CEDE
ISSN 1909-4442
Introduccin a la econometra
2006
OCTUBRE DE
CEDE
Centro de Estudios
sobre Desarrollo Econmico
Facultad de Economa
Universidad de los Andes