Está en la página 1de 28

 

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE ESTUDIOS SUPERIORES ARAGÓN

LICENCIATURA DE ECONOMÍA

“Apuntes de Econometría”

Jaime Espinosa Rodríguez


Apuntes de Econometría

INDICE

Presentación ................................................................................................................................................................................4
1. Fundamentos de econometría. ............................................................................................................................6
1.1. Definición e importancia ...............................................................................................................................6

1.2. Relación con otras ciencias: .....................................................................................................................7

1.3. Utilización de modelos en Econometría: ..........................................................................................7

1.4. Metodología de la econometría. .............................................................................................................8

1.5. Utilización de datos en econometría. .................................................................................................9

2. Repaso de Conceptos Estadísticos............................................................................................................... 12


2.1. Definiciones importantes ............................................................................................................................ 12

Valor Esperado y Varianza de una variable .......................................................................................... 12

2.2. Estimadores y sus propiedades ........................................................................................................... 13

2.3. Distribuciones de probabilidad .............................................................................................................. 13

Otras Funciones de Distribución derivadas de la distribución Normal .............................. 14

3. Modelos de Regresión de una sola ecuación. ..................................................................................... 16


1) Regresión lineal simple: método de los mínimos cuadrados ordinarios (MCO). . 16

2) El Modelo de regresión lineal múltiple ................................................................................................. 21

Estimación de los parámetros del modelo............................................................................................. 22

Descomposición de la suma de cuadrados .......................................................................................... 24

3) Inferencia acerca de los estimadores................................................................................................... 28


Análisis de la varianza .......................................................................................................................................... 32

4) Predicción en el modelo de regresión ................................................................................................. 32

5) Pruebas de diagnostico ................................................................................................................................... 34

6) Formas funcionales de los modelos de regresión múltiple .................................................. 38

4. Modelos dinámicos ................................................................................................................................................... 48


4.1. El papel del tiempo en economía ...................................................................................................... 48

4.2. Modelos de Rezagos distribuidos ....................................................................................................... 48

4.3. Modelos autorregresivos ............................................................................................................................ 50

Generalización de Hendry ................................................................................................................................... 50

Apendice A................................................................................................................................................................................ 52

2 Jaime Espinosa Rodriguez


Apuntes de Econometría

BIBLIOGRAFÍA ........................................................................................................................................................................... 54

3 Jaime Espinosa Rodriguez


Apuntes de Econometría

PRESENTACIÓN
El inicio de la econometría moderna puede ubicarse próximo a la fundación de la
Sociedad de Econometría en 1930 y posteriormente a los trabajos pioneros de la
fundación Cowles. El continuo desarrollo de la econometría en los años cuarentas y
cincuentas del siglo pasado se vio acelerado en los sesentas, gracias en parte al
desarrollo de nuevas técnicas, y al inicio del uso intensivo de las computadoras. Sin
embargo, a partir de los setentas, se observó un creciente escepticismo y una falta de
credibilidad en los resultados econométricos que se tradujo finalmente en un desencanto,
especialmente para propósitos de política económica (Hendry, 1993 y Leamer, 1983).
Como respuesta a esta situación se han desarrollado recientemente diversas
metodologías alternativas en donde vale destacar los modelos de vectores
autorregresivos (VAR), de series de tiempo (Sims, 1980), el análisis de las restricciones
no lineales en modelos VAR (Pagan 1987, y Spanos 1990), la metodología de lo general
a lo específico (Davinson, Hendry, Srba y Yeo, 1978) y el uso de la estadística bayesiana
(Leamer, 1983).1
Debemos ser realistas y contar con las limitaciones de nuestros métodos de estimación
e inferencia, desarrollados para grandes muestras que nunca disponemos, la importante
generalidad de la “ciencia” económica y las dificultades existentes para disponer de
datos suficientes y de calidad apropiada. Pero tomando todo ello en consideración y
aunque no nos sea posible rechazar teorías, si será factible aprender mediante la
modelación econométrica de las relaciones relevantes entre agentes económicos. Utilizar
los modelos no refutados, que si bien nunca nos permitirán verificar una teoría, son el
instrumento más válido para la predicción y el análisis económico. En palabras de
Pesaran (1990) '... el hecho de que la modelación econométrica esté inevitablemente
sujeta a problemas de búsqueda de especificación, no significa que toda su actividad
sea anodina. Los modelos econométricos son un importante instrumento de previsión y
análisis de políticas y es improbable que se descarten en el futuro. El desafío es
reconocer sus limitaciones, y trabajar para convertirlos en instrumentos más seguros y
efectivos.'
La econometría ha sufrido ataques importantes pero ha sabido incorporar los aspectos
más válidos de sus críticas. Ha desarrollado la microeconometría, ha incorporado el
análisis de series, las expectativas de los agentes, ha proporcionado métodos de
estimación, de validación de modelos, y sigue considerándose como el instrumento más
eficaz para la simulación y la previsión a mediano y a largo plazo. En lugar de disminuir
en desarrollo y aplicaciones, observamos un proceso contrario y la econometría se
expande a campos tan diversos como la historia económica, el marketing, las finanzas
o incluso a disciplinas tan dispares como la geografía o la medicina. Esta situación
propicia que exista la necesidad de actualizar constantemente la enseñanza y los
métodos que se aplican en la construcción de modelos econométricos.

                                                                 

1 Tomado de Galindo, L.M.P. (1995,p.4)

4 Jaime Espinosa Rodriguez


Apuntes de Econometría

Por ultimo debe señalarse, aunque parezca una obviedad, que el objetivo de estas notas
de clases es presentar los principales elementos a discutir durante el curso. Este
documento no tiene como fin el incluir el material detallado y completo presentado en
las clases. Es deber del alumno el complementar la lectura de este documento con la
bibliografía adicional presente en el programa del curso.

5 Jaime Espinosa Rodriguez


Apuntes de Econometría

1. FUNDAMENTOS DE ECONOMETRÍA.
1.1. DEFINICIÓN E IMPORTANCIA

Empezaremos por definir que es la econometría, para esto a continuación se presentamos


las diversas formas en que algunos autores han definido a la econometría:

 Literalmente: “medición económica”


 “... el análisis cuantitativo de fenómenos económicos actuales, basado en el
desarrollo congruente de teoría y observaciones, y relacionado por métodos
2
apropiados de inferencia”.
 “La econometría está interesada en el estudio sistemático de los fenómenos
3
económicos utilizando datos observados”.
 “La econometría se encarga básicamente de medir relaciones económicas;
además utiliza (la) teoría económica, incorporada en un modelo econométrico;
hechos sintetizados por la información relevante, y teoría estadística refinada en
técnicas econométricas para medir y probar en la práctica ciertas relaciones
entre variables económicas, dándole con ello un contenido práctico al
4
razonamiento económico”.
5
 “Arte y ciencia de usar métodos para la medida de relaciones económicas”.
Debe destacarse en las diferentes definiciones mostradas que la econometría tiene como
objetivo los análisis cuantitativos de fenómenos económicos reales sobre la base del
desarrollo simultáneo de teoría económica y observación realizados con métodos
apropiados de inferencia estadística. En este sentido puede decirse que la econometría
no plantea el problema de la dicotomía lógica entre deducción ­ inducción, sino que
por el contrario aboga por el enfoque sintético de aunar los conocimientos derivados
del enfoque deductivo (teoría), con los derivados de la observación e inducción (datos).
Y desde esta perspectiva la modelización econométrica es el único camino existente
para el estudio riguroso de los problemas económicos, bajo el abanico sintético de
teoría y realidad, al combinar dos corrientes que difícilmente pueden sobrevivir
eficazmente de forma aislada:
a. La teoría sin contrastación empírica, como causa del conocimiento lógico
deductivo, poco puede aportar enfrentada a los problemas económicos existentes
en la actualidad. Se convierte en un hermoso castillo de naipes que no resistirá
la mirada pragmática de un conjunto de decisiones y en consecuencia provocará
un olvido de la disciplina a la que pertenece.
b. Por otro lado, el exclusivo enfoque inductivo no puede generalizar por si sólo el
conocimiento del sistema económico y la correcta toma de decisiones. El análisis
aislado de los datos y la búsqueda de relaciones y regularidades sin ninguna

                                                                 

2 Samuelson, P.A.; Koopmans, T.C.;Stone, J. (1954)


3 Spanos A. (1991: 3)
4 Intrilligator M. D. (1990:15)
5 Chow (1983)

6 Jaime Espinosa Rodriguez


Apuntes de Econometría

orientación previa, no sólo puede convertirse en un trabajo complejo, sino que


incluso puede conducir a conclusiones falsas. La medición sin teoría en una
interpretación continua de observaciones estadísticas, normalmente aportará poco
en la explicación de cómo y porque actúan los agentes económicos.

1.2. RELACIÓN CON OTRAS CIENCIAS:

La econometría es una amalgama de Teoría Económica, economía matemática,


estadística económica y estadística matemática, las cuales se relacionan de la siguiente
forma:
 La econometría da contenido empírico a gran parte de la teoría económica, la
cual sólo hace afirmaciones cualitativas.
 La economía matemática tiene por objeto expresar matemáticamente la teoría,
aunque no sea capaz de verificarse. En econometría se convierten las ecuaciones
matemáticas en econométricas.
 La estadística económica se dedica a la recolección y ordenamiento de datos
que se generan en la economía. Con esos datos el econometrista verifica o
refuta las teorías.
 Finalmente, se requieren métodos adicionales a la estadística matemática para
analizar los datos generados en la economía, los cuales no son obtenidos
mediante experimentos controlados.

1.3. UTILIZACIÓN DE MODELOS EN ECONOMETRÍA:

Un modelo es cualquier representación de un fenómeno real con la intención de


explicarlo, predecirlo y controlarlo. Existen diferentes tipos de modelo: verbales – lógicos,
físicos, geométricos, algebraicos, etc. En términos de loa materia el tipo de modelo que
más nos interesa es el algebraico, ya que representa el funcionamiento de un sistema
real a través de un sistema de ecuaciones, que al ser resueltas permiten explicar el
comportamiento del fenómeno en estudio. En esencia, puede decirse que el modelo
algebraico determina los resultados de ciertas variables llamadas endógenas o
dependientes cuyos resultados están en función de las relaciones que se establezcan
dentro del modelo entre estas variables y otras denominadas exógenas ­ las cuales no
dependen del modelo para determinar sus valores ­ y al suceder esto se obtiene un
acercamiento al funcionamiento de un sistema (fenómeno) real y en consecuencia el
modelo cumplirá con su función de explicar, predecir y/o controlar a dicho fenómeno.
Un modelo econométrico es un tipo especial de modelo algebraico, ya que es
estocástico, es decir incluye una o más variables aleatorias, generalmente el modelo
econométrico incluye un término de perturbación estocástica, el cual constituye el
componente aleatorio.
Un modelo econométrico puede ser lineal o no lineal, en el primer caso la linealidad
se da en los parámetros (coeficientes de las variables exógenas).
Los modelos pueden ser multiecuacionales o uniecuacionales, en función del número de
ecuaciones que se utilicen para especificar el sistema que se está estudiando.

7 Jaime Espinosa Rodriguez


Apuntes de Econometría

1.4. METODOLOGÍA DE LA ECONOMETRÍA .

Como se ha señalado líneas arriba la econometría estudia fenómenos económicos a


través de la utilización de diversos enfoques teóricos: económicos, estadísticos,
matemáticos, etc., los cuales son aplicados a los datos cuantitativos con la finalidad de
explicar, predecir o controlar a dichos fenómenos.
En resumen, la manera que opera la econometría (es decir su metodología) puede
plantearse tanto en la forma que se observa en los enunciados como en el diagrama:6
1. Planteamiento de la teoría o hipótesis.
2. Establecer el modelo matemático.
3. Establecer el modelo econométrico.
4. Obtener los datos.
5. Estimación de los parámetros.
6. Realización de pruebas de hipótesis.
7. Pronóstico o predicción
8. Utilización del modelo para fines de control o de política.

                                                                 

6 El diagrama es una adaptación del que aparece en Intrilligator (1990:16).

8 Jaime Espinosa Rodriguez


Apuntes de Econometría

1.5. UTILIZACIÓN DE DATOS EN ECONOMETRÍA.

Como se observa del diagrama anterior la información recopilada es el insumo principal


del modelo econométrico, por esta razón debemos detenernos en revisar el tipo de
datos que se utilizan en los modelos econométricos, ya que según el tipo y calidad de
los datos se puede afectar el resultado de la regresión.
Los datos que se utilizan en econometría pueden ser cuantitativos (PIB, índices de
precios, tasa de desempleo, etc.) o cualitativos (variables dummy que captan aspectos
no cuantificables como sexo, nivel de instrucción, etc.).
Según la temporalidad de los datos pueden clasificarse de la siguiente manera:
1) Corte transversal o sección cruzada
Consiste en datos referidos a individuos, hogares, empresas, ciudades que se observan
en momento de tiempo dado.
a) Normalmente suponemos que esos datos se obtienen por muestreo aleatorio.
b) En ocasiones, la muestra no es aleatoria: problemas de selección, correlación
espacial, muestras estratificadas, etc.
c)
Ejemplo de datos de Corte transversal: Encuesta Nacional de Ingresos y gastos de los
Hogares 2010 (ENIGH, 2010)

9 Jaime Espinosa Rodriguez


Apuntes de Econometría

2) Series temporales
Una serie temporal consiste en observaciones de una variable o de varias variables a
lo largo de varios periodos de tiempo (días, semanas, meses, años…).
a) Una de las características fundamentales de las series temporales es que están
correlacionadas a lo largo del tiempo. Es decir, no constituyen una muestra
aleatoria.
b) Esta correlación condiciona mucho el tipo de estimación y de contrastes
econométricos que pueden realizarse.
Ejemplo de datos de Series de tiempo: Demanda final de bienes y servicios 1993:01 –
2005:04 a precios constantes de 1993.

10 Jaime Espinosa Rodriguez


Apuntes de Econometría

3) Datos fusionados de secciones cruzadas (pooled cross­sections)


Suponga que tenemos una secuencia de datos de corte transversal, con las mismas
variables pero correspondientes a poblaciones entrevistadas en diferentes años 1990,
1991, 1992,… y 2005. A esto se le denomina “datos fusionados de secciones cruzadas”.
a) Estos datos son útiles si queremos analizar la evolución a lo largo del tiempo
de la distribución de ciertas variables como los salarios, la renta de los hogares,
etc.
b) Es importante tener en cuenta que en este tipo de datos NO se tiene información
de los mismos individuos a lo largo del tiempo. En cada periodo, tenemos una
nueva muestra de individuos.
Ejemplo: Los datos unificados de la ENIGH desde 2000 hasta 2012.
4) Datos de panel o datos longitudinales
En este caso, observamos a un grupo de individuos (personas, hogares, empresas…) en
diferentes momentos del tiempo. Es decir, tenemos series temporales para cada individuo
de la muestra.
a) Por tanto, en este tipo de datos seguimos a los mismos individuos a lo largo
del tiempo.
b) Esta característica hace que este tipo de datos tenga diversas ventajas sobre
los otros.
c) Aunque también requiere un tratamiento econométrico especial.
Ejemplo: La Encuesta Nacional de Ocupación y Empleo (ENOE) incluye una submuestra
de panel desde 2005 a la fecha y cambia solo una parte de la submuestra cada 3
años (ojo: la ENOE es trimestral).

11 Jaime Espinosa Rodriguez


Apuntes de Econometría

2. REPASO DE CONCEPTOS ESTADÍSTICOS


2.1. DEFINICIONES IMPORTANTES

Si definimos a X como el resultado de cierto experimento, diremos que X es una variable


aleatoria cuando su valor no es conocido antes de llevar a cabo el experimento. La
probabilidad de que X tome un determinado valor se define como Prob (X = x). Una
variable aleatoria adicionalmente podrá ser discreta o continua. Será discreta cuando El
conjunto de resultados es finito en número o contable infinitamente. Será continua
cuando el conjunto de resultados es infinitamente divisible, y por lo tanto, incontable.
Una lista de valores x, resultantes del desarrollo de un experimento asociado a la
variable aleatoria X, y las respectivas probabilidades asociadas definen la función de
densidad, f(x). Para el caso de variable aleatoria discreta es posible plantear
f(x) = Prob (X = x). Además, se deben cumplir los siguientes axiomas:
1. Pr ob( X  x )  x  1,0
2. Pr ob( X  x )   x i  1;  f ( x) dx  1
i

3. Pr ob( X  x )  1  Pr ob( X  x)
Para cualquier variable aleatoria X, la probabilidad que esta variable tome valores
menores o iguales que a se define por F(a) (que es la función de distribución acumulada).
Para una variable aleatoria discreta se tendrá que F ( x )   xi . La función de
i

distribución acumulada debe cumplir con las siguientes propiedades:


b
1 F ( x)   f ( x)dx  x, x  1,0
a

2 Si x  y,  F ( x)  F ( y )

VALOR ESPERADO Y VARIANZA DE UNA VARIABLE


La media de la variable aleatoria X, llamada también valor esperado, se define como

E ( X )   pi x E(x) (caso discreto) o E (X )   xfxdx (caso continuo). Asimismo la


i

varianza de la variable aleatoria se define como Var( X )   


2
 pi X  E( X )2 , la
i


varianza es en sí misma un valor esperado ya que: Var ( X )  E X  E ( X ) . 2
Otra medida de dispersión aplicada a las variables aleatorias es la desviación estándar,
σ. Esta se define como la raíz positiva de la varianza.
Existen tres resultados útiles concernientes al operador valor esperado:
1. E (aX  b)  aE ( X )  b; donde a, b son cons tan tes
2. E (aX )2  a 2 E ( X 2 )
3. Var (aX  b)  a 2Var ( X )
Cuando se trata con distribuciones conjuntas de variables aleatorias (las cuales describen
las probabilidades de ocurrencia tanto de la variable aleatoria X como de la variable

12 Jaime Espinosa Rodriguez


Apuntes de Econometría

aleatoria Y) se puede obtener la covarianza de X e Y que es el valor esperado del


producto XY cuando ambas son medidas como desviaciones alrededor de sus medias:
Cov ( X , Y )  E  X  E ( X ) Y  E (Y ) 
  pi , j ( X  E ( X ))(Y  E (Y ))
i j

En el caso de distribuciones de probabilidad conjuntas se tienen los siguientes resultados


del operador del valor esperado:
1. E ( X  Y )  E ( X )  E (Y )
2. Var ( X  Y )  Var ( X )  Var (Y )  2Cov( X , Y )
3. E ( XY )  E ( X ) E (Y ); si X , Y son independientes
4. Cov( X , Y )  0; si X , Y son independientes
Una aplicación importante de la covarianza se da en el coeficiente de correlación, el
cual mide la dirección en que se mueven ambas variables, su fórmula es:

Cov ( x, y )
 ( x, y ) 
 x y

2.2. ESTIMADORES Y SUS PROPIEDADES

La estimación es el proceso de utilizar datos muestrales para obtener valores que se


aproximen a los parámetros desconocidos de una población, en particular la media y la
varianza, aunque no son los únicos parámetros de interés si son los más comunes.
Existen dos tipos de estimaciones de punto y de intervalo. Existen cuatro propiedades
importantes de los estimadores: Ausencia de sesgo, Eficiencia, Error cuadrático medio
mínimo, consistencia.
Ausencia de sesgo. Se dice que un estimador es insesgado si su valor esperado es
igual a su valor verdadero, es decir si se cumple que:

Sesgo  E ( ˆ )    0
Eficiencia Un estimador es eficiente si para un tamaño de muestra dado su varianza es
menor que la varianza de cualquier otro estimador.
Error cuadrático medio mínimo:

ECM ( ˆ )  E ( ˆ   ) 2
Consistencia. El estimador ̂ se considera consistente si el límite de probabilidad de
̂ , es decir un estimador es consistente si conforme se incrementa el
tamaño de muestra se acerca al valor poblacional.

2.3. DISTRIBUCIONES DE PROBABILIDAD

Función de Distribución Normal. Su forma general es

1  1 2
P( X  x i )  exp 2  xi   x  
2 x2  2 x 

13 Jaime Espinosa Rodriguez


Apuntes de Econometría

donde x y  x2 son la media y varianza asociadas a la variable aleatoria X. De este


modo, si la variable aleatoria X sigue una distribución normal con media x y varianza
 x2 ; esto se expresa de la siguiente forma X ~ N ( x ,  x2 ).
La figura 1muestra la forma de la función de densidad normal estándar

La distribución Normal es muy utilizada por varias razones entre las que destacan las
siguientes:
 La distribución es descrita por completo por su media y su varianza, por lo que
no es necesario preocuparse por otras propiedades como el sesgo y la kurtosis.
 Es simétrica y en forma de campana, una forma razonable para describir la
distribución de los parámetros, como la pendiente y el intercepto que se estiman
en la regresión lineal.
 A través del teorema del límite central podemos aproximar distintas distribuciones
de probabilidad a la distribución Normal.
Teorema del límite central. Si X tiene media μ y varianza σ2, entonces la distribución
muestral de X se vuelve aproximadamente normal con media μ y varianza σ2/N
conforme N se incrementa.

OTRAS FUNCIONES DE DISTRIBUCIÓN DERIVADAS DE LA DISTRIBUCIÓN NORMAL


La Función de Distribución  2 Chi cuadrada, es útil para probar hipótesis que tienen
que ver con varianzas de variables aleatorias. Su aplicación se deriva del siguiente
teorema:
La suma de los cuadrados de N variables aleatorias independientes con distribución
Normal (0,1) se distribuye como una Chi cuadrada con n grados de libertad. La forma
exacta de la Chi cuadrada depende del número de grados de libertad que tenga,
mientras más grados de libertad tenga más se aproxima a una normal.
La Función de Distribución t de Student, es útil cuando no se conoce la varianza
poblacional de la variable aleatoria. Su aplicación se deriva del siguiente teorema:
Si X se distribuye normal (0,1) y Z se distribuye como una Chi cuadrada con N grados
de libertad. Entonces si X y Z son independientes, X Z N se tiene una distribución t
con N grados de libertad.

14 Jaime Espinosa Rodriguez


Apuntes de Econometría

Como la Normal la t es simétrica, y se aproxima a la normal para muestras grandes,


aunque es más ancha en los extremos, la fórmula para calcular el estadístico t es:

X  N
t
sx
La Función de Distribución F. Es útil cuando se busca probar hipótesis conjuntas que
implican a dos o más parámetros. La distribución F se caracteriza por utilizar dos
parámetros, el primero se encuentra asociado al número de parámetros estimados y el
segundo con el número de grados de libertad. Su aplicación se deriva del siguiente
teorema:
Si X y Z son independientes y se distribuyen como Chi cuadrada con N1 y N2 grados
de libertad, respectivamente entonces (X/N1)/ (Z/N2) se distribuye de acuerdo con una
distribución F con N1 y N2 grados de libertad. La fórmula para calcular el estadístico F
es:

( N1  1) s x2 
  x2 

N1  1
F
( N 2  1) s z2 
  z2 
N2 1
El estadístico F siempre se tabula con el estimador mayor de la varianza en el numerador
y el estimador menor de la varianza en el denominador. Entre mayor es la diferencia
entre las dos varianzas, es mayor el valor de F. Por lo tanto un valor grande de F
implica que es improbable que las dos varianzas del error sean iguales.

15 Jaime Espinosa Rodriguez


Apuntes de Econometría

3. MODELOS DE REGRESIÓN DE UNA SOLA ECUACIÓN.


1) REGRESIÓN LINEAL SIMPLE: MÉTODO DE LOS MÍNIMOS CUADRADOS ORDINARIOS
(MCO).

El propósito de construir relaciones estadísticas es, por lo general predecir o explicar


los efectos en una variable resultante de los cambios en una o más variables explicativas.
En el caso de dos variables lo que nos interesa calcular es la función de regresión
poblacional (FRP), que no es más que “el lugar geométrico de las medias condicionales
o esperanzas de la variable dependiente para los valores fijos de las variables
explicativas”.7
Debido a que la FRP no puede observarse directamente se utiliza una aproximación que
es la función de regresión muestral (FRM), la cual nos producirá una estimación adecuada
de la FRP y en consecuencia podrá explicar el comportamiento de una variable
dependiente Y en función de una o más variables explicativas.
Un método para estimar la FRM es el de mínimos cuadrados ordinarios (MCO) el cual
consiste en elevar al cuadrado los residuos de la ecuación 1 y después diferenciarlos
para obtener los estimadores mínimos cuadráticos.

Yi  ˆ0  ˆ1 X i  ui Ecuación 1

A partir de la ecuación (1) se obtienen los estimadores mínimos cuadráticos, como se


observa a continuación:

 u   Y  Yˆ 
2 2
i i i

 u   Y  ˆ  ˆ X  diferenciando parcialmente respecto a ˆ


2
2
i i 0 1 i 0 y ˆ1 :
  u  2

 2 Y  ˆ  ˆ X   2 uˆ
i

ˆ
i 0 1 i i
0

  u   2 Y
2

 ˆ0  ˆ1 X i X i  2 uˆ i X i



i

ˆ
i
1

igualando a cero y despejando:


Yi  nˆ0  ˆ1  X i
Y X i i  ˆ0  X i  ˆ1  X i2

                                                                 

7 Gujarati D. N.(1997:33)

16 Jaime Espinosa Rodriguez


Apuntes de Econometría

Resolviendo las ecuaciones de manera simultánea:


n X iYi   X i  Yi
ˆ1 
n X i2    X i 
2

ˆ1 
 X i  
 X   Yi  Y 
 X  X 
2
i

ˆ1  
xi yi
(1)
x 2
i

ˆ 
 X Y   X  X Y
i
2
i i i i

n X    X 
0 2
2
i i

ˆ0  Y  ˆ1 X (2)


Características de los estimadores mínimo cuadráticos:

I. Los estimadores obtenidos ( ̂0 y ̂1 ) MCO son lineales y expresan la relación
entre X e Y. Son puntuales (dan un solo valor).
II. La línea de regresión que se obtiene pasa a través de las medias muestrales de
X e Y lo que puede observarse en el gráfico 1 (la ecuación puede escribirse
como Y  ˆ0  ˆ1 X ); además la media de los errores es cero y los errores no
están correlacionados con Yi ni con X.

Y Yˆi  ˆ0  ˆ1Xi


FRM
. .
. .
Y .
. . .. .
.
X X
FRM: Función de regresión muestral
Gráfico 1.
Ejemplo del modelo de regresión lineal de dos variables.8
Para ilustrar el funcionamiento del modelo lineal de dos variables utilizaremos la función
Keynesiana del consumo, para eso utilizamos los datos del cuadro 3.1, los cuales nos
sirven para verificar la relación entre el consumo y el ingreso.

                                                                 

8 Ejemplo adaptado del mostrado por Gujarati (1997:35)

17 Jaime Espinosa Rodriguez


Apuntes de Econometría

CON SUMO INGRESO


PERIODO
(Y) (X)

1 1 050 1 200
2 975 1 500
3 1 350 1 800
4 1 425 2 100
5 1 650 2 400
6 1 725 2 700
7 1 800 3 000

Cuadro 3.1 Datos hipotéticos sobre ingreso y consumo.

En el cuadro 3.2 se muestran los cálculos para obtener la regresión por mínimos
cuadrados de los datos del cuadro 3.1, es importante destacar que los datos son
hipotéticos, únicamente con fines ilustrativos.

18 Jaime Espinosa Rodriguez


y i  ( Y  Y ) xi  ( X  X )  2 2 2
Y-Ymed X-Xmed yixi xi2 Y e e yi X
-615 -1 350 830 250 1 822 500 977.73 72.2727 5 223 378 225 1 440 000
-690 -1 050 724 500 1 102 500 1 130.45 -155.4545 24 166 476 100 2 250 000
-315 -750 236 250 562 500 1 283.18 66.8182 4 465 99 225 3 240 000
-240 -450 108 000 202 500 1 435.91 -10.9091 119 57 600 4 410 000
-15 -150 2 250 22 500 1 588.64 61.3636 3 765 225 5 760 000
60 150 9 000 22 500 1 741.36 -16.3636 268 3 600 7 290 000
135 450 60 750 202 500 1 894.09 -94.0909 8 853 18 225 9 000 000
435 750 326 250 562 500 2 046.82 53.1818 2 828 189 225 10 890 000
660 1 050 693 000 1 102 500 2 199.55 125.4545 15 739 435 600 12 960 000
585 1 350 789 750 1 822 500 2 352.27 -102.2727 10 460 342 225 15 210 000
Suma 3 780 000 7 425 000 0 75 886 2 000 250 72 450 000

Cuadro 3.2 Calculo de la regresión para dos variables.


Basándonos en los datos del cuadro 3.2 estimamos los coeficientes de regresión:

Y  1 665
X  2 550

 x y i i
3 780 000
1  i

x i
2
i 7 425 000

1  0.5091
 
 0  Y  1X  1 665  0.5091 2 550 

 0  366.818
Obtenemos el coeficiente de determinación o de Bondad de ajuste R2:

u 2
i
75 886
R2  1 i
 1
y i
2
i 2 000 250

R  0.9621
2

En la gráfica 3.1 se muestra la línea de regresión estimada, en la cual puede observarse


que el ajuste es bastante bueno.

Estimación de mínimos cuadrados del consumo privado en función del ingreso


disponible

2 500

2 000

1 500

1 000

500

0
1 200 1 500 1 800 2 100 2 400 2 700 3 000 3 300 3 600 3 900

Consumo Real Y Consumo estimado Yest

Gráfica 3.1. Estimación de mínimos cuadrados del Consumo privado en función del Ingreso
disponible.
Asimismo obtenemos los valores de los errores estándar de los coeficientes con las que
realizamos las pruebas de significancia de los mismos:
Apuntes de Econometría

2  
ui2
75 886

 9 485.7955
n2 8
  2
 
ee 1  Var 1   
 xi2
 9 485.7955
 
ee 1 
7 425 000
 0.0357

eeˆ 0  
 X 2

n x 2
i

9 485.755 72 450 000


eeˆ 0  
10 * 7 425 000
eeˆ 0   96.2073

Probamos la hipótesis nula de que los coeficientes son diferentes de 0 para lo cual
establecemos:

H 0 : ˆ  0
H a : ˆ  0
ˆ1  0 0.5091  0
t   14.2432
eeˆ1  0.0357
ˆ 0  0 366.82  0
t   3.8128
eeˆ 0  96.2073
Los valores en tablas para t con 8 grados de libertad y 95% de intervalo de confianza
se tiene que t0.025 = 2.365, como los valores de t para β1 y β0 son mayores que 2.365,
entonces rechazamos H0 y aceptamos Ha los valores de los coeficientes son
significativamente diferentes de 0.

2) EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE

El modelo de regresión lineal normal clásico (MRLNC), que se va a estudiar, considera


que la relación entre la variable dependiente (Y) y las independientes (X1, X2,..., Xk) se
puede formular matricialmente a partir de la siguiente expresión lineal:
Y  X ·  u
donde:

 Y1   X 11 X 12 ... X 1k   1   e1 
       
Y  X X 22 ... X 2k    e 
Y  2 X   21   X1 X 2 ... Xk    2 e 2
... ... ... ... ...  ... ...
       
Y  X ... X nk    e 
 n  n1 X n2  K  n

21 Jaime Espinosa Rodriguez


Apuntes de Econometría

que desarrollando se formularía:


Yi  1 X i1   2 X i 2  ...   K X iK  ui i = 1,2,..., n

si se considera que en el modelo existe término constante, la matriz X se puede expresar


como:

1 X 12 ... X 1K 
 
1 ... 
X   Xk 
X 22 X 2K
X   X2 X3 ...
... ... ... ...
 
1 ... 
 X n2 X nK 
y el modelo quedaría: Yi  1   2 X i 2  ...   K X iK  ui i=1,2,..., n

Esta relación funcional se conoce como hipótesis de linealidad. Además se establecen,


en relación con el modelo, otro conjunto de hipótesis referidas a la variable de
perturbación y a la matriz de regresores:
Hipótesis
1. Y  X  u
2. E(u)  0
3. E (uu ' )   2 ·I
4. X matriz de regresores no estocástica
5. X   k  n
6. u ~ N (0,  2 )
En el modelo estudiado en este capítulo se supone que se verifican las 6 hipótesis
anteriores, por lo que siempre se trabajará bajo el supuesto de un modelo de regresión
lineal, normal, clásico.

ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO


 

En el modelo de regresión especificado existe un conjunto de parámetros desconocidos


( i y  ). Por ello, en primer lugar, se tratará de su estimación.
2

Existen diversos métodos para estimar los parámetros del modelo, muchos de los cuales
se basan en los residuos o errores, que se definen como la diferencia entre el valor
real de variable dependiente y el estimado por el modelo para dicha variable.

ei  Yi  Yˆi i = 1,2,..., n

Entre los métodos que estiman los parámetros del modelo a partir de los residuos, el
más sencillo es el método de Mínimos Cuadrados Ordinarios (MCO), que hace mínima
la suma de los cuadrados de los residuos.
n
Partiendo de Minimizar ei2
i 1

22 Jaime Espinosa Rodriguez


Apuntes de Econometría

Se obtiene un sistema de ecuaciones (ecuaciones normales) : X ' X ·b  X ' Y que permite


obtener los estimadores mínimo cuadrático ordinarios (EMCO) de los parámetros i a
partir de la expresión:
e  Y  X
Esto sucede por el hecho de que:
RSS  ee   X Y  Y X 

RSS  Y  X   Y  X   Y X   Y X      X Y  
RSS  Y Y    X Y  Y X     X X 
RSS  Y Y  2   X Y    X X  La  transpuesta  de  un  vector  nos 
regresa  al  vector  original  y  la 
Condiciones de primer orden traspuesta de un escalar es el escalar 
  RSS  mismo. 
 2 X Y  2 X X   0

despejando 
X X   X Y

X X  X X    X X 
1 1
X Y
 
I

   X X  X Y
1

De esta manera obtenemos los estimadores de  mínimo cuadráticos.

Cada uno de los coeficientes  representa el efecto de las variables independientes


sobre la variable explicada; es decir el valor estimado de  indica la variación que
experimenta el vector de variables dependientes cuando la matriz de variables
independientes X varía en una unidad y todas las demás permanecen constantes.
Estos estimadores MCO son los mejores estimadores lineales e insesgados (MELI) en el
modelo de regresión lineal, normal, clásico.
Un estimador de la varianza de la perturbación puede ser la siguiente expresión:

SCR ee
S u2  
nk nk
Puede comprobarse que este estimador es insesgado  
E S u2   u2 ­ de la varianza de
la perturbación.

Valores esperados y varianzas de los componentes de una regresión.


Variable Valor esperado (E) Varianza
Y X σ2I
X μ 0
e 0 σ2I

ˆ   2  X X  1

23 Jaime Espinosa Rodriguez


Apuntes de Econometría

Note que Var ( ˆ )= 


2  X X  1 , que es una matriz de kxk términos con las varianzas
muestrales de ˆ en la diagonal principal y las covarianzas en las posiciones fuera de
la diagonal, de hecho se le conoce comúnmente como la matriz de varianzas y
covarianzas.

DESCOMPOSICIÓN DE LA SUMA DE CUADRADOS


Las covarianzas cero entre los regresores y los residuos subyacen la descomposición
de la suma de cuadrados. Descomponiendo el vector Y en la parte explicada y la parte
no explicada de la regresión tenemos:

Y  Yˆ  e  X  e
si  aceptamos  que 

Y Y  Yˆ  e Yˆ  e   X X  ee
note que Y Y  es la suma de los cuadrados de los valores reales de Y
n
por lo que Y Y   Yt 2
t 1

tomando la suma del cuadrado de las desviacion es a la media tenemos que 

 Y   Y
2
t Y t
2
 nY 2
t t

si sustraemos nY 2 de la tenemos la siguiente descomposición
YY
 n  X
Y2   X  nY 2  e
  
e
STC SCE SCR

la descomposición anterior, se expresaría como:


SCT  SCE  SCR
donde:
SCT: es la Suma de Cuadrados Totales y representa una medida de la variación de la
variable dependiente
SCE es la Suma de Cuadrados Explicados por el modelo de regresión
SCR es la Suma de Cuadrados de Residuos
Una vez estimado el modelo es conveniente obtener una medida acerca de la bondad
del ajuste realizado. Un estadístico que facilita esta medida es el coeficiente de
determinación o coeficiente de correlación múltiple (R2), que se define:
SCE SCR
R2   1
SCT SCT
Esta medida mide la proporción de la variación total en Y explicada por la combinación
lineal de regresores. La mayoría de los programas computacionales incluyen dentro de
sus rutinas

A la R2 ajustada la que se denota como R2, este estadístico toma en cuenta el número
de regresores (variables independientes) en la ecuación, la R2 nunca decrece cuando se
adicionan o quitan variables explicatorias, la R2 puede decrecer con la adición de
variables de bajo poder explicatorio. Ya que se define de la siguiente manera:

24 Jaime Espinosa Rodriguez


Apuntes de Econometría

SCR n  k n 1
R 2 1
SCT n  1
 1
nk

1  R2 
Entonces R2 nos permite saber cuándo es momento de dejar de adicionar variables
independientes al modelo, existen otros dos criterios que permiten obtener información
acerca del ajuste según el número de regresores, el Criterio de Scharwz9:

ee k
SC  ln  ln n
n n
Y el criterio de información de Akaike10:

ee 2k
AIC  ln 
n n

Si puede observar que ambos criterios penalizan el incremento de variables explicativas.

EL TEOREMA DE GAUSS­MARKOV
 

Definición

Dados los supuestos del modelo clásico de regresión lineal, los estimadores de mínimos
cuadrados, dentro de la clase de estimadores lineales insesgados, tienen varianza
mínima, es decir, son MELI.

Demostración11:

Partimos del hecho que

ˆ   X X 1 X Y (1)

Como  X X 1 X es una matriz de números fijos, ˆ ̂ es una función lineal de Y. Por tanto, por
definición, es un estimador lineal.

Recordamos que la Función de Regresión Poblacional FRP está dada por:


Y  X  u (2)
Sustituimos esto en (1) y obtenemos
ˆ   X X 1 X  X  u  (3)
                                                                 

9 El SC difiere de la R2 ajustada en que penaliza más fuerte la adición de variables en el lado derecho (lo cual reduce
el número de grados de libertad). En principio, podemos seleccionar una estructura de rezago incrementando el
número de los mismos hasta el punto en que el SC alcanza un valor mínimo, (Pyndick:249)

10 El AIC también penaliza la adición de variables en el lado derecho en forma más fuerte que la R2 ajustada.

11
 La demostración está tomada de Gujarati D. – Porter D. (2010: 875), solo tiene algunas adaptaciones 
mínimas para que se a más entendible. 

25 Jaime Espinosa Rodriguez


Apuntes de Econometría

ˆ    X X 1 X u  (4)
Porque
 X X 1 X X I
Tomamos el valor esperado de (4) y da

E  ˆ  E     X X  X E (u )
1

E  ˆ   ˆ
Según los supuestos, lo cual indica que ̂ es un estimador insesgado de .

Por último, sea ˆ


β∗ cualquier otro estimador lineal de β, el cual se escribe como
β∗ _ [(X X)−1X + C]y (6)
donde C es una matriz de constantes.
Al sustituir y de (2) en (6), obtenemos
ˆβ

∗_ [(X X)−1X + C](Xβ + u)

_ β + CXβ + (X X)−1X u+ Cu
(7)
Ahora, si ˆβ∗ es un estimador insesgado de β, debemos tener

CX _ 0 (¿Por qué?) (8)


Con (8), (7) se escribe así:
ˆβ

∗− β _ (X X)−1X u+ Cu (9)

Por defi nición, la matriz de var-cov(ˆβ∗) es

E(ˆ

β∗ − β)(ˆ

β∗ − β) _ E[(X X)−1X u+ Cu][(X X)−1X u+ Cu] (10)


Empleamos las propiedades de inversión y trasposición de matrices y después de simplifi cación algebraica
para obtener
var-cov (ˆ

β∗) _ σ2(X X)−1 + σ2CC

_ var-cov (ˆ

β) + σ2CC (11)

lo cual indica que la matriz de varianza-covarianza del estimador lineal e insesgado alterno ˆβ∗ es igual a la

matriz de varianza-covarianza del estimador MCO, ˆβ más σ2 veces CC_, que es una matriz semidefi nida*

positiva. Por tanto, las varianzas de un elemento dado de ˆβ∗ deben ser necesariamente iguales o mayores al

elemento correspondiente de ˆβ, lo cual demuestra que ˆβ es MELI. Por supuesto, si C es una matriz nula, es

decir, C _ 0, entonces ˆβ∗ _ ˆβ, lo que equivale a decir que si encontramos un estimador MELI, éste debe ser

26 Jaime Espinosa Rodriguez


Apuntes de Econometría

el estimador de mínimos cuadrados ˆβ.

Que denota cualquier estimador lineal insesgado arbitrario de i . El criterio de


insesgamiento impone dos restricciones lineales sobre los ponderadores (Ci), dejando
a (n­2) ponderadores "libres". Esto puede mostrarse en:

 
var b*  var b*  2     ci  wi 
2

Donde
  ci  wi 2  0 , var  b*   var  b*  .
La igualdad sólo se mantiene cuando ci; = wi; para todo i, es decir, cuando b * = b. El
estimador de mínimos cuadrados tiene, pues, de mínima varianza en la clase de
estimadores lineales y se dice que es un best linear unbiased estimator, or BLUE.

Ejemplo:
Los datos de la siguiente hoja son datos macroeconómicos de los Estados Unidos para
el periodo 1968­1982.12 Estamos interesados en obtenemos una ecuación de inversión
en términos del PIB y de la tasa de interés.
Primero llevamos a términos reales las variables de Inversión y PIB, dividiéndolas por el
Índice de Precios al Consumidor (IPC). Podemos construir un par de variables con un
efecto potencial en la inversión: Una variable de tendencia temporal y la tasa de inflación
(calculada como el cambio porcentual del IPC) (en 1967 el IPC fue de 79.06).
Queremos un modelo de la forma
é ó

Datos de Inversiones

A˜no PIB Inversió


n IPC Tasa Interé
s
1968 873.4 133.3 82.54 5.16

1969 944.0 149.3 86.79 5.87

1970 992.7 144.2 91.45 5.95

1971 1077.6 166.4 96.01 4.88

1972 1185.9 195.0 100.00 4.50

1973 1326.4 229.8 105.75 6.44

1974 1434.2 228.7 115.08 7.83

1975 1549.2 206.1 125.79 6.25

                                                                 

12 Datos de Greene, W.H. (1997: 241), Econometric analysis. Prentice Hall. 

27 Jaime Espinosa Rodriguez


Apuntes de Econometría

1976 1718.0 257.9 132.34 5.50

1977 1918.3 324.1 140.05 5.46

1978 2163.9 386.6 150.42 7.46

1979 2417.8 423.0 163.42 10.28

1980 2633.1 402.3 178.64 11.77

1981 2937.7 471.5 195.51 13.42

1982 3057.5 421.9 207.23 11.02

Cálculos Intermedios en el Ajuste de la Regresión

5.09 0.17 0.67 0.02 é 0.001 ó

3) INFERENCIA ACERCA DE LOS ESTIMADORES

El método de estimación expuesto permite obtener estimaciones puntuales de los


parámetros del modelo. La inferencia permite completar esta estimación puntual,
mediante la estimación por intervalos y los contrastes de hipótesis.
Los primeros posibilitan la obtención de un intervalo dentro del cual, con un determinado
nivel de confianza, oscilará el verdadero valor de un parámetro.
 Intervalo de confianza para el parámetro j
Su cálculo se realiza mediante: 
IC  j : b j  S b j t n  k 

28 Jaime Espinosa Rodriguez