Está en la página 1de 68

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

FACULTAD DE ECONOMIA Y PLANIFICACIN








ANALISIS ECONOMETRICO CON E-VIEWS 7.0


PH.D JORGE ALARCN NOVOA
1
JOS LUIS NOLAZCO CAMA
2








1
Profesor Principal del Departamento Acadmico de Economa y Planificacin, alarcon1956@gmail.com.
2
Bachiller en Economa, jlnc09@gmail.com.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


2
CAPITULO 1
INTRODUCCION AL MANEJO DE E-VIEWS 7.0

1.1 Nociones de Econometra y el Programa E-Views

El programa E-Views es la versin en entorno MS-Windows del antiguo Micro - TSP (Time Series
Analysis) desarrollado por primera vez en 1981. Es uno de los ms utilizados dentro del campo de la
econometra y su manejo permite la estimacin, resolucin y uso de modelos economtricos de
distinta naturaleza, mediante la utilizacin de una amplia gama de procedimientos.

Su puesta al da" en relacin con los ltimos avances de la econometra aplicada es notable y, para
los que conocen cada una de las tcnicas, su utilizacin es extremadamente intuitiva. Esta
adecuacin a la prctica profesional de la econometra se debe sin duda a sus autores que, desde las
primeras versiones del TSP, disearon el programa de cara a su utilizacin real adaptndolo a sus
propias necesidades del trabajo cotidiano de los economistas.

Aunque el programa fue desarrollado por economistas y la mayor parte de sus usos se realizan en el
campo de la economa no hay nada en su diseo que limite su utilidad en otras disciplinas, ya sea de
las ciencias sociales, biolgicas, u otras. La versin 7.0 es la ms reciente, diseada e implementada
el presente ao 2010. Incluye mltiples mejoras que se podrn ir mostrando a lo largo del presente
curso de capacitacin.

1.2 Pantalla de Inicio Entrada

Para comenzar a trabajar con el programa E-views, versin 7.0, bastar con acceder al icono
correspondiente (al Programa) en el escritorio de nuestro computador. Luego se activar la
aplicacin seleccionada, presentndonos una pantalla como la que se presenta en la figura 1, que
est dividida en cuatro grandes partes, marcadas respectivamente del 1 al 4, con los siguientes
contenidos:





Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


3

Figura 1

- Parte 1. Men bsico de herramientas generales

En esta primera parte podemos acceder a los diferentes mens desplegables, habituales en las
aplicaciones de tipo Windows, donde se puede ejecutar los comandos genricos de fichero (File),
edicin (Edit), manejo de objetos (Object), Vista (View), desarrollo de procedimientos (Procs),
accesos rpidos a operaciones bsicas (Quick), opciones generales del programa (Options), gestin de
ventanas (Window) y ayuda en lnea (Help), y cuyas funciones son las siguientes:

File Menu: controla operaciones relacionadas con los ficheros, datos y programas
Edit Menu: contiene los tems bsicos de cualquier programa en entorno Windows
Objects Menu: manipula los distintos objetos que se almacenan en un workfile.
Proc and View Menu: estos dos mens se utilizan de forma diferente que el resto ya que se
refieren siempre a la ventana activa en cada caso y por tanto diferirn segn el tipo de
ventana en uso.
Quick Menu: da acceso directo a comandos que se utilizan con cierta frecuente
Options Menu: altera los parmetros de funcionamiento general del E-Views. Los cambios
que se realicen con este men permanecen an saliendo del programa.
Windows Menu: da acceso directo a las distintas ventanas que tengamos abiertas en el rea
de trabajo.
Help Menu: men de ayuda clsico.

Vamos ahora a entrar con ms detalle en las opciones bsicas de aquellas entradas principales, de
mayor inters, excepto en los casos de procs y views ya que stos cambian segn la ventana activa
(no se trata de describir con detalle cada una de las opciones sino tan slo de anticipar alguno de los
tems de cada uno de ellos).

Parte 1
Parte 2
Parte
3
Parte 4
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


4

MENU FILE
ENTRADA ACCION
New Crea nuevos workfiles (archivos de trabajo en E-views, tambin
llamado ficheros), el cual pueden ser de tipo programa o texto.
Open Abre un men por el que se accede a los workfiles, programas o
ficheros de texto previamente creados.
Save Salva el workfile, programa o fichero de texto activo, si no se ha
grabado nunca preguntar el nombre a utilizar.
Save as Salva (o guarda) el workfile, programa o fichero de texto preguntando
el nombre.
Close Cierra la ventana activa. Si la ventana activa es un workfile, un
programa o un fichero de texto este se cerrara, es decir, ser borrado
de la memoria RAM. Previamente se nos preguntara si deseamos
guardar los ltimos cambios.
Import Lee datos de un fichero externo. Los ficheros legibles son de los
siguientes tipos: Banco de datos de E-Views, DRI Basic Economic
database, texto, Lotus y Excel. Cuando se importan datos de estos
formatos se abrir un men adicional en el que se nos preguntara el
formato de los mismos.
Export Escribe datos desde un fichero de trabajo al formato de Banco de
datos E-Views, texto, Lotus y Excel. En el formato de Banco de datos
puede almacenarse cualquier tipo de objeto (en ficheros separados)
pero en ficheros de texto o de hoja de clculo solo pueden
almacenarse series de datos. Se abrirn en todos los casos mens
adicionales para especificar el formato.
Print Imprime el contenido de la ventana activa. Si no hay ventana activada
imprime el rea de comandos.
Print Setup Controla las opciones de impresin. El men que se abre permite,
entre otras cosas, especificar si la impresin ser enviada a la
impresora o a un fichero de disco.
Exit Cierra todas las ventanas y sale del programa preguntando si deben
grabarse los cambios realizados.

MEN EDIT
ENTRADA ACCION
Undo Deshace el efecto de la operacin de edicin ms reciente.
Cut Borra la seleccin y la coloca en el Clipboard de Windows.
Copy Copia la seleccin en el Clipboard de Windows.
Paste Coloca el material residente en el Clipboard de Windows en la zona
seleccionada.
Delete Borra la seleccin.
Find Encuentra una cadena de caracteres en un texto.
Replace Reemplaza determinadas cadenas de caracteres en un texto.
Next Ejecuta la siguiente operacin de bsqueda segn la condicin de
bsqueda previa.
Insert text file Sirve para insertar un documento de texto de tu computadora.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


5
MENU OBJECTS
ENTRADA ACCION
New Object Crea un nuevo objeto del que se nos preguntara el tipo y el nombre.
Fetch Es la operacin contraria a Store y de efecto similar a Import del
men File. Su utilidad es grabar un objeto en formato Base de Datos
E-Views (*.db*) en un disco.
Store Es la operacin contraria a Fetcht y de efecto similar a Export del
men File. Su utilidad es grabar un objeto en formato Base de Datos
E-Views (*.db*) en un disco.
Store As De efecto idntico a Store permite guardar objetos en formato
.db pero permitiendo especificar el nombre y el lugar de
almacenamiento.
Name Permite dar nombre a un objeto nuevo o ya creado cuando este se
encuentra activo.
Copy Realiza una copia de un determinado objeto cuando este se
encuentra activado o simplemente resaltado. Nos preguntara el
nombre del nuevo objeto.
Freeze Congela la vista activa del objeto seleccionado creando un nuevo
objeto. Si el objeto congelado es un grafico de una serie, el grafico
se almacenara como un objeto nuevo que podr ser modificado
poniendo textos, sombras. Para cualquier otro objeto el resultado
ser una tabla que tambin puede ser editada.
Print Imprime la vista activa del objeto que estemos visualizando.
View Options Activa o desactiva ciertas propiedades de la vista del objeto activo.
No cambia el tipo de vista sino algunas de sus caractersticas. Este
men cambia segn el men de vista activo. Sus opciones son ms
accesibles desde la barra de iconos que aparece en la parte superior
de la ventana de una vista.


MENU QUICK
ENTRADA ACCION
Sample Altera la muestra de datos que se consideraran para los
tratamientos posteriores a esta orden.
Generate Series Permite especificar una ecuacin para generar una serie nueva a
partir de otras almacenadas en el fichero de trabajo adems del
periodo (muestra) para el que se generaran datos de esa nueva
serie.
Show Activa la ventana del objeto seleccionado. La principal utilidad
de esta orden no es abrir la ventana de un objeto sino abrir, en
una ventana nica, varios grficos o series.
Graph Permite crear un grafico de la serie seleccionada o de un grupo
de series. Una vez seleccionadas las series puede especificarse el
tipo de grafico que se desea y mltiples opciones que modifican
su aspecto final.
Empty Group Crea un grupo de series vaco. Una vez creado pueden teclearse
en la barra de edicin de ese grupo las series que se desean en
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


6
ese grupo o los valores concretos para cada una de ellas.
Series Statistics Calcula diversos estadsticos que se ofrecen en un men para
una o varias series seleccionadas.
Group Statistics Calcula estadsticos para un grupo de variables previamente
creado. Al aplicarse a un grupo aparecern ciertos estadsticos
como las correlaciones, correlogramas, etc., que solo tienen
sentido cuando quieren analizarse de forma cruzada las
variables de un grupo.
Estimate Equation Estima una nueva ecuacin que el usuario deber especificar y la
almacena como un objeto nuevo.
Estimate VAR Estima un modelo VAR que debemos especificar.

- Parte 2. Zona de recepcin o lnea de comandos

En esta segunda rea, que habitualmente ocupar muy poco espacio, se podrn introducir y ejecutar,
de forma manual, todos los comandos habilitados en E-views, de forma tal que el usuario podr
ejecutar las opciones (comandos) que desee sin necesidad de ir seleccionando secuencialmente las
opciones ofrecidas en las diferentes ventanas de acceso (men)
3
.

- Parte 3. Zona de presentacin de contenidos y resultados.

En esta zona, que ocupar habitualmente la mayor parte de la pantalla, es donde se presentaran los
contenidos ( resultados) de los distintos ficheros de trabajos activos, as como los resultados de las
diferentes acciones realizadas sobre los mismos. En este sentido, podrn aparecer varias ventanas
desarrolladas, con todos sus contenidos, con pequeos contenidos que debern ser maximizados
para consultar su contenido.

- Parte 4. Barra de presentacin del estado de la aplicacin

Finalmente, esta ltima rea nos informa sobre el estado actual de la aplicacin activa, detallando la
accin que se est ejecutando en ese momento (mensaje de bienvenida en la imagen adjunta), el
directorio activo en ese momento (Path), la base de datos activa, si la hubiera (DB), y el archivo de
trabajo (Workfile).

1.3 Creacin de un Espacio de Trabajo

Para crear un archivo de Trabajo se tiene que cargar, en primer lugar, el E-views que aparece en la
ventana principal (descrito en seccin anterior); posteriormente, para generar un archivo de trabajo
se realizan los siguientes pasos (opcin de men):

Seleccionar la opcin File situada en la parte posterior de la pantalla, luego New y se sita sobre la
opcin Workfile


3
En el software existen dos posibilidades de trabajo en E-views: utilizando solo mens y utilizando comandos
(incluye la posibilidad de programacin en su ejecucin).
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


7


Luego de seleccionar estos pasos, aparecer una nueva ventana (como la mostrada a continuacin)
en el que se debe especificar la periodicidad o frecuencia de los datos con los que se va a trabajar
(por default se considera un modelo de serie de tiempo).

Luego en Start date y End date debe especificar el rango entre la fecha de inicio y la fecha de
trmino de trabajo respectivamente.




Ahora tenemos que orientar a E-views con el tipo de serie que se ingresar al sistema. En Frecuency
se muestran los posibles formatos a ingresar (los ms importantes):
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


8
Tipo o frecuencia Start date End date
Multi anual (Multi-year) 1898 1906
Series anuales (annual) 1952 2010
Semi anual (Semi-anual) 1952S1 2010S2
Series trimestrales (quarterly) 1952:3 2010:4
Series mensuales (monthly) 1952:01 2009:12
Series semanales (weekly) 1/01/1952 12/12/2009
Series diarias (Daily 7 day week) 1/01/1999 1/20/1999
Das enteros (Integer date) 5 10

Donde:
- Multianual: 1898-1906. En este caso se seleccion para dos aos; por tanto, en un perodo con
05 observaciones, el programa solo encontrar los valores 1898, 1900, 1902, 1904, 1906.
- Anual: 1952-2010; en este caso el programa se refiere a 59 observaciones.
- Semi anual: 1952-2010; en este caso el programa encuentra 2 observaciones (2 semestres por
cada ao), por lo que encontrar 118 observaciones.
- Trimestral: 1952:3 - 2010:4; comienza desde el tercer trimestre de 1952 y acaba el cuarto y
ltimo trimestre del 2010, encontrando 234 observaciones.
- Mensual: 1952:01 2009:12; significa un perodo que va de enero de 1952 hasta diciembre del
2009. Encuentra 696 observaciones.
- Semanales: 1/01/1952 - 12/11/2009, hace un conteo de todas las semanas desde el mes de
enero de 1952 hasta el mes de diciembre del 2009.
- Diaria: 1/01/1999 - 1/20/1999, para el caso de 7 das (7 day week) considera los 7 das como
hbiles (Lunes a Domingo).
- Das enteros: 5-10, hace un conteo simple de los das que usted determine, en nuestro
ejemplo encuentra 6 observaciones.

Como hemos visto el tipo y la frecuencia de los datos pueden ser multi anual, anuales, semi anuales,
trimestrales, mensuales, bimensuales, quincenales, trimensuales, semanales, diarios o sin fecha
(corte transversal)
4
.

Por ejemplo, si los datos fueran de frecuencia anual y de rango entre 1978 y 2010, se crea el archivo
workfile:



4
Para este tipo de datos nos situamos en Workfile structure type, desplazamos y escogemos
Unstructured/Undated. En este caso en Observations solo ingresamos el nmero de datos disponibles. Otra
estructura del workfile es para paneles de datos balanceados (Balanced panel).
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


9

E-views crea, por default, dos objetos c (antecedido de un cono-beta) y resid (antecedido del
cono relacionado a las series de datos). El objeto c (beta) almacenar los valores estimados para
los parmetros de los modelos corridos; el objeto resid almacenar los valores residuales de la
ltima regresin corrida.

Range: 1978 2010 significa que toda la informacin empieza el ao 1978 y termina el ao 2010 (con
un total de 33 observaciones).

Sample: 1978 2010 significa que la muestra va desde 1978 a 2010. El sample puede ser modificado;
por ejemplo: de 1978 a 1990 (parte del rango total), u otra combinacin dentro del Range, para ello
tiene tres alternativas:

1. Elija la opcin Sample de la barra de herramientas de la ventana workfile (men principal).
Sobre la ventana Sample escriba el nuevo rango muestral, por ejemplo: 78 90.
2. Haga doble click en el workfile sobre Sample: 1978 1999. Aparecer la ventana Sample y
luego cambie el rango muestral directamente, por ejemplo 78 90 (ver Figura debajo).
3. Escriba sobre la lnea de comando en la ventana principal del E-views: smpl 78 90.



1.4 Creacin de una base de datos en el archivo de trabajo (Workfile)

A- Digitacin directa de los datos

Supongamos que se crea un workfile con 6 observaciones, del 1 al 6. Este se genera mediante:
File/New/Workfile
/Workfile structure type/Unstructured-Undated
/Data range/ 6 / OK

Seguidamente en la lnea de comandos de la ventana principal del E-views escriba:
Data y x1 x2 (Enter)
Este ultimo procedimiento crea un grupo de tres variables (y, x1, x2) en la cual cada una tiene 6
observaciones (se ha generado una base de datos de corte transversal)
5
.


5
Por default se genera una base de datos de tipo serie de tiempo.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


10
La otra opcin es usar una base de datos para de ingresos de datos de tipo serie de tiempo, de
acuerdo a la informacin sealada en la seccin anterior (1.3).

Aparece una nueva ventana tipo hoja de clculo (spreadsheet) para completar los datos
correspondientes. Para guardar los datos digitados utilice la opcin Edit +/- de la barra de
herramientas de esta ventana. Adems, puede poner un nombre al grupo de datos utilizando la
opcin Name.




Una vez generado el archivo de trabajo, se puede crear una nueva serie eligiendo (en el men de
herramientas generales) la opcin:

Object / New object / Series.
Al igual que antes, llene los datos y cierre la serie con la opcin Edit+/-.



B- Importacin de datos desde un archivo de texto o Excel

Esta opcin es posible solo una vez que se he creado el WORKFILE (es un requisito necesario no
puede manipularse la opcin Importar, si es que no se ha creado el WORKFILE).

Para mostrar el proceso, vamos a usar el archivo data1_anual.xls, el cual muestra las variables
PBIREAL, CONSUMO e INVERSION, en formato EXCEL, para el periodo 1980-2008. Luego, para
importar tal archivo (que puede ser tambin de otro tipo diferente a Excel) a la base de datos E-views
procedemos a realizar los siguientes pasos:

Como ante-dicho, primero creamos un WOKFILE con frecuencia anual:
Workfile structure type: Date regular frequency y Frequency: Annual
Start date: 1980 y End date: 2008 / OK
Desde el men bsico de herramientas generales marque las opciones:
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


11
File / Import / Read, luego ubique el archivo de Excel y seleccione.

Aparecer una ventana llamada Excel Spreadsheet Import como se muestra a continuacin.







Nota: si no se conocieran los nombres de las variables, es posible solo indicar el N de variables que
se requieren extraer del archivo que se est usando para importar (4 por ejemplo, para traer
exactamente las 04 variables al WORKFILE).

Alternativamente, se puede usar la lnea de comandos: escribir Read (luego apretar enter).
Aparecer entonces la ventana OPEN en la que debe elegirse el archivo donde estn los datos y el
tipo de archivo a elegir. Luego de escoger el archivo marque la opcin abrir. Se ingresa a una nueva
ventana donde debe completarse informacin adicional mostrado en el cuadro de arriba, tambin




En este lugar se digita los
nombres de cada serie a utilizar
en el E-views. Tener cuidado en
el orden a al digitar.
Significa que el E-views
comenzar a contar los valores
a partir de la celda B2 en
adelante.
En este lugar se digita el
nombre de la pestaa
del archivo de Excel a
importar (por defecto se
lee la 1 Hoja
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


12
debemos tener en cuenta si los datos estn en filas o columnas (Data order) y el simple donde se
va a insertar los datos (debe haber coherencia con el sample del workfile creado inicialmente).

EJERCICIO

Utilice el archivo data1_trimestral.xls, donde se tiene datos del primer trimestre de 1980 al primer
trimestre del 2009, del cual se usarn tres variables: PBIREAL, CONSUMO e INVERSION (tener en
cuenta que los datos empiezan en el casillero B2 y los nombres de las variables estn en la primera
fila).

Utilizando el workfile creado anteriormente, procedemos a guardar dicho archivo mediante la
siguiente opcin:

Save (enter) en la lnea de comandos o File / Save (o Save as) del men bsico de herramientas
generales, luego agregue un nombre, por ejemplo prime_workfile. En el directorio de trabajo o en
lugar donde usted decida guardar el archivo, este aparecer con extensin wf1, es decir
primer_workfile.wf1.

Para ver los datos que contiene el workfile creado, se tiene varias alternativas:

Escribir show PBIREAL CONSUMO INVERSION en la lnea de comandos o seleccionar las series que se
requiere ver en el workfile con ctrl/doble click/Open Group, tambin se puede usar en el men
bsico de herramientas generales Quick/ Show/ PBIREAL CONSUMO INVERSION/OK.

Aparecer una nueva ventana del tipo Group incluyendo la lista de variables marcadas.

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


13

Luego de mostrar en grupo las tres variables a estudiar, E-views muestra otras alternativas para ver
los datos, el cual la mayora de ellas estn asociadas a las siguientes opciones en el workfile:

View / Graph / Options Pages, Graph Type, Details
View / Descriptive Stats / Individual Sample o Common Sample
View / Covariance Analysis/ Correlation

Ahora utilizando el grupo de series como ventana activa, puede COPIAR dichas series a un archivo
WORD EXCEL, siguiendo los siguientes pasos:

Utilizar la opcin Freeze (en una ventana activa). Aparecer entonces una nueva ventana con los
datos de las variables mostradas (esta ventana puede ser grabada en el workfile al dar click en Name
y guardarlo con el nombre que usted crea conveniente). Entonces elegir la opcin Edit +/- en la barra
de herramientas del E-Views para cambiar los valores de las series si es necesario.

Seleccionar (marcando) todos los valores del grupo de series o data que se pretende copiar. Entonces
dar click derecho/copy e ir al documento MS Word o de otro tipo- y en l pegar el objeto
previamente copiado, utilizando la opcin pegar.


(En realidad todos o casi todos- los datos pueden copiarse a un archivo EXCEL, WORD de otro tipo,
mediante el uso del procedimiento descrito anteriormente).

C. Lectura directa de un archivo externo de datos
Esta tercera opcin no requiere la apertura previa de un Workfile, puede procesarse directamente.
En el caso de un archivo EXCEL, en un 1er paso (step 1) es permitida la opcin de seleccionar la hoja
de trabajo que desee (en caso hubiera ms de una). La opcin de men es la siguiente:
File /Open /Foreign Data as Workfile






Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


14
1.5 Creacin de nuevas series o transformacin de datos

Para crear series en base a las variables existentes (PBIREAL, CONSUMO, INVERSION) se puede elegir
la opcin Genr en la barra de herramientas del workfile creado (alternativamente, elegir la opcin
Object / Generate Series de la barra de herramientas del men principal). Aparecer una nueva
ventana por la ecuacin que transforma las series existentes en la nueva serie que usted desea crear.



En este caso se cre una nueva variable denominada: logconsumo, que equivale al logaritmo
natural de los datos establecidos en la variable consumo (lgconsumo, =log(consumo)).

Otra opcin alternativa es mediante el uso de comandos: escribir (en la lnea de comandos) el
comando GENR, seguido por la ecuacin que representa la transformacin que usted desee
realizar, as por ejemplo:

Genr lgconsumo=log(consumo): como se mostr anteriormente, se genera una variable que es el
logaritmo del consumo.

Genr pbireal2=pbireal^2: equivale al cuadro de la dicha variable seleccionada (pbireal).

Genr lgconinv=log(consumo)+log(inversion)

Genr trend=@trend(1980): crea una variable de tendencia con 0 en 1980, 1 en 1981 y as
sucesivamente hasta el ao 2008.

Genr invrezagada=inversion(-1): aqu se crea una variable (invrezagada) en base al rezago de un ao
(por eso el valor de 1) de la variable denominada inversin.



1.6 Estadsticos para la interpretacin y tabulacin de datos de una serie

Antes de realizar cualquier anlisis economtrico que pretenda vincular un conjunto de variables
observadas, es conveniente analizar por separado cada una de las series involucradas. En esta parte
se revisarn las principales herramientas que permiten realizar un anlisis estadstico elemental de
las series de datos en E-Views.


Aqu se crea el logaritmo de la
variable consumo.

Tener en consideracin el
periodo muestral que es
esta eligiendo.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


15
Al abrir un objeto tipo serie (con doble clic sobre la serie correspondiente o utilizando el botn
derecho del mouse y seleccionando Open), la presentacin por defecto ser similar a a la de hoja de
datos (SpreadSheet). Es conveniente comenzar un anlisis univariado examinando la forma que
adopta el grfico lineal de una serie de datos. En caso de tratarse de una serie de tiempo (como en
nuestro ejemplo, que va desde el ao 1980 hasta el ao 2008 en intervalos anuales), el grafico
mostrara la evolucin temporal de los datos. En cambio, si lo que se tiene son datos de corte
transversal, el grfico mostrado no necesariamente tendr valor analtico inmediato (salvo para
apreciar el nivel medio y dispersin aproximada de las respuestas dadas por distintas personas).

Luego de un primer acercamiento visual a los datos, el siguiente paso formal consiste en la revisin
de los indicadores estadsticos elementales. Como veremos posteriormente, el valor de algunos de
estos ndices determina el cumplimiento de los requisitos para un anlisis de regresin. La opcin
View del men, permite acceder a un conjunto de estadsticas descriptivas y tests, que a
continuacin se detallan.


La primera opcin de resultados se denomina Histogram and Stats. Seguidamente se muestra el
resultado de esta pantalla para una serie de datos que hemos estado trabajando llamada CONSUMO.
Tambin se puede escribir en la lnea de comandos show consumo.his, en ambos casos dar el
siguiente resultado.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


16


Otras opciones para aplicar en la lnea de comandos para la serie CONSUMO, se mencionan a
continuacin:
Show consumo.bar, aqu se muestra el grfico de barras para la serie CONSUMO.
Show consumo.hist, aqu se muestra el Histograma para la serie CONSUMO.
Show consumo.line, aqu se muestra el grfico de Lneas para la serie CONSUMO.
Show consumo.stats, aqu se muestra las estadsticas bsicas e histograma para la serie CONSUMO.
Show consumo.label, aqu se la etiqueta de la serie CONSUMO.
Show consumo.sheet, aqu se muestra la hoja de datos de la serie CONSUMO.
Show consumo.statby, aqu se muestra las estadsticas por clasificacin de la serie CONSUMO.
Show consumo.testby, aqu se muestra las pruebas de igualdad por clasificacin de la serie
CONSUMO.
Show consumo.teststat, aqu se muestra las pruebas de hiptesis simples de la serie CONSUMO.
Show consumo.uroot, aqu se muestran las pruebas de raz unitaria de la serie CONSUMO.

Dado el grafico anterior, as como las estadsticas que pueden apreciarse en esta opcin (View/
Descriptive Statistics/ Stats Table, por ejemplo) es posible determinar qu valores tienen la mayor
probabilidad de ocurrencia y alrededor de que valor(es) se centran las observaciones. La forma de la
distribucin para los datos de la serie seleccionada puede analizarse con ms detalle y formalidad a
partir de los siguientes estadsticos:

Media (mean)

Corresponde al valor promedio de la serie. Si el valor de la media fuese muy cercano a cero, se
podra concluir la caracterstica de normalidad estandarizada del proceso generador de la serie.

Mediana (median)

Corresponde al valor central de la serie (luego de ser ordenada segn su magnitud). Como se sabe,
en una distribucin normal la media, la mediana y la moda arrojan el mismo resultado debido,
precisamente, a que la distribucin es simtrica (el estadstico relevante para medir la simetra ser
explicado ms adelante).



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


17
Desviacin estndar (Std.Dev.)

Es una medida de dispersin de las observaciones alrededor de la media. Formalmente, la desviacin
estndar se calcula a partir de la raz cuadrada de la sumatoria del cuadrado de las desviaciones de
las observaciones respecto a la media de la serie.

Coeficiente de asimetra (skewness)

Este ndice ofrece una medida de simetra de la distribucin de las observaciones. El valor referencial
que se toma para comparar el estadstico que muestra E-Views es cero (asociado a una distribucin
normal y, por ende, simtrica). Entonces, un valor positivo para el coeficiente de asimetra implica
una mayor cola a la derecha de la media; mientras que un valor negativo significa una mayor cola a la
izquierda del valor promedio. Formalmente, el coeficiente de asimetra se construye a partir del
tercer momento de la distribucin y la desviacin estndar de la misma:



Coeficiente de curtosis (kurtosis)

Se trata de una medida que indica el grado de apuntamiento de la distribucin o anchura de sus
colas. Al igual que en el caso del coeficiente de asimetra, se toma el coeficiente de curtosis de la
distribucin normal (3) como valor referencial. Formalmente, el coeficiente de curtosis se construye
a partir del cuarto momento de la distribucin y el cuadrado de su varianza (o la cuarta potencia de
su desviacin estndar):




En este sentido, para una distribucin normal, el cuarto momento es igual a tres veces el cuadrado
de su varianza. A partir de lo anterior, si el coeficiente de curtosis es menor a tres se dice que la
distribucin es platicrtica; en cambio, si el cuarto momento es mas de tres veces el cuadrado de la
varianza (coeficiente de curtosis de mayor a tres) se dice que la distribucin es leptocrtica.
Asimismo, una distribucin cuyo coeficiente de curtosis se aproxima al valor de tres se denomina
mesocrtica. En conclusin, distribuciones con un coeficiente de curtosis mayor a tres (leptocrticas)
poseen un mayor apuntamiento (centro ms delgado) y colas ms anchas; mientras que lo contrario
ocurre en distribuciones con un coeficiente de curtosis menor de tres (platicrtica).





3
3
1
( ) 1
N
i
i
y y
Sk
N
s
=

=

4
4
1
( ) 1
N
i
i
y y
Ku
N
s
=

=

Platicrtica Mesocrtica Leptocrtica
s
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


18
Test Jarque-Bera

La prueba de normalidad de Jarque-Bera se basa en el estadstico JB bajo la distribucin Chi-
cuadrado con 2 grados de libertad.




Donde k indica el nmero de coeficientes utilizados para generar la serie analizada. Tal como se
aprecia, la prueba de normalidad se basa en los dos estadsticos explicados anteriormente: el
coeficiente de asimetra y el coeficiente de curtosis. As, cuanto mayor sea la diferencia entre los
valores referenciales a estos estadsticos para una distribucin normal y los obtenidos para la
serie analizada, mayor ser el estadstico JB y, por tanto, mayor ser la probabilidad de que este
resulte mayor al valor crtico y nos encontremos en zona de rechazo para la hiptesis nula de
normalidad.

La hiptesis nula del test Jarque-Bera es que la distribucin de donde han sido extrados los datos
de la serie analizada es normal. Sin embargo, antes de contrastar la evidencia que nos brinda el
valor del estadstico JB, es necesario fijar un nivel de confianza (lo usual es trabajar con una
certidumbre del 95%) que delimite las zonas de aceptacin y rechazo para la hiptesis nula. Si la
probabilidad asociada al estadstico JB es mayor a 0.05, no se puede rechazar la hiptesis nula de
normalidad para la serie de datos analizada con un nivel de confianza del 95%.






























2 2
1
( 3)
6 4
N k
JB Sk Ku

(
= +
(

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


19

CAPITULO 2
M0DELO DE REGRESION LINEAL CLASICO GENERAL

2.1 RESUMEN TEORICO
Con los modelos de regresin lineal perseguimos explicar el comportamiento de una variable
(dependiente) a partir de otras (regresoras explicativas).
0 1 1 2 2
.......
i n i k ki i
y x x x | | | | c = + + + + + , 1,..., i n = (1)
La variable
i
y es la variable dependiente, las variables , 1,......
ij
x i k = son las variables explicativas o
regresoras, y
i
c es la perturbacin aleatoria o comnmente llamado termino de error. Los |

son los
parmetros asociados a cada una de las variables explicativas, tambin llamados coeficientes de
regresin y miden el impacto de cada variable independiente en relacin al comportamiento de la
variable endgena.
Los parmetros de la poblacin que son
1 2
, ,...
k
| | | no son conocidos. Sin embargo utilizando
informacin muestral se pueden obtener estimadores de los parmetros (o coeficientes).
Ahora si utilizamos la notacin matricial, el modelo se escribe como Y X| c = + , donde:
1 11 21
1
12 22 2
2
1 2
1
,
k
k
n n kn
n
nx
nxk
x x x
y
x x x
y
Y X
x x x
y
| |
| |
|
|
|
|
|
= =
|
|
|
|
\ .
|
\ .

1 1
2 2
1 1
,
k n
kx nx
| c
| c
| c
| c
| | | |
| |
| |
= =
| |
| |
\ . \ .
(2)
Si se quiere que en el modelo exista trmino independiente, la variable
1i
x tiene que ser igual a uno,
o lo que es lo mismo, la primera columna de la matriz X tiene que ser un vector de unos (a este
regresor se le llama regresor ficticio). Normalmente, se trabajar con modelos en los que existe
trmino independiente.
Adems, se considera que se cumplen las siguientes hiptesis clsicas bsicas:

- No existen relaciones lineales entre las variables explicativas o regresores y estos no son
variables aleatorias (no multicolinealidad).
- La esperanza del vector de la variable aleatoria es cero: ( ) 0 E c = .
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


20
- La matriz de varianzas y covarianzas del vector de variables aleatorias es:
2
( ) E I
c
cc o ' = . Es
decir todos los componentes del vector c

tienen varianza idntica (homoscedasticidad), y
adems las covarianzas son 0, es decir, los elementos del vector c no estn correlacionados
(no autocorrelacin).
- La distribucin de probabilidad del vector de perturbaciones aleatorias es:
2
(0, ) N I
c
c o ,
es decir es un vector normal esfrico.
Por tanto, las perturbaciones son variables aleatorias independientes e igualmente distribuidas,
normales con media cero y varianza
2
c
o . Dado que X no es aleatoria, la distribucin de probabilidad
del vector Y se deriva a partir del vector de perturbaciones:
2
( , ) Y N X I
c
| o .
La Bondad de Ajuste es entendida en trminos sencillos- lo bien que se ajusta la funcin de
regresin a los datos. Par ello se plantean distintos indicadores que permiten seleccionar las
variables que deben ser explicativas en un modelo economtrico. Entres los principales criterios, de
fcil aplicacin, se incluyen:
R
2
ajustado
En general, se refiere a la proporcin de la variacin en Y, que es explicada por la(s) variable(s)
explicativa(s). Se define de tal modo que penaliza la inclusin de nuevas variables explicativas en el
modelo (si bien al aumentar el nmero de regresores aumenta tambin la Suma de Cuadrados
Explicados, la inclusin de nuevas variables explicativas reduce los grados de libertad del modelo, por
lo que no siempre resultara adecuado incorporar nuevas variables al mismo).
2
1
1 1 (1 )
1
SCR
n
n k
R R
SCT
n k
n

= =


Criterio de Informacin de AKAIKE (AIC)
Estadstico que mide el buen ajuste de la data a la regresin estimada, permitiendo la seleccin entre
dos modelos de ajuste alternativos. Tambin penaliza la inclusin de nuevos regresores en el
modelo, seleccionando como modelo ms adecuado aquel que presenta un menor valor de dicho
coeficiente. Su frmula de clculo responde a la siguiente expresin:
2
ln
SCR k
AIC
n n
| |
= +
|
\ .

Su valor tambin aparece calculado automticamente en la estimacin facilitada por E-VIEWS; el
nombre que lo identifica es Akaike info criterion.
Criterio de SCHWARZ
Este criterio es una alternativa ms restrictiva al criterio AIC, ya que permite la seleccin de variables
que deben ser incluidas en el modelo. Este criterio penaliza en un grado mayor la inclusin de nuevos
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


21
regresores en el modelo. Al igual que en el caso anterior, se considera mejor modelo aquel que
presente un menor valor del coeficiente. Su valor aparece tambin calculado en la estimacin
facilitada por E-views con el nombre Schwarz criterion y se obtiene a partir de la siguiente expresin.
ln( ) ln
k SCR
SBC n
n n
| |
= +
|
\ .

2.2 APLICACIONES
EJERCICIO 1- Un alumno de la UNALM desea estimar la funcin de produccin del sector textil
utilizando como variables explicativas el trabajo y el capital.
Observaciones Q L K
1985 3267636 1493.8 2923423.74
1986 3664620 1549.1 3138053.94
1987 4106758 1637.6 3364006.38
1988 4592483 1727.6 4672090.06
1989 5250695 1848.6 6413698.56
1990 6074133 1963.5 8526638.63
1991 6887865 2036.2 10744839.7
1992 7848365 2070.8 12597038.7
1993 8168404 2065.4 14444431.8
1994 8392581 2055.9 16260040.2
1995 8972103 2093.78 17962362.2
1996 9420052 2107.615 19226538.1

Se le pide utilizar el archivo prod_capital.xls y luego:
1. Estimar una funcin de produccin lineal y verificar la igualdad entre las productividades
marginales del trabajo y el capital.
2. Estimar una funcin tipo Cobb-Douglas y verificar la Hiptesis de igualdad de los coeficientes
vinculados a los factores de produccin.
3. Analizar los efectos que se producen sobre las estimaciones ante cambios de escala (se
multiplica por diez), en la variable dependiente y en los regresores.
4. Considerando el periodo 1985-1993 en la variable dependiente, realizar una prediccin para
dicha variable en los tres aos siguientes.
Solucin:
Primero procedemos a importar la base de datos del EXCEL llamado prod_capital.xls, para esto
abrimos el E-views, luego:
File / New/ Workfile. Luego utilizando Dated-regular frecuency y Frecuency/ Annual,
seleccionamos en Start date: 1985 y en End date: 1996, por ltimo pulsamos OK.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


22

Ahora como hemos visto antes, realizamos:
File/ Import/Import from file/prod_capital /Finish; entonces grabamos el workfile con el nombre
que usted desee seleccionando el comando save.
Respuesta A. La funcin de produccin de tipo lineal a estimar en este caso es:
t t t t
q L K u o | = + + +

Instruccin: En el men principal seleccionamos:
Quick/Estimate equation/ q c l k.
Alternativamente, en la lnea de comandos escribimos LS q c l k.
Dependent Variable: Q
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


C -1832783. 725849.9 -2.525017 0.0325
L 2999.482 467.3818 6.417627 0.0001
K 0.255262 0.017681 14.43725 0.0000


R-squared 0.996321 Mean dependent var 6387141.
Adjusted R-squared 0.995503 S.D. dependent var 2182889.
S.E. of regression 146379.0 Akaike info criterion 26.83810
Sum squared resid 1.93E+11 Schwarz criterion 26.95933
Log likelihood -158.0286 Hannan-Quinn criter. 26.79322
F-statistic 1218.617 Durbin-Watson stat 1.577307
Prob(F-statistic) 0.000000


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


23

Es conveniente asignar un nombre a la ecuacin puesto que va a ser utilizada de nuevo. En el men
correspondiente a la estimacin se elige la opcin: name/eq01. Puede observarse como en la
pantalla principal se ha creado un nuevo objeto que identifica a esta ecuacin (se pueden verificar y
explicar la significancia estadstica de los parmetros individuales y la significancia global).
En segundo lugar, se realiza el contraste para verificar la igualdad entre las productividades
marginales, es decir:
0
: H | = o
0
: 0 H | =

Desde la salida correspondiente a la estimacin del modelo de produccin lineal, se selecciona la
opcin correspondiente al test de Wald. En esta opcin aparecer una ventana de dialogo en la que
deber especificarse la restriccin propuesta, sabiendo que el programa asigna el nombre c(1) al
primer parmetro del modelo, c(2) al segundo, y as sucesivamente.
Instrucciones: En la eq01 vamos a la opcin View/Coefficient diagnostics/ Wald test-
coefficient Restrictions / c(2)-c(3)=0

Wald Test:
Equation: EQ01


Test Statistic Value df Probability


t-statistic 6.416860 9 0.0001
F-statistic 41.17609 (1, 9) 0.0001
Chi-square 41.17609 1 0.0000



Null Hypothesis: C(2)-C(3)=0
Null Hypothesis Summary:


Normalized Restriction (= 0) Value Std. Err.


C(2) - C(3) 2999.227 467.3979


Restrictions are linear in coefficients.

La salida del ordenador muestra los estadsticos experimentales y las probabilidades que dejan a su
derecha. Puesto que en ambos casos la probabilidad es menor que el nivel de significacin elegido
(se utiliza normalmente 0,05), se rechaza la hiptesis nula (se rechaza la igualdad entre las
productividades marginales).

Respuesta B- La funcin original a estimar (tipo Cobb-Douglas) en este caso es:

t
u
t t t
q AL K e
|
=

Para realizar la estimacin de este modelo es necesario linealizarlo tomando logaritmos:

ln ln ln ln
t t t t
q A L K u | = + + +
Siendo:

ln
t t
q Lq = , ln A o = , ln
t t
L LL = , ln
t t
K LK =

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


24
Hay que estimar el modelo:
t t t t
Lnq LnL LnK u o | = + + +

Antes de estimar el modelo, se necesita transformar las variables originales en logaritmos.

Instrucciones: Genr/Lnq=log (Q)
Genr/LnL=log (L)
Genr/LnK=log (K)
Se estima la nueva funcin de produccin:
Instrucciones: En herramientas generales (men) seleccionamos:
Quick/Estimate equation/ Lnq c Lnl Lnk,
O en la lnea de comandos escribimos: LS Lnq c Lnl Lnk

Dependent Variable: LNQ
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


C 4.392927 1.714918 2.561597 0.0306
LNL 0.617822 0.354840 1.741128 0.1156
LNK 0.412304 0.063183 6.525580 0.0001


R-squared 0.992414 Mean dependent var 15.61025
Adjusted R-squared 0.990729 S.D. dependent var 0.370473
S.E. of regression 0.035672 Akaike info criterion
6
-3.616591
Sum squared resid 0.011452 Schwarz criterion -3.495365
Log likelihood 24.69955 Hannan-Quinn criter. -3.661474
F-statistic 588.7303 Durbin-Watson stat 1.348233
Prob(F-statistic) 0.000000



Se realiza el contraste para verificar la existencia rendimientos constantes de escala, es decir:
0
: 1 H | + =
Por ltimo, desde la salida correspondiente a la estimacin del nuevo modelo de produccin tipo
Cobb-Douglas, se selecciona la opcin correspondiente al test de Wald.

Instrucciones: En la eq02 vamos a la opcin View/Coefficient diagnostics/ Wald test- coefficient
Restrictions / c(2)+c(3)=1

Wald Test:
Equation: EQ02


Test Statistic Value df Probability


t-statistic 0.102506 9 0.9206
F-statistic 0.010508 (1, 9) 0.9206

6
El criterio Schwarz y Akaike pueden tomar valores negativos o positivos, para efecto de comparacin entre
modelos considere su valor absoluto.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


25
Chi-square 0.010508 1 0.9184



Null Hypothesis: C(2)+C(3)=1
Null Hypothesis Summary:


Normalized Restriction (= 0) Value Std. Err.


-1 + C(2) + C(3) 0.030126 0.293890


Restrictions are linear in coefficients.

Puesto que la probabilidad que deja a la derecha el estadstico es mayor que el nivel de significacin
de 0.05, no se puede rechazar la hiptesis nula, por lo que se considera la presencia de
rendimientos constantes de escala.
Respuesta C- Anlisis de las estimaciones antes cambios de escala.
Se selecciona en la pantalla principal la ecuacin la ecuacin uno, puesto que es el modelo de
produccin lineal sobre el que se ajusta mejor a la data. En primer lugar es necesario definir de
nuevo las variables, incrementndolas por die, incluido el termino independiente.

Instrucciones de MEN:
Genr/MQ=10*Q

Genr/MC=10*1
Genr/ML=10* L
Genr/MK=10*K

Se realiza la regresin lineal utilizando las variables incrementadas y se observa cmo afectan estos
incrementos a las estimaciones del modelo.

Si se incrementan slo los regresores, excluido el trmino independiente, los coeficientes de dichos
regresores quedan divididos por diez.
t t t t
q ML MK u o | = + + +

Instrucciones: En herramientas generales seleccionamos
Quick/Estimate equation/ q c ML MK.

Alternativamente, en la lnea de comandos escribimos LS q c ML MK
(Luego se puede nombrar la ecuacin con la opcin name del men).
Dependent Variable: Q
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


C -1832783. 725849.9 -2.525017 0.0325
ML 299.9482 46.73818 6.417627 0.0001
MK 0.025526 0.001768 14.43725 0.0000


R-squared 0.996321 Mean dependent var 6387141.
Adjusted R-squared 0.995503 S.D. dependent var 2182889.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


26
S.E. of regression 146379.0 Akaike info criterion 26.83810
Sum squared resid 1.93E+11 Schwarz criterion 26.95933
Log likelihood -158.0286 Hannan-Quinn criter. 26.79322
F-statistic 1218.617 Durbin-Watson stat 1.577307
Prob(F-statistic) 0.000000





Si se incrementa solo la variable dependiente, los coeficientes de todos los regresores se ven
multiplicados por diez:
t t t t
Mq L K u o | = + + +

Dependent Variable: MQ
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


C -18327831 7258499. -2.525017 0.0325
L 29994.82 4673.818 6.417627 0.0001
K 2.552618 0.176808 14.43725 0.0000


R-squared 0.996321 Mean dependent var 63871413
Adjusted R-squared 0.995503 S.D. dependent var 21828885
S.E. of regression 1463790. Akaike info criterion 31.44327
Sum squared resid 1.93E+13 Schwarz criterion 31.56450
Log likelihood -185.6596 Hannan-Quinn criter. 31.39839
F-statistic 1218.617 Durbin-Watson stat 1.577307
Prob(F-statistic) 0.000000



Si se incrementan la variable dependiente y los regresores, excluido el trmino independiente, el
coeficiente del regresor ficticio queda multiplicado por diez:
t t t t
Mq ML MK u o | = + + +

Dependent Variable: MQ
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


C -18327831 7258499. -2.525017 0.0325
ML 2999.482 467.3818 6.417627 0.0001
MK 0.255262 0.017681 14.43725 0.0000


R-squared 0.996321 Mean dependent var 63871413
Adjusted R-squared 0.995503 S.D. dependent var 21828885
S.E. of regression 1463790. Akaike info criterion 31.44327
Sum squared resid 1.93E+13 Schwarz criterion 31.56450
Log likelihood -185.6596 Hannan-Quinn criter. 31.39839
F-statistic 1218.617 Durbin-Watson stat 1.577307
Prob(F-statistic) 0.000000


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


27

Si se incrementan todas las variables, incluido el regresor ficticio, los coeficientes de las variables,
incluido el del regresor ficticio, no se alteran:
t t t t t
Mq MC ML MK u o | = + + +

Dependent Variable: MQ
Method: Least Squares
Sample: 1985 1996
Included observations: 12


Variable Coefficient Std. Error t-Statistic Prob.


MC -1832783. 725849.9 -2.525017 0.0325
ML 2999.482 467.3818 6.417627 0.0001
MK 0.255262 0.017681 14.43725 0.0000


R-squared 0.996321 Mean dependent var 63871413
Adjusted R-squared 0.995503 S.D. dependent var 21828885
S.E. of regression 1463790. Akaike info criterion 31.44327
Sum squared resid 1.93E+13 Schwarz criterion 31.56450
Log likelihood -185.6596 Hannan-Quinn criter. 31.39839
Durbin-Watson stat 1.577307



De los anteriores cuadros, se concluye:
- Si se cambian las escalas de los regresores sus coeficientes quedan modificados,
incrementndose por el inverso del factor de escala.
- Si se cambia solo la escala de la variable dependiente, los coeficientes de los regresores
quedan modificados, incrementndose por el factor de escala.
- Si se cambian las escalas de todas las variables, incluido el regresor ficticio, los coeficientes
de los regresores no varan.

Respuesta D- Prediccin de la variable dependiente para el periodo 1994-1996.
Para poder realizar esta prediccin hay que generar una nueva serie, que sea igual a nuestra serie de
produccin, pero sin datos, para el periodo 1994-1996.
Instrucciones: Genr/qmod=q
Una vez conseguida la nueva serie (qmod) hay que mostrarla, escribiendo (rea de comandos): show
q qmod, y luego poner (edit +/-) para poder modificar las tres ltimas observaciones de la serie,
escribiendo sobre ellas NA.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


28

Puesto que la variable dependiente se ha modificado, tiene tres observaciones menos, para realizar
la prediccin es necesario estimar de nuevo el modelo.
Instrucciones: En el men principal, seleccionamos Quick/Estimate equation/ qmod c L K.
Alternativamente, en la lnea de comandos: LS qmod c L K.
Dependent Variable: QMOD
Method: Least Squares
Sample (adjusted): 1985 1993
Included observations: 9 after adjustments


Variable Coefficient Std. Error t-Statistic Prob.


C -991000.6 1118930. -0.885668 0.4099
L 2391.562 765.0700 3.125938 0.0204
K 0.292948 0.039874 7.346843 0.0003


R-squared 0.994121 Mean dependent var 5540107.
Adjusted R-squared 0.992162 S.D. dependent var 1804697.
S.E. of regression 159777.9 Akaike info criterion 27.06216
Sum squared resid 1.53E+11 Schwarz criterion 27.12790
Log likelihood -118.7797 Hannan-Quinn criter. 26.92029
F-statistic 507.3115 Durbin-Watson stat 1.705018
Prob(F-statistic) 0.000000



Desde la salida correspondiente, mostrada en el cuadro anterior, se selecciona la opcin
correspondiente a la prediccin: Forecast. El programa asigna un nuevo nombre a la prediccin de la
variable dependiente (qmodf). De esta manera:
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


29
2,000,000
3,000,000
4,000,000
5,000,000
6,000,000
7,000,000
8,000,000
9,000,000
10,000,000
11,000,000
85 86 87 88 89 90 91 92 93 94 95 96
QMODF 2 S.E.
Forecast: QMODF
Actual: QMOD
Forecast sample: 1985 1996
Included observations: 9
Root Mean Squared Error 130458.1
Mean Absolute Error 112710.8
Mean Abs. Percent Error 2.281807
Theil Inequality Coef f icient 0.011257
Bias Proportion 0.000000
Variance Proportion 0.001474
Cov ariance Proportion 0.998526

Es interesante comparar la variable produccin original y la prediccin que se ha obtenido de esta, en
la lnea de comandos se escribe: show q qmod qmodf.

obs Q QMOD QMODF


1985 3267636 3267636. 3437927.
1986 3664620 3664620. 3633056.
1987 4106758 4106758. 3910901.
1988 4592483 4592483. 4509343.
1989 5250695 5250695. 5308923.
1990 6074133 6074133. 6202696.
1991 6887865 6887865. 7026381.
1992 7848365 7848365. 7651728.
1993 8168404 8168404. 8180004.
1994 8392581 NA 8689164.
1995 8972103 NA 9278449.
1996 9420052 NA 9681875.

EJERCICIO 2-

En este ejercicio se va a proceder a la estimacin de una funcin de demanda y, a partir de los
resultados, al clculo de tres tipos de elasticidades. Por ello es necesario que el lector recuerde
ciertos conocimientos de Teora Econmica. La informacin disponible se refiere al conjunto de la
economa peruana para el periodo de 1980-2008, segn se recoge en el cuadro que figura ms
adelante. Las series de datos corresponde al consumo de naranjas expresado en decenas de miles de
toneladas (Y), precio de las naranjas en soles por kilogramo (x1), el precio de las manzanas en soles
por kilogramo (x2) y renta nacional en billones de soles (x3).

Ao y x1 x2 x3
1980 40.96 110.11 112.7 2.15
1981 35.58 109.36 110.24 2.45
1982 36.46 109.35 109.65 2.89
1983 35.82 110.83 111.96 3.49
1984 36.93 108.49 109.65 4.33
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


30
1985 40.01 112.18 115.47 5.08
1986 35.81 107.89 106.78 6.1
1987 46.88 123 133.48 7.73
1988 50.07 115.63 131.88 9.57
1989 45.81 110.94 122.83 11.12
1990 44.72 119.07 126.61 12.76
1991 42.53 117.23 120.63 13.91
1992 51.56 121.75 135.35 15.99
1993 40.04 125.76 124.05 17.91
1994 48.07 124.37 133.34 20.11
1995 39.47 128.76 125.32 23.3
1996 51.45 142.61 154.19 25.3
1997 50.9 135.18 146.51 28.53
1998 64.21 136.49 158.81 31.92
1999 56.94 136.2 147.36 35.83
2000 58.06 154.39 169.23 37.45

El modelo que se propone para la estimacin de la funcin de demanda de naranjas es el que recoge
una relacin lineal entre las variables disponibles segn la siguiente especificacin:
0 1 1 2 2 3 3 t t t t t
y x x x | | | | = + + + +
Pregunta: Calcule las elasticidades de la demanda de naranjas, esto es, la elasticidad-precio, la
elasticidad-ingreso y la elasticidad-cruzada, con respecto al precio de las manzanas.
Solucin:
Usando el archivo fun_demanda.wf1, se estima el modelo de demanda de naranjas siguiendo las
instrucciones:
(1) En herramientas generales usamos Quick/Estimate equation/ y c x1 x2 x3.

(2) Alternativamente, en la lnea de comandos escribimos LS y c x1 x2 x3.

La funcin de demanda que resulta de la estimacin anterior puede escribirse como sigue:

Y = 34.176288 - 0.7759285969*X1 + 0.78446265664*X2 + 0.3077808962*X3

Antes de proceder al clculo de las elasticidades pedidas, conviene recordar que estas se expresan,
en cada punto de la funcin de demanda, la variacin porcentual de la cantidad demandada de un
producto frente a variaciones porcentuales unitarias del precio del propio producto, de la renta o del
precio de otro producto. Analticamente puede calcularse como:

i
y i i
x i
i
x x y
x y y
o
c |
o
= =

As cuando x
i
represente el precio de las naranjas, se obtendr la elasticidad-precio de las naranjas. Si
x
i
resulta ser la renta se puede obtener la elasticidad-renta de la demanda de naranjas. Por ltimo,
si se considera x
i
es el precio de la manzana, puede calcularse la elasticidad-cruzada de la demanda
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


31
de naranjas con respecto al precio de las manzanas. Asimismo, para su clculo emprico, es necesario
sustituir el parmetro de la expresin anterior por su estimacin en la regresin realizada y
particularizar para el punto de medias muestrales que corresponda en cada caso, tal como se pide en
el enunciado.

Elasticidad-precio de la demanda de naranjas

Es una medida de la sensibilidad de la demanda de naranjas (y) frente a las variaciones de su precio
(x1); por tanto, es posible obtenerla a partir de la siguiente expresin:
1 1
1 1
1
y
x
y x x
x y y
o
c |
o
= =
Estos valores se calculan escribiendo en la lnea de comandos las siguientes instrucciones:

@mean(x1)
=121.885
@mean(y)
=45.346
1
2.08597
y
x
c =


Por lo tanto si el precio de las naranjas se eleva en 1%, la cantidad demandada de las mismas
disminuir en un 2.08%, por lo que puede decirse que las naranjas son un bien ordinario.

Elasticidad-precio de la demanda de naranjas

Procediendo de forma anloga a como se ha hecho en el apartado anterior:

3 3
3 3
3
y
x
y x x
x y y
o
c |
o
= =
Sustituyendo los valores correspondientes a la media de x3 y de Y, asi como la estimacin del
parmetro, el valor que se obtiene para esta elasticidad es:

@mean(x3)
=15.139
@mean(y)
=45.346
3
0.1028
y
x
c =
Luego un aumento de la renta en 1% provocara un incremento del 0.1% de la cantidad demandada
de naranjas. El signo obtenido para esta elasticidad indica que se trata de un bien normal.
Elasticidad-cruzada de la demanda de naranjas con respecto al precio de las manzanas

Siguiendo la misma metodologa, en este caso:
2 2
2 2
2
y
x
y x x
x y y
o
c |
o
= =

@mean(x2)
=128.859
@mean(y)
=45.346
2
2.2288
y
x
c =
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


32
Por tanto, a partir de la informacin disponible puede afirmarse que un incremento del precio de
manzanas en 1% provocara un incremento del 2.22% de la cantidad demanda de naranjas. Se trata,
por tanto, de bienes sustitutos.

Una forma alternativa de obtener las elasticidades de una funcin de demanda consiste en estimar
una transformacin doblemente logartmica de dicha funcin (en la medida que un mejor ajuste lo
permita). En el caso que nos ocupa este modelo es:

1 2 3
1 2 3
t o t
Ly Lx Lx Lx u | | | | = + + + +

El valor que se obtenga en la estimacin MCO ofrece directamente el valor de la elasticidad que se
asocia con el coeficiente del regresor correspondiente.

EJERCICIO 3- Considere la siguiente funcin de costos totales
2 3
1 2 3 4 i i i i i
CT Y Y Y u | | | | = + + + +
Donde CT
i
representa el costo total para la empresa i
Y
i
se refiere al nivel de produccin correspondiente.
Para la estimacin de esta funcin de costos totales se dispone de un total de 30 observaciones del
costo total (CT) y del nivel de produccin (Y) de otras tantas empresas.
A partir de la informacin anterior, se pide:
- Estimar -por MCO- la funcin de costos especificada anteriormente.
- Graficar la funcin de costo total, as como las funciones que representan al costo marginal,
costos medios y costos variables medios.
- A qu nivel de produccin se da el punto de cierre de las empresas?
Solucin:
Respuesta A- Utilizando el archivo costos.wf, estimamos (por MCO) la funcin de costos que se
necesita. En primer lugar generamos las potencias cuadradas y cubicas de Y que se incluirn como
regresores en la funcin de costos especificada. A estas variables se las nombrar, respectivamente,
Y2 y Y3.
Instrucciones: Genr/ Y2=Y^2
Genr /Y3=Y^3

Luego estimamos la funcin de costos:

En herramientas generales seleccionamos: Quick/Estimate equation/ cti c yi y2 y3
Alternativamente: en la lnea de comandos escribimos LS cti c yi y2 y3






Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


33
Dependent Variable: CTI
Method: Least Squares
Date: 08/13/10 Time: 00:36
Sample: 1 30
Included observations: 30


Variable Coefficient Std. Error t-Statistic Prob.


C 174.7825 18.98125 9.208165 0.0000
YI 30.49810 11.56052 2.638124 0.0139
Y2 -5.084017 2.089334 -2.433319 0.0221
Y3 0.748526 0.115654 6.472105 0.0000


R-squared 0.997657 Mean dependent var 357.0312
Adjusted R-squared 0.997386 S.D. dependent var 148.5356
S.E. of regression 7.594006 Akaike info criterion 7.016161
Sum squared resid 1499.392 Schwarz criterion 7.202988
Log likelihood -101.2424 Hannan-Quinn criter. 7.075929
F-statistic 3689.580 Durbin-Watson stat 1.453636
Prob(F-statistic) 0.000000



Por tanto, el modelo estimado para esta funcin de costos resultara ser el siguiente:
CTI = 174.782515 + 30.4980986*Yi - 5.084016534*Y2 + 0.7485258605*Y3

Antes de proceder a realizar las representaciones graficas propuestas, conviene recordar que los
costos marginales, costos medios y costos variables medios pueden obtener de acuerdo de acuerdo
con las siguientes expresiones:
i
i
dCT
Cmg
dY
= = Costo Marginal

2 1
2 3 4
i
i
i
i
i i i
i i
CT
Cme
Y
CT
Y Y u
Y Y
|
| | |
=
= + + + +
= Costo Medio
2
2 3 4
i
i
i
i
i i i
i
CV
Cvme
Y
CV
Y Y u
Y
| | |
=
= + + +
= Costo Variable Medio

Con esta informacin y los resultados obtenidos de la regresin anterior pueden generarse las
variables costos marginales (cmg), costos medios (cme) y costos variables (cvme) relativas a esta
funcin de produccin.

Instrucciones: Genr/ o
/


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


34
Respuesta B- Las representaciones graficas pedidas se van a realizar en grficos de dispersin,
recogiendo en el eje de ordenadas los datos relativos a las distintas funciones de costos y en el eje de
las abscisas los correspondientes al nivel de produccin de las empresas.

Instrucciones: Quick/ Graph/ cti yi/ scatter

200
300
400
500
600
700
800
0 2 4 6 8 10 12
YI
C
T
I


Instrucciones: Quick/ Graph/cmg yi/ scatter



0
20
40
60
80
100
120
140
160
0 2 4 6 8 10 12
YI
C
M
G



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


35

Instrucciones: Quick/ Graph/cme yi/ scatter

50
60
70
80
90
100
110
120
130
0 2 4 6 8 10 12
YI
C
M
E


Instrucciones: Quick/ Graph/cvme yi/ scatter

20
25
30
35
40
45
50
55
0 2 4 6 8 10 12
YI
C
V
M
E


La curva de oferta de una empresa competitiva viene dada por el tramo de su curva de costos
marginales que se encuentra por encima de los costos variables medios. El cierre de las empresas se
producir, por tanto, cuando sus ingresos no cubran los costos variables medios, aunque los
beneficios de las empresas no son positivos hasta que no alcanzan un nivel de produccin tal que su
costo medio supera a su costo marginal. Para ver cul es el punto de cierre se analizan las variables
cvme, cmg y que nivel de produccin se alcanza cuando se da la igualdad (aproximada) entre estas.

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


36
Para ello, en primer lugar, es necesario ordenar los datos de forma creciente en funcin de la
produccin; el comando que nos permite realizar dicha operacin es sort. La utilizacin de este
comando ordenara los datos de todas las variables segn sentido creciente de la variable
especificada, por lo que para poder reordenar posteriormente los datos en el orden original se debe
crear previamente una variable tendencia (t=0,1,2,3,).

Instrucciones: Genr/ t=@trend(1)

En la lnea de comando escribir primero: sort yi, luego show cti yi cmg cvme cme

Obs CTI YI CMG CVME CME


1 231.6288 1.82 19.43053 23.72461 119.7590
2 214.9501 2.02 19.12153 23.28267 109.8087
3 231.0902 2.55 19.17148 22.40115 90.94331
4 224.9952 2.63 19.28861 22.30461 88.76184
5 232.5102 2.72 19.45473 22.20747 86.46574
6 239.0219 2.80 19.63293 22.13130 84.55362
7 237.9734 2.93 19.98382 22.02795 81.68069
8 242.6670 3.00 20.20420 21.98278 80.24362
9 247.7566 3.41 21.93691 21.86554 73.12141
10 243.7987 3.43 22.04074 21.86625 72.82326
11 249.1614 3.45 22.14637 21.86757 72.52917
12 259.5556 3.72 23.74822 21.94396 68.92850
13 272.6811 4.12 26.72313 22.25773 64.68067
14 279.5434 4.53 30.51818 22.82793 61.41126
15 291.0340 4.91 34.70967 23.58111 59.17837
16 297.9801 5.17 37.95119 24.22101 58.02807
17 307.8361 5.53 42.94066 25.27408 56.88032
18 316.2933 5.75 46.27632 26.01314 56.41010
19 345.7123 5.91 48.83878 26.59615 56.17018
20 404.1607 6.91 67.45905 31.10823 56.40237
21 392.8819 7.02 69.78147 31.69596 56.59375
22 428.8959 7.47 79.84814 34.28891 57.68684
23 441.4836 7.52 81.02280 34.59573 57.83809
24 465.0450 7.82 88.30654 36.51524 58.86595
25 494.8002 8.20 98.11286 39.14004 60.45498
26 519.9197 8.53 107.1550 41.59485 62.08518
27 527.7194 8.60 109.1359 42.13653 62.46008
28 616.7535 9.32 130.7883 48.13382 66.88731
29 716.3884 10.01 153.7232 54.60946 72.07025
30 736.6997 10.01 153.7232 54.60946 72.07025

Se puede apreciar que el mnimo de la funcin de costo variable medio se alcanza en 21.86554, para
un nivel de produccin 3.41. Asimismo, puede comprobarse que en este punto se verifica la igualdad
(aprox.) entre el costo marginal y el mnimo del costo variable medio.








Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


37

CAPITULO 3
MODELOS DE REGRESION CON VARIABLES FICTICIAS

3.1- RESUMEN TEORICO
Las variables FICTICIAS (variables dummy) se incluyen en el modelo como variables
independientes- bsicamente por tres razones:
- Para diferenciar el efecto de un evento aleatorio, por ejemplo un terremoto o un fenmeno
natural, un golpe de estado, etctera, que puede provocar un comportamiento extrao de la
variable dependiente en alguna o algunas observaciones de la muestra. A estas observaciones
(afectadas por el evento aleatorio) se les denomina outliers.
- Como representacin de una variable categrica, o atributo especial de las observaciones, que
se repiten regularmente en la muestra (por ejemplo sexo, raza, religin, estacin, tipo de
colegio, etc.), que hace que las observaciones en las que se observa dicho atributo, tengan un
comportamiento diferente con respecto a aquellas observaciones donde no se observa dicho
atributo.
- Permiten capturar los eventos aleatorios que pueden haber ocurrido en un momento, pero
con consecuencias por un periodo mayor. En este caso dicho evento produce cambios
estructurales en la muestra, que reflejan inestabilidad en los parmetros del modelo.
NOTA: En modelos econmicos, usualmente las variables ficticias se combinan con variables
regresoras cuantitativas, generando diferentes efectos (dependiendo de la forma como se involucran
en el modelo: en forma aditiva, interactiva o combinada).
Cambios solo en el intercepto
Supongamos que se observa nicamente un residuo fuera de rango (un outlier) que es ocasionado,
por ejemplo, por el terremoto del 2007. Para capturar el efecto del terremoto bastar con crear una
variable ficticia que identifique dicho evento, as:
1 2 2 3 3 4 i i i i i
Y x x D u | | | | = + + + +

Donde,
4
| refleja la magnitud del impacto del terremoto en el modelo.
Si no ocurre el terremoto (D=0) el modelo es:
1 2 2 3 3 i i i i
Y x x u | | | = + + + . Pero si ocurre el
terremoto (D=1), el modelo ser:
2 2 3 3 i i i i
Y x x u | | = + + +
;
donde el intercepto es:
1 4
| | = + .
Cambios solo en la pendiente
Si el propsito es identificar la eventualidad de que un shock aleatorio haya producido cambios en
alguna o en todas las pendientes (de los regresores cuantitativos involucrados), ser necesario crear
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


38
tantas variables adicionales como pendientes hayan sido afectadas. Supongamos que solo cambio la
pendiente de la variable
2
x .
1 2 2 3 3 4 2 i i i i i i
Y x x Dx u | | | | = + + + +
Donde
4
| refleja la magnitud del impacto adicional del terremoto del 2007 en la pendiente de la
variable
2
x .
Si no ocurre el terremoto (D=0), el modelo es:
1 2 2 3 3 i i i i
Y x x u | | | = + + + . Pero si ocurre el
terremoto (D=1), el modelo es:
1 2 2 3 3 i i i i
Y x x u | | = + + + ; donde la pendiente de
2
x es:
2 4
| | + .
Cambios en el intercepto y en las pendientes
Utilizando el ejemplo anterior, supongamos que el terremoto ha provocado cambios nicamente en
el intercepto y en la pendiente de la variable
2
x . De modo que si no ocurre el terremoto, D=0, el
modelo es
1 2 2 3 3 i i i i
Y x x u | | | = + + + , pero, si ocurre el fenmeno del nio, D=1, el modelo es:
1 2 2 3 3 4 5 2 i i i i i i i
Y x x D Dx u | | | | | = + + + + + .
Donde
4
| refleja la magnitud del impacto adicional del terremoto en el intercepto del modelo y
5
|
mide el cambio en la pendiente de la variable
2
x . El signo de
4
| y
5
| indicar el sentido del
impacto, positivo o negativo, en el intercepto y en la pendiente.
Uso e Interpretacin de las Variables Ficticias
1. Si una variable cualitativa tiene m categoras, solo hay que agregar (m-1) variables
dicotmicas. Si por ejemplo la variable cualitativa regin tiene tres categoras, se introducen
solo dos variables dicotmicas. Si no se respeta esta regla, se provocara lo que se conoce como
trampa de la variable dictomica.
2. La categora a la cual no se le asigna la variable dicotmica se conoce como categora base, de
comparacin, de control.
3. El valor de la interseccin (intercepto) representa el valor medio de la categora de
comparacin. El valor del coeficiente de la variable ficticia es un valor incremental.
4. Los coeficientes asociados a las variables dictomas se conocen como coeficientes de la
interseccin diferencial, debido a que indican en que medida el valor de la interseccin que se
le asigna 1 vara en relacin al coeficiente del intercepto (categora de comparacin).
5. Tambin se puede evitar la trampa de la variable dictoma siempre y cuando no se
introduzca la interseccin (intercepto) en el modelo. La interpretacin es distinta al caso
descrito en (3).







Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


39
3.2- EJERCICIOS
1. En el workfile dummy.wf1 tenemos los datos sobre salarios (S/.) de los profesores de
universidades pblicas en 51 estados para el ao 2010. Las 51 reas se clasifican en tres regiones
geogrficas: Norte, Sur, Oeste. Dado lo anterior, considere el siguiente modelo:
1 2 2 3 3 i i i i
Y D D u | | | = + + +
Donde: Y
i
=salario (promedio) de los maestros de universidades pblicas en el estado i.
D
2i
=1 si el estado est en el Norte, 0 para otra regin del pas.
D
3i
=1 si el estado es del Sur, 0 para otra regin del pas.

(a) Estime el modelo ANOVA mostrado arriba e intrprete los coeficientes y el intercepto del
modelo. Se est evitando la trampa de las variables ficticias?.

Primero hay que tener en cuenta que existe solamente una variable categrica llamada regin
geogrfica, esta contiene 3 variables dummies: Oeste, Norte y Sur. El modelo ANOVA es cuando en
un modelo de regresin, todas las variables explicativas son dummies. Dado lo anterior, se formula el
salario medio de los profesores en universidades pblicas en la regin Norte (D
2i
=1):
2 3 1 2
( | 1, 0)
i i i
E Y D D | | = = = +
El salario medio de los profesores en el Sur:
2 3 1 3
( | 0, 1)
i i i
E Y D D | | = = = +
El salario medio para los profesores en el Oeste:
2 3 1
( | 0, 1)
i i i
E Y D D | = = =
Por tanto, el salario medio de los profesores de universidades pblicas en el Oeste esta dado por la
interseccin por
1
| , adems los coeficientes
2
| y
3
| indican la cantidad por la que los salarios
promedios de los profesores de Norte y Sur, difieren
7
positiva o negativamente respecto a los
salarios de los profesores del Oeste. A continuacin se estima el modelo original mostrado arriba:

Instrucciones: Quick/Estimate equation/ salario c d2 d3
Alternativamente escribimos en la lnea de comandos: LS salario c d2 d3
Dependent Variable: SALARIO
Method: Least Squares
Sample: 1 51
Included observations: 51


Variable Coefficient Std. Error t-Statistic Prob.


C 26158.62 1128.523 23.17952 0.0000
D2 -1734.473 1435.953 -1.207890 0.2330
D3 -3264.615 1499.155 -2.177637 0.0344


R-squared 0.090083 Mean dependent var 24356.22
Adjusted R-squared 0.052170 S.D. dependent var 4179.426
S.E. of regression 4068.947 Akaike info criterion 19.51718
Sum squared resid 7.95E+08 Schwarz criterion 19.63082
Log likelihood -494.6880 Hannan-Quinn criter. 19.56060
F-statistic 2.376027 Durbin-Watson stat 1.162044
Prob(F-statistic) 0.103764



7
Gujarati (2004) denomina a la variable dummy que esta en el intercepto como criterio de comparacin, de
referencia o categora base.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


40
Los resultados de la estimacin anterior, muestran que el salario medio de los profesores del Este es
de casi S/. 26158, el de los profesores del Norte y Sur es menor por casi S/. 1734 y S/. 3265
respectivamente. Lo salarios medios reales en las ltimas dos regiones se pueden obtener al aadir
estos salarios diferenciales al salario medio de los profesores del Oeste. Al hacer esto, se tendr que
los salarios medios de las dos ltimas regiones son de casi (26158 - 1734=S/.24424) y (26158 -
3264=S/. 22894). En la estimacin anterior, se est evitando el problema de las variables ficticias ya
que no se est incluyendo todas las variables dummy adems del intercepto (que ya incorpora una
de ellas).

(b) Realice otro modelo similar al de arriba que tambin evite el problema de las variables ficticias,
intrprete tambin los coeficientes y el intercepto de dicho modelo.
Otra forma igual a la anterior, es estimar el siguiente modelo:
1 1 2 2 3 3 i i i i i
Y D D D u | | | = + + +
, es decir
eliminando el intercepto.
Instrucciones: Quick/Estimate equation/ salario d1 d2 d3
Alternativamente escribimos en la lnea de comandos: LS salario d1 d2 d3

Dependent Variable: SALARIO
Method: Least Squares
Sample: 1 51
Included observations: 51


Variable Coefficient Std. Error t-Statistic Prob.


D1 26158.62 1128.523 23.17952 0.0000
D2 24424.14 887.9170 27.50724 0.0000
D3 22894.00 986.8645 23.19873 0.0000


R-squared 0.090083 Mean dependent var 24356.22
Adjusted R-squared 0.052170 S.D. dependent var 4179.426
S.E. of regression 4068.947 Akaike info criterion 19.51718
Sum squared resid 7.95E+08 Schwarz criterion 19.63082
Log likelihood -494.6880 Hannan-Quinn criter. 19.56060
Durbin-Watson stat 1.162044



Al no incorporar el intercepto, las interpretaciones acerca de los coeficientes de la regin Norte (D2)
y Sur (D3), no se lee como un diferencial con la regin Oeste (D1), ya que como vemos en la ltima
estimacin, esta ya incorpora los verdaderos salarios medios reales para los profesores segn la
regin geogrfica. Por lo tanto, los salarios medios reales para los profesores de la regin Oeste,
Norte y Sur son S/. 26158, S/.24424, S/. 22894 respectivamente.

(c) Realice el siguiente modelo:
1 2 2 3 3 4 1 i i i i i
Y D D D u | | | | = + + + + , Habr algn problema para
estimarlo?, explique.

Instrucciones: Quick/ Estimate equation/ salario c d1 d2 d3
Alternativamente escribimos en la lnea de comandos: LS salario c d1 d2 d3
Siguiendo las instrucciones anteriores, el resultado sera que no se puede estimar este modelo ya
que se est generando la trampa de las variables ficticias, ya que como variables explicativas se
incluye todas las dummies y el intercepto (o termino independiente) - que captura ya una de las 3
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


41
variables dummy. Por lo tanto, para evitar este problema se pueden estimar todas las variables
dummies sin intercepto o estimamos solo 2 variables dummy ms el intercepto.

(d) Genere un modelo ANCOVA en las estimaciones (a) y (b), agregando el gasto en universidades
pblicas (gasto) como variable explicativa, explique si mejora el R
2
y los niveles de significancia
de las variables explicativas en comparacin con la pregunta (a) y (b).
A diferencia del modelo ANOVA, el modelo ANCOVA incluye como variables explicativas tanto
variables dummies como variables numricas. As tenemos:
Instrucciones: Quick/ Estimate equation/ salario c d2 d3 gasto
Alternativamente escribimos en la lnea de comandos: LS salario c d2 d3 gasto

Dependent Variable: SALARIO
Method: Least Squares
Date: 02/11/11 Time: 22:23
Sample: 1 51
Included observations: 51


Variable Coefficient Std. Error t-Statistic Prob.


C 13269.11 1395.056 9.511530 0.0000
D2 -1673.514 801.1703 -2.088837 0.0422
D3 -1144.157 861.1182 -1.328687 0.1904
GASTO 3.288848 0.317642 10.35393 0.0000


R-squared 0.722665 Mean dependent var 24356.22
Adjusted R-squared 0.704963 S.D. dependent var 4179.426
S.E. of regression 2270.152 Akaike info criterion 18.36827
Sum squared resid 2.42E+08 Schwarz criterion 18.51978
Log likelihood -464.3908 Hannan-Quinn criter. 18.42616
F-statistic 40.82341 Durbin-Watson stat 1.414238
Prob(F-statistic) 0.000000


Instrucciones: Quick/ Estimate equation/ salario d1 d2 d3 gasto
Alternativamente escribimos en la lnea de comandos: LS salario d1 d2 d3 gasto

Dependent Variable: SALARIO
Method: Least Squares
Date: 02/11/11 Time: 00:51
Sample: 1 51
Included observations: 51


Variable Coefficient Std. Error t-Statistic Prob.


D1 13269.11 1395.056 9.511530 0.0000
D2 11595.60 1334.367 8.689962 0.0000
D3 12124.96 1176.837 10.30301 0.0000
GASTO 3.288848 0.317642 10.35393 0.0000


R-squared 0.722665 Mean dependent var 24356.22
Adjusted R-squared 0.704963 S.D. dependent var 4179.426
S.E. of regression 2270.152 Akaike info criterion 18.36827
Sum squared resid 2.42E+08 Schwarz criterion 18.51978
Log likelihood -464.3908 Hannan-Quinn criter. 18.42616
Durbin-Watson stat 1.414238



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


42
Las estimaciones anteriores muestran que el R
2
ahora es 72.2 %, esto significa que las variables
explicativas explican correctamente las variaciones de la variable dependiente. Conforme el gasto
pblico aumente en un 1 S/. el salario de los profesores de las universidades se incrementa en S/.
3.28. Concluimos adems que los salarios medios reales para los profesores de la regin Oeste,
Norte y Sur son S/. 13269, S/.11595, S/.12124 respectivamente.

2. Usando precio.wf1 y estimamos el siguiente modelo de regresin que representa el precio de la
vivienda:
1 2 3 4
log( ) log( ) log( ) price lotsize sqrft bdrms colonial u o | | | | = + + + + +
Donde la variable Price es el precio de la vivienda, lotsize se refiere al tamao del terreno, sqrft se
refiere al tamao de la vivienda, bdrms es el nmero de dormitorios; en cuanto a colonial, se trata de
una variable binaria que vale 1 si la casa es de estilo colonial.
Instrucciones: Quick/ Estimate equation/ lprice c lotsize lsqrft bdrms colonial
Alternativamente escribimos en la lnea de comandos: LS lprice c lotsize lsqrft bdrms colonial

Dependent Variable: LPRICE
Method: Least Squares
Date: 02/12/11 Time: 00:33
Sample: 1 88
Included observations: 88


Variable Coefficient Std. Error t-Statistic Prob.


C -0.482685 0.672110 -0.718164 0.4747
LOTSIZE 6.11E-06 2.08E-06 2.931931 0.0044
LSQRFT 0.784650 0.095155 8.246004 0.0000
BDRMS 0.022156 0.030420 0.728333 0.4685
COLONIAL 0.057516 0.047333 1.215134 0.2278


R-squared 0.607985 Mean dependent var 5.633180
Adjusted R-squared 0.589093 S.D. dependent var 0.303573
S.E. of regression 0.194596 Akaike info criterion -0.380640
Sum squared resid 3.143018 Schwarz criterion -0.239882
Log likelihood 21.74816 Hannan-Quinn criter. -0.323932
F-statistic 32.18170 Durbin-Watson stat 2.110403
Prob(F-statistic) 0.000000



Cul es el significado del coeficiente colonial? Para niveles dados de lotsize, sqrft, bdrms, la
diferencia en log(Price) entre una casa de estilo colonial y una casa de otro estilo es de 0.057.
Podemos mejorar esta aproximacin calculando la diferencia porcentual exacta del precio predicho.
Para nuestro caso
4
| , que es el coeficiente de la variable ficticia y cuando la variable dependiente
esta en logaritmos, la diferencia porcentual exacta en el valor predicho del precio cuando colonial=1
comparando con el caso en el que colonial=0 es:
100*[exp(0.057)-1]=5.86% . Esta estimacin mas precisa implica que el precio de una vivienda de
estilo colonial se vender en un 5.8% ms caro, manteniendo todos los dems factores iguales.

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


43
CAPITULO 4
PERTURBACIONES NO ESFERICAS:
HETEROSCEDASTICIDAD Y AUTOCORRELACION

4.1 CONDICIONES DE GAUSS-MARKOV
Antes de empezar con los problemas de las perturbaciones no esfricas, primero es primordial ver las
cuatro condiciones de Gauss-Markov para el planteamiento del modelo lineal general. Suponiendo
una ecuacin de regresin de la forma:
y x u o | = + +
Estas condiciones (que son parte de los supuestos del modelo lineal general) asumen que el trmino
de error o perturbacin puede resumirse en:
- ( ) 0
i
E u = para todo i.
-
2
( )
i
Var u o = (constante) para todo i.
- cov( ) 0
i j
u u = para todo i j = .
- cov( ) 0
i i
x u = (lo cual implica que las variables explicativas son no estocsticas).
El segundo y tercer supuesto se pueden resumir en trminos matriciales (para el modelo lineal
general) a travs de la siguiente expresin:
2
( ')
n
E I

o =
Cuando se cumplen estas dos condiciones se dice que los errores son esfricos. La violacin del
segundo supuesto da origen al problema de heteroscedasticidad e implica que la varianza del
trmino de error no es constante para cada observacin. Por otro lado, si los elementos fuera de la
diagonal de la matriz de varianzas y covarianzas de los errores son distintos de cero, se viola el tercer
supuesto: problema de autocorrelacin (los trminos de error no son independientes).
En general, a partir de la discusin anterior nos queda la impresin de que estos problemas no
deberan existir porque van a afectar las propiedades del estimador de mnimos cuadrados
ordinarios. De hecho, sabemos que si no se cumplen las condiciones de Gauss-Markov tendremos un
estimador que ya no ser el mejor estimador linealmente insesgado (MELI).
4.2 HETEROSCEDASTICIDAD
La segunda condicin de Gauss - Markov implica que la varianza de la perturbacin debe ser
constante para cada observacin. En este sentido, el supuesto de homoscedasticidad implica que la
distribucin relevante para cada observacin es la misma. En algunos casos, sin embargo, puede ser
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


44
ms razonable pensar que la distribucin del trmino de error es diferente para cada observacin:
heteroscedasticidad.

A manera de resumen, sea el modelo lineal general: Y X| = + ; la matriz de VAR-COV, en
presencia de heteroscedasticidad, est dado por:
2
( ') E

o = donde
n
I = .

4.2.1 Por qu se presenta la heteroscedasticidad?
- Relacin entre las variables explicativas y la varianza del error.
- Datos agregados.
- Errores de especificacin.

4.2.2 DETECCION Y CORRECCION - APLICACIONES
Ejercicio. Supongamos que se requiere estimar la relacin existente entre el empleo y el PIB en
algunos departamentos del Per. Para ello se utilizan los datos agregados del Producto Bruto
Interno, en millones de soles, y el nmero de ocupados (medias anuales en miles de personas) para
el ao 2008.

Observaciones PIB EMPLEO
Arequipa 6895665 1834.1
Piura 1747221 412.3
Chiclayo 1338540 351.2
Trujillo 1150586 252.9
Iquitos 1830265 446.4
Huancavelica 660038 162.3
Hunuco 2980371 841.6
La Libertad 1846983 528.3
Lima 9511088 2222.9
Ayacucho 4949357 1276.7
Junn 963305 302.6
Lambayeque 2752518 1012.8
Cusco 7935591 1636
Ica 1240645 317
Amazonas 840372 183.9
Cajamarca 3251025 708.5
Puno 384298 90.3
Ancash 135876 29.7

Existe la posibilidad de que haya heteroscedasticidad en la varianza de los errores, dependiendo
directamente de la variable empleo o alguna transformacin de ella. Se pide lo siguiente:
(a) Usando el workfile (ht1.wf1), regresione el modelo. Despus explique resultados.
Instrucciones: Quick/Estimate equation/ pib c empleo
Alternativamente usar el comando: LS pib c empleo




Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


45
Dependent Variable: PIB
Method: Least Squares
Sample: 1 18
Included observations: 18


Variable Coefficient Std. Error t-Statistic Prob.


C -118413.4 187797.8 -0.630536 0.5372
EMPLEO 4167.111 199.5353 20.88407 0.0000


R-squared 0.964613 Mean dependent var 2800764.
Adjusted R-squared 0.962401 S.D. dependent var 2744155.
S.E. of regression 532101.5 Akaike info criterion 29.31150
Sum squared resid 4.53E+12 Schwarz criterion 29.41043
Log likelihood -261.8035 Hannan-Quinn criter. 29.32514
F-statistic 436.1445 Durbin-Watson stat 2.513420
Prob(F-statistic) 0.000000



(b) Grafique los residuos MCO del modelo y concluya en relacin a la Heteroscedasticidad.
Mtodo grafico
De la regresin original se ha obtenido la serie de residuos que es necesarios renombrar. Se utiliza
adems de esta, la variable empleo, as como distintas variantes de ambas: sus cuadrados y el valor
absoluto de los residuos.
Instrucciones:
Genr r=resid; Genr r2=r^2; Genr absr=abs(r); Genr empleo2=empleo^2

En primer lugar, se realiza la representacin grafica del PIB versus la variable empleo. Esta
representacin permite observar que a niveles bajos de PIB, existe pequea variabilidad en la
ocupacin y, sin embargo, la dispersin aumenta a medida que lo hace el PIB.

Instrucciones: Quick/ graph/ empleo pib /scatter
Alternativamente: SCAT empleo pib
0
2,000,000
4,000,000
6,000,000
8,000,000
10,000,000
0 400 800 1,200 1,600 2,000 2,400
EMPLEO
P
I
B

En segundo lugar, se puede analizar tambin de forma grafica la relacin existente entre los residuos
y la variable explicativa: a valores elevados de la variable empleo le corresponden valores tambin
elevados de los residuos.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


46
Instrucciones: Quick/graph/ empleo r /scatter
-1,500,000
-1,000,000
-500,000
0
500,000
1,000,000
1,500,000
0 400 800 1,200 1,600 2,000 2,400
EMPLEO
R

Instrucciones: Quick/graph/ empleo r2 /scatter
0.0E+00
4.0E+11
8.0E+11
1.2E+12
1.6E+12
2.0E+12
0 400 800 1,200 1,600 2,000 2,400
EMPLEO
R
2

(c) Utilice diferentes pruebas alternativas para probar la existencia formal de heteroscedasticidad en
el modelo.
1. Test de Goldfeld-Quandt
H
o
: Homocedasticidad (la varianza es constante en todo el dominio de la funcin).
H
a
: Heterocedasticidad (varianza no constante en todo el dominio de la funcin).

( )/ 2 2
exp ( )/ 2
1
n c k
n c k
SCR
F F
SCR


=
Este test requiere ordenar todas las variables, de forma ascendente, usando (como control) el orden
creciente de la variable que se supone causante de la heteroscedasticidad: variable empleo en este
caso. Para ello se dispone de un comando que las ordena automticamente, pero como este es el
nico test que lo requiere es necesario generar una serie de tendencia que permita recolocar las
series en su posicin original.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


47
Instrucciones: Genr/ t=@trend(1)
La nueva serie toma valores correlativos empezando por el cero. Servir para reordenar todas las
variables, una vez realizado el contraste. A continuacin, se procede a la recolocacin de todas las
variables segn el orden creciente de la variable que se supone causa la heteroscedasticidad.
Instrucciones: Procs/Sort current page /empleo/ascending o sort empleo
Se obtienen dos submuestras: una con las primeras (n-c)/2 observaciones y la otra con (n-c)/2
ltimas observaciones (normalmente c=n/3); luego se ajustan dos regresiones por separado para
cada submuestra.
Instrucciones: Quick/ estimate equation / pib c empleo/ smpl 1 6
Dependent Variable: PIB
Method: Least Squares
Sample: 1 6
Included observations: 6


Variable Coefficient Std. Error t-Statistic Prob.


C 88887.67 121839.2 0.729549 0.5061
EMPLEO 3524.664 629.5643 5.598576 0.0050


R-squared 0.886827 Mean dependent var 689079.2
Adjusted R-squared 0.858533 S.D. dependent var 377053.5
S.E. of regression 141817.5 Akaike info criterion 26.82367
Sum squared resid 8.04E+10 Schwarz criterion 26.75426
Log likelihood -78.47101 Hannan-Quinn criter. 26.54580
F-statistic 31.34406 Durbin-Watson stat 1.844886
Prob(F-statistic) 0.004997



Instrucciones: Quick/ estimate equation / pib c empleo/ smpl 13 18
Dependent Variable: PIB
Method: Least Squares
Sample: 13 18
Included observations: 6


Variable Coefficient Std. Error t-Statistic Prob.


C -1554291. 1129850. -1.375661 0.2409
EMPLEO 5026.047 730.6937 6.878459 0.0023


R-squared 0.922047 Mean dependent var 5837432.
Adjusted R-squared 0.902559 S.D. dependent var 2738103.
S.E. of regression 854712.9 Akaike info criterion 30.41612
Sum squared resid 2.92E+12 Schwarz criterion 30.34671
Log likelihood -89.24836 Hannan-Quinn criter. 30.13825
F-statistic 47.31320 Durbin-Watson stat 2.709093
Prob(F-statistic) 0.002341



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


48
Finalmente, para obtener el estadstico de prueba del test de Goldfeld-Quandt es necesario dividir
los valores de las sumas de cuadrados de residuos de las dos regresiones anteriores. Se puede
efectuar esta operacin en la lnea de comandos:
=2.92E+12/8.04E+10= 36.3184079602 (Valor F calculado)
Adicionalmente, se estima la probabilidad a la derecha de este punto bajo la hiptesis nula (p-
value). En la lnea de comandos se ejecuta:
=@fdist(36.3184079602,4,4)= 0.00211566325386
Conclusin: puesto que la probabilidad a la derecha es menor que un nivel de significacin de 0.05,
se rechaza la hiptesis de varianza constante para toda la muestra. Antes de continuar con el resto
del ejercicio, es necesario volver a colocar las series en su posicin original.
Instrucciones: Procs/Sort current page /t/ascending sort t
2. Test de Breusch-Pagan-Godfrey
H
o
: Homocedasticidad (la varianza es constante en toda la muestra).
H
a
: Heterocedasticidad (la varianza no es constante en toda la muestra).
2
1
2
exp
2 /

=
p
X SCE X
Donde SCE es la suma de cuadrados explicados de una regresin auxiliar en la que la variable
dependiente (G) es el cociente entre el cuadrado de los residuos de la estimacin del modelo original
(R
2
) y la estimacin maximoverosimil de la varianza de las perturbaciones, esto es:
2 2
/
MV i j
e G o = y n e
i MV
/
2 2
= o
E-views calcula este procedimiento directamente, usando la ecuacin original se realiza el siguiente
procedimiento:
Instrucciones: View/Residual diagnostics/ Heteroskedasticity test/Breusch-Pagan-Godfrey/OK

Heteroskedasticity Test: Breusch-Pagan-Godfrey


F-statistic 4.052445 Prob. F(1,16) 0.0612
Obs*R-squared 3.637661 Prob. Chi-Square(1) 0.0565
Scaled explained SS 6.000531 Prob. Chi-Square(1) 0.0143



Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1 18
Included observations: 18


Variable Coefficient Std. Error t-Statistic Prob.


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


49
C -5.99E+09 1.72E+11 -0.034825 0.9727
EMPLEO 3.68E+08 1.83E+08 2.013069 0.0612


R-squared 0.202092 Mean dependent var 2.52E+11
Adjusted R-squared 0.152223 S.D. dependent var 5.29E+11
S.E. of regression 4.87E+11 Akaike info criterion 56.76635
Sum squared resid 3.80E+24 Schwarz criterion 56.86528
Log likelihood -508.8971 Hannan-Quinn criter. 56.77999
F-statistic 4.052445 Durbin-Watson stat 1.119032
Prob(F-statistic) 0.061249



Podemos ver para este caso que la probabilidad es 0.0143 menor a 0.05, por lo que se rechaza la
hiptesis nula de homoscedasticidad en la varianza, por tanto se concluye que existe
heteroscedasticidad en toda la muestra.
3. Test de White
H
0
: Homoscedasticidad (varianza es constante en toda la muestra).
H
1
: Heteroscedasticidad (varianza no es constante en toda la muestra).
2
1
2 2
exp
.

=
p
X R n X
Donde el coeficiente de determinacin se obtiene a partir de una regresin auxiliar de los residuos al
cuadrado sobre las variables explicativas, sus cuadrados y sus productos cruzados. Este
procedimiento esta automatizado en el paquete E-views, por lo que no ser necesario estimar esta
regresin auxiliar. El procedimiento a seguir -una vez recuperada la regresin inicial (eq1)- es el
siguiente:
Instrucciones: View/Residual diagnostics/ Heteroskedasticity/ White
El resultado obtenido es el siguiente:
Heteroskedasticity Test: White


F-statistic 3.698591 Prob. F(2,15) 0.0495
Obs*R-squared 5.944912 Prob. Chi-Square(2) 0.0512
Scaled explained SS 9.806474 Prob. Chi-Square(2) 0.0074



Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1 18
Included observations: 18


Variable Coefficient Std. Error t-Statistic Prob.


C -3.03E+11 2.39E+11 -1.266662 0.2246
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


50
EMPLEO 1.44E+09 6.56E+08 2.195207 0.0443
EMPLEO^2 -512657.3 302565.4 -1.694368 0.1109


R-squared 0.330273 Mean dependent var 2.52E+11
Adjusted R-squared 0.240976 S.D. dependent var 5.29E+11
S.E. of regression 4.61E+11 Akaike info criterion 56.70234
Sum squared resid 3.19E+24 Schwarz criterion 56.85073
Log likelihood -507.3210 Hannan-Quinn criter. 56.72280
F-statistic 3.698591 Durbin-Watson stat 1.230263
Prob(F-statistic) 0.049458



Es decir, se obtiene el estadstico Ji-cuadrado = 5.944912 (probabilidad = 0.0512) podemos
rechazar la hiptesis nula de varianza constante (es decir existira heteroscedasticidad con un margen
de error de 10%).

(d) Corrija la HT especificando una relacin entre la varianza del error y el EMPLEO. Entonces re-
estime el modelo mediante MCP. Luego verifique la NO existencia de Heteroscedasticidad.
Correccin de la Heteroscedasticidad mediante MC Ponderados
- En la opcin COMANDO, se necesita en primer lugar generar la variable ponderadora:
Instrucciones: GENR IR2empleo=1/(empleo^(1/2))
- Luego estimar por MCP (MCO sobre la ecuacin transformada):
Instrucciones: Quick/Estimate equation/ pib c empleo/ Options -Type: Inverse standard deviation -
Weight: ir2empleo o en la lnea de comando escribimos: LS(W=IR2empleo) pib c empleo


Dependent Variable: PIB
Method: Least Squares
Sample: 1 18
Included observations: 18
Weighting series: IR2EMPLEO
Weight type: Inverse standard deviation (EViews default scaling)


Variable Coefficient Std. Error t-Statistic Prob.


C 7212.529 67358.41 0.107077 0.9161
EMPLEO 3987.781 171.9167 23.19600 0.0000


Weighted Statistics


R-squared 0.971122 Mean dependent var 1690105.
Adjusted R-squared 0.969317 S.D. dependent var 897313.1
S.E. of regression 284729.7 Akaike info criterion 28.06091
Sum squared resid 1.30E+12 Schwarz criterion 28.15984
Log likelihood -250.5482 Hannan-Quinn criter. 28.07455
F-statistic 538.0544 Durbin-Watson stat 2.382636
Prob(F-statistic) 0.000000 Weighted mean dep. 881095.3


Unweighted Statistics


R-squared 0.962827 Mean dependent var 2800764.
Adjusted R-squared 0.960503 S.D. dependent var 2744155.
S.E. of regression 545367.3 Sum squared resid 4.76E+12
Durbin-Watson stat 2.663290

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


51

Ahora para comprobar si ya no existe heteroscedasticidad, realizamos el test de White
(View/Residual diagnostics/ Heteroskedasticity/ White) a la ecuacin anterior, obteniendo:
Heteroskedasticity Test: White


F-statistic 1.315073 Prob. F(2,15) 0.2977
Obs*R-squared 2.685322 Prob. Chi-Square(2) 0.2611
Scaled explained SS 3.929759 Prob. Chi-Square(2) 0.1402


Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 09/09/10 Time: 05:17
Sample: 1 18
Included observations: 18
Collinear test regressors dropped from specification


Variable Coefficient Std. Error t-Statistic Prob.


C 2.44E+10 6.49E+10 0.376235 0.7120
WGT^2 -4.20E+09 1.57E+10 -0.267525 0.7927
EMPLEO^2*WGT^2 242175.5 187589.3 1.290987 0.2163


R-squared 0.149185 Mean dependent var 7.21E+10
Adjusted R-squared 0.035742 S.D. dependent var 1.43E+11
S.E. of regression 1.40E+11 Akaike info criterion 54.32076
Sum squared resid 2.95E+23 Schwarz criterion 54.46915
Log likelihood -485.8868 Hannan-Quinn criter. 54.34122
F-statistic 1.315073 Durbin-Watson stat 1.080737
Prob(F-statistic) 0.297691


(d) Re estime el modelo por MCO, pero utilice el procedimiento WHITE para obtener la verdadera
matriz de VAR-COV de los estimadores. Compare y comente.
En la ventana que contiene la ecuacin regresionada por MCO:
Instrucciones: Quick/Estimate equation/ pib c empleo/ Coefficiente covariance matrix: white

Dependent Variable: PIB
Method: Least Squares
Date: 09/09/10 Time: 05:25
Sample: 1 18
Included observations: 18
White heteroskedasticity-consistent standard errors & covariance


Variable Coefficient Std. Error t-Statistic Prob.


C -118413.4 98861.16 -1.197774 0.2484
EMPLEO 4167.111 231.2880 18.01698 0.0000


R-squared 0.964613 Mean dependent var 2800764.
Adjusted R-squared 0.962401 S.D. dependent var 2744155.
S.E. of regression 532101.5 Akaike info criterion 29.31150
Sum squared resid 4.53E+12 Schwarz criterion 29.41043
Log likelihood -261.8035 Hannan-Quinn criter. 29.32514
F-statistic 436.1445 Durbin-Watson stat 2.513420
Prob(F-statistic) 0.000000










Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


52













COMPARACIONES

Variable
Valores de Estimadores MCO Error Estndar de estimadores
Sin Heterocedastic. Con Heterocedastic. Sin Heterocedastic. Con Heterocedastic.
C -118413.4* -118413.4* 187,797.8 98861.16
EMPLEO 4167.1 4167.1 199.53 231.2880
* Estimador no significativo (o=0.05)


Observe que el valor estimado para los coeficientes no cambia, pues White slo re estima la matriz
de varianzas y covarianzas. Tambin observe que el error estndar de los estimadores MCO con
heteroscedasticidad son diferentes que en el modelo sin heteroscedasticidad. Las matrices de
varianza y covarianzas de beta estimados por MCO son:

Sin heteroscedasticidad: ( )
1 2
' )

(

= X X V
u
o |

Con heteroscedasticidad: ( ) ( )
1 1 2
' ' ' ' )

(

= X X X X X X V
u
o |

E-views obtiene el estimador consistente de White de la varianza heteroscedstica de beta as:

( ) ( )
1 1
'

' )

(

= X X X X V | .Donde: |
.
|

\
|

=
=
n
i
i i i
x x u
k n
n
1
' 2

y | |
ki i i
X X x ... 1
2
=

NOTA: La correccin WHITE funciona bien con muestras grandes.

4.3. AUTOCORRELACION
La tercera condicin de Gauss-Markov implica que el trmino de error para cada observacin se
determina independientemente de los valores que pueda arrojar en el resto de observaciones de la
muestra. Especficamente, la independencia de las perturbaciones implica que su covarianza es cero
(Cov (u
i
u
j
) = 0 para todoi j = ). Cuando esta condicin no se cumple se dice que el error presenta
autocorrelacin. Los problemas asociados a la presencia de autocorrelacin son similares a los que
enfrentamos cuando los errores son heteroscedsticos.
Los estimadores MCO se mantienen insesgados pero dejan de ser eficientes. Esto implica que la
varianza aumenta por lo que la volatilidad de los estimadores aumenta. Sin embargo, en trminos de
la estimacin en la prctica ocurre lo contrario. Dado que los programas economtricos utilizan el
estimador MCO, lo que ocurre es que calculan la varianza siguiendo la frmula tradicional de MCO la
cual nos da desviaciones estndar menores. Por tanto, stas son usualmente subestimadas lo que
conduce a una sobreestimacin de los estadsticos-t y a problemas de inferencia dado que nuestras
conclusiones seran errneas.
Con referencia al problema asociado a la eficiencia de los estimadores MCO, y al igual que para el
caso de heterocedasticidad, basta encontrar otro procedimiento para la estimacin de los
parmetros que arroje estimadores de menor varianza para descartar la eficiencia de los estimadores
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


53
MCO. En este sentido, y como alternativa a la estimacin MCO, la estimacin por mnimos cuadrados
generalizados arroja estimadores ms eficientes en el sentido de presentar una menor varianza.

4.2.3 Por qu se presenta la autocorrelacin?

- Presencia de ciclos econmicos
- Presencia de relaciones no lineales
- Mala especificacin


4.2.4 DETECCION Y CORRECCION - APLICACIONES
Ejercicio. Se ha recogido informacin hipottica macroeconmica del Per, el cual se usan el
consumo pblico (cp) y el producto bruto interno a precios de mercado (pibpm), ambos en millones
de soles, con el objetivo de estimar un modelo de regresin lineal y comprobar la posible presencia
de autocorrelacin en las perturbaciones. Las series toman los siguientes valores:

obs PIBPM CP
1985 28200885 4498034
1986 32323992 4740221
1987 36143972 5159905
1988 40158739 5368137
1989 45044128 5813462
1990 50145195 6197776
1991 54927320 6543696
1992 59104986 6808095
1993 60952584 6971511
1994 64811535 6948140
1995 69780058 7074014
1996 73743261 7141101
1997 77896586 7239097

A partir de dicha informacin, contraste el posible incumplimiento de la hiptesis de no
autocorrelacin por medio de:
a) Anlisis grficos
b) Test de Durbin-Watson
c) Correlograma
d) Test de Breusch-Godfrey
e) Sobre esta misma informacin, se propone especificar una nueva forma estableciendo una
relacin lineal del consumo pblico a partir del PIBPM y de un retardo del CP como factores
explicativos. Bajo esta formulacin, pruebe la presencia de autocorrelacin en las
perturbaciones.
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


54
f) En caso de detectar problemas de autocorrelacin, obtenga una estimacin MELI para los
parmetros del modelo.
Solucin: Abrimos primero el workfile llamado ac1.wf1 y estimamos el siguiente modelo por MCO:
1 2
*
t t t
CP PIBPM u | | = + +
Instrucciones: Quick/Estimate equation/ cp c pibpm

Dependent Variable: CP
Method: Least Squares
Sample: 1985 1997
Included observations: 13


Variable Coefficient Std. Error t-Statistic Prob.


C 3079706. 237829.5 12.94922 0.0000
PIBPM 0.058374 0.004282 13.63260 0.0000


R-squared 0.944119 Mean dependent var 6192553.
Adjusted R-squared 0.939039 S.D. dependent var 971351.1
S.E. of regression 239828.9 Akaike info criterion 27.75388
Sum squared resid 6.33E+11 Schwarz criterion 27.84079
Log likelihood -178.4002 Hannan-Quinn criter. 27.73601
F-statistic 185.8479 Durbin-Watson stat 0.343122
Prob(F-statistic) 0.000000



A partir de esta estimacin, se genera la serie de los residuos mnimo cuadrticos correspondientes a
este ejercicio.
Instrucciones: Genr/ e=resid
a) Contrastes grficos:
Instrucciones: Quick/graph/ e e(-1)/ scatter
-300,000
-200,000
-100,000
0
100,000
200,000
300,000
400,000
-400,000 -200,000 0 100,000 300,000
E
E
(
-
1
)

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


55
Se puede observar que los puntos se colocan en el diagrama en el primer y tercer cuadrante, por lo
que puede ser indicativo de presencia de autocorrelacin positiva.
Grfico de los residuos en el tiempo:
Instrucciones: Quick/ graph/ e/ line graph
-400,000
-300,000
-200,000
-100,000
0
100,000
200,000
300,000
400,000
85 86 87 88 89 90 91 92 93 94 95 96 97
E

La representacin grafica de los residuos presenta un comportamiento sistemtico, posiblemente
cclico que sigue indicando la posible presencia de problemas de autocorrelacin.
b) Test de Durbin-Watson

En la salida de regresin original que estimo al comienzo se puede encontrar el estadstico de Durbin-
Watson, que ha sido remarcado en negrita en la salida original: d=0.343122. En las tablas de Savin-
White se pueden obtener los lmites inferior y superior, al 95% de confianza, con un tamao de
muestra igual a 13 y con k variables explicativas=1, D
L
=1.010 y d
U
=1.340, por tanto, como d<d
L
,
entonces se rechaza la hiptesis nula, es decir existe autocorrelacin positiva de orden 1, veamos
aqu:
Criterio de decisin:



c) Correlograma: Al modelo original se utiliza el correlograma Q (Ljung-Box)
Instrucciones: View/ Residual diagnostics/Correlogram Q-statistic/11 lags

0.343122
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


56



El correlograma de estos residuos muestra un decrecimiento, mientras que la PAC se observa una
banda distinta de 0. Este comportamiento se asocia a un proceso autorregresivo de orden 1, es decir,
un AR(1).
d) Test de Breusch-Godfrey
Para este caso se ir seleccionando progresivamente 1,2, rezagos, hasta que el contraste de
significacin individual del ltimo retardo se situ en la regin de no rechazo de la hiptesis nula.
Instrucciones: View/residual diagnostics/ serial correlation LM test/1 lags

Breusch-Godfrey Serial Correlation LM Test:


F-statistic 18.71771 Prob. F(1,10) 0.0015
Obs*R-squared 8.473176 Prob. Chi-Square(1) 0.0036



Test Equation:
Dependent Variable: RESID
Method: Least Squares
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.


Variable Coefficient Std. Error t-Statistic Prob.


C 149133.7 151175.4 0.986495 0.3472
PIBPM -0.003342 0.002760 -1.210686 0.2539
RESID(-1) 0.974886 0.225334 4.326396 0.0015


R-squared 0.651783 Mean dependent var 1.79E-11
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


57
Adjusted R-squared 0.582139 S.D. dependent var 229618.7
S.E. of regression 148430.4 Akaike info criterion 26.85279
Sum squared resid 2.20E+11 Schwarz criterion 26.98317
Log likelihood -171.5432 Hannan-Quinn criter. 26.82600
F-statistic 9.358853 Durbin-Watson stat 1.278439
Prob(F-statistic) 0.005120



E-views ofrece tanto una salida del resultado final como la salida al completo de la regresin auxiliar
de los residuos de MCO en funcin de los regresores del modelo y de los retardos elegidos de los
mismos.
En esta primera opcin, se observa que el estadstico experimental para este test es: n.R
2
=8.473176,
con una probabilidad asociada de 0.0036 <0.05, que hace situarse a dicho estadstico en regin
critica y, por tanto, se rechaza la hiptesis de no autocorrelacin a un 95% de confianza. El test es
dado por lo siguiente:
H
0
: no existe autocorrelacin
H
1
: existe autocorrelacin de orden p
2 2 2
exp
.
p
X R n X =
Donde p es el nmero de retardos de los residuos que se introducen en la regresin auxiliar. Por otra
parte, la probabilidad asociada al estadstico t en la regresin auxiliar, correspondiente al retardo de
los residuos es 0.0015 que por ser menor a 0.05, sita al estadstico en la regin de rechazo de la
hiptesis nula. A continuacin se muestra la salida correspondiente a la introduccin de dos rezagos
de los residuos en la regresin auxiliar.
Instrucciones: View/residual diagnostics/ serial correlation LM test/2 lags
Breusch-Godfrey Serial Correlation LM Test:


F-statistic 10.11549 Prob. F(2,9) 0.0050
Obs*R-squared 8.997396 Prob. Chi-Square(2) 0.0111



Test Equation:
Dependent Variable: RESID
Method: Least Squares
Sample: 1985 1997
Included observations: 13
Presample missing value lagged residuals set to zero.


Variable Coefficient Std. Error t-Statistic Prob.


C 68270.62 167332.3 0.407994 0.6928
PIBPM -0.001571 0.003186 -0.493088 0.6338
RESID(-1) 1.216267 0.315142 3.859431 0.0039
RESID(-2) -0.428241 0.394440 -1.085692 0.3058

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


58

R-squared 0.692107 Mean dependent var 1.79E-11
Adjusted R-squared 0.589477 S.D. dependent var 229618.7
S.E. of regression 147121.5 Akaike info criterion 26.88357
Sum squared resid 1.95E+11 Schwarz criterion 27.05740
Log likelihood -170.7432 Hannan-Quinn criter. 26.84784
F-statistic 6.743657 Durbin-Watson stat 1.956964
Prob(F-statistic) 0.011152



Al igual que ocurra en el caso anterior, el estadsticos del test de Breusch-Godfrey tiene una
probabilidad asociada de 0.0111<0.05, por tanto se rechaza la hiptesis nula, es decir existe
autocorrelacin. Por otro lado la probabilidad asociada al t experimental es de 0.3058 > 0.05, no se
puede rechazar la hiptesis nula, por tanto este segundo rezago ya no es significativo en el
comportamiento de los residuos mnimo cuadrticos. La conclusin de este test es que existe
autocorrelacin en las perturbaciones y que es de orden 1.

e) Obtencin de estimadores MELI: Mtodo de Cochrane Orcutt
Se debe recordar que el modelo que presentaba problemas de autocorrelacin responda a la
formulacin inicial del consumo pblico en funcin del producto bruto interno a precios de mercado.
Sobre ese modelo ser sobre el que se trate de obtener los estimadores de forma eficiente. Como ya
se ha explicado, en la parte terica, este test es un criterio de estimacin iterativa para obtener los
mejores estimadores lineales, insesgados y ptimos, bajo la especificacin del modelo de MCG.
Instrucciones: Quick/ Estimate equation/ cp c pibpm ar(1)
Dependent Variable: CP
Method: Least Squares
Sample (adjusted): 1986 1997
Included observations: 12 after adjustments
Convergence achieved after 12 iterations


Variable Coefficient Std. Error t-Statistic Prob.


C 5643278. 2788228. 2.023966 0.0736
PIBPM 0.024402 0.029292 0.833054 0.4264
AR(1) 0.839764 0.118191 7.105174 0.0001


R-squared 0.984800 Mean dependent var 6333763.
Adjusted R-squared 0.981422 S.D. dependent var 864007.5
S.E. of regression 117764.8 Akaike info criterion 26.40308
Sum squared resid 1.25E+11 Schwarz criterion 26.52431
Log likelihood -155.4185 Hannan-Quinn criter. 26.35820
F-statistic 291.5510 Durbin-Watson stat 1.484904
Prob(F-statistic) 0.000000


Inverted AR Roots .84


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


59

Esta estimacin muestra los resultados de la repeticin 12 veces del proceso de C-O para conseguir la
convergencia. Cabe destacar que la variable pibpm pasa a ser no significativa, mientras que el
proceso autorregresivo es significativo, con una probabilidad asociada de 0.0001.
El correlograma de los residuos de esta estimacin corrobora el diagnostico de bueno
comportamiento de la perturbacin:
Instrucciones: view/residual diagnostics/correlogram Q-statistic/10 lags


El estadstico Q de Ljung-Box permite verificar la hiptesis nula de:
1 2
.... 0
o
H

= = = = =
Cuando se acepta esta hiptesis se est indicando que los residuos no estn autocorrelacionados. En el
presente, dado que la probabilidad es superior a 0.05 nos indica que se ha corregido la
autocorrelacin, ya que los residuos del nuevo modelo no la presentan.








Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


60

CAPITULO 5
MULTICOLINEALIDAD

5.1 RESUMEN TEORICO
La colinealidad est referida a la existencia de una sola relacin lineal entre las variables explicativas
y, por lo tanto, la multicolinealidad se refiere a la existencia de ms de una relacin lineal. Es
importante anotar que la multicolinealidad se refiere slo a relaciones lineales entre las variables
independientes y no a cualquier otro tipo de relacin, as pues, si xi = xj
2
, entonces no existir
multicolinealidad en el modelo. El problema de la multicolinealidad est definido por el alto grado de
intercorrelacin entre variables explicativas. Dentro de las violaciones de los supuestos del modelo
lineal general, la multicolinealidad es un problema de grado y no terico como la heteroscedasticidad
o la autocorrelacin, ms an, los estimadores obtenidos bajo multicolinealidad, conservan las
propiedades que los definen como MELI.
Una cuestin importante que debe analizarse al estudiar los resultados de un modelo de regresin es
el grado de relacin lineal existente entre las observaciones de las variables explicativas. A este
respecto, las posibles situaciones son tres:

- Multicolinealidad perfecta: se da cuando existe una relacin lineal exacta entre algunos o
todos los regresores incluidos en el modelo.
- Ortogonalidad: Supone la ausencia de relacin lineal entre algunos o todos los regresores
incluidos en el modelo (raramente ocurre esto).
- Multicolinealidad imperfecta: consiste en la existencia de una relacin lineal fuerte entre los
regresores del modelo.


Las posibles fuentes de multicolinealidad son cuatro principalmente:

- El mtodo de recoleccin de informacin empleado.
- Restricciones sobre el modelo o en la poblacin que es objeto de muestreo.
- Especificacin del modelo.
- Un modelo sobredeterminado (es cuando un modelo tiene ms variables explicativas que
observaciones).

5.2 CONSECUENCIAS
- Varianzas y covarianzas grandes.
- Intervalos de confianza ms amplios.
- Estadsticos t poco significativos y un R
2
alto.
- Sensibilidad de los estimadores y sus errores estndar ante pequeos cambios en la muestra.



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


61
5.3 CORRECCION
- Suprimir variables
- Utilizacin de informacin adicional
- Utilizacin de primeras diferencias
- Empleo de cocientes o ratios entre las variables
- Aumentar el tamao de muestra
- No hacer nada

5.4 APLICACIONES

Ejercicio 1. El archivo macro.wf1, proporciona cifras sobre importaciones, PNB e ndices al
consumidor (IPC) para Per, durante el periodo 1970-1998. Se pide considerar el siguiente modelo:

1 2 3
lnIm ln ln
t t t t
portaciones PNB IPC u | | | = + + +

a) Estime los parmetros de este modelo utilizando la informacin de la data.

Abrimos el archivo macro.wf1, y seguimos los siguientes pasos:

Instrucciones: Quick/ estimate equation/ equation eq01.ls log(importaciones) c log(pnb) log(ipc)
Alternativamente en la lnea de comandos escribimos: equation eq01.ls log(importaciones) c
log(pnb) log(ipc)

Dependent Variable: LOG(IMPORTACIONES)
Method: Least Squares
Sample: 1970 1998
Included observations: 29


Variable Coefficient Std. Error t-Statistic Prob.


C -1.345425 0.136089 -9.886398 0.0000
LOG(PNB) 0.639133 0.090477 7.064019 0.0000
LOG(IPC) 0.051627 0.065941 0.782925 0.4407


R-squared 0.992403 Mean dependent var 4.509338
Adjusted R-squared 0.991819 S.D. dependent var 0.469603
S.E. of regression 0.042475 Akaike info criterion -3.382112
Sum squared resid 0.046907 Schwarz criterion -3.240667
Log likelihood 52.04062 Hannan-Quinn criter. -3.337813
F-statistic 1698.297 Durbin-Watson stat 0.373183
Prob(F-statistic) 0.000000


b) Se sospecha que hay multicolinealidad en los datos?
Instrucciones: cor log(importaciones) log(pnb) log(ipc)
LOG(IMPOR.) LOG(PNB) LOG(IPC)


LOG(IMPORTACIONES) 1.000000 0.996105 0.988850
LOG(PNB) 0.996105 1.000000 0.990909
LOG(IPC) 0.988850 0.990909 1.000000



Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


62
c) Efecte las siguientes regresiones:
-
1 2
lnIm ln
t t
portaciones A A PNB = +
-
1 2
lnIm ln
t t
portaciones B B IPC = +
-
1 2
ln ln
t t
PNB C C IPC = +
Con base a estas regresiones, Qu se puede decir sobre la naturaleza de la
multicolinealidad en la informacin?

Escribimos en la lnea de comandos las ecuaciones pedidas:

Primero estimamos:
1 2
lnIm ln
t t
portaciones A A PNB = +

Instrucciones: equation eq02.ls log(importaciones) c log(pnb)


Dependent Variable: LOG(IMPORTACIONES)
Method: Least Squares
Sample: 1970 1998
Included observations: 29


Variable Coefficient Std. Error t-Statistic Prob.


C -1.272765 0.098818 -12.87989 0.0000
LOG(PNB) 0.709327 0.012084 58.69726 0.0000


R-squared 0.992224 Mean dependent var 4.509338
Adjusted R-squared 0.991936 S.D. dependent var 0.469603
S.E. of regression 0.042169 Akaike info criterion -3.427775
Sum squared resid 0.048013 Schwarz criterion -3.333479
Log likelihood 51.70274 Hannan-Quinn criter. -3.398242
F-statistic 3445.368 Durbin-Watson stat 0.349582
Prob(F-statistic) 0.000000



Segunda estimacin:
1 2
lnIm ln
t t
portaciones B B IPC = +


Instrucciones: equation eq03.ls log(importaciones) c log(pnb)

Dependent Variable: LOG(IMPORTACIONES)
Method: Least Squares
Sample: 1970 1998
Included observations: 29


Variable Coefficient Std. Error t-Statistic Prob.


C -1.272765 0.098818 -12.87989 0.0000
LOG(PNB) 0.709327 0.012084 58.69726 0.0000


R-squared 0.992224 Mean dependent var 4.509338
Adjusted R-squared 0.991936 S.D. dependent var 0.469603
S.E. of regression 0.042169 Akaike info criterion -3.427775
Sum squared resid 0.048013 Schwarz criterion -3.333479
Log likelihood 51.70274 Hannan-Quinn criter. -3.398242
F-statistic 3445.368 Durbin-Watson stat 0.349582
Prob(F-statistic) 0.000000


Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


63
Tercera estimacin:
1 2
ln ln
t t
PNB C C IPC = +

Instrucciones: equation eq04.ls log(pnb) c log(ipc)


Dependent Variable: LOG(PNB)
Method: Least Squares
Date: 10/23/10 Time: 06:13
Sample: 1970 1998
Included observations: 29


Variable Coefficient Std. Error t-Statistic Prob.


C -0.868888 0.236283 -3.677319 0.0010
LOG(IPC) 0.722184 0.018869 38.27295 0.0000


R-squared 0.981901 Mean dependent var 8.151539
Adjusted R-squared 0.981231 S.D. dependent var 0.659461
S.E. of regression 0.090346 Akaike info criterion -1.903862
Sum squared resid 0.220386 Schwarz criterion -1.809565
Log likelihood 29.60599 Hannan-Quinn criter. -1.874329
F-statistic 1464.819 Durbin-Watson stat 0.426461
Prob(F-statistic) 0.000000



Ejercicio 2. Se dispone alguna informacin sobre ingresos de exportacin (inex), el consumo (cons),
los gastos de personal (gper) y los gastos de explotacin (gex) relativos al sector de metalurgia y
fabricacin de productos metalicos para algunos departamentos del Per.

obs Departamentos INEX CONS GPER GEX
1 Arequipa 302565 180236 51189 274346
2 Piura 107689 51850 27642 100310
3 Chiclayo 348540 165985 75735 330602
4 Trujillo 14619 7991 3813 13253
5 Iquitos 17812 8693 5356 16000
6 Huancavelica 117007 59046 30838 115951
7 Huanuco 134899 75042 30844 126969
8 La Libertad 74856 43100 17484 70744
9 Lima 761142 389019 193713 708598
10 Ayacucho 241131 118762 60946 225651
11 Junin 14817 7806 4242 13773
12 Lambayeque 186509 92236 43276 176606
13 Cusco 337445 194993 82411 323954
14 Ica 64181 36941 12675 59007
15 Amazonas 170364 102965 38456 168279
16 Cajamarca 1051196 568539 254043 1037175
17 Puno 50517 28624 10255 46462

El objetivo de este ejercicio es el anlisis de la presencia de colinealidad en un modelo economtrico
cuya especificacin es la siguiente:

Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


64
1 2 3 4 i i i i i
inex cons gper gex u | | | | = + + + +
La utilizacin de estos regresores puede indicar, a priori, la presencia de colinealidad en el modelo.
Este problema se detectara por distintas vas alternativas y finalmente se propondr una solucin
para su correccin.

Solucin. Primero abrimos el workfile llamado mc1.wf1 , ahora procedemos a estimar el modelo
especificado anteriormente:
Instrucciones: Quick/ estimate equation/ inex c cons gper gex

Dependent Variable: INEX
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C 3729.609 3240.869 1.150805 0.2705
CONS 0.392848 0.276641 1.420067 0.1791
GPER 0.663397 0.415687 1.595907 0.1345
GEX 0.648393 0.218018 2.974033 0.0108


R-squared 0.998971 Mean dependent var 235017.0
Adjusted R-squared 0.998734 S.D. dependent var 279592.1
S.E. of regression 9949.564 Akaike info criterion 21.45077
Sum squared resid 1.29E+09 Schwarz criterion 21.64682
Log likelihood -178.3315 F-statistic 4207.203
Durbin-Watson stat 1.589402 Prob(F-statistic) 0.000000



Deteccin de la colinealidad
a) Significancia global y significacin individual de los regresores
En primer lugar, puede observarse que se trata de un modelo globalmente bien estimado. El
estadstico F nos indica que las variables conjuntamente son significativas. Por otra parte, el valor del
coeficiente de determinacin R
2
es elevado (0.998971) y al analizar la significacin individual de las
variables explicativas se puede comprobar que las variables cons y gper no son significativas en la
explicacin de los ingresos de explotacin. Cuando estas dos caractersticas se presentan de forma
simultnea (R
2
y variables no significativas individualmente), como ocurre en este caso, puede
sospecharse acerca de la presencia de colinealidad en el modelo.
b) Anlisis de la matriz de correlaciones de los regresores
A partir de la matriz de corrrelaciones de los regresores (R
xx
) puede profundizarse en el proceso de
deteccin de multicolinealidad en el modelo. Si los regresores fueran ortogonales, esto es, en
ausencia de colinealidad, el determinante de esta matriz tomara el valor de 1. A continuacin se
realizar la matriz de correlaciones entre las variables explicativas que se han usado en la estimacin:
Instrucciones: En la lnea de comandos escribir - cor cons gper gex
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


65

CONS GPER GEX


CONS 1.000000 0.990380 0.997769
GPER 0.990380 1.000000 0.995341
GEX 0.997769 0.995341 1.000000

De la matriz anterior se puede calcular su determinante: 0.000033924
xx
R = . El valor que toma el
determinante es muy prximo a cero, lo que tambin es indicativo de la posible existencia de
colinealidad en el modelo. Adems, en la matriz de correlaciones se refleja una fuera correlacin
entre las variables que han considerado en el modelo.

c) Factor de inflacin de la varianza

Para desarrollar esta metodologa se requiere, previamente, realizar ciertas regresiones auxiliares, en
concreto, se considera cada uno de los regresores como funcin de los dems. De cada una de estas
regresiones se necesita el valor de R
2
y, a partir de ellos, pueden calcularse los aumentos de las
varianzas causadas por la multicolinealidad midiendo el factor de inflacin de la varianza, segn la
siguiente expresin:
2 2 2
1 / 1 /
j bORT bi
R = o o
Estimacin de la primera regresin auxiliar:
Instrucciones: Quick/estimate equation/ cons c gper gpex

Dependent Variable: CONS
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C 2079.209 3081.281 0.674787 0.5108
GPER -0.639877 0.363360 -1.760998 0.1001
GEX 0.709049 0.091938 7.712272 0.0000


R-squared 0.996352 Mean dependent var 125401.6
Adjusted R-squared 0.995831 S.D. dependent var 148861.9
S.E. of regression 9612.225 Akaike info criterion 21.33824
Sum squared resid 1.29E+09 Schwarz criterion 21.48528
Log likelihood -178.3751 F-statistic 1911.709
Durbin-Watson stat 1.937222 Prob(F-statistic) 0.000000



Puede calcular el factor de inflacin de la varianza (FIV) ejecutando en la lnea de comandos la
siguiente operacin:
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


66
=1/(1-0.996352)= 274.122807018
Estimacin de la segunda regresin auxiliar:
Instrucciones: Quick/estimate equation/ gper c cons gex
Dependent Variable: GPER
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C -182.0407 2083.114 -0.087389 0.9316
CONS -0.283398 0.160930 -1.760998 0.1001
GEX 0.407116 0.088371 4.606894 0.0004


R-squared 0.992389 Mean dependent var 55465.76
Adjusted R-squared 0.991302 S.D. dependent var 68591.10
S.E. of regression 6396.967 Akaike info criterion 20.52382
Sum squared resid 5.73E+08 Schwarz criterion 20.67086
Log likelihood -171.4525 F-statistic 912.7659
Durbin-Watson stat 1.812016 Prob(F-statistic) 0.000000



Calculo del factor de inflacin:
=1/(1-0.992389)=131.388779398
Estimacin de la tercera regresin auxiliar:
Instrucciones: Quick/estimate equation/ gex c cons gper

Dependent Variable: GEX
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C -1270.813 3958.333 -0.321048 0.7529
CONS 1.141627 0.148027 7.712272 0.0000
GPER 1.480014 0.321261 4.606894 0.0004


R-squared 0.998229 Mean dependent var 223981.2
Adjusted R-squared 0.997976 S.D. dependent var 271088.6
S.E. of regression 12196.85 Akaike info criterion 21.81453
Sum squared resid 2.08E+09 Schwarz criterion 21.96157
Log likelihood -182.4235 F-statistic 3945.000
Durbin-Watson stat 2.131833 Prob(F-statistic) 0.000000



Calculo del factor de inflacin:
=1/(1-0.998229)=564.652738566
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


67
Los factores multiplicativos alcanzan valores elevados en los tres casos, por lo que puede
considerarse que la varianza de los coeficientes del modelo original se encuentra muy inflada, por lo
que se toman como no significativos regresores que si podran serlo. Como los valores que toman
estos coeficientes de determinacin son inferiores, pero muy prximos al de la regresin inicial
(0.998971), puede considerarse que, aunque no a un nivel preocupante, si existe colinealidad entre
los regresores del modelo.

d) Correccin de la colinealidad
Aceptada la presencia de colinealidad en el modelo se plantea ahora su correccin. Para ello se
procede a estimar nuevamente el modelo especificado inicialmente corrigiendo el problema que se
ha detectado mediante la divisin de todas las variables entre la variable peroc. Esta variable, que se
encuentra en el workfile de datos, incluye informacin relativa de las personas ocupadas en el sector
de actividad econmica considerado para los 17 departamentos mostrados. Se ha elegido esta
variable por que constituye un factor de escala de todas las incluidas en el modelo y su divisin por
dicho factor de escala puede representar la solucin de multicolinealidad que presenta el modelo.
Para obtener las variables corregidas basta dividirla entre peroc utilizando la sentencia
correspondiente a la generacin de variables. En este caso estas variables transformadas se
nombraran aadiendo una c a su nombre original. Instrucciones:
Genr/ inexc=inex/peroc
Genr/ consc=cons/peroc
Genr/gperc=gper/peroc
Genr/gexc=gex/peroc
El modelo transformado puede ser estimador siguiendo las siguientes instrucciones:
Instrucciones: Quick/estimate equation/ inex c consc gperc gexc
Dependent Variable: INEXC
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C 1.466301 0.280286 5.231453 0.0002
CONSC -0.257027 0.142161 -1.808005 0.0938
GPERC -1.220936 0.321050 -3.802943 0.0022
GEXC 1.379961 0.132546 10.41122 0.0000


R-squared 0.997072 Mean dependent var 12.37447
Adjusted R-squared 0.996397 S.D. dependent var 4.029936
S.E. of regression 0.241909 Akaike info criterion 0.201812
Sum squared resid 0.760758 Schwarz criterion 0.397863
Curso: Econometra I Jorge Alarcn Novoa y Jos Luis Nolazco Cama


68
Log likelihood 2.284594 F-statistic 1475.769
Durbin-Watson stat 2.149958 Prob(F-statistic) 0.000000


La estimacin obtenida muestra un modelo globalmente significativo, con un coeficiente de
determinacin elevado, pero el regresor consc no resulta ser significativo individualmente. Por ello
es aconsejable suprimir esta variable del modelo y realizar una nueva estimacin:
Instrucciones: Quick/estimate equation/ inex c gperc gexc

Dependent Variable: INEXC
Method: Least Squares
Sample: 1 17
Included observations: 17


Variable Coefficient Std. Error t-Statistic Prob.


C 1.154356 0.238115 4.847894 0.0003
GPERC -0.795770 0.235620 -3.377348 0.0045
GEXC 1.155360 0.049824 23.18861 0.0000


R-squared 0.996336 Mean dependent var 12.37447
Adjusted R-squared 0.995813 S.D. dependent var 4.029936
S.E. of regression 0.260775 Akaike info criterion 0.308470
Sum squared resid 0.952053 Schwarz criterion 0.455508
Log likelihood 0.378003 F-statistic 1903.527
Durbin-Watson stat 1.713325 Prob(F-statistic) 0.000000



En esta estimacin puede apreciarse que el coeficiente R
2
sigue alcanzando un nivel elevado,
prcticamente el mismo que en el modelo inicial, los regresores son conjuntamente significativos e
individualmente tambin. Puede considerarse entonces que este modelo transformado es adecuado
para explicar los ingresos de explotacin, que en este caso se realiza corrigiendo por las personas
ocupadas.

También podría gustarte