Está en la página 1de 41

APUNTES DE CLASE

FUNDAMENTOS DE ECONOMETRIA
ELABORADO POR:
NANCY MEDINA CARRANCO

2000

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
INTRODUCCION
Actualmente la Econometra es una herramienta de anlisis muy importante, inclusive
para leer y entender la nueva teora econmica. Esta aplica mtodos estadsticos y
matemticos al anlisis de variables econmicas y, sobre todo, a la relacin de
dependencia que puede existir entre las mismas.
El objetivo ltimo de este instrumento de investigacin es estimar modelos que
permitan captar el comportamiento de los individuos, fenmenos econmicos o
sociales, etc., a fin de predecir y hacer simulaciones sobre los mismos para establecer
polticas econmicas adecuadas, a nivel macroeconmico, polticas respecto a la
empresa, a nivel microecnmico, proyecciones, etc..
Por ejemplo, contribuira a establecer cul debera ser el precio mnimo o volumen de
produccin mnimo de una empresa, para lo cual se tomaran datos de las principales
variables que determinan el comportamiento de la demanda del bien que se generara
con el proyecto, para luego definir un flujo de beneficios, sobre el que se hara un
anlisis de sensibilidad y/o riesgo.
Si se desea inferir la valoracin de un recurso natural que no tiene precio, se podra
modelar el comportamiento de los individuos respecto a sus preferencias, de tal forma
que despus de hacer las manipulaciones matemticas necesarias se llegue a un
resultado del cambio en el bienestar de la poblacin afectada en trminos monetarios,
utilizando para ellos aproximaciones como la variacin compensada, la variacin
equivalente, el excedente del consumidor, etc..
En la evaluacin y formulacin de proyectos se puede utilizar a la econometra para
proyectar la oferta y la demanda del bien que se generara con los mismos. Para el
efecto, se estiman las funciones pertinentes utilizando las variables relevantes que
explican su comportamiento, una vez estimada se realizan las predicciones directamente
o travs de tasas de crecimiento calculadas con base en las elasticidades (modelo
doblemente logartmico) y variaciones porcentuales de las variables que convenga.
En economa agrcola si se trata de proyectar la produccin o encontrar el ptimo fsico
y econmico es fundamental estimar funciones de produccin y de costos, basadas en
datos de produccin e insumos (mano de obra, tierra, capital, etc.), que permitiran
plantear en trminos prcticos el problema del productor: la maximizacin de
beneficios.
En realidad, sera interminable citar ejemplos donde se puede utilizar a la econometra
como herramienta de anlisis bsico.
El propsito fundamental del anlisis economtrico es hacer inferencias de una muestra
hacia la poblacin, esto es generalizar resultados. Para el efecto se requiere que el
modelo estimado sea vlido, es decir que cumpla con los supuestos y est acorde con la
teora econmica, por lo que una vez obtenidas las estimaciones se hacen pruebas de
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

diagnstico. Si los signos y magnitud de los parmetros estimados no estn acordes con
la teora es necesario analizar el origen de estos resultados para corregir los posibles
errores cometidos, para reformular o refutar una teora, si sta no se puede aplicar a
nuestra realidad.

Concepto y Objetivos de la Econometra


Existen diversos conceptos de econometra, a manera de ejemplo citaremos dos que
recogen los elementos fundamentales de esta ciencia:
Gerhard Tinter dice que, la econometra es el resultado de la adopcin de una posicin
sobre el papel que juega la economa, consiste en la aplicacin de la estadstica
matemtica a los datos econmicos con el objeto de proporcionar no solo un apoyo
emprico a los modelos construidos por la economa matemtica, sino una forma de
obtener resultados numricos.
P. A. Samuelson define a la econometra como el anlisis cuantitativo de los fenmenos
econmicos reales basados en el desarrollo simultneo de la observacin y la teora,
relacionados a travs de apropiados mtodos de inferencia.
Tratando de construir una definicin que considere algunos criterios de diferentes
autores diramos que la econometra es parte de los mtodos cuantitativos de la
economa, combina mtodos matemticos y estadsticos en la estimacin de un modelo,
el cual se ha establecido con base en la teora econmica que indica la relacin de
dependencia entre variables y debe ser validado utilizando a la inferencia estadstica
(pruebas de hiptesis) y contrastndolo con el enunciado de la teora que se ha utilizado.
Se puede decir que la econometra, por lo tanto, se resumen en cinco etapas:
especificacin, estimacin, verificacin prediccin y recomendaciones de poltica.
El objetivo de la econometra es verificar y establecer la relacin de dependencia entre
una variable dependiente y una o ms variables independientes, a fin de obtener una
funcin que permita realizar predicciones, formulacin de polticas y simulaciones.

Metodologa
Para explicar la metodologa utilizada por la econometra es necesario primero definir lo
que es un modelo.
Un modelo es una representacin simplificada de un fenmeno econmico o de la
realidad a travs de una(s) funcin(es) o ecuacin(es). Cuando decimos que la
produccin de un bien depende del costo de los insumos, estamos resumiendo el
fenmeno de la produccin para un determinado bien.
Explicitando los pasos que debe seguir un anlisis economtrico se citara los
siguientes puntos:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

1.

Consultar, en lo posible, toda la teora existente con respecto al fenmeno que se


desea analizar. Esto permite definir las variables (dependiente e independiente(s)) y
su comportamiento en la explicacin de un fenmeno, dando cuenta de la relacin
funcional.

2.

Con los resultados del paso anterior definimos una relacin determinstica entre
variables, esto significa que establecemos que los cambios en una de ellas se
atribuyen o estn explicados por modificaciones en una o ms variables, sin dejar
margen para un error. Es decir:
Y = f (Xi)

(i = 1, 2, 3 ... n)

3.

Con esta relacin definimos la forma funcional que tendra. Para el efecto, se
utilizan varios mtodos como el diagrama de dispersin, en el caso de un modelo
que tiene una sola variable dependiente, o simplemente ensayamos diferentes
formas funcionales (cuadrtica, cbica, logartmica, etc.) y verificamos cual es la
que mejor se ajusta a los datos; por supuesto que la teora tambin sugiere formas
funcionales, por ejemplo los rendimientos marginales decrecientes expresan que
una funcin de produccin no sera lineal. Si, para el ejemplo, la forma funcional
adecuada es una lineal tendramos:
Y = 0 + 1 X

4.

El modelo anterior es matemtico o determinstico y hay que convertirlo a


economtrico, para lo cual lo nico que se debe hacer es agregarle el trmino de
error, perturbacin aleatoria o canasta aleatoria. Esto se debe a que,
generalmente, cuando trabajamos con variables econmicas y sociales siempre hay
riesgo de cometer errores de medicin; por otro lado, algunas variables son difciles
de cuantificar, o simplemente porque dada la definicin misma de modelo y de su
caracterstica de que ste debe ser parsimonioso, no se incluyen todas las variables;
a lo cual adicionaramos los posibles errores en la forma funcional. El primer
aspecto se evidencia cuando preguntamos, por ejemplo, cul es el ingreso mensual
de una persona, sta nunca nos contesta con la verdad, hay tendencia a sobre o
subestimar.
Es esta la razn para decir que es una canasta aleatoria, porque contiene a todos
los errores que fuere posible cometer. La aleatoriedad se debe a que hay la
probabilidad y no la certeza de cometer una margen de error determinado; y, de que
sus resultados no siempre se cumplan. En el ejemplo, el modelo economtrico
quedara expresado como:
Y = 0 + 1 X +

5.

Con este modelo nos servimos de procedimientos matemticos y estadsticos para


la estimacin, los que se concretan en mtodos bsicos como: Mnimos Cuadrados
Ordinarios (MCO), Mxima Verosimilitud (MV), Momentos, etc., los mismos que
sern explicados posteriormente.

6.

Una vez estimado el modelo procedemos a validarlo contrastndolo con la teora


econmica para verificar si resultaron los signos esperados y las magnitudes

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

previstas; adicionalmente verificamos si se cumplen o no los supuestos, que se


resumen en la normalidad de los errores. Si una de las dos cosas falla significa que
hubo algn error en la estimacin y tenemos que volver a reiniciar todo el proceso
hasta obtener un modelo adecuado a la realidad.
7.

Con el modelo validado procedemos a aplicarlo, ya sea para predicciones o


formulacin de poltica econmica, bsicamente.

Cabe anotar que, los elementos de un modelo son: las ecuaciones, las variables y los
parmetros.
Las ecuaciones relacionan variables y pueden ser:
- de comportamiento, cuando reflejan la conducta de diferentes agentes;
- de definicin, reflejan identidades contables;
- tecnolgicas, como las funciones de produccin que expresan una tcnica para
producir;
- institucionales, reflejan la voluntad poltica de los agentes rectores de una economa
(impuestos, oferta monetaria, etc.); y,
- de equilibro, por ejemplo las de oferta y demanda en un sistema de ecuaciones,
donde no habra solucin sin stas.
Las variables son aquellas que cambian de valor en diferentes observaciones. En un
modelo stas pueden ser:
- endgenas, que se determinan dentro de un modelo. Generalmente, las conocemos
como dependientes; y,
- exgenas, que se determinan fuera del modelo. Se las conoce como independientes o
explicativas.
Los parmetros son valores fijos. En un modelo son los coeficientes que estn ligados
con la(s) variable(s) independiente(s) y son los que precisamente se trata de encontrar a
travs de su estimacin.
Los modelos pueden ser de diferente tipo, entre los cuales tenemos:
- Uniecuacionales, cuando existe una sola ecuacin;
- Multiecuacionales, cuando tenemos ms de una ecuacin (modelos de ecuaciones
simultneas);
- Dinmicos, cuando se incluye la variable tiempo; y,
- Estticos, cuando se utilizan para explicar un fenmeno en un determinado momento
del tiempo.
El proceso para el anlisis economtrico se resume en el siguiente diagrama de flujo:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

TEORIA ECONOMIA
Revisin, anlisis y definiciones

MODELO MATEMATICO
Determinstico

DATOS

MODELO ECONOMETRICO
Probabilstico

ESTIMACION DEL MODELO


Mtodos matemticos y estadsticos

VALIDACION DEL MODELO


Viola los supuestos?
Est acorde con la teora?
(signos y valores esperados)

ES ADECUADO?

NO

SI
PREDICCIONES, PROYECCIONES
FORMULACION DE POLITICAS
PRUEBAS DE HIPOTESIS
Aplicaciones de la teora a la realidad

Inferencia Estadstica
Para hacer investigacin es necesario familiarizarse con mtodos cuantitativos que
permitan hacerla ms efectiva.
La estadstica comprende dos ramas fundamentales: la Estadstica Descriptiva y la
Inferencia Estadstica. La primera se ocupa de la recopilacin, organizacin y
presentacin de los datos. La segunda trata del desarrollo de los mtodos de la teora
estadstica (aplicacin), a fin de hacer generalizaciones de una parte (muestra) a un todo
(poblacin).

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

La econometra utiliza a la inferencia estadstica. La estadstica descriptiva le interesa


solo en la medida que ciertos resultados (estadsticos)
resumen diferentes
caractersticas de los datos (media, desviacin estndar).
La diferencia entre estadstica descriptiva e inferencia consiste en que, en el mbito de
la primera los resultados obtenidos con los datos son un fin en s mismo, mientras que
en la segunda son solo un instrumento de anlisis.
Conceptos bsicos
Poblacin.- se define como el conjunto de todas las observaciones (datos) posibles,
medidas o resultados.
Muestra.- conjunto de datos, medidas o resultados seleccionados a partir de la muestra.
Generalmente, en econometra para la estimacin de modelos utilizamos muestras
obtenidas de acuerdo a algn mecanismo causal determinado, que se denomina
probabilstico.
Tanto las muestras como las poblaciones se describen a travs de sus caractersticas
numricas, que en el caso de una poblacin se denominaran parmetros y en el de una
muestra estadsticos (medidas resumen).
Dado que la estadstica se interesa por los fenmenos que pueden ser medidos o
contados es necesario conocer lo que es una variable y un atributo.
Variable.- es aquella que toma diferentes valores en distintas observaciones.
Atributo.- cuando el fenmeno no puede medirse pero si contarse. Un atributo es la
presencia o ausencia de una caracterstica determinada. Por ejemplo: sexo (masculino o
femenino), educacin (primaria, secundaria, superior), etc.
Constante.- como su nombre lo indica es aquella que no cambia de valor de una
observacin a otra.
Variable estocstica o aleatoria.- sus valores no pueden ser determinados antes de ser
observados, ni controlados totalmente. Se caracterizan por tomar diferentes valores con
probabilidades diferentes a la unidad.
Variable no aleatoria.- la que es totalmente controlable o al menos se puede predecir
totalmente.
Variable continua.- es aquella que toma cualquier valor sobre la recta numrica. Ej:
tiempo, ingreso, temperatura, gasto, etc.
Variable discreta.- toman solo ciertos valores de la recta numrica, los mismos que
estn separados por intervalos de igual longitud. Ej: nmero de hijos, nmero de puntos
obtenidos al lanzar un dado, etc.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

Distribucin de frecuencias (muestra) y de probabilidades (poblacin).- es la


ordenacin de datos de tal forma que se indique el nmero de observaciones
correspondientes a cada valor de la variable (discreta) o de cada intervalo de valores de
la variable (continua).
Naturaleza de la Inferencia Estadstica
La inferencia se dedica a efectuar generalizaciones respecto a una poblacin, con base
en la informacin proporcionada por la muestra.
Lo que hace a la aplicacin de la inferencia un mtodo cientfico es el hecho de que se
toma en consideracin la seleccin de la muestra y que expresa los resultados en
trminos de probabilidades.
El objetivo del muestreo y de todo lo relacionado con la inferencia es efectuar juicios
acerca de los parmetros de la poblacin, basados en los estadsticos de la muestra.
Los juicios son pronsticos dotados de cierto grado de confianza y pueden ser de dos
tipos:
1.

Se refiere a la estimacin de un parmetro, es decir estimadores (informacin


resumida) que nos son ms que frmulas que describen un procedimiento para
efectuar conjeturas acerca del valor de un determinado parmetro.

2.

Se refiere a la contrastacin de una hiptesis respecto a un parmetro. Esto implica


un supuesto previo respecto al valor del parmetro, para lo cual utilizamos un
estadstico de prueba.
Distribuciones Muestrales

La forma de saber en que medida se puede confiar en un pronstico es conocer la


conducta de la variable de anlisis en todas las muestras posibles. Pues, se supone que
existe un proceso desconocido que genera los datos, el cual se describe por medio de
una distribucin de probabilidades, que se caracteriza por algunos parmetros
desconocidos.
Estimador Perfecto
Es aquel que no tiene posibilidad de error. En otras palabras, su distribucin muestral se
concentra en un solo punto y ste coincide con el valor que se estima. Pero estos son
infrecuentes dadas las caractersticas de las mediciones o datos.
Sin embargo, para que los estimadores sean al menos buenos debe tener ciertas
propiedades deseables:
Insesgado.- es cuando la distribucin muestral tiene una media que es igual al parmetro
estimado, pues proporciona el resultado perfecto en promedio.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

Eficiente.- se refiere a la distancia entre los valores estimados y el promedio de la


distribucin, es decir al grado de dispersin entre los estimadores y el promedio que no
es ms que deben tener la varianza mnima.
Consistentes.- referido a que a medida que se aumenta el tamao de la muestra la
distribucin tiende a concentrarse ms alrededor del promedio.

Comentarios Finales
La econometra se puede utilizar en el estudio y anlisis de una variedad de fenmenos
econmicos, sociales, polticos, etc., lo cual demuestra la importancia que tiene el
manejo de este instrumento para, en particular, un economista.
Se puede observar que para que la econometra genere resultados vlidos es necesario
entrar en un proceso iterativo hasta llegar a un modelo adecuado a la realidad.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

CAPITULO I
ANALISIS DE CORRELACION
En este captulo estudiaremos un tipo de anlisis muy importante dentro del proceso de
estimacin de un modelo economtrico, el de correlacin.

1.1

Definicin e Interpretacin

El anlisis de correlacin busca medir o cuantificar el grado de asociacin lineal entre


variables continuas, sin tener en cuenta cual de las dos es la dependiente o
independiente. Este anlisis utiliza como herramienta bsica el coeficiente de
correlacin ( en trminos poblacionales y r en trminos muestrales), que se lo puede
interpretar por su signo y magnitud.
Por su magnitud.- el coeficiente de correlacin puede tomar valores entre ms 1 y
menos 1, es decir que el lmite mnimo es -1 y el lmite mximo es
+1. Obviamente, mientras ms se acerca a uno (valor absoluto)
existe un mayor grado de asociacin lineal entre variables y mientras
ms se acerca a cero es evidente que no existe este tipo de relacin.
Por su signo.-

como habamos mencionado el coeficiente de correlacin puede


tener valores positivos y negativos. Si el coeficiente tiene signo
negativo se puede decir que existe una relacin lineal inversa entre
las dos variables y si es positivo se dice que existe una relacin
lineal directa entre las variables.

Para calcularlo se utiliza la frmula:


n

r=

(X

X ) (Yi Y )

i =1

(X
i =1

X )2

(Y Y )

i =1

Donde nos damos claramente cuenta que es el numerador el que determina el sigo de r.

1.2

Caractersticas

El coeficiente de correlacin tiene las siguientes caractersticas:


1.
2.
3.
4.
5.

Sus valores estn entre -1 y +1;


Maneja a las variables simtricamente, esto es que considera tanto a X como Y
como aleatorias y no las diferencia entre dependiente e independiente;
Si su resultado fuera 0, significa que no existe relacin lineal alguna entre las
variables;
Si su resultado fuera 1, significa que existe una asociacin lineal perfecta entre las
dos variables; y,
Es la relacin entre la covarianza entre X e Y y las varianzas de X y de Y.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

10

Las principales Ventajas de este coeficiente es que es fcil de medir y de interpretar,


todos los paquetes estadsticos lo proporcionan y la escala no afecta al resultado. El
limitante es que solo mide la relacin lineal entre dos variables.

1.3

Aplicaciones

Este tipo de anlisis es muy importante para verificar si existe o no alguna relacin
lineal y si sta es positiva o negativa. Por ejemplo, si se desea ver si se cumple: la ley de
la demanda, interesa observa si existe una relacin inversa entre la cantidad demandada
y el precio; la ley de la oferta, se trata de ver si hay una relacin directa entre la
cantidad ofertada y el precio, etc.
Para el efecto, se deben hacer pruebas de hiptesis1 respecto al coeficiente de
correlacin poblacional, tanto en la nula como en la alterna, con un nivel de
significancia. El estadstico de prueba til en este caso es:
t=

r n 2
1 r2

tn 2

Este estadstico tiene una distribucin aproximadamente normal, en muestras pequeas


se distribuye con una t de student con n-2 grados de libertad, es decir que se debe
contrastar con el valor terico de esta distribucin, de acuerdo al nivel de significancia
seleccionado.
El proceso para hacer una prueba de hiptesis se puede describir en los siguientes
pasos:
1.

2.

2/
3/

Planteamos la hiptesis nula y la hiptesis alterna2 que, en este caso, se refiere a si


existe o no una la relacin lineal, o al verificacin de una relacin directa o inversa
entre dos variables. Es decir:
Ho: xy = 0
Ha: xy 0

(no 3 relacin o asociacin lineal entre las variables X y Y)


( relacin o asociacin lineal entre las variables X y Y)

Ho: xy 0
Ha: xy > 0

(no una relacin o asociacin lineal directa entre X y Y)


( una relacin o asociacin lineal directa entre las variables X y Y)

Ho: xy 0
Ha: xy < 0

(no una relacin o asociacin lineal inversa entre X y Y)


( una relacin o asociacin lineal inversa entre las variables X y Y)

Definimos un nivel de significancia4 () dependiendo del error tipo I que se prev


cometer. Generalmente, se utiliza el 5%, pero su valor es establecido por el
investigador.
Una hiptesis es un supuesto que se hace con respecto al verdadero valor poblacional.
Una prueba de hiptesis no es ms que la contrastacin del valor muestral con el poblacional, para
realizar inferencias con respecto al ltimo.
Para una definicin y discusin de estos conceptos vase el Apndice 1.1.
= existe

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

11

3.

Se evala el estadstico de prueba o valor calculado, el cual simplemente es una


frmula que incluye el parmetro sobre el que se est realizando la prueba de
hiptesis, en trminos muestrales (r), y que tiene la distribucin de probabilidades
que se presume tiene el parmetro poblacional. En este caso se supone que tiene
una distribucin aproximadamente normal, para muestras pequeas se asume una
distribucin t de student. La frmula pertinente es la que se present anteriormente.

4.

Buscamos el valor terico, o el que le corresponde en la distribucin de


probabilidades, en la tabla correspondiente (distribucin normal o t-student),
considerando los grados de libertad, en este caso 2 porque perdemos dos valores al
calcular las medias utilizadas para estimar r.

5.

Finalmente, contrastamos el valor calculado con el terico sobre un grfico de la


distribucin correspondiente, la cual se dividir en una regin crtica, o de rechazo
de la hiptesis nula, y en una regin de aceptacin de la misma.

Por ejemplo, en una empresa de comercializacin de enciclopedias el salario de sus


ejecutivos de ventas se relaciona directamente con el volumen de ventas logrado en un
perodo determinado. Se desea verificar esta proposicin para los siguientes datos
disponibles:
Salario (Y)
(cientos de dlares)
4
6
5
7
7

Ventas (X)
(nmero de enciclopedias)
30
30
40
50
60

1.

Ho: xy 0
Ha: xy > 0

2.

= 5%

3.

Calculamos el estadstico de prueba -> t calculado (tc)


tc=

(no una relacin o asociacin lineal directa entre X y Y)


( una relacin o asociacin lineal directa entre las variables X y Y)

r n2
1 r2

tn 2

Para el efecto, necesitamos el valor de r que lo obtenemos con la frmula:

4/

Para entender de mejor forma este concepto vase el Apndice 1.1.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

12

r=

(X

X ) (Yi Y )

i =1

( Xi X )2
i =1

(Y Y )

i =1

=>

Sumatorias()
Promedios

Y
X
Yi - Y Xi - X (Xi - X)(Yi -Y) (Yi -Y)2 (Xi -X)2
4
30
-1,8
-12
21,6
3,24
144
6
30
0,2
-12
-2,4
0,04
144
5
40
-0,8
-2
1,6
0,64
4
7
50
1,2
8
9,6
1,44
64
7
60
1,2
18
21,6
1,44
324
29
210
52
6,8
680
Y = 5.8 X = 42

Aplicando la frmula encontramos que r = 0,764705882.


Cmo se interpreta este valor?. Su signo es positivo por lo que se dira que existe una
relacin directa entre el salario percibido por un vendedor y el volumen de ventas que
logra el mismo. Por su magnitud, el grado de asociacin lineal entre las variables es del
76.5%, aproximadamente, que significa que existe asociacin lineal entre las variables.
Conocemos que n = 5 y = 0 ( es el valor de la hiptesis).
Calculamos tc:
t c=

4.

0.76471 5 2 0
1 (0.76471)

= 2.05548

tt (t terico) = t 5%, 5-2 gl (para una cola) = 2.353


Observemos que hemos puesto el valor terico de t con el 95% de confianza y 3
grados de libertad para una cola. 95% porque el nivel de significancia = 5% y el
de confianza es simplemente 1- . Una cola (y derecha) porque en la hiptesis
alterna decimos que el valor de el coeficiente de correlacin debe ser mayor que
cero para que se cumpla esta hiptesis.

5. Contrastamos el estadstico (tc) con el terico (tt), el ltimo valor es el que define
la regin crtica y la de aceptacin.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

13

R Ho

A Ho
0
2.055

2.353

Con esta contrastacin concluimos:


Como el tc est a la izquierda del tt, es decir en la regin de aceptacin de la
hiptesis nula (A Ho) (no existe una relacin directa entre salario y ventas), se
puede decir con el 95% de confiabilidad que no existe una relacin directa
(positiva) entre el salario y las ventas.
Cabe sealar que, cuando empezamos a plantear un modelo economtrico se debe
efectuar anlisis entre las variables para observar si existe o no relacin entre ellas, de
tal forma que la incorporacin de una variable en un modelo est sustentada. El
coeficiente de correlacin contribuye a definir la existencia o no de una asociacin
lineal entre dos variables de tipo continuo.
Cuando se trata de variables categricas, o de combinaciones entre categricas y
continuas se debe utilizar otro tipo de anlisis, tales como el de contingencia.
Por ejemplo, si disponemos de datos relativos al nmero de personas por estratos (bajo,
medio y alto), quienes a su vez estn divididas por el tipo de ingreso que perciben (bajo,
medio y alto), como se indica en la siguiente tabla.
TABLA DE DATOS
Estrato
Bajo
Medio
Alto
Total

Bajo
10
9
7

Ingresos
Medio
7
11
9

Total
Alto
6
12
15

26

27

33

23
32
31
86

As, la columna total significa que en el grupo donde se ha levantado la encuesta existen
23 personas de estrato bajo, 32 de medio y 31 de alto. De las 23 personas de estrato
bajo, 10 tienen ingreso bajos, 7 medio y 6 altos, dentro de su estrato, y as
sucesivamente. Se trata de establecer si existe alguna relacin entre el estrato y el nivel
de ingreso, para lo cual se debe calcular el estadstico de prueba Xc, debido a que tiene
una distribucin Chi-cuadrado, a travs de la frmula:

X c=
i

(Oi j e i j ) 2
ei j

Donde Oij es el valor observado y eij es el valor esperado, de la frecuencia.


Construimos una tabla de contingencia, como se presenta a continuacin:
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

14

Estrato
Bajo
Medio
Alto
Total

Bajo

Ingresos
Medio

Total
Alto

10 26*23/86 7 27*23/86 6 3*23/86


9 26*32/86 11 27*32/86 12 33*32/86
7 26*31/86 9 27*31/86 15 33*31/86
26
27
33

23
32
31
86

Donde, en cada celda se encuentra el valor observado (Oij), primer nmero, y el valor
esperado (eij), segunda expresin. A continuacin calculamos los eij en la siguiente
tabla:
Estrato
e1,j
e2,j
e3,j

ei,1
6,953
9,674
9,372

ei,2
7,221
10,047
9,733

ei,3
8,826
12,279
11,895

Por ltimo procedemos a calcular cada elemento de la frmula mencionada


anteriormente y Xc, como se observa en la siguiente tabla:
(O1,j-(e1,j))2
(O2,j-(e2,j))2
(O3,j-(e3,j))2
Xc

(Oi,1-(ei,1))2 (Oi,2-(ei,2))2 (Oi,3-(ei,3))2


1,33476
0,00676
0,90463
0,04701
0,09049
0,00634
0,60038
0,05514
0,81030
3,85583

Ahora realizamos la prueba de hiptesis:


1.

Ho: X 2= 0
Ha: X 2 0

2.

= 5%

3.

Calculamos el estadstico de prueba -> Xc

(no relacin entre estrato y nivel de ingreso)


( relacin entre estrato y nivel de ingreso)

Xc = 3,85583 X 2 (i-1)*(j-1) gl
4.

Xt (X terico) = X 5%, 4 gl (para una cola) = 9.48773


Observemos que hemos puesto el valor terico de X con el 95% de confianza y 4
grados de libertad, que se obtiene de (i-1)*(j-1) = (3-1)*(3-1)= 4.

5. Contrastamos el estadstico (Xc) con el terico (Xt), el ltimo valor es el que define
la regin crtica y la de aceptacin.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

15

f(X2)

A Ho

3.86

R Ho

9.488

X2

Con esta contrastacin concluimos:


Como el Xc est a la izquierda del Xt, es decir en la regin de aceptacin de la
hiptesis nula (no existe relacin entre el nivel de ingresos y el estrato), se puede
decir con el 95% de confiabilidad que no existe relacin entre el nivel de ingreso y
el estrato.
Observemos que la Chi-cuadrado (X2) tiene una forma diferente a la distribucin t y
normal, pues relaciona un cuadrado con otro nmero, por lo que nunca puede ser
negativa y no es simtrica.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

16

CAPITULO II
ANALISIS DE REGRESION
En este captulo estudiaremos el anlisis de regresin como base fundamental para la
formulacin de un modelo.

1.1

Anlisis de correlacin versus anlisis de regresin

El anlisis de regresin se utiliza para establecer una relacin de dependencia o


funcional, lo cual requiere la definicin de una funcin. Es decir que, mientras el
anlisis de correlacin mide el grado de asociacin lineal, el anlisis de regresin va
ms all, busca definir la relacin de dependencia de una variable con otra(s).
Por otro lado, en tanto que el anlisis de correlacin maneja a las variables
simtricamente (las dos son aleatorias), el de regresin lo hace asimtricamente, lo cual
es uno de los supuestos bsicos de un modelo, es decir supone que la variable
dependiente es aleatoria y la(s) independiente(s) no aleatoria(s) o dada(s), fija(s) o
predeterminada(s). Se observa que este anlisis diferencia cul es la variable
dependiente y cul es la independiente.
Con el anlisis de regresin ya nos introducimos en el mundo de los modelos
economtricos.
Histricamente el concepto de regresin se lo atribuye a Galton, quien observ que la
estatura de los hijos de padres altos era baja y que la de hijos de padres bajos era alta,
pero que en promedio se tenda a un valor determinado o promedio.
En el anlisis de regresin estimamos el valor medio de la variable dependiente con
base en valores fijos de la variable(s) independiente(s), es decir que se puede decir
que la funcin de regresin es la unin de las medias condicionales dado un valor
determinado de la variable independiente.
Grfico No. 1
E(Y\X) = f(X)

Ingreso (Y)

E(Y\X=500000

150000

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

500000

Consumo (X)

20

En el Grfico No. 2 observamos una regresin lineal simple. La linealidad puede estar
dada desde el punto de vista de los parmetros y de las variables. En este documento
vamos a trabajar siempre con la linealidad en los parmetros.

1.2

Funcin de regresin lineal poblacional (FRP) y muestral (FRM)

Grficamente:
Grfico No. 2
Y

Y = 0 + 1X (FRP)

x
x

Y= 0 + 1X (FRM)

x
x

x1

x2

x3

Observamos que a cada valor de X le corresponde un valor promedio de Y. La lnea


Y=0 + 1X se conoce como lnea o funcin de regresin poblacional (FRP), que no es
ms que la unin de los valores promedios de Y o de las esperanzas1 condicionales2 de
Y dado un Xi, con base en los valores poblacionales observados. Es decir, es el valor
medio que toma Y dado un valor para X, que en trminos matemticos se representa
como:
E(Y/Xi)= 0 + 1X
Pero como las estimaciones se realizan con base en muestras y no poblaciones, lo que
vamos a obtener es una funcin de regresin muestral (FRM). Esto debido a que,
generalmente, no se cuenta con los datos poblacionales: para las series de tiempo
muchas veces se dispone de una datos limitados en el tiempo; para series de corte
transversal, ya sea por costos o tiempo, tampoco se dispone de todas las observaciones
correspondientes a la poblacin.
Generalmente, cuando se trata de tomar datos directamente se hace un muestreo que
puede ser aleatorio, estratificado, etc., debido a que el tiempo, as como los recursos,
para el levantamiento de una encuesta son limitados. Es ms, dependiendo del tipo de
clculo que se utilice para determinar el tamao de la muestra, con anticipacin nos
fijamos un nivel de error y de confiabilidad.
Actualmente, se define a la regresin simple como el establecimiento de una relacin
funcional entre la variable independiente y la(s) dependiente(s).

2/

El valor esperado de una variable no es ms que un promedio ponderado, donde las ponderaciones
corresponden a las probabilidades de que tome determinados valores.
La esperanza condicional es el valor promedio condicionado a una determinada probabilidad.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

21

La importancia de este tipo de anlisis se observa en las aplicaciones de sus resultados,


que como hemos mencionado hacen posible realizar simulaciones, formulacin de
polticas y predicciones, entre las principales.
Ahora que, al predecir con la FRP cometemos un error i, que es la diferencia o
distancia existente entre el valor medio poblacional estimado para Y y el valor
observado para la misma variable. En este sentido, se puede decir que un modelo de
regresin simple es una relacin funcional entre una variable independiente y una
dependiente, quedara expresado como:
E(Yi/Xi) = 0 + 1 Xi + i
En tanto que, si predecimos con la FRM cometemos un error ei, que es un estimado
considerado como la distancia existente entre la FRM y la FRP, es decir:
E(Yi/Xi) = 0 + 1 Xi + ei
Entonces, tendramos:
Valores estimados
de la muestra
FRM
0
1
ei
Yi

Valores
poblacionales
FRP
0
1
ui
E(Yi\Xi)

Caractersticas de la lnea de regresin


1.
2.
3.

1.3

Pasa por los puntos formados por las observaciones de X y los valores promedio
condicionales de Y ( X ,Y);
La media de los valores estimados es igual a la media de los valores observados
Y=Y; y,
La sumatoria de los errores estimados es igual a cero ei = 0

Mtodo de estimacin de la FRM

Una vez definida la funcin se procede a estimar el modelo. Para el efecto existen
diferentes mtodos, entre los cuales el ms conocido y el que utilizaremos en los
primeros captulos es el de Mnimos Cuadrados Ordinarios (MCO).
Como observamos en el Grfico No. 2, el valor promedio de Y no corresponde
exactamente al valor poblacional, existe un margen de error (i); por otro lado, hay
diferencia entre la FRP y FRM, la cual es la que estimamos. Lo que intenta este mtodo
es justamente minimizar el error (distancia) entre las dos funciones. Puesto que:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

22

Y = 0 + 1 Xi + ei
ei = Y - (0 + 1 Xi)

=>

Ahora que sera intil minimizar la sumatoria de los errores, pues en promedio sabemos
que ste es igual a cero. Pero si tiene sentido minimizar la sumatoria de los errores al
cuadrado, esto es:
n

i =1

i =1

min ei = [Y ( 0 + 1 X i )] 2
Aplicando el concepto de optimizacin, es decir intentamos encontrar el valor ptimo
de los i para minimizar la sumatoria de los errores al cuadrado. Para el efecto,
aplicamos conocimientos de clculo diferencial, sacando las condiciones de primer
orden (la primera derivada de la expresin con respecto a cada uno de los parmetros
desconocidos (s) ser igual a cero) y de segundo orden (la segunda deriva de la
expresin con respecto a cada uno de los s es mayor que cero).

(ei ) 2 (Y ( 0 + 1 X )) 2
=
=0
( i )
( i )
2 (ei ) 2 2 (Y ( 0 + 1 X )) 2
=
0
( i ) 2
( i ) 2
Al obtener las derivadas de primer orden encontramos dos ecuaciones con dos
incgnitas, 0 1, que al resolverlas nos dan como resultado lo que denominamos como
ecuaciones normales, que a saber son:
n

i =1

i =1

Yi = n 0 + 1 X i
n

X
i =1

i =1

i =1

Yi = 0 X i + 1 X i

Este sistema de ecuaciones es resuelto por cualquier mtodo matemtico (adicin,


substraccin, igualacin, suma y resta, etc.) para encontrar los valores de los parmetros
desconocidos, que constituyen los estimadores de MCO. Una vez estimados definimos
el modelo como:
Y = 0 + 1 Xi

1.4

Supuestos del Modelo Clsico de Regresin Lineal Simple


(MCRLS)

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

23

Siempre se deben establecer supuestos sobre el modelo. Los ms importantes o los que
deben quedar explcitos son los relativos al trmino del error. Los supuestos que debe
cumplir un modelo economtrico son:
1.

Recordemos que en la estimacin de un modelo hay un margen de error, los cuales


pueden ser positivos o negativos. El valor esperado o promedio estimado de la
variable dependiente, a travs de la regresin muestral estar subestimado o
sobrestimado con relacin al valor poblacional. Por lo tanto, se espera que en
promedio los errores sean cero, o el valor esperado de los errores es igual a cero,
esto es:

E ( i / X i ) = 0
Intuitivamente significa que los errores cometidos al estimar el modelo no afectan
sistemticamente al valor promedio de la variable dependiente, es decir que refleja
el verdadero valor poblacional.
2.

Que los errores no estn correlacionados, es decir que no existe autocorrelacin en


el modelo, esto es:
Cov (i, j) = 0 (i j)

pues,
0

Cov (i, j) = E[ui - E(ui)] [uj- E(uj)]


Cov (i, j) = E(ui uj) = E(ui) E(uj) = 0 (i j)
0

Intuitivamente significa que el valor de la observacin i no influye en el de la j. Por


ejemplo, en series de tiempo el pasado no explica al presente; en series de corte
transversal significa que las variaciones de ingreso en un grupo de personas no
explican los cambios en el consumo de otro grupo.
3.

Que la varianza es nica, o el modelo es homocedstico, esto es:


Var (i) = E (i)2 = 2

Porque:

Var (i) = E [i - E (ui)]2 = 2


Intuitivamente significa que el crecimiento (decrecimiento) de la variable
independiente no afecta o conlleva modificaciones en la varianza del error del
modelo.
4.

Que las observaciones de la variable independiente no estn correlacionadas con el


error, esto es:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

24

Cov (Xi, i) = 0
5.

Finalmente, se supone que el modelo est bien especificado. Es decir que, la forma
funcional se ajusta a los datos y que se han incluido las variables relevantes. Esto
implica que no cometemos sesgo de especificacin.

Estos cinco supuestos se pueden resumir en:


N (0, 2)
Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza
2. Estos supuestos se deben cumplir porque de lo contrario estamos en problemas.
Si un modelo lineal simple cumple con todos estos supuestos tenemos el MCRLS
(Modelo Clsico de Regresin Lineal Simple). Segn Markov si a este modelo
aplicamos el mtodo de estimacin de MCO, los estimadores van a ser los Mejores
Estimadores Lineales Insesgados (MELI).
Sabemos que para que un estimador sea perfecto debe ser:
1.

Insesgado, lo que significa que en promedio los estimadores son igual al verdadero
valor poblacional, lo que permite que las inferencias sean vlidas. Esto es:
E(i) = i

2.

Eficiente, se refiere a la distancia entre los valores del estimador y el valor del
parmetro, e implica que entre todos los estimadores se ha seleccionado aquel de
varianza mnima (distancia mnima o de menor dispersin).

i1
3.

i2

Consistente, que no es ms que un estimador se acerca cada vez ms a su


verdadero valor poblacional a medida que se aumenta el tamao de la muestra, o
tiende a concentrarse ms alrededor del verdadero valor del parmetro.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

25

Estas tres caractersticas estn bajo el supuesto que se realizan estimaciones de


diferentes modelos para diferentes muestras, obviamente esto es terico, pues sabemos
que en virtud de los costos, en la prctica, utilizamos una sola muestra.

1.5

Errores de precisin de los estimadores, intervalos de confianza y


pruebas de hiptesis

Errores de precisin de los estimadores

Conocemos que entre todos los estimadores se escoge aquel que cumple con las
propiedades tericas; sin embargo, en la prctica lo que estimamos es uno solo, con
base en la muestra, por lo que es necesario considerar los errores que tienen stos con
respecto al verdadero valor poblacional.
Esta medida la conocemos como la desviacin tpica o estndar, que se define como una
medida de dispersin de todos los valores estimados para un parmetro con respecto a
su verdadero valor poblacional (valor promedio de estos estimadores, si cumple con la
propiedad de ser insesgado) varianza.
Esta es muy importante para calcular intervalos de confianza y para hacer pruebas de
hiptesis respecto a los parmetros.
Var ( 1 ) = S ( 1 ) 2 =

S2
2

(X

=> S ( 1 ) = S ( 1 ) 2

X)

i =1

S2
Var ( 0 ) = S ( 0 ) 2 =

2
i

i =1

n (Xi X)

=> S ( 0 ) = S ( 0 ) 2

i =1

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

26

Donde: S2 es la varianza del modelo, es decir es la varianza del error (discrepancia


entre la FRM y la FRP), que tan cerca est el valor estimado del verdadero
valor poblacional:
ei = Yi - Yi
Intervalos de Confianza

La estimacin de un modelo da como resultado estimadores puntuales de los parmetros


(un solo valor). En la prctica es muy arriesgado presentar los resultados de esta forma,
pues la estimacin se hace con base a una muestra, por otro lado hay el riesgo de no
incluir todas las variables explicativas, por las razones que hemos venido mencionado, y
de cometer errores de medicin. En este sentido, es mejor presentar los resultados en
forma de intervalos con cierto nivel de confianza, es decir decimos que la probabilidad
de que el valor estimado se encuentre en un determinado intervalo con tal grado de
confianza.
Como los valores que se estiman son de los parmetros y del promedio de la variable
dependiente, habr intervalos de confianza para cada uno de los parmetros y para el
valor promedio.
Intervalo de confianza para los estimadores

IC(i) = Probabilidad[Lmite inferior, Lmite superior] = (1- )% de confiabilidad


IC ( i ) = Pr ob[ i t / 2 , n 2 * S i i i + t / 2 , n 2 * S i ] = (1 )%
Intervalo de confianza para el valor esperado de la variable dependiente

IC[E (Yi )] = Pr ob[Yi t / 2 , n 2 * S Yi Yi Yi + t / 2 , n 2 * S Yi ] = (1 )%


Donde:

2
1
(X X )

S Yi = S 2 + n 0
n
2
(X i X )

i =1

Donde X0 es un valor dado para X, pues recordemos que el valor promedio de Y est
condicionado a un valor de X.
Pruebas de hiptesis

Las pruebas de hiptesis son un poderoso instrumento para definir y establecer


conclusiones generales respecto a una poblacin. El proceso de una prueba de hiptesis
es el siguiente:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

27

1) Se deben formular la hiptesis, que son supuestos que se realizan con respecto al
verdadero valor poblacional. Decimos hiptesis porque son dos: la nula y la alterna.
La ltima apoya a la tesis del investigador y la primera simplemente es lo contrario.
Se comienza por la hiptesis alterna debido que se conoce la probabilidad de error
tipo I (), que surge cuando se rechaza la hiptesis nula siento sta verdadera; la
probabilidad de error tipo II () no se conoce, ste se genera cuando se acepta la
hiptesis nula siendo esta falsa.
Esto debido a que se supone que existe una distribucin de probabilidades para cada
uno de los parmetros estimados.
b) Al probar una hiptesis buscamos rechazar la hiptesis nula, lo que permite tener
evidencia para apoyar el supuesto establecido en la alterna. De esta forma, el
investigador prefija el nivel de probabilidad de error tipo I, es decir el margen de
error de rechazar la hiptesis nula siendo verdadera. En definitiva, fijamos un nivel
de significancia () que est a discrecin del investigador.
c) Para probar la hiptesis se necesario contrastar dos valores, por lo cual se calcula un
estadstico de prueba con base en el valor del parmetro estimado, sobre el que se
est realizando la prueba, y en los valores planteados en la prueba de hiptesis ().
d) Una vez obtenido el valor calculado se lo compara con el valor terico de la
distribucin, el cual se consulta en las tablas respectivas, utilizando los grados de
libertad que constan en la tabla anterior.
e) Se procede a graficar la distribucin correspondiente, en sta es el valor terico o de
tablas el que divide a la regin crtica (de rechazo de la hiptesis nula) y a la de
aceptacin de la hiptesis nula. Sobre este grfico se observa donde cae el valor
calculado, si en la de rechazo o en la de aceptacin.
Si cae en la regin crtica (de rechazo), se procede a concluir que con el 1- % de
confiabilidad hay evidencia suficiente para decir que se cumple lo que se enuncia en
la hiptesis alterna (ojo: no cuando se rechaza la hiptesis nula se acepta
automticamente la alterna). Si cae en la de aceptacin se concluye que con el 1-
% de confiabilidad se prueba lo que se enuncia en la hiptesis nula.
Las dos pruebas de hiptesis centrales, fundamentales, y que en todo modelo se deben
realizar son la de relevancia y la de dependencia, cuyos estadsticos de prueba utilizados
son los que se presentan a continuacin:
Estadstico de prueba
(valor calculado)
i
tc =
S i

Fc=

CMR
CME

Parmetro Prueba de hiptesis

- Relevancia
- Especficas

Distribucin

t (Student) con n-k-1 g l

Razn de - Dependencia glo- F (Fisher) con k gl para


cuadrados
bal, el modelo es el numerador y n-k-1
bueno
para el denominador

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

28

Prueba de Relevancia: se refiere a probar la importancia de una variable en la


explicacin del comportamiento de la variable dependiente.
Si es importante se supone que el coeficiente que la
acompaa (i ) es estadsticamente diferente de cero, por lo
tanto la prueba de hiptesis planteada es:

i = 0
i 0

Ho:
Ha:

El estadstico de prueba es el que consta en la primera fila de la tabla anterior.


Prueba de Dependencia Global:

se refiere a probar que todas las variables en su


conjunto explican a la variable dependiente, es
decir si todos los i estimados son estadsticamente
diferentes de cero. La prueba de hiptesis
planteada es:

1 = 2 = 3 ... = k = 0
1 0, 2 0, 3 0 ... k 0

Ho:
Ha:

El estadstico de prueba es el que consta en la tercera fila de la tabla anterior.


Cul es el origen del estadstico F? lo deduciremos a partir de la Tabla de Anlisis de
Varianza (ANOVA)
Fuente de Grados de
Suma de Cuadrados
variacin libertad (gl)
(SC)
Regresin
1
SCR = 1 (Xi X)(Yi Y)

Error
Total

n-2
n-1

SCE = ei = SCT - SCR


SCT =

(Y Y)

Cuadrado
Medio (CM)
SCR/1

SCE/(n-2)
SCT/(n-1)

F calculado
(Fc)

CMR/CME

Anlisis de los resultados y forma de presentar el modelo

Los resultados de un modelo estimado se debe presentar de la siguiente forma:


0 + 1 Xi
(S0) (S1)
t=
(tc0) (tc1)
R2 = # %
Fgl = #

Yi =

El anlisis de los resultados comienza por la interpretacin de los coeficientes


estimados, tanto por su signo como por su magnitud. Respecto a la ltima, en una
regresin lineal stos reflejan variaciones marginales, es decir cul ser el cambio, en
trminos absolutos, experimentado por la variable dependiente (Y), frente a un cambio
dado en la variable dependiente (X). El signo mostrara una relacin directa o inversa de
la variable dependiente con respecto a la independiente.
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

29

Luego se realizan las dos pruebas de hiptesis centrales mencionadas anteriormente y,


de ser necesario o inters del investigador, tambin se hacen pruebas especficas.
Por ejemplo: se desea estimar un modelo de regresin simple de la demanda del bien X,
para lo cual se dispone de 12 observaciones de sta variable y del precio del mismo
bien. El resultado obtenido despus de correr el modelo en el paquete estadstico TSP es
como se presenta a continuacin:
Dxi = 25.2686 - 1.061 Pxi
(0.4194) (0.0338)
t = (61.25) (-31.35)
R2 = 0.9899 = 98.99%
F1,10 = 982.72
Interpretemos los coeficientes 0 y 1. 0 =25.2686, representa a la interseccin de la
lnea de regresin con el eje Y, es decir que cuando X vale cero Y toma ste valor y
diramos que si el precio del bien X es cero, la demanda de este mismo bien es de
25.2686 kilos. 1, en este caso, es la pendiente de la lnea de regresin y expresa que si
el precio del bien X aumenta (disminuye) en una unidad la demanda disminuye
(aumenta) en 1.061 kilos, es decir que existe una relacin inversa entre las dos
variables.
La prueba de hiptesis de relevancia seguira el siguiente procedimiento:
1.

Ho:
Ha:

1 = 0 (Px no es relevante para explicar las variaciones de Dx)


1 0 (Px es relevante para explicar las variaciones de Dx)

Planteamos as las hiptesis porque si el parmetro en anlisis fuera estadsticamente


(no matemticamente) igual a cero, la variable Px no influira de ningn modo en los
cambios de Dx, pues Yi = 0 + 0 Px.
2.

= 5%

3.

El estadstico de prueba sera:

tc =

1
S1

tn-2 gl

Donde: 1 = es el estimador , = es el valor de la prueba de hiptesis y S1 = es la


desviacin tpica del estimador.
=>
-1.061 - 0
tc = --------------- -31.3483
0.03384
4.

El tt = t %, n-2 gl = t 5%, 10 gl (para dos colas) = 2.228

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

30

Es una prueba de dos colas, lo cual se determina con base en el signo establecido
en la hiptesis alterna, pues no interesa si es mayor o menor que cero, lo
importante es que sea estadsticamente diferente de cero.
5.

Ahora contrastamos el tc con el tt, observamos que el tc es totalmente superior al


tt. es decir cae en la zona de rechazo de la hiptesis nula por lo que se pude
concluir que: con el 95% de confianza hay suficiente evidencia para decir que
Px si es relevante para explicar a Dx.

A Ho

R Ho

R Ho

La prueba de hiptesis de dependencia.


1.

Ho:
Ha:

1 = 0 (no existe dependencia o el modelo no es bueno)


1 0 (existe dependencia o el modelo es bueno)

Se observa que en este caso la de relevancia coincide con la dependencia por existir una
sola variable independiente.
2.

= 5%

3.

El estadstico de prueba sera:

Fc =

CNR
Fk,n-k-1 gl
CME

=>
Fc 982.72 (segn los resultados obtenidos en el TSP)
4.

El Ft = F %, k, n-k-1 gl = F 5%, 1, 10 gl = 4.96


k son los grados de libertad del numerador y n-k-1 los del denominador.

5.

Ahora contratamos el Fc con el Ft, observamos que el Fc es superior al Ft, es


decir cae en la zona de rechazo de la hiptesis nula por lo que se pude concluir
que: con el 95% de confianza hay suficiente evidencia para decir que el modelo
estimado es bueno o existe dependencia.
f(F)
R Ho

A Ho

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

31
4.96

982.72

Una prueba de hiptesis especfica es cuando planteamos, por ejemplo, probar que si Px
aumenta en una unidad la demanda no disminuye en 2 unidades.
1.

Ho:
Ha:

1 = -2 (si Px aumenta en una unidad la demanda disminuye en 2 unidades)


1 -2 (si Px aumenta en una unidad la demanda no disminuye en 2 unidades)

Planteamos as las hiptesis porque:

1 =

Dx 2
=
Px
1

2.

= 10%

3.

El estadstico de prueba sera:

tc =

1
S1

tn-2 gl

=>
-1.061 - (-2)
tc = --------------------- 27.75
0.03384
4.

El tt = t %, n-2 gl = t 10%, 10 gl (para dos colas) = 1.812


Es una prueba de dos colas, lo cual se determina con base en el signo establecido
en la hiptesis alterna, pues no interesa si es mayor o menor que cero, lo
importante es que sea estadsticamente diferente de cero.

5.

Ahora contrastamos el tc (27.75) con el tt ( 1.812), observamos que el tc


(27.75) es mayor que tt (+1.812). Es decir cae en la zona de rechazo de la
hiptesis nula por lo que se pude concluir que: con el 95% de confianza hay
suficiente evidencia para decir que si Px aumenta en una unidad la demanda no
disminuye en dos unidades.

A Ho

R Ho

- 1.812

R Ho

+ 1.812
27.75

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

32

CAPITULO III
APUNTES ADICIONALES RESPECTO A
REGRESION SIMPLE
3.1

Por qu es conveniente plantear modelos con intercepto?

Un modelo sin intercepto se conoce como regresin a travs del origen, de tal forma que
0 = 0, lo que significa que la lnea de regresin pasa por el origen y, por lo tanto, el
modelo quedara expresado como:
Yi = 1 Xi + ui
Es preferible plantear un modelo con intercepto ya que como se observa en el siguiente
cuadro tiene sus ventajas:
Concepto
Expresin
matemtica
Sumatoria de
los errores
Coeficiente de
determinacin

Modelo sin intercepto


Yi = 1 Xi + ui

Modelo con intercepto


Yi = 0 + 1 Xi +ui

La sumatoria de los errores no


necesariamente es igual a cero
R2 puede ser en algunos casos
negativo

La sumatoria de los errores


siempre es igual a cero
R2 siempre es positivo, porque
asume implcitamente que 0
est presente en el modelo
2
R no puede ser adecuado para R2 si es adecuado
estos modelos
No existe
Puede no ser estadsticamente
significativo

Se evidencia, entonces, que es conveniente plantear siempre un modelo con intercepto,


ya que si en realidad el intercepto es estadsticamente no significativo se interpretara
como una regresin en el origen; en tanto que si es estadsticamente significativo y
plantemos sin intercepto cometeramos un error de especificacin, es decir se viola el
quinto supuesto, mencionando con anterioridad.
Por ejemplo si tenemos 10 observaciones de consumo e ingreso y corremos modelos
lineales en el TSP, primero con intercepto y luego sin intercepto, obtenemos los
siguientes resultados:
Y=

3.64 +
0.0888 X
(0.6191)
(0.0106)
t=
(5.8798)
(8.3757)
R2 = 0.8976 = 89.76%
F1,8 =70.152
Y=
t=

0.144 X
(0.010)
(14.32)

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

33

R2 = 0.4552 = 45.52%
Observamos que R2 disminuye drsticamente y, por lo tanto, hay mayor poder
explicativo con el primero (89.76%). Fc no ha sido posible calcularlo por el supuesto
que implcitamente el intercepto es parte del modelo. Aunque la variable independiente
tiene un tc mayor en el segundo modelo que en el primero, se pierden otros parmetros
estadsticos que validan el modelo con mayor certeza.

3.2 Unidades de escala


Es importante notar que las unidades de escala afectarn la interpretacin de los
coeficientes obtenidos, en la medida que est sea diferente para la variable
independiente y para la dependiente. As, si tenemos el modelo original como:
Yi = 0 + 1 Xi +ui
Y los modelos afectados por la escala como:
Yi* = 0 + 1 Xi* +ui
Yi* = 0 + 1 Xi +ui
Yi = 0 + 1 Xi* +ui
Donde:

Yi* = Yi* = a Yi
Xi* = Xi* = a Xi

Es decir, las dos variables estn afectadas por la misma escala, por ejemplo expresadas
en miles de sucres (divididas para mil). Utilizando las diferentes expresiones de clculo
para los coeficientes y para los errores estndar, correspondientes, as como para el
coeficiente de determinacin.
n

1 =

xi yi
i =1
n

(X

X ) (Yi Y )

(X

0 = Y 1 X

i =1

S0 =

i =1

X)

i =1

X
nx

2
i

S1 =

R = (r ) =
2

(X

X ) (Yi Y )

i =1

(X i X )2
i =1

(Yi Y ) 2

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

i =1

34

e
=

2
i

n2

2
i

Aplicando estas expresiones para calcular los diferentes parmetros se veran afectados
como se presenta en siguiente cuadro:
Yi* = 0*+ 1*Xi*
+ui

Parmetr
o
0 *
1 *
S0*
S1*
S*
R2*

Yi* = 0*+ 1*Xi


+ui

a 0
1
a S0
S1
aS
R2

a 0
a 1
a S0
a S1
aS
R2

Yi = 0*+ 1*Xi*
+ui
0
(1/a) 1
S0
(1/a) S1
S
R2

En el primer caso, donde, por ejemplo, a las dos variables se las a dividido por mil
observamos que nicamente el intercepto se ve afectado por lo que se interpretara
dividido por mil. Para el segundo caso, donde solo a la variable independiente se la
expresa en miles, todos los parmetros deberan ser divididos por mil para su
interpretacin. Finalmente, para el ltimo caso en el que se afecta nicamente a la
variable independiente los resultados del coeficiente de la misma y de su respectivo
error estndar deberan ser multiplicado por mil para su interpretacin.
Concluiramos que la escala no afecta los resultados, pero que a la hora de interpretar si
se debe tener en cuenta este aspecto.
Qu pasara si las escalas de medicin que afectan a las variables son diferentes?, esto
es si a la variable independiente se la expresa en miles y la dependiente en millones y
viceversa.
Por ejemplo, con las mismas observaciones de consumo e ingreso y con a=5, tenemos
los siguientes resultados:
Y=

3.64 +
(0.6191)
R2 = 0.8976
S2 = 0.7370

0.0888 X
(0.0106)

Y* = 18.20 +
0.44381 X
(3.095) (0.05298)
=>
R2 = 0.8976
S2 = 18.4256

0*= 5*3.64=18.2 ; 1*= 5*0.888 0.444


S0*=5*0.6193.095; S1*=5*0.0106 0.053
=>
Es igual
=>
S2*= 25*0.7370 18.4256

Y=

=>
=>

3.64 +
(0.6191)

0.01775 X*
(0.0021)

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

=>

0*= 3.64=3.64 ; 1*= 0.888/5 0.01775


S0*=0.6190.6191; S1*=0.0106/5 0.021
35

R2 = 0.8976
S2 = 0.7370

=>
=>

Y* = 18.2 +
0.888 X*
(3.095) (0.0106)
=>
2
R = 0.8976
S2 = 18.4256

0*= 5*3.64=18.2 ; 1*= 0.888 0.888


=>
S0*=5*0.6193.095; S1*=0.0106 0.0106
=>
Es igual
=>
S2*= 0.7370*25 18.425

Es igual
S2*= 0.7370 0.7370

En los resultados anteriores observamos que las estimaciones de la tabla se cumplen, es


decir que los coeficientes obtenidos son afectados en la medida que la variable
independiente o la dependiente cambien de escala.

3.3. Modelos simples no lineales


Hasta aqu hemos revisado modelos simples de tipo lineal; sin embargo, es importante
analizar aquellos no lineales, entre los que tenemos el doblemente logartmico, los
semilogartmicos y los inversos.
3.3.1 Modelo doblemente logartmico:

Matemticamente se expresa como:


Yi = 0 Xi 1 e
Donde e es la base de los logaritmos neperianos o naturales. Este modelos se lo puede
linealizar utilizando las propiedades de los logaritmos. As, si aplicamos logaritmos a
los dos miembros de la funcin obtenemos:
ln Yi = ln 0 + 1 ln Xi +
Observamos que se convierte en un modelo doblemente logartmico, pues se estima con
base en las observaciones de X y de Y, pero no originales sino de sus logaritmos. A esta
funcin se la conoce tambin como Cobb Douglas y es muy importante pues nos
permite obtener elasticidades directamente, es decir los s estimados son elasticidades.
La interpretacin correspondiente es que ante un cambio de un 1% (o 100%) de la
variable X cual es el cambio en trminos de porcentaje para la variable Y. Recordemos
que en lineal la interpretacin de los s era relativa a las variaciones marginales en
trminos de valores absolutos, esto es ante un cambio de 1 unidad de la variables X cual
es cambio experimentado, en trminos absolutos, por la variable Y.
El supuesto fundamental para aplicar el mtodo de estimacin de MCO es que el
modelo sea lineal en los parmetros ms no en las variables, por lo tanto el modelo
presentado puede estimarse a travs de este mtodo.
Las caractersticas:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

36

- El modelo doblemente logartmico es una funcin constante en elasticidades pero


variable en la pendiente, no as en el lineal donde la pendiente es constante y la
elasticidad es variable a lo largo de la funcin.
- No tiene mximo ni mnimo
- Compacta la escala de estimacin
Por ejemplo: si tenemos 36 observaciones relativas al ingreso y al consumo y
estimamos un modelo doblemente logartmico y uno lineal en el TSP, obtenemos los
siguientes resultados:
LCONS =

0.0147954 + 0.98464 LING


(0.03888)
(0.00533)
t=
(0.38066)
(184.836)
R2 = 0.999 = 99.9%
F1,8 =34164.38
CONS =

9.77283 +
(9.6539)
t=
(1.01232)
R2 = 0.9986 = 99.86%
F1,8 =23544.3

0.89974 ING
(0.005864)
(153.442)

La interpretacin para el primer modelo sera:


1 = 0.98464,

significa que si el ingreso aumenta en el 1% (100%) el consumo


aumenta, pues el coeficiente es positivo, en el 0.98464% (98.464%). Es
decir es una elasticidad que debe interpretarse por la magnitud: es
inelstica (cambio menos que proporcional); y, por el signo: que
expresa que es una relacin directa.

1 = 0.89974, en tanto que en el modelo lineal, significa que si el ingreso aumenta en


una unidad (por ejemplo 1 sucre) el consumo aumenta en 0.89974
unidades (por ejemplo 0.89974 sucres), pues el coeficiente es positivo.
Es decir es en este caso representa la propensin marginal a consumir, o
los cambios marginales en trminos absolutos.
3.3.2 Modelos semilogartmicos

Estos modelos solo tienen logaritmos de las observaciones originales en un solo


miembro de la funcin sea de X o de Y. Es decir:
ln Y = 0 + 1 Xi +
Y = 0 + 1 ln Xi +
La interpretacin de los coeficientes: para el primer modelo se dice cual es el cambio
porcentual experimentado por Y frente a un cambio en trminos de valores absolutos de
la variable X; ste modelo es muy importante cuando se trata de calcular tasas de
crecimiento en el tiempo. En el segundo, se interpretara como el cambio experimentado

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

37

por Y en trminos da valores absolutos frente un cambio porcentual de la variable


independiente.
Explicando con mayor detalle el primer modelo semilog, si recordamos la frmula de
inters compuesto tendramos:
Yt = Y0 (1+r)t
lnYt = ln Y0 + t ln (1+r)
Ahora si:

0 = ln Y0, y
1 = ln (1+r)

ln Yt = 0 + 1 t
Agregando el trmino de perturbacin se tiene:
ln Yt = 0 + 1 t + ut
3.3.3 Modelos Recprocos

Refleja una relacin inversamente proporcional entre la variable independiente y la


dependiente,
1
Y = 0 + 1 +

Un ejemplo prctico para este modelo es la teora macroeconmica del empleo.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

38

CAPITULO IV
ANALISIS DE REGRESION LINEAL MULTIPLE
4.1

Definicin y representacin general de un modelo mltiple

El anlisis de regresin mltiple, como su nombre lo indica, relaciona una variable


independiente con dos o ms variables independientes. Su importancia radica en que la
realidad expresada a travs de un modelo ya no es tan simplificada, pues en pocas
ocasiones encontraremos que un fenmeno o comportamiento est explicado por una
sola variable; es decir este tipo de modelo, obviamente, tiene mayor poder explicativo.
En trminos generales se lo puede representar como:
Yi = 0 + 1 X1i + 2 X2i + ... + k Xki + i
Expresado en forma matricial:
Y=X+
Donde:

Y=

Y1
Y2
Y3

1
1

X21
X22

X31 ... Xn1


X32 ... Xn2

X1n

X2n

X3n ... Xnn

X=

Yn

4.2

X11
X12

1
2
n

Supuestos del Modelo

Los supuestos del modelo de regresin lineal mltiple son los mismo que para el simple,
pero se agrega uno que es el de la multicolinealidad. As:
1.

Recordemos que en la estimacin de un modelo hay un margen de error, los cuales


pueden ser positivos o negativos. El valor esperado o promedio estimado de la
variable dependiente, a travs de la regresin muestral estar subestimado o
sobrestimado con relacin al valor poblacional. Por lo tanto, se espera que en
promedio los errores sean cero, o el valor esperado de los errores es igual a cero,
esto es:

E ( i / X i ) = 0
Intuitivamente significa que los errores cometidos al estimar el modelo no afectan
sistemticamente al valor promedio de la variable dependiente, es decir que refleja
el verdadero valor poblacional.
2.

Que los errores no estn correlacionados, es decir que no existe autocorrelacin en


el modelo, esto es:

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

39

Cov (i, j) = 0 (i j)
Intuitivamente significa que, por ejemplo, en series de tiempo el pasado no explica
al presente; en series de corte transversal significa que las variaciones de ingreso en
un grupo de personas no explican los cambios en el consumo de otro grupo.
3.

Que la varianza es nica, o el modelo es homocedstico, esto es:


Var () = E (2) = 2
Intuitivamente significa que el crecimiento (decrecimiento) de la variable
independiente no afecta o conlleva modificaciones en la varianza del error del
modelo.

4.

Que las observaciones de la variable independiente no estn correlacionadas con el


error, esto es:
Cov (Xi, i) = 0

5.

Las variables independientes no estn correlacionadas, es decir que el modelo no


est afectado por la multicolinealidad, esto es:
Cov (Xi, Xj) = 0

6.

(i j)

Finalmente, se supone que el modelo est bien especificado. Es decir que, la forma
funcional se ajusta a los datos y se han incluido las variables relevantes. Esto
implica que no cometemos sesgo de especificacin.

Estos supuestos se pueden resumir en:


N (0, 2)
Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza
2 .
Cuando tenemos este tipo de modelo es difcil inferir la forma funcional. En la prctica
lo que se hace es ensayar diferentes funciones, utilizando la teora econmica.
El mtodo de estimacin que vamos a utilizar es el de MCO, el proceso es el mismo que
en el modelo simple. Esto es resolvemos un proceso de optimizacin, minimizamos la
sumatoria de los errores al cuadrado.

4.3

Pruebas de hiptesis

Como en el modelo de regresin lineal simple en el mltiple tambin tenemos dos


hiptesis centrales: la de dependencia y la de relevancia.
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

40

Prueba de dependencia

Esta verifica el efecto conjunto y simultneo de todas las variables independientes sobre
la dependiente. Se la conoce tambin como la prueba de bondad del modelo. Por
ejemplo si el modelo es:
Yi = 0 + 1 X1i + 2 X2i + ... + k Xki + i
La hiptesis ser:
Ho: 0 = 1 = 2 = ... k = 0
Ha: 0 0, 1 0, 2 0, ... , k 0
Donde, como se analiz anteriormente, el estadstico de prueba es el Fc.
Prueba de relevancia

Esta prueba verifica si cada una de las variables independientes son importantes para
explicar los cambios de la variable dependiente. Igual que en el modelo de regresin
simple planteamos la hiptesis de la siguiente forma:
Ho: i = 0
Ha: i 0
Y el estadstico de prueba es el mismo que en el caso lineal simple, esto es el tc.
Hiptesis especficas

Son supuestos que se realizan con respecto a valores determinados de los parmetros
poblacionales. Por ejemplo, si queremos probar que en una funcin de produccin con
tres insumos existen rendimientos crecientes, en un modelo como:
Yi = 0 X1i 1 X2i

X3

eu

La hiptesis ser:
Ho: 1 + 2 + 3 0
Ha: 1 + 2 + 3 > 0
En este caso el estadstico de prueba es diferente, as:
tc =

'
s 2 ' ( X ' X ) 1

Donde:

t n k 1 , gl

= vector de coeficientes de los s de la hiptesis; S2 (XX)-1 = matriz de


Var-Cov ()

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

41

4.4

Intervalos de confianza

Para los estimadores:


I ( i ) = Pr ob [ ' t / 2 , n k 1 s 2 ' ( X ' X ) ]

Para la prediccin:
I (E (Y / X ) = Pr ob [ Xo' t / 2 , n k 1 s 2 Xo ' ( X ' X ) Xo ]

4.5

Multicolinealidad

La multicolinealidad se presenta cuando las variables independientes estn


correlacionadas. Es decir se est violando un supuesto y, por lo tanto, las inferencias ya
no tienen validez.
Las causas para que se de este problema son: generalmente, los modelos utilizan
variables sociales y econmicas, por lo que casi siempre se va a presentar este
problema. Es difcil encontrar en la prctica que variables de este tipo no se relacionen
de ninguna forma. Por lo que se trata de corregir reduciendo este problema, nunca se va
a eliminar totalmente.
Se pude decir que existe multicolinealidad perfecta cuando el coeficiente de correlacin
entre variables independientes es igual a 1, en este caso no se puede estimar el modelo
porque la matriz X es singular o no es de rango completo. Tambin se dice que la
multicolinealidad es menos que perfecta, en cuyo caso si es posible estimar el modelo
pero existen problemas de inferencia, por lo que hay que trata de reducirla corrigiendo.
Para detectar:
Una forma es encontrando los coeficientes de correlacin entre las variables
independientes, si este es cercano a uno significa que las variables estn altamente
correlacionadas.
Otra forma es corriendo regresiones entre las variables independientes, esto es que una
de ellas es independiente y a la otra (s) como dependiente. Si son relevantes para
explicar en los modelos, tendremos alta multicolinealidad.
Para corregir, se podra pensar en eliminar una variable que se causa de la
multicolinealidad, pero es posible que se genere un sesgo de especificacin.

4.6

Autocorrelacin

La autocorrelacin significa que los errores estn relacionados. En series de tiempo que
el pasado explica al presente, en series de corte transversal que el cambio en una
variable de un grupo afecta a otro grupo. Se presenta ms en series de tiempo.
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

42

Esta violacin de los supuestos tiene consecuencias importantes, por lo que ser
necesario corregirla. Para detectar este problema se puede utilizar el estadstico DurbinWatson y para corregir se utiliza la Ecuacin de Diferencias Generalizadas.

4.7

Heterocedasticidad

La hetorecedasticidad es la violacin del supuesto relativo a que la varianza es nica, o


que el modelo es homocedstico. Significa que a medida que aumenta o disminuye la
variable independiente, causa de este problema, aumenta o disminuye la varianza de los
errores.
Este problema es ms frecuente en series de corte transversal. Por ejemplo, cuando
estamos estimando un modelo de consumo en funcin del ingreso, para un bien
especifico y tenemos las observaciones clasificada segn estrato econmico,
obviamente dependiendo del tipo de bien, el consumo aumenta en diferente forma para
cada estrato.

4.8

Sesgo de Especificacin

Recordemos el ltimo supuesto, tanto del modelo simple como mltiple, que dice que
un modelo debe estar bien especificado, es decir poseer la forma funcional correcta y
las variables relevantes. Observamos pues que, la violacin de este supuesto conduce a
un sesgo de especificacin que puede estar dado por:
-

Forma funcional inadecuada o que no se ajusta a los datos


Omisin de variables relevantes
Inclusin de variables irrelevantes
Errores de medicin.

Siendo la omisin de una o ms variables relevantes el problema ms grave.

4.9

Proceso para estimar un modelo

Es importante conocer el proceso de estimacin de un modelo, el mismo que debe


seguir una secuencia lgica. En este sentido, a continuacin se presenta los pasos que,
segn criterio del autor, son los ms importantes.
1. Revisin de la teora, es el paso fundamental dentro de un proceso de investigacin.
Cuando se est estudiando un fenmeno social o econmico, es importante recopilar
las principales teoras que existen al respecto, las cuales deben ser actualizadas y
ajustarse a la realidad objeto de estudio.
2. Con esta teora se puede definir una relacin funcional deterministica. Esto es:
Y = f (X1, X2, X3, ... Xk)
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

43

Es decir, la teora es la base sobre la que se construye un modelo, contribuye a definir la


cual es la variable dependiente y cual o cuales las independientes.
3. Con esta relacin determinista procedemos a establecer la relacin funcional: lineal,
cudrtica, doblemente logartmica, etc.. Primero basndonos en la propia teora para
luego ensayar las funciones que deducimos se pueden ajustar a los datos y a la teora
y, finalmente, determinar el modelo economtrico.
Por ejemplo, si la relacin ms adecuada fuera una lineal tendramos:
Yi = 0 + 1 X1i + 2 X2i + ... + k Xki + i
4. Se procede a la estimacin de la funcin establecida, observando primero el
coeficiente de determinacin del modelo. Obviamente si ste se acerca ms a la
unidad los datos se ajustan al modelo. De no ser as, se inicia con un proceso
iterativo, donde ensayamos diferentes tipos de funciones siempre observando el
estadstico mencionado.
5. Con estos modelos estimados procedemos a validar el modelo. Para el efecto,
primero debemos partir siempre del modelo original, no del corregido, para ver si no
viola ninguno de los supuestos utilizando pruebas de hiptesis y los diferentes
mtodos para detectar estos problemas. Si es as corregimos con los diferentes
mtodos sealados.
Tambin dentro de la validacin se debe analizar si el modelo cumple con lo que se
espera de acuerdo a la teora, esto es la magnitud de los coeficientes y los signos. Si no
cumple estos aspectos existe algn errores y debemos volver al paso 1.
6. Una vez que tenemos el modelo validado estadsticamente y a travs de la teora
econmica procedemos a: primero interpretar cada uno de los coeficientes estimados;
y, segundo a hacer pruebas de hiptesis que nos permitan hacer ciertas inferencias,
de inters, para generalizar las caractersticas de la muestra a la poblacin objeto de
estudio.
7. Finalmente, segn los intereses de la investigacin se pueden hacer simulaciones y
formulacin de poltica econmica. Para luego escribir las conclusiones y
recomendaciones, definidas primero sobre el propsito de la investigacin, despus
sobre la facilidad o dificultad de la investigacin como tal; y, por ltimo sobre los
resultados del modelo, as como sobre su validez.

APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
Nancy Medina Carranco

44