Está en la página 1de 62

Introducción

ECONOMETRIA BASICA
PROFESOR: MANUEL PIZARRO VIDAL
Resumen tomado de ECONOMETRIA 4° Edic.
Damodar Gujarati
Introducción (DEFINICIONES)
Econometría es la ciencia que aplica métodos matemáticos y estadísticos al análisis
de datos económicos, con el objetivo de dotar de una base empírica a una teoría
económica, para así refutarla o verificarla.

La econometría se basa en el desarrollo de métodos estadísticos destinados a


estimar las relaciones económicas, contrastar teorías económicas y evaluar y poner
en práctica políticas gubernamentales y de negocio.

Wooldridge: disciplina distinta de la estadística matemática que se centra en los


problemas inherentes a la recopilación y al análisis de datos económicos no
experimentales. Los datos no experimentales no se recogen mediante
experimentos controlados por individuos, empresas u otras entidades. Son
datos de observación, recopilados en forma pasiva.

Es una ciencia social en la cual se aplican herramientas de la teoría


económica, las matemáticas y la inferencia estadística, al análisis de
los fenómenos económicos
Sin embargo, las metodologías aplicadas en econometría (los tres
puntos de vista de Frish), no han sido utilizados exclusivamente por
la ciencia económica. Otras ciencias naturales también han
aprovechado sus ventajas.
En el campo del comportamiento económico adquieren especial
particularidad y relevancia, dada sus condiciones esencialmente no-
experimentales, colocándonos en situaciones donde todas las
variables relevantes parecen moverse constantemente y donde
existen factores impredecibles que pueden alterar los resultados.

Es por esto que la econometría es esencialmente una ciencia no


determinística, donde se reconoce la existencia de factores
esencialmente impredecibles que determinan nuestras
conclusiones.
Metodología de Trabajo en Econometría
1.-) Teoría Económica
La formalización de la hipótesis o “sospecha” del econometrista debe
partir de una lógica básica. Proviene fundamentalmente del área de la
teoría económica o del sentido común.
Ejemplo Tipo: Teoría Keynesiana del Consumo
“La ley psicológica fundamental, consiste en que los hombres están
dispuestos por regla general y en promedio a aumentar su consumo
en la medida que su ingreso crece, aunque no tanto como el
crecimiento de dicho ingreso”
Es decir, la Propensión Marginal a Consumir (PMC) es mayor que cero
pero menor que uno
0<PMC<1
2.-) Planteamiento de un modelo matemático.
La teoría establece una relación entre consumo e ingreso de tal modo que:
Y=f(X)
Interesa establecer cuál es la forma funcional (f) que relaciona ambas
variables, lo que en general es un hecho empírico.
Podemos suponer una relación lineal entre ambas variables, del tipo:

= + 0< <1
Donde Yi = Consumo Familiar
y Xi = Ingreso familiar por unidad de tiempo,

y donde

β1 y β2 son conocidos como los parámetros del modelo,


correspondiendo respectivamente, a los coeficientes de intersección
y pendiente de la recta.
3.-) Planteamiento de un modelo econométrico.
El modelo matemático de la teoría tiene poca validez práctica para el
econometrista, toda vez que es un modelo determinista.

(Si existiesen varias familias con el mismo ingreso (cosa probable)


= 100
= 100
= 100
= 100
CONOCIDOS
= 10 Y = 0,85
= 95
= 95
= 95
= 95
Todas tendrían igual consumo, cosa improbable toda vez que cada
familia tiene características especiales que la hacen única).
Para confeccionar el modelo econométrico se deben considerar todas
aquellas variables que afectan al consumo además del ingreso.
• N° de componentes del grupo familiar,
• Región geográfica,
• Religión
-
• -
• -
• -
-
• -
• -
• -
• -
• -
• -
• ETC, etc)
El modelo econométrico queda
= + +

μi = Se denomina, Termino de Perturbación o Termino de Error

Representa a todas aquellas variables que afectan al consumo y


que no están incluidas explícitamente en el modelo considerado
por diversas razones.
4.-) Estimación de los parámetros del modelo.
El siguiente paso es estimar numéricamente los indicadores del
modelo econométrico, también llamados
y
parámetros, estimadores
o coeficientes.
Para esto es necesario disponer de una MUESTRA que en lo
principal debe ser aleatoria y representativa de la población.
En el ejemplo tipo equivale a establecer cuánto valen β1 y β2 en la
muestra. Son estimaciones muéstrales, por tanto, se designan con
un gorro ( ^ ).

Son estimadores de los


parámetros verdaderos o Y
también llamados poblacionales
5.-) Validación del modelo. (Inferencia estadística)
Se debe comprobar si la afirmación es aceptada o rechazada.
Esto se realiza mediante test de hipótesis o intervalos de confianza
y consiste en verificar si los resultados obtenidos mediante la
muestra pueden ser inferidos a la población.
Esto significa verificar la significancia estadística o el grado de
representatividad de los estimadores obtenidos, es decir, qué tan
efectivos son estos estimadores muestrales respecto de la
población.
En el ejemplo tipo puede suceder : si = 0,96
El verdadero Puede pertenecer al intervalo

Caso a)

∈ 0,93 ; 0,99 95%


Es decir , efectivamente

0< <1
En cuyo caso se pasa al punto 6. y siguientes.

6.-) Predicción
Un modelo verificado sirve para predecir

7.-) Aplicación Política y/o aplicación de toma de decisiones.


La econometría es una herramienta de toma de decisiones dentro
de la empresa o el gobierno.

Ejemplo : Proponer medidas frente a un alza en el nivel de


desempleo basado en un PIB estimado del modelo econométrico
correspondiente.
También puede suceder que el “verdadero beta 2” pertenezca
al siguiente intervalo
Caso b)

∈ 0,91 ; 1,01 95%


En este caso se debe efectuar una revisión del modelo,
específicamente en los puntos 2 ) al punto 5. Esto es:
2. Revisar el modelo matemático
3. Revisar el modelo econométrico
4. Revisar la estimación de los parámetros
5. Efectuar la inferencia estadística

Y finalmente si la evidencia empírica así lo señala


NUEVA TEORIA:
0 < PMC < 1,1
Tipos de datos
Puede haber tres tipos de datos disponibles para el análisis empírico:
series de tiempo, series de corte transversal e información
combinada.

Series de tiempo : Una serie de tiempo es un conjunto de


observaciones sobre los valores que toma un variable en diferentes
momentos del tiempo.
Tal información debe ser recopilada a intervalos regulares, es decir,
en forma diaria (precios de acciones), semanal (cifras de oferta
monetaria), mensual (tasa de desempleo e Índice de Precios al
Consumidor), trimestral (el PIB), anual (presupuestos de gobierno),
quinquenal (censo manufacturero), o decenalmente (censos de
población).
Algunos datos están disponibles en más de un periodo, por ejemplo,
el PIB y los gastos de consumo, son entregados trimestral y
anualmente.
Series de Corte Transversal (cross-section): La información de
Corte Transversal consiste en datos de una o más variables recogidos
en el mismo momento del tiempo, tales como el censo de población
realizado por la Oficina del Censo cada 10 años y las encuestas de
opinión.
Información combinada : los datos agrupados tienen elementos
de series de tiempo y de corte transversal reunidos.
- Datos longitudinales de panel o micropanel : Hay un tipo
especial de datos agrupados, también llamada información
micropanel, en la cual la misma unidad de corte transversal (una
familia o una empresa) es encuestada a través del tiempo.
- Por ejemplo, el Ministerio del Trabajo y Previsión Social (MINTRAB)
del Gobierno de Chile, realiza cada dos años la Encuesta de
Protección Social (EPS).
ANALISIS DE REGRESION
INTRODUCCION
Análisis de
El primero en mencionar el término de Regresión fue
Francis Galton.
En un famoso artículo planteó que, a pesar de la tendencia
en la que los padres de estatura alta tenían hijos altos y los
padres de estatura baja tenían hijos bajos,
La estatura promedio de los niños nacidos de padres de una
estatura dada tendía a moverse o “regresar” hacia la
estatura promedio de la población.
La ley de Regresión Universal de Galton fue confirmada por
su colega Karl Pearson, quien reunió más de mil registros
de estaturas de miembros de grupos familiares.
En palabras de Galton, se trataba de una “regresión hacia la
mediocridad”.
Interpretación moderna de Regresión
Actualmente, el Análisis de Regresión trata de la
dependencia de una variable (llamada explicada)
de una o más variables denominadas explicatorias
de modo que para una muestra dada se pueda predecir
el valor promedio de la variable explicada
basándose en datos conocidos de las variables
explicatorias.
CON ESTA DEFINICION ES EVIDENTE QUE EL ANALISIS DE REGRESION
SE PUEDE APLICAR EN UNA AMPLIA GAMA DE SITUACIONES Y AREAS
DEL CONOCIMIENTO (NO NECESARIAMENTE VARIABLES ECONOMICAS)
Regresión versus Causalidad
Es importante tener claro que la regresión es una
relación estadística, que no implica causalidad a priori.

En el ejemplo del vino, no hay una razón estadística para


suponer que la lluvia no depende de la calidad del vino.
Pero nuestro sentido común nos hace considerar como
variable dependiente la calidad del vino y no la lluvia.

Es importante recordar de aquí en adelante que una


relación estadística no puede por sí misma implicar en
forma lógica una causalidad.
ANALISIS DE REGRESION
SIMPLE
DOS VARIABLES
UNA EXPLICADA
Y UNA EXPLICATORIA
Asumiremos que existe una variable dependiente (Y) que es
explicada por sólo una variable (X).
Aun cuando la utilidad práctica de un modelo con dos variables es
escasa, su análisis sirve para sentar las bases de la regresión de una
forma sencilla que se extiende fácilmente al caso múltiple.
Consideraremos el siguiente ejemplo tipo.
En la Tabla se presentan datos de consumo e ingreso para 27 familias
que corresponden a toda la población.
INGRESO FAMILIAR

80 120 160 200 240


CON 55 79 102 120 137
SU 60 84 107 136 145
MO 65 90 110 140 155
FA 70 94 116 144 165
MI 75 98 118 145 175
LIAR 125 189
SUMA 325 445 678 685 966
PROMEDIO 65 89 113 137 161
CONSUMO
Y

170 FUNCION DE
160 REGRESION
POBLACIONAL
150 FRP
130
120
110
100
90
80
70
60

X
INGRESO
80 120 160 200 240
En el gráfico de a continuación, los valores medios condicionales
están marcados.
La unión de estos valores representa la Curva o Función de Regresión
Poblacional, donde el término poblacional se refiere a que estamos
trabajando con el total de la población. (Para el caso una Recta)

180
160
140
120
100
80
60
40 FUNCION DE REGRESION POBLACIONAL
(FRP)
20
0
0 40 80 120 160 200 240 280
Función de regresión poblacional (FRP)
De lo anterior es claro que la media condicional E(Y|Xi) es función
de Xi, donde Xi es un valor dado de X:
E(Y/Xi) = f(Xi)
donde f( ) es una función cualquiera, en el ejemplo anterior era
una función lineal.
La forma que tiene la FRP es un hecho empírico, aunque muchas
veces la teoría nos puede ayudar bastante.
Supongamos que en nuestro ejemplo anterior el consumo está
relacionado linealmente con el ingreso, así podemos suponer que la
función de regresión poblacional E(Y/Xi) es una función lineal de Xi,
es decir:

Donde β1 y β2 se denominan coeficientes de regresión verdaderos o


poblacionales.
Definición:
La curva de regresión poblacional es simplemente el lugar
geométrico donde concurren las medias condicionales de la
variable dependiente para los valores fijos de la(s) variable(s)
explicativa(s).
La FRP atraviesa dichas expectativas condicionales.

En el ejemplo anterior los valores de Y (consumo) están


distribuidos de forma simétrica en torno al valor promedio para
cada valor X.
Se asumirá que esto se cumple.

En este ejemplo, se ve la relación entre ingreso semanal y gasto


en consumo semanal,
Para cada nivel de ingreso se tiene un rango de gasto que se
distribuye en forma simétrica entorno al valor promedio
condicional de gasto.
Especificación estocástica de la función de regresión poblacional
En el ejemplo anterior veíamos que a medida que se incrementa la
variable explicativa (ingreso), el valor promedio de la variable
dependiente (gasto) también se incrementaba.
Sin embargo, este patrón se da solo a nivel de promedios.
A nivel individual esto no es necesariamente cierto. En la Tabla
podemos ver que un individuo que tiene menos ingreso, consume
más que otro de mayor ingreso. Podemos definir:

Donde ui es una variable aleatoria no observable que toma valores


positivos o negativos.
Este término surge pues no se puede esperar que todas las
observaciones Yi sean igual al promedio condicional a Xi.
Recordemos que la regresión es una relación estadística, a pesar
de conocer los valores de Xi, esto no nos permite predecir en
forma exacta Yi.
CONSUMO
Y
FUNCION DE
170 REGRESION
POBLACIONAL
160 FRP
150

130
120
110
100
90
80
( ⁄ )
70
60

X
INGRESO
80 120 160 200 240
Lo que no podemos explicar debido a que tiene naturaleza aleatoria
se representa a través de ui, denominado término de error
estocástico.
Entonces siguiendo el ejemplo anterior, podemos decir que el gasto
de una familia individual (Yi) corresponde a la suma de dos
componentes:
• E(Y|Xi), que corresponde a la media de gasto de todas las
familias con el mismo nivel de ingresos (Componente
Determinístico)
• ui (Componente Aleatorio)

Si E(Y|Xi) es lineal en Xi, podemos escribir la ecuación de la siguiente


forma:
POR EJEMPLO:
UNA FAMILIA QUE TIENE INGRESO DE 160 UM, CONSUME 125.
LAS FAMILIAS CON INGRESO DE 160 CONSUMEN EN PROMEDIO 113 UM
Yi= 125 (Xi=160 FIJO)
E(Y/Xi) = 113

= + +

INGRESO FA
125 = 113 + 12
MILIAR 102 = 113 + -11
160
102
107 = 113 + -6
107 110 = 113 + -3
110
116 116 = 113 + 3
118 118 = 113 + 5
125
678 =
Tomando el valor esperado condicional en Xi a la ecuación se llega a
determinar que:

Así, el supuesto de que la recta de regresión pasa a través de las


medias condicionales de Y, implica que la media condicional de
ui es cero.
La Función de Regresión
Muestral
FRM
Función de Regresión Muestral

Del mismo modo como se deriva la FRP se deriva el concepto de


FRM

En la mayoría de los fenómenos económicos a estudiar, no


disponemos de las observaciones totales de la población.

En la práctica se tiene alcance nada más que a una muestra de los


valores de Y que corresponden a unos valores fijos de X.

En este caso tenemos que estimar la función de regresión


poblacional en base a información muestral.
Recordemos que los datos poblacionales del ejemplo tipo

INGRESO FAMILIAR
80 120 160 200 240
CON 55 79 102 120 137
SU 60 84 107 136 145
MO 65 90 110 140 155
FA 70 94 116 144 165
MI 75 98 118 145 175
LIAR 125 189
SUMA 325 445 678 685 966
PROMEDIO 65 89 113 137 161

En la práctica no conoceremos estos datos, es decir, no tenemos


acceso a las observaciones correspondientes a la población total.
Tenemos a nuestra disposición sólo una muestra, la que ha sido
obtenida de forma aleatoria de la población.
Es importante notar que a partir de una población podemos sacar
una gran cantidad de muestras en forma aleatoria y en la realidad
nosotros observamos solo una de ellas.
Debido a esta variabilidad en las muestras podremos estimar la
FRP pero no de manera precisa.
Para ejemplificar esto supongamos que se saca una muestra
absolutamente aleatoria a partir de la información poblacional. Que
corresponde a los valores marcados en la población, es decir:

X (Fijos) Y
80 60
120 90
160 110
200 145
240 165
CONSUMO
Y
= +
170 FUNCION DE
160 REGRESION
MUESTRAL
150 FRM
130
120
110
100
90
80
70
60

X
INGRESO
80 120 160 200 240
FUNCION DE REGRESION MUESTRAL

(FRM)

Al graficar los datos de la Tabla obtenemos la Grafica o diagrama


de dispersión.
En este diagrama se ha trazado la curva de regresión (para el caso,
recta de regresión muestral: FRM. Como vemos, no es posible
asegurar si la recta muestral representa adecuadamente la recta de
regresión poblacional.
Si se toma otra muestra aleatoria se obtendrá una nueva FRM que
intentará representar a la población.
180
160
140
120
100
80
60
40 FUNCION DE REGRESION POBLACIONAL
(FRP)
20
0
0 40 80 120 160 200 240 280
=
Entonces es importante tener en mente que las rectas de regresión
muestral representan la recta de regresión poblacional, pero debido
a fluctuaciones muestrales pueden ser consideradas sólo como una
aproximación.
Como contraparte muestral la función de regresión muestral puede
escribirse como:

Es un estimador de
Donde :
Es un estimador de

= Es un estimador de

Es un estimador de
Definición: Un estimador es una regla, fórmula o método que dice
cómo determinar el parámetro poblacional a partir de la
información suministrada por la muestra disponible.
De igual manera que para el caso poblacional la función de
regresión muestral también tiene una representación estocástica:

El objetivo del Análisis de Regresión es estimar la Función de


Regresión Poblacional basándose para ello en la Función de Regresión
Muestral.
Es decir:

A partir de la FRM poder aproximarse a la FRP


¿Cómo se puede construir la función de regresión
muestral para que

este lo más cerca de los valores verdaderos


(poblacionales) de
Modelo de Regresión con dos variables
En la regresión simple sólo existen dos variables involucradas, x e
y,
Donde x es la variable explicativa o independiente a la cual le
hacemos tomar valores fijos, por tanto, se convierte en una
variable de control, e
y es la variable explicada o dependiente, la cual se denomina
también como variable aleatoria o estocástica, puesto que en ella
existe una esperanza matemática o promedio, y es posible la
dispersión de sus valores.
La expresión estándar de la función de regresión muestral
corresponde :
Considerando una serie de datos muestrales (puntos en el plano),
correspondientes al comportamiento de la ordenada sobre Xi, se
puede encontrar un valor medio de todos los Yi para cada Xi, a
estos valores medios se les denomina ŷi.
Para calcular la FRM solo se requiere efectuar estimaciones de beta
1 y beta 2 mediante las observaciones provistas por la muestra.
Esto es:

Dado que los Xi son constantes fijas en el muestreo (se conocen),


entonces para basta estimar los parámetros del modelo para
tener la FRM
=FRM
El objetivo de hacer análisis de regresión consiste en estimar la
función de regresión poblacional (FRP) con base en la función de
regresión muestral (FRM) en la forma más precisa posible. En el
mejor de los casos solo será una aproximación.
El método de estimación mas frecuentemente utilizado es Mínimos
Cuadrados Ordinarios (MCO)
La alternativa es máxima verosimilitud)

SUPUESTOS DEL MODELO DE REGRESION LINEAL

SUPUESTO 1

Modelo de regresión lineal: El modelo de regresión es lineal en los


parámetros, aunque puede o no ser lineal en las variables. Es decir, el modelo
de regresión como se muestra en la ecuación
SUPUESTO 2
Valores fijos de X, o : Los valores que toma la regresora X
pueden considerarse fijos en muestras repetidas (el caso de
la regresora fija), o haber sido muestreados junto con la
variable dependiente Y (el caso de la regresora
estocástica).

SUPUESTO 3

Los valores de X independientes del término de error

Se supone que la(s) variable(s) X y el término de error son


independientes, esto es, cov(X, u) = 0.
SUPUESTO 4 (SUPUESTO 1 DE GAUSS)
El valor medio de la perturbación ui es igual a cero: Dado el
valor de X i , la media o el valor esperado del término de
perturbación aleatoria ui es cero. Simbólicamente,
tenemos que
E(u |X) = 0
i

O, si X no es estocástica, E(ui) = 0
Es importante señalar que el supuesto 4 implica que no hay sesgo de
especificación o error de especificación en el modelo del análisis
empírico. En otras palabras, el modelo de regresión está
especificado correctamente. (ejemplo mitir variables explicativas
importantes
SUPUESTO 5 (SUPUESTO 2 DE GAUSS)

No hay autocorrelación entre las perturbaciones: Dados


dos valores cualesquiera de X,Xi y Xj (i j ), la correlación entre dos ui y uj
cualesquiera (i j ) es cero.
En pocas palabras, estas observaciones se muestrean de manera independiente.
Simbólicamente

(donde i y j son dos observaciones diferentes y cov significa covarianza).

E(ui,uj)=0
SUPUESTO 6 (SUPUESTO 3 DE GAUSS)
Homoscedasticidad o varianza constante de ui: La
varianza del término de error, o de perturbación, es la misma sin importar
el valor de X. Simbólicamente:
HETEROSCEDASTICIDAD
SUPUESTO 7 (SUPUESTO 5 DE GAUSS)

Las Variables explicatorias o independientes no están


correlacionadas entre si
Cada una de ellas ejerce una influencia independiente sobre la
variable explicada

No debe existir MULTICOLINEALIDAD


SUPUESTO 8
El número de observaciones n debe ser mayor que el
número de parámetros por estimar:
Sucesivamente, el número de observaciones n debe ser mayor que el número
de variables explicativas.

SUPUESTO 9
La naturaleza de las variables X:
No todos los valores X en una muestra determinada deben ser iguales.
Técnicamente, var(X) debe ser un número positivo.
Además, no puede haber valores atípicos de la variable X, es decir, valores
muy grandes en relación con el resto de las observaciones.
Es importante señalar que todos estos supuestos sólo se refieren a la
FRP y no a la FRM.
METODO DE MINIMOS CUADRADOS ORDINARIOS (MICO MMC)

El método de mínimos cuadrados ordinarios se atribuye a Carl Friedrich Gauss, matemático


alemán. A partir de los supuestos estudiados (en especial los 3 de Gauss ), presenta
propiedades estadísticas muy atractivas que lo han convertido en uno de los más eficaces y
populares del análisis de regresión.
=
= + +

= - −
El método de mínimos cuadrados escoge a los estimadores beta 1 y
beta 2 gorro de tal modo que para una muestra dada la suma de los
residuos elevados al cuadrado sea minima

2
2

Para minimizar la suma de cuadrados (residuos al cuadrado) se


debe derivar parcialmente con respecto a cada parámetro e
igualar a cero.
Si la segunda derivada parcial es mayor que cero se trata de un
mínimo.
La segunda derivada c/r a B1 gorro es 2
La segunda derivada c/r a beta2 gorro es 2*SUM ( )

Igualamos a cero arreglamos un poco las ecuaciones y de


obtiene
Que son las ecuaciones
normales para la recta y que
garantizan que la suma residual
de cuadrados es mínima

Se trata de un sistema de ecuaciones con dos incógnitas y dos


ecuaciones. Luego se tiene solución única

Se requieren solo algunos valores para poder despejar y obtener


los resultados
En el ejemplo tipo quedaría:
INGRESO CONSUMO
Xi Yi Yi*Xi Xi*Xi Yi*Yi
1 80 60 4800 6400 3600
2 120 90 10800 14400 8100
3 160 110 17600 25600 12100
4 200 145 29000 40000 21025
5 240 165 39600 57600 27225
SUMA 800 570 101800 144000 72050
MEDIA 160 114

DE DONDE : =8
570 = 5* + 800*
= 0,6625
101800 = 800* + 144000*
• La función de regresión muestral puede escribirse
como:

Yˆi  ˆ1  ˆ2 Xi


Donde Yˆi es el estimador de E(Yi|Xi), ̂1 es el
estimador de 1 y ˆ2 es el estimador de 2

Definición: un estimador es una regla, fórmula o


método que permite estimar parámetros
poblacionales a partir de una muestra disponible
(el promedio es un estimador de la media
poblacional)

También podría gustarte