Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Econometría I
Econometría I
Ω Modelo Económico.
Ω Modelo Econométrico.
Ω Datos.
La Teoría Económica propone modelos que explican el
comportamiento de una o varias variables, Y1, Y2,..., Yi, en función de
otra u otras variables, X1, X2,...,Xi, que se determinan fuera del modelo.
Y = f (X1, . . . ,Xi )
Demanda: Q= f1(P, R)
Oferta: Q= f2(P, Ll)
Q= Cantidades, P= Precios, R= Renta y, Ll= Lluvias
Curva de Engel
G= f(GT)
Y1= G= Gasto de un Bien, X1= GT= GastoTotal
El Modelo Econométrico permite cuantificar y contrastar las relaciones
entre variables postuladas por los modelos económicos a partir de los
datos (Evidencia Empírica).
E [Y – f (X1, . . . ,Xk)] = 0
Y = f (X1, . . . ,Xk)] + μ
Dependiendo del problema a analizar, del interés de investigador y de la
naturaleza de los datos se formulan diferentes tipos de modelos
econométricos.
Keynes plantea:
Keynes, después de haber postulado una relación positiva entre el consumo y el ingreso no
especifica la forma precisa de la relación funcional entre ambas variables.
Y = 1 + 2X
Para dar cabida a relaciones inexactas entre las variables económicas, el econometrista
modificaría la función determinista de consumo en la ecuación de la siguiente manera:
Y = 1 + 2X +
Modelo de Regresión Lineal
¿Qué nivel de ingreso garantizará la cantidad de gasto de consumo fijado como meta?
Un nivel de ingresos de alrededor de 12537 (miles de millones), con una PMC de cerca de
0.72, producirá un gasto aproximado de 8750 millones de dólares.
Como indican estos cálculos, un modelo estimado sirve para fines de control o de políticas
públicas. Mediante una mezcla apropiada de política fiscal y monetaria, el gobierno puede
manejar la variable de control X para producir el nivel deseado de la variable objetivo Y.
Fuente: Gujarati (2010)
Fuente: Gujarati (2010)
El término Regresión fue introducido por Francis Galton.
Regresión a la Mediocridad.
El análisis de regresión trata del estudio de la dependencia de una
variable (variable dependiente) respecto a una o más variables
(variables explicativas) con el objeto de estimar o predecir el valor
promedio poblacional de la primera en términos de los valores
conocidos o fijos de las segundas.
Una relación estadística, sin importar que tan fuerte sea, nunca podrá
establecer una conexión causal: nuestras ideas de causalidad deben
provenir de estadísticas externas y, en último término, de una u otra
teoría (Kendall y Stuart, 1961).
El Análisis de Correlación está estrechamente relacionado con el de regresión,
aunque conceptualmente los dos son muy diferentes.
El análisis de regresión simple es el que se realiza a dos variables, una dependiente y una
explicativa.
El análisis de la regresión múltiple es el que se realiza con más de dos variables, una
dependiente y más de una explicativa.
E(Y | Xi) = 1 + 2 Xi
- Donde 1 y 2 son parámetros no conocidos que se llaman Coeficientes de
Regresión cuya estimación es el interés del análisis de regresión.
- E(Y | Xi) = 1 + 2 Xi es la función que permite estimar los coeficientes de
regresión con base en la Función de Regresión Lineal Poblacional.
Como se ha demostrado, a medida que aumenta el ingreso familiar, el consumo familiar,
en promedio, también aumenta.
- E(Y | Xi) = 1 + 2 Xi
-Yi = 1 + 2Xi + μi (Reemplazar)
Por un lado, el promedio de las
-Yi = E(Y | Xi) + μi ( Multiplicar E(…) ) perturbaciones estocásticas es igual
- EX(Yi) = E[E(Y | Xi) + μi] a cero porque son desviaciones con
respecto a la media. Por otro lado, lo
- E(Yi | Xi) = E[E(Y | Xi) + E(μi | Xi) anterior implica que la recta de
- E(Yi | Xi) = E(Y | Xi) + E(μi | Xi) regresión pase a través de las
- E(μi | Xi) = 0 medias condicionales de Y.
Vaguedad de la teoría.
Principio de parsimonia.
C60,10 = 60!
10! x 50!
Muestra 1 Muestra 2
El método de MCO es el más común en el análisis de regresión, sobre todo por ser mucho
más intuitivo y matemáticamente más sencillo que el método de máxima verosimilitud.
r² = 0
r² = 1
Una cantidad estrechamente relacionada con r² pero conceptualmente muy diferente es
el coeficiente de correlación, el cual, como ya lo hemos mencionado, es una medida del
grado de asociación entre dos variables.
La hipótesis planteada (en el lenguaje estadístico hipótesis nula) se la denota como H0.
La hipótesis alternativa o mantenida se la denota como H1.
Yi= Inversión Doméstica Privada Bruta (IDPB) de Estados Unidos (miles de millones/millones de dólares).
Xi= Producto Interno Bruto (PIB) de Estados Unidos (miles de millones/millones de dólares).
Yi*= w1Yi
Xi*= w2Xi
w1 y w2 son constantes denominados factores de escala.
Yi= Inversión Doméstica Privada Bruta (IDPB) de Estados Unidos (miles de millones/millones de dólares).
Xi= Producto Interno Bruto (PIB) de Estados Unidos (miles de millones/millones de dólares).
- El coeficiente de la pendiente,
al igual que su error estándar, es
(1/1.000), pues sólo se modificó
la escala de la variable PIB.
Como resultado, no importa en qué unidades se expresen ambas variables (la regresada
y la regresora). En consecuencia, en lugar de llevar a cabo la regresión estándar
(bivariada), podemos realizar la regresión sobre las variables estandarizadas.
Coeficientes Beta.
Para mostrar la diferencia entre la regresión estándar y estandarizada, a continuación tenemos el
siguiente ejemplo: IDPB – PIB.
En esta sección revisaremos algunos modelos de regresión muy comunes, que pueden
ser no lineales en las variables pero sí lineales en los parámetros, o que pueden serlo
mediante transformaciones apropiadas de las variables. Estos modelos de regresión
pueden ser:
1. El modelo log-lineal.
2. Modelos semilogarítmicos.
3. Modelos recíprocos.
4. El modelo logarítmico recíproco.
Ahora analizaremos las características especiales de cada modelo, los casos en los cuales
su uso es apropiado y la forma de estimarlos.
Los resultados evidencian que la elasticidad de GASBD respecto de GCPERT es de casi
1.63, lo que indica que si el gasto personal total aumenta 1%, en promedio, el gasto en
bienes duraderos se incrementará casi 1.63%. En consecuencia, el gasto en bienes
duraderos es muy sensible a los cambios en el gasto de consumo personal. Por esta
razón, los productores de bienes duraderos siguen muy de cerca los cambios en el
ingreso personal y el gasto de consumo personal.
Modelo log-lin
A estos modelos se los denominan Modelos Semilog porque sólo una variable (en este
caso, la regresada) aparece en forma logarítmica. Para fines descriptivos, un modelo en
el cual la variable regresada es logarítmica se denomina Modelo log-lin.
El coeficiente de la variable de tendencia del modelo de crecimiento, β2, da la tasa de crecimiento instantánea
(en un momento dado), pero no la tasa de crecimiento compuesta (durante un periodo).
La tasa de crecimiento compuesta se calcula a través del antilogaritmo de la β2 estimada (0.007054), se resta 1 y
se multiplica la diferencia por 100.
En consecuencia, la tasa compuesta de crecimiento de gastos en servicios fue de casi 0.708% por trimestre, lo
cual es un poco mayor que la tasa de crecimiento instantánea de 0.705%. Lo anterior se debe, por supuesto, al
efecto de la composición.
Modelo de Tendencia Lineal
En este modelo en lugar de regresar el log de Y sobre el tiempo, regresan Y sobre el tiempo, donde Y es la
variable regresada en consideración.
Un modelo de este tipo se denomina Modelo de Tendencia Lineal, y la variable tiempo t se conoce como
variable de tendencia. Si el coeficiente de la pendiente es positivo, existe una tendencia creciente en Y,
mientras que si es negativa, existe una tendencia decreciente en Y.
Por consiguiente, cuando se utiliza MCO para estimar regresiones, se debe multiplicar el
valor del coeficiente estimado de la pendiente por 0.01, o, lo que es lo mismo, dividirlo
entre 100.
Modelos de Gasto Engel (Ernst Engel 1821-1896) muestran que el gasto total que se
dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el
gasto total aumenta en progresión geométrica.
✓ Los resultados evidencian que el coeficiente de la pendiente es 257.27. Esto implica que un
incremento en el gasto total del 1%, en promedio, propicia un incremento de casi 2.57 rupias
en el gasto en alimento de las 55 familias incluidas en la muestra.
A pesar de que este modelo es no lineal en la variable X porque se encuentra inversamente o
en forma recíproca, el modelo es lineal en β1 y β2, y, por consiguiente, es un modelo de
regresión lineal.
Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el
término β2(1/X) se acerca a cero y Y se aproxima al valor límite o asintótico β1.
Por consiguiente, los modelos recíprocos contienen un valor asintótico o límite que tomará la
variable dependiente cuando el valor de la variable X aumente indefinidamente.
La pendiente de la regresión,
implica que si el β2 es positivo,
la pendiente siempre es
negativa, a su vez, si el β2 es
negativo, la pendiente siempre
es positiva.
✓ Conforme el PIB per cápita se incrementa indefinidamente, la mortalidad infantil se acerca a
su valor asintótico de casi 82 muertes por millar. El valor positivo del coeficiente β2 de
(1/PIBPCt) implica que la tasa de cambio de la MI respecto del PIBPC es negativa.
Concluimos este análisis de los modelos recíprocos con el modelo recíproco logarítmico,
que adopta la siguiente forma:
Al principio Y se incrementa con una tasa creciente (es decir, la curva es convexa al inicio)
y luego aumenta con una tasa decreciente (la curva se convierte en cóncava).
Se ha analizado las distintas formas funcionales que un modelo empírico puede tomar,
incluso dentro de los confines de los modelos de regresión lineal en los parámetros.
La elección de una forma funcional particular puede ser relativamente fácil para el caso de
dos variables, pues se pueden graficar las variables y tener así una ligera idea respecto del
modelo adecuado. La elección se complica mucho más cuando se considera el modelo de
regresión múltiple que implica más de una regresora.
Donde λ es un parámetro que puede ser negativo, cero o positivo. Como Y está elevado a la
potencia λ, obtendremos varias transformaciones de Y, según el valor de λ.
En la regresión, β1 es el término del intercepto. Este término da el efecto
medio o promedio sobre Y de todas las variables excluidas del modelo, aunque
su interpretación mecánica sea el valor promedio de Y cuando X2 y X3 se
igualan a cero. Los coeficientes β2 y β3 se denominan coeficientes de
regresión parcial.
✓ −0.0056 y -2,2316 son los coeficientes de
regresión parcial.
✓ El coeficiente −0.0056 expresa que si se
mantiene constante la influencia de la TAF,
conforme el PIBPC se incrementa en una unidad,
en promedio, la MI disminuirá en 0.0056
unidades. Para interpretar esto desde el punto
de vista económico, si el PIB percápita se
incrementara 1 dólar, en promedio, el número
de muertes de niños menores de 5 años se
reduciría a 5.6 por cada 1000 nacimientos vivos.
✓ El coeficiente −2.2316 señala que si la influencia
del PIBPC se mantiene constante, el número de
muertes de niños menores de 5 años disminuirá,
en promedio, 2.23 por cada 1000 nacimientos
vivos, si la tasa de alfabetización en las mujeres
sube un punto porcentual.
✓ El valor del intercepto de alrededor de 263, si se
interpretara de una forma mecanicista,
significaría que si los valores del PIBPC y de la
TAF fuesen cero, la mortalidad infantil sería de
más o menos 263 muertes por cada 1000
nacimientos vivos.
Multicolinealidad
El supuesto 8 del Modelo Clásico de Regresión Lineal (MCRL) plantea que no
existe multicolinealidad entre las regresoras incluidas en el modelo de
regresión.
Diagrama de dispersión.
Medidas Correctivas
Blanchard (1967) expresa que ante la multicolinealidad “no hay que hacer
nada”. La multicolinealidad es en esencia un problema de deficiencia de datos
(micronumerosidad) y, en algunas ocasiones, no hay opción respecto de los
datos disponibles para el análisis empírico.
A medida que aumentan los ingresos, la gente posee más ingreso discrecional.
A medida que mejoran las técnicas de recolección de datos, es probable que σ2 se reduzca.
Violación del supuesto 9 del MCRL, que establece que el modelo de regresión está
correctamente especificado.
Métodos Formales
Prueba de Glejser.- Si no hay una significancia estadística entre los parámetros, no hay
heteroscedasticidad.
Fenómeno de la telaraña.
Rezagos.
“Manipulación” de datos.
Transformación de datos.
No estacionariedad.
Autocorrelación - Detección
Método gráfico.
Prueba d de Durbin-Watson.
× Método Newey-West.
× Método de Cochrane-Orcutt.