Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MODELOS ECONOMETRICOS
TEMA
MANUAL DE CLASES PARA
EL ESTUDIANTE
INTEGRANTES:
Estudiantes P01
POSGRADO:
Maestría En Economía
Con Mención En Desarrollo Rural
PROFESOR:
MSC. Jorge Garcia R.
Año Lectivo
2018 2020
Estudiantes P01:
Alumnos Paralelo 01
MODELOS ECONOMÉTRICOS
COMPONENTE 0: ECONOMETRIA
Es medir la economía con variables económicas.
X1 X2…Xn ≈ Z
+;-;0
+ (hipótesis)
Y = F(x)
Tesis
Conclusiones
Decisiones
MODELO
V.A Continuas Vx Vt
- Variable (aleatoriedad) P1(X1).P2(X2)…Pn(Xn)
(Distribución de V.A Discontinuas R1 (1,0)
probabilidad)
Pi (ɛ)
Pi (x/4)
SI/NO
PARA RECORDAR:
Macroeconometría:
Datos de series de tiempo
Microeconometría:
Datos de corte transversal
Estimación:
Aproximación a le realidad.
Parámetros:
Limites, indicador, lineamientos, condiciones. (Controles).
U=0 Z
(𝑋𝑖 − 𝑢)
𝑍=
𝛿
( )
√𝑛
(ɛ) Inferir en el comportamiento de la variable
𝑍=
𝛿 hacia adelante.
( )
√𝑛
𝛿
𝑧. = ɛ
√𝑛
𝑧. 𝛿 2 2
[ ] = (√𝑛)
𝜀
𝑍2 𝛿 2
𝑛=
𝜀2
Se habla
de homocedasticidad si el error
cometido por el modelo tiene
siempre la misma varianza. En
particular, si el modelo es
homocedástico, el valor de las
variables explicativas, no
afectará a la varianza del error.
Modelo univariable
Escogemos que la variable dependiente es el DESEMPLEO
Y la independiente es el SALARIO
Inflación con salario hay mayor correlación…. Los 1 son las varianzas
El modelo tampoco es significativo… el valor p de la constante es mayor a 0.05.
Modelo espurio
Quiere decir que el modelo carece de datos o carece de variables, o que las variables
asociadas no son enteramente independientes
Taller 1.1
Datos muestra demanda de helados
Análisis de matriz de correlación
Hay una mayor correlación entre la temperatura y la demanda de helado
Variable dependiente ---- es la variable que se estudia… DEMANDA DE
HELADO
Variable independiente ---- es la variable que cambia ----- TEMPERATURA
Modelo
Demanda helado = 0.206862 + 0.003107 temp + Ei (error estimado)
El modelo es significativo porque el valor p en ambas es menor a 0.05. (5%) a
pesar que R2 es bajo
TALLER 2
GASTO = CONSTANTE + INGRESO + PRECIO GASOLINA + Precios de los
nuevos carros + error estimado
Los asteriscos dicen que el modelo es altamente significativo. El R2 es muy cercano a
1.
Que las líneas estén casi pegadas significa que
El R2 bajo, mayor error, mayor dispersión
R2 mas cerca de 1 o 1, menor error, menor dispersión
Covarianza
Es el grado de covariabilidad de una variable con la otra. Es el grado común de las
x con las y. Es adimensional.
>0 relación directa
<0 relación inversa
=0 no hay relación, no hay dependencia
Correlación
1 es 100%
>0 correlación directa
<0 correlación inversa
=0 no hay correlación
Estadístico f
Es un parámetro de medición de significancia conjunta de toda la estadística
Hacer el mismo modelo con logaritmo para suavizar las series (es decir linealizar
las variables, dejan de ser tan irregulares)
La información no varió
Para hallar predicciones
COMPONENTE 3: SERIES TE TIEMPO
Modelos Ar
Modelo AR(1)
Hay un buen ajuste ya que el modelo estimado se aproxima al modelo observado, y el error se
minimiza.
Los residuos están muy concentrados respecto a la media
Con 23 rezagos hacia atrás probablemente el modelo tenga consistencia, pero a partir del
rezago 24 días ya no aporta información, porque mi información relevante está asociada a los
23 datos hacia atrás, es decir a partir del dato 24 o 25 se puede desechar esa información. La
función de autocorrelación demuestra que de los 23 datos, a partir del dato 5 hacia atrás
aporta información significativa al modelo. Con la autocorrelación se busca pronosticar cual va
a ser el valor de Yt+1
A continuación se pronostican 10 periodos
Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge
valores de la variable como la frecuencia absoluta o número de veces que aparece el valor en
la muestra y el porcentaje de veces que aparece cada valor de la variable sobre el total de
observaciones.
Los residuos están dentro de la normalidad
Gráfico de concentración de retardos
Los residuos están concentrados
La función de autocorrelación me indica que los residuos estadísticamente significativos es el
retardo 3,12,15, y 24 y se reflejan gráficamente a continuación.
Predicción de 10 años
Ar (2)
Modelos Ma
Los modelos de medias móviles (Ma) que pueden ser de orden 1, 2 y MA(p), se refiere a
rezagos en periodos. Los modelos Ma están asociados o correlacionados a su término de error,
Los errores tienden a desaparecer en el tiempo, las series de tiempo no tienen memoria.
La serie de modelo Ma deben ser estacional, hay un ajuste porque los parámetros, estima
MCO pero fundamentalmente con máxima verosimilitud, es un proceso interactivo para hallar
la constante Theta 1 y Theta 2. En este modelo la constante Theta 1 y 2 del modelo MA1 son
significativos y no presenta el R2 porque el modelo está en función de los errores y por
definición la covarianza de Et Yt es 0. Los Thetas y la significancia estadística son altas.
En la función de autocovarianza, en la tendencia que guardan los residuos refleja que hay
autocorrelación histórica de todos los residuos en el proceso, mientras que en la función de
autocorrelación el séptimo error hacia atrás es el que me aporta información, pero mas fuerte
en el rezago 1 y 2.
El elipse de confianza es estacionario porque está dentro
Esta volatilidad de los erros refleja muchas equivocaciones
Gran parte de la información esta centrada en la normalidad
COMPONENTE 4: MODELOS LOGIT Y PROBIT
MODELO LOGIT
Este modelo permite, además de obtener estimaciones de la probabilidad de un suceso,
identificar los factores de riesgo que determinan dichas probabilidades, así como la
influencia o peso relativo que éstos tienen sobre las mismas.
Este tipo de modelo arroja como resultado un índice, cuyos determinantes son
conocidos, el cual permite efectuar ordenaciones, las cuales al realizarse, posibilitan,
con algún método de estratificación, generar clasificaciones en las que se le asocia a
cada elemento una calificación. Existen muchos criterios para llevar a cabo la
asociación índice - calificación, muchos de ellos con base en índices de muestreo, donde
el criterio es puramente estadístico. Otros criterios podrían considerarse como
subjetivos.
Para el caso más sencillo, el de una única variable explicativa, se trata de encontrar la
relación que existe entre la variable explicativa y la endógena. Las posibilidades que se
plantean son:
Que la función que relaciona ambas variables sea una función lineal, caso en el cual se
tiene, lo que se ha denominado, el modelo lineal de probabilidad. Este asume que la
relación entre las variables explicativas y la variable explicada tiene un comportamiento
lineal, suposición que en muchos casos no se da, dando esta situación origen a los
modelos de regresión no lineales, dentro de los cuales se encuentran ubicados los
modelos Probit y Logit, siendo este último el que interesa y del cual a continuación se
hace un análisis detallado sobre su estructura y los fundamentos teóricos que lo
soportan. La modelización Logit es similar a la regresión tradicional salvo que utiliza
como función de estimación la función logística en vez de la lineal. Con la
modelización Logit, el resultado del modelo es la estimación de la probabilidad de que
un nuevo individuo pertenezca a un grupo o a otro, mientras que por otro lado, al
tratarse de un análisis de regresión, también permite identificar las variables más
importantes que explican las diferencias entre grupos.
donde: Zi = β1 + β2X
Donde:
MODELO PROBIT
El modelo de estimación que surge de una FDA2 normal se conoce comúnmente como
modelo probit, aunque algunas veces también como modelo normit. En principio, se
puede sustituir la FDA normal por la FDA logística .
Pero en lugar de seguir este camino, presentaremos el modelo probit basado en la teoría
de la utilidad, o de la perspectiva de selección racional con base en el comportamiento,
según el modelo desarrollado por McFadden. Para motivar el modelo probit, suponga
que en el ejemplo de propiedad de vivienda, la decisión de la i-ésima familia de tener
casa propia o de no tenerla depende de un índice de conveniencia no observable Ii
(también conocido como variable latente), determinado por una o diversas variables
explicativas, digamos, el ingreso Xi, de manera que entre mayor sea el valor del índice
Ii, mayor será la probabilidad de que la familia posea vivienda.
donde F−1 es la inversa de la FDA normal. El significado de todo esto se aclara con la fi
gura anterior. En el panel a) de esta figura se obtiene (de la ordenada) la probabilidad
(acumulada) de tener casa propia dado Ii∗ ≤ Ii, mientras que en el panel b) se obtiene
(de la abscisa) el valor de Ii dado el valor de Pi, que es simplemente el inverso del
primero. Pero, específicamente, ¿cómo obtenemos el índice Ii al igual que las
estimaciones de β1 y β2? Como en el caso del modelo logit, la respuesta depende que se
cuente con datos agrupados o desagrupados.
……..
………
Wt = ȿ0 + ȿ1 Wt- 1 + ȿ2 W t-2 + Ɛ i t
Żt = K + Â Zt- k + U i y
= θ ∏+ θ it ȿ iy ∆∆ ᶺ
ɣ it ȿ iy
Por lo tanto esto expresa cuanto es el cambio de esta matriz de parametros como se
ve afectada en Z.
∆ A = ɚ Ẑit
Repaso MCOO
Matriz de correlacion
La relacion entre pampa explica a pampa o el precio de pampa explica a merval, la
menos relacionada indupa con irsa
Este modelo cuenta con una elevada significancia estadística, es decir, el modelo si
funciona.
Grafico de series de tiempo
Por separad0
MCO
EN LOGARITMO EL R2 AUMENTO POR LO TANTO SE AJUSTO MAS
CORRELOGRAMA DE RESIDUOS
MODELOS MA MEDIAS MOVILES
Vienen de los modelos ar, son modelos que tienden a cero, si cometimos un error en el
pasado lo más probable que no lo cometamos hoy.
Orden 1
Lo más pertinente es comparar un modelo AR con PAMPA
Ma de orden 2
Autocorrelación de residuos
Modelos aryma:
Es la combinación de ar y ma
MODELO BINARIO: LOGIT
Modelo de regresión no lineal, diseñado específicamente para analizar variables dependientes
de carácter dicotómico o datos de corte transversal.
La bondad del ajuste, vendrá determinada por la R2 , cuanto más próxima al 1, mejor será el
ajuste y la capacidad predictiva del modelo sea elevada, el modelo se considera lo
suficientemente bueno para predecir la probabilidad de ocurrencia de la variable dependiente
en estudio.
El modelo Logit Binario, se utiliza para modelar perfiles de riesgos que permiten determinar si
la persona aplica o no para acceder a un crédito.
ANEXOS: CD
Panel de datos Datos para múltiples entidades donde cada entidad se observa en
dos o más periodos.
Parámetro Constante que determina una característica de una distribución de
probabilidad o una función de regresión poblacional.
Población Grupo de entidades, como personas o empresas, que se desean
estudiar.
p-valor Nivel de significación más pequeño para el que puede rechazarse
la hipótesis nula.
Serie temporal.- Datos para una misma entidad para múltiples periodos.
Valor crítico Valor del estadístico del contraste para el cual el test rechaza la
hipótesis nula al nivel de significación preestablecido.
Valor esperado Valor medio a largo plazo de una variable aleatoria en
experimentos repetidos. Es la media ponderada en términos de
probabilidad de todos los posibles valores que puede tomar la
variable aleatoria.
Valor predicho Valor de la variable dependiente que es predicho por la línea de
regresión de mínimos cuadrados ordinarios.
Variable binaria Variable que sólo toma el valor 0 o el valor 1.
o dummy
Variable Variable que se explica en una regresión u otro modelo
dependiente estadístico (variable que aparece a la izquierda del igual en una
regresión).
Variable endógena Variable que está correlacionada con el término de error.
Variable que está determinada dentro del modelo de regresión.
Variable exógena Variable que no está correlacionada con el término de error.
Variable que está determinada fuera del modelo de regresión.
Variable Véase “Regresor”
explicativa
Varianza Valor esperado del cuadrado de la diferencia entre una variable
aleatoria y su media.