Manual de Clases para El Estudiante

MATERIA:
MODELOS ECONOMETRICOS
TEMA
MANUAL DE CLASES PARA
EL ESTUDIANTE
INTEGRANTES:
Estudiantes P01
POSGRADO:
Maestría En Economía
Con Mención En Desarrollo Rural
PROFESOR:
MSC. Jorge Garcia R.
Año Lectivo
2018 2020
Estudiantes P01:
 Albarracín Vergara Paola Lissette

 Almeida Saldaña Felix Nivaldo
 Ávila Bailón John Alejandro
 Barcia Moran Adriana Madeleyn
 Castillo Ortiz María Isabel
 Chanalata Llumiluisa Walter Vinicio
 Cherrez Chonillo Hardy Andrés
 Crespín Guzmán Enrique Patricio
 De La Torre Vallarino Gabriela Fernanda
 Díaz Álvarez Danny Javier
 Encarnación León Darwin Enrique
 Escobar Ortiz Paola María
 Freire Paredes Andrés Enrique
 Gavilanes Torres Leonor Kristy
 Gonzáles Torres Luis Miguel
 León Wong Henry Sekwing
 Llerena Paz Manuel Andrés
 Macias Alcivar Fernando Guillermo
 Morocho Bravo Angélica María
 Párraga Cepeda Roberth Vicente
 Pincay Jordán Karen Vanessa
 Plaza Vanegas Galo David
 Quintana Ruiz Amanda Yuliana
 Robles Salas Andrea Natali
 Tobar Bastidas Matilde Esther
 Torres Matamoros Freddy Eladio
El objetivo de realizar este documento sobre teoría y ejercicios de Econometría y

prácticas en paquetes informáticas, es aplicar y dar a conocer los conocimientos
obtenidos a lo largo del Módulo de Modelos Econométricos P01, a su vez orientar a los
estudiantes para futuros aprendizajes dentro de esta materia en futuros Cohortes de esta
Maestría.
Alumnos Paralelo 01
MODELOS ECONOMÉTRICOS
COMPONENTE 0: ECONOMETRIA
Es medir la economía con variables económicas.
N1, n2, n3…nn ≈ N
X1 X2…Xn ≈ Z
+;-;0
+ (hipótesis)
Y = F(x)
Tesis
Conclusiones
Decisiones
MODELO
V.A Continuas Vx Vt
- Variable (aleatoriedad) P1(X1).P2(X2)…Pn(Xn)
(Distribución de V.A Discontinuas R1 (1,0)
probabilidad)
Pi (ɛ)
Pi (x/4)
SI/NO
PARA RECORDAR:
Macroeconometría:
Datos de series de tiempo
Microeconometría:
Datos de corte transversal
Estimación:
Aproximación a le realidad.
Parámetros:
Limites, indicador, lineamientos, condiciones. (Controles).
COMPONENTE 1: MODELO DE REGRESION LINEAL SIMPLE
- Univariado Y= F(x) ~Yi = β0+β1Yi+ɛi

- Multivariado Y = F(X1 X2 X3…Xn
Yi = β0+β1 X1+ β2X2+…+ βn Xn + ɛi
U=0 Z
(𝑋𝑖 − 𝑢)
𝑍=
𝛿
( )
√𝑛
(ɛ) Inferir en el comportamiento de la variable
𝑍=
𝛿 hacia adelante.
( )
√𝑛
𝛿
𝑧. = ɛ
√𝑛
𝑧. 𝛿 2 2
[ ] = (√𝑛)
𝜀
𝑍2 𝛿 2
𝑛=
𝜀2
Se habla
de homocedasticidad si el error
cometido por el modelo tiene
siempre la misma varianza. En
particular, si el modelo es
homocedástico, el valor de las
variables explicativas, no
afectará a la varianza del error.
En estadística se dice que un

modelo de regresión lineal
presenta heterocedasticidad
cuando la varianza de los
errores no es constante en todas
las observaciones realizadas.
Esto implica el incumplimiento
de una de las hipótesis básicas
sobre las que se asienta el
modelo de regresión lineal.
GRETL (Programa econométrico)
TALLER 1
Modelo univariable
Escogemos que la variable dependiente es el DESEMPLEO
Y la independiente es el SALARIO
Desempleo en el tiempo Ut = 5.80+0.0608w+ei (error esperado)

El modelo nos indica que no hay relación entre el salario y el desempleo, pues el valor p
de salario es mayor a 0.05, entonces la muestra no es significativa.
Variable dependiente es la inflacion
Independiente es el desempleo
El modelo no sirve… porque el valor p en la constante es mayor a 0.05.

O faltan datos, o faltan considerar más variables
Para suavizar los datos y probar si el modelo sirve, calculo con logaritmos.
Con logaritmos tampoco es significativo el modelo.
Otro Modelo
Dependiente: salario
Independientes: desempleo e inflación
Correlación
Selecciono datos
Matriz de correlación
Inflación con salario hay mayor correlación…. Los 1 son las varianzas
El modelo tampoco es significativo… el valor p de la constante es mayor a 0.05.
Modelo espurio
Quiere decir que el modelo carece de datos o carece de variables, o que las variables
asociadas no son enteramente independientes
Taller 1.1
Datos muestra demanda de helados
Análisis de matriz de correlación
Hay una mayor correlación entre la temperatura y la demanda de helado
Variable dependiente ---- es la variable que se estudia… DEMANDA DE
HELADO
Variable independiente ---- es la variable que cambia ----- TEMPERATURA
Modelo
Demanda helado = 0.206862 + 0.003107 temp + Ei (error estimado)
El modelo es significativo porque el valor p en ambas es menor a 0.05. (5%) a
pesar que R2 es bajo
TALLER 2
GASTO = CONSTANTE + INGRESO + PRECIO GASOLINA + Precios de los
nuevos carros + error estimado
Los asteriscos dicen que el modelo es altamente significativo. El R2 es muy cercano a
1.
Que las líneas estén casi pegadas significa que
El R2 bajo, mayor error, mayor dispersión
R2 mas cerca de 1 o 1, menor error, menor dispersión
Covarianza
Es el grado de covariabilidad de una variable con la otra. Es el grado común de las
x con las y. Es adimensional.
>0 relación directa
<0 relación inversa
=0 no hay relación, no hay dependencia
Correlación
1 es 100%
>0 correlación directa
<0 correlación inversa
=0 no hay correlación
Estadístico f
Es un parámetro de medición de significancia conjunta de toda la estadística
EL VALOR F Es menor a 0.05 … es significativo

INDICADORES DE CONSISTENCIA
R2
Estadístico t
Estadístico f
Matriz de correlación
Covarianza
Prueba Normalidad
Análisis de heterocesticidad
Hacer el mismo modelo con logaritmo para suavizar las series (es decir linealizar
las variables, dejan de ser tan irregulares)
La información no varió
Para hallar predicciones
COMPONENTE 3: SERIES TE TIEMPO
Modelos Ar
La serie de tiempo es la secuencia de observaciones que son medidos y analizadas en el

tiempo, a partir de estas series de tiempo surgen los modelos autorregresivos (AR), es decir la
comparación de la misma variable en el periodo anterior, se refiere a como se a afectado el
cambio de la variable de hoy ante los cambios de la misma variable en los periodos atrás. El
orden d ellos modelos autorregresivos depende de lo que estoy investigando, en el que más
incidencia tiene el dato más reciente. Sin embargo también hay datos históricos que inciden en
el actual, ejemplo la dolarización en el Ecuador que aún tiene afectación en los precios. El
proceso autorregresivo es un modelo de regresión en el que las variables explicativas son la
misma variable dependiente retardada.
Modelo AR(1)
Los modelos autorregresivos de orden 1 (Ar 1) donde la estimación se da por mínimos

cuadrados ordinarios, o por Máxima Verosimilitud, la serie debe cumplir con la condición de
Estacionariedad (Nivel donde la variable se ajusta), ya que si los datos son volátiles es más
complicado hacer una estimación, para esto Theta debe ser menor a 1.
Modelo de una serie de forma Ar(1)
En Ar (1) sólo se aplicará 1 rezago

Se utiliza Cochrane-Orcutt para conseguir el estimador de Mínimos cuadrados generalizados,
en el que es necesario lograr una estimación del parámetro de autocorrelación de primer
orden, con el cual corregir el problema de la autocorrelación de los errores.
Se observa que el valor de la constante es 8,51819 y Theta (0,996625) es menor a 1 se deduce

que estacionaria. El ajuste según el R-cuadrado es de 0,989074, lo que significa que existe
ajuste en los datos de ayer y hoy. Referente al Valor P del coeficiente es estadísticamente
significativo 6,94e-248. El modelo tiene ajuste, es decir precio de MERVAL25_1, en función del
precio de la variable de Y con un coeficiente de 0,09 es representativo para estos datos.
Normalidad de los residuos

En esta grafica la mayor proporcion de los residuos estan distriuidos normalmente dentro de la
zona de confianza.
Los resultados de las estimaciones muestra valores moderados
Hay un buen ajuste ya que el modelo estimado se aproxima al modelo observado, y el error se
minimiza.
Los residuos están muy concentrados respecto a la media
Con 23 rezagos hacia atrás probablemente el modelo tenga consistencia, pero a partir del
rezago 24 días ya no aporta información, porque mi información relevante está asociada a los
23 datos hacia atrás, es decir a partir del dato 24 o 25 se puede desechar esa información. La
función de autocorrelación demuestra que de los 23 datos, a partir del dato 5 hacia atrás
aporta información significativa al modelo. Con la autocorrelación se busca pronosticar cual va
a ser el valor de Yt+1
A continuación se pronostican 10 periodos
Se tenía observaciones hasta el 29 de junio del 2017 pero se realizó proyecciones de 10

periodos y estos dieron valores normales
A medida que voy rezagando más períodos, estos afectan menos a la variable de hoy, es decir
que el dato que más aporta información a la variable de hoy es el más próximo.
Distribución de frecuencia
Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge
valores de la variable como la frecuencia absoluta o número de veces que aparece el valor en
la muestra y el porcentaje de veces que aparece cada valor de la variable sobre el total de
observaciones.
Los residuos están dentro de la normalidad
Gráfico de concentración de retardos
Los residuos están concentrados
La función de autocorrelación me indica que los residuos estadísticamente significativos es el
retardo 3,12,15, y 24 y se reflejan gráficamente a continuación.
Predicción de 10 años
Ar (2)
En este modelo el resultado de Constante es 0,0178323, y Pampa_2 0,0997077, por lo que el

proceso es estacionario, además de ser significativo. El error es 0,0312626, mientras que
Pampa_2 presenta la suma de Theta 1 y Theta_2.
En escala logarítmica la línea roja se suaviza mientras que la otra es volátil
Modelos Ma
Los modelos de medias móviles (Ma) que pueden ser de orden 1, 2 y MA(p), se refiere a
rezagos en periodos. Los modelos Ma están asociados o correlacionados a su término de error,
Los errores tienden a desaparecer en el tiempo, las series de tiempo no tienen memoria.
La serie de modelo Ma deben ser estacional, hay un ajuste porque los parámetros, estima
MCO pero fundamentalmente con máxima verosimilitud, es un proceso interactivo para hallar
la constante Theta 1 y Theta 2. En este modelo la constante Theta 1 y 2 del modelo MA1 son
significativos y no presenta el R2 porque el modelo está en función de los errores y por
definición la covarianza de Et Yt es 0. Los Thetas y la significancia estadística son altas.
En la función de autocovarianza, en la tendencia que guardan los residuos refleja que hay
autocorrelación histórica de todos los residuos en el proceso, mientras que en la función de
autocorrelación el séptimo error hacia atrás es el que me aporta información, pero mas fuerte
en el rezago 1 y 2.
El elipse de confianza es estacionario porque está dentro
Esta volatilidad de los erros refleja muchas equivocaciones
Gran parte de la información esta centrada en la normalidad
COMPONENTE 4: MODELOS LOGIT Y PROBIT
MODELO LOGIT
Este modelo permite, además de obtener estimaciones de la probabilidad de un suceso,
identificar los factores de riesgo que determinan dichas probabilidades, así como la
influencia o peso relativo que éstos tienen sobre las mismas.
Este tipo de modelo arroja como resultado un índice, cuyos determinantes son
conocidos, el cual permite efectuar ordenaciones, las cuales al realizarse, posibilitan,
con algún método de estratificación, generar clasificaciones en las que se le asocia a
cada elemento una calificación. Existen muchos criterios para llevar a cabo la
asociación índice - calificación, muchos de ellos con base en índices de muestreo, donde
el criterio es puramente estadístico. Otros criterios podrían considerarse como
subjetivos.
Para el caso más sencillo, el de una única variable explicativa, se trata de encontrar la
relación que existe entre la variable explicativa y la endógena. Las posibilidades que se
plantean son:
Que la función que relaciona ambas variables sea una función lineal, caso en el cual se
tiene, lo que se ha denominado, el modelo lineal de probabilidad. Este asume que la
relación entre las variables explicativas y la variable explicada tiene un comportamiento
lineal, suposición que en muchos casos no se da, dando esta situación origen a los
modelos de regresión no lineales, dentro de los cuales se encuentran ubicados los
modelos Probit y Logit, siendo este último el que interesa y del cual a continuación se
hace un análisis detallado sobre su estructura y los fundamentos teóricos que lo
soportan. La modelización Logit es similar a la regresión tradicional salvo que utiliza
como función de estimación la función logística en vez de la lineal. Con la
modelización Logit, el resultado del modelo es la estimación de la probabilidad de que
un nuevo individuo pertenezca a un grupo o a otro, mientras que por otro lado, al
tratarse de un análisis de regresión, también permite identificar las variables más
importantes que explican las diferencias entre grupos.
Para comprender su modelación, si tenemos la siguiente función tomemos un ejemplo

econ la relación entre ingreso y ser propietario no de una casa:
Pi = β1 +β2Xi
donde X es el ingreso y Pi=E(Yi = 1|Xi) significa que la familia es propietaria de una

casa. Pero considere ahora la siguiente representación de la propiedad de vivienda:
donde: Zi = β1 + β2X
Esta función Pi representa lo que se conoce como función de distribución logística

acumulada de donde se obtiene la función del modelo Logit.
Por consiguiente, podemos escribir:
Y tomando el logaritmo natural, tenemos:
Es decir, L, el logaritmo de la razón de las probabilidades, no es sólo lineal en X, sino

también (desde el punto de vista de estimación) lineal en los parámetros. L se llama
Logit, y de aquí el nombre modelo Logit, para el modelo descrito anteriormente.
CARACTERISTICAS DEL MODELO LOGIT

1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de −∞ a +∞, el logit
L va de −∞ a +∞. Es decir, aunque las probabilidades (por necesidad) se
encuentran entre 0 y 1, los Logit no están acotados en esa forma.
2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son.
3. Aunque en el modelo anterior incluimos sólo una variable X, o regresora,
podemos añadir tantas regresoras como indique la teoría subyacente.
4. Si L, el logit, es positivo, significa que cuando se incrementa el valor de la(s)
regresora(s), aumentan las posibilidades de que la regresada sea igual a 1 (lo
cual indica que sucederá algo de interés). Si L es negativo, las posibilidades de
que la regresada iguale a 1 disminuyen conforme se incrementa el valor de X.
Para expresarlo de otra forma, el logit se convierte en negativo y se incrementa
en gran medida conforme la razón de las probabilidades disminuye de 1 a 0;
además, se incrementa en gran medida y se vuelve positivo conforme la razón de
las probabilidades aumenta de 1 a infinito.
5. De manera más formal, la interpretación del modelo dado es la siguiente: β2, la
pendiente, mide el cambio en L ocasionado por un cambio unitario en X, es
decir, dice cómo cambia el logaritmo de las posibilidades en favor de tener una
casa propia a medida que el ingreso cambia en una unidad, por ejemplo, $1 000.
El intercepto β1 es el valor del logaritmo de las posibilidades en favor de tener
una casa propia si el ingreso es cero. Al igual que la mayoría de las
interpretaciones de los interceptos, esta interpretación puede no tener significado
físico alguno.
6. Para datos de nivel individual, tomando el ejemplo de las familia que pueden o
no tener casa propia, si disponemos de datos sobre familias individuales, no es
factible la estimación de por MCO, lo cual es fácil de ver:
Estas expresiones no tienen sentido. Por consiguiente, si la información disponible está

en un nivel micro o individual, no podemos estimar la función Logit mediante la rutina
de MCO estándar. En esta situación quizá debamos recurrir al método de máxima
verosimilitud (MV) para estimar los parámetros.
Aplicación del modelo Logit para datos no agrupados o individuales
A fin de establecer el contexto, considere los datos de la tabla 15.7. Sea Y =1, si la

calificación final de un estudiante en un curso intermedio de microeconomía fue A, y Y
= 0 si esa calificación final fue B o C. Spector y Mazzeo utilizaron el GPA (promedio
de puntos de calificación),
Donde:
Los resultados de la regresión son los siguientes:

Análisis de los resultados de la Regresión:
En esta ecuación, cada coeficiente de pendiente es un coeficiente de pendiente parcial y

mide el cambio en el logit estimado correspondiente a una unidad de cambio del valor
de la regresada dada (con las demás regresoras constantes). Por tanto, el coeficiente del
GPA igual a 2.8261 significa que, mientras las demás variables se mantengan
constantes, si el GPA se incrementa en una unidad, en promedio el logit estimado
aumenta casi 2.83 unidades, lo cual indica una relación positiva entre ambos. Como se
aprecia, todas las demás regresoras tienen un efecto positivo en el logit, a pesar de que
en términos estadísticos el efecto de TUCE no es importante. No obstante, todas las
regresoras en conjunto tienen un impacto importante en la calificación final, pues el
estadístico RV es igual a 15.40, cuyo valor p es de casi 0.0015, el cual resulta muy
pequeño.
En esta tabla se observa que, de las 32 observaciones, hubo 6 pronósticos incorrectos

(estudiantes 14, 19, 24, 26, 31 y 32). Por tanto, el valor de la cuenta R2 es 26/32 =
0.8125, en tanto que el valor R2 McFadden es 0.3740. Aunque estos dos valores no se
pueden comparar de manera directa, dan una idea de los órdenes de magnitud. Además,
no se debe sobrevalorar la importancia de la bondad de ajuste en modelos para los que
la regresada es dicótoma.
MODELO PROBIT
El modelo de estimación que surge de una FDA2 normal se conoce comúnmente como
modelo probit, aunque algunas veces también como modelo normit. En principio, se
puede sustituir la FDA normal por la FDA logística .
Pero en lugar de seguir este camino, presentaremos el modelo probit basado en la teoría
de la utilidad, o de la perspectiva de selección racional con base en el comportamiento,
según el modelo desarrollado por McFadden. Para motivar el modelo probit, suponga
que en el ejemplo de propiedad de vivienda, la decisión de la i-ésima familia de tener
casa propia o de no tenerla depende de un índice de conveniencia no observable Ii
(también conocido como variable latente), determinado por una o diversas variables
explicativas, digamos, el ingreso Xi, de manera que entre mayor sea el valor del índice
Ii, mayor será la probabilidad de que la familia posea vivienda.
Expresamos el índice Ii como Ii = β1 +β2Xi donde Xi es el ingreso de la i-ésima

familia. ¿Cómo se relaciona el índice (no observable) con la decisión real de ser
propietario de una casa? Igual que antes, sea Y = 1 si una familia es propietaria de una
casa y Y = 0 si no lo es. Ahora bien, es razonable suponer que para cada familia hay un
nivel crítico o umbral del índice, que podemos denominar Ii∗, tal que si Ii excede a Ii∗,
la familia tendrá una casa propia, de lo contrario no lo hará. El umbral Ii∗, al igual que
Ii, no es observable, pero si suponemos que está distribuido normalmente con las
mismas media y varianza, es posible no sólo estimar los parámetros del índice dado en,
sino también obtener alguna información sobre el propio índice no observable. Este
cálculo se muestra de la siguiente manera. Con el supuesto de normalidad, la
probabilidad de que Ii∗ sea menor o igual que Ii se calcula a partir de la FDA normal
estándar como:
Como P representa la probabilidad de que ocurra un suceso, en este caso la probabilidad

de tener casa propia, se mide por el área de la curva normal estándar de −∞ a Ii, como se
muestra en la figura:
Ahora, para obtener información sobre Ii, el índice de utilidad, lo mismo que para β1 y
β2, se toma la inversa de Pi para obtener:
donde F−1 es la inversa de la FDA normal. El significado de todo esto se aclara con la fi
gura anterior. En el panel a) de esta figura se obtiene (de la ordenada) la probabilidad
(acumulada) de tener casa propia dado Ii∗ ≤ Ii, mientras que en el panel b) se obtiene
(de la abscisa) el valor de Ii dado el valor de Pi, que es simplemente el inverso del
primero. Pero, específicamente, ¿cómo obtenemos el índice Ii al igual que las
estimaciones de β1 y β2? Como en el caso del modelo logit, la respuesta depende que se
cuente con datos agrupados o desagrupados.
Estimación de probit con datos agrupados: gprobit
Dadas las siguientes Pi , se estima el índice Ii de la FDA normal estándar:

Con la siguiente grafica de distribución de la FDA normal:
Una vez estimado el Ii, se puede estimar β1 y β2 A propósito, observe que en el

lenguaje del análisis probit, el índice de utilidad no observable Ii se conoce simplemente
como desviación equivalente normal (d.e.n.) o sólo normit. Como la d.e.n. o Ii será
negativa siempre que Pi < 0.5, en la práctica se agrega el número 5 a la d.e.n. y el
resultado se denomina un probit.
Los resultados de la regresion son los siguientes:
Interpretación de las estimaciones de probit
Para averiguar el efecto de una unidad de cambio en X (ingreso medido en miles de

dólares) sobre la probabilidad de que Y = 1; es decir, que una familia adquiera una casa.
Deseamos tomar la derivada de esta función respecto de X (es decir, la tasa de cambio
de la probabilidad respecto del ingreso). Resulta que su derivada es:
dPi /dXi = f(β1 +β2Xi)β2 (15.9.5)32 donde ƒ(β1 + β2Xi) es la función de densidad de
probabilidad de la normal estandarizada evaluada en β1 + β2Xi. Resulta evidente que
esta evaluación dependerá del valor particular de las variables X. Tome el valor de X ,
por ejemplo, X = 6 (miles de dólares). Con los valores estimados de los parámetros
proporcionados deseamos encontrar la función de densidad normal en ƒ[−1.0166 +
0.04846(6)] = ƒ(−0.72548). Si consulta las tablas de distribución normal, encontrará que
para Z = −0.72548, la densidad normal es casi de 0.3066.33 Ahora, si multiplica ese
valor por el coeficiente de pendiente estimado de 0.04846, obtiene 0.01485. Esto
significa que si empieza con un nivel de ingreso de $6 000 y el ingreso aumenta $1 000,
la probabilidad de que una familia compre una casa se incrementa alrededor de 1.4%.
Como se ve en el análisis anterior, el cálculo de cambios en la probabilidad mediante el
modelo probit resulta un poco tedioso, en comparación con los modelos MLP y logit.
En vez de calcular los cambios en la probabilidad, suponga que deseamos encontrar las
probabilidades estimadas a partir del modelo gprobit ajustado.
SERIES DE TIEMPO
PRACTICAS EN CLASE MODELOS VAR´S ( VECTORES
AUTOREGRESIVOS)
Se estudia para acercar un fenomeno que no es univariado sino que va pasando a
multivariado para ir llegando a una mayor complejidad, ya que con esta se puede
observar todas las variables que afectan el fenomeno para poder darle solución al
problema. Por ejemplo el fenomeno de la inflacion no solo se lo estudia desde el punto
de vista del desempleo ahí otroa factores que influyen como la inversión, tipos de
cambios, etc, por decirlo a grozo modo.
Por esta explicacion podemos decir que partiendo de un modelo univariado se pasa a
un modelo multivariado:
SERIES UNIVARIADA: ᶺ θ U
Yt= θ0 + θ1Yt-1 + ………….θp Yt-p + U
Pasa a multivariado o multiserial:
Yt = θ0 + θ1Yt-1 + θ2Yt-2 + ………….θp Yt-p + U
Zt = ɣ0 + ɣ1 Zt-1 + ɣ2 Z t-2 + Ɛi t
……..
………
Wt = ȿ0 + ȿ1 Wt- 1 + ȿ2 W t-2 + Ɛ i t
Żt = K + Â Zt- k + U i y
= θ ∏+ θ it ȿ iy ∆∆ ᶺ
ɣ it ȿ iy
Por lo tanto esto expresa cuanto es el cambio de esta matriz de parametros como se
ve afectada en Z.
∆ A = ɚ Ẑit
Repaso MCOO
5 variables para apalicar series de tiempos

Estadisticos principales entre nuestras 5 variables, estas variables establecen una
relación lineal con PAMPA.
Matriz de correlacion
La relacion entre pampa explica a pampa o el precio de pampa explica a merval, la
menos relacionada indupa con irsa
Este modelo cuenta con una elevada significancia estadística, es decir, el modelo si
funciona.
Grafico de series de tiempo
Por separad0
Modelo de minimos cuadrados

Aquí se puede decir que hay un buen ajuste.
Aquí aparece F
Los valores p son significativos excepto tgsu
En el siguiente analisis se quita
Aquí se pueden verificar restricciones
MODELOS EN LOGARITMOS CON LAS MISMAS 5 SERIES.
MCO
EN LOGARITMO EL R2 AUMENTO POR LO TANTO SE AJUSTO MAS
EXTRAEMOS EL LOGARITMO DE DE TGSU 2

VAR 1 UNIVARIADO
SERIE DE TIEMPO 1 CON MERVAL

PORQUE TETA 1 ES MENOR A 1 Y ES ESTACIONARIO
AR 2
EL DATO DE HOY CON EL DATO DE AYER, SI LA SERIE ESTA TRIMESTRALIZADA LOS
DATOS TAMBIEN TIENEN QUE SERLO
CORRELOGRAMA DE RESIDUOS
MODELOS MA MEDIAS MOVILES
Vienen de los modelos ar, son modelos que tienden a cero, si cometimos un error en el
pasado lo más probable que no lo cometamos hoy.
Orden 1
Lo más pertinente es comparar un modelo AR con PAMPA
Ma de orden 2
Grafico con el tiempo

Logaritmo de pampa
Autocorrelación de residuos
Modelos aryma:
Es la combinación de ar y ma
MODELO BINARIO: LOGIT
Modelo de regresión no lineal, diseñado específicamente para analizar variables dependientes
de carácter dicotómico o datos de corte transversal.
El efecto marginal estimado correspondiente, obtenido de la columna de las pendientes de

resultado del modelo de regresión logística indica que por cada aumento de la variable
independiente en concreto (manteniéndose constantes el resto de variables) la probabilidad
de ocurrencia del valor 1 de la variable dependiente, se incrementa o disminuye (según sea
positivo o negativo) en el valor obtenido de la pendiente en concreto que se corresponde con
la variable independiente.
La bondad del ajuste, vendrá determinada por la R2 , cuanto más próxima al 1, mejor será el
ajuste y la capacidad predictiva del modelo sea elevada, el modelo se considera lo
suficientemente bueno para predecir la probabilidad de ocurrencia de la variable dependiente
en estudio.
El modelo Logit Binario, se utiliza para modelar perfiles de riesgos que permiten determinar si
la persona aplica o no para acceder a un crédito.
ANEXOS: CD
1ERA. RONDA DE EXPOSICIONES
2DA. RONDA DE EXPOSICIONES

Glosario de Econometría
AIC Criterio de información de Akaike.

Autocorrelación Correlación entre el valor actual y su valor retardado de una serie
temporal.
Autocovarianza Covarianza entre el valor actual y su valor retardado de una serie
temporal.
Autorregresión Modelo de regresión lineal que relaciona el valor actual de una
serie temporal con sus valores retardados (pasados), por ejemplo,
un AR (p).
Cointegración Compartición de una tendencia estocástica común por dos o más

series temporales.
Contraste de Procedimiento en el que se utiliza la evidencia sobre la muestra
hipótesis para ayudar a determinar si una hipótesis concreta sobre la
población es verdadera o falsa.
Correlación Medida sin unidades del nivel de movimiento o variación
conjunto entre dos variables aleatorias.
Covarianza Medida con unidades del nivel de movimiento o variación
conjunto entre dos variables aleatorias.
Criterio de Estadístico utilizado para estimar el número de retardos de las
información variables explicativas a incluir en un modelo autorregresivo, tal
como el criterio de información de Akaike (AIC) o el criterio de
información de Bayes (BIC).
Desviación Raíz cuadrada de la varianza. La desviación estándar de una

estándar variable aleatoria es una medida de dispersión de la distribución
de una variable alrededor de su media.
Distribución Distribución aproximada de una variable aleatoria calculada
asintótica empleando una muestra de gran tamaño.
Distribución Distribución de probabilidad de una variable aleatoria dado un
condicionada determinado valor de otra variable aleatoria.
Distribución Distribución con forma de campana normalmente empleada de
normal una variable aleatoria continua.
Distribución Distribución normal con media igual a 0 y varianza igual a 1,
normal estándar denotada por N (0, 1).
Error de predicción Diferencia entre el valor de la variable que ocurre en la realidad y

el valor que se predijo.
Error de tipo I Error cometido en un contraste de hipótesis cuando se rechaza la
hipótesis nula, sabiendo que es cierta.
Error de tipo II Error cometido en un contraste de hipótesis cuando no se rechaza
la hipótesis nula, sabiendo que es falsa.
Estacionariedad Situación que se produce cuando la distribución conjunto de una
serie temporal y sus valores retardados no cambia a lo largo del
tiempo.
Estadísticamente Situación que se produce cuando la hipótesis nula (normalmente,
no significativo que un coeficiente de regresión es cero) no puede rechazarse para
un nivel de significación dado.
Estadísticamente Situación que se produce cuando la hipótesis nula (normalmente,
significativo que un coeficiente de regresión es cero) puede rechazarse para un
nivel de significación dado.
Estimación Valor numérico de un estimador calculado a partir de datos de
una muestra específica.
Estimador Función de una muestra de datos extraída aleatoriamente de una
población.
Estimador Estimador que converge en probabilidad hacia el parámetro que
consistente se estima.
Estimador de Estimador del intercepto y la(s) pendiente(s) de una regresión que
mínimos cuadrados minimiza la suma de los residuos al cuadrado.
ordinarios (MCO)
Estimador Estimador cuyo sesgo es igual a cero.
insesgado
F-estadístico.- Estadístico empleado para contrastar una hipótesis conjunta relativa a

más de uno de los coeficientes de regresión.
Heteroscedasticidad Situación en la cual la varianza del término de error de la

regresión, condicionada sobre los regresores, no es constante.
Hipótesis Denotada por H1, es la hipótesis que es asumida como cierta si
alternativa la hipótesis nula es falsa.
Hipótesis conjunta Hipótesis consistente en dos o más hipótesis individuales, esto
es, que incluye más de una restricción sobre los parámetros del
modelo.
Hipótesis nula Hipótesis que se contrasta en un contraste de hipótesis,
normalmente denotada por H0.
Homoscedasticidad Situación en la cual la varianza del término de error de la
regresión, condicionada sobre los regresores, es constante.
Independencia .- Situación en la que conocer el valor de una variable aleatoria no

proporciona información sobre el valor de otra variable aleatoria.
Intercepto.- Término constante de la regresión.
Intervalo de confianza .- Intervalo (o conjunto) que contiene el verdadero valor de un

parámetro de la población con una probabilidad preespecificada cuando se computa
sobre muestras repetidas.
Matriz de Matriz formada por las varianzas y covarianzas de un vector de

covarianza variables aleatorias.
Media Valor esperado de una variable aleatoria.
MELI (BLUE en Mejor estimador lineal insesgado. Es un estimador que tiene la
inglés) menor varianza dentro de los estimadores que son una función
lineal de los valores de la muestra y es insesgado. Bajo el
teorema de Gauss-Markov, el estimador de Mínimos Cuadrados
Ordinarios (MCO) es el mejor estimador lineal insesgado de los
coeficientes de la regresión condicionado a los valores de los
regresores.
Modelo de Extensión del modelo de regresión simple que permite que la
regresión múltiple variable dependiente esté en función de varias variables
explicativas o regresores.
Modelo lineal- Función de regresión no lineal en la que la variable dependiente
logarítmico (lin- es lineal y la variable independiente es logarítmica.
log)
Modelo Función de regresión no lineal en la que la variable dependiente
logarítmico-lineal es logarítmica y la variable independiente es lineal.
(log-lin)
Modelo Función de regresión no lineal en la que la variable dependiente
logarítmico- es logarítmica y la variable independiente es logaítimica.
logarítmico (log-
log)
Nivel de confianza.- Probabilidad preespecificada de que un intervalo de confianza

contiene el verdadero valor de un parámetro.
Nivel de significación.- Probabilidad de rechazo preespecificada de un contraste de

hipótesis estadístico cuando la hipótesis nula es cierta.
Número de observación.- Identificador único asignado a cada entidad en un conjunto de

datos.
Panel de datos Datos para múltiples entidades donde cada entidad se observa en
dos o más periodos.
Parámetro Constante que determina una característica de una distribución de
probabilidad o una función de regresión poblacional.
Población Grupo de entidades, como personas o empresas, que se desean
estudiar.
p-valor Nivel de significación más pequeño para el que puede rechazarse
la hipótesis nula.
R2 ajustado Versión modificada del R2, la cual no se incrementa

necesariamente cuando aumenta el número de variables
explicativas o regresores de una regresión.
R2 o R cuadrado Fracción de la varianza de la muestra de la variable dependiente
que es explicada por las variables independientes o regresores en
una regresión.
Región de Conjunto de valores de un estadístico para los cuales se acepta
aceptación (no se rechaza) la hipótesis nula.
Región de rechazo Conjunto de valores de un estadístico para los cuales se rechaza
la hipótesis nula.
Regresor Variable independiente en una regresión (variable que aparece a
la derecha del igual en una regresión).
Retardo Valor de una serie temporal en un momento anterior
Serie temporal.- Datos para una misma entidad para múltiples periodos.
Sesgo.- Valor esperado de la diferencia entre un estimador y el párametro que se

estima.
Valor crítico Valor del estadístico del contraste para el cual el test rechaza la
hipótesis nula al nivel de significación preestablecido.
Valor esperado Valor medio a largo plazo de una variable aleatoria en
experimentos repetidos. Es la media ponderada en términos de
probabilidad de todos los posibles valores que puede tomar la
variable aleatoria.
Valor predicho Valor de la variable dependiente que es predicho por la línea de
regresión de mínimos cuadrados ordinarios.
Variable binaria Variable que sólo toma el valor 0 o el valor 1.
o dummy
Variable Variable que se explica en una regresión u otro modelo
dependiente estadístico (variable que aparece a la izquierda del igual en una
regresión).
Variable endógena Variable que está correlacionada con el término de error.
Variable que está determinada dentro del modelo de regresión.
Variable exógena Variable que no está correlacionada con el término de error.
Variable que está determinada fuera del modelo de regresión.
Variable Véase “Regresor”
explicativa
Varianza Valor esperado del cuadrado de la diferencia entre una variable
aleatoria y su media.

Manual de Clases para El Estudiante

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Clases para El Estudiante

Cargado por

Copyright:

Formatos disponibles

MATERIA:

 Albarracín Vergara Paola Lissette

El objetivo de realizar este documento sobre teoría y ejercicios de Econometría y

N1, n2, n3…nn ≈ N

COMPONENTE 1: MODELO DE REGRESION LINEAL SIMPLE

- Univariado Y= F(x) ~Yi = β0+β1Yi+ɛi

Yi = β0+β1 X1+ β2X2+…+ βn Xn + ɛi

En estadística se dice que un

Desempleo en el tiempo Ut = 5.80+0.0608w+ei (error esperado)

El modelo no sirve… porque el valor p en la constante es mayor a 0.05.

EL VALOR F Es menor a 0.05 … es significativo

La serie de tiempo es la secuencia de observaciones que son medidos y analizadas en el

Los modelos autorregresivos de orden 1 (Ar 1) donde la estimación se da por mínimos

Modelo de una serie de forma Ar(1)

En Ar (1) sólo se aplicará 1 rezago

Se observa que el valor de la constante es 8,51819 y Theta (0,996625) es menor a 1 se deduce

Normalidad de los residuos

Se tenía observaciones hasta el 29 de junio del 2017 pero se realizó proyecciones de 10

En este modelo el resultado de Constante es 0,0178323, y Pampa_2 0,0997077, por lo que el

Para comprender su modelación, si tenemos la siguiente función tomemos un ejemplo

donde X es el ingreso y Pi=E(Yi = 1|Xi) signiﬁca que la familia es propietaria de una

Esta función Pi representa lo que se conoce como función de distribución logística

Por consiguiente, podemos escribir:

Y tomando el logaritmo natural, tenemos:

Es decir, L, el logaritmo de la razón de las probabilidades, no es sólo lineal en X, sino

CARACTERISTICAS DEL MODELO LOGIT

Estas expresiones no tienen sentido. Por consiguiente, si la información disponible está

A ﬁn de establecer el contexto, considere los datos de la tabla 15.7. Sea Y =1, si la

Los resultados de la regresión son los siguientes:

En esta ecuación, cada coeﬁciente de pendiente es un coeﬁciente de pendiente parcial y

En esta tabla se observa que, de las 32 observaciones, hubo 6 pronósticos incorrectos

Expresamos el índice Ii como Ii = β1 +β2Xi donde Xi es el ingreso de la i-ésima

Como P representa la probabilidad de que ocurra un suceso, en este caso la probabilidad

Estimación de probit con datos agrupados: gprobit

Dadas las siguientes Pi , se estima el índice Ii de la FDA normal estándar:

Una vez estimado el Ii, se puede estimar β1 y β2 A propósito, observe que en el

Los resultados de la regresion son los siguientes:

Interpretación de las estimaciones de probit

Para averiguar el efecto de una unidad de cambio en X (ingreso medido en miles de

5 variables para apalicar series de tiempos

Modelo de minimos cuadrados

EXTRAEMOS EL LOGARITMO DE DE TGSU 2

SERIE DE TIEMPO 1 CON MERVAL

Grafico con el tiempo

El efecto marginal estimado correspondiente, obtenido de la columna de las pendientes de

1ERA. RONDA DE EXPOSICIONES

2DA. RONDA DE EXPOSICIONES

AIC Criterio de información de Akaike.

Cointegración Compartición de una tendencia estocástica común por dos o más

Desviación Raíz cuadrada de la varianza. La desviación estándar de una

Error de predicción Diferencia entre el valor de la variable que ocurre en la realidad y

F-estadístico.- Estadístico empleado para contrastar una hipótesis conjunta relativa a

Heteroscedasticidad Situación en la cual la varianza del término de error de la

Independencia .- Situación en la que conocer el valor de una variable aleatoria no

Intercepto.- Término constante de la regresión.

Intervalo de confianza .- Intervalo (o conjunto) que contiene el verdadero valor de un

Matriz de Matriz formada por las varianzas y covarianzas de un vector de

Nivel de confianza.- Probabilidad preespecificada de que un intervalo de confianza

Nivel de significación.- Probabilidad de rechazo preespecificada de un contraste de

Número de observación.- Identificador único asignado a cada entidad en un conjunto de

R2 ajustado Versión modificada del R2, la cual no se incrementa

Sesgo.- Valor esperado de la diferencia entre un estimador y el párametro que se