Está en la página 1de 23

UNIVERSIDAD NACIONAL DE CÓRDOBA

FACULTAD DE CIENCIAS ECONÓMICAS

PRIMER TRABAJO DE APLICACIÓN

GRUPO 16

Carrera: Licenciatura en Economía


Asignatura: Econometría
Profesor: Adrián Moneta Pizarro

2021
Ejercicio 1

a) En base a un modelo de la teoría económica que sea de interés para el grupo,


especificar un modelo econométrico uniecuacional de regresión lineal múltiple
aplicable a datos de corte transversal. Para esto, deberán buscar en la literatura la
correspondiente justificación de las posibles relaciones planteadas entre las variables.
Para definir el modelo, deben responder las siguientes preguntas: ¿qué variable se
propone como variable endógena?, ¿cuáles serían las variables explicativas?, y
¿cómo se espera que sea la relación entre estas variables? Tener en cuenta que no
es necesario condicionar la elección del modelo teórico a los resultados
econométricos posteriores.

Hemos tomado de la literatura económica una función de producción de tipo Cobb Douglas.
Ésta es una forma algebraica muy utilizada para aproximar determinados procesos
productivos. Esta función responde a la siguiente estructura analítica:

Donde A: es un parámetro positivo que mide la escala de la producción (es un indicador del
cambio tecnológico).

β es un parámetro positivo que mide cómo responde la producción cuando varía el uso del
factor capital.

α es un parámetro positivo que mide cómo responde la producción cuando varía el uso del
factor trabajo.

Una de las propiedades más importantes de esta función de producción radica en que es
lineal en términos de logaritmos naturales (esto será de suma importancia para nuestro
trabajo):

Para transformar esta función de la teoría económica, en una función propia de un modelo
econométrico, debemos incluir en ella la posible influencia de otras variables que no hemos
incluido en este modelo. Para ello, agregamos un término de error o perturbación aleatoria
que recoge el efecto de los factores no observados en la relación:

Nos queda así especificado el modelo econométrico de la función de producción Cobb


Douglas. En este caso, la variable Y, que representa el volumen de producción, es la
variable exógena, dependiente o explicada del modelo; L y K, que representan la cantidad
de trabajo y capital, respectivamente, son las variables endógenas, independientes o
explicativas. A, α y β son los parámetros del modelo (que supondremos constantes) y µ,
como se dijo anteriormente, representa el término de error o perturbación aleatoria. Se
espera que las variables guarden una relación positiva entre sí, esto es que, a mayor nivel
de capital y trabajo, mayor nivel de producción. Por este motivo, se espera que los
parámetros A, α y β asuman valores siempre positivos, por ende, las variables trabajo y
capital estarían positivamente relacionadas con la variable producción.

Este modelo será aplicado a datos de corte transversal ya que estudiaremos una muestra
de 37 países, con sus respectivas producciones y factores trabajo y capital.

b) Buscar y seleccionar una base con datos de corte transversal que les permita
contrastar empíricamente el modelo teórico propuesto en el inciso anterior. Para esto,
recomendamos explorar las páginas web de entes nacionales (Ministerio de
Economía, INDEC, AFIP y BCRA, entre otros) o de organismos internacionales (Banco
Mundial, FMI y otros). Es muy importante dejar indicada la fuente de los datos
seleccionados y el sitio web de donde fueron obtenidos.

Hemos decidido utilizar este tipo de función Cobb Douglas (linealizada) de producción para
estimar la división de la renta entre capital y trabajo en los países de la OCDE en el año
2017.

Para llevar a cabo la estimación se utiliza la famosa Penn World Table, se seleccionan los
37 países miembros de la OCDE y se extraen los datos correspondientes a las siguientes
secciones para el año 2017:

Como puede observarse, tanto la producción como el stock de capital están valuados en
dólares a paridad de poder adquisitivo en el año 2011. El trabajo, por su parte, se mide en
cantidad de personas empleadas.

Se citan al final del trabajo las páginas y base de datos utilizadas para realizar y plantear
esta estimación.

Se adjunta la base de datos utilizada para realizar la estimación por MCO:

COUNTRY Y K L

Germany 3805884 19033204 43,23632813

Austria 380619,5625 2518291,5 4,346899986

Belgium 453157,6563 3032260,75 4,757217407

Bulgaria 127809,3828 420190,0313 3,454327345

Czech Republic 324808,625 2278895,75 5,356266499

Croatia 91654,1875 556734,3125 1,53284204

Slovakia 148090,625 689147,1875 2,376909733

Spain 1557162,5 10450522 19,17537117


Estonia 35738,45703 185511,0625 0,65280354

Finland 216303,0781 1102754,375 2,526444435

France 2565994,25 15062345 27,90513229

Greece 243241,75 2442296,25 4,356856346

Hungary 244138,0781 1422003,125 4,472741127

Ireland 353160,875 1298682,625 2,088937044

Italy 2117242 16525972 24,57262421

Denmark 274271,6875 1499052,625 2,902802467

Lithuania 76692,6875 326608,0625 1,382975459

Latvia 46461,68359 397774,5313 0,893623471

Slovenia 59680,55078 453280,7188 0,995922804

Luxembourg 32807,05469 219834,4844 0,419243634

Netherlands 808999,0625 4163233,75 9,037130356

Poland 1027229,875 2638046 16,1368866

Portugal 253923,9375 2398430,5 4,848035812

Australia 1215688 5421295,5 12,25908089

Canada 1647159,125 8071759 18,70030212

Chile 399417,2813 1534204,625 8,121524811

Colombia 666578,25 2444396,25 23,06844711

Republic of 1886272,625 8896485 26,30535889


Korea

United States 17711024 60923964 154,4364471

Greece 243241,75 2442296,25 4,356856346

Israel 271320,1563 1170295,75 4,114510536

Japan 5020396 22900656 68,29595184

Mexico 2168958 9272062 56,19820023

Norway 442985,0313 1574070,75 2,805572271

New Zealand 169940,7813 617119,6875 2,529310703

United Kingdom 2525001 13221941 31,98050308

Turkey 2065728,25 8341127 27,02634811


c) Utilizando el programa EViews, estimar los parámetros del modelo aplicando el
método de mínimos cuadrados ordinarios (MCO). Interpretar los coeficientes
estimados, sus intervalos de confianza (calcularlos) y responder la siguiente pregunta:
¿coinciden los signos de los coeficientes con los esperados de acuerdo a la teoría?

Una vez armada la base de datos, se importa el modelo al software Eviews, se re-expresan
las variables en términos de logaritmos naturales y se realiza la estimación por mínimos
cuadrados ordinarios (MCO). A continuación, se presenta la correspondiente salida:

Como podemos observar, la estimación devuelve los siguientes valores para los
parámetros:

Calculando los intervalos de confianza, en Eviews resulta la siguiente salida:


De esta manera, interpretamos que no se encuentra incluido el 0 dentro de los intervalos y
es correcto afirmar que los coeficientes de las variables son distintos de 0 y, por ende,
significantes.

El valor de  representa el residuo de Solow. Éste es un número que describe el


crecimiento empírico de la productividad en una economía de un momento a otro. Es un
“residual” porque es la parte del crecimiento que no se contabiliza mediante medidas de
acumulación de capital o mayor insumo de trabajo. Es lógico, entonces, que el valor que
asume esta constante matemática sea mayor a cero.

Los coeficientes estimados se ajustan bastante bien a los esperados de acuerdo a la teoría.
Si prestamos atención, veremos que la suma de los parámetros alfa y beta es igual a
1,047218. En la forma original de la función Cobb Douglas, si los exponentes alfa y beta,
correspondientes a las variables, suman 1, se concluye que existen rendimientos
constantes a escala, y es la forma más conocida teóricamente para expresar este modelo
económico. De esta manera, una variación equiproporcional en la cantidad de capital y
trabajo implica una variación de la misma magnitud en la cantidad de producción. Por ende,
los signos de los coeficientes estimados son los esperados ya que implican una relación
positiva entre las variables.

d) Evaluar la calidad del ajuste del modelo analizando la significación individual de los
coeficientes por medio de las pruebas t y la validez global por medio de la prueba F y
el estadístico R cuadrado.

El coeficiente de determinación R cuadrado arroja un valor de 0,972675, el cual indica que


la calidad del modelo es buena y existe una relación lineal positiva entre las variables. Esto
nos indica que la variación en la producción es mayormente explicada por la variación en el
factor trabajo y por la variación del capital.

Podemos comprobar la significación individual de cada uno de los coeficientes, α y β , a


través de una prueba de hipótesis t. Para esto, se plantean las hipótesis:

El valor observado de la t de Student para cada uno de los casos viene dado por:
Vemos que el primer valor observado corresponde para el coeficiente de la variable trabajo,
mientras que el segundo corresponde a la prueba del coeficiente del capital.
El valor crítico para un nivel de significancia igual a α = 0,05 y grados de libertad iguales a
(n − p) = (37 − 3) = 34, proviene de calcular el valor de x tal que P (X ≤ x) = 0,975,
recordando que esta distribución es simétrica a dos colas.

Puesto que el t observado es mayor al t∗ (crítico) para ambos casos, se rechazan ambas
hipótesis nulas de las dos pruebas, por lo que concluimos que tanto α como β son
significativamente distintos de cero, y suponiendo la causalidad dada por la teoría
económica, K y L son explicativas de la variable Y.

Dados los valores tan pequeños de los p-valores en la salida de Eviews, era de esperar el
rechazo de la hipótesis nula, puesto que este valor nos indica cuál es la probabilidad de no
rechazar la hipótesis nula. Como el p-valor es menor al nivel de significancia, rechazamos la
hipótesis nula planteada. Asimismo, también podemos realizar una prueba de validez global
del modelo, empleando para ello un estadístico F. Para esto, se plantean las hipótesis nula
y alternativa:

En donde la hipótesis nula indica que ambos parámetros son iguales a cero, y la hipótesis
alternativa indica que al menos uno de ellos es significativamente distinto de cero. El
estadístico de prueba bajo hipótesis nula es:

Que coincide con el valor arrojado por la salida de Eviews. El valor crítico proviene de
calcular el valor de x de una distribución F de Snedecor para el cual P (X ≤ x) = 0,95,
recordando que esta es una prueba unilateral derecha. Los grados de libertad del
numerador son (p − 1) = (3 − 1) = 2 y los del denominador (n − p) = (37 − 3) = 34
Nuestro F* es igual a 3,2758.

De esta forma, puesto que el F observado > F∗ se rechaza la hipótesis nula, y se concluye
que al menos una de las variables, K o L, contribuye a explicar la variable exógena del
modelo, Y. Concluimos entonces que, de acuerdo a los valores de la estimación realizada,
la participación relativa del trabajo en el producto total de los países de la OCDE es del
48%, mientras que la participación relativa del capital es del 56%.

e) Examinar y evaluar la especificación del modelo. En caso de considerar necesaria


alguna modificación, tener presente la teoría económica para eliminar o agregar
variables. Suponiendo que se haya excluido erróneamente una variable explicativa:
¿cómo se justifica su incorporación al modelo? y ¿qué prueba se debe utilizar para
verificar la contribución incremental de dicha variable al modelo? Realizar los cálculos
pertinentes con EViews seleccionando para esto alguna variable omitida en la
estimación del punto c) que consideren podría mejorar el ajuste. Se recomienda
previamente repasar la prueba de variables omitidas (Omitted variables test en
EViews) en los capítulos 8 y 13 de Gujarati y Porter (2010).

Creemos que la especificación del modelo es muy acorde, prestando atención no solo al R
cuadrado de gran valor, sino también al R cuadrado ajustado, con el cual deberíamos
comparar modelos en caso de ser necesario. Este último presenta un valor de 0.9710, es
decir que difícilmente se pueda mejorar mucho más el modelo. Es poco probable que en los
modelos econométricos se encuentre un R cuadrado ajustado de 1. Por ende, no creemos
conveniente la exclusión de ninguna de las dos variables, ya que el R cuadrado ajustado en
dichos casos es inferior al del modelo que corresponde a la interacción de ambas variables.

Es así
que no

creemos conveniente la exclusión de variables, como


así tampoco la inclusión de otras, ya que difícilmente el R cuadrado ajustado aumente,
teniendo en cuenta que el mismo penaliza la incorporación de variables frente a la pérdida
de grados de libertad, por lo que incluso, tal vez, éste tienda a ser menor. Por otro lado, la
teoría económica incluye un fuerte sustento con respecto a esta manera de relacionar las
variables de producción, estableciéndose que es la más indicada en el general de los casos.

Suponiendo que se haya excluido erróneamente una variable explicativa, podemos usar
varios criterios de inclusión al modelo. Estos son por el procedimiento forward, backward o
el stepwise. Generalmente el más utilizado es el backward, el cual consiste en partir del
modelo general, con todas las variables incluidas, y luego se eliminan paso a paso las
variables menos significativas, en el orden de mayor a menor significancia. Sin embargo,
para el caso de la inclusión de una variable al modelo, quizá sea más eficiente el método
stepwise, donde se parte del modelo más sencillo y se van incluyendo variables en forma
sucesiva comparando la significancia de todos los coeficientes. Por otro lado, puede
llevarse a cabo una prueba de contraste de razón de verosimilitud, partiendo del modelo
restringido, sin la variable erróneamente excluida, y rechazando la hipótesis nula de que la
variable omitida es relevante, para de esta forma corroborar que en realidad hemos excluido
erróneamente la variable. Además, la inclusión debe ir acompañada del sostén económico
que avale la inclusión significativa de la variable para explicar el modelo. Para ello se lleva a
cabo la prueba t de significancia individual, asegurándose que las variables se verifiquen
significantes. A su vez, podemos comparar los R cuadrados ajustados de Theil para
establecer cuánto poder explicativo agrega la variable erróneamente excluida al modelo que
si la contiene.

Ejercicio 2

a) Realizar con EViews un análisis exploratorio de los datos graficando los diagramas
de dispersión que sean de interés y calculando la matriz de correlaciones. ¿Es posible
identificar, a priori, alguna relación entre las variables?

Analizando la tabla de covarianzas generada por Eviews, lo más notorio aquí es la


importante correlación negativa entre el desempleo y el crecimiento (-0,382); no así con
respecto al desempleo y el nivel de apertura comercial, cuya correlación se puede
considerar baja. Con respecto al crecimiento y el grado de apertura comercial, existe una
correlación positiva, pero de baja significancia.
Por otro lado, observando la matriz de los gráficos de dispersión, contrastando todas las
variables se observa:
Al igual que en el caso anterior es visible una relación negativa entre la variable crecimiento
y desempleo, pero no muy acentuada, al menos lo que puede deducirse del gráfico.
Comparando el desempleo con el grado de apertura comercial, solo observando estos
gráficos, no logra apreciarse muy claramente el tipo de correlación existente entre las
variables. Por otro lado, entre comercio y crecimiento sucede algo parecido.

b) Ajustar por mínimos cuadrados ordinarios (MCO) un modelo adecuado para


explicar el desempleo utilizando como variables explicativas el crecimiento del PIB y
el grado de apertura comercial. Interpretar los coeficientes estimados y evaluar la
calidad del ajuste.

Estimando el modelo por MCO tomando al desempleo como variable endógena, explicada a
su vez por el grado de apertura del comercio y del crecimiento del PIB, se obtuvo la
siguiente salida:
Se puede observar que el coeficiente de la variable crecimiento es -0.2787, es decir que
dicha variable está negativamente relacionada con el desempleo, algo que se suponía
previamente. Por otro lado, el coeficiente de la variable comercio es de 0.0041, es decir que
no es un coeficiente muy importante, ya que un cambio en la variable comercio, no genera
un gran impacto sobre la variable desempleo, agregando, además, que existe una relación
positiva entre ambas variables.

Por otro lado, tomando en cuenta la calidad de ajuste, se puede realizar un análisis variable
a variable, observando los valores del p-value que facilita la salida de Eviews. En el caso de
dócimas de coeficientes, se plantea como hipótesis nula que el coeficiente es igual a 0, es
decir que la variable no aporta poder explicativo al modelo. Es así que se plantea como
hipótesis alternativa que el coeficiente es distinto de 0, por ende, aporta explicación a la
variable endógena. De esta forma, un p-valor menor al nivel de significancia, nos indica que
debemos rechazar la hipótesis nula.

En el caso de la variable crecimiento, vemos que el p-valor es mayor al nivel de


significancia, que por defecto Eviews arroja como 5% o 0.05. De esta forma no rechazamos
la hipótesis nula, por ende, no encontramos evidencia suficiente para poder suponer que la
variable tiene poder explicativo sobre la variable desempleo. Lo mismo ocurre con la
variable comercio.
Podemos ver, además, que el R cuadrado de la regresión es un valor relativamente bajo,
por ende, el ajuste del modelo es bastante pobre.

Adicionalmente, tomando en cuenta la prueba F de validez global del modelo, se cuenta con
el F observado para contrastar la validez general del modelo, el cual adquiere un valor de
1.8811. En esta prueba se establece como hipótesis nula que ambos coeficientes son
iguales a 0, y como hipótesis alternativa, que al menos uno de los coeficientes es distinto de
0.
Debemos encontrar el valor crítico F en su tabla de valores. En cuanto al numerador, los
grados de libertad serían 2, ya que la forma de calcularlo es p-1, por ende, al tener 3
parámetros (contando el intercepto), debemos restarle 1. Así resulta 3-1=2. En cuanto al
denominador, tenemos 25 observaciones (n=25). P, como se mencionó, es 3. De esta forma
los grados de libertad del denominador serían 25-3=22.
En la tabla:
De esta forma, el valor crítico es 3,443, por lo cual el valor observado cae en la zona de no
rechazo de la hipótesis nula. Esto lleva a suponer que en realidad estos coeficientes son
iguales a 0 y sus variables asociadas no aportan poder explicativo a la variable endógena
“desempleo”.

c) Teniendo en cuenta lo analizado en los puntos anteriores y en otras pruebas de


interés que puedan llevarse adelante, determinar si es necesaria una modificación en
la especificación del modelo que excluya alguna de las variables explicativas
propuestas. En tal caso, re-especificar y estimar el nuevo modelo.

Por lo analizado previamente, puede verse a simple vista que se necesita una re-
especificación del modelo. Para ello, se llevó a cabo la realización de las dócimas de
restricciones lineales homogéneas del modelo, para evaluar la posible exclusión de alguna
de las variables. De esta forma, se estimará un modelo para cada caso en donde se excluya
una u otra variable explicativa. Para analizar la validez del modelo se debe contrastar los
valores F, comparando entre el modelo original y el re-especificado. Por un lado, realizando
los cálculos manuales del F observado según la fórmula establecida:

SCRr hace referencia a la suma de cuadrados residuales del modelo restringido, mientras
que SCRn refiere a lo mismo, pero del modelo no restringido, es decir del original. Para ello,
re-estimamos el modelo, sin incluir la variable que se desea omitir para observar los
posibles resultados de dicha estimación. Es por esto que se estimaron dos modelos, uno
excluyendo la variable crecimiento y otro excluyendo la variable comercio.

En primer lugar, se busca en la tabla el valor F crítico para este caso. Nos encontramos con
1 solo grado de libertad en el numerador ya que la diferencia de parámetros entre el modelo
original y el restringido, en ambos casos, es igual a 1: los grados de libertad en una resta es
la resta de los grados de libertad que implica esta diferencia de SCR. En el caso del
denominador, seguimos contando con 22 grados de libertad. De esta forma nuestro F crítico
es 4,301(puede corroborarse en la tabla expuesta anteriormente).

Una vez re-estimados los modelos, para el cálculo de los F observados, debemos fijarnos
en “sum squared resid” que indica la suma de cuadrados residuales o SCR de cada modelo
por separado. Con todos los datos podemos aplicar la fórmula. Tenemos en cada caso:

a) Fobs: (3705231-3704859) / (3704859/ (25-3)) =0,0022


b) Fobs: (4338264 -3704859) / (3704859/ (25-3)) = 3,7612

Vemos que, en ambas pruebas, comparando con el F crítico, el resultado es no rechazar la


hipótesis nula, por ende, no existen pruebas suficientes que indiquen que los coeficientes
de las variables (comercio o crecimiento) sean distintas de 0.

Por el otro lado, podemos hacer mediante Eviews un “Wald test” para un diagnóstico de
coeficientes, donde se restringen a 0 uno de los coeficientes de la regresión lineal inicial.
Podemos comprobar que los F calculados para cada caso son iguales a los calculados
manualmente, a su vez que comprobamos que los grados de libertad están bien
establecidos.
Sin embargo, a pesar de los resultados, podemos llevar a cabo una comparación entre los
modelos, para determinar si uno ajusta mejor que otro, y si es necesaria una re-estimación
del modelo original. Para ello podemos hacer un análisis de bondad de ajuste comparando
los R cuadrados ajustados de los modelos expuestos para poder analizar cuál es el modelo
que mejor ajusta la explicación de la variable desempleo. De la salida de Eviews podemos
observar que el R cuadrado ajustado del modelo original que contiene ambas variables es
de 0.0684. Por otro lado, el modelo que solo incluye la variable comercio nos arroja un valor
R cuadrado ajustado de -0.0434, un valor extremadamente pobre. Por último, ese indicador
en el modelo que incluye solo la variable crecimiento del PIB nos indica un R cuadrado
ajustado de 0.1088. Vemos con claridad que, mediante esta comparación de modelos,
tomado en cuenta el R cuadrado, el cual penaliza la incorporación de variables por la
pérdida de grados de libertad frente al poder explicativo de dicha variable sobre la variable
endógena, concluimos que el modelo más adecuado es aquel que incluye solo a la variable
crecimiento. Más allá del análisis econométrico que se está llevando a cabo, no debemos
olvidar la teoría económica. Pensando en términos económicos, podemos encontrar que en
realidad el crecimiento en el nivel de la actividad económica tiene efecto sobre el desempleo
y son variables que se analizan a la par en estudios sobre los cambios en el PIB y su
consecuencia en el desempleo. Por ende, creemos que es una variable significativa desde
el punto de vista económico, por ende, es un modelo acertado. A su vez, debemos recordar
que la influencia de una sola variable sobre la variable dependiente, no podrá tener
demasiado poder explicativo por sí sola. Quizá, en la medida que se agregan variables
significativas y el modelo se va complejizando, la variable crecimiento seguramente se
tornará significativa.

Es de esta forma que nos quedaría el siguiente modelo estimado, con la ecuación
especificada:
Siendo C (1) la ordenada al origen o intercepto y C (2) el coeficiente de la variable
crecimiento. Vemos que en esta re-estimación, contamos ahora con un modelo de regresión
lineal simple, cuyo coeficiente de la variable explicativa es -0.2785. Observamos, al igual
que en el modelo original, que la variable explicativa está negativamente relacionada con la
variable desempleo.

d) ¿Existe algún cambio estructural en los coeficientes estimados? En caso afirmativo,


determinar en qué momentos ocurren estos quiebres aplicando en primer lugar los
métodos de residuos recursivos, coeficientes recursivos, CUSUM y CUSUMQ. En
segundo lugar, utilizar la dócima de quiebre estructural de Chow para verificar la
existencia del o los quiebres encontrados con las pruebas anteriores.

Para analizar la posible existencia de un cambio estructural en nuestro modelo reestimado,


acudiremos primeramente a analizar la estabilidad de los coeficientes del modelo mediante
distintos métodos:

COEFICIENTES RECURSIVOS:

Analizaremos las salidas de Eviews de los coeficientes


recursivos, donde se trabaja con la secuencia de cada
coeficiente estimado por MCO y sus respectivas bandas
de confianza establecidas como +/- 2 veces sus errores
estándares.

Llamamos C (1) al coeficiente de la ordenada al origen,


es decir el intercepto, que corresponde al primer gráfico.
Llamamos C (2) al coeficiente de la variable explicativa,
es decir de la variable “crecimiento”.
Obviando los primeros valores de esta serie, ya que los mismos resultan claramente
inestables por haber sido obtenidos con pocas observaciones, podemos notar que tanto el
intercepto como el coeficiente 2, C (2), es decir el correspondiente a la variable crecimiento,
se comportan estables y convergen a un valor en la serie. No existen, así, indicios de un
quiebre estructural.

RESIDUOS RECURSIVOS:

En este método se crea una serie de residuos agregando secuencialmente una a una las
observaciones, para formular la ecuación en cada periodo:

Bt-1 son los coeficientes estimados por MCO


de las primeras t-1 muestras. El producto del
segundo término no es más que el Y
estimado en el momento t, mientras que el
primer término, yt, es el valor observado de
la variable endógena. Otra vez nos
encontramos con un gráfico de la serie de
residuos recursivos con su respectiva banda
de confianza (dos veces el error estándar de
la regresión). En este método, puede
observarse un quiebre estructural cuando
algún residuo se ubica por fuera de la banda
de confianza. Mientras los valores se
encuentren dentro de la banda, no puede
rechazarse la hipótesis nula de que la media
de los residuos sea 0. Analizando la
estabilidad del gráfico, se pueden divisar
pequeñas desviaciones de la banda en 1996
y 2009.

CUSUM:

Este método se basa en un estadístico


formado por la suma acumulada de los
residuos recursivos. Se establece que un
desvío significativo del valor 0 podría
implicar un quiebre estructural, así como
también el hecho de que un valor se aleje
de la banda. Si bien ningún valor sobrepasa
la banda, observamos que el estadístico
comienza a desviarse de 0 en el año 1995,
para en los próximos años tener una
tendencia a volver a dicho valor. Sin
embargo, se produce un salto importante
nuevamente en 2002, para comenzar a descender y luego alejarse totalmente del nivel 0 en
el año 2009.

CUSUMQ:

Un método muy similar al anterior, a


diferencia que en este caso contamos
con la suma acumulada de los
cuadrados de los residuos recursivos.
Los puntos más alejados de la banda
indican cambio estructural. El punto
más lejano de la banda es donde se da
el quiebre. Prestando atención a este
caso, observamos que en realidad no
hay ninguna observación que
sobrepase la banda.

Teniendo en cuenta estos análisis, se llevó a cabo la prueba de quiebre estructural de


Chow. En este caso, para corroborar los posibles años donde ocurre el quiebre, se
realizaron varias pruebas:

Tomando en cuenta las conclusiones de los residuos recursivos, podría existir un quiebre
estructural en 1996. Sin embargo, la prueba de Chow, observando el p-value de la prueba
F, nos deja concluir que no existen evidencias suficientes para decir que hay quiebre
estructural en este año:
Para el caso del año 2009, la dócima de Chow nos arroja que se rechaza la hipótesis nula
de que no exista un cambio estructural, por ende, puede significar que dicho año los
coeficientes de las variables dejen de ser constantes e iguales. Sin embargo, seguiremos
con el análisis.

Para el caso del análisis del método CUSUM, tomando el año 2002 como posible quiebre
estructural, la dócima de Chow nos arroja:

Vemos claramente que, debido al p-valor menor al nivel de significancia, debemos rechazar
la hipótesis nula de que no existen quiebres estructurales en dicho año.

Es así que nos encontramos con dos posibles años de quiebre estructural, 2002 o 2009.

e) Corroborar el cumplimiento de los tres supuestos necesarios para la prueba de


quiebre estructural de Chow y re-estimar el modelo contemplando los posibles
quiebres. Comparar este modelo con el estimado en el inciso c). ¿Cuál presenta un
mejor ajuste?

Los supuestos que deben cumplirse en la prueba de quiebre estructural de Chow, son
aquellos referidos a los errores de las regresiones de cada submuestra.
Dichos supuestos son:

-Distribuciones normales: Para este análisis separaremos la muestra en 2 a partir del


quiebre estructural. Es decir que tendremos una muestra desde 1991 hasta 2002 y de 2003
a 2015 para el caso del quiebre estructural del año 2002. De esta forma estimaremos el
modelo 2 veces, una tomando la primera muestra, y luego estimando a partir de la segunda
muestra. Luego de ello analizaremos el histograma de los residuos para analizar la
distribución normal. De esta forma resulta:

Vemos que en ambas muestras los errores se distribuyen normal, siendo esto visible tanto
en la forma del histograma como en el valor de las medias cercanas a 0 y un índice de
Kurtosis que se aproxima a 3, es decir, a una distribución normal.

-Distribuciones independientes:

Analizando los gráficos de distribución de los residuos de cada submuestra, vemos que no
se repiten patrones en su distribución por ende podemos concluir que siguen distribuciones
independientes y no están correlacionados entre sí.

-Igualdad de varianzas: es tal vez el supuesto más crítico y necesario de verificar, ya que ni
siquiera en el límite puede suponerse igualdad de varianzas.
Para analizar este supuesto recurrimos a la prueba de varianzas F con un nivel de
significancia del 0.025 para mayor exigencia. Recordemos que esta prueba es solo de cola
derecha. Nuestra hipótesis nula es que las varianzas de las muestras son iguales, mientras
que la alternativa es que las mismas son distintas entre sí.
Es así que, mediante Eviews encontramos la varianza de cada submuestra.
Varianza de la muestra con datos 1991-2002: 9,82786
Varianza de la muestra con datos 2003-2015: 5,87424

Construimos así nuestro F observado realizando el cociente entre ambas varianzas,


colocando la mayor de ellas en el numerador.

Fobs: 9,82786/5,87424 = 1,67304

Comparando con el valor crítico F que tiene como grados de libertad los tamaños de las
muestras, en el numerador tenemos un n=12 mientras que en el denominador n=13.
Nuestro F crítico es de 3,153. De esta forma concluimos que no se debe rechazar la
hipótesis nula que las varianzas de las muestras son iguales entre sí y finalmente podemos
decir que la dócima de quiebre estructural de Chow puede llevarse a cabo y es correcta, ya
que se cumplen los supuestos base.

Por ende, para poder re-estimar el modelo de forma que se tenga en cuenta el quiebre
estructural, procedemos a analizar nuevamente los posibles quiebres.

Si bien gráficamente es más visible el cambio estructural en el año 2009, cuando re-
estimamos el modelo para tener en cuenta este quiebre, mediante la creación de una
variable ficticia, se muestran resultados interesantes:

Creando la variable ficticia, teniendo en cuenta el cambio en 2009, la estimación por MCO
establece:

Vemos que el coeficiente de la variable crecimiento multiplicada por la variable ficticia, nos
indica un p-value muy alto, por ende, no es una variable significativa. Re-estimamos el
modelo, excluyendo esta variable por el método backward:
Podemos analizar que todas las variables son significativas, incluso la variable crecimiento,
que en el modelo re-estimado del inciso anterior no era totalmente significativa. A la vez, es
interesante el valor del R cuadrado ajustado de este modelo frente al modelo re-estimado
en el inciso anterior, ya que contamos con un R cuadrado mucho más alto, permitiéndonos
comparar los modelos. Por ende, al agregar este quiebre estructural en la estimación del
modelo, este se vuelve mucho más explicativo y las variables ajustan bien.

Sin embargo, podemos continuar con el análisis. Teniendo en cuenta ahora que el quiebre
estructural se da en 2002 y no en 2009, podemos construir una variable ficticia que refleje
este cambio y podemos re-estimar el modelo por MCO, arrojando la siguiente salida:
Podemos observar que todas las variables son significativas, y sorprendentemente,
contamos con un R cuadrado ajustado todavía mayor, no solo mayor al del modelo del
inciso anterior, sino que también mayor comparado al correspondiente al quiebre estructural
del 2009.
Analizando estas posibilidades, no debemos pasar por alto un detalle significativo. Estamos
frente a un modelo que refleja datos para la economía argentina de los años 1991-2015
sobre la tasa de desempleo, la tasa de crecimiento anual del PIB real y el grado de apertura
comercial en términos del PIB. Hemos de recordar que, en el año 2001, Argentina atraviesa
una gran crisis económica con fuerte impacto en diversos sectores. Tomando este dato de
la teoría económica, parece lógico que se produzca un quiebre estructural de los
coeficientes de dichas variables a partir del año 2002, que reflejarían las consecuencias de
la crisis atravesada. Por otro lado, también contamos con la crisis económica ocurrida en
2008, por lo cual, un quiebre estructural en 2009 también puede ser tenido en cuenta.
Bibliografía:
Swoboda, C. (2016). Microeconomía Intermedia: Una aproximación matemática. (2da Ed)
Córdoba, Argentina: Asociación Cooperadora de la Facultad de Ciencias Económicas.

Organización para la cooperación y el desarrollo económico (OCDE): Penn World Table.


Recuperado el día 20 del mes de agosto, del año 2021. Disponible en: https://data.oecd.org/

Gujarati, N; Porter, C. (2010) Econometría (5ta Ed). México: Mc Graw Hill.

También podría gustarte