Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GRUPO 16
2021
Ejercicio 1
Hemos tomado de la literatura económica una función de producción de tipo Cobb Douglas.
Ésta es una forma algebraica muy utilizada para aproximar determinados procesos
productivos. Esta función responde a la siguiente estructura analítica:
Donde A: es un parámetro positivo que mide la escala de la producción (es un indicador del
cambio tecnológico).
β es un parámetro positivo que mide cómo responde la producción cuando varía el uso del
factor capital.
α es un parámetro positivo que mide cómo responde la producción cuando varía el uso del
factor trabajo.
Una de las propiedades más importantes de esta función de producción radica en que es
lineal en términos de logaritmos naturales (esto será de suma importancia para nuestro
trabajo):
Para transformar esta función de la teoría económica, en una función propia de un modelo
econométrico, debemos incluir en ella la posible influencia de otras variables que no hemos
incluido en este modelo. Para ello, agregamos un término de error o perturbación aleatoria
que recoge el efecto de los factores no observados en la relación:
Este modelo será aplicado a datos de corte transversal ya que estudiaremos una muestra
de 37 países, con sus respectivas producciones y factores trabajo y capital.
b) Buscar y seleccionar una base con datos de corte transversal que les permita
contrastar empíricamente el modelo teórico propuesto en el inciso anterior. Para esto,
recomendamos explorar las páginas web de entes nacionales (Ministerio de
Economía, INDEC, AFIP y BCRA, entre otros) o de organismos internacionales (Banco
Mundial, FMI y otros). Es muy importante dejar indicada la fuente de los datos
seleccionados y el sitio web de donde fueron obtenidos.
Hemos decidido utilizar este tipo de función Cobb Douglas (linealizada) de producción para
estimar la división de la renta entre capital y trabajo en los países de la OCDE en el año
2017.
Para llevar a cabo la estimación se utiliza la famosa Penn World Table, se seleccionan los
37 países miembros de la OCDE y se extraen los datos correspondientes a las siguientes
secciones para el año 2017:
Como puede observarse, tanto la producción como el stock de capital están valuados en
dólares a paridad de poder adquisitivo en el año 2011. El trabajo, por su parte, se mide en
cantidad de personas empleadas.
Se citan al final del trabajo las páginas y base de datos utilizadas para realizar y plantear
esta estimación.
COUNTRY Y K L
Una vez armada la base de datos, se importa el modelo al software Eviews, se re-expresan
las variables en términos de logaritmos naturales y se realiza la estimación por mínimos
cuadrados ordinarios (MCO). A continuación, se presenta la correspondiente salida:
Como podemos observar, la estimación devuelve los siguientes valores para los
parámetros:
Los coeficientes estimados se ajustan bastante bien a los esperados de acuerdo a la teoría.
Si prestamos atención, veremos que la suma de los parámetros alfa y beta es igual a
1,047218. En la forma original de la función Cobb Douglas, si los exponentes alfa y beta,
correspondientes a las variables, suman 1, se concluye que existen rendimientos
constantes a escala, y es la forma más conocida teóricamente para expresar este modelo
económico. De esta manera, una variación equiproporcional en la cantidad de capital y
trabajo implica una variación de la misma magnitud en la cantidad de producción. Por ende,
los signos de los coeficientes estimados son los esperados ya que implican una relación
positiva entre las variables.
d) Evaluar la calidad del ajuste del modelo analizando la significación individual de los
coeficientes por medio de las pruebas t y la validez global por medio de la prueba F y
el estadístico R cuadrado.
El valor observado de la t de Student para cada uno de los casos viene dado por:
Vemos que el primer valor observado corresponde para el coeficiente de la variable trabajo,
mientras que el segundo corresponde a la prueba del coeficiente del capital.
El valor crítico para un nivel de significancia igual a α = 0,05 y grados de libertad iguales a
(n − p) = (37 − 3) = 34, proviene de calcular el valor de x tal que P (X ≤ x) = 0,975,
recordando que esta distribución es simétrica a dos colas.
Puesto que el t observado es mayor al t∗ (crítico) para ambos casos, se rechazan ambas
hipótesis nulas de las dos pruebas, por lo que concluimos que tanto α como β son
significativamente distintos de cero, y suponiendo la causalidad dada por la teoría
económica, K y L son explicativas de la variable Y.
Dados los valores tan pequeños de los p-valores en la salida de Eviews, era de esperar el
rechazo de la hipótesis nula, puesto que este valor nos indica cuál es la probabilidad de no
rechazar la hipótesis nula. Como el p-valor es menor al nivel de significancia, rechazamos la
hipótesis nula planteada. Asimismo, también podemos realizar una prueba de validez global
del modelo, empleando para ello un estadístico F. Para esto, se plantean las hipótesis nula
y alternativa:
En donde la hipótesis nula indica que ambos parámetros son iguales a cero, y la hipótesis
alternativa indica que al menos uno de ellos es significativamente distinto de cero. El
estadístico de prueba bajo hipótesis nula es:
Que coincide con el valor arrojado por la salida de Eviews. El valor crítico proviene de
calcular el valor de x de una distribución F de Snedecor para el cual P (X ≤ x) = 0,95,
recordando que esta es una prueba unilateral derecha. Los grados de libertad del
numerador son (p − 1) = (3 − 1) = 2 y los del denominador (n − p) = (37 − 3) = 34
Nuestro F* es igual a 3,2758.
De esta forma, puesto que el F observado > F∗ se rechaza la hipótesis nula, y se concluye
que al menos una de las variables, K o L, contribuye a explicar la variable exógena del
modelo, Y. Concluimos entonces que, de acuerdo a los valores de la estimación realizada,
la participación relativa del trabajo en el producto total de los países de la OCDE es del
48%, mientras que la participación relativa del capital es del 56%.
Creemos que la especificación del modelo es muy acorde, prestando atención no solo al R
cuadrado de gran valor, sino también al R cuadrado ajustado, con el cual deberíamos
comparar modelos en caso de ser necesario. Este último presenta un valor de 0.9710, es
decir que difícilmente se pueda mejorar mucho más el modelo. Es poco probable que en los
modelos econométricos se encuentre un R cuadrado ajustado de 1. Por ende, no creemos
conveniente la exclusión de ninguna de las dos variables, ya que el R cuadrado ajustado en
dichos casos es inferior al del modelo que corresponde a la interacción de ambas variables.
Es así
que no
Suponiendo que se haya excluido erróneamente una variable explicativa, podemos usar
varios criterios de inclusión al modelo. Estos son por el procedimiento forward, backward o
el stepwise. Generalmente el más utilizado es el backward, el cual consiste en partir del
modelo general, con todas las variables incluidas, y luego se eliminan paso a paso las
variables menos significativas, en el orden de mayor a menor significancia. Sin embargo,
para el caso de la inclusión de una variable al modelo, quizá sea más eficiente el método
stepwise, donde se parte del modelo más sencillo y se van incluyendo variables en forma
sucesiva comparando la significancia de todos los coeficientes. Por otro lado, puede
llevarse a cabo una prueba de contraste de razón de verosimilitud, partiendo del modelo
restringido, sin la variable erróneamente excluida, y rechazando la hipótesis nula de que la
variable omitida es relevante, para de esta forma corroborar que en realidad hemos excluido
erróneamente la variable. Además, la inclusión debe ir acompañada del sostén económico
que avale la inclusión significativa de la variable para explicar el modelo. Para ello se lleva a
cabo la prueba t de significancia individual, asegurándose que las variables se verifiquen
significantes. A su vez, podemos comparar los R cuadrados ajustados de Theil para
establecer cuánto poder explicativo agrega la variable erróneamente excluida al modelo que
si la contiene.
Ejercicio 2
a) Realizar con EViews un análisis exploratorio de los datos graficando los diagramas
de dispersión que sean de interés y calculando la matriz de correlaciones. ¿Es posible
identificar, a priori, alguna relación entre las variables?
Estimando el modelo por MCO tomando al desempleo como variable endógena, explicada a
su vez por el grado de apertura del comercio y del crecimiento del PIB, se obtuvo la
siguiente salida:
Se puede observar que el coeficiente de la variable crecimiento es -0.2787, es decir que
dicha variable está negativamente relacionada con el desempleo, algo que se suponía
previamente. Por otro lado, el coeficiente de la variable comercio es de 0.0041, es decir que
no es un coeficiente muy importante, ya que un cambio en la variable comercio, no genera
un gran impacto sobre la variable desempleo, agregando, además, que existe una relación
positiva entre ambas variables.
Por otro lado, tomando en cuenta la calidad de ajuste, se puede realizar un análisis variable
a variable, observando los valores del p-value que facilita la salida de Eviews. En el caso de
dócimas de coeficientes, se plantea como hipótesis nula que el coeficiente es igual a 0, es
decir que la variable no aporta poder explicativo al modelo. Es así que se plantea como
hipótesis alternativa que el coeficiente es distinto de 0, por ende, aporta explicación a la
variable endógena. De esta forma, un p-valor menor al nivel de significancia, nos indica que
debemos rechazar la hipótesis nula.
Adicionalmente, tomando en cuenta la prueba F de validez global del modelo, se cuenta con
el F observado para contrastar la validez general del modelo, el cual adquiere un valor de
1.8811. En esta prueba se establece como hipótesis nula que ambos coeficientes son
iguales a 0, y como hipótesis alternativa, que al menos uno de los coeficientes es distinto de
0.
Debemos encontrar el valor crítico F en su tabla de valores. En cuanto al numerador, los
grados de libertad serían 2, ya que la forma de calcularlo es p-1, por ende, al tener 3
parámetros (contando el intercepto), debemos restarle 1. Así resulta 3-1=2. En cuanto al
denominador, tenemos 25 observaciones (n=25). P, como se mencionó, es 3. De esta forma
los grados de libertad del denominador serían 25-3=22.
En la tabla:
De esta forma, el valor crítico es 3,443, por lo cual el valor observado cae en la zona de no
rechazo de la hipótesis nula. Esto lleva a suponer que en realidad estos coeficientes son
iguales a 0 y sus variables asociadas no aportan poder explicativo a la variable endógena
“desempleo”.
Por lo analizado previamente, puede verse a simple vista que se necesita una re-
especificación del modelo. Para ello, se llevó a cabo la realización de las dócimas de
restricciones lineales homogéneas del modelo, para evaluar la posible exclusión de alguna
de las variables. De esta forma, se estimará un modelo para cada caso en donde se excluya
una u otra variable explicativa. Para analizar la validez del modelo se debe contrastar los
valores F, comparando entre el modelo original y el re-especificado. Por un lado, realizando
los cálculos manuales del F observado según la fórmula establecida:
SCRr hace referencia a la suma de cuadrados residuales del modelo restringido, mientras
que SCRn refiere a lo mismo, pero del modelo no restringido, es decir del original. Para ello,
re-estimamos el modelo, sin incluir la variable que se desea omitir para observar los
posibles resultados de dicha estimación. Es por esto que se estimaron dos modelos, uno
excluyendo la variable crecimiento y otro excluyendo la variable comercio.
En primer lugar, se busca en la tabla el valor F crítico para este caso. Nos encontramos con
1 solo grado de libertad en el numerador ya que la diferencia de parámetros entre el modelo
original y el restringido, en ambos casos, es igual a 1: los grados de libertad en una resta es
la resta de los grados de libertad que implica esta diferencia de SCR. En el caso del
denominador, seguimos contando con 22 grados de libertad. De esta forma nuestro F crítico
es 4,301(puede corroborarse en la tabla expuesta anteriormente).
Una vez re-estimados los modelos, para el cálculo de los F observados, debemos fijarnos
en “sum squared resid” que indica la suma de cuadrados residuales o SCR de cada modelo
por separado. Con todos los datos podemos aplicar la fórmula. Tenemos en cada caso:
Por el otro lado, podemos hacer mediante Eviews un “Wald test” para un diagnóstico de
coeficientes, donde se restringen a 0 uno de los coeficientes de la regresión lineal inicial.
Podemos comprobar que los F calculados para cada caso son iguales a los calculados
manualmente, a su vez que comprobamos que los grados de libertad están bien
establecidos.
Sin embargo, a pesar de los resultados, podemos llevar a cabo una comparación entre los
modelos, para determinar si uno ajusta mejor que otro, y si es necesaria una re-estimación
del modelo original. Para ello podemos hacer un análisis de bondad de ajuste comparando
los R cuadrados ajustados de los modelos expuestos para poder analizar cuál es el modelo
que mejor ajusta la explicación de la variable desempleo. De la salida de Eviews podemos
observar que el R cuadrado ajustado del modelo original que contiene ambas variables es
de 0.0684. Por otro lado, el modelo que solo incluye la variable comercio nos arroja un valor
R cuadrado ajustado de -0.0434, un valor extremadamente pobre. Por último, ese indicador
en el modelo que incluye solo la variable crecimiento del PIB nos indica un R cuadrado
ajustado de 0.1088. Vemos con claridad que, mediante esta comparación de modelos,
tomado en cuenta el R cuadrado, el cual penaliza la incorporación de variables por la
pérdida de grados de libertad frente al poder explicativo de dicha variable sobre la variable
endógena, concluimos que el modelo más adecuado es aquel que incluye solo a la variable
crecimiento. Más allá del análisis econométrico que se está llevando a cabo, no debemos
olvidar la teoría económica. Pensando en términos económicos, podemos encontrar que en
realidad el crecimiento en el nivel de la actividad económica tiene efecto sobre el desempleo
y son variables que se analizan a la par en estudios sobre los cambios en el PIB y su
consecuencia en el desempleo. Por ende, creemos que es una variable significativa desde
el punto de vista económico, por ende, es un modelo acertado. A su vez, debemos recordar
que la influencia de una sola variable sobre la variable dependiente, no podrá tener
demasiado poder explicativo por sí sola. Quizá, en la medida que se agregan variables
significativas y el modelo se va complejizando, la variable crecimiento seguramente se
tornará significativa.
Es de esta forma que nos quedaría el siguiente modelo estimado, con la ecuación
especificada:
Siendo C (1) la ordenada al origen o intercepto y C (2) el coeficiente de la variable
crecimiento. Vemos que en esta re-estimación, contamos ahora con un modelo de regresión
lineal simple, cuyo coeficiente de la variable explicativa es -0.2785. Observamos, al igual
que en el modelo original, que la variable explicativa está negativamente relacionada con la
variable desempleo.
COEFICIENTES RECURSIVOS:
RESIDUOS RECURSIVOS:
En este método se crea una serie de residuos agregando secuencialmente una a una las
observaciones, para formular la ecuación en cada periodo:
CUSUM:
CUSUMQ:
Tomando en cuenta las conclusiones de los residuos recursivos, podría existir un quiebre
estructural en 1996. Sin embargo, la prueba de Chow, observando el p-value de la prueba
F, nos deja concluir que no existen evidencias suficientes para decir que hay quiebre
estructural en este año:
Para el caso del año 2009, la dócima de Chow nos arroja que se rechaza la hipótesis nula
de que no exista un cambio estructural, por ende, puede significar que dicho año los
coeficientes de las variables dejen de ser constantes e iguales. Sin embargo, seguiremos
con el análisis.
Para el caso del análisis del método CUSUM, tomando el año 2002 como posible quiebre
estructural, la dócima de Chow nos arroja:
Vemos claramente que, debido al p-valor menor al nivel de significancia, debemos rechazar
la hipótesis nula de que no existen quiebres estructurales en dicho año.
Es así que nos encontramos con dos posibles años de quiebre estructural, 2002 o 2009.
Los supuestos que deben cumplirse en la prueba de quiebre estructural de Chow, son
aquellos referidos a los errores de las regresiones de cada submuestra.
Dichos supuestos son:
Vemos que en ambas muestras los errores se distribuyen normal, siendo esto visible tanto
en la forma del histograma como en el valor de las medias cercanas a 0 y un índice de
Kurtosis que se aproxima a 3, es decir, a una distribución normal.
-Distribuciones independientes:
Analizando los gráficos de distribución de los residuos de cada submuestra, vemos que no
se repiten patrones en su distribución por ende podemos concluir que siguen distribuciones
independientes y no están correlacionados entre sí.
-Igualdad de varianzas: es tal vez el supuesto más crítico y necesario de verificar, ya que ni
siquiera en el límite puede suponerse igualdad de varianzas.
Para analizar este supuesto recurrimos a la prueba de varianzas F con un nivel de
significancia del 0.025 para mayor exigencia. Recordemos que esta prueba es solo de cola
derecha. Nuestra hipótesis nula es que las varianzas de las muestras son iguales, mientras
que la alternativa es que las mismas son distintas entre sí.
Es así que, mediante Eviews encontramos la varianza de cada submuestra.
Varianza de la muestra con datos 1991-2002: 9,82786
Varianza de la muestra con datos 2003-2015: 5,87424
Comparando con el valor crítico F que tiene como grados de libertad los tamaños de las
muestras, en el numerador tenemos un n=12 mientras que en el denominador n=13.
Nuestro F crítico es de 3,153. De esta forma concluimos que no se debe rechazar la
hipótesis nula que las varianzas de las muestras son iguales entre sí y finalmente podemos
decir que la dócima de quiebre estructural de Chow puede llevarse a cabo y es correcta, ya
que se cumplen los supuestos base.
Por ende, para poder re-estimar el modelo de forma que se tenga en cuenta el quiebre
estructural, procedemos a analizar nuevamente los posibles quiebres.
Si bien gráficamente es más visible el cambio estructural en el año 2009, cuando re-
estimamos el modelo para tener en cuenta este quiebre, mediante la creación de una
variable ficticia, se muestran resultados interesantes:
Creando la variable ficticia, teniendo en cuenta el cambio en 2009, la estimación por MCO
establece:
Vemos que el coeficiente de la variable crecimiento multiplicada por la variable ficticia, nos
indica un p-value muy alto, por ende, no es una variable significativa. Re-estimamos el
modelo, excluyendo esta variable por el método backward:
Podemos analizar que todas las variables son significativas, incluso la variable crecimiento,
que en el modelo re-estimado del inciso anterior no era totalmente significativa. A la vez, es
interesante el valor del R cuadrado ajustado de este modelo frente al modelo re-estimado
en el inciso anterior, ya que contamos con un R cuadrado mucho más alto, permitiéndonos
comparar los modelos. Por ende, al agregar este quiebre estructural en la estimación del
modelo, este se vuelve mucho más explicativo y las variables ajustan bien.
Sin embargo, podemos continuar con el análisis. Teniendo en cuenta ahora que el quiebre
estructural se da en 2002 y no en 2009, podemos construir una variable ficticia que refleje
este cambio y podemos re-estimar el modelo por MCO, arrojando la siguiente salida:
Podemos observar que todas las variables son significativas, y sorprendentemente,
contamos con un R cuadrado ajustado todavía mayor, no solo mayor al del modelo del
inciso anterior, sino que también mayor comparado al correspondiente al quiebre estructural
del 2009.
Analizando estas posibilidades, no debemos pasar por alto un detalle significativo. Estamos
frente a un modelo que refleja datos para la economía argentina de los años 1991-2015
sobre la tasa de desempleo, la tasa de crecimiento anual del PIB real y el grado de apertura
comercial en términos del PIB. Hemos de recordar que, en el año 2001, Argentina atraviesa
una gran crisis económica con fuerte impacto en diversos sectores. Tomando este dato de
la teoría económica, parece lógico que se produzca un quiebre estructural de los
coeficientes de dichas variables a partir del año 2002, que reflejarían las consecuencias de
la crisis atravesada. Por otro lado, también contamos con la crisis económica ocurrida en
2008, por lo cual, un quiebre estructural en 2009 también puede ser tenido en cuenta.
Bibliografía:
Swoboda, C. (2016). Microeconomía Intermedia: Una aproximación matemática. (2da Ed)
Córdoba, Argentina: Asociación Cooperadora de la Facultad de Ciencias Económicas.