Está en la página 1de 13

Universidad Industrial de Santander

Escuela de Economía y Administración


Econometría I
Grupo A1
Taller 3
2150148 – Henry Andrés Gómez Ramírez
2150033- David Parra Bohórquez

Ejercicio 1. Multicolinealidad

a.

Para poder determinar si en el modelo 1 existe multicolinealidad, debemos realizar con el


coeficiente de R una simple observación. Como no tenemos el coeficiente de este sino la R2
hacemos una operación para observar despejando el término cuadrado R2=0.97

√ R2=R
√ 0.97=0.9849
Haciendo esta simple operación y observando el coeficiente de relación simple el cual se acerca
mucho a 1 (0.98).

b.

Observando el signo que maneja la regresión 1 podría decirse que a priori el valor que toma en
ese caso el índice de capital real (K) es negativo (-). Aunque a simple vista, parece que es un
poco contradictorio; ya que a mayor nivel de insumos de capital se tengan mayores tendrían que
ser los resultados de la producción real; se puede decir que debido a ser el modelo planteado en
manera logarítmica, el índice de producción real puede ser de manera marginal; ya que en algún
momento, lo producción podría crecer como lo anterior expuesto. Pero en un momento dado;
aumentos relativamente grandes de la cantidad de insumos para producción puede hacer que los
procesos no sea tan eficientes debido a la imposibilidad de tener trabajo para manjar dichos
insumos.

c.

Como estamos haciendo alusión a una función de producción basada en los insumos o mejor
conocidos como bienes de capital y trabajo en un tiempo dado; podemos decir que la forma de
ajustarlo a un modelo logarítmico se traduce debido a la función Cobb-Douglas en la cual
debido a diferentes mezclas de factores productivos, darán diferentes tipos de producción.

d.

En la regresión (1), se dice que el índice de la producción real se ve influenciado por tres
situaciones; cuando varía el índice de insumos de capital; cuando varía el índice de insumo
trabajo real y cuando varia el tiempo o tendencia; se dice que una variación positiva de un uno
por ciento de los insumos de capital reales contraen un 53% el índice de producción. Una
variación positiva de un uno por ciento del índice de trabajo real aumenta un 91% el índice de
producción real. Y un aumento de una unidad del tiempo aumenta un 4.7% el índice de
producción real. Se puede decir que el papel que cumple esta última es de reguladora en mayor
medida del índice; ya que en la mayor parte (en los sectores de manufactura) es muy difícil
hacer variaciones significativas de las dos primeras variables; más que todo se ve que en la
mayoría de los casos entre procesos de producción se presentan tiempos diferentes; lo que hace
que el tiempo de producción entre procesos puede ser diferente.

e.

La lógica de la nueva regresión (2); es que ahora se analiza la razón entre los índices de
producción real y los de insumos de capital con respecto al índice de trabajo real. En esto se
puede analizar cuál es la relación existente cuando la razón entre el insumo de capital y trabajo
toman diferentes valores (sean de 0 en adelante) con la razón entre la producción real y el
trabajo real.

f.
modelo1 modelo2
√ R2 √ R 2=Rmodelo1 √ R2 =R
modelo2

modelo 1 modelo 2
√ 0.97 =0.9849modelo 1 √ 0.65 =0.806modelo 2

Observando de acuerdo a lo planteado en el análisis de la regresión (1); podemos decir que no


hubo una reducción de esta misma con la nueva regresión Al contrario puede haber la
posibilidad de que exista de alguna manera más multicolinealidad ya que al contrario del primer
modelo, el segundo tiene una variable que no es significativa al ni al 1 ni al 5%; aunque ahora
se pasó a estar en un nivel inferior a 0.9 en R .

g.

En ambas regresiones se observa que el autor realiza una restricción entre la elección de ambos
modelos; en este caso el autor restringe totalmente la variable del índice de trabajo total;
incluyéndola como una relación contra la otra variable explicativa y la explicada. Esta
restricción podría ser válida debido a los rendimientos a escala; ya que aquí se puede observar la
relación existente entre los cambios proporcionales entre los insumos y la producción real
respecto a los salarios.

Como se menciona en (e), el autor está tratando de descubrir que hay un retorno constante a
escala. Se podría usar la prueba F discutida conjunta entre parámetros para averiguar si la
restricción es válida. Pero como las variables dependientes en los dos modelos son diferentes,
no podemos usar la versión R2.de la prueba F. Necesitamos las sumas residuales restringidas y
sin restricciones de cuadrados para usar la prueba F.

h.

En el momento dado; a los dos modelos no se les puede hacer una buena comparación a sus R2
ya que aunque presentan la misma medida (ln) tienen intercepto no poseen el mismo número de
variables; ya que omite la viable correspondiente a el trabajo real. Para hacerlos comparables de
la forma actual, se podría agregar una variable ficticia al modelo (2) para que tenga un término
más y de esa manera se puedan comparar sus R2.

Ejercicio 2. Heteroscedasticidad
a.

La suposición hecha es que la varianza del error es proporcional al cuadrado del PNB, como se
describe en la postulación. Los autores hacen esta suposición mirando los datos en el tiempo y
observando esta relación

b.

Los resultados son esencialmente los mismos; Aunque los errores estándar para dos de los
coeficientes son más bajos en el segundo modelo; Esto puede tomarse como una justificación
empírica de la transformación de la heteroscedasticidad.

c.

No. Los términos R2 no pueden compararse directamente, ya que las variables dependientes en
los dos modelos no son iguales

Ejercicio 3. Mala especificación y autocorrelación.

Año y x
1990 6 -4
1991 3 -3
1992 1 -2
1993 1 -1
1994 1 1
1995 4 2
1996 6 3
1997 16 4
1998 25 5
1999 36 6
2000 49 7
2001 64 8
a.

Por medio de gretl nos arroja

Coeficiente Desv. Típica Estadístico t Valor p


const 8.0122 4.05896 1.9740 0.0766 *
x 4.45591 0.919174 4.8477 0.0007 ***

R-cuadrado 0.701497 R-cuadrado corregido 0.671647

b.

Una de las formas de identificar si existe algún tipo de correlación es observando por medio del
método grafico
residuo con respecto a y (con ajuste mínimo-cuadrático)
25

20

15

10

5
residuo

-5

-10

-15

-20
0 10 20 30 40 50 60
y

Aunque no es muy efectivo y por eso realizamos por medio de Gretl el contraste de hipótesis de
Durbin-Watson; el cual nos dio d= 0.321828 y valores críticos de dL = 0.9708 dU = 1.3314.
Siendo

H 0=no autocorrelación

H 1=existenciade autocorre lación

Determinando que existe autocorrelación negativa en el modelo (ya que d < dl).

c.

Para verificar si existe un problema en la forma funcional tenemos que hacer un test de Ramsey
con el cual establecemos:

H 0=forma funcional correcta

H 1=forma funcional incorrecta

Con un valor de F = 498.100064 y un p-valor de F de 0.0000 lo cual nos indica que la forma
funcional en el modelo es incorrecta Para solucionar este problema podemos agregar más
variables explicativas; pero el principal problema es la imposibilidad de agregar más variables
ya que no tenemos en el ejercicio más variables para agregar. Es por eso; que se puede tomar
como método el MCG o mínimos cuadrados generalizados.

Ejercicio 4. Salarios de CEOs en Fortune

a.

En gretl, la regresión expuesta es la siguiente


Coeficiente Desv. Típica Estadístico t Valor p
const 998.709 623.695 1.6013 0.1100
tenure 31.6728 9.4651 3.3463 0.0009 ***
age 5.49239 11.4609 0.4792 0.6320
sales 0.0142866 0.00661405 2.1600 0.0313 **
profits 0.141302 0.068845 2.0525 0.0407 **
assets 0.00762968 0.00132578 5.7548 <0.0001 ***

Con el estadístico Breusch-Pagan:

H 0=no hay homocedasticidad

H 1=hay homocedasticidad

Arrojándonos lo siguiente:

Contraste de heterocedasticidad de Breusch-Pagan


MCO, usando las observaciones 1-447
Variable dependiente: uhat^2 escalado

Coeficiente Desv. Típica Estadístico t Valor p


----------------------------------------------------------------
const 1.64170 1.99186 0.8242 0.4103
tenure 0.0786649 0.0302282 2.602 0.0096 ***
age −0.0289525 0.0366020 −0.7910 0.4294
sales 2.60858e-05 2.11230e-05 1.235 0.2175
profits −0.000180637 0.000219867 −0.8216 0.4118
assets 7.46592e-06 4.23409e-06 1.763 0.0785 *

Suma de cuadrados explicada = 335.479

Estadístico de contraste: LM = 167.739692,


con valor p = P(Chi-cuadrado(5) > 167.739692) = 0.000000

Observando parece existir una situación de Homocedasticidad ya que a todos los niveles de
significancia el estadístico LM (167.739692) es rechazado.

b.

Al agregar el Ln del salario encontramos el siguiente modelo

Coeficiente Desv. Típica Estadístico t Valor p


const 6.75366 0.236823 28.5178 <0.0001 ***
tenure 0.00825119 0.00359398 2.2958 0.0222 **
age 0.00722837 0.00435179 1.6610 0.0974 *
sales 6.09192e-06 2.51141e-06 2.4257 0.0157 **
profits 5.71637e-05 2.61411e-05 2.1867 0.0293 **
assets 2.03154e-06 5.03412e-07 4.0355 <0.0001 ***
Al realizar la prueba Breusch-Pagan con las mismas hipótesis aún nos sigue dando un nivel de
homocedasticidad; aunque parece que con la aplicación del logaritmo este nivel se disminuyó;
ya que redujo el estadístico LM cuatro veces aproximadamente (44.965248).
c.

Respecto a la Experiencia

salary con respecto a tenure (con ajuste mínimo-cuadrático)


16000
Y = 1.75e+003 + 36.0X

14000

12000

10000
salary

8000

6000

4000

2000

0
0 10 20 30 40 50 60
tenure

Respecto a la Edad

salary con respecto a age (con ajuste mínimo-cuadrático)


16000
Y = 320. + 30.2X

14000

12000

10000
salary

8000

6000

4000

2000

0
40 50 60 70 80
age
Respecto a las ventas

salary con respecto a sales (con ajuste mínimo-cuadrático)


16000
Y = 1.57e+003 + 0.0396X

14000

12000

10000
salary

8000

6000

4000

2000

0
0 20000 40000 60000 80000 100000 120000 140000 160000
sales

Respecto a las utilidades

salary con respecto a profits (con ajuste mínimo-cuadrático)


16000
Y = 1.74e+003 + 0.414X

14000

12000

10000
salary

8000

6000

4000

2000

0
0 5000 10000 15000 20000
profits
Respecto a los activos

salary con respecto a assets (con ajuste mínimo-cuadrático)


16000
Y = 1.72e+003 + 0.0115X

14000

12000

10000
salary

8000

6000

4000

2000

0
0 100000 200000 300000 400000 500000 600000
assets

Observando detalladamente cada distribución de las variables con respecto a los salarios; se
puede ver que las que mayor dilatación tienen en sus distribuciones son la experiencia y la edad;
tanto así que sus medias (líneas regresoras simples) tienden a ser horizontales lo cual puede
hacer que hagan diferir el modelo y permitan estados de heterocedasticidad. Para resolver este
problema; primero que todo tendríamos que establecer el modelo de MCG para poder hallar la
relación existente en la varianza con alguna de las variables explicativas; para así poder realizar
MCP y encontrar el nuevo modelo; o inclusive generando unos errores estándar robusos.

Ejercicio 5. Heteroscedasticidad

a.

ε1

[]
100 0
Sabiendo que ( ε)=
ε2
T
ε 3 y que ( ε∗ε ) =σ

εn
2

[ ]
010 0
⋮⋮⋱ ⋱
000 1
2
y que en este caso E(ε ) =σ
2 1
xi
Entonces:

ε1

[]
1/ x1 0 0 0
ε2
E( ε )= ε 3

ε 24
[
( ε∗ε T ) =σ 2 0 1/ x 2 0 0
⋮ ⋮ ⋱ ⋱
0 0 0 1/ x 24
]
b.
1 2
No. Ya que en este momento, con el tipo de varianza σ el valor que toma la varianza
xi
cambiara dependiendo de los valores que tomen algunas de las variables explicativas.

c.

Ya que en modelo encontramos explicita la relación de la varianza heterocedástica, podemos


realizar un nuevo modelo con unos coeficientes del tipo homocedástico usando el método de
mínimos cuadrados ponderados

d.

En este caso la ponderación es multiplicando cada término por X i ; ya que:

e.

Y i ¿ X i=β 1∗X i+ β2 ¿ X i∗X i +ε i ¿ X i

Y i X i=β 1 X i + β 2 X 2i + ε i X i

La nueva varianza con la ponderación resulta


2 2
E ( u^ ) =( (u^ )∗x )

E ( u^ )2=( u^ )2∗x 2

2 σ2 2
E ( u^ ) = ∗x
x2
2 2
E ( u^ ) =σ

f.

Tenemos el modelo:

Y i X i=β 1 X i + β 2 X 2i + ε i X i

Queremos minimizar el error: vi =ε i X i

∂( ∑ v 2i ) ∑ (Y i X i− β1 X i−β 2 X 2i )2
=
∂ β2 ∂ β2

0=−2 ∑ X 2i (¿ Y i X i−β 1 X i−β 2 X 2i )¿

0=∑ X 2i (¿ Y i X i− β1 X i−β 2 X 2i )¿

0=∑ Y i X 3i −β 1 ∑ X 3i −β 2 ∑ X 4i

0=n Ý ∑ X 3i −β 1 ∑ X 3i −β 2 ∑ X 4i
β 2 ∑ X 4i =n Ý ∑ X 3i −β 1 ∑ X 3i

Estableciendo que β 1=n Ý − β2 n X́

β 2 ∑ X 4i =n Ý ∑ X 3i −n Ý −β2 n X́ ∑ X 3i

β2 ∑ X i4 3 3
=( Ý ∑ X i −Ý −β 2 n X́ ∑ X i )
n

β2 ∑ X i4 3 3
+ β 2 n X́ ∑ X i =( Ý ∑ X i −Ý )
n

∑ X 4i +n X́ ∑ X 3 =( Ý ∑ X 3−Ý ) ¿
( β ¿¿ 2) ( n i ) i

Ý ∑ X 3i −Ý
( β ¿¿ 2)= ¿
∑ X i4 + n X́ X 3
n
∑ i
Ý ∑ X 3i −Ý
( β ¿¿ 2)= ¿
∑ X i4 + n X́ X 3
n
∑ i
Ejercicio 6. Autocorrelación

Y i=β 1 + β 2 X 2+ …+ β K X Kt +ε i

Cov ( ε t , ε t −1) =E ¿

Definimos las variables de la Cov.

Cov ( ε t , ε t −1) =[ ε t∗ε t−1 ]

Cov ( ε t , ε t −1) =E [( ρ ε t−1 +ϑi )(ε t −1) ]

2
Cov ( ε t , ε t −1) =[ ρ ε t−1+ ϑt ε t −1 ]

Cov ( ε t , ε t −1) =ρE [ ε 2t −1 ] + E [ ϑt ε t −1 ]

obteniendo

Cov ( ε t , ε t −1) =ρ σ 2 +0

Cov ( ε t , ε t −1) =ρ σ 2

E [ ε t , ε t−n ] =E [ ( p ε t−1 +ϑ1 ) ( ε t−n ) ]


E [ ρ ε t −1 ε t−n +ϑt ε t−n ]

ρ [ ε t −1 ε t−n ] + E[ϑ1 ε t −n ]

n−1
Sea E ( ε t−1 )= ρ y E ( ε t−n )=σ 2 y E [ ϑ1 ε t −n ] =0

ρ∗ρn−1 σ 2+ 0

Planteamos la matriz de varianzas y covarianzas con E ( εε ´ )

E ( εε ´ )=E ¿

σ2 ρ σ2 ρ2 σ 2 ρn σ 2

[
ρ σ2
E ( εε ´ )=E 2 2
ρ σ
ρn σ 2
σ2
ρ σ2
ρ σ 2 ρ n−1 σ 2
σ 2 ρn −2 σ 2
ρn−1 σ 2 ρ σ 2 ρn−n σ 2
]
Despejamos σ 2 de la matriz

1 ρ ρ2 ρn

[ ρ
E [ ε ε ' ] =σ 2 2
ρ
1
ρ
ρ ρ n−1
n
ρ
1
ρn−1
ρn−2
ρn−2 ρn−n
]
Se presenta un caso de homocedasticidad, pues se descubre que la varianza es constante
y no presenta un tipo de autocorrelación entre sus variables explicativas.

8.2

2 2 2
Con una varianza Var(u|inc,price,educ,female) = σ inc el valor de h(x) = inc Donde h (x)
2
es la función de heterocedasticidad definida en la ecuación Var(ulx)= σ h(x). Por lo tanto (h)x=
inc Y así la ecuación transformada se obtiene dividiendo la ecuación original por inc:

beer β 0 β 2∗price β 3∗educ β 4∗female u


= + β1 + + + +
inc inc inc inc inc inc

8.4

i)

Estas variables tienen los signos anticipados. Si un estudiante toma cursos donde las
calificaciones son, en promedio, más altas - como lo refleja la mayor crsgpa - entonces sus
calificaciones serán más altas. Cuanto mejor ha sido el estudiante en el pasado - como lo mide el
cumgpa, mejor lo hace (en promedio) en el semestre actual. Por último, tothrs es una medida de
la experiencia, y su coeficiente indica un retorno creciente a la experiencia.

El estadístico t para crsgpa es muy grande, sobre cinco usando el error estándar usual (que es el
más grande de los dos). Utilizando el error estándar robusto para cumgpa, su estadística t es de
aproximadamente 2,61, que también es significativa al nivel de 5%. El estadístico t para tothrs
es sólo alrededor de 1,17 usando cualquiera de los errores estándar, por lo que no es
significativo en el nivel del 5%.

ii)

Esto es más fácil de ver sin otras variables explicativas en el modelo. Si crsgpa fue la única
variable explicativa, H0: crsgpaβ = 1 significa que, sin ninguna información sobre el estudiante,
el mejor predictor del término GPA es el promedio de GPA en los cursos de los estudiantes;
Esto se cumple esencialmente por definición. (La intercepción sería cero en este caso.) Con
otras variables explicativas no es necesariamente cierto que crsgpa β = 1 porque crsgpa podría
correlacionarse con las características del estudiante. (Por ejemplo, tal vez los cursos que toman
los estudiantes están influenciados por la habilidad -medida por las calificaciones de los
exámenes- y el desempeño de la universidad anterior). Pero todavía es interesante probar esta
hipótesis.

El estadístico t que usa el error estándar usual es t = (.900 - 1) /. 175 ≈-.57; Usando el error
estándar robusto hetero-skedasticity da t ≈ -.60. En cualquier caso, no podemos rechazar H0:
crsgpaβ = 1 a cualquier nivel de significancia razonable, incluyendo ciertamente 5%.

iii)

El efecto de la temporada es dado por el coeficiente de la temporada, lo que implica que, otras
cosas iguales, el GPA de un atleta es aproximadamente .16 puntos más bajo cuando su deporte
está compitiendo. El estadístico t utilizando el error estándar habitual es de alrededor de -1,60,
mientras que el uso del error estándar robusto es de aproximadamente -1,96. Contra una
alternativa de dos lados, el estadístico t que utiliza el error estándar robusto es sólo significativo
al nivel de 5% (el valor crítico normal estándar es 1,96), mientras que usando el error estándar
usual, el estadístico t no es muy significativo en el 10 % De nivel (cv ≈ 1,65). Así que el error
estándar usado hace una diferencia en este caso. Este ejemplo es algo inusual, ya que el error
estándar robusto es más a menudo el más grande de los dos.

9.3

i)

La elegibilidad para el programa de almuerzos escolares financiado por el gobierno federal está
estrechamente ligada a vivir en la pobreza. Por lo tanto, el porcentaje de estudiantes elegibles
para el programa de almuerzo es muy similar al porcentaje de estudiantes que viven en la
pobreza.

ii)

Podemos usar nuestro razonamiento habitual para omitir variables importantes de una ecuación
de regresión. Las variables log (gasto) e lnchprg están correlacionadas negativamente: los
distritos escolares con niños más pobres gastan, en promedio, menos en las escuelas. Además,
3β <0. A partir de la Tabla, omitir lnchprg (el indicador de pobreza) de la regresión produce un
estimador sesgado al alza de 1β (ignorando la presencia de log en el modelo). Así que cuando
controlamos la tasa de pobreza, el efecto del gasto disminuye.

iii)

Una vez que controlamos por lnchprg, el coeficiente de log (matricular) se convierte en negativo
y tiene una t de aproximadamente -2.17, que es significativa al nivel del 5% frente a una
alternativa de dos caras. El coeficiente implica que - (1.26 / 100) (% Δenroll) = -.0126 (%
Δenroll). Por lo tanto, un aumento del 10% en la matrícula conduce a una caída en las
matemáticas10 de .126 puntos porcentuales.

iv)

Tanto math10 como lnchprg son porcentajes. Por lo tanto, un aumento de diez puntos
porcentuales en lnchprg conduce a una caída de aproximadamente 3.23 puntos porcentuales en
matemáticas10, un efecto considerable.

v)

En la columna (1) estamos explicando muy poco de la variación en las tasas de aprobación en la
prueba de matemáticas MEAP: menos del 3%. En la columna (2), estamos explicando casi el
19% (que todavía deja mucha variación inexplicada). Claramente la mayor parte de la variación
en math10 se explica por la variación en lnchprg. Este es un hallazgo común en los estudios de
desempeño escolar: el ingreso familiar (o factores relacionados, como vivir en la pobreza) son
mucho más importantes para explicar el desempeño estudiantil que el gasto por estudiante u
otras características de la escuela.

También podría gustarte