Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FEBRERO, 2021
Para la actividad de esta semana se pide la lectura del segundo capítulo de Introducción a
la Econometría de Jeffrey M. Wooldridge, titulado “El modelo de regresión simple” hasta la
sección correspondiente a las propiedades algebraicas de los estadísticos de MCO.
También debe leerse el capítulo dos de Econometría de Damodar Gujarati, titulado”
Análisis de regresión con dos variables: algunas ideas básicas”. Para el desarrollo de esta
actividad, se debe de instalar el paquete “wooldridge” en R a través del comando
install.packages(“wooldridge”).
1. La base de datos wage2 perteneciente al paquete “wooldridge” contiene una
muestra de 953 individuos. La variable wage contiene los salarios mensuales de
estos individuos, mientras que la variable IQ contiene el puntaje del coeficiente
intelectual de estas personas.
a. Construya un diagrama de dispersión que explore la relación entre estas variables.
¿Qué concluye de este diagrama? ¿Parece existir alguna relación?
La nube de puntos no permite identificar una relación lineal fuerte, sin embargo,
hay una ligera relación positiva entre las variables.
b. SI quisiera determinar cuál es el efecto del IQ sobre los salarios, ¿qué modelo debo
ajustar? Calcule este modelo en R e interprete el valor estimado para beta 1.
Call:
lm(formula = wage ~ IQ, data = wage2)
Residuals:
Min 1Q Median 3Q Max
-898.7 -256.5 -47.3 201.1 2072.6
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.9916 85.6415 1.366 0.172
IQ 8.3031 0.8364 9.927 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
d. Ajuste el mismo modelo, pero esta vez utilice el logaritmo de los salarios (lwage)
como variable dependiente. ¿Cómo cambia la interpretación de beta 1?
> Modelo2<-lm(lwage~IQ,data=wage2)
> summary(Modelo2)
Call:
lm(formula = lwage ~ IQ, data = wage2)
Residuals:
Min 1Q Median 3Q Max
-2.09324 -0.25547 0.02261 0.27544 1.21487
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.8869944 0.0890206 66.13 <2e-16 ***
IQ 0.0088072 0.0008694 10.13 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Se interpreta que por cada punto adicional que una persona tiene de IQ, su salario
aumenta en un 0.8%.
e. ¿Qué factores están incluidos en u?, ¿estarán estos valores relacionados con la
variable X? y ¿qué problema existe si lo están?
Respuesta
Los factores que están incluidos en el término de error u son los años de educación, la
edad, la experiencia laboral, el sexo, etc. Es probable que el IQ este relacionado con la
educación, ya que las personas con mayor coeficiente intelectual estudian más años,
lo que provoca un problema de multicolinealidad.
> summary(Modelo3)
Call:
lm(formula = lwage ~ IQ + educ, data = wage2)
Residuals:
Min 1Q Median 3Q Max
-2.01601 -0.24367 0.03359 0.27960 1.23783
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.6582877 0.0962408 58.793 < 2e-16 ***
IQ 0.0058631 0.0009979 5.875 5.87e-09 ***
educ 0.0391199 0.0068382 5.721 1.43e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
El valor del β 1 disminuye de 8.3031 a 0.039, esto se debe a que parte del efecto que de
la variable IQ es recogido por la variable educación.
Individu Consum
o Ingreso o
María 100 80
Juan 80 62
Andrés 50 35
José 150 110
Helena 200 130
Paola 120 95
Mauricio 60 40
Camilo 75 65
Jorge 82 75
Ana 100 90
a. Plantee un modelo en el que relacione estas dos variables. ¿Cuál sería la variable
dependiente? ¿Cuál la independiente? Sustente su respuesta basándose en la
función de consumo propuesta por Keynes.
Respuesta
El consumo tiene dos componentes, uno autónomo y otro depende del ingreso de
manera positiva en una proporción dada por la propensión marginal al consumo.
En un modelo con la siguiente forma:
C=β 0 + β 1 Y
Donde β 0 es el consumo autónomo y β 1 es la propensión marginal a consumir.
b. Estime esta relación a través de mínimos cuadrados ordinarios e interprete el valor
de la pendiente y del intercepto. Realice este cálculo tanto de manera manual,
paso a paso, como en R. Ponga en la respuesta el código usado y las capturas de
pantalla de los resultados.
Realizando la estimación de forma manual:
> Ingreso<-c(100,80,50,150,200,120,60,75,82,100)
> Consumo<-c(80,62,35,110,130,95,40,65,75,90)
> IC<-Ingreso*Consumo
> IC
[1] 8000 4960 1750 16500 26000 11400 2400 4875 6150 9000
> I2<-Ingreso*Ingreso
> I2
[1] 10000 6400 2500 22500 40000 14400 3600 5625 6724 10000
> C2<-Consumo*Consumo
> C2
[1] 6400 3844 1225 12100 16900 9025 1600 4225 5625 8100
> SSxx<-sum(I2)-((sum(Ingreso)^2)/10)
> SSxx
[1] 18320.1
> SSyy<-sum(C2)-((sum(Consumo)^2)/10)
> SSyy
[1] 7891.6
> SSxy<-sum(IC)-((sum(Ingreso)*sum(Consumo))/10)
> SSxy
[1] 11505.6
> Beta1<-SSxy/SSxx
> Beta1
[1] 0.6280315
> Beta0<-mean(Consumo)-Beta1*mean(Ingreso)
> Beta0
[1] 14.3292
> SSE<-SSyy-Beta1*SSxy
> SSE
[1] 665.7207
> R2<-1-SSE/SSyy
> R2
[1] 0.9156419
[1] 0.9156419
Usando el comando lm
> Modelo<-lm(Consumo~Ingreso)
> Modelo
Call:
lm(formula = Consumo ~ Ingreso)
Coefficients:
(Intercept) Ingreso
14.329 0.628
> summary(Modelo)
Call:
lm(formula = Consumo ~ Ingreso)
Residuals:
Min 1Q Median 3Q Max
-12.011 -8.095 2.167 4.872 12.868
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.3292 7.4365 1.927 0.0902 .
Ingreso 0.6280 0.0674 9.318 1.43e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
d. Calcule los valores que ajustaría el modelo para cada observación y los residuales.
¿Cuánto suman los residuales? ¿Por qué?
> predict(Modelo)
1 2 3 4 5 6 7 8
77.13235 64.57172 45.73077 108.53392 139.93550 89.69298 52.01109 61
9 10
.43156 65.82778 77.13235
> resid(Modelo)
1 2 3 4 5 6
7 8
2.867654 -2.571716 -10.730771 1.466078 -9.935497 5.307023 -
12.011086 3.568441
9 10
9.172221 12.867654
> sum(resid(Modelo)))
[1] 3.552714e-15
La suma de los residuales es cercana a cero porque el modelo minimiza los errores y tiene
un buen ajuste a los datos