Está en la página 1de 8

TALLER TEÓRICO PRÁCTICO INDIVIDUAL 2

SEBASTIAN CALLE AGUIRRE.

JOSE ANDERSON GIRALDO VARGAS.

FEBRERO, 2021

UNIVERSIDAD DE MANIZALES, ECONOMETRÍA

JUAN FELIPE CASTELLANOS MARTINEZ


Taller teórico práctico individual 2

Para la actividad de esta semana se pide la lectura del segundo capítulo de Introducción a
la Econometría de Jeffrey M. Wooldridge, titulado “El modelo de regresión simple” hasta la
sección correspondiente a las propiedades algebraicas de los estadísticos de MCO.
También debe leerse el capítulo dos de Econometría de Damodar Gujarati, titulado”
Análisis de regresión con dos variables: algunas ideas básicas”. Para el desarrollo de esta
actividad, se debe de instalar el paquete “wooldridge” en R a través del comando
install.packages(“wooldridge”).
1. La base de datos wage2 perteneciente al paquete “wooldridge” contiene una
muestra de 953 individuos. La variable wage contiene los salarios mensuales de
estos individuos, mientras que la variable IQ contiene el puntaje del coeficiente
intelectual de estas personas.
a. Construya un diagrama de dispersión que explore la relación entre estas variables.
¿Qué concluye de este diagrama? ¿Parece existir alguna relación?

La nube de puntos no permite identificar una relación lineal fuerte, sin embargo,
hay una ligera relación positiva entre las variables.

b. SI quisiera determinar cuál es el efecto del IQ sobre los salarios, ¿qué modelo debo
ajustar? Calcule este modelo en R e interprete el valor estimado para beta 1.

Para determinar el efecto de IQ sobre los salarios se debe estimar el siguiente


modelo
Salarios= β0 + β 1 IQ
Estimando el modelo por M.C.O.
> Modelo1<-lm(wage~IQ,data=wage2)
> summary(Modelo1)

Call:
lm(formula = wage ~ IQ, data = wage2)

Residuals:
Min 1Q Median 3Q Max
-898.7 -256.5 -47.3 201.1 2072.6

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.9916 85.6415 1.366 0.172
IQ 8.3031 0.8364 9.927 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 384.8 on 933 degrees of freedom


Multiple R-squared: 0.09554, Adjusted R-squared: 0.09457
F-statistic: 98.55 on 1 and 933 DF, p-value: < 2.2e-16

La ecuación de regresión estimada es


Salarios=116.9916+8.3031 IQ
Se interpreta a partir del valor de β 1 que, por cada punto adicional de coeficiente
intelectual, las personas ganan al mes en promedio 8.3 unidades monetarias más.

c. ¿Cómo se interpreta el R2 obtenido?


El modelo se ajusta en un 0.955%, por lo que el modelo estimado tiene poca capacidad
de explicar los salarios.

d. Ajuste el mismo modelo, pero esta vez utilice el logaritmo de los salarios (lwage)
como variable dependiente. ¿Cómo cambia la interpretación de beta 1?
> Modelo2<-lm(lwage~IQ,data=wage2)
> summary(Modelo2)

Call:
lm(formula = lwage ~ IQ, data = wage2)

Residuals:
Min 1Q Median 3Q Max
-2.09324 -0.25547 0.02261 0.27544 1.21487

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.8869944 0.0890206 66.13 <2e-16 ***
IQ 0.0088072 0.0008694 10.13 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3999 on 933 degrees of freedom


Multiple R-squared: 0.09909, Adjusted R-squared: 0.09813
F-statistic: 102.6 on 1 and 933 DF, p-value: < 2.2e-16

Se interpreta que por cada punto adicional que una persona tiene de IQ, su salario
aumenta en un 0.8%.

e. ¿Qué factores están incluidos en u?, ¿estarán estos valores relacionados con la
variable X? y ¿qué problema existe si lo están?
Respuesta
Los factores que están incluidos en el término de error u son los años de educación, la
edad, la experiencia laboral, el sexo, etc. Es probable que el IQ este relacionado con la
educación, ya que las personas con mayor coeficiente intelectual estudian más años,
lo que provoca un problema de multicolinealidad.

f. Incluya la variable educ (años de educación) en el modelo. ¿Cambió beta 1? En


caso afirmativo, ¿a qué se debe este cambio?

> summary(Modelo3)

Call:
lm(formula = lwage ~ IQ + educ, data = wage2)

Residuals:
Min 1Q Median 3Q Max
-2.01601 -0.24367 0.03359 0.27960 1.23783

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.6582877 0.0962408 58.793 < 2e-16 ***
IQ 0.0058631 0.0009979 5.875 5.87e-09 ***
educ 0.0391199 0.0068382 5.721 1.43e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3933 on 932 degrees of freedom


Multiple R-squared: 0.1297, Adjusted R-squared: 0.1278
F-statistic: 69.42 on 2 and 932 DF, p-value: < 2.2e-16

El valor del β 1 disminuye de 8.3031 a 0.039, esto se debe a que parte del efecto que de
la variable IQ es recogido por la variable educación.

2. Sea la variable Precio el precio en millones de pesos de una vivienda y la variable


Tamaño el tamaño de esta vivienda en metros cuadrados. A través de un modelo
se piensa relacionar el tamaño de las viviendas con su precio:
Precio=β0 + β 1 Tamaño+u
Donde u es el error no observado.
a. ¿Qué tipo de factores podrían encontrarse en u?
Respuesta
En el término de error u se podrían encontrar la antigüedad del inmueble, la distancia
a estaciones de transporte público, colegios, parques, centros comerciales, el estrato,
el número de cuartos, de baños, tener o no garaje, etc.
b. ¿Alguno de esos factores podría estar relacionado con el tamaño de la vivienda? Si
así fuera, ¿sería posible hallar el efecto ceteris paribus del tamaño de la vivienda
sobre los precios a través de la regresión lineal simple?
Respuesta
El tamaño de la vivienda puede estar relacionado con el número de habitaciones y el
número de baños, con el garaje. Si es posible calcular la regresión lineal sin violar los
supuestos de M.C.O. porque solo se incluye información de una variable en la
estimación.

3. La siguiente tabla contiene los ingresos semanales en dólares de diez individuos y


sus consumos semanales.

Individu Consum
o Ingreso o
María 100 80
Juan 80 62
Andrés 50 35
José 150 110
Helena 200 130
Paola 120 95
Mauricio 60 40
Camilo 75 65
Jorge 82 75
Ana 100 90

a. Plantee un modelo en el que relacione estas dos variables. ¿Cuál sería la variable
dependiente? ¿Cuál la independiente? Sustente su respuesta basándose en la
función de consumo propuesta por Keynes.

Respuesta
El consumo tiene dos componentes, uno autónomo y otro depende del ingreso de
manera positiva en una proporción dada por la propensión marginal al consumo.
En un modelo con la siguiente forma:
C=β 0 + β 1 Y
Donde β 0 es el consumo autónomo y β 1 es la propensión marginal a consumir.
b. Estime esta relación a través de mínimos cuadrados ordinarios e interprete el valor
de la pendiente y del intercepto. Realice este cálculo tanto de manera manual,
paso a paso, como en R. Ponga en la respuesta el código usado y las capturas de
pantalla de los resultados.
Realizando la estimación de forma manual:

> Ingreso<-c(100,80,50,150,200,120,60,75,82,100)
> Consumo<-c(80,62,35,110,130,95,40,65,75,90)
> IC<-Ingreso*Consumo
> IC
[1] 8000 4960 1750 16500 26000 11400 2400 4875 6150 9000
> I2<-Ingreso*Ingreso
> I2
[1] 10000 6400 2500 22500 40000 14400 3600 5625 6724 10000
> C2<-Consumo*Consumo
> C2
[1] 6400 3844 1225 12100 16900 9025 1600 4225 5625 8100
> SSxx<-sum(I2)-((sum(Ingreso)^2)/10)
> SSxx
[1] 18320.1
> SSyy<-sum(C2)-((sum(Consumo)^2)/10)
> SSyy
[1] 7891.6
> SSxy<-sum(IC)-((sum(Ingreso)*sum(Consumo))/10)
> SSxy
[1] 11505.6
> Beta1<-SSxy/SSxx
> Beta1
[1] 0.6280315
> Beta0<-mean(Consumo)-Beta1*mean(Ingreso)
> Beta0
[1] 14.3292
> SSE<-SSyy-Beta1*SSxy
> SSE
[1] 665.7207
> R2<-1-SSE/SSyy
> R2
[1] 0.9156419
[1] 0.9156419

Usando el comando lm
> Modelo<-lm(Consumo~Ingreso)
> Modelo
Call:
lm(formula = Consumo ~ Ingreso)
Coefficients:
(Intercept) Ingreso
14.329 0.628
> summary(Modelo)
Call:
lm(formula = Consumo ~ Ingreso)

Residuals:
Min 1Q Median 3Q Max
-12.011 -8.095 2.167 4.872 12.868

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.3292 7.4365 1.927 0.0902 .
Ingreso 0.6280 0.0674 9.318 1.43e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9.122 on 8 degrees of freedom


Multiple R-squared: 0.9156, Adjusted R-squared: 0.9051
F-statistic: 86.83 on 1 and 8 DF, p-value: 1.434e-05

Se interpreta a β 1 como la propensión marginal a consumir, la cual es de 0.628. Se puede


afirmar que el aumento del ingreso semanal de una persona en un dólar genera un
incremento de su consumo semanal de 0.628 dólares en promedio.

c. ¿Es en este caso útil interpretar el valor del intercepto?


Respuesta
Es útil interpretar el intercepto como el componente autónomo del consumo, es decir,
aquel que no depende del ingreso.

d. Calcule los valores que ajustaría el modelo para cada observación y los residuales.
¿Cuánto suman los residuales? ¿Por qué?

> predict(Modelo)

1 2 3 4 5 6 7 8
77.13235 64.57172 45.73077 108.53392 139.93550 89.69298 52.01109 61
9 10
.43156 65.82778 77.13235

> resid(Modelo)
1 2 3 4 5 6
7 8
2.867654 -2.571716 -10.730771 1.466078 -9.935497 5.307023 -
12.011086 3.568441
9 10
9.172221 12.867654
> sum(resid(Modelo)))
[1] 3.552714e-15

La suma de los residuales es cercana a cero porque el modelo minimiza los errores y tiene
un buen ajuste a los datos

e. Realice un histograma con los residuales obtenidos.


> hist(resid(Modelo),col="blue",main="Histograma de los Residuales del
Modelo", xlab="Residuales del Modelo")

f. ¿Qué valor predice el modelo cuando el ingreso es de 90? ¿Cómo podría


interpretarse este valor?
> Beta0+Beta1*90
[1] 70.85203

Es estima que el consumo de una persona con un ingreso de 90 dólares semanales es de


70.85 dólares.

También podría gustarte