Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ECONOMETRIA
Alumno:
Jaime Cabrera Guzman
Actividad 1
Abril 2021
Ejercicios
1. Considerar el modelo de regresion lineal sin intercepto 3
1.1. Deducir el estmador OLS β ∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Comprobar que el estimador β ∗ es lineal en Yi es insesgado . . . . . . . . . . . . . . . 4
1.3. La constante del modelo fue eliminada por error cuando deberia estar presente.Sigue
siendo insesgado en el estimador βˆ∗ [Pista: introducir el modelo con interceptoP βˆ∗ ] . . 4
∗ ∗
Calcular la varianza del estimador β , comprobar que var(β ) ≤ var(β̂). Pista:
1.4. P Xi2 ≥
2
(Xi − X̂) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Que elegir, un estimador sesgado pero con una varianza minima o un insegado con una
varianza mayor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
q = βp + u
8. El archivo bw.smoking.RData contiene datos sobre una muestra aleatoria del naci-
miento de bebes en Pennsylvania en 1989. Datos incluye el peso al nacer de bebes
junto con otras caracte-risticas de la madre, incluyendo si ella fumaba durante el
embarazo. La descripcion detallada de se anexa en archivo pdf. El ejercicio inves-
tiga la relacion entre el peso del bebe al nacer y si la madre fumaba durante el
embarazo. 16
1
8.1. Cual es el peso promedio de los bebe para todas las mamas. . . . . . . . . . . . . . . . 16
8.2. Cual es el peso promedio de los bebe para las mamas que fumaron durante el embarazo
y para aquellas que no fumaron. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
8.3. Construir intervalo de confianza al 95 por ciento para esta diferencia. . . . . . . . . . . 16
2
library(lmtest)
library(sandwich)
Yi = βXi + ui
Asumir los iguientes supuestos:
ui iid(0, σ 2 )
cov(xi , ui ) = 0, (xi , yi ).
Así
n
X n
X
βXi2 = Yi Xi
i=1 i=1
3
1.2. Comprobar que el estimador β ∗ es lineal en Yi es insesgado
Para demostrar que β ∗ es lineal en Yi consideramos
n
P
Yi Xi
∗ i=1
β = n
βXi2
P
i=1
Asi
n
X
β∗ = ai Yi
i=1
Donde
Xi
ai = n
Xj2
P
j=1
Entonces
E(ui |X1 , . . . , Xn ) = 0
∴ E(β ∗ |X1 , . . . , Xi ) = β
1.3. La constante del modelo fue eliminada por error cuando deberia estar pre-
sente.Sigue siendo insesgado en el estimador βˆ∗ [Pista: introducir el modelo
con intercepto βˆ∗ ]
Para mostrar que β ∗ es insesgado, en el estimador tenemos
n
X
(Xi − X̂) = 0
i=1
4
β ∗ = âi Yi
Donde ai
n
P
(Xi − X̂)
i=1
aˆ∗i = n
(Xj − X̂)2
P
j=1
1.4. Calcular la varianza del estimador β ∗ , comprobar que var(β ∗ ) ≤ var(β̂). Pista:
P 2 P
Xi ≥ (Xi − X̂)2
n
Xi2 var(ui |X1, . . . , Xn )
P
i=1
var(β ∗ |X1 , . . . , Xn ) = n
Xj2
P
j=1
µ2u
var(β ∗ |X1 , . . . , Xn ) = n
Xj2
P
j=1
1.5. Que elegir, un estimador sesgado pero con una varianza minima o un insegado
con una varianza mayor.
µ2u
Ya que la varianza es n va hacer un estimador sesgado con una varianza minima.
Xj2
P
j=1
Yi = βXi + ui
asumir los supuestos:
ui iid(0, σ 2 )
cov(xi , ui ) = 0, (xi , yi ).
5
Asi
n
X
β̄ = ai Yi
i=1
Donde
1
ai = n
P
Xi
i=1
Entonces
E(ui |X1 , . . . , Xn ) = 0
∴ E(β̄|X1 , . . . , Xi ) = β
n
Xi2 var(ui |X1, . . . , Xn )
P
i=1
var(β̄|X1 , . . . , Xn ) = n
Xj2
P
j=1
µ2u
var(β̄|X1 , . . . , Xn ) = n
Xj2
P
j=1
Ȳ = βˆ0
Ŷi = βˆ0
Con esto nos queda que
Ȳ = Ŷi −→ Ȳ − Ŷi = 0 . . . λ
Ahora, tenemos que la suma explicada(SE) y la suma tota(ST):
n
X
SE = (Ȳ − Ŷi )2
i=1
6
n
X
ST = (Yi − Ȳ )2
i=1
Calculando el rato entre la suma explicada y la suma total, tenemos que:
n
(Ȳ − Ŷi )2
P
2 SE i=1
R = = n
ST
(Yi − Ȳ )2
P
i=1
∴ R2 = 0
n
X
SR = (ûi )2
i=1
n
X
SR = (X̂i − X̄)2
i=1
Xi = βˆ0 + βˆ1 Yi . . . γ)
7
sustituyendo ϖ) en ω) nos queda:
n
P 2
(Yi − Ȳ )(Xi − X̄) Xn
i=1
SR = ( n (Yi − Ȳ )2
(Yi − Ȳ )2
P
i=1
i=1
n
(Yi − Ȳ )(Xi − X̄))2
P
(
i=1
SR = n
(Yi − Ȳ )2
P
i=1
∴ R2 = rXY
2
yi = α + βxi + ui
ui tiene funcion exponencial, demostrar de βb es insesgado pero α
b es sesgado.
8
en el pasado, monopolista ha fijado los siguientes precios y vendido
las cantidades costo marginal de producir una unidad es de 10.
Estimar partros con ols y deducir intervalode confianza para nivel
de produccie maximiza beneficios.
q p
3 18
3 16
7 17
6 12
10 15
15 15
16 4
(1)
13 13
9 11
15 6
9 8
15 10
12 7
18 7
21 7
install.packages("dplyr")
dataf = data.frame(q,p)
dataf
## q p
## 1 3 18
## 2 3 16
## 3 7 17
## 4 6 12
## 5 10 15
## 6 15 15
## 7 16 4
## 8 13 13
## 9 9 11
## 10 15 6
## 11 9 8
## 12 15 10
## 13 12 7
## 14 18 7
## 15 21 7
9
18
cantidad vendida
14
8 10
6
4
5 10 15 20
precio
b <- sum((dataf$q-mean(dataf$q))*(dataf$p-mean(dataf$p)))/sum((dataf$q-mean(dataf$q))^2); b
## [1] -0.5836376
a <- mean(dataf$p)-b*mean(dataf$q ); a
## [1] 17.75904
8 10
6
4
5 10 15 20
growth
10
Tenemos que nuestra regresion es:
\ i = 17.75904 − 0.58363precio
cantidad \i
1.0
0.5
−2 0 2 4 6
growth
Podemos ver que con-
forme aumenta el crecimiento en los paises, hay un ligero crecimiento en el comercio de cada uno.
7.2. Un pais, Malta, tiene una cuota de participacion del comercio mucho mayor
que la de otros paises. Encontrar a Malta en el diagrama de dispersion. Parece
Malta un atipico?
Si, esto se podria deber a que Mata es un pais considerado como un pais de ingresos altos al tener
una economia basada en servicios. Estta clasificado por el Fondo Monetario Internacional como una
economia avanzada, por lo que tiene una participacion mucho mayor que los otros paises.
7.3. Utilizar todas las observaciones y estimar regresion del growth sobre tra-
deshare. Cual es la pendiente estimada? Utilizar resultados para predecir la
tasa de crecimiento de un pais con una participacion del comercio de un 0.5
y con una participacion del comercio igual a 1.
11
ols <- lm(tradeshare~growth, data = Growth);ols
##
## Call:
## lm(formula = tradeshare ~ growth, data = Growth)
##
## Coefficients:
## (Intercept) growth
## 0.46053 0.05362
1.0
0.5
−2 0 2 4 6
growth
\ i = 0.46 + 0.05precio
cantidad \i
b <- sum((Growth$growth-mean(Growth$growth))*(Growth$tradeshare-mean(Growth$tradeshare)))/sum((G
## [1] 0.053624
12
esta asociado a un aumento de 0.05 unidades, la pendiente positiva nos dice que conforme crezca mas
un pais, mayor sera su comercio.
La tasa de crecimiento de un país con una participación del comercio igual a .5 es:
## (Intercept)
## 0.4873389
La tasa de crecimiento de un país con una participación del comercio igual a 1 es:
ols$coef[1] + ols$coef[2] * 1
## (Intercept)
## 0.5141509
7.4. Estimar modelo pero excluir a Malta. Contestar las mismas preguntas que
en 7.3 . Es significativo el estimador de comercio? Construir intervalo de
confianza al 90 por cientoy 95 por ciento.
##
## Call:
## lm(formula = tradeshare ~ growth, data = sinmalta)
##
## Coefficients:
## (Intercept) growth
## 0.49273 0.02657
13
1.0
0.8
tradeshare
0.6
0.4
0.2
−2 0 2 4 6
growth
\
tradeshare \ → (amarillo)Regresión incluyendo al pais Malta
= 0.46 + 0.05growth
\
tradeshare \ → (verde)Regresión excluyendo al pais Malta
= 0.49 + 0.02growth
## 2.5 % 97.5 %
## (Intercept) 0.36331236 0.55774134
## growth 0.01768718 0.08956082
## 5 % 95 %
## (Intercept) 0.37931443 0.54173928
## growth 0.02360259 0.08364542
## 2.5 % 97.5 %
## (Intercept) 0.411740455 0.57372620
## growth -0.004627985 0.05776376
14
confint(ols1, level = 0.90)
\textbf{La tasa de crecimiento de un país(excluyendo Malta) con una participación del comercio i
## (Intercept)
## 0.5060173
ols1$coef[1] + ols1$coef[2] * 1
## (Intercept)
## 0.5193012
En este caso, nos damos cuenta que cuando exluimos Malta, baja la tasa de crecimiento de un país.
7.5. Deberia Malta estar incluida o excluida del analisis? Tal vez ayude en la
respuesta investigar donde se situa geograficamente el pais.
Y el error estándar de la regresión con malta, es de:
## [1] 0.02833622
sd.b
## [1] 0.02833622
## [1] 0.01408595
Como el error estándar de la regresión es más pequeño excluyendo a Malta, entonces concluimos
que Malta debería de ser excluida
15
8. El archivo bw.smoking.RData contiene datos sobre una muestra
aleatoria del nacimiento de bebes en Pennsylvania en 1989. Datos
incluye el peso al nacer de bebes junto con otras caracte-risticas
de la madre, incluyendo si ella fumaba durante el embarazo. La
descripcion detallada de se anexa en archivo pdf. El ejercicio in-
vestiga la relacion entre el peso del bebe al nacer y si la madre
fumaba durante el embarazo.
load("~/Econometria/base de datos/bw_smoking.RData")
8.1. Cual es el peso promedio de los bebe para todas las mamas.
## [1] 3382.934
8.2. Cual es el peso promedio de los bebe para las mamas que fumaron durante
el embarazo y para aquellas que no fumaron.
peso_1<- bw_smoking[bw_smoking$smoker == 1, 7 ]
peso_fumadora <- data.frame(peso_1)
peso_promedio <- mean(peso_fumadora$peso_1);peso_promedio
## [1] 3178.832
## [1] 580.0068
peso_0<- bw_smoking[bw_smoking$smoker == 0, 7 ]
peso_nofumadora <- data.frame(peso_0)
peso_promedio <- mean(peso_nofumadora$peso_0);peso_promedio
## [1] 3432.06
## [1] 584.6211
## [1] 3411.305
## [1] 3452.815
16
B <- peso_promedio - 1.96*(desviacion_0/sqrt(3000));B
## [1] 3411.14
## [1] 3452.98
##
## Call:
## lm(formula = ahe ~ age, data = cps_2015)
##
## Coefficients:
## (Intercept) age
## 4.883 0.552
17
80 100
60
ahe
40
20
0
26 28 30 32 34
age
##
## Call:
## lm(formula = ahe ~ age, data = cps_20151)
##
## Coefficients:
## (Intercept) age
## 4.331 0.552
18
80 100
60
ahe
40
20
0
26 28 30 32 34
age
40
20
0
26 28 30 32 34
age
Nos damos cuenta que la pendiente Regresión sin aumentar edad es igual que la pendiente Regresión
sin aumentar edad, como las pendientes son iguales podemos tomar cualquier edad y y sustituilar en
las regresiones, para saber cuanto es lo que difiere el salario.
19
salario <- abs((reg$coef[1]+reg$coef[2]*27)-(reg1$coef[1]+reg1$coef[2]*27));
salario
## (Intercept)
## 0.5519601
con esto, vemos que hay una disminución en el salario de 0.5519601 para la regresión con aumentar
respecto a la regresión sin aumentar
## 2.5 % 97.5 %
## (Intercept) 1.3391816 7.3221144
## age 0.4547248 0.6491954
9.4. Repetir ejercicio con datos exclusivamente de personas con diploma de pre-
paratoria.
## [1] 0.3574902
## [1] 5.787286
20
reg11 <- lm(ahe ~ age, data = prepa );reg11
##
## Call:
## lm(formula = ahe ~ age, data = prepa)
##
## Coefficients:
## (Intercept) age
## 5.7873 0.3575
40
20
0
26 28 30 32 34
age
## [1] 0.7287957
21
alll <- mean(graduado2$ahe)-beee*mean(graduado2$age); alll
## [1] 4.022727
##
## Call:
## lm(formula = ahe ~ age, data = graduado2)
##
## Coefficients:
## (Intercept) age
## 4.0227 0.7288
40
20
0
26 28 30 32 34
age
22
80 100
60
ahe
40
20
0
26 28 30 32 34
age
Conclusion: Pudimos comprobar en general el supuesto de que a mayor edad una persona puede
llegar a tener un mayor ingreso en promedio. Ahora bien si comparamos la poblacion de graduados con
las personas que solo obtuvieron su diploma de preparatoria, podemos observar que la poblacion de
graduados tiene una pendiente mas positiva que la otra poblacion lo qe significa que con un aumento en
la edad su ingreso se elevaria mas rapido en promedio en comparacion a una persona que solo obtuvo
su diploma de preparatoria.
23