Está en la página 1de 24

Escuela Superior de Fisica y Matematicas

ECONOMETRIA

Alumno:
Jaime Cabrera Guzman

Actividad 1

Abril 2021
Ejercicios
1. Considerar el modelo de regresion lineal sin intercepto 3
1.1. Deducir el estmador OLS β ∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Comprobar que el estimador β ∗ es lineal en Yi es insesgado . . . . . . . . . . . . . . . 4
1.3. La constante del modelo fue eliminada por error cuando deberia estar presente.Sigue
siendo insesgado en el estimador βˆ∗ [Pista: introducir el modelo con interceptoP βˆ∗ ] . . 4
∗ ∗
Calcular la varianza del estimador β , comprobar que var(β ) ≤ var(β̂). Pista:
1.4. P Xi2 ≥
2
(Xi − X̂) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Que elegir, un estimador sesgado pero con una varianza minima o un insegado con una
varianza mayor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Considerar el modelo de regresineal sin intercepto 5


2.1. Demostrar que estimador β̄ es lineal en Yi e insesgado. . . . . . . . . . . . . . . . . . . 5
2.2. Comprobar que varianza de β̄ es mayor a varianza de estimador OLS. . . . . . . . . . 6

3. En el modelo de regresion lineal simple si β̂ = 0, entonces R2 = 0 6

4. Demostrar que el R2 de la regresion de y contra x es el valor cuadrado de la


2
correlacion muestral ebtre y y x. Es decir, rXY 7

5. Sea el modelo de regresion lineal, 8

6. Un monopolista maximizador del beneficio enfrenta la curva de demanda de mercado

q = βp + u

en el pasado, monopolista ha fijado los siguientes precios y vendido las cantidades


costo marginal de producir una unidad es de 10. Estimar partros con ols y deducir
intervalode confianza para nivel de produccie maximiza beneficios. 9

7. El archivo Growth.RData contiene datos sobre las tasas medias de crecimiento


desde 1960 a 1995 para 65 paises, junto con variables que potencialmente estan
relacionadas con el crecimiento. En este ejercicio se investigara la relacionn entre
crecimiento y el comercio 11
7.1. Construir diagrama de dispersion de la tasa media de crecimiento anual Growth sobre la
cuota media de participacion del comercio tradeshare. Parece que existe relacion entre
las variables? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
7.2. Un pais, Malta, tiene una cuota de participacion del comercio mucho mayor que la de
otros paises. Encontrar a Malta en el diagrama de dispersion. Parece Malta un atipico? 11
7.3. Utilizar todas las observaciones y estimar regresion del growth sobre tradeshare. Cual
es la pendiente estimada? Utilizar resultados para predecir la tasa de crecimiento de un
pais con una participacion del comercio de un 0.5 y con una participacion del comercio
igual a 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
7.3.1. ¿Cuál es la pendiente estimada y que significa? . . . . . . . . . . . . . . . . . . 12
7.4. Estimar modelo pero excluir a Malta. Contestar las mismas preguntas que en 7.3 . Es
significativo el estimador de comercio? Construir intervalo de confianza al 90 por cientoy
95 por ciento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
7.5. Deberia Malta estar incluida o excluida del analisis? Tal vez ayude en la respuesta
investigar donde se situa geograficamente el pais. . . . . . . . . . . . . . . . . . . . . . 15

8. El archivo bw.smoking.RData contiene datos sobre una muestra aleatoria del naci-
miento de bebes en Pennsylvania en 1989. Datos incluye el peso al nacer de bebes
junto con otras caracte-risticas de la madre, incluyendo si ella fumaba durante el
embarazo. La descripcion detallada de se anexa en archivo pdf. El ejercicio inves-
tiga la relacion entre el peso del bebe al nacer y si la madre fumaba durante el
embarazo. 16

1
8.1. Cual es el peso promedio de los bebe para todas las mamas. . . . . . . . . . . . . . . . 16
8.2. Cual es el peso promedio de los bebe para las mamas que fumaron durante el embarazo
y para aquellas que no fumaron. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
8.3. Construir intervalo de confianza al 95 por ciento para esta diferencia. . . . . . . . . . . 16

9. El archivo cps.2015.RData contiene datos relativos sobre trabajadores de tiempo


completo, empleados mas de 35 horas por semana por al menos 48 semanas en el
aevio. Datos incluye trabajadores que obtuvieron diploma de preparatoria o grado
de licenciatura. Por lo general, trabajadores con mas edad tienen mayor experiencia
laboral que aumenta su productividad e ingresos laborales 17
9.1. Estimar regresion entre ingresos medios por hora (AHE) y edad del trabajador. Cuo au-
mentara los ingresos al incrementar la edad de los trabajadores en un a
17
9.2. Cual es el ingreso promedio de un trabajador con 26 y 30 a respectivamente . . . . . . 20
9.3. Construir intervalo de confianza para coeficientes estimados al 95 por ciento . . . . . . 20
9.4. Repetir ejercicio con datos exclusivamente de personas con diploma de preparatoria. . 20
9.5. Repetir ejercicio con datos exclusivamente de personas con licenciatura. . . . . . . . . 21

2
library(lmtest)
library(sandwich)

1. Considerar el modelo de regresion lineal sin intercepto

Yi = βXi + ui
Asumir los iguientes supuestos:

ui iid(0, σ 2 )

cov(xi , ui ) = 0, (xi , yi ).

(xi , yi ) son iid.

No hay observaciones atcas.

1.1. Deducir el estmador OLS β ∗ .


El estimador de minimos cuadrados de β ∗ es:

Yi = βXi + ui −→ ui = (Yi − βXi )


La funcion del objetivo de minimos cuadrados es
n
X
(Yi − βXi )2
i=1

El diferencial con respecto de β ∗


n n
∂ X 2
X
( (Yi − βXi ) ) = −2 Xi (Yi − βXi )
∂β
i=1 i=1
n
X n
X
= −2 Yi Xi + 2 βXi2
i=1 i=1

Igualando a cero y resuelviendo para el estiamdor de minimos cuadrados β ∗


n
X n
X
−2 Yi Xi + 2 βXi2 = 0
i=1 i=1

Así
n
X n
X
βXi2 = Yi Xi
i=1 i=1

Por lo que obtenemos β ∗


n
P
Yi Xi
∗ i=1
β = n
βXi2
P
i=1

3
1.2. Comprobar que el estimador β ∗ es lineal en Yi es insesgado
Para demostrar que β ∗ es lineal en Yi consideramos
n
P
Yi Xi
∗ i=1
β = n
βXi2
P
i=1

Asi
n
X
β∗ = ai Yi
i=1

Donde

Xi
ai = n
Xj2
P
j=1

Entonces, dado que ai es independiente de Xi y no de Yi , entonces β ∗ es una funcion lineal de Yi


Para demostrar que β ∗ es condicional insesgado que es E(β ∗ |X1 , . . . , Xi ) = β, consideramos la
funcion
n
P
Xi E(ui |X1 , . . . , Xn )
∗ i=1
E(β |X1 , . . . , Xi ) = β + n
Xj2
P
j=1

Entonces

E(ui |X1 , . . . , Xn ) = 0

∴ E(β ∗ |X1 , . . . , Xi ) = β

1.3. La constante del modelo fue eliminada por error cuando deberia estar pre-
sente.Sigue siendo insesgado en el estimador βˆ∗ [Pista: introducir el modelo
con intercepto βˆ∗ ]
Para mostrar que β ∗ es insesgado, en el estimador tenemos
n
X
(Xi − X̂) = 0
i=1

Las desviaciones sobre la suma media igual a cero es:


n
X n
X n
X
(Xi − X̂)(Yi − Ŷ ) = Yi ( (Xi − X̂)) − Ŷ ( (Xi − X̂))
i=1 i=1 i=1
n
X
= Yi (Xi − X̂)
i=1

Sustituyendo el modelo de intercepto, tenemos


n
P
Yi (Xi − X̂)
∗ i=1
β = n
(Xi − X̂)2
P
i=1

4
β ∗ = âi Yi
Donde ai
n
P
(Xi − X̂)
i=1
aˆ∗i = n
(Xj − X̂)2
P
j=1

Entonces âi depende de X1 , . . . , Xn y no de Y1 , . . . , Yn entonces β ∗ es un estimador lineal. Por la


condicion de Gauss-Markov, β ∗ sigue siendo insesgado.

1.4. Calcular la varianza del estimador β ∗ , comprobar que var(β ∗ ) ≤ var(β̂). Pista:
P 2 P
Xi ≥ (Xi − X̂)2

n
Xi2 var(ui |X1, . . . , Xn )
P
i=1
var(β ∗ |X1 , . . . , Xn ) = n
Xj2
P
j=1

Por lo que tenemos

µ2u
var(β ∗ |X1 , . . . , Xn ) = n
Xj2
P
j=1

1.5. Que elegir, un estimador sesgado pero con una varianza minima o un insegado
con una varianza mayor.
µ2u
Ya que la varianza es n va hacer un estimador sesgado con una varianza minima.
Xj2
P
j=1

2. Considerar el modelo de regresineal sin intercepto

Yi = βXi + ui
asumir los supuestos:

ui iid(0, σ 2 )

cov(xi , ui ) = 0, (xi , yi ).

(xi , yi ) son iid.

No hay observaciones atcas.



Sea β̄ el estimador de β que se construye con las medias muestrales, β̄ = x̄ .

2.1. Demostrar que estimador β̄ es lineal en Yi e insesgado.


Para demostrar que β̄ es lineal en Yi consideramos
n
1 P
n Yi
i=1
β̄ = n
1 P
n βXi
i=1

5
Asi
n
X
β̄ = ai Yi
i=1
Donde
1
ai = n
P
Xi
i=1

Entonces, dado que ai es independiente de Xi y no de Yi , entonces β̄ es una funcion lineal de Yi


Para demostrar que β̄ es condicional insesgado que es E(β̄|X1 , . . . , Xi ) = β, consideramos la funcion
n
P
Xi E(ui |X1 , . . . , Xn )
i=1
E(β̄|X1 , . . . , Xi ) = β + n
Xj2
P
j=1

Entonces

E(ui |X1 , . . . , Xn ) = 0

∴ E(β̄|X1 , . . . , Xi ) = β

2.2. Comprobar que varianza de β̄ es mayor a varianza de estimador OLS.

n
Xi2 var(ui |X1, . . . , Xn )
P
i=1
var(β̄|X1 , . . . , Xn ) = n
Xj2
P
j=1

Por lo que tenemos

µ2u
var(β̄|X1 , . . . , Xn ) = n
Xj2
P
j=1

3. En el modelo de regresion lineal simple si β̂ = 0, entonces R2 = 0


Solución:
Tenemos que
Ȳ = βˆ0 + βˆ1 X̄ . . . α)
Ŷi = βˆ0 + βˆ1 Xi . . . γ)
si βˆ1 = 0, sustituyendo en α) y γ nos queda

Ȳ = βˆ0

Ŷi = βˆ0
Con esto nos queda que
Ȳ = Ŷi −→ Ȳ − Ŷi = 0 . . . λ
Ahora, tenemos que la suma explicada(SE) y la suma tota(ST):
n
X
SE = (Ȳ − Ŷi )2
i=1

6
n
X
ST = (Yi − Ȳ )2
i=1
Calculando el rato entre la suma explicada y la suma total, tenemos que:
n
(Ȳ − Ŷi )2
P
2 SE i=1
R = = n
ST
(Yi − Ȳ )2
P
i=1

sustituyendo . . . λ) en R2 tenemos que


n n
(Ȳ − Ŷi )2 (0)2
P P
2 i=1 i=1
R = n = n
(Yi − Ȳ )2 (Yi − Ȳ )2
P P
i=1 i=1

∴ R2 = 0

4. Demostrar que el R2 de la regresion de y contra x es el valor


2
cuadrado de la correlacion muestral ebtre y y x. Es decir, rXY
Solucion:
Como es y contra x, tenemos que

Xi = Ȳi + ūi −→ ūi = Xi − Ȳi

n
X
SR = (ûi )2
i=1
n
X
SR = (X̂i − X̄)2
i=1

Xi = βˆ0 + βˆ1 Yi . . . γ)

X̄ = βˆ0 + βˆ1 Ȳ −→ βˆ0 = X̄ − βˆ1 Ȳ . . . λ)


Sustituyendo λ) en γ)
X̂i = X̄ − βˆ1 Ȳ + βˆ1 Yi . . . ϕ
Sustityuendo ϕ en SR tenemos que:
n
X
SR = (X̄ − βˆ1 Ȳ + βˆ1 Yi − X̄)2
i=1
n
X
SR = (βˆ1 (Yi − Ȳ ))2
i=1
n
2 X
SR = βˆ1 (Yi − Ȳ )2 . . . ω)
i=1
pero, tenemos que
n
P
(Yi − Ȳ )(Xi − X̄)
i=1
βˆ1 = n . . . ϖ)
(Yi − Ȳ )2
P
i=1

7
sustituyendo ϖ) en ω) nos queda:
n
P 2
(Yi − Ȳ )(Xi − X̄) Xn
i=1
SR = ( n (Yi − Ȳ )2
(Yi − Ȳ )2
P
i=1
i=1
n
(Yi − Ȳ )(Xi − X̄))2
P
(
i=1
SR = n
(Yi − Ȳ )2
P
i=1

Ahora, tenemos que:


n
X
ST = (Xi − X̄)2
i=1
SR
Recordando que R2 = ST , tenemos que:
n
(Yi −Ȳ )(Xi −X̄))2
P
(
i=1 n
n
(Yi − Ȳ )(Xi − X̄))2
P
P
(Yi −Ȳ )2 (
i=1
R2 = ( n
i=1
= n n
(Xi − X̄)2 (Yi − Ȳ )2 )( (Xi − X̄)2 )
P P P
(
i=1 i=1 i=1
n
1 P
(Yi − Ȳ )(Xi − X̄)
n−1
2 i=1 sx y 2
R = [s s ]2 = ( )
n n Sx sy
1 P 1 P
n−1 ( (Yi − Ȳ n−1 ( (Xi − X̄)
i=1 i=1

∴ R2 = rXY
2

5. Sea el modelo de regresion lineal,

yi = α + βxi + ui
ui tiene funcion exponencial, demostrar de βb es insesgado pero α
b es sesgado.

6. Un monopolista maximizador del beneficio enfrenta la curva de


demanda de mercado
q = βp + u

8
en el pasado, monopolista ha fijado los siguientes precios y vendido
las cantidades costo marginal de producir una unidad es de 10.
Estimar partros con ols y deducir intervalode confianza para nivel
de produccie maximiza beneficios.
 
q p
3 18
 
3 16
 
7 17
 
6 12
 
10 15
 
15 15
 
16 4
 
(1)
13 13
 
9 11
 

15 6

 
9 8
 
15 10
 
12 7
 
18 7
21 7
install.packages("dplyr")

q <- c(3, 3, 7, 6, 10, 15,16, 13, 9, 15,9, 15,12,18,21)


p <- c(18,16,17,12,15, 15, 4, 13,11, 6, 8, 10, 7, 7, 7)

dataf = data.frame(q,p)
dataf

## q p
## 1 3 18
## 2 3 16
## 3 7 17
## 4 6 12
## 5 10 15
## 6 15 15
## 7 16 4
## 8 13 13
## 9 9 11
## 10 15 6
## 11 9 8
## 12 15 10
## 13 12 7
## 14 18 7
## 15 21 7

load("~/Econometria/base de datos/Growth.RData") #corresponde a su direccion en la compu


plot( dataf$q ,dataf$p , pch = 20, xlab = "precio", ylab = "cantidad vendida" )

9
18
cantidad vendida

14
8 10
6
4

5 10 15 20

precio

b <- sum((dataf$q-mean(dataf$q))*(dataf$p-mean(dataf$p)))/sum((dataf$q-mean(dataf$q))^2); b

## [1] -0.5836376

a <- mean(dataf$p)-b*mean(dataf$q ); a

## [1] 17.75904

plot( dataf$q ,dataf$p , pch=20, xlim = c(min(dataf$q), max(dataf$q)), ylim = c(min(dataf$p), ma


abline(a,b, col = "yellow", lwd = 2 )
18
14
tradeshare

8 10
6
4

5 10 15 20

growth

10
Tenemos que nuestra regresion es:

\ i = 17.75904 − 0.58363precio
cantidad \i

7. El archivo Growth.RData contiene datos sobre las tasas medias de


crecimiento desde 1960 a 1995 para 65 paises, junto con variables
que potencialmente estan relacionadas con el crecimiento. En este
ejercicio se investigara la relacionn entre crecimiento y el comercio
7.1. Construir diagrama de dispersion de la tasa media de crecimiento anual
Growth sobre la cuota media de participacion del comercio tradeshare. Pa-
rece que existe relacion entre las variables?
El Gráfico de dispersión nos queda de la siguiente manera:

load("~/Econometria/base de datos/Growth.RData")#corresponde a su direccion en la compu


plot( Growth$growth ,Growth$tradeshare , pch = 20, ylab = "tradeshare", xlab = "growth" )
2.0
1.5
tradeshare

1.0
0.5

−2 0 2 4 6

growth
Podemos ver que con-
forme aumenta el crecimiento en los paises, hay un ligero crecimiento en el comercio de cada uno.

7.2. Un pais, Malta, tiene una cuota de participacion del comercio mucho mayor
que la de otros paises. Encontrar a Malta en el diagrama de dispersion. Parece
Malta un atipico?
Si, esto se podria deber a que Mata es un pais considerado como un pais de ingresos altos al tener
una economia basada en servicios. Estta clasificado por el Fondo Monetario Internacional como una
economia avanzada, por lo que tiene una participacion mucho mayor que los otros paises.

7.3. Utilizar todas las observaciones y estimar regresion del growth sobre tra-
deshare. Cual es la pendiente estimada? Utilizar resultados para predecir la
tasa de crecimiento de un pais con una participacion del comercio de un 0.5
y con una participacion del comercio igual a 1.

11
ols <- lm(tradeshare~growth, data = Growth);ols

##
## Call:
## lm(formula = tradeshare ~ growth, data = Growth)
##
## Coefficients:
## (Intercept) growth
## 0.46053 0.05362

plot( Growth$growth ,Growth$tradeshare , pch=20, ylab = "tradeshare", xlab = "growth")


abline(ols, col = "yellow", lwd = 2 )
2.0
1.5
tradeshare

1.0
0.5

−2 0 2 4 6

growth

Tenemos que nuestra regresion es:

\ i = 0.46 + 0.05precio
cantidad \i

7.3.1. ¿Cuál es la pendiente estimada y que significa?


La pendiente estimada (β̂) es:
Pn
(x − x̄)(yi − ȳ)
β̂ = Pn i
i=1
2
(2)
i=1 (xi − x̄)

b <- sum((Growth$growth-mean(Growth$growth))*(Growth$tradeshare-mean(Growth$tradeshare)))/sum((G

## [1] 0.053624

Recordemos que la pendiente de la recta relaciona X con Y es elefecto de la variación en una


unidad de X sobre Y, con esto, la variación de tradeshare sobre growth nos queda nos indica que un
aumento proporcional en el crecimiento de un pais vs el creciemiento ene l comercio en una unidad,

12
esta asociado a un aumento de 0.05 unidades, la pendiente positiva nos dice que conforme crezca mas
un pais, mayor sera su comercio.
La tasa de crecimiento de un país con una participación del comercio igual a .5 es:

ols$coef[1] + ols$coef[2] * 0.5

## (Intercept)
## 0.4873389

La tasa de crecimiento de un país con una participación del comercio igual a 1 es:

ols$coef[1] + ols$coef[2] * 1

## (Intercept)
## 0.5141509

7.4. Estimar modelo pero excluir a Malta. Contestar las mismas preguntas que
en 7.3 . Es significativo el estimador de comercio? Construir intervalo de
confianza al 90 por cientoy 95 por ciento.

tradeshare <- Growth[Growth$country_name != "Malta" , 5 ]


growth <- Growth[Growth$country_name != "Malta" , 2 ]
sinmalta <- data.frame(tradeshare,growth)

ols1 <- lm(tradeshare~growth, data = sinmalta);ols1

##
## Call:
## lm(formula = tradeshare ~ growth, data = sinmalta)
##
## Coefficients:
## (Intercept) growth
## 0.49273 0.02657

plot( sinmalta$growth ,sinmalta$tradeshare , pch=20, ylab = "tradeshare",xlab= "growth")


abline(ols, col = "yellow", lwd = 2 )
abline(ols1, col = "green", lwd = 2 )

13
1.0
0.8
tradeshare

0.6
0.4
0.2

−2 0 2 4 6

growth

Tenemos que nuestra regresion es:

\
tradeshare \ → (amarillo)Regresión incluyendo al pais Malta
= 0.46 + 0.05growth

\
tradeshare \ → (verde)Regresión excluyendo al pais Malta
= 0.49 + 0.02growth

Intervalo de confianza al 95 por ciento incluyendo al pais Malta

confint(ols, level = 0.95)

## 2.5 % 97.5 %
## (Intercept) 0.36331236 0.55774134
## growth 0.01768718 0.08956082

Intervalo de confianza al 90 por ciento incluyendo al pais Malta

confint(ols, level = 0.90)

## 5 % 95 %
## (Intercept) 0.37931443 0.54173928
## growth 0.02360259 0.08364542

Intervalo de confianza al 95 por ciento excluyendo al pais Malta

confint(ols1, level = 0.95)

## 2.5 % 97.5 %
## (Intercept) 0.411740455 0.57372620
## growth -0.004627985 0.05776376

Intervalo de confianza al 90 por ciento excluyendo al pais Malta

14
confint(ols1, level = 0.90)

\textbf{La tasa de crecimiento de un país(excluyendo Malta) con una participación del comercio i

## Error: <text>:3:2: unexpected symbol


## 2:
## 3: \textbf
## ^

ols1$coef[1] + ols1$coef[2] * 0.5

## (Intercept)
## 0.5060173

La tasa de crecimiento de un país(excluyendo Malta) con una participación del comer-


cio igual a 1 es:

ols1$coef[1] + ols1$coef[2] * 1

## (Intercept)
## 0.5193012

En este caso, nos damos cuenta que cuando exluimos Malta, baja la tasa de crecimiento de un país.

7.5. Deberia Malta estar incluida o excluida del analisis? Tal vez ayude en la
respuesta investigar donde se situa geograficamente el pais.
Y el error estándar de la regresión con malta, es de:

ols <- lm(tradeshare~growth, data = Growth)


e.2 <- residuals(ols)^2
n <- length(e.2)
desvio.x <- (Growth$growth-mean(Growth$growth))^2
var.b <- (n/(n-2))*sum(desvio.x*e.2)/sum(desvio.x)^2
sd.b <- sqrt(var.b);sd.b

## [1] 0.02833622

sd.b

## [1] 0.02833622

Y el error estándar de la regresión sin malta, es de:

ols <- lm(tradeshare~growth, data = sinmalta)


e.2 <- residuals(ols)^2
n <- length(e.2)
desvio.x <- (sinmalta$growth-mean(sinmalta$growth))^2
var.b <- (n/(n-2))*sum(desvio.x*e.2)/sum(desvio.x)^2
sd.b <- sqrt(var.b);sd.b

## [1] 0.01408595

Como el error estándar de la regresión es más pequeño excluyendo a Malta, entonces concluimos
que Malta debería de ser excluida

15
8. El archivo bw.smoking.RData contiene datos sobre una muestra
aleatoria del nacimiento de bebes en Pennsylvania en 1989. Datos
incluye el peso al nacer de bebes junto con otras caracte-risticas
de la madre, incluyendo si ella fumaba durante el embarazo. La
descripcion detallada de se anexa en archivo pdf. El ejercicio in-
vestiga la relacion entre el peso del bebe al nacer y si la madre
fumaba durante el embarazo.

load("~/Econometria/base de datos/bw_smoking.RData")

8.1. Cual es el peso promedio de los bebe para todas las mamas.

peso_promedio <- mean(bw_smoking$birthweight); peso_promedio

## [1] 3382.934

8.2. Cual es el peso promedio de los bebe para las mamas que fumaron durante
el embarazo y para aquellas que no fumaron.

peso_1<- bw_smoking[bw_smoking$smoker == 1, 7 ]
peso_fumadora <- data.frame(peso_1)
peso_promedio <- mean(peso_fumadora$peso_1);peso_promedio

## [1] 3178.832

desviacion_1 <- sd(peso_fumadora$peso_1);desviacion_1

## [1] 580.0068

peso_0<- bw_smoking[bw_smoking$smoker == 0, 7 ]
peso_nofumadora <- data.frame(peso_0)
peso_promedio <- mean(peso_nofumadora$peso_0);peso_promedio

## [1] 3432.06

desviacion_0 <- sd(peso_nofumadora$peso_0);desviacion_0

## [1] 584.6211

8.3. Construir intervalo de confianza al 95 por ciento para esta diferencia.

A <- peso_promedio - 1.96*(desviacion_1/sqrt(3000));A

## [1] 3411.305

A1 <- peso_promedio + 1.96*(desviacion_1/sqrt(3000));A1

## [1] 3452.815

16
B <- peso_promedio - 1.96*(desviacion_0/sqrt(3000));B

## [1] 3411.14

B1 <- peso_promedio + 1.96*(desviacion_0/sqrt(3000));B1

## [1] 3452.98

9. El archivo cps.2015.RData contiene datos relativos sobre trabaja-


dores de tiempo completo, empleados mas de 35 horas por semana
por al menos 48 semanas en el aevio. Datos incluye trabajadores
que obtuvieron diploma de preparatoria o grado de licenciatura.
Por lo general, trabajadores con mas edad tienen mayor experien-
cia laboral que aumenta su productividad e ingresos laborales
9.1. Estimar regresion entre ingresos medios por hora (AHE) y edad del trabaja-
dor. Cuo aumentara los ingresos al incrementar la edad de los trabajadores en un
a

load("~/Econometria/base de datos/cps_2015.RData")#corresponde a su direccion en la compu

Usando la Linea de comando obtenemos:

reg<- lm(ahe ~ age, data = cps_2015); reg

##
## Call:
## lm(formula = ahe ~ age, data = cps_2015)
##
## Coefficients:
## (Intercept) age
## 4.883 0.552

Tenemos que nuestras regresiones son:

yˆi = 4.883 + 0.552x̂i → (azul)Regresión de trabajadores

plot( cps_2015$age,cps_2015$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg,col = "blue", lwd = 2)

17
80 100
60
ahe

40
20
0

26 28 30 32 34

age

Ahora se aumentara la edad de los trabajadores en un aCalculamos la regresión, si los traba-


jadores aumenta la edad en un año
Usando linea de comandos, obtenemos:

ahe <- cps_2015$ahe


age <- cps_2015$age+1
cps_20151 <- data.frame(age,ahe)
reg1 <- lm(ahe ~ age, data = cps_20151 );reg1

##
## Call:
## lm(formula = ahe ~ age, data = cps_20151)
##
## Coefficients:
## (Intercept) age
## 4.331 0.552

Tenemos que nuestras regresion es:

yˆi = 4.331 + 0.552x̂i → (Rojo)Regresión de trabajadores con un as

plot( cps_2015$age,cps_2015$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg1,col = "red", lwd = 2)

18
80 100
60
ahe

40
20
0

26 28 30 32 34

age

Ahora comparamos ambas rectas estimadas:

plot( cps_2015$age,cps_2015$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg,col = "blue", lwd = 2)
abline(reg1,col = "red", lwd = 2)
80 100
60
ahe

40
20
0

26 28 30 32 34

age

Nos damos cuenta que la pendiente Regresión sin aumentar edad es igual que la pendiente Regresión
sin aumentar edad, como las pendientes son iguales podemos tomar cualquier edad y y sustituilar en
las regresiones, para saber cuanto es lo que difiere el salario.

19
salario <- abs((reg$coef[1]+reg$coef[2]*27)-(reg1$coef[1]+reg1$coef[2]*27));
salario

## (Intercept)
## 0.5519601

con esto, vemos que hay una disminución en el salario de 0.5519601 para la regresión con aumentar
respecto a la regresión sin aumentar

9.2. Cual es el ingreso promedio de un trabajador con 26 y 30 a respectivamente


el ingreso promedio de los trabajadores es

W <- reg$coef[1] + reg$coef[2] * 26

W <- reg$coef[1] + reg$coef[2] * 30

el ingreso promedio de los trabajadores aumentandoles un a

W1 <- reg1$coef[1] + reg1$coef[2] * 26

W2 <- reg1$coef[1] + reg1$coef[2] * 30

9.3. Construir intervalo de confianza para coeficientes estimados al 95 por ciento

confint(reg1, level = 0.95)

## 2.5 % 97.5 %
## (Intercept) 1.3391816 7.3221144
## age 0.4547248 0.6491954

9.4. Repetir ejercicio con datos exclusivamente de personas con diploma de pre-
paratoria.

age <- cps_2015[cps_2015$bachelor == 0, 5 ]


ahe <- cps_2015[cps_2015$bachelor == 0, 2 ]
prepa <- data.frame(age,ahe)

De forma manual, tenemos que:

bee <- sum(((prepa$age)-mean(prepa$age))*(prepa$ahe-mean(prepa$ahe))


)/sum((prepa$age-mean(prepa$age))^2); bee

## [1] 0.3574902

all <- mean(prepa$ahe)-bee*mean(prepa$age); all

## [1] 5.787286

Usando lineas de comando comprobamos:

20
reg11 <- lm(ahe ~ age, data = prepa );reg11

##
## Call:
## lm(formula = ahe ~ age, data = prepa)
##
## Coefficients:
## (Intercept) age
## 5.7873 0.3575

plot( prepa$age,prepa$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg11,col = "blue", lwd = 2)
80
60
ahe

40
20
0

26 28 30 32 34

age

La regresión nos queda:

yˆi = 5.787286 + 0.3574902x̂i

9.5. Repetir ejercicio con datos exclusivamente de personas con licenciatura.

age <- cps_2015[cps_2015$bachelor == 1, 5 ]


ahe <- cps_2015[cps_2015$bachelor == 1, 2 ]
graduado2 <- data.frame(age,ahe)

De forma manual, tenemos que:

beee <- sum(((graduado2$age)-mean(graduado2$age))*(graduado2$ahe-mean(


graduado2$ahe)))/sum((graduado2$age-mean(graduado2$age))^2); beee

## [1] 0.7287957

21
alll <- mean(graduado2$ahe)-beee*mean(graduado2$age); alll

## [1] 4.022727

Comprobando por linea de comando, nos da:

reg22 <- lm(ahe ~ age, data = graduado2 );reg22

##
## Call:
## lm(formula = ahe ~ age, data = graduado2)
##
## Coefficients:
## (Intercept) age
## 4.0227 0.7288

plot( graduado2$age,graduado2$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg22,col = "red", lwd = 2)
80 100
60
ahe

40
20
0

26 28 30 32 34

age

La regresión nos queda:

yˆi = 4.022727 + 0.7287957x̂i

comparando ambas lineas:

plot( cps_2015$age,cps_2015$ahe, pch=20, xlab = "age", ylab = "ahe")


abline(reg11,col = "blue", lwd = 2)
abline(reg22,col = "red", lwd = 2)

22
80 100
60
ahe

40
20
0

26 28 30 32 34

age

Conclusion: Pudimos comprobar en general el supuesto de que a mayor edad una persona puede
llegar a tener un mayor ingreso en promedio. Ahora bien si comparamos la poblacion de graduados con
las personas que solo obtuvieron su diploma de preparatoria, podemos observar que la poblacion de
graduados tiene una pendiente mas positiva que la otra poblacion lo qe significa que con un aumento en
la edad su ingreso se elevaria mas rapido en promedio en comparacion a una persona que solo obtuvo
su diploma de preparatoria.

23

También podría gustarte