Está en la página 1de 18

UNIVERSIDAD ESTATAL DE MILAGRO

MILAGRO – GUAYAS – ECUADOR

FACULTAD DE CIENCIAS SOCIALES, EDUCACIÓN COMERCIAL Y DERECHO.

ECONOMÍA EN LÍNEA – SEXTO NIVEL – PARALELO C3

ANÁLISIS DE REGRESIONES

RESOLUCIÓN DE EJERCICIOS DE LA UNIDAD 3

Autores.

Gutiérrez Jiménez Karelys Brigitte Macas Robles Bryan Reginaldo


kgutierrezj@unemi.edu.ec bmacasr@unemi.edu.ec
C.I.: 0706777257 C.I.: 0705604411

Vivar Dávila Fernanda Estefanía Toapanta Pérez Marco Javier


fvivard@unemi.edu.ec mtoapantap2@unemi.edu.ec
C.I.: 0706687068 C.I.: 1717292757

Cedillo Achanci Keyla Thalis


kcedilloa@unemi.edu.ec
C.I.: 0955199534
Cátedra.

Econometría Aplicada

Docente de Cátedra.

Econ. Roberto William Cascante Yarleque

Fecha de entrega.

Domingo, 03 de noviembre de 2023.

Enlace de acceso a la práctica en R-Studio.

https://drive.google.com/drive/folders/1OOPyQcaMogBeE9b6PU19FOxU
QGM5DRDk?usp=sharing
Página |1

RESOLUCIÓN DE EJERCICIOS DE LA UNIDAD 3.

Ejercicio 3.1.

Suponga que:
𝑦 = 𝛽𝑥 + 𝜀

Donde se sabe que Var(ε)=100 y se tiene las siguientes


observaciones:

Y X Z
25 6 3
33 3 1
-42 -2 -4
63 9 6
56 -16 -3

Siendo Z un instrumento para X.

A partir de esta información:

𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑙𝑎 𝑒𝑛𝑑𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑
𝐻𝑎 : 𝑆𝑖 𝑒𝑥𝑖𝑠𝑡𝑒 𝑙𝑎 𝑒𝑛𝑑𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑

Literal A.
Contraste por endogeneidad usando un test de Hausman.
> # Se muestra los residuales de p value
> summary(Hausman)[[4]][2,3:4]
t value Pr(>|t|)
-2.75391737 0.07051042

Interpretación del ejercicio.

“Dado que el valor de alfa supera el nivel de significancia,


podemos inferir de manera automática que no se descarta la hipótesis
nula. En resumen, para este primer caso y respondiendo a la solicitud,
podemos afirmar que no hay presencia de endogeneidad.”

Literal B.
Calcule la línea de regresión muestral, 𝑋̂, de una regresión de X sobre Z.
Estime un modelo de regresión múltiple de Y sobre X y 𝑋̂ y contraste la
Ho de que el coeficiente que acompaña a 𝑋̂ es cero. Muestre que este
contraste es igual al del punto anterior.
Página |2

> # Calculamos la regresión de Y sobre X


> Hausman2 <- lm(y ~ x + FT_X2 - 1)
> summary(Hausman2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
x 1.928 1.235 1.561 0.2164
FT_X2 4.242 1.540 2.754 0.0705 .

> data.frame(row.names = c("Tvalue","Pvalue"),


+ Hausman = rbind(Tvalue1,Pvalue1),
+ Etapas = rbind(Tvalue2,Pvalue2))

Hausman Etapas
Tvalue -2.753917 2.753917
Pvalue 0.070510 0.070510

Interpretación.

“Los resultados nos indican que, desde una perspectiva estadística,


se puede afirmar que los valores de t y p en el test de Hausman y en el
análisis de dos etapas son consistentes. En otras palabras, los coeficientes
son absolutos, lo que significa que, al realizar una prueba de hipótesis, el
resultado será el mismo, ya que los coeficientes son idénticos.”

Ejercicio 3.2.

Para estimar el rendimiento de la educación para los hombres, se


utiliza la variable sibs (número de hermanos) como instrumento para
educ. Estas están correlacionadas de forma negativa, como se uede
constatar a partir de la regresión simple:

𝒆𝒅𝒖𝒄 = 𝟏𝟒, 𝟏𝟒 − 𝟎, 𝟐𝟐𝟖 𝒔𝒊𝒃𝒔


(𝟎, 𝟏𝟏) (𝟎, 𝟎𝟑𝟎)
𝟐
𝑵 = 𝟗𝟑𝟓 𝑹 = 𝟎, 𝟎𝟓𝟕

Esta ecuación implica que cada hermano se asocia, en


promedio, con aproximadamente 0.23 años menos de educación. Si se
supone que sibs no está correlacionada con el término de error,
entonces el estimador de VI es consistente. Al estimar nuevamente, pero
esta vez con sibs como una VI para educ se obtiene:

𝒍𝒐𝒈(𝒘𝒂𝒈𝒆) = 𝟓, 𝟏𝟑 + 𝟎, 𝟏𝟏𝟐 𝒆𝒅𝒖𝒄


(𝟎, 𝟑𝟔) (𝟎, 𝟎𝟐𝟔)
𝑵 = 𝟗𝟑𝟓
Página |3

De esta forma usando sibs como instrumento para educ, la


estimación de VI del rendimiento de la eduación es 0.122.

Se pide:

Literal A.
Para convencerse de que usar sibs como una VI para educ no es lo
mismo que sólo insertar sibs en lugar de educ y estimar la regresión por
MCO, realice la regresión de log(wage) sobre sibs y explique sus
hallazgos.
> # Creamos la nueva variable:
> BD$lg_wage <- log(BD$wage)
> Regresión <- lm(lg_wage ~ sibs, data = BD)
> summary(Regresión)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.861076 0.022078 310.771 < 2e-16 ***
sibs -0.027904 0.005908 -4.723 2.68e-06 ***

Interpretación.

“A partir de los resultados obtenidos, se realizó una regresión


basada en el salario. Esto indica que hay una correlación inversa con el
número de hermanos, lo que implica que a medida que la cantidad de
hermanos aumenta, el nivel de salario tiende a disminuir en un 3%, como
lo indica el coeficiente de -0,03. Esta conclusión se respalda con un nivel
de confianza de -0,0004723, que se encuentra dentro de nuestro intervalo
de confianza.”

Literal B.
La variable brthord es el orden de nacimiento (brthord es (1) uno para el
niño que nació primero, (2) dos para el segundo, y así sucesivamente).
Explique por qué educ y brthord pueden estar negativamente
correlacionadas. Realice la regresión de educ sobre brthord para
determinar si existe una correlación negativa estadísticamente
significativa.
> # LITERAL B.
> Regresión2 <- lm(educ ~ brthord, data = BD)
> summary(Regresión2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.14945 0.12868 109.962 < 2e-16 ***
brthord -0.28264 0.04629 -6.106 1.55e-09 ***
Página |4

Interpretación.

“Según los resultados obtenidos en R-Studio, se puede afirmar que


existe una relación lógica que indica que a medida que aumenta el
número de hijos en una familia, el nivel de educación tiende a disminuir
en un porcentaje del -28,26%. Esto implica que, en general, los hermanos
menores pueden tener un nivel educativo inferior al del primogénito.
Aunque esta relación muestra significancia estadística al entrar en la zona
de confianza, es importante destacar que en la realidad pueden existir
diversas situaciones y variaciones, por lo que siempre será relevante.”

Literal C.
Use brthord como una VI para educ en la siguiente ecuación:

log(𝑤𝑎𝑔𝑒) = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝑢
> # LITERAL C.
> Regresión3 <- ivreg(lg_wage ~ educ | brthord, data = BD)
> summary(Regresión3)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.03040 0.43295 11.619 < 2e-16 ***
educ 0.13064 0.03204 4.078 4.97e-05 ***

Interpretación.

“Según los resultados obtenidos en nuestra práctica de R-Studio,


podemos concluir en comparación con el ejercicio anterior que hay una
correlación positiva entre el nivel de educación y el nivel salarial. Esto
indica que a medida que el nivel educativo aumenta, es probable que
el salario también aumente. La inclusión de la variable instrumental
brthord en el modelo ayuda a corregirlo, lo que se traduce en cambios
significativos en la importancia estadística y el error estándar asociado
con la variable de educación con respecto al nivel salarial.”

Literal D.
Ahora suponga que se incluye el número de hermanos como una
variable explicativa en la ecuación del salario; esto controla los
antecedentes familiares, en cierto grado:

log(𝑤𝑎𝑔𝑒) = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝛽2 𝑠𝑖𝑏𝑠 + 𝑢

Suponga que se quiere usar brthord como una VI para educ,


suponiendo que sibs sea exógena. La forma reducida para educ es:

𝑒𝑑𝑢𝑐 = 𝜋0 + 𝜋1 + 𝜋2 + 𝑣
Página |5

Estime la ecuación (5) usando brthord como una VI para educ, ver
ecuación (6) y comente sobre los parámetros y errores estándares de
𝛽𝑒𝑑𝑢𝑐 y 𝛽𝑠𝑖𝑏𝑠
> Regresión4 <- ivreg(lg_wage ~ educ + sibs |
+ educ + sibs + brthord,
+ data = BD)
> summary(Regresión4)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.055953 0.091155 66.436 <2e-16 ***
educ 0.057926 0.006265 9.246 <2e-16 ***
sibs -0.014984 0.006034 -2.483 0.0132 *

> Regresión5 <- ivreg(lg_wage ~ sibs + educ |


+ sibs + brthord,
+ data = BD)
> summary(Regresión5)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.938528 1.055690 4.678 3.37e-06 ***
sibs 0.002111 0.017372 0.122 0.9033
educ 0.136994 0.074681 1.834 0.0669 .

Interpretación.

“Se puede reflejar de mejor manera en los resultados observados,


la evidencia en que los coeficientes de las variables experimentan
cambios al introducir una variable instrumental. En el caso de la variable
‘educación’, la estimación inicial era del 5,79%, con una significancia del
1,32%. Sin embargo, al incorporar la variable instrumental, la estimación
para la educación aumentó a 13,70%, con una significancia del 6,69%. En
cuanto al número de hermanos, la estimación inicial fue del -1,50%, con
una significancia del 1,32%. Al introducir la variable instrumental, la
estimación de este coeficiente disminuyó a 0,21%, pero la significancia
aumentó significativamente al 90,33%. En resumen, podemos concluir
que estos resultados reflejan de manera más precisa la realidad, ya que
se aplican a cada familia de manera más ajustada que en el caso
anterior.”

Ejercicio 3.3.

Estos datos incluyen para las mujeres en Bostwana durante 1988,


información sobre el número de niños (children), años de educación
(educ), edad (age) y variables del estatus religioso y económico.

Se pide:
Página |6

Literal A.

Estime el siguiente modelo mediante MCO e interprete las estimaciones.

𝑐ℎ𝑖𝑙𝑑𝑟𝑒𝑛 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝛽2 𝑎𝑔𝑒 + 𝛽3 𝑎𝑔𝑒 2 + 𝑢

En particular, si se mantiene age fija, ¿Cuál es el efecto estimado de un


año más de educación sobre la fertilidad?
> # LITERAL A.
> Modelo6 <- lm(children ~
+ educ + age + I(age^2),
+ data = BD)
>
> summary(Modelo6)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.1383066 0.2405942 -17.200 <2e-16 ***
educ -0.0905755 0.0059207 -15.298 <2e-16 ***
age 0.3324486 0.0165495 20.088 <2e-16 ***
I(age^2) -0.0026308 0.0002726 -9.651 <2e-16 ***

Interpretación.

“Dentro de los resultados obtenidos, nos indican que el número de


nacimientos presenta una relación inversa con el nivel educativo,
disminuyendo en un 9,06% con cada aumento en la educación. Por otro
lado, existe una relación positiva entre la edad y la fertilidad,
aumentando en un 33,24% con cada año adicional. Sin embargo, este
aumento tiene un límite, ya que llega un punto en la edad en el que la
fertilidad comienza a disminuir. Esto se refleja en la correlación negativa
entre la edad al cuadrado (age^2) y la fertilidad, disminuyendo en un
0,26% por cada año adicional.”

“El análisis propuesto se valida al observar el nivel de significancia,


ya que todos los niveles de cada variable se encuentran dentro del
intervalo de confianza. Por lo tanto, se confirma que el enfoque analítico
utilizado es preciso.”

Literal B.

Estime el modelo (7) usando frsthalf como una VI para educ. Compare
el efecto estimado de la educación con la estimación por MCO del
literal A.
Página |7

> # LITERAL A.
> Modelo6 <- lm(children ~
+ educ + age + I(age^2),
+ data = BD)
>
> summary(Modelo6)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.1383066 0.2405942 -17.200 <2e-16 ***
educ -0.0905755 0.0059207 -15.298 <2e-16 ***
age 0.3324486 0.0165495 20.088 <2e-16 ***
I(age^2) -0.0026308 0.0002726 -9.651 <2e-16 ***

> # LITERAL B.
> Modelo7 <- ivreg(children ~
+ educ + age + I(age^2) |
+ frsthalf + age + I(age^2),
+ data = BD)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.3878054 0.5481502 -6.180 6.98e-10 ***
educ -0.1714989 0.0531796 -3.225 0.00127 **
age 0.3236052 0.0178596 18.119 < 2e-16 ***
I(age^2) -0.0026723 0.0002797 -9.555 < 2e-16 **

Interpretación.

“Comparando con el literal A, cuando incorporamos la variable


frsthalf como variable instrumental, observamos que la correlación
inversa con respecto a la educación disminuye al -17,15%. Aunque hay
endogeneidad, su significancia no es tan ampliamente aceptada como
antes, pero aún se encuentra dentro de la zona de confianza. De manera
similar, la relación positiva con la edad disminuye al 32,36%, manteniendo
la misma significancia. En cuanto al límite de edad permitido para
fertilizar, su correlación disminuye con una mínima diferencia en los
decimales, pero su significancia se mantiene en comparación con el
párrafo anterior.”

Literal C.

Agregue las variables binarias, electric (electricidad), tv (televisión) y


bicycle (bicicleta) al modelo y suponga que son exógenas. Estime por
MCO y MC2E y compare los coeficientes estimados de educ. Interprete
el coeficiente de tv y explique por qué tener televisor tiene un efecto
negativo en la fertilidad.
Página |8

> # LITERAL C.
> # Aplicamos MCO:
> Modelo8 <- lm(children ~
+ educ +
+ age +
+ I(age^2) +
+ electric +
+ tv +
+ bicycle,
+ data = BD)
>
> summary(Modelo8)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.3897837 0.2403173 -18.267 < 2e-16 ***
educ -0.0767093 0.0063526 -12.075 < 2e-16 ***
age 0.3402038 0.0164417 20.692 < 2e-16 ***
I(age^2) -0.0027081 0.0002706 -10.010 < 2e-16 ***
electric -0.3027293 0.0761869 -3.974 7.20e-05 ***
tv -0.2531443 0.0914374 -2.768 0.00566 **
bicycle 0.3178950 0.0493661 6.440 1.33e-10 ***

Interpretación.

“Se puede concluir desde una perspectiva estadística, se puede


concluir que la televisión tiene un impacto inverso en la fertilidad,
evidenciado por una disminución del 25,31% en la fertilidad asociada con
un aumento en el tiempo de visualización. Por otro lado, la práctica del
ciclismo muestra un efecto positivo en la fertilidad, con un aumento del
31,80%. Estas conclusiones se respaldan mediante la observación de los
niveles de significancia, los cuales se encuentran dentro de la zona de
confianza establecida.”
Página |9

> # Aplicamos MCO 2 etapas:


> Modelo9 <- ivreg(children ~
+ educ +
+ age +
+ I(age^2) +
+ electric +
+ tv +
+ bicycle |
+ frsthalf +
+ age +
+ I(age^2) +
+ electric +
+ tv +
+ bicycle,
+ data = BD)
>
> summary(Modelo9)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.5913324 0.6450889 -5.567 2.74e-08 ***
educ -0.1639814 0.0655269 -2.503 0.0124 *
age 0.3281451 0.0190587 17.218 < 2e-16 ***
I(age^2) -0.0027222 0.0002766 -9.843 < 2e-16 ***
electric -0.1065314 0.1659650 -0.642 0.5210
tv -0.0025550 0.2092301 -0.012 0.9903
bicycle 0.3320724 0.0515264 6.445 1.28e-10 ***

Interpretación.

“En el momento en el que corregimos la endogeneidad, logramos


mejorar el modelo de regresión. En el caso de la televisión, la estimación
aumentó al 0,02%, pero su significancia se elevó significativamente al
99,03%, lo que la coloca fuera de nuestra zona de confianza. La única
observación destacada es que aún mantiene una correlación negativa.
Por otro lado, en el caso de la bicicleta, la estimación aumentó al 33,21%,
y aunque su significancia también aumentó, aún se encuentra dentro de
nuestra zona de confianza.”

Ejercicio 3.4.

Se ha propuesto un modelo regional para la determinación


simultánea del nivel salarial y el Empleo.

𝑺𝒊 = 𝒂𝟏 + 𝒂𝟐 𝑬𝒊 + 𝒂𝟑 𝑷𝒊 + 𝒖𝟏𝒊
𝑬𝒊 = 𝑸𝟏 + 𝑸𝟐 𝑺𝒊 + 𝒖𝟐𝒊

Siendo:
P á g i n a | 10

S= Nivel salarial en miles de dólares.

E= empleo en miles de trabajadores.

P= Nivel de Precios, media ponderada del precio de bienes y servicios.

A partir de la siguiente información muestral:

S E P
30 20 15
15 25 5
45 15 5
15 40 15
20 10 10

Se pide:

Literal A.
Expresar el modelo en forma reducida y analizar su identificabilidad

𝑆𝑖 = 𝑎1 + 𝑎2 (𝑄1 + 𝑄2 𝑆𝑖 + 𝑢2𝑖 ) + 𝑎3 𝑃𝑖 + 𝑢1𝑖


𝑆𝑖 = 𝑎1 + (𝑎2 ∙ 𝑄1 ) + (𝑎2 ∙ 𝑄2 ∙ 𝑆𝑖 ) + (𝑎2 ∙ 𝜀2𝑖 ) + (𝑎3 ∙ 𝑃𝑖 ) + 𝜀1𝑖
𝑆𝑖 ∙ 𝑎2 ∙ 𝑄2 ∙ 𝑆𝑖 = 𝑎1 + (𝑎2 ∙ 𝑄1 ) + (𝑎2 ∙ 𝜀2𝑖 ) + (𝑎3 ∙ 𝑃𝑖 ) + 𝜀1𝑖
𝑆𝑖 (1 − 𝑎2 ∙ 𝑄2 ) = 𝑎1 + (𝑎2 ∙ 𝑄1 ) + (𝑎2 ∙ 𝜀2𝑖 ) + (𝑎3 ∙ 𝑃𝑖 ) + 𝜀1𝑖
𝑎1 + 𝑎2 ∙ 𝑄1 𝑎2 ∙ 𝜀2𝑖 𝑎3 ∙ 𝑃𝑖 + 𝜀1𝑖
𝑆𝑖 = + +
1 − 𝑎2 ∙ 𝑄2 1 − 𝑎2 ∙ 𝑄2 1 − 𝑎2 ∙ 𝑄2
𝑎1 + 𝑎2 ∙ 𝑄1
𝜇1 =
1 − 𝑎2 ∙ 𝑄2
𝑎2 ∙ 𝜀2𝑖
𝜇2 ∙ 𝜀2𝑖 =
1 − 𝑎2 ∙ 𝑄2
𝑎3 ∙ 𝑃𝑖 + 𝜀1𝑖
𝜇2 ∙ 𝑃𝑖 =
1 − 𝑎2 ∙ 𝑄2
𝑆𝑖 = 𝜇1 + 𝜇2 ∙ 𝜀2𝑖 + 𝜇2 ∙ 𝑃𝑖

Interpretación.

“La ecuación 8 carece de identificación debido a la ausencia de


una variable exógena en la ecuación 9 que pueda servir como
instrumento para la variable endógena E. En contraste, la ecuación 9
posee identificación, ya que cuenta con una variable exógena, 𝑃𝑖 , que
puede actuar como instrumento para 𝑆𝑖 en la ecuación 8. Al examinar
esta variable, observamos que no está correlacionada con el empleo,
indicando que el nivel de precios de bienes y servicios no influye en el
empleo. En otras palabras, cambios en los precios no necesariamente
conllevan cambios en el empleo.”
P á g i n a | 11

Literal B.
Estimar cada ecuación del modelo razonando el uso del método
seleccionado.
> #LITERAL B.
>
> # Proponemos el Modelo Econométrico:
> Modelo10 <- lm(S ~ E
+ + P,
+ data = BD)
>
> summary(Modelo10)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 38.7791 19.1132 2.029 0.180
E -0.5233 0.7440 -0.703 0.555
P -0.2267 1.7128 -0.132 0.907

Interpretación.

“Dado que no podemos identificar la ecuación de salarios y


carecemos de herramientas para la variable E, que se supone endógena,
no podemos llevar a cabo una regresión mediante el método de Mínimos
Cuadrados de dos etapas. En su lugar, solo podemos realizar una
regresión utilizando el método de Mínimos Cuadrados Ordinarios. Es
crucial destacar que los estimadores obtenidos mediante este método
estarán sesgados, lo que significa que no reflejarán con precisión los
verdaderos efectos de las variables explicativas en los salarios.”
> # Ingresamos la variable instrumental:
> Modelo11 <- ivreg(E ~
+ S |
+ S +
+ P,
+ data = BD)
>
> summary(Modelo11)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 33.5385 12.3124 2.724 0.0723 .
S -0.4615 0.4481 -1.030 0.3788
Interpretación.

“Calculamos a través del MCI, el cual es equivalente al MC2E,


donde empleamos el precio como una variable instrumental para
determinar los salarios.”
P á g i n a | 12

Ejercicio 3.5.

Un modelo para estimar los efectos del tabaquismo en el ingreso


anual es:

𝒍𝒐𝒈(𝒊𝒏𝒄𝒐𝒎𝒆) = 𝑸𝟎 + 𝑸𝟏 𝒄𝒊𝒈𝒔 + 𝑸𝟐 𝒆𝒅𝒖𝒄 + 𝑸𝟑 𝒂𝒈𝒆 + 𝑸𝟒 𝒂𝒈𝒆𝟐 + 𝒖𝟏

donde:

Cigs, es el número de cigarros que se consumen al día en promedio.

Educ, son los años de educación.

Age, son los años de la persona.

Se pide:

Literal A.
Como piensa que se interpretaría 𝛽1 en la ecuación (10).

Se anticipa que este coeficiente sea negativo, lo que significa que


un incremento en el consumo de cigarrillos se asociaría con una
disminución en el ingreso anual en cierto porcentaje. Esto podría
entenderse como que aquellos que consumen más cigarrillos
experimentan una reducción en sus ingresos, posiblemente debido a que
el aumento en el consumo de tabaco afecta negativamente su
capacidad para llevar a cabo sus actividades diarias con normalidad,
resultando en una merma en sus ingresos.

Literal B.
Para reflejar el heho de que el consumo de cigarros podría estar
determinado conjuntamente por el ingreso, una ecuación de la
demanda de cigarros es:

𝑐𝑖𝑔𝑠 = 𝑦0 + 𝑦1 log(𝑖𝑛𝑐𝑜𝑚𝑒) + 𝑦2 𝑒𝑑𝑢𝑐 + 𝑦3 𝑎𝑔𝑒 + 𝑦4 𝑎𝑔𝑒 2 + 𝑦5 log(𝑐𝑖𝑔𝑝𝑟𝑖𝑐)


+𝑦6 𝑟𝑒𝑠𝑡𝑎𝑢𝑟𝑛 + 𝑢1

donde,

Cigpric, es el precio de una cajetilla de cigarros (en centavos).

Restaurn, es una variable binaria igual a la unidad si la persona vive en


un estado cuyos restaurantes restringen el consumo del cigarro.

Si se supone que éstas son variables exógenas al individuo. ¿Qué signos


se esperarían para 𝑦5 y 𝑦6 ?

En este escenario, se anticipa que ambos coeficientes tengan efectos


opuestos, es decir, que sean negativos. Esto se debe a la teoría
económica que sostiene que a medida que el precio aumenta, la
P á g i n a | 13

demanda disminuye, lo que implica un menor consumo. No obstante, en


este caso particular, la situación no es tan categórica debido a la
naturaleza adictiva del bien en cuestión, lo que provoca que el consumo
no siga un patrón completamente convencional. Además, si el individuo
reside en una ciudad que regula el consumo de cigarrillos, es evidente
que dicho consumo se verá afectado negativamente para cumplir con
las normativas. Sin embargo, es crucial tener en cuenta que algunos
estudios psicológicos indican que la imposición de prohibiciones sobre
ciertos bienes puede dar lugar a un aumento en el consumo ilegal.

Literal C.
Estime la ecuación del ingreso (10) mediante MCO y analice la
estimación 𝛽1.
> # LITERAL C.
>
> # Analizamos el modelo econométrico:
> Modelo12 <- lm(log(income) ~
+ cigs +
+ educ +
+ age +
+ I(age^2),
+ data = BD)
>
> summary(Modelo12)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.795e+00 1.704e-01 45.741 < 2e-16 ***
cigs 1.731e-03 1.714e-03 1.010 0.313
educ 6.036e-02 7.898e-03 7.642 6.10e-14 ***
age 5.769e-02 7.644e-03 7.548 1.21e-13 ***
I(age^2) -6.306e-04 8.338e-05 -7.563 1.08e-13 ***

Interpretación.

“Como resultado de este nuevo estudio, observamos que hay una


asociación positiva entre la variable del consumo de cigarrillos (cigs) y los
ingresos. Es decir, cuando el consumo de cigarrillos aumenta, el nivel de
ingresos también aumenta en un 0,0017%. Sin embargo, no podemos
confirmar que el coeficiente 𝛽1 esté realmente relacionado con la
realidad, ya que, aunque puede tener un efecto positivo, su nivel de
significancia no explica ese efecto, ya que se encuentra dentro de
nuestra zona de confianza.”
P á g i n a | 14

Literal D.
Estime la ecuación de la demanda del cigarro (11) mediante MCO.
¿Log(cigpric) y restaurn son significativas?
> # LITERAL D.
>
> # Estimamos el modelo econométrico:
> Modelo13 <- lm(cigs ~
+ log(income) +
+ educ +
+ age +
+ I(age^2) +
+ log(cigpric) +
+ restaurn,
+ data = BD)
>
> summary(Modelo13)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.639826 24.078659 -0.151 0.87988
log(income) 0.880268 0.727783 1.210 0.22682
educ -0.501498 0.167077 -3.002 0.00277 **
age 0.770694 0.160122 4.813 1.78e-06 ***
I(age^2) -0.009023 0.001743 -5.176 2.86e-07 ***
log(cigpric) -0.750862 5.773342 -0.130 0.89655
restaurn -2.825085 1.111794 -2.541 0.01124 *

Interpretación.

“Después de examinar detenidamente nuestro modelo de


regresión y las variables relevantes, notamos que, al aumentar la
demanda de cigarrillos en una unidad, el precio del cigarrillo
experimenta una disminución del 75.07%. Es crucial destacar que la
significancia de este resultado no alcanza el nivel necesario, lo que
sugiere que nuestro modelo no puede afirmar de manera concluyente
la existencia de dicho efecto. Por lo tanto, no disponemos de evidencia
suficiente para rechazar la hipótesis nula, que sostiene que el precio del
cigarrillo no influye de manera significativa en su demanda.”

“En contraste, la variable ‘restaurn’ se revela como significativa.


En este sentido, si las restricciones aumentan, la demanda de cigarrillos
disminuirá considerablemente en un 282.51%, indicando un efecto
inverso significativo. En resumen, concluimos que la cantidad de
cigarrillos consumidos está efectivamente vinculada a las restricciones.”
P á g i n a | 15

Literal E.
Ahora, estime la ecuación del ingreso mediante MC2E. Analice cómo se
compara la estimación de 𝛽1 con la estimación MCO.
> # LITERAL E.
>
> # Estimación del modelo en una etapa:
> Modelo14 <- lm(educ ~
+ log(income) +
+ age +
+ I(age^2) +
+ log(cigpric) +
+ restaurn,
+ data = BD)
>
> PE <- fitted(Modelo14)

> # Estimación del modelo en segunda etapa:


> Modelo15 <- lm(log(income) ~
+ PE +
+ age +
+ I(age^2) +
+ log(cigpric) +
+ restaurn,
+ data = BD)
>
> summary(Modelo15)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.050e+00 4.600e-14 2.282e+13 <2e-16 ***
PE 9.034e-01 1.221e-15 7.398e+14 <2e-16 ***
age -9.625e-02 3.672e-16 -2.622e+14 <2e-16 ***
I(age^2) 1.358e-03 4.269e-18 3.181e+14 <2e-16 ***
log(cigpric) -3.218e-01 1.112e-14 -2.893e+13 <2e-16 ***
restaurn -1.790e-01 2.166e-15 -8.266e+13 <2e-16 ***

Interpretación.

“Cuando aplicamos el método MC2E, observamos que el precio


del cigarrillo experimentará una reducción del 32,18%, en contraste con
la situación anterior. Este resultado se alinea con la realidad, ya que un
mayor consumo de cigarrillos está asociado a niveles más bajos de
ingresos. Este fenómeno también se refleja en las restricciones, las cuales
tienden a aumentar. Si este efecto se materializa, provocará una
disminución en los ingresos, ya que un aumento en las restricciones se
traduce en un incremento en el precio del cigarrillo y, por ende, en una
reducción del ingreso y del consumo.”
P á g i n a | 16

ANEXOS
P á g i n a | 17

También podría gustarte