Está en la página 1de 6

Parte práctica

1. Suponga que se desea estimar el número de visitas (visitor) a una página web. Para esto
se cuenta con información de la base de datos “website.dta”, y se considera el tiempo
que gastan en internet (time) y el número de veces que ellos reciben una publicidad vía
email o de otro website (ad). Adicionalmente, la página web quiere saber si las visitas
están determinadas por el sexo de persona.

𝑣𝑖𝑠𝑖𝑡𝑜𝑟i = 𝛽0+ 𝛽1 𝑎𝑑i +𝛽2 𝑓𝑒𝑚𝑎𝑙𝑒i + 𝛽3 𝑡𝑖𝑚𝑒i + 𝜀i

a) Estime el modelo por MCO, y comente los resultados.

Tabla 1

(1)
VARIABLES visits

ad 0.800***
(0.0805)
female -0.0468
(0.215)
time 0.830***
(0.114)
Constant 0.692
(0.452)

Observations 500
R-squared 0.677
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

A partir de la regresión se tiene que dos variables son significativas al 99%, estas son la variable ad
(el número de veces que ellos reciben una publicidad vía email o de otro website) y la variable time
(el tiempo que gastan en internet). Así mismo se puede decir que por cada número de veces que ellos
reciben una publicidad viá email o de otro website se presenta un aumento del número visitas de la
página en 0.8 y que por cada hora empleada en internet es un aumento de 0.83 visitas

b) Algunos consideran que el tiempo en internet es una variable endógena, explique con
sus propias palabras porque puede existir endogeneidad en la variable 𝑡𝑖𝑚𝑒.

El tiempo en internet, es decir la variable time puede presentar endogeneidad, ya que esta misma tiene
una dependencia hacía, las diversas actividades a las que se pueda desempeñar o pueda realizar un
individuo. Así mismo se depende del tiempo con el que cuente el individuo para poder usarlo en
internet, por lo tanto se es necesaria la disponibilidad de tiempo para poder realizar la actividad.
c) Un investigador propone dos instrumentos, el primero corresponde al tiempo que una
persona usa el celular (𝑝h𝑜𝑛e) y el segundo es el tiempo que gasta en interactuar con
amigos, familia que vive fuera del barrio (𝑓𝑟𝑓𝑎𝑚). ¿Serían estos instrumentos válidos y
relevantes? Justifique intuitivamente y basándose en los supuestos de un buen
instrumento.

El instrumento pone el cual hace referencia al tiempo que una persona usa el celular, es un instrumento
válido al momento de usarlo en el modelo y cumple con la propiedad de relevancia, ya que este tiene
relación con respecto a la variable time, la cual hace referencia al tiempo que se gasta en internet,
donde existe una relación entre el uso del celular y el uso que se le da a este para ingresar a internet
u diversas aplicaciones donde sea necesario el uso de internet. Así mismo esta se presenta como una
variable exógena con la variable visitor por las mismas razones mencionadas previamente.

d) Realice la estimación con el instrumento 𝑝h𝑜𝑛𝑒, comente los resultados de la primera y


segunda etapa. ¿Es razonable pensar que no se presenta el problema de instrumentos
débiles? Adicionalmente, realice las pruebas de significancia global y parcial, y
justifique la relevancia y exogeneidad del instrumento.

𝑣𝑖𝑠𝑖𝑡𝑜𝑟i = 𝛽0+ 𝛽1 𝑎𝑑i +𝛽2 𝑓𝑒𝑚𝑎𝑙𝑒i + phone+ 𝜀i

Tabla 2

VARIABLES Etapa 1

Ad 0.269***
(0.0567)
Female -0.0371
(0.206)
phone 0.408***

(0.0578)
Constant 1.346***
(0.207)

Observations 500
R-squared 0.256
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
A partir de la regresión se puede concluir que la variable pone es estadísticamente significante a un
99%, así como la constante y la variable Ad, del número de la publicidad.

𝑣𝑖𝑠𝑖𝑡𝑜𝑟i = 𝛽0+ 𝛽1 𝑎𝑑i +𝛽2 𝑓𝑒𝑚𝑎𝑙𝑒i + time+ 𝜀i

Tabla 3

(1)
VARIABLES visits

time 0.853***
(0.145)
ad 0.788***
(0.0865)
female -0.0463
(0.210)
Constant 0.643*
(0.355)

Observations 500
R-squared 0.677
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

En esta regresión se tiene que el tiempo y la publicidad son variables significativas para explicar las
visitas a la página web.

Tabla 4

(1) (2)
VARIABLES visits visits

Ad 0.800*** 0.788***
(0.0805) (0.106)
Female -0.0468 -0.0463
(0.215) (0.279)
time 0.830*** 0.853**
(0.114) (0.346)
Constant 0.692 0.643
(0.452) (1.003)

Observations 500 500


R-squared 0.677 0.465
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
Retomando, se tiene que el tiempo pierde significancia en el segundo modelo el cual hace referencia
a VI. Así mismo se presenta un aumento del error estándar. Con base al F calculado dado que el F
calculado es mayor al F de tablas, por ende, el instrumento no es débil y se puede tomar como una
variable relevante. De tal manera no se presenta problema de instrumentos débiles.

e) Realice la estimación con los dos instrumentos, comente los resultados de la primera y
segunda etapa. ¿Es razonable pensar que no se presenta el problema de instrumentos
débiles? Pruebe relevancia y exogeneidad de los instrumentos.

Tabla 5

(1)
VARIABLES Primera etapa

ad 0.166***
(0.0549)
female -0.0522
(0.202)
frfam 0.276***
(0.0655)
phone 0.291***
(0.0753)
Constant 0.935***
(0.262)

Observations 500
R-squared 0.286
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

En esta regresión tenemos dos instrumentos, los cuales son phone y frfam. En esta primera etapa
las variables significativas son ad, female phone y la constante, por ende, se tiene que todas las
variables son estadísticamente significativas. Lo cual argumenta el uso de los dos nuevos
instrumentos en el modelo.

Tabla 6
VARIABLES (1) (2)

ad 0.800*** 0.795***
(0.0805) (0.0986)
female -0.0468 -0.0466
(0.215) (0.268)
time 0.830*** 0.838***
(0.114) (0.156)
Constant 0.692 0.674*
(0.452) (0.402)
Observations 500 500
R-squared 0.677 0.473
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

En el modelo de VI el cual es el número dos no se presenta, algún cambio significante en la


significancia de alguna de las variables. Con base al F calculado dado que el F calculado es mayor al
F de tablas, por ende, el instrumento no es débil y se puede tomar como una variable relevante. De
tal manera no se presenta problema de instrumentos débiles.

f) Compare los resultados obtenidos en los numerales d y e.

No hay cambio significativo alguno entre los dos modelos obtenidos en d y en e.

VARIABLES (1) (2)

ad 0.800*** 0.800***
(0.0805) (0.0805)
female -0.0468 -0.0468
(0.215) (0.215)
time 0.830*** 0.830***
(0.114) (0.114)
Constant 0.692 0.692
(0.452) (0.452)

Observations 500 500


R-squared 0.677 0.677
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

Do – File

cd "/Users/SantiagoSoler/Desktop/2018-1/Econometri ́a 2/Talleres 2018/Taller 1"


use website.dta

*a
reg visits ad time female
outreg2 using "PuntoA.doc"
*c
corr time frfam
corr time phone
ivreg visits ad female (time= phone), first

reg res1 ad female phone frfam

quiet reg time ad female phone if visits ~=.


test phone
*Hausman directo
ivregress 2sls visits (time=phone) ad female
est store bmco
est store bc2e
hausman bc2e bmco, sigmamore
*e
reg time phone frfam ad female,r
ivreg visits ad female (time= phone frfam), first
predict timeha, xb

quiet reg time ad female phone frfam if visits ~=.


test phone frfam

*Hausman
quiet reg time ad female phone frfam if visits ~=.
predict residuales, resid
reg visits ad female time residuales

También podría gustarte