Está en la página 1de 4

Universidad Andrés Bello Facultad de Ingenierı́a

Guı́a 1
Análisis de Datos
Profesor
MSc. Ramón H. Cornejo-Muñoz

Semestre: 2◦ Semestre, 2015.


Fecha de Entrega1 Domingo 30 de Agosto2 a las 23:59 hrs.

Esta es la primera guı́a del curso, que sirve de preparación para la solemne correspon-
diente. Debe ser entregada en formato PDF. Pueden usar el procesador de texto que más les
acomode (Word, Open Office, LATEX, etc.) al igual que el software que estime conveniente
o con el que se sientan más comodos ( R, Stata, Matlab, etc.). Se recomienda fuertemente
trabajar en pareja junto a otro compañero de la misma sección. No sean extensos a la hora
de redactar, enfóquense en la pregunta, no se enfrasquen en trivialidades que de hecho le
molestan a su profesor. Sólo se debe entregar un archivo por pareja, por ende, sólo uno debe
enviar el email con este.

1. Problemas Básicos
1. El objetivo teórico principal de la primera parte del curso es entender que se puede, con
datos, determinar si la hipótesis sobre una sentencia “estadı́sticamente” es rechazada o
no es rechazada. El primer paso para esto, es tener esta sentencia lo más clara posible
para ası́ estudiarla correctamente.
a) Describa 3 sentencias que podrı́an ser testeadas. una buena de hacerlo es crearlas
pensando en causas y efectos. Para cada una de ellas, identifique claramente:
Variables explicativas y explicadas.
Variables endógenas y exógenas.
Variables independientes y dependientes.
Variables observables y no observables.
b) Comente cuál es la relación existente entre todos los tipos de variables mostradas
anteriormente.
c) Escriba, para cada sentencia, el modelo teórico a testear, tanto de forma matricial
como por individuo.
d ) Para cada sentencia, defina una hipótesis que se podrı́a testear con las variables
definidas anteriormente.
e) Explique a que se refiere una variables proxy y para cada sentencia defina estas
variables de forma lo más realista posible en reemplazo de las definidas en la letra
a).
1
Se debe enviar el archivo en formato PDF al email del profesor con el asunto: Análisis de Datos/Guia
1/Nombre completo 1/Nombre completo 2/N◦ de Sección. Cualquier guı́a que no cumpla estas condiciones no
será revisada.
2
Puede que esta fecha se modifique dado que no se tiene claro aún la fecha de la primera solemne. Si no
fuese la primera semana de Septiembre, se modificará la fecha de entrega.

1
Universidad Andrés Bello Facultad de Ingenierı́a

f ) Para cada sentencia, determine si los datos a utilizar son de corte transversal, lon-
gitudinal o de panel.
g) Comente qué datos utilizarı́a para estudiar cada sentencia y cómo (y dónde) los
obtendrı́a. ¿Cuál serı́a la cantidad óptima de datos? Argumente su respuesta con la
bibliografı́a que estime conveniente.

2. El ejercicio a realizar le ayudará a entender cómo calcular los estimadores de una regresión
lineal múltiple y a aplicar los conceptos vistos en clase. Si bien algunos conceptos no los
hemos revisado a cabalidad en clases, es importante que con el laboratorio y las lecturas
ya vistas puedan resolver las preguntas.
Utilice el archivo adjunto para realizar una regresión lineal entre ventas (como variable
explicada), publicidad y precio (variables explicativas) de un producto en particular. Con
ayuda de los capı́tulos 2 y 3 del libro Econometrı́a de Gujarati y utilizando el programa
Microsoft Office - Excel sólo con matrices3 , responda las siguientes preguntas:

a) Comente la relación causalidad versus correlación entre la variable explicada y las


explicativas. ¿Es razonable la relación?
b) Haga un gráfico de cada variable explicativa sobre la explicada, ¿hay correlación
entre ellas?
c) Calcule el estimador de los parámetros, que es β̂ = (X 0 X)−1 X 0 Y . Para esto, co-
mente cada matriz en el archivo Excel para llegar a los estimadores.
d ) ¿Cuál es la interpretación de cada parámetro?
e) Calcule4 ahora la matriz de varianza-covarianza V(β̂) = s2 (X 0 X)−1 e interprete
cada componente de esa matriz.
f ) Construya la tabla ANOVA en base a cada componente construido con las matrices
correspondientes.
g) Realice los test de hipótesis global e individual para cada variable independiente5 .
Para esto, utilice los tres métodos vistos en clases6
Método del p-value.
Método del estadı́stico o estadı́grafo.
Método del intervalo de confianza.

3
Esto es, sin usar la opción de Regresión que entrega el programa. Como consejo, puede utilizar esa opción
sólo para comprobar sus resultados. El objetivo de este ejercicio es que conozcan cómo operar matrices en Excel
y cómo se presentan los datos en forma matricial. También lo puede hacer en Matlab si les es más cómodo.
4
Con los β, encuentre Ŷ = X β̂ y, por consiguiente, ε̂ = Y − Ŷ
5
Utilice un nivel de significancia del 5 %.
6
Que obviamente son equivalentes.

2
Universidad Andrés Bello Facultad de Ingenierı́a

2. Problemas Intermedios
1. Derive los estimadores β̂ M V ≡ [α̂M V , β̂ M V , γ̂1M V , γ̂2M V ]0 y σ̂µ2 por el método de máxima
verosimilitud de una regresión estándar7 del tipo,

yi = α+βxi + γ1 zi + γ2 zi2 + µi
o
Y = Xβ + µ.

con µ ∼ IIDN (0, Σµ ) o µi ∼ IIDN (0, σµ2 ), y Σµ ≡ σµ2 I donde I es la matriz identidad
de dimensiones 3 × 3, además de 0 ≡ [0, 0, 0, 0]0 . x ∈ R y z ∈ R. Además, aunque es obvio,
β ≡ [α, β, γ1 , γ2 ]0 y X ≡ [1, x, z, z 2 ].
2. Una compañı́a de seguros desea determinar el grado de relación que existe entre el ingreso
familiar “x” y el monto del seguro de vida “y” del jefe de familia. Con base en una muestra
aleatoria de 5 familias, se tuvo la siguiente información.

Ingreso Seguro de vida


56,25 35,00
50,00 30,00
58,75 45,00
31,25 27,50
18,75 20,00

Los datos anteriores se pueden representar por el siguiente modelo de regresión

ŷi = −9,44 + 1,66xi

Se desea aplicar el test de White para identificar la presencia de heteroscedasticidad8 y


para esté se emplea la siguiente regresión auxiliar9 ,

û2i = η̂0 + η̂1 x2i + vi , vi ∼ IIDN (0, σv2 )

Recuerde que el estadı́stico distribuye χ2 con la siguiente expresión:

n · R2 ∼ χ2

i. Plantee la hipótesis nula y el estadı́stico de prueba.


ii. Determine si es necesario corregir la heteroscedasticidad.

7
Note que se ha dado una especificación por individuo y una vectorial. Es irrelevante cual de las dos utilice,
simplemente cuando realice la derivada hágalo sobre todas los parámetros.
8
Este es un test que se utilizará en la segunda parte del curso. En este momento, no es importante su
interpretación, sino que Ud. sepa utilizar de manera correcta un test de hipótesis. Como debe darse cuenta,
todos funcionan de la misma forma.
9 2
ûi es el error de la regresión entre Ingreso y Seguro de Vida.

3
Universidad Andrés Bello Facultad de Ingenierı́a

3. Problemas Avanzados
1. Suponga que cuenta con una muestra definida por {Xi , Yi }Ti=1 . Utilizando el método de
Mı́nimos Cuadrados Ordinarios determine el valor de los estimadores de los parámetros
según corresponda10 . Asuma que las observaciones son independientes e idénticamente
distribuidas.

Yi = β2 Xi + εi
Yi = β0 + β1 Xi + β2 Xi2 + εi
Yi = eβ0 +εi Xiβ1

2. Suponga que X sigue una distribución normal perfectamente simétrica con media µ y
varianza σ 2 . Encuentre una expresión para E(X 3 ), en función de µ y σ.

10
Este ejercicio no se hace en su forma matricial, se espera que lo haga por observación, esto es, determinar
el valor de cada estimador por separado.

También podría gustarte