Está en la página 1de 10

Pauta Control 1

Aplicaciones de Estadı́stica para Economı́a y Gestión


IN4402
Segundo Semestre 2018
Profesor: Benjamı́n Villena R.
Auxiliares: Ronald Leblebici y Ángelo Muñoz

Fecha: 30 de octubre de 2018

1. Comente las siguientes afirmaciones:

a) La era del “big data” con decenas, cientos o miles de millones de datos, será el fin de
la evidencia cientı́fica ya que cualquier hipótesis será rechazada.

Respuesta: En bigdata, al tener un tamaño de muestra enorme, las varianzas son


muy pequeñas y es muy fácil rechazar hipótesis nulas de todo tipo, incluyendo signifi-
cancia individual, aunque las estimaciones puntuales no tengan significancia práctica.
Por otro lado, la refutación cientı́ca (rechazar hipótesis) no es el único elemento que
define el conocimiento cientı́fico en la práctica, ya que existen múltiples supuestos
auxiliares en cualquier test. En la visión más práctica de la ecolución del conocimiento
cientı́fico, es razonable el postulado de Thomas Kuhn: sólo una nueva teorı́a derriba
a una teorı́a establecida.

b) Hallar una correlación cero entre el tiempo de estudio de los alumnos para IN4402
y la nota final del curso probarı́a que, en promedio, si alguien decide dedicarle más
tiempo de estudio a este control, su nota no cambiará.

Respuesta: Falso. Correlación no es causalidad. Es probable que el tiempo de estudio


esté correlacionado con otras variables observables o no observables, como por ejemplo
la formación previa que tiene cada alumno en matemática general, probabilidades
y estadı́stica. Un alumno con más conocimiento previo posiblemente deba estudiar
menos que otros para obtener la misma nota. El contrafactual relevante es: un alumno
con formation previa especı́fica, si estudia más por una razón exógena, tendrá mejor
nota que la que obtiene estudiando menos.

1
c) Si los supuestos del teorema de Gauss-Markov se cumplen, entonces no es posible
hallar un estimador con error cuadrático medio menor que MCO.

Respuesta: El teorema de Gauss-Markov prueba que el estimador MCO es el que


tiene la mı́nima varianza dentro de la categorı́a de los estimadores lineales e inses-
gados. Por otro lado, el error cuadrático medio se descompone como: ECM (β) b =
b 2 + V(β).
B(β) b
Con estos datos, se concluye que la afirmación es incorrecta. Eventualmente se podrı́an
encontrar estimadores sesgados y/o no lineales que reduzcan ECM .Si un estimador
tiene sesgo mayor a cero, su varianza podrái ser considerablemente menor a la del
estimador MCO.

d ) Tener errores poblacionales con distribución normal ayuda a que la inferencia es-
tadı́stica sea más precisa.

Respuesta: Verdadero. Con un tamaño de muestra grande, el Teorema Central del


Lı́mite indica que la distribución del estimador MCO es aproximadamente normal y
podemos hacer inferencia aproximada basándonos en una distribución normal, aunque
los errores poblacionales no sean normales. Si los errores son normales, el estimador
MCO tiene una distribución normal exacta, independientemente del tamaño de mues-
tra, y por lo tanto, ya no es una aproximación. La estimkación es más precisa en este
caso naturalmente.

2. Un estudio sobre el nivel educacional alcanzado por las personas, medido en años de
educación E, intenta explicar esta variable por factores familiares y socioeconómicos. En
particular, el estudio recaba información sobre nivel educacional del padre EP y de la
madre EM . Además, se obtiene información sobre el número de hermanos N H y el género
del encuestado G. Una dificultad importante es que en un 25 % de los casos las personas
no responden o no conocen sobre el nivel educacional del padre EP .

a) Utilizando un modelo de regresión, explique cómo testearı́a la hipótesis de que el


promedio de educación E alcanzado por los encuestados que entregan alguna infor-
mación sobre la educación de sus padres, EP , es mayor al de aquéllos que no conocen
o no reportan esta variable. Explicite hipótesis nula, estadı́stico de prueba, y regla de
rechazo.

Respuesta: Sea N EPn una variable dummy que toma el valor 1 si es que la persona
no reporta el nivel educacional del padre y 0 si es que si lo hace. Un modelo de
regresión que permite testear lo pedido es:

2
En = β0 + β1 N EPn + Un

Hipótesis nula (H0 ): β1 < 0 (quienes reportan tienen mayor nivel educativo
promedio que quienes no).
Hipótesis alternativa (Ha ): β1 ≥ 0 (quienes reportan tienen menor o igual
nivel educativo promedio que quienes no).
βb1
Estadı́stico de prueba: t = .
DS(βb1 )
d
Regla de rechazo: t > TN −K,1−α (notar que se trata de un test de cola derecha).

b) Escriba un modelo en que la educación alcanzada E depende de la educación de ambos


padres y número de hermanos, permitiendo efectos diferentes para cada género.

Respuesta: Sin pérdida de generalidad, supongamos que Gn toma el valor 1 si la


persona es hombre y cero si es mujer. Una alternativa de modelo serı́a:

En = β0 +β0H Gn +β1 EMn +β1H Gn ×EMn +β2 EPn +β2H Gn ×EPn +β3 N Hn +β3H Gn ×N Hn +Un

Esta especificación funciona porque la expectativa condicional para hombres serı́a

E [En |EMn , EPn , N Hn , Gn = 1] = (beta0 +β0H )+(β1 +β1H )EMn +(β2 +β2H )EPn +(β3 +β3H )N Hn

Mientras que para mujeres serı́a,

E [En |EMn , EPn , N Hn , Gn = 0] = beta0 + β1 EMn + β2 EPn + β3 N Hn

Por ende, los parámetros betaH H H H


0 , β1 , β2 , β3 capturan los efectos diferenciales entre
hombres y mujeres para cada variable.

c) Describa cómo testearı́a que el efecto marginal esperado de la educación del padre
sobre un hijo hombre es igual al efecto marginal esperado de educación de la ma-
dre sobre una hija mujer. Explicite hipótesis nula, estadı́stico de prueba, y regla de
rechazo.

Respuesta: A partir del modelo anterior se pueden obtener los retornos marginales
antes descritos. A partir de ellos se puede formular un test de restricción lineal simple.

∂E[En |Gn = 1]
= β2 + β2H
∂EPn
∂E[En |Gn = 0]
= β1
∂EMn

3
Hipótesis nula (H0 ): β2 + β2H = β1 .
Hipótesis alternativa (Ha ): β2 + β2H 6= β1 .
βb2 +βb2H −βb1
Estadı́stico de prueba: t = d βb2 +βbH −βb1 ) .
DS( 2
Regla de rechazo: |t| > TN −K,1−α/2 .
Notar que el estadı́stico de prueba y la regla de rechazo se pudieron haber cons-
truido también a partir del test de restricciones lineales múltiples (ver formulario),
considerando el caso particular en el que la cantidad de restricciones R es 1. También
puede proponerse el test de residuos libres versus restringidos, construyendo el último
modelo con la imposición de la restricción de parámetros de la hipótesis nula.

d ) Un investigador cuestiona los resultados obtenidos porque “hay un 25 % de los da-


tos que no los utilizamos debido a que no hay reportes de educación de los padres”.
Además plantea que “es probable que el hecho de que no se reporte educación del
padre ocurra en hogares con jefas de hogar mujeres, que en promedio viven en con-
diciones más precarias”. Si se construye una dummy N EP que toma valor 1 si el
encuestado no reporta o no sabe la educación de su padre, muestre cómo se podria
estimar un modelo en el que se incluyan todas las observaciones, considerando el
efecto de no declarar o conocer la educación del padre. Interprete los coeficientes de
la ecuación. (Pista: será útil redefinir alguna variable de la base de datos original)

Respuesta: Sea EPn0 = EPn si la observación de la educación del padre siempre está
registrada y EPn0 = A donde A es un valor de educación arbitrario (puede ser cero u
otro valor razonable). La ecuación más simple que satisface lo pedido, tomarı́a la siguiente
forma

En = β0 + β1 EMn + β2 EPn0 + β3 N EPn + Un

β0 = E [En , EM = 0, EP 0 = 0, N EP = 0], es decir, es el nivel de educación esperado


de un individuo cuya madre y padre no tienen educación con datos de EP observados.
n |EM ]
β1 = ∂E[E∂EM , es decir, es el efecto marginal de la educación de la madre en la
educación del individuo.
0
β2 = ∂E[En |EP ,N EP =0]
∂EP 0 , es decir, es el efecto marginal de la educación del padre en la
educación del individuo dado que la educación del padre se reporta.
La interpretación de β3 es más complicada. Notemos que si N EP = 1 entonces
EP 0 = A , por lo tanto

E En |EM, EP 0 , N EP = 1 = β0 + β1 EM + β2 A + β3
 

4
Si, por el contrario N EM = 0 y EP 0 = A, tendremos que

E En |EM, EP 0 = A, N EP = 0 = β0 + β1 EM + β2 A
 

Entonces β3 es la diferencia de ambas expoectativas condicionales, es decir, el impacto


en la educación del individuo si no reporta educación de su padre con respecto a la
educación obtenido por alguien con un padre que alcanzo A años de educación.

3. Como jefe de estudios de una importante empresa del rubro automotriz, debe estimar una
demanda por automóviles. Para ello, cuenta con datos de número de vehı́culos vendidos
Q y su precio en pesos chilenos de cada año P . Además tiene precios de otros automóviles
del segmento de mercado relevante resumidos en un indice de precios S en pesos chilenos
de cada año. Finalmente, a partir de los datos recabados, tiene una variable de ingreso de
sus clientes I en pesos chilenos de cada año.

a) A partir de los datos descritos, escriba un modelo lineal que tenga elasticidad con
respecto al ingreso y elasticidades con respecto a los precios (P y S) que sean cons-
tantes.

Respuesta:

log(Qn ) = β0 + β1 log(In ) + β2 log(Pn ) + β3 log(Sn ) + Un

La especificación permite estimar los parametros requeridos porque


∂E[log Qn |X]
∂ log In = β1
∂E[log Qn |X]
∂ log Pn = β2
∂E[log Qn |X]
∂ log Sn = β3

b) Se cree que la correlación de precios de distintas marcas es alto, ya que todos son
importados y varı́an con el precio del dólar o tipo de cambio. ¿Qué consecuencias
puede tener esto para la estimación?

Respuesta: Una correlación alta puede generar problemas de multicolinealidad. Con-


ceptualmente, se dificulta atribuir qa cada regresor separadamente las variaciones de
la variable dependiente. Alta multicolinealidad se traduce en un alto R2 entre varia-
bles explicativas, lo que genera un mayor inflador de varianza, y mayor varianza de
los estimadores respecto auna situación ideal en que no hay multicolinealidad.

5
c) Usted recuerda la propiedad de las ecuaciones de demanda con homogeneidad de
grado cero (HG0). ¿Cómo esta información puede ayudarle a mejorar sus estimaciones
del punto anterior? Justifique cuidadosamente. [Nota: homogeneidad de grado cero
implica que aumentado precios e ingresos en pesos chilenos propocionalmente, no
tendrá efecto en la cantidad demandada. Formalmente Q(λP, λS, λI) = Q(P, S, I)
∀λ > 0.

Respuesta: Dado que se cumple la propiedad de homogeneidad de grado cero, se


tiene que β1 + β2 + β3 = 0. En efecto:

Qn (In , Pn , Sn ) = Qn (λIn , λPn , λSn )


1 2 3 1 2 3
⇐⇒ eβ0 +Un I β P β S β = eβ0 +Un λβ1 +β2 +β3 I β P β S β
⇐⇒ β1 + β2 + β3 = 0

Reemplazando esto en el modelo de regresión propuesto en la parte anterior, se tiene:

log(Qn ) = β0 + β1 log(In ) + β2 log(Pn ) + (−β1 − β2 ) log(Sn ) + Un


⇐⇒ log(Qn ) = β0 + β1 [log(In ) − log(Sn )] + β2 [log(Pn ) − log(Sn )] + Un

De esta forma, se puede reestructurar el modelo de regresión lineal. La incoporación


de información extra permitirá reducir la varianza de los esrumjadores al reducir el
nivel de multicolinealidad entre los regresores.

d ) Explique cómo testearı́a HG0 de la demanda por automóviles formalmente. Detalle


su hipótesis nula, estadı́stico de prueba, regla de rechazo y distribuciones relevantes.
¿Qué consecuencias tendrı́a sobre la estimación restringida si encuentra fuerte evi-
dencia para rechazar la hipótesis nula? ¿Si su objetivo es estimar la elasticidad con
respecto a su propio precio de la demanda por autos, confiarı́a más en la estimación
restringida o en la no restringida?

Respuesta:

Hipótesis nula (H0 ): β1 + β2 + β3 = 0.


Hipótesis alternativa (Ha ): β1 + β2 + β3 6= 0.
βb1 +βb2 +βb3
Estadı́stico de prueba: t = d βb1 +βb2 +βb3 ) .
DS(
Regla de rechazo: |t| > TN −K,1−α/2 .

6
Notar que el estadı́stico de prueba y la regla de rechazo se pudieron haber construido
también a partir del test de restricciones lineales múltiples (ver formulario), considerando
el caso particular en el que la cantidad de restricciones R es 1. También es posible utilizar
el enfoque de modelo restringidfo versus libre.

Si se rechaza la hipótesis nula entonces la estimación restringida estarı́a basada en una


forma funcional erronea, pues por construcción esta estimación se respalda en el supuesto
de que β1 + β2 + β3 = 0. En consecuencia, las estimaciones que se obtengan a partir de
este modelo serı́an más imprecisas, por contener un alto sesgo. Por lotro lado la varianza
de los estimadores se reducirá, dependiendo de la severidad de la multicolinealidad inicial.
A priori, desde un punto de vista de Eroor Cuadático Medio, no es claro qué estimador es
mejor. Sin embargo, dado el rechazo de la restricción, si el objetivo es estimar la elasticidad
con respecto a su propio precio de la demanda por autos (β2 ) serı́a más razoinable confiar
en las estimación no restringida.

4. Una empresa de administración financiera que debe invertir si un proyecto obtiene una
rentabilidad superior al 5 %. La administradora cuenta con un buen modelo econométrico
que predice una rentabilidad del proyecto de 4.8 % con una desviación estándar de 0.2 %.

a) Suponga que la administradora toma la decisión de invertir, ¿qué clase de hipótesis


nula y nivel de confianza explicarı́a la decisión tomada? Explique cómo llega a esta
conclusión, no es necesario que realice cálculos.

Respuesta: Suponiendo normalidad de los estimadores (al menos aproximiada, por


normalidad asintótica), se debe pensar que la administradora realizó un test de hipóte-
sis de una cola, usando una distribución t-Student. La hipótesis nula serı́a R > 5 % y
el nivel de confianza debe ser suficientemente bajo para que no se rechace la hipóte-
b = 4, 8 %. La regla de rechazo serı́a Rb
sis nula dado que R d b < Tα (G) o bien
DS(R)
(R)−0,05
b
0,002 < −T1−α (G), donde mathcalT1−α (G) es el percentil 1 − α de la distribución
t-Student con G grados de libertad del estadistico R. b La administradora tomó su
decisión utilizando un nivel de confianza 1 − α suficientemente alto como para no
rechazar la hipótesis nula.

b) ¿Cómo cambia su respuesta ahora si la administradora decide NO invertir?

Respuesta: Hay dos alternativas respecto a lo que pudo haber hecho la firma para
explicar esta decisión (basta que escojan una).

7
1) La hipótesis nula fue R ≤ 5 % y el nivel de confianza deberı́a ser suficientemente
alto para que se rechace la hipótesis nula, dada la evidencia obtenida.
2) La hipótesis nula fue R > 5 % y el nivel de confianza deberı́a ser bajo (es decir,
el nivel de significancia α debe ser alto) para que se rechace la hipótesis nula.

c) Si la inversión tiene efectivamente una rentabilidad por debajo del 4.8 %, la empresa
administradora podrı́a enfrentar una demanda de sus clientes con muy serias conse-
cuencias. ¿Qué tan probable es que se llegue al juicio si la empresa lleva a cabo la
inversión? Explique cómo llegar a este número. No es necesario que realice cálculos.

Respuesta: Hay dos posibilidades: si se responde sólo una de ellas, correctamente, se


obtiene 75 % del puntaje. Si se responden las dos, se suma el otro 25 %. Las opciones
son:
Opción 1: Sabemos que la administradora realizó la inversión. Por ende, si la ad-
ministradora tenı́a una hipótesis nula de R > 5 %, y NO la rechazó, entonces hizo
la inversión. Sin embargo, fue una decisión incorrecta porque en realidad R < 4,8 %.
Por lo tanto, buscamos la probabilidad de error tipo II para una hipótesis alternativa
de R < 4,8 %. Esta se calcuları́a del siguiente modo

8
!
Rb − 0,05
P rob(No rechazar|R < 4,8) = P rob > T1−α (G)|R < 4,8 %
0,002
 
= P rob R b > 0,05 + 0,002T1−α (G)|R < 4,8
!
Rb − 0,048 0,05 − 0,048 + 0,002T1−α (G)
= P rob >
0,002 0,002
 
0,05 − 0,048 + 0,002T1−α (G)
= 1 − FT
0,002

donde FT es la función de distribución acumulado de una t-Student con G grados de


libertad.
Opción 2: Sabemos que la administradora realizó la inversión. Por ende, si la
administradora tenı́a una hipótesis nula de R ≤ 5 %, y SI la rechazó, entonces hizo
la inversión. Sin embargo, fue una decisión incorrecta porque en realidad R < 4,8 %.
Por lo tanto, buscamos la probabilidad rechazar la nula, dado que ésta es verdadera,
es decir la probabilidad de error tipo I , que corresponde al nivel de significancia
definido por quien toma la decisión.

d ) Una gerente de la empresa sostiene que “dados los costos y beneficios asociados a
esta decisión, debiéramos usar niveles de confianza menores al nivel convencional de
5 % o 1 %”. Su subalterno está dudoso y plantea que “vamos a espantar a los clientes
si les decimos que bajaremos los niveles de confianza de nuestras decisiones”. Evalúe
los argumentos expuestos y apoye una de las opiniones con fundamentos.

Respuesta: Si la hipótesis nula que ocupa la empresa es R > 5 % entonces elegir


un valor de α muy pequeño significa que es muy difı́cil rechazar esta hipótesis (la
rentabilidad estimada deberı́a ser demasiado baja para rechazar). Sin embargo, bajar
de 4.8 % parece ser muy costoso, por lo cual parece ser razonable utilizar un nivel de
confianza mucho menor o un α más alto. Con esto se logra disminuir el error tipo II
si la rentabilidad real es 4..8 % o menos. La gerente al parecer tiene en mente que la
elección de α no es un valor convencioinal simplemente y está asociada a los costos y
beneficios de rechazar o no una hipótesis.

Si la hipótesis nula es R ≤ 5 % entonces elegir un valor de α muy pequeño significa


que es demasiado difı́cil rechazar esta hipótesis (la rentabilidad estimada deberı́a
ser demasiado alta para rechazar), por lo que la empresa estarı́a siendo demasiado
conservadora y realiza poca inversión. Sin embargo, si consideramos que el costo para
la empresa de un R < 4,8 % es muy alto (una demanda), la empresa harı́a bien en

9
usar un α muy bajo, porque es muy costoso rechazar la nula equivocadamente. La
idea de la gerente en este caso no concuerda. O está equivocada, o tiene en menta la
hipótesis nula de R > 5 %.
El subalterno dice que “vamos a espantar a los clientes si les decimos que bajaremos
los niveles de confianza de nuestras decisiones”. Esto puede significar que (i) no
entiende la relación inversa entre error tipo I y tipo II, porque operar con menos
confianza implica aumentar la potencia. Si la hipótesis alternativa nos pone en un
escenario especialmente negativo, es lo que hay que hacer. La otra opción es que (ii) el
subalterno cree que sus clientes no entienden la relación inversa de confianza-potencia
y les preocupa como pueden percibir que usan “menor confianza” en sus decisiones
financieras. En este caso, su comentario es más razonable.
(NOTA: esta respuesta es muy extensa y trata de ponerse en todos los escenarios
posibles. Para 100 % basta considerar un escenario para gerente y subalterno)

10

También podría gustarte