Está en la página 1de 7

Facultad de Economía y Empresas UDP

Econometría l
Vicente Abrigo Z

Ayudantía 6
Profesor: Benjamín Villena

Ayudante: Vicente Abrigo

Repaso
1. ¿Cuál sería el problema de tomar un intervalo de confianza de 100%? Siendo que
obtendríamos una estimación certera con seguridad.

 R: En una distribución normal al querer utilizar un


intervalo de confianza del 100%, el intervalo será la
línea recta real completa.
El problema es que sería prácticamente nula la
información que nos entregaría un intervalo de ese
tamaño, por lo tanto se “sacrifica” un porcentaje de
confianza, con la finalidad de obtener más riqueza
en la conclusión que nos dará el estadístico.

2. Recordemos que para rechazar 𝐻0 se deben cumplir las sgtes condiciones:


i) Si 𝑯𝟎 : 𝛽𝒊 ≤ 𝛽𝐻𝑜 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑑𝑒𝑏𝑒 𝑐𝑢𝑚𝑝𝑙𝑖𝑟 ∶ 𝑡 𝑐 ≥ 𝑡𝛼,𝑛−(𝑘+1)
2
ii) Si 𝑯𝟎 : 𝛽𝒊 ≥ 𝛽𝐻𝑜 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑑𝑒𝑏𝑒 𝑐𝑢𝑚𝑝𝑙𝑖𝑟 ∶ 𝑡 𝑐 ≤ 𝑡𝛼,𝑛−(𝑘+1)
2
iii) Si 𝑯𝟎 : 𝛽𝒊 = 𝛽𝐻𝑜 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑑𝑒𝑏𝑒 𝑐𝑢𝑚𝑝𝑙𝑖𝑟 ∶ |𝑡 𝑐 | ≥ 𝑡𝛼,𝑛−(𝑘+1)
2
iv) 𝑃 − 𝑣𝑎𝑙𝑢𝑒 ≤ 𝛼 para cualquier hipótesis en cualquier test.
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

Problema 1

Usted quiere investigar sobre el peso que puede tener un recién nacido, y para esto ha realizado
ha estimado el siguiente modelo:

̂ = 2 − 0,03𝐶𝑖𝑔𝑖 + 0,004𝐸𝑑𝑎𝑑𝑀𝑖 + 0,04𝐼𝑛𝑔𝑀𝑖


𝑃𝑒𝑠𝑜

Donde “𝐶𝑖𝑔” indica el número de cigarros que ha fumado durante el embarazo, “𝐸𝑑𝑎𝑑𝑀” indica
la edad de la madre medida en años, “𝐼𝑛𝑔𝑀” es el ingreso mensual de la madre, medida en
cientos de miles de pesos y finalmente la variable “𝑃𝑒𝑠𝑜” indica el peso esperado del feto recién
nacido medido en kilos. n=320

a) Interprete cada uno de las pendientes de la regresión.

 La pendiente de Cig, al tener un signo negativo, debemos tener claro que la


relación es inversa, por lo tanto, por cada cigarro adicional que la madre fume
durante el embarazo, se predice que el recién nacido pesará 30gramos, en
promedio, menos.

 Luego, sobre la edad, podemos predecir que por cada año adicional que tenga la
madre, el peso aumentará 4 gramos en promedio.

 Finamente, el último estimador nos indica que por cada 100mil pesos adicional
que tenga la madre en su ingreso mensual, el recién nacido pesará, en promedio,
40 gramos más.
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

b) Observa la siguiente tabla y obtenga los intervalos de confianza de la variable Cig. ¿Qué
puede decir sobre su significancia estadística?(Use un 95% de confianza)
Estimador Estimación D.E Estimada
Intercepto 2 0,2
Cig 0,04 0,006
EdadM 0,004 0,001
IngM 0,04 0,0

R: La fórmula de los intervalos de confianza, para una desviación estándar no


conocida es:
𝛽̂𝑘 − 𝐷. 𝐸(𝛽̂𝑘 ) ∗ 𝑡𝛼 < 𝛽𝑘 < 𝛽̂𝑘 + 𝐷. 𝐸(𝛽̂𝑘 ) ∗ 𝑡𝛼
2 2

Y dado que tenemos todos los valores, sólo debemos reemplazar:

0,04 − 0,006 ∗ 1,96 < 𝛽1 < 0,04 + 0,006 ∗ 1,96

Que nos da como resultado:

0,02824 < 𝛽1 < 0,05176

Dado el intervalo de confianza calculado, podemos rechazar la hipótesis nula de


significancia estadística, ya que el intervalo de confianza para 𝛽1 al 95% de
confianza, no contiene el valor de cero.

c) Realice un test de significancia individual para la variable 𝐶𝑖𝑔, mencionando tipo de test,
hipótesis nula, alternativa, grados de libertad y criterio de rechazo. (Utilice un 95% de
confianza)
R: El test a utilizar, será t-student, esto dado que no conocemos la verdadera
desviación estándar del estimador, y recordemos que la fórmula para calcular el
valor-t es la siguiente.
𝛽̂𝑘 − 𝛽̂𝐻0
𝑡𝑐 =
𝐷. 𝐸(𝛽̂𝑘 )
Nuestra hipótesis de significancia individual es:
𝐻0 : 𝛽𝐶𝑖𝑔 = 0
𝐻1 : 𝛽𝐶𝑖𝑔 ≠ 0

Reemplazando, tenemos que para testear el estimador de “𝐶𝑖𝑔":

0,04 − 0
𝑡𝑐 = = 6.6666
0,006
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

Los grados de libertad son N-K-1, que en este caso serían 320-3-1=316, y dado que
es una muestra suficientemente grande, al 95% de confianza, podemos aproximar
nuestro valor-t a 1,96.

Complementando lo anterior, también nos es útil recordar la regla del 2t vista en


clases, por la cual podemos inmediatamente rechazar la hipótesis nula al 95% de
confianza, y concluir que existe evidencia suficiente para concluir que 𝛽𝐶𝑖𝑔 ≠ 0.

d) Comente. Un aumento en la varianza estimada del estimador del parámetro, elevaría el


nivel de confianza.
Falso. Si nuestra varianza aumenta, hay un área mayor en las colas, y menor entre
los límites, por lo tanto el nivel de confianza disminuye.
(Se utilizará la pizarra de Zoom para ver explicación de forma más explícita)

Problema 2
La estimación del modelo de regresión lineal 𝑦𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝑢𝑖 entrega los siguientes
resultados:

̂𝑖 = 4 + 0,4 ∗ 𝑋1 + 0,9𝑋2
𝑌

8
𝑅2 = 60 ∑29 ̂ 𝑖2 = 520
𝑖=1 𝑢

1
0 0
29
80 10
(𝑋 ′ 𝑋)−1 = 0 −
3900 3900
10 50
(0 −
3900 3900 )

a) Testee la hipótesis que 𝛽1 + 𝛽2 = 0 con un nivel de 95% de confianza.


R: En primer lugar debemos ver que datos tenemos para poder calcular el valor-t
que necesitamos.
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

La fórmula para calcular el valor t de la restricción impuesta es muy similar a la de


significancia estádistica.
𝛽̂𝑗 + 𝛽̂𝑘 − 𝛽̂𝐻0
𝑡𝑐 =
𝐷.̂𝐸 (𝛽̂𝑗 + 𝛽̂𝑘 )

Si vemos la fórmula, nos falta la desviación estándar estimada, ¿De dónde


podemos obtenerla?
Como recordamos 𝑉𝑎𝑟(𝛽) = 𝜎̂ 2 (𝑋 ′ 𝑋)−1 que es la matriz de varianza y covarianza
de los estimadores, por lo tanto, debemos intentar obtenerla, lo cual, dado los
datos que tenemos, no es muy difícil.
Para poder obtener 𝜎̂ 2 , sólo debemos calcularlo mediante su fórmula:

𝑆𝐶𝑅 ∑29 ̂ 𝑖2
𝑖=1 𝑢 520
𝜎̂ 2 = = = = 20
𝑛 − 𝑘 − 1 29 − 2 − 1 26

Y multiplicamos por la matriz (𝑋 ′ 𝑋)−1 .


Obtenemos finalmente:

20
0 0
29
1600 200
𝜎̂ 2 (𝑋 ′ 𝑋)−1 = 0 −
3900 3900
200 1000
(0 −
3900 3900 )

Y ya sabemos que:

̂ (𝛽1 ) = 1600 , ∴ 𝐷.
𝑉𝑎𝑟 ̂ (𝛽2 ) = 1000 , ∴ 𝐷.
̂𝐸 (𝛽̂1 ) ≈ 0,6405 𝑦 𝑉𝑎𝑟 ̂𝐸 (𝛽̂2 ) ≈ 0,16
3900 3900

¿Cómo utilizamos estos datos para armar nuestro valor-t? Debemos aplicar
propiedades de varianza, es decir, escribir el denominador de tal forma, que
podamos aplicar estás propiedades.

𝛽̂1 + 𝛽̂2 − 0 𝛽̂1 + 𝛽̂2 − 0


𝑡𝑐 = → 𝑡𝑐 =
̂ ̂ ̂
𝐷. 𝐸 (𝛽1 + 𝛽2 )
√𝑉𝑎𝑟(𝛽̂1 + 𝛽̂2 )

𝛽̂1 + 𝛽̂2
𝑡𝑐 =
√𝑉𝑎𝑟(𝛽̂1 ) + 𝑉𝑎𝑟(𝛽̂2 ) + 2 ∗ 𝐶𝑜𝑣(𝛽̂1 , 𝛽̂2 )
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

𝛽̂1 + 𝛽̂1 − 𝛽̂𝐻0


𝑡𝑐 =
√𝑉𝑎𝑟(𝛽̂1 ) + 𝑉𝑎𝑟(𝛽̂2 ) + 2 ∗ 𝐶𝑜𝑣(𝛽̂1 , 𝛽̂2 )
¿Podemos simplemente reemplazar con los datos que tenemos? ¿De dónde
podemos obtener la covarianza entre los estimadores?

Lo cierto es que efectivamente podemos llegar y reemplazar, dado que la matriz


que hemos calculado, nos entrega tanto varianzas como covarianzas

0,4 + 0,9
𝑡𝑐 =
√1600 + 1000 + 2 ∗ (− 200 )
3900 3900 3900

1.3
𝑡𝑐 = ≈ 2.3
√0.5641

Dado que tenemos una muestra relativamente pequeña, buscaremos en la tabla


de valores t-student para hacer inferencia.

¿Cuántos grados de libertad poseemos?

(𝑁 − 𝐾 − 1) → (29 − 2 − 1) → 26

El valor crítico es 2.053, y dado que es menor a nuestro valor-t calculado,


rechazamos la hipótesis nula, de 𝛽1 + 𝛽2 = 0 al 95% de confianza.
Facultad de Economía y Empresas UDP
Econometría l
Vicente Abrigo Z

Comente.
a) Significancia estadística implica significancia económica.

Falso. La significancia estadística, que es concluida a través de test de hipótesis, no


permite inferir que se esté en presencia de significancia económica. Un ejemplo
puede ser una situación donde hayan altas desviaciones estándares, en
proporciones al estimadores, y producen bajos valores t y por lo tanto no es
posible inferir significancia estadística, sin embargo, el impacto del estimador
puede ser importante. No hay significancia estadística pero si puede haber
económica.
Otra situación, es cuando tenemos un N suficientemente grande, que puede
producir, con alta probabilidad, que todos los estimadores sean estadísticamente
significativos, no por esto, lo son en su impacto.
Que el coeficiente estimado no sea estadísticamente significativo no quiere decir
que no lo sea desde el punto de vista del modelo que se está estudiando.

b) Explique el concepto de p-hacking o manipulación de significancia.

También podría gustarte