Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto 1
Econometría
Econometría
SECCIÓN B.
INTEGRANTES
Hedy González Alvear.
Alexis Gutiérrez Gutiérrez.
Pablo Donaire González.
Marjorie Yáñez Castro.
PROFESOR
Leidy García.
a) Considere el estimador de 𝛽:
𝑦̅
𝛽̃ =
𝑥̅
𝑦̅
𝛽̃ =
𝑥̅
Entonces
∑𝑛𝑖=1 𝑦𝑖 𝑦1 𝑦2 𝑦3 𝑦𝑛
𝛽̃ = 𝑛 = 𝑛 + 𝑛 + 𝑛 +⋯+ 𝑛
∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖
𝐸(𝑢𝑖 )
Como resultado, lo que acompaña al β es 1 y ∑𝑛 = 0 porque 𝐸(𝜇𝑖 ) = 0. De este modo es
𝑖=1 𝑥𝑖
posible demostrar que 𝛽̃ es un estimador insesgado de 𝛽.
𝔼[𝛽̃ ] = 𝛽
ii) calcule su varianza y demuestre que es superior a la varianza del estimador MCO
de 𝛽.
Varianza de 𝛽̃ :
𝛴𝜇 𝑁𝜎 2
𝑉𝑎𝑟[𝛽̃ ] = 𝑉𝑎𝑟[ 𝛽 + 𝛴𝑥𝑖 ]=(𝛴𝑥 ) 2
𝑖 𝑖
lo cual demuestra que 𝛽̂2 es un promedio ponderado de las Y, con las 𝑘𝑖 como
ponderaciones.
𝛽2∗ = ∑𝑤𝑖 𝑌𝑖
donde 𝑤𝑖 son también ponderaciones, no necesariamente iguales a 𝑘𝑖 . Ahora
= ∑𝑤𝑖 (𝛽1 + 𝛽2 𝑋𝑖 )
= 𝛽1 ∑𝑤𝑖 + 𝛽2 ∑𝑤𝑖 𝑋𝑖
∑𝑤𝑖 = 0
∑𝑤𝑖 𝑋𝑖 = 1
También se puede escribir:
2
𝑥 ∑𝑥𝑖2 𝑥 𝑥
= 𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) + 𝜎 2 2 + 2𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) (∑𝑥𝑖2 )
𝑖 (∑𝑥𝑖2 ) 𝑖 𝑖
2
𝑥 1
= 𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) + 𝜎 2 (∑𝑥 2)
𝑖 𝑖
Entonces:
𝜎2
Var (𝛽2∗ ) = ∑𝑥 2
𝑖
Esto quiere decir que el estimador lineal insesgado de varianza mínima, siempre es menor
que cualquier estimador 𝛽 calculado.
b) Se estima el parámetro 𝛽 por mínimos cuadrados ordinarios, pero utilizando solo las
primeras 𝑠 < 𝑛 observaciones. Demuestre que el estimador de MCO de 𝛽 obtenido de
esta forma es lineal e insesgado, pero su varianza es superior a la del estimador MCO de
𝛽 calculado utilizando todas las 𝑛 observaciones.
Sea 𝛽̂𝑠 el estimador mínimo cuadrado ordinario utilizando solo las primeras s observaciones,
cabe recalcar que todo estimador MCO es lineal e insesgado sin importar su tamaño
muestral.
si 𝔼[𝛽̂𝑠 ] = 𝛽𝑠
′
= 𝔼 [[𝛽̂𝑠 − 𝛽𝑠 ][𝛽̂𝑠 − 𝛽𝑠 ] ]
𝔼(𝜇 𝜇′ ) = Ι𝜎 2
Da como resultado:
𝜎 2 (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑋 (𝑋 ′ 𝑋)−1
Por la propiedad de la matriz identidad se elimina (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑋
Cambiamos cada X por 𝑋𝑠 siendo 𝑋𝑠 la matriz que representa las primeras s observaciones
𝜎 2
Var (𝛽̂𝑠 ) = ∑𝑠 2
𝑖=1 𝑋𝑖
*fuente: Gujarati pág. 93
𝜎2
̂)
𝑉𝑎𝑟 (𝛽 ∑𝑛 𝑋2
𝑖=1 𝑖 ∑𝑠 𝑋2
̂ = 𝜎2
= ∑𝑖=1 𝑖
𝑛 𝑋2 < 1
𝑉𝑎𝑟(𝛽𝑠 ) 𝑖=1 𝑖
∑𝑠 𝑋2
𝑖=1 𝑖
El denominador ∑𝑛𝑖=1 𝑋𝑖2 puede dar un resultado lo suficientemente grande lo que da como
resultado un número muy pequeño (inferior a 1).
por lo tanto, la Var (𝛽̂ ) < Var (𝛽̂𝑠 )
c) Obtenga el estimador lineal de mínima varianza de 𝛽, no necesariamente insesgado.
̃ = 𝜆𝑦 + 𝐶
𝛽´ con 𝜆, 𝐶 𝜖 ℝ
Se tiene que:
̃ = 𝑉𝑎𝑟(𝜆𝑦)
𝑉𝑎𝑟(𝛽´)
Se minimiza con 𝜆 → 0
̂ = 𝜆 con
𝛽´ 𝜆𝜖ℝ
Punto 2.
Se cree más alto es el nivel educativo del jefe de hogar mayor es el ingreso de la familia. Una
economista desea testear dicha creencia con un modelo de regresión lineal simple, de la
siguiente manera:
𝐼𝑖 = 𝛽0 + 𝛽1 𝐸𝑖 + µ𝑖
𝐼 = 24,2645 + 3,6765𝐸 + µ
El coeficiente asociado a la pendiente indica que por cada año adicional el salario sube
$3,6765. La constante indica que el salario mínimo (cantidad de años 0) es de $24,2645.
b) Calcule la elasticidad del salario-educación
𝐸̅ 𝜕𝐼̂ 𝐸̅ 7
𝐸̂ = ̅ × = ̅ × 𝛽̂1 = × 3,6765 = 0,5147
𝐼 𝜕𝐸 𝐼 50
La elasticidad del salario-educación es de 0,5147, es decir, es relativamente inelástica.
Por lo tanto, la dispersión de los valores a las diferencias entre los valores de la variable
dependiente observado y los valores que precedimos a través de la recta corresponde a
19,0434.
𝐻1 : 𝛽1 > 0
Error estándar de la pendiente:
𝜎µ 2 𝜎µ 2 𝜎µ 2 𝜎µ 2
𝑉𝑎𝑟(𝛽1 ) = = = =
∑ 𝜒 2 ∑(𝐸 − 𝐸̅ )2 ∑ 𝐸2 ̅̅̅
2 − (𝐸 × 𝑛)
2
∑ 𝐸2 − ( ) ∑ 𝐸
𝑛 𝑛
𝜎µ 2 19,0434
𝜎̂𝛽1 2 = 𝑆𝑏1 2 = = = 0,5601
2 ̅
∑ 𝐸 − (𝐸 ) × 𝑛 622 − (72 × 12)
2
Estadístico t-students:
Se concluye que se rechaza la 𝐻0 , por lo tanto, los años de educación si son significativos
para el salario.
g) ¿Cuánto sería el ingreso de un hogar con una jefa de hogar con 23 años de educación?
𝐼 = 24,2645 + 3,6765 × 23
𝐼 = 108,824
El ingreso del hogar con una jefa con 23 años de educación es de $108,824.
Nota: no olvide interpretar los resultados (es el 50% del puntaje de éste ítem)
1. Empleo
Y X1 X2 X3 X4 X5
60323 830 234289 2356 1590 1
61122 885 259426 2325 1456 2
60171 882 258054 3682 1616 3
61187 895 284599 3351 1650 4
63221 962 328975 2099 3099 5
63639 981 346999 1932 3594 6
64989 990 365385 1870 3547 7
63761 1000 363112 3578 3350 8
66019 1012 397469 2904 3048 9
67857 1046 419180 2822 2857 10
68169 1084 442769 2936 2798 11
66513 1108 444546 4681 2637 12
68655 1126 482704 3813 2552 13
69564 1142 502601 3931 2514 14
69331 1157 518173 4806 2572 15
x5 15 8 4.472136 1 15
La tabla anterior nos entrega el número total de observaciones y los datos de análisis
descriptivos como lo son la media, desviación estándar y al final el mínimo y el máximo. De
los siguientes se puede desprender el análisis posterior:
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝜇
Análisis:
✓ Con un nivel de significación del 5% (0,05) podemos ver que las variables 𝑋1 y 𝑋2 no
son significativas ya que son mayores que 0,05 y que 𝑋3 , 𝑋4 y 𝑋5 si lo son debido a
que son menores que 0,05; para esto nos fijamos en P>|t.|:
✓ Además, el error cuadrático medio (ECM) es relativamente grande 279,55, no
obstante, el R cuadrado ajustado, es decir, la efectividad del modelo al explicar las
variables independientes en explicar la variable dependiente es muy aceptable dado
que a un 99,3% y lo máximo es 100%.
𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝛽6 𝑥6 + 𝜇
Por lo tanto, este modelo sería más efectivo que el modelo anterior. No obstante,
consideramos que debemos plantear otro modelo que explique mejor la variable de
respuesta, en este caso será el modelo Semi-Logarítmico:
ln𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝛽6 𝑥6 + 𝜇
Análisis:
✓ Con un nivel de significación del 0,05 (5%) vemos que existe solo una variable que es
poco significativa, la cual vendría siendo la 𝑋6 (PIB real), pero en base teoría, si es
importante esta variable para explicar la variable de respuesta 𝑦.
✓ El error cuadrático medio el cual es de 0,00457 es el más bajo en comparación a todos
los otros los otros modelos y el R ajustado es el más alto con un 99,21%.
Por lo tanto, podríamos considerar este modelo como aceptable si observamos el ECM y el
R ajustado, no obstante, tenemos la variable 𝑋6 (PIB real), así que consideraremos un nuevo
modelo para contrastar con este ya que hasta el momento podemos establecerlo como el
mejor.
El nuevo modelo será el Lineal-Log:
Análisis:
✓ Con un nivel de significación del 5% (0,05) se puede observar que existen dos
variables no significativas 𝑋3 y 𝑋5 , aunque la menos significativa corresponde a los
periodos (𝑋5 ).
✓ El error cuadrático medio es un número grande 456,84 mucho mayor el otro modelo
el cual correspondía a 0,00457 y el R ajustado disminuye quedando en 98,12%.
Luego de un excautivo análisis llegamos a concluir que la variable 𝑋5 que corresponde al
“periodo” no es tan significativa en el modelo económico porque en sí solo se podría
emplear para pronosticas 15 periodos, por lo cual eliminaremos dicha variable. Luego de
esto al volver a probar en el programa estadístico stata, pero esta vez sin la variable 𝑋5 ,
obtuvimos los siguientes resultados:
El modelo Logarítmico se expresa como:
✓ Con un nivel del 5% (0,05) observamos que todas las variables son significativas.
✓ El error cuadrático medio es un número grande 0,00699 y el R ajustado es de
98,16%.
Concluyendo que este sería el mejor modelo hasta el momento, pero al igual que
anteriormente haremos cambios de variable, empleando un nuevo modelo y sin emplear el
𝑋5 :
ln𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽6 𝑥6 + 𝜇
Análisis:
✓ Con un nivel de significación del 0,05 (5%) vemos que todas las variables son
significativas.
✓ El error cuadrático medio el cual es de 0,00595 es el más bajo en comparación con
los otros modelos y el R ajustado es el bastante alto, no el mayor de todos los modelos
anteriores, pero es muy aceptable con un 98,67% de efectividad.
Análisis:
✓ Usando un nivel de significación del 5% todas las variables de nuestro modelo son
significativas, incluyendo le parámetro 𝛽0 .
✓ El R cuadrático ajustado disminuyo solo un 0,0064, el cual no es una gran variación
para considerar que corresponde a la explicación del modelo.
✓ Pero donde encontramos diferencias mayúsculas es en el ECM, donde pasa de
0,00595 a 467,86, por lo cual nuestro modelo no es tan aceptable.
En suma, luego de analizar todos los modelos realizados, concluimos que el mejor modelo
es:
𝛽3 = −0,0000104
𝛽4 = −0,0000115
𝛽6 = 0,000011
𝛽0 = 10,73627
𝐻0 : 𝛽3 = 𝛽4 = 𝛽6 = 0
𝐻1 : 𝑛𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑑𝑒 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑠𝑜𝑛 𝑠𝑖𝑚𝑢𝑙𝑡á𝑛𝑒𝑎𝑚𝑒𝑛𝑡𝑒 0
𝑅2 0,9895 0,9895
𝐹𝑒𝑥𝑝 = 𝑘 − 1 = 4 − 1 = 3 = 345,5397
1 − 𝑅2 1 − 0,9895 0,0105
𝑛−4 15 − 4 11
El valor experimental para la prueba F es de 345,54 aprox. Esto debemos compararlo con el
F teórico es de 3,59. El valor experimental es mayor que el valor teórico, por lo tanto,
rechazamos la hipótesis de no significancia conjunta concluyendo que los parámetros
estimados en su conjunto son significativos o que nuestro modelo es significativo
globalmente.
e) Calcular e interpretar el coeficiente determinación del modelo.
𝑆𝐶𝐸
𝑅2 = 1 −
𝑆𝐶𝑇
Fuente: formulario profesora Leidy García y Rodrigo Herrera, econometría.
Entonces reemplazando según la formula y los valores entregados en la salida del STATA
tenemos que:
𝑆𝐶𝐸 𝑆𝐸 𝑆𝐶𝑅 𝑆𝑅 0.00038917
𝑅2 = 𝑆𝐶𝑇 = 𝑆𝑇 = 1 − 𝑆𝐶𝑇 = 1 − 𝑆𝑇 = 1 − 0.037164111 = 1 − 0.01047 =0,9895