Yáñez G G D

Universidad de Talca
Facultad de Economía y Negocios

Escuela de Ingeniería Comercial
Econometría
Proyecto 1
Econometría
Econometría
SECCIÓN B.
INTEGRANTES
Hedy González Alvear.
Alexis Gutiérrez Gutiérrez.
Pablo Donaire González.
Marjorie Yáñez Castro.
PROFESOR
Leidy García.
18 de Mayo de 2020, Talca.

Punto 1.
Considere el siguiente modelo de regresión lineal, donde 𝑦 es la variable dependiente, 𝑥 es

la variable explicativa no estocástica:
𝑦𝑖 = 𝑥𝑖 𝛽 + 𝜇𝑖
para 𝑖 = 1,2, … 𝑛. Se hacen los supuestos siguientes:
𝐸(𝜇𝑖 ) = 0
𝑉𝑎𝑟(𝜇𝑖 ) = 𝜎 2 ∀𝑖
𝐶𝑜𝑣(𝜇𝑖 , 𝜇𝑗 ) = 0 ∀𝑖 ≠ 𝑗
Sean,
∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1 𝑦𝑖
𝑥̅ = ; 𝑦̅ =
𝑛 𝑛
a) Considere el estimador de 𝛽:
𝑦̅
𝛽̃ =
𝑥̅
Demuestre que 𝛽̃ es estimador lineal e insesgado de 𝛽; calcule su varianza y demuestre que

es superior a la varianza del estimador MCO de 𝛽.
i) Demuestre que 𝛽̃ es estimador lineal e insesgado de 𝛽;
𝑦̅
𝛽̃ =
𝑥̅
Entonces
∑𝑛𝑖=1 𝑦𝑖 𝑦1 𝑦2 𝑦3 𝑦𝑛
𝛽̃ = 𝑛 = 𝑛 + 𝑛 + 𝑛 +⋯+ 𝑛
∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖
La sumatoria de ∑𝑛𝑖=1 𝑦𝑖 nos muestra el siguiente resultado en el modelo de regresión lineal

al momento de reemplazar los valores que nos indica la sumatoria.
𝛽𝑥1 + 𝑢1 𝛽𝑥2 + 𝑢2 𝛽𝑥3 + 𝑢3 𝛽𝑥𝑛 + 𝑢𝑛
= 𝑛 + 𝑛 + 𝑛 +⋯+ 𝑛
∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑥𝑖
Por lo que en general queda la siguiente expresión simplificando lo anteriormente propuesto

∑𝑛𝑖=1 𝛽𝑥𝑖 + 𝑢𝑖
𝛽̃ =
∑𝑛𝑖=1 𝑥𝑖
A continuación, es necesario resolver la esperanza del estimador para ver si 𝛽̃ es un

estimador insesgado de 𝛽.
∑𝑛𝑖=1 𝛽𝑥𝑖 + 𝑢𝑖 ∑𝑛𝑖=1 𝑥𝑖 + 𝑢𝑖 ∑𝑛𝑖=1 𝑥𝑖 𝔼(𝑢𝑖 )
𝔼[𝛽̃ ] = 𝔼 [ ] = 𝔼 [𝛽 ] = 𝛽 + = 𝛽
∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖
𝐸(𝑢𝑖 )
Como resultado, lo que acompaña al β es 1 y ∑𝑛 = 0 porque 𝐸(𝜇𝑖 ) = 0. De este modo es
𝑖=1 𝑥𝑖
posible demostrar que 𝛽̃ es un estimador insesgado de 𝛽.
𝔼[𝛽̃ ] = 𝛽
ii) calcule su varianza y demuestre que es superior a la varianza del estimador MCO
de 𝛽.
Varianza de 𝛽̃ :
𝛴𝜇 𝑁𝜎 2
𝑉𝑎𝑟[𝛽̃ ] = 𝑉𝑎𝑟[ 𝛽 + 𝛴𝑥𝑖 ]=(𝛴𝑥 ) 2
𝑖 𝑖
Varianza de 𝛽̂ realizada por MCO:
*fuente: Gujarati pág. 95-96.

𝑋 −𝑋̅ 𝑋𝑖
𝛽̂2 = ∑𝑘𝑖 𝑌𝑖 donde 𝑘𝑖 = ∑(𝑋𝑖 −𝑋̅)2 =
𝑖 ∑𝑋𝑖 2
lo cual demuestra que 𝛽̂2 es un promedio ponderado de las Y, con las 𝑘𝑖 como
ponderaciones.
Se define un estimador lineal alterno de 𝛽2 de la siguiente forma:
𝛽2∗ = ∑𝑤𝑖 𝑌𝑖
donde 𝑤𝑖 son también ponderaciones, no necesariamente iguales a 𝑘𝑖 . Ahora
𝔼(𝛽2∗ ) = ∑𝑤𝑖 𝔼(𝑌𝑖 )
= ∑𝑤𝑖 (𝛽1 + 𝛽2 𝑋𝑖 )
= 𝛽1 ∑𝑤𝑖 + 𝛽2 ∑𝑤𝑖 𝑋𝑖
Por consiguiente, para que (𝛽2∗ ) sea insesgado se requiere que:
∑𝑤𝑖 = 0
∑𝑤𝑖 𝑋𝑖 = 1
También se puede escribir:
Var (𝛽2∗ ) = Var ∑𝑤𝑖 𝑌𝑖
= ∑ 𝑤𝑖2 𝑉𝑎𝑟 𝑌𝑖 [𝑁𝑜𝑡𝑎: 𝑉𝑎𝑟 𝑌𝑖 = 𝑉𝑎𝑟 𝑢𝑖 = 𝜎 2 ]
= 𝜎 2 ∑ 𝑤𝑖2 [𝑁𝑜𝑡𝑎: 𝐶𝑜𝑣(𝑌𝑖 , 𝑌𝑗 ) = 0 (𝑖 ≠ 𝑗)]

2
𝑥 𝑥
= 𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2 + ∑𝑥𝑖2 )
𝑖 𝑖
2
𝑥 ∑𝑥𝑖2 𝑥 𝑥
= 𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) + 𝜎 2 2 + 2𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) (∑𝑥𝑖2 )
𝑖 (∑𝑥𝑖2 ) 𝑖 𝑖
2
𝑥 1
= 𝜎 2 ∑ (𝑤𝑖 − ∑𝑥𝑖2) + 𝜎 2 (∑𝑥 2)
𝑖 𝑖
Entonces:
𝜎2
Var (𝛽2∗ ) = ∑𝑥 2
𝑖
Var (𝛽2∗ ) = Var (𝛽̂2 )
Expresado en palabras, con ponderaciones 𝑤𝑖 = 𝑘𝑖 , que son ponderaciones de mínimos

cuadrados, la varianza del estimador lineal 𝛽2∗ es igual a la del estimador de mínimos
cuadrados 𝛽̂2 ; de lo contrario, la var (𝛽2∗ ) > var (𝛽̂2 ). Dicho de otra manera, si hay un estimador
lineal insesgado de 𝛽2 de varianza mínima, debe ser el estimador de mínimos cuadrados.
Esto quiere decir que el estimador lineal insesgado de varianza mínima, siempre es menor
que cualquier estimador 𝛽 calculado.
b) Se estima el parámetro 𝛽 por mínimos cuadrados ordinarios, pero utilizando solo las
primeras 𝑠 < 𝑛 observaciones. Demuestre que el estimador de MCO de 𝛽 obtenido de
esta forma es lineal e insesgado, pero su varianza es superior a la del estimador MCO de
𝛽 calculado utilizando todas las 𝑛 observaciones.
Sea 𝛽̂𝑠 el estimador mínimo cuadrado ordinario utilizando solo las primeras s observaciones,
cabe recalcar que todo estimador MCO es lineal e insesgado sin importar su tamaño
muestral.
se sabe que el cálculo de la varianza de beta es

2 ′
Var (𝛽̂𝑠 ) = 𝔼 [𝛽̂𝑠 − 𝔼[𝛽̂𝑠 ] ] = 𝔼 [[𝛽̂𝑠 − 𝔼[𝛽̂𝑠 ]] [𝛽̂𝑠 − 𝔼[𝛽̂𝑠 ]] ]
si 𝔼[𝛽̂𝑠 ] = 𝛽𝑠
′
= 𝔼 [[𝛽̂𝑠 − 𝛽𝑠 ][𝛽̂𝑠 − 𝛽𝑠 ] ]
Se debe continuar resolviendo con matrices
= 𝔼[(𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇 ((𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇)′ ]
= 𝔼[(𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇 𝜇′ 𝑋(𝑋 ′ 𝑋)′−1 ]

= 𝔼[(𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇 𝜇′ 𝑋(𝑋 ′ 𝑋)−1 ]
= (𝑋 ′ 𝑋)−1 𝑋 ′ 𝔼(𝜇 𝜇′ )𝑋(𝑋 ′ 𝑋)−1
Si tomamos en cuenta que:
𝔼(𝜇 𝜇′ ) = Ι𝜎 2
Da como resultado:
𝜎 2 (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑋 (𝑋 ′ 𝑋)−1
Por la propiedad de la matriz identidad se elimina (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑋
El resultado final es:
Cambiamos cada X por 𝑋𝑠 siendo 𝑋𝑠 la matriz que representa las primeras s observaciones
Var (𝛽̂𝑠 ) = 𝜎 2 (𝑋 ′ 𝑠 𝑋𝑠 )−1
𝜎 2
Var (𝛽̂𝑠 ) = ∑𝑠 2
𝑖=1 𝑋𝑖
*fuente: Gujarati pág. 93
Para calcular la variabilidad de los estimadores resolvemos lo siguiente:
𝜎2
̂)
𝑉𝑎𝑟 (𝛽 ∑𝑛 𝑋2
𝑖=1 𝑖 ∑𝑠 𝑋2
̂ = 𝜎2
= ∑𝑖=1 𝑖
𝑛 𝑋2 < 1
𝑉𝑎𝑟(𝛽𝑠 ) 𝑖=1 𝑖
∑𝑠 𝑋2
𝑖=1 𝑖
El denominador ∑𝑛𝑖=1 𝑋𝑖2 puede dar un resultado lo suficientemente grande lo que da como
resultado un número muy pequeño (inferior a 1).
por lo tanto, la Var (𝛽̂ ) < Var (𝛽̂𝑠 )
c) Obtenga el estimador lineal de mínima varianza de 𝛽, no necesariamente insesgado.
̃ = 𝜆𝑦 + 𝐶
𝛽´ con 𝜆, 𝐶 𝜖 ℝ
Se tiene que:
̃ = 𝑉𝑎𝑟(𝜆𝑦)
𝑉𝑎𝑟(𝛽´)
Se minimiza con 𝜆 → 0
Por lo tanto, tenemos que el estimador de mínima varianza es el siguiente:
̂ = 𝜆 con
𝛽´ 𝜆𝜖ℝ
Punto 2.
Se cree más alto es el nivel educativo del jefe de hogar mayor es el ingreso de la familia. Una
economista desea testear dicha creencia con un modelo de regresión lineal simple, de la
siguiente manera:
𝐼𝑖 = 𝛽0 + 𝛽1 𝐸𝑖 + µ𝑖
Para ello obtuvo los siguientes datos de 12 hogares de la cuidad de Talca.

𝑛 𝑛 𝑛
𝐼 ̅ = 50; 𝐸̅ = 7; ∑ 𝐸𝑖2 = 622; ∑ 𝐼𝑖2 = 30.650; ∑ 𝐼𝑖 𝐸𝑖 = 4.325

𝑖=1 𝑖=1 𝑖=1
a) Estime los coeficientes del modelo

∑ 𝐼𝐸 − 𝐼 ̅ ∑ 𝐸 ∑ 𝐼𝐸 − 𝐼 (̅ 𝑛𝐸̅ ) 4.325 − (50 × (12 × 7))
𝛽̂1 = = = = 3,6765
∑ 𝐸 2 − 𝐸̅ ∑ 𝐸 ∑ 𝐸 2 − 𝐸̅ (𝐸̅ 𝑛) 622 − (72 ) × 12
𝛽̂0 = 𝐼 ̅ − 𝛽̂1 𝐸̅ = 50 − (3,6765 × 7) = 24,2645
𝐼 = 24,2645 + 3,6765𝐸 + µ
El coeficiente asociado a la pendiente indica que por cada año adicional el salario sube
$3,6765. La constante indica que el salario mínimo (cantidad de años 0) es de $24,2645.
b) Calcule la elasticidad del salario-educación
𝐸̅ 𝜕𝐼̂ 𝐸̅ 7
𝐸̂ = ̅ × = ̅ × 𝛽̂1 = × 3,6765 = 0,5147
𝐼 𝜕𝐸 𝐼 50
La elasticidad del salario-educación es de 0,5147, es decir, es relativamente inelástica.
c) Realice una descomposición de la varianza del modelo

𝑆𝑇 = 𝑆𝐸 = 𝑆𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇𝑜𝑡𝑎𝑙 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙
la suma de cuadrados de la
𝑆𝑇 = ∑ 𝐼 2 − 𝑛(𝐼 2 ) = 30.650 − (12 × (502 )) = 650
endógena alrededor de su media
𝑆𝐸 = (𝛽̂1 )2 (∑ 𝐸 2 − 𝑛(𝐸̅ )2 ) = (3,6765)2 × (622 − (12 × (72 )) = 459,5662
es la suma de cuadrados 650 = 459,5662 + 𝑆𝑅

de la variable ajustada
alrededor de su media 𝑆𝑅 = 190,4338 la suma de cuadrados de residuos MCO
d) Analice la capacidad explicativa del modelo

𝑆𝐸 𝑆𝑅
𝑅2 = =1−
𝑆𝑇 𝑆𝑇
459,5662 190,4338
𝑅2 = = 1− = 0,7070
650 650
El 70,70% de las variaciones en el ingreso es explicado por el ajuste mínimo cuadrático
sobre su nivel educativo.
e) Estime la varianza de los residuos

𝑛
2 1 𝑆𝑅 190,4338
𝜎̂µ = ∑ µ̂𝑖 2 = = = 19,0434
𝑛−2 𝑛−2 12 − 2
𝑖=1
Por lo tanto, la dispersión de los valores a las diferencias entre los valores de la variable
dependiente observado y los valores que precedimos a través de la recta corresponde a
19,0434.
f) Demuestre si se cumple o no la Hipótesis planteada por la economista. Recuerde

realizar los cálculos necesarios.
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 > 0
Error estándar de la pendiente:
𝜎µ 2 𝜎µ 2 𝜎µ 2 𝜎µ 2
𝑉𝑎𝑟(𝛽1 ) = = = =
∑ 𝜒 2 ∑(𝐸 − 𝐸̅ )2 ∑ 𝐸2 ̅̅̅
2 − (𝐸 × 𝑛)
2
∑ 𝐸2 − ( ) ∑ 𝐸
𝑛 𝑛
𝜎µ 2 19,0434
𝜎̂𝛽1 2 = 𝑆𝑏1 2 = = = 0,5601
2 ̅
∑ 𝐸 − (𝐸 ) × 𝑛 622 − (72 × 12)
2
La desviación estándar del parámetro:
√𝑉𝑎𝑟(𝛽̂ ) = 𝑆𝛽̂1 = 𝜎̂𝛽1 = 𝑒𝑒(𝛽1 ) = √0,5601 = 0,7484
Estadístico t-students:
𝛽̂1 − 𝛽1 𝛽̂1 3,6765

𝑡𝑒𝑥𝑝 = = = = 4,9125
𝑆𝛽̂1 𝑆𝛽̂1 0,7484
𝑡𝑡𝑐𝑜 = 𝑡𝑛−𝑘 ∝ = 𝑡10 0,05 = 𝑡(10; 0,95) = 1,8125
Aplicando la regla de decisión:
|𝑡𝑒𝑥𝑝 | > |𝑡𝑡𝑐𝑜 |
|4,9125| > |1,8125|
Se concluye que se rechaza la 𝐻0 , por lo tanto, los años de educación si son significativos
para el salario.
g) ¿Cuánto sería el ingreso de un hogar con una jefa de hogar con 23 años de educación?
𝐼 = 24,2645 + 3,6765 × 23
𝐼 = 108,824
El ingreso del hogar con una jefa con 23 años de educación es de $108,824.
Punto 3. Para la base de datos asignada debes:
a) Realice un análisis de estadística descriptiva (media, desviación estándar, rango,

entre otros).
b) Formular un modelo con base en la teoría económica que sea factible de aplicar a los
datos entregados. Recuerde expresarlo matemáticamente y que también podría ser
necesario realizar transformaciones de las variables (ej: logaritmos).
c) Estimar los parámetros del modelo e interpretarlos.
d) Realizar los contrastes de significación y concluir sobre éstos.
e) Calcular e interpretar el coeficiente determinación del modelo.
Nota: no olvide interpretar los resultados (es el 50% del puntaje de éste ítem)
1. Empleo
▪ 𝑌 = Número de personas empleadas

▪ 𝑋 1 = Deflactor del producto interno bruto
▪ 𝑋 2 = Producto interno bruto
▪ 𝑋 3 = Número de personas desempleadas
▪ 𝑋 4 = Número de personas en las fuerzas armadas
▪ 𝑋 5 = periodo
Y X1 X2 X3 X4 X5
60323 830 234289 2356 1590 1
61122 885 259426 2325 1456 2
60171 882 258054 3682 1616 3
61187 895 284599 3351 1650 4
63221 962 328975 2099 3099 5
63639 981 346999 1932 3594 6
64989 990 365385 1870 3547 7
63761 1000 363112 3578 3350 8
66019 1012 397469 2904 3048 9
67857 1046 419180 2822 2857 10
68169 1084 442769 2936 2798 11
66513 1108 444546 4681 2637 12
68655 1126 482704 3813 2552 13
69564 1142 502601 3931 2514 14
69331 1157 518173 4806 2572 15
a) Realice un análisis de estadística descriptiva (media, desviación estándar, rango,

entre otros).
Para realizar el análisis de estadística descriptiva usamos el programa estadístico
STATA, del cual al subir la base de datos presentada anteriormente obtuvimos las
siguientes salidas:
. sum y x1 x2 x3 x4 x5
Variable Obs Mean Std. Dev. Min Max
y 15 64968.07 3335.82 60171 69564

x1 15 1006.667 103.5034 830 1157
x2 15 376552.1 91951.98 234289 518173
x3 15 3139.067 940.8251 1870 4806
x4 15 2592 717.7737 1456 3594
x5 15 8 4.472136 1 15
La tabla anterior nos entrega el número total de observaciones y los datos de análisis
descriptivos como lo son la media, desviación estándar y al final el mínimo y el máximo. De
los siguientes se puede desprender el análisis posterior:
1) Número de personas empleadas (𝑌): En promedio tenemos que el número de personas

empleadas es de 64.968,07, del cual cuenta con una desviación estándar de 3.335,82 lo
que indica que en esa suma se alejan los datos de la media, además se puede ver que el
periodo con mínimo de personas empleadas es de 60.171 y que el máximo de personas
empleadas es de 69.564.
2) Deflactor del producto interno bruto (𝑋1 ): Tenemos que en promedio el deflactor del
PIB el cual es la variación de los precios en una economía en un tiempo determinado
utilizando el PIB es de 1.006,667, este presenta una desviación estándar de 103,5034,
además en un periodo tuvo un mínimo de 830 y un máximo de 1.157.
3) Producto interno bruto (𝑋2 ): En promedio el producto interno bruto es 376.552,1, con
una desviación estándar de 91.951,98, además se puede observar que existe un PIB
mínimo que corresponde a 234.289 y un máximo de 518.173.
4) Números de personas desempleadas (𝑋3 ): El promedio de personas desempleadas es
3.139,067, con una desviación estándar de 940,8251 lo cual manifiesta los datos que se
alejan de la media, también se obtiene el mínimo de personas desempleadas 1.870 y un
máximo 4.806.
5) Número de personas en las fuerzas armadas (𝑋4 ): Se obtiene en promedio del número
de personas en las fuerzas armadas de 2.592, con una desviación estándar de 717,
7737.Además de un periodo con un mínimo de 1.456 y un máximo de 3.594.
b) Formular un modelo con base en la teoría económica que sea factible de aplicar a los
datos entregados. Recuerde expresarlo matemáticamente y que también podría ser
necesario realizar transformaciones de las variables (ej: logaritmos).
En primera instancia tenemos el siguiente modelo lineal múltiple:
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝜇
En el cual se consideraron las variables de número de personas empleadas (𝑌), deflactor

del PIB (𝑋1 ), producto interno bruto (𝑋2 ), número de personas desempleadas (𝑋3 ),
número de personas en las fuerzas armadas (𝑋4 ) y el periodo (𝑋5 ). Al analizar estas
variables en STATA ocupando el comando “reg” obtenemos lo siguiente salida:
Análisis:
✓ Con un nivel de significación del 5% (0,05) podemos ver que las variables 𝑋1 y 𝑋2 no
son significativas ya que son mayores que 0,05 y que 𝑋3 , 𝑋4 y 𝑋5 si lo son debido a
que son menores que 0,05; para esto nos fijamos en P>|t.|:
✓ Además, el error cuadrático medio (ECM) es relativamente grande 279,55, no
obstante, el R cuadrado ajustado, es decir, la efectividad del modelo al explicar las
variables independientes en explicar la variable dependiente es muy aceptable dado
que a un 99,3% y lo máximo es 100%.
✓ Y observado que las variables no significativas (𝑋 1 y 𝑋 2 ), según el modelo,

deberíamos eliminarlas, pero dado que es en base a la teoría económica,
consideramos que, si son significativas para explicar el número de personas
empleadas (𝑦), por lo cual, modificaremos ambas variables para crear una nueva:
“PIB REAL”, la cual la llamaremos 𝑋 6 . Y para obtener esta nueva variable será de la
siguiente forma:
𝑃𝐼𝐵 𝑁𝑂𝑀𝐼𝑁𝐴𝐿 (𝑋 )
(𝐷𝐸𝐹𝐿𝐴𝐶𝑇𝑂𝑅 𝐷𝐸𝐿 𝑃𝐼𝐵 2(𝑋 )) ∗ 100 = 𝑃𝐼𝐵 𝑅𝐸𝐴𝐿 (𝑋 6 )
1
✓ Con esta nueva variable, plantearemos un nuevo modelo y concluiremos cuan

explicativo es, el cual es el siguiente:
𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝛽6 𝑥6 + 𝜇
✓ Aplicamos el comando “reg” en Stata y tenemos la siguiente salida:

Análisis:
✓ Con un nivel de significación del 5% (0,05) podemos ver que las variables 𝑋3 , 𝑋4 , 𝑋5
siguen siendo significativas debido a que son menores que 0,05. La variable 𝑋6
corresponde al PIB real el cual no es significativo dado que es mayor al 0,05. Para
observar esto nos fijamos en P>|t|.
✓ Y tal como se mencionó anteriormente, el PIB real (𝑋6 ) si es significativo
económicamente para explicar el número de personas empleadas.
✓ Y al implementar este nuevo modelo, el error cuadrático medio es mayor que el
modelo anterior, pasando de 279,55 a 295,72 y el R cuadrado ajustado, disminuye
levente, solo un 0,09%, por lo cual no están relevante.
En suma, al tener aún una variable estadísticamente no significativa PIB real 𝑋6 y sí es

significativo en base a la teoría económica al estimar el número de personas empleadas
procedemos a los siguientes modelos:
Primero tenemos el modelo Logarítmico, su función es:
ln𝑦 = 𝛽0 + 𝛽3 𝑙𝑛𝑥3 + 𝛽4 𝑙𝑛𝑥4 + 𝛽5 𝑙𝑛𝑥5 + 𝛽6 𝑙𝑛𝑥6 + 𝜇
✓ Las variables para considerar en este modelo fueron:

• y: número de personas empleadas.
• x3: número de personas desempleadas.
• x4: número de personas en las fuerzas armadas.
• x5: periodo.
• x6: PIB real.
✓ Aplicamos el comando “reg” en Stata y tenemos la siguiente salida:
Análisis:
✓ Con un nivel del 5% (0,05) observamos que existen dos variables no significativas el
número de personas desempleadas( 𝑋3 ) y el periodo (𝑋5 ).
✓ El error cuadrático medio corresponde a 0,00688 el cual bajo considerablemente y el
R cuadrado ajustado es de 98,22%.
Por lo tanto, este modelo sería más efectivo que el modelo anterior. No obstante,
consideramos que debemos plantear otro modelo que explique mejor la variable de
respuesta, en este caso será el modelo Semi-Logarítmico:
ln𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝛽6 𝑥6 + 𝜇
Aplicamos el comando “reg” en Stata y tenemos la siguiente salida:
Análisis:
✓ Con un nivel de significación del 0,05 (5%) vemos que existe solo una variable que es
poco significativa, la cual vendría siendo la 𝑋6 (PIB real), pero en base teoría, si es
importante esta variable para explicar la variable de respuesta 𝑦.
✓ El error cuadrático medio el cual es de 0,00457 es el más bajo en comparación a todos
los otros los otros modelos y el R ajustado es el más alto con un 99,21%.
Por lo tanto, podríamos considerar este modelo como aceptable si observamos el ECM y el
R ajustado, no obstante, tenemos la variable 𝑋6 (PIB real), así que consideraremos un nuevo
modelo para contrastar con este ya que hasta el momento podemos establecerlo como el
mejor.
El nuevo modelo será el Lineal-Log:
𝑦 = 𝛽0 + 𝛽3 𝑙𝑛𝑥3 + 𝛽4 𝑙𝑛𝑥4 + 𝛽5 𝑙𝑛𝑥5 + 𝛽6 𝑙𝑛𝑥6 + 𝜇
Análisis:
✓ Con un nivel de significación del 5% (0,05) se puede observar que existen dos
variables no significativas 𝑋3 y 𝑋5 , aunque la menos significativa corresponde a los
periodos (𝑋5 ).
✓ El error cuadrático medio es un número grande 456,84 mucho mayor el otro modelo
el cual correspondía a 0,00457 y el R ajustado disminuye quedando en 98,12%.
Luego de un excautivo análisis llegamos a concluir que la variable 𝑋5 que corresponde al
“periodo” no es tan significativa en el modelo económico porque en sí solo se podría
emplear para pronosticas 15 periodos, por lo cual eliminaremos dicha variable. Luego de
esto al volver a probar en el programa estadístico stata, pero esta vez sin la variable 𝑋5 ,
obtuvimos los siguientes resultados:
El modelo Logarítmico se expresa como:
ln𝑦 = 𝛽0 + 𝛽3 𝑙𝑛𝑥3 + 𝛽4 𝑙𝑛𝑥4 + 𝛽6 𝑙𝑛𝑥6 + 𝜇

✓ Con un nivel del 5% (0,05) observamos que todas las variables son significativas.
✓ El error cuadrático medio es un número grande 0,00699 y el R ajustado es de
98,16%.
Concluyendo que este sería el mejor modelo hasta el momento, pero al igual que
anteriormente haremos cambios de variable, empleando un nuevo modelo y sin emplear el
𝑋5 :
Este modelo es el Semi-Logarítmico y la función de este es:
ln𝑦 = 𝛽0 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽6 𝑥6 + 𝜇
Análisis:
✓ Con un nivel de significación del 0,05 (5%) vemos que todas las variables son
significativas.
✓ El error cuadrático medio el cual es de 0,00595 es el más bajo en comparación con
los otros modelos y el R ajustado es el bastante alto, no el mayor de todos los modelos
anteriores, pero es muy aceptable con un 98,67% de efectividad.
Finalmente, realizaremos el último modelo el cual es el lineal-log:
𝑦 = 𝛽0 + 𝛽3 𝑙𝑛𝑥3 + 𝛽4 𝑙𝑛𝑥4 + 𝛽6 𝑙𝑛𝑥6 + 𝜇
Análisis:
✓ Usando un nivel de significación del 5% todas las variables de nuestro modelo son
significativas, incluyendo le parámetro 𝛽0 .
✓ El R cuadrático ajustado disminuyo solo un 0,0064, el cual no es una gran variación
para considerar que corresponde a la explicación del modelo.
✓ Pero donde encontramos diferencias mayúsculas es en el ECM, donde pasa de
0,00595 a 467,86, por lo cual nuestro modelo no es tan aceptable.
En suma, luego de analizar todos los modelos realizados, concluimos que el mejor modelo
es:
ln𝑦 = 10,73627 − 0,0000104𝑥3 − 0,0000115𝑥4 + 0,000011𝑥6 + 𝜇
El cual corresponde a un modelo es el Semi-Logarítmico.

c) Estimar los parámetros del modelo e interpretarlos.
Estimadores de los parámetros
Los parámetros según el modelo elegido serían:
𝛽3 = −0,0000104
𝛽4 = −0,0000115
𝛽6 = 0,000011
𝛽0 = 10,73627
✓ 𝛽3 se relaciona negativamente con la variable y se estima que cae en un 0,0000104

por cada unidad de número de personas desempleadas que aumente.
✓ 𝛽4 también se relaciona negativamente con la variable y se estima que cae en un
0,0000115 por cada unidad de número de personas en las fuerzas armadas que
aumente.
✓ 𝛽6 se relaciona positivamente con la variable y se estima aumenta en un 0,000011
por cada unidad de PIB real que aumente.
✓ 𝛽0 es la constante del modelo la cual indica que el empleo mínimo (cantidad de
personas desempleadas es 0, cantidad de personas en las fuerzas armadas es 0 y el
PIB real es 0) es 10,73627.
El modelo con estos nuevos parámetros sería el siguiente:
ln𝑦 = 10,73627 − 0,0000104𝑥3 − 0,0000115𝑥4 + 0,000011𝑥6 + 𝜇

d) Realizar los contrastes de significación y concluir sobre éstos.
𝐻0 : 𝛽3 = 𝛽4 = 𝛽6 = 0
𝐻1 : 𝑛𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑑𝑒 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑠𝑜𝑛 𝑠𝑖𝑚𝑢𝑙𝑡á𝑛𝑒𝑎𝑚𝑒𝑛𝑡𝑒 0
𝑅2 0,9895 0,9895
𝐹𝑒𝑥𝑝 = 𝑘 − 1 = 4 − 1 = 3 = 345,5397
1 − 𝑅2 1 − 0,9895 0,0105
𝑛−4 15 − 4 11
𝐹𝑡𝑐𝑜 = 𝐹3,11 (0,05) = 3,59
Además, se realizó el contraste de significación en stata, empleando el comando “test”,

resultando la siguiente salida:
Se prueba que los coeficientes de estas

hipótesis sean igual a cero
Es menor que 0,05 según

nuestra regla de decisión.
El valor experimental para la prueba F es de 345,54 aprox. Esto debemos compararlo con el
F teórico es de 3,59. El valor experimental es mayor que el valor teórico, por lo tanto,
rechazamos la hipótesis de no significancia conjunta concluyendo que los parámetros
estimados en su conjunto son significativos o que nuestro modelo es significativo
globalmente.
e) Calcular e interpretar el coeficiente determinación del modelo.
𝑆𝐶𝐸
𝑅2 = 1 −
𝑆𝐶𝑇
Fuente: formulario profesora Leidy García y Rodrigo Herrera, econometría.
Source Model: SCE
Source Residual: SCR
Source Total: SCT
Entonces reemplazando según la formula y los valores entregados en la salida del STATA
tenemos que:
𝑆𝐶𝐸 𝑆𝐸 𝑆𝐶𝑅 𝑆𝑅 0.00038917
𝑅2 = 𝑆𝐶𝑇 = 𝑆𝑇 = 1 − 𝑆𝐶𝑇 = 1 − 𝑆𝑇 = 1 − 0.037164111 = 1 − 0.01047 =0,9895
El 98,95% de las variaciones en el número de personas empleadas es explicado por el ajuste

mínimo cuadrático sobre el número de personas empleadas, número de personas en las
fuerzas armadas y el PIB real.

Yáñez G G D

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Yáñez G G D

Cargado por

Copyright:

Formatos disponibles

Universidad de Talca

Facultad de Economía y Negocios

18 de Mayo de 2020, Talca.

Considere el siguiente modelo de regresión lineal, donde 𝑦 es la variable dependiente, 𝑥 es

Demuestre que 𝛽̃ es estimador lineal e insesgado de 𝛽; calcule su varianza y demuestre que

i) Demuestre que 𝛽̃ es estimador lineal e insesgado de 𝛽;

La sumatoria de ∑𝑛𝑖=1 𝑦𝑖 nos muestra el siguiente resultado en el modelo de regresión lineal

Por lo que en general queda la siguiente expresión simplificando lo anteriormente propuesto

A continuación, es necesario resolver la esperanza del estimador para ver si 𝛽̃ es un

Varianza de 𝛽̂ realizada por MCO:

*fuente: Gujarati pág. 95-96.

Se define un estimador lineal alterno de 𝛽2 de la siguiente forma:

𝔼(𝛽2∗ ) = ∑𝑤𝑖 𝔼(𝑌𝑖 )

Por consiguiente, para que (𝛽2∗ ) sea insesgado se requiere que:

Var (𝛽2∗ ) = Var ∑𝑤𝑖 𝑌𝑖

= ∑ 𝑤𝑖2 𝑉𝑎𝑟 𝑌𝑖 [𝑁𝑜𝑡𝑎: 𝑉𝑎𝑟 𝑌𝑖 = 𝑉𝑎𝑟 𝑢𝑖 = 𝜎 2 ]

= 𝜎 2 ∑ 𝑤𝑖2 [𝑁𝑜𝑡𝑎: 𝐶𝑜𝑣(𝑌𝑖 , 𝑌𝑗 ) = 0 (𝑖 ≠ 𝑗)]

Var (𝛽2∗ ) = Var (𝛽̂2 )

Expresado en palabras, con ponderaciones 𝑤𝑖 = 𝑘𝑖 , que son ponderaciones de mínimos

se sabe que el cálculo de la varianza de beta es

Se debe continuar resolviendo con matrices

= 𝔼[(𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇 ((𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇)′ ]

= 𝔼[(𝑋 ′ 𝑋)−1 𝑋 ′ 𝜇 𝜇′ 𝑋(𝑋 ′ 𝑋)′−1 ]

Si tomamos en cuenta que:

El resultado final es:

Var (𝛽̂𝑠 ) = 𝜎 2 (𝑋 ′ 𝑠 𝑋𝑠 )−1

Para calcular la variabilidad de los estimadores resolvemos lo siguiente:

Por lo tanto, tenemos que el estimador de mínima varianza es el siguiente:

Para ello obtuvo los siguientes datos de 12 hogares de la cuidad de Talca.

𝐼 ̅ = 50; 𝐸̅ = 7; ∑ 𝐸𝑖2 = 622; ∑ 𝐼𝑖2 = 30.650; ∑ 𝐼𝑖 𝐸𝑖 = 4.325

a) Estime los coeficientes del modelo

𝛽̂0 = 𝐼 ̅ − 𝛽̂1 𝐸̅ = 50 − (3,6765 × 7) = 24,2645

c) Realice una descomposición de la varianza del modelo

𝑆𝐸 = (𝛽̂1 )2 (∑ 𝐸 2 − 𝑛(𝐸̅ )2 ) = (3,6765)2 × (622 − (12 × (72 )) = 459,5662

es la suma de cuadrados 650 = 459,5662 + 𝑆𝑅

d) Analice la capacidad explicativa del modelo

e) Estime la varianza de los residuos

f) Demuestre si se cumple o no la Hipótesis planteada por la economista. Recuerde

La desviación estándar del parámetro:

√𝑉𝑎𝑟(𝛽̂ ) = 𝑆𝛽̂1 = 𝜎̂𝛽1 = 𝑒𝑒(𝛽1 ) = √0,5601 = 0,7484

𝛽̂1 − 𝛽1 𝛽̂1 3,6765

𝑡𝑡𝑐𝑜 = 𝑡𝑛−𝑘 ∝ = 𝑡10 0,05 = 𝑡(10; 0,95) = 1,8125

Aplicando la regla de decisión:

|𝑡𝑒𝑥𝑝 | > |𝑡𝑡𝑐𝑜 |

|4,9125| > |1,8125|

Punto 3. Para la base de datos asignada debes:

a) Realice un análisis de estadística descriptiva (media, desviación estándar, rango,

▪ 𝑌 = Número de personas empleadas

a) Realice un análisis de estadística descriptiva (media, desviación estándar, rango,

Variable Obs Mean Std. Dev. Min Max

y 15 64968.07 3335.82 60171 69564

1) Número de personas empleadas (𝑌): En promedio tenemos que el número de personas

En primera instancia tenemos el siguiente modelo lineal múltiple:

En el cual se consideraron las variables de número de personas empleadas (𝑌), deflactor

✓ Y observado que las variables no significativas (𝑋 1 y 𝑋 2 ), según el modelo,

✓ Con esta nueva variable, plantearemos un nuevo modelo y concluiremos cuan

✓ Aplicamos el comando “reg” en Stata y tenemos la siguiente salida:

En suma, al tener aún una variable estadísticamente no significativa PIB real 𝑋6 y sí es

Primero tenemos el modelo Logarítmico, su función es:

ln𝑦 = 𝛽0 + 𝛽3 𝑙𝑛𝑥3 + 𝛽4 𝑙𝑛𝑥4 + 𝛽5 𝑙𝑛𝑥5 + 𝛽6 𝑙𝑛𝑥6 + 𝜇

✓ Las variables para considerar en este modelo fueron:

Aplicamos el comando “reg” en Stata y tenemos la siguiente salida: