Documentos de Académico
Documentos de Profesional
Documentos de Cultura
online 2
• Para esto no sólo se debe especificar la forma funcional del modelo, 4. No hay colinealidad perfecta
sino también hacer ciertos supuestos sobre la forma como se genera
𝑌𝑖 . Pero como 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 , no hay manera de hacer alguna
inferencia estadística sobre 𝑌𝑖 , ni tampoco, sobre 𝛽1 y 𝛽2 , sin EFICIENCIA
especificar la forma como se crean o generan 𝑋𝑖 , 𝑢𝑖 . ˆ)
MIN→ var(
5. Homoscedasticidad j
[1] Linealidad en los parámetros [2] Valores fijos de X o valores de X independientes del
término de error y muestreo aleatorio
La relación entre el regresando, regresor y perturbación aleatoria es lineal
en los parámetros Los valores que toma la regresora X pueden considerarse fijos en muestras repetidas, o
Lineal No lineal haber sido muestreados de manera aleatoria o estocástica junto con la variable
dependiente Y.
ln 𝑌 = 𝛽1 + 𝛽2 ln(𝑋) + 𝑢 𝑌 = 𝛽1 + ln(𝛽2 )𝑋 + 𝑢
2
Y= 𝛽1 + 𝛽2 𝑋 + 𝑢
Cunado se cumple el supuesto de media condicionada cero el modelo de regresión 𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1 𝑏𝑒𝑑𝑟𝑜𝑜𝑚𝑠 + 𝛽2 𝑎𝑟𝑒𝑎 + 𝛽4 𝑙𝑎𝑛𝑑 + 𝛽5 𝑡𝑜𝑡𝑎𝑙 + 𝑢
está especificado correctamente. AREA + LAND = TOTAL
𝐸 𝑤𝑎𝑔𝑒 𝑒𝑑𝑢𝑐 = 𝛽y
1 + 𝛽2 𝑒𝑑𝑢𝑐
y wage
8
12
x1 16
x2
x3 𝐸 𝑦 𝑥 = 𝛽1 + 𝛽2 𝑥 educ
Heteroscedasticidad
Homoscedasticidad x
11 12
Tema 4: Propiedades e Hipótesis básicas. Tema 4: Propiedades e Hipótesis básicas.
4.1. Hipótesis Estadísticas (Básicas) en el MRL. 4.1. Hipótesis Estadísticas (Básicas) en el MRL.
Otras hipótesis asumidas sobre la perturbación aleatoria: Sobre la perturbación aleatoria
Las perturbaciones aleatorias correspondientes a distintas observaciones son Notación Matricial Interpretación
independientes entre sí (no autocorrelación): cov(ui, uj) = E(ui uj )=0 𝑖 ≠ 𝑗 𝐸(𝒖)=0 La perturbación tiene media 0
• Las perturbaciones correspondientes a diferentes individuos o momentos del tiempo no
están correlacionadas entre sí. Var-cov 𝑢 = 𝐸 𝒖𝒖′ = 𝜎 2 𝑰 La varianza de las perturbaciones es
El vector de perturbaciones aleatorias u tiene una distribución normal multivariante. donde I es una matriz de identidad CONSTANTE y NO
AUTOCORRELACIONADA.
• Dado que el conjunto amplio de variables omitidas que suponemos que están detrás nxn
de la perturbación aleatoria son independientes entre sí, por el Teorema Central del
Límite se puede suponer que el vector de perturbaciones aleatorias tiene una
distribución normal multivariante.
• Si u se distribuye normalmente, también lo harán los coeficientes estimados de
regresión. Cov[u,x]=E[X’u]=0 Las explicativas no están relacionadas
con el término de perturbación.
𝑢𝑖 ~𝑁 0, 𝜎 2
13 14
15 16
Tema 4: Propiedades e Hipótesis básicas. Tema 4: Propiedades e Hipótesis básicas.
4.2. Propiedades Probabilísticas de los estimadores MCO. 4.2. Propiedades Probabilísticas de los estimadores MCO.
Constante
Varianza de los estimadores Distribución de la variable Dependiente. Esta variable, como depende de una
variable aleatoria, también es aleatoria con una distribución que se caracteriza a
continuación:
MRLS MRLM Suponemos u~ N(0, 𝜎 2 I). Como y es una función lineal de u → y ~ N
Media:
E(y)=E[Xb+u]=Xb+E(u)=Xb
𝒚~𝑁 𝑿𝜷, 𝜎 2 𝑰
19 20
Tema 4: Propiedades e Hipótesis básicas. Tema 4: Propiedades e Hipótesis básicas.
4.3. Distribución de la variable dependiente y de los estimadores MCO.
4.3. Distribución de la variable dependiente y de los estimadores MCO.
E ˆ =
var − cov ˆ = u2 ( X ' X ) −1 Teniendo en cuenta que: ෝ =𝒚−𝒚
𝒖 − 𝑿𝜷)
ෝ = 𝒖 − (𝑿𝜷
Además, el estimador también depende de la perturbación: − 𝑿𝜷) tiene un valor esperado que es igual a
Como la diferencia entre ellos (𝑿𝜷
cero, uno podría utilizar como estimador de la varianza de las perturbaciones la
= (𝑿′ 𝑿)−1 𝑿′ 𝒚 = (𝑿′𝑿)−1 𝑿′(𝑿𝜷 + 𝒖)
𝜷 expresión:
= 𝜷 + (𝑿′𝑿)−1 𝑿′𝒖
𝜷 u ~ N(0, 𝜎 2 I) û' û
sˆ u2 =
N
Es decir, los estimadores MCO son una función lineal de u y, por tanto, Pero sería un estimador sesgado porque no tiene en cuenta las dos siguientes
se distribuyen como una Normal: condiciones:
ˆ ~ N ( , u2 ( X ' X ) −1 ) uˆ X
i i =0
21 22
4.3. Distribución de la variable dependiente y de los estimadores MCO. 4.3. Distribución de la variable dependiente y de los estimadores MCO.
Distribución de los estimadores MCO: Estimación de la varianza
Distribución de los estimadores MCO: = 𝑿′ 𝑿
Recuerda 𝜷 −𝟏
𝑿𝒚′ de las perturbaciones
Consideremos la suma de cuadrados de los residuos:
Pero: ෝ =𝒚−𝒚
𝒖 ෝ = 𝒖 − 𝑿𝜷 − 𝑿𝜷
− 𝑿𝜷 = 𝒖 + 𝑿𝜷 − 𝑿 𝑿′ 𝑿 −𝟏 𝑿′ 𝒚
u'u = u' M ' Mu = u' Mu Escalar
ෝ = 𝒖 − 𝑿𝜷
𝒖
Calculamos primero la esperanza matemática de la expresión anterior:
= 𝒖 + 𝑿𝜷 − 𝑿 𝑿′ 𝑿 −𝟏 𝑿′ 𝑿𝜷 + 𝒖
𝐸𝒖ෝ′𝒖
ෝ |𝑋 = 𝐸 𝒖′ 𝑴𝒖|𝑿 = 𝐸 𝒕𝒓(𝒖′ 𝑴𝒖)|𝑿 = 𝐸 𝒕𝒓 𝑴𝒖𝒖′ |𝑿 = 𝒕𝒓(𝑴𝐸 𝒖𝒖′ |𝑿 )
= 𝑰 − 𝑿 𝑿′ 𝑿 −𝟏 𝑿′ 𝒖 = 𝑴𝒖 con 𝑀 = 𝐼 − 𝑋 𝑋 ′ 𝑋 −1 𝑋′
= 𝑡𝑟(𝑴𝜎𝒖𝟐 𝑰) = 𝜎𝒖𝟐 𝑡𝑟(𝑴) = 𝜎𝒖𝟐 (𝑁 − 𝑘)
tr(ABCD) = tr(BCDA) =
′ −1 ′ tr(CDAB) = tr(DABC)
Sabiendo que 𝑡𝑟(𝑴) = 𝑡𝑟(𝑰𝑁𝑥𝑁 − 𝑿 𝑿 𝑿 𝑿)
Y que el residuo tiene un valor esperado cero: E[uˆ ] = E[ Mu ] = ME [u ] = 0 = 𝑡𝑟(𝑰𝑁𝑥𝑁 ) − 𝑡𝑟(𝑿 𝑿′ 𝑿 −1 𝑿′) = 𝑡𝑟(𝑰𝑁𝑥𝑁 ) − 𝑡𝑟(𝑰𝑘𝑥𝑘 )
Constante
=𝑁−𝑘
4.3. Distribución de la variable dependiente y de los estimadores 4.4. Estimación Máximo-verosímil del modelo lineal simple y
MCO. propiedades de los estimadores.
Distribución de los estimadores MCO:
Sabemos que la perturbación del modelo se distribuye normal:
Aunque no conozcamos el valor de la varianza de la perturbación, ahora ui~ N(0, 𝜎 2 )
ya podemos estimarla y por lo tanto podemos estimar la varianza de los
estimadores: Y disponemos de una muestra con un tamaño N, de modo que tenemos N
var- cov(b̂ ) = s u2 (X' X)-1 variables aleatorias: u1, u2, ..., uN.
Que será un estimador insesgado de la varianza del estimador, ya que La idea es encontrar aquellos valores de los parámetros que hacen máxima la
probabilidad de que la muestra disponible proceda de una población
û' û E[û' û] caracterizada por los llamados parámetros.
E[ŝ b2 ] = E[ (X' X)-1 ] = (X' X)-1 = s u2 (X' X)-1 = s b2
N-k N-k
E[û' û] = s u2 (N - k)
25 26
4.4. Estimación Máximo-verosímil del modelo lineal simple y 4.4. Estimación Máximo-verosímil del modelo lineal simple y
propiedades de los estimadores. (Con dos variables) propiedades de los estimadores. (Con dos variables)
𝑦𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 + 𝑢𝑖 𝑦𝑖 = 𝛽1 + 𝛽2 𝑥𝑖 + 𝑢𝑖
ui~ N(0, 𝜎 2 )
Para obtener la función de probabilidad conjunta P(u) se realiza el productorio
La función de probabilidad conjunta puede expresarse como el producto de las
de las distribuciones individuales de cada perturbación aleatoria:
probabilidades individuales de cada perturbación aleatoria ui, dado que las
𝑁 1
perturbaciones aleatorias son independientes unas de otras (hipótesis de no 1 − ⋅ σ ui 2
ෑ P(ui ) = P (u) = ⋅ e 2 σ2 u
autocorrelación): 𝑖=1
(2 𝜋𝜎𝑢2 )N/2
P (u1, u 2 , u3,..., u N ) = P (u1 )× P (u 2 )× P (u 3 )×... × P (u N )
- La perturbación aleatoria en el modelo de regresión simple puede escribirse en
u´s independientes
función de las variables yi y xi:
Dado que la perturbación sigue una distribución Normal, su función de u i = y i - (β1 + β 2 x i )
probabilidad, P(ui), estará definida por la expresión:
Así, llegamos a la función de verosimilitud, que es la probabilidad que
1
1 − ⋅ u2 queremos maximizar:
P (ui ) = ⋅e 2 σ2 u
2 𝜋 𝜎𝑢2 1
1 − ⋅ σ(yi −β1 −β2 ⋅xi )2
𝐿 = P (u|X,𝜎𝑢 ) = ⋅ e 2 σ2 u
(2 𝜋 𝜎𝑢2 )N/2
27 28
Tema 4: Propiedades e Hipótesis básicas. Tema 4: Propiedades e Hipótesis básicas.
4.4. Estimación Máximo-verosímil del modelo lineal simple y 4.4. Estimación Máximo-verosímil del modelo lineal simple y
propiedades de los estimadores. propiedades de los estimadores.
A continuación linealizamos la función de verosimilitud, cogiendo logaritmos: d ln L
× å x i (yi - b1 - b2 × x i ) = 0 ® å x i y i = b̂1 å xi + b̂2 × å x 2i = 0
2
=+
N N 1 d b2 2 s 2u
ln L = − ln 2 − ln σ 2u − (y i − β 1 − β 2 x i ) 2
2 2 2σ u
2
Para resolver el problema de optimización, obtenemos las condiciones de Que coincide con la Segunda ecuación normal de la recta
primer orden, derivando la función respecto de los parámetros, 1 , 2 y, σ 2 e de regresión. Por lo tanto: ~
igualando a 0. β 2MV = β̂ 2MCO
29 varianza cuasivarianza 30
4.4. Estimación Máximo-verosímil del modelo lineal simple y 4.4. Estimación Máximo-verosímil del modelo lineal simple y
propiedades de los estimadores. propiedades de los estimadores.
e´e N −2 2
Y será sesgada E[~
σ 2 u MV ] = E[ ]= σ
N N Si consideramos N1 < N2 < N3 < … < NN.
A veces, no será posible obtener un estimador sin sesgo. En ese caso, el requisito
mínimo que se debe pedir a un estimador es la consistencia, que nos permitirá Distribuciones normales con igual promedio y diferentes desviaciones típicas.
realizar inferencia. NN
La CONSISTENCIA es una propiedad asintótica de los estimadores, se cumple
cuando el tamaño de la muestra tiende a infinito. Un estimador, β es consistente si:
N3
lim prob β̂ K −β K e = 1 ( )
lim prob β̂ K = β K
N → N2
N →
Por el contrario, el estimador de MV de σ2, no coincide con el de MCO y es sesgado, Variables fijas en la regresión: tienen esta característica (por hipótesis) las
aunque, cuando la muestra se hace grande, el sesgo tiende a cero, es decir, será variables explicativas. Intuitivamente, indica que si repetimos el
asintóticamente insesgado. experimento muestral un número n de veces, las variables continuarían
siendo las mismas. Además. Esta hipótesis les concede una carácter
N −2 2 2σ 2 Pero tiende a σ2 determinista o no estocástico.
E[~
σ 2 u MV ] = σ = σ2 − σ2
N N asintóticamente
Normalidad de los errores: hipótesis que se realiza sobre la distribución
de las perturbaciones con la finalidad de poder realizar constrastes de
hipótesis i conocer las distribuciones de las variables aleatorias de la
33 regresión. 34
Referencias
• Básicas
• Wooldridge, J (2016). Introducción a la econometría. 5
ed. Cengage Learning.
• Greene, W. (1999). Análisis Econométrico (3 edición).
Prentice-Hall. Madrid
• Gujarati, D. y Porter D.C. (2010) Econometría (5ª
Edición). McGraw-Hill.
35
1
Grado en Economía 2022-2023 2
eCONOMETRÍAI Prácticas 6 y 7
Profesor: - Tema 4-
Marko Petrovic
Correo electrónico: marko.petrovic@uv.es
Despacho: 3C01
Ejercicio 1 3
Ejercicio 1 4
Considera el modelo 𝑦𝑖 = 𝛽1 + 𝛽2 𝑥2,𝑖 + 𝛽3 𝑥3,𝑖 + 𝑢𝑖 estimado utilizando 15 El conjunto de datos hprice2_tema2_ej9.gdt contiene información sobre precios de
las viviendas y sus características. La variable price es la mediana de precios de las
observaciones. Se obtienen los siguientes resultados viviendas en un barrio en dólares, variable crime son delitos cometidos per cápita y
variable rooms es la media de las habitaciones de las vivienda.
2.0 35 .
. −10 −30 .
( X ' X ) −1 = 35
.10
. 65
. ,( X ' y) = 2.2 , u' u = 10.96 Considera el modelo: 𝑝𝑟𝑖𝑐𝑒𝑖 = 𝛽1 + 𝛽2 𝑐𝑟𝑖𝑚𝑒𝑖 + 𝛽3 𝑟𝑜𝑜𝑚𝑠𝑖 + 𝑢𝑖
−10 . 4.3
. 65 0.6
a) Muestre gráficamente la distribución de cada variable. ¿Hay observaciónes que
a) Estime la varianza de las perturbaciones
podamos considerar atípicos?
b) Estime la matriz de varianza-covarianza de los estimadores e indique la
b) Estime el modelo e interprete los coeficientes estimados.
estimación de la varianza de 𝛽መ2 y de la desviación típica de 𝛽መ3 . c) Analiza los residuos y verifique si se mantiene el supuesto de la distribución
(normalidad, media, varianza).
i. Guarda los residuos
ii. Guarda los valores estimados
iii. Haga un gráfico de dispersión entre 𝑝𝑟𝑖𝑐𝑒 y 𝑝𝑟𝑖𝑐𝑒
iv. Haga un gráfico de dispersión entre 𝑢ො y 𝑝𝑟𝑖𝑐𝑒
v. Calcule los residuos estandarizados 𝑢𝑆𝐷
y 𝑝𝑟𝑖𝑐𝑒
vi. Haga un gráfico de dispersión entre 𝑢𝑆𝐷
vii. Interpreta los resultados
¿Se puede mejorar la estimación?
Ejercicio 3 continuación… 7
d) Propone una nueva forma funcional del modelo que puede mejorar la estimación.
f) Determine cuál de los dos modelos estimados es el que mejor ajusta a los datos