Está en la página 1de 37

Tema 2: El modelo lineal básico:

Hipótesis y propiedades

Josep Navarro
jm.navarro@ucv.es
Gujarati Capı́tulos 3 y 4
Econometrı́a el modelo Lineal Ezequiel Uriel 1990 Capı́tulo 4

UCV

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
1 / 37
Inferencia en la Regresión Lineal Múltiple

El problema de la inferencia estadı́stica en la regresión consiste en


introducir, tomando como base un conjunto de observaciones, las
caracterı́sticas de la distribución de probabilidad que las ha generado.
Retomando la ecuación lineal de regresión ya estudiada en clase:

Yi = β + β2 X2i + . . . + βk Xki + ui , i = 1, 2, ..., N


Donde el regresando Yi es una función lineal de k regresores y de la
perturbación aleatoria ui , que es una variable no observable. La
perturbación aleatoria recoge la incertidumbre de la relación y se puede
considerar como una variable aleatoria que toma unos valores con unas
determinadas probabilidades.

El regresando, por tanto, tiene unas variaciones de carácter aleatorio que


están determinadas por la naturaleza de la perturbación aleatoria.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
2 / 37
Inferencia en la Regresión Lineal Múltiple

Como estudiamos en el Tema 0, no es habitual disponer de los datos de


toda la población de individuos estudiados. Por lo tanto, para estimar los
parámetros poblacionales, necesitaremos una muestra aleatoria de la
población para poder calcular los parámetros muestrales a partir de esta
muestra de la población. Por lo tanto, se presume que las observaciones
sobre el regresando son el resultado de extracciones aleatorias e
independientes de las distribuciones de probabilidad de las respectivas
variables aleatorias. Por lo tanto, el vector de observaciones sobre el
regresando es una variable aleatoria con una distribución de probabilidad
multivariante.

Las hipótesis estadı́sticas acerca de la población nos permitirán establecer


las propiedades estadı́sticas de los estimadores, obtenidos mediante la
aplicación del método de estimación de los mı́nimos cuadrados.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
3 / 37
Hipótesis estadı́sticas del modelo lineal básico

En los temas anteriores el interés ha estado centrado en la estimación de


los coeficientes de una relación estocástica lineal. Pero, para que un
modelo econométrico este totalmente especificado debemos establecer un
conjunto de hipótesis en torno a los elementos que figuran en ella.

De este modo, se le denominará Modelo lineal Básico a todo aquel modelo


económico que pueda ser representado mediante una relación lineal junto
con las hipótesis que se expondrán a continuación.

A las hipótesis que se establecen como punto de partida en el modelo


lineal básico se las denomina hipótesis básicas. Estas hipótesis son muy
sencillas, facilitándose con ellas el proceso de inferencia. Como
contrapartida a la sencillez, las hipótesis básicas tienen un carácter muy
restrictivo, por lo que en muchos casos será necesario introducir
modificaciones, sustituyendo algunas hipótesis por otras más plausibles, de
acuerdo con la naturaleza de los datos
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
4 / 37
Inferencia en la Regresión Lineal Múltiple
A grandes rasgos, se pueden clasificar las hipótesis en cuatro grupos:
1. Hipótesis sobre la forma funcional.

2. Hipótesis sobre la perturbación aleatoria.


a) La perturbación aleatoria ui es una variable aleatoria no observable.
b) La esperanza matemática de la perturbación aleatoria ui es cero.
c) Las perturbaciones aleatorias son homoscedásticas.
d) Las perturbaciones aleatorias con distintos subı́ndices son
independientes entre sı́.

3. Hipótesis sobre los regresores.


a) La matriz de regresores, X, es una matriz fija.
b) La matriz de regresores tiene rango k
c) Los regresores no contienen errores de observación o de medida.

4. Hipótesis sobre el vector de parámetros β.


Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
5 / 37
1. Hipótesis sobre la forma funcional

La relación entre el regresando, los regresores y la perturbación aleatoria es


lineal y puede representarse mediante la la ecuación:

Y = X β + ui
El regresando y los regresores pueden ser cualquier función de la variable
endógena o de las variables predeterminadas, respectivamente, siempre que
entre regresando y regresores se mantenga una relación lineal, es decir, el
modelo sea lineal en los parámetros. El carácter aditivo de la perturbación
aleatoria garantiza su relación lineal con el resto de los elementos.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
6 / 37
2. Hipótesis sobre la perturbación aleatoria
a) La perturbacoión aleatoria ui es una variable aleatoria no observable

Puesto que la perturbación aleatoria recoge un conjunto de variables que


tienen un efecto individual irrelevante sobre el regresando, pero cuyo
efecto conjunto no es despreciable, además de contener una parte debida
exclusivamente al azar, es razonable suponer que la perturbación tiene un
comportamiento aleatorio y tratarla, por tanto, como una variable
aleatoria, que toma diferentes valores con una determinada probabilidad.

Esta hipótesis no es contrastable empı́ricamente, puesto que, si bien los


residuos mı́nimo-cuadráticos ûi , que se pueden considerar estimaciones de
ui , sı́ son observables, las verdaderas perturbaciones aleatorias ui no son
observables en ningún caso.

Como consecuencia, el regresando es también una variable aleatoria,


puesto que es una combinación lineal de la variable aleatoria.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
7 / 37
2. Hipótesis sobre la perturbación aleatoria
b) La esperanza matemática de la perturbación aleatoria ui es cero.

E (ui ) = 0 i = 1, 2, ..., N
Se adopta aquı́ el supuesto de que los efectos individuales de las variables
incluidas en el término de perturbación tienden a compensarse por término
medio. En cualquier caso, aun suponiendo que los efectos individuales no
se compensasen exactamente y, por tanto, su valor esperado fuese distinto
de cero, dicho valor podrı́a ser acumulado en el término constante del
modelo de regresión, con lo cual se podrı́a mantener esta hipótesis sin
ningún problema.

Por esta razón, si el modelo tiene término constante, es imposible desligar


a posteriori la parte estrictamente correspondiente al coeficiente
independiente del modelo, de la parte proveniente de la media de la
perturbación aleatoria del modelo. Ası́ pues, esta serı́a una hipótesis no
contrastable empı́ricamente.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
8 / 37
2. Hipótesis sobre la perturbación aleatoria
c) Las perturbaciones aleatorias son homoscedásticas

E (ui2 ) = σ 2 i = 1, 2, ..., N
Esta hipótesis indica que todas las perturbaciones aleatorias tienen la
misma varianza. Es decir, la varianza de la perturbación aleatoria del
modelo es constante y, por tanto, independiente del tiempo o de los
valores de las variables predeterminadas.
Dicha hipótesis es contrastable empı́ricamente mediante diversos
contrastes estadı́sticos basados en los residuos mı́nimo-cuadráticos.
Asimismo, en determinadas situaciones, esta hipótesis resulta poco
plausible, sobre todo cuando se trabaja con datos de corte transversal, es
decir, con observaciones sobre diferentes unidades muestrales referidas a
un mismo momento del tiempo.
Si no se cumple esta hipótesis, se dice que las perturbaciones son
heteroscedásticas.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
9 / 37
2. Hipótesis sobre la perturbación aleatoria
d) Las perturbaciones aleatorias con distinto subı́ndices son independientes entre sı́.

E (ui us ) = 0∀i 6= s
Es decir, las perturbaciones correspondientes a distintos momentos del
tiempo o distintas unidades muestrales que tengan una ordenación no
están correlacionadas entre sı́.

Este supuesto, al igual que el anterior, es contrastable a posteriori. La


transgresión del mismo se produce con bastante frecuencia en los modelos
en los que se utilizan datos de series temporales, es decir, observaciones
realizadas a intervalos regulares de tiempo.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
10 / 37
2. Hipótesis sobre la perturbación aleatoria
e) El vector de perturbaciones aleatorias u tiene una distribución normal multivariante.

Utilizando la notación matricial, la hipótesis 2.b. se puede expresar como:

E (u) = 0
Análogamente, las hipótesis de homoscedasticidad y no autocorrelación se
pueden expresar conjuntamente como:

E (u12 )
 
E (u1 u2 ) . . . E (u1 uN )
 E (u2 u1 ) E (u22 ) . . . E (u2 uN ) 
E (uu 0 ) =  =
 
.. .. . . ..
 . . . . 
2)
E (uN u1 ) E (uN u2 ) . . . E (uN
 2 
σ 0 ... 0
 0 σ2 . . . 0 
2
..  = σ I
 
 .. .. . .
 . . . . 
0 0 . . . σ2
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
11 / 37
2. Hipótesis sobre la perturbación aleatoria
e) El vector de perturbaciones aleatorias u tiene una distribución normal multivariante.

Es decir, la matriz varianzas-covarianzas se las perturbaciones aleatorias


del modelo es una matriz escalar.

En forma sintética, el conjunto de hipótesis básicas sobre las


perturbaciones aleatorias del modelo de regresión lineal múltiple se puede
expresar ası́:

u ∼ N(0, σ 2 I )
Es decir, el vector de perturbaciones del modelo tiene una distribución
normal multivariante de media cero y matriz de varianzas-covarianzas
escalar.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
12 / 37
3. Hipótesis sobre los regresores
a) La matriz de regresores, X, es una matriz fija

Según esta hipótesis, los distintos regresores del modelo toman los mismos
valores para distintas muestras del regresando.

Éste es un supuesto fuerte en el caso de las ciencias sociales, en el que es


poco viable experimentar. Los datos se obtienen por observación, y no por
experimentación. Para que dicho supuesto se cumpliera, los regresores
deberı́an ser susceptibles de ser controlados por parte del investigador/a.

Es importante señalar que, dentro del alcance de este curso, los resultados
que se obtienen utilizando este supuesto se mantendrı́an prácticamente
idénticos si supusiéramos que los regresores son estocásticos, siempre que
introdujéramos el supuesto adicional de independencia entre los regresores
y la perturbación aleatoria.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
13 / 37
3. Hipótesis sobre los regresores
b) La matriz de regresores tiene rango k

ρ(X ) = k
Puesto que, tal como se formuló el modelo de regresión, la matriz de
regresores contiene k columnas, correspondientes a los k regresores del
modelo, y N filas, correspondientes al número de unidades muestrales
sobre las que se realizan las observaciones. Esta hipótesis tiene dos
implicaciones:

1. El número de observaciones, N, ha de ser igual o mayor que el


numero de regresores, k.
2. Todas las columnas de la matriz de regresores deben ser linealmente
independientes, lo cual implica que no puede existir una relación lineal
exacta entre ningún subconjunto de regresores.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
14 / 37
3. Hipótesis sobre los regresores
b) La matriz de regresores tiene rango k

En caso contrario, el rango de la matriz X serı́a menor que k, y , por


tanto, la matriz X 0 X serı́a singular (carecerı́a de inversa), con lo cual no
podrı́amos determinar los valores del vector de estimadores de los
parámetros del modelo.

En este último caso se dice que existe multicolinealidad perfecta.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
15 / 37
3. Hipótesis sobre los regresores
c) Los regresores no contienen errores de observación o de medida

Ésta es una hipótesis que raramente se cumple en la práctica, ya que los


instrumentos de medición en la Economı́a son escasamente fiables.

Aunque es difı́cil encontrar instrumentos para contrastar esta hipótesis, la


naturaleza del problema y, sobre todo, la procedencia de los datos
utilizados pueden ofrecer evidencia favorable o desfavorable a la hipótesis
anunciada.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
16 / 37
4. Hipótesis sobre el vector de parámetros β
β es un vector fijo

Según esta hipótesis, los distintos parámetros toman el mismo valor para
diversas muestras de los regresores.

Esta es una hipótesis de gran utilidad, ya que, en caso de no cumplirse


aparecerı́an graves complicaciones.

Sin embargo, aunque esta hipótesis es muy conveniente, es difı́cil de


admitir en los modelos que intentan reflejar el comportamiento humano,
debido a que las reacciones de diferentes agentes económicos frente a
determinados estı́mulos pueden cambiar a lo largo del tiempo.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
17 / 37
Distribución del regresando y del vector de estimadores

El regresando, Y , tiene una distribución normal multivariante con vector


de medias X β, y con una matriz de varianzas-covarianzas σ 2 I , escalar,

Y ∼ N(X β, σ 2 )
En efecto, el regresando es una función lineal del vector de perturbaciones
aleatorias que, por la hipótesis 3.e.(u ∼ N(0, σ 2 I )) , sigue una distribución
normal. Por lo tanto, Y seguirá también una distribución normal.
Teniendo en cuenta las hipótesis 1 (Y = X β + ui ) y 2.d. (E (ui ) = 0), la
esperanza matemática de la distribución del regresando viene dada por:

E (Y ) = E [X β + u] =
= X β + E (u) = X β

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
18 / 37
Distribución del regresando y del vector de estimadores

Análogamente, teniendo en cuenta las hipótesis 1(Y = X β + ui ), 3.c.


(E (ui2 ) = σ 2 , i = 1, 2, ..., N) y 3.d.(E (ui us ) = 0, i 6= s), la matriz de
varianzas-covarianzas será:
var (Y ) = E [(Y − X β)(Y − X β)0 ] =
= E [uu 0 ] = σ 2 I

El vector de estimadores, β̂, tiene una distribución normal multivariante


con vector de medias β y matriz de varianzas-covarianzas σ 2 [X 0 X ]−1
h −1 i
β̂ ∼ N β, σ 2 X 0 X


En efecto, el vector β̂ es una combinación lineal del vector Y . Puesto que


dicho vector tiene una distribución normal multivariante, de acuerdo con
Y ∼ N(X β, σ 2 ), β̂ tiene también una distribución normal multivariante.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
19 / 37
Distribución del regresando y del vector de estimadores

Teniendo en cuenta que β̂ = (X 0 X )−1 X 0 Y , la hipótesis 1 Y = X β + u y la


hipótesis 2.b. E (u) = 0 podemos demostrar que β̂ es un estimador
insesgado de β

β̂ = [X 0 X ]−1 X 0 Y =
= [X 0 X ]−1 X 0 [X β + u] =
= β + [X 0 X ]−1 X 0 u
Si aplicamos el operador esperanza a la expresión anterior, teniendo en
cuenta que β es un vector fijo y X es una matrix fija y aplicando el
supuesto 2.b:
−1 0
E (β̂) = β + X 0 X

X E (u) = β

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
20 / 37
Distribución del regresando y del vector de estimadores

La matriz de varianzas-covarianzas del vector de estimadores


mı́nimo-cuadráticos viene dada por:
h ih i0 h ih i0
E β̂ − E (β̂) β̂ − E (β̂) = E β̂ − β β̂ − β
h −1 0 ih −1 0 i0
= E β + X 0X X u − β β + X 0X
 
X u−β
h −1 0 i h 0 −1 0 i0
= E X 0X Xu XX Xu
h −1 0 i h 0  0 −1 i
= E X 0X X u uX X X
h −1 0 0  0 −1 i
= E X 0X X uu X X X
−1 0 −1
= X 0X X E (uu 0 )X X 0 X
 

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
21 / 37
Distribución del regresando y del vector de estimadores

Usando las hipótesis de homoskedasticidad y no autocorrelación 2.c y 2.d


tendremos que E (uu 0 ) = σ 2 I . Por lo tanto, la matriz de
varianzas-covarianzas del vector de estimadores será:
−1 0  2   0 −1
= X 0X

X σ I X XX
−1 0  0 −1
= σ2 X 0X

XX XX
−1
= σ2 X 0X


De esta deducción se desprende que la varianza de β̂i vendrá dada por


σ 2 ν ii , donde ν ii es el elemento ii-ésimo de [X 0 X ]−1
Análogamente, la covarianza entre β̂i y β̂j será σ 2 ν ij , siendo ν ij el
elemento ij-ésimo de [X 0 X ]−1

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
22 / 37
Propiedades probabilı́sticas de los estimadores
Las propiedades enunciadas y demostradas a continuación son propiedades
que se deducen conjuntamente de la aplicación del método de estimación
de los mı́nimos-cuadrados y de las hipótesis estadı́sticas que hemos
establecido.

Los estimadores mı́nimo-cuadráticos, en presencia de las hipótesis


estadı́sticas presentadas son lineales, insesgados y óptimos:
a) El vector de estimadores, β̂, es lineal en el vector Y :

β̂ = AY
donde A es una matriz fija.
En efecto, teniendo en cuenta la ecuación de regresión vista en el
Tema 1: −1 0
β̂ = X 0 X

X Y = AY
Puesto que X es una matriz de regresores fijos, según la hipótesis 3.a.
también será fija la matriz A = [X 0 X ]−1 X 0
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
23 / 37
Propiedades probabilı́sticas de los estimadores

b) El vector de estimadores, β̂, es insesgado:


h i
E β̂ = β

c) Dentro de la clase de estimadores lineales insesgados, β̂ tiene mı́nima


varianza, es decir, β̂ es un estimador óptimo, de acuerdo con el
teorema de Gauss-Markow.
Se puede demostrar que la varianza de cualquier combinación lineal
de estimadores mı́nimo-cuadráticos es menor o igual que la varianza
de la misma combinación lineal de estimadores arbitrarios
pertenecientes a la classe de los estimadores lineales insesgados.
h i
E (β̂ − β)(β̂ − β)0 ≤ E (β ∗ − β)(β ∗ − β)0
 

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
24 / 37
Estimación de la varianza de las perturbaciones

Al igual que el vector de coeficientes, β, del modelo de regresión, la


varianza de las perturbaciones, σ 2 , es un parámetro desconocido. En
ambos casos es necesario estimarlos.

Ası́ como la estimación de los coeficientes de regresión se realiza a partir


de las observaciones muestrales sobre el regresando y los regresores,
cuando se desea estimar la varianza de las perturbaciones se pueden
utilizar los residuos mı́nimo-cuadráticos obtenidos mediante la aplicación
del método de mı́nimos cuadrados.

Puesto que las perturbaciones aleatorias son variables no observables, los


residuos mı́nimos-cuadráticos constituyen, bajo las hipótesis básicas,
aproximaciones adecuadas de las perturbaciones y, por tanto, pueden ser
útiles para la obtención de un estimador insesgado de la varianza de las
perturbaciones.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
25 / 37
Estimación de la varianza de las perturbaciones
Desarrollando la expresión û = Y − Ŷ es posible obtener el vector de
residuos como una combinación lineal del regresando:

û = Y − X β̂ =
= hY − X [X 0 X ]−1 X 0 Y
i =
= I − X [X 0 X ]−1 X 0 Y =
= MY
Una expresión alternativa del vector de residuos, en función de las
perturbaciones aleatorias, seria la siguiente:
û = Y − X β̂ =
= X β + u − X [X 0 X ]−1 X 0 Y =
= hX β + u − X [X 0 X ]i−1 X 0 X β − X [X 0 X ]−1 X 0 u =
= I − X [X 0 X ]−1 X 0 u =
= Mu
Siendo M una matriz idempotente y, por tanto, semidefinida positiva.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
26 / 37
Estimación de la varianza de las perturbaciones

A partir de la anterior ecuación se puede obtener la distribución de û. Ası́,


û seguirá una distribución normal, por ser una combinación lineal de u,
que se distribuye normalmente de acuerdo con el supuesto 2.e. Además,

E [û] = E [Mu] = ME [u] = 0

var [û] = E û û 0 = E Muu 0 M = ME uu 0 M =


     

Mσ 2 IM = σ 2 M
Con lo que se tiene que
û ∼ N(0, σ 2 M)

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
27 / 37
Estimación de la varianza de las perturbaciones
Puesto que el objetivo es la obtención de un estimador insesgado de la
varianza de las perturbaciones, podemos partir de la suma de los
cuadrados de los residuos, que, teniendo en cuenta la expresión û = Mu,
será la siguiente función de las perturbaciones:
û 0 û = u 0 M 0 Mu = u 0 Mu
Veamos ahora como se debe construir, a partir de la anterior expresión, un
estimador de σ 2 que sea insesgado.

Aplicando el operador esperanza en la anterior expresión obtenemos:


E [û 0 û] = E [u 0 Mu] =
= trE [u 0 Mu] =
= E [tr (u 0 Mu)] = E [trMu 0 u] =
(1)
= trME [u 0 u] = trMσ 2 I =
= σ 2 trM =
= σ 2 (N − k)
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
28 / 37
Estimación de la varianza de las perturbaciones

En la deducción anterior se han utilizado las siguientes propiedades del


operador traza, tr, que es la suma de los elementos de la diagonal principal
de una matriz:
a) La traza de un escalar es el mismo escalar
b) tr (AB) = tr (BA).
La aplicación de esta última propiedad ha permitido establecer que:
h i
trM = tr IN×N − X [X 0 X ]−1 X 0 =
= tr IN×N − tr [X 0 X ]−1 X 0 X =
= tr IN×N − tr Ik×k =
=N −k

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
29 / 37
Estimación de la varianza de las perturbaciones

De la ecuación (1) se deduce que:

E [û 0 û]
σ2 = (2)
N −k
Teniendo en cuenta que E [û 0 û] es un estimador insesgado de u 0 u,
podemos obtener un estimador insesgado de la varianza de las
perturbaciones mediante la siguiente expresión:

û 0 û
σ̂ 2 = (3)
N −k
De las ecuaciones (2) y (3) se sigue que un estimador insesgado de
varianzas y covarianzas de β̂ será:
−1 û 0 û  0 −1
ˆ (β̂) = σ̂β̂2 = σ̂ 2 X 0 X

var = XX
N −k

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
30 / 37
Coeficientes de determinación

Una vez ajustado el modelo de regresión lineal múltiple, interesa disponer


de una medida de la bondad del ajuste del hiperplano de regresión
determinado por los estimadores mı́nimo-cuadráticos.

Deducimos a continuación la expresión del coeficiente de determinación


que constituye una medida adecuada de la bondad del ajuste lineal.

Partiendo de que la varianza muestral de la variable endógena Y se puede


expresar en función de los valores ajustados del regresando y de los
residuos mı́nimo-cuadráticos de la forma siguiente:
P Ph i2
(Yi − Ȳ ) = (Ŷi − ûi ) − Ȳ =
Ph i
= (Ŷi − Ȳ )2 + 2(Ŷi − Ȳ )ûi + ûi2 =
= (Ŷi − Ȳ )2 + ûi2
P P

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
31 / 37
Coeficientes de determinación
Si multiplicamos por 1/N el primer miembro de la expresión anterior, se
obtiene la varianza muestral del regresando. Esta varianza muestral se
descompone en dos sumandos:
1. La varianza ”explicada” por la regresión.
2. La suma de los cuadrados de los residuos mı́nimo-cuadráticos, es
decir, la proporción de la varianza del regresando no explicada por la
regresión, a la que se le denomina la varianza residual.
Se puede definir el coeficiente de determinación, R 2 , como el cociente
entre la variable explicada por la regresión y la varianza total.
Analı́ticamente,
(Ŷ − Ȳ )2
P
2
R =P (4)
(Yi − Ȳ )2
Dividiendo por (Yi − Ȳ )2 y operando se obtiene una expresión
P
alternativa: P 2
2 (û)
R =1− P
(Yi − Ȳ )2
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
32 / 37
Coeficientes de determinación
Desarrollando y expresando en notación matricial el numerador y el
denominador de la ecuación (4) obtenemos:

(Ŷ − Ȳ )2 = Ŷi2 − 2Ȳ Ŷi + N Ȳ 2 =


P P P

= Ŷi − 2N Ȳ + N Ȳ 2 =
P 2

= Ŷi2 + N Ȳ 2 =
P

= β̂ 0 X 0 X β − N Ȳ 2 =
= β̂ 0 X 0 Y − N Ȳ 2
El denominador de la ecuación (4) será:
X X
(Ŷi − Ȳi )2 = Yi2 + N Ȳ 2 = Y 0 Y − N Ȳ 2

Por lo que podemos reescribir la R 2 en forma matricial como:

β̂ 0 X 0 Y − N Ȳ 2
R2 =
Y 0 Y − N Ȳ 2
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
33 / 37
Coeficientes de determinación

El coeficiente de determinación múltiple varı́a entre 0 y 1. El valor 0 lo


toma cuando la varianza ”explicada” es nula; por el contrario, el
coeficiente R 2 toma el valor 1 cuando es nula la varianza residual.

Una limitación del R 2 es que puede incrementarse artificialmente


introduciendo regresores adicionales, aunque éstos no sean apropiados. Ası́,
como caso extremo, tenemos que, cuando k = N, se consigue un
coeficiente de determinación igual a la unidad, siempre que no exista una
relación lineal exacta entre los regresores. Para comprobarlo tenemos que:
−1 0
û = YX β̂ = Y − X 0 X 0 X

XY

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
34 / 37
Coeficientes de determinación

Ahora bien, si k = N y no existe relación lineal exacta entre los regresores,


se verificará que el rango de X es igual a N, y , en consecuencia, la matriz
X es invertible. Por tanto,
h  −1 i 0
û = Y − X 0 X −1 X 0 X Y =Y −Y =0

y, naturalmente, si todos los residuos son iguales a cero, se deduce de


forma inmediata que R 2 debe ser igual a 1. Este resultado es obvio cuando
consideramos k = N = 2. Dados dos puntos, sólo se puede trazar una
recta que pase por ellos, siendo, en este caso, nulos ambos residuos.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
35 / 37
Coeficientes de determinación corregido
Para evitar el problema de que se incremente artificialmente el R 2 se ha
propuesto el coeficiente de determinación corregida (R̄ 2 ), el cual penaliza
la inclusión de nuevos regresores. A efectos de introducir este coeficiente,
tomemos como referencia el coeficiente de determinación poblacional,
cuya expresión es:

2 var (u)
RPOB =1−
var (Y )
Hemos visto que el estimador insesgado de var (u) es:

û 0 û
σ̂ 2 =
N −k
Mientras que un estimador insesgado de var (Y ) es:

(Yi − Ȳ )2
P

N −1
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos
Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
36 / 37
Coeficientes de determinación corregido

Si sustituimos los estimadores insesgados de la varianza de u e Y en la


función poblacional obtendremos:

N −1 û 0 û
R̄ 2 = 1 −
N − k (Yi − Ȳ )2
P

Se puede comprobar fácilmente que la relación entre R 2 y R̄ 2 viene dada


por:

N −1
R̄ 2 = 1 − (1 − R 2 )
N −k
De esta expresión se desprende que el coeficiente R̄ 2 penaliza la
introducción de nuevos regresores, ya que, aunque la suma de cuadrados
de los residuos disminuirá, el incremento de k hace que la variación del R̄ 2
pueda tener cualquier signo.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos


Tema 2: 3Ely modelo
4 Econometrı́a
lineal básico:
el modelo
Hipótesis
Linealy Ezequiel
propiedades
Uriel 1990 Capı́tulo 4 (UCV)
37 / 37

También podría gustarte