Tema 1

Tema 1: El modelo de regresión lineal clásico (MRLC)
Hipótesis
Estimación de los parámetros
Propiedades de los estimadores
Análisis de la bondad del ajuste
El modelo clásico sin ordenada en el origen
1.1.- EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE Y LAS HIPÓTESIS DEL MODELO.
1.1.1.- El modelo de regresión lineal.

En el modelo de regresión lineal múltiple, el regresando o variable endógena, es una función lineal de k
regresores y una perturbación aleatoria, además puede incluir un término independiente. La expresión
matemática del modelo poblacional de regresión lineal viene dada por:
𝑦𝑦t = β0 + β1 𝑥𝑥1t + β2 𝑥𝑥2t + ⋯ . . +βk 𝑥𝑥kt + ε𝑡𝑡 t = 1,2, … … , T
que incluye:
• variables observables (el regresando también llamada variable observada o variable endógena Y, k
variables explicativas también llamados regresores X1, X2, …., Xk y un suele incluir un regresor ficticio
X0).
• parámetro fijos y desconocidos (β0, β1,…., βk también llamados coeficientes de regresión).
• la perturbación aleatoria que le da carácter estocástico a la expresión.
Podemos escribir la ecuación del modelo para cada una de las observaciones de la siguiente manera:
𝑦𝑦 = β0 + β1 x11 + β2 x21 + ⋯ . . +βk xk1 + ε1
⎧ 1
⎪ 2 = β0 + β1 x12 + β2 x22 + ⋯ . . +βk xk2 + ε2
𝑦𝑦
⋮
⎨ ⋮
⎪
𝑦𝑦
⎩ T = β0 + β x
1 1T + β2 2T + ⋯ . . +βk xkT + ε 𝑇𝑇
x
También podemos expresar el modelo de forma matricial:
𝑌𝑌 = 𝑋𝑋𝑋𝑋 + 𝜀𝜀
Donde: 𝑌𝑌𝑇𝑇×1 = 𝑋𝑋𝑇𝑇×(𝑘𝑘+1) 𝛽𝛽(𝑘𝑘+1)×1 + 𝜀𝜀𝑇𝑇×1
𝑦𝑦1 1 𝑥𝑥11 𝑥𝑥21 … 𝑥𝑥𝑘𝑘1 𝜀𝜀1
𝛽𝛽0
𝑦𝑦 𝑥𝑥12 𝑥𝑥22 … 𝑥𝑥𝑘𝑘2 ⎞ 𝜀𝜀
⎛ ⎞ ⎛1
2
𝛽𝛽 ⎛ 2⎞
⎜ ⋮ ⎟ = ⎜⋮ ⋮ ⋮ ⋮ ⋮ ⎟ � 1� + ⎜ ⋮ ⎟
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋮
𝑦𝑦 𝑥𝑥1𝑇𝑇 𝑥𝑥2𝑇𝑇 … 𝑥𝑥𝑘𝑘𝑘𝑘 ⎠ 𝛽𝛽
⎝𝜀𝜀𝑇𝑇 ⎠
1 𝑘𝑘
⎝ ⎠ ⎝
𝑇𝑇
Combinado ambas nomenclaturas vemos que 𝑦𝑦𝑡𝑡 = 𝑋𝑋´𝑡𝑡 𝛽𝛽 + 𝜀𝜀𝑡𝑡
Grado en Economía. Econometría I. Tema 1 -1-

1.1.2.- Hipótesis del modelo.
Antes de estudiar las propiedades estadísticas de los estimadores de MCO en el modelo de regresión lineal
múltiple, necesitamos formular un conjunto de supuestos estadísticos. Específicamente, al conjunto de
supuestos que vamos a formular se les denomina supuestos del modelo de regresión lineal clásico (MRLC). Es
importante destacar que los supuestos estadísticos o hipótesis del MRLC son muy simples, y que los
estimadores MCO tienen, bajo estos supuestos, muy buenas propiedades.
 Hipótesis sobre la forma del modelo:

• El modelo está correctamente especificado y la relación entre la variable endógena y las variables
explicativas es lineal.
 Hipótesis sobre los regresores:
• El modelo incluye todas las variables explicativas relevantes.
• Los regresores son no estocásticos, es decir, son constantes y no existen relaciones lineales exactas
entre ellos (ausencia de multicolinealidad perfecta).
• El modelo tiene suficientes grados de libertad, es decir, el número de observaciones es mayor que el
número de parámetros que se desea estimar. Matemáticamente: T > k+1.
 Hipótesis sobre los parámetros:
• Los parámetros 𝛽𝛽0 , 𝛽𝛽1 , … . , 𝛽𝛽𝑘𝑘 son constantes, al menos dentro de la muestra que se está
considerando.
 Hipótesis sobre la perturbación aleatoria:
• Esperanza nula: 𝐸𝐸(𝜀𝜀𝑡𝑡 ) = 0 𝑡𝑡 = 1, 2, … . . , 𝑇𝑇
• Homocedasticidad: 𝑉𝑉(𝜀𝜀𝑡𝑡 ) = 𝐸𝐸(𝜀𝜀𝑡𝑡 − 𝐸𝐸𝐸𝐸𝑡𝑡 )2 = 𝐸𝐸 (𝜀𝜀𝑡𝑡 2 ) = 𝜎𝜎 2 𝑡𝑡 = 1, 2, … . . , 𝑇𝑇
• No autocorrelación: 𝐶𝐶𝐶𝐶𝐶𝐶(𝜀𝜀𝑡𝑡 , 𝜀𝜀𝑠𝑠 ) = 𝐸𝐸�(𝜀𝜀𝑡𝑡 − 𝐸𝐸𝐸𝐸𝑡𝑡 )(𝜀𝜀𝑠𝑠 − 𝐸𝐸𝐸𝐸𝑠𝑠 )� = 𝐸𝐸(𝜀𝜀𝑡𝑡 · 𝜀𝜀𝑠𝑠 ) = 0 𝑡𝑡 ≠ 𝑠𝑠
En resumen, en el MRLC se establecen las siguientes hipótesis: no existe error de especificación ni de medida,
el término de perturbación aleatoria es un ruido blanco, los regresores no son variables aleatorias y entre
ellos no existen relaciones lineales exactas y el tamaño de la muestra es mayor que el número de parámetros,
cuyos valores son desconocidos, pero se mantienen constantes.
Las hipótesis se pueden escribir matricialmente así:

 La ecuación Y = Xβ + ε es correcta y la matriz X y el vector Y no contienen errores de especificación ni de
medida.
 X es una matriz no estocástica y tiene rango pleno, rg (X) = k+1 < T.
 El vector β es constante.
 El vector aleatorio ε tiene esperanzas nula 𝐸𝐸(𝜀𝜀) = 0 y matriz de varianzas y covarianzas 𝑉𝑉(𝜀𝜀) = 𝜎𝜎 2 𝐼𝐼

En resumen, en lenguaje matricial, en el MRLC se establecen las siguientes hipótesis: no hay errores de
especificación ni de medida, el vector ε es aleatorio y tienen vector de esperanzas nulo 𝐸𝐸(𝜀𝜀) = 0 y matriz
de varianzas y covarianzas escalar 𝑉𝑉(𝜀𝜀) = 𝜎𝜎 2 𝐼𝐼, la matriz X es no estocástica y tiene rango pleno, y por último
β es un vector de elementos constantes.
Al establecer las hipótesis se deriva que el regresando en el MRLC es una variable aleatoria y sus
características dependerán solo de las características de la perturbación, que por hipótesis es un ruido
blando. Es decir:
𝑦𝑦𝑡𝑡 → 𝑣𝑣. 𝑎𝑎. 𝑡𝑡 = 1, 2, … . . , 𝑇𝑇
𝐸𝐸(𝑦𝑦t ) = β0 + β1 x1t + β2 x2t + ⋯ . . +βk xkt
𝑉𝑉(𝑦𝑦t ) = E (𝑦𝑦t − 𝐸𝐸𝑦𝑦𝑡𝑡 )2 = 𝐸𝐸( 𝑦𝑦𝑡𝑡 − β0 − β1 x1t − β2 x2t − ⋯ . . −βk xkt )2 = 𝐸𝐸(𝜀𝜀𝑡𝑡2 ) = 𝜎𝜎 2 ∀𝑡𝑡
𝑐𝑐𝑐𝑐𝑐𝑐(𝑦𝑦t , 𝑦𝑦𝑠𝑠 ) = E[ (𝑦𝑦t − 𝐸𝐸𝑦𝑦𝑡𝑡 )(𝑦𝑦s − 𝐸𝐸𝑦𝑦𝑠𝑠 )] = 𝐸𝐸(𝜀𝜀𝑡𝑡 ∙ 𝜀𝜀𝑠𝑠 ) = 0 ∀𝑡𝑡 ≠ 𝑠𝑠
Expresión matricial: 𝐸𝐸(𝑌𝑌) = 𝐸𝐸( 𝑋𝑋𝑋𝑋 + 𝜀𝜀) = 𝑋𝑋𝑋𝑋

𝑉𝑉(𝑌𝑌) = 𝐸𝐸[(𝑌𝑌 − 𝐸𝐸(𝑌𝑌))(𝑌𝑌 − 𝐸𝐸(𝑌𝑌))´ ] = 𝐸𝐸(𝜀𝜀𝜀𝜀´) = 𝑉𝑉(𝜀𝜀) = 𝜎𝜎 2 𝐼𝐼
1.2.- OBTENCIÓN DE ESTIMACIONES POR MÍNIMOS CUADRADOS ORDINARIOS (MCO).

Un estimador es una función de las observaciones muestrales que permite obtener valores numéricos que
se consideran representativos de un parámetro. A los valores numéricos que se obtienen al sustituir en el
estimador una muestra concreta se le denomina estimación. Si tuviéramos infinitas muestras distintas
obtendríamos infinitas estimaciones distintas, aunque usáramos el mismo estimador. Pero, en la práctica,
solo tenemos una muestra, por tanto, solo tenemos una estimación; una sola de los infinitos valores que
puede tomar el estimador.
2.2.1.- Estimadores MCO de los parámetros β.

La idea básica de la regresión consiste en obtener las mejores estimaciones b0, b1,…,bk posibles de los
parámetros 𝛽𝛽0 , 𝛽𝛽1 , … . , 𝛽𝛽𝑘𝑘 a partir de una muestra.
Partiendo del modelo:
𝑦𝑦t = β0 + β1 x1t + β2 x2t + ⋯ . . +βk xkt + ε𝑡𝑡 t = 1,2, … … , T
El objetivo es estimar los parámetros y obtener:

y� t = b0 + b1 x1t + b2 x2t + ⋯ . . +bk xkt t = 1,2, … … , T
Si denominamos errores a la diferencia entre los valores observados y estimados del regresando:
𝑒𝑒𝑡𝑡 = 𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 𝑡𝑡 = 1, … … , 𝑇𝑇
El método de estimación MCO trata de obtener los estimadores de tal forma que se minimice la suma de los
cuadrados de los errores. De esta forma cuanto más pequeño sea el error mejor será la estimación.
𝑇𝑇 𝑇𝑇 𝑇𝑇
𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑒𝑒𝑡𝑡2 = �(𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 )2 = �(𝑦𝑦t − b0 − b1 x1t − b2 x2t − ⋯ . . −bk xkt )2

𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1
𝑇𝑇
𝑆𝑆𝑆𝑆𝐸𝐸 = � 𝑒𝑒𝑡𝑡2 = 𝑒𝑒´𝑒𝑒

𝑡𝑡=1
El vector que minimiza la SCE y, por tanto, el vector de los parámetros estimados por MCO es:
𝑏𝑏0
𝑏𝑏
⎛ 1⎞
𝑏𝑏
⎜ 2 ⎟ = 𝑏𝑏 = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌
⎜⋮⎟
⋮
⎝𝑏𝑏𝑘𝑘 ⎠
Donde:
∑ 𝑥𝑥1𝑡𝑡 ∑ 𝑥𝑥2𝑡𝑡 … … . . … ∑ 𝑥𝑥𝑘𝑘𝑘𝑘 ∑ 𝑦𝑦𝑡𝑡

𝑇𝑇
2 ∑ 𝑥𝑥1𝑡𝑡 𝑦𝑦𝑡𝑡
⎛ ⋮ ∑ 𝑥𝑥1𝑡𝑡 ∑ 𝑥𝑥1𝑡𝑡 𝑥𝑥2𝑡𝑡 ∑ 𝑥𝑥1𝑡𝑡 𝑥𝑥𝑘𝑘𝑘𝑘 ⎞ ⎛ ⎞
𝑋𝑋´𝑋𝑋 = ⎜ ⋮ 2
∑ 𝑥𝑥2𝑡𝑡 ∑ 𝑥𝑥2𝑡𝑡 𝑥𝑥𝑘𝑘𝑘𝑘 ⎟ 𝑋𝑋´𝑌𝑌 = ⎜ ⎟
⎜ ⋮ ⎟
⋮
2 ⋮
⎝ ⋮ ⋮ ∑ 𝑥𝑥𝑘𝑘𝑘𝑘 ⎠ ⎝∑ 𝑥𝑥𝑘𝑘𝑘𝑘 𝑦𝑦𝑡𝑡 ⎠
1.2.2.- Interpretación de los estimadores MCO de los parámetros β.

• b0 es la estimación de la ordenada en el origen, indica el valor estimado que toma la variable
explicada o regresando cuando todas las variables explicativas se anulan. No suele proporcionar
desde el punto de vista económico información relevante, porque lo más frecuente es que algunas
de las variables explicativas no pueden anularse.
• bi para i=1, 2, …,k es la estimación de los coeficientes angulares, indica la variación estimada que se
produce en el regresando ante una variación unitaria en la i-ésima variable explicativa, suponiendo
que todas las demás permanecen constantes. Es muy importante en la interpretación de los
coeficientes angulares tener en cuenta la cláusula céteris paribus.
1.2.3.- Implicaciones algebraicas de la estimación MCO.

De la estimación MCO se deducen dos propiedades del ajuste:
∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡 = 0 ∑𝑇𝑇𝑡𝑡=1 𝑥𝑥𝑖𝑖𝑖𝑖 𝑒𝑒𝑡𝑡 = 0 𝑖𝑖 = 1,2, … . , 𝑘𝑘

De estas dos propiedades se obtienen las siguientes implicaciones o consecuencias de la aplicación del
método MCO al modelo de regresión lineal múltiple:
a) La media muestral de los errores es nula:
∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡
𝑒𝑒̅ = =0
𝑇𝑇
b) Las sumas y las medias muestrales del regresando son iguales a las del regresando estimado:
𝑇𝑇 𝑇𝑇
∑𝑇𝑇𝑡𝑡=1 𝑦𝑦𝑡𝑡 ∑𝑇𝑇𝑡𝑡=1 𝑦𝑦�𝑡𝑡 1 1
𝑦𝑦� − 𝑦𝑦�� = − = �(𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 ) = � 𝑒𝑒𝑡𝑡 = 0
𝑇𝑇 𝑇𝑇 𝑇𝑇 𝑇𝑇
𝑡𝑡=1 𝑡𝑡=1
c) Entre los errores y las variables explicativas no existe correlación muestral:

𝐶𝐶𝐶𝐶𝐶𝐶(𝑥𝑥𝑖𝑖 ; 𝑒𝑒) → 𝑆𝑆𝑥𝑥𝑥𝑥;𝑒𝑒 = 0 → 𝑟𝑟𝑥𝑥𝑥𝑥;𝑒𝑒 = 0 ∀𝑖𝑖 = 1, … . , 𝑘𝑘
�(𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 )(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ ) = �(𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 )𝑒𝑒𝑡𝑡 = � 𝑥𝑥𝑖𝑖𝑖𝑖 𝑒𝑒𝑡𝑡 − 𝑥𝑥̅𝑖𝑖 � 𝑒𝑒𝑡𝑡 = 0
𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1
d) Entre los errores y los valores estimados del regresando no existe correlación muestral:
𝐶𝐶𝐶𝐶𝐶𝐶(𝑦𝑦�; 𝑒𝑒) → 𝑆𝑆𝑦𝑦�;𝑒𝑒 = 0 → 𝑟𝑟𝑦𝑦�;𝑒𝑒 = 0
�(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ ) = �(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)𝑒𝑒𝑡𝑡 = � 𝑦𝑦�𝑡𝑡 𝑒𝑒𝑡𝑡 − 𝑦𝑦�� 𝑒𝑒𝑡𝑡 =

𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1
�(b0 + b1 x1t + b2 x2t + ⋯ . . +bk xkt )𝑒𝑒𝑡𝑡 = b0 � 𝑒𝑒𝑡𝑡 + 𝑏𝑏1 � x1t 𝑒𝑒𝑡𝑡 + ⋯ + 𝑏𝑏𝑘𝑘 � xkt 𝑒𝑒𝑡𝑡 = 0
𝑡𝑡=1 𝑡𝑡=1 𝑖𝑖=1 𝑖𝑖=1
e) El hiperplano de regresión muestral pasa por el centro de gravedad de la nube de puntos:

∑𝑇𝑇𝑡𝑡=1 𝑦𝑦�𝑡𝑡 ∑𝑇𝑇𝑡𝑡=1(b0 + b1 x1t + b2 x2t + ⋯ . . +bk xkt )
𝑦𝑦�� = = =
𝑇𝑇 𝑇𝑇
∑𝑇𝑇𝑡𝑡=1 𝑏𝑏0 + 𝑏𝑏1 ∑𝑇𝑇𝑡𝑡=1 𝑥𝑥1𝑡𝑡 + … . . +𝑏𝑏𝑘𝑘 ∑𝑇𝑇𝑡𝑡=1 𝑥𝑥𝑘𝑘𝑘𝑘
= b0 + b1 x�1 + b2 x� 2 + ⋯ . . +bk x� k
𝑇𝑇
Como 𝑦𝑦�� = 𝑦𝑦� → 𝑦𝑦� = b0 + b1 x�1 + b2 x� 2 + ⋯ . . +bk x� k
Si se efectúa un ajuste distinto al MCO o el modelo no tiene ordenada en el origen no todas estas propiedades
se cumplen.
1.2.4.- Estimador MCO de la varianza de la perturbación aleatoria.

La varianza de la perturbación aleatoria (𝜎𝜎 2 ) es otro parámetro desconocido del modelo que también
necesitamos estimar. Un estimador de la varianza de la perturbación aleatoria podría ser la varianza muestral
de error:
2
∑𝑇𝑇𝑡𝑡=1(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ )2 ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆
𝜎𝜎� = = =
Pero cuando calculamos SCE, de los T datos iniciales se han usado k+1 para obtener las estimaciones de los
parámetros β, de manera que observaciones libres o grados de libertad solo tenemos T-(k+1). Por eso, para
estimar la varianza de la perturbación no se usa la varianza muestral del error si no:

∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆
𝑆𝑆 2 = =
𝑇𝑇 − 𝑘𝑘 − 1 𝑇𝑇 − 𝑘𝑘 − 1
Este estimador es un estimador insesgado de la varianza de la perturbación aleatoria:

𝐸𝐸(𝑆𝑆 2 ) = 𝜎𝜎 2
A la raíz cuadrada, S, se le denomina error estándar de la regresión y es un
estimador insesgado de σ. En los programas informáticos a S se le llama (SE
of regression o D.T. de la regresión)
Para calcular la SCE se pueden utilizar los errores pero el proceso es tedioso, así que resulta más cómodo
utilizar la expresión matricial de la SCE:
𝑇𝑇
𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑒𝑒𝑡𝑡2 = 𝑒𝑒´𝑒𝑒 = �𝑌𝑌 − 𝑌𝑌��´ �𝑌𝑌 − 𝑌𝑌�� = (𝑌𝑌 − 𝑋𝑋𝑋𝑋)´(𝑌𝑌 − 𝑋𝑋𝑋𝑋) =
𝑇𝑇=1
(𝑌𝑌´ − 𝑏𝑏´𝑋𝑋´) (𝑌𝑌 − 𝑋𝑋𝑋𝑋) = 𝑌𝑌´𝑌𝑌 − 𝑌𝑌´𝑋𝑋𝑋𝑋 − 𝑏𝑏´𝑋𝑋´𝑌𝑌 + 𝑏𝑏´𝑋𝑋´𝑋𝑋𝑋𝑋 = 𝑌𝑌´𝑌𝑌 − 2 𝑏𝑏´𝑋𝑋´𝑌𝑌 + 𝑏𝑏´𝑋𝑋´𝑋𝑋𝑋𝑋 =
𝑌𝑌´𝑌𝑌 − 2 𝑏𝑏´𝑋𝑋´𝑌𝑌 + 𝑏𝑏´𝑋𝑋´𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 = 𝑌𝑌´𝑌𝑌 − 2 𝑏𝑏´𝑋𝑋´𝑌𝑌 + 𝑏𝑏´𝑋𝑋´𝑌𝑌 = 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌
1.2.5.- Interpretación de los estimadores MCO en distintos modelos de regresión.
ln 𝑦𝑦t = β0 + β1 ln x1t + β2 ln x2t + ε𝑡𝑡
ln�𝑦𝑦t = 𝑏𝑏0 + 𝑏𝑏1 ln x1t + 𝑏𝑏2 ln 𝑥𝑥2t

∂ 𝑦𝑦�t ∂ 𝑦𝑦�t
∂ ln�𝑦𝑦t 𝑦𝑦t 𝑦𝑦 ∗ 100
𝑏𝑏1 = = = t
𝜕𝜕ln x1t 𝜕𝜕 x1t 𝜕𝜕 x1t
x1t x1t ∗ 100
b0 indica el valor estimado del logaritmo neperiano de la variable y cuando se anulan los logaritmos
neperianos de las variables explicativas, es decir, cuando las variables x1 y x2 toman valores unitarios.
b1 indica, manteniendo constantes la variable x2, el porcentaje de variación estimado de la variable y cuando
se produce un incremento de un 1% en la variable x1
b2 indica, manteniendo constantes la variable x1, el porcentaje de variación estimado de la variable y cuando
se produce un incremento de un 1% en la variable x2
𝑦𝑦t = β0 + β1 ln x1t + β2 ln x2t + ε𝑡𝑡

𝑦𝑦� t = 𝑏𝑏0 + 𝑏𝑏1 ln x1t + 𝑏𝑏2 ln x2t
𝑏𝑏1 = =
𝜕𝜕ln x1t 𝜕𝜕 x1t
x1t
b0 indica el valor estimado de la variable y cuando se anulan los logaritmos neperianos de las variables
explicativas, es decir, cuando las variables x1 y x2 toman valores unitarios.
b1 indica, manteniendo constantes la variable x2, la variación estimada de la variable y cuando se produce un
incremento en la tasa de variación de la variable x1 en una unidad.
ln 𝑦𝑦t = β0 + β1 x1t + β2 x2t + ε𝑡𝑡

�𝑦𝑦t = 𝑏𝑏0 + 𝑏𝑏1 x1t + 𝑏𝑏2 x2t
ln
∂ 𝑦𝑦�t
∂ ln�𝑦𝑦t 𝑦𝑦
𝑏𝑏1 = = t
𝜕𝜕x1t 𝜕𝜕 x1t
b0 indica el valor estimado del logaritmo neperiano de la variable y cuando se anulan las variables
explicativas.
b1 indica, manteniendo constantes la variable x2, la tasa de variación estimada de la variable y, cuando se
produce un incremento unitario en la variable x1.
𝑦𝑦t = β0 + β1 t t + ε𝑡𝑡
𝑦𝑦� t = 𝑏𝑏0 + 𝑏𝑏1 t t
b0 indica el valor estimado de la variable Y cuando se anula la variable explicativa t=0, es decir, en el período
de referencia.
b1 indica la variación estimada de la variable y cuando la variable explicativa experimenta una variación de
una unidad, es decir, cuando transcurre un periodo de tiempo (un año, si los datos son anuales; o un mes, si
son mensuales, etc).
ln 𝑦𝑦t = β0 + β1 t t + ε𝑡𝑡
�𝑦𝑦t = 𝑏𝑏0 + 𝑏𝑏1 t t
ln
∂ 𝑦𝑦�t
∂ ln�𝑦𝑦t 𝑦𝑦
𝑏𝑏1 = = t
𝜕𝜕t t 𝜕𝜕 t t
b0 indica el valor estimado del logaritmo neperiano de la variable y cuando se anula la variable explicativa, es
decir, en el periodo de referencia se estima para la variable y un valor igual a 𝑒𝑒 𝑏𝑏0 .
b1 indica la variación estimada del logaritmo neperiano de la variable y cuando se produce un incremento
unitario en la variable xi, es decir, representa la tasa de variación estimada de la variable y cuando transcurre
un periodo de tiempo (un año, si los datos son anuales; o un mes, si son mensuales, etc).
1.3.- PROPIEDADES DE LOS ESTIMADORES.

Hasta ahora hemos calculados las mejores estimaciones b0, b1,…,bk posibles de los parámetros 𝛽𝛽0 , 𝛽𝛽1 , … . , 𝛽𝛽𝑘𝑘
a partir de una muestra. Los estimadores son variables aleatorias y nosotros solo tenemos una estimación,
la pregunta ahora sería: ¿cómo sabemos si esta estimación es “buena” o “mala”? ¿cómo puedo garantizar

que esa única estimación esté próxima al parámetro que quiero estimar? Para responder a esta pregunta
necesitamos conocer las propiedades deseables de un estimador.
Las propiedades deseables de los estimadores se refieren a la bondad de las estimaciones que se realizan
con él. Solo se puede garantizar una buena estimación, si los valores más probables del estimador se
encuentran cerca del verdadero valor del parámetro. La distancia entre el estimador y el parámetro a estimar
puede medirse mediante lo que se denomina error cuadrático medio (ECM), que se define como el valor
esperado de la diferencia entre el estimador y el verdadero valor del parámetro. 𝑬𝑬𝑬𝑬𝑬𝑬(𝒃𝒃𝒊𝒊 ) = 𝑬𝑬(𝒃𝒃𝒊𝒊 − 𝜷𝜷𝒊𝒊 )𝟐𝟐 =
𝑽𝑽𝑽𝑽𝑽𝑽(𝒃𝒃𝒊𝒊 ) + [𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔𝒔(𝒃𝒃𝒊𝒊 )]𝟐𝟐 . Parece sensato pedirle a un estimador que tenga un ECM pequeño o lo que es lo
mismo que tanto su sesgo como su varianza sean pequeñas.
1.3.1 Propiedades de los estimadores de los parámetros β

Bajo los supuestos del MRLC, los estimadores MCO tienen las mejores propiedades que se pueden tener pues
tienen la menor varianza de entre todos los estimadores lineales e insesgados. Por esta razón se dice que los
estimadores MCO son estimadores lineales insesgados y óptimos (ELIO).
• Lineal: un estimador es lineal si es una función lineal de las observaciones muestrales.

Los estimadores 𝑏𝑏 = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 se pueden expresar como una combinación lineal de los valores
muestrales del regresando ya que (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´ = 𝐶𝐶̌ ´ que es una matriz no estocástica.
Hipótesis necesarias: X es no estocástica
• Insesgado: un estimador es insesgado si por término medio, proporciona una estimación exacta del
parámetro, es decir, si su esperanza matemática coincide con el parámetro.
𝑏𝑏 = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌=(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´(𝑋𝑋𝑋𝑋 + 𝜀𝜀) = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑋𝑋𝑋𝑋 + (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀 = 𝛽𝛽 + (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀
𝐸𝐸(𝑏𝑏) = 𝐸𝐸(𝛽𝛽 + (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀) = 𝐸𝐸(𝛽𝛽) + 𝐸𝐸[(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀] = 𝛽𝛽 + (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝐸𝐸(𝜀𝜀) = 𝛽𝛽
Hipótesis necesarias: X es no estocástica, β es el vector de parámetros
constante, por tanto, la esperanza solo se aplica a la perturbación
que es la única variable aleatoria que tiene E(ε)=0
• Óptimo: un estimador es óptimo si es el que tiene menor varianza entre los de su clase. Entre los
estimadores lineales e insesgados el óptimo es el de varianza mínima.

𝑉𝑉(𝑏𝑏) = 𝐸𝐸[(𝑏𝑏 − 𝐸𝐸𝐸𝐸)(𝑏𝑏 − 𝐸𝐸𝐸𝐸)´] = 𝐸𝐸[(𝑏𝑏 − 𝛽𝛽)(𝑏𝑏 − 𝛽𝛽)´] = 𝐸𝐸[((𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀)((𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀)´ ]
= 𝐸𝐸[(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜀𝜀𝜀𝜀´𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 ] = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝐸𝐸(𝜀𝜀𝜀𝜀´)𝑋𝑋(𝑋𝑋´𝑋𝑋)−1
= (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝜎𝜎 2 𝐼𝐼𝐼𝐼(𝑋𝑋´𝑋𝑋)−1 = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1
Hipótesis necesarias: X es no estocástica y b es insesgado, la matriz
de varianzas y covarianzas de la perturbación es una matriz escalar
𝑉𝑉(𝜀𝜀) = 𝐸𝐸(𝜀𝜀𝜀𝜀´) = 𝜎𝜎 2 𝐼𝐼, es decir se cumplen las hipótesis de
homocedasticidad e incorrelación de la perturbación aleatoria.
Por lo tanto, V(b) es la matriz de varianzas y covarianzas del vector b. En esta matriz, cuadrada y
simétrica, en cada elemento de la diagonal principal aparece la varianza de cada elemento bi
mientras que las covarianzas entre cada par de elementos se encuentran fuera de la diagonal
principal. Específicamente, la varianza de bi es igual a σ2 multiplicada por el elemento
correspondiente de la diagonal principal de la matriz (𝑋𝑋´𝑋𝑋)−1
𝑉𝑉(𝑏𝑏) = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1
𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏0 ) 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏0 , 𝑏𝑏1 ) 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏0 , 𝑏𝑏2 ) ⋯ ⋯ 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏0 , 𝑏𝑏𝑘𝑘 ) 𝑥𝑥 00 𝑥𝑥 01 𝑥𝑥 02 ⋯ ⋯ 𝑥𝑥 0𝑘𝑘
⎛ 𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏1 ) 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏1 , 𝑏𝑏2 ) ⋯ ⋯ 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏1 , 𝑏𝑏𝑘𝑘 )⎞ 𝑥𝑥 11 𝑥𝑥 12 ⋯ ⋯ 𝑥𝑥 1𝑘𝑘 ⎞
⎛
⎜ ⋯ … 𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏2 ) ⋯ ⋯ 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏2 , 𝑏𝑏𝑘𝑘 )⎟ = 𝜎𝜎 2 ⎜ ⋯ … 𝑥𝑥 22 ⋯ ⋯ 𝑥𝑥 2𝑘𝑘 ⎟
⎜ ⋯ ⋯ ⋯ ⎟ ⎜ ⋯ ⋯ ⋯⎟
… ⋯ … ⋯
⎝ 𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏𝑘𝑘 ) ⎠ ⎝ 𝑥𝑥 𝑘𝑘𝑘𝑘 ⎠
Por lo tanto: 𝜎𝜎𝑏𝑏20 = 𝜎𝜎 2 𝑥𝑥 00 𝜎𝜎𝑏𝑏21 = 𝜎𝜎 2 𝑥𝑥 11 …. 𝜎𝜎𝑏𝑏2𝑘𝑘 = 𝜎𝜎 2 𝑥𝑥 𝑘𝑘𝑘𝑘
El teorema de Gauss-Markov demuestra que la varianza de los estimadores MCO es la más pequeña
de todos los estimadores lineales e insesgados de β. (*** ***)
Como V(b) depende del parámetro desconocido σ2 es necesario sustituirlo por su estimador 𝜎𝜎� 2 y
utilizaremos como estimador 𝑆𝑆 2 por ser un estimador insesgado.
� = 𝜎𝜎� 2 (𝑋𝑋´𝑋𝑋)−1 = 𝑆𝑆 2 (𝑋𝑋´𝑋𝑋)−1

𝑉𝑉(𝑏𝑏)
�0 ) 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏
𝑉𝑉𝑎𝑎𝑎𝑎(𝑏𝑏 � �
0 , 𝑏𝑏1 ) 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏0 , 𝑏𝑏2 ) ⋯ ⋯ �
𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏0 , 𝑏𝑏𝑘𝑘 )
⎛ �1 )
𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏 �
𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏1 , 𝑏𝑏2 ) ⋯ ⋯ �
𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏1 , 𝑏𝑏𝑘𝑘 )⎞
⎜ ⋯ … �2 ) ⋯
𝑉𝑉𝑎𝑎𝑎𝑎(𝑏𝑏 � ⎟
⎜ ⋯ 𝐶𝐶𝐶𝐶𝐶𝐶(𝑏𝑏 2 , 𝑏𝑏𝑘𝑘 )⎟ =
⎜ ⋯ ⋯ ⋯ ⎟
… ⋯
⎝ �𝑘𝑘 ) ⎠
𝑉𝑉𝑉𝑉𝑉𝑉(𝑏𝑏

𝑆𝑆𝑏𝑏20 𝑆𝑆𝑏𝑏0 𝑏𝑏1 𝑆𝑆𝑏𝑏0 𝑏𝑏2 ⋯ ⋯ 𝑆𝑆𝑏𝑏0 𝑏𝑏𝑘𝑘
⎛ 𝑆𝑆𝑏𝑏21 𝑆𝑆𝑏𝑏1 𝑏𝑏2 ⋯ ⋯ 𝑆𝑆𝑏𝑏1 𝑏𝑏𝑘𝑘 ⎞
⎜ ⎟
=⎜ ⋯ … 𝑆𝑆𝑏𝑏22 ⋯ ⋯ 𝑆𝑆𝑏𝑏 𝑏𝑏 ⎟
2 𝑘𝑘
⎜ ⋯ ⋯ ⋯ ⎟
… ⋯
⎝ 𝑆𝑆𝑏𝑏2𝑘𝑘 ⎠
Por lo tanto: 𝑆𝑆𝑏𝑏20 = 𝑆𝑆 2 𝑥𝑥 00 𝑆𝑆𝑏𝑏21 = 𝑆𝑆 2 𝑥𝑥11……… 𝑆𝑆𝑏𝑏2𝑘𝑘 = 𝑆𝑆 2 𝑥𝑥 𝑘𝑘𝑘𝑘
Para resumir: como desconocemos las varianzas teóricas de los estimadores 𝑉𝑉(𝑏𝑏) = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1 → 𝜎𝜎𝑏𝑏20 ,
𝜎𝜎𝑏𝑏21 , … … , 𝜎𝜎𝑏𝑏2𝑘𝑘 debemos estimarlas y lo hacemos utilizando un estimador insesgado de 𝜎𝜎 2 que sabemos que
� = 𝑆𝑆 2 (𝑋𝑋´𝑋𝑋)−1 → 𝑆𝑆𝑏𝑏2 , 𝑆𝑆𝑏𝑏2 , … … . , 𝑆𝑆𝑏𝑏2 . Si las varianzas
es 𝑆𝑆 2 . Las varianzas estimadas de los estimadores 𝑉𝑉(𝑏𝑏) 0 1 𝑘𝑘
estimadas de los estimadores son pequeñas estaríamos estimando con precisión.
Para analizar con más facilidad los factores que influyen en la varianza estimada de los estimadores, podemos
utilizar la siguiente expresión:
𝑆𝑆𝑆𝑆𝑆𝑆 𝑆𝑆 2
𝑆𝑆𝑏𝑏2𝑖𝑖 = 𝑖𝑖𝑖𝑖
𝑥𝑥 = (∗∗∗∗) = 2
𝑇𝑇 − 𝑘𝑘 − 1 𝑇𝑇𝑆𝑆𝑖𝑖 (1 − 𝑅𝑅𝑖𝑖2 )
 Cuanto mayor sea S2 mayor es la varianza estimada del estimador. Cuanto más “ruido” exista en
la ecuación es más difícil estimar con precisión el efecto parcial de cualquier regresor sobre Y.
 Cuanto mayor es la muestra menor es la varianza del estimador.

 Cuanto menor es la varianza muestral del regresor i-éximo mayor es la varianza de su estimador.
Por tanto, manteniendo los demás factores iguales, es preferible que la variación muestral de Xi
sea lo más grande posible pues hay muchas líneas hipotéticas que podrían ajustarse a los datos
cuando la varianza muestral es pequeña.

 Cuanto mayor sea 𝑅𝑅𝑖𝑖2 mayor es la varianza estimada del estimador, siendo 𝑅𝑅𝑖𝑖2 el R2 de la regresión
de cada Xi sobre el resto de los regresores. Por tanto, a mayor correlación del regresor i-éximo
con el resto de los regresores empeora la precisión de la estimación.
• Eficiente en términos relativos: el estimador más eficiente en términos relativos es aquel que tiene
menor error cuadrático medio (ECM). Sabemos que el 𝐸𝐸𝐸𝐸𝐸𝐸(𝑏𝑏𝑖𝑖 ) = 𝑉𝑉(𝑏𝑏𝑖𝑖 ) + (𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑏𝑏𝑖𝑖 ))2 , como el
estimador MCO es lineal e insesgado, entonces → 𝐸𝐸𝐸𝐸𝐸𝐸(𝑏𝑏𝑖𝑖 ) = 𝑉𝑉(𝑏𝑏𝑖𝑖 ) y su varianza es mínima, por tanto,
es el estimador más eficiente dentro de los lineales e insesgados.
• Consistente: un estimador es consistente si a medida que aumenta el tamaño muestral el estimador

converge en probabilidad al parámetro, es decir, tiene una probabilidad cada vez más elevada de estar
próximo al parámetro. Para que esto suceda es condición necesaria que al aumentar el número de
observaciones su sesgo y su varianza disminuyan hasta que si el número de observaciones tiende a
infinito su sesgo y su varianza tienden a cero.
𝑏𝑏𝑖𝑖 es un estimador consistente de 𝛽𝛽𝑖𝑖 si: lim 𝑃𝑃[|𝑏𝑏𝑖𝑖 − 𝛽𝛽𝑖𝑖 | < 𝛿𝛿] = 1 → 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑏𝑏𝑖𝑖 = 𝛽𝛽𝑖𝑖
𝑇𝑇→∞
asintoticamente insesgado → 𝑙𝑙𝑙𝑙𝑙𝑙 [𝐸𝐸(𝑏𝑏𝑖𝑖 ) − 𝛽𝛽𝑖𝑖 ] = 0 → 𝑙𝑙𝑙𝑙𝑙𝑙 𝐸𝐸(𝑏𝑏𝑖𝑖 ) = 𝛽𝛽𝑖𝑖 → 𝑙𝑙𝑙𝑙𝑙𝑙 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑏𝑏𝑖𝑖 ) = 0
𝑇𝑇→∞ 𝑇𝑇→∞ 𝑇𝑇→∞
ó� 𝜎𝜎 2 1 𝜎𝜎 2 1
lim 𝑉𝑉(𝑏𝑏) = lim 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1 = lim ( 𝑋𝑋´𝑋𝑋)−1 = lim lim ( 𝑋𝑋´𝑋𝑋)−1 = 0 (∗∗∗)
𝑇𝑇→∞ 𝑇𝑇→∞ 𝑇𝑇→∞ 𝑇𝑇 𝑇𝑇 𝑇𝑇→∞ 𝑇𝑇 𝑇𝑇→∞ 𝑇𝑇
Como consecuencia de la consistencia de b (al aumentar el tamaño de la muestra 𝑏𝑏 → 𝛽𝛽) se puede

demostrar que a medida que aumenta el tamaño de la muestra el error tiende a la perturbación aleatoria
(𝑒𝑒 → 𝜀𝜀); 𝑒𝑒 = 𝑌𝑌 − 𝑌𝑌� = 𝑋𝑋𝑋𝑋 + 𝜀𝜀 − 𝑋𝑋𝑋𝑋 = 𝜀𝜀 − 𝑋𝑋(𝑏𝑏 − 𝛽𝛽)
1.3.2.- Propiedades del estimador de la varianza de la perturbación aleatoria S2.

𝑆𝑆 2 = =
𝑇𝑇 − 𝑘𝑘 − 1 𝑇𝑇 − 𝑘𝑘 − 1
Este estimador es un estimador insesgado de la varianza de la perturbación aleatoria:

𝐸𝐸(𝑆𝑆𝑆𝑆𝑆𝑆) (𝑇𝑇 − 𝑘𝑘 − 1)𝜎𝜎 2
𝐸𝐸(𝑆𝑆 2 ) = = (∗∗∗∗∗) = = 𝜎𝜎 2
𝑇𝑇 − 𝑘𝑘 − 1 𝑇𝑇 − 𝑘𝑘 − 1
Debes recordar que otro posible estimador de la varianza de la perturbación aleatoria (𝜎𝜎 2 ) podría ser la
varianza muestral del error:
∑𝑇𝑇𝑡𝑡=1(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ )2 ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆
𝜎𝜎� 2 = = =
Sin embargo, este estimador es sesgado con sesgo negativo y por tanto subestima a la varianza de la
perturbación aleatoria:

𝑆𝑆𝑆𝑆𝑆𝑆 𝑆𝑆𝑆𝑆𝑆𝑆 (𝑇𝑇 − 𝑘𝑘 − 1) (𝑇𝑇 − 𝑘𝑘 − 1) 2
𝜎𝜎� 2 = = = 𝑆𝑆
𝑇𝑇 𝑇𝑇 (𝑇𝑇 − 𝑘𝑘 − 1) 𝑇𝑇
(𝑇𝑇 − 𝑘𝑘 − 1) (𝑇𝑇 − 𝑘𝑘 − 1) 2
𝐸𝐸(𝜎𝜎� 2 ) = 𝐸𝐸(𝑆𝑆 2 ) = 𝜎𝜎 ≠ 𝜎𝜎 2
𝑇𝑇 𝑇𝑇
(𝑇𝑇 − 𝑘𝑘 − 1) 2 (𝑘𝑘 + 1) 2
𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 (𝜎𝜎� 2 ) = 𝐸𝐸(𝜎𝜎� 2 ) − 𝜎𝜎 2 = 𝜎𝜎 − 𝜎𝜎 2 = − 𝜎𝜎 < 0
𝑇𝑇 𝑇𝑇
Pero, en muestras grandes, este estimador es asintóticamente insegado; por tanto, su sesgo tiende a cero o
su esperanza tiende al verdadero valor del parámetro:
(𝑘𝑘 + 1) 2
𝑙𝑙𝑙𝑙𝑙𝑙 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝜎𝜎� 2 ) = 𝑙𝑙𝑙𝑙𝑙𝑙 − 𝜎𝜎 = 0
𝑇𝑇→∞ 𝑇𝑇→∞ 𝑇𝑇
(𝑇𝑇 − 𝑘𝑘 − 1) 2
𝑙𝑙𝑙𝑙𝑙𝑙 𝐸𝐸(𝜎𝜎� 2 ) = 𝑙𝑙𝑙𝑙𝑙𝑙 𝜎𝜎 = 𝜎𝜎 2
𝑇𝑇→∞ 𝑇𝑇→∞ 𝑇𝑇
Resumen: bajo las hipótesis del MRLC, los estimadores MCO (bi) son estimadores óptimos de los parámetros
βi en el sentido de que son los de varianza mínima entre los lineales e insesgados, además en esta clase de
estimadores son los más eficientes y también son consistentes. S2 es un estimador insesgado de la varianza
de la perturbación σ 2, mientras que 𝜎𝜎� 2 es un estimador sesgado.
1.4.- BONDAD DEL AJUSTE.

Una vez que se ha estimado el modelo por MCO, es conveniente tener alguna medida de la bondad del ajuste.
En el caso de que se hayan estimado varios modelos alternativos, las medidas de la bondad del ajuste podrían
ser utilizadas para seleccionar el modelo más apropiado. En la literatura econométrica existen numerosas
medidas de bondad del ajuste. La más popular es el coeficiente de determinación, que se designa por R2 o R-
cuadrado, y el coeficiente de determinación ajustado, que se designa por 𝑅𝑅� 2o R-cuadrado ajustado. Dado
que estas medidas tienen algunas limitaciones, nos referiremos también al porcentaje de la raíz del error
cuadrático medio (%RECM) y al porcentaje del error estándar (%ES). Existen otras medidas de la bondad del
ajuste como el criterio de información de Akaike (AIC) y al criterio de Schwarz (SC).
1.4.1.- Coeficiente de determinación, R2.

La calidad del ajuste puede valorarse descomponiendo la variación total del regresando de la siguiente forma
(siempre que los estimadores sean los MCO y el modelo tenga ordenada en el origen):
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑆𝑆𝑆𝑆 + 𝑆𝑆𝑆𝑆𝑆𝑆
Donde:
• SCT = Suma de los Cuadrados Totales: desviaciones del regresando respecto de su media muestral,
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1(𝑦𝑦𝑡𝑡 − 𝑦𝑦�)2
• SCR = Suma de Cuadrados de la Regresión: desviaciones del regresando estimado respecto a su media
muestral, 𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)2
• SCE = Suma de Cuadrados de los Errores, 𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1(𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 )2 = ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2
Por lo tanto:
2
�(𝑦𝑦𝑡𝑡 − 𝑦𝑦�) = ��𝑦𝑦�𝑡𝑡 − 𝑦𝑦�� + � 𝑒𝑒𝑡𝑡2
2

𝑇𝑇 2 𝑇𝑇 𝑇𝑇 2
(𝑦𝑦𝑡𝑡 − 𝑦𝑦�) �𝑦𝑦�𝑡𝑡 − 𝑦𝑦�� 𝑒𝑒𝑡𝑡2
� = � +�
𝑆𝑆𝑦𝑦2 = 𝑆𝑆𝑦𝑦2� + 𝑆𝑆𝑒𝑒2

var muestral del regresando = varianza muestral del regresando estimado + varianza muestral de los errores
varianza debida a la regresión
Basándonos en esta ecuación, el coeficiente de determinación se define:

𝑆𝑆𝑆𝑆𝑆𝑆
𝑅𝑅 2 =
O de forma alternativa:
𝑅𝑅 2 = 1 −
 Interpretación: Si calculamos R2*100 nos indica el porcentaje de variabilidad muestral del regresando
que queda explicado con la regresión. Por tanto, cuanto menor es el peso de la SCE en la SCT o cuanto
más similares son los valores de la SCR y SCT mejor será el ajuste.
 Valores: Los valores extremos del coeficiente de determinación son: 0, cuando la varianza explicada
en la regresión es cero y por tanto el ajuste es nulo; y 1, cuando la varianza de los errores es cero y
por tanto el ajuste es perfecto. Un ajuste es bueno cuando el 𝑅𝑅 2es próximo a 1, pero si el 𝑅𝑅 2 tiene
un valor pequeño, probablemente se haya cometido un error en la especificación del modelo o bien
en la forma funcional o bien en la selección de los regresores. En la práctica un ajuste es bueno si
𝑅𝑅 2 > 0.95
Las expresiones matriciales que se utilizan para su cálculo son:

𝑇𝑇
𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑒𝑒𝑡𝑡2 = 𝑒𝑒´𝑒𝑒 = �𝑌𝑌 − 𝑌𝑌��´�𝑌𝑌 − 𝑌𝑌�� = (𝑌𝑌 − 𝑋𝑋𝑋𝑋)´(𝑌𝑌 − 𝑋𝑋𝑋𝑋) = 𝑌𝑌´𝑌𝑌 − 𝑌𝑌´𝑋𝑋𝑋𝑋 − 𝑏𝑏´𝑋𝑋´𝑌𝑌 + 𝑏𝑏´𝑋𝑋´𝑋𝑋𝑋𝑋 =
𝑡𝑡=1
𝑌𝑌´𝑌𝑌 − 2𝑌𝑌´𝑋𝑋𝑋𝑋 + 𝑏𝑏´𝑋𝑋´𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 = 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌

2
𝑆𝑆𝑆𝑆𝑆𝑆 = �(𝑦𝑦𝑡𝑡 − 𝑦𝑦�) = �(𝑦𝑦𝑡𝑡2 + 𝑦𝑦� − 2𝑦𝑦𝑡𝑡 𝑦𝑦�) = � 𝑦𝑦𝑡𝑡2 + 𝑇𝑇𝑦𝑦� 2 − 2𝑇𝑇𝑦𝑦� 2 = 𝑌𝑌´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2
2
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑆𝑆𝑆𝑆 − 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑌𝑌´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2 − ( 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌) = 𝑏𝑏´𝑋𝑋´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2
Para interpretar adecuadamente el R2 se debe tener en cuenta que:

• Cuando se añaden nuevas variables explicativas, aumenta su valor, esto sucede a pesar de que la
variable o variables añadidas sean o no relevantes; ya que si se añade una nueva variable al modelo,
la SCE disminuye, y por tanto el 𝑅𝑅 2 aumenta.
• Si el modelo no tiene término independiente el R2 no tiene una interpretación clara.
• No se puede utilizar para comparar modelos en los que la forma funcional de la variable endógena
sea diferente (es decir, un modelo con 𝑦𝑦𝑡𝑡 frente a otro con 𝑙𝑙𝑙𝑙𝑙𝑙𝑡𝑡 )
• Es adimensional.
1.4.2.- Porcentaje de la raíz del error cuadrático medio, %RECM.
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ∑ 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆

%𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = ∗ 100 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝐸𝐸𝐸𝐸𝐸𝐸 = =
𝑦𝑦� 𝑇𝑇 𝑇𝑇
 Interpretación: indica cual es, por término medio, el porcentaje de error que se comete al estimar
los valores del regresando utilizando el modelo. Por tanto, el ajuste es mejor cuanto menor sea su
valor.
 Valores: el valor más pequeño es cero, cuando SCE es nula y por tanto el ajuste es perfecto, pero
puede tomar cualquier valor. En la práctica se considera que el ajuste es bueno si el %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 es
menor al 5%.
Para interpretar adecuadamente el %RECM se debe tener en cuenta que:
• Cuando se añaden nuevas variables explicativas siempre disminuye su valor, esto sucede a pesar de
que la variable o variables añadidas sean o no relevantes.
• Si el modelo no tiene término independiente se puede interpretar.
• No se puede utilizar para comparar modelos en los que la forma funcional de la variable endógena
sea diferente (es decir, un modelo con 𝑦𝑦𝑡𝑡 frente a otro con 𝑙𝑙𝑙𝑙𝑙𝑙𝑡𝑡 )
• Es adimensional.
Es conveniente para analizar la bondad de ajuste calcular tanto 𝑅𝑅 2 (lo dan los programas informáticos) como
%RECM (no lo dan los programas informáticos) ya que pueden proporcionar información contradictoria, pues
son medidas relativas (cocientes) que no dependen únicamente de la SCE.
 Si SCT es muy muy grande (es decir, si 𝑦𝑦𝑡𝑡 presenta mucha variabilidad) y aunque la SCE sea grande:

𝑆𝑆𝑆𝑆𝑆𝑆 𝑆𝑆𝑆𝑆𝑆𝑆
o el cociente puede ser pequeño, 𝑅𝑅 2 = 1 − puede ser próximo a 1→ buen ajuste.
�
𝑇𝑇
o sin embargo, 𝑦𝑦� no es representativa, %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑦𝑦�
∗ 100 es grande → mal ajuste.
 Si SCT es muy muy pequeño (es decir, si 𝑦𝑦𝑡𝑡 presenta poca variabilidad) y aunque la SCE sea pequeña:
o el cociente puede ser grande, 𝑅𝑅 2 = 1 − puede ser próximo a 0→ mal ajuste.
�
𝑇𝑇
o sin embargo, la 𝑦𝑦� es representativa, %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 𝑦𝑦�
∗ 100 es pequeño→ buen ajuste.
Conclusión:
• Si SCT es muy elevada, ninguna de las medidas es fiable y hay que analizar los errores relativos para
cada observación.
• Si la SCT es pequeña, es más fiable el %RECM pues la media es muy representativa.
1.4.3.- Coeficientes para comparar modelos cuando se introducen variables explicativas adicionales.
Las dos medidas anteriores no son válidas para comparar modelos cuando se introducen variables
explicativas adicionales ya que el 𝑅𝑅 2 aumenta y el %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 disminuye. En este caso debemos utilizar los
siguientes coeficientes:
� 𝟐𝟐 .
 El coeficiente de determinación ajustado, 𝑹𝑹
𝑆𝑆𝑆𝑆𝑆𝑆�
𝑅𝑅� 2 = 1 − 𝑇𝑇 − 𝑘𝑘 − 1 = 1 − 𝑇𝑇 − 1 𝑆𝑆𝑆𝑆𝑆𝑆 = 1 − 𝑇𝑇 − 1 (1 − 𝑅𝑅 2 )
𝑆𝑆𝑆𝑆𝑆𝑆� 𝑇𝑇 − 𝑘𝑘 − 1 𝑆𝑆𝑆𝑆𝑆𝑆 𝑇𝑇 − 𝑘𝑘 − 1
𝑇𝑇 − 1
• Su gran ventaja es que penaliza la inclusión de variables explicativas no relevantes. Si se añade
una nueva variable al modelo, la SCE disminuye o, en el peor de los casos queda igual, (T-k-1)
siempre disminuyen y por tanto el 𝑅𝑅� 2 puede aumentar o disminuir, ello dependerá de si la
variable incluida mejora o no el modelo.
• 𝑅𝑅� 2 tiene como mucho el valor 1 pero no tiene cota inferior, incluso puede tomar valores
negativos, aunque cercanos a cero.
• 𝑅𝑅� 2 < 𝑅𝑅 2
 Porcentaje del error estándar, %ES.
𝐸𝐸𝐸𝐸 𝑆𝑆𝑆𝑆𝑆𝑆
%𝐸𝐸𝐸𝐸 = ∗ 100 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝐸𝐸𝐸𝐸 = �𝑆𝑆 2 = �
𝑦𝑦� 𝑇𝑇 − 𝑘𝑘 − 1
• Su gran ventaja es que penaliza la inclusión de variables explicativas no relevantes, pues el %ES
no siempre disminuye cuando se incluyen nuevos regresores.
• %𝐸𝐸𝐸𝐸 > %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅

1.5.- EL MODELO CLÁSICO SIN ORDENADA EN EL ORIGEN
𝑦𝑦t = β1 x1t + β2 x2t + ⋯ . . +βk xkt + ε𝑡𝑡 t = 1,2, … … , T
La ecuación matricial del modelo es la misma que con la ordenada en el origen

𝑌𝑌 = 𝑋𝑋𝑋𝑋 + 𝜀𝜀, y los vectores de observaciones del regresando (Y) y de perturbaciones (𝜀𝜀) son también los
mismos, sin embargo, la matriz de observaciones de los regresores (X) y el vector de parámetros (β) son
diferentes:
𝑦𝑦1 𝑥𝑥11 𝑥𝑥21 … 𝑥𝑥𝑘𝑘1 𝛽𝛽1 𝜀𝜀1
⎡ 𝑦𝑦2 ⎤ ⎡ 𝑥𝑥12 𝑥𝑥22 𝑥𝑥𝑘𝑘2 ⎤ ⎡𝛽𝛽 ⎤ ⎡ 𝜀𝜀2 ⎤
⎢ 2⎥
𝑦𝑦 = ⎢ ⋮ ⎥ 𝑋𝑋 = ⎢ ⋮ ⋮ … ⋮ ⎥ 𝛽𝛽 = ⎢ ⋮ ⎥ 𝜀𝜀 = ⎢ ⋮ ⎥
⎢⋮⎥ ⎢ ⋮ ⋮ … ⋮ ⎥ ⎢⋮⎥ ⎢⋮⎥
⎣𝑦𝑦𝑇𝑇 ⎦ ⎣𝑥𝑥1𝑇𝑇 𝑥𝑥2𝑇𝑇 … 𝑥𝑥𝑘𝑘𝑘𝑘 ⎦ ⎣𝛽𝛽𝑘𝑘 ⎦ ⎣𝜀𝜀𝑇𝑇 ⎦
𝑇𝑇𝑇𝑇1 𝑇𝑇𝑇𝑇𝑇𝑇 𝑘𝑘𝑘𝑘1 𝑇𝑇𝑇𝑇1

Por ser la matriz X distinta en los modelos con y sin ordenada en el origen, también son diferentes los
productos X´X y X´Y. Como se puede comprobar, la matriz X´X en el modelo sin ordenada en el origen es
cuadrada, simétrica, de orden k y coincide con la que resulta en el modelo con ordenada si se suprime la
primera fila y la primera columna; esta matriz contiene los sumatorios de los productos cruzados de las
variables explicativas. El vector X´Y en el modelo sin ordenada en el origen es un vector columna de orden
kx1, que coincide con el que se obtiene en el modelo con ordenada en el origen si se elimina su primer
elemento; este vector contiene los sumatorios de los productos cruzados del regresando con las variables
explicativas.
⎡ 𝑇𝑇 � 𝑥𝑥1𝑡𝑡 � 𝑥𝑥2𝑡𝑡 � 𝑥𝑥𝑘𝑘𝑘𝑘 ⎤ ⎡ � 𝑦𝑦𝑡𝑡 ⎤

⎢� 𝑥𝑥 … ⎥ ⎢ ⎥
1𝑡𝑡 2
⎢ � 𝑥𝑥1𝑡𝑡 � 𝑥𝑥1𝑡𝑡 𝑥𝑥2𝑡𝑡 … � 𝑥𝑥1𝑡𝑡 𝑥𝑥𝑘𝑘𝑘𝑘 ⎥ ⎢ � 𝑥𝑥1𝑡𝑡 𝑦𝑦𝑡𝑡 ⎥
⎢ … ⎥ ⎢ ⎥
𝑋𝑋´𝑋𝑋 = ⎢� 𝑥𝑥2𝑡𝑡 𝑋𝑋´𝑦𝑦 = ⎢
� 𝑥𝑥2𝑡𝑡 𝑥𝑥1𝑡𝑡 2
� 𝑥𝑥2𝑡𝑡 � 𝑥𝑥2𝑡𝑡 𝑥𝑥𝑘𝑘𝑘𝑘 ⎥ � 𝑥𝑥2𝑡𝑡 𝑦𝑦𝑡𝑡 ⎥
⎢ ⋮ ⎥ ⎢ ⎥
⎢ ⋮ ⋮ ⋮ ⎥ ⎢ ⋮ ⎥
⎢ 2 ⎥ ⎢ ⎥
⎣� 𝑥𝑥𝑘𝑘𝑘𝑘 � 𝑥𝑥𝑘𝑘𝑘𝑘 𝑥𝑥1𝑡𝑡 � 𝑥𝑥𝑘𝑘𝑘𝑘 𝑥𝑥2𝑡𝑡 � 𝑥𝑥𝑘𝑘𝑘𝑘 ⎦ ⎣� 𝑥𝑥𝑘𝑘𝑘𝑘 𝑦𝑦𝑡𝑡 ⎦
𝑘𝑘𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘1
Las expresiones de cálculo de los estadísticos se ven afectadas por el hecho de que el modelo esté formulado
sin ordenada en el origen. Cuando no se incluye ordenada en el origen, alguna de las propiedades del ajuste
del método MCO no se cumplen. Sigue cumpliéndose que 𝑋𝑋´𝑒𝑒 = 0, pero al faltarle a X´ una primera fila de
valores unitarios, de esta igualdad sólo se deduce que: ∑ 𝑇𝑇𝑡𝑡=1 𝑥𝑥𝑖𝑖𝑖𝑖 𝑒𝑒𝑡𝑡 = 0 𝑖𝑖 = 1,2, … . , 𝑘𝑘 (la suma de los
productos de las variables explicativas y los errores vale cero) pero no se deduce que ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡 = 0.
Es decir: 𝑋𝑋´𝑒𝑒 = 𝑋𝑋´�𝑌𝑌 − 𝑌𝑌�� = 𝑋𝑋´(𝑌𝑌 − 𝑋𝑋𝑋𝑋) = 𝑋𝑋´(𝑌𝑌 − 𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌) = 𝑋𝑋´𝑌𝑌 − 𝑋𝑋´𝑌𝑌 = 0

1 1 … 1 𝑒𝑒1 ∑ 𝑒𝑒𝑡𝑡 0
𝑥𝑥11 𝑥𝑥12 … 𝑥𝑥1𝑇𝑇 𝑒𝑒2 ∑ 𝑥𝑥1𝑡𝑡 𝑒𝑒𝑡𝑡 0
� ⋮ ⋮ ⋮ � �⋮�= � �= � �
⋮ ⋮
𝑥𝑥𝑘𝑘1 𝑥𝑥𝑘𝑘2 … 𝑥𝑥𝑘𝑘𝑘𝑘 𝑒𝑒𝑇𝑇 ∑ 𝑥𝑥𝑘𝑘𝑘𝑘 𝑒𝑒𝑡𝑡 0
Al no ser nula la suma de los errores, no se cumplen algunas de las consecuencias o implicaciones de la
estimación MCO. La media muestral de los errores no es nula, las sumas y las medias muestrales del
regresando y del regresando estimado no coinciden, no es nula la covarianza muestral de los regresores y los
errores, no es nula tampoco la covarianza muestral del regresando estimado y los errores; y el hiperplano de
regresión no pasa por el centro de gravedad de la nube de puntos. Sin embargo ∑𝑇𝑇𝑡𝑡=1 𝑦𝑦�𝑡𝑡 𝑒𝑒𝑡𝑡 = 0.
Por otro lado, las propiedades de los estimadores MCO se han demostrado bajo las hipótesis del modelo
clásico tenga ordenada en el origen o no, por tanto, estas propiedades se mantienen. El estimador 𝑏𝑏 =
(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 es ELIO (lineal, insesgado, óptimo), el más eficiente de los ELIO y consistente.
A la hora de calcular el estimador insesgado de la varianza de la perturbación se debe tener en cuenta que
los grados de libertad de este tipo de modelos son T-k porque ahora el número de regresores coincide con el
número de variables explicativas:
𝑆𝑆 2 = → 𝑆𝑆 = �
𝑇𝑇−𝑘𝑘 𝑇𝑇−𝑘𝑘
siendo:
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌 = ∑ 𝑦𝑦𝑡𝑡2 − 𝑏𝑏1 ∑ 𝑥𝑥1𝑡𝑡 𝑦𝑦𝑡𝑡 − 𝑏𝑏2 ∑ 𝑥𝑥2𝑡𝑡 𝑦𝑦𝑡𝑡 − ⋯ − 𝑏𝑏𝑘𝑘 ∑ 𝑥𝑥𝑘𝑘𝑘𝑘 𝑦𝑦𝑡𝑡
Por tanto, son insesgados los estimadores de las varianzas de los estimadores que se obtienen siguiendo la
expresión:
2
𝑆𝑆𝑏𝑏𝑏𝑏 = 𝑆𝑆 2 𝑥𝑥 𝑖𝑖𝑖𝑖 ∀𝑖𝑖 = 1,2, … , 𝑘𝑘
Como hemos visto, en el modelo sin ordenada en el origen la suma de los errores no es nula, y por
consiguiente, no se puede descomponer la varianza como: 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑆𝑆𝑆𝑆 + 𝑆𝑆𝑆𝑆𝑆𝑆.
Por tanto:
𝑅𝑅 2 = 1 − ≠
 Interpretación: al no ser esta medida igual a SCR/SCT, 𝑅𝑅 2 % no puede interpretarse como el porcentaje
de variaciones del regresando explicado por la regresión, ni (1- R2) x100 como el porcentaje de
variaciones no explicadas.
 Valores: puede ser negativo, porque si no se puede descomponer la varianza, puede ser SCE> SCT. Por
tanto, en los modelos sin ordenada en el origen esta medida de bondad del ajuste pierde una de sus
ventajas, sigue siendo 1 el límite superior (ajuste perfecto), pero carece de límite inferior, pudiendo
incluso tomar valores negativos.
Con respecto al porcentaje de la raíz del error cuadrático medio, se define e interpreta igual que en el modelo
con ordenada en el origen.
ESTE TEMA HA SIDO ELEBORADO EN BASE A:

Ramil, M.; Rey, C.; Lodeiro, M. y Arranz, M. (2012). Introducción a la econometría. Teoría y práctica.
Reprografía Noroeste, S.L.
Uriel, E. (2019). Introducción a la econometría. Universidad de Valencia.
Stock, J.H. y Watson M. M. (2012). Introducción a la Econometría. Pearson.

Repaso tema 1. MRLC
Interpretación de los coeficientes estimados.

Modelo Estimación Interpretación
𝑦𝑦t = β0 + β1 x1t + ε𝑡𝑡 𝑦𝑦�t = b0 + b1 x1t ∂ 𝑦𝑦�t si x ↑una unidad,
𝑏𝑏1 =
𝜕𝜕X1t entonces 𝑦𝑦�t se ↑ó ↓en
𝑏𝑏1 unidades
𝑙𝑙𝑙𝑙𝑦𝑦t = β0 + β1 𝑙𝑙𝑙𝑙x1t + ε𝑡𝑡 𝑙𝑙𝑙𝑙𝑦𝑦�t = b0 + b1 𝑙𝑙𝑙𝑙x1t ∂ ln�𝑦𝑦t si x ↑un 1%, entonces 𝑦𝑦�t
𝑏𝑏1 = = ↑ó ↓ un 𝑏𝑏1 %.
𝜕𝜕ln x1t
∗ 100
𝑦𝑦t 𝑦𝑦
= t
𝜕𝜕 x1t 𝜕𝜕 x1t
∗ 100
x1t 𝑥𝑥1t
𝑦𝑦t = β0 + β1 𝑙𝑙𝑙𝑙x1t + ε𝑡𝑡 𝑦𝑦�t = b0 + b1 lnx1t ∂ 𝑦𝑦�t ∂ 𝑦𝑦�t si x ↑ un 1%, entonces 𝑦𝑦�t
𝑏𝑏1 = = 𝑏𝑏
𝜕𝜕ln x1t 𝜕𝜕 x1t ↑ó ↓en � 1�100�
x1t
unidades
𝑙𝑙𝑙𝑙𝑦𝑦t = β0 + β1 x1t + ε𝑡𝑡 𝑙𝑙𝑙𝑙𝑦𝑦�t = b0 + b1 x1t ∂ 𝑦𝑦�t si x ↑una unidad,

∂ ln�𝑦𝑦t 𝑦𝑦 entonces, la tasa de
𝑏𝑏1 = = t
𝜕𝜕x1t 𝜕𝜕 x1t variación de 𝑦𝑦�t ↑ó ↓en
𝑏𝑏1 , es decir, 𝑦𝑦�t ↑ó ↓un
100 ∗ 𝑏𝑏1 %
𝑦𝑦t = β0 + β1 t t + ε𝑡𝑡 𝑦𝑦�t = b0 + b1 t t ∂ 𝑦𝑦�t ∂ 𝑦𝑦�t 𝑏𝑏1 es el crecimiento medio
𝑏𝑏1 = =
𝜕𝜕t t 𝜕𝜕 t t o variación media (anual,
trimestral,..) estimado de y
𝑙𝑙𝑙𝑙𝑙𝑙t = β0 + β1 t t + ε𝑡𝑡 𝑙𝑙𝑙𝑙𝑦𝑦�t = b0 + b1 t t ∂ 𝑦𝑦�t 𝑏𝑏1 es la tasa de crecimiento
�𝑦𝑦t
∂ ln 𝑦𝑦
𝑏𝑏1 = = t medio o tasa de variación
𝜕𝜕t t 𝜕𝜕 t t media (anual, trimestral,..)
estimado de y
Propiedades de los estimadores de los parámetros β (MCO)

Estimadores MCO de los parámetro β 𝒃𝒃 = (𝑿𝑿´𝑿𝑿)−𝟏𝟏 𝑿𝑿´𝒀𝒀
Lineal b es una función lineal de 𝑏𝑏 = (𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 = 𝐶𝐶̌ ´ 𝑌𝑌
las observaciones
muestrales del regresando
Insesgado Por término medio b 𝐸𝐸(𝑏𝑏) = 𝛽𝛽
proporciona una
estimación exacta de β
Optimo Varianza mínima dentro de 𝑉𝑉(𝑏𝑏) = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1
los de su clase, es decir
varianza mínima dentro de 𝜎𝜎𝑏𝑏20 𝜎𝜎𝑏𝑏21 … … 𝜎𝜎𝑏𝑏2𝑘𝑘
los lineales e insesgados
Eficiente (en término Menor error cuadrático 𝐸𝐸𝐸𝐸𝐸𝐸(𝑏𝑏𝑖𝑖 ) = 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑏𝑏𝑖𝑖 )2 + 𝑣𝑣𝑣𝑣𝑣𝑣(𝑏𝑏𝑖𝑖 )
relativo) medio
Consistente En muestras grandes, b plim 𝑏𝑏𝑖𝑖 = 𝛽𝛽𝑖𝑖 ó
𝑇𝑇→∞
proporciona estimaciones
perfectas de β (su sesgo y 𝑙𝑙𝑙𝑙𝑙𝑙 𝐸𝐸(𝑏𝑏𝑖𝑖 ) = 𝛽𝛽𝑖𝑖 → 𝑙𝑙𝑙𝑙𝑙𝑙 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑏𝑏𝑖𝑖 ) = 0
su varianza son cero) 𝑇𝑇→∞ 𝑇𝑇→∞
lim 𝑉𝑉(𝑏𝑏) = 0
𝑇𝑇→∞
bajo las hipótesis del MRLC, los estimadores MCO (bi) son estimadores óptimos de los parámetros βi
en el sentido de que son los de varianza mínima entre los lineales e insesgados, además en esta clase
de estimadores son los más eficientes y también son consistentes.

Propiedades del estimador de la varianza de la perturbación aleatoria 𝝈𝝈𝟐𝟐 .
Estimador MCO 2
𝑆𝑆 = =
𝑇𝑇 − 𝑘𝑘 − 1 𝑇𝑇 − 𝑘𝑘 − 1
Insesgado 𝐸𝐸(𝑆𝑆 2 ) = 𝜎𝜎 2
Por término medio proporciona una estimación exacta de σ2
Estimador MV ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆
𝜎𝜎� 2 = = es la varianza muestral del error
𝑇𝑇 𝑇𝑇
(𝑇𝑇−𝑘𝑘−1) (𝑇𝑇−𝑘𝑘−1) 2
Sesgado 𝐸𝐸(𝜎𝜎� 2 ) = 𝑇𝑇
𝐸𝐸(𝑆𝑆 2 ) = 𝑇𝑇
𝜎𝜎 ≠ 𝜎𝜎 2
(𝑇𝑇 − 𝑘𝑘 − 1) 2 (𝑘𝑘 + 1) 2
𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 (𝜎𝜎� 2 ) = 𝐸𝐸(𝜎𝜎� 2 ) − 𝜎𝜎 2 = 𝜎𝜎 − 𝜎𝜎 2 = − 𝜎𝜎 < 0
𝑇𝑇 𝑇𝑇
Asintóticamente insesgado
Estimador de la varianza de los estimadores de los parámetros:

𝑉𝑉(𝑏𝑏) = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1 → 𝜎𝜎𝑏𝑏2𝑖𝑖 = 𝜎𝜎 2 𝑥𝑥 𝑖𝑖𝑖𝑖
� = 𝑆𝑆 2 (𝑋𝑋´𝑋𝑋)−1 → 𝑆𝑆𝑏𝑏2 = 𝑆𝑆 2 𝑥𝑥 𝑖𝑖𝑖𝑖
𝑉𝑉(𝑏𝑏) 𝑖𝑖
Insesgado Por término medio, las 𝐸𝐸�𝑆𝑆𝑏𝑏2𝑖𝑖 � = 𝜎𝜎𝑏𝑏2𝑖𝑖

varianzas estimadas de los
estimadores proporcionan
estimaciones exactas de las
varianzas de los
estimadores
Como desconocemos las varianzas teóricas de los estimadores 𝑉𝑉(𝑏𝑏) = 𝜎𝜎 2 (𝑋𝑋´𝑋𝑋)−1 → 𝜎𝜎𝑏𝑏20 ,
𝜎𝜎𝑏𝑏21 , … … , 𝜎𝜎𝑏𝑏2𝑘𝑘 debemos estimarlas y lo hacemos utilizando un estimador insesgado de 𝜎𝜎 2
que sabemos que es 𝑆𝑆 2 . Por tanto, las varianzas estimadas de los estimadores son
� = 𝑆𝑆 2 (𝑋𝑋´𝑋𝑋)−1 → 𝑆𝑆𝑏𝑏2 , 𝑆𝑆𝑏𝑏2 , … … . , 𝑆𝑆𝑏𝑏2 .
𝑉𝑉(𝑏𝑏) 0 1 𝑘𝑘
𝑆𝑆𝑏𝑏 𝑏𝑏𝑖𝑖
Las desviaciones típicas estimadas de los estimadores son pequeñas si: 𝑖𝑖
< 0.5 ⇔ >2
𝑏𝑏𝑖𝑖 𝑆𝑆𝑏𝑏
𝑖𝑖
También podemos calcular las varianzas estimadas de los estimadores usando el estimador
de 𝜎𝜎 2 por MV 𝜎𝜎� 2 (lo vemos en el siguiente tema).
Análisis de la bondad del ajuste.

∑𝑇𝑇 �)2
𝑡𝑡=1(𝑦𝑦𝑡𝑡 −𝑦𝑦
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1(𝑦𝑦𝑡𝑡 − 𝑦𝑦�)2 → (T-1) 𝑆𝑆𝑦𝑦2 = varianza muestral del regresando
𝑇𝑇
2 ∑𝑇𝑇 �)2
𝑡𝑡=1(𝑦𝑦𝑡𝑡 −𝑦𝑦
𝑆𝑆𝑦𝑦𝑦𝑦 = 𝑇𝑇−1
cuasivarianza muestral del regresando
2
2 ∑𝑇𝑇 �𝑡𝑡 −𝑦𝑦��
𝑡𝑡=1�𝑦𝑦
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1�𝑦𝑦�𝑡𝑡 − 𝑦𝑦�� → (K) 𝑆𝑆𝑦𝑦2� = varianza muestral del regresando estimado
𝑇𝑇
∑𝑇𝑇 2
𝑡𝑡=1 𝑒𝑒𝑡𝑡
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑇𝑇𝑡𝑡=1(𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 )2 = ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡2 → (T-k-1) 𝑆𝑆𝑒𝑒2 = 𝑇𝑇
varianza muestral del error
∑𝑇𝑇 2
𝑡𝑡=1 𝑒𝑒𝑡𝑡
𝑆𝑆 2 =
𝑇𝑇−𝑘𝑘−1
Siempre que los estimadores sean los MCO y el modelo tenga ordenada en el origen:
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑆𝑆𝑆𝑆 + 𝑆𝑆𝑆𝑆𝑆𝑆

Coeficiente de 𝑆𝑆𝑆𝑆𝑆𝑆 𝑆𝑆𝑆𝑆𝑆𝑆 𝑅𝑅 2 ∈ [0 , 1]
𝑅𝑅 2 = 1 − =
determinación, R2 𝑆𝑆𝑆𝑆𝑆𝑆 𝑆𝑆𝑆𝑆𝑆𝑆
R2*100 indica el porcentaje de
variabilidad muestral del regresando
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌 que queda explicada con la regresión.
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑌𝑌´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑏𝑏´𝑋𝑋´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2 El ajuste es bueno si es > 0.95.
Adimensional.
R2 es un indicador del grado de corrección en la especificación del modelo, si está próximo a cero una parte
importante de las variaciones del regresando quedan sin explicar (existe algún error en la especificación,
bien por la forma funcional del modelo o bien porque la selección de los regresores); si está próximo a la
unidad, no se tiene certeza de que la especificación sea la correcta.
Porcentaje de la raíz del error %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ≥ 0
cuadrático medio, %RECM.
indica, cual es, por término medio, el
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 porcentaje de error que se comete al
%𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = ∗ 100
𝑦𝑦� estimar los valores del regresando
utilizando el modelo.
�𝑆𝑆𝑆𝑆𝑆𝑆
𝑇𝑇
= ∗ 100
𝑦𝑦� El ajuste es bueno si es menor al 5%.
Adimensional.
Siempre debes usar las dos medidas. Pero ¿pueden ser contradictorias? Si la variabilidad del regresando
es o muy grande o muy pequeña, pueden dar resultados contradictorios, entonces debes analizar los
𝑒𝑒 𝑒𝑒
errores, relativos ��𝑦𝑦𝑡𝑡 � < 0.05 ó �𝑦𝑦𝑡𝑡 � ∗ 100 < 5%�.
𝑡𝑡 𝑡𝑡
Comparación de modelos con variables explicativas adicionales (SCE↓, 𝐑𝐑𝟐𝟐 ↑, %𝐑𝐑𝐑𝐑𝐑𝐑𝐑𝐑↓)

Coeficiente de determinación 𝑆𝑆𝑆𝑆𝑆𝑆� 𝑅𝑅� 2 ∈ (−∞ , 1]
�2 𝑇𝑇 − 𝑘𝑘 − 1
ajustado, 𝑅𝑅� 2 𝑅𝑅 = 1 −
𝑆𝑆𝑆𝑆𝑆𝑆�
𝑇𝑇 − 1 𝑅𝑅� 2 < 𝑅𝑅 2
𝑇𝑇 − 1
= 1− (1 − 𝑅𝑅 2 )
𝑇𝑇 − 𝑘𝑘 − 1
Porcentaje del error 𝐸𝐸𝐸𝐸 %𝐸𝐸𝐸𝐸 ≥ 0

%𝐸𝐸𝐸𝐸 = ∗ 100 =
𝑦𝑦�
estándar, %ES
%𝐸𝐸𝐸𝐸 > %𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
� 𝑆𝑆𝑆𝑆𝑆𝑆
𝑇𝑇 − 𝑘𝑘 − 1
∗ 100
𝑦𝑦�
El modelo clásico sin ordenada en el origen

∑𝑇𝑇𝑡𝑡=1 𝑥𝑥𝑖𝑖𝑖𝑖 𝑒𝑒𝑡𝑡 = 0 𝑖𝑖 = 1,2, … . , 𝑘𝑘 ∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡 ≠ 0 𝑦𝑦� ≠ 𝑦𝑦��
𝑆𝑆𝑆𝑆𝑆𝑆 ≠ 𝑆𝑆𝑆𝑆𝑆𝑆 + 𝑆𝑆𝑆𝑆𝑆𝑆. 𝑅𝑅 2 ∈ (−∞ , 1] No se puede interpretar
%𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ≥ 0 Si se puede interpretar

Tema 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 1

Cargado por

Copyright:

Formatos disponibles

Tema 1: El modelo de regresión lineal clásico (MRLC)

1.1.- EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE Y LAS HIPÓTESIS DEL MODELO.

1.1.1.- El modelo de regresión lineal.

También podemos expresar el modelo de forma matricial:

Combinado ambas nomenclaturas vemos que 𝑦𝑦𝑡𝑡 = 𝑋𝑋´𝑡𝑡 𝛽𝛽 + 𝜀𝜀𝑡𝑡

Grado en Economía. Econometría I. Tema 1 -1-

 Hipótesis sobre la forma del modelo:

Las hipótesis se pueden escribir matricialmente así:

Grado en Economía. Econometría I. Tema 1 -2-

Expresión matricial: 𝐸𝐸(𝑌𝑌) = 𝐸𝐸( 𝑋𝑋𝑋𝑋 + 𝜀𝜀) = 𝑋𝑋𝑋𝑋

1.2.- OBTENCIÓN DE ESTIMACIONES POR MÍNIMOS CUADRADOS ORDINARIOS (MCO).

2.2.1.- Estimadores MCO de los parámetros β.

El objetivo es estimar los parámetros y obtener:

𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑒𝑒𝑡𝑡2 = �(𝑦𝑦𝑡𝑡 − 𝑦𝑦�𝑡𝑡 )2 = �(𝑦𝑦t − b0 − b1 x1t − b2 x2t − ⋯ . . −bk xkt )2

𝑆𝑆𝑆𝑆𝐸𝐸 = � 𝑒𝑒𝑡𝑡2 = 𝑒𝑒´𝑒𝑒

∑ 𝑥𝑥1𝑡𝑡 ∑ 𝑥𝑥2𝑡𝑡 … … . . … ∑ 𝑥𝑥𝑘𝑘𝑘𝑘 ∑ 𝑦𝑦𝑡𝑡

1.2.2.- Interpretación de los estimadores MCO de los parámetros β.

1.2.3.- Implicaciones algebraicas de la estimación MCO.

∑𝑇𝑇𝑡𝑡=1 𝑒𝑒𝑡𝑡 = 0 ∑𝑇𝑇𝑡𝑡=1 𝑥𝑥𝑖𝑖𝑖𝑖 𝑒𝑒𝑡𝑡 = 0 𝑖𝑖 = 1,2, … . , 𝑘𝑘

c) Entre los errores y las variables explicativas no existe correlación muestral:

�(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ ) = �(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)𝑒𝑒𝑡𝑡 = � 𝑦𝑦�𝑡𝑡 𝑒𝑒𝑡𝑡 − 𝑦𝑦�� � 𝑒𝑒𝑡𝑡 =

e) El hiperplano de regresión muestral pasa por el centro de gravedad de la nube de puntos:

Como 𝑦𝑦�� = 𝑦𝑦� → 𝑦𝑦� = b0 + b1 x�1 + b2 x� 2 + ⋯ . . +bk x� k

1.2.4.- Estimador MCO de la varianza de la perturbación aleatoria.

Grado en Economía. Econometría I. Tema 1 -5-

Este estimador es un estimador insesgado de la varianza de la perturbación aleatoria:

1.2.5.- Interpretación de los estimadores MCO en distintos modelos de regresión.

ln 𝑦𝑦t = β0 + β1 ln x1t + β2 ln x2t + ε𝑡𝑡

ln�𝑦𝑦t = 𝑏𝑏0 + 𝑏𝑏1 ln x1t + 𝑏𝑏2 ln 𝑥𝑥2t

𝑦𝑦t = β0 + β1 ln x1t + β2 ln x2t + ε𝑡𝑡

ln 𝑦𝑦t = β0 + β1 x1t + β2 x2t + ε𝑡𝑡

1.3.- PROPIEDADES DE LOS ESTIMADORES.

Grado en Economía. Econometría I. Tema 1 -7-

1.3.1 Propiedades de los estimadores de los parámetros β

• Lineal: un estimador es lineal si es una función lineal de las observaciones muestrales.

Grado en Economía. Econometría I. Tema 1 -8-

Por lo tanto: 𝜎𝜎𝑏𝑏20 = 𝜎𝜎 2 𝑥𝑥 00 𝜎𝜎𝑏𝑏21 = 𝜎𝜎 2 𝑥𝑥 11 …. 𝜎𝜎𝑏𝑏2𝑘𝑘 = 𝜎𝜎 2 𝑥𝑥 𝑘𝑘𝑘𝑘

� = 𝜎𝜎� 2 (𝑋𝑋´𝑋𝑋)−1 = 𝑆𝑆 2 (𝑋𝑋´𝑋𝑋)−1

Grado en Economía. Econometría I. Tema 1 -9-

Por lo tanto: 𝑆𝑆𝑏𝑏20 = 𝑆𝑆 2 𝑥𝑥 00 𝑆𝑆𝑏𝑏21 = 𝑆𝑆 2 𝑥𝑥11……… 𝑆𝑆𝑏𝑏2𝑘𝑘 = 𝑆𝑆 2 𝑥𝑥 𝑘𝑘𝑘𝑘

estimadas de los estimadores son pequeñas estaríamos estimando con precisión.

 Cuanto mayor es la muestra menor es la varianza del estimador.

Grado en Economía. Econometría I. Tema 1 -10-

• Consistente: un estimador es consistente si a medida que aumenta el tamaño muestral el estimador

Como consecuencia de la consistencia de b (al aumentar el tamaño de la muestra 𝑏𝑏 → 𝛽𝛽) se puede

1.3.2.- Propiedades del estimador de la varianza de la perturbación aleatoria S2.

Este estimador es un estimador insesgado de la varianza de la perturbación aleatoria:

Grado en Economía. Econometría I. Tema 1 -11-

1.4.- BONDAD DEL AJUSTE.

1.4.1.- Coeficiente de determinación, R2.

𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1

𝑆𝑆𝑦𝑦2 = 𝑆𝑆𝑦𝑦2� + 𝑆𝑆𝑒𝑒2

Basándonos en esta ecuación, el coeficiente de determinación se define:

Las expresiones matriciales que se utilizan para su cálculo son:

𝑌𝑌´𝑌𝑌 − 2𝑌𝑌´𝑋𝑋𝑋𝑋 + 𝑏𝑏´𝑋𝑋´𝑋𝑋(𝑋𝑋´𝑋𝑋)−1 𝑋𝑋´𝑌𝑌 = 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌

Grado en Economía. Econometría I. Tema 1 -13-

𝑡𝑡=1 𝑡𝑡=1 𝑡𝑡=1

𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑆𝑆𝑆𝑆 − 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑌𝑌´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2 − ( 𝑌𝑌´𝑌𝑌 − 𝑏𝑏´𝑋𝑋´𝑌𝑌) = 𝑏𝑏´𝑋𝑋´𝑌𝑌 − 𝑇𝑇𝑦𝑦� 2

Para interpretar adecuadamente el R2 se debe tener en cuenta que:

1.4.2.- Porcentaje de la raíz del error cuadrático medio, %RECM.

𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ∑ 𝑒𝑒𝑡𝑡2 𝑆𝑆𝑆𝑆𝑆𝑆

Grado en Economía. Econometría I. Tema 1 -14-

 Porcentaje del error estándar, %ES.

�(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)(𝑒𝑒𝑡𝑡 − 𝑒𝑒̅ ) = �(𝑦𝑦�𝑡𝑡 − 𝑦𝑦��)𝑒𝑒𝑡𝑡 = � 𝑦𝑦�𝑡𝑡 𝑒𝑒𝑡𝑡 − 𝑦𝑦�� 𝑒𝑒𝑡𝑡 =