Está en la página 1de 66

TEMA 3

EL MODELO DE REGRESIÓN MÚLTIPLE

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN


2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y TEOREMA DE GAUSS-
MARKOV
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN


2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y TEOREMA DE GAUSS-
MARKOV
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE y = β0 + β1 x + u


Inconveniente principal del MRLS:
resulta difícil establecer relaciones ceteris
paribus sobre cómo X afecta a Y.
SUPUESTO ESPERANZA CONDICIONADA NULA
E(u|x) = E(u) = 0
Que no habia
relacion entre la
X y la U

β1 recoge el efecto ceteris paribus β1 presenta sesgo, está incorporando


de X en Y, esto es, el efecto el efecto de otras variables
“exclusivo” de X sobre Y. (recogidas en u) sobre Y.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

kids=β 0 +β1educ+u ¿CUÁL ES LA INFLUENCIA DE LA


FORMACIÓN ACADÉMICA SOBRE EL
si Ε( U educ)=0 NÚMERO DE NIÑOS?
Δkids
β1 =
Δeduc Hay veces que dentro de esta U
hay variables que deberian estar
kids   0  1educ  u explicadas y produce sesgos

kids   0  1educ  ( 0  1wage  e)


Supongamos que: kids   0  1educ   0  1( 0   1educ  s)  e
u=α0 +α1wage+e
Por lo tanto,
donde,
1 en el Modelo de Regresión
wage=γ 0 +γ1educ+s Δkids
Simple presenta sesgo. No nos
 1  1 1 estaría recogiendo el efecto
Δeduc aislado que la formación tiene
sobre el nº de niños

Ε( U educ)  0
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

SOLUCIÓN: MODELO DE REGRESIÓN MÚLTIPLE

kids   0  1educ  2wage  u

kids
 1 Esto se recoge en B1

educ wage0
Lo que hace variar educ a kids, siendo wage 0

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE

y = β0 + β1 x1 + u
Β1 PRESENTA SESGO
No mediria el efecto de la variable explicativa en la explicada

y = β0 + β1 x1 + β2 x2 + u
Β1 EFECTO CETERIS PARIBUS

MODELO DE REGRESIÓN LINEAL MÚLTIPLE


María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

y = β0 + β1 x1 + β2 x2 + β3 x3 +…+ βk xk + u
en la muestra

No observables
Observables

en la muestra
VARIABLE EXPLICADA VARIABLES EXPLICATIVAS
Dependiente, de respuesta, predicha o regresando Independiente, de control, predictor, regresor
Fenómeno que queremos Variable cuya relación con Y La U
explicar/predecir queremos establecer

B1,B2...
PARÁMETRO - CONSTANTE PARÁMETROS - PENDIENTES ERROR
Recoge el valor de “y” Recogen el efecto de cada una de Todos aquellos factores distintos
cuando “x” = 0 las k variables independientes sobre de las k variables independientes
“y” cuando los demás factores que afectan a “y”
permanecen fijos

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

COMO EN EL CASO DEL MODELO LINEAL SIMPLE, LA VALIDEZ


DE LAS ESTIMACIONES DE LOS PARÁMETROS DE PENDIENTE
DEPENDERÁ, (ENTRE OTROS FACTORES), DE QUE SE CUMPLA EL
SUPUESTO DE ESPERANZA CONDICIONADA NULA

(u x1, x2 ,  , x k )  0

(u)  0
Para cada valor de X1, X2,…,Xk
( x1u)  0 en la población, el valor medio
La U no está correlacionada de las variables no observadas
 con ninguna de las variables
del modelo es nulo.
( x k u)  0
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

CONCLUSIÓN

 EL MODELO DE REGRESIÓN MÚLTIPLE SUPONE UNA


MEJORA RESPECTO DEL MODELO DE REGRESIÓN SIMPLE
EN LA MEDIDA QUE TE PERMITE INCORPORAR DE FORMA
EXPLÍCITA EN LA FRP MAS DE UNA VARIABLE EXPLICATIVA.
 SI BIEN ES MUY PROBABLE QUE SIGA EXISTIENDO ALGÚN
GRADO DE CORRELACIÓN ENTRE ALGUNA O ALGUNAS DE
LAS VARIABLES EXPLICATIVAS Y EL TÉRMINO ERROR, EL
MODELO DE REGRESIÓN MÚLTIPLE POR LO MENOS TE
GARANTIZA QUE EL PARÁMETRO βK CAPTA EL EFECTO DE
XK SOBRE Y, MANTENIENDO FIJOS X1, X2,…,XK-1.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

y = β0 + β1 x1 + u
Especificación +
rica

y = β0 + β1 x1 + β2 x2 + β3 x3 +…+ βk xk + u

MEJORA LA CAPACIDAD PREDICTIVA DE MI MODELO

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE


 Formas funcionales muy limitadas → modelos poco realistas
 Única forma de paliar esas limitaciones → transformaciones
logarítmicas
cons = β0 + β1 inc + u → ∆ cons/ ∆ inc ≈ β1

MODELO DE REGRESIÓN LINEAL MÚLTIPLE


 Al incorporar más de una variable explicativa, nos permite
generalizar relaciones funcionales entre variables (formas
cuadráticas e interacciones entre variables → tema 6)
cons = β0 + β1 inc + β2 inc2 + u → ∆ cons/ ∆ inc ≈ β1 + 2 β2inc
precio = β0 + β1 supcasa + β2 supjard + β3 sur + β4 (supjard . sur) + u
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

EJEMPLO: Análisis de los determinantes de la nota media universitaria.

 Objetivo: cuantificar la relación entre la nota media de la


universidad y la nota obtenida en la prueba de acceso a la
universidad, controlando por la nota media del instituto.

colGPA  0  1hsGPA  2 ACT  u

Nota media Nota media Nota prueba acceso


universidad instituto universidad
(1 a 4) (1 a 4) (1 a 30)

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

colGPA  0  1hsGPA  2 ACT  u

CONSTANTE 0: PENDIENTE 2:


Nota media de la Efecto sobre la nota media de la
universidad si hsGPA y universidad de un aumento en
ACT valen cero. un punto de ACT, manteniendo
constante la nota media del
instituto.

PENDIENTE 1:
Diferencia en la nota media universitaria
entre dos estudiantes que obtuvieron el
mismo resultado en la prueba de acceso a
la universidad, pero se diferencian en un
punto en la nota media del instituto.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y Tª DE GAUSS-MARKOV

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

Modelo y   0  1 x1  2 x2     k xk  u

Estimación MCO (muestra


aleatoria)

FRM: yˆi  ˆ0  ˆ1 x1i  ˆ2 x2i    ˆk x ki


Comparación de los valores
estimado de y con los
valores observados de y Derivar parcialmente cada B
respecto de B0 e igualar a 0.
Después hacemos con todas las

uˆi  yi  ˆ0  ˆ1 x1i  ˆ2 x2i    ˆk xki


exiaciones un sistema y resolvemos

Residuos:

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

 El método de MCO elige los valores estimados de los


parámetros que minimizan la suma de los cuadrados de
los residuos:

 
n n 2

min
ˆ ˆ ˆ
SCE  
 0 , 1 ,,  k
ˆ
u 2
i  
i 1
y i 
i 1
ˆ  ˆ x    ˆ x  0
 0 1 1i k ki

 El método de los momentos elige los valores de los


parámetros que cumplen las versiones muestrales de las
restricciones de los momentos poblaciones:
(u)  0
(x1u)  0

(x k u)  0
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

Ecuaciones normales: k+1 ecuaciones, k+1 incógnitas


Condiciones de 1er orden

Método de los momentos


 y 
n

i  ˆ 0  ˆ 1x1i    ˆ k x ki  0 E(u)=0
i 1

 x y 
n

1i i  ˆ 0  ˆ 1x1i    ˆ k x ki  0 E(X1u)=0
i 1

 x y 
n

ki i  ˆ 0  ˆ 1x1i    ˆ k x ki  0 E(Xku)=0
i 1

yˆi  ˆ0  ˆ1 x1i  ˆ2 x2i    ˆk x ki


María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO: Análisis de los determinantes de la nota media universitaria.

colGPA  0 1hsGPA 2ACT  u


Muestra 141 estudiantes

Nota media Nota media Nota prueba acceso


Estimación MCO

universidad instituto universidad


(1 a 4) (1 a 4) (1 a 30)

ˆ PA  1 . 29  0 . 453 hsGPA  0 . 0094 ACT


col G
n  141

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


Elemplo 3.1 (pag 75)
ESTIMADORES MCO

colGˆPA  1,29  0,453hsGPA  0,0094ACT

Efecto parcial de ACT


sobre colGPA: variación
Para aquellos predicha en colGPA
estudiantes cuyas notas cuando ACT aumenta en
del instituto y del una unidad,
examen ACT son 0, el manteniendo constante
modelo predice que su Efecto parcial de hsGPA hsGPA.
nota media en la sobre colGPA: variación
universidad será 1,29. colGˆPA ˆ
predicha en colGPA  2  0,0094, si hsGPA  0
ACT
cuando hsGPA aumenta
en una unidad,
manteniendo constante
ACT.
20
colGˆ PA ˆ
 1  0.453 , si ACT  0
María Feo, Jordi Ripollés y Maite Alguacil hsGPA
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
ESTIMADORES MCO

colGˆPA  1,29  0,453hsGPA  0,0094ACT

• COEFICIENTE HSGPA: Si escogemos dos estudiantes A y B con


la misma nota en el examen de acceso (ACT) pero con
diferente nota media del instituto (hsGPA), el modelo
predice que por cada punto de diferencia en la nota media
del instituto, la nota media de la universidad se
incrementará en 0,45 puntos (sobre 4).

• COEFICIENTE ACT: Para la misma nota en el instituto


(hsGPA), por cada 10 puntos de más que se obtenga en el
resultado ACT, el modelo predice que la nota media en la
universidad se incrementará en 0,09 puntos (sobre 4). 21
Como digo por cada 10, tengo que
multiplicar el resultado por 10
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

ˆ  1.29  0.453hsGPA  0.0094ACT


colGPA MRLM

ˆ  2.40  0.0271ACT
colGPA MRLS

 En el MRLS, por cada 10 puntos de más en ACT, el modelo predice un


aumento de colGPA en 0,27 puntos.
 En el MRLM, por cada 10 puntos de más en ACT, el modelo predice un
aumento de colGPA en 0,09 puntos.

 Cuando tenemos en cuenta de forma explícita el efecto de hsGPA


sobre colGPA, el efecto de ACT sobre colGPA pasa a ser insignificante
 En el MRLS el coeficiente de ACT me está recogiendo, además de el
efecto de esta nota sobre colGPA, el efecto de hsGPA sobre colGPA.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

ˆ  ˆ 0  ˆ 1hsGPA  ˆ 2 ACT
colGPA

colGPA  0  2 ACT

Como veremos más adelante, las estimaciones podrían ser


análogas si se cumple alguna de estas condiciones:
 𝛽1 = 0
 Corr(ACT, hsGPA) = 0
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO: Análisis de los determinantes del salario.


 Objetivo: cuantificar la relación entre los salarios (en logaritmos), los
años de formación académica (educ), los años de experiencia laboral
(exper) y los años de antigüedad en la empresa actual (tenure).

log(wage)  0 1educ 2 exper 3tenure  u


Muestra

n=526

ˆ
log(wage)  0,284  0,092educ  0,0041exper  0,022tenure
Tal y como ocurre en la regresión simple, los coeficientes tienen una
interpretación porcentual. Aquí, además, tienen una interpretación ceteris
paribus. Si mantenemos fijos exper y tenure, un año más de formación predice
un incremento del salario de aproximadamente el 9,2%.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

¿Cuál es el efecto estimado sobre el salario si el individuo


permanece en la empresa durante un año más?
tenure  1   exper  1 educ  0
Por cada año mas de tenure
(antiguedad) , en que porcentaje
aumenta el salario

log(wage)
ˆ  0,0041 exper  0,022tenure
log(wage)
ˆ  0,0261

El aumento de la experiencia laboral y de la antigüedad en la empresa en un


año, lleva asociado un incremento salarial del 2,61%.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

PROPIEDADES NUMÉRICAS DE LA FRM


propiedades numéricas FRM ≠ propiedades
estadísticas MCO

1. La suma, y por tanto la media muestral de los residuos


es cero.
𝑛

෍ 𝑢ො 𝑖 = 0
𝑖=1

2.La covarianza muestral entre las variables explicativas y


los residuos es nula
n

 x uˆ  0
i1
ij i i  1,2 ,n j  1,2, k
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

3. El punto (x1 ,x2 , ,xk ,y) siempre está sobre la FRM

4. La media de los valores ajustados es igual a la media de


la variable a explicar
ŷ  y

5. La covarianza muestral entre los residuos y los valores


ajustados es igual a cero.
n

 yˆ uˆ  0
i 1
i i

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

BONDAD DEL AJUSTE


n 2

SUMA TOTAL DE LOS CUADRADOS (STC) →  y y 


STC

i
i1
Medida de la varianza muestral total en las yi. Indicador del grado de dispersión de la variable a
explicar en la muestra.
=

n 2

SUMA EXPLICADA DE LOS CUADRADOS (SEC) →   ŷ  y 


i
SEC

i1
Medida de la varianza muestral de los valores ajustados. Indicador del grado de dispersión de
las variables predichas en la muestra.
+

n
SUMA DE LOS CUADRADOS DE LOS RESIDUOS (SCE) →
i
û2
SCE

i 1
Medida de la varianza muestral de los residuos. Indicador del grado de dispersión de los
residuos en la muestra.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

BONDAD DEL AJUSTE: medida de la capacidad de la relación lineal establecida


entre la variable a explicar (Y) y las variables explicativas (X) para explicar (Y)

COEFICIENTE DE DETERMINACIÓN R2: proporción de la variación explicada en


comparación con la variación total. Fracción de la variación muestral en y que
viene explicada por las X.

SEC SCE
R 
2
1
STC STC

 Valor acotado entre 0 y 1 → 0 ≤ R2≤ 1

 Si R2 = 0 → poca capacidad explicativa. La parte sistemática de mi modelo


no explica nada de la variación de Y
 Si R2 = 1→ todos los puntos de la muestra se encuentran sobre la recta,
modelo perfecto.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

CARACTERÍSTICAS DEL COEFICIENTE DE DETERMINACIÓN EN EL MRLM

 Como en el MRLS, serán preferibles las estimaciones que


maximicen el coeficiente de determinación.

 Nunca disminuye, más bien tiende a aumentar, cuando se


incorporan variables explicativas adicionales a la regresión.

 Herramienta poco válida para decidir si habría que añadir una o


varias variables al modelo.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO:
colGˆPA  1,29  0,453hsGPA  0,0094ACT
n  141 R 2  0,176

 hsGPA y ACT conjuntamente explican un 17,6 por ciento


de la variación de la nota media universitaria para esta
muestra de estudiantes.

 Conclusión: parece que existen otros factores (como


personalidad, antecedentes familiares, la calidad de la
educación, etc.) que influyen en el rendimiento de un
estudiante universitario. 31

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

2. ESTIMADORES MCO

3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR


4. EFICIENCIA DEL ESTIMADOR MCO Y Tª DE GAUSS-MARKOV

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

POBLACIÓN Y0 1 X1 2 X2   k Xk U 0 ,1 ,2 , ,k

MUESTRA 1 MCO Ŷi ˆ 0 ˆ 1 X1i ˆ 2 X2i   ˆ k Xki ˆ 0 ,ˆ 1 ,ˆ 2 , ,ˆ k

MUESTRA 2 MCO Yi 0 1 X1i 2 X2i   k Xki 0 ,1 ,2 , ,k
….

MUESTRA m MCO Yi 0 1 X1i 2 X2i   k Xki 0 ,1 ,2 , ,k

Queremos conocer las propiedades estadísticas


vinculadas a las distribuciones de estos parámetros
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Para que el estimador MCO cumpla la propiedad de insesgadez


y eficiencia, deben cumplirse una serie de supuestos:

 RLM.1. LINEALIDAD EN LOS PARÁMETROS


 RLM.2. MUESTREO ALEATORIO INSESGADEZ
 RLM.3. MEDIA CONDICIONADA NULA ˆ )
E( j j

 RLM.4. NO COLINEALIDAD PERFECTA

EFICIENCIA
 RLM.5. HOMOSCEDASTICIDAD MIN var(ˆ j )
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.1. LINEALIDAD EN LOS PARÁMETROS

 La función de regresión poblacional (FRP) es lineal en los


parámetros poblacionales 0, 1,...,k.

𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝑢,

Controlable por el investigador. Siempre podemos redefinir las


variables dependiente/independientes para relajar las
restricciones vinculadas a la linealidad en los parámetros (i.e.,
transformaciones logarítmicas o cuadráticas).

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.2. MUESTREO ALEATORIO


 Obtenemos de la población una muestra aleatoria de n
observaciones:
(x1i , x2i , , xki , y i ) : i  1,2, , n.

 Para una observación extraída aleatoriamente de la población


tenemos:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑘 𝑥𝑖𝑘 + 𝑢𝑖 .

Por el momento no nos supone un problema puesto


que consideraremos todas las muestras como
aleatorias.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.3. MEDIA CONDICIONADA NULA


 El valor esperado de u no depende del valor que tomen las
variables explicativas.
𝐸 𝑢 𝑥1 , 𝑥2 , … , 𝑥𝑘 = 0.

El investigador tiene poco control sobre este supuesto, el cual puede fallar cuando:
 La relación funcional entre la variable explicada y las explicativas no se
especifica adecuadamente. Ejemplos:
Modelo poblacional (verdadero) Modelo especificado
𝑐𝑜𝑛𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑖𝑛𝑐 2 + 𝑢 𝑐𝑜𝑛𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝑢
log 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 log 𝑒𝑑𝑢𝑐 + 𝑢 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝑢

 Omitimos factores explicativos relevantes (incluidos en u) que están


correlacionados con cualquiera de las variables explicativas x1, x2, … , xk.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.4. NO COLINEALIDAD PERFECTA


 En la muestra (y, por tanto, en la población), ninguna de las
variables explicativas es constante, y no existen relaciones
lineales exactas entre las variables explicativas.

RLM.4.

RLM.3.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

 El supuesto RLM.4. sí que permite que las variables explicativas estén correlacionadas
entre sí (ese es justamente el atractivo del MRLM en relación con el MRLS), lo que no
permite es que estén perfectamente correlacionadas.

• Cuando una variable es múltiplo constante de otra. Ejemplos:


𝑖𝑛𝑐
𝑐𝑜𝑛𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 +𝑢
100
log 𝑐𝑜𝑛𝑠 = 𝛽0 + 𝛽1 log 𝑖𝑛𝑐 + 𝛽2 log 𝑖𝑛𝑐 2 + 𝑢 → 𝑥2 = 2𝑥1

• Cuando una variable es una combinación lineal exacta de otra u otras


variables independientes. Ejemplo:
𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1 𝑏𝑒𝑑𝑟𝑜𝑜𝑚𝑠 + 𝛽2 𝑎𝑟𝑒𝑎 + 𝛽4 𝑙𝑎𝑛𝑑 + 𝛽5 𝑡𝑜𝑡𝑎𝑙 + 𝑢

AREA + LAND = TOTAL

• Cuando una variable es función exacta de otra (pero no lineal)

𝑐𝑜𝑛𝑠 = 𝛽0 + 𝛽1 𝑖𝑛𝑐 + 𝛽2 𝑖𝑛𝑐 2 + 𝑢


María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.4. NO COLINEALIDAD PERFECTA


 En la muestra (y, por tanto, en la población), ninguna de las
variables explicativas es constante, y no existen relaciones
lineales exactas entre las variables explicativas.

Relativamente controlable por el investigador (véase


ejercicio 3.5.), más aún si el tamaño de la muestra es
elevado.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 1: INSESGADEZ DEL ESTIMADOR MCO

BAJO LOS SUPUESTOS RLM.1 A RLM.4:


𝐸 𝛽෡𝑗 = 𝛽𝑗 , 𝑗 = 0, 1 , … , 𝑘,
LOS ESTIMADORES MCO SON ESTIMADORES INSESGADOS DE LOS
PARÁMETROS POBLACIONALES.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 1: INSESGADEZ DEL ESTIMADOR MCO

 RLM.1: Linealidad en los parámetros


 RLM.2: Muestreo Aleatorio
(ˆ j )   j
 RLM.3: Media condicionada nula
 RLM.4: No colinealidad perfecta

42

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INSESGADEZ: ( ˆ j )   j j  0,1, , k

MCO
Muestra 1 yˆ  ˆ0  ˆ1 x1  ˆ2 x2    ˆk x k ˆ0 , ˆ1 ,, ˆk

Muestra 2 y  0  1 x1  2 x2    k x k 0 , 1 ,, k
...

       
Muestra m y   0   1 x1   2 x 2     k x k  0 , 1 ,,  k

 ˆ k ,h
h 1
 k
María Feo, Jordi Ripollés y Maite Alguacil
m
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INSESGADEZ
Densidad de 2

Estimaciones de 2
2
Estimadores insesgados: la media de la distribución de densidad del
estimador coincide con el verdadero valor del parámetro.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

SESGADEZ: (ˆ j )   j

 RLM.1. LINEALIDAD EN LOS PARÁMETROS


 RLM.2. MUESTREO ALEATORIO
 RLM.3. MEDIA CONDICIONADA NULA
 RLM.4. NO COLINEALIDAD PERFECTA

OMITIMOS FACTORES EXPLICATIVOS RELEVANTES (INCLUIDOS EN U)


QUE ESTÁN CORRELACIONADOS CON CUALQUIERA DE LAS VARIABLES
EXPLICATIVAS X1, X2,…,XK.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

A LA HORA DE ESPECIFICAR UN MODELO PODEMOS INCURRIR EN 2 TIPOS DE ERRORES

SOBRESPECIFICACIÓN : inclusión de una o más variables irrelevantes en el modelo.

y 0 1 x1 u Incluyo en mi especificación la variable X2,


cuando en realidad dicha variable, una vez
tenido en cuenta el efecto de X1 sobre Y, no tiene
ŷ ˆ 0 ˆ 1 x1  ˆ 2 x 2 ningún efecto parcial sobre Y.

SUBESPECIFICACIÓN: omitimos en el modelo una variable relevante.

y 0 1 x1 2 x2  u En el modelo real X2 tiene un efecto parcial


relevante sobre Y. Sin embargo nuestra
especificación no incluye dicha variable, bien
porque no hemos sido capaces de obtener datos
y 0 1 x1 sobre los niveles que toma en la muestra o
simplemente porque no la hemos considerado.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INCLUSIÓN VARIABLE IRRELEVANTE → SOBRESPECIFICACIÓN


¿Qué ocurre si incluimos variables irrelevantes en el modelo?

Una vez tenida en cuenta el efecto del resto


de variables, no tienen ningún impacto
parcial sobre la variable explicada.

EJEMPLO:

pricei   0  1bedroomsi  2areai   3colouri  ui

- Si la variable colour es irrelevante: 3 = 0.


- ¿Són insesgados los estimadores de MCO de este modelo?

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INCLUSIÓN VARIABLE IRRELEVANTE (CONT.)


y 0 1 x1 2 x2  3 x3  u Con
β3=0
y 0 1 x1 2 x2  u

ŷ ˆ 0 ˆ 1 x1 ˆ 2 x 2  ˆ 3 x 3  u


SI SE SIGUEN CUMPLIENDO RLM.1 - RLM.4  MCO ES UN ESTIMADOR INSESGADO:
(ˆ0 )   0 (ˆ1 )  1 (ˆ2 )   2 (ˆ3 )  0

 La inclusión de una o más variables irrelevantes en un modelo de regresión


no afecta a la insesgadez de los estimadores MCO.
 ¿Quiere decir esto que no causa ningún problema la inclusión de variables
irrelevantes en nuestro modelo de regresión? No, incluir variables
irrelevantes puede tener efectos adversos sobre las varianzas
María Feo, Jordi Ripollés y Maite Alguacil
(agrandándolas).
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


Supongamos que el modelo poblacional es:

y   0  1 x1  2 x2  u MODELO
“VERDADERO”

Que cumple el supuesto RLM.3: (u x1 , x2 )  0 , y los otros supuestos necesarios


para la insesgadez de los estimadores de MCO (RLM.1, RLM.2 y RLM.4).
Por consiguiente, si estimamos este modelo por MCO obtendremos
estimadores insesgados de los coeficientes:

(ˆ0 )   0 (ˆ1 )  1 (ˆ2 )   2

Pero, ¿qué ocurre si omitimos la influencia de x2 sobre y y estimamos los


parámetros del siguiente modelo (subespecificado)?
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


Modelo “verdadero”: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝑢𝑖
RLM.1. A RLM.4
Modelo “verdadero” estimado: 𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 𝑥𝑖1 + 𝛽መ2 𝑥𝑖2  
E ˆ 1 1

Modelo subespecificado: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝑣𝑖


   
¿E 1  E ˆ 1 1 ?
Modelo subespecificado estimado: 𝑦෤𝑖 = 𝛽෨0 + 𝛽෨1 𝑥𝑖1

El estimador de la pendiente del modelo subespecificado puede


expresarse del siguiente modo. 𝛽2 𝑥𝑖2 + 𝑢𝑖 𝛽2 𝑥ҧ2 + 𝑢ത

σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )(𝑦𝑖 − 𝑦)


ത σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝛽0 + 𝛽1 𝑥𝑖1 + 𝑣𝑖 − 𝛽0 − 𝛽1 𝑥ҧ1 − 𝑣)ҧ
𝛽෨1 = =
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2 σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2

σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝑥𝑖2 − 𝑥ҧ2 ) σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝑢𝑖 − 𝑢ത )


= 𝛽1 + 𝛽2 +
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2 σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


Modelo “verdadero”: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝑢𝑖
RLM.1. A RLM.4
Modelo “verdadero” estimado: 𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 𝑥𝑖1 + 𝛽መ2 𝑥𝑖2  
E ˆ 1 1

Modelo subespecificado: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝑣𝑖


   
¿E 1  E ˆ 1 1 ?
Modelo subespecificado estimado: 𝑦෤𝑖 = 𝛽෨0 + 𝛽෨1 𝑥𝑖1
Si tomamos la esperanza condicional de 𝛽෨1 sobre los valores de las variables explicativas y utilizamos el
RLM.3: 𝐸 𝑢𝑖 𝑥𝑖1 = 0, entonces tenemos:
σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝑥𝑖2 − 𝑥ҧ2 ) σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝑢𝑖 − 𝑢)

𝐸(𝛽෨1 ) = 𝐸 𝛽1 + 𝛽2 +
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2 σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2

σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝑥𝑖2 − 𝑥ҧ2 ) 𝐶𝑜𝑣. 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑥1 𝑦 𝑥2


= 𝛽1 + 𝛽2 𝐸 = 𝛽1 + 𝛽2
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2 𝑉𝑎𝑟. 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑑𝑒 𝑥1
= 𝛿ሚ1
Pendiente de la regresión de la variable omitida
María Feo, Jordi Ripollés y Maite Alguacil
(𝑥2 ) sobre la variable 𝑥1 : 𝑥෤𝑖2 = 𝛿ሚ0 + 𝛿ሚ1 𝑥𝑖1

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


Modelo “verdadero”: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + 𝑢𝑖
RLM.1. A RLM.4
Modelo “verdadero” estimado: 𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 𝑥𝑖1 + 𝛽መ2 𝑥𝑖2  
E ˆ 1 1

Modelo subespecificado: 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝑣𝑖


   
¿E 1  E ˆ 1 1 ?
Modelo subespecificado estimado: 𝑦෤𝑖 = 𝛽෨0 + 𝛽෨1 𝑥𝑖1

El sesgo será nulo, 𝛽2 𝛿ሚ1 = 0 y 𝐸(𝛽෨1 ) = 𝛽1 , si:


• 𝜷𝟐 = 𝟎. Mi modelo estaba bien especificado, no he omitido ninguna
𝐸(𝛽෨1 ) = 𝛽1 + 𝛽2 𝛿ሚ1 variable “relevante” puesto que las variaciones x2 no tienen ningún
efecto sobre y.
SESGO
y/o
• ෩𝟏 = 𝟎. x1 y x2 no están correlacionadas en la muestra y por tanto el
𝜹
hecho de pasar a incluir x2 en el término error no supone un
incumplimiento de RLM.3.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


E(1 )  1  21  2 1  0 ¿SIGNO DEL SESGO?

¿Correlación entre x1 y x2?


Corr(x1, x2) = 0 Corr(x1, x2) > 0 Corr(x1, x2) < 0
Signo de β2

β2 = 0 Sesgo = 0 Sesgo = 0 Sesgo = 0


β2 > 0 Sesgo = 0 Sesgo > 0 Sesgo < 0
β2 < 0 Sesgo = 0 Sesgo < 0 Sesgo > 0

E(1 )  1 SESGO AL ALZA


E(1 )  1 SESGO A LA BAJA
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

EJEMPLO:
Supongamos que el salario (wage) está determinado por la siguiente expresión:

log(wage)   0  1educ  2abil  u

Sin embargo, puesto que la habilidad (abil) es difícil de cuantificar, estimamos el


siguiente modelo (subespecificado):

log( wage )  0  1educ  v

donde v = 2abil + u
~ age)  ~  ~ educ
log(w 0 1

¿Bajo qué condiciones es insesgado el estimador de la pendiente en el modelo


subespecificado?
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

 Consideremos las dos regresiones:

log(waˆge)  ˆ0  ˆ1educ  ˆ2abil

log(wa~ge)  ~0  ~1educ

 De antes, sabemos que la relación entre ambas es:


~ ~
1  1   21
donde
~ Coˆv( x1 , x2 ) Coˆv(educ, abil )
1  
Vaˆr ( x1 ) Vaˆr (educ)

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

 Tomando esperanzas condicionadas, tenemos:


~ ~
1  1   21

~ ~
( 1 )  1   21

 El sesgo será:
~ ~
( 1 )  1   21

 El estimador de 1 en el modelo subestimado será insesgado :

 si x2 (abil ) es irrelevante :  2  0, y/o


 si x2 (abil ) y x1 (educ) no están correlacionados : 1  0

56

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

 Hasta ahora nos hemos centrado en lo relativo a la esperanza


de los estimadores MCO.

 VARIANZA DE LOS ESTIMADORES MCO → medida de la dispersión


de su distribución muestral.

La desviación típica de un
Desviación estimador mide la precisión
típica de 2 del mismo: “lo concentrada
que está su distribución
alrededor del verdadero
valor del parámetro”

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
Para poder obtener las varianzas

RLM.5. HOMOSCEDASTICIDAD del estimador MCO, añadimos el


siguiente supuesto:

 La varianza condicional del término de error no depende de los valores


que tomen las variables explicativas.  2 es una constante desconocida.
Var (u x1 ,  , xk )   2 𝑉𝑎𝑟(y|𝑥1 , … , 𝑥𝑘 ) = 𝜎 2

HOMOSCEDASTICIDAD EJEMPLO:

La homoscedasticidad implica que, para todas las posibles 𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝛽2 𝑎𝑏𝑖𝑙 + 𝑢
combinaciones de valores de las variables explicativas, la varianza del La homoscedasticidad requiere que la varianza del error
término de error es la misma. u no dependa de la educación o de la habilidad del
trabajador, lo que es lo mismo que suponer que
Var(wage|educ, habil) = 𝜎 2 .
Densidad f(y|x)

Var (u educ, abil )   2 𝑉𝑎𝑟(wage|𝑒𝑑𝑢𝑐, 𝑎𝑏𝑖𝑙) = 𝜎 2

y Si la varianza del salario es constante a todos los niveles


de educación o de la habilidad, existe homoscedasticidad.

x1
x2
x3 𝐸 𝑦 𝑥 = 𝛽0 + 𝛽1 𝑥

María Feo, Jordi Ripollés y Maite Alguacil x


FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
Para poder obtener las varianzas

RLM.5. HOMOSCEDASTICIDAD del estimador MCO, añadimos el


siguiente supuesto:

 La varianza condicional del término de error no depende de los valores


que tomen las variables explicativas.  2 es una constante desconocida.
Var (u x1 ,  , xk )   2 𝑉𝑎𝑟(y|𝑥1 , … , 𝑥𝑘 ) = 𝜎 2

VIOLACIÓN DEL SUPUESTO: HETEROSCEDASTICIDAD EJEMPLO:


𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝛽2 𝑎𝑏𝑖𝑙 + 𝑢
Ejemplo, la varianza del salario depende del nivel de educación

Si la varianza del salario cambia con educ o con abil,


Densidad f(wage|educ)

entonces existe heteroscedasticidad


y
𝑉𝑎𝑟 𝑢 𝑒𝑑𝑢𝑐, 𝑎𝑏𝑖𝑙 ≠ 𝜎 2

wage 𝑉𝑎𝑟(𝑤𝑎𝑔𝑒|𝑒𝑑𝑢𝑐, 𝑎𝑏𝑖𝑙) ≠ 𝜎 2

8
12
16 𝐸 𝑤𝑎𝑔𝑒 𝑒𝑑𝑢𝑐 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐

María Feo, Jordi Ripollés y Maite Alguacil educx


FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
60

SUPUESTOS DE GAUSS-MARKOV
 RLM.1: Linealidad en los parámetros
 RLM.2: Muestreo Aleatorio
 RLM.3: Media condicionada nula
 RLM.4: No colinealidad perfecta
 RLM.5: Homoscedasticidad

SUPUESTOS DE GAUSS-MARKOV para datos de corte


transversal
60

María Feo, Jordi Ripollés y Maite Alguacil


60
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

 Los SUPUESTOS RLM.1 A RLM.5 se conocen como los SUPUESTOS DE


GAUSS-MARKOV para datos de corte transversal.

TEOREMA 2: VARIANZAS ESTIMADORES MCO DE LAS


PENDIENTES
BAJO LOS SUPUESTOS RLM.1 A RLM.5 (GAUSS-MARKOV):
𝜎2
𝑉𝑎𝑟 𝛽መ𝑗 = 𝑗 = 0, 1 , … , 𝑘
𝑆𝑇𝐶𝑗 (1 − 𝑅𝑗2 )
DONDE:
 𝜎 2 ES LA VARIANZA DEL ERROR
 𝑆𝑇𝐶𝑗 ES LA VARIANZA MUESTRAL TOTAL EN 𝑋𝑗
 𝑅𝑗2 R-CUADRADO DE LA REGRESIÓN DE 𝑋𝑗 SOBRE EL RESTO DE VARIABLES
ES EL
INDEPENDIENTES (Y UN TÉRMINO CONSTANTE).
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Supongamos un modelo de regresión simple 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝑢𝑖 donde RLM.1 - RLM.5.

𝑛
𝜎2
Entonces, Var 𝛽መ1 |𝑥𝑖1 = 𝑆𝑇𝐶 siendo 𝑆𝑇𝐶1 = ෍(𝑥𝑖1 − 𝑥ҧ1 )2
1
𝑖=1

DEMOSTRACIÓN DEL TEOREMA 2 PARA UN MODELO DE REGRESIÓN SIMPLE:

σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )(𝑦𝑖 − 𝑦)


ത σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 (𝛽0 + 𝛽1 𝑥𝑖1 + 𝑢𝑖 − 𝛽0 − 𝛽1 𝑥ҧ1 − 𝑢)


𝛽1 = =
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2 σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2

σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )(𝑢𝑖 − 𝑢)



= 𝛽1 +
σ𝑛𝑖=1(𝑥𝑖1 − 𝑥ҧ1 )2
RLM.5
𝑉𝑎𝑟 𝑢𝑖 |𝑥𝑖1 = 𝜎 2 para todo i =1, 2, …, n
෡ 𝟏 𝒙𝒊𝟏 =
𝑽𝒂𝒓(𝜷
2
2 σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 𝑢𝑖 − 𝑢ത 𝐸 𝑢𝑖 − 𝑢ത 2
𝐸 𝛽መ1 − 𝐸(𝛽መ1 ) = 𝐸 𝛽1 + − 𝛽1 = 𝑛
σ𝑛𝑖=1 𝑥𝑖1 − 𝑥ҧ1 2 σ𝑖=1 𝑥𝑖1 − 𝑥ҧ1 2
= 𝛽1
RLM. s 1 − 4 = 𝑆𝑇𝐶1
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

VOLVAMOS AL MODELO DE REGRESIÓN MÚLTIPLE…


¿DE QUÉ DEPENDE LA VARIANZA DE LOS ESTIMADORES MCO Y,
POR TANTO, SU PRECISIÓN?  2
Var ( ˆ ) 
STC j (1  R 2j )
j

 LA VARIANZA DEL TÉRMINO DE ERROR (σ2):


CUÁNTO MAYOR ES LA VARIABILIDAD DE LOS FACTORES DESCONOCIDOS QUE AFECTAN A 𝑦𝑖
(“RUIDO”), MENOR SERÁ LA PRECISIÓN DE LOS ESTIMADORES.
ESTE TÉRMINO PODRÍA REDUCIRSE INTRODUCIENDO VARIABLES EXPLICATIVAS ADICIONALES
(AUNQUE NO ES SIEMPRE POSIBLE NI DESEABLE).

 LA VARIACIÓN MUESTRAL DE LAS VARIABLES EXPLICATIVAS (STCJ):


CUANTO MAYOR VARIABILIDAD PRESENTEN LAS EXPLICATIVAS, MÁS PRECISA SERÁ LA
ESTIMACIÓN.
AL AUMENTAR EL TAMAÑO MUESTRAL, N, PODREMOS AUMENTAR ESTA VARIABILIDAD.
EL SUPUESTO RLM.4 (NO COLINEALIDAD PERFECTA) SE INCUMPLE SI ALGUNA DE LAS
EXPLICATIVAS MUESTRA UNA VARIABILIDAD NULA (𝑆𝑇𝐶𝑗 = 0).
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

VOLVAMOS AL MODELO DE REGRESIÓN MÚLTIPLE…


¿DE QUÉ DEPENDE LA VARIANZA DE LOS ESTIMADORES MCO Y,
POR TANTO, SU PRECISIÓN?  2
Var ( ˆ ) 
STC j (1  R 2j )
j

 RELACIONES LINEALES ENTRE LAS VARIABLES INDEPENDIENTES (RJ2):


CUANTO MAYORES SEAN LAS RELACIONES LINEALES ENTRE LAS EXPLICATIVAS, MAYORES
SERÁN LAS VARIANZAS DE LAS ESTIMACIONES MCO DE LAS PENDIENTES.

UNA CORRELACIÓN ALTA (PERO NO PERFECTA) ENTRE DOS O MÁS VARIABLES EXPLICATIVAS
SE DENOMINA MULTICOLINELIDAD.

CASOS EXTREMOS:
• RJ2=0: LA CORRELACIÓN MUESTRAL DE XJ CON EL RESTO DE LAS EXPLICATIVAS ES NULA
SE OBTIENE LA VARIANZA MÁS PEQUEÑA.

• RJ2=1: XJ ES UNA COMBINACIÓN LINEAL PERFECTA DE LAS OTRAS VARIABLES


EXPLICATIVAS (COLINEALIDAD PERFECTA). SE INCUMPLE EL SUPUESTO RLM.4

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 3: TEOREMA DE GAUSS-MARKOV


BAJO LOS SUPUESTOS RLM.1 A RLM.5 (GAUSS-MARKOV):

ˆ0 , ˆ1 ,, ˆk

SON LOS ESTIMADORES INSESGADOS ÓPTIMOS (ELIO) DE


 0 , 1 ,,  k , RESPECTIVAMENTE.
___________

IMPLICACIÓN:
SI PODEMOS ASUMIR ESTOS SUPUESTOS, NO ES NECESARIO BUSCAR ESTIMADORES
INSESGADOS ALTERNATIVOS: NINGUNO ES MEJOR QUE LOS MCO.
María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


Bibliografía básica:

• Matilla García, M., Pérez Pascual, P., Sanz Carnero, B. (2013):


Econometría y Predicción, McGraw Hill. Capítulo 2 (sección
2.3.1.), Capítulo 3 (sección 3.1.) y Capítulo 5 (secciones
5.1.1. y 5.1.2.)

• Wooldridge, Jeffrey M. (2010). Introducción a la


econometría: un enfoque moderno. 4ª Edición. Cengage
Learning. Capítulo 3: Análisis de regresión múltiple:
estimación.

María Feo, Jordi Ripollés y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE

También podría gustarte