Está en la página 1de 64

TEMA 3

EL MODELO DE REGRESIÓN MÚLTIPLE

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN


2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y TEOREMA DE GAUSS-
MARKOV
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN


2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y TEOREMA DE GAUSS-
MARKOV
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE y = β0 + β1 x + u


Inconveniente principal del MRLS:
resulta difícil establecer relaciones ceteris
paribus sobre cómo X afecta a Y.
SUPUESTO ESPERANZA CONDICIONADA NULA
insesgado: el promedio coincidirá con lo que
pase en la realidad
E(u|x) = E(u) = 0
sesgo: cuando nos desviamos de lo que pasa en realidad

β1 recoge el efecto ceteris paribus β1 presenta sesgo, está incorporando


de X en Y, esto es, el efecto el efecto de otras variables
“exclusivo” de X sobre Y. (recogidas en u) sobre Y.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

k id s = β 0 + β 1 e d u c + u ¿CUÁL ES LA INFLUENCIA DE LA
FORMACIÓN ACADÉMICA SOBRE EL
s i Ε ( U e d u c )= 0 NÚMERO DE NIÑOS?
Δ k id s
β1 =
Δ educ
kids = β 0 + β1educ + u
kids = β 0 + β1educ + (α 0 + α1wage + e)
Supongamos que: kids = β 0 + β1educ + α 0 + α1(γ 0 + γ 1educ + s) + e
u=α 0 +α1wage+e
Por lo tanto,
donde,
β1 en el Modelo de Regresión
wage=γ 0 +γ1educ+s Δkids
Simple presenta sesgo. No nos
= β1 + α1γ 1 estaría recogiendo el efecto
Δeduc aislado que la formación tiene
sobre el nº de niños

Ε( U educ) ≠ 0
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

SOLUCIÓN: MODELO DE REGRESIÓN MÚLTIPLE

kids = β 0 + β1educ + β2wage + u

∆kids
= β1
∆educ ∆wage =0

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE

y = β0 + β1 x1 + u
Β1 PRESENTA SESGO

y = β0 + β1 x1 + β2 x2 + u
Β1 EFECTO CETERIS PARIBUS

MODELO DE REGRESIÓN LINEAL MÚLTIPLE


María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

y = β0 + β1 x1 + β2 x2 + β3 x3 +…+ βk xk + u
en la muestra

No observables
Observables

en la muestra
VARIABLE EXPLICADA VARIABLES EXPLICATIVAS
Dependiente, de respuesta, predicha o regresando Independiente, de control, predictor, regresor
Fenómeno que queremos Variable cuya relación con Y
explicar/predecir queremos establecer

PARÁMETRO - CONSTANTE PARÁMETROS - PENDIENTES ERROR


Recoge el valor de “y” Recogen el efecto de cada una de Todos aquellos factores distintos
cuando “x” = 0 las k variables independientes sobre de las k variables independientes
“y” cuando los demás factores que afectan a “y”
permanecen fijos

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

COMO EN EL CASO DEL MODELO LINEAL SIMPLE, LA VALIDEZ


DE LAS ESTIMACIONES DE LOS PARÁMETROS DE PENDIENTE
DEPENDERÁ, (ENTRE OTROS FACTORES), DE QUE SE CUMPLA EL
SUPUESTO DE ESPERANZA CONDICIONADA NULA

Ε(u x1, x2 , K , x k ) = 0

Ε(u) = 0
Para cada valor de X1, X2,…,Xk
Ε(x1u) = 0 en la población, el valor medio
de las variables no observadas
M es nulo.
Ε(x k u) = 0
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

CONCLUSIÓN

EL MODELO DE REGRESIÓN MÚLTIPLE SUPONE UNA


MEJORA RESPECTO DEL MODELO DE REGRESIÓN SIMPLE
EN LA MEDIDA QUE TE PERMITE INCORPORAR DE FORMA
EXPLÍCITA EN LA FRP MAS DE UNA VARIABLE EXPLICATIVA.
SI BIEN ES MUY PROBABLE QUE SIGA EXISTIENDO ALGÚN
GRADO DE CORRELACIÓN ENTRE ALGUNA O ALGUNAS DE
LAS VARIABLES EXPLICATIVAS Y EL TÉRMINO ERROR, EL
MODELO DE REGRESIÓN MÚLTIPLE POR LO MENOS TE
GARANTIZA QUE EL PARÁMETRO βK CAPTA EL EFECTO DE
XK SOBRE Y, MANTENIENDO FIJOS X1, X2,…,XK-1.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

Especificación + y = β0 + β1 x1 + u
rica

y = β0 + β1 x1 + β2 x2 + β3 x3 +…+ βk xk + u

MEJORA LA CAPACIDAD PREDICTIVA DE MI MODELO

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

MODELO DE REGRESIÓN LINEAL SIMPLE


Formas funcionales muy limitadas → modelos poco realistas
Única forma de paliar esas limitaciones → transformaciones
logarítmicas
cons = β0 + β1 inc + u → ∆ cons/ ∆ inc ≈ β1

MODELO DE REGRESIÓN LINEAL MÚLTIPLE


Al incorporar más de una variable explicativa, nos permite
generalizar relaciones funcionales entre variables (formas
cuadráticas e interacciones entre variables → tema 6)
cons = β0 + β1 inc + β2 inc2 + u → ∆ cons/ ∆ inc ≈ β1 + 2 β2inc Derivada parcial
precio = β0 + β1 supcasa + β2 supjard + β3 sur + β4 (supjard . sur) + u
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

EJEMPLO: Análisis de los determinantes de la nota media universitaria.

Objetivo: cuantificar la relación entre la nota media de la


universidad y la nota obtenida en la prueba de acceso a la
universidad, controlando por la nota media del instituto.

colGPA = β 0 + β1hsGPA + β 2 ACT + u

Nota media Nota media Nota prueba acceso


universidad instituto universidad
(1 a 4) (1 a 4) (1 a 30)

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

colGPA = β 0 + β1hsGPA + β 2 ACT + u

CONSTANTE β0: PENDIENTE β2:


Nota media de la Efecto sobre la nota media de la
universidad si hsGPA y universidad de un aumento en
ACT valen cero. un punto de ACT, manteniendo
constante la nota media del
instituto.

PENDIENTE β1:
Diferencia en la nota media universitaria
entre dos estudiantes que obtuvieron el
mismo resultado en la prueba de acceso a
la universidad, pero se diferencian en un
punto en la nota media del instituto.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

2. ESTIMADORES MCO
3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR
4. EFICIENCIA DEL ESTIMADOR MCO Y Tª DE GAUSS-MARKOV

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

Modelo y = β 0 + β 1 x1 + β 2 x 2 + L + β k x k + u

Estimación MCO (muestra


aleatoria)

FRM: yˆi = βˆ0 + βˆ1 x1i + βˆ2 x2i + L + βˆk x ki


Comparación de los valores
estimado de y con los
valores observados de y

Residuos: uˆ = y − βˆ0 − βˆ1 x1 − βˆ2 x2 − L − βˆk x k


Diferencia entre el valor que realmente toma y cuando x=xi (valor que observamos en
nuestra muestra) y el valor ajustado predicho por nuestro modelo para ese nivel de x.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

El método de MCO elige los valores estimados de los


parámetros que minimizan la suma de los cuadrados de
los residuos:

( )
n n 2

min SCE = ∑ uˆ 2
i = ∑ y i − βˆ 0 − βˆ 1x1i − L − βˆ k x ki =0
βˆ 0 , β1 ,K, β k
ˆ ˆ
i =1 i =1

El método de los momentos elige los valores de los


parámetros que cumplen las versiones muestrales de las
restricciones de los momentos poblaciones:
Ε(u) = 0
Ε(x1u) = 0
M
Ε(x k u) = 0
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

Ecuaciones normales: k+1 ecuaciones, k+1 incógnitas


Condiciones de 1er orden

Método de los momentos


∑ (y )
n

i − βˆ 0 − βˆ 1x1i − L − βˆ k x ki = 0 E(u)=0
i =1

∑ x (y )
n

1i i − βˆ 0 − βˆ 1x1i − L − βˆ k x ki = 0 E(X1u)=0
i =1

∑ x (y )
n

ki i − βˆ 0 − βˆ 1x1i − L − βˆ k x ki = 0 E(X2u)=0
i =1

yˆi = βˆ0 + βˆ1 x1i + βˆ2 x2i + L + βˆk x ki


María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO: Análisis de los determinantes de la nota media universitaria.

colGPA = β0 + β1hsGPA + β2 ACT + u


Muestra 141 estudiantes

Nota media Nota media Nota prueba acceso


Estimación MCO

universidad instituto universidad


(1 a 4) (1 a 4) (1 a 30)

ˆ PA = 1 . 29 + 0 . 453 hsGPA + 0 . 0094 ACT


col G
n = 141

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

colGˆPA = 1,29 + 0,453hsGPA + 0,0094 ACT

Efecto parcial de ACT


sobre colGPA: variación
Para aquellos predicha en colGPA
estudiantes cuyas notas cuando ACT aumenta en
del instituto y del una unidad,
examen ACT son 0, el manteniendo constante
modelo predice que su Efecto parcial de hsGPA hsGPA.
nota media en la sobre colGPA: variación
universidad será 1,29. ∆colGˆPA ˆ
predicha en colGPA = β 2 = 0,0094, si ∆hsGPA = 0
∆ACT
cuando hsGPA aumenta
en una unidad,
manteniendo constante
ACT.
20
∆colGˆPA ˆ
= β1 = 0.453hsGPA, si ∆ACT = 0
María Feo y Maite Alguacil ∆hsGPA
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
ESTIMADORES MCO

colGˆPA = 1,29 + 0,453hsGPA + 0,0094 ACT

• COEFICIENTE HSGPA: Si escogemos dos estudiantes A y B con


la misma nota en el examen de acceso (ACT) pero con
diferente nota media del instituto (hsGPA), el modelo
predice que por cada punto de diferencia en la nota media
del instituto, la nota media de la universidad se
incrementará en 0,45 puntos (sobre 4).

• COEFICIENTE ACT: Para la misma nota en el instituto


(hsGPA), por cada 10 puntos de más que se obtenga en el
resultado ACT, el modelo predice que la nota media en la
universidad se incrementará en 0,09 puntos (sobre 4). 21

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

ˆ = 1.29 + 0.453hsGPA + 0.0094ACT


colGPA MRLM

ˆ = 2.40 + 0.0271ACT
colGPA MRLS

En el MRLS, por cada 10 puntos de mas en ACT, el modelo predice un


aumento de colGPA en 0,27 puntos.
En el MRLM, por cada 10 puntos de más en ACT, el modelo predice un
aumento de colGPA en 0,09 puntos.

Cuando tenemos en cuenta de forma explícita el efecto de hsGPA


sobre colGPA, el efecto de ACT sobre colGPA pasa a ser insignificante
En el MRLS el coeficiente de ACT me está recogiendo, además de el
efecto de esta nota sobre colGPA, el efecto de hsGPA sobre colGPA.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

ˆ = βˆ 0 + βˆ 1hsGPA + βˆ 2 ACT
colGPA
¿CUANDO SERÁN IGUALES?
% = β% 0 + β% 2 ACT
colGPA β% 2 = βˆ 2 + βˆ 1δ% 2

Las estimaciones de β% 2 y βˆ 2 serán equivalentes cuando


se cumpla alguna de estas condiciones:

βˆ 1 = 0
Correlación ACT y hsGPA = 0
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO: Análisis de los determinantes del salario.


Objetivo: cuantificar la relación entre los salarios (en logaritmos), los
años de formación académica (educ), los años de experiencia laboral
(exper) y los años de antigüedad en la empresa actual (tenure).

log(wage) = β0 + β1educ + β2 exper + β3 tenure + u


Muestra

n=526

ˆ
log(wage) = 0,284 + 0,092educ + 0,0041exper + 0,022tenure
Tal y como ocurre en la regresión simple, los coeficientes tienen una
interpretación porcentual. Aquí, además, tienen una interpretación ceteris
paribus. Si mantenemos fijos exper y tenure, un año más de formación predice
un incremento del salario de aproximadamente el 9,2%.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

¿Cuál es el efecto estimado sobre el salario si el individuo


permanece en la empresa durante un año más?
∆tenure = 1 → ∆ exper = 1 ∆educ = 0

∆ log(wage)
ˆ = 0,0041∆ exper + 0,022∆tenure
∆ log(wage)
ˆ = 0,0261

El aumento de la experiencia laboral y de la antigüedad en la empresa en un


año, lleva asociado un incremento salarial del 2,61%.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

PROPIEDADES NUMÉRICAS DE LA FRM


propiedades numéricas FRM ≠ propiedades
estadísticas MCO

1. La suma, y por tanto la media muestral de los residuos


es cero.
n

∑Û = 0
i=1
i

2.La covarianza muestral entre las variables explicativas y


los residuos es nula
n

∑ x uˆ = 0
i=1
ij i ∀i = 1,2K ,n ∀j = 1,2,Kk
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

3. El punto (x1 , x2 ,K , xk , y) siempre está sobre la FRM

4. La media de los valores ajustados es igual a la media de


la variable a explicar
ŷ = y

5. La covarianza muestral entre los residuos y los valores


ajustados es igual a cero.
n

∑ yˆ uˆ = 0
i=1
i i

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

BONDAD DEL AJUSTE


n 2

SUMA TOTAL DE LOS CUADRADOS (STC) → ∑(y −y )


STC

i
i=1
Medida de la varianza muestral total en las yi. Indicador del grado de dispersión de la variable a
explicar en la muestra.
=

n 2

SUMA EXPLICADA DE LOS CUADRADOS (SEC) → ∑ ( ŷ − y )


i
SEC

i=1
Medida de la varianza muestral de los valores ajustados. Indicador del grado de dispersión de
las variables predichas en la muestra.
+

n
SUMA DE LOS CUADRADOS DE LOS RESIDUOS (SCE) → 2
∑i

SCE

i=1
Medida de la varianza muestral de los residuos. Indicador del grado de dispersión de los
residuos en la muestra.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

BONDAD DEL AJUSTE: medida de la capacidad de la relación lineal establecida


entre la variable a explicar (Y) y las variables explicativas (X) para explicar (Y)

COEFICIENTE DE DETERMINACIÓN R2: proporción de la variación explicada en


comparación con la variación total. Fracción de la variación muestral en y que
viene explicada por las X.

SEC SCE
R =
2
=1−
STC STC

Valor acotado entre 0 y 1 → 0 ≤ R2≤ 1

Si R2 = 0 → poca capacidad explicativa. La parte sistemática de mi modelo


no explica nada de la variación de Y
Si R2 = 1→ todos los puntos de la muestra se encuentran sobre la recta,
modelo perfecto.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

CARACTERÍSTICAS DEL COEFICIENTE DE DETERMINACIÓN EN EL MRLM

Como en el MRLS, serán preferibles las estimaciones que


maximicen el coeficiente de determinación.

Nunca disminuye, más bien tiende a aumentar, cuando se


incorporan variables explicativas adicionales a la regresión.

Herramienta poco válida para decidir si habría que añadir una o


varias variables al modelo.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ESTIMADORES MCO

EJEMPLO:
colGˆPA = 1,29 + 0,453hsGPA + 0,0094 ACT
n = 141 R 2 = 0,176

hsGPA y ACT conjuntamente explican un 17,6 por ciento


de la variación de la nota media universitaria para esta
muestra de estudiantes.

Conclusión: parece que existen otros factores (como


personalidad, antecedentes familiares, la calidad de la
educación, etc.) que influyen en el rendimiento de un
estudiante universitario. 31

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


ÍNDICE

1. REGRESIÓN MÚLTIPLE: JUSTIFICACIÓN

2. ESTIMADORES MCO

3. VALOR ESPERADO Y VARIANZA DEL ESTIMADOR


4. EFICIENCIA DEL ESTIMADOR MCO Y Tª DE GAUSS-MARKOV

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

POBLACIÓN Y =β0 +β1 X1 +β2 X2 + K + βk Xk + U β0 ,β1 , β2 ,K ,βk

MUESTRA 1 MCO Ŷi =βˆ 0 +βˆ 1 X1i +βˆ 2 X 2i + K + βˆ k Xki βˆ 0 ,βˆ 1 , βˆ 2 ,K , βˆ k

MUESTRA 2 MCO Y%i =β% 0 +β% 1 X1i +β% 2 X 2i + K + β% k Xki β% 0 ,β% 1 , β% 2 ,K , β% k


….

( ( ( ( ( ( ( ( (
MUESTRA m MCO Yi =β0 +β1 X1i +β2 X 2i + K + βk Xki β0 ,β1 ,β2 ,K ,βk

Queremos conocer las propiedades estadísticas


vinculadas a las distribuciones de estos parámetros
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.1. LINEALIDAD EN LOS PARÁMETROS


RLM.2. MUESTREO ALEATORIO INSESGADEZ

RLM.3. MEDIA CONDICIONADA NULA E(βˆ j )=β j


RLM.4. NO COLINEALIDAD PERFECTA
+
EFICIENCIA
RLM.5. HOMOSCEDASTICIDAD MIN → var(βˆ j )

Homoscedasticidad: La varianza del error es constante y no depende de las x

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.1. LINEALIDAD EN LOS PARÁMETROS

La función de regresión poblacional (FRP) es lineal en los


parámetros poblacionales β0, β1,...,βκ.

Controlable por el investigador. Siempre podemos


redefinir las variables dependiente/independientes
para relajar las restricciones vinculadas a la linealidad
en los parámetros.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.2. MUESTREO ALEATORIO


Obtenemos de la población una muestra aleatoria de n
observaciones:
{(x1i , x2 i , K, x ki , y i ) : i = 1,2, K, n}.

Para una observación extraída aleatoriamente de la población


tenemos:

Por el momento no nos supone un problema puesto


que consideraremos todas las muestras como
aleatorias.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.3. MEDIA CONDICIONADA NULA


El valor medio de u no depende del valor que tomen las
variables explicativas.

El investigador tiene poco control sobre este supuesto, el cual puede


fallar cuando:
La relación funcional entre la variable explicada y las explicativas no
se especifica adecuadamente.
cons = β0 + β1inc + β2inc2 + u → cons = β0 + β1inc + u
Cuando omitimos factores explicativos relevantes (incluidos en u)
que están correlacionados con cualquiera de las variables
explicativas x1, x2,…,xk.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.4. NO COLINEALIDAD PERFECTA


En la muestra (y, por tanto, en la población), ninguna de las
variables explicativas es constante, y no existen relaciones
lineales exactas entre las variables explicativas.

RLM.4.

RLM.3.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

El supuesto RLM.4. sí que permite que las variables


independientes estén correlacionadas entre sí (ese es
justamente el atractivo del MRLM en relación con el MRLS),
lo que no permite es que exista colinealidad perfecta, esto
es, que una variable sea una combinación lineal exacta de
otra u otras variables independientes.

x 2 = ( x1 )
2
cons =β0 +β1 inc +β2 inc + u 2

pricei =β 0 +β1bedroomsi +β 2 area i +β 4 land i +β5 totali +u i

AREA + LAND = TOTAL

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

RLM.4. NO COLINEALIDAD PERFECTA


En la muestra (y, por tanto, en la población), ninguna de las
variables explicativas es constante, y no existen relaciones
lineales exactas entre las variables explicativas.

Relativamente controlable por el investigador (véase


ejercicio 3.5.), más aún si el tamaño de la muestra es
elevado.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 1: INSESGADEZ ESTIMADOR MCO

BAJO LOS SUPUESTOS RLM.1 A RLM.4:

LOS ESTIMADORES MCO SON ESTIMADORES INSESGADOS DE LOS


PARÁMETROS POBLACIONALES.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 1: INSESGADEZ ESTIMADOR MCO

RLM.1: Linealidad en los parámetros


RLM.2: Muestreo Aleatorio
Ε(βˆ j ) = β j
RLM.3: Media condicionada nula
RLM.4: No colinealidad perfecta

42

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Ε(β j ) = β j j = 0,1,K, k INSESGADEZ


MCO
Muestra 1 yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 + L + βˆk x k βˆ0 , βˆ1 ,K , βˆk

Muestra 2 y&& = β&&0 + β&&1 x1 + β&&2 x2 + L + β&&k x k β&&0 , β&&1 ,K, β&&k
...

( ( ( ( ( ( ( (
Muestra m y = β 0 + β 1 x1 + β 2 x 2 + L + β k x k β 0 , β1 ,K , β k

∑ βˆ k ,h
h =1
= βk
María Feo y Maite Alguacil
m
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Densidad de β2

Estimaciones de β2
β2
Estimadores insesgados: la media de la distribución de densidad del
estimador coincide con el verdadero valor del parámetro.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

SESGADEZ
RLM.1. LINEALIDAD EN LOS PARÁMETROS Ε(βˆ j ) ≠ β j
RLM.2. MUESTREO ALEATORIO
RLM.3. MEDIA CONDICIONADA NULA
RLM.4. NO COLINEALIDAD PERFECTA
Si falla cualquiera se produce sesgadez, pero se ha señalado uno

OMITIMOS FACTORES EXPLICATIVOS RELEVANTES (INCLUIDOS EN U)


QUE ESTÁN CORRELACIONADOS CON CUALQUIERA DE LAS VARIABLES
EXPLICATIVAS X1, X2,…,XK.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

A LA HORA DE ESPECIFICAR UN MODELO PODEMOS INCURRIR EN 2 TIPOS DE ERRORES

SOBRESPECIFICACIÓN : inclusión de una o más variables irrelevantes en el modelo.

y =β0 +β1 x1 +u Incluyo en mi especificación la variable X2,


cuando en realidad dicha variable, una vez
tenido en cuenta el efecto de X1 sobre Y, no tiene
ŷ =βˆ 0 +βˆ 1 x1 + βˆ 2 x 2 ningún efecto parcial sobre Y.

SUBESPECIFICACIÓN: omitimos en el modelo una variable relevante.

y =β0 +β1 x1 +β2 x 2 + u En el modelo real X2 tiene un efecto parcial


relevante sobre Y. Sin embargo nuestra
especificación no incluye dicha variable, bien
porque no hemos sido capaces de obtener datos
y% =β% 0 +β% 1 x1 sobre los niveles que toma en la muestra o
simplemente porque no la hemos considerado.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INCLUSIÓN VARIABLE IRRELEVANTE → SOBRESPECIFICACIÓN


¿Qué ocurre si incluimos variables irrelevantes en el modelo?

Una vez tenida en cuenta el efecto del resto


de variables, no tienen ningún impacto
parcial sobre la variable explicada.

EJEMPLO:

pricei = β 0 + β1bedrooms i + β 2areai + β 3colouri + ui

- Si la variable colour es irrelevante: β3 = 0.


- ¿Són insesgados los estimadores de MCO de este modelo?
estimadores: son los Betas

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

INCLUSIÓN VARIABLE IRRELEVANTE (CONT.)


y =β0 +β1 x1 +β2 x 2 + β3 x 3 + u Con
β3=0
y =β0 +β1 x1 +β2 x 2 + u

ŷ =βˆ 0 +βˆ 1 x1 +βˆ 2 x 2 + βˆ 3 x 3 + u


SI SE CUMPLE RLM.1. A RLM.4, MCO ES UN ESTIMADOR INSESGADO:
Ε(βˆ0 ) = β 0 Ε(βˆ1 ) = β1 Ε(βˆ2 ) = β 2 Ε(βˆ3 ) = 0

La inclusión de una o más variables irrelevantes en un modelo de regresión


no afecta a la insesgadez de los estimadores MCO.
¿Quiere decir esto que no causa ningún problema la inclusión de variables
irrelevantes en nuestro modelo de regresión? No, incluir variables
irrelevantes puede tener efectos adversos sobre las varianzas
María Feo y Maite Alguacil
(agrandándolas).
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


Supongamos que el modelo poblacional es:

y = β 0 + β 1 x1 + β 2 x 2 + u MODELO
“VERDADERO”

Que cumple el supuesto RLM.3: Ε(u x1 , x2 ) = 0


Y los otros supuestos necesarios para la insesgadez de los estimadores de MCO
(RLM.1, RLM.2 y RLM.4).
Por consiguiente, si estimamos este modelo por MCO obtendremos
estimadores insesgados de los coeficientes:

Ε(βˆ0 ) = β 0 Ε(βˆ1 ) = β 1 Ε(βˆ2 ) = β 2

Pero, ¿qué ocurre si omitimos la influencia de x2 sobre y y estimamos los


parámetros del siguiente modelo (subespecificado)?
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN

y =β0 +β1 x1 +β2 x 2 + u


MODELO RLM.1. A RLM.4
“VERDADERO” ŷ =βˆ +βˆ x +βˆ x ( )
E βˆ 1 =β1
0 1 1 2 2

MODELO y =β0 +β1 x1 + u


sub ESPECIFICADO
y% =β% 0 +β% 1 x1

( ) ( )
¿E β% 1 = E βˆ 1 =β1 ?

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN

VERDADERO ŷ =βˆ 0 +βˆ 1 x1 +βˆ 2 x2


ESTIMADO y% =β% +β% x
0 1 1

%β = βˆ + βˆ ∑ ( x i1 − x1 ) x i2
Nuestro estimador de
pendiente también

1 1 2 2
puede expresarse como:
∑ i1 1
(x x )
β% 1 = βˆ 1 + βˆ 2δ% 1

COVARIANZA ENTRE X1 Y X2 SOBRE LA VARIANZA DE X1.


PENDIENTE DE LA REGRESIÓN DE LA VARIABLE OMITIDA (X2) SOBRE LA VARIABLE X1
→ EFECTO QUE LA VARIACIÓN DE X1 TIENE SOBRE X2.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


El valor esperado de nuestro parámetro de interés es:

( )
E β~1 = β1 + β 2δ 1 Sesgo

El sesgo será nulo, β2 δ% 1 = 0 y E(β% 1 ) = β1 , si:

Mi modelo estaba bien especificado, no he omitido ninguna variable


“relevante” puesto que las variaciones de X2 no tienen ningún efecto
sobre Y

X1 y X2 no están correlacionadas en la muestra y por tanto el hecho de


pasar a incluir X2 en el término error no supone un incumplimiento de
RLM.3.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

OMISIÓN VARIABLE RELEVANTE → SUBESPECIFICACIÓN


E(β% 1 ) = β1 + β2δ% 1 β2δ% 1 ≠ 0 ¿SIGNO DEL SESGO?

¿Correlación entre x1 y x2?


Corr(x1, x2) = 0 Corr(x1, x2) > 0 Corr(x1, x2) < 0
β2 = 0 Sesgo = 0 Sesgo = 0 Sesgo = 0
Signo de β2 → β2 > 0 Sesgo = 0 Sesgo > 0 Sesgo < 0
β2 < 0 Sesgo = 0 Sesgo < 0 Sesgo > 0

E(β% 1 ) > β1 SESGO AL ALZA


E(β% ) < β
1 1 SESGO A LA BAJA
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

EJEMPLO:
Supongamos que el salario (wage) está determinado por la siguiente expresión:
log(wage) = β 0 + β1educ + β 2abil + u

Sin embargo, puesto que la habilidad (abil) es difícil de cuantificar, estimamos el


siguiente modelo (subespecificado):

log(wage ) = β 0 + β1educ + v

Donde v = β2abil + u

log(wage) = β~0 + β~1educ

¿Bajo qué condiciones es insesgado el estimador de la pendiente en el modelo


subespecificado?
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Consideremos las dos regresiones:

log(waˆge) = βˆ0 + βˆ1educ + βˆ2abil

log(wa~ge) = β~0 + β~1educ

De antes, sabemos que la relación entre ambas es:

β~1 = βˆ1 + βˆ2δˆ1


donde
Cov(x1 , x2 ) Cov(educ , abil )
δˆ1 = =
Var (x1 ) Var (educ)

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Tomando esperanzas condicionadas, tenemos:

β~1 = βˆ1 + βˆ2δˆ1

Ε(β~1 ) = β1 + β 2δ 1

El sesgo será:
Ε(β~1 ) − β1 = β 2δ 1

El estimador de β1 en el modelo subestimado será insesgado cuando:

∗ si x2 (abil ) es irrelevante : β 2 = 0, o
∗ si x2 (abil ) y x1 (educ) no están correlacionados : δ 1 = 0
56

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Hasta ahora nos hemos centrado en lo relativo a la esperanza


de los estimadores MCO.

VARIANZA DE LOS ESTIMADORES MCO → medida de la dispersión


de su distribución muestral.

La desviación típica de un
Desviación estimador mide la precisión
típica de β2 del mismo: “lo concentrada
que está su distribución
alrededor del verdadero
valor del parámetro”

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Para poder obtener las varianzas


RLM.5. HOMOSCEDASTICIDAD del estimador MCO, añadimos el
siguiente supuesto:

La varianza condicional del término de error no depende de los


valores que tomen las variables explicativas. σ 2es una constante
desconocida.
Var (u x1 ,K, xk ) = σ 2 Var ( y x1 ,K , xk ) = σ 2

Para todas las posibles


combinaciones de valores de las HETEROSCEDASTICIDAD
variables explicativas, la varianza del
término de error es la misma.

HOMOSCEDASTICIDAD
La varianza de u depende del nivel de
María Feo y Maite Alguacil educación

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

EJEMPLO:
log(wage) = β 0 + β1educ + β 2abil + u

La homoscedasticidad requiere que la varianza del error no


observado u no dependa de la educación o de la habilidad del
trabajador.

Var (u educ , abil) = σ 2

Si la varianza cambia con educ o con abil, entonces existe


heteroscedasticidad.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


60

SUPUESTOS DE GAUSS-MARKOV
RLM.1: Linealidad en los parámetros
RLM.2: Muestreo Aleatorio
RLM.3: Media condicionada nula
RLM.4: No colinealidad perfecta
RLM.5: Homoscedasticidad
Para que el modelo sea eficiente se
tienen que cumplir los 5 supuestos

SUPUESTOS DE GAUSS-MARKOV para datos de corte


transversal
60

María Feo y Maite Alguacil


60
FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE
VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

Los SUPUESTOS RLM.1 A RLM.5 se conocen como los SUPUESTOS DE


GAUSS-MARKOV para datos de corte transversal

TEOREMA 2: VARIANZAS ESTIMADORES MCO DE LAS


PENDIENTES
BAJO LOS SUPUESTOS RLM.1 A RLM.5 (GAUSS-MARKOV):
σ 2
Var ( βˆ j ) =
STC j (1 − R 2j )
DONDE:
σ2 ES LA VARIANZA DEL ERROR
STCJ ES LA VARIANZA MUESTRAL TOTAL DE XJ
R2J ES EL R-CUADRADO DE LA REGRESIÓN DE XJ SOBRE EL RESTO DE VARIABLES
INDEPENDIENTES.

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

¿DE QUÉ DEPENDE LA VARIANZA DE LOS ESTIMADORES MCO Y


POR TANTO SU PRECISIÓN? Var ( βˆ ) = σ 2

STC j (1 − R 2j )
j

LA VARIANZA DEL TÉRMINO DE ERROR (σ2):


CUÁNTO MAYOR ES LA VARIABILIDAD DE LOS FACTORES DESCONOCIDOS QUE AFECTAN A Y
(“RUIDO”), MENOR SERÁ LA PRECISIÓN DE LOS ESTIMADORES.
ESTE TÉRMINO PODRÍA REDUCIRSE INTRODUCIENDO VARIABLES EXPLICATIVAS ADICIONALES
(AUNQUE NO ES SIEMPRE POSIBLE NI DESEABLE).

LA VARIACIÓN MUESTRAL DE LAS VARIABLES EXPLICATIVAS (STCJ):


CUANTO MAYOR VARIABILIDAD PRESENTEN LAS EXPLICATIVAS, MÁS PRECISA SERÁ LA
ESTIMACIÓN.
AL AUMENTAR EL TAMAÑO MUESTRAL, N, PODREMOS AUMENTAR ESTA VARIABILIDAD.
EL SUPUESTO RLM.4 (NO COLINEALIDAD PERFECTA) SE INCUMPLE SI ALGUNA DE LAS
EXPLICATIVAS MUESTRA UNA VARIABILIDAD NULA (STCJ = 0).
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

¿DE QUÉ DEPENDE LA VARIANZA DE LOS ESTIMADORES MCO Y


POR TANTO SU PRECISIÓN? Var ( βˆ ) = σ 2

STC j (1 − R 2j )
j

RELACIONES LINEALES ENTRE LAS VARIABLES INDEPENDIENTES (RJ2):


CUANTO MAYORES SEAN LAS RELACIONES LINEALES ENTRE LAS EXPLICATIVAS, MAYORES
SERÁN LAS VARIANZAS DE LAS ESTIMACIONES MCO DE LAS PENDIENTES.

UNA CORRELACIÓN ALTA (PERO NO PERFECTA) ENTRE DOS O MÁS VARIABLES EXPLICATIVAS
SE DENOMINA MULTICOLINELIDAD.

CASOS EXTREMOS:
• RJ2=0: LA CORRELACIÓN MUESTRAL DE XJ CON EL RESTO DE LAS EXPLICATIVAS ES NULA
SE OBTIENE LA VARIANZA MÁS PEQUEÑA.

• RJ2=1: XJ ES UNA COMBINACIÓN LINEAL PERFECTA DE LAS OTRAS VARIABLES


EXPLICATIVAS (MULTICOLINEALIDAD PERFECTA). SE INCUMPLE EL SUPUESTO RLM.4

María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE


VALOR ESPERADO Y VARIANZA DEL ESTIMADOR

TEOREMA 3: TEOREMA DE GAUSS-MARKOV


BAJO LOS SUPUESTOS RLM.1 A RLM.5 (GAUSS-MARKOV):

βˆ0 , βˆ1 ,K, βˆk

SON LOS ESTIMADORES INSESGADOS ÓPTIMOS (ELIO) β 0 , β1 ,K, β k , DE


RESPECTIVAMENTE

IMPLICACIÓN:
SI PODEMOS ASUMIR ESTOS SUPUESTOS, NO ES NECESARIO BUSCAR ESTIMADORES
INSESGADOS ALTERNATIVOS: NINGUNO ES MEJOR QUE LOS MCO.
María Feo y Maite Alguacil

FUNDAMENTOS DE ECONOMETRÍA TEMA 3 – EL MODELO DE REGRESIÓN MÚLTIPLE

También podría gustarte