Está en la página 1de 18

TEMA A li i de Reg e i Li eal

M l i le
Modelo de regresi n lineal con ariables
La FRP en su forma estocástica nos queda:

donde 1

La ecuación es una expresión abreviada para el siguiente conjunto de n ecuaciones:

El sistema de ecuaciones en forma matricial se escribe:

1 …
1 …

1 …

Con lo que nos queda la ecuación matricial:

Supuestos del modelo cl sico de regresi n lineal en notaci n


matricial
S e Li ealidad

Modelo Lineal en los parámetros:

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
S e E e a ac dici ada la E ge eidad

| , ,…, 0

NOTAS

Este supuesto implica que , 0

Bajo este supuesto, los estimadores muestrales son INSESGADOS

El supuesto indica que las variables son exógenas Si alguna de las variables explicativas está
correlacionada con el término error, diremos que esa variable es endógena

S e N M l ic li ealidad e fec a

NOTAS

Lo que significa que no existe una relación lineal perfecta entre las variables , es decir,
ninguna de las regresoras puede escribirse como combinación lineal exacta de las regresoras
restantes del modelo

La matriz X tendrá rango k , y para ello es necesario que 1

Este supuesto implica que det ´ 0, si no se cumple el supuesto, no podremos calcular


los estimadores MCO lo comprobaremos más adelante

Las relaciones no lineales entre las regresoras no violan el supuesto de no Multicolinealidad


perfecta

Podremos expresar este supuesto como ´ 0 estilo Matilla

S e H m ceda icidad N A c elaci

NOTAS

… …
´ … …

… …
0 … 0
0 … 0
Matriz de varianzas y covarianzas de las
0 0 0

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
NOTA Donde los elementos de la diagonal son las varianzas de las perturbaciones , que
debido a la homocedasticidad son ; y los elementos de fuera de la diagonal dan
las covarianzas de las perturbaciones, que debido a la no autocorrelación son , 0

Ya que:

S e M e a alea ia
, ,…, , 1,2, … , é

S e N malidad de l e e

Los errores poblacionales son independientes de , son independientes entre sí y se


distribuyen normalmente con media nula y varianza constante

~ 0,

S e Ada aci de la ici de m a

Si tenemos datos temporales, las variables aleatorias , ,…, , :

Tienen una distribución de probabilidad que no cambia a lo largo del tiempo


, ,…, , , ,…, , se convierten en independientes a
medida que j aumenta

S e G a de A í ic c bable

Formalmente, , tienen momentos de cuarto orden finitos, es decir, las observaciones


que presentan valores de o de o de ambas que están muy alejados del rango habitual
para el tipo de datos considerados datos atípicos son altamente improbables

NOTA Este supuesto es necesario para llegar a una distribución estadística de los
coeficientes

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Teorema de Gauss Marko para datos de secci n cru ada
En el caso de datos de sección cruzada, si se cumplen los siguientes supuestos:

Linealidad
Exogeneidad
No Multicolinealidad Perfecta Estimadores MCO son MELI
Muestra Aleatoria
Homocedasticidad
Grandes atípicos son improbables

NOTA : El supuesto de muestra aleatoria incluye el supuesto de no autocorrelación

NOTA Los datos de sección cruzada suelen tener problemas de heterocedasticidad

Teorema de Gauss Marko para datos temporales


En el caso de datos temporales, si se cumplen los siguientes supuestos:

Linealidad
Exogeneidad Estricta
No Multicolinealidad Perfecta
Adaptación del supuesto de m a s Estimadores MCO son MELI
Homocedasticidad
No Autocorrelación

NOTA Las series temporales suelen tener problemas de autocorrelación

Estimaci n por MCO


La FRM en su forma estocástica para variables nos queda:

En notación matricial:

( . )

Expresándolo con matrices tenemos que:

1 …
1 …

1 …

Al igual que para dos variables, los estimadores de MCO se obtienen al minimizar

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Derivando respecto a , ,…, obtenemos la ec aci e male

Si expresamos el sistema de ecuaciones normales en forma matricial, obtenemos:

1 1 … 1
… …

… … … …
…………………………………….. ………………….. …

´ ´

La ecuación matricial resultante recibe el nombre de ECUACIONES NORMALES

´ ´ Ec aci e N male de eja d ´ ´

Ejem l cálc l de a ak

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Propiedades de lo estimadores de MCO
Las propiedades de lo estimadores de MCO del modelo de regresión múltiple son similares a
las del modelo con dos variables:

P iedade algeb aica del MCO

La recta de regresión pasa a través de las medias , , ,…,

, 0

, 0

Con los supuestos del modelo clásico de regresión lineal estos estimadores de MCO son
lineales e insesgados, y dentro de éstos son los de mínima varianza MELI

Matri de arian a co arian a de


´

Donde á

Estimador insesgado para :

´
1 1 1

En la práctica se calcula con la siguiente fórmula: ´ ´ ´

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
El coeficiente de determinaci n m ltiple
Mide la proporción de variabilidad total de Y alrededor de su valor medio que es explicada por
el modelo, es decir, que es explicada por las variables , , … , conjuntamente

´ ´
1
´

Hay una relación entre el y la varianza de los estimadores :

1
1 1

Donde es el coeficiente de determinación de la regresión de sobre las 1 variables


independientes restantes y es la suma cuadrática total de la variable independiente j

El
El coeficiente es una función no decreciente del número de variables explicativas, es decir,
aumentar el número de variables hará que el se mantenga igual, o lo que será más normal ,
aumente Así, si queremos comparar dos modelos de regresión con la misma variable
dependiente pero con un número diferente de variables independientes se debe tener
mucho cuidado al escoger el modelo con la mas alta Por lo tanto, para comparar estos dos
modelos usaremos lo que se conoce como , :

1 1

Donde

La relación entre y :

1
1 1
1

Propiedades del

Añadir una variable independiente tiene dos efectos sobre :

SCR disminuye, lo que provoca un aumento de


aumenta

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Por lo tanto, el efecto final sobre dependerá de cuál de ambos efectos sea mayor

puede ser negativo

Comparaci n de dos alores de


Si queremos comparar dos modelos con el mismo número de variables independientes,
basándonos en el coeficiente de determinación, ajustado o no, ambos modelos tendrán que
tener el mismo tamaño de la muestra y la misma forma de la varible dependiente

NOTA El investigador debe preocuparse más por la pertinencia lógica de las variables
explicativas para la variable dependiente y por su significancia estadística, que de si el ,
ajustado o no, es elevado El tendrá que ser elevado para las series temporales

Contrastes de hip tesis sobre coeficientes de regresi n


indi iduales
Partiendo del supuesto de normalidad de los errores:

~ , es una matriz

Podemos afirmar lo siguiente:

~ , ´

Es decir, cada elemento de la matriz está normalmente distribuido con media igual al
parámetro correspondiente y la varianza está dada por veces el elemento
correspondiente de la diagonal de la matriz inversa ´

Como en la práctica se desconoce , se estimará mediante , por lo que ahora

cada elemento de se distribuye como una con 1 . .

Por lo tanto, la distribución nos servirá para probar hipótesis sobre el verdadero y
establecer intervalos de confianza sobre él como ya estudiamos en el tema

Contrastes de hip tesis sobre dos par metros


Para explicar si el efecto de dos variables es o no el mismo:

: ó : 0
: : 0
Tema : Análisis de Regresión Lineal Múltiple
TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Estadístico de contraste:
0

Si ⁄ rechazamos , es decir la diferencia es estadísticamente


significativa

2 ,

NOTA Es importante distinguir entre mayor coeficiente y mayor influencia de la variable


explicativa Para determinar qué variable tiene mayor influencia lo mejor es recurrir a los
coeficientes BETA variables estandarizadas

Ejem l Sala i e el Sec T í ic

A partir de la encuesta de la estructura salarial española de , hemos seleccionado datos


del sector turístico y hemos obtenido la regresión

ln 1,69 0,07 0,01 0,04 0,09 ñ


, , , , ,
n

es el logaritmo del salario hora en euros corrientes de


es el nivel de estudios terminados
son los años de antigüedad en la empresa
en décadas, si tiene menos de años, si tiene entre y , , más de
ñ es el tamaño de la empresa, menos de trabajadores, entre y , más de

La matriz de varianzas y covarianzas de y ñ es:

E di Tama

E di , ,
Tama , ,

a ¿Son significativas cada una de las variables al ?¿Y al ?

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
b ¿A nivel poblacional, el efecto que tiene el tamaño de la empresa es igual al que tiene el
nivel de estudios? Nivel de confianza del

Contraste de hip tesis conjunto estad stico de la F


Restricciones de e clusi n
Supongamos que queremos contrastar si de un total de variables explicativas, de
éstas, digamos de a , influyen conjuntamente en la variable a explicar

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
: 0
: á

Nos preguntamos si imponer restricciones hace que el ajuste empeore significamente


respecto al modelo sin restricciones Entenderemos por empeorar que la SCR del modelo
aumente

Ecuación no restringida:

Ecuación restringida:

í :

~ ,

Si , ; Rechazamos , o lo que es lo mismo, afirmamos que las


variables son CONJUNTAMENTE SIGNIFICATIVAS
NOTAS
No tiene por qué coincidir el diagnóstico de la con el de la , ya que en ocasiones
la significación conjunta arroja resultados diferentes a los individuales Normalmente
la razón se encuentra en la existencia de Multicolinealidad no perfecta entre las
variables Este contraste de exclusión múltiple se suele usar cuando las variables están
muy relacionadas
Si tenemos un contraste individual del tipo : 0 lo podremos realizar a partir
de la , ya que ; , ; , de manera que los dos métodos nos llevan
a los mismos resultados
se puede calcular también usando el , siempre y cuando la a iable
de e die e e ga la mi ma f ma f ci al e la ec aci e i gida e la
e i gida

~ ,

Significati idad conjunta


Se contrasta la significatividad global del modelo con el contraste:

: 0
: ú 0

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
í :

~ ,

Ejem l Dema da de Ce e a

Con datos de la encuesta continua de presupuestos familiares entre el primer cuatrimestre de


y el último de queremos estimar la ecuación de demanda de cerveza La estimación
por MCO es:

ln 10,27 0,815 ln 1,383 ln


, , ,
0,053 ln 0,060 ln
, ,

32, 0,7052, 0,6615, 0,1397

a ¿Son todos los signos los esperados según prevé la teoría económica?

b Contrastar si el vino de mesa y el de calidad son conjuntamente significativos al ,


usando la ecuación restringida:

ln 9,67 0,672 ln 1,312 ln


32, 0,6567, 0,633, 0,1627

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
d Contrastar si las variables explicativas de la regresión son conjuntamente significativas al
, es decir, contrasta si el modelo es globalmente significativo

Ejem l E di de la f ci de d cci e la ec mía e a la

A partir de los datos suministrados por la Contabilidad Nacional, hemos obtenido datos de
producción, empleo y stock de capital de maquinaria, material de equipo y otros, entre y
en millones de euros del año , y miles de trabajadores totales medidos en jornadas
equivalentes a tiempo completo

Partimos de un modelo poblacional basado en la función de producción de Cobb Douglas:

Aplicando logaritmos y estimando por MCO obtenemos:

ln 0,72 0,59 ln 0,41 ln


, , ,
31, 0,99, 0,014094

a Expresar el modelo de regresión poblacional

b Para comprobar si existen rendimientos constantes a escala es decir, un incremento del


en el empleo y el stock provocaría un incremento del en la producción a partir de la
hipótesis : 1 , tendríamos que usar la ecuación restringida, ¿cuál sería
la forma poblacional de la ec restringida si aplicamos la restricción de la hipótesis nula?

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
d Supongamos que la estimación de la ecuación con restricciones anterior es:

ln 0,76 0,60 ln

31, 0,95, 0,014108

Contrastar si existen rendimientos constantes a escala al de confianza

Forma Funcional Cuadr tica

Pa a e dia la a iaci e e ada e a ca bi ia i e de i a

Por lo tanto, la variación esperada en tras un cambio en depende del nivel inicial de

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
El valor de que hace que 0 es:

Para ese nivel inicial existe:

Un Mínimo: si 0
Un Máximo: si 0

Ejem l Sala i del ec í ic e a l

Con datos de la encuesta salarial de , estimamos el modelo en el que el salario hora del
sector turístico español depende del nivel de estudios acabados y de la antigüedad en la
empresa El modelo estimado es:

8,04 0,385 0,189 0,299 0,0017


5286, 0,2165, 0,2159

a ¿En qué nivel de estudios se alcanza el salario mínimo fijada la antigüedad?

b ¿Para cuántos años de antigüedad alcanza el salario su máximo fijados los estudios?

c ¿En cuánto se incrementa el salario por cada nivel de estudios superado, ceteris paribus la
antigüedad?

d ¿En cuánto se incrementa el salario medio cuando se pasa de uno a dos años de
antigüedad? ¿y cuando se pasa de a años? ¿Por qué se produce distinto incremento?

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Ejem l U ai de I e e

A partir del informe sobre el desarrollo mundial de , obtenemos datos del ingreso per
cápita de países en miles de dólares en términos de Paridad de Poder Adquisitivo PPA , el
número de años de escolaridad promedio de la población, y la proporción de usuarios de
internet en cada país El modelo estimado es:

52,608 6,26 ln 19,08


2,511 ln ∙

169, 0,8024, 0,7988

a El valor medio del nivel de estudios en la muestra es de , Si fijamos los años de estudios
en ese valor, ¿Cuál es el efecto parcial sobre internet de los ingresos?

b El ingreso medio per cápita en términos de PPA en logaritmos de la muestra es , Fijando


en ese valor los ingresos, ¿cuál será el efecto parcial sobre internet de los estudios?

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
Predicci n mediante regresi n m ltiple
Predicci n Media
1

Sea el vector de valores de para las cuales se desea predecir , la predicción

media de La predicción media de nos queda:

, ,…,

El estimador de la predicción, , está sujeto a la variabilidad de los estimadores MCO

Varian a de la predicci n media


´ ´

Así, el INTERVALO DE CONFIANZA PARA LA PREDICCIÓN MEDIA nos queda:

Predicci n indi idual


Ya vimos que la diferencia entre las predicciones de la media y la individual consiste en sus
varianzas:

Varian a de la predicci n indi idual


| 1 ´ ´

Así, el INTERVALO DE CONFIANZA PARA LA PREDICCIÓN INDIVIDUAL nos queda:


2 2

Ejem l P edicci de l ala i h a del ec í ic

Con los mismos datos del ejercicio estimamos un modelo con las mismas variables, pero
con la variable explicada en niveles y no en logaritmos El modelo estimado es:

0,81 1,24 ∙ 0,17 ∙ 0,89 ∙ 1,19 ∙ ñ


, , , , ,
5286, 0,239 0,2388 176722,5

a ¿Cuál sería la previsión del salario hora medio de un licenciado estudios , con años de
edad edad y cinco de antigüedad en una empresa ant de tamaño mediano tamaño

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com
b Calcule un intervalo de confianza para la predicción individual y otro para la predicción
media a partir de los datos suministrados en la siguiente estimación del modelo:

16,7389 1,24 ∙ 8 0,17 ∙ 5 0,89 ∙ 3


, , , ,
1,19 ∙ ñ 2
,

Precisi n para la predicci n con datos de series temporales


Para evaluar la capacidad predictiva del modelo las medidas más usadas son:

LA raíz cuadrada del Error Cuadrático Medio:

el error medio absoluto:

El porcentaje de error medio en términos absolutos:

1
100

La U de Theil, es el estadístico más utilizado para evaluar la precisión de la predicción:

0 ó í

Tema : Análisis de Regresión Lineal Múltiple


TÉCNICAS DE PREDICCIÓN GRADO DE TURISMO
Pilar Del Saz https: econometriclass wordpress com

También podría gustarte