Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5
EL MODELO DE REGRESIÓN MÚLTIPLE:
CUESTIONES ADICIONALES
‐ multiplica por k ‐ divide por k ‐
‐ divide por k ‐ multiplica por k ‐
EJEMPLO: Modelo en el que queremos estudiar el efecto que sobre el peso del recién
nacido, medido en onzas (bwght), tiene el número de cigarrillos consumido diariamente
por la madre (cigs) y el ingreso familiar anual (faminc), medido en miles de dólares.
• ¿Qué sucede con nuestros estimadores MCO si medimos el peso del
recién nacido en libras (bwghtlbs) en lugar de en onzas?
• ¿Qué sucede si cambiamos las unidades de medida de cigs?
• ¿Qué sucede con nuestros estimadores MCO si medimos el peso del
recién nacido en libras (bwghtlbs) en lugar de en onzas?
VARIABLE
DEPENDIENTE bwghtlbs = bwght / 16 1 libra = 16 onzas
NUEVA
1. El término constante y todas las pendientes se dividen por 16 (÷ 16).
2. Los errores estándar también son 16 veces más pequeños (÷ 16).
3. La suma de los cuadrados de los residuos se divide por 256 (÷ 16 al
cuadrado).
LOS COEFICIENTES DE
LA CONSTANTE Y DE LAS
PENDIENTES SE DIVIDEN
TAMBIÉN POR 16, DE
TAL FORMA QUE EL
/16
EFECTO DE UNA
VARIACIÓN DE XJ
SOBRE Y SIGUE SIENDO
EL MISMO
/16
CETERIS PARIBUS, POR
CADA CIGARRILLO DE
/16 MÁS QUE FUMA LA
MADRE EL PESO DEL
RECIÉN NACIDO SE
REDUCE EN 0,0289
LIBRAS, LO QUE EQUIVALE
A 0,0289*16=0,4634
ONZAS
¡NO!
/16
EL CAMBIO DE ESCALA
EN LA VARIABLE
DEPENDIENTE NO
AFECTA A LOS
ESTADÍSTICOS T NI, POR
/16 LO TANTO, A LA
SIGNIFICATIVIDAD DE
LOS COEFICIENTES.
βˆcigs −0,4634
tβˆ = = =−5,06
cigs
se(βˆcigs) 0,0916
• ¿Qué sucede si cambiamos las unidades de medida de cigs? Definamos
packs como el número de paquetes de cigarrillos consumidos diariamente.
EL COEFICIENTE Y EL ERROR
ESTÁNDAR DE LA VARIABLE
PACKS SON IGUALES A LOS
DE LA VARIABLE CIGS
MULTIPLICADOS POR 20
X20 ¡NO!
EL ERROR ESTÁNDAR DE LA
PENDIENTE SE MULTIPLICA
TAMBIÉN POR 20, DE TAL
FORMA QUE EL
ESTADÍSTICO T NO CAMBIA
EL CAMBIO DE ESCALA
EN UNA VARIABLE
INDEPENDIENTE NO
AFECTA A LA
SIGNIFICATIVIDAD DE
SUS COEFICIENTES.
X20
βˆpacks −9,268
tβˆ = = =−5,06
packs
se(βˆpacks) 1,832
βˆcigs −0,4634
tβˆ = = =− 5,06
cigs
se(βˆcigs ) 0,0916
RECAPITULACIÓN
VARIABLE
VARIABLE A SIGNIFICATI BONDAD
EXPLICATIV CONSTANTE PENDIENTE ERROR
EXPLICAR ‐VIDAD DEL AJUSTE
A β0 β1 ESTANDAR
(Y) (TEST T Y F) R2
(X)
MODELO DE REGRESIÓN LINEAL → lineal en los parámetros
y = β0 + β1 x + u
Incrementos en el nivel de educación en una unidad (año) llevan aparejados un
incremento en el nivel del salario de 1.234 euros, independientemente del nivel de
educación inicial.
VBLE VBLE
MODELO INTERPRETACIÓN β1
DEP. INDEP.
ŷ = βˆ 0 − βˆ 1 X1 + βˆ 2 X12 ŷ = βˆ 0 + βˆ 1 X1 − βˆ 2 X12
y y
X1
X1
(
Δŷ ≈ βˆ 1 +2βˆ 2X1 ΔX1) Δŷ ΔX1 ≈ βˆ 1 +2βˆ 2X1
( )
X1
x = βˆ 1 2βˆ 2
*
1
X1 < X1* → “x” tiene un efecto positivo sobre “y” X1 > X1* → “x” tiene un efecto negativo sobre “y”
Ceteris paribus, incrementos en el nivel de la Ceteris paribus, incrementos en el nivel de la
variable x1 da lugar a un incremento de “y” variable x1 da lugar a una reducción de “y”
( )
x*1 = βˆ 1 2βˆ 2
X1 < X1* → “x” tiene un efecto negativo sobre “y” X1 > X1* → “x” tiene un efecto positivo sobre “y”
Ceteris paribus, incrementos en el nivel de la Ceteris paribus, incrementos en el nivel de la
variable x1 da lugar a una reducción de “y” variable x1 da lugar a un incremento de “y”
• La estimación de este modelo por MCO nos dice que la variable exper tiene
un efecto decreciente sobre wage.
• Concretamente, la rentabilidad de la experiencia se hace cero
aproximadamente a los 24,4 años:
exper *
= βˆ 1 /( 2 βˆ 2 ) = 0 . 298 /[ 2 ( 0 . 0061 )] ≈ 24 . 4
Δ price
= β 2 + β 3 sqrft
Δ bdrms
ÍNDICE
1.CAMBIO DE UNIDADES DE MEDIDA
2.FORMA FUNCIONAL
3.BONDAD DEL AJUSTE
SEC SCE
R =
2
=1−
STC STC
SOLUCIÓN: Coeficiente de determinación ajustado
El R2 ajustado tiene en cuenta el número de variables en el modelo:
R =1−
2 [SCE (n − k − 1)]
Se penaliza los modelos que
añaden muchas variables
[STC (n − 1)] independientes
Depende de k, por lo que cuando añadimos una nueva variable explicativa, SCE
disminuye, pero también lo harán los g.d.l, de forma que que el término
SCE/(n‐k‐1) podrá disminuir o aumentar.
Los estadísticos F sólo nos permiten seleccionar entre modelos anidados:
cuando el modelo restringido es un caso particular del modelo sin restringir.
COMPARACIÓN DE MODELOS
9Los estadísticos F nos permiten seleccionar entre MODELOS ANIDADOS
→ esto es, en aquellos casos en los que un modelo (modelo
restringido) es el caso particular del otro modelo (modelo sin
restringir).
9Sin embargo no nos permiten seleccionar entre MODELOS NO
ANIDADOS con mismo número de observaciones y misma variable
dependiente. En ese caso, ninguna especificación constituye un
caso particular de la otra.
9En esos casos el R2 ajustado nos permite identificar el modelo con
mayor capacidad explicativa.
VARIABLE COEFICIENTE ERR. TÍP. ESTAD T VALOR P VARIABLE COEFICIENTE ERR. TÍP. ESTAD T VALOR P
const 1.10332 1.57857 0.699 0.48998 const 2.61155 0.429500 6.080 <0.00001 ***
l_sales 0.301790 0.215561 1.400 0.17176 sales 0.000300633 0.000139314 2.158 0.03935 **
sq_sales ‐6.94397E‐09 3.72664E‐09 ‐1.863 0.07257 *
Media de la var. dependiente = 3.26563
Media de la var. dependiente = 3.26563
Desviación típica de la var. dependiente. = 1.87408
Desviación típica de la var. dependiente. = 1.87408
Suma de cuadrados de los residuos = 102.2
Suma de cuadrados de los residuos = 92.7054
Error típico de los residuos = 1.84572 Error típico de los residuos = 1.78794
R‐cuadrado = 0.0613286 R‐cuadrado = 0.148534
R‐cuadrado corregido = 0.0300396 R‐cuadrado corregido = 0.0898125
Grados de libertad = 30 Estadístico F (2, 29) = 2.52946 (valor p = 0.0971)
Log‐verosimilitud = ‐63.9852 Log‐verosimilitud = ‐62.4251
Criterio de información de Akaike (AIC) = 131.97 Criterio de información de Akaike (AIC) = 130.85
Criterio de información Bayesiano de Schwarz (BIC) = 134.902 Criterio de información Bayesiano de Schwarz (BIC) = 135.247
Criterio de Hannan‐Quinn (HQC) = 132.942 Criterio de Hannan‐Quinn (HQC) = 132.308