Documentos de Académico
Documentos de Profesional
Documentos de Cultura
06 Multicolinealidad PDF
06 Multicolinealidad PDF
Multicolinealidad
Máximo Camacho
Introducción
Multicolinealidad exacta
• Consecuencias sobre la estimación
• ¿Cómo detectarla?
• ¿Cómo corregirla?
Multicolinealidad aproximada
• Consecuencias sobre la estimación
• ¿Cómo detectarla?
• ¿Cómo corregirla?
Conclusiones
i Notas Yi
i Porcentaje de alumnos que pueden pedir ayuda para comedor X3i (PAC)
nuevas
i Porcentaje de alumnos que pueden pedir ayuda por renta baja X4i (PAR)
Supuestos
Exogeneidad débil E (ε i χ i ) = E (ε i ) = 0
Muestras aleatorias ⇒ E (ε i χ j ) = E (ε i ) = 0 E (ε iε j ) = E (ε i )E (ε j ) = 0
Normalidad ε X~N
Definición
i Una o varias variables explicativas son una combinación lineal de otra(s)
Ejemplos económicos
i .
Renta regional i = β 0 + β1interési + ε i
⎛ Y1 ⎞ ⎛1 X 11 X k 1 ⎞⎛ β 0 ⎞ ⎛ ε 1 ⎞
⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ Y2 ⎟ ⎜1 X 12 X k 2 ⎟⎜ β1 ⎟ ⎜ ε 2 ⎟
⎜ ⎟ = ⎜ ⎟⎜ ⎟ ⎜ ⎟
+
⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ Y ⎟ ⎜1 X 1n X kn ⎟⎠⎜⎝ β k ⎟⎠ ⎜⎝ ε n ⎟⎠
⎝ n ⎠ ⎝
βˆ ( X ' X )−1
X 'Y
No podemos encontrar de forma única MCO =
¿Cómo detectarlo?
i Los programas “se quejarán” de que no podemos invertir matriz (X’X)
¿Cómo corregirlo?
i Se deben a errores del investigador al introducir las explicativas
Corrección
Renta regionali = α 0 + ε i α 0 = β0 + β1 4
α 0 = β0
Cotización i = α 0 + α1ingresosi + α 2gastos i + ε i α1 = β1 + β3
α 2 = β 2 − β3
Definición
i Una o varias variables explicativas son una combinación lineal aproximada de otra(s)
i Supongamos que X1 es buena explicativa pero comb. lineal aproximada de las demás
X 1i = α 0 + α 2 X 2i + ... + α k X ki + u1i
Ejemplos económicos
Porcentaje de alumnos que pueden pedir ayuda por renta baja
ˆ
β ( X ' X )−1
X 'Y
Podemos encontrar de forma única MCO =
i Y definimos 2
2
R = 1−
SCR1
= 1−
∑ uˆ1i
1 2
STC1 ( X
∑ 1i 1− X )
Máximo Camacho Econometría I - ADE+D 11/12 - Tema 6 10
3. Multicolinealidad aproximada
3.2. Implicación para el modelo
i Estimación imprecisa e intervalos de confianza muy grandes ⎛⎜ βˆ1 ± tn− K ,α / 2 vâr βˆ1 ⎞⎟
⎝
( )⎠
i Ejemplos:
i (
Si X1 no se relacionara ( R21 = 0 ) var βˆ1 X = σ )
2
∑ (X 1i − X1 )
2
i Bajo 3 supuestos de R21 (0, 0.9 y 0.99). Siempre se cumplen los supuestos clásicos
casi esperanzas
β̂ ( 8.0 , 5.1, -3.0 ) ( 7.9, 5.1,-3.2 ) ( 7.9, 5.2, -3.3 )
(insesgados)
( )
var βˆ1 0.23 1.29 11.22
aumentan mucho
var(βˆ )2 0.23 1.06 11.03
βˆi
t* = ~ tn− K
( )
vâr βˆi
- tn-K,α/2 tn-K,α/2
720 720 80
70
700 700
60
680 680
50
NOTAS
NOTAS
PAR
660 660 40
30
640 640
20
620 620 10
600 600 0
0 10 20 30 40 50 60 70 80 0 20 40 60 80 100 0 20 40 60 80 100
i El problema viene dado por R2j altos que indican alta relación lineal
i Crítica ¿cómo de grande debe ser R2j para preocuparnos por multicolinealidad?
* R 2j 3
CSC: H 0 : α1 = 0, α 2 = 0, α 3 = 0 F =
i j
(1 − R ) (n − 4)
2
j
i Crítica. Con n grande RH0 con demasiada frecuencia: recuerda que R21 = 0.04 !!!
Notˆasi = 700.39− 1.01 REPi − 0.13 PNI i − 0.52 PACi − 0.04 PARi ⇒ R = 0.77
2
( 4.69) (0.23) ( 0.03) ( 0.03) ( 0.06)
⎧ t1* = −4.23
βˆi
⎪ *
⎪ t 2 = −3.81 * R2 4
F =
ti* =
( )⎨ *
vâr βˆi ⎪t3 = −16.42 (1 − R ) (n − 5) = 357
2
⎪ t * = −0.78
⎩ 4
*
t3
*
t1 *
t4
* *
t2 F
r Globalmente significativas
r Regresamos usando Z Y = Zα + ε
Yi = β1 X 1i + ε i ~
β1
~ ⎛ βi ⎞
ECM (β1 ) t = ⎜⎜ ⎟
ECM (βˆ1 )
(
= 1 + R22 t 2 − 1 ) ⎝ var(βi ) ⎟⎠
r En nuestro ejemplo
Notˆasi = 700.39 − 1.01 REPi − 0.13 PNI i − 0.52 PACi − 0.04 PARi * βˆ4
t4 = = 0.78
( 4.69 ) (0.23) ( 0.03) ( 0.03) ( 0.06 )
( )
vâr βˆ4
r ¿Qué hacemos?
q Parece que tanto PAC como PAR contienen la misma información sobre los
X-4
X-4 X4
X4
caso 1 caso 3
X-4
X-4
X4
X4
caso 2 caso 4
Multicolinealidad
i Relación lineal entre las variables explicativas del modelo
Exacta
i Teoría: nunca hay porque suponemos !
i Práctica: fácil de detectar y resolver
Aproximada
i Da lugar a estimaciones imprecisos, varianzas e intervalos de confianza grandes
i Difícil de detectar y de corregir
¿Qué hacer?
i Asegurarnos de que tenemos multicolinealidad: todas pruebas y teoría económica
i No significativa y la información sobre Y ya está en las que quedan: eliminarla
i No significativa pero la información sobre Y ya está en las que quedan: la dejamos