Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IV. Construcción Del Modelo Nuevo Final
IV. Construcción Del Modelo Nuevo Final
MODELOS DE REGRESIN
APLICADOS
Transformaciones de Box-Cox.
Mnimos cuadrados ponderados.
Componentes principales.
Regresin robusta.
Regresin polinomial.
~ N (0, I ) 2
Supuestos sobre las variables
Incorrecto Correcto
-50 -30 -10 0 -50 -30 -10 0
10
20
V1 V1
10
5
0
0
-10
-5
-30
-10
y1 y1
0
-10 0
-10
-30
-30
-50
-50
10
10
x1 x1
5
5
0
0
-5
-5
-30 -10 0 10 20 -5 0 5 10 -10 -5 0 5 10 -5 0 5 10
Los grficos sugieren la relacin de la variable, pare ver
que tipo de transformacin usamos, lo que queremos
hacer es normalizar los residuos. Los landas lo
encontramos de la verosimilitud, pero como un
parmetro ms, queremos estimar un parmetro ms
Diagnsticos de linealidad: Grficos de
residuos: Modelo logartmico en y
Incorrecto Correcto
0.0e+00 1.0e+08 2.0e+08 0.0e+00 1.0e+08 2.0e+08
10
V1 V1
5
1.0e+08
0
0.0e+00
-5
-10
2.0e+08
2.0e+08
y2 y2
1.0e+08
1.0e+08
0.0e+00
0.0e+00
10
10
x1 x1
5
5
0
0
-5
-5
0.0e+00 1.0e+08 -5 0 5 10 -10 -5 0 5 10 -5 0 5 10
Diagnsticos de linealidad: Grficos de
residuos: Modelo inverso
Incorrecto Correcto
0 2 4 6 0 2 4 6
3
V1 V1
2
1
1
0
0
-1
-1
y3 y3
6
6
4
4
2
2
0
0
10
10
x1 x1
5
5
0
0
-5
-5
-1 0 1 2 -5 0 5 10 -1 0 1 2 3 -5 0 5 10
Transformacin de Box-Cox
=0.5
=0 Y = ln(Y)
=-0.5
=-1
Estimacin de va Mxima Verosimilitud
95%
-100
log-Likelihood
-110
-120
-130
-2 -1 0 1 2
Transformacin de Box-Cox
95%
-200
-300
log-Likelihood
-400
-500
-600
-2 -1 0 1 2
Transformacin de Box-Cox
15
25
20
10
Frequency
Frequency
15
10
5
5
0
0 10 20 30 40 -6 -4 -2 0 2 4
yexp log(yexp)
Transformacin de Box-Cox
-160
-162
Lambda para una gamma
95%
-164
log-Likelihood
-166
-168
-170
-172
-2 -1 0 1 2
Transformacin de Box-Cox
log vuelve mas asimtrica la distri
Histogram of ygamma Histogram of log(ygamma)
12
15
10
10
8
Frequency
Frequency
6
4
5
2
0
ygamma log(ygamma)
Mnimos Cuadrados Ponderados
ln(y2/y1)=b1
b1=0.02 Por cada aumento en una unidad, y cambia en 0,02 es decir 2%
Objetivo de los Mnimos Cuadrados Ponderados
Sigma sub i
w = (XWX)-1 XWY
Y la matriz de variancia covariancia sera:
2[w]= (XWX)-1
Cuando las variancias de los errores no se conocen.
e2i es un estimador de 2i
Si la heteroscedasticidad se observa
en los grficos de x vs los residuos con una
forma de megfono:
Regresin de los residuos absolutos vs. x
en los grficos de predichos contra residuos
con una forma de megfono:
Regresin de los residuos absolutos vs. los
predichos.
en los grficos de x o predichos, vs residuos
al cuadrado con forma creciente,
Regresin de los residuos al cuadrado vs. X o los
predichos
Modelos heteroscedsticos
Objetivo de los Modelos heteroscedsticos
= 1 ( )
(i) es una funcin escalar no negativa definida por la
distribucin de probabilidad de la yi | xi
wi es una ponderacin conocida
i es un parmetro de dispersin relativo a la
observacin i.
Modelos Heteroscedsticos
Distintos nombres:
Modelos heteroscedsticos
Modelos lineales generalizados dobles
Regresin Robusta
Objetivo de la Regresin Robusta
Bi-cuadrtica (Bisquare):
wi = si |ui| 4.685
wi = 0 si |ui|>4.685
Otros mtodos de Regresin Robusta
B3=function(D,d)
{
E=D[d,] objeto= lm(E$y~E$x)
(objeto$coefficients[2])
}
resp3=boot(data,B3,1000)
resp3
Componentes Principales
Objetivo del Mtodo de Componentes Principales
para controlar Multicolinealidad
O en trminos matriciales:
Zi=aiTX
a2i1+a2i1++a2i,p-1=1
en trminos matriciales:
aiTai=1
Lgica del ACP
Suponga que la matriz S es la matriz de variancia-
covariancia de la matriz X.
Entonces se tiene que encontrar una matriz A tal que:
Var(Z1)>Var(Z2)>Var(Z3)>>Var(Zp-1)
> porc.var=nuevos$sdev/sum(nuevos$sdev)
> porc.var
[1] 0.40937206 0.16875772 0.11726747
0.10074550 0.09619392 0.06855036
0.03911297
Salidas de componentes principales
> round(nuevos$rotation,4)
PC1 PC2 PC3 PC4 PC5 PC6 PC7
mpg -0.3800 -0.1979 -0.3942 0.6321 -0.4451 0.2506 0.0240
headroom 0.2821 -0.7701 -0.2180 -0.4303 -0.3070 0.0168 -0.0016
trunk 0.3576 -0.4506 0.1655 0.5959 0.4954 -0.1846 0.0844
weight 0.4263 0.1818 0.0476 0.0270 -0.1103 0.5342 0.6961
length 0.4273 0.0968 0.1923 0.1366 -0.1479 0.4869 -0.7025
turn 0.3974 0.2243 0.1257 0.2017 -0.6029 -0.6074 0.0522
gear_ratio -0.3547 -0.2683 0.8454 0.0045 -0.2542 0.1068 0.1071
Salidas de componentes principales
> summary(modelo.pca)
Call:
lm(formula = price ~ tamanyo + pesados.peq + marcha.poco.millaje +carros.cajuela)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6165.3 307.1 20.075 < 2e-16 ***
tamanyo 575.0 138.5 4.151 9.32e-05 ***
pesados.peq 544.3 336.0 1.620 0.110
marcha.poco.millaje 679.6 483.6 1.405 0.164
carros.cajuela -230.2 562.9 -0.409 0.684
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1