Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Jonathan Acosta
Clase en vivo 1
Line los
Y po + B
=
x + 2
L
~ a
S
,
orremetros
B x
Y B
=
+ P, X + ,
+ 24
Jonathan Acosta (UC) EPG4506 Clase en vivo 1 8 / 32
El problema de Regresión
El problema de Regresión
El problema de Clasificación
1
P(G = K|X = x) = K
X
>
1+ exp( l0 + l x)
l=1
1
P(G = K|X = x) = K
X
>
1+ exp( l0 + l x)
l=1
Para poder estimar los parámetros del modelo, se necesita asociar un mo-
delo de probabilidad a los datos.
Jonathan Acosta (UC) EPG4506 Clase en vivo 1 16 / 32
El problema de Clasificación: Regresión Logı́stica
U ( ) = r`( ) = 0
2
Criterio del Rajustado : Eliminar aquellas variables que no aporten de ma-
nera significativa en este coeficiente, se puede establecer un porcentaje
mı́nimo de mejora. (Aplicable al caso de regresión)
2
Criterio del Rajustado : Eliminar aquellas variables que no aporten de ma-
nera significativa en este coeficiente, se puede establecer un porcentaje
mı́nimo de mejora. (Aplicable al caso de regresión)
Criterio del p-valor de los parámetros del modelo: Quitar aquellas variables
cuyo p-valor sea mayor a la significancia establecida.
2
Criterio del Rajustado : Eliminar aquellas variables que no aporten de ma-
nera significativa en este coeficiente, se puede establecer un porcentaje
mı́nimo de mejora. (Aplicable al caso de regresión)
Criterio del p-valor de los parámetros del modelo: Quitar aquellas variables
cuyo p-valor sea mayor a la significancia establecida.
H0 : = 0 vs. H1 : = 1
H0 : = 0 vs. H1 : = 1
Para poner a prueba las hipótesis anteriores considere la diferencia de los es-
tadı́sticos de Deviance:
⇣ ⌘
D = D0 D1 = 2 `( b0 ) `( b1 ) ⇠ 2p q
(D0 D1 )/(p q)
F = ⇠ Fp q,n p
D1 /(n p)
Obs: Por lo general se construye una tabla ANOVA con varios modelos anida-
dos, indicando la variación de Deviance y el p-valor de las pruebas anteriores.
Modelo 1: y = 0 + 1 · t + "t
Modelo 2: y = 0 + 1 ·t+ 2 · t2 + " t
Modelo 3: y = 0 + 1 ·t+ 2 · t2 + 3 · t3 + " t
Modelo 1: y = 0 + 1 · t + "t
Modelo 2: y = 0 + 1 ·t+ 2 · t2 + " t
Modelo 3: y = 0 + 1 ·t+ 2 · t2 + 3 · t3 + " t
AIC BIC
1 -110.95 -102.21
2 -196.27 -184.62
3 -196.28 -181.72
AIC BIC
1 -110.95 -102.21
2 -196.27 -184.62
3 -196.28 -181.72
Si, además, se sabe que la inversa de la matriz X > X, donde el orden corres-
ponde al modelo 2, es
0 1
0,6758016 0,007303 0,001341
(X > X) 1 = @ 0,007303 0,000125 0,0000276 A
0,001341 0,0000276 0,0000064
Trevor Hastie, Robert Tibshirani and Jerome Friedman (2008) The Ele-
ments of Statistical Learning Data Mining, Inference, and Prediction.
Springer Series in Statistics.