Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Departamento de Matemática
FIQ - Basado en los slides del curso Introduction to machine learning de Hastie y
Tibshirani
Regresión lineal
Y = β0 + β1 X1 + · · · + βp Xp + (1)
Xp
= β0 + βj Xj + (2)
j=1
Pp
es el error y E(Y |X = x) = fL (x) = β0 + j=1 βj xj , acá
x indica el vector x = (x1 , . . . , xp ).
La verdadera función de regresión E(Y |X = x) es lineal
en x
Regresión lineal tiene como objetivo estimar a fL (x): la
mejor aproximación lineal a la función de regresión
verdadera dados datos que siguen el modelo
Mejor aproximación lineal
Regresión lineal para datos de propaganda
(advertising data)
Descripción de los datos.
Regresión lineal para datos de propaganda
(advertising data)
Preguntas:
¿Hay una relación entre cuanto se gasta en propaganda y
ventas?
¿Cuán fuerte es la relación entre cuanto se gasta en
propaganda y ventas?
¿Qué media contribuye mas a las ventas?
¿Cuan precisa es la predicción para futuras ventas?
¿Es lineal la relación?
¿Hay sinergia entre los diferentes medios de propaganda?
Regresión lineal para datos de propaganda
(advertising data)
Preguntas:
Nuestro modelo es
Y = β0 + β1 X1 + β2 X2 + · · · + βp Xp +
Interpretamos βj como el efecto promedio en Y cuando
Xj aumenta una unidad, manteniendo todos los otros
predictores fijos. En el caso de ventas (el ejemplo) el
modelo será
n
X
RSS = (yi − ŷi )2
i=1
n
X
= (yi − β̂0 − β̂1 xi1 − β̂2 xi2 − · · · − β̂p xip )2
i=1
Si llamamos
y1 x11 x12 ... x1p x̄1
n n
y2 x21 x22 ... x2p x̄2 1 X 1 X
y=
X = X̄ =
. . . x̄j = n
xij ȳ = yi
... ... ... ... ... n
i=1 i=1
yn xn1 xn2 ... xnp x̄p
β̂0 = ȳ − β̂ T x̄
β̂ = (X T X − nx̄x̄T )−1 X T (Y − ȳ1n )