Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alberto Nogales
alberto.nogales@ufv.es
Curso 2020-2021
Índice
Aplicaciones:
1. Cómo influye la altura de un padre en la de un hijo.
2. Relación entre los gastos de promoción de una
empresa y sus ingresos.
3. Estimar el valor de una vivienda según su tamaño.
Definición del problema
• Objetivo: obtener estimaciones razonables de Y para
distintos valores de X a partir de una muestra de n
pares de valores (x1 , y1 ), . . . , (xn , yn ).
Definición del problema
1) Si ambas variables están realmente relacionadas
entre sí o si, por el contrario, pueden considerarse
independientes.
Pero OJO!!!!
No siempre se cumple (no lineal y no cercano a 0)
Definiciones: tipos de relación
Ejercicio: ¿Cuál es su r? ¿Tipo de relación?
Regresión lineal simple
Tomando la ecuación de una línea en geometría:
– y = m*x + b
– m es la pendiente
– b constante donde corta con el eje y
Qué se obtiene:
Relación lineal o no.
Modelo de regresión lineal.
Intercepto: punto medio del modelo, la media.
Pendiente: efecto que tiene X sobre Y.
Residuo: error que se comete al predecir.
Regresión lineal simple
Por lo tanto para regresión tendremos que encontrar la
recta que mejor se adapte al conjunto de datos.
Pendiente (β1);
Intercepto; ӯ – β1𝑥̅
Regresión lineal simple
Ejemplo (Acidez total (Y) y libre (X) en la miel):
1) Se calculan las variables anteriores con:
3) Se crea el modelo
Regresión lineal simple
4) Se dibuja e interpreta
Regresión lineal simple
Ej (edad y peso): 1) Tipo de correlación
Sumatorios
!"
Xi Yi Xi2 Yi2 Xi*Yi 𝑥̅ = = 5
Id Edad Peso "
1 2 14 2 14 4 196 28 152
2 3 20 3 20 9 400 60 𝑦& = = 30,4
5
3 5 32 5 32 25 1024 160
𝑆x2 = 151/5 – 52 = 5,2
4 7 42 7 42 49 1764 294
5 8 44 8 44 64 1936 352 Sy2 = 5320/5 – 30,42 = 139,84
2) Modelos de regresión 25 152 151 5320 894
Sxy/Sy2 Sxy = 894/5 – 5*30,4 = 26,8
Distancia Nº Clientes
8 15
7 19
6 25
4 23
2 34
Regresión lineal simple
Solución: 1) Tipo de correlación 2) Modelos de regresión
Sy2 = 40,96
Sxy = -12,68
r = -0,91
u = Residuo.
0,43 2,10 3
0,31 1,10 4
0,32 0,90 5
0,46 1,60 4
1,25 6,20 4
0,44 2,30 3
0,52 1,80 6
0,29 1,00 5
1,29 8,90 3
0,35 2,40 2
0,35 1,20 4
0,78 4,70 3
0,43 3,50 2
0,47 2,90 3
0,38 1,40 4
Regresión lineal múltiple
0,43 1 2,1 3 Gasto de Ingresos Tamaño
alimentación
0,31 1 1,1 4 0,43 2,10 3
0,32 1 0,9 5 0,31 1,10 4
0,46 1 1,6 4 0,32 0,90 5
1,25 1 6,2 4 0,46 1,60 4
0,44 1 2,3 3 1,25 6,20 4
0,52 1 1,8 6 𝛽# 𝑢# 0,44 2,30 3
0,43 3,50 2
0,47 1 2,9 3
0,47 2,90 3
0,38 1 1,4 4
0,38 1,40 4
Regresión lineal múltiple
Yi X1i X2i X1i 2 X2i 2 X1iX2i X1iYi X2iYi
0,43 2,10 3 4,41 9 6,3 0,903 1,29
0,31 1,10 4 1,2 16 4,4 0,341 1,24
0,32 0,90 5 0,81 25 4,5 0,288 1,6
0,46 1,60 4 2,56 16 6,4 0,736 1,84
1,25 6,20 4 38,44 16 24,8 7,750 5
0,44 2,30 3 5,29 9 6,9 1,012 1,32
0,52 1,80 6 3,24 36 10,8 0,936 3,12
0,29 1,00 5 1 25 5 0,29 1,45
1,29 8,90 3 79,21 9 26,7 11,481 3,87
0,35 2,40 2 5,76 4 4,8 0,84 0,7
0,35 1,20 4 1,44 16 4,8 0,42 1,4
0,78 4,70 3 22,09 9 14,1 3,666 2,34
0,43 3,50 2 12,25 4 7 1,505 0,86
0,47 2,90 3 8,41 9 8,7 1,363 1,41
0,38 1,40 4 1,96 16 5,6 0,532 1,52
15 42 55 𝛽# 8,07
42 188,08 140,08 𝛽$ = 32,063
55 140,08 219 𝛽! 28,96
Regresión lineal múltiple
-1
𝛽# 15 42 55 8,07
𝛽$ = 42 188,08 140,08 32,063
𝛽! 55 140,08 219 28,96
𝛽# −0,16
𝛽$ = 0,149 Y = -0,16 + 0,149X1 +0,077X2 + u
𝛽! 0,077
Regresión lineal múltiple
Ej (Ganancias (Y), experiencia(X1) y horas dedicadas(X2)):
$ $ $
! 𝑌𝑖 = 1625,5 ! 𝑌𝑖 𝑋1𝑖 = 4862,9 ! 𝑋1𝑖 % = 46
!"# !"# !"#
$ $ $
! 𝑋1𝑖 = 14 ! 𝑌𝑖 𝑋2𝑖 = 63196, 9 ! 𝑋2𝑖 % = 7477
!"# !"# !"#
$ $
! 𝑋2𝑖 = 193 ! 𝑋1𝑖𝑋2𝑖 = 549 𝑛=5
!"# !"#
Aplicaciones:
- Un paciente deja de fumar o no después del tratamiento.
- Un paciente muere o no antes del alta.
- Un paciente positivo al VIH está o no en el estado IV.
Regresión logística
Se basa en la función logística y se expresa de la
siguiente manera: