Está en la página 1de 2

Profesor, Jose Damian Collazos

Técnicas de Aprendizaje de Maquina


Institución Universitaria Antonio Jose Camacho Grupo E05

Taller Práctico #2

El taller deberá ser entregado de forma organizada con un documento con los miembros
de los estudiantes donde, máximo por grupo son cuatro. Las preguntas podrán ser
realizadas en hoja de cálculo o Python, entregar esto con el documento informe. Si es
obligatorio realizar en Python y hoja de cálculo la pregunta (a y d).

Situación Problema a Resolver.

Un embotellador de bebidas gaseosas analiza las rutas de servicio de las máquinas


expendedoras en su sistema de distribución. Le interesa predecir el tiempo necesario
para que el representante de ruta atienda las máquinas expendedoras en una tienda. Esta
actividad de servicio consiste en abastecer la máquina con productos embotellados, y
algo de mantenimiento o limpieza. El ingeniero industrial responsable del estudio ha
sugerido que las dos variables más importantes que afectan al tiempo de entrega (y), son
la cantidad de cajas de producto abastecido, (x1) y la distancia caminada por el
representante, (x2) El ingeniero ha reunido 25 observaciones de tiempo de entrega que
se ven en la tabla; Se ajustará el modelo de regresión lineal múltiple.

Los datos de entrega se encuentra en la tabla.

Observació Tiempo de entrega Cantidad de cajas Distancia en pies


n (minutos) (y) (x1) x2
#
1 16.68 7 560
2 11.50 3 220
3 12.03 3 340
4 14.88 4 80
5 13.75 6 150
6 18.11 7 330
7 8.00 2 110
8 17.83 7 210
9 79.24 30 1460
10 21.50 5 605
11 40.33 16 688
12 21.00 10 215
13 13.50 4 255
14 19.75 6 462
15 24.00 9 448
16 29.00 10 776
17 15.35 6 200
18 19.00 7 132
19 9.50 3 36
20 35.10 17 770
21 17.90 10 140
22 52.32 26 810
23 18.75 9 450
24 19.83 8 635
25 10.75 4 150

a) Realizar una matriz de dispersión de los datos de tiempo de entrega. Es un


arreglo bidimensional de graficas bidimensionales, en las que, a excepción de
los de la diagonal, cada cuadro contiene un diagrama de dispersión. Así, cada
grafica trata de arrojar alguna luz sobre la relación entre un par de variables. Con
frecuencia esto es un mejor resumen de las relaciones. Si no es posible graficar
la dispersión por matriz, graficar cada valor de (X1,y) y (X2,y).
b) Realice regresión lineal usando los 20 primeros datos para, cada atributo
(Tiempo de entrega y Cantidad de cajas) contra distancia en pies.
c) Prediga con los 5 últimos datos e indique los errores; para cada atributo (Tiempo
de entrega y Cantidad de cajas) contra distancia en pies, con esto indique los
errores de la tabla.

Usando MSE MSE Baseline RMSE MAE R2


Peso
Altura

d) Realizar con los 20 primeros datos un regresión lineal de múltiples variables de


manera matricial en hoja de cálculo a pie, prediga con los 5 últimos, con esto
indique los errores de la tabla.

Usando MSE MSE Baseline RMSE MAE R2


Peso y Altura
con respecto a Y

e) En un hoja de cálculo realizar una regresión lineal de múltiples variables no


matricial indique cuales son los B0, B1,B2. Utilice el método establecido por la
hoja de cálculo y compare con la pregunta anterior.

Concluya si los modelos son menos precisos al trabajar de forma individual cada
parámetro o al aumentar la variables. Además de completar esta con colusión de dos
más.

Pegunta bonus:

1- Si logran desde Google colab llamar los datos desde un base de datos o hoja de
cálculo sheets y con esto responder las preguntas anteriores.
2- De forma interactiva encontrar B0, B1,B2, utilizando la función de costo al
aplicar la regresión línea. Realizar con los primeros 20 dato prueba de prueba en
la tabla y de test los cinco últimos, graficar la regresión de datos.

También podría gustarte