Ia 2

UNIVERSIDAD INDUSTRIAL DE SANTANDER
ESCUELA DE INGENIERÍA DE SISTEMAS E INFORMÁTICA
Inteligencia artificial 2 B1
Reto 1
PRESENTADO POR:
MIGUEL SANTIAGO HENAO ALVARADO COD:2210084
PROFESOR:
Luis Carlos Guayacán
Bucaramanga
2024
Reto 1
Modelo de regresion
Número de capas: 4
Número de neuronas en cada capa: [28, 140, 40, 1]
Tamaño de la entrada: 28
Tamaño de salida de la red: 1

Reto 1
Modelo de clasificacion
Número de capas: 4
Número de neuronas en cada capa: [9, 140, 40, 2]
Tamaño de la entrada: 9
Tamaño de salida de la red: 2

Reto 1
Hiperparametros en modelo de regresión:
Número de capas y neuronas: Entre diferentes experimentos creo que las dos capas ocultas de
140 y 40 me dieron un buen ejemplo, porque cuando miré y comparé las gráficas vi que este
cambio fue exitoso.
Funciones de activación: Relu (Rectified Linear Unit) es una opción común para las capas ocultas
debido a su simplicidad y eficacia en la mayoría de los casos.
Optimizador Adam es una herramienta popular y eficaz para aumentar la tasa de aprendizaje
durante la formación. Funciona bien para una variedad de problemas y parece una buena opción
como punto de partida.
Función de pérdida: el error cuadrático medio (MSE) es una función de pérdida común para
problemas dinámicos. Es sensible a los factores externos y castiga de manera efectiva los errores
mas grandes
Número de epoch: 100 epoch es un valor comúnmente utilizado como punto de partida. Me
parecio suficiente para ver cómo evoluciona el entrenamiento y si el modelo está convergiendo.
Tamaño del lote (batch size): Un tamaño de lote de 32 es un valor comúnmente utilizado y suele
ser eficiente en términos de velocidad de entrenamiento y estabilidad.
Tamaño de la división de validación: El 20% es una división de datos de validación comúnmente

utilizada. Permite reservar una cantidad significativa de datos para la validación sin sacrificar
demasiado los datos de entrenamiento.
Reto 1
Hiperparametros en modelo de clasificacion:
Número de capas y neuronas: Basándome en el modelo anterior decidí usar el mismo tipo de
capas.
Funciones de activación: Usando un simulador, vi que Relu era la opción mas viable para la
clasificación
Optimizador: Adam es una herramienta popular y eficaz para aumentar la tasa de aprendizaje
durante la formación. Funciona bien para una variedad de problemas y parece una buena opción
como punto de partida.
Función de pérdida He utilizado la función de pérdida sparse categorical crossentropy.Esta función

de pérdida es adecuada para problemas de clasificación con múltiples clases.
Número de epoch: 100 epoch es un valor comúnmente utilizado como punto de partida. Me
pareció suficiente para ver cómo evoluciona el entrenamiento y si el modelo está convergiendo.
Tamaño del lote (batch size): Un tamaño de lote de 32 es un valor comúnmente utilizado y suele
ser eficiente en términos de velocidad de entrenamiento y estabilidad.
Tamaño de la división de validación: El 20% es una división de datos de validación comúnmente

utilizada. Permite reservar una cantidad significativa de datos para la validación sin sacrificar
demasiado los datos de entrenamiento.
Reto 1
Resultados del modelo de regresión:
Use también el validation loss ( línea amarilla ) , mide la discrepancia entre las predicciones del
modelo y las etiquetas verdaderas en el conjunto de datos de validación , junto con el valor de loss
( línea azul ) , la cual simboliza la discrepancia entre las predicciones del modelo y las etiquetas
verdaderas en el conjunto de datos de entrenamiento.
Todos los datos están escalados para así mejorar su rendimiento

Reto 1
Este sería el modelo si en lugar de usar relu hiciéramos uso de tanh y un Batch size de 50 , como
podemos ver el modelo empeora , esto puede ser debido a que a un batch size tan grande genera
que haya menos generalización , el modelo solo se actualiza una vez por lote, haciendo que la
información que recibe sea menos variada y mas “ruidosa”.
Reto 1
Este seria el modelo si reducimos el batch size a 32 , y mantuviéramos la función tanh , como se
puede observar el loss y validation loss casi llegan a una convergencia esto puede ser debido a que
La función tanh es suave y diferenciable en todo su dominio. Esto puede llegar a ser ventajoso
durante el entrenamiento, ya que facilita el cálculo de gradientes y puede conducir a una
convergencia más estable del modelo.
Reto 1
Este es el modelo con la función relu , podemos ver que desde el inicio del entrenamiento , el
parámetro loss y validation loss , están casi iguales hasta los 10-15 epochs , la función relu es
también la mejor resultado nos ha brindado , esto puede ser a que la función ReLU es más simple
computacionalmente en comparación con la función tanh. La función ReLU simplemente devuelve
cero para valores negativos y la entrada misma para valores no negativos, mientras que la función
tanh involucra cálculos más complejos, como la exponenciación y la normalización.
Con esto, podemos decir que la función relu y un batch size de 32, nos dieron los mejores
resultados para nuestro modelo de regresión.
Reto 1
Resultados del modelo de clasificación:
Modelo con función sigmoid y su matriz de confusión
Modelo con función relu y su matriz de confusión

Reto 1
Modelo de función tanh y su matriz de confusión
Relu es por poco , la mejor función para esta clasificación

Reto 1
Conclusiones:
Con los diferentes hiperparametros que usamos pudimos determinar el mejor modelo para
nuestro problema, sin embargo, no se descarta que haya una manera que de mejores resultados.
Una posibilidad para mejorar el modelo puede ser en lugar de usar una matriz para la matricula ,
usar un aplanado de datos , el array se acomodaría mejor al tipo de datos que estamos
manejando.
Por otro lado, la diferencia principal entre un modelo de clasificación y un modelo de regresión
Modelo de clasificación: Se utiliza para predecir la etiqueta o categoría de una entrada. Es decir, la
salida es la categoría o clase a la que pertenece la entrada. Estos modelos son útiles cuando el
objetivo es clasificar datos en diferentes grupos, como predecir si un correo electrónico es spam o
determinar si una imagen contiene una persona u objeto. Para este fin se suelen utilizar
algoritmos de clasificación como la regresión logística, los árboles de decisión y las máquinas de
vectores de soporte.
Modelo de regresión: se utiliza para predecir valores continuos en función de las entradas. En
otras palabras, el resultado es un número que representa una cantidad medible, como el precio de
una vivienda en función de sus características, o la probabilidad de comprar un producto en
función del historial de compras de un cliente. Algoritmos de regresión, como la regresión lineal, la
regresión logística, y la regresión de bosques aleatorios, son aplicados para resolver este tipo de
problemas
Reto 1
Bibliografía:
Funciones de activación: Sigmoid, Tanh, ReLU, Leaky ReLU, Softmax. (2022, 28 octubre).
ICHI.PRO. https://ichi.pro/es/funciones-de-activacion-sigmoid-tanh-relu-leaky-relu-
softmax-88869174103717
How to interpret loss and accuracy for a machine learning model. (s. f.). Stack Overflow.
https://stackoverflow.com/questions/34518656/how-to-interpret-loss-and-accuracy-
for-a-machine-learning-model
Lightning AI. (2023, 17 mayo). Unit 9.5 Increasing Batch Sizes to Increase Throughput -
Lightning AI. https://lightning.ai/courses/deep-learning-fundamentals/9.0-overview-
techniques-for-speeding-up-model-training/unit-9.5-increasing-batch-sizes-to-
increase-throughput/
Max. (2020, 22 diciembre). Diferencia entre clasificación y regresión en machine learning.
Ingenierobeta.com. https://ingenierobeta.com/clasificacion-vs-regresion-machine-
learning/
Métricas de evaluación de modelos en el aprendizaje automático. (2023, 25 septiembre).
DataSource.ai. https://www.datasource.ai/es/data-science-articles/metricas-de-
evaluacion-de-modelos-en-el-aprendizaje-automatico
Science, B. o. C., & Science, B. o. C. (2023, 15 septiembre). Training and Validation Loss
in Deep Learning | Baeldung on Computer Science. Baeldung On Computer
Science. https://www.baeldung.com/cs/training-validation-loss-deep-learning
Reto 1
Shen, K. (2018, 20 junio). Effect of batch size on training dynamics - Mini Distill -
Medium. Medium. https://medium.com/mini-distill/effect-of-batch-size-on-training-
dynamics-21c14f7a716e
The Black Box Lab. (2022, 30 junio). Machine Learning: Algoritmos de clasificación y
regresión - The Black Box Lab. https://theblackboxlab.com/2022/05/06/machine-
learning-diferencias-entre-algoritmos-clasificacion-regresion/

Ia 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ia 2

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD INDUSTRIAL DE SANTANDER

ESCUELA DE INGENIERÍA DE SISTEMAS E INFORMÁTICA

MIGUEL SANTIAGO HENAO ALVARADO COD:2210084

Número de neuronas en cada capa: [28, 140, 40, 1]

Tamaño de salida de la red: 1

Número de neuronas en cada capa: [9, 140, 40, 2]

Tamaño de salida de la red: 2

Hiperparametros en modelo de regresión:

Tamaño de la división de validación: El 20% es una división de datos de validación comúnmente

Hiperparametros en modelo de clasificacion:

Función de pérdida He utilizado la función de pérdida sparse categorical crossentropy.Esta función

Tamaño de la división de validación: El 20% es una división de datos de validación comúnmente

Resultados del modelo de regresión:

Todos los datos están escalados para así mejorar su rendimiento

Resultados del modelo de clasificación:

Modelo con función sigmoid y su matriz de confusión

Modelo con función relu y su matriz de confusión

Modelo de función tanh y su matriz de confusión

Relu es por poco , la mejor función para esta clasificación

Lightning AI. https://lightning.ai/courses/deep-learning-fundamentals/9.0-overview-

Max. (2020, 22 diciembre). Diferencia entre clasificación y regresión en machine learning.

Métricas de evaluación de modelos en el aprendizaje automático. (2023, 25 septiembre).

in Deep Learning | Baeldung on Computer Science. Baeldung On Computer

Medium. Medium. https://medium.com/mini-distill/effect-of-batch-size-on-training-

regresión - The Black Box Lab. https://theblackboxlab.com/2022/05/06/machine-

También podría gustarte