Tipos de Modelos ML
Los modelos supervisados son aquellos en los que el
algoritmo aprende a partir de datos etiquetados,
donde cada entrada tiene una salida correspondiente
conocida. Estos modelos se utilizan principalmente
para tareas de predicción y clasificación, y requieren
conjuntos de datos con respuestas o etiquetas claras
para entrenarse eficazmente.
La regresión es un tipo de aprendizaje supervisado
donde el objetivo es predecir un valor numérico
continuo. Se usa para modelar relaciones entre
variables independientes y una variable dependiente
continua, ayudando a comprender cómo cambian las
predicciones en función de las variables de entrada.
La regresión lineal asume una relación lineal entre las
variables de entrada y la salida; es decir, la predicción
se realiza mediante una suma ponderada de las
Regresión Lineal
variables independientes más un término constante.
Es sencilla, interpretable y efectiva para relaciones
Modelos Supervisados lineales simples.
La regresión polinómica extiende la lineal
permitiendo relaciones no lineales mediante la
Polinómica inclusión de términos polinómicos de las variables
independientes, lo que posibilita ajustar curvas más
complejas en los datos.
La clasificación es un tipo de aprendizaje supervisado
donde el objetivo es asignar una etiqueta o categoría
a cada entrada basada en sus características. Es
fundamental en problemas donde es necesario
distinguir entre diferentes clases o categorías.
KNN clasifica una instancia en función de las clases
de sus vecinos más cercanos en el espacio de
Clasificación K-Vecinos Más Cercanos (KNN) características. Es simple, basado en la proximidad, y
funciona bien con conjuntos de datos pequeños y con
pocas dimensiones.
Las SVM buscan encontrar el hiperplano que maximiza
la separación entre clases en el espacio de
Máquinas de Vectores de Soporte (SVM) características, siendo efectivas en problemas
lineales y no lineales mediante kernels, y útiles en
casos con margen de separación definido.
Los modelos no supervisados trabajan con datos sin
etiquetas, buscando encontrar patrones, estructuras
o agrupaciones en los datos, y son útiles en
exploración de datos y reducción de dimensionalidad.
El agrupamiento permite dividir los datos en grupos
o clústeres basados en similitudes internas, sin
etiquetas predefinidas.
K-Medias divide los datos en K grupos minimizando
la variación interna dentro de cada grupo, iterando
para ajustar centroides hasta converger. Es eficiente K-Medias Agrupamiento (Clustering)
y ampliamente usado en segmentación de clientes y
análisis exploratorio.
Modelos No Supervisados
El método jerárquico construye una dendrograma
que representa agrupaciones en diferentes niveles de
Jerárquico
similitud, permitiendo una exploración flexible de la
estructura de datos jerárquica.
Técnicas que simplifican datos con muchas variables,
conservando la mayor parte de la información
relevante, facilitando visualización y análisis.
PCA transforma los datos en un nuevo conjunto de
variables ortogonales (componentes principales)
ordenadas por la varianza explicada, permitiendo PCA (Análisis de Componentes Principales) Reducción de Dimensionalidad
reducir dimensiones manteniendo la mayor
información.
t-SNE es una técnica no lineal que proyecta datos de
alta dimensión en dos o tres dimensiones,
t-SNE
preservando las relaciones locales y permitiendo
visualizaciones efectivas de agrupaciones complejas.
Los modelos semi supervisados combinan datos
etiquetados y no etiquetados, aprovechando la gran
cantidad de datos no etiquetados para mejorar el
aprendizaje cuando las etiquetas son escasas o
costosas.
Modelos Semi Supervisados
Son ideales en escenarios donde obtener etiquetas
es difícil o costoso, pero se dispone de abundantes
datos no etiquetados, ayudando a mejorar la
Uso en problemas con poca data etiquetada
precisión de los modelos supervisados tradicionales
mediante técnicas de propagación de etiquetas o
autoentrenamiento.
El aprendizaje por refuerzo se basa en agentes que
aprenden a tomar decisiones mediante interacciones
con un entorno, recibiendo recompensas o
penalizaciones.
Algoritmo que busca aprender la función de valor Q,
que indica la utilidad de tomar una acción en un
estado dado, mediante una política iterativa que
Q-Learning Modelos por Refuerzo
maximiza las recompensas acumuladas.
Una extensión del Q-learning que usa redes
neuronales profundas para aproximar la función Q en
Deep Q-Networks (DQN)
entornos complejos, permitiendo aplicaciones en
juegos, robótica y control autónomo.
Diversas metodologías que no encajan estrictamente
en los modelos anteriores, pero que son
fundamentales en diferentes aplicaciones y avances
en ML.
Técnica que reutiliza modelos preentrenados en
tareas similares para acelerar el entrenamiento y
Aprendizaje por Transferencia mejorar el rendimiento en tareas nuevas,
especialmente en visión por computadora y
procesamiento de lenguaje natural.
Modelos con múltiples capas que aprenden
representaciones jerárquicas de datos complejos,
Otros Modelos y Técnicas Redes Neuronales Profundas (Deep Learning)
logrando avances en reconocimiento de voz, visión y
traducción automática.
Modelos que toman decisiones mediante estructuras
en forma de árbol, dividiendo los datos en función de
Árboles de Decisión
reglas basadas en atributos, fáciles de interpretar y
usar en clasificación y regresión.
Conjuntos de árboles de decisión que promedian sus
predicciones para mejorar precisión y evitar
Bosques Aleatorios
sobreajuste, siendo robustos y versátiles en tareas
supervisadas.