Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto financiado por el Ministerio de Educación y Formación Profesional - U.E. Next Generation
Dirección de proyecto UGT España:
Fernando Montalvo Martín
Coordinación de proyecto UGT España:
Manuela Jiménez Luna
2
Índice
Índice .................................................................................................................................................................. 3
1 INICIO ......................................................................................................................................................... 5
1.1 Consideraciones previas ........................................................................................................................ 5
1.2 Introducción............................................................................................................................................. 5
1.2.1 ¿Qué vas a aprender en esta unidad? ........................................................................................ 7
1.2.2 ¿Cómo vas a conseguir el gran reto de este módulo formativo? ............................................ 8
2 INTELIGENCIA ARTIFICIAL ....................................................................................................................... 9
2.1 Conjunto de entrenamiento .................................................................................................................... 9
3 APLICACIONES DEL APRENDIZAJE AUTOMÁTICO .............................................................................. 10
3.1 Clasificación .......................................................................................................................................... 10
3.2 Clustering ............................................................................................................................................... 10
3.2.1 Clasificación de datos .............................................................................................................. 11
3.2.2 Clusterización ............................................................................................................................ 11
3.3 Regresión ............................................................................................................................................... 11
3.4 Reducción de la dimensionalidad ........................................................................................................ 13
3.4.1 Entrenamiento para el reto ....................................................................................................... 14
4 ESCENARIOS DE ENTRENAMIENTO ...................................................................................................... 15
4.1 Aprendizaje supervisado ...................................................................................................................... 15
4.2 Aprendizaje no supervisado ................................................................................................................. 16
4.3 Aprendizaje semisupervisado .............................................................................................................. 16
4.4 Aprendizaje transductivo ...................................................................................................................... 16
4.5 Aprendizaje por refuerzo ...................................................................................................................... 17
5 ALGORTIMOS DE APRENDIZAJE SUPERVISADO .................................................................................. 18
5.1 K-Nearest Neighbors (kNN) ................................................................................................................... 19
5.1.1 EJEMPLO ................................................................................................................................... 19
5.2 Redes Neuronales Artificiales (Neural Networks o NN) ...................................................................... 19
5.2.1 EJEMPLO ................................................................................................................................... 19
5.3 Support Vector Machine (SVM)............................................................................................................. 20
5.3.1 EJEMPLO ................................................................................................................................... 20
5.4 Bosque aleatorio (Random Forest)....................................................................................................... 21
5.4.1 EJEMPLO ................................................................................................................................... 21
6 ALGORITMOS DE APRENDIZAJE NO SUPERVISADO ........................................................................... 22
6.1 K-means ................................................................................................................................................. 22
6.2 CLARA (Clustering Large Applications) ................................................................................................ 23
6.3 Caso de uso ........................................................................................................................................... 23
6.3.1 Entrenamiento para el reto ....................................................................................................... 24
3
7 CIERRE...................................................................................................................................................... 25
7.1¿Qué has aprendido en esta unidad?..................................................................................................... 25
7.2 Referencias bibliográficas .................................................................................................................... 26
8 ANEXOS ................................................................................................................................................... 27
8.1 Glosario .................................................................................................................................................. 27
8.1.1 Categoría binaria ....................................................................................................................... 27
8.1.2 Categoría multiclase ................................................................................................................. 27
8.1.3 Chatbot ...................................................................................................................................... 27
8.1.4 Centroide ................................................................................................................................... 27
8.1.5 Hiperplano ................................................................................................................................. 27
8.1.6 K-medoids .................................................................................................................................. 27
8.1.7 Nodo .......................................................................................................................................... 27
8.1.8 Perceptrón ................................................................................................................................. 28
4
1 INICIO
A lo largo del documento encontrarás algunas palabras con un enlace que te llevará al glosario del
curso para que puedas consultar su significado si así lo necesitas.
También encontrarás otros enlaces a vídeos o páginas web externas. Te recomendamos que los abras
pulsando el botón derecho del ratón y seleccionando la opción “Abrir hipervínculo” para que se muestren
en una ventana emergente distinta a la actual.
1.2 Introducción
Alexa y Siri
Gmail
Propone respuestas cortas o cadenas textuales para redactar un mensaje según el contenido escrito
previamente o sobre elementos del correo (asunto, remitente, cierre…).
5
Este sistema de ayuda almacena preguntas y dudas recurrentes para ofrecer la respuesta más adecuada.
6
1.2.1 ¿Qué vas a aprender en esta unidad?
a. Clasificación.
b. Clústering.
c. Regresión.
d. Reducción de la dimensionalidad.
3. Escenarios de entrenamiento.
a. Aprendizaje supervidado.
b. Aprendizaje no supervisado.
c. Aprendizaje semisupervisado.
d. Aprendizaje transductivo.
d. Random Forest.
a. K-means.
b. CLARA (Clustering Large Applications).
7
1.2.2 ¿Cómo vas a conseguir el gran reto de este módulo formativo?
8
2 INTELIGENCIA ARTIFICIAL
Para entender su potencial, debemos conocer a qué hace referencia el entrenamiento. Este término
alude a:
• El conjunto de instancias utilizadas para entrenar el algoritmo.
• El conjunto de validación es otro conjunto de ejemplos usados para ajustar los parámetros del
algoritmo.
• El conjunto de prueba evalúa su rendimiento después de entrenarlo según los parámetros
seleccionados.
9
3 APLICACIONES DEL APRENDIZAJE AUTOMÁTICO
Los problemas que pueden resolverse son tan diversos como las técnicas que se pueden aplicar.
Veámoslas.
3.1 Clasificación
Consiste en clasificar un ejemplo, asignándole una categoría, a partir de un conjunto finito de valores.
Puede ser binaria (dos clases) o multiclase (más de dos).
Un ejemplo sería identificar expresiones faciales a partir de una fotografía de una persona para
determinar qué emociones muestra.
3.2 Clustering
El clustering agrupa datos similares sin etiquetas predefinidas para descubrir patrones ocultos, según
su similitud o proximidad en el espacio. Busca maximizar la similitud intraclúster (los elementos dentro
del mismo clúster son similares) y minimizar la similitud interclúster (los elementos de diferentes
clústeres son diferentes).
Los clústeres pueden tener diferentes formas y tamaños. No todos los datos se agrupan en un clúster.
10
3.2.1 Clasificación de datos
Tipo de agrupamiento: Usa clases o categorías predefinidas en las que se asignan los objetos para la
agrupación.
Tipo de aprendizaje; Esta técnica pertenece al aprendizaje supervisado donde tenemos conocimiento
de datos de entrada mediante el etiquetado y podemos conocer las posibles salidas del algoritmo.
Existe una clasificación binaria que da respuestas a variables dicotómicas de dos opciones únicas.
3.2.2 Clusterización
Tipo de agrupamiento: Identifica similitudes entre los objetos de los conjuntos de datos, agrupándolas
según características comunes.
Tipo de aprendizaje: Esta técnica pertenece al aprendizaje no supervisado, donde solo disponemos de
conjuntos de datos de entrada, sin procesos de etiquetados sobre los que debemos obtener
información, sin conocer resultados o datos de salida.
Otro ejemplo son las plataformas como Netflix, que analiza el comportamiento de sus clientes y según
los resultados valora la producción de una película o una serie.
3.3 Regresión
Su objetivo es encontrar una función matemática que modele la relación entre las variables de entrada
(características o variables independientes) y la variable de salida (variable dependiente). Esta función la
utilizará para hacer predicciones sobre nuevos datos no vistos.
11
El objetivo es minimizar la discrepancia entre los valores predichos por el modelo y los valores reales
del conjunto de datos de entrenamiento.
Con esta técnica se podría predecir el precio de las viviendas basándose en características como el
tamaño, la ubicación, número de habitaciones... Para ello, se recopilarían históricos de ventas. Con estos
datos se entrenaría un modelo de regresión que aprendería los patrones y relaciones entre las
características y los precios de la vivienda con el objetivo de predecir el precio de nuevas viviendas, lo que
sería útil para compradores, vendedores e inmobiliarias.
Veamos pues cómo se utilizan los principales algoritmos de regresión basándonos en el ejemplo anterior:
Lineal: Relaciona dos variables. Por ejemplo, el precio del alquiler de una vivienda y la cantidad de
características físicas.
Polinómica: Por ejemplo, recogiendo el número de metros cuadrados de una vivienda y su precio.
Árboles de decisión: En este ejemplo, el precio de venta se establece en función de los metros cuadrados
y teniendo en cuenta también su antigüedad.
12
3.4 Reducción de la dimensionalidad
Esta técnica transforma datos, partiendo de la representación inicial, hacia otra nueva transformación
con menos dimensiones, intentando preservar la información de los datos originales.
Se utiliza en:
• La visualización de datos
• La reducción de ruido
• El preprocesamiento de datos
Por ejemplo, en el software de reconocimiento facial que tiene nuestro móvil para el desbloqueo, se
mejora el entrenamiento del algoritmo aplicando la reducción de dimensionalidad para eliminar el ruido y
la información redundante en la imagen, causado por una mala iluminación, expresiones faciales o poses
diferentes. Esto optimiza la precisión del modelo al enfocarse en las características más relevantes.
13
3.4.1 Entrenamiento para el reto
En tu empresa, el equipo de marketing tiene un dispositivo que recoge las emociones de los clientes
cuando ven distintos tipos de anuncios publicitarios para identificar el grado de interés que les despierta
un determinado producto o marca identificando emociones como desagrado, interés, sorpresa, etc.
En el departamento en el que trabajas queréis ver los costes de producir las nuevas agendas para el
próximo año, y para ello debéis tener en cuenta el número de hojas, la calidad del papel, las
dimensiones, el tipo de cubierta, si será en color o no… Tú sugieres el uso de un algoritmo que facilite el
cálculo por lo que propones usar:
e. Un algoritmo de regresión lineal.
f. Un algoritmo de regresión polinómica.
g. Un algoritmo de regresión de árbol de decisión.
h. No propondrías un algoritmo de regresión sino de reducción.
Feedback: Como hay varios factores a considerar, lo mejor es utilizar el árbol de decisión, que nos
facilitará la predicción teniendo en cuenta los diferentes supuestos y nos ayudará a decidir qué tipo de
agenda vamos a producir atendiendo a los costes.
14
4 ESCENARIOS DE ENTRENAMIENTO
Para los problemas anteriores podemos encontrar diferentes escenarios de entrenamiento en
aprendizaje automático. Estos difieren en los tipos de conjuntos de entrenamiento y en el método para
procesar los datos de entrenamiento, prueba y validación.
¿Recuerdas que hemos visto los tipos de aprendizaje en la unidad anterior? Aquí te dejamos un resumen
para refrescar tu memoria.
Recordamos que el aprendizaje supervisado utiliza un sistema que contiene ejemplos con datos
etiquetados para entrenar un modelo con el objetivo de predecir las etiquetas correctas para nuevos
ejemplos.
15
4.2 Aprendizaje no supervisado
Decíamos que este tipo de aprendizaje mixto combina aprendizaje supervisado y no supervisado en
situaciones en las que existe una pequeña cantidad de datos etiquetados, normalmente costosos de
generar; así como datos sin etiquetar para realizar las predicciones.
16
En un conjunto etiquetado y otro sin etiquetar, el objetivo es predecir las etiquetas solo para los ejemplos
sin etiquetar. Este escenario permite utilizar la transducción, que consiste en deducir las etiquetas de los
ejemplos no etiquetados a partir de los etiquetados, sin construir ninguna regla general.
En este aprendizaje interesa maximizar la recompensa que recibe un agente al interactuar con un entorno
y para ello se refuerzan los comportamientos deseados y/o se reprimen los no deseados.
17
5 ALGORTIMOS DE APRENDIZAJE SUPERVISADO
Tal y como se explicaba en la unidad anterior, los algoritmos de aprendizaje automático son fragmentos
de código que ayudan a los usuarios a explorar y analizar conjuntos de datos para predecir los resultados.
18
5.1 K-Nearest Neighbors (kNN)
5.1.1 EJEMPLO
El algoritmo calcula las expresiones genéticas más probables de manera que facilita la identificación de
las personas que tienen predisposición a padecerlo.
Se representan las redes neuronales como un diagrama organizado en capas que contienen varios
nodos o neuronas. Cada una se conecta a una anterior y posterior por pesos, entendidos como valores
numéricos.
Los pesos regulan la información que se transmite de una neurona a otra. Existen diferentes
arquitecturas de redes neuronales. La más común es perceptrón multicapa de alimentación hacia
adelante.
5.2.1 EJEMPLO
Un ejemplo del uso de este algoritmo es, por ejemplo, la realización de un estudio para identificar los
riesgos de los créditos. Tienen ya 1.200 clientes con créditos, así que utilizan los datos obtenidos de
1.000 de ellos para crear el perceptrón, y después verifica la predicción con los otros 200.
19
5.3 Support Vector Machine (SVM)
Utilizado para clasificación y para regresión. Su objetivo es encontrar el hiperplano óptimo que
maximice el margen o distancia entre las muestras de diferentes clases.
En un espacio bidimensional, un hiperplano es una línea que separa dos clases. En un espacio
tridimensional, un hiperplano es un plano que separa dos clases en dos mitades.
5.3.1 EJEMPLO
Un uso sería en el correo electrónico. Constantemente el algoritmo SVM se retroalimenta de los correos
que marcamos como spam para obtener datos de regresión (el hiperplano óptimo) para futuros uso y
para determinar que correos serán spam en el futuro.
El algoritmo busca patrones en los correos que tú marcas como spam y puede notar que este tipo de
correos tiene palabras o enlaces extraños. Después ya puede decirte si es probable que sea spam o no,
y te ayuda a mantener limpia tu bandeja de entrada.
20
5.4 Bosque aleatorio (Random Forest)
Este algoritmo se utiliza para la clasificación, regresión y otras tareas de análisis predictivo. Combina
múltiples árboles de decisión independientes para tomar decisiones más precisas y robustas. Muy útil
con conjuntos de datos grandes y complejos.
5.4.1 EJEMPLO
Se utiliza, por ejemplo, para proporcionar recomendaciones de diferentes productos a los clientes en el
comercio electrónico.
21
6 ALGORITMOS DE APRENDIZAJE NO SUPERVISADO
Son algoritmos cuya fase de entrenamiento consiste en apostar por datos no categorizados
previamente. A continuación explicaremos los dos más usados.
6.1 K-means
Es más conocido porque su finalidad es dividir un conjunto de datos iniciales en “k” categorías
basándose en sus atributos significativos.
Su procedimiento consiste en elegir en primera instancia el número de grupos y con ello se da paso a la
elección aleatoria de “k centroides”. Seguidamente, se asigna cada muestra del conjunto a su centroide
más próximo, y en cada iteración se actualizan los centroides tomando la media de los puntos asignados
anteriormente. Esta etapa se repite hasta que los centroides ya no cambian de posición.
Este algoritmo se usa principalmente para encontrar grupos ocultos en los datos, o intuidos pero no
etiquetados. Este análisis facilita la confirmación o eliminación de alguna suposición sobre los datos.
Por ejemplo, en una tienda de videojuegos quieren clasificar sus productos y establecen 3 grupos en
función de 3 temáticas concretas. Una vez realizada la distribución se valora si sería mejor variar la
temática, y se repite hasta que ya no haya posibilidades de mejora.
22
6.2 CLARA (Clustering Large Applications)
A diferencia de K-means, Clara solo utiliza una muestra aleatoria del conjunto de datos para realizar los
cálculos de agrupamiento.
CLARA es más escalable y eficiente en términos de uso de memoria y tiempo de ejecución en conjuntos
grandes.
¡Importante! CLARA puede generar soluciones aproximadas debido al uso de muestras aleatorias.
23
Imagínate que vas a abrir una librería de libros usados y te ha llegado tu primer pedido de 1.000 libros.
Ahora tienes que ordenarlos en las estanterías, así que recurres a CLARA. El algoritmo CLARA se basa
en tomar un muestreo de tus libros (tomaríamos 20 libros al azar) y los agrupa.
Al hacer la exploración de los datos de los 20 libros, realiza la siguiente identificación:
• Hay 5 libros de ciencia - Crea una categoría Ciencia.
• Hay otros 10 libros de historia - Crea una categoría Historia
• Hay otros 5 libros de Arte - Crea la categoría Arte.
Has determinado por medio de un muestro que en términos generales tus 1000 libros se agrupan entre
Ciencia, Historia y Arte.
Ahora el algoritmo CLARA le da un valor numérico a cada categoría. Por ejemplo, Ciencia 100, Historia
900 y Arte 800. Entonces el algoritmo determina que Historia está más cerca de Arte que de Ciencia. A
la hora de ordenar tus libros indica que debes poner los de Arte al lado de los de Historia y los de
Ciencia un poco alejados.
CLARA no solo determina las diferentes agrupaciones sino cuantas similitudes tienes entre sí.
Una empresa de estudios de mercado quiere ver cuántas fotos de gatitos ve un determinado sector de
la población. Para ello utiliza un enfoque de aprendizaje automático en el que el modelo busca patrones
y estructuras en los datos sin la necesidad de etiquetas o respuestas conocidas. ¿Qué tipo de
aprendizaje usa?
a) Aprendizaje supervisado.
b) Aprendizaje no supervisado.
Empiezas a trabajar en una tienda de videojuegos y, después de una semana, crees que puedes mejorar
la organización de los productos a través de un algoritmo que utilice una muestra aleatoria del conjunto
de datos para realizar los cálculos de agrupamiento. ¿Qué algoritmo vas a utilizar?
a) CLARA.
b) K-means.
c) Random Forest.
24
7 CIERRE
Que el entrenamiento del sistema es clave para que los algoritmos construyan patrones de respuesta
fiables. Los importantes volúmenes de datos y la existencia o no de etiquetas dificultan este proceso.
Combinando inteligencia artificial y estadística, se generan escenarios de entrenamiento en aprendizaje
automático, supervisado y no supervisado. Además, has aprendido:
25
1. Que la inteligencia artificial está integrada en nuestro día a día.
2. Que esta tecnología tiene la capacidad de dar respuestas predictivas en los dispositivos de
comunicación y recomendaciones según nuestras preferencias.
3. Que los algoritmos como conjuntos de operaciones sistemáticas permiten realizar cálculos y obtener
la mejor respuesta a un problema concreto.
4. Que si se entrenan estos algoritmos con datos específicos se pueden identificar secuencias que
ayudan a definir los patrones óptimos.
5. Que existen diferentes aplicaciones de aprendizaje automático.
6. Que es fundamental conocer conceptos como etiquetas, valores, categorías, variables, capas, datos…
7. Que existen diferentes escenarios de entrenamiento: aprendizaje supervisado, no supervisado,
semisupervisado, transductivo y por refuerzo.
8. Que existen distintos algoritmos en función del aprendizaje supervisado y el no supervisado.
• James, G., Witten, D., Hastie, T. & Tibshirani, R. (2013). An Introduction to Statistical Learning with
Applications in R. Springer Texts in Statistics.
• MindMachineTV [@MindMachineTV] (2017). Así funciona una red neuronal artificial [Video].
YouTube. https://www.youtube.com/watch?v=6vwfT3-mBBw
26
8 ANEXOS
8.1 Glosario
Clasificación de los elementos en más de dos grupos o clases, en función de un parámetro establecido.
Volver al contenido
8.1.3 Chatbot
Programa de inteligencia artificial capaz que permite una conversación en tiempo real por texto o por
voz.
Volver al contenido
8.1.4 Centroide
Centro geométrico.
Volver al contenido
8.1.5 Hiperplano
Volver al contenido
8.1.6 K-medoids
Volver al contenido
8.1.7 Nodo
Punto de intersección o conexión entre varios elementos que convergen en un mismo lugar.
Volver al contenido
27
8.1.8 Perceptrón
Es una matriz para representar redes neuronales artificiales que nos permite efectuar cálculos para
detectar características o tendencias en los datos de entrada.
Volver al contenido
28