MF1 UD2 Entrenamiento Del Sistema

MF1: Inteligencia artificial
Unidad Didáctica 2: Entrenamiento del sistema
Proyecto financiado por el Ministerio de Educación y Formación Profesional - U.E. Next Generation
Dirección de proyecto UGT España:
Fernando Montalvo Martín
Coordinación de proyecto UGT España:
Manuela Jiménez Luna
Diseño y adaptación pedagógica UGT España:

Érika Cruz Torres
Miriam Escribano Cotera
Revisión de contenidos UGT España:

Érika Cruz Torres
Miriam Escribano Cotera
Javier Vaquero Andaluz
Carlos Sayalero Caballero
Dirección de proyecto Telefónica Educación Digital:

Gemma-Ruth Lazovsky
Coordinación de proyecto Telefónica Educación Digital:
Yesmariana Gómez Fernández
Coordinación pedagógica Telefónica Educación Digital:

Nines Ruiz-Valdepeñas del Amo
Autoría contenidos Telefónica Educación Digital:

Mirella Jiménez Gutiérrez
Angélica Comesaña Comesaña
Mª de las Nieves Pardo Díaz
Ana Castro Antonio
Laura Gutiérrez Pérez
Diseño gráfico y producción audiovisual Telefónica Educación Digital:

Erick Biain Galán
Ismael Sanz Sánchez
Revisión y edición de contenidos Telefónica Educación Digital:

Naiara San Pedro Zamora
María Luisa Belmonte Carmona
2
Índice
Índice .................................................................................................................................................................. 3
1 INICIO ......................................................................................................................................................... 5
1.1 Consideraciones previas ........................................................................................................................ 5
1.2 Introducción............................................................................................................................................. 5
1.2.1 ¿Qué vas a aprender en esta unidad? ........................................................................................ 7
1.2.2 ¿Cómo vas a conseguir el gran reto de este módulo formativo? ............................................ 8
2 INTELIGENCIA ARTIFICIAL ....................................................................................................................... 9
2.1 Conjunto de entrenamiento .................................................................................................................... 9
3 APLICACIONES DEL APRENDIZAJE AUTOMÁTICO .............................................................................. 10
3.1 Clasificación .......................................................................................................................................... 10
3.2 Clustering ............................................................................................................................................... 10
3.2.1 Clasificación de datos .............................................................................................................. 11
3.2.2 Clusterización ............................................................................................................................ 11
3.3 Regresión ............................................................................................................................................... 11
3.4 Reducción de la dimensionalidad ........................................................................................................ 13
3.4.1 Entrenamiento para el reto ....................................................................................................... 14
4 ESCENARIOS DE ENTRENAMIENTO ...................................................................................................... 15
4.1 Aprendizaje supervisado ...................................................................................................................... 15
4.2 Aprendizaje no supervisado ................................................................................................................. 16
4.3 Aprendizaje semisupervisado .............................................................................................................. 16
4.4 Aprendizaje transductivo ...................................................................................................................... 16
4.5 Aprendizaje por refuerzo ...................................................................................................................... 17
5 ALGORTIMOS DE APRENDIZAJE SUPERVISADO .................................................................................. 18
5.1 K-Nearest Neighbors (kNN) ................................................................................................................... 19
5.1.1 EJEMPLO ................................................................................................................................... 19
5.2 Redes Neuronales Artificiales (Neural Networks o NN) ...................................................................... 19
5.2.1 EJEMPLO ................................................................................................................................... 19
5.3 Support Vector Machine (SVM)............................................................................................................. 20
5.3.1 EJEMPLO ................................................................................................................................... 20
5.4 Bosque aleatorio (Random Forest)....................................................................................................... 21
5.4.1 EJEMPLO ................................................................................................................................... 21
6 ALGORITMOS DE APRENDIZAJE NO SUPERVISADO ........................................................................... 22
6.1 K-means ................................................................................................................................................. 22
6.2 CLARA (Clustering Large Applications) ................................................................................................ 23
6.3 Caso de uso ........................................................................................................................................... 23
6.3.1 Entrenamiento para el reto ....................................................................................................... 24
3
7 CIERRE...................................................................................................................................................... 25
7.1¿Qué has aprendido en esta unidad?..................................................................................................... 25
7.2 Referencias bibliográficas .................................................................................................................... 26
8 ANEXOS ................................................................................................................................................... 27
8.1 Glosario .................................................................................................................................................. 27
8.1.1 Categoría binaria ....................................................................................................................... 27
8.1.2 Categoría multiclase ................................................................................................................. 27
8.1.3 Chatbot ...................................................................................................................................... 27
8.1.4 Centroide ................................................................................................................................... 27
8.1.5 Hiperplano ................................................................................................................................. 27
8.1.6 K-medoids .................................................................................................................................. 27
8.1.7 Nodo .......................................................................................................................................... 27
8.1.8 Perceptrón ................................................................................................................................. 28
4
1 INICIO
1.1 Consideraciones previas
A lo largo del documento encontrarás algunas palabras con un enlace que te llevará al glosario del
curso para que puedas consultar su significado si así lo necesitas.
También encontrarás otros enlaces a vídeos o páginas web externas. Te recomendamos que los abras
pulsando el botón derecho del ratón y seleccionando la opción “Abrir hipervínculo” para que se muestren
en una ventana emergente distinta a la actual.
1.2 Introducción
Si lanzamos la pregunta “¿qué es un entrenamiento de aprendizaje automático?”, gran parte de las

personas no sabría contestar. Si preguntásemos sobre Machine Learning, tampoco. Sin embargo, el
entrenamiento del sistema es un proceso que está muy relacionado con nuestro día a día. Algunos
ejemplos los encontramos en tecnologías capaces de predecir patrones como WhatsApp, Gmail, Netflix,
automóviles autónomos, asistentes de voz…
Veamos ejemplos de entrenamiento de aprendizaje automático aplicados a la vida real.
Alexa y Siri
Construyen respuestas inteligentes a preguntas humanas.
Gmail
Propone respuestas cortas o cadenas textuales para redactar un mensaje según el contenido escrito
previamente o sobre elementos del correo (asunto, remitente, cierre…).
Chatbots de atención a clientes
5
Este sistema de ayuda almacena preguntas y dudas recurrentes para ofrecer la respuesta más adecuada.
La estadística es la herramienta fundamental del aprendizaje automático. Analiza grandes cantidades

de datos para que el algoritmo pueda predecir el resultado óptimo.
6
1.2.1 ¿Qué vas a aprender en esta unidad?
ENTRENAMIENTO DEL APRENDIZAJE AUTOMÁTICO

1. Conjunto de entrenamiento.
2. Aplicaciones del aprendizaje automático.
a. Clasificación.
b. Clústering.
c. Regresión.
d. Reducción de la dimensionalidad.
3. Escenarios de entrenamiento.
a. Aprendizaje supervidado.
b. Aprendizaje no supervisado.
c. Aprendizaje semisupervisado.
d. Aprendizaje transductivo.
e. Aprendizaje por refuerzo.
4. Algoritmos de aprendizaje supervisado.
a. K-Nearest Neighbors (kNN).
b. Redes neuronales artificiales (Neutral Networks o NN).
c. Support vector machine (SVM).
d. Random Forest.
5. Algortimos de aprendizaje no supervisado.
a. K-means.
b. CLARA (Clustering Large Applications).
7
1.2.2 ¿Cómo vas a conseguir el gran reto de este módulo formativo?
Te planteamos el siguiente objetivo que te ayudará a lograrlo:

• Describir el procedimiento de despliegue de un aplicativo basado en la inteligencia artificial.
8
2 INTELIGENCIA ARTIFICIAL
2.1 Conjunto de entrenamiento
Para entender su potencial, debemos conocer a qué hace referencia el entrenamiento. Este término
alude a:
• El conjunto de instancias utilizadas para entrenar el algoritmo.
• El conjunto de validación es otro conjunto de ejemplos usados para ajustar los parámetros del
algoritmo.
• El conjunto de prueba evalúa su rendimiento después de entrenarlo según los parámetros
seleccionados.
9
3 APLICACIONES DEL APRENDIZAJE AUTOMÁTICO
Los problemas que pueden resolverse son tan diversos como las técnicas que se pueden aplicar.
Veámoslas.
3.1 Clasificación
Consiste en clasificar un ejemplo, asignándole una categoría, a partir de un conjunto finito de valores.
Puede ser binaria (dos clases) o multiclase (más de dos).
Un ejemplo sería identificar expresiones faciales a partir de una fotografía de una persona para
determinar qué emociones muestra.
3.2 Clustering
El clustering agrupa datos similares sin etiquetas predefinidas para descubrir patrones ocultos, según
su similitud o proximidad en el espacio. Busca maximizar la similitud intraclúster (los elementos dentro
del mismo clúster son similares) y minimizar la similitud interclúster (los elementos de diferentes
clústeres son diferentes).
Esta técnica se emplea para:

• Segmentar clientes
• Analizar redes sociales
• Reconocer patrones
• Comprender datos no estructurados
Los clústeres pueden tener diferentes formas y tamaños. No todos los datos se agrupan en un clúster.
Pero, ¿cuál es la diferencia entre clasificación de datos y clusterización?
10
3.2.1 Clasificación de datos
Tipo de agrupamiento: Usa clases o categorías predefinidas en las que se asignan los objetos para la
agrupación.
Tipo de aprendizaje; Esta técnica pertenece al aprendizaje supervisado donde tenemos conocimiento
de datos de entrada mediante el etiquetado y podemos conocer las posibles salidas del algoritmo.
Existe una clasificación binaria que da respuestas a variables dicotómicas de dos opciones únicas.
3.2.2 Clusterización
Tipo de agrupamiento: Identifica similitudes entre los objetos de los conjuntos de datos, agrupándolas
según características comunes.
Tipo de aprendizaje: Esta técnica pertenece al aprendizaje no supervisado, donde solo disponemos de
conjuntos de datos de entrada, sin procesos de etiquetados sobre los que debemos obtener
información, sin conocer resultados o datos de salida.
Veamos algunos ejemplos de clusterización:
Esto se puede observar en la segmentación de campañas publicitarias, donde si la empresa analiza y

conoce el comportamiento de los clientes, puede dirigir de forma más adecuada los productos.
Otro ejemplo son las plataformas como Netflix, que analiza el comportamiento de sus clientes y según
los resultados valora la producción de una película o una serie.
3.3 Regresión
Es una técnica que trata de predecir un valor numérico específico.
Su objetivo es encontrar una función matemática que modele la relación entre las variables de entrada
(características o variables independientes) y la variable de salida (variable dependiente). Esta función la
utilizará para hacer predicciones sobre nuevos datos no vistos.
11
El objetivo es minimizar la discrepancia entre los valores predichos por el modelo y los valores reales
del conjunto de datos de entrenamiento.
Antes de avanzar, veamos un ejemplo.
Con esta técnica se podría predecir el precio de las viviendas basándose en características como el
tamaño, la ubicación, número de habitaciones... Para ello, se recopilarían históricos de ventas. Con estos
datos se entrenaría un modelo de regresión que aprendería los patrones y relaciones entre las
características y los precios de la vivienda con el objetivo de predecir el precio de nuevas viviendas, lo que
sería útil para compradores, vendedores e inmobiliarias.
Veamos pues cómo se utilizan los principales algoritmos de regresión basándonos en el ejemplo anterior:
Lineal: Relaciona dos variables. Por ejemplo, el precio del alquiler de una vivienda y la cantidad de
características físicas.
Polinómica: Por ejemplo, recogiendo el número de metros cuadrados de una vivienda y su precio.
Árboles de decisión: En este ejemplo, el precio de venta se establece en función de los metros cuadrados
y teniendo en cuenta también su antigüedad.
12
3.4 Reducción de la dimensionalidad
Esta técnica transforma datos, partiendo de la representación inicial, hacia otra nueva transformación
con menos dimensiones, intentando preservar la información de los datos originales.
Se utiliza en:
• La visualización de datos
• La reducción de ruido
• El preprocesamiento de datos
Por ejemplo, en el software de reconocimiento facial que tiene nuestro móvil para el desbloqueo, se
mejora el entrenamiento del algoritmo aplicando la reducción de dimensionalidad para eliminar el ruido y
la información redundante en la imagen, causado por una mala iluminación, expresiones faciales o poses
diferentes. Esto optimiza la precisión del modelo al enfocarse en las características más relevantes.
13
3.4.1 Entrenamiento para el reto
¡Pon a prueba lo aprendido!
En tu empresa, el equipo de marketing tiene un dispositivo que recoge las emociones de los clientes
cuando ven distintos tipos de anuncios publicitarios para identificar el grado de interés que les despierta
un determinado producto o marca identificando emociones como desagrado, interés, sorpresa, etc.
¿Cuál es el tipo de aprendizaje más efectivo?

a. Clasificación.
b. Custering.
c. Regresión.
d. Reducción de la dimensionalidad.
Feedback: Nos referimos a la clasificación porque el dispositivo permite clasificar un ejemplo,

asignándole una categoría, a partir de un conjunto finito de valores. Puede ser binaria (existen dos
clases) o multiclase (existen más de dos).
En el departamento en el que trabajas queréis ver los costes de producir las nuevas agendas para el
próximo año, y para ello debéis tener en cuenta el número de hojas, la calidad del papel, las
dimensiones, el tipo de cubierta, si será en color o no… Tú sugieres el uso de un algoritmo que facilite el
cálculo por lo que propones usar:
e. Un algoritmo de regresión lineal.
f. Un algoritmo de regresión polinómica.
g. Un algoritmo de regresión de árbol de decisión.
h. No propondrías un algoritmo de regresión sino de reducción.
Feedback: Como hay varios factores a considerar, lo mejor es utilizar el árbol de decisión, que nos
facilitará la predicción teniendo en cuenta los diferentes supuestos y nos ayudará a decidir qué tipo de
agenda vamos a producir atendiendo a los costes.
14
4 ESCENARIOS DE ENTRENAMIENTO
Para los problemas anteriores podemos encontrar diferentes escenarios de entrenamiento en
aprendizaje automático. Estos difieren en los tipos de conjuntos de entrenamiento y en el método para
procesar los datos de entrenamiento, prueba y validación.
¿Recuerdas que hemos visto los tipos de aprendizaje en la unidad anterior? Aquí te dejamos un resumen
para refrescar tu memoria.
4.1 Aprendizaje supervisado
Recordamos que el aprendizaje supervisado utiliza un sistema que contiene ejemplos con datos
etiquetados para entrenar un modelo con el objetivo de predecir las etiquetas correctas para nuevos
ejemplos.
La clasificación y la regresión son ejemplos de este tipo de aprendizaje.
15
4.2 Aprendizaje no supervisado
Comentábamos que en el aprendizaje no supervisado se establecen patrones con datos no etiquetados.

La agrupación y la reducción dimensional son dos claros ejemplos.
4.3 Aprendizaje semisupervisado
Decíamos que este tipo de aprendizaje mixto combina aprendizaje supervisado y no supervisado en
situaciones en las que existe una pequeña cantidad de datos etiquetados, normalmente costosos de
generar; así como datos sin etiquetar para realizar las predicciones.
4.4 Aprendizaje transductivo
16
En un conjunto etiquetado y otro sin etiquetar, el objetivo es predecir las etiquetas solo para los ejemplos
sin etiquetar. Este escenario permite utilizar la transducción, que consiste en deducir las etiquetas de los
ejemplos no etiquetados a partir de los etiquetados, sin construir ninguna regla general.
4.5 Aprendizaje por refuerzo
En este aprendizaje interesa maximizar la recompensa que recibe un agente al interactuar con un entorno
y para ello se refuerzan los comportamientos deseados y/o se reprimen los no deseados.
17
5 ALGORTIMOS DE APRENDIZAJE SUPERVISADO
Tal y como se explicaba en la unidad anterior, los algoritmos de aprendizaje automático son fragmentos
de código que ayudan a los usuarios a explorar y analizar conjuntos de datos para predecir los resultados.
La aproximación supervisada se caracteriza por entrenar al algoritmo según áreas de entrenamiento

que se conocen a priori, y con ello generar un modelo óptimo para usarlo en la predicción de nuevos
datos.
A continuación, revisemos brevemente los algoritmos más comunes.
18
5.1 K-Nearest Neighbors (kNN)
En castellano ‘vecinos más que cercanos’. Permite la clasificación y la regresión.
Los ejemplos de entrenamiento más cercanos a un punto desconocido en el espacio de características

son buenos indicadores de cómo se debe clasificar o predecir ese punto.
5.1.1 EJEMPLO
En el ámbito sanitario. KNN se ha aplicado haciendo predicciones sobre el riesgo de ciertas

enfermedades como ataques cardíacos y cáncer de próstata.
El algoritmo calcula las expresiones genéticas más probables de manera que facilita la identificación de
las personas que tienen predisposición a padecerlo.
5.2 Redes Neuronales Artificiales (Neural Networks o NN)
Se representan las redes neuronales como un diagrama organizado en capas que contienen varios
nodos o neuronas. Cada una se conecta a una anterior y posterior por pesos, entendidos como valores
numéricos.
Los pesos regulan la información que se transmite de una neurona a otra. Existen diferentes
arquitecturas de redes neuronales. La más común es perceptrón multicapa de alimentación hacia
adelante.
5.2.1 EJEMPLO
Un ejemplo del uso de este algoritmo es, por ejemplo, la realización de un estudio para identificar los
riesgos de los créditos. Tienen ya 1.200 clientes con créditos, así que utilizan los datos obtenidos de
1.000 de ellos para crear el perceptrón, y después verifica la predicción con los otros 200.
19
5.3 Support Vector Machine (SVM)
Utilizado para clasificación y para regresión. Su objetivo es encontrar el hiperplano óptimo que
maximice el margen o distancia entre las muestras de diferentes clases.
En un espacio bidimensional, un hiperplano es una línea que separa dos clases. En un espacio
tridimensional, un hiperplano es un plano que separa dos clases en dos mitades.
5.3.1 EJEMPLO
Un uso sería en el correo electrónico. Constantemente el algoritmo SVM se retroalimenta de los correos
que marcamos como spam para obtener datos de regresión (el hiperplano óptimo) para futuros uso y
para determinar que correos serán spam en el futuro.
El algoritmo busca patrones en los correos que tú marcas como spam y puede notar que este tipo de
correos tiene palabras o enlaces extraños. Después ya puede decirte si es probable que sea spam o no,
y te ayuda a mantener limpia tu bandeja de entrada.
20
5.4 Bosque aleatorio (Random Forest)
Este algoritmo se utiliza para la clasificación, regresión y otras tareas de análisis predictivo. Combina
múltiples árboles de decisión independientes para tomar decisiones más precisas y robustas. Muy útil
con conjuntos de datos grandes y complejos.
5.4.1 EJEMPLO
Se utiliza, por ejemplo, para proporcionar recomendaciones de diferentes productos a los clientes en el
comercio electrónico.
21
6 ALGORITMOS DE APRENDIZAJE NO SUPERVISADO
Son algoritmos cuya fase de entrenamiento consiste en apostar por datos no categorizados
previamente. A continuación explicaremos los dos más usados.
6.1 K-means
Es más conocido porque su finalidad es dividir un conjunto de datos iniciales en “k” categorías
basándose en sus atributos significativos.
Su procedimiento consiste en elegir en primera instancia el número de grupos y con ello se da paso a la
elección aleatoria de “k centroides”. Seguidamente, se asigna cada muestra del conjunto a su centroide
más próximo, y en cada iteración se actualizan los centroides tomando la media de los puntos asignados
anteriormente. Esta etapa se repite hasta que los centroides ya no cambian de posición.
Este algoritmo se usa principalmente para encontrar grupos ocultos en los datos, o intuidos pero no
etiquetados. Este análisis facilita la confirmación o eliminación de alguna suposición sobre los datos.
Por ejemplo, en una tienda de videojuegos quieren clasificar sus productos y establecen 3 grupos en
función de 3 temáticas concretas. Una vez realizada la distribución se valora si sería mejor variar la
temática, y se repite hasta que ya no haya posibilidades de mejora.
22
6.2 CLARA (Clustering Large Applications)
Es un algoritmo de agrupamiento utilizado para el análisis de grandes conjuntos de datos. Es una

extensión del algoritmo K-medoids para manejar eficientemente conjuntos de datos de gran tamaño.
A diferencia de K-means, Clara solo utiliza una muestra aleatoria del conjunto de datos para realizar los
cálculos de agrupamiento.
CLARA es más escalable y eficiente en términos de uso de memoria y tiempo de ejecución en conjuntos
grandes.
¡Importante! CLARA puede generar soluciones aproximadas debido al uso de muestras aleatorias.
6.3 Caso de uso
23
Imagínate que vas a abrir una librería de libros usados y te ha llegado tu primer pedido de 1.000 libros.
Ahora tienes que ordenarlos en las estanterías, así que recurres a CLARA. El algoritmo CLARA se basa
en tomar un muestreo de tus libros (tomaríamos 20 libros al azar) y los agrupa.
Al hacer la exploración de los datos de los 20 libros, realiza la siguiente identificación:
• Hay 5 libros de ciencia - Crea una categoría Ciencia.
• Hay otros 10 libros de historia - Crea una categoría Historia
• Hay otros 5 libros de Arte - Crea la categoría Arte.
Has determinado por medio de un muestro que en términos generales tus 1000 libros se agrupan entre
Ciencia, Historia y Arte.
Ahora el algoritmo CLARA le da un valor numérico a cada categoría. Por ejemplo, Ciencia 100, Historia
900 y Arte 800. Entonces el algoritmo determina que Historia está más cerca de Arte que de Ciencia. A
la hora de ordenar tus libros indica que debes poner los de Arte al lado de los de Historia y los de
Ciencia un poco alejados.
CLARA no solo determina las diferentes agrupaciones sino cuantas similitudes tienes entre sí.
6.3.1 Entrenamiento para el reto
¡Pon a prueba lo aprendido!
Una empresa de estudios de mercado quiere ver cuántas fotos de gatitos ve un determinado sector de
la población. Para ello utiliza un enfoque de aprendizaje automático en el que el modelo busca patrones
y estructuras en los datos sin la necesidad de etiquetas o respuestas conocidas. ¿Qué tipo de
aprendizaje usa?
a) Aprendizaje supervisado.
b) Aprendizaje no supervisado.
Feedback: Este aprendizaje no necesita ni etiquetas ni respuestas conocidas previamente.
Empiezas a trabajar en una tienda de videojuegos y, después de una semana, crees que puedes mejorar
la organización de los productos a través de un algoritmo que utilice una muestra aleatoria del conjunto
de datos para realizar los cálculos de agrupamiento. ¿Qué algoritmo vas a utilizar?
a) CLARA.
b) K-means.
c) Random Forest.
Feedback: CLARA es un algoritmo de agrupamiento utilizado para el análisis de grandes conjuntos de

datos.
24
7 CIERRE
7.1¿Qué has aprendido en esta unidad?
Que el entrenamiento del sistema es clave para que los algoritmos construyan patrones de respuesta
fiables. Los importantes volúmenes de datos y la existencia o no de etiquetas dificultan este proceso.
Combinando inteligencia artificial y estadística, se generan escenarios de entrenamiento en aprendizaje
automático, supervisado y no supervisado. Además, has aprendido:
25
1. Que la inteligencia artificial está integrada en nuestro día a día.
2. Que esta tecnología tiene la capacidad de dar respuestas predictivas en los dispositivos de
comunicación y recomendaciones según nuestras preferencias.
3. Que los algoritmos como conjuntos de operaciones sistemáticas permiten realizar cálculos y obtener
la mejor respuesta a un problema concreto.
4. Que si se entrenan estos algoritmos con datos específicos se pueden identificar secuencias que
ayudan a definir los patrones óptimos.
5. Que existen diferentes aplicaciones de aprendizaje automático.
6. Que es fundamental conocer conceptos como etiquetas, valores, categorías, variables, capas, datos…
7. Que existen diferentes escenarios de entrenamiento: aprendizaje supervisado, no supervisado,
semisupervisado, transductivo y por refuerzo.
8. Que existen distintos algoritmos en función del aprendizaje supervisado y el no supervisado.
En la siguiente Unidad Didáctica trataremos la preparación y clasificación de los datos de entrenamiento

detallando procesos concretos como la limpieza, transformación y selección de variables. Parecen
conceptos complejos pero son esenciales para entender que junto con el aprendizaje automático
podemos obtener conocimientos valiosos para la toma de decisiones en distintos campos. ¡Avanza por
el contenido y continúa aprendiendo!
Recuerda que ponemos a tu disposición el documento Mediateca, donde encontrarás contenido

adicional para ampliar información. Te animamos también a entrar en el foro del Módulo Formativo,
donde encontrarás actividades e información de actualidad para comentar con el resto de participantes.
7.2 Referencias bibliográficas
• James, G., Witten, D., Hastie, T. & Tibshirani, R. (2013). An Introduction to Statistical Learning with
Applications in R. Springer Texts in Statistics.
• MindMachineTV [@MindMachineTV] (2017). Así funciona una red neuronal artificial [Video].
YouTube. https://www.youtube.com/watch?v=6vwfT3-mBBw
¡Has terminado la unidad!
26
8 ANEXOS
8.1 Glosario
8.1.1 Categoría binaria
Clasificación de los elementos de un conjunto en dos grupos en función de un parámetro establecido.

Volver al contenido
8.1.2 Categoría multiclase
Clasificación de los elementos en más de dos grupos o clases, en función de un parámetro establecido.
Volver al contenido
8.1.3 Chatbot
Programa de inteligencia artificial capaz que permite una conversación en tiempo real por texto o por
voz.
Volver al contenido
8.1.4 Centroide
Centro geométrico.
Volver al contenido
8.1.5 Hiperplano
Es una generalización del concepto de plano.
Volver al contenido
8.1.6 K-medoids
Es un algoritmo de agrupamiento utilizado para clasificar un conjunto de datos en k clústeres. A

diferencia del algoritmo K-means, que utiliza los centroides para representar cada clúster, el algoritmo K-
medoids utiliza puntos reales de los datos llamados medoids como representantes de los clústeres.
Volver al contenido
8.1.7 Nodo
Punto de intersección o conexión entre varios elementos que convergen en un mismo lugar.
Volver al contenido
27
8.1.8 Perceptrón
Es una matriz para representar redes neuronales artificiales que nos permite efectuar cálculos para
detectar características o tendencias en los datos de entrada.
Volver al contenido
28

MF1 UD2 Entrenamiento Del Sistema

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MF1 UD2 Entrenamiento Del Sistema

Cargado por

Copyright:

Formatos disponibles

MF1: Inteligencia artificial

Unidad Didáctica 2: Entrenamiento del sistema

Diseño y adaptación pedagógica UGT España:

Revisión de contenidos UGT España:

Dirección de proyecto Telefónica Educación Digital:

Coordinación pedagógica Telefónica Educación Digital:

Autoría contenidos Telefónica Educación Digital:

Diseño gráfico y producción audiovisual Telefónica Educación Digital:

Revisión y edición de contenidos Telefónica Educación Digital:

1.1 Consideraciones previas

Si lanzamos la pregunta “¿qué es un entrenamiento de aprendizaje automático?”, gran parte de las

Veamos ejemplos de entrenamiento de aprendizaje automático aplicados a la vida real.

Construyen respuestas inteligentes a preguntas humanas.

Chatbots de atención a clientes

La estadística es la herramienta fundamental del aprendizaje automático. Analiza grandes cantidades

ENTRENAMIENTO DEL APRENDIZAJE AUTOMÁTICO

2. Aplicaciones del aprendizaje automático.

e. Aprendizaje por refuerzo.

4. Algoritmos de aprendizaje supervisado.

a. K-Nearest Neighbors (kNN).

b. Redes neuronales artificiales (Neutral Networks o NN).

c. Support vector machine (SVM).

5. Algortimos de aprendizaje no supervisado.

Te planteamos el siguiente objetivo que te ayudará a lograrlo:

2.1 Conjunto de entrenamiento

Esta técnica se emplea para:

Pero, ¿cuál es la diferencia entre clasificación de datos y clusterización?

Veamos algunos ejemplos de clusterización:

Esto se puede observar en la segmentación de campañas publicitarias, donde si la empresa analiza y

Es una técnica que trata de predecir un valor numérico específico.

Antes de avanzar, veamos un ejemplo.

¡Pon a prueba lo aprendido!

¿Cuál es el tipo de aprendizaje más efectivo?

Feedback: Nos referimos a la clasificación porque el dispositivo permite clasificar un ejemplo,

4.1 Aprendizaje supervisado

La clasificación y la regresión son ejemplos de este tipo de aprendizaje.

Comentábamos que en el aprendizaje no supervisado se establecen patrones con datos no etiquetados.

4.3 Aprendizaje semisupervisado

4.4 Aprendizaje transductivo

4.5 Aprendizaje por refuerzo

La aproximación supervisada se caracteriza por entrenar al algoritmo según áreas de entrenamiento

A continuación, revisemos brevemente los algoritmos más comunes.

En castellano ‘vecinos más que cercanos’. Permite la clasificación y la regresión.

Los ejemplos de entrenamiento más cercanos a un punto desconocido en el espacio de características

En el ámbito sanitario. KNN se ha aplicado haciendo predicciones sobre el riesgo de ciertas

5.2 Redes Neuronales Artificiales (Neural Networks o NN)

Es un algoritmo de agrupamiento utilizado para el análisis de grandes conjuntos de datos. Es una

6.3 Caso de uso

6.3.1 Entrenamiento para el reto

¡Pon a prueba lo aprendido!

Feedback: Este aprendizaje no necesita ni etiquetas ni respuestas conocidas previamente.

Feedback: CLARA es un algoritmo de agrupamiento utilizado para el análisis de grandes conjuntos de

7.1¿Qué has aprendido en esta unidad?

En la siguiente Unidad Didáctica trataremos la preparación y clasificación de los datos de entrenamiento

Recuerda que ponemos a tu disposición el documento Mediateca, donde encontrarás contenido

7.2 Referencias bibliográficas

¡Has terminado la unidad!

8.1.1 Categoría binaria

Clasificación de los elementos de un conjunto en dos grupos en función de un parámetro establecido.

8.1.2 Categoría multiclase

Es una generalización del concepto de plano.

Es un algoritmo de agrupamiento utilizado para clasificar un conjunto de datos en k clústeres. A

También podría gustarte