Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Departamento De Informática
II Periodo Virtual
Sección: 08:00
Machine Learning
Equipo E
Integrantes:
N° Nombre Completo No. de Cuenta
1 Iris Yasmin Paz Espinal 20211031759
2 Ana Cristina Hernandez Giménez 20221003079
3 Gabriel Alexander Rodriguez 20211002468
4 Gexy Abigail López Vásquez 20181030222
Machine Learning
2
CONTENIDO
¿Cómo funciona?.....................................................................................................3
APRENDIZAJE NO SUPERVISADO........................................................................23
APRENDIZAJE PROFUNDO.....................................................................................27
BIBLIOGRAFÍA............................................................................................................37
CONCLUSIONES.........................................................................................................38
ANEXOS........................................................................................................................39
Machine Learning
3
¿Cómo funciona?
Big Data y Machine Learning aplicado a la empresa
Una empresa de telefonía quiere saber qué clientes están en “peligro” de
darse de baja de sus servicios para hacer acciones comerciales que eviten que
se vayan a la competencia. ¿Cómo puede hacerlo? La empresa tiene muchos
datos de los clientes, muchísimos: antigüedad, planes contratados, consumo
diario, llamadas mensuales al servicio de atención al cliente, últimos cambios
de planes contratados… pero seguramente los usa solo para facturar y para
hacer estadísticas. ¿Qué más puede hacer con esos datos? Se pueden usar
para predecir cuándo un cliente se va a dar de baja y gestionar la mejor acción
que lo evite. En pocas palabras, con Machine Learning se puede pasar de ser
reactivos a ser proactivos. Los datos históricos del conjunto de los clientes,
debidamente organizados y tratados en bloque, generan una base de datos
que se puede explotar para predecir futuros comportamientos, favorecer
aquellos que mejoran los objetivos de negocio y evitar aquellos que son
perjudiciales.
Esa cantidad ingente de datos son imposibles de analizar por una
persona para sacar conclusiones y menos todavía para hacer predicciones. Los
algoritmos en cambio sí pueden detectar patrones de comportamiento
contando con las variables que le proporcionamos y descubrir cuáles son las
que han llevado, en este caso, a darse de baja como cliente. La siguiente
imagen es un ejemplo de una predicción simplificada basada en datos de una
compañía de telefonía ficticia, pero usando una herramienta de Machine
Learning real:
Machine Learning
4
Machine Learning
5
cambio de plan de tarificación o podría revisar por qué han llamado al servicio
de atención al cliente para intentar mantenerlos.
El árbol de predicción completo sería el siguiente. En este caso hemos
resaltado una predicción falsa (es decir, no se daría de baja) con una confianza
del 90,59%.
Machine Learning
6
La tecnología está ahí. Los datos también. ¿Por qué esperar a probar
algo que puede suponer una puerta abierta a nuevas formas de tomar
decisiones basadas en datos? Seguro que has oído que los datos son el
petróleo del futuro. Ahora ya puedes empezar a bombearlo. (González, 2022)
¿De dónde surge Machine Lear Ning?
Los orígenes del Machine Learning
Mucho se ha hablado sobre ‘Machine Learning’ (Aprendizaje
Automático), pero no de su origen. ¿Sabes cuándo se originó realmente? o
¿por qué actualmente estamos viviendo un auténtico boom del Machine
Learning?
Machine Learning
7
Por moderno que pueda parecer este campo, nos debemos remontar al
año 1950 cuando el gran Alan Turing creó el “Test de Turing”. De forma que
para pasar el test, una máquina debía engañar a un humano haciéndole creer
que se encontraba delante de un humano en vez de un ordenador.
No debemos dejar de lado tampoco el año 1952, en el que Arthur
Samuel escribe el primer algoritmo que es capaz de aprender; consistiendo
este en un programa que jugaba a las damas y mejoraba tras cada partida su
juego. Posteriormente, en el seno de una conferencia nacerá el término
‘Artificial Intelligence’ (Inteligencia Artificial) para nombrar el nuevo campo que
estudiaban en el verano de 1956.
Winter is coming
Durante la década de los 70, el campo pasó por momentos difíciles
debido a las altas expectativas de los inversores y los pocos avances
conseguidos. A pesar de ello, en 1967 se desarrolla el algoritmo ‘Nearest
Neighbor’ que es considerado el nacimiento de los algoritmos de
reconocimiento de patrones.
Más adelante, en los años 80, nacen los sistemas expertos basados en
reglas; lo que vuelve a generar un gran interés por el Machine Learning. Pero el
segundo invierno de la Inteligencia Artificial y más prolongado que el anterior,
llegará a finales de la década de los 80 y no se recuperará completamente
hasta bien entrados los 2000.
Aparece un nuevo protagonista
Estamos en los inicios del 2000, el Machine Learning todavía está
recuperándose del largo invierno que ha sufrido y un joven protagonista está a
punto de aparecer en escena.
Comienza a forjarse en el año 2003 cuando se publica un estudio sobre
un sistema de ficheros distribuidos, llamado ‘Google File System’ (GFS). Y
terminará definiéndose en 2004 cuando Google presente un nuevo paradigma
de procesamiento distribuido al que llamará ‘Map & Reduce’.
Mientras nuestro protagonista crece a pasos agigantados, su padre
Google no deja de apoyarle en su progreso y crea el ‘Cloud Bigtable’ que es el
servicio de bases de datos de Big Data NoSQL. Es el año 2006, ingenieros de
Apache llevan a la culminación los paradigmas de Google en la primera
plataforma Big Data Open Source, a la que llaman Hadoop.
Machine Learning
8
Tercera explosión
Actualmente, nos encontramos inmersos en la tercera explosión del
Machine Learning, en la que gracias a los avances en el sector no paran de
encontrarse aplicaciones en mundo economico. Llegando hasta el punto de
crear completos mercados y produciendo cambios significativos en las
estrategias tanto de pequeñas como de grandes empresas.
Cada vez son más los sectores empresariales que se están beneficiando
del Machine Learning, desde el sector asegurador hasta el marketing pasando
por los call centers.
Machine Learning e Inteligencia Artificial
Ya conocemos el origen de nuestro protagonista, pero ¿sabemos
exactamente qué es el Machine Learning? Habitualmente se suele usar como
sinónimo de la Inteligencia Artificial, sobre todo cuando hablamos de Big Data.
Vamos a dejar claros ambos conceptos antes de profundizar más en el tema en
siguientes artículos.
Machine Learning
9
Machine Learning
10
Machine Learning
11
Machine Learning
12
Machine Learning
13
Machine Learning
14
Clasificación multiclase
En la clasificación multiclase, el conjunto de datos de entrenamiento se
etiqueta con una de las múltiples clases posibles. A diferencia de la
Machine Learning
15
Machine Learning
16
Machine Learning
17
Regresión logística
Se utiliza para determinar la probabilidad de que ocurra un evento. Los
datos de entrenamiento tendrán una variable independiente, y el resultado
deseado será un valor entre 0 y 1. Una vez que el algoritmo se entrena con la
regresión logística, podrá predecir el valor de una variable dependiente (entre 0
y 1) en función del valor de la variable independiente (entrada). La regresión
logística utiliza la función sigmoidea clásica en forma de S. En la regresión
logística en el contexto de aprendizaje supervisado, un algoritmo calcula los
valores del coeficiente beta b0 y b1 a partir de los datos de entrenamiento
proporcionados.
probabilidad = e^(b0 + b1 * X)
Las aplicaciones de la regresión logística incluyen:
• Determinación de la probabilidad: Una de las principales
aplicaciones de la regresión logística es determinar la probabilidad de un
evento. La probabilidad de cualquier evento se encuentra entre 0 y 1, y ese es
el resultado de una función logística. Los algoritmos de regresión logística en
Machine Learning se pueden utilizar para predecir los resultados de las
elecciones, las probabilidades de un desastre natural y otros eventos similares.
• Clasificación: aunque la regresión logística utiliza una función
continua, algunas de sus aplicaciones están en la clasificación. Se puede
utilizar para la segregación de imágenes y problemas de clasificación
relacionados.
Regresión polinomial
La regresión polinomial se utiliza para un conjunto de datos más
complejo que no encajaría perfectamente en una regresión lineal. Un algoritmo
se entrena con un conjunto de datos complejos y etiquetados que podrían no
encajar adecuadamente en una regresión en línea recta. Si dichos datos de
entrenamiento se utilizan con regresión lineal, podría causar un ajuste
insuficiente, donde el algoritmo no capturará las tendencias verdaderas de los
datos. Las regresiones polinomiales permiten una mayor curvatura en la línea
de regresión y, por lo tanto, una mejor aproximación de la relación entre la
variable dependiente y la independiente.
El sesgo y la desviación son dos términos principales asociados con la
regresión polinomial. El sesgo es el error en el modelado que se produce al
Machine Learning
18
Machine Learning
19
Machine Learning
20
Machine Learning
21
Machine Learning
22
Machine Learning
23
partir de Dado el tiempo suficiente, este procedimiento puede así construir una
estimación precisa de la función de la acción-valor . Aquí termina la
descripción de la etapa de evaluación de políticas. En la etapa de mejora de las
políticas, como se hace en el algoritmo de iteración, la siguiente política se
obtiene mediante el cálculo de una política greedy con respecto a : Dado un
estado , la nueva política devuelve una acción que maximiza . En la práctica a
menudo se evita el cómputo y el almacenamiento de la nueva política, pero
utiliza la evaluación perezosa para aplazar el cómputo de las acciones que
maximizan cuando realmente sea necesario. Este procedimiento puede
acarrear algunos problemas como los siguientes:
• Se puede perder mucho tiempo en la evaluación de una política
subóptima;
• Utilizar muestras de manera ineficiente
• Cuando las trayectorias tienen una alta varianza, la convergencia
será lenta;
• Funciona solo en los problemas episódicos;
• Actúa en solo MDPs pequeños y finitos.
Teoría
La teoría de las pequeñas MDP, finitos es bastante madura. Tanto el
comportamiento asintótico como el de muestra finita de la mayoría de los
algoritmos es bien entendido. Como se mencionó previamente, se conocen
algoritmos con demostrablemente buen desempeño en línea. La teoría de la
gran MDP necesita más trabajo. Exploración eficiente es en gran parte intacta
(salvo para el caso de problemas de bandidos). Aunque los límites de
rendimiento en tiempo finito aparecieron muchos algoritmos en los últimos
años, se espera que estos límites mejores ya que son bastante vagos y por lo
tanto se necesita más trabajo para comprender mejor las ventajas relativas, así
como las limitaciones de estos algoritmos. Para algoritmos incrementales se
han resuelto problemas de convergencia asintótica. Recientemente, nuevos
algoritmos incrementales temporales basados en diferencias han aparecido
que convergen en un conjunto mucho más amplio de condiciones de lo que era
posible anteriormente.
(Interactive Chaos , s.f.)
Machine Learning
24
APRENDIZAJE NO SUPERVISADO
Los algoritmos de Aprendizaje no Supervisados infieren patrones de un
conjunto de datos sin referencia a resultados conocidos o etiquetados. A
diferencia del Aprendizaje Supervisado, los métodos de Aprendizaje no
Supervisado no se pueden aplicar directamente a un problema de regresión o
clasificación porque no tiene idea de cuáles pueden ser los valores de los datos
de salida, lo que hace imposible que entrene el algoritmo de la forma en que lo
haría normalmente. En cambio, el aprendizaje sin supervisión puede utilizarse
para descubrir la estructura subyacente de los datos.
Los algoritmos de Aprendizaje no Supervisados te permiten realizar
tareas de procesamiento más complejas en comparación con el Aprendizaje
Supervisado. Sin embargo, el aprendizaje sin supervisión puede ser más
impredecible en comparación con otros métodos de aprendizaje naturales.
Los algoritmos de Aprendizaje no Supervisados se utilizan para agrupar
los datos no estructurados según sus similitudes y patrones distintos en el
conjunto de datos. El término “no supervisado” se refiere al hecho de que el
algoritmo no está guiado como el algoritmo de Aprendizaje Supervisado.
La manera más fácil de entender esto es con un ejemplo, tenemos un
bebe y su perro. Ella conoce e identifica a su perro. Unas semanas más tarde,
un amigo de la familia trae un perro y trata de jugar con la bebé. La bebé no ha
visto a este perro antes, pero reconoce muchos rasgos de él, 2 orejas, 2 ojos,
caminar sobre 4 patas, son como su mascota. Ella identifica al nuevo animal
con un perro. Este ejemplo se trata de un aprendizaje sin supervisión, en el que
no se le enseña, sino que se aprende a partir de los datos, en este caso, los
datos sobre un perro.
¿Por qué es importante el Aprendizaje no Supervisado?
El Aprendizaje no Supervisado pretende descubrir patrones previamente
desconocidos en los datos, pero la mayoría de las veces estos patrones son
aproximaciones deficientes de lo que el Aprendizaje Supervisado puede lograr.
Además, dado que no sabe cuáles deberían ser los resultados, no hay forma
Machine Learning
25
Machine Learning
26
Machine Learning
27
APRENDIZAJE PROFUNDO
El aprendizaje profundo (Deep Learning) es un tipo de aprendizaje
automático (machine learning, ML) e inteligencia artificial (IA) que imita la forma
en que los humanos obtienen ciertos tipos de conocimiento.
El aprendizaje profundo es un elemento importante de la ciencia de
datos, que incluye estadísticas y modelos predictivos. Es extremadamente
beneficioso para los científicos de datos que tienen la tarea de recopilar,
analizar e interpretar grandes cantidades de datos; el aprendizaje profundo
hace que este proceso sea más rápido y sencillo.
En su forma más simple, el aprendizaje profundo se puede considerar
como una forma de automatizar el análisis predictivo. Si bien los algoritmos de
aprendizaje automático tradicionales son lineales, los algoritmos de aprendizaje
Machine Learning
28
Machine Learning
29
Machine Learning
30
Machine Learning
31
Machine Learning
32
Machine Learning
33
Ejemplos:
Aprendizaje profundo
Por ejemplo, un modelo de aprendizaje profundo conocido como «redes
neuronales convolucionales», se puede entrenar como un gran número (de
millones) de imágenes; por ejemplo, las que contienen gatos. Este tipo de red
neuronal normalmente aprende de los píxeles que contienen las imágenes que
adquiere.
Machine Learning
34
Aprendizaje no supervisado:
Las principales aplicaciones del aprendizaje no supervisado están
relacionadas en el agrupamiento o clustering de datos. Aquí, el objetivo es
encontrar subgrupos homogéneos dentro de los datos. Estos alogoritmos se
basan en la distancia entre observaciones.
Machine Learning
35
Machine Learning
36
Machine Learning
37
BIBLIOGRAFÍA
Machine Learning
38
CONCLUSIONES
Machine Learning
39
Machine Learning
40
Machine Learning
41
Machine Learning
42
ANEXOS
Machine Learning
43
Machine Learning