0% encontró este documento útil (0 votos)

76 vistas38 páginas

Introducción a Machine Learning y Algoritmos

Este documento presenta una introducción a varios temas de machine learning, incluyendo regresión logística, árboles de decisión y máquinas de vectores de soporte. Explica brevemente cómo funcionan estos algoritmos de clasificación supervisada y provee ejemplos ilustrativos de cómo pueden aplicarse a problemas comunes como la detección de spam, diagnósticos médicos y más.

Cargado por

Tony Mayhuay Rashta

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

76 vistas38 páginas

Introducción a Machine Learning y Algoritmos

Cargado por

Tony Mayhuay Rashta

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Machine Learning

Pablo Belmar Apablaza

Regresión Logística

Árboles de decisión
Temas

Support vector machine

Antes !
¿Cómo el computador enfrenta un problema?

Antes de hablar sobre ML

¿Cómo el humano enfrenta un problema?

Lógica humana:
• Analizar la situación, y luego tomar una decisión.

Lógica del computador:

• Compara los datos de entrada, y toma un camino.

Fuente: Matías Katz

-Razonamiento:
• Llueve, entonces llevo chaqueta.
• No tengo hambre, entonces no como.

-Ordenes preestablecidas:
• P -> Q
• -P -> -Q
- Razonamiento:
• Si el semáforo está en rojo parpadeando, pero pasaron sólo 5
segundos desde que empezó a parpadear, y la calle que voy a cruzar
tiene menos de 10 metros de ancho, y no estoy cargando nada que
me haga caminar lento, y no hay autos que vengan rápido por la calle
que intenten cruzar el semáforo en rojo o en amarillo, entonces
cruzo.
-Órdenes preestablecidas:
Si “Parpadeo” = verdadero
Si “Tiempo de parpadeo” < 5 seg:
Si “Longitud calle” < 10 mts:
Si “Cargando algo pesado” = falso:
Si “Autos andando rápido” = falso:
Cruzar
Si no:
No cruzar
Diferencias entre algoritmos de IA y algoritmos tradicionales de reglas
Fuente: Gartner
Métodos de clasificación
La clasificación supervisada es una de las tareas que más frecuentemente son
llevadas a cabo por los denominados Sistemas Inteligentes. Por lo tanto, un gran
número de paradigmas desarrollados bien por la Estadística (Regresión Logística,
Análisis Discriminante) o bien por la Inteligencia Artificial (Redes Neuronales,
Inducción de Reglas, Árboles de Decisión, Redes Bayesianas) son capaces de
realizar las tareas propias de la clasificación.
Clasificación
Cuando usamos clasificación, el resultado es una clase, entre un
número limitado de clases. Con clases nos referimos a categorías
arbitrarias según el tipo de problema
Por ejemplo, si queremos detectar si un correo es spam o no, sólo hay
2 clases. Y el algoritmo de machine learning de clasificación, tras darle
un correo electrónico, tiene que elegir a qué clase pertenece: spam o
no-spam
Hay muchos más ejemplos, por supuesto:

¿comprará el cliente este producto? [sí, no]

¿tipo de tumor? [maligno, benigno]

¿subirá el índice bursátil? IBEX mañana [sí, no]

¿es este comportamiento una anomalía? [sí, no]

Regresión Logística
¿Cuál es la diferencia entre regresión lineal y logística?

La regresión lineal es adecuada para estimar valores continuos (por

ejemplo, estimar el precio de la vivienda), pero no es la mejor
herramienta para predecir la clase de un punto de dato observado.
Para estimar la clase de un punto de datos, necesitamos algún tipo de
orientación sobre cuál sería la clase más probable para ese punto de
dato. Para ello, se utiliza la regresión logística.
• Regresión lineal

La regresión lineal trata de encontrar una función que relaciona una variable dependiente
continua, Y, con algunos predictores (variables independientes x_1, x_2, …) Por ejemplo, una
regresión lineal simple asume una función de la forma:
• aquí, se trata de encontrar el valor de los parámetros θ_0, θ_1, θ_2, …,
donde el término θ_0 es el interceptor. Todo esto se muestra
generalmente como:
Regresión logística
La regresión logística es una variación de la regresión lineal, y es útil
cuando la variable dependiente observada, Y, es categorica. Esto
produce una fórmula que predice la probabilidad de una etiqueta de
clase como una función de las variables independientes.
La regresión logística ajusta una curva especial en
forma de S tomando como base una regresión lineal
y transformando la estimación numérica en una
probabilidad utilizando la siguiente función, que se
llama función sigmoidea:
Así, la regresión logística pasa
la entrada a la función
sigmoide/logística para
después tratar el resultado
como una probabilidad como
se muestra en la figura.
Vamos a ver como funciona !
Ejemplo: Fuga de clientes con regresión logística

Las empresas siempre están preocupadas por la cantidad de clientes que dejan su negocio por
competidores. Es por esto que los analistas de las empresas necesitan entender quién se va y por qué.

Se trabajará con un conjunto de datos de telecomunicaciones para predecir la rotación o fuga de

clientes. Este es un conjunto de datos de clientes históricos donde cada fila representa un cliente. Los
datos son relativamente fáciles de entender y procesar. Por lo general, es menos costoso mantener a los
clientes que adquirir nuevos, por lo que el enfoque de este análisis es predecir los clientes que
permanecerán en la empresa.

Este conjunto de datos proporciona información que ayuda a predecir qué comportamiento son
necesarios para retener clientes. Así, se puede analizar los datos relevantes de los clientes y desarrollar
programas específicos para su retención.
Codigo !
Árboles de Decisión

La idea básica de un árbol de decisiones es mapear todas las posibles rutas de toma de decisiones que
tienen la forma de un árbol. Así, los árboles de decisión están formados por nodos y su lectura se realiza
de la raíz hacia las hojas terminales. En un árbol de decisión se puede distinguir 3 tipos diferentes de
nodos:

* Nodo raíz: en él se produce la primera división en función de la variable más importante.

* Nodos intermedios: nodos que vuelven a dividir el conjunto de datos en función de las variables.
* Nodos terminales: se ubican en la parte inferior y su función es indicar la clasificación definitiva.

Un parámetro importan a configurar es la profundidad de un árbol, que viene determinada por el

número máximo de niveles después de la raíz.
Vamos a ver
como funciona !
Ejemplo

Una de las tareas de un investigador médico es recopilar datos para algún estudio en particular. Por
ejemplo, recopilar datos sobre un conjunto de pacientes, todos los cuales padecen la misma
enfermedad. Durante el curso del tratamiento, cada paciente respondió a uno de los 5 medicamentos,
Medicamento A, Medicamento B, Medicamento C, Medicamento X y Medicamento Y.

Parte de su trabajo es construir un modelo para averiguar qué medicamento podría ser apropiado para
un futuro paciente con la misma enfermedad. Los conjuntos de características de este conjunto de
datos son la edad, el sexo, la presión arterial y el colesterol de los pacientes, y el objetivo es el fármaco
al que respondió cada paciente.
El conjunto de datos corresponde a una muestra de clasificador binario, y puede usar la parte de
entrenamiento del conjunto de datos para construir un árbol de decisión y luego usarlo para predecir la
clase de un paciente desconocido, o para recetarle a un nuevo paciente.
Codigo !
Máquinas de Vectores de
Soporte
Las Máquinas de Vectores de Soporte (SVM, del inglés, Support Vector Machine) funciona asignando datos a un espacio de
características de alta dimensión para que los puntos de datos se puedan clasificar, incluso cuando los datos no se pueden separar
linealmente. Se encuentra un separador entre las categorías, luego los datos se transforman de tal manera que el separador podría
dibujarse como un hiperplano. Después de esto, las características de los nuevos datos se pueden utilizar para predecir el grupo al
que debe pertenecer un nuevo registro.

El hiperplano que mejor distingue las zonas de las distintas clases es el hiperplano que maximiza el margen entre estas. Las máquinas
de vectores de soporte son una técnica que encuentra la mejor separación posible entre clases. Con dos dimensiones es fácil
entender lo que está haciendo. Normalmente, los problemas de aprendizaje automático tienen muchísimas dimensiones. Así que en
vez de encontrar la línea óptima, el SVM encuentra el hiperplano que maximiza el margen de separación entre clases.

Se llama máquina en español por la parte de "machine" learning. Los vectores de soporte son los puntos que definen el margen
máximo de separación del hiperplano que separa las clases. Se llaman vectores, en lugar de puntos, porque estos puntos tienen
tantos elementos como dimensiones tenga nuestro espacio de entrada. Es decir, estos puntos multi-dimensionales se representan
con un vector de $n$ dimensiones.
Vamos a ver
como
funciona !
Ejemplo

Se utilizará SVM para construir y entrenar un modelo utilizando registros de

células humanas y clasificará las células según sean benignas o malignas.

El conjunto de datos consta de varios cientos de registros de muestras de células

humanas, cada uno de los cuales contiene los valores de un conjunto de
características celulares.
Los campos de
cada registro
son:
Codigo !
Machine Learning
Pablo Belmar Apablaza

También podría gustarte

005 Aprendizaje Automático-Machine Learning
100% (2)
005 Aprendizaje Automático-Machine Learning
229 páginas
005 Aprendizaje Automático-Machine Learning
Aún no hay calificaciones
005 Aprendizaje Automático-Machine Learning
270 páginas
Machine Learning para Dummies
100% (1)
Machine Learning para Dummies
35 páginas
Clasificadores Lineales y SVM en Machine Learning
Aún no hay calificaciones
Clasificadores Lineales y SVM en Machine Learning
17 páginas
Modelos de Analítica-F
Aún no hay calificaciones
Modelos de Analítica-F
68 páginas
Introducción Al Machine Learning - Una Guía Desde Cero
Aún no hay calificaciones
Introducción Al Machine Learning - Una Guía Desde Cero
14 páginas
Introducción al Aprendizaje Supervisado
Aún no hay calificaciones
Introducción al Aprendizaje Supervisado
57 páginas
Aprendizaje Supervisado en Negocios
Aún no hay calificaciones
Aprendizaje Supervisado en Negocios
49 páginas
Fundamentos y Aplicaciones de Machine Learning
Aún no hay calificaciones
Fundamentos y Aplicaciones de Machine Learning
14 páginas
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad (Fase 1)
Aún no hay calificaciones
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad (Fase 1)
6 páginas
ATD - Sesion 15-16 Supervised Models - NEW Format
Aún no hay calificaciones
ATD - Sesion 15-16 Supervised Models - NEW Format
51 páginas
Clase 6
Aún no hay calificaciones
Clase 6
43 páginas
Pdfuni3 4
Aún no hay calificaciones
Pdfuni3 4
3 páginas
Modelos ML
Aún no hay calificaciones
Modelos ML
9 páginas
Algoritmos de Aprendizaje Supervisado ML
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado ML
3 páginas
Machine Learning
Aún no hay calificaciones
Machine Learning
9 páginas
Guía Introductoria al Machine Learning
Aún no hay calificaciones
Guía Introductoria al Machine Learning
26 páginas
Análisis de Machine Learning con R
Aún no hay calificaciones
Análisis de Machine Learning con R
72 páginas
Modulo4 Qué Es El Machine Learning
Aún no hay calificaciones
Modulo4 Qué Es El Machine Learning
5 páginas
Guía Completa de Aprendizaje de Máquinas
Aún no hay calificaciones
Guía Completa de Aprendizaje de Máquinas
109 páginas
1.2 Casos Prácticos IA
Aún no hay calificaciones
1.2 Casos Prácticos IA
6 páginas
Conceptos Machine Learning
Aún no hay calificaciones
Conceptos Machine Learning
8 páginas
Algoritmos de Clasificación en Machine Learning
Aún no hay calificaciones
Algoritmos de Clasificación en Machine Learning
3 páginas
Introducción a la Ciencia de Datos
Aún no hay calificaciones
Introducción a la Ciencia de Datos
59 páginas
Introducción a Machine Learning y R
Aún no hay calificaciones
Introducción a Machine Learning y R
35 páginas
Fundamentos de Machine Learning y Modelos
Aún no hay calificaciones
Fundamentos de Machine Learning y Modelos
11 páginas
Algoritmos de Clasificación y Regresión
Aún no hay calificaciones
Algoritmos de Clasificación y Regresión
45 páginas
Apuntes Master Aprendizaje
Aún no hay calificaciones
Apuntes Master Aprendizaje
6 páginas
Curso de Ciencia de Datos en ClusterAI
Aún no hay calificaciones
Curso de Ciencia de Datos en ClusterAI
51 páginas
Aprendizaje Supervisado en Machine Learning
Aún no hay calificaciones
Aprendizaje Supervisado en Machine Learning
15 páginas
Modelos de Clasificación en Big Data
Aún no hay calificaciones
Modelos de Clasificación en Big Data
22 páginas
Tipos y Pasos del Aprendizaje Automático
Aún no hay calificaciones
Tipos y Pasos del Aprendizaje Automático
14 páginas
Introducción a las SVM en IA
Aún no hay calificaciones
Introducción a las SVM en IA
9 páginas
Fundamentos de Aprendizaje Supervisado
Aún no hay calificaciones
Fundamentos de Aprendizaje Supervisado
26 páginas
Curso IA Clase 5
Aún no hay calificaciones
Curso IA Clase 5
48 páginas
Introducción al Machine Learning en Python
Aún no hay calificaciones
Introducción al Machine Learning en Python
26 páginas
Algoritmos de Aprendizaje Supervisado
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado
39 páginas
Clase 5 DAAF 2023
Aún no hay calificaciones
Clase 5 DAAF 2023
54 páginas
Clase 6 - Teoria General DS, Python - Setup
Aún no hay calificaciones
Clase 6 - Teoria General DS, Python - Setup
67 páginas
Machine Learning en Finanzas: Tipos y Modelos
Aún no hay calificaciones
Machine Learning en Finanzas: Tipos y Modelos
35 páginas
Diplomado en Ciencia de Datos y ML
Aún no hay calificaciones
Diplomado en Ciencia de Datos y ML
127 páginas
Modelos de ML para Predecir Impagos
Aún no hay calificaciones
Modelos de ML para Predecir Impagos
43 páginas
Introducción al Machine Learning
Aún no hay calificaciones
Introducción al Machine Learning
43 páginas
3 Tecnicas Supervisadas - MD
Aún no hay calificaciones
3 Tecnicas Supervisadas - MD
95 páginas
Fundamentos Matemáticos de SVM
Aún no hay calificaciones
Fundamentos Matemáticos de SVM
73 páginas
Fundamentos del Aprendizaje Automático
Aún no hay calificaciones
Fundamentos del Aprendizaje Automático
68 páginas
Mantenimiento de Aerogeneradores con IA
Aún no hay calificaciones
Mantenimiento de Aerogeneradores con IA
50 páginas
Universidad Tecnológica de Nezahualcóyotl: Extracción de Conocimientos de Base de Datos
Aún no hay calificaciones
Universidad Tecnológica de Nezahualcóyotl: Extracción de Conocimientos de Base de Datos
8 páginas
Algoritmos de Aprendizaje Automático en Python y R
Aún no hay calificaciones
Algoritmos de Aprendizaje Automático en Python y R
49 páginas
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad
Aún no hay calificaciones
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad
7 páginas
Algoritmos Clave en Ciencia de Datos
Aún no hay calificaciones
Algoritmos Clave en Ciencia de Datos
9 páginas
1 Tipos Modelo
Aún no hay calificaciones
1 Tipos Modelo
23 páginas
Algoritmos de Machine Learning
Aún no hay calificaciones
Algoritmos de Machine Learning
5 páginas
Clasificación de Imágenes con SVM en Matlab
Aún no hay calificaciones
Clasificación de Imágenes con SVM en Matlab
18 páginas
Análisis de Datos: Técnicas Estadísticas y Predictivas
Aún no hay calificaciones
Análisis de Datos: Técnicas Estadísticas y Predictivas
3 páginas
Quantum Computers
Aún no hay calificaciones
Quantum Computers
24 páginas
Introducción al Aprendizaje Automático
Aún no hay calificaciones
Introducción al Aprendizaje Automático
89 páginas
Tipos de Modelos ML
Aún no hay calificaciones
Tipos de Modelos ML
1 página
Separata 01
Aún no hay calificaciones
Separata 01
45 páginas
Cómo Hacer una Pizarra de Corcho Económica
Aún no hay calificaciones
Cómo Hacer una Pizarra de Corcho Económica
16 páginas
Situación Nutricional y Salud en Perú
Aún no hay calificaciones
Situación Nutricional y Salud en Perú
46 páginas
25-Texto Del Artículo-112-3-10-20220122
Aún no hay calificaciones
25-Texto Del Artículo-112-3-10-20220122
13 páginas
Nutrición y Cáncer: Prevención y Datos Clave
Aún no hay calificaciones
Nutrición y Cáncer: Prevención y Datos Clave
44 páginas
Autismo Laboral
Aún no hay calificaciones
Autismo Laboral
3 páginas
Flujo de Datos MPEG-2 en Ingeniería de Audio
Aún no hay calificaciones
Flujo de Datos MPEG-2 en Ingeniería de Audio
64 páginas
Sílabo EE508: Ingeniería de Audio y Video
Aún no hay calificaciones
Sílabo EE508: Ingeniería de Audio y Video
1 página
Diseño de Arreglos de Antenas 4λ
Aún no hay calificaciones
Diseño de Arreglos de Antenas 4λ
1 página
Prueba Práctica de Antenas 2021-2
Aún no hay calificaciones
Prueba Práctica de Antenas 2021-2
1 página
Cálculos de Antenas y Radiación Electromagnética
Aún no hay calificaciones
Cálculos de Antenas y Radiación Electromagnética
7 páginas
Análisis de Antenas: Práctica 2021-2
Aún no hay calificaciones
Análisis de Antenas: Práctica 2021-2
1 página
Sistema Automático para Lixiviación de Oro
Aún no hay calificaciones
Sistema Automático para Lixiviación de Oro
90 páginas
La Relación Entre El Humanismo y La Tecnología, Una Aproximación Al Tema Desde La Filosofía de La Tecnología
Aún no hay calificaciones
La Relación Entre El Humanismo y La Tecnología, Una Aproximación Al Tema Desde La Filosofía de La Tecnología
78 páginas
Manual de Instalación LAMP en CentOS 7
Aún no hay calificaciones
Manual de Instalación LAMP en CentOS 7
4 páginas
Modelado de Lenguaje en Recuperación de Texto
Aún no hay calificaciones
Modelado de Lenguaje en Recuperación de Texto
8 páginas
(MetNum) Investigación 4 Runge Kutta
Aún no hay calificaciones
(MetNum) Investigación 4 Runge Kutta
15 páginas
Notación Posfija y Estructura de Pila
Aún no hay calificaciones
Notación Posfija y Estructura de Pila
5 páginas
Análisis de Termofluidos Computacional
Aún no hay calificaciones
Análisis de Termofluidos Computacional
3 páginas
UTEL Estadística y Probabilidad-Modalidad de Exámenes - Semana 3 - Revisión Del Intento
92% (12)
UTEL Estadística y Probabilidad-Modalidad de Exámenes - Semana 3 - Revisión Del Intento
2 páginas
Tarea Grupal en Estrategia Pura y Mixta
Aún no hay calificaciones
Tarea Grupal en Estrategia Pura y Mixta
19 páginas
Heurísticas y Metaheurísticas en Algoritmos
Aún no hay calificaciones
Heurísticas y Metaheurísticas en Algoritmos
19 páginas
Trabajo Pseint SEGUNDO CORTE
Aún no hay calificaciones
Trabajo Pseint SEGUNDO CORTE
9 páginas
Solucion de Problemas de Transporte y Asignacion - Leonardo Palma Forero
Aún no hay calificaciones
Solucion de Problemas de Transporte y Asignacion - Leonardo Palma Forero
52 páginas
Segundo Parcial de Compiladores: Autómatas
Aún no hay calificaciones
Segundo Parcial de Compiladores: Autómatas
8 páginas
Coeficiente de Determinación en Regresión
100% (1)
Coeficiente de Determinación en Regresión
15 páginas
Mapa Conceptual Metodos Cuantitativos
100% (2)
Mapa Conceptual Metodos Cuantitativos
1 página
Análisis de Filtro Analógico: Frecuencias y Ganancia
Aún no hay calificaciones
Análisis de Filtro Analógico: Frecuencias y Ganancia
2 páginas
Método de Reducción en Ecuaciones
Aún no hay calificaciones
Método de Reducción en Ecuaciones
4 páginas
Introducción a Autómatas Finitos
Aún no hay calificaciones
Introducción a Autómatas Finitos
14 páginas
Examen Ítem 1 Investigación de Operaciones
Aún no hay calificaciones
Examen Ítem 1 Investigación de Operaciones
8 páginas
Algoritmos para Cálculos Básicos en Programación
Aún no hay calificaciones
Algoritmos para Cálculos Básicos en Programación
8 páginas
Teoría de Exponentes y Polinomios
Aún no hay calificaciones
Teoría de Exponentes y Polinomios
28 páginas
Diseño Factorial de Dos Factores
100% (2)
Diseño Factorial de Dos Factores
6 páginas
Distribución Normal en Estadística Descriptiva
Aún no hay calificaciones
Distribución Normal en Estadística Descriptiva
5 páginas
Cálculo Actuarial: Fundamentos y Aplicaciones
Aún no hay calificaciones
Cálculo Actuarial: Fundamentos y Aplicaciones
22 páginas
C05 Regresión
Aún no hay calificaciones
C05 Regresión
46 páginas
Evaluación de Trabajo Colaborativo en Criptografía
0% (2)
Evaluación de Trabajo Colaborativo en Criptografía
5 páginas
Análisis de Regresión Lineal Bivariada
Aún no hay calificaciones
Análisis de Regresión Lineal Bivariada
9 páginas
Primer Examen - 2023
Aún no hay calificaciones
Primer Examen - 2023
40 páginas
Sesion Aplicamos Una Encuesta
Aún no hay calificaciones
Sesion Aplicamos Una Encuesta
5 páginas
Métodos Multidimensionales de Búsqueda
Aún no hay calificaciones
Métodos Multidimensionales de Búsqueda
3 páginas
Control Estadístico en Procesos Alimentarios
Aún no hay calificaciones
Control Estadístico en Procesos Alimentarios
4 páginas
Métodos Iterativos en Ecuaciones Lineales
Aún no hay calificaciones
Métodos Iterativos en Ecuaciones Lineales
10 páginas
Algoritmo de Cifrado Clásico
Aún no hay calificaciones
Algoritmo de Cifrado Clásico
8 páginas