Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MAESTRÍA EN ELECTRICIDAD
MENSIÓN EN SISTEMAS ELÉCTRICOS DE POTENCIA
NOMBRE DE LA ASIGNATURA
TEMA 1: MÉTODOS MATEMÁTICOS DE LA INTELIGENCIA ARTIFICIAL
1
ANÁLISIS CLUSTER
En el campo del Machine Learning, el Clustering se enmarca dentro del aprendizaje no supervisado; es decir,
que para esta técnica solo disponemos de un conjunto de datos de entrada, sobre los que debemos obtener
información sobre la estructura del dominio de salida, que es una información de la cual no se dispone
Es importante no confundir el Clustering con los problemas de Clasificación. Las técnicas de Clasificación se
enmarcan dentro del aprendizaje supervisado porque para cada dato tenemos información sobre sus
variables de entrada y de salida; es decir, cada dato u objeto esta etiquetado. Sin embargo para aquellos
casos en los que no disponemos de la salida de cada dato y queramos agrupar estos objetos en grupos
similares, debemos de aplicar alguna de las técnicas de Clustering para saber la procedencia de estos datos.
CLUSTER vs CLASIFICACIÓN
PROBLEMA DE CLASIFICACIÓN CLUSTER
COLOR DE CABELLO
EN CODIGO RGB
METODOS:
ANÁLISIS DE CONGLOMERADOS:
METODOS: Minimizar
distancia
Intra Clúster
DEFINICION GENERAL
Dado un conjunto de datos definido por una muestra de un universo, la matriz X, conformada de
n individuos y sobre los que se explican p variables, para cada objeto i se establece un elemento
definido como 𝒙𝒊𝒋 siendo la variable 𝑥𝑖 en el i-ésimo objeto, con j=1,2,3,… p se establece la matriz
EXPLORACION VISUAL
OBJETIVO
𝑛
1 2
𝑖𝑛𝑒𝑟𝑐𝑖𝑎 = 𝑥𝑖 − 𝜇
𝑛
𝑖=0
Distancia
METODO K-MEANS
𝐼(𝑃) = 𝐵 𝑃 + 𝑊(𝑊)
Notar que, como la inercia I(P) es fija, dada la nube de puntos, entonces al maximizar
B(P) se minimiza automáticamente W(P)
METODO K-MEANS
CUANTOS KLUSTERS?
METODO K-MEANS
• BD Datos salud
CLUSTER JERARQUICO
CLASIFICACION JERARQUICA ASCENDENTE
TABLA T(n,p)
D E B A C
INDIVIDUOS
CLASIFICACION JERARQUICA ASCENDENTE
METODO K-MEANS
• BD Eficiencia Energética
https://matesnoaburridas.wordpress.com/2021/03/28/diagramas-cajas-y-bigotes/
TRATAMIENTO DE VALORES ATIPICOS
TRATAMIENTO DE VALORES ATIPICOS
El algoritmo funciona pasando por una puntuación de anomalía. Una indicación de una
puntuación baja significa que el punto de datos es normal. Sin embargo, si la puntuación está en
un nivel superior, indica la presencia de una anomalía.
BOSQUE DE AISLAMIENTO
Los métodos utilizados en este enfoque son diferentes de los otros métodos. La mayoría de los
métodos primero intentaron identificar la región normal de los datos y luego avanzaron para
identificar cualquier cosa que pareciera fuera de lugar.
AGRUPACIÓN DE DBSCAN
El nombre del método en sí denota que este
enfoque implica un algoritmo de agrupación. El
algoritmo se utiliza para identificar valores
atípicos mediante un método de detección de
anomalías basado en la densidad. Este método es
ideal para datos unidimensionales y
multidimensionales, se basa en los siguientes
conceptos
Puntos centrales : para comprender este concepto, primero debe conocer los hiperparámetros
utilizados para definir el trabajo de DBScan, es decir, [HP] min_samples (para un número mínimo
de puntos básicos necesarios para formar un clúster) y [HP] eps. eps (para la distancia máxima
entre dos muestras requerida para formar un grupo).
Puntos fronterizos : grupo casi similar a los puntos centrales, pero mucho más lejos del centro del
grupo.
Puntos de ruido : cualquier punto de datos que no pertenezca a ningún tipo de grupo se puede
llamar puntos de ruido. Esto puede ser anómalo o no anómalo, sin embargo, sería muy necesario
realizar más investigaciones.
TRATAMIENTO DE VALORES ATIPICOS
•Forzar. Sustituye los valores atípicos y extremos por el valor más cercano que no se
consideraría extremo. Por ejemplo, si un valor atípico se define como todo lo que queda
por encima o por debajo de tres desviaciones estándar, todos los valores atípicos se
sustituirían por el valor mayor o menor de este intervalo.
•Descartar. Descarta los registros con valores atípicos o extremos para el campo
especificado.
•Anular. Sustituye los valores atípicos y extremos con valores nulos o perdidos por el
sistema.
•Forzar valores atípicos/descartar extremos. Descarta sólo los valores extremos.
•Forzar valores atípicos/anular extremos. Anula sólo los valores extremo
TAREA AUTO APRENDISAJE AA2