Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Minería de datos
20 de octubre de 2022
Universidad Abierta y a Distancia de México
Actividad 1. Naturaleza de los grandes datos.
a. Clustering jerárquico
El Clustering Jerárquico (agrupamiento jerárquico o Hierarchical Clustering en
inglés), es un método de data mining (Minería de datos) para agrupar datos en
clases, tal que objetos dentro de una clase sean lo más semejantes entre sí,
pero muy diferentes con otros objetos de otra clase. El algoritmo de clúster
jerárquico agrupa los datos basándose en la distancia entre cada uno y
buscando que los datos que están dentro de un clúster sean los más similares
entre sí. Un clúster es una colección de datos u objetos que son similares entre
sí dentro del mismo clúster y diferentes a otros objetos en otros clústeres
(Romero, 2019).
En una representación gráfica los elementos quedan anidados en jerarquías con
forma de árbol.
b. Random forest
Un Random Forest es un conjunto (ensemble) de árboles de
decisión combinados con bagging. Al usar bagging, lo que en realidad está
pasando, es que distintos árboles ven distintas porciones de los datos. Ningún
árbol ve todos los datos de entrenamiento. Esto hace que cada árbol se entrene
con distintas muestras de datos para un mismo problema. De esta forma, al
combinar sus resultados, unos errores se compensan con otros y tenemos una
predicción que generaliza mejor (Martínez, 2020).
En este tipo de red se toma como parámetro de medición el tiempo, entre otros
factores, se puede utilizar para resolver problemas de optimización o como
memoria asociativa. Para ésta RNA, las entradas suelen ser binarias.
Es una red Monocapa, con N neuronas, la que tiene por salida 0 o 1. En esta
red existe la retroalimentación, sin embargo, la salida de una neurona no es
entrada de la misma.
Las redes se pueden concebir como grafos con nodos y enlaces. Se organizan
por capas, la primera es de entrada, las siguientes son denominadas ocultas, y
finalmente la capa de salida (Martínez, 2020).
Por otra parte, según Francisco Javier Martínez de Pisón Ascacíbar (citado en
Romero, 2019) “en la práctica, quizás, una de las clasificaciones más
interesantes de los algoritmos de minería de datos es la que corresponde con
su función”, entonces se pueden clasificar:
Tipos de algoritmos de minería de datos
Benedet, M. (s. f). Qué es data mining, cómo funciona, algoritmos y ejemplos.
19/10/2022. https://blog.mdcloud.es/que-es-data-mining-algoritmos-y-ejemplos/
Duk2. (s. f.). Algoritmos de Data Mining para agrupar datos – Clustering
Jerárquico. 19/10/2022. https://estrategiastrading.com/clustering-jerarquico/