Clustering Jerárquico PDF

Cargado por

andres felipe

0% encontró este documento útil (0 votos)

66 vistas3 páginas

Título original

Clustering jerárquico.pdf

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

66 vistas3 páginas

Clustering Jerárquico PDF

Cargado por

andres felipe

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 3

Buscar dentro del documento

Clustering jerárquico – Andres Felipe Aya Roa

Es un método de data mining para agrupar datos (en minería de datos a estos grupos de datos se
les llama clúster).
El algoritmo de clúster jerárquico agrupa los datos basándose en la distancia entre cada uno y
buscando que los datos que están dentro de un clúster sean los más similares entre sí.

En una representación gráfica los elementos quedan anidados en jerarquías con forma de árbol.
Lo mejor para explicarlo es una imagen. Así que para ilustrar mejor este tema de agrupación en
categorías voy a retomar un ejemplo gráfico muy difundido – y a la vez es el más descriptivo que
he encontrado – que es el que exponen en la Wikipedia.

En la primera imagen vemos cómo están distribuidos los datos y a qué distancia se encuentran
unos de otros. En la segunda, vemos un ejemplo de clustering jerárquico dónde los datos se
agrupan en función de la distancia (en este caso distancia euclidiana) entre ellos.

Al igual que el método de K-Means (aquí puedes ver una introducción al método K-
Means publicada en esta web), los algoritmos de agrupamiento jerárquico están dentro de la
categoría de algoritmos de aprendizaje no supervisado.

CÓMO FUNCIONA UN ALGORITMO DE CLUSTERING JERÁRQUICO

Se pueden definir dos tipos de clustering jerárquico dependiendo de la dirección en la que el
algoritmo ejecute el agrupamiento:

• Tipo Aglomerativo: Empezamos a agrupar desde cada elemento individual.

Al inicio cada punto o dato está en un clúster separado. A cada paso, los dos
clústeres más cercanos se fusionan. Estas fusiones de clúster se siguen
produciendo de forma sucesiva produciendo una jerarquía de resultados de
clustering. Al final del proceso solo queda un único clúster que aglutina todos los
elementos.
• Divisible: Comenzamos a la inversa, partimos de un único clúster que aglomera
todos los datos y vamos dividiendo en clústeres más pequeños

Medir la distancia
Además de la dirección en la que se haga la agrupación, también tenemos que definir cómo vamos
a medir la distancia entre clústeres. Podemos tener 4 tipos de medidas de distancia entre
clústeres:

Conexión completa: La distancia se mide entre los dos puntos más lejanos de cada clúster
Conexión simple: Es la opuesta a la conexión completa. Toma la distancia mínima entre dos
puntos de cada clúster.
Distancia entre medias: La distancia entre dos clústeres se calcula como la distancia entre las
medias de cada uno.
La distancia promedio entre pares: Es el promedio entre todas las distancias que podemos
obtener entre todos los pares de puntos.

REPRESENTACIÓN: EL DENDROGRAMA
La manera de representar un clustering jerárquico es con un dendrograma.
Las líneas verticales del dendrograma ilustran las fusiones (o divisiones) realizadas en cada etapa
del clustering. Podemos ver la distancia, los distintos niveles de asociaciones entre los datos
individuales y también las asociaciones entre clústeres.

También podría gustarte

04c SIMULACION de SISTEMAS Simulacion de Sistemas de Inventarios en Arena
Documento8 páginas
04c SIMULACION de SISTEMAS Simulacion de Sistemas de Inventarios en Arena
luispename1
Aún no hay calificaciones
Pre - Saberes Fase Inicial - Contextualización
Documento3 páginas
Pre - Saberes Fase Inicial - Contextualización
Carolina Jiménez
Aún no hay calificaciones
Presentación - K-Means.13775252 PDF
Documento67 páginas
Presentación - K-Means.13775252 PDF
Mejia Ruiz Francisco
Aún no hay calificaciones
Silabo Teoria de La Probabilidad 2019
Documento3 páginas
Silabo Teoria de La Probabilidad 2019
Richard N
Aún no hay calificaciones
04 - La Gestión en Entornos Ágiles
Documento8 páginas
04 - La Gestión en Entornos Ágiles
Perez Martín
Aún no hay calificaciones
Metodológica y Proceso Scrum para Proyectos
Documento11 páginas
Metodológica y Proceso Scrum para Proyectos
Fredy Cubides
100% (1)
Curso Minitab Avanzado
Documento5 páginas
Curso Minitab Avanzado
jaime
Aún no hay calificaciones
Fuzzificacion
Documento18 páginas
Fuzzificacion
Luis Garcia
Aún no hay calificaciones
Introducción a la Estadística Empresarial
De Everand
Introducción a la Estadística Empresarial
Barbara Illowsky
Aún no hay calificaciones
Diseño y Validación de Modelos para Sistemas de Recomendación PDF
Documento258 páginas
Diseño y Validación de Modelos para Sistemas de Recomendación PDF
Anonymous
Aún no hay calificaciones
Elementos de estadística para ingeniería: Un curso básico
De Everand
Elementos de estadística para ingeniería: Un curso básico
Rigoberto Quintero Camacho
Aún no hay calificaciones
Sales Prediction Based On Machine Learning - En.es
Documento6 páginas
Sales Prediction Based On Machine Learning - En.es
johan
Aún no hay calificaciones
Clase - 1 - Introduccion - Al - Modelamiento - y - Simulacion
Documento35 páginas
Clase - 1 - Introduccion - Al - Modelamiento - y - Simulacion
Ronald Zamudio Salazar
Aún no hay calificaciones
Parcial 1 Modelación y Simulación II
Documento11 páginas
Parcial 1 Modelación y Simulación II
Valentina Movil Sandoval
Aún no hay calificaciones
Clase 26 Regresion Lineal Simple
Documento7 páginas
Clase 26 Regresion Lineal Simple
John Anthony Apaza
100% (1)
SVM PDF
Documento33 páginas
SVM PDF
Victor Contreras Ordoñez
Aún no hay calificaciones
Workflow Modelado Del Negocio
Documento4 páginas
Workflow Modelado Del Negocio
User334422
Aún no hay calificaciones
ModeladoOO: Introducción al Modelado Orientado a Objetos
Documento19 páginas
ModeladoOO: Introducción al Modelado Orientado a Objetos
Sebas Pisso
Aún no hay calificaciones
Toma de decisiones bajo incertidumbre con árboles de decisión y análisis de sensibilidad
Documento26 páginas
Toma de decisiones bajo incertidumbre con árboles de decisión y análisis de sensibilidad
stone_c35
Aún no hay calificaciones
Modelo de Sistema Viable
Documento53 páginas
Modelo de Sistema Viable
Huarcaya Nina Jhon
100% (1)
Balanced Scorecard: Cuadro de Mando Integral
Documento28 páginas
Balanced Scorecard: Cuadro de Mando Integral
osmary
Aún no hay calificaciones
Estadistica en Una Empresa
Documento4 páginas
Estadistica en Una Empresa
Sebastian Cruz Hernandez
Aún no hay calificaciones
Trabajo Final Agrupamiento
Documento16 páginas
Trabajo Final Agrupamiento
Riardo Artunduaga
100% (1)
Metodologia SCRUM Grupo 7 PDF
Documento11 páginas
Metodologia SCRUM Grupo 7 PDF
juliana
Aún no hay calificaciones
GQM - Goal Question Metric
Documento27 páginas
GQM - Goal Question Metric
Luigi Mendoza Jiibaja
Aún no hay calificaciones
Implementación de Una Red de Acceso 4g Lte
Documento31 páginas
Implementación de Una Red de Acceso 4g Lte
Oswaldo Ccoñas Sandoval
100% (1)
Modelo Predictivo
Documento10 páginas
Modelo Predictivo
Karlos Vergara
Aún no hay calificaciones
Anova
Documento5 páginas
Anova
Alexander Loaiza
Aún no hay calificaciones
LTE (Long Term Evolution) Evolución A Largo Plazo
Documento37 páginas
LTE (Long Term Evolution) Evolución A Largo Plazo
Bruno Mauricio Gonnet
Aún no hay calificaciones
S08.s16 - Entrevistas de Evaluación Situacional o Assessment Centres PDF
Documento21 páginas
S08.s16 - Entrevistas de Evaluación Situacional o Assessment Centres PDF
Kath Portilla
Aún no hay calificaciones
Diagnóstico Del Nivel de Implementación de La Industria 4.0
Documento9 páginas
Diagnóstico Del Nivel de Implementación de La Industria 4.0
jeliach
Aún no hay calificaciones
PracticaSVM PDF
Documento8 páginas
PracticaSVM PDF
Paul Diaz
Aún no hay calificaciones
Modelo y Simulación - Dinamica Sistemas
Documento27 páginas
Modelo y Simulación - Dinamica Sistemas
Christopher Jesús Guerrero Carbajal
Aún no hay calificaciones
Algoritmo Genetico
Documento52 páginas
Algoritmo Genetico
marisa arango palomino
Aún no hay calificaciones
Heuristica y Metaheuristica Aplicadas en Logistica y Producciòn
Documento22 páginas
Heuristica y Metaheuristica Aplicadas en Logistica y Producciòn
Cesar Augusto Rovira Cabezas
Aún no hay calificaciones
Analisis Clusterd
Documento27 páginas
Analisis Clusterd
Alfredo Zea Valenzuela
Aún no hay calificaciones
Syllabus Del Curso Aspectos Éticos y Legales de La Seguridad de La Información
Documento10 páginas
Syllabus Del Curso Aspectos Éticos y Legales de La Seguridad de La Información
Javier Marmolejo Serrano
Aún no hay calificaciones
Simulación: Método Montecarlo
Documento5 páginas
Simulación: Método Montecarlo
Miguel Ángel Camacho
Aún no hay calificaciones
Curso de Redes Neuronales 1
Documento45 páginas
Curso de Redes Neuronales 1
Edison Javier Acevedo Arismendi
Aún no hay calificaciones
Modelos Lineales Generalizados PDF
Documento39 páginas
Modelos Lineales Generalizados PDF
Sulema Iridian
Aún no hay calificaciones
Maquina de Vectores
Documento24 páginas
Maquina de Vectores
Angel Alberto Vargas Cano
Aún no hay calificaciones
Ciencia de Datos para Gente Sociable
Documento116 páginas
Ciencia de Datos para Gente Sociable
Gonzalo Torchio
Aún no hay calificaciones
Estrategias de Manufactura
Documento8 páginas
Estrategias de Manufactura
William Harvey
Aún no hay calificaciones
Introducción a la simulación: qué es y tipos
Documento46 páginas
Introducción a la simulación: qué es y tipos
Alex Diaz Santisteban
Aún no hay calificaciones
Sistemas de Recomendacion
Documento15 páginas
Sistemas de Recomendacion
Patricia B. Nolberto
Aún no hay calificaciones
Algoritmo Genetico
Documento19 páginas
Algoritmo Genetico
Pitter Pastor
Aún no hay calificaciones
Sistemas Complejos22
Documento28 páginas
Sistemas Complejos22
Curtis Rivera
Aún no hay calificaciones
ML aprendizaje máquinas evidencia clase
Documento13 páginas
ML aprendizaje máquinas evidencia clase
JHON
Aún no hay calificaciones
Comparación MLP, Logit y Probit
Documento2 páginas
Comparación MLP, Logit y Probit
Adriana Jiménez Torres
Aún no hay calificaciones
IO optimización modelado 40
Documento73 páginas
IO optimización modelado 40
Ing. Oscar Rojas Hernandez
Aún no hay calificaciones
657-Texto-Del Limites de Creciemintos
Documento12 páginas
657-Texto-Del Limites de Creciemintos
Pierre Alexander Camacho Benites
Aún no hay calificaciones
Metricas Tecnicas Del Software
Documento87 páginas
Metricas Tecnicas Del Software
rancruel027
100% (1)
Redes Neuronales
Documento8 páginas
Redes Neuronales
Audita
Aún no hay calificaciones
14 - Regresión Lineal
Documento30 páginas
14 - Regresión Lineal
Colara ViveTusColores
Aún no hay calificaciones
Lenguaje Programación Avanzado I
Documento99 páginas
Lenguaje Programación Avanzado I
jorge leonardo
Aún no hay calificaciones
Simulación Monte Carlo para evaluación de proyectos
Documento28 páginas
Simulación Monte Carlo para evaluación de proyectos
Alex
100% (1)
Taller Data Science
Documento15 páginas
Taller Data Science
Harrison QUINTERO CAICEDO
Aún no hay calificaciones
Modelo Proceso Analtico Jerrquico Saaty
Documento4 páginas
Modelo Proceso Analtico Jerrquico Saaty
Diegoo Guevara
Aún no hay calificaciones
03 - Herramientas de Inteligencia de Negocio 1.1 45685
Documento61 páginas
03 - Herramientas de Inteligencia de Negocio 1.1 45685
Karina Alvarez Hancco
Aún no hay calificaciones
Articulo Scrum Vs Rup
Documento8 páginas
Articulo Scrum Vs Rup
Vyserion Free Fire
Aún no hay calificaciones
TMP - 4875-Machine Learning - Libro Online de IAAR6425397170085804942
Documento13 páginas
TMP - 4875-Machine Learning - Libro Online de IAAR6425397170085804942
alejandro
Aún no hay calificaciones
Tabla de Hechos
Documento2 páginas
Tabla de Hechos
andres felipe
Aún no hay calificaciones
Qué Es Data Warehouse
Documento7 páginas
Qué Es Data Warehouse
andres felipe
Aún no hay calificaciones
Parcial II
Documento3 páginas
Parcial II
andres felipe
Aún no hay calificaciones
Data Mining
Documento4 páginas
Data Mining
andres felipe
Aún no hay calificaciones
Parcial
Documento2 páginas
Parcial
andres felipe
Aún no hay calificaciones
Clustering Jerárquico PDF
Documento3 páginas
Clustering Jerárquico PDF
andres felipe
Aún no hay calificaciones
Regresión lineal y cuadrática para predecir clientes, pesos y precios
Documento9 páginas
Regresión lineal y cuadrática para predecir clientes, pesos y precios
andres felipe
Aún no hay calificaciones
Articulo
Documento3 páginas
Articulo
andres felipe
Aún no hay calificaciones
Clustering
Documento3 páginas
Clustering
andres felipe
Aún no hay calificaciones
Clustering Jerárquico PDF
Documento3 páginas
Clustering Jerárquico PDF
andres felipe
Aún no hay calificaciones
Método de la Gran M y reoptimización de procesos productivos
Documento4 páginas
Método de la Gran M y reoptimización de procesos productivos
andres felipe
Aún no hay calificaciones
Taller Regresión Exponencial y Algorítmica
Documento7 páginas
Taller Regresión Exponencial y Algorítmica
andres felipe
Aún no hay calificaciones
Tarea 2
Documento2 páginas
Tarea 2
andres felipe
Aún no hay calificaciones
Qué Es Data Warehouse
Documento7 páginas
Qué Es Data Warehouse
andres felipe
Aún no hay calificaciones
Data Mining
Documento4 páginas
Data Mining
andres felipe
Aún no hay calificaciones
Clustering Jerárquico PDF
Documento3 páginas
Clustering Jerárquico PDF
andres felipe
Aún no hay calificaciones
Qué Es Data Warehouse
Documento7 páginas
Qué Es Data Warehouse
andres felipe
Aún no hay calificaciones
Trabajo ISFCOL
Documento19 páginas
Trabajo ISFCOL
andres felipe
Aún no hay calificaciones
Taller Lectura Crítica Ceplec I Semana Cinco Isum
Documento2 páginas
Taller Lectura Crítica Ceplec I Semana Cinco Isum
andres felipe
100% (2)
Entorno de Programacion IDE
Documento4 páginas
Entorno de Programacion IDE
andres felipe
Aún no hay calificaciones
Ev Modelo Relacional
Documento74 páginas
Ev Modelo Relacional
DELIA MARINA HERAZO TUIRAN
Aún no hay calificaciones
Testo Saveris Life Science CFR Cockpit - Catálogo
Documento4 páginas
Testo Saveris Life Science CFR Cockpit - Catálogo
Sebastián Janavel
Aún no hay calificaciones
Comunicado - Ingreso PFR 2023-1 (AD)
Documento3 páginas
Comunicado - Ingreso PFR 2023-1 (AD)
Luis Alberto Crisanto Loayza
Aún no hay calificaciones
Oficio - Multiple-000025a-2023-Dgipat - Arequipa
Documento4 páginas
Oficio - Multiple-000025a-2023-Dgipat - Arequipa
SISFOH Caylloma
Aún no hay calificaciones
Guía para El Desarrollo Del Componente Práctico y Rúbrica de Evaluación - Unidad 3 - Fase 4 - Componente Práctico - Construcción de La Solución
Documento8 páginas
Guía para El Desarrollo Del Componente Práctico y Rúbrica de Evaluación - Unidad 3 - Fase 4 - Componente Práctico - Construcción de La Solución
Juan Diaz
Aún no hay calificaciones
Practica de Laboratorio 4
Documento3 páginas
Practica de Laboratorio 4
Sue Pat
Aún no hay calificaciones
Calendario Semanal 2023
Documento3 páginas
Calendario Semanal 2023
Albert
Aún no hay calificaciones
Hoja de Datos Del Producto Rosemount 3051 Transmisor de Presión Es Es 73192
Documento132 páginas
Hoja de Datos Del Producto Rosemount 3051 Transmisor de Presión Es Es 73192
Zts Mks
Aún no hay calificaciones
Lenguaje ANSI C Optativa I FBP FIME 2
Documento11 páginas
Lenguaje ANSI C Optativa I FBP FIME 2
BernScribd
Aún no hay calificaciones
Codigo y Explicacion Ventana en C++
Documento9 páginas
Codigo y Explicacion Ventana en C++
Alfredo Mujica
Aún no hay calificaciones
IRqA Integal Requisite Analizer
Documento4 páginas
IRqA Integal Requisite Analizer
Diana Fernanda Sanchez
Aún no hay calificaciones
EJERCICIO Proceso de Muestreo y Tamaño de Muestra.
Documento7 páginas
EJERCICIO Proceso de Muestreo y Tamaño de Muestra.
MARIA ROSA YAÑEZ RIVERA
Aún no hay calificaciones
1.-Ficha Tecnica de Proceso de Metrologia
Documento4 páginas
1.-Ficha Tecnica de Proceso de Metrologia
Bel Morales
Aún no hay calificaciones
Descargar
Documento3 páginas
Descargar
Joshua Hernández
Aún no hay calificaciones
Diseño de Integracion Currilular - Seminario 1
Documento72 páginas
Diseño de Integracion Currilular - Seminario 1
isabeldsam
Aún no hay calificaciones
Tema 2.3 - Actividades - Especializacion
Documento2 páginas
Tema 2.3 - Actividades - Especializacion
Alejandro Herrera
Aún no hay calificaciones
Spark2
Documento46 páginas
Spark2
mauricio995
Aún no hay calificaciones
Activar Eset Nod 32
Documento9 páginas
Activar Eset Nod 32
Cristian Otavalo Alba
Aún no hay calificaciones
Desmitificando A Los NFTs - Matías Lavanda & Álvaro Gastañadui
Documento27 páginas
Desmitificando A Los NFTs - Matías Lavanda & Álvaro Gastañadui
Matías Lavanda
Aún no hay calificaciones
Ensayonfernando 3262b5399fec26b
Documento6 páginas
Ensayonfernando 3262b5399fec26b
Monica Guerra
Aún no hay calificaciones
007 Pro 04 5010hohsa 00048
Documento6 páginas
007 Pro 04 5010hohsa 00048
Daniela Araos Walker
Aún no hay calificaciones
Guia de Usuario BLUE
Documento14 páginas
Guia de Usuario BLUE
Daniel Ordorica
Aún no hay calificaciones
Instalar Fusion Org, Balandro y Control Remoto en Kodi
Documento19 páginas
Instalar Fusion Org, Balandro y Control Remoto en Kodi
Hide777
Aún no hay calificaciones
Taller 2 Windows 7
Documento4 páginas
Taller 2 Windows 7
VICTOR HUGO LEON QUINTANA
Aún no hay calificaciones
Royal Knight - Digimon X
Documento4 páginas
Royal Knight - Digimon X
Luis Carpio
Aún no hay calificaciones
HTML
Documento14 páginas
HTML
Carmen Selene Tondopó Velázquez
Aún no hay calificaciones
JIMDO
Documento7 páginas
JIMDO
Roxana Mina
Aún no hay calificaciones
Trucos 20 Access
Documento45 páginas
Trucos 20 Access
Ramón
Aún no hay calificaciones
Claves de Dictation para Los Usuarios de MAC
Documento5 páginas
Claves de Dictation para Los Usuarios de MAC
lplaza85
Aún no hay calificaciones