Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Elementos reales del conjunto de datos como centroides (en lugar de computar
nuevos centroides agrupados como lo hace k-means) y es menos sensible a los valores atípicos. K-medoids
es un proceso iterativo de agrupación, y funciona de la siguiente manera:
(1) Primero, el algoritmo k-medoids selecciona k representativo objetos como centros de agrupamiento
(medoides), por ejemplo, vía aleatoria selección. Entonces cada objeto se asigna al cluster con
El medoide más cercano, utilizando la medida de distancia elegida. (por ejemplo, la distancia Jaccard, la
distancia Levenshtein o la distancia Damerau-Levenshtein).
(2) Posteriormente, se calculan nuevos centroides encontrando los Objeto con la menor distancia sumada a
todos los otros grupos miembros.
(4) Repita los pasos (2) y (3) hasta que el criterio de parada sea satisfecho (generalmente cuando no se
encuentran nuevos centroides en (2)).
ENFOQUE
Los procesos que observamos en los datos son listas de operaciones consecutivas
en un entorno de fabricación. Suponemos que dos operaciones son idénticas si se
llevan a cabo en el mismo sistema de trabajo (máquina). Por lo tanto, podemos
expresar cada orden como un vector de máquinas de longitud variable. Si, por
ejemplo, denotamos 10 máquinas disponibles de la A a J, posibles vectores proceso
podría ser (A, D, E), (F, B, F, C) o (D). La longitud mínima de un vector de
proceso es 1, pero no es (en teoría) sin límite superior. Las máquinas pueden
aparecer en orden arbitrario y pueden aparecer más de una vez, si la máquina se
utiliza varias veces durante el proceso.
LAS MEDIDAS DE DISTANCIA PARA LA CUANTIFICACIÓN DE SIMILITUD PROCESO: