Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen Abstract
El algoritmo de agrupamiento Isodata es uno de los más Isodata algorithm is one of the most used by the data
utilizados por la comunidad de minería de datos, aunque mining community, even though it has some
cuenta con algunas desvestajas. En este artículo se disadvantages. In this paper we present two modified
presentan dos versiones modificadas del algoritmo de versions of Isodata clustering algorithm where θ_c and
agrupamiento Isodata, que calcula automáticamente los θ_s input parameters are automatically calculate. Results
parámetros de entrada θ_c y θ_s. Las pruebas realizadas show similar performance to the original algorithm
sugieren que se obtienen los mismos resultados de according to SSE measure.
acuerdo a la medida SSE.
Clustering, Isodata, Data mining.
Agrupamiento, Isodata, Minería de datos
Citación: RENDON, Eréndira, MENDOZA, Marcos, CISNIEGA, Roció y CARBAJAL, Guillermo. Una versión
modificada del algoritmo de agrupamiento Isodata. Revista de Tecnología e Innovación 2015, 2-5: 942-957
© ECORFAN-Bolivia www.ecorfan.org/bolivia
943
Artículo Revista Tecnología e Innovación
Diciembre 2015 Vol.2 No.5 942-957
̅ = 1 ∑𝑁
𝐷 𝑐 ̅
𝑁 𝑖=1 𝑁𝑖 𝐷𝑖
𝑐
(4)
𝐿: Cuando en una iteración genérica del Actualizar los centroides de los grupos
algoritmo existe más de una pareja de grupos
susceptibles a unirse, este parámetro limita el La actualización se lleva a cabo calculando la
número de fusiones que pueden llevarse a cabo media muestral de cada grupo, empleando la
en esa iteración. siguiente ecuación:
1 𝑁𝑖
𝐼: Número máximo de iteraciones que puede 𝑍𝑖 = 𝑁 ∑𝑗=1 𝑥𝑗 ; 𝑖 = 1,2 … 𝑁𝑐 (24)
ejecutar el algoritmo. 𝑖
̅
𝐷𝑚𝑖𝑛 + 𝐷 𝑐𝑜𝑛 𝑂𝐶 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑙 𝑔𝑟𝑢𝑝𝑜 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑑𝑜 𝑦 𝑔
𝜃𝐶 = (26) = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜
2
Una vez obtenidos estos valores se Por otro lado se tiene la alternativa de
comienza a evaluar por grupo si la distancia que división basada en obtener las dos muestras del
se obtuvo de cada objeto a su centroide es grupo 𝛼𝑗 más alejadas entre sí y con respecto a
menor o mayor que el promedio de distancia su centroide, si las muestras obtenidas se
𝑃𝑔 (se obtuvo en el paso 10) para el grupo representan como 𝑍𝑗 + y 𝑍𝑗 − los dos nuevos
correspondiente. centroides se calcularan de la manera siguiente:
Datos utilizados
Diseño de pruebas
Referencias