Documentos de Académico
Documentos de Profesional
Documentos de Cultura
datos de alta
dimensionalidad
Anthony Ccapira
Cesar Aleman
Kevin Valencia
Temas
Large Datasets
High dimensional
Find clusters - high dimensional Data Set
very expensive
domains: Biologia, astronomia, visin por computador y redes sociales.
Enfoques
Algoritmos previos
DBSCAN
PCA
PROCLUS, FINIT : TOP DOWN
Basado en densidad de grilla. Clique, MAFIA ENCLUS
Subspace clustering
Principio Apriori
Encuentra sub espacios de calidad
Buen grado de paralelismo
escalable, bajo costo
solo requiere K data base scans por K-dimensin
6144 dimensional data set