Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Práctica de Laboratorio #11 KDD - Algoritmos de Clustering
Práctica de Laboratorio #11 KDD - Algoritmos de Clustering
PRÁCTICA DE LABORATORIO N° 11
1. TEMA:
Un KDD es el Descubrimiento de Conocimiento en Bases de Datos o KDD se
refiere al proceso de identificar patrones válidos, novedosos, potencialmente
útiles y principalmente entendibles.
2. OBJETIVOS:
Knowledge Discovery implica la evaluación e interpretación de patrones y
modelos para tomar decisiones con respecto a lo que constituye conocimiento y
lo que no lo es. Por lo tanto, el KDD requiere de un amplio y profundo
conocimiento sobre tu área de estudio.
3. FUNDAMENTO TEORICO:
La Extracción de conocimiento está principalmente relacionado con el proceso
de descubrimiento conocido como Knowledge Discovery in Databases (KDD),
que se refiere al proceso no-trivial de descubrir conocimiento e información
potencialmente útil dentro de los datos contenidos en algún repositorio de
información [1]. No es un proceso automático, es un proceso iterativo que
exhaustivamente explora volúmenes muy grandes de datos para determinar
relaciones. Es un proceso que extrae información de calidad que puede usarse
para dibujar conclusiones basadas en relaciones o modelos dentro de los datos.
4. Pasos:
5. CUESTIONARIO:
5.1. ¿Qué es KDD?
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
5.2. ¿De qué está formado un KDD?
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
5.3. Indique las reglas para realizar un KDD
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
5.4. Indique los fases para realizar un KDD
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
6. OBSERVACIONES Y CONCLUSIONES:
Anotar cinco observaciones y conclusiones acerca de esta práctica.
1. ..........................................................................................................
..........................................................................................................
..........................................................................................................
2. ..........................................................................................................
..........................................................................................................
..........................................................................................................
3. ..........................................................................................................
..........................................................................................................
..........................................................................................................
4. ..........................................................................................................
..........................................................................................................
..........................................................................................................
5. ..........................................................................................................
ALGORITMOS DE CLUSTERING
1. TEMA:
También conocido como agrupamiento, es una de las técnicas de minería de
datos, el proceso consiste en la división de los datos en grupos de objetos
similares. Cuando se representan la información obtenida a través de clusters
se pierden algunos detalles de los datos, pero a la vez se simplifica dicha
información.
2. OBJETIVOS:
Clustering es una técnica de minería de datos (data mining) dentro de la
disciplina de Inteligencia Artificial que identifica de forma automática
agrupaciones o clústeres de elementos de acuerdo a una medida de similitud
entre ellos. El objetivo fundamental de las técnicas de clustering consiste en
identificar grupos o clústeres.
3. FUNDAMENTO TEORICO:
Técnica en la que el aprendizaje realizado es no supervisado. Desde un punto
de vista práctico. El clustering juega un papel muy importante en aplicaciones de
minería de datos, tales como exploración de datos científicos, recuperación de
la información y minería de texto, aplicaciones sobre bases de datos espaciales
(tales como GIS o datos procedentes de astronomía), aplicaciones Web,
marketing, diagnóstico médico, análisis de ADN en biología computacional y
muchas otras.
De forma general, las técnicas de Clustering son las que utilizando algoritmos
matemáticos se encargan de agrupar objetos. Usando la información que
brindan las variables que pertenecen a cada objeto se mide la similitud entre los
mismos, y una vez hecho esto se colocan en clases que son muy similares
internamente (entre los miembros de la misma clase) y a la vez diferente entre
los miembros de las diferentes clases.
4. ALGORITMOS DE CLUSTERING:
Este algoritmo debe definir el número de clusters que se desean obtener, así se
convierte en un algoritmo voraz para particionar. Los pasos básicos para aplicar
el algoritmo son muy simples. Primeramente se determina la cantidad de clusters
en los que se quiere agrupar la información, en este caso las simulaciones.
Luego se asume de forma aleatoria los centros por cada clusters. Una vez
encontrados los primeros centroides el algoritmo hará los tres pasos siguientes:
X-Means
entre ellos. Los mismos son aplicables cuando en la Base de datos existen al
menos 2 simulaciones para el modelo (que son ecuaciones formadas por
arreglos de parámetros y condiciones iniciales). Se ha comprobado que sus
resultados son más fiables que los obtenidos con el K-Means, debido a que
presenta un valor de distorsión menor, son mucho mejor para realizar Clusters
de un conjunto grande de datos y es incluso una variante mucho más rápida.
Cobweb
EM
Este algoritmo pertenece a una familia de modelos que se conocen como Finite
Mixture Models, los cuales se pueden utilizar para segmentar conjuntos de
Proceso iterativo
6. CUESTIONARIO:
6.1. ¿Cuál es el objetivo de un algoritmo de clustering?
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
6.2. ¿Cuál es la estructura de un Clustering?
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
6.3. Indique los pasos para realizar un algoritmo Kmeans
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
6.4. Indique los 3 usos de los algoritmos de clustering
..........................................................................................................
..........................................................................................................
..........................................................................................................
..........................................................................................................
7. OBSERVACIONES Y CONCLUSIONES:
Anotar cinco observaciones y conclusiones acerca de esta práctica.
6. ..........................................................................................................
..........................................................................................................
..........................................................................................................
7. ..........................................................................................................
..........................................................................................................
..........................................................................................................
8. ..........................................................................................................
..........................................................................................................
..........................................................................................................
9. ..........................................................................................................
..........................................................................................................
..........................................................................................................
10. ..........................................................................................................
..........................................................................................................
..........................................................................................................