Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura:
Minería de Datos e Inteligencia de Negocios
Tema:
Aprendizaje No Supervisado
Sustentado por:
En este caso, suponemos una distribución paramétrica de datos. Supone que los datos de muestra
provienen de una población que sigue una distribución de probabilidad basada en un conjunto
fijo de parámetros. Teóricamente, en una familia normal de distribuciones, todos los miembros
tienen la misma forma y están parametrizados por la media y la desviación estándar, eso significa
que, si conoce el promedio y la desviación estándar y que la distribución es normal, conoce la
probabilidad de cualquier observación futura. El aprendizaje no supervisado paramétrico implica
la construcción de modelos de mezclas gaussianas y el uso del algoritmo de maximización de
expectativas para predecir la clase de la muestra en cuestión. Este caso es mucho más difícil que
el aprendizaje supervisado estándar porque no hay etiquetas de respuesta disponibles y, por lo
tanto, no hay una medida exacta de precisión disponible para verificar el resultado.
En esta versión, los datos se agrupan en grupos, donde cada grupo dice algo acerca de las
categorías y clases presentes en los datos. Este método se usa comúnmente para modelar y
analizar datos con pequeños tamaños de muestra. A diferencia de los modelos paramétricos, los
modelos no paramétricos no requieren que el modelador haga suposiciones sobre la distribución
de la población, y a veces se los conoce como un método libre de distribución.
Agrupamiento o Clustering
2) Superposición de clústeres: usa conjuntos difusos para agrupar datos, de modo que cada
punto puede pertenecer a dos o más clústeres con diferentes grados de membresía. En
este caso, los datos se asociarán con un valor de membresía apropiado.
3) Agrupamiento jerárquico: se basa en la unión entre los dos clústeres más cercanos. La
condición de inicio se realiza estableciendo cada punto de datos como un clúster, después
de algunas iteraciones alcanza los clústeres finales deseados.
Algoritmo K-means