Está en la página 1de 4

Módulo 4.

Análisis descriptivo y exploratorio

Modo 4 - PRAI Práctica Individual

Presentado por: Juan David Santos Llanes

1. ¿Cuál es la importancia del Análisis del Modelo K - means?


K - means como método de agrupamiento o clustering que permite encontrar
y clasificar una serie de datos con características similares o compartidas.
Para validar si los datos presentados pueden ser clasificados en un mismo
grupo, el algoritmo K – means usa la distancia de los datos como condición,
por lo cual, aquellos datos cuya distancia sea menor, pueden pertenecer a
un mismo grupo (utilizando la medida euclidiana en general para este
análisis). Este tipo de clustering catalogado como “aprendizaje no
supervisado” se basa en las múltiples variables que describen los datos y es
útil para la exploración, descripción y resumen de datos que ayudan a validar
patrones y relaciones de manera que permite un análisis a diferentes clases
de datos y entender que características pueden aglomerar una serie de datos
en diferentes clasificaciones.

2. La descripción visual de los datos cargados:


A continuación se muestra la distribución de los datos
3. La estimación de agrupamiento data para el modelo K - means (¿Cuántos
clúster se estimaron y con qué datos quedaron compuestos?):
Los clúster que se estimaron fueron 2 y quedaron compuestos por 6 y 4
respectivamente.
4. ¿Cuánto dio el indicador de similitud del agrupamiento? Interpretar el resultado:
El indicador de similitud del agrupamiento es 0,9999 eso quiere decir que los
datos son similares ya que se aproximan a uno.

Analizando los datos con un setK (5) el indicador de la distancia euclidiana es de


0.7916 lo cual indica que en esta manera de agruparlos, puede haber datos que
ya no sean similares y están quedando organizados en mismos clústeres.

También podría gustarte