Está en la página 1de 11

Estas son las data y los nombres con los datos de la varibales

k-means Clustering
La función kmeans() nos ayuda a agrupar los datos por medio del métodos k-means, el cual tiene como objetivo la
clasificación del conjunto de datos en k grupos, de modo que la suma de cuadrados de los puntos asignados al centro de un
cluster sea minimizada.

Si inspeccionamos la gráfica anterior nos damos cuenta de que


hay tres grupos en todo el conjunto de datos.
Si lo realizamos varias veces obtenemos resultados
relativamente consistentes, con variabilidad similar intrasujetos.
Scree Plot
El único asunto que mencionar es que nosotros estamos forzando el número de grupos a encontrar,
de modo que podríamos tener una mejor solución con algún otro número de grupos. Para solucionar
lo anterior podemos evaluar el algoritmo especificando diferentes números de grupos o centers.

Como regla de dedo,


se puede considerar
que a partir
del codito es el
número óptimo de
grupos. Ya que
conformar más
grupos no reduce
más la variabilidad
intragrupos.
Hierarchical Clustering
El análisis de agrupamiento jerárquico lo entiendo menos, sin embargo, sé que es un método que
utiliza el cálculo de la distancia euclidiana para determinar la similitud entre los casos.

Se puede observar
que la solución de
mayor jerarquía es la
de dos clusters de
observaciones.
Existen diferentes
métodos pero el
“complete”, que está
por defecto, parece
dar los árboles más
balanceados.
Por ejemplo el
método “average”:
Metodo average
Metodo single
Si quisieramos hacer el agrupamiento con mútiples variables en
diferentes escalas, tendríamos que realizar una estandarización de las
escalas.
Correlacion de las variables

(FCM) es un algoritmo de agrupación suave propuesto por Bezdek
(1974; 1981). A diferencia del algoritmo K-means en el que cada
objeto de datos es miembro de un solo clúster, un objeto de datos es
miembro de todos los clústeres con distintos grados de pertenencia
difusa entre 0 y 1 en FCM. Por lo tanto, los objetos de datos más
cercanos a los centros de los grupos tienen un mayor grado de
pertenencia que los objetos dispersos en los bordes de los grupos.
Vizualizacion de los cluster mediante la
lógica difusa

También podría gustarte