Está en la página 1de 2

Clustering de los datos iris

Tú
May 29, 2023

1 Introducción
En este tutorial, utilizaremos el lenguaje de programación R para realizar el
clustering de los datos iris. Los algoritmos que utilizaremos son K-means y
Hclust. Además, generaremos gráficos para visualizar los resultados.

2 Carga de datos
Comenzamos cargando los datos iris en R:

data(iris)

3 K-means
A continuación, realizaremos el clustering utilizando el algoritmo K-means:

# Seleccionamos las columnas a utilizar en el clustering


datos <- iris[, 1:4]

# Realizamos el clustering con K-means


kmeans_resultado <- kmeans(datos, centers = 3)

# Obtenemos los centroides


centroides <- kmeans_resultado$centers

# Obtenemos las etiquetas asignadas a cada punto


etiquetas <- kmeans_resultado$cluster

4 Hclust
Ahora, realizaremos el clustering utilizando el algoritmo Hclust:

1
# Calculamos la matriz de distancias
distancias <- dist(datos)

# Realizamos el clustering con Hclust


hclust_resultado <- hclust(distancias)

# Cortamos el dendrograma para obtener los grupos


grupos <- cutree(hclust_resultado, k = 3)

5 Gráficos
Ahora que hemos realizado el clustering, generaremos gráficos para visualizar
los resultados.

5.1 Gráfico de dispersión


# Gráfico de dispersión con colores según las etiquetas de K-means
plot(datos, col = etiquetas, pch = 16, main = "K-means")
points(centroides, col = 1:3, pch = 8, cex = 2)

# Leyenda
legend("topright", legend = unique(etiquetas), col = unique(etiquetas), pch = 16, bty = "n")

5.2 Dendrograma
# Gráfico del dendrograma con colores según los grupos de Hclust
plot(hclust_resultado, hang = -1, main = "Hclust")
rect.hclust(hclust_resultado, k = 3, border = 2:4)

# Leyenda
legend("topright", legend = unique(grupos), fill = 2:4, border = 2:4, bty = "n")

6 Conclusiones
En este tutorial, hemos utilizado R para realizar el clustering de los datos iris
utilizando los algoritmos K-means y Hclust. Además, generamos gráficos para
visualizar los resultados. El análisis de clustering nos permite agrupar los datos
en categorı́as similares, lo que puede ayudarnos a comprender mejor la estruc-
tura de los datos.
¡Espero que este tutorial te haya sido útil para aprender a realizar clustering
en R!

También podría gustarte