Está en la página 1de 2

#2 DATOS BEIJING

# Carga del archivo


Datos <- read.csv('DatosBeijing.csv', header=TRUE, sep=',',dec='.', row.names = 1)
dim(Datos)
summary(Datos)

# Verificacion de los datos


str(Datos)

#Transformacion de variables
Datos$Anno <- as.numeric(Datos$Anno)
Datos$Mes <- as.numeric(Datos$Mes)
Datos$Dia <- as.numeric(Datos$Dia)
Datos$Hora <- as.numeric(Datos$Hora)
Datos$ConcetracionParticula_pm2.5 <- as.numeric(Datos$ConcetracionParticula_pm2.5)
Datos$PuntoRocio <- as.numeric(Datos$PuntoRocio)
Datos$Temperatura <- as.numeric(Datos$Temperatura)
Datos$Presion <- as.numeric(Datos$Presion)
Datos$DireccionViento <- factor(Datos$DireccionViento)
Datos$VelocidadViento <- as.numeric(Datos$VelocidadViento)
Datos$HorasNieve <- as.numeric(Datos$HorasNieve)
Datos$HorasLluvia <- as.numeric(Datos$HorasLluvia)

str(Datos)

#Eliminacion de valores nulos y unicos


Datos_Beijing <- read.csv('DatosBeijing.csv', header=TRUE, sep=',',dec='.',
row.names = 1)

Datos_Beijing <- na.omit(Datos_Beijing)


Datos_Beijing$DireccionViento <- NULL
str(Datos_Beijing)

#KMEAN
Beijing <- kmeans(Datos_Beijing,centers=5,iter.max=1000, nstart = 50)
Beijing$cluster

Beijing$centers

# Grafico radar
centros<-Beijing$centers
rownames(centros)<-c("Cluster 1","Cluster 2","Cluster 3","Cluster 4","Cluster 5")
centros<-as.data.frame(centros)
maximos<-apply(centros,2,max)
minimos<-apply(centros,2,min)
centros<-rbind(minimos,centros)
centros<-rbind(maximos,centros)
centros

color <- c("violet","lightblue","lightgreen", "pink")

radarchart(as.data.frame(centros),maxmin=TRUE,axistype=4,axislabcol="red",
centerzero=FALSE,seg=8,
pcol=color,plty=1,plwd=5,title="Comparacion de clusteres")

legenda <-legend(1.5,1, legend=c("Cluster 1","Cluster 2","Cluster 3","Cluster


4","Cluster 5"),
seg.len=-1.4,title="Clusteres",pch=21,bty="n" ,lwd=3, y.intersp=1,
horiz=FALSE,col = color)

#Codo de Jambu
InerciaIC<-rep(0,10)
for(k in 1:10) {
Beijing <-kmeans(Datos_Beijing,centers=k,iter.max=50,nstart=25)
InerciaIC[k]<-Beijing$tot.withinss
}
plot(InerciaIC,col="darkred",type="b")

#Facto Extra
Beijing_muestra <- sample(1:41747,4175)
muestra.beijing <- Datos_Beijing[Beijing_muestra,]

Datos.Escalados <- scale(Beijing_muestra)


Datos.Escalados
fviz_nbclust(Datos.Escalados, method = "silhouette",k.max = 10, FUNcluster =
kmeans)

Beijing <- kmeans(Datos_Beijing,centers=2,iter.max=10, nstart = 1)


Beijing$cluster

centros <- Beijing$centers

colnames(Datos_Beijing)

rownames(centros) <- c("Cluster 1","Cluster 2")


centros<-as.data.frame(centros)
maximos<-apply(centros,2,max)
minimos<-apply(centros,2,min)
centros<-rbind(minimos,centros)
centros<-rbind(maximos,centros)
centros

color <- c("yellow", "blue")

radarchart(as.data.frame(centros),maxmin=TRUE,axistype=4,axislabcol="red",
centerzero=FALSE,seg=8,
pcol=color,plty=1,plwd=5,title="Comparacion de clusteres")

legenda <-legend(1.5,1, legend=c("Cluster 1","Cluster 2"),


seg.len = 1,title ="Clusteres",pch=21,bty="n" ,lwd=3, y.intersp=1,

horiz=FALSE,col = color)

También podría gustarte