Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESCUELA DE POSTGRADO
MAESTRIA EN ESTADISTICA
ESTUDIANTES
CUSCO - PERÚ
2022
Análisis de Cluster
• Descripción de la data
• Objetivo
• Dendograma
• Conclusiones
Descripción de la data
Los datos se descargaron de EUROSTAT. Se analizan las emisiones de gases de efecto
invernadero por país y por año desde 1990. La información se mide en toneladas por
persona.
Objetivo
El objetivo es situar a los países en relación con sus emisiones.
Número de grupos
En esta fase del análisis, la pregunta más habitual es cuántos grupos hay que crear para
optimizar la clasificación. En teoría, cuantos más conglomerados se tengan, menos
dispersión habrá dentro de los conglomerados. Esto es positivo, pero si hay muchas
divisiones, la interpretación de los grupos es demasiado complicada y las diferencias se
vuelven demasiado insignificantes.
library(cluster)
library(fpc)
library(mclust)
library(flexmix)
library(prabclus)
##
## Attaching package: 'prabclus'
library(diptest)
library(trimcluster)
library(plyr)
library(modeltools)
##
## Attaching package: 'modeltools'
## The following object is masked from 'package:plyr':
##
## empty
library(mvtnorm)
##
## Attaching package: 'mvtnorm'
library(robustbase)
library(kernlab)
##
## Attaching package: 'kernlab'
Metodos Particionales
K-Medias o Kmeans
library(readxl)
## a1990 a1991 a1992 a1993 a1994 a1995 a1996 a1997 a1998 a1999 a2000
## UE27 11.7 11.4 11.1 10.8 10.8 10.9 11.1 10.9 10.8 10.6 10.6
## UE28 12.0 11.8 11.4 11.2 11.1 11.2 11.4 11.2 11.1 10.9 10.8
## Belgium 15.0 15.2 15.1 14.9 15.3 15.5 15.9 15.1 15.6 15.0 15.1
## Bulgaria 11.8 9.7 9.2 9.2 8.8 9.0 9.0 8.7 8.3 7.4 7.3
## Czechia 19.3 17.6 16.9 16.2 15.4 15.4 15.6 15.2 14.6 13.7 14.7
## Denmark 14.1 16.1 14.9 15.3 16.0 15.4 17.8 15.9 15.1 14.6 13.8
## a2001 a2002 a2003 a2004 a2005 a2006 a2007 a2008 a2009 a2010 a2011
## UE27 10.7 10.6 10.8 10.8 10.7 10.6 10.5 10.3 9.5 9.7 9.5
## UE28 10.9 10.8 11.0 10.9 10.8 10.8 10.7 10.4 9.6 9.8 9.5
## Belgium 14.8 14.7 14.7 14.7 14.3 13.9 13.5 13.5 12.1 12.7 11.6
## Bulgaria 7.9 7.7 8.4 8.3 8.4 8.6 9.2 9.0 7.9 8.3 9.1
## Czechia 14.8 14.5 14.8 14.9 14.7 14.8 14.9 14.3 13.3 13.5 13.4
## Denmark 14.0 13.8 14.7 13.6 12.8 14.2 13.3 12.5 11.9 11.9 10.9
## a2012 a2013 a2014 a2015 a2016 a2017 a2018
## UE27 9.3 9.1 8.8 8.9 8.9 8.9 8.7
## UE28 9.3 9.1 8.7 8.8 8.7 8.8 8.6
## Belgium 11.3 11.2 10.6 11.0 10.8 10.8 10.8
## Bulgaria 8.4 7.7 8.2 8.7 8.4 8.8 8.3
## Czechia 12.9 12.4 12.2 12.3 12.5 12.4 12.2
## Denmark 10.1 10.3 9.6 9.0 9.3 8.9 8.9
CLUSTER
res<-kmeans(scale(emisiones),4) # con scale estadarizamos, se desea formar 4
grupos
res
Los cluster que han sido escogidos por Agrupación de K-means son 3 clusters de tamaños
13, 1, 10, 11
El país UE27 pertenece al grupo 1, … , el país Turquía pertenece al grupo 4.
El indice de homogeneidad es 88.5%
La suma de cuadrados en el cluster 1 es 33.87231
La suma de cuadrados en el cluster 2 es 0.00000 La suma de cuadrados en el cluster 3 es
56.47946 La suma de cuadrados en el cluster 3 es 22.59696
Segun el criterio de calinski harabats nos dice que seleccionemos con 10 clusters de
tamaños 3, 3, 1, 1, 6, 5, 6, 1, 1, 8
El país UE27 pertenece al grupo 5, … , el país Turquía pertenece al grupo 2.
El indice de homogeneidad es 96.8%
La suma de cuadrados en el cluster 1 es 2.611517 . . . La suma de cuadrados en el cluster 10
es 7.713589
kmeansruns(scale(emisiones),criterion="asw") # silueta
Segun el criterio del indice de silueta nos dice que seleccionemos 2 clusters de tamaños 12,
23
El país UE27 pertenece al grupo 2, … , el país Turquía pertenece al grupo 2.
El indice de homogeneidad es 55.7%
Por recomendación de ambos criterios, vamos a trabajar con cluster
res=kmeans(scale(emisiones),4)
plotcluster(emisiones,res$cluster)
clusplot(emisiones,res$cluster, color = TRUE,
shade = TRUE, labels =2,lines=0,
main ="Gráfico de Conglomerados")
En este caso, se
obtienen 4 clusters. Uno de ellos sólo tiene una observación. Esto es Luxemburgo. Esto
puede explicarse por el hecho de que está demasiado lejos de los demás y, por tanto, no
consigue unirse a ellos. Los otros 3 grupos están bien diferenciados. Los que emiten poco y
reducen sus emisiones aparecen en azul. Los que no reducen sus emisiones pero no
contaminan mucho aparecen en negro. Por último, los que producen gases de efecto
invernadero y no los reducen aparecen en rojo.
En el grupo 1 tenemos a los paises: UE27, UE28, Bulgaria, Grecia, España, Francia, Italia,
Austria, Polonia, Eslovenia, Eslovaquia, Reino Unido y Noruega.
En el grupo 2 tenemos a los paises: Croacia Letonia Lituania Hungría Malta Portugal
Rumanía Suecia Liechtenstein Suiza y Turquía
En el grupo 3 tenemos al país: Luxemburgo
En el grupo 4 tenemos a los paises: Bélgica Chequia Dinamarca Alemania Estonia Irlanda
Chipre Países Bajos Finlandia y Islandia
Ademas estos componentes explican el 96.64% de los puntos de variabilidad.
res$cluster
En el grupo 1 tenemos a los paises: UE27, UE28, Bulgaria, Grecia, España, Francia, Italia,
Austria, Polonia, Eslovenia, Eslovaquia, Reino Unido y Noruega.
En el grupo 2 tenemos a los paises: Croacia Letonia Lituania Hungría Malta Portugal
Rumanía Suecia Liechtenstein Suiza y Turquía
En el grupo 4 tenemos al país: Luxemburgo
En el grupo 3 tenemos a los paises: Bélgica Chequia Dinamarca Alemania Estonia Irlanda
Chipre Países Bajos Finlandia y Islandia
## a1990 a1991 a1992 a1993 a1994 a1995 a1996 a1997 a1998 a1999 a2000
## UE27 11.7 11.4 11.1 10.8 10.8 10.9 11.1 10.9 10.8 10.6 10.6
## UE28 12.0 11.8 11.4 11.2 11.1 11.2 11.4 11.2 11.1 10.9 10.8
## Belgium 15.0 15.2 15.1 14.9 15.3 15.5 15.9 15.1 15.6 15.0 15.1
## Bulgaria 11.8 9.7 9.2 9.2 8.8 9.0 9.0 8.7 8.3 7.4 7.3
## Czechia 19.3 17.6 16.9 16.2 15.4 15.4 15.6 15.2 14.6 13.7 14.7
## Denmark 14.1 16.1 14.9 15.3 16.0 15.4 17.8 15.9 15.1 14.6 13.8
## a2001 a2002 a2003 a2004 a2005 a2006 a2007 a2008 a2009 a2010 a2011
## UE27 10.7 10.6 10.8 10.8 10.7 10.6 10.5 10.3 9.5 9.7 9.5
## UE28 10.9 10.8 11.0 10.9 10.8 10.8 10.7 10.4 9.6 9.8 9.5
## Belgium 14.8 14.7 14.7 14.7 14.3 13.9 13.5 13.5 12.1 12.7 11.6
## Bulgaria 7.9 7.7 8.4 8.3 8.4 8.6 9.2 9.0 7.9 8.3 9.1
## Czechia 14.8 14.5 14.8 14.9 14.7 14.8 14.9 14.3 13.3 13.5 13.4
## Denmark 14.0 13.8 14.7 13.6 12.8 14.2 13.3 12.5 11.9 11.9 10.9
## a2012 a2013 a2014 a2015 a2016 a2017 a2018 cluster.km
## UE27 9.3 9.1 8.8 8.9 8.9 8.9 8.7 1
## UE28 9.3 9.1 8.7 8.8 8.7 8.8 8.6 1
## Belgium 11.3 11.2 10.6 11.0 10.8 10.8 10.8 4
## Bulgaria 8.4 7.7 8.2 8.7 8.4 8.8 8.3 2
## Czechia 12.9 12.4 12.2 12.3 12.5 12.4 12.2 4
## Denmark 10.1 10.3 9.6 9.0 9.3 8.9 8.9 4
Tabla de medias
med<-aggregate(x = emisiones.new[,1:7],by =
list(emisiones.new$cluster.km),FUN = mean)
med
Describir variables
par(mfrow=c(2,4))
for (i in 1:length(emisiones.new[,1:29])) {
boxplot(emisiones.new[,i]~emisiones.new$cluster.km,
main=names(emisiones.new[i]), type="l")
}
En el año 1991: En el grupo 1 presenta bajo porcentaje de emisiones de gases, En el grupo 2
presenta muy bajo porcentaje de emisiones de gases, En el grupo 3 presenta alto porcentaje
de emisiones de gases, En el grupo 3 presenta muy alto porcentaje de emisiones de gases. . .
. En el año 2018: En el grupo 1 presenta bajo porcentaje de emisiones de gases, En el grupo
2 presenta muy bajo porcentaje de emisiones de gases, En el grupo 3 presenta alto
porcentaje de emisiones de gases, En el grupo 3 presenta muy alto porcentaje de emisiones
de gases.
PAM
metodo particional
res=pam(scale(emisiones),4) # normalizacion Z
res
## Medoids:
## ID a1990 a1991 a1992 a1993 a1994
## UE27 1 -0.1238809 -0.1241630 -0.06470121 -0.07791954 -0.06483063
## Netherlands 21 0.4827788 0.5971890 0.77260857 0.82473993 0.87066405
## Hungary 19 -0.5877972 -0.6343876 -0.74977285 -0.69249621 -0.72166733
## Luxembourg 18 3.9264650 4.1335731 4.38826446 4.45458335 4.19465582
## a1995 a1996 a1997 a1998 a1999
## UE27 -0.01204485 -0.03687372 -0.04706348 -0.04601189 -0.05516575
## Netherlands 1.06530036 1.09521404 1.09145741 1.15540956 0.94784782
## Hungary -0.85518459 -0.82933515 -0.89489818 -0.91512527 -0.83250126
## Luxembourg 3.54787848 3.33674781 3.22315610 2.91919849 3.15447767
## a2000 a2001 a2002 a2003 a2004
## UE27 -0.0435587 -0.0573361 -0.07455773 -0.09157029 -0.09688378
## Netherlands 0.8760139 0.8027054 0.74091745 0.65852674 0.63281049
## Hungary -0.8663342 -0.8218174 -0.84343433 -0.81893710 -0.78365486
## Luxembourg 3.2717426 3.4306100 3.74652599 3.77256593 4.15251227
## a2005 a2006 a2007 a2008 a2009
a2010
## UE27 -0.09417771 -0.1302493 -0.1550273 -0.1455982 -0.1470812
-0.1546553
## Netherlands 0.58704108 0.5146436 0.5117214 0.5687855 0.6980870
0.7718831
## Hungary -0.77539651 -0.8418552 -0.8907499 -0.9076075 -0.9154160
-0.9105156
## Luxembourg 4.30078227 4.1171485 3.9144384 3.9502019 4.0275376
3.9416199
## a2011 a2012 a2013 a2014 a2015
a2016
## UE27 -0.1336976 -0.1201878 -0.1138304 -0.1246125 -0.0791696
-0.08397137
## Netherlands 0.6677492 0.6992742 0.7379348 0.7361975 0.9147531
0.88589800
## Hungary -0.9351443 -0.9942806 -1.0205481 -0.9567289 -0.8923791
-0.84811088
## Luxembourg 4.0028018 3.9498069 3.6229458 3.5194833 3.3845005
3.11953654
## a2017 a2018
## UE27 -0.1149705 -0.1346386
## Netherlands 0.7889640 0.7089306
## Hungary -0.7856315 -0.7454992
## Luxembourg 3.1216980 3.2396385
## Clustering vector:
## UE27 UE28 Belgium Bulgaria Czechia
## 1 1 2 3 2
## Denmark Germany Estonia Ireland Greece
## 2 2 2 2 1
## Spain France Croatia Italy Cyprus
## 1 3 3 1 2
## Latvia Lithuania Luxembourg Hungary Malta
## 3 3 4 3 3
## Netherlands Austria Poland Portugal Romania
## 2 1 1 3 3
## Slovenia Slovakia Finland Sweden United Kingdom
## 1 1 2 3 1
## Iceland Liechtenstein Norway Switzerland Turkey
## 2 3 1 3 3
## Objective function:
## build swap
## 1.574956 1.574956
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
Grafico de siluestas
par(mfrow=c(1,3))
for(h in 2:4){
res=pam(scale(emisiones),h)
plot(res,which.plots=2)
}
## $pamobject
## Medoids:
## ID a1990 a1991 a1992 a1993 a1994
## Switzerland 34 -0.6948548 -0.5991997 -0.5404454 -0.5772631 -0.6221466
## Netherlands 21 0.4827788 0.5971890 0.7726086 0.8247399 0.8706641
## a1995 a1996 a1997 a1998 a1999
a2000
## Switzerland -0.6678202 -0.7161264 -0.7495551 -0.710628 -0.6569739
-0.6485407
## Netherlands 1.0653004 1.0952140 1.0914574 1.155410 0.9478478
0.8760139
## a2001 a2002 a2003 a2004 a2005
a2006
## Switzerland -0.6545871 -0.7036386 -0.7507465 -0.7192701 -0.7094721
-0.7306668
## Netherlands 0.8027054 0.7409175 0.6585267 0.6328105 0.5870411
0.5146436
## a2007 a2008 a2009 a2010 a2011
a2012
## Switzerland -0.8217759 -0.7647308 -0.6849156 -0.6666897 -0.7800256
-0.7211266
## Netherlands 0.5117214 0.5687855 0.6980870 0.7718831 0.6677492
0.6992742
## a2013 a2014 a2015 a2016 a2017
a2018
## Switzerland -0.6633563 -0.7558732 -0.8020225 -0.8187209 -0.873109
-0.8909421
## Netherlands 0.7379348 0.7361975 0.9147531 0.8858980 0.788964
0.7089306
## Clustering vector:
## UE27 UE28 Belgium Bulgaria Czechia
## 1 1 2 1 2
## Denmark Germany Estonia Ireland Greece
## 2 2 2 2 2
## Spain France Croatia Italy Cyprus
## 1 1 1 1 2
## Latvia Lithuania Luxembourg Hungary Malta
## 1 1 2 1 1
## Netherlands Austria Poland Portugal Romania
## 2 1 2 1 1
## Slovenia Slovakia Finland Sweden United Kingdom
## 1 1 2 1 2
## Iceland Liechtenstein Norway Switzerland Turkey
## 2 1 2 1 1
## Objective function:
## build swap
## 3.034255 2.589189
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
##
## $nc
## [1] 2
##
## $crit
## [1] 0.0000000 0.4988386 0.3548675 0.4060404 0.3231428 0.3339764 0.3160318
## [8] 0.3222885 0.3155829 0.2842144
CH CALINSKI HARABATZ
pamk(scale(emisiones),criterion="ch")
## $pamobject
## Medoids:
## ID a1990 a1991 a1992 a1993
a1994
## UE28 2 -0.07035214 -0.05378722 -0.007611907 -0.001097458
-0.005118208
## Belgium 3 0.46493588 0.54440711 0.696489502 0.709506809
0.830855770
## Italy 14 -0.56995429 -0.51122995 -0.426266799 -0.404413394
-0.423105197
## Estonia 8 2.37412979 2.07508084 1.191263465 0.575068164
0.771143343
## Ireland 9 0.66120815 0.72034662 0.867757412 0.959178579
1.049801335
## Croatia 13 -0.99818470 -1.17980008 -1.206487280 -1.191839745
-1.259079174
## Hungary 19 -0.58779722 -0.63438760 -0.749772852 -0.692496205
-0.721667332
## Luxembourg 18 3.92646503 4.13357310 4.388264459 4.454583355
4.194655822
## Iceland 31 0.55415054 0.42124945 0.468132288 0.555862643
0.512389492
## a1995 a1996 a1997 a1998 a1999
## UE28 0.05821679 0.03105155 0.02560807 0.03067459 0.02006027
## Belgium 1.06530036 1.04993053 0.97033817 1.18097172 1.04814918
## Italy -0.36335308 -0.44442531 -0.41042121 -0.32719563 -0.25576846
## Estonia 0.71399214 0.77822947 0.84921893 0.69529071 0.47141638
## Ireland 1.34634694 1.32163160 1.52748669 1.76890136 1.80040935
## Croatia -1.39385720 -1.37273727 -1.35515131 -1.37524412 -1.25878203
## Hungary -0.85518459 -0.82933515 -0.89489818 -0.91512527 -0.83250126
## Luxembourg 3.54787848 3.33674781 3.22315610 2.91919849 3.15447767
## Iceland 0.76083324 0.71030421 0.94611432 1.18097172 1.37412859
## a2000 a2001 a2002 a2003 a2004
## UE28 0.004839856 -0.009556017 -0.02795915 -0.04610986 -0.07542218
## Belgium 1.045408882 0.922155614 0.88071320 0.79490802 0.74011847
## Italy -0.237152941 -0.248456435 -0.23765277 -0.22795157 -0.20419176
## Estonia 0.392028331 0.420464736 0.34482951 0.61306632 0.63281049
## Ireland 1.843985111 1.853867246 1.64958980 1.47681441 1.27665838
## Croatia -1.205124128 -1.108497941 -1.02982866 -0.97804860 -0.93388603
## Hungary -0.866334212 -0.821817439 -0.84343433 -0.81893710 -0.78365486
## Luxembourg 3.271742612 3.430610006 3.74652599 3.77256593 4.15251227
## Iceland 1.335800238 1.089385907 1.06710753 0.95401951 0.95473444
## a2005 a2006 a2007 a2008 a2009
a2010
## UE28 -0.07220291 -0.08577393 -0.1090446 -0.1217854 -0.1214701
-0.1302727
## Belgium 0.69691508 0.60359430 0.5347127 0.6164111 0.5188089
0.5768224
## Italy -0.18207691 -0.24143772 -0.2929753 -0.3122877 -0.3775817
-0.3740986
## Estonia 0.65296548 0.55911893 1.2474440 0.9736030 0.6212535
1.3570653
## Ireland 1.37813388 1.24848716 1.1554786 1.1402925 1.0310321
0.8694135
## Croatia -0.90724531 -0.90856827 -0.8677585 -0.8837947 -0.8641937
-0.9105156
## Hungary -0.77539651 -0.84185521 -0.8907499 -0.9076075 -0.9154160
-0.9105156
## Luxembourg 4.30078227 4.11714851 3.9144384 3.9502019 4.0275376
3.9416199
## Iceland 0.87271348 1.29296253 1.4543659 1.7356123 1.7225333
1.5521260
## a2011 a2012 a2013 a2014 a2015
a2016
## UE28 -0.1336976 -0.1201878 -0.1138304 -0.1533062 -0.1092885
-0.1427513
## Belgium 0.4092180 0.4261202 0.4631718 0.3918735 0.5533267
0.4744383
## Italy -0.3663757 -0.3933418 -0.5259748 -0.5837112 -0.5309527
-0.5248211
## Estonia 1.5467553 1.4914209 1.9743681 1.9700252 1.4267739
1.7088175
## Ireland 0.7453085 0.8631666 0.9302689 1.0231342 1.2159418
1.2679677
## Croatia -0.9092912 -0.9942806 -1.0205481 -1.0141162 -1.0128546
-0.9656708
## Hungary -0.9351443 -0.9942806 -1.0205481 -0.9567289 -0.8923791
-0.8481109
## Luxembourg 4.0028018 3.9498069 3.6229458 3.5194833 3.3845005
3.1195365
## Iceland 1.5467553 1.7099441 1.7820340 1.9700252 2.2399834
2.2672271
## a2017 a2018
## UE28 -0.1441296 -0.1637272
## Belgium 0.4390539 0.4762219
## Italy -0.5815173 -0.5418790
## Estonia 1.9553310 1.7852087
## Ireland 1.1680333 1.1743482
## Croatia -0.9022682 -0.9200307
## Hungary -0.7856315 -0.7454992
## Luxembourg 3.1216980 3.2396385
## Iceland 2.3635594 2.4251578
## Clustering vector:
## UE27 UE28 Belgium Bulgaria Czechia
## 1 1 2 3 2
## Denmark Germany Estonia Ireland Greece
## 2 2 4 5 1
## Spain France Croatia Italy Cyprus
## 3 3 6 3 2
## Latvia Lithuania Luxembourg Hungary Malta
## 6 7 8 7 7
## Netherlands Austria Poland Portugal Romania
## 2 1 1 7 7
## Slovenia Slovakia Finland Sweden United Kingdom
## 3 3 2 7 1
## Iceland Liechtenstein Norway Switzerland Turkey
## 9 7 1 7 6
## Objective function:
## build swap
## 0.9879691 0.9744464
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
##
## $nc
## [1] 9
##
## $crit
## [1] 0.00000 38.85648 30.03803 78.94525 71.80541 81.01012 73.40502
77.03702
## [9] 82.89823 80.51983
attach(DATANUEVA)
par(mfrow=c(2,4))
boxplot(a1990~clu)
boxplot(a1991~clu)
boxplot(a1992~clu)
boxplot(a1993~clu)
boxplot(a2015~clu)
boxplot(a2016~clu)
boxplot(a2017~clu)
boxplot(a2018~clu)
En el año 1991: En
el grupo 1 presenta bajo porcentaje de emisiones de gases, En el grupo 2 presenta alto
porcentaje de emisiones de gases, En el grupo 3 presenta my bajo porcentaje de emisiones
de gases, En el grupo 3 presenta muy alto porcentaje de emisiones de gases. . . . En el año
2018: En el grupo 1 presenta bajo porcentaje de emisiones de gases, En el grupo 2 presenta
alto porcentaje de emisiones de gases, En el grupo 3 presenta my bajo porcentaje de
emisiones de gases, En el grupo 3 presenta muy alto porcentaje de emisiones de gases.
library(factoextra)
##
## Attaching package: 'ggplot2'
Le hemos dicho 4
grupos y a pintado de 4 colores (azul, amarillo, plomo y rojo) diferentes la jerarquizacion,
Si se corta a la altura de 15 se tendría 5 grupos
Si se corta a la altura de 5 se tendría 7 grupos
plot(res.agnes.single)
Tenemos 2 graficos: grafico de banner y el grafico del dendrograma con el metodo simple
El coeficiente aglomeracion es 0.88 con el metodo simple
res.agnes.ward=agnes(scale(emisiones),method="ward")
res.agnes.ward
plot(res.agnes.ward)
El coeficiente aglomeracion es 0.94 con el metodo ward, ya que tiende a uno es una manera
eficiente de agrupar en el dendrograma.
Usando matriz de disimilaridad
diss.emisiones=daisy(scale(emisiones))
res.agnes.ward2 =agnes(diss.emisiones,method="ward")
plot(res.agnes.ward2)
Usando matriz de disimilaridad daysi, con el metodo ward tenemos el coeficiente
aglomeracion es 0.94 con el metodo ward, ya que tiende a uno es una manera eficiente de
agrupar en el dendrograma.
Determinando el número optimo de conglomerados
Indice de Silueta
par(mfrow=c(1,3))
for(h in 2:4){
conglomerados=cutree(res.agnes.ward2,k=h)
plot(silhouette(conglomerados,diss.emisiones))
}
Conclusión:
Hemos probado diferentes modelos y se recomienda utilizar 2 y 4 clusters, dependiendo de
la información que queramos introducir.
Existen grandes diferencias entre los países de la UE en cuanto a las emisiones de gases de
efecto invernadero. Esto se debe a las toneladas de estos gases emitidas, pero también a la
reducción de estas emisiones en las últimas décadas.
Las naciones más avanzadas en este sentido son : Croacia Letonia Lituania Hungría Malta
Portugal Rumanía Suecia Liechtenstein Suiza y Turquía (Clusters 2)
También podemos distinguir los países que están haciendo progresos significativos, como
UE27, UE28, Bulgaria, Grecia, España, Francia, Italia, Austria, Polonia, Eslovenia, Eslovaquia,
Reino Unido y Noruega (Clusters 1)
Por último, los países que emiten demasiado pero que no tienen mucho margen de
reducción: Bélgica Chequia Dinamarca Alemania Estonia Irlanda Chipre Países Bajos
Finlandia y Islandia (Clusters 3)
El país más destacado es Luxemburgo. Es un país bastante rico y social y económicamente
avanzado, pero emiten mucho, e y no está reduciendo sus emisiones. Una posible
explicación de este fenómeno en Luxemburgo es que hay muchos trabajadores
transfronterizos. Contaminan y al final del día regresan a sus países de origen. Así que no
cuentan como habitantes pero contribuyen a las emisiones de gases.