Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Cádiz
Análisis Cluster
Análisis Cluster
Dendograma
Análisis Cluster
B A
C E
D
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
1
En el gráfico consideramos en el eje x
0.8 los individuos y en el eje
j y los valores
0.6 de las disimilaridades entre ellos.
Así, vemos que los individuos más
0.4 similares (menor disimilaridad) son B
y C y es la primera agrupación que se
0.2
forma. Después se agrupan D y E.
A B C D E Luego, para el valor 0.6 el individuo A
se añade
ñ d all grupo formado
f d por B y C.
Si prefijamos en 3 el número de Finalmente, para el valor 0.8 de
grupos, tendríamos para una disimilaridad, todos los individuos
disimilaridad 0.3, los siguientes grupos: f
forman un ú
único
i grupo.
B A
C E
D
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
¿Cómo
ó calcular distancias (disimilaridades) entre grupos con más
á de un individuo?
Análisis Cluster
Análisis Cluster
El algoritmo
Llamemos dij a la distancia (disimilaridad) entre los individuos i y j
Llamemos Dij a la distancia entre el i-ésimo y el j-ésimo grupo formado
Análisis Cluster
Análisis Cluster
3
(1+3+5) (2+4)
2
(1+3+5) 0 Último grupo: {1,2,3,4,5}
D12345 = 4 1
(2+4)
4 0
1 3 5 2 4
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
23 50 39 3
ancia
32 75 40
2
Dista
38 70 38
17 60 42 1
60 80 43 0
45 70 43
6
Statgraphics estandariza (por defecto) las variables. También por defecto
considera la distancia euclídea al cuadrado
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
mero pie
e
1 2 3 1,23783 42
2 5 6 1,78326 41
3 2 5 2,88375 40
Num
4 1 4 2,97102
2 97102 39 80
75
5 1 2 3,723 38 70
65
60
-------------------------------------------- 17 27 37 55
47 57 67 50 Peso
edad
d d
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
Centroides
Cluster Estatura Peso Pie Lbrazo Aespalda Dcraneo Drt
----------------------------------------------------------------------------------------------------
1 161,2 55,4 36,9 69,9 43,0667 56,4333 41,0667
2 178,25 74,5 41,5833 77,9167 49,3333 58,25 45,625
----------------------------------------------------------------------------------------------------
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
Dendrograma
Método
Mét d VVecino
i más
á L
Lejano,Euclidean
j E lid C
Cuadrado
d d
25
20
Disttancia
15
10
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
Observación:
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
Ejemplo 3 (OCDE)
Análisis cluster
(Método del Vecino más lejano)
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
60
Análisis cluster 50
40
cia
Distanc
30
20
10
0
0 10 20 30 40
Etapa
Dendograma
Método del Vecino Más Lejano,Euclideana Cuadrada
60
50
40
Distancia
30
20
10
0
ed Kingdom
Finland
Hungary
Portugal
uxembourg
Chile
Belgium
Austria
Korea
Poland
Spain
Canada
Norway
Estonia
Italy
Japan
Mexico
Denmark
Australia
Sweden
nited States
France
Ireland
Turkey
Netherlands
Switzerland
Iceland
Germany
ch Republic
Israel
Slovenia
ew Zealand
Greece
ak Republic
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Ejemplo 3 (OCDE)
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Ejemplo 3 (OCDE)
ANEXO 1
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Cluster
Análisis Cluster
(1+3+2+4) 5
5
(1+3+5) 0 3
D is ta n c ia
D12345 = 5 2
(2+4)
5 0 1