Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Definicin
El mtodo de Ward es un procedimiento jerrquico en el cual, en cada etapa, se unen los
dos clusters para los cuales se tenga el menor incremento en el valor total de la suma de los
cuadrados de las diferencias, dentro de cada clster, de cada individuo al centroide del clster.
Cabe resaltar que cada individuo evaluado corresponde a un clster independiente, es decir, si
manejamos 10 elementos, entonces se generarn 10 clusters.
Para este mtodo se plantea todas las posibles fusiones en cada etapa concreta y elige la
que maximiza la homogeneidad:
Calcula los centroides de los grupos resultantes de las posibles fusiones
A continuacin, calcula la distancia al centroide de todas las observaciones del
grupo (suma de cuadrados total)
La solucin con menor suma de cuadrados total es la elegida.
2. Funcionamiento
Ejemplo 1:
Veamos cmo funciona este procedimiento en el caso de 5 individuos sobre los cuales se miden
dos variables. Los datos son los siguientes
Individuo X1 X2
A 10 5
B 20 20
C 30 10
D 30 15
E 5 10
Primer paso:
Calculamos el nmero de combinaciones, partiendo de la idea que el Mtodo Ward agrupa 2
clusters por cada iteracin.
>> 5C2 = 10 combinaciones (vistas en la primera columna del cuadro posterior)
Realizamos las agrupaciones
Es importante detallar lo siguiente:
- Ek = a la suma de cuadrados de los errores del clster k, o sea, la
distancia euclidiana al cuadrado entre cada individuo del clster k a
su centroide.
- E = la suma de cuadrados de los errores para todos los clusters, o
sea, si suponemos que hay h clusters.
Ejemplo Fila1:
Para la particin: (A, B), C, D, E. Se identific los siguientes centroides:
>> C AB = ( 10+20
2
,
5+20
2 )
=(10, 12.5)
De la misma manera que el primer paso, se deduce que en esta etapa se unen
los elementos A y E. La configuracin actual es (A, E), (C, D), B.
Tercer paso:
A partir de la configuracin actual tomamos las 3C2 = 3 combinaciones
posibles.
Se deduce que en esta etapa se unen los clusters B y (C, D). La configuracin actual es (A,
E), (B, C, D).
Cuarto paso:
Ejemplo 2:
Luego obtenemos:
Luego hallamos la distancia frente el centroide: