Está en la página 1de 7

MTODO WARD

1. Definicin
El mtodo de Ward es un procedimiento jerrquico en el cual, en cada etapa, se unen los
dos clusters para los cuales se tenga el menor incremento en el valor total de la suma de los
cuadrados de las diferencias, dentro de cada clster, de cada individuo al centroide del clster.
Cabe resaltar que cada individuo evaluado corresponde a un clster independiente, es decir, si
manejamos 10 elementos, entonces se generarn 10 clusters.
Para este mtodo se plantea todas las posibles fusiones en cada etapa concreta y elige la
que maximiza la homogeneidad:
Calcula los centroides de los grupos resultantes de las posibles fusiones
A continuacin, calcula la distancia al centroide de todas las observaciones del
grupo (suma de cuadrados total)
La solucin con menor suma de cuadrados total es la elegida.

2. Funcionamiento

Ejemplo 1:
Veamos cmo funciona este procedimiento en el caso de 5 individuos sobre los cuales se miden
dos variables. Los datos son los siguientes

Individuo X1 X2
A 10 5
B 20 20
C 30 10
D 30 15
E 5 10

Primer paso:
Calculamos el nmero de combinaciones, partiendo de la idea que el Mtodo Ward agrupa 2
clusters por cada iteracin.
>> 5C2 = 10 combinaciones (vistas en la primera columna del cuadro posterior)
Realizamos las agrupaciones
Es importante detallar lo siguiente:
- Ek = a la suma de cuadrados de los errores del clster k, o sea, la
distancia euclidiana al cuadrado entre cada individuo del clster k a
su centroide.
- E = la suma de cuadrados de los errores para todos los clusters, o
sea, si suponemos que hay h clusters.

Ejemplo Fila1:
Para la particin: (A, B), C, D, E. Se identific los siguientes centroides:

>> C AB = ( 10+20
2
,
5+20
2 )
=(10, 12.5)

Ahora hallamos la suma de os cuadrado de los errores:


2 2 2 2
>> E AB= (1015 ) + ( 512.5 ) + ( 2015 ) + ( 2012.5 ) =162.5

EC=B =D =0 , ya que el centroide de los valores de un elemento, es el mismo


valor, por ende, no hay error.
De esta manera el E es
>> E = 162.5 + 0 + 0 + 0 = 162.5

Conclusin del cuadro


Se deduce que en esta etapa se unen los elementos C y D, ya que
presenta el menor E = (12.5). La configuracin actual es (C, D), A, B, E.
Segundo Paso
A partir de la configuracin actual tomamos las 4C2 = 6 combinaciones
posibles.

De la misma manera que el primer paso, se deduce que en esta etapa se unen
los elementos A y E. La configuracin actual es (A, E), (C, D), B.
Tercer paso:
A partir de la configuracin actual tomamos las 3C2 = 3 combinaciones

posibles.
Se deduce que en esta etapa se unen los clusters B y (C, D). La configuracin actual es (A,
E), (B, C, D).
Cuarto paso:
Ejemplo 2:

Posibles fusiones: (1,2,3,4) y (5,6)

Posibles fusiones: (5,6) y (7 y 8)


Encontrar centroides:

Luego obtenemos:
Luego hallamos la distancia frente el centroide:

También podría gustarte