Está en la página 1de 9

3.2.

El mtodo del vecino ms cercano


Disponemos de una tabla resumen de tipo T(n,p)
Los elementos de T(n,p) presentan una estructura de grupo
o de jerarqua de grupos encajados.
Aplicamos las etapas ya vistas del proceso de clasificacin :
Primera etapa :
Con una distancia dij podemos evaluar la disimilaridad
entre los objetos a clasificar.
Podemos crear una tabla D(n,n), simtrica, que resume las
distancias entre los n objetos a clasificar, comparados dos a
dos.
Suponemos que es aceptable considerar que la distancia
entre dos clases que contienen un solo objeto cada una es
igual a la distancia entre los objetos:
d({x},{y}) = d(x,y ) "x, y I
Los trminos diagonales de D(n,n) son nulos, puesto que, si
dij es una distancia : d({x},{x}) = d(x,x ) = 0 "x I
Segunda etapa :
Buscamos en la tabla D(n,n) el trmino extra-diagonal mnimo, es decir el valor d({x},{y}) = d(x,y ) mnimo.
Formamos una nueva clase que reagrupa esos dos objetos: {x}
y {y}.

Iteracin :
Se recomienza a partir de la primera etapa, pero ahora slo
con n - 1 objetos a comparar, puesto que una clase contiene
ahora dos objetos.

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N22

Para calcular la Tabla D(n-1, n-1) correspondiente a la nueva


situacin debemos darnos un criterio para calcular la distancia
entre una clase que contiene dos objetos y las clases restantes
que slo contienen un objeto.
La estrategia de agregacin responde a ese problema...
La estrategia del vecino ms cercano consiste en elegir como
distancia entre la clase{x; y} y la clase {k} la ms pequea de las
dos distancias siguientes:

d ({x},{k }) o bien d({y},{k })


En cada etapa t de iteracin del proceso de agregacin por el
mtodo del vecino ms cercano, la Tabla D(n-t, n-t) es
construida con la siguiente distancia ultramtrica :

d ({x ,y }{, k }) = Min (d{x ,k } ; d{ y ,k } )

Ventaja del mtodo : simplicidad de clculo. No requiere el


clculo de la matriz Dt(n-t, n-t) en
cada etapa de agregacin.
Inconveniente del mtodo : tiene tendencia a producir un
efecto de encadenamiento
Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N23

3.3. El mtodo del vecino ms cercano :


un ejemplo numrico
a) Tabla de Datos y Representacin grfica en R2
Tabla T(n,p)

Representacin grfica

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N24

b) Primera agregacin
Utilizando la distancia euclidiana,

d( i , j) =

(xi - x j )2 + (y i - y j )2

"i = 1, K , n ; "j = 1,K , n

podemos calcular la matriz D1(6, 6) siguiente :

Primera agregacin : Como la distancia ms pequea se verifica


entre los objetos A y B, formamos la clase
{A, B}.

Representacin grfica de la primera agregacin


Dendrograma

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N25

c) Segunda agregacin
Utilizando la distancia ultramtrica del vecino ms cercano,
calculamos la tabla D2(5, 5) siguiente :

Segunda agregacin : Dos pares de objetos presentan la distancia ms pequea :( E , F) y ((A, B), C).
Formamos primero la clase{E, F}.

Representacin grfica de la segunda agregacin


Dendrograma

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N26

d) Tercera agregacin
Utilizando la distancia ultramtrica del vecino ms cercano,
calculamos la tabla D3(4, 4) siguiente :

Tercera agregacin : Como la distancia ms pequea se verifica entre los objetos (A, B) y (C), formamos la clase {A, B, C}.

Representacin grfica de la tercera agregacin


Dendrograma

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N27

e) Cuarta agregacin
Utilizando la distancia ultramtrica del vecino ms cercano,
calculamos la tabla D4(3, 3) siguiente :

Cuarta agregacin : Dos pares de objetos presentan la distancia ms pequea :( {A, B, C} y {E, F}) y
({E, F} y {D}). Formamos primero la
clase{A, B, C, E, F} :

Representacin grfica de la cuarta agregacin


Dendrograma

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N28

f) Quinta agregacin
Utilizando la distancia ultramtrica del vecino ms cercano,
calculamos la tabla D5(2, 2) siguiente :

Quinta agregacin : Se agrupan por ltimo los objetos


{A,B,C, E, F} y {D}, formando la clase
{A,B,C,E,F,D} que rene todos los objetos de T(n, p)

Representacin grfica de la quinta agregacin


Dendrograma final

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N29

g) Resultados de la clasificacin
Descripcin de las clases encajadas sucesivas

Histograma de ndices de nivel

Programa PRESTA - 1999 - Eduardo CRIVISQUI

Tr. N30

También podría gustarte