Está en la página 1de 9

Mapas Autoorganizados de kohonen

Edgar Richard Polonio Bocanegra


Universidad San Pedro Campus de Chimbote, Richardsmith_libra@hotmail.com

RESUMEN.
Se describe las caractersticas de los mapas auto organizados, su regla de
aprendizaje, su algoritmo de entrenamiento, con la finalidad de resolver problemas
de clasificacin.

Kohonen Self-Organizing Maps


ABSTRACT
The characteristics of the self-organizing maps, the rule learning, the training
algorithm, in order to solve classification problems described.

INTRODUCCIN
Los mapas autoorganizados o SOM (SelfOrganizing Maps), tambin llamados redes de
Kohonen son un tipo de red neuronal no
supervisada, competitiva, distribuida de forma
regular en una rejilla de, normalmente, dos
dimensiones. Su finalidad es descubrir la
estructura subyacente de los datos introducidos
en ella. A lo largo del entrenamiento de la red,
los vectores de datos son introducidos en cada
neurona y se comparan con el vector de peso
caracterstico de cada neurona. La neurona que
presenta menor diferencia entre su vector de
peso y el vector de datos es la neurona ganadora
(o BMU) y ella, y sus vecinas vern
modificados sus vectores de pesos. Este tipo de
mapas permiten reducir la dimensionalidad de
los vectores de entrada para representarlos
mediante una matriz de distancias unificada (Umatriz) generalmente consistente en una matriz
2D, apta para la visualizacin como una imagen
plana.

ESTRUCTURA
Matriz de neuronas: Las neuronas se
distribuyen de forma regular en una
rejilla de dos dimensiones, que pueden
ser rectangulares o hexagonales, en las
que cada neurona puede tener cuatro o
seis vecinos respectivamente.
Espacio de entrada: Los datos de
entrada corresponden a un vector de N

componentes por cada atributo que


queramos comprar, siendo esta

dimensin la misma del vector de


pesos sinpticos asociado a cada una de
las neuronas de la rejilla.
Espacio de salida: Corresponde con la
posicin (2D) en el mapa de cada
neurona.
Relacin entre neuronas: Entre todas
las neuronas hay una relacin de
vecindad que es la clave para
conformar el mapa durante la etapa de
entrenamiento. Esta relacin viene
dada por una funcin.

Ilustracin 1 Estructura de un mapa


autoorganizado

Entrenamiento
Para
cada
paso
del
entrenamiento (poca) se introduce un vector de
datos
correspondiente
a
una
entrada
seleccionada aleatoriamente y se calcula la
similitud entre este vector y el peso de cada
neurona. Aplicacin de SOM a la visualizacin
de datos 4 La neurona ms parecida al vector de
entrada ser la neurona ganadora (BestMatching Unit BMU). Generalmente se usa la
distancia eucldea para medir esta similaridad
entre pesos sinpticos. Tras esto, los vectores de

pesos de la BMU y sus vecinos son actualizados


de forma que se acercan al vector de entrada.

APLICACIN

DE SOM A
LA VISUALIZACIN DE
DATOS
Las dos caractersticas descritas
anteriormente hacen especialmente
atractivo el uso de SOM para
representacin de datos:

realizando un preprocesado del


conjunto de datos.
Recientemente se est produciendo
un crecimiento del uso de mapas SOM
gracias a su potencia y facilidad de
uso para trabajar en campos como la
estadstica. Adems una vez obtenida
el mapa, la representacin no tiene
por qu limitarse a una rejilla
rectangular, como se puede apreciar
en la siguiente imagen.

Reduccin
de
la
multidimensionalidad:
Podemos representar conjuntos
de datos de gran nmero de
atributos en mapas 2D.
Asociacin de elementos con
atributos
similares:
Visualmente podemos ver de
forma rpida como quedan
agrupados
elementos
que
tienen valores prximos entre
s.
Aparte de estas razones
tcnico tenemos adems
ventajas como son:

a nivel
muchas

Facilidad de implementacin:
La implementacin de un
sistema SOM es relativamente
fcil
y
se
adapta
perfectamente al modelo de
procesado en paralelo por lo
que
es
tambin
muy
fcilmente optimizable.
Abstraccin de los datos de
entrada:
Los
SOM
son
totalmente transparentes a la
naturaleza de los datos de
entrada, tan solo se limitan a
comparar vectores de entrada
con los pesos sinpticos de las
neuronas de la rejilla. Esto
hace que pueda ser usado en
gran variedad de problemas
sin tener necesidad de cambiar
la aplicacin base.
Facilidad de integracin con
otras tcnicas: Esta tcnica se
puede compaginar con otras
tcnicas de obtencin de
conocimiento como pueden ser
las
redes
bayesianas

Ilustracin 2 Ejemplo de uso de SOM en


aplicaciones estadsticas

APRENDIZAJE

NO

SUPERVISADO
Los algoritmos de clasificacin no supervisados
son aquellos que no requieren etiquetado de
cada uno de los vectores de entrada; se suelen
llamar tambin algoritmos auto-asociativos,
porque asocian entradas a ellas mismas. Una
buena explicacin de estos algoritmos se halla
en la FAQ de redes neuronales.
El tipo ms comn de algoritmos de aprendizaje
o clasificacin no supervisada son los
algoritmos de anlisis de grupos o clustering;
estos algoritmos tratan de dividir las muestras
del conjunto de entrada en una serie de grupos
con caractersticas comunes. Un algoritmo debe
descubrir cules son estos clusters, pero tambin
cules son las caractersticas que define ese
cluster y cuntos clusters hay; pero ste ltimo
es un problema que no tiene solucin fcil.
Dentro de las redes neuronales, uno de los
mtodos no supervisados ms comunes es
precisamente el SOM, pero hay otro mtodo
denominado aprendizaje hebbiano que usa una

red monocapa, con pesos conectando las


entradas a las salidas, y aumentarndo el valor de
los pesos que unen a dos neuronas si se activan
a la vez, y disminuir el valor si se activan de
forma diferencial. Una red hebbiana se puede
disponer en una sola capa o varias: las entradas
se propagan a la capa interna, y a la salida, y
tras la propagacin, se cambian los pesos de la
forma indicada. El aprendizaje hebbiano
equivale a un anlisis de componentes
principales de las entradas, segn ha sido
probado recientemente.

Una red neuronal supervisada tal como el


perceptrn multicapa se puede convertir en no
supervisada usando las entradas como salidas;
de esta forma, la capa interna extraer los
componentes principales de las entradas, y se
podr usar, por ejemplo, como memoria
asociativa; o bien, analizando las activaciones
de la capa interna, se pueden asignar diferentes
grupos (clusters) a las entradas: los patrones de
entrada/salida que provoquen unos patrones de
activacin similares pertenecern al mismo
grupo.
Los mtodos no supervisados se suelen usar en
lo denominado anlisis de datos exploratorio, es
decir, en una fase del anlisis de los datos,
cuando no se sabe de antemano cules son los
grupos naturales que se forman, y se quiere
visualizar la abundancia y la relacin que hay
entre los grupos "naturales"; se puede decir que
una de sus principales aplicaciones es la
visualizacin de datos multidimensionales,
porque un algoritmo no supervisado acta como
una proyeccin de un espacio multidimensional
a otro de dimensiones visualizables. Tambin se
pueden usar como fase inicial de algoritmos de
aprendizaje supervisados: un algoritmo como el
k-medias o el mismo SOM se pueden usar para
inicializar
algoritmos
de
aprendizaje
supervisado tales como el LVQ (Learning
Vector Quantization). [1]

ARQUITECTURA EN RED
En general, el algoritmo SOM considera una
arquitectura en 2 capas: por una parte tenemos
una red de nodos de aprendizaje (de la que nos
importa la relacin de distancias que hay entre
ellos) junto con un conjunto de vectores de
entrenamiento, de forma que todos los
elementos de la primera capa estn conectados
con todos los elementos de la segunda capa.

Para los propsitos bsicos que necesitamos en


este ejemplo trabajaremos con una distribucin
2D del SOM, tal y como muestra la siguiente
figura (la red de aprendizaje viene representada
por nodos rojos, y los vectores de entrenamiento
vienen representados en verde).

Ilustracin 3 La red de aprendizaje viene


representada por nodos rojos, y los
vectores
de
entrenamiento
vienen
representados en verde

Cada nodo tiene un posicin topolgica


especfica (que suele estar asociada a las
coordenadas (x,y)) y contiene un vector de
pesos de la misma dimensin que los vectores
de entrenamiento. Es decir, si cada vector, V, de
entrenamiento tiene dimensin n, cada nodo
tendr un vector de pesos, W, de dimensin n.

ALGORITMO

DE

APRENDIZAJE
A grandes rasgos, ya que no hay vector objetivo
al que aproximarse, lo que se hace es que, en
aquellas zonas en las que la red tiene nodos con
pesos que coinciden con vectores de
entrenamiento, el resto de nodos de su entorno
tienden a aproximarse tambin a ese mismo
vector. De esta forma, partiendo de una
dstribucin de pesos inicial (normalmente
aleatorios), el SOM tiende a aproximarse a una
distribucin de pesos estable. Cada una de estas
zonas que se estabiliza se convierte en un
clasificador de propiedades, de forma que la red
se convierte en una salida que representa una
aplicacin de clasificacin. Una vez estabilizada
la red, cualquier vector nuevo estimular la zona
de la red que tiene pesos similares.
De forma ms detallada, los pasos que se siguen
para el proceso de entrenamiento son:

Cada nodo se inicializa con un peso


(aleatorio). Normalmente, vectores
en [0,1]n,
Se selecciona al azar un vector del
conjunto de entrenamiento.
Se calcula el nodo de la red que tiene el
peso ms similar al vector anterior, que

notaremos
como Best
Matching
Unit (BMU). Para ello, simplemente se
calculan las distancias eucldeas entre
los vectores W de cada nodo y el
vector de entrenamiento (por motivos
de eficiencia, no se aplica la raz
cuadrada al clculo de la distancia
eucldea, cosa que no afecta para
calcular el mnimo).
Se calcula el radio del entorno de
BMU. Este radio comenzar siendo
grande (como para cubrir la red
completa) y se va reduciendo en cada
iteracin.
Cada nodo del entorno de BMU ajusta
su peso para parecerse al vector de
entrenamiento seleccionado en el paso
2, de forma que los nodos ms
cercanos al BMU se vean ms
modificados.
Repetir desde el paso 2 (el nmero de
iteraciones que se considere necesario).

La frmula que establece el radio en funcin de


la iteracin (que hace que vaya disminuyendo,
pero no linealmente) es:
r(t)=r0et
donde r0 es el radio inicial (habitualmente, el
radio de la red, es decir, uno suficiente para
cubrir en el primer paso todos los nodos) y una
constante que permite hacer que el radio sea
muy pequeo cuando llegamos a la iteracin
mxima:
=Tiempo_de_Entrenamientolnr0
La siguiente figura muestra el efecto de ir
reduciendo paulatinamente el radio del entorno,
donde se marcan los nodos que se veran
afectados si el nodo BMU es el nodo amarillo:
[2]

LOS MAPAS
AUTOORGANIZADOS
APLICADOS A LA
BIBLIOMETRA.
La Bibliometra es una disciplina que estudia los
aspectos cuantitativos de la informacin
registrada, para ello se han creado una serie de
modelos estadsticos que aportan datos
numricos sobre el comportamiento de la
actividad cientfica. Tambin se han adaptado
modelos de otras disciplinas para facilitar los
anlisis
y
representar
los
resultados
desarrollados a partir de la Bibliometra. Los
mapas auto-organizados (SOM) o modelo de
Kohonen (basado en las RNA) es una de estas
herramientas. En los estudios mtricos la
aplicacin de las redes neuronales, y
especficamente los SOM, estn asociados en lo
fundamental
con
la
clasificacin
de
informacin, o sea, la formacin de cluster y su
representacin en mapas bidimensionales de
conceptos y ms especficamente con el
descubrimiento de informacin (data mining).
Este ltimo vinculado con la recuperacin de la
informacin con "ruido" e incompleta o con el
tratamiento de informacin que incluye
diferentes tipos de datos (nmeros, texto,
registros estructurados, etc.). Los SOM facilitan
que el conocimiento tcito se haga explcito, a
partir de la extraccin no-trivial (a partir de los
datos)
de
conocimientos
implcitos
potencialmente
tiles
desconocidos
previamente. Se podrn encontrar patrones o
estructuras en el conocimiento tcito. [3]
Las investigaciones bibliomtricas, a travs de
la utilizacin de las redes neuronales,
incursionan en:

Ilustracin 4 La siguiente figura muestra el


efecto de ir reduciendo paulatinamente el
radio del entorno

la seleccin de variables.
clasificacin de
informacin
formacin de cluster.
regresin.
relaciones entre variables.
cambios y desviaciones.
representacin de las variables.

Lo anterior se puede ejemplificar a partir de


algunas aplicaciones prcticas relacionadas con
la evaluacin de pginas web [8] y trabajos
relacionados con la clasificacin de revistas en
un determinado campo temtico [9]. Se
conocen, adems, investigaciones relacionadas
con la minera de textos (text mining) sobre
todo aplicado a la asociacin de palabras o co-

word. En todos estos ejemplos se utiliza como


variante de las RNA el modelo de los mapas
autoorganizativos (self-organizing map, SOM).
En un anlisis, realizado por los autores sobre el
tema, se examinaron cerca de 56 documentos
sobre redes neuronales aplicadas al anlisis de
informacin, con ello se constato que la mayora
utilizaban el modelo SOM como herramienta de
estudio. (2, 7, 8,12,16). Un ejemplo de SOM
podra ser.el estudio de una temtica
determinada, para este caso en un mapa cada
documento (artculo de revista, podra ser una
patente, una tesis, etc.) va a ocupar un lugar en
el espacio, en funcin de su contenido temtico.
Cada rea del mapa va a Sotolongo, G.;
Guzmn, MV. Aplicaciones de las redes
neuronales. El caso de la bibliometra. Ciencias
de la Informacin. (preprint) 2001; 32(1):27-34.
10 reflejar un contenido especfico y los tpicos
van variando levemente a lo largo del mismo.
Las diferentes tonalidades indican la densidad
de documentos, cuanto ms oscura ms
documentos se encuentran. Este uso frecuente
de los SOM quizs se deba a lo amigable de la
interfaz de los mapas para los usuarios finales y
a la diversidad de sus utilidades prcticas, estas
representaciones son vlidas para poder
identificar, adems de los desarrollos temticos
antes mencionados, relaciones entres reas
temticas y publicaciones, alianzas estratgicas
y caractersticas de la cooperacin. Permite,
tambin, visualizar los avances tecnolgicos que
tienen lugar en un perodo, conocer la evolucin
de una tecnologa a travs del tiempo e
identificar campos emergentes. En el acpite
anterior se mencion al Viscovery SOMine
como un software que ha automatizado el
modelo SOM. Este sistema es utilizado por un
equipo de trabajo del Instituto Finlay para
elaborar mapas cientfico-tecnolgicos.

Ilustracin 5 Funcionamiento del Viscovery


SOMine

El punto de partida, para el uso de esta


herramienta, es la entrada de un conjunto de
datos
numricos
(datos
multivariables,
variables, nodos ). Estos datos necesitan ser
preprocesados con el objetivo de organizarlos
en forma de matrices. Los datos son convertidos
hasta obtener una informacin visual en forma
de mapa, para ello se aplica un nmero de
tcnicas de evaluacin como coeficientes de
correlacin entre variables o factores
discriminantes [4, 13, 14]. Los mapas sern
amigables a la vista del usuario final, en ellos se
identificarn dependencias entre parametros,
cluster y grficos que facilitarn diferentes
predicciones o el proceso de monitoreo.

APLICACIONES:
Se estima que a pesar de las limitaciones
tcnicas, las redes neuronales aplicadas a la
Bibliometra constituyen un campo de
investigacin muy prometedor. Un ejemplo es
presentado a continuacin. La disciplina
muldidisciplinar de las redes neuronales es
aplicada en esta seccin, donde se asume a la
produccin de los documentos de patentes como
indicador de la capacidad de desarrollo
industrial. El objetivo es identificar posibles
competidores,
alianzas
estratgicas,
dependencia tecnolgica, etc. Se escogi para el
primer ejemplo la representacin de la situacin
tecnolgica de la Neisseria meningitidis.3 Las
diferentes instituciones en la primera hoja de sus
patentes hacen referencias a otras patentes, a
partir de estos datos se puede inferir el impacto
que produce una tecnologa o institucin en
otra. Con el objetivo de determinar la
dependencia tecnolgica entre instituciones, se
realiz un anlisis de citas, estas formaron los
cluster que aparecen en la figura.

"gastos en I+D" en cada uno de los pases


analizados, "personal dedicado a actividades de
I+D", etc.

Ilustracin 6 Posicin tecnolgica de las


instituciones segn las citaciones.

El mapa tecnolgico presentado en la figura


anterior representa a tres cluster: cluster 1
formado solamente por la Merck & Co., un
cluster 2 formado nicamente por el National
Res. Council of Canada y el cluster 3 que
incluye al resto de las instituciones. Este ltimo
grupo est formado por una gran cantidad de
instituciones que tienen igual estrategia de
citacin, sobre todo las representadas con
colores ms claros y sin lmites de separacin.
Se presupone que estas firmas se basan para su
desarrollo en su propia base tecnolgica, pues
citan poco a otras instituciones. El cluster 2
evidencia un alto nivel de autocitacin, cuando
esto sucede, algunos investigadores [1] en el
tema sealan que probablemente esta institucin
tenga un nicho de proteccin cerrada sobre un
espacio tecnolgico. Puede estar ocurriendo que
exista una patente importante, la cual se ha
rodeado de invenciones mejoradas. El cluster
formado por la Merck & Co. indica un mayor
nivel de citacin, esto presupone una estrategia
balanceada: absorbe tecnologa externa y
produce tecnologa propia. La cercana de los
cluster tambin es una evidencia sobre las
instituciones que tienen estrategias parecidas a
la de otras. La Rockefeller University hace
frontera con el cluster que incluye a North
American Vaccine, y el National Res. Council
de Canada; estas instituciones forman un
colegio tecnolgico invisible que basa sus
desarrollos en la misma innovacin tecnolgica.
Otro ejemplo Otra aplicacin se presenta en un
campo diferente del conocimiento: la
agricultura. En este ejemplo no solo se tom
como elemento de entrada la produccin
documental de determinados pases, tambin se
consideraron otros tipos de variables como

Ilustracin 7 Mapa de Amrica Latina y el


Caribe (pases seleccionados) de acuerdo
con la

En la figura 6 se presenta un mapa autoorganizado sobre la actividad en ciencia agrcola


en Amrica Latina y el Caribe (se seleccionaron
algunos pases segn los datos disponibles). Con
ello se pretende lograr una representacin de la
regin, teniendo en cuenta los indicadores de
insumo y de resultados ms significativos. En la
figura aparecen, en dos dimensiones, 22 pases.
La semejanza de los pases, considerando de
forma simultnea los 20 indicadores, se expresa
mediante la cercana de estos en el mapa. Los
22 pases se agrupan (autorganizan) en 3
clusters o grupos: El cluster C1, que aparece en
la esquina inferior izquierda, es seguido por una
banda de 4 pases correspondientes al cluster C2
(Cuba, Colombia, Chile y Venezuela) y otro
cluster (C3) con el resto de los pases.
En el mbito regional e internacional hay un
grupo de pases formado por Brasil, Mxico y
Argentina que tienen una investigacin en la
temtica con mayor solidez y con parecidos
niveles de desarrollo. Esto coincide con los
pases que presentan mayor nivel regional en el
desarrollo agrcola. [4]

ANLISIS

DE
DIABTICOS
INTERNADOS

PACIENTE

que fue anteriormente aprendida. El problema


principal consiste en disear un sistema que sea
simultaneament sensible a pero no radicalmente
destructivo, a la nueva entrada.

ANLISIS

DE PACIENTE
FACTORES DE RIESGO

ROBUSTEZ:
En la data real existen diversos puntos
denominados outliers los cuales difieren del
comun de los datos. Las SOM no son sensibles
a la presencia de este tipo de datos, no logranso
realizar una buena generalizacion del conjunto
de entrada, siendo otro problema importante que
se debe abordar. [6]

RIESGOS
VARIABLES
DATOS [5]

BANCARIOS
DE
LOS

INTERFERENCIA
CATRASTOFICA
Sucede cuando cuanod la informacion que fue
recientemente aprendida a menudo elimina la

CONCLUSIONES:
El uso de las redes neurales incide en las
empresas mejorando el proceso de calificacin
de las finanzas econmicas al margen de error
en el ranking. Todo esto demuestra su

utilizacin en varios campos (capital de trabajo,


pagos, inversiones, etc.), para poder ser aplicado
a una gran variedad de proyectos e
investigaciones.
En este trabajo hemos presentado los mapas
auto-organizados tal y como fueron introducidas
por Kohonen y particularizando desde el punto
de vista general de redes neuronales artificiales.
De entre las miles de aplicaciones que tienen los
mapas auto-organizados hemos descrito varias
de ellas orientadas a la segmentacin de
imgenes en color. Posteriormente hemos
introducido el concepto de mapa autoorganizado generalizado, cuya principal virtud
sea quizs su simetra respecto a los datos de
entrada y las neuronas. Hemos visto como
algunas de las variantes de mapas autoorganizados explicados anteriormente se
enmarcan dentro de este nuevo concepto
generalizado mientras que no lo hacan en el

concepto clsico de mapa auto-organizado.


Creemos que este concepto podra dar a nuevas
desarrollos o variaciones de mapas autoorganizados. Como aplicacin hemos diseado
un
mapa
auto-organizado
generalizado
orientado a la segmentacin de imgenes en
color. La diferencia con un mapa clsico radica
fundamentalmente en que el movimiento de las
neuronas se realiza a lo largo de las geodsicas
de cierta mtrica. Esta mtrica depende de una
densidad continua calculada a partir de las
muestras. La implementacin se ha llevado a
cabo en MATLAB y C.

Bibliografa
[1] [En lnea]. Available:
http://geneura.ugr.es/~jmerelo/tutoriales/bioinfo/Kohonen.html. [ltimo
acceso: 22 mayo 2015].
[2] D. C. d. l. C. e. I. A. U. d. Sevilla, 10 enero 2014. [En lnea]. Available:
http://www.cs.us.es/~fsancho/?e=76. [ltimo acceso: 22 mayo 2015].
[3] [En lnea]. Available:
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema5d
m.pdf. [ltimo acceso: 22 MAYO 2015].
[4] M. V. Guzmn. [En lnea]. Available:
http://www.dynamics.unam.edu/DinamicaNoLineal/Articulos/MineriaDato
s/Articulo03.pdf. [ltimo acceso: 22 mayo 2015].
[5] G. Meschino. [En lnea]. Available:
http://www3.fi.mdp.edu.ar/meschino/Presentaciones/GUSTAVO
%2008%20-%20KOHONEN.pdf. [ltimo acceso: 22 mayo 2015].
[6] [En lnea]. Available: http://www.doc4net.es/doc/1850344633707/.
[ltimo acceso: 22 mayo 2015].

También podría gustarte