Reconocimiento de Patrones y El Aprendizaje No Supervisado

Reconocimiento de patrones y el aprendizaje no
supervisado
Jess Cceres Tello
Servicios Informticos
Profesor del Dpto. Ciencias de la Computacin
Escuela Tcnica Superior de Informtica
Universidad de Alcal
jesus.caceres@uah.es

Resumen. Este artculo muestra una introduccin al reconocimiento de pa-
trones entrando ms en detalle en el aprendizaje de sistemas no supervisados
los cuales debern, una vez proporcionados todos los tipos de patrones, deci-
dir cul es el que ms se ajusta al sistema en cuestin. Se concluye el artculo
analizando los problemas existentes en un sistema de aprendizaje no supervi-
sado como son los sistemas topogrficos en los que coexisten un nmero ele-
vado de patrones lineales.
1 Introduccin
La visin artificial nos permite reducir el problema de una imagen a ciertas formas
geomtricas, a partir de ellas podemos analizar el problema e intentar comprender
ante qu objeto nos encontramos, principalmente esto se realiza mediante el recono-
cimiento de patrones.
Es una disciplina dependiente de la inteligencia artificial, ya que nos permite, a
partir de unos datos la adquisicin de conocimientos, adems los sistemas de recono-
cimiento de patrones suelen incorporar un mtodo de aprendizaje, normalmente me-
diante un algoritmo inductivo.
Es importante resaltar la necesidad de introducir un mtodo de evaluacin para
analizar dicho algoritmo, ya que, en el caso de que dicha evaluacin fuese negativa
reducira la eficiencia del algoritmo.
2 Anlisis estadstico

La primera aproximacin al reconocimiento de patrones es simplemente estadsti-
ca, es a veces tambin la ms eficiente. Este mtodo consiste en analizar el patrn
como una variable aleatoria n-dimensional compuesta por n componentes, x
1
, x
2
,..., x
n
,
tales que x
i
pertenece a G
i
para i = 1, 2,..., n.

Figura 1: Ejemplo de espacio de patrones
1

Un patrn se representa como un punto en el espacio de patrones P. El espacio de
patrones P es un espacio de dimensionalidad determinada por el nmero de variables
consideradas y se define como el conjunto de todos los valores posibles que puede
tomar el patrn X, esto es, el producto cartesiano de todos los pares de G
i
.
La tarea fundamental de un sistema de reconocimiento de patrones (clasificador) es
la de asignar a cada patrn de entrada una etiqueta. Dos patrones diferentes deberan
asignarse a una misma clase si son similares y a clases diferentes si no lo son. La
cuestin que se plantea ahora es la definicin de una medida de similitud entre patro-
nes.
En definitiva, se supone que el proceso de adquisicin es biunvoco y continuo.
Estas consideraciones sugieren que si las representaciones de dos patrones estn muy
cercanas en el espacio de representacin, entonces los patrones deben tener un alto
grado de similitud. No obstante, no puede afirmarse tajantemente que a mayor distan-
cia menor similitud ya que la medida (absoluta) de distancia depende de la escala en
la que se cuantifiquen las variables asociadas al patrn.
Los sistemas de adquisicin introducen cierta distorsin o ruido, lo que produce
una variabilidad en la representacin de los patrones. Aunque es posible controlar
eficientemente en muchos casos esta distorsin mediante el calibrado de los sistemas
de adquisicin de datos, aparece otra fuente de variabilidad por la propia naturaleza
de los patrones.
Con mucha frecuencia, patrones de una misma clase difieren, incluso significati-
vamente. Un ejemplo sencillo es el de los sistemas de reconocimiento de caracteres
OCR que pueden interpretar diversos tipos de letra. Bien, en el caso ms simple, en el
que se trata un solo tipo de letra, la variabilidad de los patrones se debe a factores
tales como el granulado, el color y calidad del papel o el tipo de tinta empleado.

1
Fuente del grfico:
http://www-etsi2.ugr.es/depar/ccia/rf/www/tema1_00-01_www/node6.html.

De lo que se trata es de extraer la informacin relevante a partir de la clasificacin
de informacin suministrada por los sensores (datos en bruto). De forma general este
problema puede plantearse como sigue. Dado un conjunto de patrones
n-dimensionales X = [x1, x2,..., xn]T se trata de obtener un nuevo conjunto (carac-
tersticas) d-dimensionales Y = [y1, y2,..., yd]T donde dn.
Esto se consigue con varios mtodos.
1. Reduciendo la dimensionalidad de los datos, si los patrones son de alta
dimensionalidad, el coste computacional asociado a la clasificacin puede
ser muy alto. Las tcnicas dedicadas a seleccionar las variables ms rele-
vantes se dicen de seleccin de caractersticas y reducen la dimensionali-
dad de los patrones.
2. Cambiando el espacio de representacin. El objetivo es obtener una nueva
representacin de los patrones en la que los agrupamientos aparezcan se-
parados si son de diferente clase y que haya un agrupamiento por clase.
Esto puede conseguirse aplicando alguna transformacin sobre los datos
originales. Estas transformaciones suelen ser transformaciones lineales y
el objetivo suele ser maximizar la varianza, los vectores resultantes del
proceso de seleccin o extraccin se denominan caractersticas.
A este conjunto se le debe asignar clases, siendo este el objetivo del sistema, las
clases idealmente son disjuntas, quedando claramente discriminada la pertenencia o
exclusin de un elemento a la clase concreta. La problemtica empieza cuando estos
patrones no estn agrupados de manera ideal o en el peor de los casos cuando estn
solapados, dando entonces lugar a una problemtica clasificacin dado que para un
patrn podemos deducir que pertenece a dos o ms clases.
Esto suele resolverse dado que la muestra suele ser multidimensional, lo cual nos
permite discriminar en funcin de la relacin de las clases seleccionadas por estos
valores, dado que si se adhiere a alguna clase concreta podemos decantarnos por la
relacin entre estas.
Un apartado importante es el aprendizaje del sistema, pudiendo ser ste supervisa-
do o no supervisado.
3 Aprendizaje no supervisado
El principal problema surge cuando el sistema toma la decisin de elegir un deter-
minado patrn de entre todos los proporcionados. Es el sistema el que debe determi-
nar la clase de la cual se obtiene ese patrn.
Otro problema aadido es la toma de decisiones, correctas o no, aqu entra en jue-
go la lgica difusa, en la utilizacin de tcnicas de clustering difuso.
El clustering o agrupamiento es el proceso de particionar un conjunto de datos (u
objetos) en un conjunto de subclases significativas llamadas grupos (clusters). Un
grupo es una coleccin de objetos de datos que son similares a otros y as pueden ser
tratados colectivamente como un grupo.
El agrupamiento es una forma de clasificacin no supervisada en la que, a diferen-
cia de la supervisada, no se conocen las etiquetas de las clases (no hay clases predefi-
nidas) y puede que tampoco se conozca el nmero de grupos.
Un buen mtodo de agrupamiento produce grupos de alta calidad en los cuales la
similitud dentro del grupo es alta y la similitud entre las clases es baja. La medida de
similitud se define usualmente por proximidad en un espacio multidimensional.
3.1 Agrupamiento difuso
Este mtodo (desarrollado por Dunn en 1973 y mejorado por Bezdek en 1981 ) se
utiliza con frecuencia en el reconocimiento de patrones. Se basa en la minimizacin
de la siguiente funcin:

Para todo nmero m verdadero mayor de 1, el u
ij
es el grado de la calidad de
miembro de x
i
en el grupo j , x
i
es el i-ensimo datos medios d-dimensionales, c
j
es el
centro de la d-dimensin del agrupamiento, y ||*|| es cualquier norma que expresa la
semejanza entre cualesquiera datos medidos y el centro.
La distribucin borrosa se realiza con una optimizacin de la funcin anterior,
con la actualizacin del ij y de los centros c
j
de la calidad del miembro u del grupo.

Esta iteracin parar cuando

donde es un criterio de la finalizacin de la iteracin y su valor estar entre 0 y
1, mientras que k es el paso de la iteracin. Este procedimiento converge a un valor
mnimo tambin llamado punto de la silla de montar de J
m
.
El algoritmo se compone de los pasos siguientes:
1. Inicializar la matriz del ij de U=[u ], U (0)
2. En el k-paso: calcular los vectores de los centros C (k) = [ cj ] con U (k)
3. Actualizar U(k) a U(k+1)

4. Si ||U (k+1) - U (k) ||< en-
tonces PARAR; si no volver al
paso 2.

Segn lo dicho anteriormente, los datos estn
limitados a cada agrupacin por medio de una funcin, que representa el comporta-
miento borroso de este algoritmo. Para esto, se tendr que construir simplemente una
matriz apropiada llamada U cuyos elementos sean valores entre 0 y 1, y representar el
grado de proximidad entre los datos y los centros de las agrupaciones.
4 Problemtica en los sistemas de aprendizaje no supervisado:
Caso Prctico.
Un claro ejemplo de sistema con aprendizaje no supervisado lo constituyen los sis-
temas topogrficos. Estos sistemas se caracterizan por tener como entrada una Foto-
grafa area y como salida la elaboracin de un mapa. Esto se consigue analizando los
patrones y modificando el mapa por su equivalente simblico en el caso de los patro-
nes ms sencillos, los patrones topogrficos puntuales, los cuales representan en los
mapas los objetos cartogrficos, cuyos tamaos son menores en relacin con el tama-
o del territorio, presentado en el mapa. Dependiendo de la escala del mapa, a esta
clase de patrones geogrficos pueden pertenecer: ciudades, pueblos, aeropuertos, etc.
Entre los problemas de la digitalizacin de los patrones puntuales, se puede plan-
tear un problema particular de reconocimiento de puntos geodsicos y puestos hidro-
lgicos, los cuales se presentan numerosamente en mapas topogrficos de media
escala que se necesitan para la creacin de modelos digitales de relieve. Estos patro-
nes se dibujan en los mapas, como un grupo de smbolos, como formas y/o colores,
los cuales representan sus caractersticas constructivas. Los smbolos de puntos geo-
dsicos, generalmente vienen con informacin textual, que indica su nombre registra-
do y la altura de su punto de referencia. Los smbolos de puestos hidrolgicos tam-
bin vienen con informacin textual estructurada, que contiene el nombre registrado
de puesto, la indicacin de altura del agua o la corriente, tipo de depsitos de fondo,
etc. Las caractersticas indicadas para los smbolos de patrones, pueden usarse efecti-
vamente para el desarrollo de algoritmos de reconocimiento automtico de patrones
puntuales.
Otro de los problemas que se pueden plantear es la representacin de patrones car-
togrficos lineales, definidos por que el tamao de los cuales, en una direccin es
mucho menor que en la otra. Los patrones lineales representan en los mapa; ros,
autopistas, fallas tectnicas de la corteza terrestre, etc. Los patrones de este tipo se
dibujan en mapas en forma de lneas de diferentes tipos, colores y anchos. Cada ele-
mento puede tener su propio valor informativo. El resultado de la digitalizacin de los
patrones lineales debe contener una secuencia de las coordenadas de los arcos, los
cuales se aproximan el patrn y, en caso de un reconocimiento posible, los atributos
del patrn. La identificacin de los patrones lineales se complica por el hecho de que
se dibujan en mapas no solamente con lneas continuas, sino con lneas de una topo-
loga distinta (continuas, discontinuas, doble lnea, etc.)

Tambin existe el problema del reconocimiento de las isolneas de la altura de la
superficie terrestre. Las isolneas se dibujan en mapas con lneas continuas y trazos
del mismo ancho y color. El reconocimiento de las isolneas se complica por el hecho
de que, generalmente, tienen discontinuidades en las cuales se escribe el valor del
parmetro correspondiente para una isolnea dada. Estos nmeros se ponen en el
mapa con una orientacin definida con respecto a la isolnea marcada. En los lugares
de marcacin numrica o de alta densidad de isolneas, una parte de isolneas afines
puede desaparecer. Con frecuencia se utilizan dos grupos de isolneas en los mapas:
principales y adicionales. Las imgenes de estas ltimas isolneas se diferencian por
el tipo de lneas. Las imgenes de las isolneas pueden contener "berg-rayas", o seg-
mentos cortos con longitud fija, los cuales se ponen perpendicularmente a la isolnea
misma, con orientacin hacia la disminucin del valor numrico de parmetro
Sin embargo, al crear los algoritmos de reconocimiento para sistemas con isol-
neas, se pueden usar de acuerdo a sus especificaciones geomtricas: las isolneas no
pueden cruzarse y cada una es cerrada o comienza y cierra en la frontera de una re-
gin. El resultado de la digitalizacin de isolneas debe contener una secuencia de las
coordenadas de los arcos, los cuales aproximan estas lneas, con un restablecimiento
mximo posible de los segmentos ausentes en las isolneas y una tabla con los valores
del parmetro correspondiente.
Referencias
Juan Carlos Camara. Posibilidades de Websemantico
http://www.iua.upf.es/~jblat/material/doctorat/students/jccbis/Web_Sema
ntico.htm
MNDEZ RODRGUEZ, Eva Mara. RDF: Un modelo de metadatos
flexible para las bibliotecas digitales del prximo milenio.
http://www.cobdc.org/jornades/7JCD/1.pdf
RDF Model Theory.W3C Working Draft 29 April 2002.
http://www.w3.org/TR/rdf-mt/#graphsyntax
RDF Tutorial. Pierre-Antoine Champin. http://www710.univ-
lyon1.fr/~champin/rdf-tutorial/rdf-tutorial.html
Resource Description Framework (RDF): Concepts and Abstract Syntax.
W3C Working Draft 08 November 2002.
http://www.w3.org/TR/2002/WD-rdf-concepts-20021108/
W3C. Resource Description Framework (RDF). http://www.w3.org/RDF/

Reconocimiento de Patrones y El Aprendizaje No Supervisado

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Reconocimiento de Patrones y El Aprendizaje No Supervisado

Cargado por

Copyright:

Formatos disponibles

Reconocimiento de patrones y el aprendizaje no

También podría gustarte