Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NO - Tesis Carlos Platero
NO - Tesis Carlos Platero
INTRODUCCIN ..................................................................................................................... 11
1.1 MARCO DE LA TESIS .............................................................................................................11
1.1.1 ALCANCE DE LA TESIS ...................................................................................................12
1.2 OBJETIVOS ............................................................................................................................13
1.3 ESTRUCTURA DE LA TESIS ....................................................................................................14
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
Carlos Platero
ndice
DISAM-UPMT-98-015
Carlos Platero
CONCLUSIONES.................................................................................................................... 285
8.1 APORTACIONES DE LA TESIS ..............................................................................................288
8.2 FUTUROS TRABAJOS ...........................................................................................................289
DISAM-UPMT-98-015
Carlos Platero
ndice
DISAM-UPMT-98-015
Carlos Platero
1.1
Captulo 1: Introduccin
Introduccin
Marco de la tesis
DISAM-UPMT-98-015
11
Carlos Platero
desarrollo de muchas aplicaciones SIVA para las necesidades de la industria actual. De hecho,
a lo largo de los ltimos aos se han desarrollado mltiples arquitecturas para la deteccin de
defectos visuales en superficies planas y homogneas, tales como textiles, maderas, aceros,
aluminio, plsticos, pasta de papel y un sinfn de productos industriales, mostrando un gran
inters tanto para la industria como para la investigacin aplicada.
Si bien hay constatacin de mltiples sistemas de inspeccin de superficies
[Piiro90][Oulu97][Parsy97][EES92], en ningn caso existe una metodologa completa que
permita, independientemente de las caractersticas del proceso, configurar el sistema de
inspeccin visual automatizado[Newma95]. Los trabajos presentados muestran soluciones
particulares atendiendo a las condiciones de la inspeccin. An as, de todos ellos se desprende
una filosofa comn, caracterizada por tres bloques. Una primera etapa encargada de la
formacin de imgenes, con los objetivos de realzar los defectos visuales en la escena y
trasladarlos a la memoria del computador. Un segundo bloque llamado sistema de deteccin
de defectos, que trata de localizar los defectos de apariencia visual. Y por ltimo, un tercer
bloque de clasificacin, convirtiendo la informacin seleccionada en una etiqueta de
catalogacin. A veces resulta este ltimo bloque como optativo.
El desarrollo de esta tesis pretende ofrecer una solucin metdica al diseo de sistemas
de inspeccin visual automatizada de superficies planas y homogneas. La consecucin de este
objetivo debe cubrir los fundamentos y criterios para el diseo del sistema de iluminacin
sobre superficies planas, estrategias de arquitectura de adquisicin de escenarios SIVA, la
elaboracin de algoritmos de deteccin de defectos locales, la representacin virtual de los
defectos junto con la seleccin de las mejores caractersticas y por ltimo, la clasificacin de
los defectos.
Como marco del desarrollo experimental de la tesis, as como de aplicacin industrial,
se ha participado en la implementacin de dos sistemas de inspeccin. Un primer SIVA
dedicado a la deteccin y clasificacin de faltas visuales en el aluminio colado, capaz de
discernir la ausencia/presencia de defectos locales en las planchas de aluminio, as como de
su clasificacin. Y un segundo sistema diseado para la deteccin de defectos locales en la
pasta de papel. Las arquitecturas desarrolladas han servido de bancada para probar la bondad
de las propuestas presentadas en esta tesis.
1.1.1
Alcance de la tesis
La determinacin en superficies planas y homogneas de la presencia o ausencia de
defectos, as como de su clasificacin, mediante tcnicas de Visin artificial e Inteligencia
artificial ha sido tema de estudio por mltiples autores. Todos coinciden bsicamente en el
planteamiento de tres hitos importantes: formacin de imgenes, algoritmos de deteccin y en
menor medida la clasificacin de los defectos.
El primer hito cubre desde la iluminacin hasta el almacenamiento de la seal en la
memoria del computador. En referencia al sistema de iluminacin, la problemtica se centra
en la colocacin ptima entre los focos luminosos, la superficie a inspeccionar y las
disposiciones de los sensores. Con tal propsito, se requieren conocer los modelos sobre la
12
DISAM-UPMT-98-015
Carlos Platero
Captulo 1: Introduccin
1.2
Objetivos
El objetivo general de esta tesis es el desarrollo de tcnicas de Visin e Inteligencia
artificial conducentes tanto a la caracterizacin de defectos en superficies planas y
homogneas, como a la deteccin y clasificaciones de tales defectos, de forma que la
informacin obtenida sea integrable en tiempo real dentro del proceso productivo. Con tal fin,
los objetivos desglosados en puntos correspondern a:
DISAM-UPMT-98-015
13
1.3
Carlos Platero
Estructura de la tesis
La configuracin de la tesis en captulos viene dada como sigue: un captulo inicial
sobre la problemtica concerniente a la inspeccin visual automatizada, para pasar a
desarrollar en los siguientes cuatro captulos el anlisis y diseos de las cuestiones planteadas,
esto es, formacin de imgenes, deteccin de los defectos locales, anlisis de los datos y
clasificacin de los defectos. Para acabar se muestran las aplicaciones industriales elaboradas,
las cuales han servido como marco de trabajo experimental. Una explicacin ms detallada de
los siguientes captulos se muestra a continuacin con el objeto de ilustrar por separado qu
problemtica se estudia en cada tema.
El captulo segundo presenta la problemtica de la Inspeccin visual automatizada. Se
empieza con una evolucin histrica de la Inspeccin industrial llegando a la conclusin de
la necesidad de insertar las operaciones de inspeccin dentro del proceso manufacturero.
Adems, tambin se concluye que la inspeccin visual automatizada es ideal para la mejora
de la produccin y de la competitividad de las empresas. Llegado a este punto, se centra la
problemtica sobre los SIVA, indicando sus ventajas e inconvenientes. Luego se pasa a un
14
DISAM-UPMT-98-015
Carlos Platero
Captulo 1: Introduccin
DISAM-UPMT-98-015
15
Carlos Platero
es la falta de muestras para el diseo de los clasificadores. El sexto captulo aborda el diseo
de los clasificadores paramtricos y no paramtricos, sujetos a las mencionadas condiciones,
indicndose expresiones analticas tanto del error de clasificacin como su sesgo, siendo unas
de las aportaciones ms significativas de la tesis. Tambin, es presentado un novedoso mtodo
de parametrizacinseleccin de las caractersticas basadas en transformaciones Box Cox y
en las distancias de Bhattacharyya. Por ltimo se comparan los resultados obtenidos con las
tcnicas de Reconocimiento de formas tradicionales.
El captulo 7 describe las aplicaciones industriales acometidas durante la realizacin
de esta tesis. Se presenta tanto el SIVA elaborado para el aluminio colado como para la pasta
de papel. El esquema empleado trata de exponer la problemtica a resolver y cmo se ha
diseado la formacin de imgenes, la deteccin de los defectos y su clasificacin para cada
uno de stos.
Por ltimo, en el captulo octavo se hace un resumen del trabajo realizado as como de
las aportaciones novedosas presentadas. Para acabar indicando algunas posibles lneas de
trabajo a investigar en el futuro.
16
DISAM-UPMT-98-015
Carlos Platero
Problemtica de la Inspeccin
visual automatizada
DISAM-UPMT-98-015
17
2.1
Carlos Platero
La Inspeccin industrial
La inspeccin fue uno de los motores de la Revolucin industrial, al ayudar a la
realizacin de productos con dimensiones consistentes. Con partes estndar, la nocin de
intercambiabilidad fomentada por Whitney fue finalmente una realidad. La produccin en
serie era posible y las organizaciones tendieron a ser ms complejas. A principios de siglo,
con el aumento de la complejidad se vio la necesidad de separar y formar departamentos de
inspeccin. Durante las tres cuartas partes del siglo, el nmero de inspectores se ha
incrementado paulatinamente, asegurndose stos la responsabilidad de la calidad de los
productos. Los inspectores han actuado cuando detectaban alguna anomala en el proceso.
Pero frecuentemente, esta actitud significaba que mientras se localizaba la mala calidad del
producto, algunos productos ya haban sido embarcados y recibidos por el cliente.
Durante la mayor parte del siglo XX, la organizacin de la inspeccin estaba
normalmente separada del proceso productivo. La responsabilidad de la inspeccin de los
productos dependa del departamento de calidad. Sin embargo, la constatacin de que la
calidad del producto no poda darse desde fuera, sino en su propio proceso, supuso un
punto de inflexin en la Inspeccin industrial.
En una industria cada vez ms automatizada, donde el diseo de los productos
puede ser modificado, las operaciones del proceso cambian de secuencia con slo variar las
rdenes en un programa. Es este ambiente el que propicia que las operaciones de
inspeccin no estn aisladas del proceso, al contrario, deben formar parte de ste. Aun ms,
la mejora de la produccin manufacturera va a depender de la integracin de sistemas de
inspeccin dentro del proceso [Winch96].
En el proceso productivo, el resultado es un producto cuyas propiedades varan
dentro de un rango. Las causas de esta variabilidad son debidas, a las propiedades
estocsticas del control del proceso, la falta de uniformidad de las materias primas, las
variaciones ambientales, como temperatura, humedad, vibraciones, y por supuesto los
errores humanos. La variabilidad del proceso productivo es una de sus caractersticas.
Luego, la inspeccin se encuentra dentro de un mundo variable, en el cual va a tratar de
identificar la extensin de la variabilidad. Por estas razones, es frecuente representar las
medidas mediante distribuciones normales. Algo muy utilizado y que en esta tesis tambin
se va a aplicar.
Dependiendo de la variabilidad un proceso podra producir productos aceptables,
rechazables o bien provocar el reajuste del propio proceso. Este conocimiento es crtico en
cualquier proceso y continuar siendo crtico en el futuro.
En trminos simples, la inspeccin puede ser vista como el examen de alguna
caracterstica del producto, la cual trata de determinar si se encuentra dentro de los valores
esperados. Para su determinacin debe considerarse el emplazamiento, los mtodos, los
instrumentos y si hay necesidad de realizar historiales.
18
DISAM-UPMT-98-015
Carlos Platero
2.1.1
DISAM-UPMT-98-015
19
Carlos Platero
2.2
20
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
21
Carlos Platero
22
La inspeccin humana es subjetiva. Los SIVA pueden realizar medidas con gran
objetividad y repetitividad.
La inspeccin humana puede ser demasiada lenta. Los SIVA suelen trabajar en
tiempo real respecto al proceso manufacturero.
DISAM-UPMT-98-015
Carlos Platero
2.2.2
DISAM-UPMT-98-015
23
Carlos Platero
24
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
25
Carlos Platero
Implementacin de SIVA
La tabla 2.1 recoge una seleccin de SIVA implementados en la industria actual. En
ella se ven los atributos segn tipo de informacin, mtodo utilizado y geometra de las
superficies.
26
DISAM-UPMT-98-015
Carlos Platero
2.2.5
Aplicacin
Tipo de informacin
Mtodo
Geometra
Referencia
Acero
niveles de grises
caractersticas
plana
Parsy97
Agricultura
color
caractersticas
arbitraria
Poole89
Aluminio
niveles de grises
caractersticas
plana
Plate94
Baldosas
niveles de grises
casamiento
plana
Fern97
Circuito impreso
color
caractersticas
plana
Xie91
Circuito impreso
binaria
casamiento
plana
Ninom92
Fecha de
caducidad
niveles de grises
casamiento
plana
Plate97a
Madera
color
caractersticas
plana
Oulu97
Pasta de papel
niveles de grises
caractersticas
plana
Plate98
Pliego de billetes
niveles de grises
casamiento
plana
Sebas95
Textiles
niveles de grises
caractersticas
plana
Serran95
DISAM-UPMT-98-015
27
Carlos Platero
95, LeCrouest 97), Italia (Florencia 98) y Japn (Tokio 98). Muchos otros sistemas de
inspeccin no han sido ni incluso reportados, probablemente debido a consideraciones de
privacidad.
Coma ya ha sido comentado anteriormente, dos son los problemas generales: las
tcnicas dedicadas a la deteccin de los defectos, y las referentes a la clasificacin de las
faltas. Estas dos problemticas suelen presentarse por separado. Las primeras se
especializan en los algoritmos de procesamiento de imgenes, sobre todo, si son defectos
locales, en el contraste de los defectos, la aplicacin de mscaras, template matching, etc.
son habituales. Por otro lado, est la clasificacin de defectos, que en general parten de un
vector de caractersticas y utilizan tcnicas que van desde sistemas expertos a redes
neuronales, pasando por clasificadores paramtricos y una multitud de procedimientos
especficos. Todas estas tcnicas, tanto las de Procesamiento de imgenes como las de
Reconocimiento de Formas, son expuestas en multitudes de libros, artculos, ponencias,
documentaciones internas as como pginas WWW, mostrando el auge de una
investigacin en alza.
2.3
Conclusiones
Se ha abordado la problemtica de la Inspeccin industrial concluyendo en la
necesidad creciente de insertar las operaciones de inspeccin dentro del proceso
productivo. De las muchas tcnicas empleadas, la inspeccin visual automatizada es una
rama fundamental para esta nueva filosofa, sobre todo para las industrias de materias
primas o sectores que requieren el 100% de la inspeccin. No obstante, las dificultades de
esta tecnologa hacen lenta su evolucin, convirtindose en tema de estudio para muchos
investigadores.
28
DISAM-UPMT-98-015
Carlos Platero
Formacin de imgenes en
Sistemas
de
inspeccin
visual
automatizada (SIVA)
Los SIVA se encuentran con escenas visuales de informacin en el espacio
continuo y sin embargo el desarrollo y diseo de los SIVA se sustenta en tecnologa
digital. Luego se evidencia el paso de informacin continua en el tiempo a discreta. La
captacin de la informacin presente en el espacio continuo, as como la forma en que sta
va a ser alterada, como consecuencia de la transformacin a datos discretos, requiere ser
estudiada con cierta profundidad para comprender las limitaciones de resolucin que
impone el sistema de adquisicin en su conjunto.
Las escenas que aborda esta tesis, consisten en superficies planas, las cuales van a
ser inspeccionadas en la localizacin visual de defectos en el material. La capacidad de
respuesta de los SIVA depender, en un primer paso, de la posibilidad de captar la
informacin del exterior lo ms fiablemente posible. An ms, en esta fase, crucial en el
DISAM-UPM DISAM-UPMT-98-015
29
Carlos Platero
diseo, se requiere reconstruir una visin virtual1 de la escena, que sea consistente con la
realidad puesta delante del sistema de adquisicin.
La transformacin de la realidad en virtual, debe cumplir con los criterios de la
deteccin de los defectos y an ms importante, con la mtrica entre lo real y lo adquirido,
esto es, que si se detecta un defecto, el nmero de pxeles asociados a ste debe ser
proporcional al rea del defecto. As en los casos prcticos utilizados en esta tesis, ha sido
necesario detectar defectos por debajo de 0.04 mm2 en la pasta de papel [Ence94], mientras
en el aluminio colado las faltas ms pequeas eran de 1 mm2[Brite92].
La figura 3.1 muestra un esquema de
adquisicin de escenas visuales de inspeccin
superficial. El motivo es iluminado de manera
ptima, tal que aumente el contraste entre el fondo
y el defecto; la luz reflejada o transmitida pasa a
travs de un sistema ptico, adecuando la escena al
tamao del elemento sensor. El transductor est
constituido por elementos sensores, que convierten
los fotones recibidos en una seal elctrica. La
cmara de estado slido da un formato a la imagen
recibida en seal elctrica, pudiendo ser de tipo Figura 3.1 Elementos constituyentes
digital o analgico. sta es transmitida hasta el de formacin de imagenes en SIVA
computador, ya sea para su monitorizacin o
procesamiento. En el caso de utilizar seal elctrica analgica, se requiere de la conversin
a formato digital. Sea como fuese, se habr generado una correspondencia entre la realidad
y lo almacenado en el computador.
Sistema de
iluminacin
ptica
Movimientos de la banda
Batera de cmaras
Escena
Lnea de inspeccin
El concepto de virtual hace referencia a la aplicacin unvoca entre la informacin visual real y su
representacin almacenada en el computador
30
DISAM-UPMT-98-015
Carlos Platero
cmaras de estado slido (0). Los motivos son que stos representan los elementos ms
crticos en la calidad de la imagen y por ende en la mtrica. Adems son subsistemas
genricos de los SIVA, a diferencia de otros, como el entorno de trabajo, que dependen de
la naturaleza del producto concreto a inspeccionar. Adems tambin se estudiarn los
modelos de comportamiento de las superficies ante la luz (3.2), que junto con los modelos
de fuentes luminosas podrn permitir presentar una metodologa para el diseo del sistema
de iluminacin de los SIVA (3.4). Para acabar se muestran algunos ejemplos de formacin
de imgenes en SIVA documentados (3.5.3).
3.1
Iluminacin
Superficie a inspeccionar
ptica
Sensores
DISAM-UPM DISAM-UPMT-98-015
31
Cmaras
Entorno
Carlos Platero
32
DISAM-UPMT-98-015
Carlos Platero
puede producir profundos cambios en las cmaras desde que se enciende hasta que alcanza
su rgimen permanente. Estos cambios provocan errores en magnitudes de pxeles. Sus
causas se encuentran en las deformaciones mecnicas y en las variaciones en la frecuencia
del reloj, debidos a los cambios de temperatura. Hay casos de multitud de cmaras que
requieren ms de dos horas antes de alcanzar su estado estable [Sanch98].
3.1.1
DISAM-UPM DISAM-UPMT-98-015
33
Carlos Platero
34
DISAM-UPMT-98-015
Carlos Platero
A pesar de ser ste el problema fundamental que produce una prdida significativa
de resolucin espacial al utilizar este tipo de dispositivos, existen otras propiedades en
estos sistemas que originan deformaciones en el tratamiento de la imagen. Idealmente el
fotodetector acta como un convertidor de intensidad ptica a corriente del detector, esto
es, acta como un convertidor de fotones incidentes a electrones recibidos por el
detector[Pratt91][Jain89]. El detector produce una corriente de seal a travs de un filtro
paso bajo, creando una tensin a travs de una carga. La fuente de error ms comn
asociada con los fotodetectores, respecto a la electrnica asociada, consiste en el ruido
trmico resultante de las fluctuaciones de electrones aleatorios en elementos resistivos
dentro del amplificador del sensor. Segn Pratt, el ruido trmico puede ser modelado como
un proceso estocstico normal aditivo, independiente del campo de imagen sensitivo. Un
anlisis ms detallado, requiere del conocimiento de la circuitera del sensor. No obstante,
la corriente de ruido trmico generada se puede modelar como un proceso aleatorio
gaussiano de media cero y varianza dependiente del sensor utilizado.
Por otro lado aun no teniendo en cuenta este ruido trmico generado, la corriente
del fotodectector no tiene un valor verdaderamente constante an cuando la intensidad de
luz incidente sea la misma. Los sensores fotoelctricos exhiben una incertidumbre como
consecuencia de la naturaleza mecnica - cuntica de la luz. A niveles bajos de luz, el
nmero de electrones emitidos por un fotodetector est gobernado por una densidad de
probabilidad de Poisson. La incertidumbre resultante en el conocimiento de la corriente del
detector, se denomina ruido de disparo (shot) en detectores fotoemisivos, y ruido de
generacin recombinacin en conductores fotoconductivos y fotovoltaicos [Reino96]. En
definitiva, el comportamiento de los sensores fotoelctricos es un comportamiento no
lineal, siendo esta no linealidad dependiente de las caractersticas del sensor utilizado.
Adems del efecto de la no linealidad del sensor y del ruido trmico, hay que considerar
las interacciones locales entre elementos adyacentes en el array, que en su conjunto
deforman la informacin recibida.
Por estos motivos, es requerida la modelizacin del comportamiento del plano
sensor, que es realizada mediante lo que se conoce como funcin de extensin puntual
(PSF, Point Spread Function), cuyo anlisis desborda el temario de esta tesis. Esta funcin
refleja las limitaciones del sensor para representar de una forma precisa cada punto sin la
influencia de los vecinos.
Las caractersticas radiomtricas y geomtricas de los sensores de estado slido han
mejorado drsticamente, hasta tal punto, que puede considerarse como el mejor elemento
del sistema de imgenes digitales[Beyer93]. Las prestaciones de los parmetros
radiomtricos, tales como relacin seal ruido (SNR), no-uniformidad de corriente oscura
(DSNU), respuesta fotnica no uniforme (PRNU) son excelentes. Un elemento de
potenciales problemas es el tamao de la superficie y su topografa. Los sensores de gran
tamao son usados para longitudes de onda superiores a los 500 nm [Blouk87]. Mientras,
las diagonales de los sensores estn normalizados a , 1/3, y 2/3. El efecto de la
topografa de la superficie (estructura de las puertas, microlentes) no ha sido investigado
hasta la fecha.
DISAM-UPM DISAM-UPMT-98-015
35
Carlos Platero
Sin embargo, las cmaras por la multitud de componentes que las constituyen,
representan uno de los elementos ms crticos. Algunos de los elementos que inducen a la
degradacin son: la autoganancia (AGC), los filtros paso bajo, correcciones de gamma y
control del iris [Balts92]. La estabilidad mecnica entre el sensor y los elementos pticos,
frecuentemente resulta insuficiente. Slo algunos fabricantes usan la suficiente estabilidad.
Por estos motivos, volver a tratarse la eleccin del tipo de cmara, al resultar ser un
elemento fundamental en la calidad de la imagen.
3.1.1.3 Digitalizadoras
El digitalizador es el ltimo componente fsico presente en el proceso de formacin
de una imagen digital. En este elemento se realizan dos procesos diferentes, la
cuantificacin de la seal y su muestreo. Para comprender los errores que se introducen en
el proceso de formacin de la imagen discreta, como consecuencia nicamente de la accin
del convertidor analgico/digital, se van abordar por separado el proceso de cuantificacin
y el de muestro. Aunque estos dos procesos tienen componentes interrelacionadas, es
bueno considerarlos como separados para estudiar los errores debidos a unos y a otros,
pues simplifica la exposicin.
Los errores de muestreo son originados por no cumplir el teorema de Nyquist,
provocando el efecto de solapamiento en frecuencias o aliasing, llevando consigo una
prdida de informacin en la seal discreta de salida. Para evitar esta falta se recurre a la
utilizacin de filtros anti-aliasing, cuyo inconveniente es la perdida de informacin
correspondiente a las componentes de alta frecuencia. No obstante, las prdidas de
precisin son del orden de 0.08 para casos extremos [Reino96]. De otro lado, en el proceso
de cuantificacin se mejora la precisin al aumentar el nmero de niveles de grises. La
incertidumbre introducida por la cuantificacin de la seal analgica en niveles de grises
implica que las caractersticas geomtricas de los objetos disminuyen con una disminucin
del rango de niveles de grises. Pero hay otros factores que tambin juegan en la
determinacin de resolucin en la digitalizadora. Imgenes con elevado nmero de grises
son ms difciles de tratar computacionalmente, requieren de ms memoria para ser
almacenadas y su procesamiento necesita ms tiempo. Por lo que suelen utilizarse
imgenes con 256 niveles de grises, requisito suficiente para la mayora de las aplicaciones
SIVA.
Otro aspecto a destacar es la sincronizacin entre el digitalizador y la seal enviada
por la cmara. La mayora de los digitalizadores establecen sincronismo de lnea (PLL),
esto es, utilizan una sincronizacin entre el digitalizador y la seal proveniente de la
cmara al comienzo del cuadro, recuperando la prdida de sincronismo en cada lnea. Ello
introduce una inestabilidad posicional de varias centsimas de pixel, es decir, cada lnea se
encuentra desplazada con respecto a su lnea contigua (en el campo) un cierto
valor[Beyer93a]. En cambio, si se usa un muestreo de pixel sncrono, es decir, se establece
lneas de control para muestrear en cada instante el pixel correspondiente, se asegura una
sincronizacin precisa con los datos obtenidos a la salida del digitalizador, presentado una
mayor fiabilidad. Este tipo de transmisin es tan efectiva como la utilizada en cmaras
digitales. Para estos ltimos casos, se puede obtener una precisin de 0.004
pxeles[Beyer93a].
36
DISAM-UPMT-98-015
Carlos Platero
Resumiendo, desde que se tiene la imagen en el entorno que se desee captar, hasta
que se enva a la memoria del computador, sta ha sufrido diversas degradaciones que son
necesarias modelar. La funcin de transferencia ptica (OTF) se encarga de modelar la
componente difuminadora de las lentes, siendo la OTF una medida de la deformacin
producida en la imagen captada como consecuencia de la distorsin geomtrica. La
funcin de extensin puntual (PSF) modela las caractersticas de muestreo espacial por
parte de los fotosensores, encargados de captar la imagen del entorno. El nivel tecnolgico
actual es tan elevado en la fabricacin de estos componentes que las prdidas de precisin
son del orden de magnitud de 1/50 de pixel. De otro lado, las prestaciones de las tarjetas
digitalizadoras son tan variadas como modelos hay en el mercado. Numerosos problemas
tienen las digitalizadoras, tales como prdidas de sincronismo, no linealidades y efectos de
solapamiento en frecuencias (aliasing). La mayora de los factores afectan a la exactitud de
la mtrica, pudiendo provocar errores de hasta 0.5 pxeles. Las diferentes tcnicas de
sincronizacin es uno de los factores ms decisivo. Si se utiliza sincronizacin de lnea el
error va desde 0.5 pixel a 1 pixel, mientras una sincronizacin por pixel reduce el error a
0.05.
Slo queda por resear algunas consideraciones prcticas efectuadas a lo largo del
proceso experimental, como ha sido el uso de lentes de mayor formato que el plano sensor,
utilizando exclusivamente la zona central de la lente, evitando la mayora de las
degradaciones pticas. Conjuntamente a esta accin, se ha tomado imgenes con el iris lo
ms cerrado posible, favoreciendo la concentracin de los rayos sobre el foco. Respecto al
digitalizador y al utilizar cmaras sin capacidad de sincronismo, se han definido drivers
que pudieran sincronizar todo lo ms posible con el pixel, en el sentido de slo muestrear
tanto en horizontal como en vertical por el nmero de pxeles existentes en el plano sensor.
De este estudio preliminar se desprende que, la calidad de la imagen depende, sobre
todo, de una iluminacin eficaz y una eleccin ptima de las cmaras. Por tanto, los
siguientes puntos tratan sobre el realce visual de superficies planas y de cmo determinar
los criterios para una buena seleccin de cmaras atendiendo a la aplicacin en concreto.
3.2
DISAM-UPM DISAM-UPMT-98-015
37
Carlos Platero
38
DISAM-UPMT-98-015
Carlos Platero
I =
d
d
( 3.1 )
Luz incidente
direccin del ngulo cenital i. La relacin entre
n
d
el flujo incidente en la superficie respecto al
rea, define la iluminacin incidente como:
i
dA
Ei =
DISAM-UPM DISAM-UPMT-98-015
di
dA
( 3.2 )
39
Carlos Platero
( 3.3 )
Lr (i r r )
Ei (i )
( 3.4 )
( 3.5 )
Magnitud fsica
Smbolo
Unidad en S.I.
Flujo luminoso
Intensidad luminosa
W sr-1
Iluminacin
W m-2
Radiacin
W m-2 sr-1
40
DISAM-UPMT-98-015
Carlos Platero
superficies lisas al ser iluminadas con un haz incidente, la luz reflejada sobre ellas toma
una sola direccin, en superficies rugosas tienden a difuminarse en mltiples direcciones.
Para establecer con exactitud el fenmeno de la reflexin, es necesario tener un
conocimiento a priori de la estructura de la superficie, es decir, un modelo de stas. Se
pueden catalogar en dos clases: mapas de perfiles y modelos aleatorios. Un exacto perfil
puede ser determinado con las medidas de alturas en cada punto de la superficie, por algn
tipo de dispositivo existente en el mercado. No obstante, este mtodo es caro e
impracticable en muchos casos. Por lo tanto, suele modelarse mediante funciones
bidimensionales de distribucin que tienden aproximarse al verdadero comportamiento de
la superficie ante un haz de luz incidente.
3.2.1.2.1
La altura de la superficie puede ser expresada en funcin de las coordenadas (x, y),
como muestra la figura 3.7. La forma de la superficie es determinada por la funcin de
distribucin de la altura, h. Sea por ejemplo h con distribucin normal, media cero y
varianza h, la funcin de densidad viene dada por:
DISAM-UPM DISAM-UPMT-98-015
41
ph =
Rugosidad de la superficie
h(x,y)
2
1
e (h
2 h
2 2 h
Carlos Platero
( 3.6 )
C = e (
T2
( 3.7 )
42
DISAM-UPMT-98-015
Carlos Platero
Modelo de Phong
kLr
= A + B cos n
cos i
( 3.8 )
DISAM-UPM DISAM-UPMT-98-015
2 2 )
( 3.9 )
43
Carlos Platero
z
n'
i
d
Luz reflejada
i
Considrese
la
geometra
n
dr
mostrada en la Figura 3.8. El rea de
superficie dAS est localizado en el
origen de coordenadas del marco, y la
x
dAs
r
normal a la superficie, n, coincide con
la direccin de z. La fuente luminosa
Modelo de Torrence - Sparrow
se sita en el plano (x-z), y ste es
incidente a la superficie con un ngulo
i. El modelo pretende calcular la
radiacin, Lr, en cualquier direccin
definida por r y r.
Figura 3.8 Relaciones geomtricas del modelo de
Luz incidente
di
Torrence -Sparrow
d 2 i = Li di a f p( )d dAS
( 3.10 )
( 3.11 )
donde
h, v 0 y h + v = 1
44
( 3.12 )
DISAM-UPMT-98-015
Carlos Platero
( 3.13 )
d 2 r
d r dAs cos r
( 3.14 )
( 3.15 )
d r
4 cos i
( 3.16 )
Lr = k
k=
3.2.1.4.3
( 3.17 )
Modelo de Lambert
DISAM-UPM DISAM-UPMT-98-015
45
Carlos Platero
( 3.18 )
( 3.19 )
( 3.20 )
d i
dAs
( 3.21 )
46
DISAM-UPMT-98-015
Carlos Platero
Lr = k dif Li d i cos i
( 3.22 )
Lente
dAs
3.2.1.5.1
Modelo de Beckmann-Spizzichino
R0
im
dA cos
dAS = im
cos r
z
f
( 3.23 )
dAim coincidir con el rea del elemento bsico del sensor (pixel). Si dAim es
constante para un sensor dado, dAs est determinado por su geometra y por el tamao del
pixel. Todos los rayos luminosos radiados por dAS, que son incidentes dentro del rea de la
lente, dAl, son proyectados dentro del rea de la imagen, dAim. Luego, el ngulo slido de
la radiacin reflejada, dr, cuando es visto desde dAS quedar como:
d r =
dAl cos
R02
( 3.24 )
El flujo reflejado, dr, es la energa de luz recibida por el rea de la lente. Haciendo
uso del vector complejo de Poynting, S, para definir el campo electromagntico descrito
por una onda, se tiene:
DISAM-UPM DISAM-UPMT-98-015
47
Carlos Platero
S = ExH
( 3.25 )
donde E representa la intensidad del campo elctrico (no confundir ahora con la
iluminacin, tambin llamada E) y H la intensidad del campo magntico. Siendo la parte
real de S la que define el valor medio de energa emitida por unidad de rea, cuya
dimensin ser vatio por metro cuadrado:
S a = Re[S ] =
1
Re[ExH ]
2
( 3.26 )
( 3.27 )
el valor medio del flujo de energa por unidad de rea est definido por
Sa =
1 2 1
E =
H
2
2
( 3.28 )
2
E 2 A 2 cos 2
T 2 D 2
E = 01 2 2 i e g 02 +
A
R0
g m v 2xy T 2 / 4 m
m =1 m! m
( 3.29 )
donde
48
DISAM-UPMT-98-015
Carlos Platero
(v , v
x
g = 2 h (cos i + cos r )
o = sinc(v x Ax )sinc(v y Ay )
D=
v xy = v x2 + v y2
( 3.30 )
1 2
E dAl cos
2
( 3.31 )
2 2
1 R0 f E
Lr =
2 z 2 dAim cos
( 3.32 )
L r =
2
2
2
E 01 cos i g z dA pixel cos 2 T 2 D 2
0 +
e
2
f
cos r
2 2
cos
r
g m v xy2 T 2 / 4
e
m =1 m! m
( 3.33 )
DISAM-UPM DISAM-UPMT-98-015
49
Carlos Platero
Lr (lisas ) =
Lr ( rugosas ) =
2
2
2
E 01 cos i g z dApixel cos 2 T 2 D 2 g v xy2 T 2 / 4
0 +
e
e
(g << 1)
f cos 2 r
22
cos
r
2
2
2 2
vxy2 T 2
E 01 cos iT D
exp 2 2
22 cos r
4v z h
(g >> 1)
( 3.34 )
50
i +
Csl ( 2
e
r
2 2
) + C ( ) ( )
ss
i
r
r
( 3. 35)
DISAM-UPMT-98-015
Carlos Platero
Sensor
Manantial
r
Luz incidente
n
i
Halo difuso
Pico especular
i
Halo especular
DISAM-UPM DISAM-UPMT-98-015
51
Carlos Platero
El haz especular tiende a concentrarse, a medida que la superficie sea cada vez
ms lisa, h / < 1.5, y/o bien cuando el halo especular se concentra debido a
que la superficie es suavemente ondulada, h / T < 0.025.
Modelo de la cmara
Cmara
Superficie a
inspeccionar
A0
Asensor
R1
R2
Apixel
Lente
AS
A0
AS At I
R12
( 3.36 )
nsen sor = Lr
A0
AS A Ot I
R22
( 3.37 )
52
DISAM-UPMT-98-015
Carlos Platero
Apixel
Asen sor
( 3.38 )
R12
R22
( 3.39 )
( 3.40 )
A0 Apixel
f (1 + M 0 )
2
A Ot I
( 3.41 )
Lr Apixel
A Ot I
4 F 2 (1 + M 0 )2
( 3.42 )
n pe = Rr ( )n pixel ( , TIlum )d
1
n pe = Rr ( )
1
Lr ( , TIlum )Apixel
A ( ) O ( )t I d
4 F 2 (1 + M 0 )2
( 3.43 )
DISAM-UPM DISAM-UPMT-98-015
53
3.3
Carlos Platero
x
Lnea (superficie
z0
E (x, y ) = I k Ek ( x, y )
k =1
( 3.44 )
54
DISAM-UPMT-98-015
Carlos Platero
1
= IE (x0 )
z 02
( 3.45 )
3/ 2
= IE(x )
( 3.46 )
E ' ( x)
E ' ( x0 )
( 3.47 )
3/ 2
( 3.48 )
DISAM-UPM DISAM-UPMT-98-015
55
Carlos Platero
( 3.49 )
es fcilmente entendible al suponer que el rea est constituido por infinitos puntos
luminosos y la aportacin luminosa en cada punto a de la superficie ser la misma.
z
y
superficie
superficie
x
iluminacin
iluminacin
z 03
((x x )
+ z 02
3/ 2
( 3.50 )
z03
((x x ) + (y y ) + z )
2
56
2 3/ 2
0
( 3.51 )
DISAM-UPMT-98-015
Carlos Platero
2 R 2 + z02
3/ 2
1/ 2
( )
e m
( 3.52 )
donde
r = x2 + y2
m=
1/ 2
4 Rr
R + z + r 2 + 2 Rr
2
2
0
( )
e m = 1 m sen 2 d
( 3.53 )
z
z
y
superficie
y
superficie
x
(x,y)
iluminacin
iluminacin
R
P(x0, y0, z0)
P(x0,y0,z0)
DISAM-UPM DISAM-UPMT-98-015
57
Carlos Platero
de Taylor alrededor del plano referencia. Para un punto cerca del origen,(x,y), la
iluminacin total ser:
E (x, y ) = E (x0 , y0 ) +
E
E
x +
y + ...
x x = x0
y y = y 0
( 3.54 )
3.4
3.4.1
58
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPM DISAM-UPMT-98-015
59
Carlos Platero
Manantial
Luz incidente
Sensor
n
i
3.4.2
60
DISAM-UPMT-98-015
Carlos Platero
puede estar constituido el sistema de iluminacin para el SIVA y cules deben ser sus
caractersticas esenciales para la formacin de la imagen.
Pues bien, la primera caracterstica del sistema de iluminacin para este SIVA debe
ser que tiene que fundamentarse en iluminacin transmitida. Adems por la arquitectura
que va a ser presentada, la superficie de inspeccin se ha dividido en cuatro regiones
complementarias, con el motivo de disminuir los tiempos de inspeccin por cada pliego de
papel. Su argumentacin ser dada en el captulo 7. Esta matizacin implica que en vez de
un nico escenario SIVA, se va a tener cuatro escenarios independientes pero
complementarios. Por lo que cada escenario estar constituido por un foco luminoso, un
trozo de superficie a inspeccionar y una cmara. De forma que los cuatro escenarios,
adyacentes entre s, cubran en su totalidad la superficie a inspeccionar que marca la norma.
Una vez definidos los requisitos bsicos, se plantea a continuacin cules deben ser
los objetivos del sistema de iluminacin. Como se ha comentado en este captulo, el
sistema de iluminacin intentar trivializar todo lo posible el anlisis de las imgenes.
Atendiendo a esta premisa, se pretender que la informacin luminosa que le llega al plano
sensor de la cmara sea debida exclusivamente a la textura de la superficie. Adems deber
exigirse que los datos captados por la cmara tengan la suficiente capacidad como para
poder discernir qu es defecto y qu no lo es. Para poder cumplir con el primer objetivo,
ser necesario que la iluminacin sobre la superficie a inspeccionar sea uniforme en el
campo visual de la cmara. Y en cuanto al segundo requisito, habr de buscar el foco
luminoso que tenga la conveniente potencia lumnica como para poder captar los
suficientes fotones recibidos por el sensor durante el tiempo de integracin de la cmara.
El primer objetivo va a depender de la disposicin fsica de los elementos del
escenario SIVA, esto es, se va a tratar sobre la localizacin ptima del foco, la superficie y
la cmara. En cuanto al segundo punto, resulta un problema de la eleccin de la tecnologa
a emplear tanto del tipo de foco como de
cmara. Por lo que se abordar en estos
momentos la ubicacin correcta de los
elementos, sin entrar en cules deberan ser
sus caractersticas tcnicas, de las que sern
comentadas en el mencionado captulo 7.
3.4.2.1 Disposicin ptima de los
focos luminosos respecto a la
superficie a inspeccionar
Debido al tamao de los defectos a
localizar y al tipo de sensor empleado, el
escenario SIVA tiene una dimensin de 73
mm por 48 mm. Esta superficie es la captada
por la cmara cada vez que toma una Figura 3.21 Diposicin geomtrica de los
imagen, su justificacin viene avalada por focos
las dimensiones de las faltas y por el tipo de arquitectura de sensores empleados (ver
3.5.2). Por ese motivo se hizo uso de focos luminosos puntuales, capaces tecnolgicamente
DISAM-UPM DISAM-UPMT-98-015
61
Carlos Platero
de mantener una iluminacin cuasi uniforme en esta superficie. De otro lado, por las
estrategias de inspeccin sobre el pliego de pasta de papel, los susodichos focos estn
separados de entre s 292 mm y 240 mm ( ver figura 3.21 ). Adems, se tiene que las
fuentes de luz estn situadas en el mismo eje que las cmaras (transversal al papel), con la
intencin de aprovechar al mximo la uniformidad del foco puntual y su mxima potencia.
En la figura 3.21 se muestra las disposiciones mencionadas y las separaciones entre los
focos, la superficie y las cmaras. De esta manera,
se ha hecho una descripcin del modelo de
iluminacin empleado, el cual podr ser simulado
mediante las expresiones vistas en 3.3. Para una
variacin de uniformidad de luz de un 2% en el
escenario SIVA, segn el modelo expresado en (
3.51 ), el foco deber estar situado a una distancia
de 640 mm respecto al papel. La figura 3.23
muestra los resultados de la simulacin de la
radiacin incidente en el rea de inspeccin. Los
resultados de la simulacin muestran que la
iluminacin con un solo foco es totalmente
satisfactoria, pero que existen acoplamientos
lumnicos como consecuencia de la proximidad
Figura 3.22 Distancia entre focos,
existente entre ellos, eliminando la propiedad de
superficie y cmaras
uniformidad en la radiacin luminosa incidente en
la superficie del papel. Por lo que obligar a
buscar algn remedio que evite las interferencias entre los diferentes focos. El mtodo
empleado consiste en insertar cuerpos negros con el objeto de evitar la conexin entre
focos, a la vez que se disminuya todo lo posible la radiacin reflejada de estos cuerpos.
Pero antes de entrar en su anlisis, se van a contrastar los resultados de la simulacin con
las observaciones experimentales.
62
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPM DISAM-UPMT-98-015
63
Carlos Platero
64
DISAM-UPMT-98-015
Carlos Platero
calculado los resultados de aplicar esta teora para dos, cinco y siete puntos luminosos
distribuidos segn muestra la figura 3.26.
A cada punto luminoso le corresponde una fuente cuya intensidad es igual al
resultado de dividir la intensidad total por el nmero de puntos luminosos usados en la
distribucin. Los resultados obtenidos son decepcionantes, ya que apenas hay diferencia
con la simulacin de aplicar un solo punto luminoso. La debilidad de los resultados viene
motivada por no considerar sus direcciones privilegiadas de radiacin, al haber repartido
los focos homogneamente en la superficie de radiacin.
3.4.2.4 Modelo mediante funcin ponderacin
Como se ha comentado anteriormente, una
forma de reproducir la cada tan fuerte de la
luminosidad conforme se aleja del eje de mxima
radiacin del foco es utilizar funciones que
tiendan a 0 para ngulos cercanos a los 90. Las
funciones ms triviales que cumplen esta
caracterstica son el conjunto de cosn. Al tener
un parmetro indeterminado, permite tener un
grado de libertad capaz de elegir aqul que ms se
aproxime la curva real con la terica. Para elegir
Figura 3.27 Geometra entre foco y
dicho valor se ha utilizado una funcin de coste
superficie
basada en el sumatorio de las distancias entre la
curva real y la terica. Y a esta funcin se ha
buscado el mnimo, determinando el valor de n. El algoritmo queda as establecido:
m
min J = E P* ,i ( x, y ) ET* ,i ( x, y )
i =1
r 2 cos n r02 + n
ET* ,i ( x, y ) = 0 2
= 2+ n
r
r
)
2
( 3.55 )
n i =1
=0
m *
ET* ,i ( x, y )
E , ( x, y ) E * , ( x, y )
= 0
T i
i =1 P i
n
( 3.56 )
DISAM-UPM DISAM-UPMT-98-015
65
m *
r 2+ n
E P ,i ( x, y ) 0
i =1
r 2+ n
r02 + n
r
2 + n log 0
r
r
= 0
Carlos Platero
( 3.57 )
22,19
19,92
20,05
19,93
Mostrando que el valor de n es slido y que slo depende de la naturaleza del foco
utilizado. Obsrvese que para n = 20, el modelo
terico se ajusta bien al caso real ( ver figura
3.28). Por ltimo, para aclarar lo expuesto se
muestra un resumen de las distribuciones
lumnicas y un corte transversal en el eje y para
apreciar mejor las diferencias. Para mayores
detalles sobre los experimentos ver el trabajo de
Garca [Garci98].
66
DISAM-UPMT-98-015
Carlos Platero
Figura 3.29 Diferencias entre los resultados experimentales y los obtenidos con los
diferentes modelos
DISAM-UPM DISAM-UPMT-98-015
67
Carlos Platero
68
DISAM-UPMT-98-015
Carlos Platero
E ( x, z ) =
Iy 0
I cos 1
=
2
2
r1
x + y 02 + z 2
3/ 2
( 3.58 )
z
superficie a inspeccionar
x1,y1,z0
r2
z0
r1
x,y0,z
x
y
y0
pantalla lumnica
de
las
E ( x1 , y1 ) = Ik dif
i =1
dS
r22,i ( 3.59 )
DISAM-UPM DISAM-UPMT-98-015
69
y 0 ,i
E ( x1 , y1 ) = Ik dif
i =1 x , z
(x
x 0 ,i
Ik dif
i =1 y , z
(x
+ y 02,i + z
2
0 ,i
+ y2 + z
z0 z
) ((x
Carlos Platero
2
1 x ) + (y1 y 0 ,i ) + z
2 3/ 2
) ((x
2 3/ 2
z0 z
x 0,i
) + (y
2
y) + z
2
3/ 2
2 3/ 2
dxdz +
dydz +
( 3.60 )
donde y0,i y x0,i son las distancias entre las pantallas y el foco, junto con z0 que
representa la separacin entre la superficie de inspeccin y el foco. Si se analiza el
desarrollo de Taylor sobre la radiacin reflejada de un par de pantallas para un dS, quedar
los trminos de primer y segundo orden como:
y (z z )( y y 0 a )
y (z z )( y + y 0 b )
E ( x1 , y1 )
= 3 0 a 0 3 5 1
3 0b 0 3 5 1
y1
r1a r2 a
r1a r2 a
y (z z )( y y 0 a )
y (z z )
2 E ( x1 , y1 )
= 15 0 a 0 3 7 1
3 0a 3 0 5
2
r1a r2 a
r1a r2 a
y1
2
y (z z )( y + y 0b )
y (y + y )
+ 15 0 a 0 3 7 1
3 0 b 31 5 0 b
r1a r2 a
r1a r2 a
2
( 3.61 )
La condicin de uniformidad exigir que la separacin a pares de las pantallas
sean idnticas, ya que esta condicin tender a cancelar todos los trminos excepto el de
orden cero. Si en ( 3.61 ) se hace y0a = y0b, las primeras derivadas se anulan en la normal al
foco.
70
DISAM-UPMT-98-015
Carlos Platero
Por ltimo quedar comparar los resultados experimentales con los conseguidos por
el modelo. Respecto a los valores medidos, stos se obtendrn de la resta entre los
evaluados para un foco con el paraleleppedo y sin l. Se observa en primer lugar, que el
efecto de la reflexin es de un orden de magnitud menor que la radiacin incidente de la
fuente. Tambin es destacable cmo algunos valores se hacen negativos, lo cual no es
posible, lo que indica una falta de precisin en las medidas tomadas como consecuencia de
la baja precisin del luxmetro utilizado. En tercer lugar, se observa el nivel de
discrepancia entre los valores medidos de
reflexin y el modelo terico obtenido de ( 3.60
). Y por ltimo, se ha observado empricamente
que el aironfix tiene menor coeficiente de
reflexin. No obstante, se ha utilizado la pintura
mate en el recubrimiento del paraleleppedo,
pues el aironfix es ms receptivo de absorber
polvo, lo que hara decrecer sus propiedades de
cuerpo opaco con el paso del tiempo. El
resultado conseguido es que la informacin
recibida por el sensor slo se debe a la textura del
papel y no a la intensidad luminosa recibida, esto
Figura 3.34 Discrepancia entre el
es, que la distribucin del histograma de la
modelo terico y los valores medidos
imagen se debe slo a la constitucin del material
ante una radiacin luminosa transmitida, siendo
esta ltima de igual valor en todos los puntos del espacio de medida.
71
3.5
Carlos Platero
3.5.1
Cmaras lineales
detectores
Registro de desplazamiento
a)
Registro de desplazamiento
72
detectores
Registro de desplazamiento
b)
DISAM-UPMT-98-015
Carlos Platero
ste tambin es sensible a la luz, se cubre con una capa protectora. No obstante, el tamao
total del pixel est limitado por la puerta de control. As en un sistema de dos fases de
transferencias de carga, esto es, dos seales desfasadas, V1 y V2, que son utilizadas para
transferir las cargas desde los fotosensores al registro de lectura mediante el efecto CCD
(como se observa en la figura 3.38), la anchura del pixel depende del ancho de la puerta (el
lector puede encontrar bibliografa variada en torno a las transferencias de carga y la
estructura misma de los CCD, por ejemplo [Holst96] ). En el ejemplo de la ilustracin, se
ve que el pixel debe ser de dos veces la anchura de una puerta, es decir, el tipo de
transferencia de las cargas impone el tamao del pixel. Por eso, con el objeto de aumentar
el nmero de pxeles e incrementar la resolucin, se puede reducir el ancho del pixel
V1
V2
Puerta
Pixel
Pixel
T1
Carga
T2
T3
T4
mediante un doble registro (Figura 3.36b). Pudindose en este caso doblar la resolucin de
la cmara lineal.
3.5.1.1.2
Cmaras entrelazada
Fotodiodos
DISAM-UPM DISAM-UPMT-98-015
Registro de
desplazamiento vertical
Fotodiodos
73
Carlos Platero
a+b
b+c
c+d
}
}
La ventaja del formato entrelazado es
que permite disminuir los anchos de banda,
manteniendo una consistencia debida a la
inercia de la retina humana. El hecho de
transmitir en dos campos las lneas pares e
impares, ha provocado que los diseadores de Figura 3.40 Video entrelazado y seudocmaras CCD entrelazadas hayan aprovechado entrelazado
este evento, como para hacer arquitecturas que
comparten los recursos de lectura entre las lneas, obligando a que los tiempos de
integracin no coincidan entre lneas pares e impares. Este motivo obliga a detener la
escena, al menos durante el tiempo necesario para la adquisicin de la imagen, lo que
supone un inconveniente grave.
74
DISAM-UPMT-98-015
Carlos Platero
3.5.1.1.3
Cmaras progresivas
Transferencia entrelazada
V1 V2 V3 V4
Transferencia progresiva
Cmaras TDI
Por ltimo, las cmaras TDI (TimeDelay and Integration) han representado una
pequea revolucin en el campo de la inspeccin de superficies continuas. TDI implica los
conceptos de mltiples exposiciones del objeto ante la cmara y su posterior suma. La
conjuncin de desplazamientos automticos de las cargas, de un detector a otro, junto con
los tiempos de exposicin, producen mltiples imgenes. La figura 3.44 muestra el efecto
TDI. La lente de la cmara invierte el movimiento del objeto, recorriendo la matriz de
detectores, mientras las cargas de un sensor a otro son desplazadas a la misma velocidad.
DISAM-UPM DISAM-UPMT-98-015
75
Carlos Platero
Cmara TDI
Elementos TDI
T2
T1
Movimientos de la banda
Lneas de inspeccin
T4
T3
Para entender el modo de operar de una cmara TDI, se sigue la figura 3.43. En el
tiempo T1, la imagen se sita en el primer detector y crea una carga. Llegado el tiempo T2,
la imagen se ha desplazado al segundo detector. Simultneamente, el reloj del pixel ha
movido la carga del primero al segundo. En este punto, se crea una imagen formada por la
carga anterior aadindose la nueva creada en el segundo detector, y as sucesivamente. La
carga (seal) se incrementa linealmente con el nmero de detectores, tambin lo hace el
ruido pero no proporcionalmente sino con la raz cuadrada del nmero de elementos TDI,
NTDI[Holst96]. El resultado es una mejora de la relacin seal ruido en NTDI . No
obstante, existe un lmite mximo de elementos TDI que puedan ser utilizados. Es evidente
que una prdida de sincronismo afecta negativamente en la MTF de la cmara. La
exactitud en el conocimiento de la velocidad de la imagen, es la que limita el nmero de
TDI que van a ser usados en cada etapa de mltiples exposiciones.
3.5.1.2 Resolucin
Una de las caractersticas ms importantes dentro de las cmaras de estado slido es
la resolucin. La resolucin puede referirse tanto al nmero de pxeles contenidos en la
matriz sensorial, como al nmero de lneas de televisin producidas. Las lneas de
televisin es un viejo estndar que permaneci durante la primera expansin de cmaras de
tubo de vaco. Este estndar se encuentra en desuso, aunque suele estar presente en muchos
catlogos de productos referidos a cmaras. Las lneas de televisin se refieren a la
frecuencia en que una imagen es dividida por un modelo peridico. A este respecto, las
lneas televisin corresponden con el sistema de visualizacin, en comparacin al detector
que hace referencia al nmero de pxeles en filas y columnas.
76
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPM DISAM-UPMT-98-015
77
Carlos Platero
puede ser una buena solucin. Estas cmaras que llevan incorporado el obturador, impiden
la acumulacin de cargas filtrando las mismas dentro del substrato detector segn varios y
diferentes mtodos. La velocidad de estos obturadores vara entre 1/60 segundos y 100
microsegundos para aplicaciones que requieran las ms altas velocidades. Las cmaras con
obturador electrnico contienen adems un cristal con un liquido ferroelctrico para
proveer del mecanismo del obturador. Este cristal lquido est localizado justo detrs de las
lentes.
En algunas aplicaciones es necesario que la cmara se pueda disparar
(reseteable), esto es, que la acumulacin de la carga pueda ser eliminada de manera
asncrona. Su origen viene dado por la necesidad de adquirir la imagen tras efectuarse un
evento, lo cual se determina, normalmente, por una seal de disparo, provocada por el
sistema, el cual enva una seal de reset para que la cmara pueda adquirir una imagen ante
el suceso.
Como se ha indicado, a veces la aplicacin requiere de una disminucin del tiempo
de integracin, pero ello obligar a aumentar la potencia luminosa, con el objeto de
mantener el suficiente rango dinmico en la seal de video.
3.5.1.5 Seal de ruido
La relacin seal/ruido, SNR, indica la proporcin de potencia entre una seal y la
cantidad de ruido presente en sta, esto es, muestra la proporcin de energa de una seal
que puede ser considerada til, lo que viene a significar que a menor SNR, menos til es la
seal. Este aspecto est ntimamente relacionado con la discusin de la MTF.
La mayora de las cmaras de estado slido CCD tienen alta relacin seal/ruido,
tpicamente oscilan entre 45 dB y 65 dB, que es prcticamente la ausencia de ruido para la
mayora de las aplicaciones. La relacin seal/ruido depende enormemente de algunos
factores tales como la temperatura, el contraste, la longitud de onda y la intensidad de
luminosidad.
3.5.1.6 Respuesta del espectro
La respuesta espectral de una cmara se refiere a la regin del espectro
electromagntico en el que una cmara es sensible. Por ejemplo, el ojo humano tiene una
respuesta mxima espectral entre la regin del azul y el verde del espectro visible. Las
cmaras de estado slidos son sensibles en un rango de 200 nm a 1100nm. La mxima
respuesta se encuentra en torno a los 800 nm de longitud de onda, la cual se encuentra
cerca del final de la zona infrarroja del espectro. sta es la causa por la que la mayora de
las cmaras de estado slido vienen con un filtro IR incorporado. De otro lado, la respuesta
espectral difiere enormemente de un comportamiento ideal, pues dependiendo de cada
longitud de onda su ganancia vara, esto es, la respuesta es altamente no lineal. El tipo de
aplicacin y en particular el sistema de iluminacin, obligar a una seleccin de cmara
atendiendo a su respuesta espectral.
78
DISAM-UPMT-98-015
Carlos Platero
3.5.1.7 MTF
La funcin de transferencia de modulacin (Modulation Transfer Function) es una
medida de cmo el sistema de imagen es capaz de reproducir con fidelidad la escena
adquirida. Matemticamente, representa el mdulo del valor complejo de la funcin de
transferencia ptica (OTF), por tanto representa la ganancia del sistema ptico para cada
frecuencia, es evidente que la MTF carece de informacin sobre el nivel de intensidad de la
seal.
La MTF es calibrada generalmente entre el contraste en la salida respecto a la
cantidad de lneas por milmetro visibles que se pueden obtener. La MTF de una cmara
puede ser medida de diferentes formas, siendo una de las ms comunes aquella que
determina cmo recoge una cmara unas series de pares de lneas blancas y negras de
frecuencia variable. La medida se determina con el nivel de tensin producido por la
cmara al ver los pares de lneas blancas y negras. Obsrvese que al hablar sobre la OTF,
no slo se trata a la cmara, sino a la conjuncin de elementos de captacin, es decir,
ptica, detector, transmisin y adquisicin.
3.5.1.8 Entorno
Quizs uno de los aspectos ms importantes, que hay que considerar en la eleccin
de una cmara de estado slido, para una aplicacin de inspeccin, es el entorno donde la
cmara va a operar. A este respecto, tendr poco sentido elegir una cmara con todas las
caractersticas correctas si la cmara no soporta el ambiente de trabajo. Los factores del
entorno como temperaturas, vibraciones, contaminantes en el ambiente, etc. necesitan ser
estudiados para saber qu cmara es la que se adapta mejor a estos ambientes. En algunos
casos se hace necesario el encapsulado apropiado de las cmaras para protegerlas.
Algunos fabricantes suelen ofrecer sus cmaras con encapsulamientos especiales
para incrementar su resistencia a todos estos factores que han sido mencionados. Por
ejemplo, Peafiel et al[Peaf94] utilizan cmaras protegidas contra la radiacin, para la
inspeccin de intercambiadores de calor en centrales nucleares.
3.5.1.9 Coste
En trminos generales y para una misma arquitectura de array, las cmaras con
mayor nmero de pxeles poseen precios ms altos. Lo que s se puede tener en cuenta a la
hora de comprar una cmara son algunas apreciaciones o alternativas. Por ejemplo, si se
necesita alta resolucin, puede ser ms barato usar varias cmaras de baja resolucin que
solamente una cmara con una muy alta resolucin. Frecuentemente no hay una nica
solucin para una determinada aplicacin, lo que permite una cierta flexibilidad en la
eleccin de la cmara.
DISAM-UPM DISAM-UPMT-98-015
79
3.5.2
Carlos Platero
Campo de visin
Superficie iluminada
cuasi uniforme
Focos luminoso
Figura 3.45
inspeccin
80
Campo
visual
de
DISAM-UPMT-98-015
Carlos Platero
si se divide 50 mm entre 4.5 mm, se obtienen los aumentos necesarios de 11X. Esta
informacin puede ser usada despus para identificar las lentes necesarias para la cmara
seleccionada.
En el caso de obtener una resolucin elevada, se puede optar por dos soluciones. Si
es posible parar la escena, puede resultar ser ms ventajoso utilizar varias cmaras de baja
resolucin en lugar de una de alta resolucin, pues se consigue disminuir anchos de banda
puntuales y resulta ser una solucin ms econmica. Si la escena no se puede detener y el
nmero de detectores a utilizar es elevado, bien porque la arquitectura de iluminacin slo
permite iluminar uniformemente una estrecha banda, o bien porque se quiere cubrir el
ancho de la banda del material a inspeccionar, las cmaras lineales y TDI son las ms
apropiadas. Estas cmaras tienen la ventaja de poner decenas de miles de pxeles en lnea,
cubriendo toda la cubierta de la superficie y con una resolucin muy alta. La adquisicin
de una sola lnea permite un ancho de banda razonable, aun con centenas de miles de
detectores. Por otro lado, las altas velocidades hacen que los tiempos de exposicin sean
muy pequeos, obligando a aumentar la intensidad luminosa. Esta consecuencia, puede ser
disminuida con cmaras TDI, siendo la ms utilizada en inspeccin de superficies
continuas en lnea.
2.- Es estacionaria la superficie ? La respuesta a esta pregunta determinar el uso
de iluminacin especial y el tipo de arquitectura de las cmaras. El propsito de usar
iluminacin especial, como pueden ser luces estroboscpicas, o la obturacin automtica,
es congelar el movimiento de un objeto para eliminar las manchas producidas por el
movimiento de la imagen. Hay que tener en cuenta que, una cmara cunto ms rpido se
obture ms luz se necesita. Esto es debido a que la cmara tiene menos tiempo para
acumular fotones.
Para superficies continuas de alta velocidad, como la produccin de
acero[Domin94], los tiempos de integracin son muy pequeos, por lo que se requiere gran
intensidad luminosa. Como ha sido comentado, las cmaras TDI son la solucin, pues
permiten aumentar el rango dinmico a consecuencia de la suma de cargas en elementos
TDI. Si la resolucin es media y es posible conseguir iluminacin uniforme en el campo de
visin, las cmaras progresivas pueden ser empleadas. Y para baja resolucin, cmaras
entrelazadas con integracin por campo y sub-muestreo en la seal de vdeo, pueden ser
elegidas por su bajo costo y formato de salida estndar. Obsrvese que emplear integracin
por campo en vez de por cuadro, permite a la imagen mayor continuidad y por ende mayor
MTF. Si se hubiera utilizado integracin por cuadro con sub-muestreo, al ver slo un
bloque de lneas, pares o impares, se apreciara una discontinuidad en la imagen y por tanto
degenerar su calidad.
DISAM-UPM DISAM-UPMT-98-015
81
Carlos Platero
Las figuras 3.46 y 3.47 muestran las dos arquitecturas bsicas de inspeccin
superficial, la primera basada en cmaras matriciales y la segunda en lineales.
Sistema de
iluminacin
Batera de cmaras
matriciales
Movimientos de la banda
rea de inspeccin
Sistema de
iluminacin
Batera de cmaras
lineales
Movimientos de la banda
Lnea de inspeccin
82
DISAM-UPMT-98-015
Carlos Platero
Para terminar, la figura 3.48 presenta un flujograma, a modo de resumen, que pueda
ayudar en la seleccin de la cmara ante una tarea de inspeccin superficial. La primera
divisin que se observa, es si la superficie est en reposo o en movimiento. Para superficies
Seleccin de cmaras
para inspeccin superficial
movimiento
esttica
La superficie est ...
media
alta
Cmaras entrelazadas
Iluminacin constante
continua
discreta
resolucin
La superficie es...
muestro
Cmaras lineales
total
La inspeccin es...
rpida
continuo
Paso a paso
Cmaras entrelazadas
Iluminacin constante
baja
La velocidad es...
Cmaras matriciales,
parar movimiento
Iluminacin constante
El movimiento es...
Muy
rpida
alta
resolucin
Cmaras lineales
media
Cmaras TDI
Cmaras entrelazada
Integracin por campo
Cmaras progresiva
Cmaras lineales
o TDI
estticas depender del tipo de resolucin, ya que como se ha visto, un nmero elevado de
pxeles obligar a hacer uso de cmaras lineales. Cuando la superficie est en movimiento
y sta es continua, caso del acero, el aluminio, etc., con el objetivo de cubrir todo el ancho
de las bandas es necesario recurrir a cmaras lineales o ltimamente a cmaras TDI. La
diferencia entre una y otra est en la sincronizacin de velocidad del proceso, una mejora
de la relacin seal-ruido y que necesita menos intensidad luminosa la segunda respecto a
la primera.
Para el caso de inspeccin basada en muestreo, si se permite parar la imagen
durante el tiempo de adquisicin, se puede utilizar cmaras entrelazadas y si hay
movimiento cmaras progresivas.
Para superficies discretas y con desplazamiento paso a paso, es decir, exposicin
del material sobre las cmaras y retirada, caso de inspeccin de baldosas[Fernn97a] o
billetes de banco[Sebas95], se puede emplear cmaras entrelazadas. Mientras para
productos que se mueven continuamente, por ejemplo la inspeccin de etiquetas sobre
DISAM-UPM DISAM-UPMT-98-015
83
Carlos Platero
Tipo de inspeccin
(superf./veloc.)
Iluminacin
Arquitectura de
cmaras
Referencia
Acero
en lnea, alta
velocidad (15m/s)
Uniforme controlada
Cmara lineal de
2048 pxeles
[Domin94]
Aluminio
colado
en lnea, baja
velocidad (2m/min)
Cmaras matriciales
entrelazadas, 4
cmaras por cada
cara
[Plate94]
Baldosas
Batera de cmaras
progresivas de
512x512
[Ferna97a]
Billetes de
banco
Batera de cmaras
entrelazadas 768x571
[Sebas95]
Etiquetas
farmacuticas
discreta, continua y
media velocidad
Integracin por
campo
[Plate97a]
Genrico
(acero,
plstico,
madera)
En lnea, continuo y
en movimiento
1 o 2 lseres de 780nm
Cmaras lineales
[Intec93a]
Genrico
(productos
continuos)
En lnea, continuo y
en movimiento
Luces estroboscpicas
Bateras de cmaras
entrelazadas,
510x485
[Aero93]
Pasta de papel,
mtodo ENCE
Muestro
Cuatro cmaras
entrelazadas,
500x576
[Plate98]
Pasta de papel,
mtodo TAPI
Muestro
Cmaras lineales
[Intec93b]
84
DISAM-UPMT-98-015
Carlos Platero
3.6
Pelculas
En lnea
Batera de cmaras
TDI
[Rober93]
Planchas
metlicas
galvanizadas
En lnea
Cmara lineal de
2048 pxeles
[Macai93]
Textiles
Muestro
Fluorescente. Componente
reflejada
Entrelazada 768x756
[Serran95]
Conclusiones
En este captulo se han analizado los factores que intervienen en la adquisicin de
imgenes digitales, siendo los ms importantes la iluminacin, los elementos pticos, los
sensores y las tarjetas de adquisicin. Adems, se indica que dependiendo de la mtrica
requerida, se necesita considerar ms o menos elementos a tener en cuenta para el diseo
del sistema de adquisicin de imgenes. Por el nivel tecnolgico y las prestaciones
requeridas para los SIVA implementados, slo se ha abordado el diseo del sistema de
iluminacin y la eleccin de cmaras de estado slido.
Para el diseo del sistema de iluminacin se precisa del estudio sobre el
comportamiento de las superficies ante la radiacin luminosa, exponindose los diferentes
modelos existentes, as como indicando la validez de cada uno de ellos. Adems tambin
se pasa al anlisis de las fuentes luminosas, indicando sus caractersticas y las ecuaciones
de comportamiento. Por otro lado, y en trminos generales, se suele requerir una
iluminacin uniforme en el escenario SIVA, con tal propsito es necesario conseguir la
expresin analtica de la radiacin incidente en la superficie a inspeccionar, para a rengln
seguido buscar las condiciones geomtricas que intenten anular los trminos de primer
orden y superior del desarrollo de Taylor.
Tambin se ha presento una metodologa para el diseo del sistema de iluminacin,
que consta de la definicin del tipo de fuentes luminosas ms la localizacin del binomio
fuentes cmara respecto a la superficie. El mtodo se basa en un procedimiento de cuatro
puntos: primero, estudio sobre el espectro de la luz para determinar la regin de sta que
aumente el realce de los defectos; segundo, determinacin de las componentes de la luz a
adquirir junto con el modelo de superficie a utilizar, tal que explique la respuesta de sta
ante la excitacin luminosa; tercero, modelizacin de las fuentes luminosas, el material no
defectuoso y el defectuoso; y cuarto, simulacin de la escena en diferentes posiciones
espaciales. Parte de esta metodologa ha sido empleada en el diseo del sistema de
iluminacin para la inspeccin de pasta de papel.
Para terminar, se ha pasado al anlisis de los factores que influyen en la eleccin de
una arquitectura de cmaras CCD, poniendo especial nfasis en la arquitectura del sensor.
Proponindose a continuacin un mtodo bsico para la seleccin de las cmaras
atendiendo a las especificaciones del SIVA a implementar.
DISAM-UPM DISAM-UPMT-98-015
85
Carlos Platero
Deteccin
locales
visual
de
defectos
DISAM-UPMT-98-015
87
Carlos Platero
88
DISAM-UPMT-98-015
Carlos Platero
4.1
DISAM-UPMT-98-015
89
Carlos Platero
90
DISAM-UPMT-98-015
Carlos Platero
Realce de los
defectos
(Procesado)
Deteccin de
los defectos
(Segmentacin)
Agrupacin de
pixeles defectos
(post-procesado)
Las actuaciones de los bloques estn interaccionadas, no son bloques cuyos diseos
puedan ser considerados como independientes. Por ejemplo, una accin de eliminacin de
componentes de altas frecuencias del espectro de la seal, producido en el primer bloque,
reducira la efectividad de la tercera etapa. El diseo ptimo de cada uno no es algo exacto
sino que tiene componentes de ingenio, pues su formulacin en trminos formales no ha
sido posible realizar. De esta manera surgen preguntas como Cul es el mejor filtro que
aumente el contraste? Qu umbral optimiza el compromiso entre falsas alarmas y
ocultacin de defectos? Cul es la tcnica de clustering capaz de distinguir ruido de
defecto?. No existe una respuesta general, todo va a depender del conocimiento del
problema y de la habilidad del diseador.
Los siguientes puntos van a versar sobre estos tres bloques, intentado responder de
forma metodolgica a las preguntas formuladas, para acabar con un criterio de medida
sobre la eficacia del sistema detector.
DISAM-UPMT-98-015
91
4.2
Carlos Platero
En 1998, la tarjeta Genesis de Matrox realiza una transformada discreta de Fourier 2D, en una
imagen de 512x512 con 8 bits en 2 s aproximadamente
92
DISAM-UPMT-98-015
Carlos Platero
g m ,n =
M 1 N 1
h
k = 0 l =0
k ,l
g m k , n l
( 4.1 )
DISAM-UPMT-98-015
93
Carlos Platero
n-1
m-1
m+1
n+1
94
DISAM-UPMT-98-015
Carlos Platero
F ( z ) = a 0 + a1 z 1 + ... + a n z n
y (k ) = a 0 x( k ) + a1 x(k 1) + ... + a n x(k n)
( 4.2 )
donde n es el orden del filtro. Obsrvese que en estos tipos de filtros cada valor de
la secuencia de salida slo depende del nmero finito de valores de la secuencia de entrada.
En cambio, las expresiones de los filtros recursivos corresponden a la forma de:
F ( z) =
y (k ) =
a 0 + a1 z 1 + ... + a m z m
b0 + b1 z 1 + ... + bn z n
,n m
1
[a 0 x(k ) + a1 x(k 1) + ... + a m x(k m) b1 y(k 1) ... bn y(k n)]
b0
( 4.3)
DISAM-UPMT-98-015
95
Carlos Platero
una imagen G en G. En este apartado se van a tratar las propiedades del operador H, para
llegar a que ste cumple con las caractersticas de linealidad e invarianza a traslaciones.
El operador H tiene la propiedad conmutativa, esta propiedad es fcil de demostrar
en el dominio de la frecuencia.
H * H = H * H
( 4.4 )
( 4.5 )
1
4
6
4
1
4 6 4
16 24 16
24 36 24
16 24 16
4 6 4
1
4
6
4
1
1
4
6 * (1 4 6 4 1)
4
1
( 4.6 )
( 4.7 )
( 4.8 )
96
DISAM-UPMT-98-015
Carlos Platero
H a k Gk = ak HGk
k
k
( 4.9 )
1 m, n
P=
0 en caso contrario
M 1 N 1
G = Gmn mn P
( 4.10 )
m =0 n =0
mostrndose el operador P como una funcin discreta dirac en 2D. Otra importante
propiedad es la invarianza a traslaciones, esto es, el resultado del operador no depende
explcitamente de la posicin de la imagen. Si se traslada en posicin, la imagen de salida
es la misma pero desplazada. Se puede formular mediante el operador desplazamiento, mnS,
como que cumple con:
mn
( 4.11 )
( 4.12 )
mn
4.2.1.3 Simetra
La simetra de las mscaras tanto en tamao como en coeficiente es una propiedad
muy utilizada en la prctica y, preferentemente se suelen utilizar mscaras de tamao
impar. La convolucin de una mscara de tamao impar y centrada en el origen de sta,
vendr dado por:
g m ,n =
k = rl = r
k , l
g m+ k ,n +l
( 4.13 )
DISAM-UPMT-98-015
97
Carlos Platero
centro de gravedad [Jhne97]. Si se hacen traslaciones en los pxeles, no sern posibles las
medidas de posicin de los pxeles. Y sta es una caracterstica importante en los equipos
de inspeccin.
Se puede distinguir dos tipos de simetra, par e impar, con la condicin de cumplir
en una o en ms direcciones, las siguientes igualdades:
h k , l = h k ,l
o h k , l = h k ,l
( 4.14 )
donde el signo + y hace referencia a simetra par o impar. Desde esta definicin y
para el caso de un filtro unidimensional, la expresin ( 4.13 ) quedar como:
, n = h0 g m , n +
gm
h (g
l
m,n l
+ g m,n +l )
par
l =1
g m, n =
h (g
l
m , n l
g m,n + l )
impar
l =1
( 4.15 )
m '= 0 n '= 0
, n +
rm, n g m
m '= r n '= r
m , n g m m , n n
( 4.16 )
donde los primeros sumandos corresponden al IIR, cuyos coeficientes son tomados
del primer cuadrante, exceptuando el origen. Tal restriccin es necesaria, al considerar en
el algoritmo recursivo slo los pxeles ya calculados. El signo de los ndices (m,n)
determinarn la direccin en el que es aplicado el filtro recursivo. Los segundo sumandos
representan el FIR de mscara (2r+1) (2r+1).
Las funciones de transferencia de los filtros IIR no suelen ser simtricas, ms bien
tienden a la direccin de propagacin del algoritmo recursivo. Si se requiere el diseo de
filtros simtricos, debe ejecutarse el mismo filtro en todas las direcciones, o al menos en
sentidos contrarios, sumndose o restndose los distintos resultados. De esta forma las
asimetras pueden ser compensadas, unas con otras.
98
DISAM-UPMT-98-015
Carlos Platero
Para el caso de los filtros FIR, se puede hacer uso de la propiedad asociativa para el
diseo de mscaras que fuesen simtricas en las cuatro direcciones.
4.2.1.4 Respuesta en frecuencia
En el dominio de la frecuencia, un filtro se representa por su respuesta espectral.
sta mostrar como cambia la amplitud y fase del filtro en funcin de la k-sima
componente de frecuencia. La relacin entre el dominio frecuencial y espacial vendr dado
por la transformada discreta de Fourier. La transformada del operador H, omitiendo el
factor 1/MN para una representacin normalizada, ser:
M
hu , v =
m,n
m =0 n =0
2jmu
2jnv
exp
exp
M
N
( 4.17 )
hu , v = h0 , 0 +
m,n
( m , n )Dh
2jmu
2jnv
exp
exp
M
N
2jmu
2jnv
+ h M m, N n exp
exp
M
N
( 4.18 )
donde Dh es el conjunto de ndices que recorre la mitad del espacio. Usando las
caractersticas de filtros pares e impares, se desprenden las siguientes expresiones
hu ,v = h00 +
2h
m,n
( m , n )Dh
hu , v = j
2h
2mu 2nv
+
cos
par
N
M
2mu 2nv
+
N
M
m , n sin
( m , n )Dh
impar
( 4.19 )
hu,v = h0,0 +
m,n
par
( m,n)Dh
hu,v = j
m, n
( m,n)Dh
impar
( 4.20 )
Como se ver ms adelante, estas expresiones van a ser muy utilizadas para el
anlisis y diseo de las mscaras de convolucin.
DISAM-UPMT-98-015
99
4.2.2
Carlos Platero
M 1 N 1
h
k =0 l =0
k ,l
g m + k ,n+l
( 4.21 )
G * H G H
DFT
correlacion(GH ) G * H
( 4.22 )
g m ,n = h0 g m ,n + hl ( g m ,n l + g m ,n + l ) par
l =1
g m ,n = H l ( g m , n+ l g m ,n l )
l =1
impar
( 4.23 )
Obsrvese que las expresiones ( 4.23 ) y ( 4.15 ) son iguales para simetra par y
con distinto signo en simetra impar. Esta propiedad ha sido utilizada por los fabricantes de
hardware de procesamiento de imgenes para el diseo de sus tarjetas[Awcoc95].
4.2.2.1 Regresin mltiple
Se ha observado cmo bajo ciertas condiciones de simetra, la convolucin coincide
con la correlacin lineal. En todo caso, para cualquier caso de convolucin discreta del
operador H sobre una imagen G, esta operacin puede ser presentada como una
combinacin lineal de un vector H* por una matriz G*. Vase, partiendo de la definicin
dada de convolucin:
100
DISAM-UPMT-98-015
Carlos Platero
g m ,n =
k = rl = r
g m+ k ,n +l
k , l
( 4.24 )
( 4.25 )
( 4.26 )
y suponiendo que (2r+1)x(2r+1) sea menor a PxQ, hace que el rango de G* sea de
(2r+1)x(2r+1). Desde el punto de vista de la regresin mltiple, la solucin de los
coeficientes de la mscara puede ser calculado mediante mnimos cuadrados. La solucin
est definida por:
(h ,..., h
*
1
) = (G
T
*
( 2 r +1)( 2 r +1)
*T
G * G *T G * '
( 4.27 )
( 4.28 )
( 4.29 )
DISAM-UPMT-98-015
101
Carlos Platero
gmn
gmn
1
(h ,..., h
*
1
) = (G
T
*
( 2 r +1)( 2 r +1)
*T
G * G *T G * '
( 4.30 )
E g * ' | G * = Gi* = G * H *
( 4.31 )
102
DISAM-UPMT-98-015
Carlos Platero
pi = p ( g *' = 1 | G = Gi* )
] (
( 4.32 )
( 4.33 )
1
1 + e Gi
*T
H*
( 4.34 )
DISAM-UPMT-98-015
g i* ' = 0,1
( 4.35 )
103
Carlos Platero
( 4.36 )
i =1
y tomando logaritmos:
PxQ
pi PxQ
*
+ ln(1 pi )
ln( P( g1* ' ,..., g PxQ
' )) = g i* ' ln
p
(
1
)
i =1
i
i =1
( 4.37 )
PxQ
i =1
i =1
*T * *
L( H ) = g i* ' Gi*T H ln 1 + eGi H
( 4.38 )
1
*T
1 + e Gi
H*
( 4.39 )
=0
( 4.40 )
1 + e Gi*T *H *
i =1
i =1
PxQ
PxQ
*
i
*
i
*
i
( 4.41 )
Estas ecuaciones expresan que el producto de los valores observados por las
variables explicativas debe ser igual al de los valores previstos. Tambin, que los residuos
del modelo, ei = g i* ' g i* ' , deben ser ortogonales a las variables de entrada. La condicin
( 4.41 ) es anloga a la obtenida en el modelo de regresin estndar, pero ahora el sistema
resultante no es lineal en los parmetros H * . Para obtener el valor MV de H * que
maximiza la funcin soporte, ( 4.40 ), se recurre a un algoritmo tipo Newton-Raphson.
104
DISAM-UPMT-98-015
Carlos Platero
( 4.42 )
2 L( H * k ) L( H * k )
= H +
*
*T
H *
H H
*
( 4.43 )
que expresa cmo obtener el punto H * k del mximo a partir de un punto prximo
cualquiera H * . La ecuacin depende de la matriz de segundas derivadas, que, en el
ptimo, es la inversa de la matriz de varianzas y covarianzas asinttica de los estimadores
MV. Derivando por segunda vez en ( 4.40 ) y sustituyendo las derivadas de primer y
segundo orden en ( 4.43 ), queda:
H * k = H * + G *T VG *
G *T (G * 'G * ' )
( 4.44 )
donde V es una matriz diagonal con trminos pi(1-pi), mientras G * ' es el vector de
valores esperados de G*. Esta expresin proporciona el siguiente algoritmo iterativo para
obtener el estimador MV de H * .
1. Fijar un valor arbitrario inicial, H * 0 , para los parmetros y obtener el vector
G * ' 0 para dicho valor en el modelo logit.
2. Definir una variable auxiliar Z = V 1 (G * 'G * ' ) .
3. Estimar por mnimos cuadrados ponderados una regresin con variable
dependiente Z, regresores G* y coeficientes de ponderacin g i+ ' (1 g i+ ' ) . Los
parmetros
estimados
con
esta
regresin,
vendrn
dados
1
por G *T VG * G *T (G * 'G * ' ) . Obtener un nuevo estimador de los parmetros
utilizando el resultado de la etapa anterior, quedando la expresin:
H * k = H * k 1 + G *T Vk 1G *
G *T (G * 'G * ' k 1 )
( 4.45 )
DISAM-UPMT-98-015
105
4.2.4
Carlos Platero
h
m '= r n '= r
m 'n '
g m m ',n n '
( 4.46 )
106
DISAM-UPMT-98-015
Carlos Platero
Con propsito opuesto se puede definir el operador erosin. Los objetos que sean
ms pequeos que la mscara desaparecern completamente, mientras grupos de pxeles
conectados por puentes sern separados. La erosin de un objeto estar definida por la
siguiente convolucin binaria:
g m ,n =
h
m '= r n '= r
m 'n '
g m m ',n n '
( 4.47 )
( 4.48 )
G H = {p : H p G 0}
( 4.49 )
y la dilatacin como:
Propiedades
( 4.50 )
DISAM-UPMT-98-015
107
Carlos Platero
( 4.51 )
( 4.52 )
( 4.53 )
( 4.54 )
( 4.55 )
108
DISAM-UPMT-98-015
Carlos Platero
( 4.56 )
( 4.57 )
( 4.58 )
Opening y closing
( 4.59 )
DISAM-UPMT-98-015
109
G H = (G H )H
Carlos Platero
( 4.60 )
El cambio de reas de los objetos puede ser resumido por las siguientes relaciones,
considerando que H contenga el origen:
( 4.61 )
GH G $ H G G H G H
Opening y closing son operaciones idempotentes
G H = (G H ) H
G $ H = (G $ H ) $ H
( 4.62 )
esto es, la aplicacin de una segunda vez de un closing o un opening con igual
elemento estructurante no muestra cambios de una a otra.
4.2.4.1.3
Operadores hit-miss
( 4.63 )
( 4.64 )
al erosionar el fondo con H2 aparecern objetos del fondo con la forma de H2,
correspondiendo con formas de igual tamao a H1 o menores. Luego, la interseccin de la
primera erosin con la segunda dar todos los pxeles de objetos constituido por una fila de
tres pxeles consecutivos. En general, los operadores hit-miss se definen como:
110
DISAM-UPMT-98-015
Carlos Platero
G ( H1 H 2 ) = (GH1 ) (G H 2 ) = (GH1 ) G H 2
( 4.65 )
( 4.66 )
La erosin del fondo con esta mscara, G H3, dar como resultado la deteccin de
objetos que contengan horizontalmente de 1 a 5 pxeles consecutivos, en un fondo de 3x7.
Al aplicar el operador hit-miss con H1 y H3, G (H1H3), se tendr como resultado objetos
de 3 a 5 pxeles consecutivos con una fila. Siendo las mascaras del hit y el miss disjuntas,
se desprende que los 1 en el hit, combinados con los 0 del miss, darn los pxeles del
resultado. Obsrvese que aparece un tercer tipo, a lo que se denomina x, los cuales
permitirn un cierto grado de libertad en la forma que se busca. Por ejemplo, en la muestra
utilizada la mscara hit-miss que localiza objetos que contengan de 3 a 5 pxeles
consecutivos en fila ser del estilo
0000000
H = 0 x111x0
0000000
( 4.67 )
DISAM-UPMT-98-015
111
000
H A = 010
000
Carlos Platero
x10
H B = 110
000
( 4.68 )
Figura 4.8 a)Imagen sinttica en la que se pretende realzar figuras de tres, cuatro
o cinco pxeles consecutivos horizontales b)erosin con H1, c)erosin con la
imagen negada y H2 d) Resultado de 3 pxeles e) Resultado de 3 a 5 pxeles
112
DISAM-UPMT-98-015
Carlos Platero
( 4.69 )
DISAM-UPMT-98-015
113
Carlos Platero
( 4.70 )
( 4.71 )
( 4.72 )
( 4.73 )
( 4.74 )
114
DISAM-UPMT-98-015
Carlos Platero
G H = (G H )H
( 4.75 )
( 4.76 )
G H = (G H ) H
G $ H = (G $ H ) $ H
( 4.77 )
( 4.78 )
Transformaciones Top-Hat
( 4.79 )
DISAM-UPMT-98-015
( 4.80 )
115
Carlos Platero
Consecuentemente, si se elige una mscara mayor que los valles, stos sern
eliminados en closing y realzados en la sustraccin. Para detectar conjuntamente picos y
valles, se puede en primer lugar realizar transformacin top-hat y localizar el umbral para
los puntos brillantes. Y en segundo lugar, lo mismo pero esta vez aplicando el operador
dual top-hat. Otro proceder, es aplicar en paralelo un opening y un closing, para seguir con
una sustraccin de lo obtenido, (GH)-(G $ H).
El operador HAT es ilustrado en la figura 4.9, en la que se aplica una mscara H
mayor que el valle del defecto. Obsrvese como stos son eliminados y al sustraerse
aparecen realzados.
116
DISAM-UPMT-98-015
Carlos Platero
4.3
4.3.1
DISAM-UPMT-98-015
117
Carlos Platero
Q 1
p(q) = 1
q=0
p(q) 0
( 4.81 )
p(q|D),p (q|F)
SD
p DD = p (q | D), p SD =
q =0
p FD =
118
Q 1
p(q | F ),
q =u +1
Q 1
p(q | D)
q = u +1
u
p FA = p (q | F )
q =0
( 4.82 )
DISAM-UPMT-98-015
Carlos Platero
Decisin
Probabilidad
Defecto
Defecto
Defecto
Fondo
Fondo
Fondo
Fondo
Defecto
El umbral u se posicionar tal que separe la componente del fondo respecto del
defecto. Idealmente, las componentes de ruido y seal deberan estar lo suficientemente
alejadas, como para que tanto las probabilidades de las falsas alarmas como de defectos sin
detectar sean cero, pero esto no suele suceder. Lo ms comn, es que ambas componentes
se solapen, tal como mostraba la figura 4.10, provocando que la colocacin de u sea un
compromiso entre pFA y pSD. La seleccin ms apropiada del umbral u es lo que se llama la
estrategia de decisin.
4.3.2
Estrategias de decisin
El objetivo ltimo de la etapa de decisin consiste en maximizar la probabilidad de
deteccin, pDD, minimizando la probabilidad de falsas alarmas, pFA. Obsrvese que
representan objetivos contrapuestos, as un aumento de pDD puede originar un incremento
fuerte de falsas alarmas, o una disminucin de falsas alarmas puede llevar a una mala
deteccin de defectos. Obviamente el grado de compromiso depender del lugar que ocupe
el umbral. En el caso de conocer el coste de falsas alarmas, c FA, y el de defecto sin detectar,
cSD, es posible establecer una funcin de coste del tipo:
l (u ) = c FA (u ) p FA (u ) p ( F ) + c SD (u ) p SD (u ) p ( D)
( 4.83 )
donde el mnimo de l(u), dar el valor de u ptimo. Pero este planteamiento parte
de que se conoce tanto las funciones de densidad, como las de coste. Cuando esta
informacin no est disponible, hay varias alternativas, de las que algunas son descritas en
[Norton82][Brads94]. stas, en general, se basan en el conocimiento de al menos la
funcin de densidad de fondo, siendo las ms comunes el observador de Neyman
Pearson, o el observador inverso de Neyman Pearson.
DISAM-UPMT-98-015
119
Carlos Platero
( 4.84 )
La principal ventaja de esta estrategia es la poca informacin a priori que debe ser
requerida. No se precisa de la funcin de densidad del defecto y opcionalmente la del
fondo. En general, resulta difcil obtener en lnea las caractersticas de los datos de partes
defectuosas, mientras resulta relativamente fcil obtener informacin del fondo. Si la
funcin de densidad del fondo es conocida, el umbral puede ser calculado para un valor
dado de pFA. Incluso si no es conocida p(q|F), es posible determinar u ajustando
manualmente hasta alcanzar un nivel aceptable de falsas alarmas.
Pero este proceder tiene dos grandes inconvenientes, el primero que no se conoce el
nivel de acierto de los defectos y, segundo, una variacin sobre el umbral no predice el
mejoramiento o empeoramiento de la deteccin. Por ejemplo, podra suceder que al mover
el umbral u, en el sentido de aumentar el nivel de falsas alarmas, se produjese un
incremento espectacular de deteccin del defecto, mientras el valor de pFA se ha aumentado
levemente. Por lo que no es posible establecer un nivel ptimo de umbral.
La estrategia inversa de Neyman-Pearson, consiste en ajustar el umbral mediante la
imposicin de un nivel de probabilidad de deteccin de defectos superior a un cierto valor
de k, esto es:
p DD (u ) > k
( 4.85 )
Esta estrategia es especialmente apta para aquellas aplicaciones donde todos los
mensajes deben ser detectados. Las consecuencias pueden ser que los niveles de falsas
alarmas sean inaceptables. Pero como ya se dijo tanto en la introduccin del captulo como
al inicio de este apartado, es posible aplicar una tercera etapa de post procesado,
reduciendo el nivel de falsas alarmas. Para los propsitos de deteccin, esta estrategia es
superior a la anterior y por doble motivo. Es posible determinar tericamente los niveles de
pDD, pSD, pFD y pFA, y adems es posible poder evaluar los efectos de la modificacin de u.
El principal inconveniente est en que se necesita el conocimiento a priori de las seales de
los defectos.
120
DISAM-UPMT-98-015
Carlos Platero
Al captar una imagen sin defecto del escenario SIVA, muestra un conjunto de
propiedades que van a ser estudiadas. Antes de entrar en el anlisis, se parte de tres
supuestos matemticos referidos al modelo espacio-temporal de la distribucin de la
intensidad lumnica:
1. La seal es estacionaria, esto es, el valor medio de la seal se mantiene
constante en el tiempo. Implica que la iluminacin y los sensores de captacin
mantienen sus caractersticas a lo largo del tiempo, si bien en la prctica no es
del todo cierto (vase el estudio sobre formacin de imgenes en SIVA)
2. La seal sigue un modelo probabilstico, como consecuencia del proceso de
obtencin del material a inspeccionar. sta seguir una determinada ley al ser
un proceso estocstico.
3. La seal muestra una textura repetitiva, es decir, un patrn espacial que se
repite, habiendo correlacin espacial entre las lneas adquiridas.
A partir de estas suposiciones, la seal del fondo tiene tres elementos distinguibles:
1. Una lenta modulacin. Su origen viene dada tanto por los efectos de la
iluminacin como por las lentes. Recurdese que la intensidad luminosa
disminuye de forma cuadrtica entre la superficie y el foco. Los valores medios
de los pxeles en el centro sern mayores que en los bordes. De la misma
manera, la transmitancia en el corazn de la lente es distinta que en las partes
perifricas. Estos efectos son estacionarios y probabilisticos, pudiendo ser
modelizados segn se vio en el captulo 3 de formacin de imgenes.
DISAM-UPMT-98-015
121
Carlos Platero
2. Las variaciones entre lneas pares e impares generadas por las propias cmaras
entrelazadas, o la discontinuidad entre pxeles adyacentes provocadas por zonas
no sensibles, provoca una seal discontinua.
122
DISAM-UPMT-98-015
Carlos Platero
consecuencia era de esperar, al aplicar el teorema central del lmite, que dice lo siguiente:
una variable aleatoria sigue una distribucin gaussiana, cuando sta viene originada por la
suma de un nmero creciente de variables aleatorias independientes, que actan
conjuntamente formando la seal de medida. Este efecto suele ser comn cuando se
efectan medidas, en las que intervienen diversos factores en su obtencin. Tambin indica
esta conclusin que la informacin adquirida emana de tres fuentes.
1. El proceso de fabricacin del material. Aunque ste es de carcter estocstico,
no implica una respuesta preestablecida sino que introduce desviaciones
aleatorias dentro de la seal.
2. Causas aleatorias como consecuencia de la reflexin de la luz en la textura del
material.
3. Las caractersticas del sensor y de la electrnica asociada.
Los efectos combinados de estas tres fuentes generan que los histogramas de las
imgenes adquiridas sigan una distribucin normal. La figura 4.13 muestra una imagen
correspondiente a la adquisicin de pasta de papel, donde tambin se presenta el
histogramas de la imagen, observando que sigue una distribucin normal.
DISAM-UPMT-98-015
123
Carlos Platero
haber faltas que contengan pxeles de tonalidad oscura y otros de tonalidad clara. Las
peculiaridades de cada defecto marcarn distintas funciones de densidad.
No obstante en algunas aplicaciones, los defectos locales se caracterizan por puntos
de medio y alto contraste respecto a la textura de la materia, entre el 20% al 60% de nivel
de contraste [Feng93]. En general sus apariencias, tienden a aproximarse a elipses o a
manchas oscuras y menos frecuente es la aparicin de burbujas brillantes. En la
experiencia obtenida en el desarrollo de esta tesis coincide con la afirmacin de Feng. As
en el caso de fallos en la pasta de papel, en el 96% de los defectos sus apariencias son de
puntos oscuros prximos a forma circular. Y en el aluminio colado, las inclusiones de gas
originan puntos brillantes mientras el grafito provoca faltas en forma de motas y manchas
de tonalidad oscura.
Si se considera que para la deteccin de un defecto local es necesario que exista al
menos un pixel de alto contraste (full contrast), se est definiendo una nueva estrategia de
decisin. La idea de Feng es que la deteccin de los defectos, es un problema de encontrar
donde estn los pxeles de alto contraste.
En la figura 4.14 se aprecia como el
defecto est constituido por pxeles de alto y
medio contraste. Luego, si se detecta los pxeles
de alto contraste y posteriormente se aplica
operaciones morfolgicas y de vecindad (ver
prrafos 4.4.2), es posible reconstruir el defecto
total o parcialmente.
4.3.3
124
( 4.86 )
DISAM-UPMT-98-015
Carlos Platero
donde gm,n es la intensidad del punto situado en las coordenadas m,n, y pm,n
representa alguna propiedad local mediada en un entorno de vecindad de este punto. La
imagen que se obtiene al llevar a cabo un procesamiento de umbral se define como:
1
g m ,n =
0
g m ,n u
g m ,n > u
( 4.87 )
de forma que los pxeles etiquetados con 0 se corresponde con el fondo, mientras
que los 1 se corresponden con los defectos. En la ecuacin ( 4.87 ) se supone que la
intensidad del defecto es menor que la intensidad del fondo. Cuando en ( 4.86 ), u depende
slo de gm,n, el umbral se llama global. Pero si u depende tanto de gm,n como de pm,n, el
umbral se denomina local, y cuando adems depende de las coordenadas espaciales, x e y,
se llama umbral dinmico.
Los umbrales globales tienen aplicacin en situaciones donde existe una clara
definicin entre los objetos y el entorno, y cuando la iluminacin es relativamente
uniforme. Los sistemas de iluminacin de luz posterior y las tcnicas de iluminacin por
franjas pueden dar como resultados imgenes que pueden ser segmentadas mediante el uso
de umbrales globales. A menudo, una iluminacin arbitraria del espacio da lugar a
imgenes que, si se trabaja con umbrales, requieren de algn tipo de anlisis local para
compensar efectos, como las no uniformidades de iluminacin, sombras y
reflejos[Marav93]. Por eso, se ha puesto tanto nfasis en el diseo de los sistemas de
iluminacin, ya que un buen diseo en esta etapa ahorrar mucho esfuerzo computacional.
Ha habido un gran esfuerzo por parte de la comunidad cientfica, en cmo
segmentar imgenes mediante umbrales en niveles de grises. El resultado es una gran
variedad de algoritmos, un resumen de stos se puede encontrar en [Sahoo88][Glasb93].
Sin embargo, muchas de las tcnicas presentadas, parten de la suposicin de que al menos
hay un objeto de inters. Esta hiptesis de trabajo no es admisible para la deteccin de
defectos, pues en una imagen capturado puede no haber defectos. El planteamiento de
tcnicas de umbral para la deteccin de defectos se esboza a continuacin.
4.3.4
DISAM-UPMT-98-015
125
Carlos Platero
varianzas, y . El nivel de falsas alarmas puede ser determinado desde el punto de vista
terico, y como es conocido, la pFA depender de la distancia del umbral, u, respecto a la
intensidad media de la imagen, pudindose medir mediante k veces la varianza. As, un
umbral separado tres veces la varianza respecto a la media, 3 , dar una probabilidad
de falsas alarmas de menos de un 1%. Este conocimiento a priori puede ser empleado en la
construccin de la etapa de segmentacin.
Otra fuente a utilizar viene de la bsqueda de pxeles de alto contraste, el umbral
ser determinado tal que slo detecte los pxeles de mayor contraste. Esta premisa
permitir disminuir la pFA al poder desplazar u a posiciones ms alejadas respecto a la
media. Pero esta actuacin, requerir de una nueva etapa que tenga como objetivo la
reconstruccin del defecto a partir de las pxeles de alto contraste.
Llegado a este punto, la localizacin del umbral pasa por un lado por la validez de
las suposiciones hechas, y en el caso de cumplir se pueden presentar dos tipos de umbral,
que atendiendo a la clasificacin anteriormente dada, puede ser de tipo global o de tipo
local. Si no cumple las hiptesis iniciales de trabajo habr de recurrir a otras tcnicas que
debern ser exploradas. Por tanto, el mtodo tratar en primer lugar de validar las hiptesis
de trabajo, en el caso de cumplir se presentan dos tipo de algoritmos de umbralizacin.
Mientras habr de recurrir al estado de la tcnica para tratar otros mtodos, por ejemplo el
presentado por Macaire [Macai93].
4.3.4.1 Validez de las conjeturas de normalidad en la seal del fondo
Si bien la tendencia, segn se ha visto, es tener imgenes adquiridas en escenas
SIVA caracterizadas por distribuirse la intensidad del pixel de forma normal, tambin hay
que incidir sobre la posibilidad de haberlas tratada anteriormente en la etapa de realce. Para
una transformacin de tipo lineal, la nueva funcin de densidad tambin ser normal, eso
s, se habrn modificado los parmetros de la normalidad segn el tipo de mscara
utilizada. Obviamente, esta afirmacin no es vlida si el realce no se basa en filtros
lineales. Aun en el caso de realces basados en transformaciones lineales, no hay que
olvidar que la variable de intensidad es discreta y por tanto finita, pudiendo provocar
efectos de saturacin tanto porque de resultados de la convolucin sean menores que cero o
superiores al mayor valor de discretizacin.
La validez de la conjetura de normalidad en la distribucin de la seal del fondo,
puede refrendarse de dos formas: una mediante algn test de normalidad y otra a travs de
las propiedades que se derivan de una distribucin normal.
Para la primera y aunque existen diferentes posibilidades de abordar este estudio,
no todos los contrastes de normalidad se pueden aplicar a este caso en concreto. El mtodo
de Shapiro y Wilks no se puede utilizar dado que tan slo se puede aplicar a muestras de
pocos datos, tampoco es aplicable el criterio de Kolgomorov-Smirnov dado que su uso est
restringido a funciones continuas.
126
DISAM-UPMT-98-015
Carlos Platero
CA =
m
=
3
( p (q)(q ))
q=0
( 4.88 )
CA p =
m
=
4
( p (q)(q ))
q =0
( 4.89 )
( 4.90 )
sigue una distribucin 2 con dos grados de libertad. Por lo tanto, se puede calcular
el ndice de confianza de la hiptesis de normalidad.
La segunda forma es a travs de sus propiedades. Si la distribucin es normal
deber cumplir con los siguientes requisitos:
1. El nivel de falsas alarmas puede ser determinado a travs de la media y la
varianza del histograma de la imagen:
pFA (u ) = p (q | F )
q =0
DISAM-UPMT-98-015
1
2
(q )2
2 2
dq
( 4.91 )
127
Carlos Platero
Umbral global
El umbral global es aplicado sobre toda la imagen, y sus parmetros sern la media
y la varianza muestral de la imagen, junto una constate k, que determine la separacin del
umbral respecto a tanta veces de la varianza, quedando expresado como:
u = k
( 4.92 )
128
Umbral local
DISAM-UPMT-98-015
Carlos Platero
( 4.93 )
El valor de k
p AC (u ) = p(q | AC )
q=0
( 4.94 )
siendo p(q|AC) la funcin de densidad del los pxeles de alto contraste. El valor
ptimo de umbral va a depender del coste de falsas alarmas, cFA, y el de no detectar los
pxeles de alto contraste, cAC, pudiendo establecer una funcin de coste del tipo:
l (u ) = c FA (u ) p FA (u ) p ( F ) + c AC (u )(1 p AC (u )) p ( D)
( 4.95 )
DISAM-UPMT-98-015
129
4.4
Carlos Platero
4.4.1
130
DISAM-UPMT-98-015
Carlos Platero
que se ha borrado los pxeles aislados, esto es, la eliminacin de falsas alarmas precisa de
una operacin opening. El elemento estructurante depender de la forma de los defectos y
de la textura del material a inspeccionar.
4.4.2
( 4.96 )
Donde kMC ser menor que kAC en trminos absolutos. Este actuar necesita de este
segundo umbral, uMC, capaz de detectar pxeles de medio contraste. Pero al umbralizar no
slo pasarn pxeles del defecto sino adems del fondo, como consecuencia de la
variabilidad de la textura del material. No obstante, la
definicin previa de los pxeles de alto contraste,
Tabla
4.2
Algoritmos
de
permitir distinguir qu parte depende al defecto y qu
reconstruccin de los defectos
otra pertenece al fondo. La reconstruccin del defecto
est basada en las dos imgenes resultantes de la doble
Mtodo 1
umbralizacin, uAC y uMC, junto con la aplicacin de
k=1;
las tcnicas de procesado morfolgico, llamada
Gk=(GACH)GMC
dilatacin condicionada. Dos algoritmos han sido
Do {
diseados con este objetivo. La tabla 4.2 muestra los
Gk+1=(GkH)GMC;
quehaceres de estas reconstrucciones. Sean GAC y GMC
} While(Gk+1-Gk+!= 0)
las imgenes binarias de pxeles de alto y medio
contraste, respectivamente y H el elemento
Mtodo 2
estructurante. El segundo algoritmo es una
Gk=(GACH)GMC
simplificacin del primero. Este primero resulta ms
correcto pero consume ms tiempo que el segundo. Se
basa en la dilatacin de la imagen de pxeles de alto
contraste con la interseccin de pxeles de medio
contraste. Cuando este proceder se vuelve
idempotente, se habr finalizado la reconstruccin del
defecto. El segundo mtodo slo se efecta una sola
vez.
DISAM-UPMT-98-015
131
4.5
Carlos Platero
4.5.1
Q 1
p(q | D) p( D) + c p(q | F ) p ( F )
2
q =u +1
q =0
( 4.97 )
siendo c1 y c2 dos constantes que ponderan el coste de tener rea de defecto sin
detectar y de masa proveniente de falsas alarmas. En el caso de defecto de tonalidad clara,
la expresin ( 4.97 ) slo ser modificada en los intervalos de integracin, quedando
como :
u 1
c (u ) = c1 p (q | D) p ( D) + c 2
q =0
Q 1
p(q | F ) p( F )
q =u +1
( 4.98 )
Cuando el valor de c tienda a ser nulo indicar que el contraste entre el defecto y el
fondo, para el umbral u, tender a ser el acertado. Tal como se ha comentado, es
132
DISAM-UPMT-98-015
Carlos Platero
observable como de una manera directa, este nivel de contraste depende del tipo de
umbralizacin, al estar vinculado el ndice de contraste con el valor de nivel de gris de
segmentacin, u.
Si las dos distribuciones son normales, la distancia de Bhattacharyya puede ser
empleada como medida de contraste, al ser sta un ndice superior del error de Bayes. Por
tanto, a mayor distancia mayor contraste; expresndose esta medida en funcin de las
medias y las varianzas de las dos funciones de densidad, quedando reflejada en:
F2 + D2
1 ( D F ) 1
2
dc =
+ ln
8 D2 + F2 2 F2 D2
( 4.99 )
donde F y D son las medias de las distribuciones de niveles de grises del fondo y
el defecto, mientras F y D corresponden con las varianzas de stas.
No obstante, esta medida de contraste basada en el error de Bayes, slo considera la
informacin sobre la distribucin de niveles de grises. No hay ninguna referencia sobre la
distribucin espacial del fondo ni la del defecto. La falta de estimacin sobre la
distribucin espacial de los pxeles es un gran handicap para esta medida. As el nivel de
falsas alarmas, si bien es conocido, no hay conocimiento de cmo se reparte en el espacio,
y esta informacin es vital para las etapas de post-procesado. De hecho, la etapa de postprocesado no es considerada en este nivel de medida. En la prctica, se observa que existen
procesados con bajos rendimientos sin etapa de post-procesado, pero aumenta
considerablemente al aplicar una etapa de eliminacin de falsas alarmas. Y viceversa,
realzados de gran contraste en el procesado, tienen mal comportamiento en la eliminacin
de falsas alarmas.
Adems, el concepto utilizado de masa defectuosa no detectada, no es del todo
cierto, pues como ha sido comentado, es posible la reconstruccin de la masa de defecto
con operaciones de post-procesado.
Las carencias de esta medida se evidencian al no considerar las distribuciones
espaciales tanto del defecto como de las falsas alarmas. Esta medida es incompleta y
genera errores. Para paliar estas dificultades se hace propuesta de una nueva metodologa
de medida de la capacidad de deteccin.
4.5.2
DISAM-UPMT-98-015
133
Carlos Platero
134
DISAM-UPMT-98-015
Carlos Platero
basadas en semillas tanto de pxeles de alto contraste como de falsas alarmas, pues en la
reconstruccin de los defectos sern proporcionales las reas aditivas alrededor de estas
semillas.
Ntese que estas medidas son hechas al no tener conocimiento a priori de los costes
de falsas alarmas, cFA, ni del precio de falta de deteccin del defecto, cDD. Ser el usuario
final el que pueda determinar el valor ptimo a partir de la funcin de coste oportuna.
4.6
Aparicin
(pitch) %
rea
(pitch)%
Aparicin
(shive)%
rea
(shive)%
44%
13%
9%
1%
38%
29%
33%
8%
15%
35%
30%
22%
Mayores a 0.8
3%
23%
29%
69%
Estos datos emanan del universo entregado a travs de 32 pliegos con ms de 230 defectos
DISAM-UPMT-98-015
135
Carlos Platero
Una vez dada esta breve y primera impresin sobre el problema a resolver se
plantean la trayectoria marcada en este captulo para la deteccin de faltas en la pasta de
papel, constituida por cuatro fases:
1. Tipo de realce. Estudiando desde el uso de filtros lineales hasta el empleo de
tcnicas de procesamiento morfolgico.
2. La estrategia de segmentacin. Para este caso y dada la facilidad de obtencin
de muestras, se ha optado por una tctica de observador inverso de NeymanPearson. Por lo que habr de intentar modelar las funciones de densidad tanto
del fondo como de los defectos.
3. Validacin de las hiptesis de normalidad de la seal del fondo. En caso
contrario, buscar otro modelo de funcin de densidad.
4. Y por ltimo, fijar los parmetros del sistema de deteccin mediante las
medidas de calibracin explicadas. Este proceso determinar: Filtro lineal o no
lineal, modelos de mscaras o elementos estructurantes, tipo de umbral,
operaciones de post-procesado y reconstruccin de semillas, dando un nivel de
falsas alarmas y de defectos localizados.
El primer paso consistir en la determinacin de las posibles operaciones lineales o
no que aumenten el realce de los defectos. Las mscaras de convolucin a testear salen de
la bibliografa especializada y del mtodo propuesto mediante correlacin de variable
cualitativas (explicado en 4.2.3). Respecto al procesado morfolgico se exploran las
transformaciones top-hat. En segundo lugar, las estrategias de segmentacin se basan en el
anlisis del histograma, al validarse la normalidad de distribucin en niveles de grises. Por
ltimo, se proceder a la calibracin de los parmetros. En los prrafos siguientes se
desmenuza este proceder sobre la inspeccin en la pasta de papel.
4.6.1
136
DISAM-UPMT-98-015
Carlos Platero
en niveles de grises del defecto, orienta ambas razones a utilizar simetra par en las cuatro
direcciones. En cuanto al tamao de las mscaras, depende tanto del algoritmo como del
nmero de pxeles que representan el defecto. El tipo de algoritmo para la deteccin, se
basa en la localizacin de pxeles de alto contraste. Respecto a la resolucin tomada es
aproximadamente de 0.015 pixel/mm2, y segn la base de datos, los defectos estn en
subimgenes que tienen tamaos desde 3 x 2 hasta ms de 15 x 14, correspondientes a
defectos que van desde el tipo P hasta A. Por tanto, el tamao de la mscara debe ser tal
que al situarse su centro sobre un pixel de alto contraste, los pxeles adyacentes fuesen
otros de alto y medio contraste. La motivacin est en que los coeficientes de la mscara
encuentren correlacin con los defectos. Por las caractersticas morfolgicas deberan ser
de 3 x 3. Mayores tamaos podran desfigurar el realce de los defectos ms pequeos, pues
tomara en la convolucin pxeles del fondo. No obstante, el rea de los defectos mayores
representa casi un 90% del rea total para los pitch y un 99% para los shives, segn se
desprende de la informacin de la tabla 4.3. Por lo que podra considerarse entornos de
vecindad 5 x 5, incluso mayores. Para mscaras de mayor tamao podrn ser obtenidas
como proceso de aplicacin de la propiedad asociativa de la convolucin, esto es, para su
decantacin se pasar aplicar dos o ms etapas de procesado con mscaras 3 x 3 5 x 5.
Concluyendo, por el carcter convexo de los defectos, por la resolucin tomada y por el
algoritmo a emplear, las mscaras a utilizar son del tipo representado por:
cbc
H1 = bab
cbc
ecd
H 2 = bab
dce
fedef
ecbce
H 3 = dbabd
ecbce
fedef
jihkl
fecdg
H 4 = dbabd
gdcef
lkhij
( 4.100 )
DISAM-UPMT-98-015
137
Carlos Platero
mientras que con pxeles del fondo se mantenga o aumente, se fija cero en el defecto y uno
en el fondo.
Debido a las caractersticas propias de cada cmara e iluminacin, correspondientes
al sistemas de adquisicin de imgenes del papel, las muestras tomadas requieren de un
proceso de normalizacin. De esta forma, se puede crear una poblacin de defectos y
fondos comparables entre si. La unificacin de las muestras ha sido realizada mediante la
traslacin de las imgenes a igual media para todo el universo. Este proceder se justifica en
la medida de que todas las imgenes capturadas tienen similar varianza pero diferente
media, lo que viene a indicar que la variabilidad de la informacin est definida por la
textura del material y que con slo corregir la intensidad lumnica se hacen comparables
las muestras.
Una vez preparadas las muestras, se pasar a determinar los coeficientes por el
mtodo Logit. El resultado corresponder con la variacin de correlacin entre la mscara
y el entorno de vecindad. Por dicho motivo habr de sumar adems de la ponderacin
oportuna de la correlacin, el nivel de gris de los pxeles. La ponderacin del resultado
logit depender del nivel de discretizacin de la seal, evitando que se produzca
saturaciones. De esta forma quedar definida la mscara, slo resta colocar los coeficientes
para que sean efectuados de forma eficiente por el procesador, esto es, prximo a potencias
de 2n. En la tabla 4.4 se expone un ejemplo. Tambin se emplear otras mscaras como las
correspondientes a filtros binomiales, por ser muy extendido dentro de la bibliografa
SIVA.
Tabla 4.4 Resultados del mtodo logit para una mscara 3x3
Resultado logit
Mscara
optimizada
2 0 4
1
(0.49 0.03 0.008 0.14 0.06) (1.49 0.03 0.008 0.14 0.06) 1 48 1
32
4 0 2
Respecto al procesamiento morfolgico, si se desea realzar defectos de tonalidad
oscura se precisa de transformaciones top-hat, ver 4.2.4.2.4. Un estudio de la base de datos
de los defectos muestra que los pxeles de alto contraste son pocos y prximos entre si, por
lo que sugiere utilizar elementos estructurantes de conectividad 4 pxeles en cruz, por ser
los ms prximos o bien probar con conectividad de 8 vecinos. En mayor tamao podra
pensarse en 11 e incluso 24 vecinos. La ecuacin ( 4.101 ) muestra los elementos
estructurantes propuestos.
138
DISAM-UPMT-98-015
Carlos Platero
010
H1 = 111
010
111
H 2 = 111
111
00100
01110
H 3 = 11111
01110
00100
11111
11111
H 4 = 11111
11111
11111
( 4.101 )
DISAM-UPMT-98-015
139
Carlos Platero
Funciones de densidad
Respuesta en frecuencia
Parmetros
Normalidad
AC
AC
AC
dB
178
13
83
25
0.4
0.04
156
18
43
29
0.3
0.24 2.7
178
16
69
28
0.4
0.04
178
11
98
24
0.4
0.1
2.5
8 1 8
1
1 64 1
32
8 1 8
1 0 1
1
0 12 0
8
1 0 1
1 2 1
1
2 4 2
16
1 2 1
140
DISAM-UPMT-98-015
Carlos Platero
2 0 6
1
1 32 1
16
6 0 2
2 0 4
1
1 48 1
32
4 0 2
3
1
8
32
3
3 8 3 8
1 2 1 3
2 56 2 8
1 2 1 3
3 8 3 8
2
1
8
64
2
2 8 2 8
1 2 1 2
2 85 2 8
1 2 1 2
2 8 2 8
157
18
43
29
0.1
0.25 2.6
189
16
76
28
0.5
0.04
156
22
16
35
0.3
0.1
2.8
136
17
28
27
0.4
0.09
DISAM-UPMT-98-015
141
Carlos Platero
valor de k. Esta fase de calibracin definir la etapa de realce, el umbral u* y por ende k*,
junto al tipo de postprocesado.
Para el caso de la pasta de papel, los pxeles de alto contraste vendrn ponderados
por el tipo de defecto, pues stos se clasifican atendiendo al tamao de sus defectos. No es
lo mismo un pixel de alto contraste de un defecto de tipo P que otro de tipo A, pues los
primeros slo representan un 0.04 mm2 y los segundos un mm2, segn se vio en la tabla
4.4. A continuacin se presentan los resultados de las distintas estrategias de deteccin de
defectos. En la Tabla 4.6 aparece en la primera columna el tipo de procesado, en la
segunda las funciones de distribucin de los pixeles de alto contraste ponderados y falsas
alarmas con y sin post procesado. El post procesado utilizado ha sido el explicado en 4.4.1
con 8 vecinos. Y las ltimas columnas hace referencia a las medidas de probabilidad de
deteccin sin pixeles de falsas alarmas, pAC(pFA=0), sin y con post procesado ( - o + ), ms
la probabilidad de falsas alarmas cuando se detectan al 100 % de los defectos.
La ltima fila est reservada al procesado morfolgico tipo top hat, al que se le
aplicado vecindad a 4 y 8 vecinos.
Funciones de distribucin
142
DISAM-UPMT-98-015
Carlos Platero
8 1 8
1
1 64 1
32
8 1 8
1 0 1
1
0 12 0
8
1 0 1
1 2 1
1
2
4
2
16
1 2 1
2 0 6
1
1 32 1
16
6 0 2
2 0 4
1
1 48 1
32
4 0 2
DISAM-UPMT-98-015
143
3
1
8
32
3
1
2
1
3
2
1
8
64
2
2 8 2 8
1 2 1 2
2 85 2 8
1 2 1 2
2 8 2 8
Carlos Platero
3 8 3 8
2
56
2
8
1
2
1
3
Top-hat
3
8
3
8
2.6
144
DISAM-UPMT-98-015
Carlos Platero
calcular la relacin entre la masa de defecto detectado y de falsas alarmas para cada valor
de k. Estas funciones son de gran utilidad de cara al producto final, en el que el propio
cliente es el que deber decidir, con su conocimiento del sistema, el coste de la falta de
deteccin y de falsas alarmas.
4.7
Conclusiones
Se ha presentado un esquema metodolgico para la deteccin de defectos locales en
superficies homogneas y planas. El sistema de inspeccin se basa en tres etapas: realzado,
segmentacin y post procesado. Respecto al realzado, se han estudiado los filtros lineales
discretos, proponiendo una tcnica novedosa basada en el uso de correlacin lineal con
variables cualitativas. Adems tambin se han explorado tcnicas de realce soportado en
procesamiento morfolgico. En cuanto a la etapa de segmentacin fue abordada desde las
funciones de densidad en niveles de grises del defecto y del fondo, introducindose el
concepto de pxeles de alto y medio contrastes. Convirtiendo el problema de
umbralizacin, en la localizacin ptima del umbral mediante una funcin de coste, donde
se tiene en cuenta los dos errores tpicos, defectos sin detectar y falsas alarmas. Las
tcnicas de post procesado han sido aplicadas con una doble intencionalidad, eliminacin
de falsas alarmas y reconstruccin de defectos a partir de los pxeles de alto contraste. A
continuacin se ha definido un conjunto de medidas con el objeto de calibrar cul es el
mejor mtodo de deteccin de defectos. stas se basan en las funciones de distribucin en
niveles de grises del fondo y de los defectos. Por ltimo, se ha implementado esta
metodologa para la deteccin de faltas locales en la pasta de papel. Donde se ha
desarrollado experimentalmente la tcnica propuesta, dando los resultados de diseo para
cada una de las etapas y cmo han sido stas evaluadas.
DISAM-UPMT-98-015
145
Carlos Platero
DISAM-UPMT-98-015
147
Carlos Platero
148
DISAM-UPMT-98-015
Carlos Platero
5.1
DISAM-UPMT-98-015
149
5.1.1
Carlos Platero
Pen
sam
Ma
iento
Fu
Ha
bla
Alto
pa
s
ci
ca
ifi as
an re
Pl e ta
d
nc
ion
es
mo
tr
en
ica
sor
s
ial
5.1.1.1 Arquitectura
to
en
mi
oci s
con do
Re soni
de
to
ie n
cim
no as
co labr
e
R pa
de
Bajo
to
imien
Mov s
de ojo
Visin
150
DISAM-UPMT-98-015
Carlos Platero
VecindadNi
malla
Mi(t)
sinapsis
1
X(t)
5.1.1.2 El algoritmo
El objetivo del algoritmo de Kohonen consiste en adaptar los pesos ij de las
neuronas de la malla, segn una regla de aprendizaje no supervisado, hasta conseguir una
malla ordenada topolgicamente, en el que cada neurona est especialmente
sensibilizada en un dominio de la seal de entrada.
La modificacin de los pesos ij se realiza selectivamente de acuerdo al siguiente
criterio: Al encontrar el nodo ganador, se modifica el peso de ste y de todos aquellos que
se encuentran dentro del conjunto de vecindad definido (verdadera aportacin de Kohonen
en el aprendizaje competitivo). El nodo ganador es el nodo de la malla que, en alguna
mtrica, est ms cerca o mejor casa con la entrada que se presenta en el ciclo de
modificacin (aprendizaje).
El algoritmo de Kohonen puede ser expresado por un conjunto de pesos, los
cuales se repiten iterativamente hasta conseguir un orden topolgico en la capa de
competicin (fase de aprendizaje). Una vez conseguido el orden, se continua aplicando el
algoritmo para afinar los pesos de los nodos ya ordenados (fase de convergencia). En esta
etapa, la topologa de la red se preserva, esto es, el mapa conserva su distribucin a pesar
de continuar sometiendo a la red, a nuevos ciclos de aprendizaje.
Los pasos del algoritmo son:
1.Inicializacin de los pesos: En un principio, t = t0, la red se encuentra en un
estado inicial desordenado, los pesos de los nodos de la capa de competicin
toman valores aleatorios.
DISAM-UPMT-98-015
151
Carlos Platero
( 5.1 )
4.Modificacin de los pesos: Los pesos de los nodos de la capa de competicin son
modificados segn la ley de aprendizaje
M i t + 1 = M i t + hci t X t M i t
( 5.2 )
152
DISAM-UPMT-98-015
Carlos Platero
r c ri
h ci ( t ) = ( t ) e
(t )
( 5.3 )
Los mapas obtenidos son nicos, en el sentido de que a partir de pesos iniciales
distintos, la respuesta sea siempre la misma ?
Cmo definir los mejores mapas, tal que stos cumplan con el objetivo de ser
fiel reflejo del espacio de entrada sobre una dimensin reducida ?
Estas cuestiones que aqu son emplazadas caen dentro de la discusin terica de las
SOM, que lleva ms de una dcada buscando respuestas. Segn Kohonen [Kohon95], hay
cuatro clases de problemas en las discusiones sobre los mapas auto organizados.
1. Ordenamiento topolgico de los mapas
2. Convergencia de los vectores de referencia, Mi.
3. Funcin de densidad, p(X), versus vectores de referencia
4. ptima funcin de vecindad, hci, y factor de aprendizaje
Las respuestas que se tienen a estas preguntas son parciales, especialmente en un
sentido estrictamente matemtico. Se han hecho diferentes esfuerzos con diversos mtodos
DISAM-UPMT-98-015
153
Carlos Platero
J = i i 1 N 1
i =2
( 5.4 )
Las tcnicas de Markov se utilizan principalmente para el estudio de la auto organizacin. Se trata
de aplicar los resultados conocidos de la teora de Markov al proceso de organizacin topolgica. As, para la
prueba de auto organizacin, lo que se pretende es probar la existencia de un estado absorbente, al cual en el
proceso de aprendizaje de los vectores de referencia, entrarn en el estado ordenado con probabilidad uno
despus de un tiempo determinado.
154
DISAM-UPMT-98-015
Carlos Platero
vez el conjunto ordenado, ste no podr ser desordenado aunque existan etapas de
actualizacin
Para mayores dimensiones es muy difcil definir un orden topolgico. Por lo menos
as lo han mostrado los diversos trabajos, en lo que para cada sugerencia hecha de la
funcin J, siempre se ha encontrado un contraejemplo que contradice la existencia de un
estado absorbente.
Al menos lo que s siempre se ha cumplido en las SOM, es que el orden refleja
propiedades de la funcin de densidad de la variable de entrada, p(X). Parece que debera
definirse el concepto de orden, en trminos de minimizar alguna condicin expresada
como funcin de error medio esperado entre la distribucin de los vectores de referencia y
p(X). Efectivamente, en las pruebas constructivas y para el caso especfico de igual
dimensin en el espacio de entrada y en la malla, el ordenamiento est ligado al
compromiso geomtrico de los nodos con la variable de entrada.
DISAM-UPMT-98-015
155
Carlos Platero
{ X Mi }
i
( 5.5 )
p(X) dX
( 5.6 )
( 5.7 )
156
X 2 p X dX
( 5.8 )
DISAM-UPMT-98-015
Carlos Platero
J J
J
m J =
,
,...,
=0
n
1 2
( 5.9 )
( 5.10 )
( 5.11 )
Robbins y Monro probaron que esta secuencia converge con probabilidad uno hasta
el ptimo local de M*, para la cual J es mnimo, si y solo si, se cumplen las siguientes
condiciones:
( t ) = ,
t =0
(t ) <
t =0
( 5.12 )
( 5.13 )
DISAM-UPMT-98-015
157
E =
Carlos Platero
X M c p X dX
( 5.14 )
=0
( 5.15 )
En el caso ms simple de hci(t), donde fuese declarado como 1 para aquellos nodos
que perteneciesen al conjunto topolgico de Nc y nulo para el resto, el vector de referencia
se posicionar:
Mi =
Xp X dX
Vi
p X dx
Vi
( 5.16 )
donde Vi es el conjunto de todos los valores de X que han actualizado al vector Mi.
Estas condiciones de equilibrio significan que cada Mi* debe coincidir con el centroide de
su regin de influencia, ms aun, representa el centroide de p(X) sobre la parte la regin
que le ha tocado dominar. ste podra ser definido como el estado ordenado.
Intuitivamente deja claro que para cualquier dimensin, el equilibrio slo podra
conseguirse con una particular configuracin de Mi.
5.1.1.5
Mosaico de Voronoi
158
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
159
Carlos Platero
> t1, pero que la aportacin a sus correspondientes neuronas deberan ser las mismas, por
ser presentadas en el mismo orden, aunque eso si, separado en el tiempo, la ley de la
secuencia podra estimarse de diferentes ritmos de aprendizaje para cada una de ellas. Si
adems deben cumplir los requisitos de aproximacin estocstica del proceso, ( 5.12 ), una
propuesta correspondera a :
c (t + 1) =
c (t )
1 + c (t )
( 5.17 )
(t ) =
A
B+t
( 5.18 )
donde A y B son unas constantes elegidas. Al menos esta forma satisface las
condiciones de aproximacin estocstica. La principal justificacin es que las muestras
ms recientes son consideradas dentro del entorno de evolucin.
5.1.1.7 Efecto de la forma de la funcin de vecindad
Para una buena fase de ordenacin es imprescindible empezar con radios de
vecindad de la mitad de la red, Nc(0), evitando la aparicin de mapas configurados
metaestables, recibiendo este nombre cuando la distorsin media esperada o error de
cuantizacin cae dentro de un mnimo local y no global.
Erwin et al.[Erwin92] han analizado los estados metaestables en mallas de una
nica dimensin, definiendo que una funcin de vecindad es convexa dentro de un cierto
intervalo I{0,1,2,...N}, si las condiciones s-q>s-r y que s-q>r-q implican que
[h(s,s) + h(s,q)] < [h(s,r) + h(r,q)] para todo s,r,q I, en caso contrario la funcin de
vecindad es cncava.
El principal resultado que obtuvieron fue que si la funcin es convexa no existen
estados que no estn ordenados, mientras que con el uso de funciones cncavas aparecen
estados metaestables que podran relentizar el proceso de ordenamiento. Por lo tanto, si en
el principio del proceso se utiliza una funcin de vecindad convexa, el ordenamiento es
160
DISAM-UPMT-98-015
Carlos Platero
casi seguro, y posteriormente la funcin de vecindad puede ser contraida para mejorar la
aproximacin a p(X).
5.1.1.8 Factor de magnificacin
Desde el punto de vista de los mapas biolgicos cerebrales, existe correspondencia
entre el volumen de informacin a representar y la densidad de clulas receptoras,
definindose factor de magnificacin como el nmero de neuronas por unidad de rea.
Algo similar sucede en los SOM, donde el rea reservado en la representacin de los
patrones es proporcional a la frecuencia estadstica de la ocurrencia del patrn en las
observaciones.
Ritter et al. [Ritte88] han analizado el factor de magnificacin en mapas
unidimensionales con gran cantidad de vectores de referencia sobre un rea finita. Si N es
el nmero de vecinos incluidos en el conjunto de vecindad, se demuestra que la densidad
de vectores de referencia es proporcional a p(X)r, donde el exponente es
r=
2
1
2
3 3N + 3( N + 1)
( 5.19 )
Obsrvese que para N=0, caso VQ, la densidad de vectores se aproxima con un
valor bajo, r = 1/3, considerndolo como un handicap. En cambio, si N tiende a ser elevado
r2/3 ms prximo a la concepcin hipottica de ordenacin, segn modelos biolgicos.
Por ltimo, si en la fase de convergencia ya no es tan importante el ancho de
vecindad, especialmente si es utilizado un kernel gaussiano, se puede llegar al caso
extremo de topologa de orden cero, es decir, slo el ganador es actualizado. Sin embargo,
la falta de interaccin con los vecinos, en esta fase de aprendizaje, puede llevar a
situaciones de prdida del estado de ordenamiento. Concluyendo, debe existir un
compromiso entre la mejor aproximacin a la funcin de densidad p(X), cuyo mejor caso
es el VQ, y la estabilidad del ordenamiento, para lo que se hace necesario mantener las
interacciones con los vecinos.
5.1.2
DISAM-UPMT-98-015
161
Carlos Platero
5.2
162
DISAM-UPMT-98-015
Carlos Platero
5.2.1
DISAM-UPMT-98-015
163
Carlos Platero
Mtodo U-Matriz
Ultsh y Siemon proponen utilizar un mtodo complementario al algoritmo del
SOM, que es el clculo de la matriz llamada U-Matriz; permitiendo obtener un mapa
superpuesto al SOM que remarque ms la distribucin del vector.
164
DISAM-UPMT-98-015
Carlos Platero
Para cada unidad aij del mapa auto organizado se definen cuatro tipos de distancia a
sus inmediatos vecinos.
d x (i, j ) = d (u i , j , u i +1, j )
d y (i, j ) = d (u i , j , u i , j +1 )
( 5.20 )
d xy (i, j ) = d (u i , j , u i +1, j +1 )
d yx (i, j ) = d (u i , j +1 , u i +1, j )
Y se propone la siguiente matriz que combina las cuatro distancias con una
dimensin de 2 n 1x 2 n 1 como sigue:
2j-1
2j
2j+1
2i-1
dz (i,j-1)
dy(i-1,j)
dz(i-1,j)
2i
dx(i,j-1)
du(i,j)
dx(i,j)
2i+1
dz(i,j-1)
dy(i,j)
dz(i,j)
DISAM-UPMT-98-015
165
Carlos Platero
5.3
166
DISAM-UPMT-98-015
Carlos Platero
regiones existentes entre los datos, as a cualquier grupo en n le corresponde una regin
sobre el mapa. No obstante, el uso de los mapas de Kohonen como tcnica de anlisis es
incompleta, al desaparecer la distancia eucldea entre los datos.
Ultsh et al [Ultsh90] proponen utilizar un mtodo complementario al algoritmo del
SOM, que es el clculo de la llamada U-Matriz. ste permite obtener un mapa superpuesto
al SOM que remarque ms la distancia en el espacio de medidas. No obstante, en las
observaciones experimentales, los resultados no fueron los esperados, al no encontrar de
forma ntida y clara las fronteras entre cluster.
En los prrafos anteriores, han sido comentadas las caractersticas de los mapas de
Kohonen, y al hablar sobre la convergencia, se expona la idea de que los vectores de
referencia se encaminan a representar la funcin de densidad de la variable de entrada,
p(X). Llegndose a indicar por Kohonen, que los vectores de referencia tienden a ser los
centroides de los conjuntos de Voronoi, esgrimindose la expresin:
Xp X dX
Ui
Mi =
p X dX
( 5.21 )
Ui
pX =
pX
j =1
p j
( 5.22 )
hj
X p X j p j dX
j =1
Ui
( 5.23 )
min
Ui
DISAM-UPMT-98-015
mj
Mi X
p X
j =1
p j dX
( 5.24 )
167
Carlos Platero
M i X p X j dX
( 5.25 )
Ui
siendo j la nica clase que cae dentro de Ui. Por ltimo, quedar conocer cual es la
parametrizacin ptima a considerar y en funcin de sta el nmero de parmetros a
determinar, quedando reflejado en:
min
M i X p X j 1 j 2
jr dX
Ui
( 5.26 )
min M i X p X j 1 j 2
i = 1 Ui
rn dX
( 5.27 )
168
DISAM-UPMT-98-015
Carlos Platero
Distribuciones multinormales
Se considera una de la ms importante de las distribuciones multivariantes. Es una
generalizacin n-dimensional de la normal univariante. En general, se asimilan a esta
distribucin conjuntos de variables tales como bateras de tests psicolgicos, medidas
biomtricas, variables socioeconmicas, etc. En Reconocimiento de Formas, es una de las
distribuciones ms utilizadas. Las causas son mltiples, algunas razones a destacar son, la
aplicacin del teorema de valor central, tal como se vio en la deteccin de defectos, la
facilidad del diseo de clasificadores, la aplicacin de la distancia de Bhattacharrya como
lmite superior del error de Bayes, las sencillas expresiones del sesgo y la varianza para
distribuciones normales, etc.
Se dice que las variables aleatorias x1,....,xn siguen una distribucin normal, si
existen n variables independientes y1,...,yn ,con distribucin N(0,1), verificndose :
xi = mi + ai1 y1 + + ain yn
i =1
( 5.28 )
DISAM-UPMT-98-015
169
Carlos Platero
( 5.29 )
X = AY + M
ci , j = E ( xi mi ) x j m j
)} = E a
ih
yh a jk yk =
k
n
E aih a jk yh yk = aih a jh
h ,k
h =1
( 5.30 )
= AAT
La funcin de densidad conjunta de x1,..., xn es
f ( x1 ,..., x n ) =
(2 )
n/2
1/ 2
exp ( X M ) T 1 ( X M )
2
( 5.32 )
siendo X = (x1,..., xn)T. Indicando tambin Y= (y1,..., yn)T, como las variables
independientes y1,..., yn, su funcin de densidad conjunta es:
f ( y1 ,..., y n ) =
1
1
exp Y T Y
n/2
(2 )
2
( 5.33 )
170
1/ 2
. Entonces
( 5.34 )
DISAM-UPMT-98-015
Carlos Platero
( 5.35 )
DISAM-UPMT-98-015
171
Carlos Platero
H
1 P
i =1
( 5.36 )
172
DISAM-UPMT-98-015
Carlos Platero
P( H1 ... H n ) 1 n
( 5.37 )
( 5.38 )
en la hiptesis de que estos valores provienen de una distribucin normal con media
y varianza 2, los valores estandarizados
x1
x2
xN
( 5.39 )
sern una muestra ordenada de una poblacin N(0, 1), cuyos valores estn
tabulados. Sea Ci,N el valor esperado del trmino que ocupa el lugar i en una muestra de
tamao N de una poblacin normal, es decir :
x i
E
= Ci N
( 5.40 )
entonces :
DISAM-UPMT-98-015
173
[ ]
E x i = + Ci N
Carlos Platero
( 5.41 )
Por tanto, el grfico de x(i) respecto a Ci,N ser, aproximadamente una recta cuya
ordenada en el origen estimar y con pendiente . La expresin de los coeficientes de
Ci,N es complicada, pero puede aproximarse por :
i3 8
Ci N = 1
N + 1 4
( 5.42 )
x i Ci N
r 2 = i =1 N
N Ci2N
i =1
( 5.43 )
1 h
A2
w=
xj =
a x
N 2 j =1 j n N j +1
N 2
( 5.44 )
aj N =
Cj N
N
C
j =1
jN
( 5.45 )
Shapiro y Wilks han tabulado los valores exactos de aj,N sin utilizar la
aproximacin de ( 5.42 ). Las pruebas experimentales fueron realizadas mediante la
insercin de dichas tablas.
174
DISAM-UPMT-98-015
Carlos Platero
Inicializacin :
A.
Construccin de un vector gua formado por las caractersticas del espacio, V
B.
Inicializar V = [ 0 ], luego dimensin 1, dim(V) = 1.
C.
Definir la dimensin mxima del espacio, n
Mientras dim(V) sea distinta de cero
A.
Incrementar en uno V(1)
B.
Test de normalidad en las dos poblaciones,
C.
Si el min(1, 2) > c hacer II.D en caso contrario saltar a II.E
D.
Aumentar la dimensin del vector V con dicha componente V(1),
0
E.
V=[ V(1) V ]
F.
Si la dimensin de V es igual a n, eliminar la primera componente de V
3
4
5
G.
Saltar a II
II.
5 3
Figura
5.16
bsqueda
rbol
DISAM-UPMT-98-015
de
175
Carlos Platero
Transformaciones normalizantes
Se sabe que slo una transformacin lineal de las variables X con distribucin
normal multivariante da lugar a otra distribucin del mismo tipo. Sea entonces una familia
de transformaciones
X = x1
xn X
= x11
xnn
( 5.46 )
= 0 (lineal)
Rechazar H0 quiere decir que existe una transformacin no lineal tal que X() es
normal multivariante y por tanto significa rechazar la normalidad de X.
Si X es un vector aleatorio que no sigue una distribucin normal, existe una potente
familia de transformaciones no lineales estudiada por Andrews et al[Andre71], capaz de
normalizar los datos observados, siendo una generalizacin de las transformaciones
univariantes Box Cox[Box64]. Cada transformacin viene definida por el vector de
parmetros, = (1, , n)T, de la siguiente forma
x jkk
x jk + m K 1
=
k
x jk + m
para k 0
para k = 0
( 5.47 )
176
DISAM-UPMT-98-015
Carlos Platero
x =
( 5.48 )
lim x ( ) = lim
0
( 5.49 )
La relacin entre el modelo para los datos originales X y para los transformados
ser :
f X = f X
( 5.50 )
J X
J
k =1
=
k =1 j =1
dx jk k
dx jk
=
k =1
x
j =1
k 1
jk
( 5.51 )
n 2
1
X j M
1 X j J X
( 5.52 )
DISAM-UPMT-98-015
177
LM =
1 2
n 2
j =1
Carlos Platero
T 1
X j X j J X
2
( 5.53 )
1 N
traza 1 X j X j
2 j =1
N
L =
2
}+
J X
( 5.54 )
= x1 1
1
=
N
x n n con
i =1
xk k =
1
N
x
j =1
Xi M Xi M
k
jk
( 5.55 )
( 5.56 )
N
2
J x
( 5.57 )
Esta funcin slo depende de y los datos originales X. El siguiente paso consiste
en hallar el mximo de L() mediante algn algoritmo numrico.
Definiendo X() como la matriz de N x n de datos transformados
L =
N
2
I n 1N 1N T
N X
J x
( 5.58 )
178
DISAM-UPMT-98-015
Carlos Platero
Lmax =
Demostracin :
N
2
Z T I n 1n1n T
Definiendo
N Z
( 5.59 )
( J 11 N
diag
J1n N )
as
que
N
2
D 1 D T I N 1N 1N T
N X
D 1 D +
J x
( 5.60 )
( 5.61 )
Demostracin:
q j = sj 1 J j1
I N 1N 1TN Z
= S 2 Z T I N 1N 1TN Z
Escribiendo X = x1
xn tal
= J
1 n
j
xj = xj
que
N
x
i =1
( 5.62 )
ij
j 1
sj ,
llamando
= snj 1 j J j x j . Por lo
con:
DISAM-UPMT-98-015
179
Carlos Platero
Z = Z S 1 + 1n Q T
( 5.63 )
Determinacin de
5.3.5
( 5.64 )
L
= n M
r
180
Zr T (Wr r ) AZ
( 5.65 )
DISAM-UPMT-98-015
Carlos Platero
2L
= n M
2 r
2L
= n M
r s
[Z
T
r
[Z
T
rs
(W ) AZ (W ) + Z
r
(W
AZr (U r r
)]
( 5.66 )
)]
( 5.67 )
j y
x jk x jk k
w jk =
x jk
k2
( 5.68 )
x
+
k
jk
x jk
+ xlk
l =1
k
1 N
(x
k
jk
x jkk
x jk
J 1k n
w jk
5.3.6
1 N
J1k n
2 x jk k x jkk
k
jk
xlk
l =1
k
jk
xlk
l =1
1 N
( 5.69 )
+ L
+1
TH
L L
2
DISAM-UPMT-98-015
( 5.70 )
181
Carlos Platero
( 5.71 )
( 5.72 )
1 2
L L
2 n
( 5.73 )
que implica:
^
L()
L()
182
DISAM-UPMT-98-015
Carlos Platero
5.4
Apariencia
Causa
Exceso de grafito
Adhesiones (St)
Insuficiente lubricacin
Bandas brillantes(Br)
Presencia de burbujas
Incremento de temperatura
Atascamiento de tolva
DISAM-UPMT-98-015
183
5.4.1
Carlos Platero
184
Figura 5.18
Asociacin de objetos a un
elemento terminal
DISAM-UPMT-98-015
Carlos Platero
Por cada defecto se tendr un rbol de informacin, en el que cada nodo de este
rbol, estarn presentes los elementos terminales y la informacin de medio nivel, de cada
una de las regiones de imagen de inters implicados en el defecto. La figura 5.19 muestra
la forma de actuar con dos tipos de defectos.
Llegado a este punto se tendr una coleccin de
elementos terminales dispuesta a ser analizada por los
clasificadores basados en reglas de concatenacin, pero
tambin es requerido un vector de caractersticas para los
clasificadores basados en datos. Se necesita aplicar una
transformacin desde la agrupacin secuencial de
elementos terminales a un vector de caractersticas con
dimensin n.
Si la representacin de los objetos mediante
elementos terminales es posible y fiable, para el caso aqu
tratado as lo muestran las representaciones virtuales y los
Figura
5.19
Ejemplos
de
resultados de los clasificadores sintcticos, stas se pueden descripcin de defectos mediante
convertir en fuentes de entrada para clasificadores basados elementos terminales
en un vector de caractersticas. Luego, la idea es condensar
la informacin de elementos terminales en un vector. Para tal fin, se puede hacer uso de las
reas asociadas a cada tipo de elementos terminales, momentos de inercia, suma de
permetros de los elementos terminales y otras posibles caractersticas que pudieran
integrar el vector de caractersticas.
Este mtodo ofrece mltiples ventajas. Primero si hay fiabilidad de la
representacin de los objetos mediante elementos terminales, la informacin generada es
infinitamente menor y por ende el vector de caractersticas tiene una dimensin muy
reducida.
Segundo, la calidad del vector de caractersticas viene determinado por la calidad
de informacin de los elementos terminales. La informacin de los elementos terminales es
de un nivel muy superior a los descriptores clsicos pues tiene informacin de la estructura
del defecto (si es alargado, tiene bandas, su situacin espacial,...).
Tercero, el vector de caractersticas se forma una vez que se tiene detectado la
totalidad del defecto. No hay un vector de caractersticas por cada imagen obtenida sino
por la globalidad de imgenes que constituyen el defecto.
Cuarto, las caractersticas son muy homogneas si se utilizan criterios comunes en
la seleccin de stas. Por ejemplo, la suma de las reas de cada uno de los elementos
terminales existentes.
Quinto, la dimensin del vector de caractersticas es muy pequea, ya que la
informacin contenida en cada uno de los elementos, es una informacin cualitativa y no
DISAM-UPMT-98-015
185
Carlos Platero
186
DISAM-UPMT-98-015
Carlos Platero
5.4.2
xij x j
( 5.74 )
Al utilizar los mapas de Sammon [SAMM69] para determinar la relacin nx/ny del caso que ocupa,
resulto ser de 28/23 y se probaron las combinaciones 7x5, 7x6, 8x6 y 8x7. Finalmente se escogi la
dimensin 8x6 por el menor error de cuantizacin
DISAM-UPMT-98-015
187
Carlos Platero
Tr Tr Lo Lo La La La La
Tr La Lo Lo La La La St
Tr Lo Lo Lo XX La La La
Tr Tr Lo Lo La La La St
Tr Tr XX Cr XX Cr XX St
Tr Tr Lo Cr St Cr St
Tr Tr YY Lo La La La La
Tr YY Lo Lo La La La St
Tr Lo Lo Lo XX La La La
Tr YY Lo Lo La La La YY
Tr Tr XX Cr XX Cr XX St
St
Tr Tr Lo Cr YY Cr St
St
188
DISAM-UPMT-98-015
Carlos Platero
Tr Tr YY Ar Ar La La La
Tr Tr Tr Ar Ar La La La
Tr YY Lo Ar La La La Br
Tr La Lo Ar La La La Br
Tr XX Lo Lo XX La La La
Tr Ar Lo Lo XX La La La
Tr YY Ar Ar Lg Lg Lg YY
Tr Tr Ar Ar Lg Lg Lg St
Tr Tr XX Cr XX Cr XX St
Tr Tr XX Cr XX Cr XX St
Tr Tr Lo Cr St Cr St
Tr Tr XX Cr YY Cr St
St
St
Estos mapas de rasgos han servido para detectar diferentes zonas de influencias
correspondientes a topologas de defectos similares. Desde el punto de vista del
Reconocimiento de patrones, los mapas de Kohonen han permitido empezar a conocer la
estructura inherente de los patrones.
La cuestin siguiente a abordar es la delimitacin de las regiones o dominios en el
espacio de entrada, que se correspondan con patrones similares, los cuales constituyan un
grupo homogneo. Esta informacin no est de manera explcita en los mapas, se propone
un proceso de decantacin de cluster basados en las U-Matriz de Utls et al combinadas con
descripciones de los patrones y pruebas de normalidad.
dz11
dy12
dz13
dx21
du
dx23
dz31
dy32
dx21
dz33
Figura
5.25
U-Matriz
entrenamiento rectangular
5.4.3
dy11
du
dy31
con
dy12
dx22
dy32
DISAM-UPMT-98-015
189
Carlos Platero
rectangulares, los autores proponen un valor medio de las distancias eucldeas entre
neuronas situadas en posiciones diagonales en forma de aspa (ver Figura 5.25), siendo sta
la interpretacin geomtrica de dz, correspondiente a la influencia colateral del
aprendizaje rectangular. Pero en el proceso de entrenamiento hexagonal, tales influencias
no existen, las neuronas presentan una agrupacin ms homognea, sus relaciones con las
vecinas son indistintas (ver prrafo sobre el estudio de la vecindad 5.1.1.7), no teniendo
necesidad de considerar evaluaciones distintas en la distribucin espacial; justificando la
modificacin en la obtencin de la U-Matriz, en cuanto que los elementos de la matriz
estarn formadas por las distancias de la neurona aij a sus vecinas, sin consideraciones de
valores promediados en las vecindades diagonales (Figura 5.24,Figura 5.25 ).
El resultado de aplicar los conceptos de la U-Matriz modificada sobre el mapa auto
organizado es mostrado en Figura 5.26. Una primera observacin muestra que los bordes
de separacin no son ntidos, pero s empieza a sugerir una versin preliminar de mapa de
rasgos. Es interesante apreciar cmo las neuronas etiquetadas como confusas, aparecen
rodeadas de grupos, confirmando las suposiciones anteriores de servir estas neuronas,
como remansos de las funciones de densidad de grupos prximos.
190
DISAM-UPMT-98-015
Carlos Platero
apreciarse las probabilidades del defecto y el tanto por ciento de vectores de referencia
etiquetados como tal tipo ( efecto factor magnificacin ).
Denominaci
n del defecto
Probabilida
d del
defecto
Vect.Ref.Eti
q/Vect.Total
es
Tr
24
23
Lo
28
26
La
26
31
Cr
12
10
St
11
10
de
Denominacin
del defecto
Probabilidad
del defecto
Vect.Ref.Etiq/V
ect.Totales
Tr
24
23
Lo
12
15
Ar
14
11
La
24
26
Lg
Cr
12
10
Br
St
DISAM-UPMT-98-015
191
Tamao
Forma
Carlos Platero
De Oscuro a Claro
192
DISAM-UPMT-98-015
Carlos Platero
Nmero del
cluster
Nmero de
neuronas
Descripcin
U-Min/U-Max
U-Min/U-Max
0,1,8
0.24/ 0.67
0.4/0.9
16,24,32,33,40
0.44/0.67
0.78/1.62
41
-/-
0.95/2.18
4a,b
3,4,10,11,18,19
0.25/0.84
0.62/1
26,27
0.48/0.48
0.78/1.96
5,6,7,12,13,14,21
,22,23
0.39/1
0.68/1.9
28,29,30
1.19/1.37
0.92/4.06
35,43
1.32/1.32
0.85/1.53
37,45
2.37/2.37
2.38/3.36
10
39,46,47
1.65/3.19
2.33/3.36
11
15
-/-
0.83/0.96
DISAM-UPMT-98-015
193
Carlos Platero
194
DISAM-UPMT-98-015
Carlos Platero
i = 1,2,... nk
( 5.75 )
Nombre
Componentes
Observaciones
Tr1
1,2,3,4,5 y 13
Tr2
1,2,3,4,5 y 13
Tr3
1,2,3,4,5 y 15
Manchas oscuras
4a.b
Ln1
1,2,3,4,5,11 y 17
Ln2
1,2,3,4,5,11 y 17
Lk1
1,2,3,4,5,6,7,8,9,10,15 y 16
Lk2
1,2,3,4,5,6,7,8,9,10,11,
14,15,16,17
Cr1
1,2,3,4,5,11 y 17
Cr2
1,2,3,4,5,6,7,8,9,10,11,
12,13,16,17,18
10
St2
11
St1
6,7,8,9,10 y 14
5.4.5
DISAM-UPMT-98-015
195
Cluster
= 0.2
= 0.15
= 0.1
12
4a,b
15
10
16
11
18
de
Carlos Platero
los
196
DISAM-UPMT-98-015
Carlos Platero
5.5
Conclusiones
Se ha presentado una nueva metodologa de clustering paramtrico que empieza en
este captulo con el anlisis de los datos y finaliza en el siguiente con la seleccin de las
caractersticas y su parametrizacin. Su fundamento est en los mapas auto organizados, en
la parametrizacin del espacio mediante funciones normales y en las transformaciones Box
Cox. Se ha utilizado la clasificacin de los defectos locales en planchas de aluminio para
el desarrollo experimental.
Partiendo de una coleccin de muestras etiquetadas de defectos locales en planchas
de aluminio, se procedi a segmentacin de los defectos y a una extraccin de
caractersticas mediante tcnicas de anlisis sintctico. Posteriormente se pas a la
conversin de la informacin desde primitivas a un vector de L-dimensin, habindose
hecho la eleccin de las oportunas componentes.
El etiquetamiento de los defectos fue realizado mediante la percepcin visual de
stos y bajo las consideraciones oportunas de clasificacin dadas por el fabricante del
aluminio. As pues, se parte de una base de conocimiento etiquetada a cinco y ocho
defectos. Ahora bien, los defectos en una misma clase mantienen topologas bien
diferenciadas, lo que supone que los vectores de medidas no mantienen la misma situacin
en el espacio de caractersticas, efecto que ha podido ser estudiado mediante los mapas
auto organizados. Estos mapas de rasgos han servido para detectar diferentes zonas de
influencias correspondientes a topologas de defectos similares. Desde el punto de vista del
Reconocimiento de formas, los mapas de Kohonen han permitido conocer la estructura
inherente de los patrones, de lo que se ha comentado en esta tesis medianamente. No
obstante, la formacin de cluster no es inmediata a partir de la informacin otorgada por
dichas neuronas, ms bien es el principio; Ults et al proponen las U-Matriz como elemento
de apoyo en la formacin de los clusters en los patrones. La experiencia ha mostrado que si
bien es una buena herramienta, en este caso no decide de forma evidente las fronteras entre
los grupos; se podra decir que las fronteras obtenidas son difusas y no tan evidente como
exponen en sus artculos. Adems, sus propuestas van orientadas a matrices rectangulares y
es recomendable hacer uso de aprendizajes con vecindades hexagonales, pues la literatura
recomienda este entorno de vecindad para la formacin de mapas de rasgos; as que se ha
utilizado una nueva versin de las U-Matriz aplicada para vecindades hexagonales.
De otro lado, Kohonen propone para el etiquetamiento de las neuronas un proceso
de votacin de las muestras de aprendizaje y que de forma $democrtica las neuronas se
etiqueten con aquellas clases que ms votos hayan conseguido. La propuesta aqu hecha es
diferente, slo sern etiquetadas aquellas neuronas que hubieran conseguido unanimidad.
La razn es evidente, como es conocido, sus vectores de referencia son distribuidos
estadsticamente segn el espacio de medidas. Luego, si se parte de vectores de referencia
bien definidos, el entrenamiento habr generado regiones del espacio de entrada
dependiente de algn grupo inherente, por lo que los entornos de Voronoi pertenecientes a
neuronas etiquetadas con varias clases, correspondern con zonas de conflicto, en
definitiva que dentro de su regin de influencia, hay concurrencia de varias clases. La
experiencia ha corroborado con las suposiciones.
DISAM-UPMT-98-015
197
Carlos Platero
198
DISAM-UPMT-98-015
Carlos Platero
Clasificadores estticos
DISAM-UPMT-98-015
199
Carlos Platero
tratan de obtener las ecuaciones tanto de los parmetros para su diseo como de los
resultados obtenidos, expresndose stos en trminos de error de clasificacin.
Seguidamente se presenta un novedoso mtodo de parametrizacin - seleccin de
las caractersticas basada en las transformaciones Box Cox y en las distancias de
Bhattacharyya (6.3). El algoritmo considera el nmero de muestras que se tiene de las
poblaciones enfrentadas.
Dentro de los clasificadores no paramtricos y enmarcado en el contexto de
clasificadores lineales y cuadrticos, se estudia y se propone una modificacin de los
algoritmos de aprendizaje LVQ, pasando de la distancia eucldea a la Mahalanobis (6.4).
Por ltimo, la plausibilidad de lo propuesto ha sido demostrada en el trabajo
experimental para la deteccin de defectos locales en el aluminio colado (6.5), donde se
comparan los resultados obtenidos con otras tcnicas tradicionales de clasificacin.
6.1
Clasificadores paramtricos
Los clasificadores paramtricos se muestran como los clasificadores ptimos, al
minimizar la probabilidad de error [Fukun90]. Sin embargo, requieren del conocimiento de
la funcin de densidad de la seal de entrada, p(X), y en la mayora de las aplicaciones, las
funciones son estimadas por un nmero finito de observaciones, que en general resultan
insuficientes.
An en el caso de conocer la funcin de densidad, la implementacin suele ser
difcil por falta de metodologa. No obstante, el objetivo de parametrizar el espacio
encamina tanto a facilitar la introduccin de conocimiento a priori como a la seleccin de
las caractersticas. La primera por tener la intencin de buscar las transformaciones Box
Cox que permitan modelar las funciones de distribucin condicionales como funciones
normales, y la segunda por conocer el error de clasificacin mediante expresiones
analticas.
Desde el punto de vista de Bayes, el mejor clasificador que minimice el error ser
aquel que cumpla
p k p X k = max( p i p X i
i
X k
( 6.1 )
200
DISAM-UPMT-98-015
Carlos Platero
1
min h(X ) = 2 (X M )
i1 (X M i )
( 6.2 )
min h(X ) = M iT 1 X M iT 1 M i
i
2
( 6.3 )
X i
[hii es excluida ]
( 6.4 )
h12= 0
h13= 0
regin
de
rechazo
h23= 0
3
h =0
x
entradas de signo hij, como muestra la Figura 6.2.
34
DISAM-UPMT-98-015
201
Carlos Platero
i = 1 pr hi1 X > 0
1
ph
i1
hi1 X > 0 X i =
hi1 X i dhi1 dhiL
[h
ii
( 6.5 )
el error total es
p
i =1
( 6.6 )
AND
hiL
clasificador
202
DISAM-UPMT-98-015
Carlos Platero
tal que minimice de ( 6.6 ). La dificultad de obtener una solucin explcita del error sobre
los parmetros de h(X), hace necesario recurrir al clculo numrico. Incluso para
distribuciones normales la solucin no es fcil. Este proceder ser utilizado para el diseo
de h(X), lineales o cuadrticos, con enfrentamiento entre dos grupos.
3.Diseo de clasificadores tomados a pares, utilizando las tcnicas tradicionales que
L
sern expuestas a continuacin en el apartado 6.1.1. funciones discriminantes sern
2
calculadas para cada regin y posteriormente se determinar la clasificacin mediante ( 6.4
). Las regiones vendrn definidas por la etapa de clustering paramtrico, basadas en las
exposiciones del anterior captulo y en las que se va a ver seguidamente para la
decantacin definitiva del cluster.
A continuacin se expone la teora del diseo de clasificadores paramtricos
tomados en grupos de dos. Se desarrollan los conceptos bsicos para determinar en primer
lugar, la expresin de error para clasificadores cuadrticos y lineales cuando las funciones
de distribucin son normales, prrafo 6.1.2, en segundo lugar, se estudian los criterios para
el diseo de los clasificadores cuadrticos y lineales (6.1.3). Para continuar seguidamente
con la influencia del nmero de muestras en el diseo de los clasificadores.
6.1.1
p 1 p X 1
> p
<
p X 2
p X 1
"X =
p X 2
> p
< p
( 6.7 )
h( X ) = ln "( X ) = ln p( X | 1 ) + ln p( X | 2 ) > ln
<
2
DISAM-UPMT-98-015
p( 1 )
p( 2 )
( 6.8 )
203
Carlos Platero
( 6.9 )
( 6.10 )
L1
1 =
2 =
(h | 1 )dh
h
ln( p (1 ) / p ( 2 ))
ln( p (1 ) / p ( 2 ))
(h | 2 )dh
( 6.11 )
204
DISAM-UPMT-98-015
Carlos Platero
>0
<
hX
( 6.12 )
1 =
h ( X ) >0
( 6.13 )
1
j
( 6.14 )
1 =
1
2
1
1
=
+
2
2
1
j
j h
e
p X 1 d dX
e j h X
p X 1 d dX
j
( 6.15 )
2 =
p( X |
h ( X )< 0
=
=
)dX = F ( h( X )) p ( X | 2 )dX
1
2
( )
,X
1 1
2 2
1 j h ( X )
e
p( X | 2 )ddX
j
e j h ( X )
p ( X | 1 )ddX
j
,X
( 6.16 )
= p 1 1 + p 2 2
=
1
1
+
2 2
e jh X
j p X ddX
X
( 6.17 )
donde :
DISAM-UPMT-98-015
205
p X = p 1 p X 1
Carlos Platero
p 2 p X 2
( 6.18 )
expresin ( 6.17 ) deducida al ser p(1) + p(2) la unidad. Se observa que el error
es una funcin de h(X) y de p X , especificando el tipo de clasificador y la distribucin de
las variables, respectivamente.
Otra interpretacin del error puede ser dada desde la funcin caracterstica, Fi().
sta se define como :
Fi = E {e jh X i } = e jh X p X i dX = e jh p h i dh
X
( 6.19 )
esto es, Fi() puede ser obtenida o bien mediante la integracin n-dimensional de
X, o a travs de la integral unidimensional de h. Obsrvese que Fi() representa la
transformada de Fourier, excepto por el signo de j. Si se aplica el concepto de
antitransformada,
1
2
p h i =
F e
jh
( 6.20 )
o
p h i =
1
2
F e
i
jh
( 6.21 )
1
+ j en el dominio de Fourier, corresponder con el error de tipo 1, esto es con el
valor de 1:
1 =
1
2
1
1
F1 d =
j
2
p h
1
F e j h d h = 0 =
j 1
dh =
ph
dh
( 6.22 )
1
j en el dominio de Fourier, corresponde:
206
DISAM-UPMT-98-015
Carlos Platero
2 =
p h
dh =
ph
dh
( 6.23 )
Estas dos ltimas ecuaciones son ilustradas en la figura 6.3, donde se muestra como
los errores corresponden con las reas ocupadas desde el umbral hasta el segn sea
p(h|i).
( 6.24 )
DISAM-UPMT-98-015
207
6.1.2.1.1
Carlos Platero
1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
1
2
1
2
( )
p( )
p 1
( 6.25 )
y
pT X T =
( 2 )
n 2
1 2
T 1
2 X M T X M
( 6.26 )
AT T A = I
( 6.27 )
AT i A = Ki
i = 12
( 6.28 )
1 T 1
Y Y V TY + c
2
pT Y T =
1
( 2 ) n
1 T
2 Y Y
( 6.29 )
( 6.30 )
donde
V = K11D1 K21D2
208
( 6.31 )
DISAM-UPMT-98-015
Carlos Platero
c=
1 T 1
1
D1 K1 D1 D2T K21 D2 ) +
(
2
2
K1
K2
p(1 )
p(2 )
( 6.32 )
1
1
2
1
j v i
exp (1 j / i ) y i +
1 j / i
2
i =1
2
2
n
vi
exp
exp[ jc ]dY
2
(
1
j
/
)
i =1
i
2 vi2
1
=
exp
exp[ jc]
2
(
1
j
/
)
1
j
/
1
=
i
i
1
=
(2 )n / 2
( 6.33 )
1
la tercera tautologa se tienen n distribuciones normales N Y
.
1 j i 1 j i
Dependiendo de si el error es generado por h(X)>0 o h(X)<0, el error de clasificacin ser
computado como:
p(h | T )dh =
T = 1 + 2 = 00
p (h | )dh =
T
1 1
+
2 2
1 1
2 2
F1 ( )
d
j
F2 ( )
j d
( 6.34 )
AT 2 A =
A T ( M 2 M1 ) = L
( 6.35 )
DISAM-UPMT-98-015
209
= AT ( 11 21 ) A = AT A( I 1 ) AT
1
A = ( I 1 )
Carlos Platero
( 6.36 )
( 6.37 )
p( 1 )
1
1
c = LT 1 L ln ln
p( 2 )
2
2
( 6.38 )
vi =
li
i
( 6.39 )
Z = 1/2Y
( 6.40 )
quedando ( 6.40 )
1/ 2 I1/ 2 = I
1/ 2 AT ( M1 M 2 ) = 1/ 2 L
1/ 2 1/ 2 = I
( 6.41 )
= 1/ 2 ( I 1 ) 1/ 2 = ( I )
1
( 6.42 )
210
( 6.43 )
p ( 1 ) 1 T
p(1 )
1 T 1 / 2 1 / 2
1
1
L L ln ln
= L L ln ln
p ( 2 ) 2
p( 2 )
2
2
2
( 6.44 )
DISAM-UPMT-98-015
Carlos Platero
( 6.45 )
+ 2
, adems los dos grupos siguen distribuciones normales.
donde = 1
2
Utilizando similar procedimiento que en los clasificadores cuadrticos, es aplicado
diagonalizacin y desplazamiento, Y=AT(X-MT),
AT ( 1 + 2 ) A =
AT T A = I
( 6.46 )
definiendo Di como:
AT ( Mi M T ) = Di
i = 1,2
( 6.47 )
1
( 2 ) n
1 T
2 Y Y
( 6.48 )
( 6.49 )
donde
V = 1( D2 D1 )
DISAM-UPMT-98-015
( 6.50 )
211
c=
1 T 1
D1 D1 D2T 1 D2 )
(
2
Carlos Platero
( 6.51 )
1
1
1
(2 )n / 2
exp 2 ( y
i =1
2
j v i )
2 vi2
exp
exp[ jc ]dY
2
i =1
2 T
= exp
V V + j c
2
( 6.52 )
AT 2 A =
( 6.53 )
1 T
1
A ( 1 + 2 ) A = ( I + )
2
2
( 6.54 )
I +
L
V =
2
( 6.55 )
1
1 I +
L
c = LT
2 2
( 6.56 )
212
DISAM-UPMT-98-015
Carlos Platero
Y = AT ( X M 2 )
Z = 1/2Y
( 6.57 )
resultando
1/ 2 I1/ 2 = 1/ 2 1/ 2 = I
1/ 2 AT ( M1 M 2 ) = 1/ 2 L
( 6.58 )
( 6.59 )
1 + I 1/ 2
V =
L
2
( 6.60 )
1
1 + I 1/ 2
1
c = LT 1/ 2
L
2
2
( 6.61 )
DISAM-UPMT-98-015
213
Carlos Platero
= min[ p( 1 ) p( X | 1 ), p( 2 ) p( X | 2 )]dX
( 6.62 )
0s1
ab0
( 6.63 )
dicha ecuacin muestra que la media geomtrica de dos valores positivos es mayor
que la menor de stas. Si a < b, la expresin de la izquierda de ( 6.63 ) es a, mientras el
lado derecho puede ser escrito como a(b/a)1-s. Al ser b/a > 1 y 1-s 0, el margen derecho
ser mayor que el izquierdo. Viceversa, si a > b y reescribiendo b(a/b)s, est claro que el
lado derecho es mayor que el izquierdo al ser (a/b)s 1. Aplicando ( 6.63 ) en ( 6.62 ) el
lmite superior del error ser :
u = p 1 s p 2
1 s
pX
p X 2
1 s
dX
0s1
( 6.64 )
pX
p X 2
1 s
dX = e s
( 6.65 )
donde
s =
1
T
s1 s
M 2 M1 ) [ s1 + 1 s 2 ] ( M 2 M1 )
(
2
1 s1 + 1 s 2
+
1 s
s
2 1 2
( 6.66 )
214
DISAM-UPMT-98-015
Carlos Platero
T + 2
1
1
=
M 2 M1 1
2
8
2
1 + 2
1
2
M 2 M1 +
2
1
2
( 6.67 )
s =
T
s1 s
M 2 M1 ) 1 ( M 2 M 1 )
(
2
( 6.68 )
( 6.69 )
la solucin es s = .
De la expresin de ( 6.67 ) se desprende que la distancia de Bhattacharyya contiene
dos trminos, 1 y 2. El primer valor mide la separacin de las clases debido a la
diferencia entre las medias, mientras el segundo muestra la diferencia debido a las matrices
de covarianza.
6.1.2.2.2
Otros lmites
Si bien hay otros lmites que resultan ser mejores que los de Bhattacharyya y
Chernoff, como por ejemplo el de Hadar et at[Hadar96], pues stos se aproximan ms al
verdadero error, tienen el gran inconveniente de no tener una expresin analtica para
distribuciones normales, lo que posteriormente dificultar el tratamiento de estimacin del
sesgo y la varianza al considerar un nmero limitado de muestras.
6.1.3
DISAM-UPMT-98-015
215
Carlos Platero
h X = V T X + v0
>0
<
2
( 6.70 )
216
DISAM-UPMT-98-015
Carlos Platero
i = E {h X i } = V T E {X i } + v0 = V T Mi + v0
( 6.71 )
i2 = Var {h X i } = V T E ( X Mi )( X Mi ) i V = V T iV
T
( 6.72 )
f
f 1 f 2
f 12
f 22
=
+
+
+
V 1 V 2 V 12 V 22 V
( 6.73 )
f
f 1 f 2
f 12
f 22
=
+
+
+
v0 1 v0 2 v0 12 v0 22 v0
( 6.74 )
i
= Mi
V
i
=1
v 0
i2
= 2 iV
V
i2
=0
v 0
( 6.75 )
( 6.76 )
f
f
M1 +
M2
2 2 1 +
2 2 V =
2
2
1
DISAM-UPMT-98-015
( 6.77 )
217
Carlos Platero
f
f
+
=0
1 2
( 6.78 )
V = s 1 + (1 s) 2
] (M
1
M1
( 6.79 )
donde
f
12
s = f
f
2 +
1 22
( 6.80 )
Fisher
( )
=
1
1 + 2
2 M 2 M1
f =
1
2
1
+ 22
( )
p( )
v0
( )
+ p( )
[ p( ) + p( ) ] ( M M )
p 1 1 + p 2 2
1
2
1
2
2
V T p(1) M1 + p(2 ) M2
218
DISAM-UPMT-98-015
Carlos Platero
f = = p(1 )
1 2
e d + p(2 )
2
2
1 1
2 2
1 2
e d
2
2
( 6.81 )
para este criterio, las derivadas del error respecto a los parmetros son :
p(1 ) (1
=
e
12
2
p(2 ) (2
=
e
22
2
1 )
2 )
p(1 ) (1 1 ) 1
1
2
=
e
13
12
21
2
p(2 ) (2
2
=
e
23
22
/
p ( 1 ) 1 2 1
=
e
1
2 1
2 )
2
( 6.82 )
2
22
( 6.83 )
)2
( 6.84 )
( / )
p ( 2 ) 2 2 2
=
e
2
2 2
( 6.85 )
2 )
( 6.86 )
esto es, v0 debe ser seleccionado tal que las distribuciones de h(X) sean ambas
iguales a cero.
Considerando la igualdad de ( 6.86 ) e introduciendo ( 6.82 ) y ( 6.83 ) en ( 6.80 )
1
12
s=
2
1
2 +
1 22
( 6.87 )
V = s 1 + (1 s) 2
] (M
1
M1
( 6.88 )
DISAM-UPMT-98-015
219
Carlos Platero
s12V T M 2 + (1 s)22V T M 2
v0 =
s12 + (1 s)22
( 6.89 )
] (M
1
M1 .
1
1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
2
1
2
> p( )
< p( )
1
( 6.90 )
220
DISAM-UPMT-98-015
Carlos Platero
( 6.91 )
hX =
n n +1
2
i =1
i =1
i =1
qij xi x j + vi xi + v0 =
i =1 j =1
i yi + vi xi + v0
( 6.92 )
donde qij y vi son las componentes de Q y V. Cada una de las nuevas variables, yi,
representa el producto a dos de x, y su correspondiente valor de q. La ecuacin ( 6.92 )
corresponde a una funcin discriminante lineal, de la que puede aplicarse el procedimiento
ptimo de diseo:
n n + 1
v1
vn
= sK1 + 1 s K2
D2 D1
( 6.93 )
DISAM-UPMT-98-015
221
Distancia a la clase 2
x
x
Carlos Platero
x o
o
o
x
x
x
x x
xo o o o
x
x
o
o
x o
o
o
o
x o
o
x
o
o
o
x
Distancia a la clase 1
( 6.94 )
( 6.95 )
222
DISAM-UPMT-98-015
Carlos Platero
6.2
= f Y +
f T
1 2 f
Y + tr 2 YY T
Y
2 Y
( 6.96 )
( 6.97 )
E { f Y } f Y + tr 2 E {YY T }
2 Y
DISAM-UPMT-98-015
( 6.98 )
223
Carlos Platero
1 2 f
1 2 f
T
T
Var f Y E
Y + tr 2 E {YY } tr 2 E {YY }
2 Y
Y
2 Y
2
2 f
f
f T
E {YY T }
E 2 Y =
Y
Y
Y
( 6.99 )
{ ( )}
Nr
X
j =1
r
j
( 6.100 )
)(
1 Nr
X jr M r X jr M r
N r 1 j =1
( 6.101 )
Y = m 11
224
m n1 m 12
m n2 c111
cnn1 c112
cnn2
( 6.102 )
DISAM-UPMT-98-015
Carlos Platero
definiendo mi r = m i r mi r
e cijr = cijr cijr , las variables aleatorias de la
expresin( 6.102 ) satisfacen las siguientes propiedades estadstica
1. La media y la matriz de covarianzas son insesgada,
{ }=0
E {mi r } = 0 E cijr
( 6.103 )
{
E {c
}
}=0
E mi 1 m j2 = E {mi 1 } E m j2 = 0
1
ij
ckl2
E mi r ckls = 0 r s
( 6.104 )
{
{
1
T
E ( M r M r )( M r M r ) =
Nr r
i r
r
r
E mi mj =
N r ij
( 6.105 )
E mi r cklr
}= 0
( 6.106 )
E cijr ckls
DISAM-UPMT-98-015
i r jr
i ji=k j=l
r
N r
2i
i=k = j=l
r
N 0 1
( 6.107 )
225
Carlos Platero
{}
n
n i 1
2 f
2 f
1 2 n 2 f
r 2
r 2
r 2
=
E
m
+
E
c
+
E
c
{
}
{
}
ii
ij
i
r
r
2 r = 1 i = 1 mi r
i = 1 j = 1 cij
i = 1 cii
r
r
n
n i 1
2 f 2 i r
2 f i j
1 2 n 2 f i r
=
+
+
2 r = 1 i = 1 mi r N r i = 1 ciir N r 1 i = 1 j = 1 cijr N r
( 6.108 )
{}
Var f
2
n i 1
n
n f 2 r
f 2i r 2
f
i
+
+
=1 =1 m r N r =1 c r N r 1 =1 =1 c r
r
i
j
i
ij
ii
i i
2
2
i r jr
r
N ( 6.109 )
E mi r cklr
E c c
(r )
ij
(r )
kl
}
}
{x
1
Nr
{
{
{
xkr xl r
( 6.110 )
Var x i( r ) x (j r ) / N ( r )
Var x i( r ) 2 / N ( r )
Cov x ( r ) x ( r ) , x ( r ) x ( r ) / N ( r )
i
j
k
l
i j, i = k , j = l
i= j=k =l
Para cualquier otro caso( 6.111 )
226
DISAM-UPMT-98-015
Carlos Platero
1
1 + 2
M 2 M1 T
8
2
1
2
1 + 2
2
1 2
( 6.112 )
1
1
= ( 1)r 1 ( M 2 M1 )
M r
4
( 6.113 )
2 1 1 1
=
M r2 4
( 6.114 )
=
=
ij
cijr
cij cijr
i j
16
( 6.115 )
2 (r )
mi2 m 2j
2 1 2 1 cij
1
(2 ij ) +
=
=
j
32i j
cij( r ) 2 cij( r ) 2 cij( r )
i
2 i = (i 1 + i 2 ) 2 . Introduciendo de (
( 6.116 )
6.113 ) a (
1
i
i 2
mi2 1
1 n
1
+
+
+
2 i =1 2( 1 + i ) N 1 N 2 ( 1 + i )3 N 1 1 N 2 1
2
2
i j
1 n i 1 mi ( 1 + j ) + m j ( 1 + i ) 1
+
2
2
2 i =1 j =1 2( 1 + i ) ( 1 + j )
N2
N1
DISAM-UPMT-98-015
( 6.117 )
227
Carlos Platero
{}
mi2m2j
1
i n n
mi2 1
1 n
i j
Var 1 =
+ +
+
2
2
2
4 i =1 (1 + i ) N1 N2 i =1 j =1 2(1 + i ) (1 + j ) N1 N2
^
( 6.118 )
De igual proceder es seguido para 2
2
=0
M r
( 6.119 )
2 2
=0
M r 2
( 6.120 )
ij 1
2
1
r
r =
cij
4 i i
( 6.121 )
2 2 2 ij
=
cijr 2
4
1
1
r r
2 i j
i j
( 6.122 )
E{ 2 } = 1
+
+
4 i =1 ( 1 + i ) 2 N 1 1 i 2 ( 1 + i )2 N 2 1
1 n i 1
2
1
4 i =1 j =1 ( 1 + i )( 1 + j
{ }
^
Var 2
1 1
2
) N1 i j ( 1 + i )( 1 + j
i j
) N 2
2
2
1
i 2
1 n 1
1
1
1
=
+
2 i =1 ( 1 + i ) 2 N 1 1 ( 1 + i ) 2 i N 2 1
( 6.123 )
( 6.124 )
228
DISAM-UPMT-98-015
Carlos Platero
6.2.2
h( X ) = h ( X ) h( X ) = 0( k )
k =1
( 6.125 )
Ed {0( 3) } = 0 Ed {0( 4 ) } 1 / N 2
( 6.126 )
1 1
+
2 2
e j h ( X ) ~
j p ( X )ddX
( 6.128 )
jh ( X )
=e
jh ( X )
jh ( X )
jh ( X )
(
j )
1 + jh( X ) +
h2 ( X )
2
( 6.129 )
DISAM-UPMT-98-015
229
1
2
h( X ) +
j 2
h ( X ) e jh ( X ) ~
p ( X ) ddX
2
Carlos Platero
( 6.130 )
1 1
+
2 2
E d e j h ( X ) ~
j p ( X )ddX = +
( 6.131 )
1
2
j 2
h ( X ) e jh ( X ) ~
p ( X )ddX
h( X ) +
2
( 6.132 )
h
1 q q 2h
y
+
y i 2 y y yi y j
i =1
i =1 j =1
i
i
j
q
( 6.133 )
1 q q 2h
E yi y j
2 i =1 j = 1 yi y j d
h h
E d yi y j
i y j
} y
i =1 j =1
( 6.134 )
h h
1 q q 2h
jh X
+
j
p X ddX
Ed yi y j e
2 i =1 j =1 yiy j
y
y
i
j
( 6.135 )
si los parmetros son M1, M2, 1 y 2 de dos distribuciones normales, al aplicar las
esperanza de los sesgo de los parmetros queda
230
DISAM-UPMT-98-015
Carlos Platero
2
2
n
n 2h
h i r
h 2 i r
2h
r 2 + j
r
r +
r 2 + j
r
m
m
N
c
c
N r 1
1
=
r =1 i =1
i
i
i
ii
ii
2
n i 1
h i r jr jh X
2h
e
+ r 2 + j r
p X ddX
r
c
c
N
i =1 j =1
ij
ij
( 6.136 )
1
4
= +
( 6.137 )
donde v vendr definida por la arquitectura del clasificador. Los siguientes prrafos
tratan de localizar v para clasificadores cuadrticos y lineales.
6.2.2.1 Sesgo de Clasificadores cuadrticos
En el caso de utilizar un clasificador cuadrtico, h(X) ser del tipo
hX =
T
T
1
1
1
X M1 ) 1 1 ( X M1 ) ( X M 2 ) 2 1( X M 2 ) +
(
2
2
2
1
2
t
( 6.138 )
donde t es el umbral fijado por las probabilidad de los clusters. Para el clculo del
sesgo del error se utilizar ( 6.136 ), del que es necesario introducir las derivadas parciales
de h respecto a sus parmetros. Haciendo uso de Fukunaga et al [Fukun89] para
obtenerlas, se tiene:
h
= ( 1)r r X M r
M r
( 6.139 )
2h
= ( 1)r +1 r
M r2
( 6.140 )
h
r 1
(
)
=
1
2 ij
cijr
2
DISAM-UPMT-98-015
(x
mi r
)(x
i r jr
mjr
ij
r
i
( 6.141 )
231
2 ij ( xi mi r
2h
r +1
= ( 1)
i r 2 jr
cijr 2
2
) + (x
2
m jr
i
r
r
j
Carlos Platero
1
i jr
r
( 6.142 )
donde r = 1,2. Considerando que los datos son transformados sin prdida de
generalidad a I-, tal que i(1) = 1, i(2) = junto mi(1) = 0 y mi(2) = mi, e introduciendo de
( 6.139 ) a ( 6.142 ) en ( 6.136 ), el valor de v de ( 6.137 ) para el clasificador llega a
ser :
vq =
1
2
X e jh X p X ddX
( 6.143 )
donde
2
n
1
2 (xi mi )
f q ( X , ) = ( n + 1) xi
i
2
i =1
n
n
x
m
x j mj
(
)
1
i
i
+ j n + xi2 x 2j +
i j
2 i =1 j = 1
)
2
( 6.144 )
Caso I-I
Para el caso de datos I-I es posible obtener una expresin explcita de la integracin
de ( 6.143 ). Considerando dos poblaciones normales NX( 0, I ) y NX( 0, M ), se puede
escribir e jh ( X ) p( X |i ) como
e jh ( X ) p( X |1 ) =
232
2
T
M M
e M
M /8
1
j
N , T N X ( j M , I )
2 M M
( 6.145 )
DISAM-UPMT-98-015
Carlos Platero
e jh ( X ) p( X | 2 ) =
MT M
e M
M /8
1
j
N , T N X ((1 + j ) M , I )
2 M M
( 6.146 )
( X , ) N X ( D, K ) dX es una
(M
( ) =
i
(M
#
+
M)
( M T M ) n + 5 + 3( M T M ) ( j ) 3
2
( j ) 5 # ( M T M ) ( j ) 4 +
2
2
2
M)
n + 5 + 2( M T M ) ( j ) 2
2
2
1
(n + 1) M T M
n(n + 7) + (5n + 9) M T M + ( M T M ) ( j ) #
4
2
( 6.147 )
( ) N
i
6.2.2.1.2
1
4 2M T M
e M
M /8
2
( M T M )2 ( M T M )
MT M
n
n
1
+
+
+
2
16
2
( 6.148 )
Caso I-
DISAM-UPMT-98-015
233
v qr =
( 1)r +1 p ( r )
2
(Y , ) e j h (Y ) p (Y | r ) dYd
r = 1,2
Carlos Platero
( 6.149 )
1
jy 2 ( 1)
jvy + jc =
exp y 2
v )
(
j v
1
1
=
Ny
,
exp
+ j c
1
1
1
1
1 - j
1 - j
21 - j
1 - j
e j h ( y ) p ( y | 1 ) =
( 6.150 )
y para el segundo grupo:
1 ( y m )2 jy 2 ( 1)
jvy + jc =
exp
2 1 / 2
m
m
j
v
j
v
2
1
1
exp
,
+ j c
Ny
1 2
1
1 - j 1 1 - j 1
1 1/ 2
1
2 j
- j
( 6.151 )
e j h ( y ) p ( y | 2 ) =
donde
m
m2 1
v=
;c =
ln t
2 2
( 6.152 )
j v
1
,
Ny(,2), que para el caso del grupo 1 ser N Y
,
1 j ( 1) / 1 j (1 )/
m / j v
1
. Todo
mientras para el grupo 2 se tendr N Y
,
1 / j ( 1) / 1 / j ( 1)/
ello permitir la conversin de ( 6.143 ) en integral unidimensional extendida en la
234
DISAM-UPMT-98-015
Carlos Platero
frecuencia. Para ello habr de tener los momentos no centrados correspondientes a una
normal unidimensional Ny(,2), que son
E{y} =
{ }
E {y }= ( + 3 )
E {y }= + 3 + 6
E y2 = 2 + 2
3
( 6.153 )
j
1
3
( j v ) 4
6( jv) 2
1 ( ) =
+
+
+
1 + 2
2
4
3
4
(
1
)
(
1
)
(
1
)
3
( jv) 2
2
( j ) mv
+
2
j ( 1)
j ( 1)
1
1
+
+
j ( 1)
2
1
1 3 jm 2
1
( jv ) 2
+ 1 +
+
2
2
j ( 1)
2
j ( 1)
1
2 m jm 3
jv
2
1
m4 m2
+ j 1 + 2
j ( 1)
2 2
( 6.154 )
DISAM-UPMT-98-015
235
Carlos Platero
m
m
( j v ) 4
6( jv ) 2
j
1
3
2 ( ) =
+
+
+
1 + 2
2
4
3
4 1 j ( 1)
1 j ( 1)
1 j ( 1)
+
2
( j v ) 2
m
+
jv jm
2
1 j ( 1) 1 j ( 1)
+
+
1 j ( 1)
2
+
m 2
j
v
(
)
1 3 jm 2
+ 1 +
+
2
2
2 1 j ( 1) 1 j ( 1)
2m jm 3
m
jv
1
m4 m2
+ j 1 + 2
+
2 2
1 j ( 1)
( 6.155 )
1
( M T 1 M1 M2T 1 M2 )
2 1
( 6.156 )
236
DISAM-UPMT-98-015
Carlos Platero
h
= ( 1)r 1 X M r
M r
( 6.157 )
2h
= ( 1)r + 1 1
M r2
( 6.158 )
h
h cij
1
+ ji ijij
r =
r =
cij
cij cij
2i j ij
2h
2 h cij
=
2
=
4i j
( 6.159 )
ij ji
ij
+
ij
j
i
i
( 6.160 )
donde
ij = (mi 2 mi 1 )x j +
1 1 1
m m mi 2 mj2
2 i j
)(
h
2
+
r =
cij
(1 + i ) 1 + j ij ji ij ij
2h
4
r 2 =
cij
(1 + i ) 1 + j
( 6.161 )
ji
ij
ij
+
ij
(1 + ) 1 +
(1 + i )
i
mi 2 = mi , las
( 6.162 )
donde
ij = mi x j
1
m
mi m j = i 2 x j m j
2
2
( 6.163 )
DISAM-UPMT-98-015
237
vl =
1
2
f ( X , )e
j h ( X )
Carlos Platero
~
p ( X )ddX
( 6.164 )
donde:
n
n 1
1 2i mi
1 i
mi
i j
+
+ (2 y i mi )
+
f l (Y , ) =
3
2
+
+
1
1
(1 + i ) j =1
i =1
i
j
(1 + i )
n
n m (2 y m )(1 + )
j n yi2 + ( y i mi ) 2 i
i
j
j
i j
(
(
)
)
+
4
+
m
2
y
m
+
m
(
2
y
m
)
i
j
j
j
i
i
2
2
2
2 i =1
(
)
(1 + i )
(1 + i ) 1 + j
i =1 j =1
( 6.165 )
siendo fl(Y,) una combinacin lineal de yik (k 2), vl tiene solucin explcita para
el caso I-I, resultado:
vl =
6.2.2.2.1
1
2 2M T M
e M
M /8
M T M
1 +
n 1
( 6.166 )
Caso I-
( 1)r +1 p ( r )
2
(Y , ) e j h (Y ) p (Y | r ) dYd
r = 1,2
( 6.167 )
238
(v )2
1
1
DISAM-UPMT-98-015
Carlos Platero
j h ( y )
1 ( y m )2
+
+
p( y | 2 ) =
exp
j
vy
j
c
21 / 2
( jv )2
= N y ( jv + m, )exp
+ j (c + vm)
2
( 6.169 )
m2
2m
;c =
+1
1+
( 6.170 )
donde
v=
quedando que fl(y,) es un polinomio de yk, con k desde cero a dos. ste junto con
e jh (Y ) p (Y | r ) representar el desarrollo en momentos no centrados de Ny(,2), que para
el caso del grupo 1 ser N Y ( j v ,1) , mientras para el grupo 2 se tendr
N Y ( j v + m , ) . Todo ello permitir la conversin de ( 6.167 ) en integral
unidimensional extendida en la frecuencia. Slo resta obtener los polinomios para los dos
grupos:
2
m 2 (1 + 2 ) 2
m 2 (1 + 2 )
3
4vm( j )2
1 ( ) =
(
)
+4
v
j
+
4
2
4
(1 + )
(1 + )
1+
(1 + )
4m 2 (1 + 2 ) + m 4 (1 + 2 ) 4mv(1 + 2 ) 2m 2
2
( j )
+
+
+
+
4
3
2
(1 + )
(1 + )
(1 + ) (1 + )
1
m 2 (1 + 2 )
+
2
1+
(1 + )3
( 6.171 )
m 2 (1 + 2 )
3
( j )2 +
2 ( ) = ( )(v 2 2 )( j ) + 2 ( )mv 2vm
+
2
4
(1 + )
(1 + )
m 4 (1 + 2 )
mv (1 + 2 ) 2m 2
+ 3
+
4
+ 2 ( )(m 2 + 2 )( j )
4
3
2
(1 + )
(1 + )
(1 + )
2
2
1
m (1 + )
+
+2
1+
(1 + )3
1
m 2 (1 + 2 )
( ) = 2
+2
4
1
+
(
1
)
+
DISAM-UPMT-98-015
( 6.172 )
239
Carlos Platero
6.3
6.3.1
240
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
241
Carlos Platero
5. Las medidas debern ser de carcter continuo y discreto. Las medidas discretas
servirn para generar regiones de estudio; mientras las caractersticas continuas sern
usadas para la caracterizacin de las funciones de densidad en estas regiones. Las
componentes discretas debern tener la caracterstica de variar significativamente en el
sentido de pasar de una regin a otra alejada; en caso contrario, no estara justificada la
componente.
6. Un sexto principio es que las caractersticas deben ser obtenidas como relaciones
no lineales entre las medidas y aplicables en toda la regin de estudio. Estas relaciones
actan estableciendo regiones equivalentes en el espacio de medida.
6.3.1.3 Reduccin de la dimensin
Existen multitud de tcnicas de reduccin de la dimensin tal como se discuten, por
ejemplo en [Patri72][Raube95]. El origen se encuentra en buscar la transformacin de SL a
SM, tal que teniendo Ni muestras de cada clase, formadas por vectores XSL al ser
mapeados a vectores YSM, sean clasificados con mayor rapidez y menor complejidad. En
definitiva, el objetivo ltimo de la reduccin es mejorar la calidad del clasificador en un
compromiso entre la velocidad, generalizacin y capacidad de discriminacin. Bajo estas
pautas, las lneas generales en el desarrollo de sistemas de seleccin de caractersticas
sern las siguientes:
1. En general, la reduccin de la dimensin debe ser local; las transformaciones
sern aplicadas a regiones del espacio de observacin, raramente se aplicar de forma
global. Una regin para estos propsitos, se define como el conjunto de puntos de XSF al
que se le aplica la misma transformacin de reduccin de la dimensin.
2. Las medidas tomadas sobre el espacio de observacin al proyectarse desde SF a
SL deben de aumentar las distancias entre las clases. Si las transformaciones de las
componente utilizan conocimiento a priori, existe la posibilidad de buscar el marco de
transformaciones que aumenta la distancia entre ellas.
3. Para algunas regiones, la reduccin de la dimensin puede venir por una simple
transformacin lineal; por ejemplo, uso de las primeras componentes principales ms
discriminantes. No obstante, desde el puntos de vista general no sern tan afortunados
estos tipos de cambio, recurdese, por ejemplo, que la distancia de Mahalanobis es
invariante ante transformaciones lineales.
4. Las relaciones entre las medidas ( componentes del vector X ) varan de una
clase a otra; esta generalidad puede ser usada para discriminar clases. Apoyando el criterio
de bsqueda de filtros no lineales para cada clase.
5. La dimensin de la clase i transformada ser menor al rango de la matriz de
covarianza estimada, i , dentro del entorno local concerniente. Esta disminucin local de
242
DISAM-UPMT-98-015
Carlos Platero
la dimensin puede ser usada por la clase i sin perdida de informacin. Hay excepciones a
esta definicin.
6. Las relaciones no lineales entre las componentes de X pueden proporcionar la
eliminacin de algunas regiones, permitiendo generar marcos interregionales de
discriminacin. En definitiva, ciertas regiones obtenidas por el anlisis de clustering,
pueden ser unidas a tenor de las reducciones planteadas y buscar funciones discriminantes
con otras regiones colindantes desde una plataforma conjunta.
7. Cuando la dimensin del vector es grande, se puede utilizar un mtodo de
reduccin basado en subconjutos de medidas, tal que se destile la correlacin entre stos y
genere una jerarqua de disminucin de la dimensin.
8. La etapa final estar formada por una cierta distancia, di(X), sintctica,
estadstica, borrosa,..., y un comparador.
Bajo estas reflexiones se propone una metodologa de clustering paramtrico con
seleccin de las caractersticas, mediante transformaciones Box Cox y distancia de
Bhattacharyya, esto es, la propuesta busca transformaciones no lineales de subespacios de
regiones, tal que sean normales, lo que permitir su parametrizacin, y que adems tengan
el menor error de clasificacin a partir del nmero de muestras.
6.3.2
Clustering paramtrico
La modelizacin de cada uno de los cluster mediante algn tipo de funcin de
densidad conocida puede ser planteada desde las transformaciones Box Cox (ver prrafo
5.3.2). Dichas transformaciones tratan de convertir la distribucin de la poblacin en
normal. La expresin es :
x jkk
x jk + m k 1
=
k
x
jk + m
k 0
k = 0
( 6.173 )
N
2
k =1
j =1
+ k 1
x jk
( 6.174 )
DISAM-UPMT-98-015
243
Carlos Platero
( 6.175 )
L()
*i1
*i2
correspondiente a:
244
DISAM-UPMT-98-015
Carlos Platero
^
^
N2
N
*
*
ln( 2 ( i ) 2 ) + 1 ln( 1 ( i ) 2 )
2
2
N2
N1
*
*i *i1 *i 2
+ ( i 1) ln x ji ln x ji
j =1
j =1
L max ( i 2 ) L max ( i1 ) =
( 6.176 )
5 3
DISAM-UPMT-98-015
245
1
1 + 2
M 2 M1 T
8
2
1
2
1 + 2
2
1 2
Carlos Platero
( 6.177 )
6.4
6.4.1
Introduccin
Learning Vector Quantization (LVQ) es una clase de algoritmos de aprendizaje
prximos al VQ y al SOM. Mientras VQ y SOM son mtodos de aprendizaje no
supervisados, LVQ responde al entrenamiento supervisado. Adems, a diferencia del
246
DISAM-UPMT-98-015
Carlos Platero
( 6.178 )
de manera que ante una nueva muestra, sta quedar clasificada en la case c
utilizando la condicin de :
hc X =
max h
( 6.179 )
Algoritmo LVQ
Suponiendo que estn etiquetados los codebooks, la regla de clasificacin est
basado en la vecindad, pudiendo ser expresado como :
c = indice min X M i
( 6.180 )
DISAM-UPMT-98-015
247
Carlos Platero
clasificacin, se encuentra en los valores asintticos del proceso de aprendizaje del LVQ.
Las ecuaciones que definen la evolucin del algoritmo son:
M c (t + 1) = M c (t ) + (t ) X (t ) M c (t )
M c (t + 1) = M c (t ) (t ) X (t ) M c (t )
Si X t M c t k
( 6.181 )
Si X t k y M c t r
Mi (t + 1) = Mi (t ) Si i c
( 6.182 )
( 6.183 )
248
k h
( 6.184 )
DISAM-UPMT-98-015
Carlos Platero
Mi E = 2 ci ( X Mi )p( X )dX
( 6.185 )
( 6.186 )
ganador Mc(t), debe ser actualizado mientras el resto mantendrn el mismo valor durante el
paso.
Si p(X) en E, es reemplazada por f(X), el gradiente debe ser calculado en dos pasos
separados, cuando la muestra X(t) pertenezca a k y en el caso de X(t) pertenezca a h, por
la definicin de la nueva funcin de densidad. El gradiente de E, cambiando p(X) por f(X)
quedar como:
DISAM-UPMT-98-015
249
M i E = 2 ci (X M i ) f (X )dX =
Carlos Platero
( 6.187 )
( 6.188 )
( 6.189 )
( 6.190 )
M c (t + 1) = M c (t ) (t ) X (t ) M c (t ) Si X t Bk y X t r
( 6.191 )
M c (t + 1) = M c (t ) Si X t Bk y X t h h r
( 6.192 )
Mi (t + 1) = Mi (t ) Si i c
( 6.193 )
M c (t + 1) = M c (t ) + (t ) X (t ) M c (t ) Si X t Bk y X t k
250
DISAM-UPMT-98-015
Carlos Platero
M c (t + 1) = M c (t ) + c (t ) X (t ) M c (t )
M c (t + 1) = M c (t ) c (t ) X (t ) M c (t )
Si X t M c t k
Si X t k y M c t r
Mi (t + 1) = Mi (t ) Si i c
( 6.194 )
( 6.195 )
( 6.196 )
M c (t + 1) = 1 s t c t M c (t ) + s t c (t ) X (t )
( 6.197 )
c t = 1 s t c t c t 1
( 6.198 )
Si en estas condiciones se hacen para todo t, por induccin se puede ver que las
trazas de los primeros valores han sido escalados de una manera similar que las ltimas. El
factor de aprendizaje quedar como :
c t =
c (t 1)
1 + s(t )c (t 1)
( 6.199 )
DISAM-UPMT-98-015
251
Carlos Platero
por el algoritmo. Para valores iniciales de i , se puede tomar 0.5, pero en muchos casos es
mejor tomar un valor prximo a 0.3.
Estas modificaciones que se han llevado a cabo en el algoritmo LVQ1, no pueden
ser llevadas en el algoritmo LVQ2, porque este algoritmo no es ms que una aproximacin
parcial de las ecuaciones de VQ, y en caso de aplicar al algoritmo LVQ3, ste debera ser
llamado OLVQ3.
6.4.2.3 LVQ2
El anterior algoritmo puede ser fcilmente modificado para mejorar la filosofa de
decisin bayesiana. La forma de clasificar es
idntica que en LVQ1, pero en el aprendizaje, este
algoritmo es diferente. Se toman dos codebooks Mi
y Mj, que estn prximos entre s y pertenecientes a
clases distintas. Inicialmente, parte del espacio de
los datos estarn etiquetados incorrectamente. La
superficie de separacin es siempre definido como
un hiperplano entre Mi y Mj. Definiendo una
ventana simtrica no cero alrededor del este borde, y
X
M
M
generando correcciones en Mi y Mj, cuando al caer
una muestra X lo haga justamente en el lado
incorrecto de la ventana. Estas modificaciones
Figura 6.9 Ilustracin de la ventana movern a los codebooks y por tanto desplazarn al
utilizado en LVQ2 y LVQ3
hiperplano de separacin.
i
En principio, uno de los dos codebooks debe pertenecer a la clase correcta, mientras
que el otro pertenecer a una clase diferente. La muestra debe caer dentro de la ventana,
que vendr definida por un ancho w. Si se denominan di y dj a las distancia entre Mi y Mj
con X respectivamente, se define la anchura de la ventana, w, segn la siguiente expresin:
d dj
1 w
min i , > s en donde s =
1+ w
d j di
( 6.200 )
normalmente es recomendable utilizar una ventana con una anchura de 0.2 o 0.3.
Cuando una muestra cae dentro de la ventana se aplicar :
M i t + 1 = M i t t X t Mi t
M j (t + 1) = M j (t ) + (t ) X (t ) M j (t )
( 6.201 )
( 6.202 )
252
DISAM-UPMT-98-015
Carlos Platero
( 6.203 )
( 6.204 )
M i t + 1 = M i t t X t Mi t
Mj t + 1 = Mj t + t X t Mj t
( 6.205 )
DISAM-UPMT-98-015
253
Carlos Platero
( 6.206 )
254
( 6.207 )
DISAM-UPMT-98-015
Carlos Platero
c (t + 1) = c (t ) + s (t ) (t ) c E (t )
( 6.208 )
M = X (t ) M c (t )
E (t )
= c1 (t ) MM T + MM T
c
1
c
1
c
1
c
( 6.209 )
DISAM-UPMT-98-015
( 6.210 )
255
6.5
Carlos Platero
6.5.1
256
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
257
Carlos Platero
tenga para la regin, tal como se vio en 6.3. Los resultados pueden ser contemplados en
la tabla 6.1:
Tabla 6.1 i ndice de confianza, error superior de Bayes,
distancia de Bhattacharyya, y Var() sesgo y varianza de la
distancia
1
(%)
0.44
0.65
0.78
0.46
0.54
0.96
0.58
0.58
0.37
0.95
2.68
1.55
19.3
2.98
0
2.84
3.39
0.87
2.74
10.7
0.38
0.61
0.09
0.34
1.41
6.5.2
(%)
-0.87
-1.69
-0.50
0.63
2.52
1.45
1.08
-6.10
2.06
1.96
-0.92
5.38
6.09
3.73
-6.18
0.32
0.33
0.32
0.67
0.67
0.34
0.41
0.55
0.45
0.44
0.88
0.56
0.31
0.97
0.94
0.46
0.46
0.48
0.43
0.96
0.67
0.62
0.40
0.43
0.96
0.42
0.87
0.40
0.48
0.54
0.17
0.15
0.13
8.98
3.51
0.77
0.34
11.7
0
2.68
11.6
3.61
22.4
0.53
9.77
5.57
5.77
5.83
1.53
2.44
4.15
4.88
1.38
8.95
2.84
1.25
3.61
0.78
4.37
1.59
0.44
0.85
0.55
0.11
0.89
0.21
0.33
0.30
3.91
0.38
0.15
1.2
0.14
1.02
0.78
258
DISAM-UPMT-98-015
Carlos Platero
hX =
1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
1
2
1
2
( )
p( )
p 1
2
1
h( X ) = ( M2 M1 ) T 1 X + ( M1T 1 M1 M2T 1 M2 )
2
( 6.211 )
( 6.212 )
259
Carlos Platero
Mostrando la validez del clculo del error y la tendencia del sesgo a disminuir
con el nmero de muestras. El segundo experimento es similar al primero, pero esta vez
se utiliza dos poblaciones de covarianzas distintas. Se trata de dos poblaciones normales
con N1(0,1) y N2(3,2), manteniendo el mismo nmero de muestras para cada grupo. El
error de Bayes para el clasificador cuadrtico ser de 5.375% tanto para el primer grupo
como para el segundo. Mientras en el clasificador lineal el error de primer grupo es de
3.345% y el del segundo es de 7.23%. La figura 6.13 muestra los resultados de la
evolucin del error y el sesgo con el nmero de muestras.
10
(6.148)
0.0935
0.0605
0.0654
0.0574
0.0351
0.0151
0.0047
0.0011
0.0002
0.0001
6.2.2.1
0.0935
0.0605
0.0654
0.0574
0.0351
0.0151
0.0047
0.0011
0.0002
0.0000
260
DISAM-UPMT-98-015
Carlos Platero
Tabla 6.4 Sesgo lineal, , comparacin entre la expresin analtica (6.166) y el mtodo de 6.2.2.2
10
0.0440
0.0605
0.0486
0.0270
0.0110
0.0033
0.0008
0.0001
0.0000
0.0000
0.0440
0.0605
0.0486
0.0270
0.0110
0.0033
0.0008
0.0001
0.0000
0.0000
Por ltimo, la tabla 6.5 muestra los resultados obtenidos tanto de error como de
sesgo para clasificadores paramtricos cuadrticos como lineales.
Tabla 6.5 Resultados de los clasificadores paramtricos tanto cuadrticos como
lineales: Box Cox (), error de Bhattacharyya, error cuadrtico estimado, sesgo
cuadrtico estimado, error cuadrtico, error lineal estimado, sesgo lineal estimado,
error lineal
Clases
consideradas
1-4
1-5
2-5
2-6
3-9
4-7
5-7
5-8
6-8
6-9
7-12
8-10
8-11
9-10
10-11
-0.87
-1.69
-0.50
0.63
2.52
1.45
1.08
-6.10
2.06
1.96
-0.92
5.38
6.09
3.73
-6.18
s(%) q(%)
0.17
0.15
0.13
8.98
3.51
0.77
0.34
11.7
0
2.68
11.6
3.61
22.4
0.53
9.77
1.79
4.86
0.70
11.76
4.17
35.10
10.06
26.85
3.34
1.96
12.67
32.64
12.73
23.29
12.95
q(%) qt(%)
0.03
5.26
0.86
0.40
0.41
0.56
0.16
-
0.73
40.37
27.72
2.37
13.09
33.21
23.45
-
l(%)
l(%)
lt(%)
3.34
0.47
0.34
28.48
18.21
29.86
0.16
30.52
7.16
0.75
17.08
31.14
0.47
40.22
41.14
2.20
0.25
0
0.18
0.07
0.08
2.37
0.64
1.89
0.26
0.28
0.27
52.28
0.04
0.21
5.55
0.72
0.34
28.66
18.28
29.95
2.53
31.16
9.06
1.02
17.37
31.42
52.76
40.26
41.35
Las rayas indican que el sesgo calculado para el clasificador cuadrtico era muy
elevado, por lo que no se hace factible su construccin. Obsrvese la viabilidad de los
clasificadores lineales de Fisher ante los cuadrticos, stos se muestran ms robustos
con el nmero de muestras utilizados, conclusin tambin esbozada con las
componentes de la distancia de Bhattacharyya, ya que predominaba el efecto de 1
respecto a 2. Las discrepancias entre el error superior de Bhattacharyya y los
calculados numricamente son debido a que la distancia de Bhattacharyya considera que
las probabilidades de los grupos enfrentados son iguales, p(1) = p(2), y que el
mximo se da a s = 0.5, ver 6.1.2.2.
DISAM-UPMT-98-015
261
6.5.3
Carlos Platero
x mc (t )
c2 (t )
x mc (t )
(t + 1) = (t ) + s (t ) (t )
2
t
(
)
c
2
c
( 6.213 )
2
2
c
( 6.214 )
donde s(t) es +1 si coinciden las etiquetas de las muestras con los vectores de
aprendizaje y s(t) es 1 en caso contrario. Para el anlisis del algoritmo propuesto se
estudia el efecto de la convergencia considerando una sola neurona y un slo grupo.
Para el caso de mantener constante la varianza, la regla de actualizacin correspondera
al OLVQ1. Mayor atencin se precisa sobre la evolucin de la covarianza. Si se estudia
la convergencia de la expresin ( 6.213 ) para el caso de un nico grupo, se desprende
que la variacin de c2 con el tiempo es montonamente creciente con independencia
del tipo de distribucin del cluster. Efecto que muestra la falta de convergencia del
algoritmo. Ante esta evidencia se propone efectuar la siguiente modificacin:
c2 (t + 1) =
1
2
c2 (t )( N (t ) 1) + r (t )(x mc (t ) )
N (t )
( 6.215 )
262
DISAM-UPMT-98-015
Carlos Platero
Figura 6.14 Convergencia del algoritmo propuesto para una poblacin normal N(0,1).
N1(0,1)-N2(1,1)
Cuadrtico
1824
13
1536
Lineal
1824
13
1001
OLVQ
1848
12
13
1222
Propuesto
1869
48
1194
DISAM-UPMT-98-015
263
6.5.4
Carlos Platero
2.
3.
264
DISAM-UPMT-98-015
Carlos Platero
MLP
LVQ
Sintctico
Supervisor
Paramtrico
Pegado de rodillos
88
87.5
100
100
80.8
Faltas de material
86
95.5
100
100
82.5
Bandas longitudinales
100
95
100
100
86.6
Bandas transversales
97
100
94
94
88.6
Cristalizacin anormal
89
66.7
68
68
77.5
6.6
Tipo defecto
MLP
LVQ
Pegado de rodillos
88
75
Bandas brillante
100
Falta de material
pequeo
Sintctico
Supervisor
Paramtrico
88
88
80
100
100
100
82.6
86
94.7
100
100
82.5
Falta de material
grande
83
66
66
83
Bandas
longitudinales
84
88.9
68
68
90.8
Araazos
72
54.5
100
100
82.5
Bandas transversales
97
100
94
94
88.6
Cristalizacin
anormal
89
66.7
68
68
77.5
Conclusiones
Se ha presentado el desarrollo de un nuevo modelo de parametrizacin,
seleccin de las caractersticas y clasificacin, en las que se considera tanto el nmero
de muestras cmo el error de clasificacin, y en la que se favorece la insercin de
conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el
cual fue recogido en el captulo 5.
DISAM-UPMT-98-015
265
Carlos Platero
266
DISAM-UPMT-98-015
Carlos Platero
Aplicaciones industriales de la
tesis
7.1
DISAM-UPMT-98-015
267
7.1.1
Carlos Platero
Al 3030
268
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
269
Carlos Platero
7.1.2
270
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
271
Carlos Platero
3. Deteccin del acabado superficial y de los defectos locales con inspeccin del
100%.
4. Clasificacin de las faltas en lnea
Si bien el SIVA adems de la deteccin de los defectos debe determinar el acabado
superficial, este ltimo objetivo no ha sido tratado en esta tesis. Para una mayor
informacin sobre este asunto ver [Fernn97]. A parte de este aspecto, la implementacin
del SIVA para el aluminio colado est constituido por los tres grandes bloques: formacin
de imgenes, deteccin de los defectos y clasificacin de los defectos.
7.1.2.1 Formacin de imgenes
Los defectos en superficies metlicas se caracterizan por alteraciones en la
estructura superficial. Puesto que los defectos que aparecen en las superficies metlicas
suponen una deformacin material de las misma, la observacin de la componente
especular de la luz reflejada da como resultado la deteccin de defectos locales. Debido al
alto coeficiente de reflexin de la luz superficial del aluminio se convierte en necesidad
disear un sistema de iluminacin adecuado.
Atendiendo a los criterios vistos en el captulo 3, se opt por bateras de cmaras
CCD matriciales entrelazadas como las
ms apropiadas para la aplicacin,
principalmente por dos razones: la
velocidad mxima no supera los 2
m/min, lo que permite tener tiempos de
integracin hasta 50 ms, junto con una
escena de iluminacin cuasi uniforme en
bandas transversales,
debido a la
iluminacin planar transversal. La
resolucin utilizada fue de 2 pixel/mm, y
el tamao de buffer procesado era de
478 x 501, cubriendo una superficie de
291 mm en la direccin del tren
laminado por un ancho de 376 mm. La
figura 7.8 muestra la disposicin de Figura 7.8 Formacin de imgenes en la
inspeccin del aluminio
cmara - iluminacin - superficie.
7.1.2.2 Deteccin de los defectos
Una vez obtenida la imagen del aluminio, sta se procesa para encontrar los
defectos. Para la localizacin de defectos se realiza un anlisis local, pues debido a la
textura y al tipo de iluminacin utilizada no es posible un enfoque global, aunque esta lnea
de trabajo fue intentada, realizando operaciones morfolgicas acompaadas de
umbralizaciones globales, obteniendo resultados similares pero con mayores tiempos de
computacin[Plate92].
272
DISAM-UPMT-98-015
Carlos Platero
La alta rugosidad del aluminio origina en la imagen que pxeles con niveles altos
aparecen entremezclados con otro ms bajos. Algunos defectos no producen una variacin
significativa en los valores absolutos de nivel de gris, sino que producen una alteracin en
la distribucin espacial de los mismos, por lo que se dio el siguiente procesado a la seal.
Previo al procesado se adquiere la imagen con la mnima apertura del diafragma y con el
mximo nivel de contraste en la digitalizadora, manteniendo el mximo rango dinmico de
medida y sin saturaciones. Algoritmos basados en el anlisis textural fueron desarrollados
para la deteccin de los defectos[Fernn94], aunque el exceso de tiempo computacional los
han descartado en la implementacin final. Segn las conclusiones sobre procesado de
imgenes en tiempo real [Lee90], se admite que los mtodos de deteccin basados en
parmetros estadsticos de primer y segundo orden son los ptimos para las aplicaciones de
Visin artificial. El algoritmo usado se basa en considerar que la distribucin de niveles de
grises en una franja transversal depende slo de la materia del producto, esto es, se
considera cuasi uniforme la iluminacin por filas; por lo que se aplica un filtro binomial
3x3 y un umbral local. Se considera un pixel procesado, gm,n, no defectuoso aquel que
cumpla:
mm ,n u i g m,n mm, n + u s
( 7.1 )
DISAM-UPMT-98-015
273
Carlos Platero
%deteccin
100%
Faltas de material
100%
100%
Cristalizacin anormal
100%
98.7%
274
DISAM-UPMT-98-015
Carlos Platero
MLP
LVQ
Sintctico
Supervisor
Paramtrico
Pegado de rodillos
88
87.5
100
100
80.8
Faltas de material
86
95.5
100
100
82.5
Bandas longitudinales
100
95
100
100
86.6
Bandas transversales
97
100
94
94
88.6
Cristalizacin anormal
89
66.7
68
68
77.5
Tipo defecto
MLP
LVQ
Pegado de rodillos
88
75
88
88
80
86
94.7
100
100
82.5
83
66
66
83
Bandas longitudinales
84
88.9
68
68
90.8
Araazos
72
54.5
100
100
82.5
Bandas transversales
97
100
94
94
88.6
Bandas brillante
100
100
100
100
82.6
Cristalizacin anormal
89
77.8
68
68
77.5
DISAM-UPMT-98-015
Sintctico Supervisor
Paramtrico
275
7.2
Carlos Platero
7.2.1
7.2.2
276
DISAM-UPMT-98-015
Carlos Platero
papel ante una exposicin de luz transmitida y se cuenta manualmente las impurezas
visibles. La composicin qumica de las impurezas no es un factor determinante a la hora
de clasificar la limpieza de la pasta de papel. La mota de suciedad se cuantifica nicamente
por su tamao, y se da el valor en mm2 de rea de impurezas por kilogramo de pasta de
papel.
Sin embargo, que en la pasta de papel no se tome en cuenta de que sustancia se
compone las impurezas, no quiere decir que no sea importante distinguir los distintos tipos.
Fundamentalmente hay dos formas bsicas de impurezas: impurezas de tipo pitch,
procedentes de suciedad en general, esto es, de la que cae en la pasta de papel durante el
proceso de produccin ( por ejemplo, la grasa de las mquinas que estn en contacto
durante el tamizado, secado, etc.); e impurezas de tipo shive, su composicin es
bsicamente celulosa ( cuando las astillas no se disuelven totalmente durante los diferentes
procesos de transformacin quedan atrapadas en el interior de la pasta en forma de
pequeas motas ). Si bien hay otros tipos de impurezas sus frecuencias son muy reducidas
y stos no han sido consideradas. De otro lado, los defectos tipo pitch son ms comunes
que los shives, los primero representan casi el 96 % de las impurezas totales.
Estos dos tipos de defectos son fciles de diferenciar a simple vista por su color:
los defectos tipo pitch tienen un color negro intenso, mientras que los shives son
anaranjados, aunque en algunos casos se traten de un naranja muy oscuro. La razn de que
tomen este color vienen de que estos ltimos en realidad son pequeas astillas de madera
incrustadas dentro de la pasta. Por otra parte, los defectos tipo shive suelen ser de un gran
tamao.
La presencia de los pitch es mucho ms perjudicial para la calidad final de la pasta
que los shives, dado que la pasta de papel se usa como materia prima en procesos
siguientes, en los que los shives son fciles de disolver y los pitch no. Y como en la
determinacin de la limpieza de la pasta se mete a todos en el mismo grupo, es importante
tener control del nmero de defectos de cada
tipo que se encuentran. Sin embargo, dado
que la presencia de defectos tipo shive es
relativamente baja, no se hace imprescindible
la determinacin de la clase a la que
pertenece.
El procedimiento a seguir versa de la
siguiente manera, el inspector humano coge
una plancha de pasta de papel de 740 x 820
mm, y lo expone a trasluz con una potencia
de iluminacin de 756 W, teniendo una
intensidad lumnica alrededor de unos 31.000
luxes. El rea iluminada y por tanto de
inspeccin es de 500 x 500 mm2, lo que Figura 7.10 Inspeccin visual humana
viene a significar que no se inspecciona la
totalidad del pliego. Esta operacin se efecta por ambas caras de la hoja. El inspector
visual marca las impurezas y en funcin de su tamao le asigna una categora, que puede
DISAM-UPMT-98-015
277
Carlos Platero
ser de tipo P, C, B y A. Estas categoras son reflejadas en la tabla 7.3. Debida a las
limitaciones visuales humanas en cuanto a la mtrica, el inspector humano asigna una de
estas etiquetas en funcin del tamao que cree tener el defecto, lo que evidencia un cierto
nivel de subjetividad. El operario, a su buen juicio, determinar una etiqueta segn estime
en que rango de dimensin de rea es la impureza (ver tabla 7.3). Una vez etiquetadas
todas las impurezas localizadas en ambas caras, cuenta el nmero de defectos tipo P, C, B
y A, ponderando cada clase por el valor de rea asignada, segn se indica en la tabla. De
este proceder se saca la superficie total defectuosa que junto con el gramaje de la hoja
determinar el nivel de limpieza en pasta .
Tabla 7.3 Clasificacin de los defectos en la pasta de papel
7.2.3
Tipo de defecto
rea de las
impurezas(mm2)
rea asignada
al defecto(mm2)
0.04
0.1
0.3
Mayores a 0.8
278
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
279
Carlos Platero
tiene la digitalizadora utilizada, junto con una disposicin geomtrica adecuada para las
trayectorias seguidas por la mesa. Este proceder a supuesto una reduccin drstica del
tiempo dedicado a la inspeccin de un pliego, prximo a los 42s. Aun as, el mayor cuello
de botella sigue siendo la mecnica. El algoritmo de inspeccin sin desplazamientos
mecnicos tarda tan slo 11.7 s.
La aplicacin informtica corre sobre Windows95, con cdigo a 32 bits y con
operaciones MMX para el procesamiento de imgenes. La aplicacin est disponible para
migrar a NT4.0. La eleccin de Windows95 fue debida a que en un principio las libreras
suministradas por el fabricante de las tarjetas de control sobre motores eran de 16 bits, lo
que oblig a un diseo de 32 bits en toda la aplicacin, excepto para el control de los
motores que se realizaba bajo cdigo de 16 bits. No obstante, el conocimiento sobre diseo
de dispositivos de control (drivers) tanto en NT como en Windows95, hizo posible
posteriormente que toda la aplicacin se ejecutase en cdigo a 32 bits.
El SIVA implementado sigue la filosofa de esta tesis en cuanto a sus bloques
funcionales. Existe un diseo propio tanto para la formacin de imgenes como para la
deteccin de los defectos. En cambio, no aparece un bloque especfico de clasificacin de
los defectos por las razones esgrimidas en 7.2.2, esto es, al ser mayoritarios los defectos de
tipo pitch respecto a los shives, no hay necesidad de distinguirlos. Adems slo interesa la
superficie total defectuosa, independientemente del tipo de defecto o de tamao. Aunque
est afirmacin lleva matizaciones tal como se ha comentado anteriormente. En todo caso,
la mquina al detectar las impurezas, y en funcin de su tamao le asigna una etiqueta tipo
P, C, B o A. Sin embargo esta catalogacin es de carcter informativo, pues lo importante
es la suma total de rea defectuosa para luego convertirlo en limpieza en pasta.
Seguidamente se expone la formacin de la imgenes en el SIVA y cmo se detectan los
defectos.
7.2.3.1 Formacin de imgenes
La iluminacin de la escena es de luz transmitida, adems para poder aplicar una
umbralizacin global se precisa que sea uniforme en el campo de inspeccin de cada
cmara, esto es, la luz debe ser cuasi uniforme en una superficie de 73 x 48 mm. Otro
inconveniente aadido, es el hecho de tener no
slo una escena sino cuatro a la vez, lo que
supone acoplamientos lumnicos entre ellas. A
tal fin, se han diseado pantallas de
separacin
lumnica
evitando
las
interferencias entre los diferentes focos. Su
diseo fue tratado en el captulo 3, donde se
aborda la colocacin de los focos respecto a la
superficie as como la disposicin de las
pantallas.
Por otro lado, las caractersticas de los
focos son tambin especiales. Se requera un
foco de tipo direccional, uniforme y potente.
280
DISAM-UPMT-98-015
Carlos Platero
DISAM-UPMT-98-015
281
Carlos Platero
Resultados
La mquina fue entregada a ENCE el da 24 de abril de 1998. En los momentos de
escribir estas pginas la citada empresa est calibrando los resultados del SIVA,
procediendo a comparar la limpieza en pasta del inspector humano con los dados por la
mquina. Los resultados preliminares dados por ENCE son mostrados en la figura 7.15
282
DISAM-UPMT-98-015
Carlos Platero
7.3
Conclusiones
Se han presentado dos SIVA industriales, uno dedicado a la inspeccin del
aluminio colado y otro a la pasta de papel. Ambos han servido como marco de referencia
para el trabajo experimental realizado en el transcurso de esta tesis. Se observa que la
inspeccin visual de superficies planas y homogneas, simple para un inspector humano,
resulta compleja de automatizar. La riqueza de matices que efecta el operario en un
proceso de inspeccin visual, hace que los SIVA sean especficos de tarea, problemticos y
con limitaciones. As por ejemplo, el SIVA implementado para la pasta de papel, no es
capaz de detectar la mayora de los shives, pues debido a su tonalidad anaranjada, queda
diluida la informacin de luminancia respecto al fondo. Esta ancdota muestra como aun
en el diseo especfico las limitaciones se hacen evidentes. De todo ello se puede
pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no
cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente de
estos sistemas efectuada por la industria actual.
DISAM-UPMT-98-015
283
Carlos Platero
Captulo 8: Conclusiones
Conclusiones
DISAM-UPMT-98-015
285
Carlos Platero
286
DISAM-UPMT-98-015
Carlos Platero
Captulo 8: Conclusiones
permiten obtener los subespacios normales de los clusters, tal que dicha transformacin sea
comn con otros grupos cercanos, motivando una bsqueda que maximice la distancia
entre grupos disjuntos y a la vez cercanos. Con tal propsito, en el siguiente captulo se
expone la teora de clasificadores paramtricos y sus medidas, pudiendo de esta forma
acabar la tcnica de clustering parametrizado, propuesta original de esta tesis.
Se ha presentado el desarrollo de un nuevo modelo de parametrizacin, seleccin
de las caractersticas y clasificacin, en el que se considera tanto el nmero de muestras as
como el error de clasificacin de Bayes, y en el que se favorece la insercin de
conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el
cual fue recogido en el captulo 5.
El nuevo mtodo de parametrizacin se basa en la modelizacin del espacio de dos
clusters enfrentados entre s con etiquetas distintas. La regin definida por ambos grupos
es transformada a un subespacio, con las caractersticas de normalidad para cada grupo y el
menor error de Bayes posible, atendiendo al nmero de muestras utilizadas para la
estimacin. Para ello, se busca la transformacin Box Cox ptima marginal, de la que se
aprovecha la utilizacin del intervalo de confianza para la caracterstica transformada en
los dos clusters, localizando el ptimo comn. A ello le acompaa la distancia de
Bhattacharyya, que determina un lmite superior del error de Bayes. Esta informacin ser
utilizada para determinar el subespacio comn ms discriminante. Pero no slo se utiliza la
distancia, sino que adems se calcula el sesgo y la varianza de la medida, con el objeto de
conocer la validez de la mtrica considerando el nmero de muestras utilizado.
Una vez que han sido parametrizados los grupos, se pasa al diseo de los
clasificadores tanto lineales como cuadrticos, de los que tambin se ha trabajado en la
localizacin de su error y de su sesgo. Se han obtenido expresiones analticas tanto de los
parmetros del clasificador como del error y del sesgo, todo ello para grupos que tienen
distribuciones normales.
A tenor del trabajo realizado se plantea la modificacin del algoritmo no
paramtrico LVQ. Un estudio sobre este mtodo cognitivo concluye que los codebooks
tienden a situarse en la frontera de Bayes, mediante uso de hiperplanos, los cuales se
presentan como clasificadores lineales. Si en vez de utilizar la distancia eucldea se utiliza
la de Mahalanobis, es posible el paso de clasificadores lineales a cuadrticos. Esta
modificacin ha sido estudiada y se han comparado los resultados.
Con el objeto de verificar el anlisis propuesto, se ha trabajado experimentalmente
en la clasificacin de defectos locales en el aluminio colado. Este problema ha servido
como bancada de trabajo para el diseo de los clasificadores, tanto de tcnicas
tradicionales como las propuestas aqu recogidas. Las conclusiones obtenidas es que el
mtodo propuesto ayuda a introducir conocimiento a priori, haciendo de los clasificadores
ms exactos y generalistas, que aquellos basados tanto en reglas como en aprendizaje con
ejemplos. La explicacin viene dada por el hecho de tener expresiones analticas que
muestran con objetividad las caractersticas de cada subespacio en funcin del error y del
nmero de muestras del universo. Obviamente este proceder no puede ser dado por los
mtodos tradicionales. Aunque los mtodos de testeo como leave-one-out o holdout son
DISAM-UPMT-98-015
287
Carlos Platero
lmites superiores de error, stos no opinan sobre el sesgo del error, esto es, no consideran
el nmero de muestras, y tampoco buscan por si mismos la seleccin de las caractersticas.
Para acabar, se han presentado dos SIVA industriales, uno dedicado a la inspeccin
del aluminio colado y otro a la pasta de papel. Ambos han servido como marco de
referencia para el trabajo experimental realizado en el transcurso de esta tesis. Se observa
que la inspeccin visual de superficies planas y homogneas, simples para un inspector
humano, resultan complejas de automatizar. La riqueza de matices y las actividades
inteligentes que efecta el operario en un proceso de inspeccin visual hace que los SIVA
sean especficos de tarea, problemticos y con limitaciones. De todo ello se puede
pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no
cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente
efectuada por la industrial actual.
8.1
Aportaciones de la tesis
A modo de resumen las aportaciones realizadas podran ser expuestas atendiendo a
los tres hitos ya mencionados. En la formacin de imgenes se ha presentado un diseo del
sistema de iluminacin basado en el las propiedades de reflexin de la luz sobre superficies
planas y en los modelos de las fuentes luminosas. Primero se estudia si existe alguna zona
del espectro luminoso que pueda incrementar el realce entre defecto y fondo. En segundo
lugar, se pasa a ver qu modelo de superficie rugosa puede ser empleado, definiendo el
tipo de modelo de reflexin que puede aplicarse. En tercer lugar, se estudia el prototipo de
fuentes luminosas, centrndose en diseo de sistemas de iluminacin uniforme. Una vez
modelizado el problema, se pasa a su simulacin con el propsito de localizar la ptima
disposicin geomtrica de la superficie, los focos luminosos y las cmara. Si bien el
mtodo presentado no es una aportacin, pues ya ha sido propuesto por otros autores,
existen algunas contribuciones singulares, como la modelizacin de las fuentes mediante
funciones de ponderacin y el uso de la simulacin para la determinacin geomtrica de las
fuentes luminosas capaces de dar una iluminacin uniforme sobre el escenario SIVA.
En cuanto a la deteccin de los defectos, dos aportaciones originales se han hecho.
Respecto a la primera, se ha propuesto un mtodo de diseo de las mscaras de
convolucin lineal, basndose esta tcnica en regresin lineal con variable cualitativa. Y en
segundo lugar, se ha presentado un mtodo de calibracin de las tcnicas empleadas para la
deteccin de los defectos. Estas medidas se fundamentan en la funcin de distribucin del
fondo y de los pxeles de alto contraste.
Sobre la extraccin de las caractersticas tambin se ha trabajado. proponiendo la
conversin de los objetos etiquetados en primitivas de gramticas libres. Este proceder
tiene como ventaja la posibilidad de disear tanto clasificadores basados en reglas como en
vectores de caractersticas. Del que tambin se aporta cmo han sido transformadas las
primitivas en partes del vector de caractersticas.
Otra de las aportaciones de esta tesis, es la tcnica presentada de clustering
paramtrico, basada en los mapas auto organizados, en las U-Matriz, en la descripcin
288
DISAM-UPMT-98-015
Carlos Platero
Captulo 8: Conclusiones
textual de los patrones y en las tranformaciones normalizantes Box Cox. Adems, esta
nueva tcnica tambin realiza la seleccin de las caractersticas.
Una de las propiedades de los diseos de clasificadores para SIVA, es el bajo
nmero de muestras de que se parte para cada tipo de defecto. Por lo que se han estudiado
el clculo del sesgos para clasificadores paramtricos tanto cuadrticos como lineales.
Presentndose de forma novedosa el clculo del sesgo para clasificadores lineales y
cuadrticos de dos grupos enfrentados y en el espacio unidimensional. Adems se ha
iniciado el desarrollo de algoritmos LVQ con mtrica de Mahalanobis, en la motivacin de
utilizar cudricas en vez de hiperplanos de separacin entre los clusters.
Todo ello ha sido implementado y comprabado en los dos SIVA industriales
realizados.
8.2
Futuros trabajos
Como posibles lneas de trabajo a continuar podran citarse las siguientes:
En formacin de imgenes habra de seguir trabajando en incorporar ms elementos
al modelaje de la escena SIVA. Empezando por los sensores, si bien se ha iniciado un
breve estudio sobre los modelos de las cmaras CCD, hay que continuar en la lnea de
integrar las ecuaciones de comportamiento de las superficies, focos y cmaras, con el
objetivo de poder predecir la informacin luminosa en cada uno de los pixel del sensor.
Respecto a la deteccin de los defectos, se debera continuar la lnea de diseo de
los filtros, primero en cuanto a la determinacin de las mascaras lineales y empezar
tambin con la aplicacin de filtros recursivos para el realce de los defectos. En esta lnea
ya se puede encontrar algunas referencias bibliogrficas.
Habra de continuar en el estudio y generalizacin del clculo del sesgo para
clasificadores lineales y cuadrticos.
De otro lado, parece que la lnea natural empleada en el diseo de los clasificadores
paramtricos se debera intentar para los clasificadores no paramtricos, sobre todo en
algoritmos LVQ, investigando en la capacidad de determinar el error y el sesgo teniendo
en cuenta el nmero de muestras. Adems de seguir estudiando los comportamiento de
LVQ en mtrica de Mahalanobis.
En cuanto a las aplicaciones SIVA implementadas, los meses venideros seguirn en
el esfuerzo de mejorar el SIVA dedicado a la pasta de papel, sobre todo en tres direcciones
principalmente: un primer camino en la bsqueda de la regin espectral de la luz capaz de
aumentar el realce de tipo shive, ya sea por la interposicin de un filtro de transmitancia
DISAM-UPMT-98-015
289
Carlos Platero
entre la escena y el sensor, ya sea con el cambio de la fuente luminosa. Otra de las
direcciones que pueden ser muy fructfera es el cambio de tecnologa de adquisicin,
conducentes a introducir cmaras TDI para la determinacin de la limpieza en pasta en la
misma lnea de produccin. Y por ltimo, mejorar los resultados de deteccin mediante el
diseo de nuevos filtros para el realce de los defecto, objetivo ligado con las anteriores
pretensiones.
290
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
Bibliografa
[Abbas93]
[Aero93]
[Amore90]
[ANSI78]
American National Standards Institute, Surface Texture, ANSI / AMSE B46.11978, ANSI, New York, 1978
[Andre71]
[Atkin89]
[Avi-I96]
Avi-Itzhak, H., Diep, T., Arbitrarily Tight Upper and Lower Bounds on the
Bayesian Probability of Error, PAMI, V18, N 1, January, 1996.
[Awcoc95]
DISAM-UPMT-98-015
291
Carlos Platero
[Balst92]
Baltsavias, E.P., Beyer, H.A., Fritsch, D., Lenz, R.K., Fundamentals of RealTime Photogrammetry. Tutorial notes for XVIIth ISPRS Congress, Washington,
DC, 1992
[Bank90]
[Barri69]
Barrie, G., Sampling Inspection and Quality Control, Methuen and Company,
Ltd., London, 1969.
[Batch92]
[Beckm63]
[Beyer93]
[Beyer93a]
[Bezde92]
Bezdek, J.C., Pal, S.K. Fuzzy models for pattern recognition. Methods that
search for srtuctures a data, IEEE, Inc,. New York, 1992.
[Bhatt43]
[Blouk87]
Blouke, M.M., Janesick, J.R., Elliot, T., Hall, J.E., Current Status of the 800
x 800 Charge-Couple-Device Image Sensor. Optical Engineering, V 26 N 9,
pp 864-874, September 1987.
[Box64]
[Brads94]
Bradshaw, M., The automated inspection of web fabrics using machine vision,
tesis doctoral Universidad de Montfort, 1994.
[Brite92]
292
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Cancel86]
[Carpen88]
[Chamb95]
Chamberlain, S.G., Kamasz, S.R. A 26.3 Million Pixel CCD Image Sensor,
IEEE Proceedings of the International Conference on Electron Devices, pp 151155, Washington DC, December 10, 1995.
[Cases97]
[Chin82]
Chin, R.T., Harlow, C.A., Automated Visual Inspection: A survey. IEEE Trans.
Pattern Analysis and Machine Intelligent, 6, pp 557-573, 1982
[Chin88]
[Chin92]
[Chern52]
[Coole71]
Cooley, W.W. Lohnes, P.R., Multivariate Data Analysis, New York, Wiley,
1971.
[Cottr87]
[Cuadr91]
[Dahle90]
[Devij82]
[Domin94]
DISAM-UPMT-98-015
293
Carlos Platero
[Dough92]
[Dough94]
[EES92]
[Ence94]
ENCE, Control proceso final: limpieza en pastas, Norma 404 ENCE, Enero
1994.
[Erwin92]
[Escud77]
[Feng93]
[Fernn94]
Fernndez, C., Platero, C., Campoy, P., Aracil, R., Surface inspection of flat
products by means of texture analysis. On-line implementation using neural
networks, European Symposium on Optics for Productivity in Manufacturing,
Frankurt, 1994.
[Fernn97]
[Fernn97a]
Fernndez, J., Fernndez, C., Aracil, R., On line integral quality control of
ceramic tiles by artifical vision, Proc. International Conference on Quality
Control by Artificial Vision QCAV97, 1997
[Freem89]
[Fu88]
Fu, K. Robotics: Control, Sensing, Vision and Intelligence. McGraw Hill, 1988
[Fu82]
Fu, K.S. Syntactic pattern recognition with applications, Prentice Hall, 1982.
[Fukun89]
Fukunaga, K., Hayes, R., Effect of sample size in classifier design, PAMI, V
11, N 8, pp 873-885, august 1989
294
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Fukun90]
[Gallar97]
[Garc97]
[Garc98]
[Genne93]
[Genne94]
[Gile92]
[Glasb93]
[Gonz98]
[Guine91]
[Hall65]
Hall, D.J., Ball, G.B., ISODATA: A novel method of data analysis and pattern
classification, Technical report, Stanfort Research Institute, Menlo Park, CA,
1965.
[Han93]
Han, J.H.,Yoon, D.M., Kang M.K., Feature for automatic surface inspection,
SPIE V 1907 Machine Vision Applications in Industrial Inspection,1993.
[Hect84]
DISAM-UPMT-98-015
295
Carlos Platero
[Hertz91]
Hertz, J., Krough, A., Palmer, R., Introduction to the theory of Neural
Computation. Addison-Wesley, 1991.
[Holst96]
Holst, G.C., CCD arrays, cameras and displays, SPIE Press, 1996.
[Hughe68]
[Ikeuc94]
[Intec93a]
Intec, System 3000: Automatic Inspection System for Continuous Web Products,
Catlogo comercial, North Billerica, MA 01862, 1993
[Intec93b]
[Jhne93]
[Jhne97]
[Jain89]
[Kanal92]
[King85]
King, K., Just, J., Osheroff, Berke, G., Spidaliere, P., Ngoc, T., Robotic
technology: An assessment and forecast, Robotics and Flexible Manufacturing
Technologies, Noyes, Park Ridge, NJ, 1985.
[Kohon82]
[Kohon82a]
[Kohon88]
296
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Kohon92]
[Kohon95]
[Kung93]
[Lambe60]
[LeBea90]
[Lee90]
[Macai93]
Macaire, L., Postaire, J.G., Flaw detection on galvanized metallic strips in real
time by adaptive thresholding, Computer Vision for Industry, V 189, pp 1425,SPIE 1993.
[Malsb73]
[Marav93]
[Marsh90]
[Marti90]
[Mart95]
[Mathe75]
Matheron, G., Random Set and Integral Geometry, John Wiley, New York,
1975.
DISAM-UPMT-98-015
297
Carlos Platero
[Matro97]
[McLac92]
[Newma95]
[Miett93]
Miettinen, J., Hrkonen, A., Procedure for image acquisition design, SPIE
Vol.1989 Computer Vision for Industry, pp 70-80, 1993.
[Mulie92]
[Nayar91]
[Ninom92]
[Norto82]
[Norton83]
[Ohta86]
Ohta, K., Sakue, K., Tanura, H., Pattern Recognition Of Fabric Surfaces,
Journal Of The Textile Machinery Of Japon, V32,N1, pp 7-10, 1986.
[Oulu97]
[Parsy97]
[Parth87]
Parthasarathy, S., Wolf, D., Hu, E., Hackwood, S., Beni, G., A color vision
system for film thickness determination, Proceedings of the IEEE International
Conference on Robotics and Automation, Raleigh, NC, pp 515-519, 1987
[Patri72]
298
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Pea87]
[Phong75]
[Piiro90]
[Poole89]
[Plate92]
[Plate94]
Platero, C., Fernndez, C., Campoy, P., Aracil, R., Surface analysis of cast
alumnium by means of artificial vision and AI-based techniques, Symposium
on: Electronic Imaginig: Science & Technology, 1994
[Plate95]
Platero, C., Fernndez, C., Campoy, Aracil, R., Hybrid system : Aplication to
defect clasification in cast aluminum, International Conference on Quality
Control by Artificial Vision, pp 48-58, 1995
[Plate95a]
Platero, C., Fernndez, C. , Campoy, P., Aracil, R., Surface analysis of cast
aluminum by means of artificial vision and A.I. based techniques, International
conference on Quality Control by Artificial Vision, Le Creusot, France, 1995.
[Plate97]
[Plate97a]
[Plate98]
[Pratt91]
[Rao71]
DISAM-UPMT-98-015
299
Carlos Platero
[Raube95]
[RealA96]
[Ritte88]
[Reino96]
[Rober93]
Rober,J.W., Rose, S.D., Jullien, G., A PC-based Real Time Defect Imaging
System for High Speed Web Inspection, SPIE, V 1907 Machine Vision
Applications in Industrial Inspection, pp164-176, 1993
[Rolan87]
Roland, T.C. Automated visual inspection: 1981 to 1987. CVGIP 41, pp 346381,1987
[Ruz92]
[Snch98]
[Sears81]
[Sebas90]
[Sebas95]
[Serran93]
[Serran95]
300
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Sikka92]
[SOM92]
[Sahoo88]
[Serra82]
[Silva92]
Silva, J., Pais, C.P., Freitas, J.C., Carvalho, F.D., Rodrigues, F.C., Detection
And Automatic Classification Of Defect in Ceramic Products, SPIE V 1713,
International Conference On Manufacturing Automation, pp 22-28, 1992.
[Smith93]
Smith, B., Making war on defects : Six-sigma design, IEEE Spectrum 30 (9),
pp 43-47, September, 1993
[Spieg88]
[Takat88]
Takatoo, M., Takagi, Y., Mori, T., Automated Fabric Inspection System Using
Image Processing Rechnique, SPIE V 1004, Automated Inspection and High
Speed Vision Architectures II, pp 151-158, 1988.
[Torre67]
[Ultsc90]
[Vando90]
[VanGo91]
[Varfi92]
Varfis, A., Versino, C., Clustering of socio-economic data with Kohonen maps,
Neural Networks World, 2, 6, pp 813-833, 1992.
DISAM-UPMT-98-015
301
Carlos Platero
[Velil92]
[Velil94]
[Venon91]
[Vitri92]
[Widro62]
[Winch96]
[Wrigh88]
[Xie91]
Xie, X., Beni, G., A vality measure for fuzzy clustering, IEEE PAMI, col. 13,
pp 841-847, 1991
[Zador87]
[Zeuch88]
302
DISAM-UPMT-98-015