Está en la página 1de 294

ndice

INTRODUCCIN ..................................................................................................................... 11
1.1 MARCO DE LA TESIS .............................................................................................................11
1.1.1 ALCANCE DE LA TESIS ...................................................................................................12
1.2 OBJETIVOS ............................................................................................................................13
1.3 ESTRUCTURA DE LA TESIS ....................................................................................................14

PROBLEMTICA DE LA INSPECCIN VISUAL AUTOMATIZADA ........................... 17


2.1 LA INSPECCIN INDUSTRIAL ................................................................................................18
2.1.1 TAXONOMA DE LOS PROBLEMAS DE INSPECCIN .........................................................19
2.2 INSPECCIN VISUAL AUTOMATIZADA ................................................................................20
2.2.1 VENTAJAS DE LA INSPECCIN AUTOMATIZADA VISUAL ...............................................21
2.2.2 LIMITACIONES DE LOS SIVA..........................................................................................23
2.2.3 CLASIFICACIN DE LOS SISTEMAS DE INSPECCIN VISUAL AUTOMATIZADA ................24
2.2.4 IMPLEMENTACIN DE SIVA...........................................................................................26
2.2.5 LITERATURA DE LOS SIVA ............................................................................................27
2.3 CONCLUSIONES .....................................................................................................................28

DISAM-UPMT-98-015

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

FORMACIN DE IMGENES EN SISTEMAS DE INSPECCIN VISUAL


AUTOMATIZADA (SIVA) ....................................................................................................... 29
3.1 CARACTERIZACIN DE IMGENES DIGITALES ...................................................................31
3.1.1 DEFORMACIONES DE LAS IMGENES .............................................................................33
3.2 REALCE VISUAL DE SUPERFICIES PLANAS...........................................................................37
3.2.1 MECANISMOS DE REFLEXIN DE LA LUZ SOBRE SUPERFICIES PLANAS ..........................38
3.2.2 MODELO DE LA CMARA................................................................................................52
3.3 MODELOS DE FUENTES LUMINOSAS E ILUMINACIN UNIFORME EN SUPERFICIES
PLANAS ...................................................................................................................................54
3.4 SISTEMA DE ILUMINACIN PARA LOS SIVA IMPLEMENTADOS .........................................58
3.4.1 METODOLOGA A EMPLEAR PARA EL DISEO DEL SISTEMA DE ILUMINACIN...............58
3.5.1 SISTEMA DE ILUMINACIN PARA LA INSPECCIN DEL PAPEL ........................................60
3.5 ARQUITECTURA DE CMARAS CCD EN SIVA ....................................................................72
3.5.1 FACTORES A CONSIDERAR EN LA ELECCIN DE LAS CMARAS .....................................72
3.5.2 CMO ELEGIR LA CMARA.............................................................................................78
3.5.3 EJEMPLOS DE FORMACIN DE IMGENES EN ESCENAS SIVA ........................................84
3.6 CONCLUSIONES .....................................................................................................................85

DETECCIN VISUAL DE DEFECTOS LOCALES ............................................................ 87


4.1 LA DETECCIN COMO UN PROCESO DE DECISIN..............................................................89
4.2 REALCE DE LOS DEFECTOS LOCALES ..................................................................................92
4.2.1 FILTROS LINEALES DISCRETOS .......................................................................................93
4.2.2 CONVOLUCIN Y CORRELACIN ESPACIAL..................................................................100
4.2.3 MODELO DE REGRESIN CON VARIABLES CUALITATIVAS ...........................................102
4.2.4 FILTROS NO LINEALES: PROCESAMIENTO MORFOLGICO ...........................................106
4.3 ETAPA DE DECISIN ............................................................................................................117
4.3.1 MODELIZACIN DEL PROBLEMA MEDIANTE LAS FUNCIONES DE DENSIDAD................117
4.3.2 ESTRATEGIAS DE DECISIN ..........................................................................................119
4.3.3 IMPLEMENTACIN DE LA DECISIN: SEGMENTACIN DE IMGENES...........................124
4.3.4 UMBRALIZACIN PARA LA DETECCIN DE DEFECTOS .................................................125
4.4 AGRUPACIN DE PXELES BINARIZADOS...........................................................................130
4.4.1 ELIMINACIN DE FALSAS ALARMAS ............................................................................130
4.4.2 RECONSTRUCCIN DEL DEFECTO .................................................................................131
4.5 MEDIDA DE CALIDAD DE UN PROCEDIMIENTO PARA LA DETECCIN DE DEFECTOS
LOCALE.................................................................................................................................132
4.5.1 MEDIDAS BASADAS EN EL ERROR DE BAYES ...............................................................132
4.5.2 MEDIDAS BASADAS EN LAS FUNCIONES DE DISTRIBUCIN ..........................................133
4.6 DISEO DEL SISTEMA DE DETECCIN DE DEFECTOS LOCALES EN LA PASTA DE
PAPEL....................................................................................................................................135

DISAM-UPMT-98-015

Carlos Platero

ndice

4.6.1 REALCE DE LOS DEFECTOS LOCALES EN LA PASTA DE PAPEL ......................................136


4.6.2 VALIDACIN DE LAS HIPTESIS DE NORMALIDAD .......................................................139
4.6.3 PARMETROS DEL SISTEMA DE DETECCIN DE DEFECTOS ..........................................141
4.7 CONCLUSIONES ...................................................................................................................145

 ANLISIS DE LOS DATOS....................................................................................................147


5.1 ANLISIS DE LOS DATOS CON MAPAS AUTO ORGANIZADOS ...........................................149
5.1.1 MAPAS AUTO ORGANIZADOS .......................................................................................150
5.1.2 CONCLUSIONES SOBRE LOS MAPAS AUTO ORGANIZADOS ...........................................161
5.2 SOM COMO HERRAMIENTA DE CLUSTERING ...................................................................162
5.2.1 DEFICIENCIAS DE LOS MAPAS DE KOHONEN EN EL PROCESO DE CLUSTERING .............163
5.2.2 MTODO U-MATRIZ .....................................................................................................164
5.3 REFINAMIENTO DE LA TCNICA DE CLUSTERING.............................................................166
5.3.1 DISTRIBUCIONES MULTINORMALES .............................................................................169
5.3.2 TRANSFORMACIONES NORMALIZANTES ......................................................................176
5.3.3 LA ESTIMACIN DE MV DE LAS TRANSFORMACIONES BOX COX ................................177
5.3.4 CAMBIOS DE ESCALA DE LA POBLACIN ......................................................................179
 ...............................................................................................180
5.3.5 DETERMINACIN DE
5.3.6 INTERVALOS DE CONFIANZA Y PRUEBA DE NORMALIDAD ...........................................181
5.4 AGRUPACIN DE DATOS EN LOS DEFECTOS DE PLANCHAS DE ALUMINIO ......................183
5.4.1 EXTRACCIN DEL VECTOR DE CARACTERSTICAS .......................................................184
5.4.2 ANLISIS DE LOS DATOS ..............................................................................................187
5.4.3 APLICACIN DE LAS U-MATRIZ AL ANLISIS DE LOS DEFECTOS DEL ALUMINIO ........189
5.4.4 ELIMINACIN DE COMPONENTES SIN INFORMACIN ESTADSTICA..............................194
5.4.5 BSQUEDA DE ESPACIO NORMALES .............................................................................195
5.5 CONCLUSIONES ...................................................................................................................197

 CLASIFICADORES ESTTICOS .........................................................................................199


6.1 CLASIFICADORES PARAMTRICOS ....................................................................................200
6.1.1 CLASIFICACIN A DOS GRUPOS ....................................................................................203
6.1.2 EXPRESIN GENERAL DEL ERROR PARA LA CLASIFICACIN DE DOS GRUPOS ..............204
6.1.3 DISEO DE CLASIFICADORES LINEALES PTIMOS ........................................................215
6.1.4 DISEO DE CLASIFICADORES CUADRTICOS................................................................220
6.2 ESTIMACIN DE LOS PARMETROS MEDIANTE UN CONJUNTO FINITO DE
MUESTRAS ............................................................................................................................223
6.2.2 EFECTO DEL NMERO DE MUESTRAS EN EL DISEO DE CLASIFICADORES
PARAMTRICO .......................................................................................................................229
6.3MTODO DE PARAMETRIZACIN DE LOS CLUSTER DOS A DOS ........................................240

DISAM-UPMT-98-015

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

6.3.1 REDUCCIN DE LA DIMENSIN: SELECCIN DE LAS CARACTERSTICAS......................240


6.3.2 CLUSTERING PARAMTRICO.........................................................................................243
6.4CLASIFICADORES NO PARAMTRICOS: MTODO DE APRENDIZAJE SUPERVISADO
LVQ......................................................................................................................................246
6.4.1 INTRODUCCIN ............................................................................................................246
6.4.2 ALGORITMO LVQ ........................................................................................................247
6.4.3 MODIFICACIONES REALIZADAS EN EL ALGORITMO LVQ1 ..........................................253
6.5 APLICACIN A LA CLASIFICACIN DE DEFECTOS LOCALES EN PLANCHAS DE
ALUMINIO COLADO ..............................................................................................................256
6.5.1 PARAMETRIZACIN DOS A DOS DE LOS CLUSTER SEGN MTODO PRESENTADO ........256
6.5.2 DISEO DE LOS CLASIFICADORES PARAMTRICOS.......................................................258
6.5.3 MODIFICACIN DEL ALGORITMO NO PARAMTRICO OLVQ........................................262
6.5.4 COMPARACIN CON OTRAS TCNICAS TRADICIONALES DE CLASIFICACIN ...............264
6.6CONCLUSIONES ....................................................................................................................265

 APLICACIONES INDUSTRIALES DE LA TESIS ..............................................................267


7.1 INSPECCIN VISUAL DEL ALUMINIO COLADO ...................................................................267
7.1.1 PROCESO DE OBTENCIN DEL ALUMINIO COLADO .......................................................268
7.1.2 SIVA APLICADO A LAS PLANCHAS DE ALUMINIO COLADO ..........................................270
7.2 INSPECCIN VISUAL DE LA PASTA DE PAPEL.....................................................................276
7.2.1 PROCESO DE OBTENCIN DE LA PASTA DE PAPEL ........................................................276
7.2.2 INSPECCIN DE LA PASTA DE PAPEL.............................................................................276
7.2.3 SIVA IMPLEMENTANDO PARA LA LIMPIEZA DE LA PASTA DE PAPEL...........................278
7.2.4 RESULTADOS ................................................................................................................282
7.3 CONCLUSIONES ...................................................................................................................283

CONCLUSIONES.................................................................................................................... 285
8.1 APORTACIONES DE LA TESIS ..............................................................................................288
8.2 FUTUROS TRABAJOS ...........................................................................................................289

DISAM-UPMT-98-015

Carlos Platero

ndice

BIBLIOGRAFA ........................................................................................................................... 291

NDICE DE FIGIRAS .................................................................................................................. 303

NDICE DE TABLAS ................................................................................................................... 309

DATOS BIOGRFICOS .............................................................................................................311

DISAM-UPMT-98-015

Carlos Platero


1.1

Captulo 1: Introduccin

Introduccin
Marco de la tesis

La tesis presente se enmarca en el mbito cientfico de la Inspeccin automatizada, con


el empleo de tcnicas de Visin artificial e Inteligencia artificial.
El control de calidad es uno de los aspectos ms importantes en la competitividad
industrial. El alto coste de la inspeccin humana ha hecho promover y desarrollar sistemas
capaces de resolver las tareas de forma automtica. Una de las mayores dificultades dentro de
la Inspeccin es la supervisin de la apariencia visual. sta es encargada, en la mayora de las
ocasiones, a inspectores humanos. El sistema de visin humano es adecuado para su
funcionamiento en un mundo de variedad y cambio, mientras que el proceso de inspeccin
visual industrial, requiere de la observacin de una escena repetida de forma que se puedan
detectar anomalas. La exactitud del sistema humano de visin empeora con el trabajo
repetitivo y montono. El resultado es una inspeccin lenta, cara y errtica. La inspeccin
visual automatizada es, obviamente, la alternativa a los inspectores humanos, liberndolos de
tan alienante trabajo.
De entre los posibles escenarios de los Sistemas de Inspeccin Visual Automatizada,
SIVA, esta tesis se ha centrado en la inspeccin visual de superficies planas y homogneas.
Las razones de estas restricciones vienen dadas por las complejidades de diseo de estos
sistemas en trminos generales. No obstante, esta acotacin del problema resulta vlida en el

DISAM-UPMT-98-015

11

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

desarrollo de muchas aplicaciones SIVA para las necesidades de la industria actual. De hecho,
a lo largo de los ltimos aos se han desarrollado mltiples arquitecturas para la deteccin de
defectos visuales en superficies planas y homogneas, tales como textiles, maderas, aceros,
aluminio, plsticos, pasta de papel y un sinfn de productos industriales, mostrando un gran
inters tanto para la industria como para la investigacin aplicada.
Si bien hay constatacin de mltiples sistemas de inspeccin de superficies
[Piiro90][Oulu97][Parsy97][EES92], en ningn caso existe una metodologa completa que
permita, independientemente de las caractersticas del proceso, configurar el sistema de
inspeccin visual automatizado[Newma95]. Los trabajos presentados muestran soluciones
particulares atendiendo a las condiciones de la inspeccin. An as, de todos ellos se desprende
una filosofa comn, caracterizada por tres bloques. Una primera etapa encargada de la
formacin de imgenes, con los objetivos de realzar los defectos visuales en la escena y
trasladarlos a la memoria del computador. Un segundo bloque llamado sistema de deteccin
de defectos, que trata de localizar los defectos de apariencia visual. Y por ltimo, un tercer
bloque de clasificacin, convirtiendo la informacin seleccionada en una etiqueta de
catalogacin. A veces resulta este ltimo bloque como optativo.
El desarrollo de esta tesis pretende ofrecer una solucin metdica al diseo de sistemas
de inspeccin visual automatizada de superficies planas y homogneas. La consecucin de este
objetivo debe cubrir los fundamentos y criterios para el diseo del sistema de iluminacin
sobre superficies planas, estrategias de arquitectura de adquisicin de escenarios SIVA, la
elaboracin de algoritmos de deteccin de defectos locales, la representacin virtual de los
defectos junto con la seleccin de las mejores caractersticas y por ltimo, la clasificacin de
los defectos.
Como marco del desarrollo experimental de la tesis, as como de aplicacin industrial,
se ha participado en la implementacin de dos sistemas de inspeccin. Un primer SIVA
dedicado a la deteccin y clasificacin de faltas visuales en el aluminio colado, capaz de
discernir la ausencia/presencia de defectos locales en las planchas de aluminio, as como de
su clasificacin. Y un segundo sistema diseado para la deteccin de defectos locales en la
pasta de papel. Las arquitecturas desarrolladas han servido de bancada para probar la bondad
de las propuestas presentadas en esta tesis.
1.1.1

Alcance de la tesis
La determinacin en superficies planas y homogneas de la presencia o ausencia de
defectos, as como de su clasificacin, mediante tcnicas de Visin artificial e Inteligencia
artificial ha sido tema de estudio por mltiples autores. Todos coinciden bsicamente en el
planteamiento de tres hitos importantes: formacin de imgenes, algoritmos de deteccin y en
menor medida la clasificacin de los defectos.
El primer hito cubre desde la iluminacin hasta el almacenamiento de la seal en la
memoria del computador. En referencia al sistema de iluminacin, la problemtica se centra
en la colocacin ptima entre los focos luminosos, la superficie a inspeccionar y las
disposiciones de los sensores. Con tal propsito, se requieren conocer los modelos sobre la

12

DISAM-UPMT-98-015

Carlos Platero

Captulo 1: Introduccin

reflexin de la luz en superficies planas [Nayar91], los comportamientos de los focos


luminosos [Genn94] y las actuaciones de los sensores [Holst96]. De esta forma se podr
determinar la colocacin geomtrica de los focos y las cmaras respecto de las superficies a
revisar. No hay que olvidar que el propsito de este bloque es aumentar todo lo posible el
realce en la escena. En cuanto a la instrumentacin asociada a la adquisicin de imgenes,
depende fundamentalmente de la velocidad de desplazamiento de la superficie y del tamao
de los defectos. Es el proceso industrial el que va a definir qu tipo de tecnologas de cmaras
se necesitan, cules deben ser sus resoluciones y el nmero de sensores que son imprescindible
para la inspeccin.
En cuanto a las tcnicas empleadas para la deteccin de defectos, stas se han centrado
en el procesamiento y segmentacin de las imgenes recibidas[Norton82][Brads94][Macai93],
con el objeto, primero, de aumentar el realce entre defecto y fondo, y segundo, segmentar las
imgenes para la localizacin de los defectos locales. Para el realce de los defectos se han
utilizado tanto filtros lineales como no lineales, mientras las tcnicas de segmentacin
empleadas se basan en las propiedades de los histogramas.
Menos explotado y extendido es el estudio de la clasificacin de los defectos
detectados. En parte porque las exigencias industriales no lo precisan, o bien porque son
sencillos clasificadores basados en alguna propiedad directa de los objetos defectuosos
detectados. Sin embargo, a veces se necesita la catalogacin de faltas complejas. Estos
clasificadores presentan algunas peculiaridades. Suele suceder que algunos tipos de defectos
tienen frecuencias bajas de aparicin, por lo que no se tienen muestras o el nmero de ellas es
poco representativo. Adems, tambin ocurre que el precio de tener un universo del problema
sea econmicamente costoso, por lo que las poblaciones que se parten para el diseo de estos
clasificadores suelen ser escasas.
En esta tesis se abordan estos tres hitos, intentando dar soluciones y caminos que
ofrezcan mtodos rigurosos de anlisis, para que en una fase posterior se pase al diseo de
cada uno de estos sistemas. Los prximos captulos exponen de forma ordenada el
planteamiento del problema en concreto, su anlisis, las tcnicas a emplear y por ltimo se
muestra el trabajo experimental desarrollado.

1.2

Objetivos
El objetivo general de esta tesis es el desarrollo de tcnicas de Visin e Inteligencia
artificial conducentes tanto a la caracterizacin de defectos en superficies planas y
homogneas, como a la deteccin y clasificaciones de tales defectos, de forma que la
informacin obtenida sea integrable en tiempo real dentro del proceso productivo. Con tal fin,
los objetivos desglosados en puntos correspondern a:

Proposicin de una arquitectura general para el sistema de inspeccin automatizada de


superficies planas y homogneas.

DISAM-UPMT-98-015

13

Inspeccin automatizada de superficies homogneas mediante Visin artificial

1.3

Carlos Platero

Estudio de la problemtica de iluminacin sobre superficies planas. Diseo del sistema


de iluminacin, constituido por las fuentes luminosas y los sensores. Localizacin de
los elementos de iluminacin y adquisicin junto con las tecnologas a emplear.

Estudio sobre la adquisicin de seales de vdeo, su resolucin y exactitudes de las


medidas tomadas. Planteamiento de una solucin que permita explorar el 100% de la
superficie analizada sin que sta se detenga ante el dispositivo de captacin y que no
intervenga en el proceso productivo.

Desarrollo de algoritmos de realce de defectos locales basados en el diseo de filtros


lineales y no lineales.

Mtodos de segmentacin para la deteccin de defectos locales basados en el anlisis


del histograma.

Desarrollo de medidas de calibracin sobre las distintas tcnicas empleadas para la


deteccin de los defectos.

Estudio y desarrollo de tcnicas de modelizacin de los defectos, consistencia de la


representacin virtual y extraccin y seleccin de las mejores caractersticas.

Anlisis exploratorio de los datos para la decantacin de las distintas subclases de


defectos.

Desarrollo de la metodologa para el reconocimiento de defectos haciendo uso de


tcnicas estadsticas y cognitivas.

Estructura de la tesis
La configuracin de la tesis en captulos viene dada como sigue: un captulo inicial
sobre la problemtica concerniente a la inspeccin visual automatizada, para pasar a
desarrollar en los siguientes cuatro captulos el anlisis y diseos de las cuestiones planteadas,
esto es, formacin de imgenes, deteccin de los defectos locales, anlisis de los datos y
clasificacin de los defectos. Para acabar se muestran las aplicaciones industriales elaboradas,
las cuales han servido como marco de trabajo experimental. Una explicacin ms detallada de
los siguientes captulos se muestra a continuacin con el objeto de ilustrar por separado qu
problemtica se estudia en cada tema.
El captulo segundo presenta la problemtica de la Inspeccin visual automatizada. Se
empieza con una evolucin histrica de la Inspeccin industrial llegando a la conclusin de
la necesidad de insertar las operaciones de inspeccin dentro del proceso manufacturero.
Adems, tambin se concluye que la inspeccin visual automatizada es ideal para la mejora
de la produccin y de la competitividad de las empresas. Llegado a este punto, se centra la
problemtica sobre los SIVA, indicando sus ventajas e inconvenientes. Luego se pasa a un

14

DISAM-UPMT-98-015

Carlos Platero

Captulo 1: Introduccin

anlisis de los SIVA mediante la clasificacin de stos atendiendo al tipo de informacin a


tratar, a las tcnicas empleadas y a la geometra de las superficies a inspeccionar. La
exposicin concluye con referencias a SIVA implementados y a la literatura especializada.
El estudio sobre la formacin de imgenes en SIVA ser desarrollado en el tercer
captulo. El primer problema a resolver trata sobre la ubicacin ptima de los focos luminosos
y sensores respecto a la superficie a inspeccionar, por lo que se hace necesario el estudio sobre
el comportamiento de la luz en superficies planas, as como el desarrollo de modelos sobre las
fuentes luminosas y los captadores. A partir de stos se ha intentado o bien una iluminacin
uniforme sobre la superficie a inspeccionar, o bien se ha buscado qu componentes de la luz
reflejada tienen mayor nivel de informacin. Se ha trabajado sobre una metodologa basada
en las expresiones analticas de las fuentes luminosas y en sus desarrollos de Taylor, de manera
que determine la ubicacin correcta de los focos y elementos complementarios para una
iluminacin uniforme sobre la escena. Tambin se ha trabajado sobre el comportamiento de
la luz en superficies lisas para la ptima localizacin de focosensor. Presentndose una de
las aportaciones de la tesis, en referencia a la metodologa empleada para el diseo del sistema
de iluminacin y su ubicacin. El segundo problema se refiere a la tecnologa de los sensores
y a la arquitectura empleada. Se hace un planteamiento sobre los factores a considerar en la
eleccin de las cmaras de vdeo. Por ltimo, se dan referencias bibliogrficas de cmo ha sido
resuelto el problema de formacin de imgenes en SIVA documentados.
A partir del cuarto captulo, se pretende mostrar una metodologa sobre la deteccin
de defectos locales en superficies planas y homogneas. El planteamiento pivota en tres
bloques: realce, deteccin y eliminacin de falsas alarmas. Sobre el realce de los defectos se
plantea el diseo de filtros lineales y no lineales, ofreciendo un mtodo para la determinacin
de la mscara de convolucin lineal, presentndose como novedoso. En cuanto a la deteccin,
sta se basa en las funciones de densidad del fondo y del defecto, desarrollando tcnicas de
segmentacin basadas en el anlisis del histograma. Respecto a la eliminacin de falsas
alarmas, se proponen tcnicas de procesamiento morfolgico con el objetivo de mejorar los
resultados de la deteccin. El captulo acaba mostrando un procedimiento que permita calibrar
cul de las tcnicas propuestas para la deteccin da el mejor resultado, siendo sta otra de las
aportaciones de esta tesis.
Una vez detectados los defectos locales en la superficie y determinada la conversin
de la imagen segmentada en un vector de caractersticas, se pasan las faltas a la etapa de
clasificacin. Los dos siguientes captulos tienen como objetivo, dar una metodologa de
actuacin para la catalogacin de las muestras. La idea bsica es integrar tanto las tcnicas
estadsticas como las tcnicas cognitivas en la resolucin del problema. El quinto captulo trata
del anlisis exploratorio de los datos, etapa encargada de la bsqueda de los grupos inherentes
del universo del problema. Se han utilizado como base los mapas auto organizados. Sin
embargo, muestran algunas limitaciones, que son analizadas para pasar a rengln seguido a
proponer una nueva metodologa. El fundamento del mtodo propuesto se sustenta en la
parametrizacin de los grupos mediante funciones de densidad.
En general, en un SIVA se trata de clasificar las formas de los defectos locales,
ofrecindose stos como patrones de tipo esttico. Otra de las peculiaridades de estos sistemas

DISAM-UPMT-98-015

15

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

es la falta de muestras para el diseo de los clasificadores. El sexto captulo aborda el diseo
de los clasificadores paramtricos y no paramtricos, sujetos a las mencionadas condiciones,
indicndose expresiones analticas tanto del error de clasificacin como su sesgo, siendo unas
de las aportaciones ms significativas de la tesis. Tambin, es presentado un novedoso mtodo
de parametrizacinseleccin de las caractersticas basadas en transformaciones Box Cox y
en las distancias de Bhattacharyya. Por ltimo se comparan los resultados obtenidos con las
tcnicas de Reconocimiento de formas tradicionales.
El captulo 7 describe las aplicaciones industriales acometidas durante la realizacin
de esta tesis. Se presenta tanto el SIVA elaborado para el aluminio colado como para la pasta
de papel. El esquema empleado trata de exponer la problemtica a resolver y cmo se ha
diseado la formacin de imgenes, la deteccin de los defectos y su clasificacin para cada
uno de stos.
Por ltimo, en el captulo octavo se hace un resumen del trabajo realizado as como de
las aportaciones novedosas presentadas. Para acabar indicando algunas posibles lneas de
trabajo a investigar en el futuro.

16

DISAM-UPMT-98-015

Carlos Platero

Captulo 2: Problemtica de la Inspeccin visual automatizada

Problemtica de la Inspeccin
visual automatizada

En este captulo se presenta la problemtica de la Inspeccin visual automatizada.


Se empieza con una evolucin histrica de la Inspeccin industrial, recalcando la necesidad
de insertar las operaciones de inspeccin dentro del proceso de produccin (2.1). De esta
idea y dentro de las diferentes tcnicas que pueden ser empleadas, la automatizacin de las
operaciones de inspeccin visual resulta de las que mejor encaja, presentndose en muchos
casos ser vital en la mejora del proceso productivo y en su competitividad (2.1.1). Llegado
a este punto, se centra la problemtica en la Inspeccin visual automatizada (2.2). Son
presentadas las ventajas e inconvenientes de los SIVA (2.2.1 y 2.2.2). Seguidamente se
pasa a la clasificacin de los SIVA atendiendo a la geometra de las superficie (2.2.3.1), al
tipo de informacin recogida (2.2.3.2) y a las tcnicas empleadas(2.2.3.3). Estas dicotomas
permiten establecer el marco de trabajo dentro de la filosofa SIVA. Las referencias a SIVA
implementados ensean algunas de las soluciones tomadas(2.2.4). Por ltimo, una gua
sobre literatura SIVA muestra la cantidad de libros, artculos y ponencias, indicando la
efervescencia de un campo de investigacin en alza (2.2.5).

DISAM-UPMT-98-015

17

Inspeccin automatizada se superficies homogneas mediante Visin artificial

2.1

Carlos Platero

La Inspeccin industrial
La inspeccin fue uno de los motores de la Revolucin industrial, al ayudar a la
realizacin de productos con dimensiones consistentes. Con partes estndar, la nocin de
intercambiabilidad fomentada por Whitney fue finalmente una realidad. La produccin en
serie era posible y las organizaciones tendieron a ser ms complejas. A principios de siglo,
con el aumento de la complejidad se vio la necesidad de separar y formar departamentos de
inspeccin. Durante las tres cuartas partes del siglo, el nmero de inspectores se ha
incrementado paulatinamente, asegurndose stos la responsabilidad de la calidad de los
productos. Los inspectores han actuado cuando detectaban alguna anomala en el proceso.
Pero frecuentemente, esta actitud significaba que mientras se localizaba la mala calidad del
producto, algunos productos ya haban sido embarcados y recibidos por el cliente.
Durante la mayor parte del siglo XX, la organizacin de la inspeccin estaba
normalmente separada del proceso productivo. La responsabilidad de la inspeccin de los
productos dependa del departamento de calidad. Sin embargo, la constatacin de que la
calidad del producto no poda darse desde fuera, sino en su propio proceso, supuso un
punto de inflexin en la Inspeccin industrial.
En una industria cada vez ms automatizada, donde el diseo de los productos
puede ser modificado, las operaciones del proceso cambian de secuencia con slo variar las
rdenes en un programa. Es este ambiente el que propicia que las operaciones de
inspeccin no estn aisladas del proceso, al contrario, deben formar parte de ste. Aun ms,
la mejora de la produccin manufacturera va a depender de la integracin de sistemas de
inspeccin dentro del proceso [Winch96].
En el proceso productivo, el resultado es un producto cuyas propiedades varan
dentro de un rango. Las causas de esta variabilidad son debidas, a las propiedades
estocsticas del control del proceso, la falta de uniformidad de las materias primas, las
variaciones ambientales, como temperatura, humedad, vibraciones, y por supuesto los
errores humanos. La variabilidad del proceso productivo es una de sus caractersticas.
Luego, la inspeccin se encuentra dentro de un mundo variable, en el cual va a tratar de
identificar la extensin de la variabilidad. Por estas razones, es frecuente representar las
medidas mediante distribuciones normales. Algo muy utilizado y que en esta tesis tambin
se va a aplicar.
Dependiendo de la variabilidad un proceso podra producir productos aceptables,
rechazables o bien provocar el reajuste del propio proceso. Este conocimiento es crtico en
cualquier proceso y continuar siendo crtico en el futuro.
En trminos simples, la inspeccin puede ser vista como el examen de alguna
caracterstica del producto, la cual trata de determinar si se encuentra dentro de los valores
esperados. Para su determinacin debe considerarse el emplazamiento, los mtodos, los
instrumentos y si hay necesidad de realizar historiales.

18

DISAM-UPMT-98-015

Carlos Platero

2.1.1

Captulo 2: Problemtica de la Inspeccin visual automatizada

Taxonoma de los problemas de inspeccin


Una primera ayuda para adentrarse en la inspeccin, es realizar una catalogacin de
atributos alrededor de sta: dnde se hace el control de calidad, qu parte de la produccin
es considerada, qu medidas se realizan o qu tipo de tecnologa se emplea. A continuacin
se exponen los conceptos bsicos de la problemtica de la inspeccin
Una primera clasificacin se establece en la ubicacin del control de calidad. Las
inspecciones pueden empezar en la recepcin de las materias primas, continuar en puntos
del proceso, y concluir en el empaquetado y embarque. El control de recepcin se aplica a
las partidas de nuevos productos, sean stas materias primas, productos semiacabados o
acabados, las cuales se inspeccionan para verificar las especificaciones establecidas. El
control en curso de fabricacin se realiza continuamente durante la fabricacin del
producto, a intervalos de tiempos fijos, y tiene por objeto vigilar el funcionamiento del
sistema en las mejores condiciones posibles y recoger informacin para mejorarlo. El
control de fabricacin produce, a la larga, los mayores beneficios. Adems de las funciones
de inspeccin, que comparte con el control de recepcin, permite aprender sobre las causas
de variabilidad del proceso, aportando datos para mejorarlo. Por esta razn, el control de
fabricacin es una herramienta imprescindible para la evaluacin de acciones encaminadas
a prevenir fallos, y a perfeccionar el proceso productivo. Las inspecciones en la salida van
dirigidas aceptar o rechazar el producto. Es frecuente utilizar secuencias estadsticas sobre
la produccin final, con el objetivo de descubrir tendencias de desajuste del proceso.
Una segunda divisin se encuentra en el tipo de medida a realizarse. Pueden
tomarse medidas sobre una caracterstica de calidad medible (longitud, masa, contenido de
impurezas, etc.), o sobre atributos o caractersticas cualitativas que el producto posee o no
posee (control pasa/no pasa, por piezas defectuosas). El control por caractersticas medibles
o por variables es ms informativo que por atributos, ya que indica no slo si un elemento
es o no defectuoso, sino, adems, la magnitud del defecto. No es lo mismo que un elemento
tenga una longitud fuera de tolerancia por micras que por centmetros. En consecuencia, es
mucho ms eficaz para identificar las causas de los problemas de calidad mediante
variables cuantitativas. Lo que justifica que se utilice especialmente en el control de
procesos. Cuando el objetivo del control no es establecer acciones preventivas, sino
nicamente verificar las especificaciones (como ocurre en el control de recepcin), el
control por atributos es el ms adecuado. Por ser ms rpido y simple de aplicar y, por
tanto, ms econmico.
Una tercera dicotoma est en los mtodos a emplear. Estas operaciones pueden ser
realizadas por operadores o automticamente. Ambas deben ser consideradas para la
mejora de la calidad del producto. La capacidad de razonamiento del humano es un
elemento muy importante en estas operaciones, su habilidad y flexibilidad no puede ser
comparada con ninguna mquina. Sin embargo, los aspectos de fatiga y cansancio, hacen
mella en el operario, tomando a veces actitudes subjetivas. En cambio la automatizacin de
la inspeccin, permite dar un juicio invariable en el tiempo, aunque este juicio no sea tan
rico en matizaciones como el del humano.

DISAM-UPMT-98-015

19

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Carlos Platero

Esta tesis, como fue comentado en el anterior captulo, se enmarca dentro de la


Inspeccin visual automatizada, por lo que se procede al estudio de su problemtica.

2.2

Inspeccin Visual Automatizada


La inspeccin visual de objetos forma parte del proceso de fabricacin. La
automatizacin de esta tarea est siendo realizada de manera lenta, si se compara con otros
eslabones de la cadena de produccin, como transporte de materias primas o ms
recientemente la mecanizacin y ensamblaje de productos. La razn de esta languidez hay
que buscarla en su enorme dificultad. Su complejidad viene originada, por la cantidad de
capacidad de razonamiento que es necesaria implementar, ya sea para aceptar/rechazar un
producto o clasificarlo segn un tipo de defecto. La complicacin del problema es tan
elevada, que excepto unos pocos sistemas experimentales [Marsh90], el diseo se orienta a
la inspeccin de una tarea altamente especificada. La construccin de un Sistema de
Inspeccin Visual Automatizada, SIVA, y en ingls conocido como Automated Visual
Inspection, AVI, requiere de la intervencin de mltiples disciplinas, tales como la
Automtica, la Visin e Inteligencia artificial o la Mecnica. An siendo de una gran
complejidad, con unos costes elevados, aunque decrecientes, y enmarcado en un contexto
internacional de economas abiertas, la automatizacin de las tareas de inspeccin visual se
convierte en exigencia en sectores productivos con altos niveles de competencia.
En los ltimos aos, ha habido un aumento de atencin por parte de la comunidad
cientfica y tcnica en el desarrollo de los SIVA, primero por lo apuntado anteriormente,
una necesidad industrial con creciente prioridad. En segundo lugar, porque ha lanzado a la
comunidad un conjunto de retos asociados a la Visin artificial y al Reconocimiento de
Formas. Y por ltimo, el aumento de capacidad de trabajo de las computadoras, as como
de soporte fsico especializado, ha roto las fronteras de imposibilidad de operatividad en
lnea, junto con un abaratamiento de los costes. Todo ello ha impulsado, a una
efervescencia en torno a los SIVA, que queda reflejado por el aumento de sistemas
instalados, as como por la proliferacin de literatura especializada y de congresos
monotemticos.
Si bien cabe decir que no es una acepcin universal, dentro de la nomenclatura
SIVA hay que distinguir los conceptos de inspeccin, test y reconocimiento. Inspeccionar
es el proceso de determinacin de si un objeto se desva de un conjunto de
especificaciones. Generalmente, la inspeccin visual implica medidas de los objetos,
acabados superficiales y ensamblajes de elementos. La inspeccin es una tarea dentro del
control de calidad, pero se distingue de una labor de test, pues la primera implica un
examen completo del producto y la segunda una exploracin espordica. El reconocimiento
consiste en la identificacin positiva de los objetos detectados en la fases de inspeccin o
de test. La identificacin del objeto dentro de los SIVA, en general, no es necesario, ya que
sta asume un conocimiento a priori del problema. Por tanto, inspeccin, test, y
reconocimiento son distintas pero tareas que estn relacionadas. Una pieza puede ser

20

DISAM-UPMT-98-015

Carlos Platero

Captulo 2: Problemtica de la Inspeccin visual automatizada

inspeccionada y detectadas sus anomalas, pero su identificacin y catalogacin


corresponder a una etapa de reconocimiento. Con dicho motivo, el desarrollo de esta tesis
lleva dos lneas claramente definidas, una basada en la deteccin de los defectos,
ntimamente ligada al Procesamiento de imgenes, y la otra, en la clasificacin de las faltas
asentada en el Reconocimiento de formas.
2.2.1

Ventajas de la Inspeccin Automatizada Visual


En el mundo industrial, las tareas de inspeccin han sido realizadas
tradicionalmente por operarios humanos, bien sea en su totalidad o por muestras
representativas del lote. Algunas experiencias [Barri69] han indicado que los inspectores
humanos tienden a ser ms exactos, en la inspeccin por lotes muestreados que en la
modalidad de 100 % del producto, probablemente por razones de fatigamiento y
alienacin. Como resultado, la inspeccin del 100% con operadores humanos requiere de
altos niveles de redundancia, lo cual incrementa el coste y el tiempo para la inspeccin.
Sin embargo, sea por razones de competitividad, como ocurre en las industrias
transformadoras de materias primas, acero, aluminio, papel, ..., o porque corresponde con
aplicaciones crticas, tales como industria farmacutica o aerospacial, donde un simple
fallo es inaceptable, la mayora de estas empresas son conscientes de la importancia de la
calidad del producto. El coste de una pobre calidad en los componentes ha sido estimada,
en trminos de ventas perdidas, entre un 5% y un 10%, y aproximadamente un 20% de
ventas sobre productos finales [LeBea90]. Por tanto, el 100 % de la inspeccin es deseable.
La inspeccin basada en el muestreo de la produccin tiene dos inconvenientes: el
riesgo del fabricante y el riesgo del consumidor, la primera viene originada por el error
producido al rechazar un lote cuando ste cumple con los requisitos, mientras el riesgo del
consumidor es la aceptacin de un lote de baja calidad. Las consecuencias asociadas a estos
errores son, la prdida de confianza y de reputacin de los productores. La reduccin de los
errores de inspeccin tienden a anularse cuando se examina el 100 % del producto.
La inspeccin automatizada es necesaria, pues los inspectores humanos no son
siempre evaluadores conscientes de los productos. De hecho, en los estudios llevados a
cabo [Smith93], se ha observado que la inspeccin visual humana tiene, en el mejor de los
casos, una efectividad del 80 %, y adems sta se consigue con una frrea estructura de
chequeo. En contraste con estos datos, los sistemas de inspeccin basados en Visin
artificial, resultan tener menores costes laborales y con una medida de calidad objetiva,
medible y mejorable. Aun con mayor motivo, los SIVA se presentan como la solucin
perfecta en ambientes insalubres.
Normalmente, muchas tcnicas de inspeccin son ejecutadas con la intervencin de
dispositivos que se ponen en contacto con el objeto a examinar, necesitando, a veces,
detenerlos y colocarlos segn posicin y orientacin. Mientras en la filosofa SIVA, la
posibilidad de colocar los sensores pticos en los lugares apropiados, permitirn las
observaciones sin necesidades de detencin. Adems, los controles visuales no implican
contactos con los objetos, disminuyendo los riesgos de deterioro de los productos.

DISAM-UPMT-98-015

21

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Carlos Platero

Tradicionalmente, las operaciones de inspeccin suelen realizarse al finalizar el


ensamblaje del producto. Sin embargo, la inspeccin durante el proceso de produccin
ofrece ciertas ventajas. En el caso de slo detectar fallos en la ltima fase, los materiales
empleados, el tiempo consumido y la mano de obra utilizada, han sido desperdiciados. Por
ejemplo, dentro de la industria de PCB, se ha estimado que encontrar un fallo antes de
montar los componentes sobre el circuito impreso, costara alrededor de 25 centavos,
mientras el mismo defecto localizado al termino del montaje de componentes, tendra un
coste aproximado de 40 dlares [Zeuch88]. Nada impide utilizar SIVA en cualquier parte
del proceso, a diferencia de los inspectores humanos que requieren un determinado espacio
y un ambiente salubre.
Los procesos de ensamblaje con multitud de movimientos en poco tiempo, hace
fsicamente imposible la inspeccin visual humana. Otro tanto sucede, cuando se trata de
examinar bandas de materias primas. Las velocidades con que se mueven, como es el caso
del acero, el papel, la madera, suelen ser tan elevadas, que la efectividad del operario es
decreciente con el paso del tiempo. En definitiva, el operario muestra poca eficacia en
ambiente repetitivos con escenas poco cambiantes o con movimientos a gran velocidad.
Una de las mayores prestaciones de los SIVA, es su utilidad como elemento de
realimentacin en el proceso productivo. Una elevada frecuencia de aparicin de un
determinado tipo de defecto, podra indicar el mal funcionamiento de una herramienta o de
una mquina, en el ciclo. Por ejemplo, dentro de los SIVA implementados en el contexto
de esta tesis, la aparicin de un determinado nivel de defectos del tipo shive en la pasta de
papel, indicaba la mala coccin de la madera. Y en el caso de aluminio colado, la falta
llamada sticking, vena originada por el desgaste de los rodillos de prensado.
Resumiendo, las ventajas atractivas de las mquinas industriales de Visin artificial
respecto al sistema de visin humano son :

22

La inspeccin humana es vulnerable. Los SIVA pueden ser emplazados en


ambientes peligrosos y en condiciones extremas de espacio.

La inspeccin humana es subjetiva. Los SIVA pueden realizar medidas con gran
objetividad y repetitividad.

La inspeccin humana es falible. Los SIVA nunca comenten un error por


aburrimiento o por falta de atencin.

La inspeccin humana puede ser demasiada lenta. Los SIVA suelen trabajar en
tiempo real respecto al proceso manufacturero.

La inspeccin humana es insensible a cambios sutiles que afectan a la totalidad de


la escena. Los SIVA pueden observar tales cambios y reaccionar ante ellos con
objetividad.

DISAM-UPMT-98-015

Carlos Platero

2.2.2

Captulo 2: Problemtica de la Inspeccin visual automatizada

La inspeccin humana es reticente. Los SIVA pueden estar integrados en el proceso


manufacturero, haciendo de bucle de realimentacin.

Limitaciones de los SIVA


Aunque la Inspeccin Visual Automatizada pudiera parecer la panacea en la
reduccin de costes y en el aumento de la calidad, esta solucin no es siempre posible. La
viabilidad del sistema de inspeccin depende de varios factores, de su funcionamiento en
tiempo real y de su consistencia, robustez y eficiencia. Es difcil definir formalmente el
significado de inspeccin en tiempo real, si bien Van Gool et al [VanGo91] han sugerido
una definicin de trabajo, que el sistema de inspeccin visual no sea el mayor cuello de
botella en la reduccin del ciclo de trabajo o en la velocidad de operacin del robot. Desde
la problemtica del tiempo real, la validez del sistema depende de la capacidad de procesar
el volumen informativo que le llega desde los sensores y consiga catalogar el producto. Por
ejemplo, en el caso de examinar una banda de produccin, la velocidad de sta es crtico en
la operatividad del sistema. En la prctica y dentro de la inspeccin de superficies planas,
hay velocidades de bandas de acero por encima de los 600 m/min [Dahle90], mientras que
en el aluminio colado es de 2 m/min [Plate95a].
De otro lado, la inversin inicial de los SIVA es elevada y consumen mucho tiempo
en el desarrollo. Los coste de diseo pueden superar por encima de los 100.000 dlares
[VanGo91]. Y generalmente, los costes de ingeniera no pueden ser amortizados entre
varios sistemas, por el carcter especfico de cada uno de ellos. Casi obligando en cada
nuevo diseo a empezar desde cero. Por tanto, la inspeccin automatizada visual es slo
posible cuando la aplicacin va a trabajar sobre un gran volumen de negocio, cuando se
demande medidas muy precisas, se requiera inspeccin consistente o se trabaje en un
ambiente muy inhspito.
Las complejidades de procedimientos existentes en los SIVA, pueden ser reducidas
con los emplazamientos adecuados de los objetos a examinar. Cintas transportadoras,
tablas rotatorias, sistemas de posicionamiento y mltiples sistemas mecnicos, estn siendo
usadas para facilitar las tareas de inspeccin. Los sistemas mecnicos son piezas
fundamentales en el diseo. Por ejemplo, en la inspeccin de baldosas cermicas de
Fernndez [Fernn97a], los algoritmos de deteccin de faltas en la serigrafa, basados en
template matching, resulta muy crtico el sistema mecnico de parada y posicin de las
baldosas. Similares preocupaciones se encuentran en la inspeccin de pliegos de billetes de
bancos de Sebastin [Sebas95]. Las tcnicas de iluminacin son otra baza en la
simplificacin del problema. Iluminacin a contra luz suele ser frecuente en la inspeccin
de simples objetos. Diferentes tcnicas de contraste de iluminacin, como uso de la
componente especular o luz estructurada, han sido exitosas en la inspeccin en altas
velocidades. Desafortunadamente, los sistemas mecnicos de posicionamiento y las
arquitecturas de iluminacin no son suficientes para atacar el examen de superficies
complejas. La flexibilidad humana de cambiar los puntos de vista, tanto de posicin como
de luz recibida, hacen de estas virtudes irremplazables por ningn sistema automtico.

DISAM-UPMT-98-015

23

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Carlos Platero

Las riquezas de matices de los inspectores humanos no pueden ser desestimadas.


Wright [Wrigh88] ha observado como los operarios realizan inspecciones precisas y bajo
razonamientos de aceptacin / rechazo extremadamente complejos, siendo especialmente
cierto cuando es aplicado a formas arbitrarias. Por ejemplo, en el proceso de montajes de
piezas aerospacial, la conjuncin de maquinaria en la realizacin de las tareas es de una
dificultad tan elevada, que se llega afirmar que el ciclo de trabajo es no determinista e
inestable, y que las valoraciones y habilidades de los operarios son absolutamente
necesarios dentro de la monitorizacin del proceso. La automatizacin de inspeccin
inteligente y flexible seguir siendo un reto de investigacin en los aos venideros.
2.2.3

Clasificacin de los Sistemas de Inspeccin Visual Automatiza (SIVA)


2.2.3.1 Clasificacin atendiendo a la geometra de la superficies a
inspeccionar
Newman [Newma95] ha realizado
una clasificacin sobre los posibles
Escenarios de Inspeccin
escenarios en los que se enfrentan la
inspeccin visual. Su clasificacin se
Objetos compuestos por
Objetos compuestos por
basa en las geometras de las superficies a
superficies arbitrarias
superficies cuadrticas
observar. La figura 2.1 muestra la
dicotoma segn el tipo de superficie del
Identificacin
Identificacin
objeto a inspeccionar. En el primer nivel
conocida
desconocida
del rbol dicotmico, la separacin se
Posicin
Posicin
Posicin
Posicin
produce por el tipo de superficie que
desconocida
conocida
desconocida
conocida
constituyen los objetos a inspeccionar,
distinguindose
entre
superficies
arbitrarias y superficies cuadrticas.
Muchos de los objetos industriales
pueden modelarse usando slo planos y Figura 2.1 Escenarios de inspeccin segn
unas pocas primitivas cuadrticas, como geometra de superficies
esferas y cilindros. Por tanto, la mayora
de los sistemas de inspeccin no tratan con las complicaciones de superficies arbitrarias.
Sin embargo, con el incremento del uso de plsticos en la industria, las superficies de los
objetos tienden a tener formas libres y complejas, generando una demanda de SIVA que
manejen geometra de superficies libres.
En el nivel siguiente del rbol indica si la inspeccin requiere de la solucin de un
sistema de reconocimiento de formas. Los objetos que son expuestos delante de los
sensores pueden ser conocidos o no de antemano. En el caso normal, las escenas son
estructuradas y todos los elementos se encuentran en la base de datos del SIVA. Por ltimo,
en el nivel ms bajo del rbol est si se conoce o no la posicin de los objetos. En la
mayora de los sistemas reportados focalizan el problema bajo el dominio de identificados
los objetos y conocidas las posiciones.

24

DISAM-UPMT-98-015

Carlos Platero

Captulo 2: Problemtica de la Inspeccin visual automatizada

En esta tesis, se ha enfrentado al problema de escenarios de superficies modeladas


con planos, objetos identificados, entendindose que todos los posibles defectos son
conocidos y sus posiciones tambin estn encuadradas dentro del escenario SIVA.
2.2.3.2 Clasificacin atendiendo al tipo de imgenes adquiridas
Segn el tipo de informacin dada por los sensores, los SIVA se pueden clasificar
en inspeccin basada en imgenes binarias, en niveles de grises, en imgenes de color o en
imgenes tridimensionales.
Histricamente, la mayora de los sistemas de visin comercial para la inspeccin
automtica han usado imgenes binarias. Muchos de estos sistemas utilizan imgenes de
baja resolucin y sus prestaciones suelen ser simples verificaciones, tales como test o
presencia de alguna parte [King85]. La informacin binaria es suficiente para la inspeccin
de muchos objetos industriales, a los cuales basta con representarlos mediante su silueta.
Esta arquitectura ofrece ventajas de tipo econmico, al ser constituido por sensores de bajo
costo, en conjuncin de sistemas de iluminacin simples, como de tipos a contraluz. La
informacin adquirida permite inspeccionar objetos de altos contrastes entre s, pero resulta
difcil o imposible determinar su orientacin o su textura. De otro lado, el nivel de datos a
procesar se reduce considerablemente, lo que ayuda tanto en los requerimientos de
velocidad de procesado como de los costes[Chin92]. Tpicamente, los sistemas de visin
de imgenes binarias son empleadas en simples verificaciones de las escenas, como puede
ser el examen de contornos.
Mltiples sistemas de inspeccin basados en niveles de grises han sido presentados
en la literatura. Sin embargo, hay muy pocos sistemas que sean capaces de ejecutar
inspeccin visual en ambientes complejos, aunque esta matizacin se puede generalizar
para cualquier tipo de informacin. La mayora de estos SIVA localizan los defectos
mediante el anlisis del histograma o utilizando sustraccin de imgenes[Batch92]. No
obstante, el avance de las tecnologas de procesamiento de seales ha permitido dar un
impulso muy importante durante la dcada de los 90 a SIVA con imgenes en niveles de
grises, de hecho en la tabla 2.1 queda reflejada la tendencia actual, imprimida en anlisis de
imgenes basadas en niveles de grises.
Se ha observado que el color es un factor importante en la inspeccin tanto de
textiles como de alimentos, donde las variaciones de color indican la posibilidad de
defectos. Los humanos no suelen utilizar el color para la inspeccin, pues no se tiene buena
memoria para los colores. Sin embargo, la inspeccin de tareas mediante color son muy
apropiadas para la automatizacin. No obstante, la necesidad de ms capacidad de
procesamiento ha limitado por ahora un tanto su difusin. Adems, factores como la
intensidad de la fuente luminosa, el ngulo de incidencia, el nivel de temperatura del foco,
la apertura de la lente resultan cruciales en la exactitud del color, lo que dificultan aun ms
las tareas de inspeccin[Parth87].
En muchas aplicaciones, se precisa de una informacin tridimensional. Las piezas
mecnicas de superficies complejas requieren de un anlisis dimensional, donde la

DISAM-UPMT-98-015

25

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Carlos Platero

informacin 3D es necesaria. En estos casos, la solucin no puede estar dada en


procedimientos 2D de Visin artificial, habr de recurrir a la inspeccin visual con tcnicas
3D, tales como pares esteroscpicos, luz estructurada o sensores de rango [Gonz98].
2.2.3.3 Clasificacin atendiendo a las tcnicas empleadas de deteccin
Las tcnicas de los SIVA pueden clasificarse en dos grandes grupos. El primero
comprenden las tcnicas de casamiento de patrones, template matching, mediante las
cuales se detectan anomalas visuales comparando las imgenes del producto sometido a
inspeccin con imgenes que no contienen defectos. El segundo grupo incluyen aquellas
tcnicas basadas en la extraccin de caractersticas desde la imagen, que comparan los
valores con modelos de reglas, cognitivos o estadsticos.
La inspeccin visual mediante el casamiento con un patrn consiste en una
comparacin pixel a pixel de dos imgenes: una del producto sometido a inspeccin y otra
del producto ideal, sin defectos. Esta segunda imagen patrn se encuentra almacenada en el
sistema y puede ser una imagen obtenida por una cmara, por un conjunto de imgenes
procesadas o de un modelo sinttico obtenido por CAD. Se suele presentar como una
comparacin multinivel con correlacin normalizada [Matrox97]. Las tcnicas de
comparacin con patrn son flexibles y resultan, en muchos casos, la nica forma posible
de realizar una inspeccin fiable. No obstante, presentan inconvenientes cuando hay que
buscar un modelo en una imagen en la cual se desconoce su posicin aproximada. E
incluso un cambio de la orientacin del modelo puede resultar insalvable.
La mayora de los SIVA implementados en la industria y recogidos en la literatura,
usan mtodos basados en la extraccin de caractersticas. Se fundamentan en una adecuada
parametrizacin del producto, o lo que es ms habitual, una parametrizacin de los posibles
defectos que hacen que el producto sea rechazado. Esta modelizacin consiste en una serie
de caractersticas extradas de la imagen, lo que se conoce como vector de caractersticas.
Estos parmetros pueden ser reas, texturas, momentos de inercia, histogramas, etc. Una
vez obtenido el modelo de la imagen, se clasifica mediante algunas de las tcnicas del
Reconocimiento de Formas. Una ventaja inherente a este tipo de mtodo de inspeccin es
la falta de necesidad de mantener almacenada una extensa base de datos de imgenes de
patrones. Por otra parte, dichos mtodos de inspeccin presentan la desventaja de que
cambios en el diseo del producto inspeccionado exigen una etapa de fuera de lnea.
2.2.4

Implementacin de SIVA
La tabla 2.1 recoge una seleccin de SIVA implementados en la industria actual. En
ella se ven los atributos segn tipo de informacin, mtodo utilizado y geometra de las
superficies.

26

DISAM-UPMT-98-015

Carlos Platero

Captulo 2: Problemtica de la Inspeccin visual automatizada

Tabla 2.1 Referencias de SIVA implementados

2.2.5

Aplicacin

Tipo de informacin

Mtodo

Geometra

Referencia

Acero

niveles de grises

caractersticas

plana

Parsy97

Agricultura

color

caractersticas

arbitraria

Poole89

Aluminio

niveles de grises

caractersticas

plana

Plate94

Baldosas

niveles de grises

casamiento

plana

Fern97

Circuito impreso

color

caractersticas

plana

Xie91

Circuito impreso

binaria

casamiento

plana

Ninom92

Fecha de
caducidad

niveles de grises

casamiento

plana

Plate97a

Madera

color

caractersticas

plana

Oulu97

Pasta de papel

niveles de grises

caractersticas

plana

Plate98

Pliego de billetes

niveles de grises

casamiento

plana

Sebas95

Textiles

niveles de grises

caractersticas

plana

Serran95

Literatura de los SIVA


Muchos sistemas de inspeccin visual automatizada han sido presentados en la
literatura especializada. Chin y y Harlow hicieron un primer resumen sobre SIVA
[Chin82]. Un segundo trabajo del estado de la tcnica, cubriendo el periodo 1981 a 1987,
fue publicado de nuevo por Chin [Chin88]. Newman y Jan [Newma95] abordan el examen
desde 1988 a 1993. La literatura sobre SIVA es muy amplia y no slo restringido en
artculos y ponencias en el mundo de la Visin Artificial, sino tambin en Robtica, CAD y
en otras disciplinas de la Ingeniera. Adems de la aparicin de artculos regulares en
revistas como CVGIP Graphic Modelling and Image Processing, CVGIP Image
Understanding, Int. Journal of Computer Vision, Machine Vision and Applications, IEEE
Pattern Analisys and Machine Intelligence, es posible encontrar sesiones monotemticas
del SPIE o congresos internacionales especficos como los celebrados en Francia (Bourde

DISAM-UPMT-98-015

27

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Carlos Platero

95, LeCrouest 97), Italia (Florencia 98) y Japn (Tokio 98). Muchos otros sistemas de
inspeccin no han sido ni incluso reportados, probablemente debido a consideraciones de
privacidad.
Coma ya ha sido comentado anteriormente, dos son los problemas generales: las
tcnicas dedicadas a la deteccin de los defectos, y las referentes a la clasificacin de las
faltas. Estas dos problemticas suelen presentarse por separado. Las primeras se
especializan en los algoritmos de procesamiento de imgenes, sobre todo, si son defectos
locales, en el contraste de los defectos, la aplicacin de mscaras, template matching, etc.
son habituales. Por otro lado, est la clasificacin de defectos, que en general parten de un
vector de caractersticas y utilizan tcnicas que van desde sistemas expertos a redes
neuronales, pasando por clasificadores paramtricos y una multitud de procedimientos
especficos. Todas estas tcnicas, tanto las de Procesamiento de imgenes como las de
Reconocimiento de Formas, son expuestas en multitudes de libros, artculos, ponencias,
documentaciones internas as como pginas WWW, mostrando el auge de una
investigacin en alza.

2.3

Conclusiones
Se ha abordado la problemtica de la Inspeccin industrial concluyendo en la
necesidad creciente de insertar las operaciones de inspeccin dentro del proceso
productivo. De las muchas tcnicas empleadas, la inspeccin visual automatizada es una
rama fundamental para esta nueva filosofa, sobre todo para las industrias de materias
primas o sectores que requieren el 100% de la inspeccin. No obstante, las dificultades de
esta tecnologa hacen lenta su evolucin, convirtindose en tema de estudio para muchos
investigadores.

28

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Formacin de imgenes en
Sistemas
de
inspeccin
visual
automatizada (SIVA)
Los SIVA se encuentran con escenas visuales de informacin en el espacio
continuo y sin embargo el desarrollo y diseo de los SIVA se sustenta en tecnologa
digital. Luego se evidencia el paso de informacin continua en el tiempo a discreta. La
captacin de la informacin presente en el espacio continuo, as como la forma en que sta
va a ser alterada, como consecuencia de la transformacin a datos discretos, requiere ser
estudiada con cierta profundidad para comprender las limitaciones de resolucin que
impone el sistema de adquisicin en su conjunto.
Las escenas que aborda esta tesis, consisten en superficies planas, las cuales van a
ser inspeccionadas en la localizacin visual de defectos en el material. La capacidad de
respuesta de los SIVA depender, en un primer paso, de la posibilidad de captar la
informacin del exterior lo ms fiablemente posible. An ms, en esta fase, crucial en el

DISAM-UPM DISAM-UPMT-98-015

29

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

diseo, se requiere reconstruir una visin virtual1 de la escena, que sea consistente con la
realidad puesta delante del sistema de adquisicin.
La transformacin de la realidad en virtual, debe cumplir con los criterios de la
deteccin de los defectos y an ms importante, con la mtrica entre lo real y lo adquirido,
esto es, que si se detecta un defecto, el nmero de pxeles asociados a ste debe ser
proporcional al rea del defecto. As en los casos prcticos utilizados en esta tesis, ha sido
necesario detectar defectos por debajo de 0.04 mm2 en la pasta de papel [Ence94], mientras
en el aluminio colado las faltas ms pequeas eran de 1 mm2[Brite92].
La figura 3.1 muestra un esquema de
adquisicin de escenas visuales de inspeccin
superficial. El motivo es iluminado de manera
ptima, tal que aumente el contraste entre el fondo
y el defecto; la luz reflejada o transmitida pasa a
travs de un sistema ptico, adecuando la escena al
tamao del elemento sensor. El transductor est
constituido por elementos sensores, que convierten
los fotones recibidos en una seal elctrica. La
cmara de estado slido da un formato a la imagen
recibida en seal elctrica, pudiendo ser de tipo Figura 3.1 Elementos constituyentes
digital o analgico. sta es transmitida hasta el de formacin de imagenes en SIVA
computador, ya sea para su monitorizacin o
procesamiento. En el caso de utilizar seal elctrica analgica, se requiere de la conversin
a formato digital. Sea como fuese, se habr generado una correspondencia entre la realidad
y lo almacenado en el computador.
Sistema de
iluminacin

ptica

Movimientos de la banda

Batera de cmaras

Escena

Lnea de inspeccin

Se pretende abordar las capacidades de medidas de los SIVA y stas estn


ntimamente ligadas a las calidades de las imgenes adquiridas. Como se ha podido
observar, las posibilidades mtricas dependen de una multitud de factores; si se considera
slo la etapa de adquisicin de imgenes, los elementos a tratar son los sistemas de
iluminacin, las caractersticas de los sensores y las transmisiones y adquisiciones de las
seales de vdeo. El diseo de una aplicacin adecuada, requiere del anlisis de todos los
factores que influyen en las prestaciones, buscando, adems, las fuentes de degradacin.
Esta ltimas pueden ser eliminadas y/o compensadas, mediante la seleccin apropiada de
soporte fsico, compromisos de medidas y tcnicas de calibracin. El exacto conocimiento
de los factores que influyen en la calidad de la imagen, permitir con posterioridad la
seleccin correcta de los componentes.
El desarrollo de este captulo va a tratar de cmo afectan los diferentes elementos
del sistema de adquisicin de imgenes a la mtrica virtual (3.1), centrndose
especialmente en el subsistema de iluminacin (3.3) y en la seleccin de arquitecturas de

El concepto de virtual hace referencia a la aplicacin unvoca entre la informacin visual real y su
representacin almacenada en el computador

30

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

cmaras de estado slido (0). Los motivos son que stos representan los elementos ms
crticos en la calidad de la imagen y por ende en la mtrica. Adems son subsistemas
genricos de los SIVA, a diferencia de otros, como el entorno de trabajo, que dependen de
la naturaleza del producto concreto a inspeccionar. Adems tambin se estudiarn los
modelos de comportamiento de las superficies ante la luz (3.2), que junto con los modelos
de fuentes luminosas podrn permitir presentar una metodologa para el diseo del sistema
de iluminacin de los SIVA (3.4). Para acabar se muestran algunos ejemplos de formacin
de imgenes en SIVA documentados (3.5.3).

3.1

Caracterizacin de imgenes digitales


La calidad de una imagen es una impresin subjetiva, que va desde pobre hasta
excelente. La habilidad de la percepcin realizada por el cerebro, viene afectada no slo
por el sistema de visin humano, sino tambin de otros sistemas sensoriales, junto con los
emocionales, ms del aprendizaje y de la memoria. Las relaciones entre stas son
complejas, intrincadas y no comprendidas. Los juicios personales varan ante una misma
imagen y las valoraciones pueden ser muy dispares.
Muchas expresiones han sido dadas para categorizar una imagen, cada una es
apropiada segn un particular conjunto de condiciones. Estas expresiones suelen ser
obtenidas desde las observaciones empricas, donde un grupo de imgenes son ordenadas y
posteriormente se infiere alguna ecuacin que justifique la clasificacin.
En un principio, la calidad de la imagen estaba relacionada con las lentes y la
funcin de transferencia de modulacin, MTF (Modulation Transfer Function), de la que
se hablar ms adelante. Con el avance de la tecnologa, la calidad se ha centrado en la
minimizacin de la relacin seal ruido, SNR, y en la arquitectura de las cmaras. Muchos
tests han dado medidas sobre la calidad de la imagen. La mayora de las mtricas estn
relacionadas con la MTF, la resolucin, la velocidad de las imgenes o la relacin seal
ruido. En general, las imgenes con altos valores de MTF y bajo ruido son clasificadas
como imgenes de gran calidad. Las prestaciones del sistema de visin dependen de las
cmaras, lentes, monitores, iluminacin, etc. Y slo al final se puede plantear la calidad de
la imagen.
Los ms importantes factores que afectan a la calidad geomtrica y radiomtrica de
una imagen adquirida por cmaras de estado slidos son los siguientes:

Iluminacin

Superficie a inspeccionar

ptica

Sensores

DISAM-UPM DISAM-UPMT-98-015

31

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Cmaras

Transmisin y digitalizacin de imgenes

Entorno

Carlos Platero

La seleccin de una apropiada iluminacin es una pieza clave en las tareas de


inspeccin. La uniformidad de luminosidad en la superficie, la estabilidad temporal y su
respuesta espectral, as como las propiedades pticas del entorno deben ser consideradas.
La falta de homogeneidad de intensidad luminosa en la superficie inspeccionada, puede
acarrear que cientos de pxeles aparezcan como defectuosos, cuando stos no lo son. Por la
extensin y la importancia en el buen funcionamiento de los SIVA, se ha dedicado un
apartado aparte para abordar el estudio de las fuentes luminosas (3.3). Estos estudios
permitirn con posterioridad establecer criterios cientficos en la colocacin ptima de los
focos luminosos y las cmaras respecto a las superficies a inspeccionar.
El segundo aspecto se refiere a la naturaleza del producto a inspeccionar. El tipo, el
color, el tamao y forma del defecto junto con su fondo, obviamente influyen en las
exactitudes de las medidas. stas dependen sobre todo del tamao del defecto y de su
contraste. En la figura 3.2, se muestra un defecto con resolucin variable de 2 a 17
pxeles/mm, junto con la precisin del sistema en su localizacin. Como se observa existe
un fuerte incremento en precisin, cuando el defecto pasa de 2 a 6 pixel/mm, aunque slo
un suave aumento si se pasa a mayor resolucin. En el primer caso, ha habido un
incremento de contraste que haba sido degradado por la propia MTF del sistema. Un
aumento desmedido de la resolucin, provoca
una disminucin del gradiente entre el fondo y
defecto, que tiene como efecto una degradacin
del contraste. Por la propia naturaleza, este
Repetitividad [Pixel]
factor hay que considerarlo segn el problema
en concreto. No obstante, como se ver en el
apartado sobre seleccin de cmaras, el tamao
del defecto definir el campo visual de
inspeccin por cada cmara, mientras el
contraste entre defecto y fondo, es tema de
[pixel ]
trabajo abordado desde el tipo de iluminacin
empleada y las tcnicas de procesamiento de
imgenes digitales.
Figura 3.2 Precisin y resolucin
Los aspectos referidos a las pticas, sensores, cmaras y digitalizadoras van a ser
abordados con mayor detalle, en una doble vertiente. En el siguiente subapartado, las
pticas, los sensores y las tarjetas de adquisicin son estudiadas, dejando para ms adelante
la seleccin definitiva de arquitectura de cmaras. Las razones son que estas ltimas
dependen del tipo de iluminacin. Luego ser necesario tratar previamente el diseo de la
iluminacin para establecer que tipos de cmaras son las ms adecuadas.
Por ltimo, respecto al entorno, hay que citar la temperatura, la humedad, las
vibraciones y las iluminaciones ambientales. Por ejemplo el efecto de la temperatura, ste

32

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

puede producir profundos cambios en las cmaras desde que se enciende hasta que alcanza
su rgimen permanente. Estos cambios provocan errores en magnitudes de pxeles. Sus
causas se encuentran en las deformaciones mecnicas y en las variaciones en la frecuencia
del reloj, debidos a los cambios de temperatura. Hay casos de multitud de cmaras que
requieren ms de dos horas antes de alcanzar su estado estable [Sanch98].
3.1.1

Deformaciones de las imgenes debidas a las pticas, sensores y


tarjetas de adquisicin
3.1.1.1 ptica
Las cmaras de estado slido, como muestra la figura 3.3, estn constituidas por un
numeroso conjunto de elementos pticos. En cualquier aplicacin prctica en la que un
objeto o una escena es captada por un dispositivo
ptico, el tamao de la imagen formada es
proporcional a la distancia entre el objeto y las lentes.
Cristal protector
Los sistemas pticos estn formados por lentes,
espejos, prismas y dems elementos, que en conjunto
actan estableciendo una transformacin determinista
de una distribucin espacial de luz de entrada hacia
una distribucin espacial de la luz de salida. Tambin
se puede hacer uso del concepto de sistema para
Lente
Filtro IR
Difusor
Sensor
comprender la propagacin de la luz espacial a travs
del espacio o a travs de algn medio dielctrico. A
medida que la distancia al objeto se incrementa, el
tamao de la imagen decrece y al contrario, a medida Figura 3.3 Elementos pticos de una
que la distancia al objeto disminuye el tamao de la cmara de estado slido
imagen aumenta [Hect84]. Sin embargo no es posible
modelar el comportamiento del sistema ptico nicamente por esta situacin. A pesar de
que la imagen se encuentre perfectamente enfocada en el plano imagen del sensor, es
necesario evaluar las posibles distorsiones o aberraciones que se pueden originar como
consecuencia del paso de la imagen por este sistema fsico y que provocan una fuente de
error en el proceso completo de adquisicin de una imagen. En ocasiones ser importante
considerar esta fuente de error presente en la imagen digital de partida. No obstante, por el
nivel tecnolgico actual de estos productos, es tan elevada su exactitud que no afecta en la
precisin de equipos por debajo de 1/50 pxeles [Beyer93].
Para el siguiente estudio sobre las fuentes de degradacin de las lentes, se asume la
simplificacin de que los rayos de la luz siempre viajan en lnea recta a travs de un medio
homogneo. Segn esta hiptesis, un haz que pase a travs de una apertura, produce una
proyeccin de luz sobre una pantalla con una forma geomtrica dependiente de la apertura
del sistema ptico[Sebas90]. De cualquier modo, si la distribucin de luz en la regin entre
las reas oscuras y claras sobre el plano de imagen sensor se examina con cierto grado de
detalle, se evidencia que la frontera no se encuentra muy definida. Este efecto es ms
pronunciado a medida de que el tamao de la apertura crezca. Desde un punto de vista
simplista, la apertura provoca una inclinacin de los rayos llamados difraccin. Esto
provocar un error en la imagen proyectada sobre el plano de imagen del sensor.

DISAM-UPM DISAM-UPMT-98-015

33

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Si bien la mayor fuente de error en la obtencin de la imagen captada a su paso por


el sistema ptico viene provocada por este efecto, existen otras tpicas fuentes de error
introducidas por la ptica empleada y que se suelen catalogar dentro de uno de los
siguientes tipos[Hect84][Jain89]: aberracin cromtica, astigmatismo, coma, Todas estas
aberraciones y distorsiones originan una imagen proyectada sobre el sensor de captura, con
una cierta deformacin, que ser necesario tener en cuenta en el proceso de modelado de la
captura de la imagen. Las distorsiones de las lentes pueden ser modeladas y por tanto es
posible fijar el valor de degradacin admisible, dependiendo de la tecnologa a emplear.
Otro inconveniente menos estudiado es el alineamiento de la lente con el sensor, as como
la situacin del filtro IR, difusor y cristal difusor, que no suelen estar especificadas por el
fabricante.
En la mayora de los sistemas de formacin de imagen pticas, la radiacin ptica
emitida por un objeto procede de la luz transmitida o reflejada a partir de una fuente de luz
incoherente. La radiacin de la imagen puede ser en la mayora de los casos considerada
monocromtica, en el sentido de que el ancho de banda espectral de la radiacin de la
imagen detectada en el plano de imagen, es pequea respecto a la longitud de onda central
de la radiacin [Pratt91]. Bajo esta hiptesis el sistema de la imagen responder como un
sistema lineal en trminos de la intensidad de entrada y salida, permitiendo utilizar los
conceptos de respuesta en frecuencia, modelizando la funcin de transferencia en el
domino de la frecuencia. As, se define la Funcin de Transferencia Optica (OTF) como
la transformada de Fourier normalizada, pasando del dominio de la intensidad al dominio
de las frecuencias. A partir de la OTF se puede deducir las fuentes de error generadas por
la imperfeccin del sistema ptico. Tal como ha sido comentado anteriormente, el nivel
tecnolgico de los sistemas pticos empleados en los trabajos prcticos de esta tesis, no ha
hecho precisar un estudio que abordase las deformaciones originadas por la ptica. No
obstante, si se han utilizado recomendaciones prcticas como hacer uso de la apertura
mnima del iris en la adquisicin de las imgenes.
3.1.1.2 Sensores
Los fotodetectores son los encargados de transformar la informacin lumnica de
entrada, en informacin elctrica de salida. La mayora de los sensores utilizados en Visin
artificial son los dispositivos de estado slido conocidos como CTD (Charge Transfer
Devices)[Amore90][Beyer93a].Existen dos tipo principales de dispositivos con
caractersticas claramente diferenciales entre s: los CCD ( Charge Coupled Devices), y los
CID (Charge Injection Devices), cuyas diferencias estn bien recogidas en la bibliografa
[Holst96]. Sern tratadas ms adelante (0), en el estudio de las arquitecturas de cmaras.
Una caracterstica de muchas cmaras de estado slido con dispositivos CCD, que
afecta enormemente a la resolucin de la imagen obtenida, es la presencia de regiones no
sensibles en la matriz de elementos CCD sobre la que se proyecta la imagen tras el sistema
ptico, es decir, la presencia de zonas del sensor no activas. Aunque se abordar en el
apartado relacionado con la seleccin de cmaras, el tipo de transferencia entre el sensor y
los registros de desplazamiento, en algunas estructuras, provoca esta prdida de zona
sensible.

34

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

A pesar de ser ste el problema fundamental que produce una prdida significativa
de resolucin espacial al utilizar este tipo de dispositivos, existen otras propiedades en
estos sistemas que originan deformaciones en el tratamiento de la imagen. Idealmente el
fotodetector acta como un convertidor de intensidad ptica a corriente del detector, esto
es, acta como un convertidor de fotones incidentes a electrones recibidos por el
detector[Pratt91][Jain89]. El detector produce una corriente de seal a travs de un filtro
paso bajo, creando una tensin a travs de una carga. La fuente de error ms comn
asociada con los fotodetectores, respecto a la electrnica asociada, consiste en el ruido
trmico resultante de las fluctuaciones de electrones aleatorios en elementos resistivos
dentro del amplificador del sensor. Segn Pratt, el ruido trmico puede ser modelado como
un proceso estocstico normal aditivo, independiente del campo de imagen sensitivo. Un
anlisis ms detallado, requiere del conocimiento de la circuitera del sensor. No obstante,
la corriente de ruido trmico generada se puede modelar como un proceso aleatorio
gaussiano de media cero y varianza dependiente del sensor utilizado.
Por otro lado aun no teniendo en cuenta este ruido trmico generado, la corriente
del fotodectector no tiene un valor verdaderamente constante an cuando la intensidad de
luz incidente sea la misma. Los sensores fotoelctricos exhiben una incertidumbre como
consecuencia de la naturaleza mecnica - cuntica de la luz. A niveles bajos de luz, el
nmero de electrones emitidos por un fotodetector est gobernado por una densidad de
probabilidad de Poisson. La incertidumbre resultante en el conocimiento de la corriente del
detector, se denomina ruido de disparo (shot) en detectores fotoemisivos, y ruido de
generacin recombinacin en conductores fotoconductivos y fotovoltaicos [Reino96]. En
definitiva, el comportamiento de los sensores fotoelctricos es un comportamiento no
lineal, siendo esta no linealidad dependiente de las caractersticas del sensor utilizado.
Adems del efecto de la no linealidad del sensor y del ruido trmico, hay que considerar
las interacciones locales entre elementos adyacentes en el array, que en su conjunto
deforman la informacin recibida.
Por estos motivos, es requerida la modelizacin del comportamiento del plano
sensor, que es realizada mediante lo que se conoce como funcin de extensin puntual
(PSF, Point Spread Function), cuyo anlisis desborda el temario de esta tesis. Esta funcin
refleja las limitaciones del sensor para representar de una forma precisa cada punto sin la
influencia de los vecinos.
Las caractersticas radiomtricas y geomtricas de los sensores de estado slido han
mejorado drsticamente, hasta tal punto, que puede considerarse como el mejor elemento
del sistema de imgenes digitales[Beyer93]. Las prestaciones de los parmetros
radiomtricos, tales como relacin seal ruido (SNR), no-uniformidad de corriente oscura
(DSNU), respuesta fotnica no uniforme (PRNU) son excelentes. Un elemento de
potenciales problemas es el tamao de la superficie y su topografa. Los sensores de gran
tamao son usados para longitudes de onda superiores a los 500 nm [Blouk87]. Mientras,
las diagonales de los sensores estn normalizados a , 1/3, y 2/3. El efecto de la
topografa de la superficie (estructura de las puertas, microlentes) no ha sido investigado
hasta la fecha.

DISAM-UPM DISAM-UPMT-98-015

35

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Sin embargo, las cmaras por la multitud de componentes que las constituyen,
representan uno de los elementos ms crticos. Algunos de los elementos que inducen a la
degradacin son: la autoganancia (AGC), los filtros paso bajo, correcciones de gamma y
control del iris [Balts92]. La estabilidad mecnica entre el sensor y los elementos pticos,
frecuentemente resulta insuficiente. Slo algunos fabricantes usan la suficiente estabilidad.
Por estos motivos, volver a tratarse la eleccin del tipo de cmara, al resultar ser un
elemento fundamental en la calidad de la imagen.
3.1.1.3 Digitalizadoras
El digitalizador es el ltimo componente fsico presente en el proceso de formacin
de una imagen digital. En este elemento se realizan dos procesos diferentes, la
cuantificacin de la seal y su muestreo. Para comprender los errores que se introducen en
el proceso de formacin de la imagen discreta, como consecuencia nicamente de la accin
del convertidor analgico/digital, se van abordar por separado el proceso de cuantificacin
y el de muestro. Aunque estos dos procesos tienen componentes interrelacionadas, es
bueno considerarlos como separados para estudiar los errores debidos a unos y a otros,
pues simplifica la exposicin.
Los errores de muestreo son originados por no cumplir el teorema de Nyquist,
provocando el efecto de solapamiento en frecuencias o aliasing, llevando consigo una
prdida de informacin en la seal discreta de salida. Para evitar esta falta se recurre a la
utilizacin de filtros anti-aliasing, cuyo inconveniente es la perdida de informacin
correspondiente a las componentes de alta frecuencia. No obstante, las prdidas de
precisin son del orden de 0.08 para casos extremos [Reino96]. De otro lado, en el proceso
de cuantificacin se mejora la precisin al aumentar el nmero de niveles de grises. La
incertidumbre introducida por la cuantificacin de la seal analgica en niveles de grises
implica que las caractersticas geomtricas de los objetos disminuyen con una disminucin
del rango de niveles de grises. Pero hay otros factores que tambin juegan en la
determinacin de resolucin en la digitalizadora. Imgenes con elevado nmero de grises
son ms difciles de tratar computacionalmente, requieren de ms memoria para ser
almacenadas y su procesamiento necesita ms tiempo. Por lo que suelen utilizarse
imgenes con 256 niveles de grises, requisito suficiente para la mayora de las aplicaciones
SIVA.
Otro aspecto a destacar es la sincronizacin entre el digitalizador y la seal enviada
por la cmara. La mayora de los digitalizadores establecen sincronismo de lnea (PLL),
esto es, utilizan una sincronizacin entre el digitalizador y la seal proveniente de la
cmara al comienzo del cuadro, recuperando la prdida de sincronismo en cada lnea. Ello
introduce una inestabilidad posicional de varias centsimas de pixel, es decir, cada lnea se
encuentra desplazada con respecto a su lnea contigua (en el campo) un cierto
valor[Beyer93a]. En cambio, si se usa un muestreo de pixel sncrono, es decir, se establece
lneas de control para muestrear en cada instante el pixel correspondiente, se asegura una
sincronizacin precisa con los datos obtenidos a la salida del digitalizador, presentado una
mayor fiabilidad. Este tipo de transmisin es tan efectiva como la utilizada en cmaras
digitales. Para estos ltimos casos, se puede obtener una precisin de 0.004
pxeles[Beyer93a].

36

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Resumiendo, desde que se tiene la imagen en el entorno que se desee captar, hasta
que se enva a la memoria del computador, sta ha sufrido diversas degradaciones que son
necesarias modelar. La funcin de transferencia ptica (OTF) se encarga de modelar la
componente difuminadora de las lentes, siendo la OTF una medida de la deformacin
producida en la imagen captada como consecuencia de la distorsin geomtrica. La
funcin de extensin puntual (PSF) modela las caractersticas de muestreo espacial por
parte de los fotosensores, encargados de captar la imagen del entorno. El nivel tecnolgico
actual es tan elevado en la fabricacin de estos componentes que las prdidas de precisin
son del orden de magnitud de 1/50 de pixel. De otro lado, las prestaciones de las tarjetas
digitalizadoras son tan variadas como modelos hay en el mercado. Numerosos problemas
tienen las digitalizadoras, tales como prdidas de sincronismo, no linealidades y efectos de
solapamiento en frecuencias (aliasing). La mayora de los factores afectan a la exactitud de
la mtrica, pudiendo provocar errores de hasta 0.5 pxeles. Las diferentes tcnicas de
sincronizacin es uno de los factores ms decisivo. Si se utiliza sincronizacin de lnea el
error va desde 0.5 pixel a 1 pixel, mientras una sincronizacin por pixel reduce el error a
0.05.
Slo queda por resear algunas consideraciones prcticas efectuadas a lo largo del
proceso experimental, como ha sido el uso de lentes de mayor formato que el plano sensor,
utilizando exclusivamente la zona central de la lente, evitando la mayora de las
degradaciones pticas. Conjuntamente a esta accin, se ha tomado imgenes con el iris lo
ms cerrado posible, favoreciendo la concentracin de los rayos sobre el foco. Respecto al
digitalizador y al utilizar cmaras sin capacidad de sincronismo, se han definido drivers
que pudieran sincronizar todo lo ms posible con el pixel, en el sentido de slo muestrear
tanto en horizontal como en vertical por el nmero de pxeles existentes en el plano sensor.
De este estudio preliminar se desprende que, la calidad de la imagen depende, sobre
todo, de una iluminacin eficaz y una eleccin ptima de las cmaras. Por tanto, los
siguientes puntos tratan sobre el realce visual de superficies planas y de cmo determinar
los criterios para una buena seleccin de cmaras atendiendo a la aplicacin en concreto.

3.2

Realce visual de superficies planas


El realce visual de la escena es el primer subsistema del modelo genrico de los
SIVA. Es una de las llaves en la solucin de problemas de Visin artificial. El diseador
debera tener en mente dos ideas al considerar el sistema de iluminacin:

Maximizar el conocimiento a priori de la escena.

Intentar trivializar el problema de anlisis de imgenes, tanto como sea posible.


Un eficiente sistema de iluminacin requiere un menor tratamiento de la seal.

DISAM-UPM DISAM-UPMT-98-015

37

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Para maximizar el contraste en la escena hay que explotar el conocimiento a priori


en varias direcciones. Una de ellas es el estudio de las propiedades de los materiales ante
una excitacin luminosa. La cantidad de luz reflejada en una superficie depende en gran
medida de su rugosidad. Es marcadamente diferente la repuesta de una superficie lisa a
otra rugosa. De hecho se ha utilizado el comportamiento desigual del material defectuoso
respecto al no defectuoso ante una exposicin lumnica. para incrementar el realce entre
ambos. Luego se requiere estudiar el comportamiento de reflexin de la luz en superficies
planas. Otra de las direcciones tratada es la ptima posicin del foco luminoso y la cmara
ante la superficie a inspeccionar. Partiendo del modelo de comportamiento de superficies,
se trata de investigar cual es la posicin ms adecuada de los focos y las cmaras, con el
propsito de aumentar el contraste entre los defectos y el fondo.
Respecto a la trivializacin del problema para aplicaciones SIVA, la problemtica
de identificacin de faltas se simplifica, muchas veces, consiguiendo una iluminacin
uniforme en el campo visual. Este tema tambin ser objeto de estudio, de cmo disear la
fuente luminosa para conseguir una ptima iluminacin.
A continuacin se va a desarrollar una metodologa de trabajo para construir el
equipo de iluminacin, basndose en el estudio de reflexin de la luz en superficies planas,
bsqueda ptima de foco - superficie - cmara y de cmo tratar de obtener una iluminacin
uniforme en el campo visual.
3.2.1

Mecanismos de reflexin de la luz sobre superficies planas


Dentro de la problemtica de la iluminacin, la luz reflejada en superficies planas
ha sido motivo de estudio en esta tesis. Detectar defectos visuales en el aluminio, por
ejemplo, precisa de la ptima localizacin de los focos luminosos y de los sensores. Para la
determinacin geomtrica de ambos, se requiere del estudio de los mecanismos de
reflexin de la luz.
Se pretende mostrar en las siguientes pginas, los modelos de reflexin proveniente
de una luz incidente sobre superficies planas, y de cmo aplicar los resultados en el diseo
del sistema de iluminacin de un SIVA.
Hay dos filosofas distintas para abordar los estudios de la reflexin de la luz:
modelos pticos geomtricos y modelos pticos fsicos. Los primeros asumen que las
trayectorias de la luz van en lnea recta, mientras los segundos las tratan como ondas
electromagnticas, cuyos comportamientos siguen las ecuaciones de Maxwell. Los
modelos usados por los investigadores actuales se fundamentan en los trabajos de Phong,
Torrance Sparrow, Lambert, y Beckmann-Spizzichino. Antes de exponer los modelos de
reflexin, se tratan los conceptos bsicos de la Radiometra y de los modelos de superficie,
fundamentales para entender las diferentes modelizaciones.

38

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

3.2.1.1 Conceptos bsicos de Radiometra


La energa radiante emitida por una fuente luminosa, por unidad de tiempo y por
unidad de rea, depende de la naturaleza de la superficie y de su temperatura. Esta
radiacin es una mezcla de diferentes longitudes de onda. Por ejemplo, a la temperatura de
300C, la ms intensa de estas ondas tiene una longitud de 500nm, que se encuentra en la
regin del infrarrojo, mientras a 800C, un cuerpo emite bastante energa radiante visible
para ser luminosos por si mismo y parece incandescente; no obstante, la mayor parte de la
energa emitida es transportada, con mucho, por ondas infrarrojas. A 3000C, que es
aproximadamente la temperatura del filamento de una lmpara de incandescencia, la
energa radiante contiene bastantes longitudes de onda visibles, de las comprendidas entre
400nm y 700nm, de modo que el cuerpo parece casi rojo blanco [Sears81].
El flujo luminoso emitido por un manantial luminoso
Flujo luminoso
depende de la abertura y del tamao del cono de radiacin,
d
esto es, del ngulo slido. Se considera el manantial
luminoso puntual S de la figura 3.4. Y sea d el flujo
luminoso que atraviesa una seccin cualquiera de un
estrecho cono de ngulo slido d estereorradianes, cuyo
S
ngulo slido
d
Manantial luminoso
vrtice coincida con el manantial. La intensidad luminosa
dA
del manantial, en la direccin del cono, se define como la
razn del flujo, d, al ngulo slido, d, o sea, como el
flujo luminoso emitido por unidad de ngulo slido. La
Figura 3.4 Flujo luminosos
intensidad luminosa se representa por I:
S

I =

d
d

( 3.1 )

La unidad de intensidad es vatio por estereorradin. La mayor parte de los


manantiales no emiten cantidades iguales de flujo por unidad de ngulo slido en todas las
direcciones.
Sea dA, en la figura 3.5, un elemento de superficie cuya normal n forma un ngulo
cenital y acimut respecto a un manantial
puntual
S. Asumiendo que la fuente se encuentra
z
S

en el plano X-Z y determinado segn la


Luz reflejada

Luz incidente
direccin del ngulo cenital i. La relacin entre
n
d
el flujo incidente en la superficie respecto al
rea, define la iluminacin incidente como:
i

dA

Ei =

Figura 3.5 Sistema de coordenadas


locales

DISAM-UPM DISAM-UPMT-98-015

di
dA

( 3.2 )

De otro lado, a la fraccin del flujo


incidente que sea reflejada en la direccin (r r),
desde la superficie al sensor se la llama

39

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

radiacin reflejada. La radiacin reflejada de la superficie es definida como el flujo emitido


por unidad de rea reflejada y por unidad de ngulo slido en la direccin vista por el
sensor, as se define la radiacin radiada, L, como:
d 2
L=
dA r dr

( 3.3 )

donde dr es el ngulo slido del sensor visto desde la superficie reflejada.


Considerando que la superficie es iluminada desde una direccin i, se define la funcin de
distribucin reflejada bidireccional ( bi-directional reflectance distribution function,
BRDF), Fr de una superficie, como el nivel de radiacin reflejada de una luz incidente vista
desde (r r) por unidad de iluminacin incidente
Fr (i r r ) =

Lr (i r r )
Ei (i )

( 3.4 )

Por ltimo, el principio de conservacin de la energa indica que la radiacin


incidente en un objeto, parte de ella es transmitida (refraccin), otra absorbida y la dems
ser reflejada, esto es:
INCIDENTE = TRANSMITIDA + ABSORBIDA + REFLEJADA

( 3.5 )

En la tabla 3.1 aparecen las magnitudes radiomtricas en el Sistema Internacional

Magnitud fsica

Smbolo

Unidad en S.I.

Flujo luminoso

Intensidad luminosa

W sr-1

Iluminacin

W m-2

Radiacin

W m-2 sr-1

Tabla 3.1 Unidades del S.I. de las magnitudes de


Radiometra

3.2.1.2 Modelos de superficie planas


La manera en la que la luz es reflejada en una superficie, depende de entre muchos
factores, de las formas macroscpicas que constituyen las superficies. As mientras en

40

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

superficies lisas al ser iluminadas con un haz incidente, la luz reflejada sobre ellas toma
una sola direccin, en superficies rugosas tienden a difuminarse en mltiples direcciones.
Para establecer con exactitud el fenmeno de la reflexin, es necesario tener un
conocimiento a priori de la estructura de la superficie, es decir, un modelo de stas. Se
pueden catalogar en dos clases: mapas de perfiles y modelos aleatorios. Un exacto perfil
puede ser determinado con las medidas de alturas en cada punto de la superficie, por algn
tipo de dispositivo existente en el mercado. No obstante, este mtodo es caro e
impracticable en muchos casos. Por lo tanto, suele modelarse mediante funciones
bidimensionales de distribucin que tienden aproximarse al verdadero comportamiento de
la superficie ante un haz de luz incidente.

3.2.1.2.1

Modelos basados en funciones de distribucin de ngulos de inclinacin

Una superficie puede ser modelada a partir


de una coleccin de microsuperficies planas, tal
como queda reflejado en la figura 3.6. Cada
microsuperficies tiene su propia orientacin. El
ngulo de inclinacin, , es el parmetro que
n
determina el grado de oblicuidad respecto a la
Microsuperficies
planas

normal del plano medio. En el caso de superficies


isotrpicas, la distribucin de sera uniforme, y
las microsuperficies estaran rotadas respecto a n
con igual probabilidad. Esto lleva, a que puede
modelarse la superficie mediante una funcin de
distribucin unidimensional. Por ejemplo, la Figura 3.6 Superficie formada por
superficie responde a una funcin de densidad microfacetas
gaussiana para el nivel de microfacetas, con N( ,
). Grandes valores en la varianza, , indicarn
la presencia de superficies rugosas, y al contrario, valores pequeos sealarn superficies
lisas. Los modelos basados en la funcin de distribucin del ngulo de inclinacin en las
microsuperficies son muy populares, pues la difusin de la luz reflejada es explicada por
los niveles de inclinacin y no por la cartografa (altura) de la superficie. Por esta razn,
los modelos de inclinacin, aunque relativamente ambiguos, son ampliamente utilizados en
los problemas de reflexin de la luz en superficies.
3.2.1.2.2

Modelos basados en funciones de distribucin de perfiles

La altura de la superficie puede ser expresada en funcin de las coordenadas (x, y),
como muestra la figura 3.7. La forma de la superficie es determinada por la funcin de
distribucin de la altura, h. Sea por ejemplo h con distribucin normal, media cero y
varianza h, la funcin de densidad viene dada por:

DISAM-UPM DISAM-UPMT-98-015

41

Inspeccin automatizada de superficies homogneas mediante Visin artificial

ph =

Rugosidad de la superficie
h(x,y)

2
1
e (h
2 h

2 2 h

Carlos Platero

( 3.6 )

h representa la rugosidad de la superficie. No


obstante, las superficies no estn unvocamente
relacionadas con la funcin de distribucin de las
alturas; no dice nada sobre las separaciones entre
valles y colinas existentes. Dos superficies pueden
tener igual media y varianza, mientras sus apariencias
son totalmente distintas. Con objetivo de reforzar el
modelo, se define un coeficiente de correlacin, C(),
que mide la relacin entre la altura estimada y la de
dos puntos de la superficie separados una distancia :

Figura 3.7 Niveles de altura en la


superficie

C = e (

T2

( 3.7 )

donde T es la distancia de correlacin. La variacin de los parmetros h y T de los


modelos de superficie, generan aproximaciones que casan con la apariencia real de la
superficie.
3.2.1.3 La rugosidad de las superficies
La impresin visual de los humanos es bastante vaga con el concepto de rugosidad.
De manera que una superficie vista de cerca parece rugosa y algo ms alejada, puede llevar
a la conclusin de calificarla como lisa. De hecho, en la determinacin de faltas visuales, el
inspector, a veces, hace cambios de vistas para ayudarse en el juicio de si es defecto o no.
A diferencia de las valoraciones humanas, la teora de reflexin tiene bien definida
el concepto de rugosidad; sta debe relacionar las irregularidades de la superficie con las
direcciones que tome la luz ante un haz de luz incidente. Para superficies cuyas
irregularidades son menores que la longitud de onda de la luz, la mayor parte del flujo
incidente ser reflejada especulrmente en una sola direccin. En caso contrario, si las
irregularidades superan la longitud de onda del haz, la superficie difuminar la luz en
mltiples direcciones.
En el mundo industrial, la rugosidad se define como el valor medio de las alturas de
la superficie, y esta definicin ha sido objeto para medir el acabado superficial de los
productos manufactureros[ANSI78].
3.2.1.4 Modelos pticos geomtricos
La ptica geomtrica es aplicable en situaciones, donde el carcter
electromagntico de la luz, puede ser ignorado. Una de las caractersticas de la luz visible
es su corta longitud de onda. En general, la longitud de onda de la luz incidente es mucho

42

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

ms pequea que las dimensiones de las imperfecciones, y en estos casos, es posible


resolver, de manera aproximada, el problema de la reflexin.
3.2.1.4.1

Modelo de Phong

El modelo de Phong [Phong75] fue desarrollado dentro de la comunidad de


computadoras grficas, y est siendo ampliamente usado debido a su sencillez. Este
modelo explica bien el efecto de reflexin de la luz sobre materiales dielctricos, para el
caso de ngulo de incidencia y reflexin sean significativamente inferiores a /2. El
modelo predice la reflexin basndose en el ngulo de incidencia, i, y en el ngulo entre
la direccin especular y la direccin del plano sensor, . En l se asume que la mxima
reflexin se obtiene cuando coincide el ngulo de reflexin con la direccin especular, esto
es, i=e y e=0. Para el modelo de Phong la radiacin reflejada sigue la expresin:
Fr =

kLr
= A + B cos n
cos i

( 3.8 )

donde k, A y B son constantes y n es un ndice que muestra la rugosidad de la


superficie. De su simplicidad hace que el modelo falle al predecir una importante
caracterstica: el halo especular. Aun ms, la mxima reflexin de las superficies no ocurre
en la direccin especular, tal como predice dicho modelo. Por lo que es necesario buscar
un mejor modelo, como el que se presente a continuacin, el de Torrence Sparrow
3.2.1.4.2

Modelos de Torrence Sparrow

El modelo de Torrence Sparrow[Torre67] se basa en los conceptos vistos con


anterioridad sobre superficies formadas por microfacetas. La superficie tiene una
orientacin media n, y la inclinacin de cada microsuperficie, , est definida por una
funcin de densidad referenciada sobre n. Cada microsuperficie refleja slo la componente
especular segn su propia inclinacin. Luego, al haber una distribucin aleatoria de las
microsuperficies, la luz incidente sobre la superficie, no slo considera el elemento
especular, sino adems componentes de la luz difusa, permitiendo determinar la radiacin
superficial en cualquier direccin.
Torrence y Sparrow asumen que la funcin de densidad es normal. Adems,
tambin parte de tener rotaciones sobre la normal a la superficie de carcter simtrico. Por
tanto, se tendr una distribucin unidimensional N(0,).
p( ) = ce (

DISAM-UPM DISAM-UPMT-98-015

2 2 )

( 3.9 )

43

Inspeccin automatizada de superficies homogneas mediante Visin artificial

donde c es una constante, y la


varianza, como ya se vio, representa la
rugosidad del modelo.

Carlos Platero

z
n'
i
d

Luz reflejada

i
Considrese
la
geometra
n
dr
mostrada en la Figura 3.8. El rea de
superficie dAS est localizado en el
origen de coordenadas del marco, y la
x
dAs
r
normal a la superficie, n, coincide con
la direccin de z. La fuente luminosa
Modelo de Torrence - Sparrow
se sita en el plano (x-z), y ste es
incidente a la superficie con un ngulo
i. El modelo pretende calcular la
radiacin, Lr, en cualquier direccin
definida por r y r.
Figura 3.8 Relaciones geomtricas del modelo de
Luz incidente
di

Torrence -Sparrow

Slo algunas microfacetas


radiarn componente especular en la
direccin del ngulo slido dr (r r),
y stas tendrn como normal n, fijada por el nivel de inclinacin y ngulo de incidencia
i. El nmero de facetas por unidad de superficie orientadas dentro del ngulo slido d,
es igual a p()d. Por tanto, el rea de puntos en dAs orientados dentro de d es igual a
p()ddAs. Considerando af el rea de cada microsuperficie, el rea de puntos dentro de
dAs que refleja luz incidente con ngulo i, dentro del ngulo slido dr, es igual a af
p()ddAs. Todas las microsuperficies son asumidas con el mismo ngulo de incidencia
i. El flujo incidente en el conjunto de facetas reflejadas se determina por:

d 2 i = Li di a f p( )d dAS

( 3.10 )

Donde Li es la radiacin incidente. La fraccin de luz incidente que es reflejada por


cada microsuperficie est determinada por los coeficientes de reflexin de Fresnel. Los
coeficientes F(i,) y F(i,) de Fresnel determinan el campo electromagntico
reflejado segn la componente especular[Nayar91][Ikeuc94]. El coeficiente de Fresnel
F(i, ) para la luz incidente puede ser expresado como combinacin lineal de los
coeficientes de Fresnel paralelo y perpendicular de las ondas incidentes:
F ( i, ) = h F|| ( i, ) + v F ( i, )
2

( 3.11 )

donde
h, v 0 y h + v = 1

44

( 3.12 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Torrence y Sparrow tambin consideraron el efecto de sombras de unas


microsuperficies sobre otras. Las facetas adyacentes pueden obstruir tanto el flujo
incidente como el reflejado. Para compensar estos efectos, los autores introducen el
concepto de efectos de atenuacin geomtrica, G( i, r, r ), cuyo rango se encuentra entre
cero y uno. Partiendo de las consideraciones hechas, el flujo reflejado, dr, dentro del
ngulo slido d, el cual fija el flujo incidente, di, que refleja en la direccin (r,r),
estar determinado por:
d 2 r = F ( i, )G ( i , r , r )d 2 i

( 3.13 )

la radiacin, Lr, de dAs en la direccin ( r, r ), vendr dada por:


Lr =

d 2 r
d r dAs cos r

( 3.14 )

introduciendo las ecuaciones de ( 3.9 ) a ( 3.14 ) quedar como:


Lr =

F ( i, )G ( i , r , r )Li d i (a f p( )d dAs )cos i


d r dAs cos r

( 3.15 )

al haber partido de aquellas microsuperficies cuyas normales estn dentro del


ngulo slido d, capaces de reflejar la luz en el ngulo slido dr, ambas se encuentran
relacionadas por la expresin:
d =

d r
4 cos i

( 3.16 )

insertando la relacin entre ngulos slidos y la funcin de densidad de las


microfacetas, la radiacin queda como:
Li d i ( 2 / 2 2 )
e
cos r
ca f F ( i, )G ( i , r , r )

Lr = k
k=

3.2.1.4.3

( 3.17 )

Modelo de Lambert

DISAM-UPM DISAM-UPMT-98-015

45

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Lambert [Lamb60] fue el primero


en investigar los mecanismos de reflexin
Fuente
difusa. Las superficies que satisfacen las
dA
d
leyes de Lambert, aparecen igualmente
iluminadas en todas las direcciones.
n

Como muestra la Figura 3.9, la luz


r
penetra en la materia y se encuentra
heterogeneidad microscpica, provocando
d
Superficie
en la luz componente de reflexin y
dA
refraccin. Las componentes especulares
cruzan sus trayectorias con una variedad
Modelo de Lambert
de direcciones, resultando una reflexin
difusa. Cuando la radiacin es constante
en toda la superficie, se denomina
Figura 3.9 Relaciones geomtricas en el modelo
reflexin lambertiana.
de Lambert
i

La radiacin de una superficie


lambertiana, Lr, es proporcional a su
radiada. Considerando una superficie de rea infinitesimal, dAs, iluminada desde un
manantial, dAi. El flujo incidente en dAs ser determinando desde la radiacin fuente, Li,
como:
d 2 i = Li d s dAi

( 3.18 )

Teniendo en cuenta las relaciones entre la superficie y el ngulo slido


dAi = r 2 d i
cos i dAs
d s =
r2

( 3.19 )

Introduciendo las relaciones geomtricas, queda:


d 2 i = Li d i dAS cos i

( 3.20 )

la iluminacin en la superficie est determinada por:


Ei =

d i
dAs

( 3.21 )

y como la radiacin reflejada es proporcional a su rradiada, Ei. Obsrvese que Ei es


cero cuando el ngulo de incidencia sea /2. Luego, la radiacin en la superficie puede ser
escrita como:

46

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Lr = k dif Li d i cos i

( 3.22 )

donde kdif determina la fraccin de la energa incidente que es reflejada.


3.2.1.5 Modelos fsicos pticos
La luz es un fenmeno electromagntico. Por tanto, en un sentido estricto, los
problemas pticos deberan ser planteados desde la Electrodinmica. El modelo de
Beckmann-Spizzichino [Beckm63] describe los
fenmenos de reflexin tanto de superficies
lisas como rugosas.
Plano del sensor
dA
Superficie
l

Lente
dAs

3.2.1.5.1

Modelo de Beckmann-Spizzichino

R0

El modelo de reflexin de Beckmann


d
Spizzichino explica el comportamiento de la
f
z
dA
energa electromagntica especular, procedente
de un haz luminoso incidente sobre una
Modelo de Beckmann - Spizzichino
superficie rugosa. Como en los anteriores
modelos, se pretende calcular la radiacin de la
superficie en componentes especulares.
Considerando la formacin geomtrica de una Figura 3.10 Relaciones geomtricas del
modelo de Beckmann-Spizzichino
imagen en un sensor (por ejemplo, una cmara
CCD), segn muestra la figura 3.10, se definen,
dAS como el elemento de superficie y dAim la proyeccin dAS de dentro del rea del
sensor. La relacin entre ambas coincide con el ngulo slido, cuyo vrtice es el del foco
principal de la lente, P, llegando a:
r

im

dA cos
dAS = im
cos r

z

f

( 3.23 )

dAim coincidir con el rea del elemento bsico del sensor (pixel). Si dAim es
constante para un sensor dado, dAs est determinado por su geometra y por el tamao del
pixel. Todos los rayos luminosos radiados por dAS, que son incidentes dentro del rea de la
lente, dAl, son proyectados dentro del rea de la imagen, dAim. Luego, el ngulo slido de
la radiacin reflejada, dr, cuando es visto desde dAS quedar como:
d r =

dAl cos
R02

( 3.24 )

El flujo reflejado, dr, es la energa de luz recibida por el rea de la lente. Haciendo
uso del vector complejo de Poynting, S, para definir el campo electromagntico descrito
por una onda, se tiene:

DISAM-UPM DISAM-UPMT-98-015

47

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

S = ExH

( 3.25 )

donde E representa la intensidad del campo elctrico (no confundir ahora con la
iluminacin, tambin llamada E) y H la intensidad del campo magntico. Siendo la parte
real de S la que define el valor medio de energa emitida por unidad de rea, cuya
dimensin ser vatio por metro cuadrado:
S a = Re[S ] =

1
Re[ExH ]
2

( 3.26 )

Y al estar relacionados ambos por la permitividad y la permeabilidad


H=

( 3.27 )

el valor medio del flujo de energa por unidad de rea est definido por
Sa =

1 2 1
E =
H
2
2

( 3.28 )
2

segn Beckmann-Spizzichino, la energa media especular estimada, E , originada


por una fuente luminosa de longitud de onda , con ngulo de incidencia i, sobre una
superficie rugosa de tamao A, con distribucin normal de alturas, media cero, varianza h
y distancia de correlacin T que refleja en la direccin (r,r), es:
2

E 2 A 2 cos 2
T 2 D 2
E = 01 2 2 i e g 02 +
A
R0

g m v 2xy T 2 / 4 m

m =1 m! m

( 3.29 )

donde

48

DISAM-UPMT-98-015

Carlos Platero

(v , v
x

Captulo 3: Formacin de imgenes en SIVA

, v z ) = k ( sin i sin r cos r ) x,+ k ( sin r sin r ) y, k (cos i + cos r ) z

g = 2 h (cos i + cos r )

o = sinc(v x Ax )sinc(v y Ay )
D=

1 + cos i cos r sin i sin r cos r


cos i (cos i + cos r )

v xy = v x2 + v y2

( 3.30 )

siendo E01 la amplitud del campo elctrico y Ax y Ay denotan la superficie


rectangular de A, evaluada en la integral de Helmholtz. El flujo radiado a partir de este
modelo ser:
d r = S a dAl cos =

1 2
E dAl cos
2

( 3.31 )

introduciendo ( 3.23 ), ( 3.24 ) y ( 3.31 ), en la definicin de radiacin ( 3.3 ):


2

2 2
1 R0 f E
Lr =
2 z 2 dAim cos

( 3.32 )

No es posible determinar el valor exacto de la radiacin desde el clculo estimado


de la energa especular. La radiacin de la ecuacin anterior es realmente el valor esperado
de sta, es decir, L r . En el modelo de Beckmann-Spizzichino, el valor medio de EE * es
determinado como la integral extendida en toda la superficie del objeto. Obsrvese que si
la dimensin del pixel es conocida, dAim = dApixel, y recibe la luz radiada de dAS, entonces
el valor esperado de la energa especular puede ser computado dentro del rea A = dAS. Si
dApixel es conocido y constante, A es determinado por ( 3.23 ) Insertando de ( 3.23 ) a
( 3.32 ), L r es:

L r =

2
2
2
E 01 cos i g z dA pixel cos 2 T 2 D 2
0 +
e
2
f

cos r
2 2
cos
r

g m v xy2 T 2 / 4
e

m =1 m! m
( 3.33 )

Lr es la suma de dos componentes: el pico especular y el halo especular. En la


ltima expresin se decanta que la componente pico especular es proporcional al rea vista
dAS. Sin embargo, se puede demostrar que la integral de 02 es inversamente proporcional
a dAS. En otras palabras, aunque la magnitud del pico especular es proporcional a dAS, la
energa contenida en l es independiente de la cantidad de superficie.

DISAM-UPM DISAM-UPMT-98-015

49

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Las expresiones de radiacin para superficies rugosas y lisas, pueden ser


determinadas desde las expresiones de energa especular obtenidas por BeckmannSpizzichino, obtenindose las siguientes formulaciones:

Lr (lisas ) =

Lr ( rugosas ) =

2
2
2
E 01 cos i g z dApixel cos 2 T 2 D 2 g v xy2 T 2 / 4
0 +
e
e
(g << 1)
f cos 2 r

22
cos
r

2
2
2 2
vxy2 T 2
E 01 cos iT D
exp 2 2

22 cos r
4v z h

(g >> 1)

( 3.34 )

3.2.1.6 Modelos de reflexin para la inspeccin de superficies planas


Los modelos de reflexin descritos son demasiado complicados de utilizar en
Visin artificial. Diversos modelos aproximativos han sido propuestos por la comunidad
cientfica.
Nayar, Ikeuchi y Kanade [Nayar91] han examinado los modelos de TorrenceSparrow y de Beckmann-Spizzichino, de manera exhaustiva en simulacin por
computador. Ellos han encontrado que la solucin para superficies rugosas, pueden ser
aproximadas mediante funciones de densidades normales, y adems las soluciones
coinciden con los modelos de Torrence-Sparrow, bajo las condiciones expuestas. Tambin
han encontrado soluciones para superficies lisas aproximndolas a superficies rugosas
mediante funciones deltas.
Para estas deducciones, han elaborado un modelo de tres componentes:
Lr (i r r ) = Cb

50

i +

Csl ( 2
e
r

2 2

) + C ( ) ( )
ss
i
r
r

( 3. 35)

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

la primera componente corresponde con la reflexin difusa explicada por el modelo


lambertiano. La segunda componente corresponde al halo especular, est relacionada con
la segunda solucin de Beckmann-Spizzichino y el modelo de Torrence-Sparrow. Y la
tercera componente, referente al haz especular, corresponde a superficies lisas. La Figura
3.11 muestra un esquema del modelo.

Sensor
Manantial
r

Luz incidente
n
i
Halo difuso

Pico especular
i
Halo especular

Figura 3.11 Modelo de Nayar

Las conclusiones de Nayar et al[Nayar91] pueden ser resumidas en los siguientes


puntos:

El modelo lambertiano puede ser usado para representar las componentes de


halo difuso. Este modelo est siendo usado para el reconocimiento de formas
desde sombras y en tcnicas de fotometra estreo. Los resultados indican
buenas prestaciones.

Los modelos de reflexin de Beckmann-Spizzichino predicen tanto la


componente de halo especular como haz especular para superficies muy lisas
(h << ). La componente de haz especular domina respecto al halo, y la
superficie se comporta como un espejo. En la medida de mayor rugosidad en la
superficie, decrece la componente de haz y empieza a dominar el halo
especular. Las dos componentes son simultneamente significativas para un
estrecho rango.

DISAM-UPM DISAM-UPMT-98-015

51

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

El haz especular tiende a concentrarse, a medida que la superficie sea cada vez
ms lisa, h / < 1.5, y/o bien cuando el halo especular se concentra debido a
que la superficie es suavemente ondulada, h / T < 0.025.

El modelo de Torrence-Sparrow da una buena aproximacin para la


componente halo especular de Beckmann-Spizzichino. Ambos modelos son
exitosos en la prediccin del halo especular. Al ser ms simple de implementar
el modelo de Torrence-Sparrow, ste debe ser empleado para representar la
componente halo especular.

El modelo de Torrence-Sparrow no es capaz de describir el comportamiento


especular en superficies lisas, luego imposibilita utilizarlo para simular el haz
especular.

Aunque los dos modelos parten de diferentes supuestos, sus parmetros


rugosos, h y , se encuentran relacionados por comparacin de las ecuaciones
que describen el comportamiento del halo especular.

Estas conclusiones permitirn deducir cual de los modelos explicados debe


utilizarse dependiendo de las caractersticas de las superficies a inspeccionar.
3.2.2

Modelo de la cmara

Cmara

Superficie a
inspeccionar

A0

Asensor
R1

R2
Apixel

Lente

Si el sistema de adquisicin de imgenes,


lente ms cmara (ver Figura 3.12), se encuentra
a una distancia de R1, desde la superficie de
inspeccin, el nmero de fotones incidentes
dentro del sistema ptico, de rea A0 y durante el
tiempo de integracin, tI, es de:
nlente = Lr

AS

A0
AS At I
R12

( 3.36 )

donde Lr es la radicin refleja en la


direccin del sensor y A es el coeficiente de
transmisin atmosfrica. El nmero de fotones
que alcanza el sensor ser:

Figura 3.12 Modelo de camara

nsen sor = Lr

A0
AS A Ot I
R22

( 3.37 )

O es la transmitancia del sistema ptico. Y el nmero de fotones incidentes en un


pixel, es una relacin de reas:

52

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

n pixel = nsen sor

Apixel
Asen sor

( 3.38 )

usando la aproximacin de ngulo pequeo para rayos axiales:


As
Asen sor

R12
R22

( 3.39 )

e introduciendo los conceptos de magnificacin ptica, MO, que es la relacin entre


R2/R1. Adems, stas estn relacionadas con la distancia focal efectiva de la lente, luego:
1
1
1
+
=
R1 R2 f

( 3.40 )

el nmero de fotones que recibe el pixel ser:


n pixel = Lr

A0 Apixel

f (1 + M 0 )
2

A Ot I

( 3.41 )

asumiendo una apertura circular e introduciendo el concepto de F - nmero, como


la relacin entre f /D, siendo D el dimetro de la ptica, quedar:
n pixel =

Lr Apixel
A Ot I
4 F 2 (1 + M 0 )2

( 3.42 )

Todas las variables son funcin de la longitud de onda y de la energa de los


fotones, y a su vez de la temperatura del foco luminoso. Por ltimo, el nmero de
fotoelectrones generados en un detector de estado slido es:
2

n pe = Rr ( )n pixel ( , TIlum )d
1

n pe = Rr ( )
1

Lr ( , TIlum )Apixel
A ( ) O ( )t I d
4 F 2 (1 + M 0 )2

( 3.43 )

siendo R() la respuesta espectral del detector ante la luz.

DISAM-UPM DISAM-UPMT-98-015

53

Inspeccin automatizada de superficies homogneas mediante Visin artificial

3.3

Carlos Platero

Modelos de fuentes luminosas e iluminacin uniforme en


superficies planas
La iluminacin uniforme de las superficies planas a inspeccionar es un
requerimiento frecuente en los SIVA. En gran medida, porque facilita el procesamiento de
la imagen adquirida, con lo que se disminuye el nmero de operaciones a realizar, llegando
a abaratar los costes del soporte fsico (HW) y/o el tiempo computacional en el anlisis de
imgenes. Los siguientes prrafos tienen como objetivo, mostrar un mtodo de diseo para
la ptima colocacin del sistema luminoso, tal que consiga como efecto una distribucin
uniforme de luz en el campo visual.
El primer paso es intentar modelar la iluminacin producida por las fuentes de luz
tipo reas, lneas, puntos y coronas, as como combinaciones de ellas. Una vez conocidas
las funciones de comportamientos, es posible investigar los efectos de la seleccin del tipo
de iluminacin y su lugar ms apropiado.
Se considera que las superficies planas son iluminadas por fuentes monocromticas
e incoherentes, de cuatro tipos: primera, fuentes de rea infinita, segunda, fuentes de luz
uniforme lineal de anchura infinitesimal y longitud infinita, tercera, puntos infinitesimales
de luz uniforme y cuarta, coronas de luz de ancho infinitesimal y radio finito. Las
implicaciones de utilizar estos modelos simples para representar el comportamiento real
del sistema de iluminacin, han sido discutidos por Gennert et al[Genne93] y van a ser
tambin tratados en esta tesis. Considerando un nmero de modelos de fuentes, del mismo
tipo o diferentes, tal que representen el sistema de iluminacin, la funcin de iluminacin
E(x,y) evaluar la iluminacin total en el punto arbitrario (x,y) de la superficie a
inspeccionar. Sin prdida de generalidad, se selecciona un sistema de coordenadas, en el
cual el eje z es normal a la superficie. La orientacin de los ejes x-y con el plano de
inspeccin ser coplanar y arbitrario, seleccionndose de la forma que mejor convenga.
Al utilizar luz incoherente, la iluminacin sobre la superficie es la suma algebraica
de las n contribuciones de las distintas fuentes
luminosas
x0

x
Lnea (superficie

z0

E (x, y ) = I k Ek ( x, y )
k =1

( 3.44 )

donde Ik y Ek representan la intensidad


lumnica y la disposicin geomtrica del k foco.
Foco
El aspecto cuantitativo de Ik depende de la
naturaliza del foco, pero sta no es importante en
la determinacin de la uniformidad, excepto en lo
Figura
3.13
Modelo
2D
para
que se refiere a la contribucin relativa desde una
iluminacin
iluminacin de mltiples focos. Esta notacin
permite utilizar una funcin que separa la
potencia luminosa, Ik, de la colocacin geomtrica foco superficie, Ek(x,y).

54

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Para entender Ek(x,y), se hace el estudio en un espacio 2D con el fin de facilitar la


explicacin (Figura 3.13). La iluminacin alcanzar su mximo, justo en la normal de la
lnea (plano) que pasa por el foco,
E ( x0 ) = I

1
= IE (x0 )
z 02

( 3.45 )

mientras la intensidad en un punto arbitrario, x, ser:


z0
I cos
z0
E ( x) =
= I r2 = I
2
r
r
(x x0 )2 + z0 2

3/ 2

= IE(x )
( 3.46 )

de lo que se desprende que E(x) slo depender de la coordenada del punto en la


superficie y de la localizacin de la fuente. Por ltimo, como lo que se trata es de ver las
irregularidades del flujo radiado sobre la superficie, la expresin puede normalizarse de 0 a
1 por cada contribucin del foco, al relativizarlo respecto a su valor mximo,
E * ( x) =

E ' ( x)
E ' ( x0 )

( 3.47 )

E* se llama la iluminacin normalizada, que para el ejemplo utilizado ser:


z0
3
z03
E * ( x) = r =
1
(x x0 )2 + z02
I
z0
I

3/ 2

( 3.48 )

Por tanto, se desprende que el comportamiento del sistema luminoso depende de la


colocacin de los focos respecto a la superficie plana a inspeccionar, siendo necesario
determinar la contribucin de cada fuente. La prestacin definitiva es la suma ponderada
de cada manantial luminoso, por lo que se pasa a estudiar las funciones de iluminacin de
cada tipo de fuente.
3.3.1.1 Foco tipo rea
Una fuente uniforme de tipo rea (figura 3.15), de extensin infinita y localizada
paralelamente a la superficie plana a inspeccionar, produce una iluminacin normalizada
E * ( x, y ) = 1

DISAM-UPM DISAM-UPMT-98-015

55

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

( 3.49 )
es fcilmente entendible al suponer que el rea est constituido por infinitos puntos
luminosos y la aportacin luminosa en cada punto a de la superficie ser la misma.

z
y

superficie

superficie
x

iluminacin

iluminacin

Figura 3.15 Foco tipo rea

Figura 3.14 Foco tipo lnea

3.3.1.2 Foco tipo lnea


La fuente lnea (figura 3.14), infinitesimal en dimetro, infinita en extensin y
localizada paralela al plano de referencia, tendr una funcin normalizada de iluminacin
E ( x, y ) =
*

z 03

((x x )

+ z 02

3/ 2

( 3.50 )

donde x0 y z0 son las distancia entre el origen de coordenadas y el foco. Por


conveniencia matemtica, el eje y ha sido elegido paralelo a la fuente de iluminacin. La
deduccin de la expresin es similar a la empleada en el modelo 2D.
3.3.1.3 Foco tipo punto
El manantial punto, infinitesimal en extensin y localizado en el punto P con
coordenadas (x0, y0, z0), figura 3.16, la funcin de luminosidad respecto a la superficie es:
E * ( x, y ) =

z03

((x x ) + (y y ) + z )
2

56

2 3/ 2
0

( 3.51 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

3.3.1.4 Foco tipo corona


Esta fuente de ancho infinitesimal y de radio finito de valor R, figura 3.17, situada
en un plano paralelo a la referencia y a una altura z0, produce una iluminacin [Genne94]:
E (r ) =

2 R 2 + z02

3/ 2

(R 2 + z02 + r 2 2 Rr )(R 2 + z02 + r 2 + 2 Rr )

1/ 2

( )

e m

( 3.52 )

donde

r = x2 + y2
m=

1/ 2

4 Rr
R + z + r 2 + 2 Rr
2

2
0

( )

e m = 1 m sen 2 d

( 3.53 )

obsrvese de la expresin ( 3.52 ) que se tiene una iluminacin de isoluxes en


forma circular.

z
z
y
superficie

y
superficie

x
(x,y)

iluminacin

iluminacin
R
P(x0, y0, z0)

Figura 3.17 Foco tipo corona

P(x0,y0,z0)

Figura 3.16 Foco tipo punto

3.3.1.5 Iluminacin ptima uniforme


En general, la iluminacin total E(x,y) sobre la superficie debe ser optimizada, tal
que la adiccin de contribuciones est relacionada con el propsito de realce visual de la
escena. Asumiendo que la funcin E(x,y) es analtica y conocida, un supuesto vlido al
haber modelado las fuentes de iluminacin, esta expresin puede ser desarrollada en series

DISAM-UPM DISAM-UPMT-98-015

57

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

de Taylor alrededor del plano referencia. Para un punto cerca del origen,(x,y), la
iluminacin total ser:
E (x, y ) = E (x0 , y0 ) +

E
E
x +
y + ...
x x = x0
y y = y 0

( 3.54 )

luego el criterio para optimizar, en el sentido de tener iluminacin uniforme, es


hacer lo posible para eliminar todos los trminos del desarrollo de Taylor, excepto el de
orden cero. Dependiendo de la expresin de E(x,y) podr disearse el sistema para la
ptima iluminacin uniforme de la escena SIVA. Por lo que se presenta a continuacin
cmo se han empleado los modelos de focos y superficies para el diseo de los sistemas de
iluminacin para los dos SIVA implementados en el transcurso de esta tesis.

3.4

Sistema de iluminacin para los SIVA implementados


En la construccin de los dos SIVA implementados en el transcurso de esta tesis,
hay dos problemas diferentes en el diseo del sistema de iluminacin: el primero es
obtener una fuente luminosa que sea capaz de iluminar uniformemente el escenario SIVA,
y el segundo, es determinar la localizacin del foco y la cmara respecto a la superficie. De
ambos problemas se trata a continuacin, aunque slo se aborda en su totalidad el sistema
de iluminacin para la inspeccin de la pasta de papel, pues el dedicado para el aluminio
ya ha sido tratado por Fernndez [Fernn97]. De la citada motivacin, se pretende
conseguir un modelo para la simulacin, de manera que con l se pueda decidir la forma y
localizacin ptima de las fuentes luminosas. Con tal propsito se va a desgranar el
mtodo empleado, basado en el diseo de sistemas de iluminacin uniforme y en el estudio
de las propiedades de reflexin en la superficie a inspeccionar.

3.4.1

Metodologa a emplear para el diseo del sistema de iluminacin


Hay dos aspectos distintos a resolver, el primero es la construccin de las fuentes
luminosas que sean capaces de dar una iluminacin uniforme en la escena SIVA y el
segundo es la localizacin del binomio fuente luminosa cmara, capaz de realzar los
defectos superficiales. Para la construccin del sistema de iluminacin uniforme se
utilizar los modelos de fuentes luminosas y se aplicar el desarrollo de Taylor en la
iluminacin recibida, con el objeto de eliminar todos los trminos excepto el
correspondiente al orden cero, consiguiendo el objetivo de iluminacin uniforme. Este
mtodo podr verse con todo detalle en el diseo de las fuentes luminosas para la pasta de
papel.
Una vez obtenido el sistema de iluminacin uniforme se pasar al estudio sobre el
comportamiento de la superficie ante la luz, empezando con la respuesta espectral de la
luz. As la respuesta espectral de un sensor CCD difiere significativamente del ojo
humano. El ojo humano es ms sensible en la longitud de onda de alrededor de los 500 nm,

58

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

correspondiente a la zona del espectro del verde y amarillo. En cambio un CCD es ms


sensible al rojo, el rango espectral tpico va desde los 300 a los 1200nm, por lo que el
primer paso a efectuar es estudiar la reflexin del material en la regin visible del CCD
mediante algn espectrgrafo. El objetivo es encontrar, si hubiera, alguna regin del
espectro de la luz que tuviera un efecto dominante en el contraste de los defectos. Este
fenmeno es aplicado cuando los defectos tienen un color especfico o en materiales con
componentes de reflexin difusos, por ejemplo en inspeccin de textiles o de madera. Sin
embargo hay otros materiales como el acero, cuyas propiedades de reflexin muestran
uniformidad en el rango visible del sensor. Para los materiales tratados hay que decir que
este experimento no se ha efectuado para el aluminio colado, pero si se ha hecho para la
pasta de papel, ms concretamente se ha buscado la regin del espectro que aumente el
contraste de un tipo de defectos llamados shive ( ver 7.2 ). No obstante, para el caso del
aluminio se ha supuesto que el antecedente del acero puede utilizarse para considerar
uniformidad de comportamiento de las propiedades de reflexin en el rango espectral del
CCD (ver figura 3.19).
De otro lado se encuentra el dato sobre la
rugosidad de la superficie. As por ejemplo, para
el caso del aluminio, su rugosidad va desde los
50 m a los 75 m, dependiendo del tipo de
acabado superficial ( ver 7.1 ). Esta informacin
es extraordinariamente valiosa, primero porque
segn las conclusiones de Nayar (3.2.1.6), esta
superficie es clasificada de tipo rugosa y no lisa,
lo que implica que la componente de luz
reflejada es un halo especular y no un pico
especular. Adems, tambin se concluye que el
modelo ptimo a implementar es el de Torrence- Figura 3.19 Reflexin de la luz en el
Sparrow, lo que permitir simular el acero en el rango de los 400 a 1100nm
[Miett93]
comp
ortamiento de la radiacin reflejada de material
no defectuoso, dependiendo tanto de la posicin
c
del manantial luminoso como del sensor
b
a
respecto a la superficie.
Slo resta para iniciar la simulacin, la
modelizacin de los defectos. stos pueden ser
r
simplificados mediante geometras sencillas,
d
por ejemplo como las indicadas en la figura
3.18, cuyas dimensiones sern dadas mediante
un anlisis superficial de los defectos. Todo ello
Figura 3.18 Modelos geomtricos de los
permitir localizar la ptima posicin de los
defectos
focos y los sensores mediante la simulacin en
las diferentes posiciones espaciales, cuya funcin objetivo es la maximizacin del realce
visual.

DISAM-UPM DISAM-UPMT-98-015

59

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Esta metodologa propuesta por Miettinen et al[Miett93], puede ser contemplada


para el caso del acero, en el que se ha procedido a modelar la superficie mediante el
modelo de Phong, y se han considerado tres ngulos de ncidencia, 20, 45 y 70,
concluyendo que el mejor ngulo para el realce es el de 45.

Manantial
Luz incidente

Sensor
n
i

Figura 3.20 a) Modelo empleado b)simulacin de araazo c)


simulacin de falta de material d)simulacin de rugosidad local

3.4.2

Sistema de Iluminacin para la inspeccin del papel


Se pretende construir un sistema de iluminacin para la inspeccin de pasta de
papel segn la norma ENCE 404. Dicha normativa marca cmo debe iluminarse la pasta de
papel para la localizacin de defectos locales. El sistema empleado se basa en la
exposicin de los pliegos de papel ante una iluminacin de luz transmitida, esto es, el papel
se deposita entre la fuente luminosa y el inspector humano. La informacin lumnica
recibida por el ojo humano ser utilizada para la localizacin de las faltas. Una descripcin
ms detallada sobre este mtodo podr ser obtenida en el captulo 7.
Para el proceso de automatizacin de las tareas de inspeccin visual, lo primero a
realizar ser el diseo del sistema de iluminacin. No necesariamente, el sistema de
iluminacin utilizado por el inspector humano puede ser empleado por el SIVA, por las
razones ya esgrimidas en el anterior captulo. El operario puede considerar cambios de
posicin para tomar puntos de vistas complementarios, o por otro lado sombras generadas
por la luz ambiental no hacen cambiar la opinin del operario pero puede perjudicar
enormemente la decisin del SIVA. Sin embargo, la experiencia acumulada por parte del
inspector y sus conclusiones, pueden dar una gran cantidad de pistas iniciales sobre cmo

60

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

puede estar constituido el sistema de iluminacin para el SIVA y cules deben ser sus
caractersticas esenciales para la formacin de la imagen.
Pues bien, la primera caracterstica del sistema de iluminacin para este SIVA debe
ser que tiene que fundamentarse en iluminacin transmitida. Adems por la arquitectura
que va a ser presentada, la superficie de inspeccin se ha dividido en cuatro regiones
complementarias, con el motivo de disminuir los tiempos de inspeccin por cada pliego de
papel. Su argumentacin ser dada en el captulo 7. Esta matizacin implica que en vez de
un nico escenario SIVA, se va a tener cuatro escenarios independientes pero
complementarios. Por lo que cada escenario estar constituido por un foco luminoso, un
trozo de superficie a inspeccionar y una cmara. De forma que los cuatro escenarios,
adyacentes entre s, cubran en su totalidad la superficie a inspeccionar que marca la norma.
Una vez definidos los requisitos bsicos, se plantea a continuacin cules deben ser
los objetivos del sistema de iluminacin. Como se ha comentado en este captulo, el
sistema de iluminacin intentar trivializar todo lo posible el anlisis de las imgenes.
Atendiendo a esta premisa, se pretender que la informacin luminosa que le llega al plano
sensor de la cmara sea debida exclusivamente a la textura de la superficie. Adems deber
exigirse que los datos captados por la cmara tengan la suficiente capacidad como para
poder discernir qu es defecto y qu no lo es. Para poder cumplir con el primer objetivo,
ser necesario que la iluminacin sobre la superficie a inspeccionar sea uniforme en el
campo visual de la cmara. Y en cuanto al segundo requisito, habr de buscar el foco
luminoso que tenga la conveniente potencia lumnica como para poder captar los
suficientes fotones recibidos por el sensor durante el tiempo de integracin de la cmara.
El primer objetivo va a depender de la disposicin fsica de los elementos del
escenario SIVA, esto es, se va a tratar sobre la localizacin ptima del foco, la superficie y
la cmara. En cuanto al segundo punto, resulta un problema de la eleccin de la tecnologa
a emplear tanto del tipo de foco como de
cmara. Por lo que se abordar en estos
momentos la ubicacin correcta de los
elementos, sin entrar en cules deberan ser
sus caractersticas tcnicas, de las que sern
comentadas en el mencionado captulo 7.
3.4.2.1 Disposicin ptima de los
focos luminosos respecto a la
superficie a inspeccionar
Debido al tamao de los defectos a
localizar y al tipo de sensor empleado, el
escenario SIVA tiene una dimensin de 73
mm por 48 mm. Esta superficie es la captada
por la cmara cada vez que toma una Figura 3.21 Diposicin geomtrica de los
imagen, su justificacin viene avalada por focos
las dimensiones de las faltas y por el tipo de arquitectura de sensores empleados (ver
3.5.2). Por ese motivo se hizo uso de focos luminosos puntuales, capaces tecnolgicamente

DISAM-UPM DISAM-UPMT-98-015

61

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

de mantener una iluminacin cuasi uniforme en esta superficie. De otro lado, por las
estrategias de inspeccin sobre el pliego de pasta de papel, los susodichos focos estn
separados de entre s 292 mm y 240 mm ( ver figura 3.21 ). Adems, se tiene que las
fuentes de luz estn situadas en el mismo eje que las cmaras (transversal al papel), con la
intencin de aprovechar al mximo la uniformidad del foco puntual y su mxima potencia.
En la figura 3.21 se muestra las disposiciones mencionadas y las separaciones entre los
focos, la superficie y las cmaras. De esta manera,
se ha hecho una descripcin del modelo de
iluminacin empleado, el cual podr ser simulado
mediante las expresiones vistas en 3.3. Para una
variacin de uniformidad de luz de un 2% en el
escenario SIVA, segn el modelo expresado en (
3.51 ), el foco deber estar situado a una distancia
de 640 mm respecto al papel. La figura 3.23
muestra los resultados de la simulacin de la
radiacin incidente en el rea de inspeccin. Los
resultados de la simulacin muestran que la
iluminacin con un solo foco es totalmente
satisfactoria, pero que existen acoplamientos
lumnicos como consecuencia de la proximidad
Figura 3.22 Distancia entre focos,
existente entre ellos, eliminando la propiedad de
superficie y cmaras
uniformidad en la radiacin luminosa incidente en
la superficie del papel. Por lo que obligar a
buscar algn remedio que evite las interferencias entre los diferentes focos. El mtodo
empleado consiste en insertar cuerpos negros con el objeto de evitar la conexin entre
focos, a la vez que se disminuya todo lo posible la radiacin reflejada de estos cuerpos.
Pero antes de entrar en su anlisis, se van a contrastar los resultados de la simulacin con
las observaciones experimentales.

62

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Figura 3.23 Distribucin de la radiacin luminosa en un rea de inspeccin


considerando: a) un solo foco, b) con dos focos, situado el segundo a 240 mm en
Y, c) tres focos, con el tercero situado a 292 mm en X y d) con cuarto focos, con el
ltimo a 292 mm de X y 240 mm de Y

3.4.2.2 Validacin de los modelos de focos luminosos puntuales


Se pretende verificar que los modelos empleados y descritos en 3.3 se corresponden
con los valores experimentales tomados. A tal fin, se ha hecho una plantilla de acetato
cuadriculado con celdas de 50 mm x 50 mm y han sido tomadas medidas con un
luxmetro. ste fue ubicado en la superficie de inspeccin, con el objeto de medir la
radiacin recibida por uno, dos, tres y cuatro focos. Los resultados obtenidos si bien
mantenan similares tendencias, sus valores no correspondan con los obtenidos por la
simulacin (ver figura 3.24). Esta conclusin era de esperar, pues el foco utilizado es muy
direccional, as su ngulo de apertura mximo es de 30. Recurdese que en el modelo de
foco puntual, ste radiaba por igual en todas las direcciones. Adems fsicamente no es
una fuente puntual, sino una superficie luminosa circular de 50 mm de dimetro, tal como
se puede contemplar en la figura 3.21.

DISAM-UPM DISAM-UPMT-98-015

63

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Ante el fracaso del mencionado


modelo para recrear de forma terica los
resultados experimentales, se pens en
nuevas alternativas. Para ello, vase en
que se aparta la realidad del modelo ideal.
En primer lugar se ha considerado que la
fuente de luz es un punto luminoso, sin
dimensiones espaciales, lo cual no es as:
el chorro de luz procede una superficie
finita, lo que sugiere emplear una
composicin
de
focos
puntuales
distribuidos homogneamente en la
superficie luminosa. Por otro lado, la luz
no es proyectada por igual en todas las
Figura
3.24
Distribucin
terica
y
direcciones del espacio, sino que existe un
experimental sobre la superficie de
cono de proyeccin predominante. Los
inspeccin
rayos del foco son tanto ms dbiles
cuanto ms se alejan de su normal. Podra
pensarse en ponderar la funcin de luminosidad mediante una funcin del tipo cosn,
donde es el ngulo que forma el foco y el punto a estudiar de la superficie. En la funcin
propuesta, independientemente del valor de n est acotada entre los valores de 0 y 1, aun
ms, para = 0 vale 1 y 0 para = /2, para cualquier valor de n. El valor de n determina
la forma que toma la distribucin: cuanto ms se aleje de 0, ms cncava ser la curva.
3.4.2.3 Modelo de puntos luminosos distribuidos
Cada foco no es exactamente un punto infinitesimal desde el cual se proyecta toda
la luz, sino que presenta una cierta superficie sobre la cual se distribuye el total de la
emisin de luz. Esta superficie podra simularse mediante una fuente luminosa plana, que
considera que cada punto emite una cantidad infinitesimal de luz, con lo cual la

Figura 3.26 Modelos basados en cargas puntuales


distribuidas

Figura 3.25 Comparacin entre los


resultados experimentales y un
modelo de 7 focos

iluminacin total se obtiene integrando el valor de la intensidad luminosa por unidad de


superficie sobre el rea de foco. Una forma de aproximarse a este modelo consiste en
sustituir un solo punto luminoso en varios distribuidos sobre el rea del foco. As, se han

64

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

calculado los resultados de aplicar esta teora para dos, cinco y siete puntos luminosos
distribuidos segn muestra la figura 3.26.
A cada punto luminoso le corresponde una fuente cuya intensidad es igual al
resultado de dividir la intensidad total por el nmero de puntos luminosos usados en la
distribucin. Los resultados obtenidos son decepcionantes, ya que apenas hay diferencia
con la simulacin de aplicar un solo punto luminoso. La debilidad de los resultados viene
motivada por no considerar sus direcciones privilegiadas de radiacin, al haber repartido
los focos homogneamente en la superficie de radiacin.
3.4.2.4 Modelo mediante funcin ponderacin
Como se ha comentado anteriormente, una
forma de reproducir la cada tan fuerte de la
luminosidad conforme se aleja del eje de mxima
radiacin del foco es utilizar funciones que
tiendan a 0 para ngulos cercanos a los 90. Las
funciones ms triviales que cumplen esta
caracterstica son el conjunto de cosn. Al tener
un parmetro indeterminado, permite tener un
grado de libertad capaz de elegir aqul que ms se
aproxime la curva real con la terica. Para elegir
Figura 3.27 Geometra entre foco y
dicho valor se ha utilizado una funcin de coste
superficie
basada en el sumatorio de las distancias entre la
curva real y la terica. Y a esta funcin se ha
buscado el mnimo, determinando el valor de n. El algoritmo queda as establecido:
m

min J = E P* ,i ( x, y ) ET* ,i ( x, y )

i =1

r 2 cos n r02 + n
ET* ,i ( x, y ) = 0 2
= 2+ n
r
r

)
2

( 3.55 )

donde m es el nmero de muestras tomadas, mientras EP,i*(x,y) y ET,i*(x,y) son las


intensidades normalizadas experimentales y tericas, para un punto (x,y), situado en el
plano de inspeccin. Derivando respecto de n e igualando a cero quedar:
m *
E P ,i ( x, y ) ET* ,i ( x, y )

n i =1

=0

m *
ET* ,i ( x, y )
E , ( x, y ) E * , ( x, y )
= 0
T i

i =1 P i
n

( 3.56 )

Introduciendo la derivada en esta ecuacin se podr despejar el valor de n,


quedando:

DISAM-UPM DISAM-UPMT-98-015

65

Inspeccin automatizada de superficies homogneas mediante Visin artificial

m *
r 2+ n
E P ,i ( x, y ) 0
i =1
r 2+ n

r02 + n
r
2 + n log 0
r
r


= 0

Carlos Platero

( 3.57 )

Se ha aplicado este algoritmo a las distintas mediciones experimentales, esto es,


considerando la influencia de uno, dos, tres y cuatro focos sobre el escenario SIVA, segn
la disposicin vista en 3.4.2.1, arrojando los siguientes resultados:
Tabla 3.2 Valores de n para las distintas pruebas experimentales
Nmero focos

22,19

19,92

20,05

19,93

Mostrando que el valor de n es slido y que slo depende de la naturaleza del foco
utilizado. Obsrvese que para n = 20, el modelo
terico se ajusta bien al caso real ( ver figura
3.28). Por ltimo, para aclarar lo expuesto se
muestra un resumen de las distribuciones
lumnicas y un corte transversal en el eje y para
apreciar mejor las diferencias. Para mayores
detalles sobre los experimentos ver el trabajo de
Garca [Garci98].

Figura 3.28 Comparacin entre los


valores experimentales y el modelo de
n
cos

66

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Figura 3.29 Diferencias entre los resultados experimentales y los obtenidos con los
diferentes modelos

DISAM-UPM DISAM-UPMT-98-015

67

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

3.4.2.5 Diseo de las pantallas lumnicas


Habiendo conseguido un modelo analtico sobre la radiacin lumnica del foco, y
mostrndose la imposibilidad de iluminacin uniforme en el escenario SIVA a
consecuencia del acoplamiento entre los focos, se pasa al diseo de cuerpos negros capaces
de individualizar cada escenario para obtener una iluminacin cuasi-uniforme.
Se trata a continuacin sobre cul debe ser la geometra y ubicacin de los cuerpos
negros. Es evidente que la colocacin de los focos en el espacio, limita
extraordinariamente las posibilidades tanto geomtricas como de localizacin espacial de
los cuerpos. De otro lado, no existe fsicamente el concepto de cuerpo negro en el sentido
de que toda la radiacin incidente sobre l sea totalmente absorbida. Todo ello conduce a
que se deberan emplazar las pantallas lumnicas lo ms alejado posible del foco, con el
objeto de disminuir la radiacin de reflexin de las pantallas en el escenario de inspeccin.
Pero las distancias entre las fuentes luminosas no permiten ubicaciones de las pantallas
muy alejadas. Aun ms, la separacin de los focos imponen las distancias mximas a las
que pueden estar puestas las pantallas, siendo justamente la mitad de distancia entre focos,
esto es, 145 y 120 mm respectivamente. En cuanto a su geometra y a su facilidad
constructiva, podra pensarse o bien en un cilindro o bien en un paraleleppedo. El
inconveniente de cilindro es su radio, ste como mximo podra ser de 120 mm, pues de
mayor tamao interseccionara con cilindros adjuntos. Luego por cuestiones de radiacin
reflejada y de diseo mecnico, la solucin es el paraleleppedo.
El tamao del paraleleppedo y su exacta ubicacin debe cumplir con el doble
objetivo de desacoplar las interferencias entre focos y minimizar el efecto de radiacin
reflejada en el escenario. El primer objetivo se consigue con la colocacin de cuerpos
opacos negros. Desde el punto de vista constructivo se han diseado paraleleppedos de
aluminio revestido, o bien con pintura negra mate o bien con aironfix2 de terciopelo negro.
En cuanto al segundo objetivo, se ha tratado de determinar sus dimensiones tal que se
minimice el efecto de radiacin reflejada. Con tal propsito, se ha considerado que las
separaciones lumnicas se comportan como superficies lambertinas, esto es, reflejan por
igual en todas las direcciones. De esta manera, se puede conseguir un modelo analtico de
su comportamiento. Y a partir de esta modelizacin se podr ubicar el paraleleppedo y sus
dimensiones, atendiendo al objetivo de iluminacin uniforme en la superficie de inspeccin
segn se vio en 3.3.1.5.
En primer lugar habr de verificar la coincidencia entre la radiacin estimada y la
medida, para ello se considera que la radiacin incidente sobre una de las pantallas seguir
la siguiente expresin:

68

Producto comercial registrado

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

E ( x, z ) =

Iy 0
I cos 1
=
2
2
r1
x + y 02 + z 2

3/ 2

( 3.58 )

donde y0 es la distancia entre la fuente y la pantalla, figura 3.31. Normalizando la


expresin a E*(x,z), tanto la experimental como la analtica, se observa (ver figura 3.30 ) la
validez del planteamiento, sin necesidad de recurrir a utilizar funciones ponderadas.

Figura 3.30 Radiacin incidente en una pantalla

En ( 3.58 ) no se ha aplicado ponderacin como en el caso anterior, pues la


iluminacin recibida se encuentra fuera del cono luminoso de la fuente, recurdese que la
apertura de la lmpara era de 30.

z
superficie a inspeccionar
x1,y1,z0

r2
z0
r1

x,y0,z

x
y

y0
pantalla lumnica

Una vez estudiada la radiacin incidente


sobre las pantallas, se pasa a determinar la ptima
colocacin respecto al centro del foco.
Considerando
que
las
superficies
del
paraleleppedo radian por igual en todas las
direcciones, esto es, se comporta segn la ley de
Lambert, la distribucin luminosa debida a la
radiacin reflejada de las pantallas en el escenario
SIVA ser:
4

Figura 3.31 Geometra


pantallas y la escena SIVA

de

las

E ( x1 , y1 ) = Ik dif
i =1

cos 1,i cos 2,i


r12,i

dS
r22,i ( 3.59 )

siendo el sumatorio extendido para las cuatro paredes y kdif el coeficiente de


reflexin. Si se introduce las relaciones geomtricas existentes quedar:

DISAM-UPM DISAM-UPMT-98-015

69

Inspeccin automatizada de superficies homogneas mediante Visin artificial

y 0 ,i

E ( x1 , y1 ) = Ik dif
i =1 x , z

(x

x 0 ,i

Ik dif
i =1 y , z

(x

+ y 02,i + z

2
0 ,i

+ y2 + z

z0 z

) ((x

Carlos Platero

2
1 x ) + (y1 y 0 ,i ) + z

2 3/ 2

) ((x

2 3/ 2

z0 z

x 0,i

) + (y
2

y) + z
2

3/ 2

2 3/ 2

dxdz +

dydz +
( 3.60 )

donde y0,i y x0,i son las distancias entre las pantallas y el foco, junto con z0 que
representa la separacin entre la superficie de inspeccin y el foco. Si se analiza el
desarrollo de Taylor sobre la radiacin reflejada de un par de pantallas para un dS, quedar
los trminos de primer y segundo orden como:
y (z z )( y y 0 a )
y (z z )( y + y 0 b )
E ( x1 , y1 )
= 3 0 a 0 3 5 1
3 0b 0 3 5 1
y1
r1a r2 a
r1a r2 a

y (z z )( y y 0 a )
y (z z )
2 E ( x1 , y1 )
= 15 0 a 0 3 7 1
3 0a 3 0 5
2
r1a r2 a
r1a r2 a
y1
2

y (z z )( y + y 0b )
y (y + y )
+ 15 0 a 0 3 7 1
3 0 b 31 5 0 b
r1a r2 a
r1a r2 a
2

( 3.61 )
La condicin de uniformidad exigir que la separacin a pares de las pantallas
sean idnticas, ya que esta condicin tender a cancelar todos los trminos excepto el de
orden cero. Si en ( 3.61 ) se hace y0a = y0b, las primeras derivadas se anulan en la normal al
foco.

Figura 3.32 Desarrollo de Taylor de la radiacin incidente de dos pantallas simtricas


debida a un dS. a)Primeras derivadas, b) Radiacin para un dS y sus primeras derivadas

70

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Por ltimo quedar comparar los resultados experimentales con los conseguidos por
el modelo. Respecto a los valores medidos, stos se obtendrn de la resta entre los
evaluados para un foco con el paraleleppedo y sin l. Se observa en primer lugar, que el
efecto de la reflexin es de un orden de magnitud menor que la radiacin incidente de la
fuente. Tambin es destacable cmo algunos valores se hacen negativos, lo cual no es

Figura 3.35 Medida de la luminosidad en el escenario SIVA a) con foco y paraleleppedo b)


con slo foco c) slo efecto de reflexin debida al paraleleppedo

posible, lo que indica una falta de precisin en las medidas tomadas como consecuencia de
la baja precisin del luxmetro utilizado. En tercer lugar, se observa el nivel de
discrepancia entre los valores medidos de
reflexin y el modelo terico obtenido de ( 3.60
). Y por ltimo, se ha observado empricamente
que el aironfix tiene menor coeficiente de
reflexin. No obstante, se ha utilizado la pintura
mate en el recubrimiento del paraleleppedo,
pues el aironfix es ms receptivo de absorber
polvo, lo que hara decrecer sus propiedades de
cuerpo opaco con el paso del tiempo. El
resultado conseguido es que la informacin
recibida por el sensor slo se debe a la textura del
papel y no a la intensidad luminosa recibida, esto
Figura 3.34 Discrepancia entre el
es, que la distribucin del histograma de la
modelo terico y los valores medidos
imagen se debe slo a la constitucin del material
ante una radiacin luminosa transmitida, siendo
esta ltima de igual valor en todos los puntos del espacio de medida.

Figura 3.33 Imagen recibida por el sensor y su hitograma


DISAM-UPM DISAM-UPMT-98-015

71

Inspeccin automatizada de superficies homogneas mediante Visin artificial

3.5

Carlos Platero

Arquitectura de cmaras CCD en SIVA


Hay muchos factores a considerar cuando se va a elegir una cmara para un
problema de inspeccin. Los aspectos primordiales se refieren a caractersticas tales como
la arquitectura del array, la resolucin, la sensibilidad, la relacin seal ruido y las
condiciones ambientales a las que las cmaras estn sujetas. Otros factores como la
velocidad de la aplicacin, la respuesta espectral, y el coste de las cmaras tambin juegan
un papel importante. Por lo que a continuacin se exponen los conceptos bsicos sobre
cmaras CCD, para permitir posteriormente proponer un mtodo sobre la eleccin de
arquitectura de cmaras en funcin de la aplicacin SIVA en cuestin.

3.5.1

Factores a considerar en la eleccin de las cmaras


3.5.1.1 Arquitectura de array
La arquitectura del array depende del tipo de aplicacin a realizar. Por ejemplo, y
en trminos generales, las cmaras lineales, progresivas y TDI son las ms utilizadas en
inspeccin de superficies en movimiento. Mientras las cmaras entrelazadas son usadas,
cuando se aplica supervisin en las que se puede parar el movimiento. Este botn de
muestra, indica la importancia del tipo de arquitectura del sensor, por lo que se pasa a ver
las ideas generales de cada una de ellas.
3.5.1.1.1

Cmaras lineales

Si bien es posible encontrar cmaras matriciales de hasta 5120 x 5120 [Chamb95],


stas exigen anchos de bandas muy elevados. Por ejemplo, si se desean 25 imgenes por
segundo, el volumen de informacin es de 640 Mpixel/s, hacindose prohibitivo para la
mayora de las aplicaciones industriales. Con el fin de evitar este exceso de informacin, y
si se desea alta resolucin, la solucin hay que encontrarla en las cmaras lineales.
Las cmaras lineales son usadas
en aplicaciones donde, bien la cmara o
bien el objeto estn en movimiento en
direccin perpendicular a la fila de
sensores. Muy tpicos de inspeccin de
superficies continuas en movimiento.

detectores

Registro de desplazamiento

a)
Registro de desplazamiento

Constructivamente las cmaras


lineales carecen de distancia interpixel,
esto es, no existen zonas no sensibles.
Ello es debido a que el registro de
desplazamiento se encuentra a uno de
los lados de los fotosensores, y aunque

72

detectores

Registro de desplazamiento

b)

Figura 3.36 a) un nico registro de


desplazamiento b) doble registro

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

ste tambin es sensible a la luz, se cubre con una capa protectora. No obstante, el tamao
total del pixel est limitado por la puerta de control. As en un sistema de dos fases de
transferencias de carga, esto es, dos seales desfasadas, V1 y V2, que son utilizadas para
transferir las cargas desde los fotosensores al registro de lectura mediante el efecto CCD
(como se observa en la figura 3.38), la anchura del pixel depende del ancho de la puerta (el
lector puede encontrar bibliografa variada en torno a las transferencias de carga y la
estructura misma de los CCD, por ejemplo [Holst96] ). En el ejemplo de la ilustracin, se
ve que el pixel debe ser de dos veces la anchura de una puerta, es decir, el tipo de
transferencia de las cargas impone el tamao del pixel. Por eso, con el objeto de aumentar
el nmero de pxeles e incrementar la resolucin, se puede reducir el ancho del pixel
V1
V2

Puerta

Pixel

Pixel
T1
Carga
T2
T3
T4

Figura 3.38 Transferencia de carga en dos fases

mediante un doble registro (Figura 3.36b). Pudindose en este caso doblar la resolucin de
la cmara lineal.
3.5.1.1.2

Cmaras entrelazada
Fotodiodos

Otro tipo de cmaras ampliamente


usadas son las entrelazadas, stas consisten
en un array de fotodiodos separados por
registros de transferencia vertical, que son
cubiertos por una capa opaca de metal
(Figura 3.37). Despus de la integracin,
las cargas generadas por los fotodiodos son
transferidas al registro vertical CCD en un
tiempo de 1s, minimizando los efectos de
mancha. La principal ventaja de esta
transferencia es la rapidez, del paso de la
carga del sensor a la zona de

DISAM-UPM DISAM-UPMT-98-015

Registro de
desplazamiento vertical

Fotodiodos

Registro serie de lectura


Matriz de almacenamiento

Registro serie de lectura

Figura 3.37 Arquitectura de transferencia


entrelazada a) registro b) zona de
almacenamiento

73

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

almacenamiento, por lo que no hay necesidad de utilizar obturadores. La desventaja es que


este tipo de salida implica una menor zona activa del sensor. El rea efectiva puede estar
por debajo del 20%. Aunque este factor puede ser ampliado mediante el uso de
microlentes.
Existen variedades de arquitecturas de transferencias. Operan con dos, tres y cuatro
fases. El nmero depende de la aplicacin, pero para vdeo estndar los registros de
desplazamiento son de cuatro fases, cuyas cargas son almacenadas en dos puertas (Figura
3.39). Con 2:1 entrelazado, ambos campos son almacenados simultneamente pero ledos
alternativamente,
conocindose
como
integracin por cuadro. Con estndar CCIR
cada campo es adquirido cada 1/50 s, as que
el mximo tiempo de integracin llegar a ser
de 1/25 s.
1

Figura 3.39 a) Integracin por cuadro


b)Integracin por campo

Otra variante de integracin para esta


arquitectura, es la llamada integracin por
campo (Figura 3.39b), cambia el control de las
puertas, tal que suma dos cargas en direccin
vertical, generando un 50% de solapamiento
entre los dos campos. Al tomar un par de
pxeles se incrementa el doble de rango
dinmico de la seal. Sin embargo reduce al
50% la MTF vertical.

Mientras que cualquier arquitectura


puede ser usada para leer las cargas, al final el formato de vdeo limita la seleccin.
Aunque las cargas son adquiridas en filas y
columnas, las cmaras dan un formato de
Impar
datos en serie, consistente con los monitores.
Par
En la Figura 3.40 se observan los estndares
}
}}
}
tanto para dispositivos entrelazados como los
}
}
seudo - entrelazados.
a

a+b

b+c

c+d

}
}
La ventaja del formato entrelazado es
que permite disminuir los anchos de banda,
manteniendo una consistencia debida a la
inercia de la retina humana. El hecho de
transmitir en dos campos las lneas pares e
impares, ha provocado que los diseadores de Figura 3.40 Video entrelazado y seudocmaras CCD entrelazadas hayan aprovechado entrelazado
este evento, como para hacer arquitecturas que
comparten los recursos de lectura entre las lneas, obligando a que los tiempos de
integracin no coincidan entre lneas pares e impares. Este motivo obliga a detener la
escena, al menos durante el tiempo necesario para la adquisicin de la imagen, lo que
supone un inconveniente grave.

74

DISAM-UPMT-98-015

Carlos Platero

3.5.1.1.3

Captulo 3: Formacin de imgenes en SIVA

Cmaras progresivas

La mayor desventaja de las cmaras entrelazadas est en el desfase de los tiempos


de integracin, bien sea entre lneas o entre campos. Con el objeto de evitar parar las
superficies que estn en movimientos accin requerida con cmaras entrelazadas, aparecen
las cmaras progresivas. stas escanean secuencialmente lnea a lnea las imgenes. La
primera ventaja de las cmaras progresivas es la de tomar imgenes en un mismo instante,
en contraste con los sistemas entrelazados que adquieren secuencialmente la imagen en el
tiempo. As cualquier movimiento vertical producido entre campos, provocar manchas en
la imagen, mientras movimientos horizontales originan cortes en las lneas verticales. An
en el caso de utilizar luces estroboscpicas para parar el movimiento, se tienen imgenes
continuas slo en el campo que fue activado el pulso de luz. Cuando hay movimiento, slo
un campo puede ser usado para el procesamiento de imgenes, reduciendo en un 50% la
resolucin. En la figura 3.41 se aprecia la discontinuidad de las cmaras entrelazadas y la
mejora de las progresivas, aumentando la resolucin vertical respecto a las entrelazadas.

fotodiodo CCD vertical

fotodiodo CCD vertical


V1 V2 V3 V4

Transferencia entrelazada

Figura 3.41 Efecto del movimiento


a)carcter en movimiento horizontal b)
Discontinuidad de la imagen debido al
sistema entrelazado c) salida de una
cmara progresiva

V1 V2 V3 V4

Transferencia progresiva

Figura 3.42 Diferencias constructivas entre


entrelazada y progresiva

La diferencia entre progresivas y entrelazadas puede ser vista desde el punto de


vista constructivo. Obsrvese en la figura 3.42 como las cmaras progresivas, de cuatro
fases, difieren en su diseo, permitiendo almacenar cargas en el mismo instante de tiempo.
3.5.1.1.4

Cmaras TDI

Por ltimo, las cmaras TDI (TimeDelay and Integration) han representado una
pequea revolucin en el campo de la inspeccin de superficies continuas. TDI implica los
conceptos de mltiples exposiciones del objeto ante la cmara y su posterior suma. La
conjuncin de desplazamientos automticos de las cargas, de un detector a otro, junto con
los tiempos de exposicin, producen mltiples imgenes. La figura 3.44 muestra el efecto
TDI. La lente de la cmara invierte el movimiento del objeto, recorriendo la matriz de
detectores, mientras las cargas de un sensor a otro son desplazadas a la misma velocidad.

DISAM-UPM DISAM-UPMT-98-015

75

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

La sincronizacin entre la cmara y la superficie en movimiento, es realizada mediante el


conocimiento de la velocidad de sta, por ejemplo a travs de un encoder.

Direccin del objeto

Cmara TDI
Elementos TDI
T2

T1
Movimientos de la banda

Lneas de inspeccin

Figura 3.44 Inspeccin con cmaras TDI

T4

T3

Figura 3.43 Concepto TDI

Para entender el modo de operar de una cmara TDI, se sigue la figura 3.43. En el
tiempo T1, la imagen se sita en el primer detector y crea una carga. Llegado el tiempo T2,
la imagen se ha desplazado al segundo detector. Simultneamente, el reloj del pixel ha
movido la carga del primero al segundo. En este punto, se crea una imagen formada por la
carga anterior aadindose la nueva creada en el segundo detector, y as sucesivamente. La
carga (seal) se incrementa linealmente con el nmero de detectores, tambin lo hace el
ruido pero no proporcionalmente sino con la raz cuadrada del nmero de elementos TDI,
NTDI[Holst96]. El resultado es una mejora de la relacin seal ruido en NTDI . No
obstante, existe un lmite mximo de elementos TDI que puedan ser utilizados. Es evidente
que una prdida de sincronismo afecta negativamente en la MTF de la cmara. La
exactitud en el conocimiento de la velocidad de la imagen, es la que limita el nmero de
TDI que van a ser usados en cada etapa de mltiples exposiciones.

3.5.1.2 Resolucin
Una de las caractersticas ms importantes dentro de las cmaras de estado slido es
la resolucin. La resolucin puede referirse tanto al nmero de pxeles contenidos en la
matriz sensorial, como al nmero de lneas de televisin producidas. Las lneas de
televisin es un viejo estndar que permaneci durante la primera expansin de cmaras de
tubo de vaco. Este estndar se encuentra en desuso, aunque suele estar presente en muchos
catlogos de productos referidos a cmaras. Las lneas de televisin se refieren a la
frecuencia en que una imagen es dividida por un modelo peridico. A este respecto, las
lneas televisin corresponden con el sistema de visualizacin, en comparacin al detector
que hace referencia al nmero de pxeles en filas y columnas.

76

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Si la resolucin viene dada en pxeles, se especifican, normalmente, por separado


las dos direcciones, es decir, la horizontal y la vertical. Principalmente, este factor
determina el elemento ms pequeo en que una imagen puede ser fraccionada. Tamaos
tpicos de arrays de pxeles van desde 240x320 hasta 1024x1024.
Es importante hacer notar que, aunque un mayor nmero de pxeles produce un
aumento de la resolucin, tambin es cierto que se traduce en una superlativa informacin
a procesar. A este respecto, una mayor resolucin tiene un aspecto negativo frente a la
velocidad de procesado de esta informacin.
Si la resolucin se basa en la capacidad de las cmaras de distinguir ms objetos
dentro de la escena, este concepto no depende slo del nmero de pxeles. La resolucin
final de una cmara depender de las lentes que se usen, del numero de pxeles contenidos
en el sensor, del tipo de mecanismo de transferencia del chip detector y de la tarjeta
digitalizadora empleada. Por lo que habr de considerar la resolucin en su globalidad y no
slo en el nmero de pxeles.
3.5.1.3 Sensibilidad
La sensibilidad es el trmino usado para describir la mnima cantidad de intensidad
de luz que un sensor de una cmara es capaz de detectar y, por tanto, obtener un nivel de
tensin en la salida. Esta caracterstica puede ser un factor determinante en la eleccin de
la cmara. Las tpicas CCD tienen un rango de 0.015 luxes a 5 luxes. Las cmaras que son
muy sensibles pueden ser muy tiles en aplicaciones con bajos niveles de luz, tales como la
inspeccin de pelculas de fotografa. Para niveles bajos de luz, las tecnologas de cmaras
CCD han creado lo que se conoce como ICCD cmaras (Intensified CCD), las cuales
incorporan un intensificador de luz consistente en una pantalla de fsforo y un ctodo que
est acoplado al sensor del CCD. Estos tipos de cmaras no son apropiados para procesos o
entornos donde hay mucha intensidad de luz, debido a que se pueden producir
saturaciones.
3.5.1.4 Velocidad/Tiempo de integracin
La velocidad o la frecuencia vertical de una cmara tpica CCD es de 25 cuadros
por segundo (estndar CCIR vdeo). Una pantalla de un vdeo se compone normalmente de
dos campos separados que son adquiridos a una frecuencia de 50 hertzios. Esta frecuencia
es normalmente insuficiente para la mayora de las aplicaciones de inspeccin en lnea. El
tamao del array de los pxeles tambin influyen en la frecuencia. La razn es que a ms
pxeles a leer, ms tiempo llevar, por lo que una ganancia en resolucin conlleva un
sacrificio de la velocidad.
El tiempo de integracin debe ser considerado cuando se trabaja con altas
velocidades. El tiempo de integracin es el perodo de tiempo durante el cual a un pixel se
le permite acumular carga. Las aplicaciones que tienen altas velocidades a menudo
requieren reducidos tiempos de integracin para evitar manchas en las imgenes o
desenfoques en las mismas. Para bajos tiempos de integracin, el obturador electrnico

DISAM-UPM DISAM-UPMT-98-015

77

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

puede ser una buena solucin. Estas cmaras que llevan incorporado el obturador, impiden
la acumulacin de cargas filtrando las mismas dentro del substrato detector segn varios y
diferentes mtodos. La velocidad de estos obturadores vara entre 1/60 segundos y 100
microsegundos para aplicaciones que requieran las ms altas velocidades. Las cmaras con
obturador electrnico contienen adems un cristal con un liquido ferroelctrico para
proveer del mecanismo del obturador. Este cristal lquido est localizado justo detrs de las
lentes.
En algunas aplicaciones es necesario que la cmara se pueda disparar
(reseteable), esto es, que la acumulacin de la carga pueda ser eliminada de manera
asncrona. Su origen viene dado por la necesidad de adquirir la imagen tras efectuarse un
evento, lo cual se determina, normalmente, por una seal de disparo, provocada por el
sistema, el cual enva una seal de reset para que la cmara pueda adquirir una imagen ante
el suceso.
Como se ha indicado, a veces la aplicacin requiere de una disminucin del tiempo
de integracin, pero ello obligar a aumentar la potencia luminosa, con el objeto de
mantener el suficiente rango dinmico en la seal de video.
3.5.1.5 Seal de ruido
La relacin seal/ruido, SNR, indica la proporcin de potencia entre una seal y la
cantidad de ruido presente en sta, esto es, muestra la proporcin de energa de una seal
que puede ser considerada til, lo que viene a significar que a menor SNR, menos til es la
seal. Este aspecto est ntimamente relacionado con la discusin de la MTF.
La mayora de las cmaras de estado slido CCD tienen alta relacin seal/ruido,
tpicamente oscilan entre 45 dB y 65 dB, que es prcticamente la ausencia de ruido para la
mayora de las aplicaciones. La relacin seal/ruido depende enormemente de algunos
factores tales como la temperatura, el contraste, la longitud de onda y la intensidad de
luminosidad.
3.5.1.6 Respuesta del espectro
La respuesta espectral de una cmara se refiere a la regin del espectro
electromagntico en el que una cmara es sensible. Por ejemplo, el ojo humano tiene una
respuesta mxima espectral entre la regin del azul y el verde del espectro visible. Las
cmaras de estado slidos son sensibles en un rango de 200 nm a 1100nm. La mxima
respuesta se encuentra en torno a los 800 nm de longitud de onda, la cual se encuentra
cerca del final de la zona infrarroja del espectro. sta es la causa por la que la mayora de
las cmaras de estado slido vienen con un filtro IR incorporado. De otro lado, la respuesta
espectral difiere enormemente de un comportamiento ideal, pues dependiendo de cada
longitud de onda su ganancia vara, esto es, la respuesta es altamente no lineal. El tipo de
aplicacin y en particular el sistema de iluminacin, obligar a una seleccin de cmara
atendiendo a su respuesta espectral.

78

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

3.5.1.7 MTF
La funcin de transferencia de modulacin (Modulation Transfer Function) es una
medida de cmo el sistema de imagen es capaz de reproducir con fidelidad la escena
adquirida. Matemticamente, representa el mdulo del valor complejo de la funcin de
transferencia ptica (OTF), por tanto representa la ganancia del sistema ptico para cada
frecuencia, es evidente que la MTF carece de informacin sobre el nivel de intensidad de la
seal.
La MTF es calibrada generalmente entre el contraste en la salida respecto a la
cantidad de lneas por milmetro visibles que se pueden obtener. La MTF de una cmara
puede ser medida de diferentes formas, siendo una de las ms comunes aquella que
determina cmo recoge una cmara unas series de pares de lneas blancas y negras de
frecuencia variable. La medida se determina con el nivel de tensin producido por la
cmara al ver los pares de lneas blancas y negras. Obsrvese que al hablar sobre la OTF,
no slo se trata a la cmara, sino a la conjuncin de elementos de captacin, es decir,
ptica, detector, transmisin y adquisicin.
3.5.1.8 Entorno
Quizs uno de los aspectos ms importantes, que hay que considerar en la eleccin
de una cmara de estado slido, para una aplicacin de inspeccin, es el entorno donde la
cmara va a operar. A este respecto, tendr poco sentido elegir una cmara con todas las
caractersticas correctas si la cmara no soporta el ambiente de trabajo. Los factores del
entorno como temperaturas, vibraciones, contaminantes en el ambiente, etc. necesitan ser
estudiados para saber qu cmara es la que se adapta mejor a estos ambientes. En algunos
casos se hace necesario el encapsulado apropiado de las cmaras para protegerlas.
Algunos fabricantes suelen ofrecer sus cmaras con encapsulamientos especiales
para incrementar su resistencia a todos estos factores que han sido mencionados. Por
ejemplo, Peafiel et al[Peaf94] utilizan cmaras protegidas contra la radiacin, para la
inspeccin de intercambiadores de calor en centrales nucleares.
3.5.1.9 Coste
En trminos generales y para una misma arquitectura de array, las cmaras con
mayor nmero de pxeles poseen precios ms altos. Lo que s se puede tener en cuenta a la
hora de comprar una cmara son algunas apreciaciones o alternativas. Por ejemplo, si se
necesita alta resolucin, puede ser ms barato usar varias cmaras de baja resolucin que
solamente una cmara con una muy alta resolucin. Frecuentemente no hay una nica
solucin para una determinada aplicacin, lo que permite una cierta flexibilidad en la
eleccin de la cmara.

DISAM-UPM DISAM-UPMT-98-015

79

Inspeccin automatizada de superficies homogneas mediante Visin artificial

3.5.2

Carlos Platero

Cmo elegir la cmara


Una vez definidas las caractersticas bsicas de la escena a adquirir, se propone el
siguiente proceso para la eleccin adecuada de la arquitectura de cmaras, atendiendo al
objetivo de inspeccin de superficies, con tal propsito habr de responder a las siguientes
preguntas:
1.-Qu resolucin se necesita? Para determinar la resolucin requerida, hay que
determinar dos factores. El primero, cul es la caracterstica ms pequea a observar, y
segundo, cul es el campo de visin deseado a adquirir. Para obtener la resolucin de una
cmara, simplemente se divide el campo de visin por el tamao de la caracterstica ms
pequea de inters. Como regla general, lo mejor es permitir que la caracterstica ms
pequea sea representada por, al menos, un cuadrado de 2x2 pxeles[Vando90]. Pero en
esta tesis, la resolucin se ha hecho depender de los tipos de algoritmos de deteccin de
defectos. Por ejemplo, en la aplicacin desarrollada para la inspeccin de papel, cuyo
fundamento se basa en pxeles de alto contraste (ver capitulo 4), el tamao del defecto ms
pequeo se hace corresponder con el rea de un pixel, que en el caso del papel es de 0.015
mm2.
Por otro lado, el campo de visin suele venir dado por la capacidad del sistema de
iluminacin, ya que en general se pretende una intensidad luminosa uniforme en toda la
superficie a inspeccionar por la cmara. En el ejemplo del papel, tal como se vio en 3.4.2,
se tiene 50 mm longitudinales por 75 mm transversales de campo visual, en el que aparece
una distribucin cuasi-uniforme de intensidad lumnica. Por tanto se plantea el problema
en los siguientes trminos:
Defecto ms pequeo (atendiendo a la caracterstica ms pequea, pxeles de alto
contraste): 0.015 mm2 ( 0.1 mm x 0.15 mm )
Campo de visin (superficie con iluminacin uniforme): 50 mm x 75mm
(proporcin 2 , tpica de la arquitectura de video)
Resolucin (horizontal) = (50 mm/0.1 mm) x 1 pixel de alto contraste = 500
pxeles.
Resolucin (vertical) = (75 mm/0.15 mm) x 1 pixel de alto contraste = 500 pxeles

Campo de visin
Superficie iluminada
cuasi uniforme

Focos luminoso

Figura 3.45
inspeccin

80

Campo

visual

de

Para el ejemplo, se elegira una densidad de


pxeles en el array detector de al menos 500 x 500
pxeles. Adems implica, que una vez decidido el
tipo de cmara, el rea del pixel es fija y conocida,
por lo que se est definiendo tambin la geometra
del sistema de adquisicin de imgenes y la ptica
necesaria. As, el campo de visin se usa tambin
para calcular la cantidad de aumentos necesario.
Para determinarlo, se tiene que dividir el tamao
del array por la dimensin del campo de visin
deseado. Para la situacin descrita arriba, el
tamao del array detector es de 4.5mm x 7.3mm
(cmara tipo WATEC902A).
En este caso,

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

si se divide 50 mm entre 4.5 mm, se obtienen los aumentos necesarios de 11X. Esta
informacin puede ser usada despus para identificar las lentes necesarias para la cmara
seleccionada.
En el caso de obtener una resolucin elevada, se puede optar por dos soluciones. Si
es posible parar la escena, puede resultar ser ms ventajoso utilizar varias cmaras de baja
resolucin en lugar de una de alta resolucin, pues se consigue disminuir anchos de banda
puntuales y resulta ser una solucin ms econmica. Si la escena no se puede detener y el
nmero de detectores a utilizar es elevado, bien porque la arquitectura de iluminacin slo
permite iluminar uniformemente una estrecha banda, o bien porque se quiere cubrir el
ancho de la banda del material a inspeccionar, las cmaras lineales y TDI son las ms
apropiadas. Estas cmaras tienen la ventaja de poner decenas de miles de pxeles en lnea,
cubriendo toda la cubierta de la superficie y con una resolucin muy alta. La adquisicin
de una sola lnea permite un ancho de banda razonable, aun con centenas de miles de
detectores. Por otro lado, las altas velocidades hacen que los tiempos de exposicin sean
muy pequeos, obligando a aumentar la intensidad luminosa. Esta consecuencia, puede ser
disminuida con cmaras TDI, siendo la ms utilizada en inspeccin de superficies
continuas en lnea.
2.- Es estacionaria la superficie ? La respuesta a esta pregunta determinar el uso
de iluminacin especial y el tipo de arquitectura de las cmaras. El propsito de usar
iluminacin especial, como pueden ser luces estroboscpicas, o la obturacin automtica,
es congelar el movimiento de un objeto para eliminar las manchas producidas por el
movimiento de la imagen. Hay que tener en cuenta que, una cmara cunto ms rpido se
obture ms luz se necesita. Esto es debido a que la cmara tiene menos tiempo para
acumular fotones.
Para superficies continuas de alta velocidad, como la produccin de
acero[Domin94], los tiempos de integracin son muy pequeos, por lo que se requiere gran
intensidad luminosa. Como ha sido comentado, las cmaras TDI son la solucin, pues
permiten aumentar el rango dinmico a consecuencia de la suma de cargas en elementos
TDI. Si la resolucin es media y es posible conseguir iluminacin uniforme en el campo de
visin, las cmaras progresivas pueden ser empleadas. Y para baja resolucin, cmaras
entrelazadas con integracin por campo y sub-muestreo en la seal de vdeo, pueden ser
elegidas por su bajo costo y formato de salida estndar. Obsrvese que emplear integracin
por campo en vez de por cuadro, permite a la imagen mayor continuidad y por ende mayor
MTF. Si se hubiera utilizado integracin por cuadro con sub-muestreo, al ver slo un
bloque de lneas, pares o impares, se apreciara una discontinuidad en la imagen y por tanto
degenerar su calidad.

DISAM-UPM DISAM-UPMT-98-015

81

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Las figuras 3.46 y 3.47 muestran las dos arquitecturas bsicas de inspeccin
superficial, la primera basada en cmaras matriciales y la segunda en lineales.

Sistema de
iluminacin

Batera de cmaras
matriciales

Movimientos de la banda

rea de inspeccin

Figura 3.46 Inspeccin de superficies con


cmaras matriciales

Sistema de
iluminacin

Batera de cmaras
lineales

Movimientos de la banda

Lnea de inspeccin

Figura 3.47 Inspeccin de superficies


mediante cmaras lineales

3- Qu tipo de inspeccin va a realizarse ?. Difiere si se va hacer a modo de


muestreo o en su totalidad. Para el primer caso, se trata de capturar un conjunto de
muestras de la globalidad. El efecto sobre la eleccin de la cmara es la posibilidad de
relajar las exigencias, pues el volumen de informacin puede ser regulado segn el soporte
fsico elegido. Aqu no aparece el concepto de tiempo real, el sistema de inspeccin no est
obligado por el proceso fsico a detectar a una velocidad determinada. La solucin es el uso
de cmaras entrelazadas, cuando la superficie est inmvil, o bien, cmaras progresivas
cuando se est en movimiento.
Si la inspeccin es realizada en la totalidad de la banda, y las bobinas tienen
transversalmente gran dimensin, se hace necesario el uso de cmaras lineales y en altas
velocidades, cmaras TDI. Las razones son por un lado la necesidad de colocar miles de
detectores por lnea, implicando un gran volumen de informacin, y de otro el movimiento
en lnea, que exige de un procesamiento en tiempo real, slo abordable desde cmaras
lineales o TDI.
4.- Una vez que los requerimientos de arquitectura del array, resolucin y tiempo de
integracin han sido fijados, se pueden comparar las caractersticas de las cmaras
comerciales, dentro del mismo tipo. Es el momento de establecer la solucin definitiva
atendiendo a costes, sensibilidad, MTF, entorno, etc. Habr de atender a todo lo expuesto
sobre la formacin de las imgenes digitales.

82

DISAM-UPMT-98-015

Carlos Platero

Captulo 3: Formacin de imgenes en SIVA

Para terminar, la figura 3.48 presenta un flujograma, a modo de resumen, que pueda
ayudar en la seleccin de la cmara ante una tarea de inspeccin superficial. La primera
divisin que se observa, es si la superficie est en reposo o en movimiento. Para superficies

Seleccin de cmaras
para inspeccin superficial

movimiento

esttica
La superficie est ...
media

alta

Cmaras entrelazadas
Iluminacin constante

continua

discreta

resolucin

La superficie es...

muestro
Cmaras lineales

total
La inspeccin es...

rpida
continuo

Paso a paso

Cmaras entrelazadas
Iluminacin constante

baja

La velocidad es...

Cmaras matriciales,
parar movimiento
Iluminacin constante

El movimiento es...

Muy
rpida

alta
resolucin

Cmaras lineales

media
Cmaras TDI

Cmaras entrelazada
Integracin por campo

Cmaras progresiva

Cmaras lineales
o TDI

Figura 3.48 Flujograma para la seleccin de las cmaras ms adecuadas

estticas depender del tipo de resolucin, ya que como se ha visto, un nmero elevado de
pxeles obligar a hacer uso de cmaras lineales. Cuando la superficie est en movimiento
y sta es continua, caso del acero, el aluminio, etc., con el objetivo de cubrir todo el ancho
de las bandas es necesario recurrir a cmaras lineales o ltimamente a cmaras TDI. La
diferencia entre una y otra est en la sincronizacin de velocidad del proceso, una mejora
de la relacin seal-ruido y que necesita menos intensidad luminosa la segunda respecto a
la primera.
Para el caso de inspeccin basada en muestreo, si se permite parar la imagen
durante el tiempo de adquisicin, se puede utilizar cmaras entrelazadas y si hay
movimiento cmaras progresivas.
Para superficies discretas y con desplazamiento paso a paso, es decir, exposicin
del material sobre las cmaras y retirada, caso de inspeccin de baldosas[Fernn97a] o
billetes de banco[Sebas95], se puede emplear cmaras entrelazadas. Mientras para
productos que se mueven continuamente, por ejemplo la inspeccin de etiquetas sobre

DISAM-UPM DISAM-UPMT-98-015

83

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

superficies planas [Plate98a], dependiendo de la resolucin se suele utilizar entrelazadas


con integracin de campo, progresivas o TDI, segn sea baja, media o alta resolucin.
3.5.3

Ejemplos de formacin de imgenes en escenas SIVA


En este ltimo apartado, se recoge en la tabla 3.3, a modo de resumen, las tcnicas
empleadas en la adquisicin de imgenes de SIVA industriales, aplicados a superficies
planas.
Tabla 3.3 Formacin de imgenes de SIVA
Material a
inspeccionar

Tipo de inspeccin
(superf./veloc.)

Iluminacin

Arquitectura de
cmaras

Referencia

Acero

en lnea, alta
velocidad (15m/s)

Uniforme controlada

Cmara lineal de
2048 pxeles

[Domin94]

Aluminio
colado

en lnea, baja
velocidad (2m/min)

tipo rea uniforme, formada


por tubos fluorescentes y
difusor. Componente especular

Cmaras matriciales
entrelazadas, 4
cmaras por cada
cara

[Plate94]

Baldosas

Discreta, paso a paso

tipo rea uniforme, formada


por focos puntuales de
naturaleza halgena.
Componente especular

Batera de cmaras
progresivas de
512x512

[Ferna97a]

Billetes de
banco

Discreta, paso a paso

Focos halgenos puntuales.


Componente difusa

Batera de cmaras
entrelazadas 768x571

[Sebas95]

Etiquetas
farmacuticas

discreta, continua y
media velocidad

Foco corona. Componente


difusa

Integracin por
campo

[Plate97a]

Genrico
(acero,
plstico,
madera)

En lnea, continuo y
en movimiento

1 o 2 lseres de 780nm

Cmaras lineales

[Intec93a]

Genrico
(productos
continuos)

En lnea, continuo y
en movimiento

Luces estroboscpicas

Bateras de cmaras
entrelazadas,
510x485

[Aero93]

Pasta de papel,
mtodo ENCE

Muestro

Tipo puntual con pantallas.


Componente transmitida.

Cuatro cmaras
entrelazadas,
500x576

[Plate98]

Pasta de papel,
mtodo TAPI

Muestro

Tipo lnea. Componente


reflejada

Cmaras lineales

[Intec93b]

84

DISAM-UPMT-98-015

Carlos Platero

3.6

Captulo 3: Formacin de imgenes en SIVA

Pelculas

En lnea

Fluorescentes VHO a 60 kHz.


Componente transmitida

Batera de cmaras
TDI

[Rober93]

Planchas
metlicas
galvanizadas

En lnea

Tubo fluorescente de alta


frecuencia. Componente
especular

Cmara lineal de
2048 pxeles

[Macai93]

Textiles

Muestro

Fluorescente. Componente
reflejada

Entrelazada 768x756

[Serran95]

Conclusiones
En este captulo se han analizado los factores que intervienen en la adquisicin de
imgenes digitales, siendo los ms importantes la iluminacin, los elementos pticos, los
sensores y las tarjetas de adquisicin. Adems, se indica que dependiendo de la mtrica
requerida, se necesita considerar ms o menos elementos a tener en cuenta para el diseo
del sistema de adquisicin de imgenes. Por el nivel tecnolgico y las prestaciones
requeridas para los SIVA implementados, slo se ha abordado el diseo del sistema de
iluminacin y la eleccin de cmaras de estado slido.
Para el diseo del sistema de iluminacin se precisa del estudio sobre el
comportamiento de las superficies ante la radiacin luminosa, exponindose los diferentes
modelos existentes, as como indicando la validez de cada uno de ellos. Adems tambin
se pasa al anlisis de las fuentes luminosas, indicando sus caractersticas y las ecuaciones
de comportamiento. Por otro lado, y en trminos generales, se suele requerir una
iluminacin uniforme en el escenario SIVA, con tal propsito es necesario conseguir la
expresin analtica de la radiacin incidente en la superficie a inspeccionar, para a rengln
seguido buscar las condiciones geomtricas que intenten anular los trminos de primer
orden y superior del desarrollo de Taylor.
Tambin se ha presento una metodologa para el diseo del sistema de iluminacin,
que consta de la definicin del tipo de fuentes luminosas ms la localizacin del binomio
fuentes cmara respecto a la superficie. El mtodo se basa en un procedimiento de cuatro
puntos: primero, estudio sobre el espectro de la luz para determinar la regin de sta que
aumente el realce de los defectos; segundo, determinacin de las componentes de la luz a
adquirir junto con el modelo de superficie a utilizar, tal que explique la respuesta de sta
ante la excitacin luminosa; tercero, modelizacin de las fuentes luminosas, el material no
defectuoso y el defectuoso; y cuarto, simulacin de la escena en diferentes posiciones
espaciales. Parte de esta metodologa ha sido empleada en el diseo del sistema de
iluminacin para la inspeccin de pasta de papel.
Para terminar, se ha pasado al anlisis de los factores que influyen en la eleccin de
una arquitectura de cmaras CCD, poniendo especial nfasis en la arquitectura del sensor.
Proponindose a continuacin un mtodo bsico para la seleccin de las cmaras
atendiendo a las especificaciones del SIVA a implementar.

DISAM-UPM DISAM-UPMT-98-015

85

Carlos Platero

Deteccin
locales

Captulo 4: Deteccin visual de defectos locales

visual

de

defectos

Se pretende mostrar una metodologa sobre la deteccin de defectos locales en


superficies homogneas, mediante tcnicas de Visin artificial, y que adems, sta pueda
ser aplicada de manera industrial. Bajo este epgrafe aparecen las definiciones que
delimitan el problema a resolver. En primer lugar, el material a inspeccionar debe ser
homogneo, esto es, que su composicin y estructura sean uniformes [RealA96], como es
el caso del acero, el aluminio, el papel, y otros materiales artificiales.
El estudio se centra en la deteccin de defectos de carcter local, anomalas
puntuales en la materia que no hacen cambiar significativamente las propiedades fsicas y
qumicas globales de la materia, sino slo faltas visuales con influencias locales en las
caractersticas de las sustancias. Aunque estas faltas locales repartidas en el material,
definen el tipo de calidad del material y por ende las propiedades del producto.
La aplicacin de tcnicas de Visin artificial implica que los defectos deben tener
una apariencia visual distinta del resto de la materia que es catalogada como no defectuosa.
Adems, en este marco de trabajo, se exige que con slo la componente de luminancia de
la luz recibida por el sensor, sea capaz de discernir entre defecto o no. Esta restriccin es
muy importante, al no abordar la inspeccin visual con tratamiento de colores. No
obstante, sta es una prctica comn en estos tipos de SIVA [Newma95], que por otro lado
minimizan la cantidad de informacin a procesar.

DISAM-UPMT-98-015

87

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Y por ltimo, si la aplicacin debe ser industrial, el procesamiento de deteccin


tiene restricciones de tiempo, definiendo las prestaciones de soporte fsico (hardware) y
de ejecucin de algoritmos, acotando an ms los posibles caminos de actuacin. As si se
utilizan, por ejemplo, medidas de texturas basadas en matrices de coocurrencia
[Fern97][Cases97], el coste computacional es tan elevado que slo se podra realizar
inspeccin de tipo muestreo, no permitindose trabajos de observacin al 100%.
La problemtica de la deteccin, circunscrita al marco de esta tesis, consiste en un
proceso de decisin entre dos alternativas: qu parte de la seal recibida corresponde a
material local defectuoso y qu otra parte es buen material, a las que se llamarn defecto y
fondo, respectivamente.
En general, la informacin adquirida de la superficie a estudiar suele estar
entremezclada. La parte de los datos recibidos que representa el defecto visual suele ser
minoritaria respecto al volumen total de informacin. Y de otro lado, la informacin del
fondo, a parte de ser mayoritario, tiende a cancelar el mensaje de la porcin defectuosa. En
definitiva, la deteccin de defectos se presenta como un proceso de decisin donde la
informacin est intrincada. Luego el xito de este bloque depender de su nivel de acierto.
Un buen diseo en esta fase simplificar la construccin de un presumible clasificador de
tipos de defectos. Es esta etapa la que reemplaza el juicio subjetivo, pero flexible, del
inspector humano por la decisin inflexible de la mquina. Por lo tanto, las
especificaciones de requerimiento para la deteccin deben ser extremadamente cuidadas,
buscando un criterio de calidad compatible entre el hombre y la mquina.
En este contexto, diseador y cliente tienen que decidir cuales deben ser las
especificaciones del control de calidad, rea de inspeccin, tamaos de los defectos, faltas
que podran no ser consideradas, etc. El conjunto de pautas debern ser lo suficientemente
claras como para delimitar qu se detecta y cules no sern descubiertas, verifincndose
con posterioridad el nivel aceptable de coherencia entre la inspeccin automatizada y la
manual.
Las figuras siguientes muestran lo anteriormente mencionado. En la figura 4.1 se
muestra pasta de papel con un defecto local, del tipo llamado pitch. Obsrvese en las
figuras 4.2 y figuras 4.3, representacin en 2D y 1D del defecto, correspondiente a un
entorno de vecindad y a una fila con aparicin del defecto, donde no existe una evidencia
certera del defecto, aunque ste existe y es visualmente localizable.

88

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Figura 4.3 Pasta de papel con defecto tipo pitch

Figura 4.2 Textura del papel con


inclusin de defecto

4.1

Figura 4.1 lnea 200 conteniendo defecto


pitch

La deteccin como un proceso de decisin


La deteccin es fundamentalmente un proceso de decisin, la cual recibe
normalmente una seal representativa de la apariencia visual, constituyendo la entrada del
sistema, y devuelve a su salida una variable binaria. Suele etiquetarse con 1 aquellos
pxeles representativos de material defectuoso, mientras un 0 indicar que son pxeles del
fondo.

DISAM-UPMT-98-015

89

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Como todo proceso de decisin, de manera inexorable, la salida estar errada. Un


eficiente detector es aquel que minimice el error de clasificacin. Hay dos tipos de error:
etiquetar con 1 material no defectuoso, al que tradicionalmente se llaman falsa alarmas,
o el caso contrario, material defectuoso etiquetado con 0, denominado defecto no
encontrado. En definitiva, el mejor detector es aqul que minimice estos dos fallos.
Tal como acaba de reflejarse, es menester conocer algunas propiedades de la seal.
Se considerar que un mensaje est presente, cuando ste cruce un determinado umbral. A
veces es suficiente con la amplitud instantnea de la seal, como el utilizado para la
inspeccin del acero[EES92], pero en general, ser necesario un tratamiento previo para
aumentar el contraste entre fondo y defecto, con el propsito de poder ser detectado ms
fcilmente. Este proceso de incrementar el contraste, requiere de una etapa previa antes del
bloque de decisin. A este nuevo bloque se le llama realce o etapa de procesado. Las
tcnicas a emplear son mltiples y sern objeto de estudio en el siguiente apartado (4.2).
La definicin de esta etapa requiere de conocimiento explcito tanto de la seal del fondo
como del defecto. Las tcnicas que incrementan el contraste para la deteccin de los
defectos, suelen basarse en operacionales, lineales o no, en el entorno de vecindad.
En el proceso de decisin, etapa clave del sistema de deteccin de defectos, la seal
que proviene del fondo, a veces supera el umbral, generando falsas alarmas, o bien el
mensaje del error no alcanza el umbral. La colocacin de este umbral debe ser tal que
minimice estas faltas. Un aumento restrictivo del umbral, implicar una reduccin de
defectos sin detectar, y de otro lado, una disminucin del umbral lleva consigo un aumento
de falsas alarmas. Por eso la seleccin del umbral ptimo implica una solucin de
compromiso.
La deteccin vendr concebida cuando la amplitud de la seal, tratada o no, exceda,
por arriba o por abajo, de un determinado umbral. En esencia, se buscarn picos o
depresiones en la amplitud de la seal. Si el mensaje se manifiesta de otra forma, tal como
un cambio global de la textura, sta llevar consigo un cambio en la distribucin espectral
de la seal. Obsrvese que el planteamiento es totalmente distinto. En el primer caso, hace
referencia a defectos locales, mientras en el segundo supuesto es un cambio no local del
defecto. Pero recurdese que aqu, slo ser tratado de manera exhaustiva el caso de
defectos locales.
La seal podra cruzar el umbral debido a las fluctuaciones de luminancia del
material, como consecuencia de su propia textura, incluso cuando no est presente ningn
tipo de defecto local. El contraste entre el defecto y el fondo, es justamente el elemento
esencial en este tipo de desarrollos. Las prestaciones de proceso de decisin se optimizarn
en la medida de poder aumentar el contraste entre el fondo y el defecto, y en la eleccin
adecuada del tipo de umbralizacin.
En la mayora de las aplicaciones prcticas, las falsas alarmas tienden a distribuirse
uniformemente sobre la superficie a inspeccionar. En cambio, los defectos al ser materia
contigua tienden a formar grupos (cluster) de pxeles defectuosos. Parece pues, que pxeles
aislados etiquetados como defectuosos, corresponderan con falsas alarmas, mientras que
pxeles segmentados como defectuosos y que se agrupan bidimensionalmente sern buenos

90

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

candidatos. Esta propiedad puede ser utilizada como fase de post-procesamiento en la


deteccin de los defectos.
Concluyendo, un sistema de deteccin de defectos locales podra estar formado por
tres componentes bsicos, tal como muestra la figura 4.4. Un primer bloque de realce de
los defectos, cuya misin sea el aumento de contraste entre la zona defectuosa y el fondo.
El segundo bloque corresponder a la toma de decisin basada en la amplitud de la seal,
operacin no lineal e irreversible. Y el tercer bloque tratara de distinguir entre defecto y
falsas alarmas, basndose en propiedades de continuidad de la materia y distribucin
uniforme de las falsas alarmas.

Realce de los
defectos
(Procesado)

Deteccin de
los defectos
(Segmentacin)

Agrupacin de
pixeles defectos
(post-procesado)

Figura 4.4 Esquema general del proceso de deteccin

Las actuaciones de los bloques estn interaccionadas, no son bloques cuyos diseos
puedan ser considerados como independientes. Por ejemplo, una accin de eliminacin de
componentes de altas frecuencias del espectro de la seal, producido en el primer bloque,
reducira la efectividad de la tercera etapa. El diseo ptimo de cada uno no es algo exacto
sino que tiene componentes de ingenio, pues su formulacin en trminos formales no ha
sido posible realizar. De esta manera surgen preguntas como Cul es el mejor filtro que
aumente el contraste? Qu umbral optimiza el compromiso entre falsas alarmas y
ocultacin de defectos? Cul es la tcnica de clustering capaz de distinguir ruido de
defecto?. No existe una respuesta general, todo va a depender del conocimiento del
problema y de la habilidad del diseador.
Los siguientes puntos van a versar sobre estos tres bloques, intentado responder de
forma metodolgica a las preguntas formuladas, para acabar con un criterio de medida
sobre la eficacia del sistema detector.

DISAM-UPMT-98-015

91

Inspeccin automatizada de superficies homogneas mediante Visin artificial

4.2

Carlos Platero

Realce de los defectos locales


Los mtodos de realce de defectos pueden estar basados en tcnicas en el dominio
espacial o frecuencial. No obstante, el procesamiento en el dominio de las frecuencias en
inspeccin automatizada, no se puede contemplar el tratamiento en tiempo real desde el
estado actual de la tcnica1. Dichos mecanismos de procesamiento de imgenes, aunque
potentes y verstiles, estn reservados para implementaciones no crticas respecto al
tiempo o en aplicaciones fuera de lnea. Las instalaciones en lnea, en general crticas en el
tiempo de ejecucin, no pueden permitirse realizar procesamiento frecuencial. Sin
embargo, estn apareciendo metodologas hbridas, haciendo uso de mtodos pticos analgicos y conversin a imgenes digitales capaces de reducir los tiempos. Esta lnea de
trabajo novedosa y dentro del campo experimental, no ha sido contemplada en la
realizacin de esta tesis. Slo se van a contemplar mtodos digitales basados en el dominio
espacial.
Dentro del dominio espacial hay que distinguir entre tcnicas pixel a pixel y
tcnicas en entornos de vecindad. Si bien las operaciones de procesamiento pixel a pixel
son muy tiles para el realce de los defectos, pues stas estn ntimamente ligadas al rango
dinmico de la seal, este tipo de proceder no ha sido objeto de estudio, mas en lo que
pudiera contribuir para una mejora de calidad de las imgenes adquiridas. En cambio, s se
ha puesto nfasis en la investigacin de las relaciones espaciales de pxeles en pequeos
entornos de vecindad, al ser sta la primera seal de reconocimientos de objetos en la
imagen. Al tomar una imagen con defectos locales e iluminacin uniforme en la escena, un
cambio en la tendencia de los niveles de grises en un entorno de vecindad, permitir
detectar la presencia de faltas. Obviamente este proceder no es posible desde el
procesamiento pixel a pixel.
El resultado de operaciones de vecindad es generar otra imagen, distinta a la
adquirida, con el objetivo de aumentar el contraste entre fondo y defecto. Al procesar la
imagen para realzar ciertas caractersticas, va a implicar una prdida de la informacin
original, por lo que tambin se suele llamar a las operaciones de vecindad filtros de
procesamiento, en el sentido de transmitir una determinada parte del espectro de la seal.
Los filtros espaciales se clasifican en lineales y no lineales. Los filtros lineales estn
caracterizados por la convolucin entre mscara e imagen, coincidiendo con la inversa de
la transformada de Fourier del producto de ambas transformadas. As son llamados filtros
paso bajo, aquellos que permiten pasar las componentes de baja frecuencia y atenan las
componentes de alta frecuencia. Las componentes de alta frecuencia caracterizan
discontinuidades luminosas en la imagen, como bordes o detalles finos. De igual forma las
componentes de baja frecuencia se relacionan con distribuciones espaciales homogneas.

En 1998, la tarjeta Genesis de Matrox realiza una transformada discreta de Fourier 2D, en una
imagen de 512x512 con 8 bits en 2 s aproximadamente

92

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Concluyendo, un filtro paso bajo generar un suavizado de la imagen mientras un filtro


paso alto servir para la localizacin de bordes y de detalles en la imagen. Un tercer tipo de
filtros son los llamados paso banda, eliminando las componentes de alta y baja frecuencia.
Estos filtros son utilizados para la reconstruccin de imgenes y raramente para el realce.
Los filtros espaciales no lineales tambin operan en entornos de vecindad. En
general, el procesado se basa en alguna caracterstica de la vecindad, no utilizando
explcitamente el uso de coeficientes de la mscara como en el procesado lineal. Por
ejemplo, es comn realizar una eliminacin de ruido con la aplicacin de una mediana en
el entorno de vecindad. Otro ejemplo, puede ser el aumento del brillo de la imagen,
mediante el reemplazamiento de pixel de mayor intensidad en la mscara. Todas estas
operaciones de maximizado, mediana, etc. son operaciones no lineales.
Realizado este primer anlisis sobre las posibilidades de realce de defectos, las
siguientes pginas van a desarrollar, el anlisis y sntesis de filtros espaciales lineales o no.
No olvidando que el objetivo ltimo es el aumento de contraste entre el defecto y el fondo.
Primero se abordan las tcnicas lineales para pasar luego a las no lineales.
4.2.1

Filtros lineales discretos


El procesamiento lineal se fundamenta en la combinacin de pxeles mediante la
multiplicacin de cada pixel por un factor, para proseguir con la suma de los productos,
escribiendo el resultado sobre el pixel que sirvi de pivote, ver figura 4.5. Desde el punto
de vista matemtico y considerando H el operador mscara y G la imagen, el resultado
quedar como:
G' = H * G

g m ,n =

M 1 N 1

h
k = 0 l =0

k ,l

g m k , n l

( 4.1 )

obsrvese detenidamente este proceder, primero es una transformacin lineal,


segundo describe una operacin de convolucin discreta, reemplzese la integral por suma
de elementos discretos y, tercero, una convolucin discreta coincide con un filtro lineal
discreto, por la propia definicin que se ha dado. Estas ideas son la base del trabajo que se
va a exponer a continuacin. Parece evidente que los resultados de la imagen de salida
dependern del tipo y la forma de la convolucin, por tanto el problema que se estudia, es
de cmo se va a disear la mscara de convolucin. Y por lo expresado se puede optar por
dos vas, el diseo en el espacio temporal y en el basado en el espacio frecuencial,
sabiendo adems la correspondencia biunvoca entre estos dos espacios. A partir de estos
momentos se hablar de filtros o mscaras indistintamente.
Antes de entrar en detalle sobre el anlisis y diseo de las mscaras, vanse algunas
consideraciones prcticas. Desde el punto de vista terico y por lo mencionado
anteriormente, se desprende la no existencia de lmites en el tamao de la mscara de
convolucin. Pero en la prctica dos problemas hay que considerar, el primero y ms
importante, a medida de que se tenga mscaras de mayor tamao, ms grande ser el
esfuerzo coumputacional, por lo que se deber emplear mscaras de la menor extensin

DISAM-UPMT-98-015

93

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

posible. El segundo problema es el efecto de bordes y ruptura del teorema de convolucin.


La adquisicin prctica de una imagen en un buffer de memoria, supone una
discontinuidad en la convolucin al carecer de informacin ms all de las fronteras de la
imagen. Con el objeto de evitar este inconveniente, se suelen utilizar bien buffers de
procesamiento ms pequeos que el adquirido o bien, utilizar tcnicas llamadas overscan,
consistentes en dar un valor fijo determinado o la media de los que tiene, emplazando los
valores fuera de las fronteras por las calculadas. Todo ello lleva a utilizar mscaras lo ms
pequeas posible, con el objeto de disminuir el nmero de operaciones y evitar las
discontinuidades originadas por la falta de datos en las fronteras. Se trata pues de buscar
filtros potentes y flexibles con el menor nmero de operaciones.

n-1

m-1

m+1

n+1

Figura 4.5 Operacin de convolucin discreta con


mscara 3x3

Dentro de este apartado se va hacer el siguiente planteamiento: primero se van a


estudiar las propiedades de las mscaras, mediante el uso del dominio de las frecuencias,
de las que se van a desprender un conjunto de propiedades a tener en cuenta para la fase de
diseo; segundo, se desarrolla la relacin existente entre convolucin y correlacin, y
tercero, se expone, como proceso de sntesis, la utilizacin del mtodo de regresin de
variable cualitativa para el diseo de mscaras.
4.2.1.1 FIR e IIR
Hay dos tipos de filtros, los filtros no recursivos llamados FIR (finite impulse
response) y los filtros recursivos bajo el nombre de IIR (infinite impulse response). Para
sus estudios se empezar por abordar el caso de filtros unidimensionales. La funcin de
transferencia de un filtro de tipo FIR, en transformadas en z y su ecuacin en diferencias
es del tipo:

94

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

F ( z ) = a 0 + a1 z 1 + ... + a n z n
y (k ) = a 0 x( k ) + a1 x(k 1) + ... + a n x(k n)

( 4.2 )

donde n es el orden del filtro. Obsrvese que en estos tipos de filtros cada valor de
la secuencia de salida slo depende del nmero finito de valores de la secuencia de entrada.
En cambio, las expresiones de los filtros recursivos corresponden a la forma de:
F ( z) =
y (k ) =

a 0 + a1 z 1 + ... + a m z m
b0 + b1 z 1 + ... + bn z n

,n m

1
[a 0 x(k ) + a1 x(k 1) + ... + a m x(k m) b1 y(k 1) ... bn y(k n)]
b0

( 4.3)

en estos casos, las secuencias de salida dependen tanto de la entrada como de la


salida. De estas ecuaciones se deducen las siguientes propiedades, primero la respuesta
impulsional es infinita para los filtros IIR, aun teniendo un nmero finito de coeficientes.
Mientras la respuesta impulsional de un filtro no recursivo es siempre finita e igual al
tamao de la mscara (figura 4.6). En segundo lugar, los FIR son siempre estables, esto es,
el resultado del filtrado es otro valor finito. No es el caso de los filtros recursivos, su
estabilidad depende de los coeficientes. La estabilidad de los filtros recursivos es muy
difcil de analizar y especialmente cuando es de dos o ms dimensiones [Jhne97]. Tercera,
cualquier filtro recursivo puede ser reemplazado por otro no recursivo con infinitos
coeficientes, sus valores vendrn dados por la respuesta impulsional del IIR. La conclusin
inversa no se cumple, slo hay que observar en la inestabilidad de los IIR y la estabilidad
siempre de los FIR.

Figura 4.6 Respuesta impulsionales de FIR, IIR

4.2.1.2 Propiedades de los filtros lineales discretos


Antes de entrar en el anlisis de mscaras, se van a comentar sucintamente las
propiedades de los filtros lineales. stas, luego, sern utilizadas para el diseo de las
mscaras de convolucin. Se denotar la mscara como el operador H, el cual transforma

DISAM-UPMT-98-015

95

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

una imagen G en G. En este apartado se van a tratar las propiedades del operador H, para
llegar a que ste cumple con las caractersticas de linealidad e invarianza a traslaciones.
El operador H tiene la propiedad conmutativa, esta propiedad es fcil de demostrar
en el dominio de la frecuencia.
H * H = H * H

( 4.4 )

Tambin tiene la propiedad asociativa, pudiendo componer un operador complejo a


partir de operadores simples
H * ( H '*H ' ' ) = ( H * H ) * H

( 4.5 )

por ejemplo, en vez de utilizar un filtro binomial de 5 x 5, llevando 25


multiplicaciones y 24 sumas, stas podran ser reducidas por la propiedad asociativa a 10
multiplicaciones y 8 sumas

1
4
6
4
1

4 6 4
16 24 16
24 36 24
16 24 16
4 6 4

1
4
6
4
1

1

4
6 * (1 4 6 4 1)

4
1

( 4.6 )

adems al estar el operador H constituido por elementos de un mismo espacio


vectorial, se puede aplicar la propiedad distributiva respecto a la suma
H + H = H
4.2.1.2.1

( 4.7 )

Linealidad e invarianza a traslaciones

El operador H tiene la propiedad de linealidad, as a dos imgenes, G y G de


tamao P x Q, al ser operadas con dos escalares cualesquiera, a y b, cumple con la
siguiente igualdad:
H * (aG + bG ) = aH * G + bH * G '

( 4.8 )

que puede generalizarse para cada una de las entradas

96

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

H a k Gk = ak HGk
k
k

( 4.9 )

La propiedad de superposicin hace que el operador sea lineal. Esta propiedad es


muy til al poder descomponer la imagen por cada una de las componentes que la
constituyen. Formalmente, esto significa que la imagen es compuesta a travs de una
imagen base, de manera que se puede escribir:
mn

1 m, n
P=
0 en caso contrario
M 1 N 1

G = Gmn mn P

( 4.10 )

m =0 n =0

mostrndose el operador P como una funcin discreta dirac en 2D. Otra importante
propiedad es la invarianza a traslaciones, esto es, el resultado del operador no depende
explcitamente de la posicin de la imagen. Si se traslada en posicin, la imagen de salida
es la misma pero desplazada. Se puede formular mediante el operador desplazamiento, mnS,
como que cumple con:
mn

Sg m,n = g m ' m ,n ' n

( 4.11 )

El operador es invariante a cambios, al conmutar el operador H por el operador


desplazamiento :
H ( mn SG )= mn S ( HG )
obsrvese que el operador desplazamiento
invariante a cambios.

( 4.12 )
mn

S, tambin es un operador lineal e

4.2.1.3 Simetra
La simetra de las mscaras tanto en tamao como en coeficiente es una propiedad
muy utilizada en la prctica y, preferentemente se suelen utilizar mscaras de tamao
impar. La convolucin de una mscara de tamao impar y centrada en el origen de sta,
vendr dado por:
g m ,n =

k = rl = r

k , l

g m+ k ,n +l

( 4.13 )

Las asimetras de los coeficientes de las mscaras no son utilizadas para el


procesamiento de imgenes, ya que producen traslaciones en la estructura de la imagen. Un
filtro simtrico transforma las caractersticas del entorno de vecindad, pero no cambia su

DISAM-UPMT-98-015

97

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

centro de gravedad [Jhne97]. Si se hacen traslaciones en los pxeles, no sern posibles las
medidas de posicin de los pxeles. Y sta es una caracterstica importante en los equipos
de inspeccin.
Se puede distinguir dos tipos de simetra, par e impar, con la condicin de cumplir
en una o en ms direcciones, las siguientes igualdades:
h k , l = h k ,l

o h k , l = h k ,l

( 4.14 )

donde el signo + y hace referencia a simetra par o impar. Desde esta definicin y
para el caso de un filtro unidimensional, la expresin ( 4.13 ) quedar como:
, n = h0 g m , n +
gm

h (g
l

m,n l

+ g m,n +l )

par

l =1

g m, n =

h (g
l

m , n l

g m,n + l )

impar

l =1

( 4.15 )

La suma slo recorrer la mitad de la mscara, excluyendo el pixel central, al cual


habr de tratar aparte. En el caso de filtro impar, por la definicin dada en ( 4.14 ), el
coeficiente del pixel central debe ser cero. Para el caso de mscaras bidimensionales, las
simetras pueden ser diferentes por cada direccin. En el caso de imgenes bidimensionales
existen cuatro tipos de direcciones principales: de abajo arriba, de izquierda a derecha, de
la esquina superior izquierda a la esquina inferior derecha y, de la esquina superior derecha
a la esquina inferior izquierda. Las expresiones de la convolucin dependern de las
diferentes simetras que se den en cada una de estas direcciones.
Sea ahora el caso ms general, es decir, se considera una convolucin constituida
por un filtro IIR y FIR, las imgenes resultantes sern del tipo:
,n =
gm

m '= 0 n '= 0

, n +
rm, n g m

m '= r n '= r

m , n g m m , n n

( 4.16 )

donde los primeros sumandos corresponden al IIR, cuyos coeficientes son tomados
del primer cuadrante, exceptuando el origen. Tal restriccin es necesaria, al considerar en
el algoritmo recursivo slo los pxeles ya calculados. El signo de los ndices (m,n)
determinarn la direccin en el que es aplicado el filtro recursivo. Los segundo sumandos
representan el FIR de mscara (2r+1) (2r+1).
Las funciones de transferencia de los filtros IIR no suelen ser simtricas, ms bien
tienden a la direccin de propagacin del algoritmo recursivo. Si se requiere el diseo de
filtros simtricos, debe ejecutarse el mismo filtro en todas las direcciones, o al menos en
sentidos contrarios, sumndose o restndose los distintos resultados. De esta forma las
asimetras pueden ser compensadas, unas con otras.

98

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Para el caso de los filtros FIR, se puede hacer uso de la propiedad asociativa para el
diseo de mscaras que fuesen simtricas en las cuatro direcciones.
4.2.1.4 Respuesta en frecuencia
En el dominio de la frecuencia, un filtro se representa por su respuesta espectral.
sta mostrar como cambia la amplitud y fase del filtro en funcin de la k-sima
componente de frecuencia. La relacin entre el dominio frecuencial y espacial vendr dado
por la transformada discreta de Fourier. La transformada del operador H, omitiendo el
factor 1/MN para una representacin normalizada, ser:
M

hu , v =

m,n

m =0 n =0

2jmu
2jnv
exp
exp

M
N

( 4.17 )

Esta expresin puede ser simplificada si se aplican propiedades de simetras par e


impar. La combinacin de los trminos simtricos hm,n y de h-m,-n quedar como:

hu , v = h0 , 0 +

m,n

( m , n )Dh

2jmu
2jnv
exp
exp

M
N

2jmu
2jnv
+ h M m, N n exp

exp
M
N

( 4.18 )

donde Dh es el conjunto de ndices que recorre la mitad del espacio. Usando las
caractersticas de filtros pares e impares, se desprenden las siguientes expresiones
hu ,v = h00 +

2h

m,n

( m , n )Dh

hu , v = j

2h

2mu 2nv
+
cos
par
N
M

2mu 2nv
+

N
M

m , n sin

( m , n )Dh

impar

( 4.19 )

estas ecuaciones se pueden escribir de manera que tambin quede normalizado el


~
eje de las abscisas, o sea, la frecuencia, de forma que se cambie a K = (2u / M ,2v / N ) ,
estando su rango entre 1 y 1. Las expresiones quedarn:
~
~
2h cos[ (mk + nk )]
~
~
2h sin[ (mk + nk )]

hu,v = h0,0 +

m,n

par

( m,n)Dh

hu,v = j

m, n

( m,n)Dh

impar

( 4.20 )

Como se ver ms adelante, estas expresiones van a ser muy utilizadas para el
anlisis y diseo de las mscaras de convolucin.

DISAM-UPMT-98-015

99

Inspeccin automatizada de superficies homogneas mediante Visin artificial

4.2.2

Carlos Platero

Convolucin y correlacin espacial


En el apartado anterior ha quedado clara la necesidad de utilizar mscaras
simtricas, con el objeto de no introducir traslaciones espaciales en los centros de gravedad
del entorno de vecindad. Pero existe otra propiedad ms a estudiar, la coincidencia entre el
concepto de convolucin discreta y correlacin espacial. As, se define la correlacin entre
una imagen G discreta y un operador H como:
g m ,n =

M 1 N 1

h
k =0 l =0

k ,l

g m + k ,n+l

( 4.21 )

Si se compara esta expresin con la definida en la convolucin discreta, ( 4.1 ), se


observar que slo difiere en los signos de los ndices. De hecho, en el dominio de las
frecuencias sus transformadas coinciden en mdulo pero no en argumento:
DFT

G * H G H
DFT

correlacion(GH ) G * H

( 4.22 )

En el caso de cumplir el operador H simetra par, la convolucin y la correlacin


coinciden. Mientras en simetra impar es igual en mdulo pero de signo contrario. Sea por
ejemplo el caso de una mscara unidimensional simtrica H, al que se le pasa por la
imagen G para determinar su correlacin. Al aplicar simetra par e impar sobre ( 4.21 )
resultar:
r

g m ,n = h0 g m ,n + hl ( g m ,n l + g m ,n + l ) par
l =1

g m ,n = H l ( g m , n+ l g m ,n l )
l =1

impar

( 4.23 )

Obsrvese que las expresiones ( 4.23 ) y ( 4.15 ) son iguales para simetra par y
con distinto signo en simetra impar. Esta propiedad ha sido utilizada por los fabricantes de
hardware de procesamiento de imgenes para el diseo de sus tarjetas[Awcoc95].
4.2.2.1 Regresin mltiple
Se ha observado cmo bajo ciertas condiciones de simetra, la convolucin coincide
con la correlacin lineal. En todo caso, para cualquier caso de convolucin discreta del
operador H sobre una imagen G, esta operacin puede ser presentada como una
combinacin lineal de un vector H* por una matriz G*. Vase, partiendo de la definicin
dada de convolucin:

100

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

g m ,n =

k = rl = r

g m+ k ,n +l

k , l

( 4.24 )

Si se tiene un operador H de (2r+1) (2r+1) y una imagen G de PxQ pxeles, el


vector H* estar constituido por todos los coeficientes del operador mscara H, esto es, ser
un vector columna de (2r+1)x(2r+1) filas, mientras G* ser una matriz formada por PxQ
filas y (2r+1)x(2r+1) columnas, quedando como:
G* ' = G*H *

( 4.25 )

donde G* representar el vector de salida correspondiente al resultado de la


convolucin. El motivo de cambiar el aspecto, viene originado por tratar de presentar el
diseo de las mscaras como un problema de regresin mltiple. Si se utiliza notacin de
Anlisis multivariante, a G* se la llama la matriz de diseo, mientras que H* ser el vector
de parmetros. Segn el modelo lineal presentado:
g i* ' = g i*1 h1* + ... + g i*,( 2 r +1)( 2 r +1) h(*2 r +1)( 2 r +1)

( 4.26 )

y suponiendo que (2r+1)x(2r+1) sea menor a PxQ, hace que el rango de G* sea de
(2r+1)x(2r+1). Desde el punto de vista de la regresin mltiple, la solucin de los
coeficientes de la mscara puede ser calculado mediante mnimos cuadrados. La solucin
est definida por:

(h ,..., h
*
1

) = (G

T
*
( 2 r +1)( 2 r +1)

*T

G * G *T G * '

( 4.27 )

es decir, la mscara H puede ser estimada mediante el uso de la matriz de diseo,


G*, y el nivel deseado de salida, G*. Antes de entrar en mayor detalle en la fase de diseo,
vanse ms conceptos relacionados con la regresin. As, se define a la relacin lineal
g i* ' = g i*1 h1* + ... + g i*,( 2 r +1) 2 r +1) h(*2 r +1) 2 r +1)

( 4.28 )

hiperplano de regresin de G* sobre G*. Y se llama correlacin mltiple al


coeficiente de correlacin entre las variables G* y G * ' . Se indica por
rg*i = corr ( g i *' , g i ' )
*

( 4.29 )

Si rg* es igual a 1, entonces el valor estimado y el verdadero valor coinciden, g*


= g * , es decir la variable g* es combinacin lineal de g*, mientras que si rg* es igual a
cero, g* no es combinacin lineal de g*. Obviamente g* es combinacin lineal de g* por
la propia definicin dada en ( 4.25 ). Todo este repaso al anlisis de regresin, sirve para
ver cmo la mscara de convolucin puede ser calculada desde la bsqueda de correlacin
entre mscara y la forma del defecto que se desea detectar. ste es el fundamento de

DISAM-UPMT-98-015

101

Inspeccin automatizada de superficies homogneas mediante Visin artificial

muchos algoritmos de casamiento de patrones


(pattern matching). Pero en este caso, no se
pretende exactamente encontrar un patrn,
sino el realce de defectos puntuales, esto es,
aumentar el contraste entre el fondo y el
defecto. En la figura 4.7 se expresa lo que se
pretende conseguir, suponiendo un caso
unidimensional. Pues bien, en el modelo de
regresin no se tiene conocimiento a priori
cuantitativo del resultado, esto es, no se sabe
cuanto debe valer gm,n, pero si se sabe que se
desea aumentar la diferencia entre fondo y
contraste, lo que sugiere realizar un modelo
de regresin con variable de respuesta
cualitativa.
4.2.3

Carlos Platero

gmn

gmn
1

Figura 4.7 Realce de defecto con variables


cualitativas

Modelo de regresin con variables cualitativas


La variable respuesta en muchas investigaciones es binaria: por ejemplo, un
accidente puede o no ocurrir, un crdito devolverse o no. De igual forma, la salida del
proceso de convolucin no es conocida a priori, pero si es posible indicar si el pixel es
defectuoso o no, implicando un resultado binario. Efecto que fue mostrado en la anterior
grfica. Una solucin estara en formular el modelo de regresin y estimarlo mediante
mnimos cuadrados:
G*' = G * H * + u

(h ,..., h
*
1

) = (G

T
*
( 2 r +1)( 2 r +1)

*T

G * G *T G * '

( 4.30 )

donde u es el residuo. Suponiendo gi* como una variable binaria, se proceder a


dar valor nulo cuando un pixel corresponde al fondo, y valor uno en las reas de pxeles
defectuosas. Este procedimiento se encuentra con los inconvenientes siguientes:
1.

Tomando esperanzas en ( 4.30 ) para G* = G*i:

E g * ' | G * = Gi* = G * H *

( 4.31 )

si se llama pi a la probabilidad de que g* tome en la poblacin el valor 1 cuando


G* = G*i, entonces la esperanza de la variable de salida quedar como:

102

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

pi = p ( g *' = 1 | G = Gi* )

] (

E g * '| G * = Gi* = p g * ' = 1 1 + p g * ' = 0 0 = pi = G* H *

( 4.32 )

En consecuencia, la prediccin de g* del modelo estima la probabilidad de que la


observacin pertenezca a la clase definida por g*=1. Sin embargo, un inconveniente
fundamental con est formulacin es que, aunque pi debe estar entre cero y uno, no hay
ninguna garanta de que su prediccin, G * H * , verifique esta restriccin, por lo que puede
prever probabilidades mayores de la unidad.
2. Conocido el valor de G*, los nicos valores posibles de g* son 0 y 1. Por tanto,
la distribucin de ui es una distribucin discreta con valores (1-pi) y pi. La
variable ui tiene media cero, pero no sigue una distribucin normal. En
consecuencia, los estimadores mnimos cuadrados del modelo no sern
eficientes [Pea87].
4.2.3.1 El modelo logstico (Logit)
La forma de garantizar que la respuesta prevista est entre cero y uno es
transformar la variable respuesta, lo que equivale a establecer una relacin no lineal entre
la salida y la variable de entrada. Formulando el modelo de manera que la probabilidad de
pertenecer al grupo definido por G* igual a 1 sea una funcin no lineal de G* del tipo:
pi = F (Gi H * )
*

( 4.33 )

donde F es cualquier funcin de distribucin, garantizando que, sea cual sea el


valor de G * H * , el valor de probabilidad estar entre cero y uno. Existen varias funciones,
pero la transformacin ms utilizada corresponde con el modelo logstico (logit), dada por:
pi =

1
1 + e Gi

*T

H*

( 4.34 )

siendo sta una funcin sigmoide, definida entre cero y uno.


Partiendo de una muestra caracterizada por una imagen transformada G*, cuya
salida es un vector binario G*. La funcin de probabilidad de una respuesta g*i
cualquiera es:
P( g i* ' ) = pig i ' (1 pi )1 gi '
*

DISAM-UPMT-98-015

g i* ' = 0,1

( 4.35 )

103

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Por tanto, la funcin de probabilidades para la muestra es:


PxQ

P( g1* ' ,..., g *PxQ ' ) = pig i ' (1 pi )1 g i '


*

( 4.36 )

i =1

y tomando logaritmos:
PxQ
pi PxQ
*
+ ln(1 pi )
ln( P( g1* ' ,..., g PxQ
' )) = g i* ' ln
p
(
1

)
i =1
i

i =1

( 4.37 )

expresando pi en funcin de los parmetros de inters H * se obtendr su funcin


soporte:
PxQ

PxQ

i =1

i =1

*T * *
L( H ) = g i* ' Gi*T H ln 1 + eGi H

( 4.38 )

ya que, segn ( 4.34 ):


1 pi =

1
*T

1 + e Gi

H*

( 4.39 )

Para obtener los estimadores mximos verosmiles, se deriva ( 4.38 ) expresando el


resultado como vector columna:
*T * *
L( H * ) PxQ * * PxQ * e Gi H
= g i ' Gi Gi
1 + e Gi*T * H *
H *
i =1
i =1

=0

( 4.40 )

que conduce al sistema de ecuaciones:


e Gi*T *H *
g ' G = G

1 + e Gi*T *H *
i =1
i =1

PxQ

PxQ

*
i

*
i

*
i

( 4.41 )

Estas ecuaciones expresan que el producto de los valores observados por las
variables explicativas debe ser igual al de los valores previstos. Tambin, que los residuos
del modelo, ei = g i* ' g i* ' , deben ser ortogonales a las variables de entrada. La condicin
( 4.41 ) es anloga a la obtenida en el modelo de regresin estndar, pero ahora el sistema
resultante no es lineal en los parmetros H * . Para obtener el valor MV de H * que
maximiza la funcin soporte, ( 4.40 ), se recurre a un algoritmo tipo Newton-Raphson.

104

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Desarrollando (L( H * ) / H * ) , el vector de tasas de discriminacin alrededor de un punto,


se tiene
L( H * ) L( H * k ) 2 L( H * k ) * *
=
+
H H k
H *
H *
H * H *T

( 4.42 )

para que el punto corresponda al mximo de verosimilitud su primera derivada debe


anularse. Imponiendo la condicin (L( H * ) / H * ) = 0 , se obtiene:
1

2 L( H * k ) L( H * k )

= H +
*
*T
H *
H H
*

( 4.43 )

que expresa cmo obtener el punto H * k del mximo a partir de un punto prximo
cualquiera H * . La ecuacin depende de la matriz de segundas derivadas, que, en el
ptimo, es la inversa de la matriz de varianzas y covarianzas asinttica de los estimadores
MV. Derivando por segunda vez en ( 4.40 ) y sustituyendo las derivadas de primer y
segundo orden en ( 4.43 ), queda:

H * k = H * + G *T VG *

G *T (G * 'G * ' )

( 4.44 )

donde V es una matriz diagonal con trminos pi(1-pi), mientras G * ' es el vector de
valores esperados de G*. Esta expresin proporciona el siguiente algoritmo iterativo para
obtener el estimador MV de H * .
1. Fijar un valor arbitrario inicial, H * 0 , para los parmetros y obtener el vector
G * ' 0 para dicho valor en el modelo logit.
2. Definir una variable auxiliar Z = V 1 (G * 'G * ' ) .
3. Estimar por mnimos cuadrados ponderados una regresin con variable
dependiente Z, regresores G* y coeficientes de ponderacin g i+ ' (1 g i+ ' ) . Los
parmetros
estimados
con
esta
regresin,
vendrn
dados

1
por G *T VG * G *T (G * 'G * ' ) . Obtener un nuevo estimador de los parmetros
utilizando el resultado de la etapa anterior, quedando la expresin:

H * k = H * k 1 + G *T Vk 1G *

G *T (G * 'G * ' k 1 )

( 4.45 )

El proceso se repite hasta obtener la convergencia. De esta forma es posible obtener


los coeficientes de los filtros lineales discretos. Se ha transformado el problema de realce
en una bsqueda de la correlacin entre la mscara y la forma de los defectos.

DISAM-UPMT-98-015

105

Inspeccin automatizada de superficies homogneas mediante Visin artificial

4.2.4

Carlos Platero

Filtros no lineales: Procesamiento morfolgico


Dentro de los filtros no lineales destacan las tcnicas basadas en procesamiento
morfolgico. El impulso del procesado morfolgico sobre imgenes ha sido desarrollado
principalmente por Georges Matheron[Mathe75] y Jean Serra [Serra82]. La Morfologa
matemtica se concentra en el anlisis de formas en una imagen. La teora general,
desarrollada inicialmente, se restringi a imgenes binarias, siendo ms reciente su
aplicacin en imgenes de niveles de gris. Las referencias [Dough92] y[Dough94] tratan
de forma didctica este tema.
El procesado morfolgico de imgenes constituye en la actualidad una importante
herramienta para el anlisis de imgenes con formas predefinidas. Actualmente, estas
operaciones resultan ser los procesamientos no lineales ms empleados en la Visin
artificial, y la mayora de las tarjetas de procesamiento de imgenes permiten la realizacin
en tiempo real de los operadores ms bsicos.
Para entender la filosofa de trabajo de los filtros morfolgicos, se inicia a travs de
su definicin para imgenes binarias y se ampliar el concepto posteriormente a la
morfologa sobre escalas de grises.
4.2.4.1 Procesamiento morfolgico en imgenes binarias
La idea bsica en imgenes binarias es la de recorrer la imagen a procesar G con
una mscara H, denominado elemento estructurante, que posee un origen como referencia
y dnde la pertenencia de un punto a una imagen transformada, se decide comprobando si
los conjuntos de H y G verifican una determinada condicin. Aquellos puntos gm,n en los
que la respuesta sea afirmativa pasarn a formar parte de la imagen transformada.
Con imgenes binarias, las combinaciones de pxeles vecinos vendrn dadas por
operaciones basadas en el lgebra de Boole. As, se puede empezar definiendo una posible
convolucin binaria tal que reemplace la multiplicacin por el operador lgico and, y la
suma por el operador or, el resultado quedar como:
g m ,n =

 h

m '= r n '= r

m 'n '

g m m ',n n '

( 4.46 )

Los smbolos y representan las operaciones lgicas and y or, respectivamente.


La imagen binaria G ha sido convolucionada por el elemento estrcuturante H, de tamao
2r+1x2r+1.
Si se asume que todos los elementos de H son unos, al operar segn ( 4.46 ), si al
menos un pixel de la imagen G es uno, en la zona que est incluida la mscara, el
resultado de la operacin ser un uno, en caso contrario resultar cero. Por lo tanto el
objeto ha sido dilatado. Pequeos agujeros o fracturas sern llenados, mientras el contorno
de los objetos pasarn a ser suavizados. El operador definido por ( 4.46 ) se llama
operador dilatacin.

106

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Con propsito opuesto se puede definir el operador erosin. Los objetos que sean
ms pequeos que la mscara desaparecern completamente, mientras grupos de pxeles
conectados por puentes sern separados. La erosin de un objeto estar definida por la
siguiente convolucin binaria:
g m ,n =

 h

m '= r n '= r

m 'n '

g m m ',n n '

( 4.47 )

Se ha utilizado esta notacin no convencional del procesamiento morfolgico para


transitar fcilmente del procesado lineal al no lineal. Normalmente estas operaciones son
definidas sobre la teora de conjuntos. As, se considera G como el conjunto de todos los
posibles pxeles de la matriz que sean distintos de cero. H es el conjunto de pxeles distinto
de cero del elemento estructurante. Con Hp se denota la traslacin de la mscara respecto al
pixel p, pues no necesariamente el centro de la mscara es donde pivota el elemento
estructurante. La erosin se definir como:
GH = {p : H p G}

( 4.48 )

G H = {p : H p G 0}

( 4.49 )

y la dilatacin como:

estas definiciones son equivalentes a ( 4.47 ) y ( 4.46 ) respectivamente. Segn


( 4.48 ), la erosin sobre G con el elemento estructurante H da como resultado todos los
pxeles p, para los cuales Hp est completamente contenido en G. Por el contrario, la
dilatacin de G por H es el conjunto de todos los pxeles para los cuales la interseccin de
G y Hp no es el conjunto vacio. Los operadores dilatacin y erosin son considerados como
los operadores elementales de la morfologa, pudindose construir operadores ms
complejos a partir de stos.
4.2.4.1.1

Propiedades

Los operadores morfolgicos no comparten todas las propiedades de las


convoluciones lineales, vistas en 4.2.1.
Invariante a traslaciones: Viene como consecuencia directa de la definicin de
erosin y dilatacin como convolucin binaria. Utilizando el operador traslacin mnS y para
cualquier operacin morfolgica queda:
H ( mnSG )= mnS ( HG )

( 4.50 )

Superposicin: Con cualquier operador morfolgico y para las siguientes


expresiones

DISAM-UPMT-98-015

107

Inspeccin automatizada de superficies homogneas mediante Visin artificial

H (G G ') = ( HG ) ( HG ' ) H (G G ') = ( HG ) ( HG ' )

Carlos Platero

( 4.51 )

En trminos generales, los operadores morfolgicos no son aditivos en el sentido de


( 4.51 ). Mientras el operador dilatacin cumplira con el principio de superposicin, la
erosin no cumple. La erosin de la unin de dos objetos es un superconjunto de la unin
de los dos objetos erosionados:

(G G')H (GH ) (G' H )


(G G ') H = (G H ) (G' H )

( 4.52 )

Conmutativa y asociativa: Los operadores morfolgicos son generalmente no


conmutativos
H 1H 2 H 2 H 1
H1 H 2 = H 2 H1

( 4.53 )

Es fcil de entender que la erosin no es conmutativa para el caso especial de que


H1H2, la erosin de H2 por H1 ser el conjunto vaco, pero el caso contrario no lo es. Sin
embargo, las aplicaciones consecutivas de erosiones y dilataciones sobre una misma
imagen son conmutativas:
(GH 1 )H 2 = G( H 1 H 2 ) = (GH 2 )H 1
(G H 1 ) H 2 = G ( H 1 H 2 ) = (G H 2 ) H 1

( 4.54 )

Estas conclusiones son muy importantes para la implementacin del procesado


morfolgico. Generalmente, las operaciones en cascadas con k elementos estructurantes
H1, H2, , Hk son equivalentes a la operacin con un nico elemento estructurante H = H1
H2Hk. Concluyendo, un elemento estructurante grande puede ser descompuesto en
otros ms pequeos. Un importante ejemplo es la composicin del elemento estructrante en
filas y columnas, H=Hx Hy. Otro ejemplo, es la realizacin de un elemento estructurante
de tipo circular, ste podra construirse mediante la combinacin de elementos
estructurantes unidimensionales que corran en ms direcciones que las axiales.
Montonas: La erosin y la dilatacin son operadores montonos
G1 G2 G1 H G2 H
G1 G2 G1H G2 H

( 4.55 )

La propiedad de ser montonas la erosin y la dilatacin, significa que las


relaciones de subconjuntos son invariantes a estos operadores.

108

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

Distributiva: Las propiedades distributivas para la dilatacin y la erosin son ms


complejas que en los filtros lineales. As, la erosin es distributiva con la interseccin,
mientras la dilatacin sobre la unin.
(G1 G2 ) H (G1 H ) (G2 H )
(G1 G2 )H = (G1H ) (G2 H )

( 4.56 )

(G1 G2 ) H = (G1 H ) (G2 H )


(G1 G2 )H (G1H ) (G2 H )

( 4.57 )

Dualidad: La erosin y la dilatacin son operadores duales. Tomando la imagen


negada G, la erosin se convierte en una dilatacin y viceversa:
G H = G H
G H = GH

( 4.58 )

Los fundamentos de las operaciones de Morfologa matemtica, incluyendo las


demostraciones de todas las propiedades vistas, pueden ser encontradas en el libro de Serra
[Serra82].
4.2.4.1.2

Opening y closing

Usando los operadores elementales de erosin y dilatacin, se pueden disear


operaciones de realce de formas de objetos. La erosin suele utilizarse para eliminar
pequeos objetos, prctica que ser utilizada posteriormente en la fase de postprocesado.
Sin embargo, tiene el inconveniente de disminuir el tamao del resto de los objetos. Este
efecto puede ser subsanado con una aplicacin en cascada de erosin y dilatacin con igual
elemento estructurante. A esta operacin se la llama opening.
G $ H = (GH ) H

( 4.59 )

El opening elimina todos los objetos que no estn completamente contenidos en el


elemento estructurante, pero adems no disminuye el tamao a los objetos que superen la
erosin. Esta operacin puede ser ideal para la eliminacin de falsas alarmas. Ntese que
las fronteras de los objetos tambin sern suavizadas.
Por el contrario, la dilatacin opera agrandando los objetos, cerrando los agujeros y
las grietas. El ensanchamiento de los objetos puede ser reducido mediante la aplicacin
seguida de una erosin. La operacin combinada de dilatacin y erosin es llamada
closing:

DISAM-UPMT-98-015

109

Inspeccin automatizada de superficies homogneas mediante Visin artificial

G H = (G H )H

Carlos Platero

( 4.60 )

El cambio de reas de los objetos puede ser resumido por las siguientes relaciones,
considerando que H contenga el origen:
( 4.61 )

GH G $ H G G H G H
Opening y closing son operaciones idempotentes
G H = (G H ) H
G $ H = (G $ H ) $ H

( 4.62 )

esto es, la aplicacin de una segunda vez de un closing o un opening con igual
elemento estructurante no muestra cambios de una a otra.
4.2.4.1.3

Operadores hit-miss

La idea de estos operadores es si es posible detectar objetos de una forma


determinada. La erosin slo elimina aquellos objetos que no contengan al menos el
elemento estructurante, por lo que la deteccin de una forma especfica requiere una
combinacin de ms operaciones morfolgicas.
Por ejemplo, si se desea encontrar un objeto que tenga la forma
H1 = [111]

( 4.63 )

en la imagen G, al aplicar una erosin utilizando como elemento estructurante H 1,


se eliminan todos los objetos que no contengan completamente la mscara, pero tambin
pasarn objetos de mayor tamao a H1. Se hace necesario aplicar una nueva operacin para
eliminar aquellos objetos que han superado la erosin y son mayores a H1. Analizando el
fondo de la imagen binaria, se observa que si se hace una erosin con una mscara H2 de
tamao 3 x 5, justo la contraria de H1, esto es:
11111
H 2 = 10001
11111

( 4.64 )

al erosionar el fondo con H2 aparecern objetos del fondo con la forma de H2,
correspondiendo con formas de igual tamao a H1 o menores. Luego, la interseccin de la
primera erosin con la segunda dar todos los pxeles de objetos constituido por una fila de
tres pxeles consecutivos. En general, los operadores hit-miss se definen como:

110

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

G ( H1 H 2 ) = (GH1 ) (G H 2 ) = (GH1 ) G H 2

( 4.65 )

con la condicin de H1H2 = 0, en caso contrario, el resultado de la operacin


podra dar el conjunto vaco.
sta es una herramienta muy potente tanto para la deteccin de formas, como para
el borrado de objetos con formas determinadas. La versatilidad de stas, pueden ser
fcilmente mostradas utilizando una nueva mscara:
1111111
H 3 = 1000001
1111111

( 4.66 )

La erosin del fondo con esta mscara, G H3, dar como resultado la deteccin de
objetos que contengan horizontalmente de 1 a 5 pxeles consecutivos, en un fondo de 3x7.
Al aplicar el operador hit-miss con H1 y H3, G (H1H3), se tendr como resultado objetos
de 3 a 5 pxeles consecutivos con una fila. Siendo las mascaras del hit y el miss disjuntas,
se desprende que los 1 en el hit, combinados con los 0 del miss, darn los pxeles del
resultado. Obsrvese que aparece un tercer tipo, a lo que se denomina x, los cuales
permitirn un cierto grado de libertad en la forma que se busca. Por ejemplo, en la muestra
utilizada la mscara hit-miss que localiza objetos que contengan de 3 a 5 pxeles
consecutivos en fila ser del estilo
0000000
H = 0 x111x0
0000000

( 4.67 )

Si una mscara hit-miss carece de pxeles de tipo x, extraer las formas de la


mscara. Para el caso de que existan x, los 1 de la mscara darn la forma ms pequea,
y los 1 con x entregarn las formas ms grandes.
Otros ejemplos pueden ser mscaras como HA que encuentran pxeles aislados, o un
detector de borde de esquina inferior derecha como HB

DISAM-UPMT-98-015

111

Inspeccin automatizada de superficies homogneas mediante Visin artificial

000
H A = 010
000

Carlos Platero

x10
H B = 110
000

( 4.68 )

Figura 4.8 a)Imagen sinttica en la que se pretende realzar figuras de tres, cuatro
o cinco pxeles consecutivos horizontales b)erosin con H1, c)erosin con la
imagen negada y H2 d) Resultado de 3 pxeles e) Resultado de 3 a 5 pxeles

112

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

4.2.4.2 Tratamiento con imgenes multinivel


En esta seccin se van a extender las operaciones bsicas de dilatacin, erosin,
opening y closing a imgenes con niveles de grises. Como se hizo para imgenes binarias,
el objetivo es hacer uso de la morfologa en niveles de grises para el realce de una forma,
en este caso de defectos locales dentro de una superficie homognea. Esta tcnica se
presenta, en el contexto de esta tesis, para el procesado de la imagen antes de la
segmentacin, a diferencia de las prcticas binivel utilizadas en fase de postprocesado.
Los operadores morfolgicos actan ahora sobre una imagen digital, esto es, cada
pixel de la imagen posee un valor discreto, cuyo rango se encuentra entre 0 y Q-1, siendo
G la matriz de estos valores y H el elemento estructurante, el cual es una funcin
subimagen.
A diferencia del caso binario ya estudiado, cada punto no representa la pertenencia
o no a un determinado objeto. Los puntos que se suelen agrupar como objetos
diferenciados, pueden presentar valores no homogneos en las caractersticas
diferenciadoras.
4.2.4.2.1

Erosin y dilatacin en niveles de grises

Puesto que la erosin y dilatacin satisfacen ciertos nmeros de identidades


algebraicas, existe un nmero equivalente de formas de definirlas. La erosin en escala de
gris se puede definir como:
g m ,n = min{g m + m ',n + n ' hm ',n ' (m + m' , n + n' ) DG ; (m' , n' ) DH }

( 4.69 )

donde DG y DH son los dominios de G y H respectivamente. Geomtricamente,


para encontrar la erosin de una seal por un elemento estructurante en un punto gm,n, se
desliza el elemento estructurante espacialmente, de forma que el origen se encuentre en el
punto gm,n, y entonces se encuentra la mnima cantidad que se puede obtener. Cuando el
origen se encuentra dentro de la mscara, la seal erosionada se encuentra por debajo de la
seal inicial.
La expresin ( 4.69 ) indica que la erosin se basa en la eleccin del valor mnimo
de gm+m,n+n-hmn, en el entorno de vecindad definido por el elemento estructurante. Las
prestaciones de una erosin en niveles de grises son dos: si todos los elementos de la
mscara son positivos, la imagen resultante tiende a ser ms oscura que la imagen de
entrada, y segundo, los detalles brillantes en la imagen de entrada que sean ms pequeos
que el elemento estructurante sern eliminados.

DISAM-UPMT-98-015

113

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Como en el caso binario, la dilatacin se define de forma dual a la erosin. As se


puede definir como:
g m ,n = max{g m + m ',n + n ' + hm ',n ' (m + m' , n + n' ) DG ; (m' , n' ) DH }

( 4.70 )

Puesto que la dilatacin se basa en elegir el valor mximo de gm+m,n+n+hm,n, en el


entorno de vecindad definido por la forma del elemento estructurante, el efecto general de
realizar la dilatacin sobre una imagen en escala de grises es doble. Si todos los valores del
elemento estructurante son positivos, la imagen de salida tiende a ser ms brillante que la
imagen de entrada, y dos, los detalles oscuros quedan reducidos o incluso eliminados.
4.2.4.2.2

Maximizados y minimizados espaciales

Por elemento estructurante plano se entiende aquel que es constante en todo su


dominio de definicin. Los elementos estructurantes planos han jugado un importante
papel en la morfologa multinivel. La clase de elementos estructurantes planos puede verse
como aquella definida nicamente por sus dominios y adems de valor nulo en los puntos
en los que se encuentra definida, es decir:
hm ,n = 0 (m, n) DH

( 4.71 )

De esta forma cuando se aplica la erosin a una imagen G por la mscara H, se


tiene:
g m ,n = min{g m + m ',n + n ' (m + m' , n + n' ) DG ; (m' , n' ) DH }

( 4.72 )

representando un minimizado espacial de la imagen G sobre la ventana definida por


DH. Por igual razonamiento, la dilatacin se convierte en:
g m ,n = max{g m + m ',n + n ' (m + m' , n + n' ) DG ; (m' , n' ) DH }

( 4.73 )

obteniendo un maximizado espacial de la imagen G, segn la forma y dimensin


del elemento estructurante.
4.2.4.2.3

Opening y closing en escala de grises

Como en el caso binario, ambas operaciones son duales. Anlogamente al mismo,


el opening puede definirse como una erosin seguida por una dilatacin:
G $ H = (GH ) H

( 4.74 )

El closing en escala de grises se puede definir como una dilatacin seguida de un


proceso de erosin:

114

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

G H = (G H )H

( 4.75 )

El opening y closing cumplen las propiedades propias de los filtros morfolgicos,


es decir, presentan traslaciones invariantes. De igual forma, como todo filtro morfolgico
es creciente e idempotente:
G ' G G ' H GH

( 4.76 )

G H = (G H ) H
G $ H = (G $ H ) $ H

( 4.77 )

Adems, aparte de las propiedades lgicas como filtro, el opening es un filtro


aniextensivo y el closing resulta ser un filtro extensivo
GH G $ H G G H G H
4.2.4.2.4

( 4.78 )

Transformaciones Top-Hat

Como ya se vio en 4.2.4.1.3, la interseccin de dos imgenes binarias con mscaras


hit-miss producan la bsqueda de formas determinadas. En escala de grises, este actuar
puede ser utilizado para el realce de grupos de pxeles homogneos y contiguos.
Obviamente, la interseccin no es posible entre imgenes multinivel, por lo que la tcnica
de procesado morfolgico vara, pasando de la interseccin a la substraccin. Aparece un
nuevo operador llamado top-hat y definido como:
HAT (GH ) = G (G $ H )

( 4.79 )

Al ser el opening un operador antiextensivo, el resultado de esta operacin estar


por debajo de la imagen original, as que la transformacin top-hat dar siempre valores
mayores o iguales a cero.
Para el realce de valles se usar un operador dual al definido en ( 4.79 ):
HAT (GH ) = (G H ) G

DISAM-UPMT-98-015

( 4.80 )

115

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Consecuentemente, si se elige una mscara mayor que los valles, stos sern
eliminados en closing y realzados en la sustraccin. Para detectar conjuntamente picos y
valles, se puede en primer lugar realizar transformacin top-hat y localizar el umbral para
los puntos brillantes. Y en segundo lugar, lo mismo pero esta vez aplicando el operador
dual top-hat. Otro proceder, es aplicar en paralelo un opening y un closing, para seguir con
una sustraccin de lo obtenido, (GH)-(G $ H).
El operador HAT es ilustrado en la figura 4.9, en la que se aplica una mscara H
mayor que el valle del defecto. Obsrvese como stos son eliminados y al sustraerse
aparecen realzados.

Figura 4.9 a)Imagen con defecto local de tipo 'pitch' b)Erosin de


la imagen c)-HAT umbralizado

116

DISAM-UPMT-98-015

Carlos Platero

4.3

Captulo 4: Deteccin visual de defectos locales

Etapa de decisin: segmentacin


La decisin es la etapa segunda del modelo de deteccin, presentado anteriormente
en la introduccin y reflejado en la figura 4.4. Su objetivo es clasificar los pxeles de las
imgenes capturadas en defectuosos o no. Es una transformacin no lineal e irreversible,
eliminando la mayora de la informacin adquirida. Esta etapa es crucial dentro del sistema
de inspeccin, al implicar la seleccin de informacin que ser procesada en etapas
posteriores.
En el diseo de la etapa de decisin pueden considerarse dos fases, la seleccin de
la estrategia de decisin y la seleccin del modo de implementacin. La primera tiene
como objeto la determinacin de los parmetros a utilizar, mientras la segunda fase trata de
poner en prctica la estrategia de decisin en niveles de grises del umbral.
Por tanto, el proceso de anlisis que se plantea a continuacin, trata de establecer la
estrategia de decisin para pasar a continuacin a su implementacin. Pero para poder
entrar en tal planteamiento, se hace necesario presentar la modelizacin del problema, a
partir de las funciones de densidad de las imgenes de escenarios SIVA.

4.3.1

Modelizacin del problema mediante las funciones de densidad


Tal como se ha comentado, la decisin es la etapa en que se separa la informacin
til de la intil, es decir, distingue entre lo llamado mensaje, seal o defecto
(correspondiente a los datos que representan virtualmente al material defectuoso), y lo que
se denomina ruido o fondo (representante de material no defectuoso). Puede haber
diferentes niveles de decisin, y cada nivel tendr como objeto incrementar la relacin
seal - ruido, rechazando una porcin de la componente ruidosa, adems de mantener, en
todo lo que se pueda, la componente de mensaje. El rechazo de ruido implica la prdida de
informacin, pero sta tambin puede llevar consigo la eliminacin de componente
mensaje. Este modo de operar produce dos tipos de errores: el primero es eliminar datos
que perteneciendo a la seal defectuosa han sido cancelados, por lo que en fases
posteriores de anlisis de la seal no sern considerados. ste es el tipo de error ms grave.
El segundo es considerar parte de la informacin del fondo como parte constitutiva del
mensaje de defectos. No obstante, ste puede ser subsanado mediante etapas de post
procesado, que sern analizadas en el siguiente apartado.
El estudio sobre la problemtica de la decisin, se aborda pues desde la
modelizacin de la seal adquirida a travs de sus funciones de densidad. Sea una imagen
G procesada para el realce de los defectos con Q niveles de grises, de 0 a Q-1 niveles, se
definir p(q) como la probabilidad de que un pixel cualquiera tenga el nivel q de gris,
gm,n=q. Por tanto esta funcin de densidad discreta cumplir con los requisitos de:

DISAM-UPMT-98-015

117

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Q 1

p(q) = 1
q=0

p(q) 0

( 4.81 )

Atendiendo a las definiciones dadas, es posible calcular las funciones de densidad


en niveles de grises del fondo y del defecto, al que se llamarn respectivamente p(q|F) y
p(q|D). stas expresarn las probabilidades de que un pixel del fondo o del defecto tenga el
nivel gris q. Los histogramas de las respectivas seales correspondern con las funciones
de densidad muestreales, exceptuando el nivel de escala.

p(q|D),p (q|F)

Cuando la decisin es tomada


por la eleccin de un umbral, u, tal que
si el nivel de gris del pixel es menor o
igual a u, ste ser etiquetado como
u
p(q|D)
p(q|F)
defectuoso, en caso contrario se
considerar como pixel del fondo. Este
mtodo determinar defectos que tengan
tonalidad ms oscura que el fondo. De
igual forma, se podra definir un umbral
u para separar pxeles del fondo de
p
p
defectos de apariencia ms clara. En
este caso, aquellos pxeles cuyos niveles
Niveles de grises (q)
de grises superan a u sern clasificados
como
defectuosos,
el
resto
correspondern al fondo. Pero en lo que
Figura 4.10 Funciones de densidad de fondo y
defecto
sigue y sin prdida de generalidad, se va
a estudiar los efectos de aplicar un
nico umbral, por ejemplo u. Las conclusiones que se saquen seguirn siendo vlidas en la
aplicacin de u, slo habr de considerar que en este caso la funcin de densidad de
defecto se encuentra situada a la derecha respecto a la del fondo.
FA

SD

Al utilizar un umbral u sobre una imagen muestreada, la etapa de decisin


clasificar los pxeles en defectuosos o no. Para poder modelizar la respuesta de esta etapa
habr que utilizar las funciones de densidad tanto del fondo como del defecto, p(q|F) y
p(q|D). Por tanto, los resultados de la etapa de decisin en trminos probabilsticos sern:
u

p DD = p (q | D), p SD =
q =0

p FD =

118

Q 1

p(q | F ),

q =u +1

Q 1

p(q | D)

q = u +1
u

p FA = p (q | F )
q =0

( 4.82 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

pDD y pFD indicarn las probabilidades de pxeles clasificados correctamente,


mientras pSD y pFA muestran las probabilidades de pxeles de defectos no detectados y de
falsas alarmas. Obsrvese que stas son probabilidades acumulativas, coincidiendo con el
concepto de funcin de distribucin. La tabla 4.1 muestra un resumen de lo expuesto:

Tabla 4.1 Resultados de la etapa de decisin


Muestra

Decisin

Probabilidad

Defecto

Defecto

Defecto detectado, pDD

Defecto

Fondo

Sin detectar, pSD

Fondo

Fondo

Fondo detectado, pFD

Fondo

Defecto

Falsas alarmas, pFA

El umbral u se posicionar tal que separe la componente del fondo respecto del
defecto. Idealmente, las componentes de ruido y seal deberan estar lo suficientemente
alejadas, como para que tanto las probabilidades de las falsas alarmas como de defectos sin
detectar sean cero, pero esto no suele suceder. Lo ms comn, es que ambas componentes
se solapen, tal como mostraba la figura 4.10, provocando que la colocacin de u sea un
compromiso entre pFA y pSD. La seleccin ms apropiada del umbral u es lo que se llama la
estrategia de decisin.
4.3.2

Estrategias de decisin
El objetivo ltimo de la etapa de decisin consiste en maximizar la probabilidad de
deteccin, pDD, minimizando la probabilidad de falsas alarmas, pFA. Obsrvese que
representan objetivos contrapuestos, as un aumento de pDD puede originar un incremento
fuerte de falsas alarmas, o una disminucin de falsas alarmas puede llevar a una mala
deteccin de defectos. Obviamente el grado de compromiso depender del lugar que ocupe
el umbral. En el caso de conocer el coste de falsas alarmas, c FA, y el de defecto sin detectar,
cSD, es posible establecer una funcin de coste del tipo:
l (u ) = c FA (u ) p FA (u ) p ( F ) + c SD (u ) p SD (u ) p ( D)

( 4.83 )

donde el mnimo de l(u), dar el valor de u ptimo. Pero este planteamiento parte
de que se conoce tanto las funciones de densidad, como las de coste. Cuando esta
informacin no est disponible, hay varias alternativas, de las que algunas son descritas en
[Norton82][Brads94]. stas, en general, se basan en el conocimiento de al menos la
funcin de densidad de fondo, siendo las ms comunes el observador de Neyman
Pearson, o el observador inverso de Neyman Pearson.

DISAM-UPMT-98-015

119

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

4.3.2.1 Las estrategias de Neyman-Pearson


Este mtodo plantea la posicin del umbral u a partir de mantener un nivel
aceptable de falsas alarmas. Es el ms simple de implementar y no requiere conocimientos
de las caractersticas de mensaje. El nombre se deriva del test de Neyman - Pearson,
utilizado para la determinacin de validez de una hiptesis estadstica.
La eleccin del umbral u vendr dado por el ndice de falsas alarmas que deber
estar por debajo de un cierto nivel k
p FA (u ) < k

( 4.84 )

La principal ventaja de esta estrategia es la poca informacin a priori que debe ser
requerida. No se precisa de la funcin de densidad del defecto y opcionalmente la del
fondo. En general, resulta difcil obtener en lnea las caractersticas de los datos de partes
defectuosas, mientras resulta relativamente fcil obtener informacin del fondo. Si la
funcin de densidad del fondo es conocida, el umbral puede ser calculado para un valor
dado de pFA. Incluso si no es conocida p(q|F), es posible determinar u ajustando
manualmente hasta alcanzar un nivel aceptable de falsas alarmas.
Pero este proceder tiene dos grandes inconvenientes, el primero que no se conoce el
nivel de acierto de los defectos y, segundo, una variacin sobre el umbral no predice el
mejoramiento o empeoramiento de la deteccin. Por ejemplo, podra suceder que al mover
el umbral u, en el sentido de aumentar el nivel de falsas alarmas, se produjese un
incremento espectacular de deteccin del defecto, mientras el valor de pFA se ha aumentado
levemente. Por lo que no es posible establecer un nivel ptimo de umbral.
La estrategia inversa de Neyman-Pearson, consiste en ajustar el umbral mediante la
imposicin de un nivel de probabilidad de deteccin de defectos superior a un cierto valor
de k, esto es:
p DD (u ) > k

( 4.85 )

Esta estrategia es especialmente apta para aquellas aplicaciones donde todos los
mensajes deben ser detectados. Las consecuencias pueden ser que los niveles de falsas
alarmas sean inaceptables. Pero como ya se dijo tanto en la introduccin del captulo como
al inicio de este apartado, es posible aplicar una tercera etapa de post procesado,
reduciendo el nivel de falsas alarmas. Para los propsitos de deteccin, esta estrategia es
superior a la anterior y por doble motivo. Es posible determinar tericamente los niveles de
pDD, pSD, pFD y pFA, y adems es posible poder evaluar los efectos de la modificacin de u.
El principal inconveniente est en que se necesita el conocimiento a priori de las seales de
los defectos.

120

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

4.3.2.2 Funciones de densidad del fondo y de los defectos


El anterior apartado ha mostrado cmo la eleccin ptima del umbral depende del
conocimiento de las funciones de densidad del fondo y del defecto, por lo que se plantea a
continuacin un estudio de las caractersticas de estas seales. Primero se expone las
propiedades de las seales del fondo y luego las derivadas de la forma de los defectos.
4.3.2.2.1

Caractersticas de la seal de fondo

Al captar una imagen sin defecto del escenario SIVA, muestra un conjunto de
propiedades que van a ser estudiadas. Antes de entrar en el anlisis, se parte de tres
supuestos matemticos referidos al modelo espacio-temporal de la distribucin de la
intensidad lumnica:
1. La seal es estacionaria, esto es, el valor medio de la seal se mantiene
constante en el tiempo. Implica que la iluminacin y los sensores de captacin
mantienen sus caractersticas a lo largo del tiempo, si bien en la prctica no es
del todo cierto (vase el estudio sobre formacin de imgenes en SIVA)
2. La seal sigue un modelo probabilstico, como consecuencia del proceso de
obtencin del material a inspeccionar. sta seguir una determinada ley al ser
un proceso estocstico.
3. La seal muestra una textura repetitiva, es decir, un patrn espacial que se
repite, habiendo correlacin espacial entre las lneas adquiridas.
A partir de estas suposiciones, la seal del fondo tiene tres elementos distinguibles:
1. Una lenta modulacin. Su origen viene dada tanto por los efectos de la
iluminacin como por las lentes. Recurdese que la intensidad luminosa
disminuye de forma cuadrtica entre la superficie y el foco. Los valores medios
de los pxeles en el centro sern mayores que en los bordes. De la misma
manera, la transmitancia en el corazn de la lente es distinta que en las partes
perifricas. Estos efectos son estacionarios y probabilisticos, pudiendo ser
modelizados segn se vio en el captulo 3 de formacin de imgenes.

DISAM-UPMT-98-015

121

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Figura 4.11 Suave modulacin

2. Las variaciones entre lneas pares e impares generadas por las propias cmaras
entrelazadas, o la discontinuidad entre pxeles adyacentes provocadas por zonas
no sensibles, provoca una seal discontinua.

Figura 4.12 Variacin pixel a pixel

3. Existe variacin aleatoria de la seal debida a la rugosidad de la superficie a


inspeccionar. Segn se vio en la formacin de imgenes, los modelos de
superficies homogneas empleadas utilizaban funciones probabilsticas.
Un anlisis del histograma de niveles de grises de imgenes que cumplan con estos
requisitos, desprender que su funcin de densidad sigue una distribucin normal. La

122

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

consecuencia era de esperar, al aplicar el teorema central del lmite, que dice lo siguiente:
una variable aleatoria sigue una distribucin gaussiana, cuando sta viene originada por la
suma de un nmero creciente de variables aleatorias independientes, que actan
conjuntamente formando la seal de medida. Este efecto suele ser comn cuando se
efectan medidas, en las que intervienen diversos factores en su obtencin. Tambin indica
esta conclusin que la informacin adquirida emana de tres fuentes.
1. El proceso de fabricacin del material. Aunque ste es de carcter estocstico,
no implica una respuesta preestablecida sino que introduce desviaciones
aleatorias dentro de la seal.
2. Causas aleatorias como consecuencia de la reflexin de la luz en la textura del
material.
3. Las caractersticas del sensor y de la electrnica asociada.
Los efectos combinados de estas tres fuentes generan que los histogramas de las
imgenes adquiridas sigan una distribucin normal. La figura 4.13 muestra una imagen
correspondiente a la adquisicin de pasta de papel, donde tambin se presenta el
histogramas de la imagen, observando que sigue una distribucin normal.

Figura 4.13 Imagen de pasta de papel sin procesar e histograma

La modelizacin de la seal carente de defecto mediante una distribucin normal,


implica el exacto conocimiento de sta desde el punto de vista de la distribucin de niveles
de grises en las imgenes adquiridas.
4.3.2.2.2

Caractersticas de la seal de los defectos

Las diferentes formas de defectos generarn un catlogo de funciones de densidad,


por lo que no parece que pueda expresarse en trminos generales. Por ejemplo, puede

DISAM-UPMT-98-015

123

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

haber faltas que contengan pxeles de tonalidad oscura y otros de tonalidad clara. Las
peculiaridades de cada defecto marcarn distintas funciones de densidad.
No obstante en algunas aplicaciones, los defectos locales se caracterizan por puntos
de medio y alto contraste respecto a la textura de la materia, entre el 20% al 60% de nivel
de contraste [Feng93]. En general sus apariencias, tienden a aproximarse a elipses o a
manchas oscuras y menos frecuente es la aparicin de burbujas brillantes. En la
experiencia obtenida en el desarrollo de esta tesis coincide con la afirmacin de Feng. As
en el caso de fallos en la pasta de papel, en el 96% de los defectos sus apariencias son de
puntos oscuros prximos a forma circular. Y en el aluminio colado, las inclusiones de gas
originan puntos brillantes mientras el grafito provoca faltas en forma de motas y manchas
de tonalidad oscura.
Si se considera que para la deteccin de un defecto local es necesario que exista al
menos un pixel de alto contraste (full contrast), se est definiendo una nueva estrategia de
decisin. La idea de Feng es que la deteccin de los defectos, es un problema de encontrar
donde estn los pxeles de alto contraste.
En la figura 4.14 se aprecia como el
defecto est constituido por pxeles de alto y
medio contraste. Luego, si se detecta los pxeles
de alto contraste y posteriormente se aplica
operaciones morfolgicas y de vecindad (ver
prrafos 4.4.2), es posible reconstruir el defecto
total o parcialmente.

Pixeles de medio contraste

Pixeles de alto contraste

Figura 4.14 Pxeles de alto y medio


contraste

4.3.3

Implementacin de la decisin: Segmentacin de imgenes


La segmentacin representa la manera de implementacin de la estrategia de
decisin. Segmentar una imagen digital, significa dividirla en zonas disjuntas e
individualizadas. En cierta manera, equivale a su reconocimiento, pues como consecuencia
de la segmentacin, los diferentes objetos que se encuentran perfectamente ubicados dentro
de la imagen son detectados. Asociado a la idea de segmentacin est el concepto de
umbral, que queda definido de la forma:
u = u (m, n, g m ,n , pm ,n )

124

( 4.86 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

donde gm,n es la intensidad del punto situado en las coordenadas m,n, y pm,n
representa alguna propiedad local mediada en un entorno de vecindad de este punto. La
imagen que se obtiene al llevar a cabo un procesamiento de umbral se define como:
1
g m ,n =
0

g m ,n u
g m ,n > u

( 4.87 )

de forma que los pxeles etiquetados con 0 se corresponde con el fondo, mientras
que los 1 se corresponden con los defectos. En la ecuacin ( 4.87 ) se supone que la
intensidad del defecto es menor que la intensidad del fondo. Cuando en ( 4.86 ), u depende
slo de gm,n, el umbral se llama global. Pero si u depende tanto de gm,n como de pm,n, el
umbral se denomina local, y cuando adems depende de las coordenadas espaciales, x e y,
se llama umbral dinmico.
Los umbrales globales tienen aplicacin en situaciones donde existe una clara
definicin entre los objetos y el entorno, y cuando la iluminacin es relativamente
uniforme. Los sistemas de iluminacin de luz posterior y las tcnicas de iluminacin por
franjas pueden dar como resultados imgenes que pueden ser segmentadas mediante el uso
de umbrales globales. A menudo, una iluminacin arbitraria del espacio da lugar a
imgenes que, si se trabaja con umbrales, requieren de algn tipo de anlisis local para
compensar efectos, como las no uniformidades de iluminacin, sombras y
reflejos[Marav93]. Por eso, se ha puesto tanto nfasis en el diseo de los sistemas de
iluminacin, ya que un buen diseo en esta etapa ahorrar mucho esfuerzo computacional.
Ha habido un gran esfuerzo por parte de la comunidad cientfica, en cmo
segmentar imgenes mediante umbrales en niveles de grises. El resultado es una gran
variedad de algoritmos, un resumen de stos se puede encontrar en [Sahoo88][Glasb93].
Sin embargo, muchas de las tcnicas presentadas, parten de la suposicin de que al menos
hay un objeto de inters. Esta hiptesis de trabajo no es admisible para la deteccin de
defectos, pues en una imagen capturado puede no haber defectos. El planteamiento de
tcnicas de umbral para la deteccin de defectos se esboza a continuacin.
4.3.4

Umbralizacin para la deteccin de defectos


La umbralizacin para la deteccin de los defectos no puede asumir la existencia de
al menos un defecto en la imagen adquirida. Esta hiptesis de trabajo es, sin embargo, una
gran diferencia con los puntos de partida de muchos algoritmos de segmentacin. En
general, se suele asumir lo contrario, esto es, que la mayora de las imgenes
inspeccionadas carecen de defectos y el umbral es esencialmente utilizado para eliminar la
informacin redundante del fondo.
Para abordar el diseo del umbral ptimo se recurre a las propiedades de las seales
del fondo y de mensaje. De un lado se est suponiendo que al llegar a esta etapa, la funcin
de densidad de la seal ruidosa tiene una tendencia a seguir una distribucin gaussiana. Por
lo tanto, los parmetros de estas funciones vienen determinadas por sus medias y

DISAM-UPMT-98-015

125

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

varianzas, y . El nivel de falsas alarmas puede ser determinado desde el punto de vista
terico, y como es conocido, la pFA depender de la distancia del umbral, u, respecto a la
intensidad media de la imagen, pudindose medir mediante k veces la varianza. As, un
umbral separado tres veces la varianza respecto a la media, 3 , dar una probabilidad
de falsas alarmas de menos de un 1%. Este conocimiento a priori puede ser empleado en la
construccin de la etapa de segmentacin.
Otra fuente a utilizar viene de la bsqueda de pxeles de alto contraste, el umbral
ser determinado tal que slo detecte los pxeles de mayor contraste. Esta premisa
permitir disminuir la pFA al poder desplazar u a posiciones ms alejadas respecto a la
media. Pero esta actuacin, requerir de una nueva etapa que tenga como objetivo la
reconstruccin del defecto a partir de las pxeles de alto contraste.
Llegado a este punto, la localizacin del umbral pasa por un lado por la validez de
las suposiciones hechas, y en el caso de cumplir se pueden presentar dos tipos de umbral,
que atendiendo a la clasificacin anteriormente dada, puede ser de tipo global o de tipo
local. Si no cumple las hiptesis iniciales de trabajo habr de recurrir a otras tcnicas que
debern ser exploradas. Por tanto, el mtodo tratar en primer lugar de validar las hiptesis
de trabajo, en el caso de cumplir se presentan dos tipo de algoritmos de umbralizacin.
Mientras habr de recurrir al estado de la tcnica para tratar otros mtodos, por ejemplo el
presentado por Macaire [Macai93].
4.3.4.1 Validez de las conjeturas de normalidad en la seal del fondo
Si bien la tendencia, segn se ha visto, es tener imgenes adquiridas en escenas
SIVA caracterizadas por distribuirse la intensidad del pixel de forma normal, tambin hay
que incidir sobre la posibilidad de haberlas tratada anteriormente en la etapa de realce. Para
una transformacin de tipo lineal, la nueva funcin de densidad tambin ser normal, eso
s, se habrn modificado los parmetros de la normalidad segn el tipo de mscara
utilizada. Obviamente, esta afirmacin no es vlida si el realce no se basa en filtros
lineales. Aun en el caso de realces basados en transformaciones lineales, no hay que
olvidar que la variable de intensidad es discreta y por tanto finita, pudiendo provocar
efectos de saturacin tanto porque de resultados de la convolucin sean menores que cero o
superiores al mayor valor de discretizacin.
La validez de la conjetura de normalidad en la distribucin de la seal del fondo,
puede refrendarse de dos formas: una mediante algn test de normalidad y otra a travs de
las propiedades que se derivan de una distribucin normal.
Para la primera y aunque existen diferentes posibilidades de abordar este estudio,
no todos los contrastes de normalidad se pueden aplicar a este caso en concreto. El mtodo
de Shapiro y Wilks no se puede utilizar dado que tan slo se puede aplicar a muestras de
pocos datos, tampoco es aplicable el criterio de Kolgomorov-Smirnov dado que su uso est
restringido a funciones continuas.

126

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

El contraste elegido, dada su sencillez y fcil aplicacin, es el de Jarque y


Vera[Gallar97]. Este mtodo basa todo su desarrollo en el hecho de que toda distribucin
normal es simtrica y su coeficiente de apuntamiento vale tres. Lo primero es medir la
simetra con el coeficiente de asimetra, el cual proviene de dividir el momento de orden
tres respecto a la media entre la desviacin tpica al cubo:
Q 1

CA =

m
=
3

( p (q)(q ))

q=0

( 4.88 )

donde p(q) corresponde con la funcin de densidad de niveles de grises. En cuanto


al coeficiente de apuntamiento o curtosis, se calcula su valor con el momento de orden
cuatro respecto a la media dividido entre la desviacin tpica a la cuarta:
Q 1

CA p =

m
=
4

( p (q)(q ))

q =0

( 4.89 )

Jarque y Vera demuestran que bajo condiciones de normalidad, la expresin:


2
CA2 CAp
J=
+
6
24

( 4.90 )

sigue una distribucin 2 con dos grados de libertad. Por lo tanto, se puede calcular
el ndice de confianza de la hiptesis de normalidad.
La segunda forma es a travs de sus propiedades. Si la distribucin es normal
deber cumplir con los siguientes requisitos:
1. El nivel de falsas alarmas puede ser determinado a travs de la media y la
varianza del histograma de la imagen:

pFA (u ) = p (q | F )
q =0

DISAM-UPMT-98-015

1
2

(q )2
2 2

dq

( 4.91 )

127

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

La aproximacin se hace al convertir a q de discreta a continua. Por tanto


deber coincidir el valor terico dado por ( 4.91 ) y el obtenido al aplicar un
umbral u sobre las imgenes capturadas.
2. El nivel de falsas alarmas debe ser igual para u y u, si se hace una
umbralizacin del tipo: k . En otras palabras, la distribucin al ser
simtrica, las probabilidades de falsas alarmas de tonalidad oscura y clara deben
ser iguales. Este efecto puede ser estudiado mediante una doble umbralizacin
u, y u, observndose que las apariciones son del mismo orden de magnitud,
para un valor de k determinado.
3. Las falsas alarmas debern repartirse uniformemente por toda la imagen. En
caso contrario significara una prdida de uniformidad de iluminacin en la
escena. Para su verificacin se emplean los conceptos de centros de gravedad de
la imagen binarizada.
4.3.4.2 Umbrales para fondos con distribucin normal
En el caso de superar el contraste de hiptesis, se podra pensar en dos tipo de
algoritmos de umbralizacin. Uno de carcter global, vlido cuando se tenga un sistema de
formacin de imgenes uniforme, y otro de corte local, utilizado en escenas con subregiones uniformes y que stas cumplan con una distribucin en niveles de grises
gaussiana.
4.3.4.2.1

Umbral global

El umbral global es aplicado sobre toda la imagen, y sus parmetros sern la media
y la varianza muestral de la imagen, junto una constate k, que determine la separacin del
umbral respecto a tanta veces de la varianza, quedando expresado como:
u = k

( 4.92 )

Este mtodo es muy sencillo de implementar y de bajo costo computacional. Sin


embargo, la presencia de una falta de iluminacin uniforme afectar negativamente a este
tipo de umbral. Suele ser corriente, por el tipo de iluminacin, mantener una luminosidad
uniforme en un conjunto de lneas contiguas. Luego, se puede sugerir utilizar una divisin
de la imagen en regiones disjuntas, que en su totalidad dan la imagen original, con la
ventaja de haber formado subimgenes que cumplan las caractersticas de normalidad. Esto
conllevar la necesidad de utilizar un umbral local.
4.3.4.2.2

128

Umbral local

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

El problema anteriormente mencionado puede ser resuelto mediante un umbral


local. Si en la imagen puede observarse una respuesta uniforme en regiones de sta, se
podra aplicar para cada una de las regiones un umbral distinto, del tipo:
u i = i k i i

( 4.93 )

donde el ndice i denota la i regin de la imagen. Este modo de actuar eliminar el


efecto de lenta modulacin que caracteriza ciertos escenarios SIVA. Ahora el umbral ya no
es un escalar, sino un vector.
4.3.4.2.3

El valor de k

Tanto en el umbral global como local necesitan conocer, a parte de la media y


varianza, el valor de k. La validacin de contraste de normalidad ms la tcnica de
umbraliazcin, permitir utilizar una estrategia de observador de Neyman-Pearson. El
valor de k vendr dado por el nivel de falsas alarmas mximo permitido (ver 4.3.2.1). No
obstante, como ya fue comentado, este planteamiento tiene inconvenientes, como no saber
cul es el nivel de acierto en la deteccin. La alternativa pasa por tener ms conocimiento,
en este caso hay que explotar las caractersticas sobre la seal de mensaje.
Al utilizar el concepto de deteccin de pxeles de alto contraste, es posible definir
cul es la funcin de distribucin, no del defecto sino de los pxeles de altos contrastes. Al
basar la deteccin en la localizacin de stos, no se plantea una funcin de coste respecto a
la funcin de densidad del defecto, sino a como se distribuyen los niveles de grises de estas
semillas. El planteamiento pasar a ser similar a lo expuesto en ( 4.83 ). Pero ahora se
utilizar la probabilidad de deteccin de pxeles de alto contraste, definida como:
u

p AC (u ) = p(q | AC )
q=0

( 4.94 )

siendo p(q|AC) la funcin de densidad del los pxeles de alto contraste. El valor
ptimo de umbral va a depender del coste de falsas alarmas, cFA, y el de no detectar los
pxeles de alto contraste, cAC, pudiendo establecer una funcin de coste del tipo:
l (u ) = c FA (u ) p FA (u ) p ( F ) + c AC (u )(1 p AC (u )) p ( D)

( 4.95 )

Los valores de cFA y de cAC dependen de la aplicacin en particular y de los


criterios de calibracin del sistema global.
Recurdese que slo hasta ahora se han detectado las semillas de los defectos, pero
faltar una nueva etapa que sirva tanto para la reconstruccin definitiva o parcial del
defecto y la eliminacin de las falsas alarmas.

DISAM-UPMT-98-015

129

Inspeccin automatizada de superficies homogneas mediante Visin artificial

4.4

Carlos Platero

Agrupacin de pxeles binarizados


Las prestaciones del sistema de deteccin pueden ser mejoradas mediante la adicin
de una tercera etapa, llamada agrupacin de pxeles defectuosos. sta fue referenciada
como el tercer bloque del modelo de deteccin, a la que tambin se la suele llamar etapa de
postprocesado. El objetivo de esta nueva fase es doble, de un lado eliminar falsas alarmas,
evitando cancelar la seal de mensaje y de otro, reconstruir el defecto a partir de los
pxeles de alto contraste.
El fundamento de esta etapa se basa en las caractersticas espaciales de la seal una
vez umbralizada y en el procesamiento morfolgico en imgenes binivel. Llegado a este
punto, la informacin que se tiene es una imagen binarizada, por lo que se trata ahora de
disear los filtros binarios tal que eliminen las falsas alarmas y mantengan las seales que
provienen del defecto. En definitiva, disminuir la probabilidad de falsas alarmas de la etapa
de decisin, sin distorsionar la informacin del defecto, discutida en el anterior punto. Los
filtros binarios son probablemente una de las formas ms comunes de aplicacin del
procesamiento morfolgico. Aunque la Morfologa es el estudio de formas y est
ampliamente desarrollado desde el punto de vista matemtico, en la prctica de SIVA slo
se suele emplear una pequea parte, consistente en la secuencia de operaciones de
erosiones y dilataciones sobre imgenes. Serrano [Serran95], Silva [Silva92], Ohta
[Ohta86] y Takatoo [Takat88] han utilizado procesamiento morfolgico para la deteccin
de defectos, aunque stos no han dado detalles sobre el mtodo empleado, el tipo de
elemento estructurante utilizado o las prestaciones de sus operaciones efectuadas.
El plan a seguir va estar formado por cmo eliminar falsas alarmas y cmo
reconstruir el defecto a partir de las semillas de pxeles de alto contraste. Ambas
operaciones van a basarse en operaciones de morfologa.

4.4.1

Eliminacin de falsas alarmas


En general, los pxeles de falsas alarmas pueden ser diferenciados de los de alto
contraste, despus de la umbralizacin, por su distribucin espacial. En el caso de los
pxeles de alto contraste al pasar el umbral formarn un grupo de pxeles contiguos,
mientras las falsas alarmas se encuentran dispersas espacialmente en la imagen binarizada.
Esta premisa bsica fue explotada por Abbasszadeh [Abbas93] para el desarrollo de su
algoritmo STAD. Si la variable del fondo es aleatoria y no muestra correlacin espacial
entre pxeles adyacentes, derivar que las falsas alarmas se distribuyan azarosamente en el
espacio de la imagen segmentada. En cambio, por la constitucin del defecto habr varios
pxeles de alto contrates adyacentes entre s, formado un grupo o cluster de pxeles en el
espacio transformado por la umbralizacin.
Esta propiedad puede ser detectada por las tcnicas de procesamiento morfolgico.
As, un erosionado de la imagen binaria eliminar pxeles aislados, dejando slo aquellos
que formen grupos. Si despus se dilata la imagen obtenida, el resultado ser una imagen al

130

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

que se ha borrado los pxeles aislados, esto es, la eliminacin de falsas alarmas precisa de
una operacin opening. El elemento estructurante depender de la forma de los defectos y
de la textura del material a inspeccionar.
4.4.2

Reconstruccin del defecto


La filosofa desarrollada sobre deteccin de defectos se basa en la localizacin de
pxeles de alto contraste, en el fundamento de que los defectos estn constituidos por
pxeles de medio y alto contraste. Una vez que han sido localizados los pxeles de alto
contraste, habr de reconstruir el defecto a partir de estas semillas. Para este objetivo
tambin se servir del procesamiento morfolgico binivel.
Obviamente, por la propia definicin dada de pxeles de medio contraste, stos
sern ms prximos al nivel medio de gris de la imagen que los pxeles de alto contraste. Si
el fondo sigue una distribucin normal, la determinacin de pxeles de medio contraste
estar dada por la expresin:
u MC = k MC

( 4.96 )

Donde kMC ser menor que kAC en trminos absolutos. Este actuar necesita de este
segundo umbral, uMC, capaz de detectar pxeles de medio contraste. Pero al umbralizar no
slo pasarn pxeles del defecto sino adems del fondo, como consecuencia de la
variabilidad de la textura del material. No obstante, la
definicin previa de los pxeles de alto contraste,
Tabla
4.2
Algoritmos
de
permitir distinguir qu parte depende al defecto y qu
reconstruccin de los defectos
otra pertenece al fondo. La reconstruccin del defecto
est basada en las dos imgenes resultantes de la doble
Mtodo 1
umbralizacin, uAC y uMC, junto con la aplicacin de
k=1;
las tcnicas de procesado morfolgico, llamada
Gk=(GACH)GMC
dilatacin condicionada. Dos algoritmos han sido
Do {
diseados con este objetivo. La tabla 4.2 muestra los
Gk+1=(GkH)GMC;
quehaceres de estas reconstrucciones. Sean GAC y GMC
} While(Gk+1-Gk+!= 0)
las imgenes binarias de pxeles de alto y medio
contraste, respectivamente y H el elemento
Mtodo 2
estructurante. El segundo algoritmo es una
Gk=(GACH)GMC
simplificacin del primero. Este primero resulta ms
correcto pero consume ms tiempo que el segundo. Se
basa en la dilatacin de la imagen de pxeles de alto
contraste con la interseccin de pxeles de medio
contraste. Cuando este proceder se vuelve
idempotente, se habr finalizado la reconstruccin del
defecto. El segundo mtodo slo se efecta una sola
vez.

DISAM-UPMT-98-015

131

Inspeccin automatizada de superficies homogneas mediante Visin artificial

4.5

Carlos Platero

Medida de calidad de un procedimiento para la deteccin de


defectos locales
Ante la pregunta cul de los procesados a realizar resulta el ms conveniente para
el realce del defecto?, la respuesta no es inmediata, pues la evaluacin debe ser hecha en
la totalidad del bloque de deteccin y no slo en la etapa de procesado de la imagen. La
medida de separacin entre defecto y fondo no es cuestin exclusiva de la capacidad de
realce, sino tambin del tipo de segmentacin y del post-procesado que vaya a ejecutarse.
Para poder explicar el intrincamiento de los tres bloques, se va a desarrollar un
conjunto de medidas, con el propsito de ir desgranando el problema hasta encontrar una
metodologa que sea capaz de calibrar cul es el mejor procedimiento de deteccin.

4.5.1

Medidas basadas en el error de Bayes


stas se basan en las funciones de densidad de la intensidad de defecto y el fondo.
El fundamento bsico est en el error originado al aplicar un umbral para la clasificacin
de los pxeles entre defectuosos o fondo.
En un primer acercamiento a la medida, y desde el punto de vista intuitivo, se dir
que existe mayor contraste entre defecto y fondo, cuanta mayor separacin exista entre la
funcin de densidad del defecto respecto del fondo. Desde el punto de vista de Bayes, esta
idea puede ser expresada en forma de error de clasificacin. En otras palabras, se est
equiparando el nivel de contraste con el error de clasificacin entre fondo y objeto.
Una definicin ms formal sobre el contraste podra ser, que partiendo de un
defecto con una nica tonalidad, sin prdida de generalidad, y teniendo en cuenta p(q|D) y
p(q|F), el nivel de contraste para un defecto o el error de clasificacin, para un determinado
umbral, u, podr ser definido como:
c(u ) = c1

Q 1

p(q | D) p( D) + c p(q | F ) p ( F )
2

q =u +1

q =0

( 4.97 )

siendo c1 y c2 dos constantes que ponderan el coste de tener rea de defecto sin
detectar y de masa proveniente de falsas alarmas. En el caso de defecto de tonalidad clara,
la expresin ( 4.97 ) slo ser modificada en los intervalos de integracin, quedando
como :
u 1
c (u ) = c1 p (q | D) p ( D) + c 2
q =0

Q 1

p(q | F ) p( F )

q =u +1

( 4.98 )

Cuando el valor de c tienda a ser nulo indicar que el contraste entre el defecto y el
fondo, para el umbral u, tender a ser el acertado. Tal como se ha comentado, es

132

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

observable como de una manera directa, este nivel de contraste depende del tipo de
umbralizacin, al estar vinculado el ndice de contraste con el valor de nivel de gris de
segmentacin, u.
Si las dos distribuciones son normales, la distancia de Bhattacharyya puede ser
empleada como medida de contraste, al ser sta un ndice superior del error de Bayes. Por
tanto, a mayor distancia mayor contraste; expresndose esta medida en funcin de las
medias y las varianzas de las dos funciones de densidad, quedando reflejada en:
F2 + D2

1 ( D F ) 1
2
dc =
+ ln
8 D2 + F2 2 F2 D2

( 4.99 )

donde F y D son las medias de las distribuciones de niveles de grises del fondo y
el defecto, mientras F y D corresponden con las varianzas de stas.
No obstante, esta medida de contraste basada en el error de Bayes, slo considera la
informacin sobre la distribucin de niveles de grises. No hay ninguna referencia sobre la
distribucin espacial del fondo ni la del defecto. La falta de estimacin sobre la
distribucin espacial de los pxeles es un gran handicap para esta medida. As el nivel de
falsas alarmas, si bien es conocido, no hay conocimiento de cmo se reparte en el espacio,
y esta informacin es vital para las etapas de post-procesado. De hecho, la etapa de postprocesado no es considerada en este nivel de medida. En la prctica, se observa que existen
procesados con bajos rendimientos sin etapa de post-procesado, pero aumenta
considerablemente al aplicar una etapa de eliminacin de falsas alarmas. Y viceversa,
realzados de gran contraste en el procesado, tienen mal comportamiento en la eliminacin
de falsas alarmas.
Adems, el concepto utilizado de masa defectuosa no detectada, no es del todo
cierto, pues como ha sido comentado, es posible la reconstruccin de la masa de defecto
con operaciones de post-procesado.
Las carencias de esta medida se evidencian al no considerar las distribuciones
espaciales tanto del defecto como de las falsas alarmas. Esta medida es incompleta y
genera errores. Para paliar estas dificultades se hace propuesta de una nueva metodologa
de medida de la capacidad de deteccin.
4.5.2

Medidas basadas en las funciones de distribucin de los defectos de


pxeles de alto contraste
El carcter incompleto de la medida anterior vena dado por, uno, la falta de
informacin sobre la distribucin espacial, dos, la no utilizacin del concepto de pixel de
alto contraste y tres, el tipo de post-procesado que va a realizarse.

DISAM-UPMT-98-015

133

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Al considerar que para la deteccin de un defecto local es necesario que exista al


menos un pixel de alto contraste capaz de superar el umbral, se est definiendo el proceso
de deteccin en su globalidad. El proceso de deteccin queda definido por una etapa de
realce, a saber, con la mscara ms adecuada, una segmentacin con un determinado
umbral, u, y una eliminacin de falsas alarmas basada en erosiones, cuyo elemento
estructurante es una de las variables del proceso. Todo ello deber de decantar los pxeles
de alto contraste, al que luego seguir una etapa de reconstruccin del defecto.
Las medidas de contrastes, por tanto, se basarn en las funciones de distribucin
obtenidas de pxeles de altos contrastes que quedan despus de haber aplicado el proceso
de realce, segmentacin y de posible erosionado, tanto para el defecto como para el fondo.
Mediante este modo de actuar han quedado definidas, pAC(u) y pFA(u) como las funciones
de distribucin de pxeles de alto contraste del defecto junto al fondo, esto es, la
probabilidad acumulada de tener pixel de alto contraste hasta el nivel u, despus de haber
sido aplicadas las tres etapas.
Bajo este perfil, se han definido las siguientes medidas:
1. Valor de pFA(u1) tal que pAC(u1) sea igual a 1. El valor de u1 ser el menor/mayor
umbral, segn tonalidad, que garantice la deteccin al 100 % de los pxeles de
alto contraste. Esta medida indica el nivel de falsas alarmas cuando se detecta el
100 % de defectos.
2. Valor de pAC(u2) para un valor de u2 tal que la probabilidad de falsas alarmas
sea cero, pFA(u2) = 0. El nivel de umbral de u2 para tonalidades oscuras ser el
valor mayor de ste, tal que un incremento en el nivel de gris u2, convierta a
pFA(u2) distinta de cero. Para el caso de defectos claros, el umbral u2 ser el
menor tal que un decremento en el nivel de gris u2, convierta a pFA(u2) distinta
de cero. Esta medida indicar el nivel de xito de deteccin de los defectos sin
aparicin de falsas alarmas.
3. La mxima discrepancia entre pAC(u) y pFA(u).
Las medidas 1) y 3) tienen el inconveniente de dar sus valores sobre el tanto por
ciento de falsas alarmas semillas. Pero recurdese que al superar el umbral van a ser
utilizadas como pxeles de full-contrast, y por lo tanto alrededor de ellas habr un proceso
de reconstruccin. Por eso, es preferible tener una apreciacin ms conservadora,
correspondiente a 2).
Podra pensarse en vez de utilizar la fase de determinacin de las semillas, hacerlo
sobre la imagen resultado, es decir, al finalizar la etapa de decisin, donde los verdaderos
defectos y las falsas alarmas son etiquetadas. La ventaja de esta medida, es que considera
el proceso de decisin en su globalidad, desde el realce hasta la reconstruccin de las
semillas. Igualmente se proponen las tres medidas anteriores, pero ahora habr de utilizar
la probabilidad de defecto detectado, pDD, y de falsas alarmas reconstruidas, pFA. No
obstante, los resultados pueden ser similares a la anterior medida, esto es, a las magnitudes

134

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

basadas en semillas tanto de pxeles de alto contraste como de falsas alarmas, pues en la
reconstruccin de los defectos sern proporcionales las reas aditivas alrededor de estas
semillas.
Ntese que estas medidas son hechas al no tener conocimiento a priori de los costes
de falsas alarmas, cFA, ni del precio de falta de deteccin del defecto, cDD. Ser el usuario
final el que pueda determinar el valor ptimo a partir de la funcin de coste oportuna.

4.6

Diseo del sistema de deteccin de defectos locales en la


pasta de papel
El mtodo de deteccin de defectos propuesto ha sido implementado en la
localizacin de faltas locales en la pasta de papel. Si bien en el captulo 7 se hablar con
todo detalle del proceso de produccin de pasta de papel y el origen de los defectos locales,
es necesario recordar aqu los conceptos bsicos. En este material hay dos tipos bsicos de
defectos, llamados pitch y shives. Aun habiendo otros, su probabilidad de aparicin es
escasa y no se han considerado, pues no son relevantes en la calidad del papel, y de hecho,
slo los pitch son verdaderamente importantes, tal como se argumentar con posterioridad.
Todos los defectos tratados presentan una tonalidad oscura en luminancia respecto al
fondo. Los defectos se clasifican segn su tamao, habiendo cuatro tipos denominados con
las iniciales A, B, C y P. La tabla 4.3 indica los intervalos utilizados para la clasificacin
basados en los intervalos de reas, adems muestra el % de aparicin de cada tipo y el %
del rea total defectuosa2.

Tabla 4.3 Clasificacin de los defectos en la pasta de papel


Tipo de defecto

rea de las motas(mm2)

Aparicin
(pitch) %

rea
(pitch)%

Aparicin
(shive)%

rea
(shive)%

Menores a 0.04 (no se


encuentran)

Entre 0.04 y 0.1

44%

13%

9%

1%

Entre 0.1 y 0.3

38%

29%

33%

8%

Entre 0.3 y 0.8

15%

35%

30%

22%

Mayores a 0.8

3%

23%

29%

69%

Estos datos emanan del universo entregado a travs de 32 pliegos con ms de 230 defectos

DISAM-UPMT-98-015

135

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Una vez dada esta breve y primera impresin sobre el problema a resolver se
plantean la trayectoria marcada en este captulo para la deteccin de faltas en la pasta de
papel, constituida por cuatro fases:
1. Tipo de realce. Estudiando desde el uso de filtros lineales hasta el empleo de
tcnicas de procesamiento morfolgico.
2. La estrategia de segmentacin. Para este caso y dada la facilidad de obtencin
de muestras, se ha optado por una tctica de observador inverso de NeymanPearson. Por lo que habr de intentar modelar las funciones de densidad tanto
del fondo como de los defectos.
3. Validacin de las hiptesis de normalidad de la seal del fondo. En caso
contrario, buscar otro modelo de funcin de densidad.
4. Y por ltimo, fijar los parmetros del sistema de deteccin mediante las
medidas de calibracin explicadas. Este proceso determinar: Filtro lineal o no
lineal, modelos de mscaras o elementos estructurantes, tipo de umbral,
operaciones de post-procesado y reconstruccin de semillas, dando un nivel de
falsas alarmas y de defectos localizados.
El primer paso consistir en la determinacin de las posibles operaciones lineales o
no que aumenten el realce de los defectos. Las mscaras de convolucin a testear salen de
la bibliografa especializada y del mtodo propuesto mediante correlacin de variable
cualitativas (explicado en 4.2.3). Respecto al procesado morfolgico se exploran las
transformaciones top-hat. En segundo lugar, las estrategias de segmentacin se basan en el
anlisis del histograma, al validarse la normalidad de distribucin en niveles de grises. Por
ltimo, se proceder a la calibracin de los parmetros. En los prrafos siguientes se
desmenuza este proceder sobre la inspeccin en la pasta de papel.
4.6.1

Realce de los defectos locales en la pasta de papel


Como ya se ha dicho, los defectos de la
pasta de papel analizados tienen una apariencia
oscura respecto al fondo. Desde el punto de vista
de las formas, sus tendencias son a ser elpticos. Y
en cuanto a la distribucin de los niveles de grises,
es decreciente de manera convexa, a modo de
agujero. La figura 4.15 ilustra el aspecto tanto
espacial como en niveles de grises de los defectos
en la pasta de papel.
Figura 4.15 Relieve de un defecto
tipo pitch

Este conocimiento a priori permite


determinar algunas propiedades sobre la mscara
de convolucin. El carcter convexo de la forma
del defecto junto el uso de mscaras simtricas, para evitar trasladar el centro de gravedad

136

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

en niveles de grises del defecto, orienta ambas razones a utilizar simetra par en las cuatro
direcciones. En cuanto al tamao de las mscaras, depende tanto del algoritmo como del
nmero de pxeles que representan el defecto. El tipo de algoritmo para la deteccin, se
basa en la localizacin de pxeles de alto contraste. Respecto a la resolucin tomada es
aproximadamente de 0.015 pixel/mm2, y segn la base de datos, los defectos estn en
subimgenes que tienen tamaos desde 3 x 2 hasta ms de 15 x 14, correspondientes a
defectos que van desde el tipo P hasta A. Por tanto, el tamao de la mscara debe ser tal
que al situarse su centro sobre un pixel de alto contraste, los pxeles adyacentes fuesen
otros de alto y medio contraste. La motivacin est en que los coeficientes de la mscara
encuentren correlacin con los defectos. Por las caractersticas morfolgicas deberan ser
de 3 x 3. Mayores tamaos podran desfigurar el realce de los defectos ms pequeos, pues
tomara en la convolucin pxeles del fondo. No obstante, el rea de los defectos mayores
representa casi un 90% del rea total para los pitch y un 99% para los shives, segn se
desprende de la informacin de la tabla 4.3. Por lo que podra considerarse entornos de
vecindad 5 x 5, incluso mayores. Para mscaras de mayor tamao podrn ser obtenidas
como proceso de aplicacin de la propiedad asociativa de la convolucin, esto es, para su
decantacin se pasar aplicar dos o ms etapas de procesado con mscaras 3 x 3 5 x 5.
Concluyendo, por el carcter convexo de los defectos, por la resolucin tomada y por el
algoritmo a emplear, las mscaras a utilizar son del tipo representado por:

cbc
H1 = bab
cbc

ecd
H 2 = bab
dce

fedef
ecbce

H 3 = dbabd

ecbce
fedef

jihkl
fecdg

H 4 = dbabd

gdcef
lkhij

( 4.100 )

Al no haber direcciones privilegiadas en la orientacin de los defectos, los filtros


lineales debern ser isotrpicos. Para observar la tendencia de isotropa se realizar
respuesta en frecuencia de las mscaras, de este proceder quedar reflejado la variacin de
ganancia en cualquier direccin.
La determinacin de los coeficientes de la mscara se hace considerando el grado
de correlacin entre sta y la forma del defecto. Al utilizar el mtodo de correlacin lineal
con variable cualitativa, el problema de localizacin de los coeficientes se convierte en la
determinacin del hiperplano de serparacin entre defecto y fondo. Con tal propsito se
construye la matriz de diseo G*, constituida por vectores asociados al defecto y al fondo.
El tamao del vector de caractersticas viene definido por el tipo de mscara. La utilizacin
de simetra par y defectos de carcter convexo, hace que estos espacios sean de dimensin
3 5 para mscaras de 3 x 3, mientras para mscaras de 5 x 5 sern de 6 u 11, vase
( 4.100 ). Los vectores de los defectos estn constituidos por la informacin de los pxeles
de alto contraste y sus adyacentes, dependiendo del tamao de la mscara. En cambio, los
vectores del fondo sern una poblacin representativa de su funcin de densidad. De otro
lado, G* estar formado por ceros y unos. Cero donde corresponda con un vector del
fondo y uno cuando se le asocie un vector defecto, recurdese la figura 4.7. No obstante,
asignacin de G* contraria, dar el mismo resultado en trminos absolutos pero de signo
contrario. Al desearse justamente que cuando exista defecto, su nivel de gris sea menor,

DISAM-UPMT-98-015

137

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

mientras que con pxeles del fondo se mantenga o aumente, se fija cero en el defecto y uno
en el fondo.
Debido a las caractersticas propias de cada cmara e iluminacin, correspondientes
al sistemas de adquisicin de imgenes del papel, las muestras tomadas requieren de un
proceso de normalizacin. De esta forma, se puede crear una poblacin de defectos y
fondos comparables entre si. La unificacin de las muestras ha sido realizada mediante la
traslacin de las imgenes a igual media para todo el universo. Este proceder se justifica en
la medida de que todas las imgenes capturadas tienen similar varianza pero diferente
media, lo que viene a indicar que la variabilidad de la informacin est definida por la
textura del material y que con slo corregir la intensidad lumnica se hacen comparables
las muestras.
Una vez preparadas las muestras, se pasar a determinar los coeficientes por el
mtodo Logit. El resultado corresponder con la variacin de correlacin entre la mscara
y el entorno de vecindad. Por dicho motivo habr de sumar adems de la ponderacin
oportuna de la correlacin, el nivel de gris de los pxeles. La ponderacin del resultado
logit depender del nivel de discretizacin de la seal, evitando que se produzca
saturaciones. De esta forma quedar definida la mscara, slo resta colocar los coeficientes
para que sean efectuados de forma eficiente por el procesador, esto es, prximo a potencias
de 2n. En la tabla 4.4 se expone un ejemplo. Tambin se emplear otras mscaras como las
correspondientes a filtros binomiales, por ser muy extendido dentro de la bibliografa
SIVA.
Tabla 4.4 Resultados del mtodo logit para una mscara 3x3
Resultado logit

Suma del vector

Mscara
optimizada

2 0 4
1
(0.49 0.03 0.008 0.14 0.06) (1.49 0.03 0.008 0.14 0.06) 1 48 1
32
4 0 2
Respecto al procesamiento morfolgico, si se desea realzar defectos de tonalidad
oscura se precisa de transformaciones top-hat, ver 4.2.4.2.4. Un estudio de la base de datos
de los defectos muestra que los pxeles de alto contraste son pocos y prximos entre si, por
lo que sugiere utilizar elementos estructurantes de conectividad 4 pxeles en cruz, por ser
los ms prximos o bien probar con conectividad de 8 vecinos. En mayor tamao podra
pensarse en 11 e incluso 24 vecinos. La ecuacin ( 4.101 ) muestra los elementos
estructurantes propuestos.

138

DISAM-UPMT-98-015

Carlos Platero

010
H1 = 111
010

Captulo 4: Deteccin visual de defectos locales

111
H 2 = 111
111

00100
01110

H 3 = 11111

01110
00100

11111
11111

H 4 = 11111

11111
11111

( 4.101 )

En cuanto a las medidas de realce se ha utilizado, las distancias de Bhattacharyya y


medidas relacionadas con las funciones de distribucin tanto de pxeles de alto contraste
como de falsas alarmas, tal como fue comentado en 4.5.2. Por lo que se necesita estudiar la
viabilidad de normalidad de las distribuciones.
4.6.2

Validacin de las hiptesis de normalidad


Se va a intentar validar la normalidad de la seal del fondo. Mientras que la funcin
de distribucin de los pxeles de alto contraste, es posible conseguirla, gracias a un
conjunto extenso de muestras superiores a 230 defectos distintos.
En la tabla 4.5 se presentan los resultados de validacin de normalidad sobre la
seal del fondo y la distribucin de pxeles de alto contraste, F y AC. Para el caso de las
convoluciones, esto es, de procesado lineal, si la seal captada sigue una distribucin
normal, la procesada tambin tendr una funcin de densidad normal. No obstante, el
carcter discreto de los datos, puede generar una dispersin de los valores que provoquen
saturaciones, tanto por el valor inferior como superior, rompiendo con la modelizacin
prevista. Obsrvese que la distribucin del fondo si es normal, no as la densidad de los
pxeles de alto contraste. Si de filtros no lineales se trata, habr que estudiar su normalidad
pasada la etapa de realce, pues es esta imagen la que ser posteriormente segmentada. Las
especificaciones de los parmetros del test fueron vistas en 4.3.4.1.
El modo de actuar consisti en tomar las imgenes procesadas, siendo unas
muestras lo suficientemente extensas para la validacin rechazo de la hiptesis. De stas se
extraen sus histogramas y se calculan los coeficientes de asimetras y apuntamientos,
determinndose mediante el test de Jarque y Vera el ndice de confianza. Adems, sobre
estas imgenes se calcula el centro de gravedad para observar que las falsas alarmas se
distribuyen de manera aleatoria en todo el espacio de la imagen captada, mostrando con
ello una iluminacin uniforme y la posibilidad de tomar umbrales globales.
En la tabla siguiente se ilustra algunas de las ms de veinte mscaras probadas,
junto con sus parmetros, niveles de confianza y distancia de Bhattacharyya. Hay mscaras
de 3x3 y de 5x5 segn ( 4.100 ), adems se muestran diferentes resultados de aplicar la
correlacin ponderada con el nivel de gris.

DISAM-UPMT-98-015

139

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Tabla 4.5 Mscaras de procesado


Mscara

Funciones de densidad

Respuesta en frecuencia

Parmetros

Normalidad

AC

AC

AC

dB

178

13

83

25

0.4

0.04

156

18

43

29

0.3

0.24 2.7

178

16

69

28

0.4

0.04

178

11

98

24

0.4

0.1

2.5

8 1 8

1
1 64 1
32

8 1 8

1 0 1

1
0 12 0
8

1 0 1

1 2 1

1
2 4 2
16

1 2 1

140

DISAM-UPMT-98-015

Carlos Platero

2 0 6

1
1 32 1
16

6 0 2

2 0 4
1
1 48 1
32
4 0 2

3
1
8
32
3

3 8 3 8

1 2 1 3
2 56 2 8

1 2 1 3

3 8 3 8

2
1
8
64
2

2 8 2 8

1 2 1 2
2 85 2 8

1 2 1 2

2 8 2 8

Captulo 4: Deteccin visual de defectos locales

157

18

43

29

0.1

0.25 2.6

189

16

76

28

0.5

0.04

156

22

16

35

0.3

0.1

2.8

136

17

28

27

0.4

0.09

La primera conclusin que se puede aportar de esta tabla es la suficiencia de la


distribucin del fondo como normal, no siendo as para el caso de los pxeles de alto
contraste. Y como corolario la no validez de la distancia de Bhattacharyya, pues la
distribucin de los pxeles de alto contraste no sigue la normalidad. De otro lado, las
mscaras obtenidas de la correlacin muestran una tendencia a favorecer las componentes
de alta frecuencia.
4.6.3

Parmetros del sistema de deteccin de defectos


La determinacin de los parmetros del sistema de deteccin vendrn dados de
manera experimental, mediante el calibrado del conjunto de muestras a partir de las
medidas explicadas en 4.5. Sobre la base de datos de que se dispone, y para cada estrategia
de deteccin basada en etapa de realce, umbralizacin y post-procesado, se calcula la
funcin de distribucin de los pxeles de alto contraste y de falsas alarmas en funcin del

DISAM-UPMT-98-015

141

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

valor de k. Esta fase de calibracin definir la etapa de realce, el umbral u* y por ende k*,
junto al tipo de postprocesado.
Para el caso de la pasta de papel, los pxeles de alto contraste vendrn ponderados
por el tipo de defecto, pues stos se clasifican atendiendo al tamao de sus defectos. No es
lo mismo un pixel de alto contraste de un defecto de tipo P que otro de tipo A, pues los
primeros slo representan un 0.04 mm2 y los segundos un mm2, segn se vio en la tabla
4.4. A continuacin se presentan los resultados de las distintas estrategias de deteccin de
defectos. En la Tabla 4.6 aparece en la primera columna el tipo de procesado, en la
segunda las funciones de distribucin de los pixeles de alto contraste ponderados y falsas
alarmas con y sin post procesado. El post procesado utilizado ha sido el explicado en 4.4.1
con 8 vecinos. Y las ltimas columnas hace referencia a las medidas de probabilidad de
deteccin sin pixeles de falsas alarmas, pAC(pFA=0), sin y con post procesado ( - o + ), ms
la probabilidad de falsas alarmas cuando se detectan al 100 % de los defectos.
La ltima fila est reservada al procesado morfolgico tipo top hat, al que se le
aplicado vecindad a 4 y 8 vecinos.

Tabla 4.6 Resultados de las diferentes estrategias de deteccin


Procesado

Funciones de distribucin

pAC(pFA=0) pFA (pAC=1)


-

142

77.6 68.8 55.3 92.2

DISAM-UPMT-98-015

Carlos Platero

8 1 8

1
1 64 1
32

8 1 8

1 0 1

1
0 12 0
8

1 0 1

1 2 1

1
2
4
2

16

1 2 1

Captulo 4: Deteccin visual de defectos locales

29.9 64.9 85.4 91.3

78.3 72.1 61.1 89.3

90.1 75.0 69.9 92.2

2 0 6

1
1 32 1
16

6 0 2

65.8 72.1 96.1 89.3

2 0 4
1
1 48 1
32
4 0 2

67.1 65.8 69.9 92.2

DISAM-UPMT-98-015

143

Inspeccin automatizada de superficies homogneas mediante Visin artificial

3
1
8
32
3

1
2
1
3

2
1
8
64
2

2 8 2 8

1 2 1 2
2 85 2 8

1 2 1 2

2 8 2 8

Carlos Platero

3 8 3 8
2
56
2
8

1
2
1
3

Top-hat

3
8
3
8

33.1 60.3 88.3 76.5

2.6

5.2 95.1 76.7

39.7 40.5 97.1 97.1

De la tabla se desprende que el mejor procesado es la aplicacin de un filtro


binomial ( smooth ) sin aplicacin de post procesado, alcanzando un 90.1 % de deteccin
sin falsas alarmas. Tambin se observa que las mscaras obtenidas mediante correlacin
con variable cualitativa mejoran sus prestaciones de deteccin cuando se le aplica las
etapas de post procesado. Su explicacin viene dada por el hecho de que estas mscaras
tienen bandas pasantes de alta frecuencia, por lo que pixeles aislados de falsas alarmas
luego sern eliminados como consecuencias de la discontinuidad de la materia.
Seguidamente se pasar a calcular el valor del segundo umbral, kMC, tal que a partir
de las semillas reconstruya el defecto, segn se explic en 4.4.2. La forma de actuar
consistir una vez localizadas las semillas y conocido el tamao del defecto, obtener el
valor ptimo de kMC tal que reconstruya el defecto sin aadir pxeles del fondo. Obsrvese
que un valor pequeo de kMC puede suponer un engrosamiento del defecto, y como
resultado un rea mayor que la verdadera. Por el contrario, un elevado valor de kMC puede
llevar a la situacin contraria.
Por ltimo, faltar determinar la relacin de probabilidad de defecto detectado, p DD,
y la de falsas alarmas del sistema de deteccin. A partir del conjunto de muestras, se puede

144

DISAM-UPMT-98-015

Carlos Platero

Captulo 4: Deteccin visual de defectos locales

calcular la relacin entre la masa de defecto detectado y de falsas alarmas para cada valor
de k. Estas funciones son de gran utilidad de cara al producto final, en el que el propio
cliente es el que deber decidir, con su conocimiento del sistema, el coste de la falta de
deteccin y de falsas alarmas.

4.7

Conclusiones
Se ha presentado un esquema metodolgico para la deteccin de defectos locales en
superficies homogneas y planas. El sistema de inspeccin se basa en tres etapas: realzado,
segmentacin y post procesado. Respecto al realzado, se han estudiado los filtros lineales
discretos, proponiendo una tcnica novedosa basada en el uso de correlacin lineal con
variables cualitativas. Adems tambin se han explorado tcnicas de realce soportado en
procesamiento morfolgico. En cuanto a la etapa de segmentacin fue abordada desde las
funciones de densidad en niveles de grises del defecto y del fondo, introducindose el
concepto de pxeles de alto y medio contrastes. Convirtiendo el problema de
umbralizacin, en la localizacin ptima del umbral mediante una funcin de coste, donde
se tiene en cuenta los dos errores tpicos, defectos sin detectar y falsas alarmas. Las
tcnicas de post procesado han sido aplicadas con una doble intencionalidad, eliminacin
de falsas alarmas y reconstruccin de defectos a partir de los pxeles de alto contraste. A
continuacin se ha definido un conjunto de medidas con el objeto de calibrar cul es el
mejor mtodo de deteccin de defectos. stas se basan en las funciones de distribucin en
niveles de grises del fondo y de los defectos. Por ltimo, se ha implementado esta
metodologa para la deteccin de faltas locales en la pasta de papel. Donde se ha
desarrollado experimentalmente la tcnica propuesta, dando los resultados de diseo para
cada una de las etapas y cmo han sido stas evaluadas.

DISAM-UPMT-98-015

145

Carlos Platero

Captulo 5: Anlisis de los datos

Anlisis de los datos

Una vez detectados los defectos locales en la superficie, se determinada la


conversin de la imagen segmentada en un vector de caractersticas. Existen mltiples
tcnicas para la obtencin de este vector, de esa variedad se ha utilizado los mtodos
sintcticos y su posterior conversin a vectores de caractersticas. Sin embargo, en esta
tesis el estudio se ha centrado sobre todo en la etapa de clasificacin, dejando slo
constancia de cmo se ha procedido experimentalmente para la formacin del vector de
caractersticas. Los dos siguientes captulos tienen como objetivo, dar una metodologa de
actuacin en la catalogacin de las muestras a partir de la informacin obtenida de la etapa
de deteccin de los defectos. La idea bsica es integrar tanto las tcnicas estadsticas como
las cognitivas en la resolucin del problema. La experiencia ha demostrado que los
resultados de la clasificacin mejoran sensiblemente con acciones hbridas, y que,
sustancial mejora se encuentra en la introduccin del conocimiento humano sobre el
problema. Los mtodos cognitivos presentan las caractersticas de aprendizaje mediante
ejemplos, y cuyos resultados, algunas veces, no cumplen con los criterios de generalidad y
exactitud del sistema. Tienen adems inconvenientes en la insercin de conocimiento a
priori, y en trminos generales, no es posible saber el sesgo y la varianza derivada de un
entrenamiento basado en un conjunto finito de muestras. No obstante, son herramientas de
gran valor y que deben verse como elementos potentes en el proceso de decisin, pero no
exclusivos. Son los mtodos basados en la modelizacin de funciones de densidad los que
pueden ayudar y refinar la decisin, por los motivos que van a ser a continuacin
abordados.

DISAM-UPMT-98-015

147

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Bajo estas consideraciones, la primera pregunta es: Hay posibilidad de clasificar el


universo del problema a partir de un conjunto finito de muestras?. La respuesta es si,
siempre y cuando exista conocimiento a priori del problema. En la medida de que esta
informacin sea ms precisa, ms fcil ser la construccin del clasificador y ms sencillo
y rpido la decisin de ste. La pregunta siguiente ser Cmo se aborda la introduccin
del conocimiento previo en el clasificador?. Si se considera, hoy por hoy, que la mejor
fuente de bsqueda de modelos es el hombre Cmo puede ste introducir sus
conocimientos dentro del computador?. La respuesta se encuentra en dos facetas: la
primera conseguir una imagen en el computador que identifique unvocamente las
realidades fsicas con la informacin depositada, etapa que fue realizada en la deteccin de
defectos y en la extraccin de las caractersticas, y la segunda, buscar las relaciones entre
las caractersticas de los objetos etiquetados como defectuosos, de manera que se pueda
aumentar el poder de discriminacin entre los distintos tipos de defectos a clasificar.
El mtodo a seguir estar formado, por este primer captulo encargado de obtener
los grupos homogneos inherentes de los datos de entrada, a partir de los mapas auto
organizados y tcnicas estadsticas. Mientras en el captulo siguiente, se abordar la
seleccin de las caractersticas y la clasificacin mediante mtodos estadsticos, cognitivos
y tcnicas hbridas.
En el anlisis de datos se trata de localizar los grupos o clusters dentro de la
informacin recogida para su clasificacin. Estos grupos forman un conjunto de datos
homogneos entre si y diferentes respecto al resto. Existen mltiples tcnicas de clustering,
como el algoritmo ISODATA [Hall65] o basados en los k-vecinos ms cercanos. Por las
caractersticas del algoritmo de mapas auto organizados, se han explorado las posibilidades
que ste tiene para la formacin de un mtodo de agrupamiento, no slo por ser prximo a
algoritmos de vecindad sino por la tendencia a representar la funcin de distribucin de la
variable de entrada. La bsqueda de subespacios normales liga el anlisis de datos con la
seleccin de las caractersticas, permitiendo decantar un algoritmos de agrupamiento de
tipo paramtrico. Y aunque es en este captulo donde se habla de transformaciones
normalizantes, no se ver concluido el mtodo de parametrizacin hasta el prximo
captulo, al requerir introducir un estudio previo sobre clasificadores paramtricos y
medidas de error.
El planteamiento en este captulo es el siguiente, en primer lugar se exponen las
ideas generales sobre mapas auto organizados (5.1). En segundo lugar, se trata de mostrar
las cualidades de los mapas auto organizados de Kohonen para el anlisis de los datos
(5.2). Seguidamente se estudian las deficiencias del mtodo, para presentar a rengln
seguido una nueva metodologa, con el objetivo de modelizar el problema mediante
funciones de densidad de cada grupo (5.3). Por ltimo, se expone como se ha utilizado el
mtodo propuesto en el anlisis de datos proveniente de defectos locales en el aluminio
colado (5.4).

148

DISAM-UPMT-98-015

Carlos Platero

5.1

Captulo 5: Anlisis de los datos

Anlisis de los datos con mapas auto organizados


Se pretende ver la posibilidad de utilizar los mapas auto organizados para el anlisis
de datos. Previamente, se exponen de forma somera, las bases de los mapas y
posteriormente se expone la teora que soporta el anlisis de los datos.
En el mapa auto organizado (self-organizing) no existe ningn maestro que indique
si la red neuronal est operando correcta o equivocadamente, pues no se define ningn tipo
de realimentacin entre la salida actual y la deseada. As durante el proceso de aprendizaje,
el sistema debe descubrir por si mismo patrones, regularidades, correlaciones o categoras
en los datos de entrada, y codificarlos internamente en su estructura.
Los modelos no supervisados tienen un campo de aplicacin propio, relacionado en
general con el anlisis exploratorio de los datos. Estos modelos suelen ser simples,
monocapa y con algoritmos sencillos y rpidos, ms prximos a la biologa. Se pueden
clasificar en dos grandes grupos, redes no supervisadas hebbianas, basada en las reglas de
Hebb, y modelos auto organizados, denominadas redes no supervisadas competitivas, en
las que solamente una neurona ( o un grupo de vecinas ), pueden quedar finalmente
activadas.
El SOM o mapa auto organizado de Kohonen fue desarrollado a lo la largo de la
dcada de los ochenta por el finlands Teuvo Kohonen, y representa una continuacin
natural de la lnea de desarrollo de redes competitivas iniciado por von der Malsburg
[Malsb73]. Las primeras publicaciones sobre el SOM [Kohon82,Kohon82a] presentaban el
diseo de un eficiente y sencillo algoritmo de computador para la auto organizacin de
mapas de rasgos; este algoritmo ha resultado ser una plataforma muy importante para
multitud de aplicaciones.

DISAM-UPMT-98-015

149

Inspeccin automatizada de superficies homogneas mediante Visin artificial

5.1.1

Carlos Platero

Mapas Auto organizados


La idea de los mapas auto organizados (SOM = Self-Organizing Maps), surgi del
deseo de modelar la organizacin de los tejidos cerebrales. Se ha establecido
experimentalmente que en el cortex de los animales superiores existen zonas donde las
neuronas detectoras de rasgos se encuentran topolgicamente ordenadas. La corteza
cerebral parece estar ordenada desde varios puntos de vista y niveles de abstraccin. Los
centros responsables de actividades diversas como la visin, el odo, las funciones motoras,
etc. yacen en zonas especficas de la corteza, y estas zonas guardan entre ellas una cierta
topologa. Asimismo, las zonas individuales muestran una ordenacin respecto a su
funcionalidad. Un ejemplo de ello es el mapa tonotpico de las regiones auditivas, en el
cual neuronas prximas entre si responden a frecuencias de sonido similares segn una
sucesin ordenada, desde los tonos ms altos a los ms bajos. Las regiones tales como el
mapa tonotpico, suelen recibir el nombre de mapas de correspondencias ordenadas de
caractersticas. El algoritmo de Kohonen surgi del deseo de modelar la manera natural en
que se desarrollan estos mapas de caractersticas ordenadas.

Pen

sam

Ma

iento

Fu

Ha

bla

Alto

pa
s

ci
ca
ifi as
an re
Pl e ta
d

nc
ion
es
mo
tr
en
ica
sor
s
ial

5.1.1.1 Arquitectura

to
en
mi
oci s
con do
Re soni
de

to
ie n
cim
no as
co labr
e
R pa
de

Bajo

to
imien
Mov s
de ojo

Visin

Figura 5.1 reas de influencia

Figura 5.2 Mapa tonotpico (de gato)

La arquitectura general de un SOM puede describirse de la siguiente manera: se


tiene un conjunto de N nodos (neuronas) I = {1,2,..N}, los cuales se disponen en una malla,
generalmente de una, dos o tres dimensiones. A cada nodo i de esa malla (usualmente
conocida como capa de competicin), se le asocia un vector de peso Mi = [i1, i2,..., in]
n. La forma de la malla puede ser definida rectangular , hexagonal o incluso irregular.
Dentro de la malla se define un conjunto de vecindad Ni alrededor del i-simo nodo, que
puede adoptar diversas formas. La entrada es un vector X(t) = [x1, x2, ..., xn] n que se
conecta, en el caso ms sencillo, en paralelo a todas las neuronas de la malla de
competicin (pueden haber otros esquemas de conexin). El peso de conexin entre la
neurona Mi y el j-simo componente de la seal de entrada viene dado por ij

150

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

VecindadNi
malla

Mi(t)
sinapsis
1

X(t)

Figura 5.3 Arquitectura SOM

5.1.1.2 El algoritmo
El objetivo del algoritmo de Kohonen consiste en adaptar los pesos ij de las
neuronas de la malla, segn una regla de aprendizaje no supervisado, hasta conseguir una
malla ordenada topolgicamente, en el que cada neurona est especialmente
sensibilizada en un dominio de la seal de entrada.
La modificacin de los pesos ij se realiza selectivamente de acuerdo al siguiente
criterio: Al encontrar el nodo ganador, se modifica el peso de ste y de todos aquellos que
se encuentran dentro del conjunto de vecindad definido (verdadera aportacin de Kohonen
en el aprendizaje competitivo). El nodo ganador es el nodo de la malla que, en alguna
mtrica, est ms cerca o mejor casa con la entrada que se presenta en el ciclo de
modificacin (aprendizaje).
El algoritmo de Kohonen puede ser expresado por un conjunto de pesos, los
cuales se repiten iterativamente hasta conseguir un orden topolgico en la capa de
competicin (fase de aprendizaje). Una vez conseguido el orden, se continua aplicando el
algoritmo para afinar los pesos de los nodos ya ordenados (fase de convergencia). En esta
etapa, la topologa de la red se preserva, esto es, el mapa conserva su distribucin a pesar
de continuar sometiendo a la red, a nuevos ciclos de aprendizaje.
Los pasos del algoritmo son:
1.Inicializacin de los pesos: En un principio, t = t0, la red se encuentra en un
estado inicial desordenado, los pesos de los nodos de la capa de competicin
toman valores aleatorios.

DISAM-UPMT-98-015

151

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

2.Presentacin de la entrada: Es presentado a la red un vector de entrada aleatorio


X(t) n.
3.Bsqueda del nodo ganador: El vector de entrada X(t) se compara con todos los
vectores de referencia Mi(t), hasta encontrar el nodo Mc ms cercano o que ms
case con el vector de entrada X. Es utilizado frecuentemente la mtrica
eucldea, pero puede utilizarse otro tipo de mtrica.
X t M c t = min X t Mi t

( 5.1 )

4.Modificacin de los pesos: Los pesos de los nodos de la capa de competicin son
modificados segn la ley de aprendizaje
M i t + 1 = M i t + hci t X t M i t

( 5.2 )

la funcin hci se conoce como funcin de vecindad, y juega un papel central en el


desempeo del algoritmo. Mantiene el aspecto de un kernel (rejilla) de radio de
accin que acta sobre la neurona ganadora y sus vecinas seleccionadas. Para la
convergencia del proceso de aprendizaje, es necesario que hci(t)0 cuando t.
Usualmente hci(t) = hci(rc - ri,t) donde rc, ri 2, correspondientes al vector
de localizacin de los nodos de la malla; tal que con incrementos de rc - ri
decrezca hci0 espacialmente.
En la literatura de los SOM hay dos tipos bsicos de funcin de vecindad. La ms
simple est basado en el conjunto de vecindad Nc, establecindose que hci(t) = (t)
si i Nc(t), en caso contrario hci(t) = 0 para i Nc(t). El valor de (t) es
identificado como el factor de aprendizaje (0 < (t) < 1). Ambos (t) y Nc(t) son
montonos decrecientes en el tiempo (ver Figura 5.4 )

Figura 5.4 Conjunto de vecindad

Otra rejilla aplicada es un kernel en trminos de funcin gaussiana

152

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

r c ri

h ci ( t ) = ( t ) e

(t )

( 5.3 )

donde (t) y (t) definen el ancho de la rejilla.


Es normal utilizar una estrategia separada en la ordenacin y en la
convergencia. As durante la fase de aprendizaje habr una evolucin tanto de la
funcin de vecindad como del factor de aprendizaje, mientras en la convergencia
se mantiene la vecindad siguiendo decreciendo (t).
5.Volver al paso 2: Mientras no se haya alcanzado un estado de orden en la malla
de competicin, el algoritmo regresa al nivel 2 hasta que los nodos estn
adecuadamente afinados.
Aunque los principios bsicos del algoritmo de Kohonen parecen simples, y la
dinmica del algoritmo ha sido ampliamente observada en forma practica, sta ofrece
todava muchos interrogantes acerca del fenmeno de ordenacin topolgica y
convergencia. Desde el punto de vista del anlisis de datos, las preguntas que debera
responder el algoritmo son:

Los mapas obtenidos son nicos, en el sentido de que a partir de pesos iniciales
distintos, la respuesta sea siempre la misma ?

Los vectores de referencia tienden a representar la funcin de densidad del


vector de entrada ?

Cmo definir los mejores mapas, tal que stos cumplan con el objetivo de ser
fiel reflejo del espacio de entrada sobre una dimensin reducida ?
Estas cuestiones que aqu son emplazadas caen dentro de la discusin terica de las
SOM, que lleva ms de una dcada buscando respuestas. Segn Kohonen [Kohon95], hay
cuatro clases de problemas en las discusiones sobre los mapas auto organizados.
1. Ordenamiento topolgico de los mapas
2. Convergencia de los vectores de referencia, Mi.
3. Funcin de densidad, p(X), versus vectores de referencia
4. ptima funcin de vecindad, hci, y factor de aprendizaje
Las respuestas que se tienen a estas preguntas son parciales, especialmente en un
sentido estrictamente matemtico. Se han hecho diferentes esfuerzos con diversos mtodos

DISAM-UPMT-98-015

153

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

y herramientas matemticas para describir en forma general los fenmenos de orden y


convergencia, pero hasta ahora no se tienen soluciones globales. Las soluciones o
aproximaciones existentes se refieren a casos especficos o con condiciones limitadas.
El nico anlisis matemtico completo que se tiene hasta ahora es para el caso
unidimensional, el vector de entrada es de dimensin unitaria y la malla la componen
unidades dispuestas a modo de secuencia de nodos unidimensionales. Cottrell y Fort
[Cottr87] presentan un tratamiento completo y riguroso de las propiedades de auto
organizacin y convergencia del SOM, cuando se cumplen los requisitos de funcin de
densidad de entrada continua y funcin de vecindad tipo escaln.
5.1.1.3 Ordenamiento de los vectores de referencia
Un aspecto interesante consiste en averiguar, si los vectores de pesos, inicialmente
aleatorios, se ordenan por medio de la regla de aprendizaje, de modo que preserven la
topologa del espacio de entrada. Pero cmo expresar matemticamente, que un array o
malla est ordenado ? Qu es exactamente un orden topolgico ?. El concepto de orden
es trivial en el caso unidimensional, definiendo una funcin objetivo J y asumiendo un
conjunto de nmeros escalares i, i = 1,2, ..., N, luego
N

J = i i 1 N 1
i =2

( 5.4 )

es mnimo, y en este caso cero, si y solo si los i estn ordenados numricamente en


secuencias ascendentes o descendentes. Considerando un proceso de auto organizacin,
con un vector de entrada unidimensional y los i que corresponden a los escalares de
referencia, Mi, el array lineal tender a J = 0, a un estado absorbente en el sentido
markoviano1, esta condicin de orden no cambia aun cuando el proceso de aprendizaje
contine con la exposicin de ms entradas. Cottrell y Fort [Cottr87] han presentado una
exhaustiva demostracin del proceso de ordenamiento para el caso unidimensional. La
propiedad general demostrada del ordenamiento de un mapa de Kohonen unidimensional
se establece como:
Siendo una variable estocstica y habiendo empezado con pesos iniciales
aleatorios para cada i, estos pesos modificados por el proceso de aprendizaje segn( 5.1 )
y ( 5.2 ), junto con una funcin de vecindad de i-1 e i+1, tal que cuando t, el conjunto
de pesos {1,2,...,n} tendern ha ordenarse en secuencia ascendente o descendente. Una

Las tcnicas de Markov se utilizan principalmente para el estudio de la auto organizacin. Se trata
de aplicar los resultados conocidos de la teora de Markov al proceso de organizacin topolgica. As, para la
prueba de auto organizacin, lo que se pretende es probar la existencia de un estado absorbente, al cual en el
proceso de aprendizaje de los vectores de referencia, entrarn en el estado ordenado con probabilidad uno
despus de un tiempo determinado.

154

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

vez el conjunto ordenado, ste no podr ser desordenado aunque existan etapas de
actualizacin
Para mayores dimensiones es muy difcil definir un orden topolgico. Por lo menos
as lo han mostrado los diversos trabajos, en lo que para cada sugerencia hecha de la
funcin J, siempre se ha encontrado un contraejemplo que contradice la existencia de un
estado absorbente.
Al menos lo que s siempre se ha cumplido en las SOM, es que el orden refleja
propiedades de la funcin de densidad de la variable de entrada, p(X). Parece que debera
definirse el concepto de orden, en trminos de minimizar alguna condicin expresada
como funcin de error medio esperado entre la distribucin de los vectores de referencia y
p(X). Efectivamente, en las pruebas constructivas y para el caso especfico de igual
dimensin en el espacio de entrada y en la malla, el ordenamiento est ligado al
compromiso geomtrico de los nodos con la variable de entrada.

Figura 5.5 Distribucin de p(x) uniforme


en un rectngulos (2D)

Figura 5.6 Distribucin de p(x)


uniforme en un cactus (3D)

5.1.1.4 Convergencia de los vectores de referencia


Una vez acabada la fase de ordenacin y sabiendo que cualquier actualizacin no
variar el orden, los mapas tienden a converger, de forma ptima en el sentido, tal que
stos representen imgenes de la funcin de densidad de las variables de entrada. Una
solucin formal para la determinacin de los Mi no esta disponible actualmente, al menos
con una proposicin genrica de p(X). Kohonen ha demostrado la validez de la formula del
descenso del gradiente para SOM de orden topolgico cero2, derivable del error de
cuantizacin medio esperado.

Sin vecindad, correspondiente a los mtodos clsicos de Vector Quantization (VQ)

DISAM-UPMT-98-015

155

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Los algoritmos VQ representan una clsica aplicacin del mtodo de aproximacin


de la funcin de densidad de una seal, p(X), usando un nmero finito de vectores de
referencia Min, i = 1,2,..., k. Uno de los vectores de referencia, Mc, es elegido al estar
ms prximo al vector de entrada, X.
X Mc =

{ X Mi }
i

( 5.5 )

El ndice c es actualizado en el proceso de aprendizaje para cada nueva entrada.


Una ptima seleccin de Mi podra consistir en minimizar el valor cuadrtico medio del
error de cuantizacin, definido como:
E = X Mc

p(X) dX

( 5.6 )

donde la norma es eucldea. Obsrvese que el subndice "c" es una funcin de la


seal de entrada, X, y de todos los vectores de referencias Mi, de manera que el clculo del
error no se puede realizar de manera sencilla, al variar Mi su posicin en el espacio de
entrada por la propia evolucin de aproximacin a la funcin de densidad de X.
Sin demostrarlo [Zador82], la optima posicin de los Mi tal que se aproxime a la
funcin de densidad de X es [p(X)]n/(n+2), siendo n la dimensin del espacio de entrada; en
el caso de tener n >> 2, los vectores de referencia se aproximan a la funcin de densidad
con un nmero finito de vectores.
Kohonen demuestra que los codebook vectors siguen un proceso similar al mtodo
de aproximacin estocstico de Robbins-Monro en su dinmica de acercamiento a
posiciones ptimas. La idea que introducen Robbins y Monro[Robbi51] es el clculo de
M(t) (vector de pesos) en la red de Adaline de Widrow [Widro62]. Sugieren que el valor
del vector de pesos se calcule en cada paso de forma iterativa. Partiendo del clculo de la
funcin objetivo, J, como la media esperada del error cuadrtico
J = E MT X

( 5.7 )

siendo = MTX + la dependencia lineal de la red y el error estadstico con valor


esperado nulo; donde E{.} denota la esperanza matemtica sobre el conjunto infinito de
muestra. Si p(X) es la funcin de densidad de la variable de entrada, se puede reescribir
como
J =

156

X 2 p X dX

( 5.8 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

donde dX es un elemento diferencial de volumen en el hiperespacio n-dimensional


de los valores de la seal sobre la cual se realiza la integral. El problema es encontrar el
valor M* tal que minimice J. La condicin para el mnimo local es
T

J J
J
m J =
,
,...,
=0
n
1 2

( 5.9 )

Ya que la funcin de densidad p(X) no se conoce normalmente en su forma


analtica (en la mayora de los casos se tiene nicamente una distribucin de muestras
experimentales de X), se debe aproximar J usando los valores disponibles de X. Se puede
establecer entonces una funcin muestra de J mediante J1(t):
J1 t = [ M T t X t

( 5.10 )

donde t = 0,1,2, es un ndice de la muestra, y M(t) es una aproximacin, ms o


menos buena, de M en un tiempo t. La aportacin fue determinar M(t) en cada paso de una
recursin, donde el gradiente de J se aproxima por el gradiente de J1(t) con respecto a M(t).
A partir de esta idea se mostr que empezando con valores arbitrarios iniciales M(0), la
secuencia {M(t)} converge a una vecindad del vector ptimo M*. Esta recursin se define
como una serie de pasos de gradiente
MT t + 1 = MT t + t t MT t X t XT t

( 5.11 )

Robbins y Monro probaron que esta secuencia converge con probabilidad uno hasta
el ptimo local de M*, para la cual J es mnimo, si y solo si, se cumplen las siguientes
condiciones:

( t ) = ,
t =0

(t ) <

t =0

( 5.12 )

Lo relevante de esta aproximacin es que el algoritmo utilizado en las SOM de


orden topolgico cero es [Kohon95]:
M i (t + 1) = M i (t) + (t) ci [X(t) - M i (t)]

( 5.13 )

siendo ci delta Kronecker ( 1 para c = i, 0 en caso contrario). Esta regla es obtenida


a partir de tratar de minimizar la funcin objetivo de valor cuadrtico medio del error de
cuantizacin, definido como

DISAM-UPMT-98-015

157

Inspeccin automatizada de superficies homogneas mediante Visin artificial

E =

Carlos Platero

X M c p X dX

( 5.14 )

donde la norma es eucldea. La comparacin entre ambas ( 5.11 ) y ( 5.13 ),


muestra que la condicin de convergencia planteada por Robbins y Monro puede aplicarse
al algoritmo de Kohonen. As el factor de aprendizaje, (t), debe cumplir que la secuencia
decrezca a cero cuando t; la secuencia {(t) | t = 0,1,} debe satisfacer las
condiciones puestas en ( 5.12 ).
Atendiendo a las propiedades generales de la aproximacin estocstica, junto con la
convergencia a un estado absorbente, los valores esperados de Mi(t+1) y de Mi(t) para t
deben ser iguales, incluso cuando hci(t) fuese seleccionado distinto de cero. En otras
palabras, cuando la red se encuentre en estado estacionario deber cumplir:
E hci X Mi

=0

( 5.15 )

En el caso ms simple de hci(t), donde fuese declarado como 1 para aquellos nodos
que perteneciesen al conjunto topolgico de Nc y nulo para el resto, el vector de referencia
se posicionar:

Mi =

Xp X dX

Vi

p X dx

Vi

( 5.16 )

donde Vi es el conjunto de todos los valores de X que han actualizado al vector Mi.
Estas condiciones de equilibrio significan que cada Mi* debe coincidir con el centroide de
su regin de influencia, ms aun, representa el centroide de p(X) sobre la parte la regin
que le ha tocado dominar. ste podra ser definido como el estado ordenado.
Intuitivamente deja claro que para cualquier dimensin, el equilibrio slo podra
conseguirse con una particular configuracin de Mi.
5.1.1.5

Mosaico de Voronoi

Un concepto ampliamente utilizado tanto en los mtodos VQ como en redes


neuronales es el mosaico (tessellation) de Voronoi. La figura 5.7 muestra como los finitos
vectores de referencia en 2, presentados como puntos, han dividido el espacio en regiones
de influencia, limitada por bordes lineales ( en general, hiperplanos), tal que cada particin
contiene un vector de referencia, siendo ste el vector dominante dentro del rea. Al
conjunto de lneas que rodean al vector de referencia se le llama mosaico de Voronoi. Y a
todos los infinitos vectores que estn dentro del entorno se dice que forman un conjunto de
Voronoi.

158

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Figura 5.7 Mosaico de Voronoi

5.1.1.6 ptimo ritmo de aprendizaje


El periodo de ordenacin suele ser corto, llevndose casi todo el tiempo de
aprendizaje en la fase de convergencia, con el objetivo de obtener una fiel aproximacin
estadstica de la funcin de densidad de la entrada. No est claro como debera optimizarse
el ritmo de aprendizaje en la primera fase de ordenacin, ya de por si difcil, ms aun
cuando tambin participa en la modificacin de los vectores de referencia, la funcin de
vecindad asociada a cada neurona ganadora. En cambio, durante la fase de convergencia, el
hecho de mantener fijo el ancho de vecindad, hace ms factible determinar algn tipo de
secuencia ptima {(t)}.
El carcter recursivo del algoritmo ( 5.1 )( 5.2 ) incita a que el vector de referencia
siga la traza de las muestras de entrada que caen dentro de su dominio de influencia. La
Figura 5.8 y la Figura 5.9 sealan como la regla de aprendizaje asume la historia de los
vectores de entrada que casan con la neurona. Y es aqu donde el ritmo de aprendizaje
tiene mucho que ver con la convergencia.

Figura 5.9 Interpretacin geomtrica del


factor de aprendizaje

Figura 5.8 Proceso de aprendizaje en 2D


a)
Inicio
b)
Ordenamiento
c)
Convergencia

En esta etapa de convergencia, caracterizada por una funcin de vecindad


constante, s existen dos entradas X(t1) y X(t2) que casan con diferentes neuronas y con t2

DISAM-UPMT-98-015

159

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

> t1, pero que la aportacin a sus correspondientes neuronas deberan ser las mismas, por
ser presentadas en el mismo orden, aunque eso si, separado en el tiempo, la ley de la
secuencia podra estimarse de diferentes ritmos de aprendizaje para cada una de ellas. Si
adems deben cumplir los requisitos de aproximacin estocstica del proceso, ( 5.12 ), una
propuesta correspondera a :

c (t + 1) =

c (t )
1 + c (t )

( 5.17 )

slo seran actualizados aquellos ritmos de aprendizaje pertenecientes a neuronas


ganadoras, el resto no mantendran cambios. Esta especulacin terica no es compartida
como la mejor forma de aprendizaje en la prctica, debido a los variados valores de i
obtenidos en la ejecucin del algoritmo de aprendizaje. Es una contradiccin que los
vectores de referencia, fieles representantes de alguna funcin montona de p(X), sean
bruscamente orientados por los diferentes ritmos de aprendizaje.
Por el anterior razonamiento parece justificado mantener un (t) global en toda la
malla y buscar un ritmo ptimo medio. Mulier y Cherkassky [Mulie92] han propuesto una
expresin de la forma:

(t ) =

A
B+t

( 5.18 )

donde A y B son unas constantes elegidas. Al menos esta forma satisface las
condiciones de aproximacin estocstica. La principal justificacin es que las muestras
ms recientes son consideradas dentro del entorno de evolucin.
5.1.1.7 Efecto de la forma de la funcin de vecindad
Para una buena fase de ordenacin es imprescindible empezar con radios de
vecindad de la mitad de la red, Nc(0), evitando la aparicin de mapas configurados
metaestables, recibiendo este nombre cuando la distorsin media esperada o error de
cuantizacin cae dentro de un mnimo local y no global.
Erwin et al.[Erwin92] han analizado los estados metaestables en mallas de una
nica dimensin, definiendo que una funcin de vecindad es convexa dentro de un cierto
intervalo I{0,1,2,...N}, si las condiciones s-q>s-r y que s-q>r-q implican que
[h(s,s) + h(s,q)] < [h(s,r) + h(r,q)] para todo s,r,q I, en caso contrario la funcin de
vecindad es cncava.
El principal resultado que obtuvieron fue que si la funcin es convexa no existen
estados que no estn ordenados, mientras que con el uso de funciones cncavas aparecen
estados metaestables que podran relentizar el proceso de ordenamiento. Por lo tanto, si en
el principio del proceso se utiliza una funcin de vecindad convexa, el ordenamiento es

160

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

casi seguro, y posteriormente la funcin de vecindad puede ser contraida para mejorar la
aproximacin a p(X).
5.1.1.8 Factor de magnificacin
Desde el punto de vista de los mapas biolgicos cerebrales, existe correspondencia
entre el volumen de informacin a representar y la densidad de clulas receptoras,
definindose factor de magnificacin como el nmero de neuronas por unidad de rea.
Algo similar sucede en los SOM, donde el rea reservado en la representacin de los
patrones es proporcional a la frecuencia estadstica de la ocurrencia del patrn en las
observaciones.
Ritter et al. [Ritte88] han analizado el factor de magnificacin en mapas
unidimensionales con gran cantidad de vectores de referencia sobre un rea finita. Si N es
el nmero de vecinos incluidos en el conjunto de vecindad, se demuestra que la densidad
de vectores de referencia es proporcional a p(X)r, donde el exponente es
r=

2
1

2
3 3N + 3( N + 1)

( 5.19 )

Obsrvese que para N=0, caso VQ, la densidad de vectores se aproxima con un
valor bajo, r = 1/3, considerndolo como un handicap. En cambio, si N tiende a ser elevado
r2/3 ms prximo a la concepcin hipottica de ordenacin, segn modelos biolgicos.
Por ltimo, si en la fase de convergencia ya no es tan importante el ancho de
vecindad, especialmente si es utilizado un kernel gaussiano, se puede llegar al caso
extremo de topologa de orden cero, es decir, slo el ganador es actualizado. Sin embargo,
la falta de interaccin con los vecinos, en esta fase de aprendizaje, puede llevar a
situaciones de prdida del estado de ordenamiento. Concluyendo, debe existir un
compromiso entre la mejor aproximacin a la funcin de densidad p(X), cuyo mejor caso
es el VQ, y la estabilidad del ordenamiento, para lo que se hace necesario mantener las
interacciones con los vecinos.
5.1.2

Conclusiones sobre los mapas auto organizados


Las conclusiones que se pueden extraer del estudio anterior, para enfrentarse
posteriormente a la utilidad de las SOM como parte del anlisis de datos, estn reflejadas
en los siguientes puntos:
Primero, desde el punto de vista del ordenamiento, cabe decir que se ha demostrado
la existencia de un estado absorbente y ordenado para el caso unidmensional, y que para
dimensiones mayores se sospecha que el orden topolgico est ntimamente ligado con la
funcin de densidad de la variable de entrada. Estos supuestos son ratificados por las
pruebas constructivas.

DISAM-UPMT-98-015

161

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Segundo, una vez ordenado topolgicamente la malla, sta no sufre alteraciones de


orden aunque existan nuevas actualizaciones, siempre y cuando se mantenga un cierto
nivel de interacciones laterales.
Tercero, la fase de convergencia hace tender los vectores de referencia hacia los
centroides de las regiones de influencia o entornos de Voronoi, que les correspondan
dominar.
Cuarto, la plausibilidad de aproximacin estocstica del proceso impone
restricciones al factor de aprendizaje, como una secuencia montona decreciente.
Quinto, la funcin de vecindad debe incializarse con radios de vecindad mitad el
tamao de la malla, evolucionando en el tiempo de forma decreciente hasta mantenerse
constante en la fase de convergencia. Las funciones de vecindad deben ser convexas para
evitar configuraciones metaestables.
Sexto, el orden topolgico tambin se relaciona con la densidad de vectores, en
aquellas reas de mayor cantidad de informacin a representar, mayor densidad de vectores
de referencia se necesitan.
Sptimo, los mapas SOM deben ser un compromiso entre el ordenamiento
topolgico, que depende mucho de las interacciones laterales entre vecinos, y la
aproximacin estadstica a p(X), cuyo ptimo se encuentra en las configuraciones VQ.
Las SOM no slo tienden a reflejar la funcin de densidad de la variable de entrada,
sino que adems muestran caractersticas de ordenamiento topolgico, siendo este
concepto recogido de imitacin a mecanismos orgnicos, en el sentido de considerar a los
cerebros ordenados. Llegando a decir, que los SOM permiten conocer la naturaleza de la
informacin mediante la aproximacin a la funcin de densidad, pero adems aporta, que
aquellas regiones de n ms excitadas le correspondern ms neuronas, extrayendo los
polos de atraccin y homogeneidad de los grupos inherentes existentes.

SOM como herramienta de clustering

5.2

Si bien es conocido el xito de la clasificacin de los mapas auto organizados, stos


podran ser mejorados si el diseador introdujera conocimiento a priori del problema,
siendo sta la nica manera conocida, hasta el momento, para producir mejores
clasificadores. La forma de actuar consiste en aumentar la discriminacin mediante alguna
transformacin en los datos. Este tipo de actuacin slo se puede hacer desde una
interpretacin inteligente, por lo que queda la intervencin del raciocinio humano para que
busque la ptima proyeccin de la informacin.

162

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Un buen inicio en la construccin del clasificador, es la obtencin de un mapa auto


organizado sobre la informacin a catalogar. Y este pensamiento se sustenta en las
inmejorables caractersticas que otorgan las SOM. Las principales ventajas que afirman la
anterior sentencia vienen avaladas en:
1. El mapa refleja la funcin de densidad de la variable de entrada, lo que permitir
sugerir funciones de densidad condicionada de los grupos inherentes existentes.
2. Los patrones similares corresponden a neuronas vecinas, y stas al proyectarse
sobre una dimensin reducida ayudarn a conocer los cluster existentes.
3. Al ser aprendizaje no supervisado se hace una exploracin de los datos,
conociendo la estructura inherente de stos.
4. Divide el espacio de entrada en diferentes regiones de inters, elemento esencial
en la introduccin de conocimiento a priori. En general, no existe una nica
transformacin global que ayude a aumentar el poder de discriminacin, sino de
alguna transformacin local, lineal o no, que mejore la discriminacin.
Derivando el problema en la configuracin de diferentes clasificadores para cada
regin.
Los siguientes prrafos tienen como objetivo cmo decantar a partir de la
informacin de los mapas de Kohonen los clusters que contiene el espacio de medidas.

5.2.1

Deficiencias de los mapas de Kohonen en el proceso de clustering


Tal como se ha comentado, una de las propiedades de los mapas de Kohonen es
mantener fielmente reflejado el vector de entrada en una dimensin reducida (p.ej n >>
2). Esta virtud es aplicada para el anlisis de los datos, de manera que los grupos inherentes
en los datos de entrada corresponderan con neuronas prximas entre s y delimitaran una
regin determinada. As, a cualquier grupo en n debera corresponderle una regin de
menor dimensin sobre el mapa. Con el objetivo de mostrar las deficiencias de los mapas
de Kohonen en clustering, es repetido brevemente el experimento realizado por Ultsch et
al [Ultsc90].
Se eligen 4 puntos en tres dimensiones (ABCD), correspondientes al vrtice de un
tetraedro (Figura 5.10). Para cada uno de los puntos se toman vectores aleatorios, con una
distancia comprendida entre 0.1 y 0.4 tomando un valor medio de 0.2 respecto a cada uno
de los vrtices, generndose una nube de puntos por cada punta de la figura geomtrica.
Todos los vectores estn escalados, de manera que la globalidad de los datos estn inscritos
en un cubo unidad (Figura 5.11).

DISAM-UPMT-98-015

163

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Figura 5.10 Vrtices del tetraedro

Carlos Platero

Figura 5.11 Puntos sobre los vrtices

Los algoritmos de clustering deberan separar el conjunto de datos en cuatro


subconjuntos e indicar la disimilaridad de stos. Para verificar el mapa de Kohonen se
hace uso de una red de 64 neuronas y con un entrenamiento de 40 vectores. Las Figura
5.11y Figura 5.12 muestran la distribucin inicial de los vectores de referencia y como
despus de 50.000 pasos de entrenamiento aparecen ntidamente los cuatro cluster.

Figura 5.13 Vectores iniciales

Figura 5.12 Vectores despus de 50000


pasos

El comportamiento de los mapas auto organizados muestra que quedan reflejadas


las funciones de densidad del vector de entrada sobre ellos. No obstante, las distancias
entre los datos tambin aparecen distribuidas. Las posiciones fronteras entre grupos dentro
de la red no reflejan las separaciones eucldeas de los datos. Otros experimentos realizados
con funciones de vecindad distintas (hexagonales y octogonales) fueron probados con
iguales comportamientos.
5.2.2

Mtodo U-Matriz
Ultsh y Siemon proponen utilizar un mtodo complementario al algoritmo del
SOM, que es el clculo de la matriz llamada U-Matriz; permitiendo obtener un mapa
superpuesto al SOM que remarque ms la distribucin del vector.

164

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Para cada unidad aij del mapa auto organizado se definen cuatro tipos de distancia a
sus inmediatos vecinos.
d x (i, j ) = d (u i , j , u i +1, j )
d y (i, j ) = d (u i , j , u i , j +1 )

( 5.20 )

d xy (i, j ) = d (u i , j , u i +1, j +1 )
d yx (i, j ) = d (u i , j +1 , u i +1, j )

Y se propone la siguiente matriz que combina las cuatro distancias con una
dimensin de 2 n 1x 2 n 1 como sigue:

Tabla 5.1 Matriz de distancia


U-Matriz

2j-1

2j

2j+1

2i-1

dz (i,j-1)

dy(i-1,j)

dz(i-1,j)

2i

dx(i,j-1)

du(i,j)

dx(i,j)

2i+1

dz(i,j-1)

dy(i,j)

dz(i,j)

donde dz(i,j) es el valor medio de dxy(i,j) y dyx(i,j) y du puede ser elegida


arbitrariamente. Este valor puede ser, por ejemplo, la distancia de esta entrada a la unidad
aij. Por cada unidad aij hay un correspondiente elemento du(ij) conteniendo la distancia dy,
dx y la distancia diagonal con sus vecinos. La distancia diagonal es representada en la UMatriz como medias aritmticas de dxy y dyx. La U-Matriz contiene por tanto una correcta
aproximacin de la distribucin del vector en el mapa de Kohonen. Para obtener una
presentacin de las caractersticas de U-Matriz se visualizar de forma tridimensional,
mostrando la altura el nivel de separacin de las neuronas. As neuronas prximas entre s
correspondern con una presentacin cartogrfica de valles que indicarn proximidad de
los pesos en n y las colinas o muros muestran vectores de referencia prximos entre
si en el mapa auto organizado pero distantes en n .
Las Figura 5.14 y Figura 5.15 reflejan la disposicin de la U-Matriz en el caso de
los datos del tetraedro y un hexaedro; obsrvese que el mapa es dividido en cuatro o seis
regiones diferentes, correspondiente a los cuatro o seis clusters.

DISAM-UPMT-98-015

165

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Por tanto, para explorar las caractersticas intrnsecas en datos n-dimensionales se


propone utilizar U-Matriz, con el siguiente mtodo:

Figura 5.14 Cluster del hexaedro

Figura 5.15 Cluster del tetraedro

1. Construir el mapa auto organizado de dos dimensiones


2. Calcular la U-Matriz como se ha comentado anteriormente.
3. Interpretar la matriz como sigue: Puntos en n prximos entre s que
formen un grupo, mantendrn posiciones valles en la presentacin de la SOM con
el relieve otorgado por la matriz. En caso de disimilaridad los vectores se situaran
en zona de colinas, mostrando de esta forma la falta de consistencia en la
formacin de un grupo homogneo.

5.3

Refinamiento de la tcnica de clustering


El refinamiento de clusters puede ser conseguido si adems se desea parametrizar el
espacio. El objetivo de modelar el espacio es un paso previo para disear clasificadores
paramtricos, es decir, la capa de clasificacin puede ser utilizada como realimentacin a
la fase de anlisis de los datos. Al introducir la condicin de normalidad en el tipo de
distribucin de los clusters, sta podra fijar definitivamente la separacin/agrupacin de
los datos, y por lo tanto, tambin ser posible disear clasificadores paramtricos. La
tcnica que sustenta este proceder, va a ser expuesta en las prximas secciones y captulos;
sus soportes estn en el test de normalidad, las transformaciones Box-Cox y la distancia de
Bhattacharyya.
Ya ha habido varios estudios que han puesto sus esfuerzos en el uso de los mapas
auto organizados de Kohonen [Mart95][Varfi92], como tcnica de anlisis de los datos.
En los apartados anteriores se expuso que, los mapas auto organizados tienden a un
supuesto orden topolgico, tal que combinan la interaccin de las neuronas vecinas con la
aproximacin a reflejar la funcin de densidad de la variable de entrada. Las proyecciones
de n sobre una menor dimensin (p.ej. 2) permiten fcilmente definir las posibles

166

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

regiones existentes entre los datos, as a cualquier grupo en n le corresponde una regin
sobre el mapa. No obstante, el uso de los mapas de Kohonen como tcnica de anlisis es
incompleta, al desaparecer la distancia eucldea entre los datos.
Ultsh et al [Ultsh90] proponen utilizar un mtodo complementario al algoritmo del
SOM, que es el clculo de la llamada U-Matriz. ste permite obtener un mapa superpuesto
al SOM que remarque ms la distancia en el espacio de medidas. No obstante, en las
observaciones experimentales, los resultados no fueron los esperados, al no encontrar de
forma ntida y clara las fronteras entre cluster.
En los prrafos anteriores, han sido comentadas las caractersticas de los mapas de
Kohonen, y al hablar sobre la convergencia, se expona la idea de que los vectores de
referencia se encaminan a representar la funcin de densidad de la variable de entrada,
p(X). Llegndose a indicar por Kohonen, que los vectores de referencia tienden a ser los
centroides de los conjuntos de Voronoi, esgrimindose la expresin:

Xp X dX

Ui

Mi =

p X dX

( 5.21 )

Ui

Si en esta expresin se expresa p(X), en relacin con las probabilidades


condicionadas de los grupos dentro del conjunto de Voronoi, Ui, de la neurona i:
hj

pX =

pX
j =1

p j

( 5.22 )

teniendo a hj como el nmero de grupos existente en Ui. La expresin resultante


ser:
M i p X dX =
Ui

hj

X p X j p j dX
j =1

Ui

( 5.23 )

desprendindose el significado de Mi, como elemento representativo del dominio


que le corresponde, en otras palabras, la mejor aproximacin de p(X) en esta limitada
regin. Luego es posible buscar cual es la funcin de densidad condicionada que refleje a
p(X). Si se hace minimizar la expresin siguiente:

min

Ui

DISAM-UPMT-98-015

mj

Mi X

p X
j =1

p j dX

( 5.24 )

167

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

el planteamiento supone tener un conocimiento del nmero de clases distintas que


caen dentro del entorno Ui, y del tipo de funcin a utilizar con sus correspondientes
parmetros. En definitiva, la problemtica se cierne sobre el nmero de clusters que tiene
el clasificador y la naturaleza de las funciones de densidad. Segn lo apuntado hasta ahora,
si se hace aproximar p(X) en cada conjunto de Voronoi, el nmero de clusters queda
definido, tantos grupos como neuronas contenga el mapa. En cuanto a las funciones
condicionadas, hay que observar, cmo las neuronas errneas, es decir aquellas activadas
con muestras de dos o ms grupos, son sus conjuntos Ui remansos de funciones de
densidad. Este motivo sugiere utilizar una tcnica de slo etiquetar aquellas neuronas que,
sean ganadoras de un nico tipo de patrn. Si se acepta tal precepto la expresin quedar
como:
min

M i X p X j dX

( 5.25 )

Ui

siendo j la nica clase que cae dentro de Ui. Por ltimo, quedar conocer cual es la
parametrizacin ptima a considerar y en funcin de sta el nmero de parmetros a
determinar, quedando reflejado en:
min

M i X p X j 1 j 2

jr dX

Ui

( 5.26 )

el mtodo presentado lleva grandes dificultades prcticas, algunas de tipo tcnico,


como es la integral extendida en el dominio Ui y otras en cuanto que las conclusiones
extradas de exclusin de otras clases ( p(k) sean nulas para toda k distinto de j ), es en la
mayora de las veces, inferidas a partir de un nmero de muestras insuficientes.
La observacin emprica de los mapas, muestra como los patrones similares tienden
a estar prximos entre s, caractersticas propias del SOM. De lo que se desprende que
podran unirse en la formacin de un cluster, pero cmo se podra decidir la unin?. En
principio, por aquellas neuronas que tengan la misma etiqueta, sean vecinas, y que adems
sugieran alguna funcin de distribucin conocida. Luego se podra expresar el objetivo de
determinacin del cluster y parametrizacin como:
H

min M i X p X j 1 j 2
i = 1 Ui

rn dX

( 5.27 )

donde H es el numero de entornos unidos en la formacin del cluster. sta es la


expresin genrica de construccin de un cluster parametrizado. Sin embargo, tiene las
dificultades de no ser conocido el nmero de neuronas que integrarn el cluster, H, ni se
conoce que tipo de funcin de densidad siguen. Por lo que se plantea un proceso iterativo
de localizacin del cluster mediante la siguiente tcnica: primero, etiquetar nicamente las
neuronas bajo las hiptesis de trabajo marcadas, a decir, aquellas que se activen mediante
un nico tipo de patrn, a diferencia del mtodo de votacin usado por Kohonen. Segundo,
iniciar un diseo de los clusters basados en las U-Matriz y en el aspecto descriptivo de los

168

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

patrones, y tercero, se pasar al refinamiento de los cluster mediante la aproximacin a


alguna funcin de densidad conocida, proponindose la normalidad en cada cluster por las
razones que se van a ver a rengln seguido.
Paso previo a la normalidad es la desaparicin de las componentes discretas en la
nueva fase. La actuacin viene avalada por motivos diversos. Primero, al introducir estas
variables en el test de normalidad, no pasarn la prueba al mantener el mismo valor dentro
del cluster. Segundo, el modelaje del espacio se va a realizar sobre variables continuas. En
un primer paso de la tesis, la informacin de las componentes discretas no va a ser
considerada en esta nueva fase de diseo, en la hiptesis de que es posible construir
clasificadores paramtricos con variables continuas que cumplan con los requisitos de error
mnimo deseado. No obstante, existe la posibilidad de que en un grado ms de introduccin
de conocimiento a priori, se diseen clasificadores hbridos de variables continuas y
discretas. Si esta posibilidad no es introducida en este momento, es porque como tal
implica una accin de razonamiento humano y por ende no hay posibilidad de
implementacin como algoritmo de computador.
En este proceder hay tambin implcita una seleccin de las caractersticas. Ya que
la eliminacin de componentes implicar la bsqueda de un subespacio del cluster que siga
una determinada ley de distribucin. A continuacin se presenta el refinamiento del cluster
mediante la bsqueda de subespacios normales.
5.3.1

Distribuciones multinormales
Se considera una de la ms importante de las distribuciones multivariantes. Es una
generalizacin n-dimensional de la normal univariante. En general, se asimilan a esta
distribucin conjuntos de variables tales como bateras de tests psicolgicos, medidas
biomtricas, variables socioeconmicas, etc. En Reconocimiento de Formas, es una de las
distribuciones ms utilizadas. Las causas son mltiples, algunas razones a destacar son, la
aplicacin del teorema de valor central, tal como se vio en la deteccin de defectos, la
facilidad del diseo de clasificadores, la aplicacin de la distancia de Bhattacharrya como
lmite superior del error de Bayes, las sencillas expresiones del sesgo y la varianza para
distribuciones normales, etc.
Se dice que las variables aleatorias x1,....,xn siguen una distribucin normal, si
existen n variables independientes y1,...,yn ,con distribucin N(0,1), verificndose :
xi = mi + ai1 y1 + + ain yn

i =1

( 5.28 )

donde m1,..., mn son constantes y A = (aij) es una matriz n x n no singular.


Indicando X= (x1,....,xn)T, Y= (y1,....,yn)T y M= (m1,....,mn)T, ( 5.28 ) se expresa tambin
en la forma :

DISAM-UPMT-98-015

169

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

( 5.29 )

X = AY + M

Se designar la distribucin normal multivariante por N(M,). Es una distribucin


que depende solamente de los n parmetros de M y de los n(n+1)/2 de la matriz de
covarianza .
5.3.1.1 Propiedades de la normal multivariante
1. M es el vector de medias y es la matriz de covarianzas. En efecto, al ser E{yi} = 0 se
deduce E{xi} = mi ; adems, como E{yiyj} = 0, E{yi2} = 1, se tiene que :

ci , j = E ( xi mi ) x j m j

)} = E a

ih

yh a jk yk =
k

n
E aih a jk yh yk = aih a jh
h ,k
h =1

( 5.30 )

relacin que equivale al producto matricial


( 5.31 )

= AAT
La funcin de densidad conjunta de x1,..., xn es
f ( x1 ,..., x n ) =

(2 )

n/2

1/ 2

exp ( X M ) T 1 ( X M )
2

( 5.32 )

siendo X = (x1,..., xn)T. Indicando tambin Y= (y1,..., yn)T, como las variables
independientes y1,..., yn, su funcin de densidad conjunta es:
f ( y1 ,..., y n ) =

1
1

exp Y T Y
n/2
(2 )
2

( 5.33 )

la transformacin que pasa de Y a X es lineal, vindose que el jacobiano de la


transformacin inversa es J=A-1, cuyo determinante es J = 1
Y T Y = ( A 1 ( X M )) ( A 1 ( X M )) = ( X M ) 1 ( X M )
T

170

1/ 2

. Entonces
( 5.34 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

2) La distribucin de toda variable marginal xi es normal univariante


3) La distribucin marginal tambin es normal univariante
4) Si X es N(M,) y B es una matriz p x n y V es un vector 1 x n, entonces Z = BX
+ V es normal N(BM + V, BBT)
Al aplicar la transformacin a X = AY + M, quedar Z = BM + V + BAY, siendo
la matriz de covarianzas Z = BAATBT=BBT
5) Cualquier subconjunto formado por m variables (m < n) de X sigue tambin la
distribucin normal multivariante.
6) Incorrelacin implica independencia estadstica, es decir, si es una matriz
diagonal, las variables x1,..., xn son estadsticamente independientes. En efecto,
sustituyendo en ( 5.32 ), se obtiene que la densidad conjunta es igual al
producto de las marginales
7) Si las variables x1,..., xn son N(M,2In), y por lo tanto independientes, y Z = TX
es una transformacin lineal definida por una matriz ortogonal, entonces las
variables z1,..., zn son tambin independientes. Al utilizar la propiedad 5), la
nueva matriz Z = T 2In TT = 2In
8) Si X es N(M, ) entonces la distancia de Mahalanobis, (X-M)T -1(X-M), sigue
una n2. Al realizar una transformacin Z = -1/2(X-M), por la propiedad 5), Z es
N(0,I), luego
Z T Z = z12 +...+ z n2

( 5.35 )

es la distribucin de la suma de cuadrados de n variables N(0,1) independientes, es


decir, definicin de una n2.
Para la distribucin normal multivariante, la independencia estadstica queda
caracterizada por la incorrelacin y la regresin es siempre de tipo lineal. En consecuencia
esta distribucin se adapta muy bien a determinados mtodos de Anlisis multivariante,
que expresan relaciones de dependencia segn modelos lineales.
La normalidad univariante de cada una de las variables xi, no es condicin
suficiente de normalidad multivariante. Se pueden construir diferentes familias de
distribucin multivariante no normales, cuyas marginales sin embargo lo sean. Existen
diferentes pruebas para comprobar si una muestra aleatoria simple, de tamao N, se ajusta
a una distribucin normal multivariante. Se pueden citar mtodos basados en la
comparacin de la distancia de Mahalanobis respecto a una 2 de carcter grfico,
distribuciones , test de Box Cox, o normalidad de marginales. No obstante, de los

DISAM-UPMT-98-015

171

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

mtodos mencionados, se ha utilizado la verificacin de normalidad proyectando las


muestras en componentes principales, por ser un test fcilmente implementable en
algoritmo de computador.
Por lo que procede estudiar la posibilidad de parametrizar las funciones de densidad
de los clusters mediante funciones normales. Con este objetivo se va a desarrollar una
metodologa de bsqueda de la normalidad mediante el test oportuno o en caso de no
cumplir el criterio, buscar la transformacin adecuada para convertir la poblacin en
normal.
5.3.1.2 Test de normalidad
El test de multinormalidad consistira en comprobar la normalidad de cada variable
xi, aplicando algn test existente ( rectas de Henry, pruebas 2, test de Kolmogorov, etc. ).
Sin embargo, esta condicin es necesaria pero no suficiente. Aunque, en el caso de tener
una sola de las variables que se desva de la normalidad, implicar la falta de validez de la
hiptesis de partida. sta herramienta ser posteriormente utilizada para la exploracin de
los posibles espacios normales.
Si se efecta la proyeccin de la poblacin sobre componentes principales, y
seguidamente se aplica un anlisis de normalidad a cada una de ellas, la prueba de
multinormalidad cumple con el requisito de ser necesaria y tambin suficiente. En efecto,
la distribucin de x1, x2, ..., xn es normal multivariante si y solo si es normal univariante la
distribucin de cada una de las n componentes. Es una consecuencia de la propia
definicin de normal multivariante.
Adems, es aconsejable tambin aplicar las desigualdades de Bonferroni[Cox78],
esto es, si H1, H2, ..., Hn, representan las afirmaciones hipotticas de "F1 es normal", "F2 es
normal", etc, siendo F1, F2,.. las componentes principales, entonces se verifica que:
P H1 

H

1 P
i =1

( 5.36 )

siendo P( Hi ) la probabilidad de que la afirmacin "Fi es normal" sea rechazada


cuando es cierta, y P(H1 ... Hn) es la probabilidad de que las n afirmaciones de
normalidad sobre las componentes sean aceptadas cuando son ciertas, y exista por tanto,
normalidad multivariante. Suponiendo que el nivel de significacin para el test de
normalidad sobre cada componente sea /n, es decir, P( H i ) = / n (probabilidad de
equivocarse al rechazar Fi como normal); la probabilidad de acertar al afirmar que la
distribucin es normal multivariante ser:

172

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

P( H1  ...  H n ) 1 n

( 5.37 )

y el nivel de significacin de esta prueba conjunta ser inferior a . Por ejemplo, si


se desea comprobar la normalidad multivariante con un nivel de significacin de 0.05 y el
espacio es de dimensin 5, se verificar la normalidad de cada componente (prueba de 2,
tests de Kolmogorov o Shapiro, etc.) con un nivel de significacin de 0.01.
No existe un contraste ptimo para probar la hiptesis de normalidad. La razn es
que la eficacia de la prueba depende del tamao muestral, y de la verdadera distribucin de
los datos. Desde un punto de vista poco riguroso, el contraste de Shaprio y Wilks es, en
trminos generales, el ms conveniente en muestras pequeas ( N < 30 muestras ), mientras
los contrastes 2 de Pearson y de Kolmogorov-Smirnov, son ms adecuados para muestras
grandes.
Para el caso de patrones de defectos en planchas de aluminio, ha sido utilizado
como mtodo de contraste de normalidad el de Shapiro y Wilks. El motivo es el nmero de
muestras en los clusters que era bajo, entre seis y la treintena de ejemplos.
Este contraste mide el ajuste de la muestra al dibujarla en papel probabilstico
normal a una recta. Se rechaza la normalidad cuando el ajuste es bajo, que corresponde a
valores pequeos del estadstico.
La justificacin del contraste se basa que cuando la muestra est ordenada
x1 x2 x N

( 5.38 )

en la hiptesis de que estos valores provienen de una distribucin normal con media
y varianza 2, los valores estandarizados
x1

x2

xN

( 5.39 )

sern una muestra ordenada de una poblacin N(0, 1), cuyos valores estn
tabulados. Sea Ci,N el valor esperado del trmino que ocupa el lugar i en una muestra de
tamao N de una poblacin normal, es decir :
x i
E
= Ci N

( 5.40 )

entonces :

DISAM-UPMT-98-015

173

Inspeccin automatizada de superficies homogneas mediante Visin artificial

[ ]

E x i = + Ci N

Carlos Platero

( 5.41 )

Por tanto, el grfico de x(i) respecto a Ci,N ser, aproximadamente una recta cuya
ordenada en el origen estimar y con pendiente . La expresin de los coeficientes de
Ci,N es complicada, pero puede aproximarse por :
i3 8
Ci N = 1

N + 1 4

( 5.42 )

La construccin del test de normalidad consiste en medir el ajuste de los puntos a


una recta por el cuadrado del coeficiente de correlacin lineal:
2

x i Ci N

r 2 = i =1 N

N Ci2N
i =1

( 5.43 )

Al tener los coeficientes simetra, el test resultante puede escribirse en la forma:


2

1 h
A2
w=
xj =
a x
N 2 j =1 j n N j +1
N 2

( 5.44 )

donde  2 es la varianza muestral, h es N/2 si N es par y (N-1)/2 si es impar y los


coeficientes aj,N se obtienen con:

aj N =

Cj N
N

C
j =1

jN

( 5.45 )

Shapiro y Wilks han tabulado los valores exactos de aj,N sin utilizar la
aproximacin de ( 5.42 ). Las pruebas experimentales fueron realizadas mediante la
insercin de dichas tablas.

5.3.1.3 rbol de bsqueda de espacios normales


Considerando las propiedades de normalidad de las poblaciones, se pas a la
bsqueda de esta propiedad. El refinamiento de clustering viene dado al imponer la
condicin de distribucin normal. Una vez eliminadas las variables discretas se pasa a

174

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

localizar los subespacios normales. El mtodo de actuacin consiste en la generacin de un


rbol de bsqueda de los posible espacios normales en cada cluster.
n
Aunque la bsqueda de espacios normales pudiera parecer explosiva, por ser
m
combinaciones con m = 1,..., n, al aplicar la condicin necesaria, de que cualquier
subconjunto debe ser tambin normal, limitar las posibilidades de exploracin. Para el
examen de los posibles espacios, se va a generar un rbol que indique los espacios
normales.
La construccin del rbol se hace atendiendo a los siguientes criterios:
1. Del nodo raz colgarn todas las componentes que cumplan normalidad,
enumerndose de izquierda a derecha, de 1 hasta m1. La notacin mi indica el
nmero mximo de nodos en la capa i.
2. Los nodos que no pasen el test de normalidad no tendrn descendencia. El
subespacio estar formado por las componentes que van desde la raz hasta el
nodo antes de no tener descendencia.
3. Los descendientes de cada nodo estarn constituidos por componentes situadas a
la derecha segn enumeracin. Por ejemplo, si el nodo corresponde a la
componente etiquetada 3 y hay 6 componentes, tendr como descendientes, 4, 5
y 6.
4. La mxima profundidad del rbol indicar la mayor dimensin del subespacio
normal del cluster
Para la implementacin del rbol se ha utilizado el siguiente algoritmo:
I.

Inicializacin :
A.
Construccin de un vector gua formado por las caractersticas del espacio, V
B.
Inicializar V = [ 0 ], luego dimensin 1, dim(V) = 1.
C.
Definir la dimensin mxima del espacio, n
Mientras dim(V) sea distinta de cero
A.
Incrementar en uno V(1)
B.
Test de normalidad en las dos poblaciones,
C.
Si el min(1, 2) > c hacer II.D en caso contrario saltar a II.E
D.
Aumentar la dimensin del vector V con dicha componente V(1),
0
E.
V=[ V(1) V ]
F.
Si la dimensin de V es igual a n, eliminar la primera componente de V
3
4
5
G.
Saltar a II

II.

5 3

Figura
5.16
bsqueda

rbol

DISAM-UPMT-98-015

de

El procedimiento genera un rbol de los posibles


espacios normales. La figura 5.16 muestra un grfico de
como queda la exploracin con una dimensin n = 5, las
aspas indican que no ha pasado el test de normalidad.
Los posibles recorridos del rbol desde la raz hasta cada
nivel, determinarn las posibles soluciones del espacio.
Una buena medida para ahorrar tiempo computacional

175

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

es ordenar las caractersticas de menor a mayor ndice de normalidad, llamando 1 a la


caracterstica de menor normalidad y n la de mayor ndice marginal de normalidad.
Otra posibilidad sera realizar transformaciones no lineales capaces de buscar
subespacios normales, con tal motivo se pasa a su estudio.
5.3.2

Transformaciones normalizantes
Se sabe que slo una transformacin lineal de las variables X con distribucin
normal multivariante da lugar a otra distribucin del mismo tipo. Sea entonces una familia
de transformaciones
X = x1

xn X

= x11

xnn

( 5.46 )

y supngase que para alguna transformacin particular 0 las variables


transformadas siguen la distribucin normal multivariante. Luego X es normal
multivariante si y slo si 0 es lineal. Pudiendo construir una prueba de normalidad
planteando el contraste
H0

= 0 (lineal)

Rechazar H0 quiere decir que existe una transformacin no lineal tal que X() es
normal multivariante y por tanto significa rechazar la normalidad de X.
Si X es un vector aleatorio que no sigue una distribucin normal, existe una potente
familia de transformaciones no lineales estudiada por Andrews et al[Andre71], capaz de
normalizar los datos observados, siendo una generalizacin de las transformaciones
univariantes Box Cox[Box64]. Cada transformacin viene definida por el vector de
parmetros, = (1, , n)T, de la siguiente forma

x jkk

x jk + m K 1

=
k

x jk + m

para k 0
para k = 0

( 5.47 )

con j = 1,, N y k = 1,, n, siendo N el nmero de muestras, n la dimensin del


espacio y m se elige de forma que para cualquier x + m sea siempre positivo. Por lo tanto,
m ser cero si se trabaja con datos positivos e igual en valor absoluto al valor ms negativo
observado. Suponiendo m=0 y en el caso unidimensional, es fcil ver que el logaritmo es la
transformacin lmite cuando tiende a cero. Escribiendo x como elnx,

176

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

x =

( 5.48 )

cuando tiende a cero la transformacin anterior queda indeterminada. Utilizando


la regla de LHpital y derivando numerador y denominador :
e ln x ln x
= ln x
0
1

lim x ( ) = lim
0

( 5.49 )

esta familia incluye transformaciones logartmica, lineal, raz cuadrada y la


inversa. Cuando > 1, la transformacin produce una mayor separacin o dispersin de los
grandes valores de x, tanto ms acusada cuanto mayor sea el valor de , mientras que < 1
el efecto contrario : los valores de x grandes tienden a concentrarse y los valores pequeos
a dispersarse. Si es la unidad, habr transformacin lineal, es decir, la muestra sigue
normalidad.
5.3.3

La estimacin de MV de las transformaciones Box Cox


()

La relacin entre el modelo para los datos originales X y para los transformados
ser :
f X = f X

( 5.50 )

J X

siendo J(X) el determinante jacobiano de la transformacin inversa X() X, que


es
J X =

J
k =1

=
k =1 j =1

dx jk k
dx jk

=
k =1

x
j =1

k 1
jk

( 5.51 )

Suponiendo que X() sigue una N(,) para un determinado . La funcin de


densidad de las variables originales ser :
f X = 1

n 2

1
X j M

1 X j J X

( 5.52 )

Por tanto, la verosimilitud de la muestra es una funcin del vector de medias , la


matriz de covarianza y el vector

DISAM-UPMT-98-015

177

Inspeccin automatizada de superficies homogneas mediante Visin artificial

LM =

1 2

n 2

j =1

Carlos Platero

T 1
X j X j J X
2

( 5.53 )

el logaritmo de la verosimilitud es (salvo una constante)

1 N
traza 1 X j X j
2 j =1

N
L =
2

}+

J X

( 5.54 )

indica la regin de los n+n(n+1)/2 +n parmetros de , y . Para unos


parmetros fijados 1, ,n, la estimacin mximo-verosmil de y es
M

= x1 1

1
 =
N

x n n con

i =1

xk k =

1
N

x
j =1

Xi M Xi M

k
jk

( 5.55 )

( 5.56 )

Al sustituir estos valores en la verosimilitud se obtendr lo que se denomina la


funcin de verosimilitud concentrada en . Su expresin es, prescindiendo de constantes
L = max L =
MC

N
2

J x

( 5.57 )

Esta funcin slo depende de y los datos originales X. El siguiente paso consiste
en hallar el mximo de L() mediante algn algoritmo numrico.
Definiendo X() como la matriz de N x n de datos transformados
L =

N
2

I n 1N 1N T

N X

J x

( 5.58 )

considerando para cada columna k de la base de datos X(), el vector de variables


zij k = xijk J 1k N
normalizadas Zk k = zij k
LEMA 1: Siendo Z = Z11 Z22
Zn n una matriz de N x n variables
normalizadas. La funcin de mxima verosimilitud para es :

178

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Lmax =
Demostracin :

N
2

Z T I n 1n1n T

Definiendo

N Z

( 5.59 )
( J 11 N

diag

J1n N )

as

que

N 2 J 2 N X = N 2 D 2 . Desprendindose que las variables normalizadas se


pueden poner como Z()= X()D-1,
L =

N
2

D 1 D T I N 1N 1N T

N X

D 1 D +

J x

( 5.60 )

Para propsitos computacionales, la expresin ( 5.60 ) muestra que el estimador de


mxima verosimilitud consiste en minimizar en el determinante :
Z T I N 1N 1TN Z

( 5.61 )

En principio, la minizacin de ( 5.61 ) puede ser realizada mediante la apropiada


subrutina numrica. Sin embargo, es comn encontrar problemas en el determinante del
jacobiano, J(X), particularmente cuando N es grande. Considerando el lema anterior se
deduce la propiedad de invariante de ante escalamientos, recurso que es utilizado para
salvar el mencionado problema.
5.3.4

Cambios de escala de la poblacin


Teorema : Siendo S = diag (s1,...., sn) donde sj > 0, para j = 1,..., n, y considerando
el cambio de escala X = XS 1 . Escribiendo, en la anterior notacin, la correspondiente
matriz normalizada a Z = Z 1
Z n . El resultado es:
Z

Demostracin:
q j = sj 1 J j1

I N 1N 1TN Z

= S 2 Z T I N 1N 1TN Z

Escribiendo X = x1

xn tal

x j s j j , para j = 1,...,n, adems J j x j =

que no es difcil llegar a demostrar que zij

= J

1 n
j

xj = xj

que
N

x
i =1

( 5.62 )

ij

j 1

sj ,

llamando

= snj 1 j J j x j . Por lo

x j xij j = s j 1zij j + q j . Concluyendo

con:

DISAM-UPMT-98-015

179

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Z = Z S 1 + 1n Q T

( 5.63 )

donde el vector Q = (q1,..., qn)T. La expresin ( 5.62 ) se obtiene de ( 5.63 ),


observando que (IN-1n1nT/N) = 0.
Como consecuencia de ( 5.62 ), el determinante de  no es afectado por el
escalamiento de la matriz de datos, por una coleccin de constantes {sj}. Por ejemplo en la
prctica, es usual elegir el j-simo componente como s j = max xij , tal que en la nueva
1 i n

matriz X de datos, sus valores se encuentran entre 0 y 1.

Determinacin de 

5.3.5

Aunque algunos autores[McLac92] recomiendan evitar el problema de


optimizacin de ( 5.61 ) mediante la estimacin marginal,  M = jM , sin embargo,
Velilla [Velil92] deja constancia de la posibilidad de obtener un ptimo estimador  , a
partir de las soluciones marginales. El mtodo propuesto por l es el siguiente:
1. Seleccionar el valor inicial a partir de los estimadores marginales,  M .
2.Utilizar el mtodo numrico de Newton-Raphson, empezando con el valor inicial
del punto anterior. El ptimo valor de  se obtiene mediante la minimizacin de ( 5.61 )
t +1 = t L

( 5.64 )

En aplicaciones, la funcin -L() es tpicamente convexa y el algoritmo converge


despus de pocas iteraciones. Las expresiones del vector del gradiente y la matriz Hessiana
tambin se encuentran en [Velil92]. Haciendo uso de la nomenclatura de transposicin de
vectores en una matriz, sea una matriz H= (H1,...,Hn), de tamao N x n, Hj(u) significa
reemplazar en la columna j de H el vector columna u, adems, Hjk(u,v) es el
reemplazamiento de las columnas j y k por los vectores columna u,v, respectivamente. Del
trabajo de Velilla se deducen los coeficientes del gradiente y de la matiz Hessiana como:

L
= n M
r

180

Zr T (Wr r ) AZ

( 5.65 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

2L
= n M
2 r
2L
= n M
r s

[Z

T
r

[Z

T
rs

(W ) AZ (W ) + Z
r

(W

AZr (U r r

)]

Ws s ) AZ + Zr T (Wr r ) AZs (Ws s

( 5.66 )

)]

( 5.67 )

Para todo r,s = 1 ,...,n


la notacin empleada es A = (In - 1nT1n), M() = Z()TA Z(), Wj j = Z j j
j

j y

2 j . Las expresiones para Wj y U j son dadas por


U j = 2Z j
Atkinson[Atkin89]. Similares expresiones han sido deducidas, considerando los vectores N
x 1 de Wj j = w jk j y U j j = u jk j :
x jkk

x jk x jk k

w jk =

x jk

k2

( 5.68 )

x
+

k
jk

x jk

+ xlk
l =1
k

1 N

(x

k
jk

x jkk

x jk

J 1k n
w jk

5.3.6

1 N

J1k n

2 x jk k x jkk
k
jk

xlk
l =1

k
jk

xlk
l =1

1 N

( 5.69 )

Intervalos de confianza y prueba de normalidad


Este procedimiento proporciona adems intervalos de confianza para el valor de
y un test de normalidad. En efecto, la distribucin del logaritmo del ratio de
verosimilitudes es asintticamente una 2 con n grados de libertad. Al estar prximo el
estimador  de su verdadero valor , sus verosimilitudes sern puntos anlogos.
Desarrollando en serie L() alrededor de 

 + L 
 +1
 TH


L L
2

DISAM-UPMT-98-015

( 5.70 )

181

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

donde L() representa el vector de las primeras derivadas, y H() es la matriz


hessiana de segundas derivadas, ambas evaluadas en el punto =  ; como, por
definicin, las primeras derivadas son nulas en el mximo, y la matriz hessiana es, en ese
punto, definida negativa. El contraste de razn de verosimilitudes, es :
 L  T H  
2L

( 5.71 )

que es la distancia de Mahalanobis entre y  . En efecto, si es cierto que estn


prximas, asintticamente  es centrado, con media en el verdadero valor y matriz de
varianzas y covarianzas (-H(  ))-1, teniendo adems una distribucin normal. Como sea
cierta la hiptesis, el contraste sigue una 2 con n grados de libertad.
Fijando un nivel de confianza , se puede construir un intervalo de confianza para
el valor de la funcin de verosimilitud en el verdadero valor de . Sea 2() el valor de la
distribucin 2 con n grados de libertad que deja la probabilidad a la izquierda, entonces:
 L 1 2
L
2 n

( 5.72 )

 1 2
L L
2 n

( 5.73 )

que implica:

^
L()

L()

cortando la funcin L() con la ordenada


 1 2 se obtendrn dos valores para el
L
2 n
parmetro que definirn un intervalo de
confianza para . Si el valor de est incluido
en dicho intervalo, se aceptar la hiptesis de
normalidad con un nivel de significacin ,
mientras que se rechazar la normalidad en otro
caso. Este contraste es muy potente para detectar
asimetra, pero poco eficaz
para
el
apuntamiento[Pea87].

Figura 5.17 Estimacin grfica de y de


un intervalo de confianza

182

DISAM-UPMT-98-015

Carlos Platero

5.4

Captulo 5: Anlisis de los datos

Agrupacin de datos en los defectos de planchas de


aluminio
Para ilustrar la forma de abordar este tipo de tareas, se utiliza el estudio de la
clasificacin de defectos en planchas de aluminio mediante colada continua. Conviene
tener presente que la metodologa que aqu se desarrolla, en principio, podra ser aplicable
a problemas de muy diferentes campos, con el Reconocimiento de formas como
denominador comn.
Partiendo de las imgenes segmentadas, conseguidas mediante el sistema de
deteccin de defectos locales, se tiene la intencin de clasificar los defectos en cinco u
ocho clases, segn se puede ver en la Tabla 5.2. Las imperfecciones obtenidas en el
proceso de obtencin del aluminio, quedan reflejadas en su apariencia, de esta manera es
posible manejar el tipo de problema que se ha producido en la planta, mediante la
inspeccin visual de la superficie. Las diferencias a cinco u ocho consisten en una
subclasificacin de tres defectos principales. A ocho tipos, adems de los cinco anteriores,
se distinguirn faltas de material pequeas o grandes, lneas calientes o araazos y bandas
transversales claras o pegados. El captulo 7 muestra las formas visuales de los diferentes
tipos de alteraciones producidas en las planchas.

Tabla 5.2 Defectos del aluminio colado


Nombre del defecto

Apariencia

Causa

Carencia de material (La) (Lg)

Faltas de material en secciones de la


lmina

Insuficiente suministro de nivel de


caja

Cristalizacin anormal (Cr)

Presentacin de bandas opacas


longitudinales en la superficie

Exceso de grafito

Adhesiones (St)

Bandas transversales oscuras y


distorsiones en la lmina

Insuficiente lubricacin

Bandas brillantes(Br)

Presencia de bandas transversales


brillantes

Presencia de burbujas

Lneas calientes (Lo) (Ar)

En una primera etapa bandas oscuras


y longitudinales, y luego superficie
con agarrones

Incremento de temperatura

Desconches en el fundido (Tr)

Reconocible por la presencia de


bandas transversales oscuras

Atascamiento de tolva

DISAM-UPMT-98-015

183

Inspeccin automatizada de superficies homogneas mediante Visin artificial

5.4.1

Carlos Platero

Extraccin del vector de caractersticas


La metodologa a partir de la deteccin de los defectos, consiste primeramente en el
estudio de las caractersticas obtenidas de la etapa de extraccin, en segundo lugar es
preciso realizar una seleccin de las mejores caractersticas tomando la informacin ms
relevante. Para una mayor interpretacin de la estructura de los patrones se le someter a
anlisis de los datos, con el fin de conocer las posibles subclases subyacentes en la muestra
controlada. Estos grupos servirn para el diseo de los futuros clasificadores.
Para la primera etapa se hace uso de tcnicas de anlisis sintctico[Fu88][Fu82]
para la representacin del defecto y se extrae el mayor nmero posible de atributos de los
objetos, caractersticas de la forma de los lmites y de las regiones con tcnicas de
transformacin escalar, atendiendo a la clasificacin de Pavlidis[Venon91]. Las diferentes
fases de decantacin de las primitivas provocaron la seleccin de los descriptores de los
objetos. El conocimiento de direcciones privilegiadas de los defectos en bandas
transversales, horizontales o en manchas, hizo sugerir la utilizacin de algoritmos de
continuidad de la masa defectuosa, obtenindose la transformacin de objetos a elementos
terminales comunes a todas las gramticas. Y asociados con los elementos terminales se
pasan atributos de mayor nivel de abstraccin que en la anterior etapa. Estos elementos
terminales sern las fuentes de informacin para los siguientes mdulos.
5.4.1.1 Mtodo de obtencin de las elementos terminales
Una vez
detectado el defecto,
segmentado y etiquetado. La tarjeta de visin
pasar los descriptores de los objetos que
servirn de vector de entrada al algoritmo de
agrupacin. Posteriormente se hace una
ordenacin por reas de los objetos en cada
regin de imagen de inters, pasando
seguidamente a caracterizar cada objeto por
su forma (puntos, manchas, cuerpos
longitudinales y cuerpos transversales) y por
su compacidad. Seguidamente se asocian
objetos a un elemento terminal a partir de los
objetos ms significativos (semillas),
utilizando principios de continuidad y
proximidad. Ultimando la operacin con el
etiquetado y paso de caractersticas de medio
nivel de los elementos terminales. La
tonalidad del defecto supone etiquetamientos
separados, de un lado defectos con
apariencias claras y posteriormente defectos
tipos oscuros.

184

Figura 5.18
Asociacin de objetos a un
elemento terminal

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Por cada defecto se tendr un rbol de informacin, en el que cada nodo de este
rbol, estarn presentes los elementos terminales y la informacin de medio nivel, de cada
una de las regiones de imagen de inters implicados en el defecto. La figura 5.19 muestra
la forma de actuar con dos tipos de defectos.
Llegado a este punto se tendr una coleccin de
elementos terminales dispuesta a ser analizada por los
clasificadores basados en reglas de concatenacin, pero
tambin es requerido un vector de caractersticas para los
clasificadores basados en datos. Se necesita aplicar una
transformacin desde la agrupacin secuencial de
elementos terminales a un vector de caractersticas con
dimensin n.
Si la representacin de los objetos mediante
elementos terminales es posible y fiable, para el caso aqu
tratado as lo muestran las representaciones virtuales y los
Figura
5.19
Ejemplos
de
resultados de los clasificadores sintcticos, stas se pueden descripcin de defectos mediante
convertir en fuentes de entrada para clasificadores basados elementos terminales
en un vector de caractersticas. Luego, la idea es condensar
la informacin de elementos terminales en un vector. Para tal fin, se puede hacer uso de las
reas asociadas a cada tipo de elementos terminales, momentos de inercia, suma de
permetros de los elementos terminales y otras posibles caractersticas que pudieran
integrar el vector de caractersticas.
Este mtodo ofrece mltiples ventajas. Primero si hay fiabilidad de la
representacin de los objetos mediante elementos terminales, la informacin generada es
infinitamente menor y por ende el vector de caractersticas tiene una dimensin muy
reducida.
Segundo, la calidad del vector de caractersticas viene determinado por la calidad
de informacin de los elementos terminales. La informacin de los elementos terminales es
de un nivel muy superior a los descriptores clsicos pues tiene informacin de la estructura
del defecto (si es alargado, tiene bandas, su situacin espacial,...).
Tercero, el vector de caractersticas se forma una vez que se tiene detectado la
totalidad del defecto. No hay un vector de caractersticas por cada imagen obtenida sino
por la globalidad de imgenes que constituyen el defecto.
Cuarto, las caractersticas son muy homogneas si se utilizan criterios comunes en
la seleccin de stas. Por ejemplo, la suma de las reas de cada uno de los elementos
terminales existentes.
Quinto, la dimensin del vector de caractersticas es muy pequea, ya que la
informacin contenida en cada uno de los elementos, es una informacin cualitativa y no

DISAM-UPMT-98-015

185

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

cuantitativa. La conclusin es inmediata, los clasificadores basados en vectores sern muy


rpidos y permitirn el uso de varios clasificadores complementarios en lnea.
El siguiente problema es construir el vector de caractersticas tal que ayudar al
correcto diseo de los clasificadores basados en datos.
5.4.1.2 Transformacin de elementos terminales a vector de caractersticas
La transformacin de la informacin de elementos terminales a vector de
caracterstica est formada por dos grupos de caractersticas, datos generales que hacen
referencias a las magnitudes de los defecto, y datos de la estructura interna, indicando los
porcentajes de las diferentes topologas que conforman el defecto total.
-Datos generales: Se especificar el ancho y largo de la totalidad del defecto,
mediante radios de giro para evitar la influencia de errores producidos por la segmentacin.
Tambin se aaden las coordenadas de sus centros de gravedad, junto con los momentos de
inercia del defecto total respecto de rectas horizontal y vertical que pasan por el centro de
masas. Estos cinco datos se calculan por separado para la parte del defecto que tenga
tonalidad oscura y para la que es clara, teniendo as los primeros 10 datos de entrada al
vector.
-Datos de estructura interna: Estos datos darn la informacin de cmo se
estructura el defecto en sus diferentes elementos terminales. Se da por tanto la suma de las
masas de cada una de las ocho diferentes clases de elementos terminales que componen el
defecto.
Un estudio cuidadoso del vector de las caractersticas fue realizado mediante
tcnicas de Anlisis multivariante. Hay dos tendencias tradicionales, la eliminacin de las
componentes que menos contribuyan a la explicacin de la varianza y el segundo mtodo
tratar de estimar nuevas caractersticas, menores en nmero, que siendo factores comunes a
las anteriores, recojan la discriminacin intrnseca de las clases[Escud77]. Esta ltima
tcnica ser desarrollada en el prximo captulo. En un primer bosquejo del estudio del
vector, se aplican las tcnicas de Anlisis discriminante desde una concepcin global, es
decir, observar el carcter discriminante en el espacio de entrada del problema. Las
componentes principales permitirn conocer el grado de explicacin acumulativa de cada
componente. De otro lado, para que las componentes representen adecuadamente tamao y
forma, deben cumplirse las condiciones de Rao[Rao71], esto es, todos los coeficientes de
la primera componente principal deben ser positivos, identificando tamaos, mientras los
coeficientes de las siguientes componentes deben ser positivos y negativos, discriminando
formas. Esta prueba fue superada por el vector construido. Adems se pueden utilizar
mtodos de anlisis de la varianza, como manova, que permiten dar un ranking de las
componentes del vector de entrada, bajo suposiciones de dependencia entre caractersticas
y distribuciones multinormales. Llegado a este punto, donde se tiene construido el vector
de caractersticas, se puede pasar al anlisis exploratorio de los datos.

186

DISAM-UPMT-98-015

Carlos Platero

5.4.2

Captulo 5: Anlisis de los datos

Anlisis de los datos


Para el primer anlisis se parte de los valores numricos de cada caracterstica
estandarizada, con la idea de dar inicialmente la misma importancia a todas [Spieg88].
xij =

xij x j

( 5.74 )

siendo x j y j la media y varianza de la componente j del conjunto de muestras,


mientras xij e xij es el valor de la muestra i de la componente j y su reducida.
El entrenamiento se hizo con enrejado hexagonal y funcin de vecindad gaussiana,
al favorece la estabilizacin del proceso de aprendizaje [Som92]. Por otro lado, como los
vectores de referencia Mi tienen que aproximarse a p(X), es deseable encontrar aquella
forma de los lados del array cuyas dimensiones correspondan con las magnitudes
principales de la distribucin del espacio de entrada, de lo que se desprende hacer una
primera observacin visual de p(X), por ejemplo con mapas de Sammon, y determinar la
relacin nx/ny3.
Se definieron procesos de aprendizaje, partiendo con diferentes valores iniciales de
los vectores de referencia, aplicando sucesiones de entrenamientos distintas y modificando
parmetros de aprendizaje. Al final, la seleccin del mapa ms oportuno fue de aquel con
menor error de cuantificacin.
Posteriormente, se procedi a la fase de etiquetamientos de las neuronas del mapa.
Kohonen propone un mtodo de votacin, por cada vector dato etiquetado se busca la
correspondiente neurona activa. Las neuronas del mapa se etiquetan de acuerdo con la
mayora de las etiquetas que golpean ( hitting ) una neurona particular del mapa. Las que
no son golpeadas se dejan sin etiquetar (XX).
El mtodo propuesto en la actuacin es ms restrictivo, al etiquetarse aquellas
neuronas que en el conjunto total de muestras ( testeo + aprendizaje ) han sido validadas
sin ninguna votacin en contra. Su origen reside en localizar la funcin de densidad del
cluster (ver apartado 5.2). El resto se marcar con YY o XX si no hay suficientes patrones
capaces de inferir el tipo de clase a la que pertenecen. Las neuronas YY muestran que ha
habido votaciones confusas o lo que es lo mismo, existe influencia de varias clases en el
conjunto de Voronoi de estas neuronas. La razn de etiquetarlas como confusas es
evidente, como ha sido comentado, stas son remansos de funciones de distribucin de
grupos vecinos. Los vectores de referencia son distribuidos estadsticamente segn el

Al utilizar los mapas de Sammon [SAMM69] para determinar la relacin nx/ny del caso que ocupa,
resulto ser de 28/23 y se probaron las combinaciones 7x5, 7x6, 8x6 y 8x7. Finalmente se escogi la
dimensin 8x6 por el menor error de cuantizacin

DISAM-UPMT-98-015

187

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

espacio de medidas, y si se parte de vectores bien definidos en sus componentes, el


entrenamiento provocar una discretizacin del espacio de entrada en regiones de
influencia. Cada regin estar dominada por un grupo homogneo de vectores. Y suceder
que existen neuronas, cuyos conjuntos de Voronoi confluyan grupos distintos. El objetivo
de marcarlas como defectuosas est claro, son justo estas neuronas a las que se debe prestar
mayor atencin e intentar solventar el problema de discriminacin introduciendo mayor
conocimiento a priori.

Tr Tr Lo Lo La La La La
Tr La Lo Lo La La La St
Tr Lo Lo Lo XX La La La
Tr Tr Lo Lo La La La St
Tr Tr XX Cr XX Cr XX St
Tr Tr Lo Cr St Cr St

Tr Tr YY Lo La La La La
Tr YY Lo Lo La La La St
Tr Lo Lo Lo XX La La La
Tr YY Lo Lo La La La YY
Tr Tr XX Cr XX Cr XX St

St

Figura 5.21 Etiquetamiento segn Kohonen


a cinco tipos

Tr Tr Lo Cr YY Cr St

St

Figura 5.20 Etiquetamiento propuesto

Hay que destacar cmo la eleccin de variables discretas influye en el mapa, as se


observa que de izquierdas a derechas hay una tendencia de defectos oscuros a claros. Y de
arriba abajo, de defectos de menor a menor tamao. Posteriormente este efecto podr ser
observado al terminar la fase de clustering.
Si los vectores de referencia son etiquetados con la muestra a ocho tipos de
defectos, los resultados son anlogos, obsrvese que la nica modificacin est en el
etiquetado y no en el aprendizaje (no supervisado ). Lo nico que aporta, es que la
clasificacin a ocho defectos es coherente con la muestra etiquetada a cinco. Las
diferencias son observables en el cambio de alguna etiqueta perteneciente al mismo macrogrupo (las bandas longitudinales se dividen en araazos y bandas, ..., etc).

188

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Tr Tr YY Ar Ar La La La

Tr Tr Tr Ar Ar La La La

Tr YY Lo Ar La La La Br

Tr La Lo Ar La La La Br

Tr XX Lo Lo XX La La La

Tr Ar Lo Lo XX La La La

Tr YY Ar Ar Lg Lg Lg YY

Tr Tr Ar Ar Lg Lg Lg St

Tr Tr XX Cr XX Cr XX St

Tr Tr XX Cr XX Cr XX St
Tr Tr Lo Cr St Cr St

Tr Tr XX Cr YY Cr St

St

Figura 5.22 Etiquetamiento segn Kohonen a


ocho tipos

St

Figura 5.23 Etiquetamiento propuesto a ocho

Estos mapas de rasgos han servido para detectar diferentes zonas de influencias
correspondientes a topologas de defectos similares. Desde el punto de vista del
Reconocimiento de patrones, los mapas de Kohonen han permitido empezar a conocer la
estructura inherente de los patrones.
La cuestin siguiente a abordar es la delimitacin de las regiones o dominios en el
espacio de entrada, que se correspondan con patrones similares, los cuales constituyan un
grupo homogneo. Esta informacin no est de manera explcita en los mapas, se propone
un proceso de decantacin de cluster basados en las U-Matriz de Utls et al combinadas con
descripciones de los patrones y pruebas de normalidad.

dz11

dy12

dz13

dx21

du

dx23

dz31

dy32

dx21

dz33

Figura
5.25
U-Matriz
entrenamiento rectangular

5.4.3

dy11

du

dy31

con

dy12

dx22

dy32

Figura 5.24 U-Matriz con


entrenamiento hexagonal

Aplicacin de las U-Matriz al anlisis de los defectos del aluminio


La primera dificultad planteada fue adaptar la filosofa de las U-Matriz a un
enrejado de tipo hexagonal, utilizado en la exploracin de los datos. En las vecindades

DISAM-UPMT-98-015

189

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

rectangulares, los autores proponen un valor medio de las distancias eucldeas entre
neuronas situadas en posiciones diagonales en forma de aspa (ver Figura 5.25), siendo sta
la interpretacin geomtrica de dz, correspondiente a la influencia colateral del
aprendizaje rectangular. Pero en el proceso de entrenamiento hexagonal, tales influencias
no existen, las neuronas presentan una agrupacin ms homognea, sus relaciones con las
vecinas son indistintas (ver prrafo sobre el estudio de la vecindad 5.1.1.7), no teniendo
necesidad de considerar evaluaciones distintas en la distribucin espacial; justificando la
modificacin en la obtencin de la U-Matriz, en cuanto que los elementos de la matriz
estarn formadas por las distancias de la neurona aij a sus vecinas, sin consideraciones de
valores promediados en las vecindades diagonales (Figura 5.24,Figura 5.25 ).
El resultado de aplicar los conceptos de la U-Matriz modificada sobre el mapa auto
organizado es mostrado en Figura 5.26. Una primera observacin muestra que los bordes
de separacin no son ntidos, pero s empieza a sugerir una versin preliminar de mapa de
rasgos. Es interesante apreciar cmo las neuronas etiquetadas como confusas, aparecen
rodeadas de grupos, confirmando las suposiciones anteriores de servir estas neuronas,
como remansos de las funciones de densidad de grupos prximos.

Figura 5.26 U-Matriz del mapa auto organizado de los defectos

Se distingue cmo en los defectos de mayor dimensin, en cuanto a la magnitud


fsica del defecto, sus distancias entre neuronas vecinas aumenta, reflejando que los
espacios de influencias de estas neuronas son ms grandes, indicando una mayor
variabilidad de los patrones visuales que tienden a ser representados por estas neuronas.
Pudiera pensarse en por qu no hay ms representantes de estas zonas, y si se ha de
suponer que los mapas tienden a ser imgenes de la funcin de densidad del espacio de
medida, tambin recibe el impacto de la probabilidad del tipo de defecto en aparecer en la
plancha. Tal constatacin queda medianamente clara en las tablas, de las que puede

190

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

apreciarse las probabilidades del defecto y el tanto por ciento de vectores de referencia
etiquetados como tal tipo ( efecto factor magnificacin ).

Denominaci
n del defecto

Probabilida
d del
defecto

Vect.Ref.Eti
q/Vect.Total
es

Tr

24

23

Lo

28

26

La

26

31

Cr

12

10

St

11

10

Tabla 5.3 Probabilidad


aparicin a 5 defectos

de

Denominacin
del defecto

Probabilidad
del defecto

Vect.Ref.Etiq/V
ect.Totales

Tr

24

23

Lo

12

15

Ar

14

11

La

24

26

Lg

Cr

12

10

Br

St

Tabla 5.4 Probabilidades de aparicin a 8


defectos

Otra observacin interesante es contemplar cmo los vectores de referencia


etiquetos son distribuidos de izquierdas a derechas y de arriba a abajo, con defectos de
oscuros a claros y de menor tamao a mayor, coincidiendo con las dos primeras
componentes principales de tamao y forma del vector de caractersticas, que garantizaba
las suposiciones de Rao. Vase que todas las variables del problema se distribuyen
esencialmente siguiendo uno de los ejes del mapa, bien el OX, bien el OY, de modo que la
categorizacin cuenta con dos dimensiones principales, referencindose tamao y forma.
Es sta una clara manifestacin de la seleccin automtica de los rasgos que, como se ha
explicado en este captulo, presentan las SOM. La dimensin relacionada con el eje OY es
fundamentalmente de tamao, mientras que la relacionada con el eje OX es de forma
(Figura 5.27).

DISAM-UPMT-98-015

191

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Tamao

Forma

Carlos Platero

De Oscuro a Claro

Figura 5.27 Componentes principales del mapa


La versin preliminar de los cluster es decantada por un lado de la U-Matriz, y al
no haber un umbral que defina con absoluta objetividad los grupos, el asesoramiento para
la definicin de stos, vendr dado por la descripcin de los patrones que cae en cada una
de las neuronas. Luego el planteamiento es el siguiente:
1. Mapa SOM +U-Matriz
2. Descripcin de las formas de los patrones para cada neurona
3. Formacin del cluster como asociacin de espacios de Voronoi que estn
prximos entre s (U-Matriz) y con descripciones de patrones similares.
La Tabla 5.5 recoge como se ha definido la agrupacin; la observacin de las
caractersticas de los patrones que caen en la influencia de las neuronas asociadas, puede
ser contemplado en la tercera columna, mientras la cuarta muestra la menor y mayor
distancia eucldea entre neuronas dentro del cluster y la quinta indica las distancias con las
neuronas vecinas de otros grupos; evidenciando que el mtodo ayuda pero no es
concluyente. Los resultados quedan reflejados en la figura 5.28.

192

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

Nmero del
cluster

Nmero de
neuronas

Descripcin

U-Min/U-Max

U-Min/U-Max

0,1,8

Conjunto de finas bandas transversales que ocupan entre 1/3 y


2/3 de la banda de una ROI

0.24/ 0.67

0.4/0.9

16,24,32,33,40

Bandas transversales oscuras de tamao medio y superior. Ocupa


casi o totalmente una ROI

0.44/0.67

0.78/1.62

41

Machas oscuras grandes de decenas de miles de pxeles oscuros

-/-

0.95/2.18

4a,b

3,4,10,11,18,19

Pocos pixeles defectuosos en forma de bandas longitudinales,


apariencia de araazos

0.25/0.84

0.62/1

26,27

Bandas longitudinales oscuras alrededor de unos centenares de


pixeles oscuros

0.48/0.48

0.78/1.96

5,6,7,12,13,14,21
,22,23

Falta de material pequea, centenares de pixeles defectuosos,


claros y oscuros

0.39/1

0.68/1.9

28,29,30

Faltas de material de gran tamao

1.19/1.37

0.92/4.06

35,43

Bandas longitudinales oscuras de 2 a 4 ROIS, con alrededor de


mil a diez mil pixeles oscuros defectuosos

1.32/1.32

0.85/1.53

37,45

Bandas con una ancha cabeza que disminuye longitudinalmente,


de 3 a 5 ROIS, decenas de miles de pxeles oscuros

2.37/2.37

2.38/3.36

10

39,46,47

Pegados de rodillo, no menos de 4 ROIS y ms de 10.000 pxeles


de error tanto oscuro como claros

1.65/3.19

2.33/3.36

11

15

Bandas transversales claras y grandes, cubren casi toda la banda


ROI y con un grosor entre 1/5 y 1/3

-/-

0.83/0.96

Tabla 5.5 Descripcin de los defectos

En los tratados de anlisis de datos se busca la formacin de los cluster como


adiciones de espacios de Voronoi correspondientes a neuronas prximas entre s y
catalogadas como similares. Este mtodo de actuacin puede ser utilizado cuando se
trabaja con mapas donde no hay conflictividades, es decir, mapas caracterizados por tener
ms neuronas que patrones, como es el caso de Serrano et al [Serran93] que estudia la
crisis bancaria espaola mediante SOM. Pero al utilizar un nmero mayor de patrones que
neuronas, como es el caso aqu planteado, y al existir neuronas confusas, no se trata de
definir si una neurona forma parte de un presunto cluster cuando sta ha tenido votaciones
contradictorias, slo constituirn un grupo aquellas neuronas sin votaciones en contra,
dejando sin agrupara las neuronas confusas.

DISAM-UPMT-98-015

193

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Las neuronas ya han hecho su trabajo,


dividir el espacio de caractersticas y
agruparse razonablemente bien formando
cluster, es el momento de introducir
metodologa estadstica para refinar el cluster
y realizar la seleccin de las caractersticas.

Figura 5.28 Grupos obtenidos despus de


aplicar el mtodo Cluster: 1- Bandas
transversales oscuras pequeas, 2Bandas transversales oscuras medianas,
3- Manchas oscuras, 4a,b- Araazos, 5bandas longitudinales oscuras, 6- Faltas
de material grande, 7 - Faltas de material
grande, 8- Cristalizacin anormal I 9Cristalizacin anormal II 10- Pegado de
rodillos, 11- Bandas brillantes

5.4.4 Eliminacin de componentes sin


informacin estadstica

En el proceso de formacin de los


mapas auto organizados, algunas de las
variables utilizadas son ms cualitativas que
cuantitativas, con el objetivo de favorecer la organizacin del mapa en regiones. As al
introducir estas variables, los tipos de patrones que ocupan posiciones muy diferentes en el
espacio de medida, tambin en sus proyecciones sobre el mapa de Kohonen observan
ubicaciones alejadas (vase figura 5.28 y Tabla 5.5 sobre los defectos en el aluminio).
En el caso de clasificacin de defectos visuales en el aluminio, al introducir
caractersticas segn la tonalidad del defecto en el vector, implica que parte de las
componentes de ste quedarn canceladas. Por ejemplo, existen algunos tipos de defectos
con una nica tonalidad, bandas longitudinales, bandas transversales y manchas, todas
ellas con apariencia oscura, mientras otras aparecen bandas brillantes con apariencia
exclusivamente clara. Las proyecciones en el SOM de estos dos tipos se encuentran
alejadas. Pero los clusters de la misma tonalidad estn prximos entre s y mantienen la
misma informacin de las caractersticas asociadas a la otra tonalidad. Por consiguiente
parte del vector de medidas quedar cancelado al no haber informacin, reducindose el
espacio sensiblemente. Estas componentes desde el punto de vista de inferencia de
funciones de densidad no aportan nada, al contrario tienden anular a la matriz de
covarianza. No obstante, pudieran ser atrayentes, en algunos casos, bajo el prisma de
obtencin de clasificadores hbridos de variables discretas y continuas.
La eliminacin no puede conseguirse mediante medidas de dispersin basadas en
desviaciones tpicas, al ser stas muy sensibles a observaciones atpicas. El uso de medidas
de dispersin asociadas a la mediana, tienen la propiedad de ser robustas frente al ruido de
las muestras. Para la valoracin de las componentes se toman las muestras que caen dentro
del presunto cluster y se aplica la meda, al que se ha modificado ligeramente para una
observacin rpida:

194

DISAM-UPMT-98-015

Carlos Platero

Captulo 5: Anlisis de los datos

u(mediana (| xij mediana ( xij )|)


i

i = 1,2,... nk

( 5.75 )

siendo xij la muestra i del cluster k de la componente j y u( ) una funcin de tipo


escaln. Cuando el resultado es uno, hace referencia a una componente no binaria, en caso
contrario sta s lo ser. Los resultados coinciden con la geometra y tonalidad de los
defectos, es decir, se anulan aquellas componentes que no tengan la tonalidad del defecto y
las que difieran en su fisionoma. Obsrvese la tabla de abajo que muestra lo mencionado
en este prrafo. Adems, se ha comprobado que los vectores de referencia corroboran las
componentes discretas, al tener similares coeficientes en estas componentes.
Cluster

Nombre

Componentes

Observaciones

Tr1

1,2,3,4,5 y 13

Banda transversal oscura de pequeo tamao

Tr2

1,2,3,4,5 y 13

Banda transversal oscura de mayor tamao

Tr3

1,2,3,4,5 y 15

Manchas oscuras

4a.b

Ln1

1,2,3,4,5,11 y 17

Bandas longitudinales oscuras de pequeo


tamao

Ln2

1,2,3,4,5,11 y 17

Bandas longitudinales oscuras de mayor


tamao

Lk1

1,2,3,4,5,6,7,8,9,10,15 y 16

Defectos oscuros y claros en forma de mancha

Lk2

1,2,3,4,5,6,7,8,9,10,11,
14,15,16,17

Defectos oscuros y claros en forma de mancha


de mayor tamao

Cr1

1,2,3,4,5,11 y 17

Bandas de cristalizacin con tonalidad oscura

Cr2

1,2,3,4,5,6,7,8,9,10,11,
12,13,16,17,18

Bandas de cristalizacin con faltas de material

10

St2

Todas las componentes

Bandas transversales claras y oscuras

11

St1

6,7,8,9,10 y 14

Bandas transversales claras

Tabla 5.6 Componentes seleccionadas tras la etapa de eliminacin de variables discretas

5.4.5

Bsqueda de espacio normales


Una vez eliminadas las componentes, se buscan los subespacios normales haciendo
uso del test de Shapiro y el algoritmo de exploracin, segn se vio en 5.3.1.3. Las pruebas
realizadas sobre los grupos de defectos de aluminio se reflejan en la tabla de abajo

DISAM-UPMT-98-015

195

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Cluster

= 0.2

= 0.15

= 0.1

12

4a,b

15

10

16

11

18

Tabla 5.7 Dimensin


subespacios normales

de

Carlos Platero

los

En la tabla queda constancia de los distintos subespacios normales atendiendo al


nivel de significacin, . Se observa que el cluster
4 tiene una nica componente que sigue
normalidad, por lo que se procedi a subdividir el
cluster tal que pudiera aumentar el subespacio,
pasando al definitivo mapa de grupos (ver figura
5.29). No obstante, el diseo de los clasificadores
paramtricos permitir localizar una seleccin de
las caractersticas en funcin de las
transformaciones normalizantes propuestas, esto
es, Box Cox. Al requerir informacin sobre los
clasificadores paramtricos, los resultados
experimentales se posponen para el siguiente
Figura 5.29 Mapa de grupos definitivo
captulo.

196

DISAM-UPMT-98-015

Carlos Platero

5.5

Captulo 5: Anlisis de los datos

Conclusiones
Se ha presentado una nueva metodologa de clustering paramtrico que empieza en
este captulo con el anlisis de los datos y finaliza en el siguiente con la seleccin de las
caractersticas y su parametrizacin. Su fundamento est en los mapas auto organizados, en
la parametrizacin del espacio mediante funciones normales y en las transformaciones Box
Cox. Se ha utilizado la clasificacin de los defectos locales en planchas de aluminio para
el desarrollo experimental.
Partiendo de una coleccin de muestras etiquetadas de defectos locales en planchas
de aluminio, se procedi a segmentacin de los defectos y a una extraccin de
caractersticas mediante tcnicas de anlisis sintctico. Posteriormente se pas a la
conversin de la informacin desde primitivas a un vector de L-dimensin, habindose
hecho la eleccin de las oportunas componentes.
El etiquetamiento de los defectos fue realizado mediante la percepcin visual de
stos y bajo las consideraciones oportunas de clasificacin dadas por el fabricante del
aluminio. As pues, se parte de una base de conocimiento etiquetada a cinco y ocho
defectos. Ahora bien, los defectos en una misma clase mantienen topologas bien
diferenciadas, lo que supone que los vectores de medidas no mantienen la misma situacin
en el espacio de caractersticas, efecto que ha podido ser estudiado mediante los mapas
auto organizados. Estos mapas de rasgos han servido para detectar diferentes zonas de
influencias correspondientes a topologas de defectos similares. Desde el punto de vista del
Reconocimiento de formas, los mapas de Kohonen han permitido conocer la estructura
inherente de los patrones, de lo que se ha comentado en esta tesis medianamente. No
obstante, la formacin de cluster no es inmediata a partir de la informacin otorgada por
dichas neuronas, ms bien es el principio; Ults et al proponen las U-Matriz como elemento
de apoyo en la formacin de los clusters en los patrones. La experiencia ha mostrado que si
bien es una buena herramienta, en este caso no decide de forma evidente las fronteras entre
los grupos; se podra decir que las fronteras obtenidas son difusas y no tan evidente como
exponen en sus artculos. Adems, sus propuestas van orientadas a matrices rectangulares y
es recomendable hacer uso de aprendizajes con vecindades hexagonales, pues la literatura
recomienda este entorno de vecindad para la formacin de mapas de rasgos; as que se ha
utilizado una nueva versin de las U-Matriz aplicada para vecindades hexagonales.
De otro lado, Kohonen propone para el etiquetamiento de las neuronas un proceso
de votacin de las muestras de aprendizaje y que de forma $democrtica las neuronas se
etiqueten con aquellas clases que ms votos hayan conseguido. La propuesta aqu hecha es
diferente, slo sern etiquetadas aquellas neuronas que hubieran conseguido unanimidad.
La razn es evidente, como es conocido, sus vectores de referencia son distribuidos
estadsticamente segn el espacio de medidas. Luego, si se parte de vectores de referencia
bien definidos, el entrenamiento habr generado regiones del espacio de entrada
dependiente de algn grupo inherente, por lo que los entornos de Voronoi pertenecientes a
neuronas etiquetadas con varias clases, correspondern con zonas de conflicto, en
definitiva que dentro de su regin de influencia, hay concurrencia de varias clases. La
experiencia ha corroborado con las suposiciones.

DISAM-UPMT-98-015

197

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Llegado a este punto se tendrn grupos de neuronas, en cuyos entornos de Voronoi


no hay duda de la validez de pertenencia de un vector cado en su entorno a la etiqueta
dada. No obstante, es menester indicar que la inferencia es extrada del conjunto de
muestras. Si a estos juicios se aade la informacin dada por las U-Matriz permitir
generar posibles clusters candidatos. Hay que decir candidatos, ya que las barreras
obtenidas por las U-Matiz son ms bien borrosas y orientativas, que definitivas, tal como
se ha comentado en 5.3. En esta coyuntura, se plantea reforzar la decisin de agrupamiento
mediante la bsqueda de subespacios normales.
Tal como se recoge en la formacin de un sistema de reconocimiento de patrones,
es necesario introducir tanto componentes continuas como discretas, si estas ltimas
cumplen con el requisito de tener comportamientos absolutamente dispares en regiones
diferentes. Estas componentes ayudan mucho en el mapa auto organizado a la hora de
separar regiones de influencia. Pero tambin es evidente que estas componentes dentro del
propio cluster mantienen valores muy similares. Desde el punto de vista de anlisis
estadstico, stas no van a dar informacin sobre la funcin de distribucin. Lo que supone,
no considerarlas explcitamente en el ndice de homogeneidad. El criterio utilizado es
primero verificar que las muestras pertenecientes al cluster, excluidas las componentes
discretas, siguen una distribucin multinormal; con tal fin se pasa el test de normalidad y
en caso de ser rechazada la hiptesis se plantean transformaciones no lineales siguiendo el
algoritmo numrico de Andrews et al.
Las transformaciones normalizantes de Box Cox permitirn obtener los subespacios
normales de los clusters, tal que dicha transformacin sea comn con otros grupos
cercanos, motivando una bsqueda que maximice la distancia entre grupos disjuntos y
cercanos. Con tal propsito, en el siguiente captulo se va a exponer la teora de
clasificadores paramtricos y sus medidas, pudiendo de esta forma acabar la tcnica de
clustering parametrizado.

198

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Clasificadores estticos

En general, en un sistema de inspeccin visual se trata de clasificar las formas


visuales de los defectos locales, ofrecindose stos como patrones de tipo esttico. Esta
definicin del problema acota el marco de trabajo, es decir, se est planteando el diseo de
un sistema que sea capaz de devolver una etiqueta asignada, ante un vector de
caractersticas extrado del defecto. El clasificador esttico no depende de las conclusiones
de un instante anteriores, sino slo del vector de entrada.
Otra de las peculiaridades de estos sistemas es la falta de muestras para el diseo de
los clasificadores. El coste de obtener las muestras o la escasez de frecuencias de algunos
tipos de defectos, hace muchas veces que el universo del problema sea escaso. Por otro
lado, si se mantiene en todas las componentes del vector de caractersticas igual relacin
seal ruido, el error de clasificacin aumenta con el incremento de la dimensin del
espacio. A este efecto se le llama fenmeno Hughes [Hughe68]. Por lo que sugiere buscar
una seleccin de las caractersticas determinadas por el numero de muestras y por la
capacidad de discriminacin del clasificador resultante.
Por todo ello, se ha trabajado en el diseo de clasificadores tanto paramtricos
como no paramtricos. Los primeros ofrecen la posibilidad de obtener expresiones
analticas tanto del error como del sesgo, as como facilitan la introduccin de
conocimiento a priori. Gran parte de este captulo se orienta a estos clasificadores (6.1). Se
empieza por un planteamiento general de los clasificadores paramtricos, de los que se

DISAM-UPMT-98-015

199

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

tratan de obtener las ecuaciones tanto de los parmetros para su diseo como de los
resultados obtenidos, expresndose stos en trminos de error de clasificacin.
Seguidamente se presenta un novedoso mtodo de parametrizacin - seleccin de
las caractersticas basada en las transformaciones Box Cox y en las distancias de
Bhattacharyya (6.3). El algoritmo considera el nmero de muestras que se tiene de las
poblaciones enfrentadas.
Dentro de los clasificadores no paramtricos y enmarcado en el contexto de
clasificadores lineales y cuadrticos, se estudia y se propone una modificacin de los
algoritmos de aprendizaje LVQ, pasando de la distancia eucldea a la Mahalanobis (6.4).
Por ltimo, la plausibilidad de lo propuesto ha sido demostrada en el trabajo
experimental para la deteccin de defectos locales en el aluminio colado (6.5), donde se
comparan los resultados obtenidos con otras tcnicas tradicionales de clasificacin.

6.1

Clasificadores paramtricos
Los clasificadores paramtricos se muestran como los clasificadores ptimos, al
minimizar la probabilidad de error [Fukun90]. Sin embargo, requieren del conocimiento de
la funcin de densidad de la seal de entrada, p(X), y en la mayora de las aplicaciones, las
funciones son estimadas por un nmero finito de observaciones, que en general resultan
insuficientes.
An en el caso de conocer la funcin de densidad, la implementacin suele ser
difcil por falta de metodologa. No obstante, el objetivo de parametrizar el espacio
encamina tanto a facilitar la introduccin de conocimiento a priori como a la seleccin de
las caractersticas. La primera por tener la intencin de buscar las transformaciones Box
Cox que permitan modelar las funciones de distribucin condicionales como funciones
normales, y la segunda por conocer el error de clasificacin mediante expresiones
analticas.
Desde el punto de vista de Bayes, el mejor clasificador que minimice el error ser
aquel que cumpla
p k p X k = max( p i p X i
i

X k

( 6.1 )

donde p(k) es la probabilidad de cluster k y p(X|k) es la probabilidad


condicionada de que X pertenezca a k. Si la distribucin condicional de X para las L
clases son normales y todos los cluster tienen igual probabilidad, ( 6.1 ) ser reemplazado
por:

200

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

1
min h(X ) = 2 (X M )

i1 (X M i )

( 6.2 )

siendo Mi y i el vector de medias y la matriz de covarianzas respectivamente del


cluster i. Ntese que se clasificar segn la menor distancia de Mahalanobis de X a cada
una de las clases. La ecuacin ( 6.2 ) constituye un clasificador a tramos con fronteras
cuadrticas. En el caso de tener todas las matrices de covarianza idnticas, X T i1 X de
( 6.2 ) seran comunes entre todas las clases, y la expresin se reducira a

min h(X ) = M iT 1 X M iT 1 M i
i
2

( 6.3 )

donde es la matriz de covarianza comn. X es clasificada a la clase de mayor


correlacin entre X y M i 1 . En general, las matrices de convarianza no son iguales, pero
los clasificadores lineales son ms robustos que los cuadrticos, como se expondr en este
captulo. Para estos casos, es reemplazado por la media de las covarianzas.
Sea como fuere, habrn h(X), cuadrticos o lineales, capaces de separar entre s las
mltiples clases que existieran. Asumiendo que la regin en cada clase sea convexa, como
muestra la Figura 6.1, la regin de la clase i puede ser especificada por
hi1 ( X ) < 0,..., hiL < 0

X i

[hii es excluida ]

como se evidencia de la Figura 6.1, las L


regiones dadas por ( 6.4 ) no necesariamente cubren
todo el espacio. Cuando una muestra cae en esta regin,
el clasificador no podr decidir. A esta zona se le llama
regin de rechazo.

( 6.4 )

h12= 0

h13= 0

regin
de
rechazo

h23= 0

La implementacin ( 6.4 ) consistir en (L-1)


x
funciones discriminantes y una puerta AND con L-1

3
h =0
x
entradas de signo hij, como muestra la Figura 6.2.

Cuando la suposicin de convexidad no se cumple,


4
h =0
habr de reemplazar la puerta AND por una estructura
lgica ms complicada. Consecuentemente, el Figura 6.1 Clasificadores a tramos
clasificador llega a ser demasiado complicado para
poder ser prctico. Por lo tanto, slo se limitar el
14

34

DISAM-UPMT-98-015

201

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

diseo en las siguiente discusiones a regiones convexas.


De otro lado, la probabilidad de error de cada clase, i, puede ser expresada en
trminos de probabilidad de rechazo, pr, quedando

i = 1 pr hi1 X > 0
1

ph

i1

hi1 X > 0 X i =
hi1 X i dhi1 dhiL

[h

ii

( 6.5 )

el error total es

p
i =1

( 6.6 )

Conociendo la estructura del clasificador a tramos, el problema consiste en disear


hij(X) para cada una de las L clases. Debido
a la complejidad del problema la solucin
no es clara. Tres filosofas distintas pueden
clasificador
1
ser apuntadas :
hi1

AND

hiL

clasificador

1. Encontrar el ptimo de hij(X)


mediante la minimizacin del error
cuadrtico medio entre la salida deseada y
el valor obtenido. Desafortunadamente,
incluso para clasificadores lineales a
tramos, no hay demostracin de
convergencia. Mtodo muy utilizado en
mtodos no paramtricos.

Figura 6.2 Implementacin del clasificador

2. Ajustar los parmetros de hij(X)

202

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

tal que minimice de ( 6.6 ). La dificultad de obtener una solucin explcita del error sobre
los parmetros de h(X), hace necesario recurrir al clculo numrico. Incluso para
distribuciones normales la solucin no es fcil. Este proceder ser utilizado para el diseo
de h(X), lineales o cuadrticos, con enfrentamiento entre dos grupos.
3.Diseo de clasificadores tomados a pares, utilizando las tcnicas tradicionales que
L
sern expuestas a continuacin en el apartado 6.1.1. funciones discriminantes sern
2
calculadas para cada regin y posteriormente se determinar la clasificacin mediante ( 6.4
). Las regiones vendrn definidas por la etapa de clustering paramtrico, basadas en las
exposiciones del anterior captulo y en las que se va a ver seguidamente para la
decantacin definitiva del cluster.
A continuacin se expone la teora del diseo de clasificadores paramtricos
tomados en grupos de dos. Se desarrollan los conceptos bsicos para determinar en primer
lugar, la expresin de error para clasificadores cuadrticos y lineales cuando las funciones
de distribucin son normales, prrafo 6.1.2, en segundo lugar, se estudian los criterios para
el diseo de los clasificadores cuadrticos y lineales (6.1.3). Para continuar seguidamente
con la influencia del nmero de muestras en el diseo de los clasificadores.
6.1.1

Clasificacin a dos grupos


Una vez modelizado el espacio entre dos grupos, se asumen conocidas las
funciones de densidad condicionadas, p(X|1) y p(X|2), as como las probabilidades de
los clusters, p(1) y p(2). Una regla de decisin basada en la distribucin de la variable
ser :
1

p 1 p X 1

> p
<

p X 2

p X 1
"X =
p X 2

> p
< p

( 6.7 )

el trmino l(X) es llamado ratio de verosimilitud, donde p 2 / p 1 es el valor


umbral para la decisin. Algunas veces es ms conveniente escribirlo a modo de regla de
decisin:
1

h( X ) = ln "( X ) = ln p( X | 1 ) + ln p( X | 2 ) > ln

<
2

DISAM-UPMT-98-015

p( 1 )
p( 2 )

( 6.8 )

203

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

a h(X) se le llama funcin discriminante. En general, la regla de decisin de ( 6.8 ),


o cualquier otra forma de clasificacin, no es perfecta. Con esta finalidad, las prestaciones
de la norma de decisin son calculadas a partir del error de clasificacin, esto es, la
probabilidad de que una muestra sea asignada a una clase errnea.
El error condicional, r(X), debido a la regla de ( 6.7 ), har corresponder el error al
valor ms pequeo de p(1) p(X|1) o p(2) p(X|2), esto es :
r ( X ) = min[ p ( 1 ) p ( X | 1 ), p ( 2 ) p ( X | 2 )]

( 6.9 )

el error total o error de Bayes ser:

= E{r( X )} = r( X ) p( X )dX = min[ p(1 ) p( X | 1 ), p(2 ) p( X | 2 )]dX


X

= p(1 ) p( X | 1 )dX +p(2 ) p( X | 2 )dX


L2

( 6.10 )

L1

L1 y L2 son las regiones donde X es clasificado a 1 o a 2, respectivamente. En L1,


p(1) p(X|1) es mayor a p(2) p(X|2), y por tanto r(X) = p(2) p(X|2). En caso
contrario, r(X) = p(1) p(X|1) en L2 donde p(1) p(X|1) < p(2) p(X|2).
Distinguindose dos tipos de error, uno resultado de la mala clasificacin desde 1 y el
otro desde 2. El error total es la suma de los dos anteriores.
El clculo del error de Bayes es complicado de determinar. La mayor dificultad
viene dada por la integracin en elevadas dimensiones, al no ser fcil la limitacin de las
regiones, incluso aun cuando las observaciones sigan una distribucin normal. Por lo tanto,
suele ser ms conveniente integrar la funcin de densidad de h(X) de ( 6.8 ), la cual es
unidimensional:

1 =
2 =

(h | 1 )dh

h
ln( p (1 ) / p ( 2 ))

ln( p (1 ) / p ( 2 ))

(h | 2 )dh

( 6.11 )

donde ph(h|i) es la densidad condicional de h para i. Sin embargo, en general, la


funcin de densidad de h no suele estar disponible, y tiene dificultades de computacin.
6.1.2

Expresin general del error para la clasificacin de dos grupos


Desde un punto de vista general, si el clasificador tiene una funcin discriminante
para dos grupos, y modificando ( 6.8 ) para colocarla de la forma :

204

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

>0
<

hX

( 6.12 )

el error del grupo 1 salvo una constante, ser :

p( X | )dX = u(h( X )) p( X | )dX

1 =

h ( X ) >0

( 6.13 )

siendo u(.) la funcin escaln. Utilizando la transformada de Fourier para una


funcin escaln :
F u = +

1
j

( 6.14 )

e insertando la antitransformada del escaln

1 =

1
2

1
1
=
+
2
2

1
j

j h
e

p X 1 d dX

e j h X
p X 1 d dX
j

( 6.15 )

De la misma forma para el grupo 2, quedando :

2 =

p( X |

h ( X )< 0

=
=

)dX = F ( h( X )) p ( X | 2 )dX

1
2

( )

,X

1 1

2 2

1 j h ( X )
e
p( X | 2 )ddX
j

e j h ( X )
p ( X | 1 )ddX

j
,X

( 6.16 )

el error total ser :

= p 1 1 + p 2 2
=

1
1
+
2 2

e jh X
j p X ddX
X

( 6.17 )

donde :

DISAM-UPMT-98-015

205

Inspeccin automatizada de superficies homogneas mediante Visin artificial

p X = p 1 p X 1

Carlos Platero

p 2 p X 2

( 6.18 )

expresin ( 6.17 ) deducida al ser p(1) + p(2) la unidad. Se observa que el error
es una funcin de h(X) y de p X , especificando el tipo de clasificador y la distribucin de
las variables, respectivamente.
Otra interpretacin del error puede ser dada desde la funcin caracterstica, Fi().
sta se define como :
Fi = E {e jh X i } = e jh X p X i dX = e jh p h i dh
X

( 6.19 )

esto es, Fi() puede ser obtenida o bien mediante la integracin n-dimensional de
X, o a travs de la integral unidimensional de h. Obsrvese que Fi() representa la
transformada de Fourier, excepto por el signo de j. Si se aplica el concepto de
antitransformada,
1
2

p h i =

F e

jh

( 6.20 )

o
p h i =

1
2

F e
i

jh

( 6.21 )

esta ltima expresin indica que Fi() es la transformada de Fourier de p(-h|i).


Volviendo al error y partiendo de ( 6.15 ), la multiplicacin de la funcin caracterstica por

1
+ j en el dominio de Fourier, corresponder con el error de tipo 1, esto es con el

valor de 1:

1 =

1
2

1
1
F1 d =

j
2

p h

1
F e j h d h = 0 =
j 1

dh =

ph

dh

( 6.22 )

de la misma manera para 2, la multiplicacin de la funcin caracterstica por

1
j en el dominio de Fourier, corresponde:

206

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

2 =

p h

dh =

ph

dh

( 6.23 )

Estas dos ltimas ecuaciones son ilustradas en la figura 6.3, donde se muestra como
los errores corresponden con las reas ocupadas desde el umbral hasta el segn sea
p(h|i).

Figura 6.3 Error de clasificacin

El procedimiento para calcular el error de un clasificador ser :


1. Calcular la funcin caracterstica, Fi(), mediante la integracin n-dimensional.
Para clasificadores lineales y cuadrticos con distribuciones normales, una expresin
explcita puede ser obtenida, estas expresiones van a ser a continuacin estudiadas.
2. Aplicar ( 6.15 ) y ( 6.16 ) introduciendo Fi(). Al ser las partes reales e
imaginarias de Fi() pares e impares, el error queda
+
+
+
1 1 Fi
1 1 IM Fi
1 1 Fi
i =
j d = 2 0 d = 2 0 sin Fi d
2 2

( 6.24 )

donde + y - corresponde para la clase i = 1 o 2.


6.1.2.1 Error de clasificacin para distribuciones normales
Como ha sido mencionado, existen expresiones explcitas para el error de
clasificadores lineales y cuadrticos cuando las poblaciones de enfrentamiento siguen
distribuciones normales. Por ser stas las que van a ser decantadas del proceso de
clustering paramtrico, se estudia a continuacin las funciones caractersticas, Fi(), tanto
para clasificadores cuadrticos como lineales.

DISAM-UPMT-98-015

207

Inspeccin automatizada de superficies homogneas mediante Visin artificial

6.1.2.1.1

Carlos Platero

Funcin caracterstica Fi() para clasificador cuadrtico

En el caso de utilizar un clasificador cuadrtico, h(X) ser del tipo :


hX =

1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
1
2

1
2

( )
p( )
p 1

( 6.25 )

y
pT X T =

( 2 )

n 2

1 2

T 1
2 X M T X M

( 6.26 )

siendo T uno o dos. Si en ( 6.25 ) es aplicado simultneamente una diagonalizacin


y un desplazamiento , esto es, una transformacin blanqueante [Fukun90], Y=AT(X-MT),
AT 11 2 1 A =

AT T A = I

( 6.27 )

luego, Mi y i son convertidas a :


AT Mi M T = Di

AT i A = Ki

i = 12

( 6.28 )

por lo tanto, en el Y-espacio transformado quedar :


hY =

1 T 1
Y Y V TY + c
2

pT Y T =

1
( 2 ) n

1 T
2 Y Y

( 6.29 )

( 6.30 )

donde
V = K11D1 K21D2

208

( 6.31 )

DISAM-UPMT-98-015

Carlos Platero

c=

Captulo 6: Clasificadores estticos

1 T 1
1
D1 K1 D1 D2T K21 D2 ) +
(
2
2

K1

K2

p(1 )

p(2 )

( 6.32 )

La funcin caracterstica FT() es entonces calculada como :


FT ( ) = e jh (Y ) p (Y | T )dY
=

1
1

exp Y T I j 1 Y jV T Y exp[ jc ]dY


n/2
(2 )
2

2
1

j v i

exp (1 j / i ) y i +

1 j / i
2
i =1

2
2
n

vi

exp

exp[ jc ]dY

2
(
1
j
/
)

i =1
i

2 vi2
1
=
exp
exp[ jc]

2
(
1
j
/
)

1
j
/
1
=
i
i

1
=
(2 )n / 2

( 6.33 )

donde yi, vi, i son las componentes de Y, V y respectivamente. Obsrvese que en


jvi

1
la tercera tautologa se tienen n distribuciones normales N Y
.
1 j i 1 j i
Dependiendo de si el error es generado por h(X)>0 o h(X)<0, el error de clasificacin ser
computado como:

p(h | T )dh =

T = 1 + 2 = 00
p (h | )dh =
T

1 1
+
2 2
1 1

2 2

F1 ( )
d
j
F2 ( )
j d

( 6.34 )

La integracin de ( 6.34 ) debe realizarse de manera numrica. La integracin no es


simple pero es factible. Esta expresin ha sido utilizada en el clculo del error de los
clasificadores cuadrticos implementados.
Evaluando los resultados para MT = M1 y T = 1, luego la transformacin de
diagonalizacin y desplazamiento quedar :
AT 1 A = I

AT 2 A =

A T ( M 2 M1 ) = L

( 6.35 )

donde (11 21 ) es tambin transformado a matriz diagonal


1

DISAM-UPMT-98-015

209

Inspeccin automatizada de superficies homogneas mediante Visin artificial

= AT ( 11 21 ) A = AT A( I 1 ) AT
1

A = ( I 1 )

Carlos Platero

( 6.36 )

al ser MT = M1 implica D1 = 0, D2 = L, K1 = I y K2 = desde ( 6.28 ). Insertando


stos en ( 6.31 ) y ( 6.32 ), V y c son :
V = 1 L

( 6.37 )

p( 1 )
1
1
c = LT 1 L ln ln
p( 2 )
2
2

( 6.38 )

para estos casos los valores de i y vi de ( 6.33 ) correspondern con


1
1
= 1
i
i

vi =

li
i

( 6.39 )

Que introduciendo estos valores en ( 6.34 ) es posible calcular 1. Para el caso de


MT = M2 y T = 2, despus de la primera transformacin de ( 6.35 ), otra vez es aplicada
una segunda :
Y = AT ( X M 2 )

Z = 1/2Y

( 6.40 )

quedando ( 6.40 )
1/ 2 I1/ 2 = I

1/ 2 AT ( M1 M 2 ) = 1/ 2 L

1/ 2 1/ 2 = I

( 6.41 )

dicha transformacin garantiza la diagonalizacin de (11 21 )

= 1/ 2 ( I 1 ) 1/ 2 = ( I )
1

( 6.42 )

al ser MT = M2 implica D1 = --1/2L, D2 = 0, K1 = -1 y K2 = desde ( 6.28 ).


Insertando stos en ( 6.31 ) y ( 6.32 ), V y c son :
V = 1/ 2 L = 1/ 2 L
c=

210

( 6.43 )

p ( 1 ) 1 T
p(1 )
1 T 1 / 2 1 / 2
1
1
L L ln ln
= L L ln ln
p ( 2 ) 2
p( 2 )
2
2
2

( 6.44 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Esto es, despus de calcular y L, son obtenido los valores de i, vi y c de ( 6.34 )


a partir de ( 6.42 ), ( 6.43 ) y ( 6.44 ).
Este mtodo de calcular el error ha sido empleado en los clasificadores
paramtricos utilizados para la catalogacin de las faltas visuales del aluminio. Las pruebas
realizadas sern comentadas en el apartado 6.5
6.1.2.1.2

Funcin caracterstica Fi() para clasificador lineal

Para el caso de clasificador lineal, y eligiendo el criterio de Fisher, h(X) ser :


1
h( X ) = ( M2 M1 ) T 1 X + ( M1T 1 M1 M2T 1 M2 )
2

( 6.45 )

+ 2
, adems los dos grupos siguen distribuciones normales.
donde = 1
2
Utilizando similar procedimiento que en los clasificadores cuadrticos, es aplicado
diagonalizacin y desplazamiento, Y=AT(X-MT),
AT ( 1 + 2 ) A =

AT T A = I

( 6.46 )

definiendo Di como:
AT ( Mi M T ) = Di

i = 1,2

( 6.47 )

por lo tanto, en el Y-espacio quedar :


h(Y ) = V T Y + c
pT Y T =

1
( 2 ) n

1 T
2 Y Y

( 6.48 )

( 6.49 )

donde
V = 1( D2 D1 )

DISAM-UPMT-98-015

( 6.50 )

211

Inspeccin automatizada de superficies homogneas mediante Visin artificial

c=

1 T 1
D1 D1 D2T 1 D2 )
(
2

Carlos Platero

( 6.51 )

La funcin caracterstica FT() ser calculada como :


FT ( ) = e jh (Y ) p (Y | T )dY
=

1
1

exp Y T Y + jV T Y exp[ jc ]dY


n/2
(2 )
2

1
(2 )n / 2

exp 2 ( y
i =1

2
j v i )

2 vi2

exp

exp[ jc ]dY

2
i =1

2 T

= exp
V V + j c
2

( 6.52 )

Evaluando los resultados para MT = M1 y T = , luego la transformacin de


diagonalizacin y desplazamiento quedar :
AT 1 A = I

AT 2 A =

( 6.53 )

adems es tambin transformado a matriz diagonal

1 T
1
A ( 1 + 2 ) A = ( I + )
2
2

( 6.54 )

junto con D1 = 0, D2 = AT(M2 - M1) al que se asignar a L, introducindolo en las


expresiones ( 6.50 ) y ( 6.51 ), V y c son :
1

I +
L
V =
2

( 6.55 )
1

1 I +
L
c = LT
2 2

( 6.56 )

Si se hace MT = M2 y T = 2, despus de la primera transformacin de ( 6.53 ) ,


otra vez es aplicada una segunda :

212

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Y = AT ( X M 2 )

Z = 1/2Y

( 6.57 )

resultando
1/ 2 I1/ 2 = 1/ 2 1/ 2 = I

1/ 2 AT ( M1 M 2 ) = 1/ 2 L

( 6.58 )

dicha transformacin garantiza la diagonalizacin de (1 + 2 )


1
I + 1/ 2 + I
= 1/ 2
=
2
2

( 6.59 )

al ser MT = M2 implica D1 = --1/2L, D2 = 0. Insertando stos, V y c son :


1

1 + I 1/ 2
V =
L
2

( 6.60 )
1

1 + I 1/ 2
1
c = LT 1/ 2
L
2
2

( 6.61 )

Al igual que en los clasificadores cuadrticos, tambin se a empleado este mtodo


para determinar el error de los clasificadores lineales diseados para los defectos visuales
del aluminio (ver 6.5).
6.1.2.2 Lmites del error de Bayes
Es evidente tal como se est planteando, que el clculo de la probabilidad de error,
en general, es una tarea difcil. Incluso cuando la observacin de las muestras siga una
distribucin normal, hay que recurrir a mtodos numricos. Sin embargo, existen varias
propuestas de expresiones que se acercan al valor del error. No slo se reduce el gran
esfuerzo de carga computacional, sino ms importante todava, el uso de estas
aproximaciones permite conocer los mecanismos que causan el error. Como se ver en
prrafos siguientes, estas expresiones sern utilizadas en el problema de la seleccin de las
ptimas caractersticas y en el tipo de clasificador paramtrico a utilizar.
Las aproximaciones al error pueden ser realizadas por el lmite superior o por el
lmite inferior. En la bibliografa especializada existen mltiples propuestas tanto hacia la
arriba como hacia abajo. Seguidamente, se exponen algunas de ellas.
6.1.2.2.1

Lmite superior de Chernoff y Bhattacharyya

El error de Bayes fue dado en ( 6.10 ) y puede ponerse de la forma :

DISAM-UPMT-98-015

213

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

= min[ p( 1 ) p( X | 1 ), p( 2 ) p( X | 2 )]dX

( 6.62 )

un lmite superior de la integracin podra ser obtenido considerando que :


min[a b] a sb1 s

0s1

ab0

( 6.63 )

dicha ecuacin muestra que la media geomtrica de dos valores positivos es mayor
que la menor de stas. Si a < b, la expresin de la izquierda de ( 6.63 ) es a, mientras el
lado derecho puede ser escrito como a(b/a)1-s. Al ser b/a > 1 y 1-s 0, el margen derecho
ser mayor que el izquierdo. Viceversa, si a > b y reescribiendo b(a/b)s, est claro que el
lado derecho es mayor que el izquierdo al ser (a/b)s 1. Aplicando ( 6.63 ) en ( 6.62 ) el
lmite superior del error ser :

u = p 1 s p 2

1 s

pX

p X 2

1 s

dX

0s1

( 6.64 )

este lmite superior del error, u, es llamado lmite de Chernoff [Chern52]. El


ptimo de s se encontrar minimizando u.
Cuando dos funciones de densidad son normales, NX(M1,1) y NX(M2,2), la
integral de ( 6.64 ) puede ser expresada como :

pX

p X 2

1 s

dX = e s

( 6.65 )

donde

s =

1
T
s1 s
M 2 M1 ) [ s1 + 1 s 2 ] ( M 2 M1 )
(
2
1 s1 + 1 s 2
+
1 s
s

2 1 2

( 6.66 )

Esta expresin de (s) es llamada distancia de Chernoff. El ptimo de s puede ser


obtenido mediante la representacin de (s), para cada par de grupos enfrentados. El valor
buscado ser el mximo de (s).
En el caso de no localizar el ptimo de s, se simplifica la localizacin del lmite
superior. Una de las posibilidades es seleccionar s = . Luego, el limite superior es :

214

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

T + 2
1
1
=
M 2 M1 1
2
8
2

1 + 2

1
2

M 2 M1 +
2
1
2

( 6.67 )

el trmino (1/2) es llamado la distancia de Bhattacharyya [Bhatt43]. sta


corresponde con el ptimo de la distancia de Chernoff cuando 1 = 2. Aplicndolo en la
expresin ( 6.66 )

s =

T
s1 s
M 2 M1 ) 1 ( M 2 M 1 )
(
2

( 6.68 )

siendo 1 = 2 = . El ptimo de s resultar ser :


T
d s
1 2s
M 2 M1 1 M 2 M1 = 0
=
ds
2

( 6.69 )

la solucin es s = .
De la expresin de ( 6.67 ) se desprende que la distancia de Bhattacharyya contiene
dos trminos, 1 y 2. El primer valor mide la separacin de las clases debido a la
diferencia entre las medias, mientras el segundo muestra la diferencia debido a las matrices
de covarianza.
6.1.2.2.2

Otros lmites

Si bien hay otros lmites que resultan ser mejores que los de Bhattacharyya y
Chernoff, como por ejemplo el de Hadar et at[Hadar96], pues stos se aproximan ms al
verdadero error, tienen el gran inconveniente de no tener una expresin analtica para
distribuciones normales, lo que posteriormente dificultar el tratamiento de estimacin del
sesgo y la varianza al considerar un nmero limitado de muestras.
6.1.3

Diseo de clasificadores lineales ptimos


Los clasificadores lineales son los ms fciles de implementar y estn directamente
relacionados con muchas tcnicas conocidas, tales como correlacin o la distancia
eucldea. Sin embargo, desde el punto de vista de Bayes, los clasificadores lineales son
ptimos slo para distribuciones normales con matrices de covarianza iguales. En algunas
aplicaciones como la deteccin de seales en sistemas de comunicacin, la suposicin de
matrices iguales son razonables, ya que el ruido no afecta de manera considerable de una
seal a otra. Sin embargo, en la mayora de las aplicaciones de Reconocimiento de Formas,
no es posible aceptar la igualdad de matrices de covarianza.

DISAM-UPMT-98-015

215

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Ha habido mucho esfuerzo en el diseo del mejor clasificador lineal para


distribuciones normales con desiguales covarianzas y distribuciones no normales.
Naturalmente, stas no son ptimas, pero en muchos casos la simplicidad y robustez de los
clasificadores lineales compensan las prdidas de prestaciones.
La regla de clasificacin de stos seguirn la expresin :
1

h X = V T X + v0

>0
<
2

( 6.70 )

el trmino h(X) es una funcin lineal de X, llamada funcin discriminante lineal. El


diseo del clasificador tratar de buscar los ptimos coeficientes de V y el umbral v0 para
la distribucin dada.
Es de observar que estos clasificadores funcionan bien, si la separabilidad entre
clases viene dada por la diferencia entre las medias de los clusters. Mientras que los
clasificadores no lineales mantienen buenos resultados cuando la separacin es debida a la
diferencia entre las covarianzas. As, en los trminos 1 y 2 de Bhattacharyya indican la
naturaleza de separacin entre las dos clases. Cuando 1 es predominante en la distancia,
indica la necesidad de construir clasificadores lineales. En caso contrario, se tender al
diseo de clasificadores no lineales, especialmente cuadrticos.
6.1.3.1 Procedimiento de diseo ptimo
La expresin ( 6.70 ) muestra la proyeccin del vector X sobre el espacio
unidimensional h(X). Si X sigue una distribucin normal, h(X) tambin la seguir. En la
figura 6.4 se muestra la proyeccin de las poblaciones sobre los vectores V y V, donde v0

Figura 6.4 Representacin de clasificadores


lineales sobre dos proyecciones distintas

y v0 son los umbrales de separacin entre 1 y 2. Como se puede ver, el error es ms

216

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

pequeo en V que en V. El diseo ptimo vendr en la relacin de V y v0 que minimice el


error en el h-espacio. Con este objetivo ser necesario modelar la distribucin de 1 y 2
proyectado en h-espacio, teniendo que definir i=E{h(X)|i} y i=Var{h(X)| i }, las
cuales son funcin de V y v0. Incluso, si X no se distribuye normalmente, h(X) pudiera
acercarse a normal cuando la dimensin del espacio de X, n, tienda a ser elevada. En este
caso, h(X) es la suma de n trminos aleatorios y por el consiguiente teorema central del
lmite, h(X) tender a seguir una distribucin normal.
Los valores esperados y la varianza de h(X) son :

i = E {h X i } = V T E {X i } + v0 = V T Mi + v0

( 6.71 )

i2 = Var {h X i } = V T E ( X Mi )( X Mi ) i V = V T iV
T

( 6.72 )

considerando la funcin f(1,2,12,22), la cual maximiza o minimiza algn


criterio (por ejemplo, la distancia entre clases), esta medida permitir determinar el ptimo
de V y v0. Luego, las derivadas de f respecto a V y v0 son :

f
f 1 f 2
f 12
f 22
=
+
+
+
V 1 V 2 V 12 V 22 V

( 6.73 )

f
f 1 f 2
f 12
f 22
=
+
+
+
v0 1 v0 2 v0 12 v0 22 v0

( 6.74 )

tomando las expresiones ( 6.71 ) y ( 6.72 ), se deduce las siguientes derivadas


parciales :

i
= Mi
V
i
=1
v 0

i2
= 2 iV
V
i2
=0
v 0

( 6.75 )

( 6.76 )

introduciendo los resultados de ( 6.75 ) y ( 6.76 ), adems de igualar a cero las


expresiones ( 6.73 ) y ( 6.74 ), quedar :
f

f
f
M1 +
M2
2 2 1 +
2 2 V =
2
2
1

DISAM-UPMT-98-015

( 6.77 )

217

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

f
f
+

=0
1 2

( 6.78 )

al aplicar ( 6.78 ) sobre ( 6.77 ), el ptimo de V puede ser calculado. Atendiendo


a la reflexin utilizada, el error no depende del tamao de V sino de su direccin, por tanto,
eliminando las constantes quedar :

V = s 1 + (1 s) 2

] (M
1

M1

( 6.79 )

donde

f
12

s = f
f
2 +
1 22

( 6.80 )

el valor ptimo de V depender de la seleccin de f. Adems, una vez elegida la


funcin, el valor ptimo de v0 se calcular con la solucin de ( 6.78 ). El cuadro de abajo
muestra los resultados ptimos de V y v0, para dos criterios clsicos.
Nombre criterio

Expresin del criterio

Fisher

( )
=

1
1 + 2
2 M 2 M1

Medida entre clases

f =

1
2
1

+ 22

( )
p( )

v0

El criterio de Fisher no depende


de v0, ya que la sustraccin de
2 menos 1 elimina a v0 de (
6.71 )

( )
+ p( )
[ p( ) + p( ) ] ( M M )

p 1 1 + p 2 2
1

2
1

2
2

V T p(1) M1 + p(2 ) M2

6.1.3.2 Diseo ptimo para distribuciones normales


Cuando la distribucin de h(X) es normal, se puede disear la funcin criterio, f, tal
que minimice el error de Bayes en el h-espacio. El error ser funcin de i y i2 segn se
vio en 6.1.3.1. La definicin ser :

218

DISAM-UPMT-98-015

Carlos Platero

f = = p(1 )

Captulo 6: Clasificadores estticos

1 2
e d + p(2 )
2
2

1 1

2 2

1 2
e d
2
2

( 6.81 )

para este criterio, las derivadas del error respecto a los parmetros son :
p(1 ) (1

=
e
12
2
p(2 ) (2

=
e
22
2

1 )

2 )

p(1 ) (1 1 ) 1
1
2
=
e
13
12
21
2

p(2 ) (2
2
=
e
23
22

/
p ( 1 ) 1 2 1

=
e
1
2 1

2 )
2

( 6.82 )

2
22

( 6.83 )

)2

( 6.84 )

( / )
p ( 2 ) 2 2 2

=
e
2
2 2

( 6.85 )

Por lo tanto desde ( 6.78 )


p(1 ) (1 1 )
p(2 ) (2
e 2
=
e
21
2 2
2

2 )

( 6.86 )

esto es, v0 debe ser seleccionado tal que las distribuciones de h(X) sean ambas
iguales a cero.
Considerando la igualdad de ( 6.86 ) e introduciendo ( 6.82 ) y ( 6.83 ) en ( 6.80 )

1
12

s=
2
1
2 +
1 22

( 6.87 )

V = s 1 + (1 s) 2

] (M
1

M1

( 6.88 )

la localizacin ptima de V y v0 depender de ( 6.86 ) y ( 6.88 ), tal que minimice


el error de ( 6.81 ). Desafortunadamente, tanto i como i2 estn intrnsecamente ligadas a
V y v0, la solucin explcita no es posible. Por lo tanto, debe ser utilizado un proceso
iterativo capaz de encontrarlas. Antes de entrar en la discusin del proceso iterativo, es
menester obtener la expresin de v0. Sustituyendo 1 y 2 de ( 6.87 ) por las expresiones
de ( 6.71 ) quedar :

DISAM-UPMT-98-015

219

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

s12V T M 2 + (1 s)22V T M 2
v0 =
s12 + (1 s)22

( 6.89 )

el proceso iterativo para determinar V y v0 es el siguiente :

1. Calcular V para un determinado valor de s, V = s 1 + (1 s) 2

] (M
1

M1 .

2.Obtener i2 de ( 6.72 ), v0 de ( 6.89 ) y i de ( 6.71 ), siguiendo este secuencia.


3.Calcular el error, segn se vio en 6.1.2.1.
4.Variar s de 0 a 1
Encontrando el mnimo valor de respecto de s, el algoritmo buscar el ptimo de
V y v0. Obsrvese la validez del mtodo para cualquier tipo de distribucin, siempre y
cuando la dimensin del vector sea elevada. En efecto, al ser h(X) distribucin normal por
aplicacin del teorema central del lmite permitir ser aplicada a distribuciones de la
variable que no cumpla normalidad. De otro lado, al tratarse de distribuciones normales, es
posible calcular el error del punto 3 mediante la distancia de Bhattacharyya.
6.1.4

Diseo de clasificadores cuadrtico


Cuando la distribucin de X es normal tanto para 1 como 2, la funcin
discriminante bayesiana llega a ser de tipo cuadrtico

1
1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
2

1
2

> p( )
< p( )
1

( 6.90 )

incluso para distribuciones no normales, el clasificador trabaja bien en muchas


aplicaciones. Conceptualmente, es fcil aceptar que la clasificacin se debe a la
comparacin entre distancias de Mahalanobis a cada uno de los clusters con un apropiado
umbral.
Sin embargo, es poco conocido el diseo de clasificadores cuadrticos, excepto la
estimacin de Mi y i e insertarlas en ( 6.90 ). Adems, estos clasificadores tiene diversas
desventajas cuando son diseados desde un nmero finito de muestras. Los sesgos de los
clasificadores cuadrticos son mayores que los lineales cuando se utilizan pocas muestras
en su confeccin. Este problema ser tratado ms adelante.

220

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

6.1.4.1 Procedimientos de diseo


El clasificador cuadrtico puede expresarse como :
h X = X T QX + V T X + v0

( 6.91 )

donde Q, V y v0 son la matriz, el vector y el escalar, respectivamente de la funcin


discriminante. Por lo tanto, se optimizara mediante la funcin f(1,2,12,22) con
respecto a Q, V y v0, tal como fue efectuado con el clasificador lineal. No obstante, el
nmero de parmetros, [n(n+1)/2]+n+1, es demasiado grande, y i2 es funcin de
momentos de tercer y cuarto orden, no siendo practicable la optimizacin de
f(1,2,12,22).
6.1.4.2 Linealizacin
Una posible interpretacin a ( 6.90 ) es transformar el problema a lineal

hX =

n n +1
2

i =1

i =1

i =1

qij xi x j + vi xi + v0 =
i =1 j =1

i yi + vi xi + v0

( 6.92 )

donde qij y vi son las componentes de Q y V. Cada una de las nuevas variables, yi,
representa el producto a dos de x, y su correspondiente valor de q. La ecuacin ( 6.92 )
corresponde a una funcin discriminante lineal, de la que puede aplicarse el procedimiento
ptimo de diseo:

n n + 1

v1

vn

= sK1 + 1 s K2

D2 D1

( 6.93 )

donde Di y Ki son los vectores esperados y las matrices de covarianza de


Z=[YTXT]T con [n(n+1)/n]+n variables. Sin embargo resulta prohibitivo por la cantidad de
variables.
6.1.4.3 Visualizacin
Una solucin prctica es la representacin en un sistema de coordenadas, donde se
utilizara la distancia normalizada a cada grupo. Teniendo d12 = X M1 T 11 X M1 y
d 22 = X M 2 T 21 X M 2 en cada eje de coordenadas, la mejor lnea recta que los
separase podra ser utilizado como elemento de diseo. En la figura se observa dicha
tcnica

DISAM-UPMT-98-015

221

Distancia a la clase 2

Inspeccin automatizada de superficies homogneas mediante Visin artificial

x
x

Carlos Platero

x o
o
o
x
x
x
x x
xo o o o
x
x
o
o
x o
o
o
o
x o
o
x
o
o
o
x

Distancia a la clase 1

Figura 6.5 Tcnica de diseo de clasificador cuadrtico

El clasificador quedar como


d22 = d12 +

( 6.94 )

o bien mediante otro tipo de curva, en general,


d 22 = f d12

( 6.95 )

sin embargo, la estructura de la funcin discriminante debera ser lo ms simple


posible, ya que si bien es cierto que se adecuara mejor con las muestras utilizadas, las
venideras sern mal clasificadas por falta de generalidad en la solucin del problema.

222

DISAM-UPMT-98-015

Carlos Platero

6.2

Captulo 6: Clasificadores estticos

Estimacin de los parmetros mediante un conjunto finito de


muestras
La parametrizacin del espacio ha sido realizada mediante los vectores de medias y
las matrices de covarianzas. Hasta ahora se ha asumido que los parmetros eran fijos y
dados. Desafortunadamente, en la prctica sus valores no son conocidos, y deben ser
estimados desde un conjunto de muestras finitas. En Reconocimiento de Formas, suele
trabajarse con funciones usando estimaciones de los vectores de medias y matrices de
covarianzas, como sucede con las funciones discriminantes, las funciones de densidad o el
error de clasificacin. Por lo tanto, es menester saber como las salidas de estas funciones
son afectadas por las variable aleatorias de los parmetros, ms concretamente, sobre el
sesgo y la varianza de estas funciones.
6.2.1.1 Efecto del tamao de la muestra en la estimacin
yq , donde f
Considerando el problema de estimar f(y1, y2 ,..., yq) por f y1 y2
es la funcin, yi sus verdaderos valores, mientras yi son sus estimaciones. Asumiendo que
la desviacin entre yi e y son pequeas, f Y puede ser desarrollada por las series de
i

Taylor hasta trminos de segundo orden


q
q
q
2
f = f Y f Y + f y + 1 f y y =
i
2 i = 1 j = 1 yiy j i j
i = 1 yi

= f Y +

f T
1 2 f

Y + tr 2 YY T
Y
2 Y

( 6.96 )

donde yi = yi yi e Y = Y Y . Si el estimador carece de sesgo


entonces
E { Y} = 0

( 6.97 )

y consecuentemente el vector esperado de f Y ser :


1 2 f


E { f Y } f Y + tr 2 E {YY T }
2 Y

DISAM-UPMT-98-015

( 6.98 )

223

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

Similarmente, la varianza de f Y ser :


2
f T

1 2 f
1 2 f
T
T

Var f Y E
Y + tr 2 E {YY } tr 2 E {YY }
2 Y
Y
2 Y

2
2 f
f
f T
E {YY T }
E 2 Y =
Y
Y
Y
( 6.99 )

{ ( )}

la ecuacin ( 6.98 ) muestra como la estimacin del sesgo de la funcin, E f Y ,


2 f
depende de
y de E {YY T } , siendo el primer trmino dependiente de la funcin,
Y 2
mientras el segundo est supeditado a la distribucin de Y junto con el nmero de
f
muestras utilizado para el clculo de Y . Igualmente, la varianza depende de
y
Y
E {YY T } , y de la misma manera est vinculada al tipo de funcin junto al tipo de
distribucin de Y .
En la modelizacin paramtrica, la mayora de las funciones a considerar utilizan
estimaciones del vector de medias y la matriz de covarianzas. Asumiendo que el origen de
los datos corresponde a dos distribuciones normales n-dimensionales, y dadas sus medias y
matrices de covarianzas, M1, M2, 1 y 2.. Los parmetros Mi y i son estimados sin sesgo
mediante verosimilitud :
1
M r =
Nr
 r =

Nr

X
j =1

r
j

( 6.100 )

)(

1 Nr
X jr M r X jr M r

N r 1 j =1

( 6.101 )

donde Xj(r) es la muestra j de la clase r y Nr es el nmero de muestras de la clase r.


Llegndose a que el vector Y contiene 2[n+n(n+1)/2] componentes

Y = m 11

224

m n1 m 12

m n2 c111

cnn1 c112

cnn2

( 6.102 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

definiendo mi r = m i r mi r
e cijr = cijr cijr , las variables aleatorias de la
expresin( 6.102 ) satisfacen las siguientes propiedades estadstica
1. La media y la matriz de covarianzas son insesgada,

{ }=0

E {mi r } = 0 E cijr

( 6.103 )

2. Las muestras entre diferentes clases son independientes,

{
E {c

}
}=0

E mi 1 m j2 = E {mi 1 } E m j2 = 0
1
ij

ckl2

E mi r ckls = 0 r s

( 6.104 )

3. La matriz de covarianzas del vector esperado es diagonal

{
{

1
T
E ( M r M r )( M r M r ) =

Nr r
i r
r
r

E mi mj =
N r ij

( 6.105 )

donde i(r) es la componente i diagonal de la matriz r, mientras ij es uno cuando i


es igual a j, y en caso contrario ser nulo .
4. Los momentos de tercer orden para una distribucin normal son nulos

E mi r cklr

}= 0

( 6.106 )

5. Los momentos de orden cuarto para una distribucin normal son

E cijr ckls

DISAM-UPMT-98-015

i r jr
i ji=k j=l

r
N r
2i
i=k = j=l

r
N 0 1

( 6.107 )

225

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

Partiendo de la formulacin general y aplicndolo sobre N1(M1,1) y N2(M2,2), se


obtiene el sesgo de la funcin introduciendo de ( 6.100 ) a ( 6.107 ) en ( 6.98 ) :
1 2 f
1 q q 2 f
T

E {f } = E f f tr 2 E {YY } =
E yi y j
2 Y
2 i = 1 j = 1 yi y j

{}

n
n i 1

2 f
2 f
1 2 n 2 f
r 2
r 2
r 2
=
E

m
+
E

c
+
E

c
{
}
{
}

ii
ij
i
r
r
2 r = 1 i = 1 mi r
i = 1 j = 1 cij
i = 1 cii

r
r
n
n i 1
2 f 2 i r
2 f i j
1 2 n 2 f i r
=
+
+

2 r = 1 i = 1 mi r N r i = 1 ciir N r 1 i = 1 j = 1 cijr N r
( 6.108 )

De la misma forma, la varianza de la funcin estimada se consigue introduciendo


de ( 6.100 ) a ( 6.107 ) en ( 6.99 )

{}

Var f

2
n i 1
n
n f 2 r
f 2i r 2
f
i

+
+
=1 =1 m r N r =1 c r N r 1 =1 =1 c r
r
i
j
i
ij
ii
i i
2

2
i r jr

r
N ( 6.109 )

incluso cuando la distribucin no sea normal, ( 6.103 )( 6.104 ) y ( 6.105 ) son


vlidas. Sin embargo, el tercer y cuarto orden de momentos, ( 6.106 ) y ( 6.107 ), deben
ser modificados por

E mi r cklr

E c c
(r )
ij

(r )
kl

}
}

{x

1
Nr

{
{
{

xkr xl r

( 6.110 )

Var x i( r ) x (j r ) / N ( r )

Var x i( r ) 2 / N ( r )
Cov x ( r ) x ( r ) , x ( r ) x ( r ) / N ( r )
i
j
k
l

i j, i = k , j = l
i= j=k =l
Para cualquier otro caso( 6.111 )

6.2.1.2 Sesgo y la varianza de la distancia de Bhattacharyya


Si las dos distribuciones son normales, la distancia de Bhattacharyya da el lmite
superior del error de Bayes, , tal como se discuti en 6.1.2.2.1. Retomando la expresin

226

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

1
1 + 2
M 2 M1 T

8
2

1
2

1 + 2
2

1 2

( 6.112 )

si Mi y i son estimadas a partir de un nmero de muestras finitas con ( 6.100 ) y


( 6.101 ), el resultado de  difiere del verdadero valor. Haciendo uso de las expresiones
vistas ( 6.108 ) y ( 6.109 ), es posible calcular el sesgo y la varianza de  .
Las derivadas de 1 respecto de Mr son :

1
1
= ( 1)r 1 ( M 2 M1 )
M r
4

( 6.113 )

2 1 1 1
=
M r2 4

( 6.114 )

donde = ( 1 + 2 ) 2 . Las derivadas de 1 respecto de cij(r), utilizando M = M2M1 queda :


mi m j
1
1 cij
1

=
=

ij
cijr
cij cijr
i j
16

( 6.115 )

2 (r )
mi2 m 2j
2 1 2 1 cij
1
(2 ij ) +
=

=
j
32i j
cij( r ) 2 cij( r ) 2 cij( r )
i

siendo cij = cij1 + cij2

2 i = (i 1 + i 2 ) 2 . Introduciendo de (

( 6.116 )
6.113 ) a (

6.116 ) en ( 6.108 ) y ( 6.109 ), y realizando una transformacin blanqueante I-, i(1) =1


y i(2) =i quedar:
E {1 } =

1
i
i 2
mi2 1
1 n
1
+
+
+

2 i =1 2( 1 + i ) N 1 N 2 ( 1 + i )3 N 1 1 N 2 1

2
2
i j
1 n i 1 mi ( 1 + j ) + m j ( 1 + i ) 1
+

2
2
2 i =1 j =1 2( 1 + i ) ( 1 + j )
N2
N1

DISAM-UPMT-98-015

( 6.117 )

227

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

{}

mi2m2j
1
i n n
mi2 1
1 n
i j

Var 1 =
+ +
+
2
2
2
4 i =1 (1 + i ) N1 N2 i =1 j =1 2(1 + i ) (1 + j ) N1 N2
^

( 6.118 )
De igual proceder es seguido para 2

2
=0
M r

( 6.119 )

2 2
=0
M r 2

( 6.120 )

ij 1
2
1
r

r =
cij
4 i i

( 6.121 )

2 2 2 ij
=
cijr 2
4

1
1
r r

2 i j
i j

( 6.122 )

El sesgo y la varianza de 2 se consigue insertando de ( 6.119 ) a ( 6.122 ) en las


expresiones ( 6.108 ) y ( 6.109 ) queda:
2
1
1 n
2 1
2 i

E{ 2 } = 1
+

+
4 i =1 ( 1 + i ) 2 N 1 1 i 2 ( 1 + i )2 N 2 1

1 n i 1
2
1

4 i =1 j =1 ( 1 + i )( 1 + j

{ }
^

Var 2

1 1
2

) N1 i j ( 1 + i )( 1 + j

i j

) N 2

2
2
1
i 2
1 n 1
1
1
1
=

+

2 i =1 ( 1 + i ) 2 N 1 1 ( 1 + i ) 2 i N 2 1

( 6.123 )

( 6.124 )

Las expresiones ( 6.117 ), ( 6.118 ), ( 6.123 ) y ( 6.124 ) fueron presentadas en el


VII Simposium Nacional de Reconocimiento de Formas y Anlisis de Imgenes [Plate97].

228

DISAM-UPMT-98-015

Carlos Platero

6.2.2

Captulo 6: Clasificadores estticos

Efecto del nmero de muestras en el diseo de clasificadores


paramtricos
El estudio sobre la influencia de las muestras en el diseo de clasificadores es
complicado, y aunque se trata de mantener una expresin de tipo general, las conclusiones
definitivas obtenidas harn referencia a clasificadores lineales y cuadrticos.
Considerando que las funciones discriminantes dependen de las medias de los
grupos, M1 y M2, as como de las matrices de covarianzas, 1 y 2, y que se dispone de un
nmero finito de muestras, habindose estimado Mi y i a partir de ellas, el sesgo de h(X)
ser :

h( X ) = h ( X ) h( X ) = 0( k )
k =1

( 6.125 )

donde h ( X ) = h( X , M 1 , M 2 ,  1 ,  2 ) , h(X) = h(X,M1,M2,1,2) y 0(k) es el k-simo


orden del desarrollo de Taylor en trminos de variaciones de M i y i . Si las muestras
siguen distribucin normal y los estimadores son insesgados,
Ed {0(1) } = 0 Ed {0( 2 ) } 1 / N

Ed {0( 3) } = 0 Ed {0( 4 ) } 1 / N 2

( 6.126 )

donde E indica la esperanza con respecto a las muestras de diseo, y siendo


N1=N2=N el nmero de muestras de diseo, se concluye desde ( 6.125 ) y ( 6.126 ) que:
2
Ed {h( X )} 1 / N Ed {h2 ( X )} 1 / N Ed {h3( X )} = 1 / N 2 Ed {h4 ( X )} 1 / N
( 6.127 )

si N es razonablemente grande, slo interesa E{hm(X)} menor o igual 2. Por otro


lado, haciendo uso de la expresin genrica del error :

1 1
+
2 2

e j h ( X ) ~
j p ( X )ddX

( 6.128 )

cuando h sea pequeo, es posible aproximarlo por trminos de hasta segundo


orden:

jh ( X )

=e

jh ( X )

jh ( X )

jh ( X )

(
j )
1 + jh( X ) +
h2 ( X )
2

( 6.129 )

luego, =  puede ser aproximada por

DISAM-UPMT-98-015

229

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

1
2

h( X ) +

j 2

h ( X ) e jh ( X ) ~
p ( X ) ddX
2

Carlos Platero

( 6.130 )

la esperanza del error respecto al nmero de muestras de diseo ser :


E{} =

1 1
+
2 2

E d e j h ( X ) ~
j p ( X )ddX = +

( 6.131 )

donde se deduce que el sesgo puede ser aproximado a :


1
2

j 2

h ( X ) e jh ( X ) ~
p ( X )ddX
h( X ) +
2

( 6.132 )

cuando h es funcin de q parmetros, y1 ,..., yq, h es

h
1 q q 2h

y
+
y i 2 y y yi y j
i =1
i =1 j =1
i
i
j
q

( 6.133 )

considerando que los estimadores son insesgados, E{yi} = 0, y descartando


trminos superiores al segundo orden
E {h}
E {h

1 q q 2h
E yi y j

2 i =1 j = 1 yi y j d

h h
E d yi y j
i y j

} y
i =1 j =1

( 6.134 )

e introduciendo ( 6.134 ) en ( 6.132 )


1

2

h h
1 q q 2h
jh X

+
j
p X ddX

Ed yi y j e

2 i =1 j =1 yiy j

y
y
i
j

( 6.135 )

si los parmetros son M1, M2, 1 y 2 de dos distribuciones normales, al aplicar las
esperanza de los sesgo de los parmetros queda

230

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

2
2
n
n 2h
h i r
h 2 i r
2h

r 2 + j
r
r +
r 2 + j
r

m
m
N
c
c

N r 1
1
=
r =1 i =1
i
i
i
ii
ii


2
n i 1
h i r jr jh X
2h
e
+ r 2 + j r
p X ddX
r

c
c
N

i =1 j =1
ij
ij

( 6.136 )

1

4

expresin que va a depender de como h este constituida por Mi y i. Obsrvese que


el sesgo va a depender del nmero de muestras. Por lo tanto, para estos clasificadores
v
N

 = +

( 6.137 )

donde v vendr definida por la arquitectura del clasificador. Los siguientes prrafos
tratan de localizar v para clasificadores cuadrticos y lineales.
6.2.2.1 Sesgo de Clasificadores cuadrticos
En el caso de utilizar un clasificador cuadrtico, h(X) ser del tipo

hX =

T
T
1
1
1
X M1 ) 1 1 ( X M1 ) ( X M 2 ) 2 1( X M 2 ) +
(
2
2
2

1
2

t
( 6.138 )

donde t es el umbral fijado por las probabilidad de los clusters. Para el clculo del
sesgo del error se utilizar ( 6.136 ), del que es necesario introducir las derivadas parciales
de h respecto a sus parmetros. Haciendo uso de Fukunaga et al [Fukun89] para
obtenerlas, se tiene:

h
= ( 1)r r X M r
M r

( 6.139 )

2h
= ( 1)r +1 r
M r2

( 6.140 )

h
r 1
(
)
=

1
2 ij
cijr
2

DISAM-UPMT-98-015

(x

mi r

)(x

i r jr

mjr

ij
r
i

( 6.141 )

231

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

2 ij ( xi mi r
2h
r +1

= ( 1)
i r 2 jr
cijr 2
2

) + (x
2

m jr

i
r

r
j

Carlos Platero

1
i jr
r

( 6.142 )

donde r = 1,2. Considerando que los datos son transformados sin prdida de
generalidad a I-, tal que i(1) = 1, i(2) = junto mi(1) = 0 y mi(2) = mi, e introduciendo de
( 6.139 ) a ( 6.142 ) en ( 6.136 ), el valor de v de ( 6.137 ) para el clasificador llega a
ser :
vq =

1
2

X e jh X p X ddX

( 6.143 )

donde
2
n
1
2 (xi mi )
f q ( X , ) = ( n + 1) xi

i
2
i =1

n
n
x

m
x j mj
(
)
1

i
i
+ j n + xi2 x 2j +

i j
2 i =1 j = 1

)
2

( 6.144 )

integral extendida en X n-dimensional y en el barrido de la frecuencia. El


procedimiento para su determinacin es similar al empleado en el clculo del error visto en
6.1.2.1.1. La integracin de ( 6.143 ) ser llevada a cabo mediante la descomposicin
polinmica de momentos no centrados respecto de X. stos son funcin de la frecuencia,
habindose transformado la integracin en n+1 dimensional a unidimensional.
6.2.2.1.1

Caso I-I

Para el caso de datos I-I es posible obtener una expresin explcita de la integracin
de ( 6.143 ). Considerando dos poblaciones normales NX( 0, I ) y NX( 0, M ), se puede
escribir e jh ( X ) p( X |i ) como
e jh ( X ) p( X |1 ) =

232

2
T

M M

e M

M /8

1
j
N , T N X ( j M , I )
2 M M

( 6.145 )

Dos grupos normales con matrices idnticas y transformadas a unitaria

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

e jh ( X ) p( X | 2 ) =

MT M

e M

M /8

1
j
N , T N X ((1 + j ) M , I )
2 M M

( 6.146 )

donde N(a,b) y NX(D,K) son funciones de densidad de y X, con un vector de


medias a y varianza b para N y con vector de medias D y matriz de covarianza K para NX.
Desde la observacin de tener fq(X,) como una combinacin de xik x lj ( k , l 4) ,

vase con mayor detenimiento para el caso general I-,

( X , ) N X ( D, K ) dX es una

conjuncin de momentos no centrados de NX(D,K). El resultado de la integracin se


convierte en un polinomio en

(M
( ) =
i

(M
#
+

M)
( M T M ) n + 5 + 3( M T M ) ( j ) 3
2
( j ) 5 # ( M T M ) ( j ) 4 +
2
2
2

M)
n + 5 + 2( M T M ) ( j ) 2
2

2
1
(n + 1) M T M
n(n + 7) + (5n + 9) M T M + ( M T M ) ( j ) #
4
2

( 6.147 )

donde - y + de # son para i = 1 y 2 respectivamente. De nuevo, la integral

( ) N
i

( a , b) d es una combinacin de momentos de N(a,b). Para el caso de p(1) =

p(2) = 0.5, el valor de vq tiene la siguiente expresin analtica


vq =

6.2.2.1.2

1
4 2M T M

e M

M /8

2
( M T M )2 ( M T M )
MT M
n
n
1
+
+
+

2
16
2

( 6.148 )

Caso I-

Para el caso general ser necesario recurrir al clculo numrico, no habindose


determinado ninguna solucin explcita. De la misma manera que en el caso anterior y
aplicando el procedimiento visto para el clculo de la funcin caracterstica (6.1.2.1.1) , se
pasa simultneamente una diagonalizacin y desplazamiento en los datos,
Y = AT ( X M T ) , tal que quedar N1(0,I) y N2(M,), donde

Dos grupos normales con transformacin blanqueante

DISAM-UPMT-98-015

233

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

v qr =

( 1)r +1 p ( r )
2

(Y , ) e j h (Y ) p (Y | r ) dYd

r = 1,2

Carlos Platero

( 6.149 )

Para su resolucin se considera exclusivamente el caso unidimensional, siendo esta


solucin una de las aportaciones de la tesis. Si se analiza las expresiones e jh (Y ) p (Y | r )
para ambos grupos quedar:
1

1
jy 2 ( 1)
jvy + jc =
exp y 2

v )
(
j v
1
1

=
Ny
,
exp
+ j c

1
1
1

1
1 - j
1 - j

21 - j

1 - j

e j h ( y ) p ( y | 1 ) =

( 6.150 )
y para el segundo grupo:
1 ( y m )2 jy 2 ( 1)


jvy + jc =
exp

2 1 / 2

m
m

j
v

j
v

2
1
1

exp
,

+ j c
Ny
1 2
1
1 - j 1 1 - j 1
1 1/ 2
1
2 j

- j

( 6.151 )

e j h ( y ) p ( y | 2 ) =

donde
m
m2 1
v=
;c =
ln t

2 2

( 6.152 )

observndose que la diferencia respecto a la funcin caracterstica de (6.1.2.1.1) es


la insercin de fq(Y,). Pero fq(y,) es un polinomio de yk, con k desde cero a cuatro. ste
junto con e jh (Y ) p (Y | r ) representarn el desarrollo en momentos no centrados de

j v
1
,
Ny(,2), que para el caso del grupo 1 ser N Y
,
1 j ( 1) / 1 j (1 )/

m / j v
1
. Todo
mientras para el grupo 2 se tendr N Y
,
1 / j ( 1) / 1 / j ( 1)/
ello permitir la conversin de ( 6.143 ) en integral unidimensional extendida en la

234

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

frecuencia. Para ello habr de tener los momentos no centrados correspondientes a una
normal unidimensional Ny(,2), que son
E{y} =

{ }
E {y }= ( + 3 )
E {y }= + 3 + 6
E y2 = 2 + 2
3

( 6.153 )

insertando dichas expresiones en ( 6.144 ), los polinomios correspondientes sern:

j
1
3
( j v ) 4
6( jv) 2

1 ( ) =
+
+
+
1 + 2
2
4
3
4

(
1
)
(
1
)
(
1
)

3
( jv) 2
2
( j ) mv
+
2
j ( 1)
j ( 1)
1
1

+
+
j ( 1)
2
1

1 3 jm 2
1
( jv ) 2

+ 1 +
+
2
2
j ( 1)
2
j ( 1)

1

2 m jm 3

jv

2
1
m4 m2

+ j 1 + 2
j ( 1)
2 2

( 6.154 )

y para el grupo 2 ser:

DISAM-UPMT-98-015

235

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

m
m

( j v ) 4
6( jv ) 2
j

1
3

2 ( ) =
+
+
+
1 + 2
2
4
3
4 1 j ( 1)
1 j ( 1)
1 j ( 1)
+

2
( j v ) 2
m

+
jv jm
2

1 j ( 1) 1 j ( 1)

+
+
1 j ( 1)
2
+

m 2

j
v
(
)
1 3 jm 2

+ 1 +
+
2
2
2 1 j ( 1) 1 j ( 1)

2m jm 3
m

jv

1

m4 m2
+ j 1 + 2
+
2 2
1 j ( 1)

( 6.155 )

Obteniendo una integral unidimensional definida en el rango de la frecuencia. sta


deber ser calculada numricamente. Las expresiones ( 6.154 ) y ( 6.155 ) son
aportaciones de esta tesis y son las expresiones genricas para el caso unidimensional. Si
se aplica dos poblaciones normales unidimensionales de igual varianza, N1(0,I) y N1(M,I),
en estas ecuaciones se obtendrn las conclusiones vistas en ( 6.147 ). Las evaluaciones de
estas expresiones sern realizadas en el apartado 6.5

6.2.2.2 Sesgo de clasificadores lineales


Al utilizar un clasificador lineal de Fisher con h(X) igual a :
h X = ( M 2 M1 ) 1 X +
T

1
( M T 1 M1 M2T 1 M2 )
2 1

( 6.156 )

donde = ( 1 + 2 ) 2 y considerando las derivadas parciales de h(X) respecto a


sus estimadores, Mi y i , [Fukun89] :

236

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

h
= ( 1)r 1 X M r
M r

( 6.157 )

2h
= ( 1)r + 1 1
M r2

( 6.158 )

h
h cij
1
+ ji ijij
r =
r =
cij
cij cij
2i j ij

2h
2 h cij
=

cijr 2 cij2 cijr

2
=
4i j

( 6.159 )

ij ji
ij

+
ij
j
i
i

( 6.160 )

donde

ij = (mi 2 mi 1 )x j +

y cij = cij1 + cij2

1 1 1
m m mi 2 mj2
2 i j

i = (i 1 + i 2 ) 2 . En particular, cuando se hace una

transformacin y desplazamiento a I-, i 1 = 1 i 2 = i mi 1 = 0


expresiones ( 6.159 ) y ( 6.160 ) quedan como :

)(

h
2
+
r =
cij
(1 + i ) 1 + j ij ji ij ij

2h
4
r 2 =
cij
(1 + i ) 1 + j

( 6.161 )


ji
ij
ij

+
ij
(1 + ) 1 +
(1 + i )
i

mi 2 = mi , las

( 6.162 )

donde

ij = mi x j

1
m
mi m j = i 2 x j m j
2
2

( 6.163 )

Introduciendo de ( 6.157 ) a ( 6.162 ) :

DISAM-UPMT-98-015

237

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

vl =

1
2

f ( X , )e

j h ( X )

Carlos Platero

~
p ( X )ddX

( 6.164 )

donde:

n
n 1
1 2i mi
1 i
mi
i j
+
+ (2 y i mi )
+
f l (Y , ) =

3
2

+
+
1
1
(1 + i ) j =1
i =1
i
j
(1 + i )

n
n m (2 y m )(1 + )

j n yi2 + ( y i mi ) 2 i
i
j
j
i j

(
(
)
)
+
4
+
m
2
y

m
+
m
(
2
y

m
)

i
j
j
j
i
i
2
2
2

2 i =1
(
)
(1 + i )
(1 + i ) 1 + j
i =1 j =1

( 6.165 )

siendo fl(Y,) una combinacin lineal de yik (k 2), vl tiene solucin explcita para
el caso I-I, resultado:
vl =

6.2.2.2.1

1
2 2M T M

e M

M /8

M T M
1 +

n 1

( 6.166 )

Caso I-

Con igual procedimiento que para el clasificador cuadrtico habr de recurrir al


clculo numrico y slo se ha efectuado para el caso unidimensional. El planteamiento es
similar al clculo de la funcin caracterstica lineal (6.1.2.1.2). Se pasa simultneamente
una diagonalizacin y desplazamiento en los datos, Y = AT ( X M T ) , tal que quedar
N1(0,I) y N2(M,), donde
v lr =

( 1)r +1 p ( r )
2

(Y , ) e j h (Y ) p (Y | r ) dYd

r = 1,2

( 6.167 )

Analizando las expresiones e jh (Y ) p (Y | r ) para ambos grupos quedar:


e jh ( y ) p ( y | 1 ) =

238

(v )2

1
1

exp y 2 + jvy + jc = N y ( jv,1)exp


+ jc
2
2 ( 6.168
2

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

y para el segundo grupo:

j h ( y )

1 ( y m )2

+
+
p( y | 2 ) =
exp
j
vy
j
c

21 / 2

( jv )2

= N y ( jv + m, )exp
+ j (c + vm)
2

( 6.169 )

m2
2m
;c =
+1
1+

( 6.170 )

donde
v=

quedando que fl(y,) es un polinomio de yk, con k desde cero a dos. ste junto con
e jh (Y ) p (Y | r ) representar el desarrollo en momentos no centrados de Ny(,2), que para
el caso del grupo 1 ser N Y ( j v ,1) , mientras para el grupo 2 se tendr
N Y ( j v + m , ) . Todo ello permitir la conversin de ( 6.167 ) en integral
unidimensional extendida en la frecuencia. Slo resta obtener los polinomios para los dos
grupos:
2

m 2 (1 + 2 ) 2
m 2 (1 + 2 )
3

4vm( j )2

1 ( ) =

(
)
+4
v
j

+
4
2
4

(1 + )
(1 + )
1+
(1 + )
4m 2 (1 + 2 ) + m 4 (1 + 2 ) 4mv(1 + 2 ) 2m 2
2
( j )
+
+
+
+
4
3
2
(1 + )
(1 + )
(1 + ) (1 + )

1
m 2 (1 + 2 )
+
2
1+
(1 + )3

( 6.171 )


m 2 (1 + 2 )
3
( j )2 +
2 ( ) = ( )(v 2 2 )( j ) + 2 ( )mv 2vm
+
2
4

(1 + )
(1 + )

m 4 (1 + 2 )
mv (1 + 2 ) 2m 2
+ 3
+
4

+ 2 ( )(m 2 + 2 )( j )
4
3
2
(1 + )
(1 + )
(1 + )

2
2
1
m (1 + )
+
+2
1+
(1 + )3

1
m 2 (1 + 2 )

( ) = 2
+2
4

1
+

(
1
)
+

DISAM-UPMT-98-015

( 6.172 )

239

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

Obteniendo una integral unidimensional definida en el rango de la frecuencia. sta


deber ser calculada numricamente. Estas expresiones ( 6.171 ) y ( 6.172 ) tambin son
aportaciones de la tesis. Al igual que el sesgo cuadrtico, el sesgo lineal ser analizado
experimentalmente en el apartado 6.5

6.3

Mtodo de parametrizacin de los cluster dos a dos


A continuacin se presenta un novedoso mtodo de parametrizacin de los clusters
basados en transformaciones Box Cox, medidas de Bhattacharyya y valoracin a partir del
nmero de muestras que se tiene. En el captulo anterior se habl de las transformaciones
normalizantes, adems en el anterior punto, se ha estudiado los efectos de estimacin de
parmetros con un conjunto de muestras y se ha evaluado el error de Bayes. Slo resta por
mencionar consideraciones sobre la seleccin de las caractersticas, para proceder a
explicar el mtodo propuesto. Por lo que se presenta a continuacin criterios de diseo
sobre la seleccin de las caractersticas para culminar con el clustering paramtrico.

6.3.1

Reduccin de la dimensin: Seleccin de las caractersticas


Uno de los problemas clsicos en Reconocimiento de formas es la reduccin de la
dimensin del vector de entrada X desde la dimensin L a M, siendo M < L. Tanto en el
Anlisis discriminante como en el Reconocimiento de formas, ambos tienen como objetivo
buscar filtros que permitan reducir la dimensin del espacio. Una de las ventajas ms
notables de la reduccin del vector, consiste en el diseo de clasificadores ms rpidos y
menos complejos. La reduccin de la dimensin debe ir acompaada del tipo del problema
a resolver y del conocimiento a priori que se tenga del modelo. Sea por ejemplo conocida
la relacin entre dos caractersticas del problema concreto, ser solo necesario estimar la
funcin de distribucin de una de las dimensin, ya que la otra ser obtenida a partir de la
estimada, permitiendo eliminar una de las dimensiones. De otro lado, a menor dimensin
menor nmero de muestras es requerido para la generalizacin. En los trabajos
experimentales suele suceder que el nmero de muestras del universo sea escaso, lo que
obligar a buscar subespacios de dimensiones reducidas.
La pregunta de partida es si se puede reducir la dimensin del vector utilizando una
muestra del espacio de entrada. La respuesta es $si#, pero siempre y cuando se utilice
conocimiento del problema especfico.
6.3.1.1 Extraccin Versus Seleccin
La extraccin de las caractersticas es la reduccin del conjunto de medidas que se
pueden realizar en la modelizacin de un estado del problema, y a cada una de ellas se las
llamar caractersticas. Para obtener esta disminucin de la dimensin suele utilizarse
estructuras de datos ms o menos estndar; por ejemplo en Visin artificial suele utilizarse
las medidas de Hu, momentos de inercia, centros de gravedad, reas, permetros,.... Algo

240

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

ms especfico es dado por Han et al[Han93] que proponen un catlogo de caractersticas


para la modelizacin de inspeccin superficial mediante Visin artificial.
Intuitivamente se puede decir que a medida de que se tenga ms conocimiento del
problema decrecer el tamao del espacio del vector. As si se desea modelar los defectos
superficiales, es seguro que el vector de caractersticas a extraer disminuye, si existen
direcciones privilegiadas en la formacin de las faltas visuales. En definitiva, en la medida
de que se parte de mayor grado de informacin sobre el problema, menor ser el vector y el
nmero de muestras necesarias para la representacin del universo. Aun ms, si no hay
lugar para la insercin de conocimiento por parte del experto, no habr programa de
computador. Por lo tanto, el hombre es, hoy por hoy, la mejor fuente de modelos, el cual
podr inferir las relaciones existentes entre las medidas x1, x2, ..., xL y conseguir
caractersticas y1, y2, ..., yM , M < L.
Desde el punto de vista estadstico, la reduccin de la dimensin deber ser tal que
la seleccin, sea, la mejor familia de funciones bases que permitan proyectar desde el
espacio L-dimension al M-dimensional, consiguiendo que el subespacio tomado sea "el
mejor" en el sentido de reducir la dimensin y mantener una alta prestacin de
discriminacin. Usualmente, dos o mas clases sern consideradas a la vez, aunque en esta
tesis slo se aborda el enfrentamiento de dos a dos clases, siguiendo con el planteamiento
inicial de este captulo. El nivel de discriminacin permitir caracterizar diferencias entre
las clases as como dentro de cada propia clase.
6.3.1.2 Seis principios de reduccin de la dimensionalidad
En esta seccin se presenta seis principios de reduccin de la dimensionalidad, que
van a suponer el soporte para el mtodo de parametrizacin propuesto:
1. Los vectores del espacio de medidas, X, sern utilizados para estimar los
vectores y matrices que caractericen la funcin de densidad del grupo, p( X|i ).
2. Si existe la proyeccin desde X SL a YSM, con M < L, no es necesario
conocer p(X|i) sino p(Y|i); facilitando la estimacin de los parmetros que
caracterizan la funcin de densidad. La eleccin del subespacio ser tal que maximice la
separabilidad de las funciones de densidad condicionadas.
3. Como alternativa a los dos primeros principios, referentes a la caracterzacin de
las funciones de densidad, este punto hace referencia a que es posible estimar directamente
las fronteras de las clases, si se conoce a priori cual es el tipo de frontera entre clases
colindantes. Y en el caso de que sea desconocida, en teora podra ser aproximada por la
adecuacin de un nmero finito de hiperplanos.
4. La estimacin de las funciones de densidad a partir de un nmero de muestras es
extremadamente difcil. Por lo que se sugiere buscar transformaciones que ayuden a
parametrizar el espacio de medida.

DISAM-UPMT-98-015

241

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

5. Las medidas debern ser de carcter continuo y discreto. Las medidas discretas
servirn para generar regiones de estudio; mientras las caractersticas continuas sern
usadas para la caracterizacin de las funciones de densidad en estas regiones. Las
componentes discretas debern tener la caracterstica de variar significativamente en el
sentido de pasar de una regin a otra alejada; en caso contrario, no estara justificada la
componente.
6. Un sexto principio es que las caractersticas deben ser obtenidas como relaciones
no lineales entre las medidas y aplicables en toda la regin de estudio. Estas relaciones
actan estableciendo regiones equivalentes en el espacio de medida.
6.3.1.3 Reduccin de la dimensin
Existen multitud de tcnicas de reduccin de la dimensin tal como se discuten, por
ejemplo en [Patri72][Raube95]. El origen se encuentra en buscar la transformacin de SL a
SM, tal que teniendo Ni muestras de cada clase, formadas por vectores XSL al ser
mapeados a vectores YSM, sean clasificados con mayor rapidez y menor complejidad. En
definitiva, el objetivo ltimo de la reduccin es mejorar la calidad del clasificador en un
compromiso entre la velocidad, generalizacin y capacidad de discriminacin. Bajo estas
pautas, las lneas generales en el desarrollo de sistemas de seleccin de caractersticas
sern las siguientes:
1. En general, la reduccin de la dimensin debe ser local; las transformaciones
sern aplicadas a regiones del espacio de observacin, raramente se aplicar de forma
global. Una regin para estos propsitos, se define como el conjunto de puntos de XSF al
que se le aplica la misma transformacin de reduccin de la dimensin.
2. Las medidas tomadas sobre el espacio de observacin al proyectarse desde SF a
SL deben de aumentar las distancias entre las clases. Si las transformaciones de las
componente utilizan conocimiento a priori, existe la posibilidad de buscar el marco de
transformaciones que aumenta la distancia entre ellas.
3. Para algunas regiones, la reduccin de la dimensin puede venir por una simple
transformacin lineal; por ejemplo, uso de las primeras componentes principales ms
discriminantes. No obstante, desde el puntos de vista general no sern tan afortunados
estos tipos de cambio, recurdese, por ejemplo, que la distancia de Mahalanobis es
invariante ante transformaciones lineales.
4. Las relaciones entre las medidas ( componentes del vector X ) varan de una
clase a otra; esta generalidad puede ser usada para discriminar clases. Apoyando el criterio
de bsqueda de filtros no lineales para cada clase.
5. La dimensin de la clase i transformada ser menor al rango de la matriz de
covarianza estimada, i , dentro del entorno local concerniente. Esta disminucin local de

242

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

la dimensin puede ser usada por la clase i sin perdida de informacin. Hay excepciones a
esta definicin.
6. Las relaciones no lineales entre las componentes de X pueden proporcionar la
eliminacin de algunas regiones, permitiendo generar marcos interregionales de
discriminacin. En definitiva, ciertas regiones obtenidas por el anlisis de clustering,
pueden ser unidas a tenor de las reducciones planteadas y buscar funciones discriminantes
con otras regiones colindantes desde una plataforma conjunta.
7. Cuando la dimensin del vector es grande, se puede utilizar un mtodo de
reduccin basado en subconjutos de medidas, tal que se destile la correlacin entre stos y
genere una jerarqua de disminucin de la dimensin.
8. La etapa final estar formada por una cierta distancia, di(X), sintctica,
estadstica, borrosa,..., y un comparador.
Bajo estas reflexiones se propone una metodologa de clustering paramtrico con
seleccin de las caractersticas, mediante transformaciones Box Cox y distancia de
Bhattacharyya, esto es, la propuesta busca transformaciones no lineales de subespacios de
regiones, tal que sean normales, lo que permitir su parametrizacin, y que adems tengan
el menor error de clasificacin a partir del nmero de muestras.
6.3.2

Clustering paramtrico
La modelizacin de cada uno de los cluster mediante algn tipo de funcin de
densidad conocida puede ser planteada desde las transformaciones Box Cox (ver prrafo
5.3.2). Dichas transformaciones tratan de convertir la distribucin de la poblacin en
normal. La expresin es :

x jkk

x jk + m k 1

=
k

x
jk + m

k 0

k = 0

( 6.173 )

siendo xjk la muestra j de la componente k y m se elige de forma que para cualquier


x + m sea siempre positivo. Para la determinacin del vector hay que maximizar el
estadstico L, siendo L() :n
Lmax =

N
2

k =1

j =1

+ k 1

x jk

( 6.174 )

donde N es el nmero de muestras, n la dimensin del espacio y () la matriz de


covarianza estimada de las variables transformadas. El procedimiento de localizacin de
ptimo ha sido estudiado por Velilla et al[Velilla94]. No obstante, implican
transformaciones diferentes en cada cluster y por lo tanto con niveles de medida distintos

DISAM-UPMT-98-015

243

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

entre ellos. Ante esta tesitura, el planteamiento alternativo consiste en la transformacin


conjunta dentro de una regin determinada, con el objetivo de preservar una medida del
espacio acotado que sea comn.
El fundamento se basa en las localizaciones de las ptimas transformaciones Box
Cox marginales. El sesgo del estimador de las transformaciones, L(), sigue una 2 con n
grados de libertad (ver prrafo 5.3.6). Este hecho permite buscar cual es la transformacin,
si existe, capaz de convertir la distribucin en los diferentes grupos como normal. La
solucin ser ms difcil en la medida de que participe ms grupos. Por este motivo, el
estudio se ha centrado en la parametrizacin dos a dos de los cluster.
Considerando que slo hay dos clases, c = 1,2, se trata de comprobar la posibilidad
de transformacin Box Cox comn marginal. Sea la caracterstica i, i = 1,2, ...,n, y
llamando i1* y i2* las soluciones ptimas marginales para cada grupo. Es posible definir
un i* comn, si cumple que:
1 2
1 ( 1 ) L(*i )
2
1 2
*
Lmax (i 2 ) 1 ( 2 ) L(*i )
2
i > c
Lmax (*i1 )

( 6.175 )

L()

siendo i el ndice de confianza, capaz de construir un intervalo para el valor de la


funcin de verosimilitud en el verdadero valor de , mientras c implicar el nivel crtico.
De otro lado, al tratar con distribuciones marginales 2 ser de un grado de libertad.

*i1

*i2

Figura 6.6 Localizacin ptima de

La localizacin del ptimo entre las dos


distribuciones, es impuesto por la condicin de
igualdad en los niveles de confianza. No tendra
sentido que fuesen distintas ya que significara
aproximarla ms a una que a otra en la distribucin
normal marginal. Sin prdida de generalidad, sean
etiquetados los grupos como 2 y 1 tal que cumplan i2*
> i1*. Obsrvese que la solucin estar en el intervalo
[ i1* i2* ], y al ser L(i) una funcin convexa,
continua y su derivada tambin continua, Lmax(i2* ) L(i2) es montona decreciente y Lmax(i1* ) - L(i1) es
montona creciente, ambas mayor o igual a cero en el
intervalo.
Implicando
una
nica
solucin,

correspondiente a:

244

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

^
^
N2
N
*
*
ln( 2 ( i ) 2 ) + 1 ln( 1 ( i ) 2 )
2
2
N2
N1

*
*i *i1 *i 2
+ ( i 1) ln x ji ln x ji
j =1
j =1

L max ( i 2 ) L max ( i1 ) =

( 6.176 )

siendo N1 y N2 el nmero de muestras de cada cluster


6.3.2.1 Seleccin de las caractersticas transformadas
Despus de haber localizado las posibles transformaciones marginales en la regin,
definida por los dos cluster de enfrentamiento, se sugiere realizar una primera criba. No
todas las componentes tendrn transformacin al no cumplir ( 6.175 ). Seguidamente es
buscado el espacio que cumpla normalidad en los dos cluster, maximice la distancia de
Bhattacharyya, y la medida tenga mnimo sesgo y varianza, pues dicha medida ha sido
determinada por un conjunto de muestras finito.
n
Aunque la bsqueda del ptimo espacio pudiera parecer explosiva, por ser
m
combinaciones con m = 1 ,..., n, al aplicar la condicin necesaria, de que cualquier
subconjunto debe ser tambin normal, limitar las
posibilidades de exploracin. Para el examen de los
0
posibles espacios, ha sido utilizado el algoritmo visto en
3
4
5
1
2
5.3.1.3.
2

5 3

El procedimiento genera un rbol de los posibles


espacios normales. La figura 6.7 muestra un grfico de
3
5
5
como queda la exploracin con una dimensin n = 5, las
aspas indican que no ha pasado el test de normalidad.
Los posibles recorridos del rbol desde la raz hasta cada
nivel determinarn las posibles soluciones del espacio.
Figura
6.7
Arbol
de
Una buena medida para ahorrar tiempo computacional es
exploracin
de
espacios
ordenar las caractersticas de menor a mayor ndice de
normales
normalidad, llamando 1 a la caracterstica de menor
normalidad y n la de mayor ndice marginal de normalidad.

6.3.2.2 Distancia de Bhattacharyya, sesgo y varianza


Una vez generado el rbol de los posibles espacios normales de caractersticas
transformadas, se puede utilizar la distancia de Bhattacharyya como lmite superior del
error de Bayes:

DISAM-UPMT-98-015

245

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

1
1 + 2
M 2 M1 T

8
2

1
2

1 + 2
2

1 2

Carlos Platero

( 6.177 )

El primer y segundo trmino, 1 y 2, miden la distancia entre dos distribuciones


debido a las medias y a las covarianzas. Cuando Mi y i son determinados mediante un
conjunto finito de muestras, el resultado de difiere de su verdadero valor. Por lo que
habr de calcular el sesgo y la varianza.
Haciendo uso de la metodologa expuesta, sobre la influencia del tamao de las
muestras en la distancia de Bhattacharyya, se obtuvo expresiones del sesgo y la varianza
para cualquier poblacin normal N1(1 1), N2(2 2) inferida con N1 y N2 tamaos de
muestras. Aunque paso previo, y sin perdida de generalizacin, las poblaciones deben ser
desplazadas y transformadas, tal que las matrices de covarianza sean diagonalizadas a I-
(whitening transformation), quedando stas en N1(0,I) y N2(M, ). Con esta distancia,
junto al sesgo y la varianza se determinar cual es el ptimo espacio transformado.

6.4

Clasificadores no paramtricos: mtodo de aprendizaje


supervisado LVQ
De entre los mtodos no paramtricos se ha estudiado el algoritmo LVQ. La
motivacin viene dada por la tendencia de colocar hiperplanos de separacin en los bordes
de Bayes, adems de ser un algoritmo basado en aprendizaje mediante muestras. Por lo
explicado hasta este punto, este mtodo cognitivo resulta ser interesante pues aun siendo
no paramtrico, en su convergencia utilizada hiperplanos tal que tienden a minimizar el
error de Bayes. Todo ello conduce a explorar este algoritmo por las motivaciones que lleva
esta tesis. De hecho, por los estudios realizados sobre clasificadores paramtricos, se va a
llevar a realizar una propuesta de modificacin en este algoritmo, perfectamente
encuadrado y comprensible por el trabajo realizado.
En este apartado se explica los fundamentos del algoritmo as como su
convergencia, para pasar a continuacin a mostrar las motivaciones y el desarrollo de las
modificaciones propuestas sobre el algoritmo LVQ.

6.4.1

Introduccin
Learning Vector Quantization (LVQ) es una clase de algoritmos de aprendizaje
prximos al VQ y al SOM. Mientras VQ y SOM son mtodos de aprendizaje no
supervisados, LVQ responde al entrenamiento supervisado. Adems, a diferencia del

246

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

SOM, el algoritmo LVQ en el entrenamiento de los codebook vectors3, no se definen


entornos de vecindad alrededor del ganador.
LVQ genera regiones clases dentro del espacio de los datos de entrada, utilizando
un subconjunto de codebooks etiquetados para cada clase. Las regiones de cuantizacin,
similar a los conjunto de Voronoi en VQ, son definidas por hiperplanos entre codebooks
vecinos. En definitiva, los bordes de las clases estn constituidos por segmentos lineales
6.4.1.1 Teora de decisin ptima
Como se ha comentado repetidas veces, el problema de la decisin ptima est
encuadrada dentro de la teora bayesiana. Partiendo de un conjunto finito de muestras para
cada clase y definiendo las funciones discriminantes como :
hk ( X ) = p ( X | k ) p ( k )

( 6.178 )

de manera que ante una nueva muestra, sta quedar clasificada en la case c
utilizando la condicin de :
hc X =

max h

( 6.179 )

Los mtodos paramtricos en Reconocimiento de formas, primero intentan modelar


el espacio y luego utilizar ( 6.179 ). La filosofa de LVQ es distinta, en una etapa inicial se
asignan un subconjunto de vectores a cada clase k, y la clasificacin se otorga por la
mnima distancia eucldea entre una muestra y un codebook. Aqu no es importante la
aproximacin a la funcin de densidad condicional, p(X|k), sino que el lugar del
codebook, Mi, dentro del espacio de los datos minimice el error esperado de clasificacin.
6.4.2

Algoritmo LVQ
Suponiendo que estn etiquetados los codebooks, la regla de clasificacin est
basado en la vecindad, pudiendo ser expresado como :

c = indice min X M i

( 6.180 )

donde c es la etiqueta patrn de la neurona ganadora, y slo depende de X y Mi.


Considerando X(t) una variable aleatoria y Mi(t) una secuencia de valores Mi en el dominio
discreto del tiempo, t = 0,1,2,.., los valores de Mi en ( 6.180 ) que minimice el error de

Nombre utilizado para los vectores de LVQ

DISAM-UPMT-98-015

247

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

clasificacin, se encuentra en los valores asintticos del proceso de aprendizaje del LVQ.
Las ecuaciones que definen la evolucin del algoritmo son:

M c (t + 1) = M c (t ) + (t ) X (t ) M c (t )

M c (t + 1) = M c (t ) (t ) X (t ) M c (t )

Si X t M c t k

( 6.181 )

Si X t k y M c t r

Mi (t + 1) = Mi (t ) Si i c

( 6.182 )

( 6.183 )

recibiendo el nombre de LVQ1. Aqu (t) es un factor de aprendizaje, comprendido


entre 0 y 1. Su funcin es montonamente decreciente con el tiempo, siendo recomendado
que (t) empiece con un valor bastante pequeo, por ejemplo 0.01. No obstante, (t) no es
crtico, pudindose elegir una funcin decreciente lineal que tienda a cero.
6.4.2.1 Convergencia del algoritmo
La demostracin de que el algoritmo tienda a minimizar el error de clasificacin es
extremadamente difcil. La siguiente exposicin se basa en la propiedad del VQ como
algoritmo que tiende aproximarse a p(X). Si VQ en vez de acercarse a la funcin de
densidad de la variable de entrada, p(X), lo hiciera sobre los bordes de Bayes, y las
expresiones obtenidas resultaran ser similares a [( 6.181 )-( 6.183 )], mostrara la
capacidad el algoritmo LVQ de ser un clasificador no paramtrico con mnimo error de
clasificacin.
Primero habr que localizar una nueva funcin de densidad, f(X), que sea definida
con la condicin de tener todos los bordes bayesianos nulos. Por ejemplo, la expresin de
abajo cumple con el requisito impuesto :
f (X ) = p (X | k ) p ( k ) max h [ p( X | h ) p ( h )]

248

k h

( 6.184 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Donde k es la clase ganadora segn ( 6.178 ). La Figura 6.8 indica la forma de


f(X) en el caso unidimensional para tres
clases. En la parte superior aparecen los
P(X)
bordes bayesianos con lneas a trazos. La
funcin f(X) es cero en las posiciones
frontera, de acuerdo con ( 6.184 ) y en caso
contrario cumple f(X) > 0.
f(X)

Al utilizar VQ para aproximar el


punto de densidad de Mi a f(X), implica que
esta densidad tender a cero en todos los
bordes de Bayes. Con ( 6.184 ) y VQ se
definen los bordes bayesianos con un buen
nivel de acierto, dependiendo del nmero de
Figura 6.8 (a) Distribucin de las muestras en
vectores usados.
tres clases. (b) Representacin de f(X)

Los valores ptimos de Mi, en el


mtodo clsico VQ, se determinarn minimizando el error de cuantizacin esperado, E. El
gradiente de E, tal como se vio en 5.1.1.4 es:

Mi E = 2 ci ( X Mi )p( X )dX

( 6.185 )

en esta ecuacin ci es el delta de Kronecker, y c es el ndice de Mi que est ms


cercano a la muestra de entrada X. En cada entrenamiento, el codebook ser modificado de
la siguiente manera :
Mi (t + 1) = Mi (t ) mi (t ) E

( 6.186 )

en donde define el tamao del paso, y el valor de la funcin muestro, M i E en t,

ser M i (t ) E = 2ci [ X (t ) Mi (t )] . Un resultado es obvio de la ecuacin ( 6.185 ): slo el

ganador Mc(t), debe ser actualizado mientras el resto mantendrn el mismo valor durante el
paso.
Si p(X) en E, es reemplazada por f(X), el gradiente debe ser calculado en dos pasos
separados, cuando la muestra X(t) pertenezca a k y en el caso de X(t) pertenezca a h, por
la definicin de la nueva funcin de densidad. El gradiente de E, cambiando p(X) por f(X)
quedar como:

DISAM-UPMT-98-015

249

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

M i E = 2 ci (X M i ) f (X )dX =

Carlos Platero

= 2 ci (X M i ) p(X | k ) p( k ) max[ p(X | h ) p( h )] dX


h

( 6.187 )

Cuando X(t)k, la funcin de muestreo de M i E


M i (t ) E = 2ci [ X (t ) Mi (t )]

( 6.188 )

Si la clase con max h [ p (X | h ) p ( h )], es nombrada con el ndice r, y en el caso que


X(t) r, la funcin M(t)E se obtiene con la probabilidad a priori p( r ) y queda una
expresin como la que sigue :
M i (t ) E = +2ci [ X (t ) Mi (t )]

( 6.189 )

Reescribiendo la funcin ( t ) = 2 , se obtienen los siguientes resultados :

( 6.190 )

M c (t + 1) = M c (t ) (t ) X (t ) M c (t ) Si X t Bk y X t r

( 6.191 )

M c (t + 1) = M c (t ) Si X t Bk y X t h h r

( 6.192 )

Mi (t + 1) = Mi (t ) Si i c

( 6.193 )

M c (t + 1) = M c (t ) + (t ) X (t ) M c (t ) Si X t Bk y X t k

donde Bk define la regin del espacio de k con mnimo error. Si el codebook Mi de


la clase k estaba ya en la regin Bk , y se tiene en cuenta la forma de la funcin f(X) en la
Figura 6.8.b), el codebook Mi k debe aproximarse por el mtodo VQ a ser
representativo en Bk, al menos si los pasos de aprendizaje son pequeos.
Cerca del equilibrio, las expresiones ( 6.181 ) a ( 6.183 ) y ( 6.190 ) a ( 6.193 )
tienden a ser similares. No obstante, en LVQ la clasificacin se aproxima mediante reglas
de cercana en vecindad, y stas mejorarn sus prestaciones de clasificacin con el
aprendizaje. Sin embargo, cuando las muestras estn cerca de los bordes de Bayes, el
mtodo VQ es diferente a LVQ1. En VQ, existe modificacin del codebook si Mi es el
segundo ms cercano. Pero en LVQ, este efecto es indiferente, los vectores son
actualizados en cualquier caso de incorrecta clasificacin. Estas diferencias pueden causar
pequeos sesgos en los valores asintticos de Mi dentro del LVQ1. A razn de este
fenmeno, los algoritmos LVQ2 y LVQ3, que sern presentados seguidamente, tienden a
parecerse ms a VQ en este sentido.

250

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

6.4.2.2 Optimizacin del factor de aprendizaje en LVQ1 (OLVQ1)


El algoritmo bsico de LVQ1 puede ser modificado en el factor de aprendizaje. La
mejora viene al dar diferentes factores de aprendizaje para cada codebook, a diferencia del
anterior que era comn. Las expresiones de ( 6.181 ) a ( 6.183 ) quedan :

M c (t + 1) = M c (t ) + c (t ) X (t ) M c (t )
M c (t + 1) = M c (t ) c (t ) X (t ) M c (t )

Si X t M c t k
Si X t k y M c t r

Mi (t + 1) = Mi (t ) Si i c

( 6.194 )
( 6.195 )

( 6.196 )

Para determinar el valor de i(t), capaz de acelerar el proceso de convergencia, se


empezar con redefinir el algoritmo de aprendizaje de la forma :

M c (t + 1) = 1 s t c t M c (t ) + s t c (t ) X (t )

( 6.197 )

donde s(t)= +1 si la clasificacin es correcta, y s(t) = -1 en caso contrario. Es


evidente que la exactitud estadstica del aprendizaje de los codebook, vendr dado por la
igualdad de peso en la presentacin de todas las muestras. En consecuencia, si las muestras
son enseadas en tiempos diferentes, la correccin debe ir en el sentido de mantener la
misma importancia. Obsrvese que Mc(t) contiene toda la trama de muestras desde t igual a
1 hasta t-1. Adems, Mc(t) contiene el vector X(t-1) escalado, y tambin tendr la trama de
los valores anteriores debido al termino Mc(t-1). En cada uno de los aprendizajes que se
llevan a cabo durante el entrenamiento, la magnitud de aprendizaje del vector X(t) se debe
disminuir progresivamente a travs del factor c(t). As en el mismo momento de
actualizar Mc(t) tambin habr decrecido el termino de X(t-1) por el factor
1 s( t ) c (t ) c ( t 1) . Por lo que se puede concluir que estos dos factores que
disminuyen progresivamente los valores de X, deben ser idnticos:

c t = 1 s t c t c t 1

( 6.198 )

Si en estas condiciones se hacen para todo t, por induccin se puede ver que las
trazas de los primeros valores han sido escalados de una manera similar que las ltimas. El
factor de aprendizaje quedar como :

c t =

c (t 1)
1 + s(t )c (t 1)

( 6.199 )

Es necesario tener cuidado con el valor de c(t), porque puede incrementarse, y es


importante que no sobrepase en ningn momento el valor de 1. Esta condicin es impuesta

DISAM-UPMT-98-015

251

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

por el algoritmo. Para valores iniciales de i , se puede tomar 0.5, pero en muchos casos es
mejor tomar un valor prximo a 0.3.
Estas modificaciones que se han llevado a cabo en el algoritmo LVQ1, no pueden
ser llevadas en el algoritmo LVQ2, porque este algoritmo no es ms que una aproximacin
parcial de las ecuaciones de VQ, y en caso de aplicar al algoritmo LVQ3, ste debera ser
llamado OLVQ3.
6.4.2.3 LVQ2
El anterior algoritmo puede ser fcilmente modificado para mejorar la filosofa de
decisin bayesiana. La forma de clasificar es
idntica que en LVQ1, pero en el aprendizaje, este
algoritmo es diferente. Se toman dos codebooks Mi
y Mj, que estn prximos entre s y pertenecientes a
clases distintas. Inicialmente, parte del espacio de
los datos estarn etiquetados incorrectamente. La
superficie de separacin es siempre definido como
un hiperplano entre Mi y Mj. Definiendo una
ventana simtrica no cero alrededor del este borde, y
X
M
M
generando correcciones en Mi y Mj, cuando al caer
una muestra X lo haga justamente en el lado
incorrecto de la ventana. Estas modificaciones
Figura 6.9 Ilustracin de la ventana movern a los codebooks y por tanto desplazarn al
utilizado en LVQ2 y LVQ3
hiperplano de separacin.
i

En principio, uno de los dos codebooks debe pertenecer a la clase correcta, mientras
que el otro pertenecer a una clase diferente. La muestra debe caer dentro de la ventana,
que vendr definida por un ancho w. Si se denominan di y dj a las distancia entre Mi y Mj
con X respectivamente, se define la anchura de la ventana, w, segn la siguiente expresin:
d dj
1 w
min i , > s en donde s =
1+ w
d j di

( 6.200 )

normalmente es recomendable utilizar una ventana con una anchura de 0.2 o 0.3.
Cuando una muestra cae dentro de la ventana se aplicar :

M i t + 1 = M i t t X t Mi t

M j (t + 1) = M j (t ) + (t ) X (t ) M j (t )

( 6.201 )

( 6.202 )

donde Mi, Mj son los codebooks ms prximos a X, de forma que X y Mj tengan la


misma etiqueta, y X y Mi pertenezcan a clases distintas. La aplicacin de las expresiones

252

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

( 6.201 ) y ( 6.202 ) har tender asintticamente el hiperplano de separacin al borde


bayesiano
6.4.2.4 LVQ3
El algoritmo LVQ2 est basado en la idea de un desplazamiento de los bordes de
decisin hasta el ptimo de Bayes, mientras que no se prest atencin alguna a la posicin
del codebook Mi a lo largo del proceso. Por lo que parece necesario introducir algunas
correcciones que aseguren que Mi se contine aproximando fielmente a la funcin f(X).
Combinando algunas ideas, se puede obtener una algoritmo mejorado al que se ha llamado
LVQ3 :

( 6.203 )

( 6.204 )

M i t + 1 = M i t t X t Mi t
Mj t + 1 = Mj t + t X t Mj t

donde Mi y Mj son los dos codebooks ms prximos a la muestra de entrada X, y


Mj pertenece a la misma clase que X, mientras que Mi pertenece a una clase diferente,
adems X debe estar contenida dentro de la ventana anteriormente definida. Aadindose
la ecuacin de acercamiento a f(X) :
M k (t + 1) = M k (t ) + (t )[X (t ) M k (t )]

( 6.205 )

para k {i , j} , si X, Mi , y Mj pertenecen al la misma clase. El valor de debe estar


comprendido entre 0.1 y 0.5, y parece que depende del tamao de la ventana. Este
algoritmo parece que se estabiliza por si mismo, puesto que la localizacin ptima de Mi
no cambia en un aprendizaje continuado.
6.4.3

Modificaciones realizadas en el algoritmo LVQ1


Los distintos algoritmos LVQ vistos utilizan la distancia eucldea para determinar
cul es el codebook ms cercano. Como consecuencia de este proceder, se obtendr un
clasificador lineal, de manera que la separacin entre las diferentes clases vendrn
determinadas por un conjunto de hiperplanos. En la figura adjunta se muestra dos
poblaciones binormales las cuales son separadas por los vectores del LVQ, que tratan de
alinearse alrededor del borde de Bayes.

DISAM-UPMT-98-015

253

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

Figura 6.10 Separacin de dos poblaciones normales mediante LVQ

Si en vez de utilizar la distancia eucldea se utilizase la distancia de Mahalanobis,


un nico vector de referencia sera necesario. Se ha pasado del clasificador lineal al
cuadrtico. Recurdese el planteamiento anterior de transformaciones normalizantes, por lo
que es vlido suponer tener regiones de grupos con distribuciones normales. La
modificacin propuesta es utilizar la distancia de Mahalanobis en vez de la distancia
eucldea. Partiendo de la definicin de esta medida:
d i = (X M i ) i1 (X M i )
2

( 6.206 )

donde X es la muestra de entrada, Mi el vector de media del codebook, as como i


es la matriz de covarianzas asociada al codebook. Tanto el vector de medias como la matriz
de covarianzas vendrn definidas por las muestras de entrenamiento.
El algoritmo propuesto tiene la siguiente mecnica, una vez calculada la distancia
de Mahalanobis entre la nueva muestra y cada uno de los vectores existentes, habr de
determinar si la muestra de entrada pertenece a la misma clase que el vector ganador,
siendo ste aquel de menor distancia de Mahalanobis entre la muestra y el codebook. A
continuacin se pasar a modificar tanto el vector de medias como la matriz de covarianzas
asociados al coodebook ganador. Y de forma similar al OLVQ1, la variacin vendr dada
por el parmetro (t) que ir decreciendo monotnicamente en el tiempo.
Para la obtencin de los algoritmos de modificacin del vector de medias y de la
matriz de covarianzas, se ha definido el error de cuantizacin a partir de la distancia de
Mahalanobis, E:
E = (X M c ) c1 (X M c ) p ( X )dX
T

254

( 6.207 )

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

de esta manera se podr definir:


M c (t + 1) = M c (t ) + s (t ) (t ) M c E (t )

c (t + 1) = c (t ) + s (t ) (t ) c E (t )

( 6.208 )

donde s(t) es +1 cuando coinciden las etiquetas entre la muestra y el vector y 1 en


caso contrario. Haciendo uso del anexo de derivadas parciales sobre funciones potenciales
[Fukun90], y considerando que la mejor aproximacin del gradiente en la muestra t es la
distancia de Mahalanobis, quedar como:
E (t )
= c1T (t ) + c1 (t ) M
M c

M = X (t ) M c (t )

E (t )
= c1 (t ) MM T + MM T
c

) ) (t ) diag ( (t )(MM ) (t )))


T

1
c

1
c

1
c

( 6.209 )

El valor del parmetro (t), as como su ley de decrecimiento es muy importante y


crtico en la convergencia de este algoritmo. Como ley de decrecimiento de (t) se ha
tomado la siguiente:
(t )
1 + (t ) si la muestra est clasificada correctamente
(t + 1) =
(t )

si la muestra est clasificada incorrectamente


1 (t )

DISAM-UPMT-98-015

( 6.210 )

255

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

6.5

Carlos Platero

Aplicacin a la clasificacin de defectos locales en


planchas de aluminio colado
Las tcnicas comentadas han sido implementadas en la clasificacin de defectos
locales en planchas de aluminio colado. Partiendo de los resultados experimentales del
captulo 5, se ha procedido de la siguiente forma:
1. Parametrizacin dos a dos de los clusters segn mtodo presentado en 6.3.
2. Diseo de los clasificadores paramtricos a partir de los resultados obtenidos
en el anterior punto y segn se vio en 6.1 y 6.2.
3. Experimentos de convergencia del algoritmo modificado OLVQ y diseo de
los clasificadores no paramtricos segn este algoritmo.
4. Comparacin de los mtodos presentados con otras tcnicas tradicionales de
clasificacin.
A continuacin se presentan los resultados del trabajo experimental.
Parametrizacin dos a dos de los cluster segn mtodo presentado
en 6.3

6.5.1

Tras la obtencin de los clusters mediante las tcnicas de anlisis exploratorio de


los datos visto en el anterior captulo y basado en los mapa de Kohonen, las U-Matriz,
la descripcin de los patrones, y los subespacios normales, se paso a la parametrizacin
y seleccin de las caractersticas. Los resultado del anlisis de los datos queda reflejado
en la figura 6.11. En el mapa aparecen 12 grupos distintos; las neuronas etiquetadas con
XX son aquellas en las que no ha sido posible inferir informacin estadstica, por el
bajo nmero de muestras activadas en la neurona. Mientras, las etiquetas YY
corresponden con neuronas confusas, coexistiendo muestras de diferentes clases.
De este anlisis de los datos se da un enfrentamiento de dos a dos de los clusters,
tal que son vecinos pero les corresponden etiquetas distintas de tipos de defectos (ver
figura 6.11.b). Seguidamente se pas al mtodo propuesto como sigue: Eliminacin de
la componentes discretas, esta operacin se hizo mediante la meda, tal como se vio en
5.4.2. Posteriormente se paso a una preseleccin de las variables continuas con el
mtodo univar [Guine91] y manova [Coole71]. Los test de normalidad fueron
realizados con el contraste de Shapiro, con niveles de significacin mayores a 0.25.
Aceptndose la normalidad con la condicin de distribuciones marginales proyectadas
sobre componentes principales y cumpliendo la desigualdad de Bonferroni.

256

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Figura 6.11 a) Grupos obtenidos despus de aplicar el mtodo Cluster: 1- Bandas


transversales oscuras pequeas, 2- Bandas transversales oscuras medianas, 3- Manchas
oscuras, 4- Araazos, 5- Bandas longitudinales oscuras medianas 6- bandas longitudinales
oscuras grandes, 7- Faltas de material, 8 - Faltas de material grande, 9- Cristalizacin
anormal I 10- Cristalizacin anormal II 11- Pegado de rodillos, 12- Bandas brillantes. b)
Enfrentamiento entre clusters adyacentes

El cuadro 6.1 muestra un ejemplo del mtodo, aplicado a la regin comprendida


entre los cluster 6-9. Despus de haber eliminado las componentes sin informacin
estadsticas y haber hecho la preseleccin de las variables restantes, se localizan las
transformaciones Box Cox marginales tanto del cluster A como B.
Clases consideradas
6 9
Variables a considerar (meda)
4 11 1 3 5 2 17
Valor del criterio (Univar)
0.76 0.32 0.13 0.27 2.16 22 -28
marginales para A:
10 -4.33 6.96 9.99 8.97 9.99 9.99
Variables Eliminadas (por bajo c):
3 17
marginales para B:
-4.48 0.44 2.2 4.24 9.99
Variables Eliminadas (por bajo c):
* "optima"
1.96 0.89 0 6.21 5
Cuadro 6.1

Del cuadro se desprende que las componentes 4, 11, 1, 5 y 2 tienen


transformaciones marginales Box Cox comunes, cuyas ptimas son 1.96, -0.89, 0,
6.21 y 5 respectivamente. A continuacin se pasa a la bsqueda de subespacios
comunes de normalidad para ambos grupos, segn el rbol exploratorio de subespacios
normales visto en 5.3.1.3. Al final quedar un conjunto de subespacios transformados y
normales, de los cuales sern seleccionados aquellos que tengan mayor distancia de
Bhattacharyya, con menor sesgo y varianza a partir del nmero de muestras que se

DISAM-UPMT-98-015

257

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

tenga para la regin, tal como se vio en 6.3. Los resultados pueden ser contemplados en
la tabla 6.1:
Tabla 6.1 i ndice de confianza, error superior de Bayes,
distancia de Bhattacharyya, y Var() sesgo y varianza de la
distancia
1

(%)

0.44
0.65
0.78
0.46
0.54

0.96
0.58
0.58
0.37
0.95

2.68
1.55
19.3
2.98
0

2.84
3.39
0.87
2.74
10.7

0.38
0.61
0.09
0.34
1.41

2 Var(1) Var(2) Compo


nentes
0.03
1.22
0
4
0.31
1.44
0.02
4 11
0.03
0.08
0.02
11
0.04
1.04
0.007
1
0.03
13.3
0
5

Para el resto de los clusters es aplicado igual mtodo, resultando la siguiente


tabla 6.2 :

Tabla 6.2 Resultados del mtodo de clustering paramtrico


Clases
consideradas
1-4
1-5
2-5
2-6
3-9
4-7
5-7
5-8
6-8
6-9
7-12
8-10
8-11
9-10
10-11

6.5.2

(%)

-0.87
-1.69
-0.50
0.63
2.52
1.45
1.08
-6.10
2.06
1.96
-0.92
5.38
6.09
3.73
-6.18

0.32
0.33
0.32
0.67
0.67
0.34
0.41
0.55
0.45
0.44
0.88
0.56
0.31
0.97
0.94

0.46
0.46
0.48
0.43
0.96
0.67
0.62
0.40
0.43
0.96
0.42
0.87
0.40
0.48
0.54

0.17
0.15
0.13
8.98
3.51
0.77
0.34
11.7
0
2.68
11.6
3.61
22.4
0.53
9.77

5.57
5.77
5.83
1.53
2.44
4.15
4.88
1.38
8.95
2.84
1.25
3.61
0.78
4.37
1.59

0.44
0.85
0.55
0.11
0.89
0.21
0.33
0.30
3.91
0.38
0.15
1.2
0.14
1.02
0.78

2 Var(1) Var(2) Compo


nentes
0.01
2.43
0.01
5
0.01
4.79
0
5
0.02
3.28
0
5
0.04
0.18
0.02
4
0.01
2.05
0
5
0.01
0.95
0
5
0.02
1.64
0.01
4
0.04
0.52
0
4
0
28.11
0.04
2
0.03
1.22
0
4
0.02
0.26
0
9
0.06
3.98
0.02
9
0.02
0.08
0.04
4
0.04
4.09
0
5
0
0.97
0.04
12

Diseo de los clasificadores paramtricos


Una vez parametrizado el espacio para cada uno de los dos grupos enfrentado, se
pasa al diseado tanto de los clasificadores cuadrticos como lineales, cuyas
expresiones paramtricas corresponden a:

258

DISAM-UPMT-98-015

Carlos Platero

hX =

Captulo 6: Clasificadores estticos

1
1
X M1 T 11 X M1 X M2 T 21 X M2 +
2
2
1
2

1
2

( )
p( )
p 1
2

1
h( X ) = ( M2 M1 ) T 1 X + ( M1T 1 M1 M2T 1 M2 )
2

( 6.211 )

( 6.212 )

La primera referente al cuadrtico y la segunda a un clasificador lineal de Fisher.


Para cada clasificador local, tanto cuadrtico como lineal, se calcular su error utilizando
el mtodo visto en 6.1.2.1. De la misma manera y haciendo uso del mtodo presentado
en 6.2.2 se calcula para ambos el sesgo producido, como consecuencia de las
estimaciones realizadas a partir de un conjunto finito de muestras. Pero antes de entrar
en los resultados para el diseo de los clasificadores paramtricos del aluminio, se debe
verificar las conclusiones obtenidas en los apartados 6.1.2.1, 6.2.2.1 junto a 6.2.2.2
sobre los clculos del error y de los sesgos para dos poblaciones normales I-. Con tal
fin se va a realizar un conjunto de experimentos relacionados con los procedimientos
esgrimidos para el clculo del error y del sesgo.
El primer experimento consiste en calcular el error y el sesgo de dos poblaciones
normales en donde se va incrementando el nmero de muestras de ambas. Se inicia con
dos grupos de dimensin unidimensional y de varianza unitaria, separadas sus medias
en dos unidades, esto es, N1(0,1) y N(2,1), colocndose la condicin de igualdad de
probabilidad para ambos grupos, p( 1 ) = p( 2 ) = 1 . Desde el punto de vista terico,
2
los errores de Bayes coinciden tanto en el clasificador lineal como en el cuadrtico,
adems de corresponder para estas condiciones con igual error en cada grupo,
1 = 2 = 7,935% , luego el error total ser de 15,87% . Las muestras en ambos grupos
van creciendo por igual y son valores aleatorios tomados de las dos normales. Los
resultados de aplicar los procedimientos vistos de clculo del error y del sesgo son
mostrados en la figura 6.12.

Figura 6.12 Error y sesgo para poblaciones normales de igual varianza


DISAM-UPMT-98-015

259

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

Mostrando la validez del clculo del error y la tendencia del sesgo a disminuir
con el nmero de muestras. El segundo experimento es similar al primero, pero esta vez
se utiliza dos poblaciones de covarianzas distintas. Se trata de dos poblaciones normales
con N1(0,1) y N2(3,2), manteniendo el mismo nmero de muestras para cada grupo. El
error de Bayes para el clasificador cuadrtico ser de 5.375% tanto para el primer grupo
como para el segundo. Mientras en el clasificador lineal el error de primer grupo es de
3.345% y el del segundo es de 7.23%. La figura 6.13 muestra los resultados de la
evolucin del error y el sesgo con el nmero de muestras.

Figura 6.13 Error y sesgo para poblaciones normales de distinta varianza

La tercera prueba ha consistido en comparar los resultados de aplicar el mtodo


para la determinacin del sesgo segn las propuestas recogidas en esta tesis, con las
expresiones analticas (6.148) y (6.166) referentes al sesgo de clasificadores cuadrticos
y lineales para poblaciones normales I-I. La validacin vienen dada entre los resultados
dados por el clculo numrico para el caso especfico de I-I con las expresiones
analticas. A continuacin se muestran las pruebas realizadas respecto a la distancia
entre grupos de covarianza unidad y separado sus medias en M:
Tabla 6.3 Sesgo cuadrtico, comparacin entre la expresin analtica (6.148) y el mtodo de
6.2.2.1
M

10

(6.148)

0.0935

0.0605

0.0654

0.0574

0.0351

0.0151

0.0047

0.0011

0.0002

0.0001

6.2.2.1

0.0935

0.0605

0.0654

0.0574

0.0351

0.0151

0.0047

0.0011

0.0002

0.0000

260

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Tabla 6.4 Sesgo lineal, , comparacin entre la expresin analtica (6.166) y el mtodo de 6.2.2.2

10

0.0440

0.0605

0.0486

0.0270

0.0110

0.0033

0.0008

0.0001

0.0000

0.0000

0.0440

0.0605

0.0486

0.0270

0.0110

0.0033

0.0008

0.0001

0.0000

0.0000

Por ltimo, la tabla 6.5 muestra los resultados obtenidos tanto de error como de
sesgo para clasificadores paramtricos cuadrticos como lineales.
Tabla 6.5 Resultados de los clasificadores paramtricos tanto cuadrticos como
lineales: Box Cox (), error de Bhattacharyya, error cuadrtico estimado, sesgo
cuadrtico estimado, error cuadrtico, error lineal estimado, sesgo lineal estimado,
error lineal
Clases
consideradas
1-4
1-5
2-5
2-6
3-9
4-7
5-7
5-8
6-8
6-9
7-12
8-10
8-11
9-10
10-11

-0.87
-1.69
-0.50
0.63
2.52
1.45
1.08
-6.10
2.06
1.96
-0.92
5.38
6.09
3.73
-6.18

s(%) q(%)
0.17
0.15
0.13
8.98
3.51
0.77
0.34
11.7
0
2.68
11.6
3.61
22.4
0.53
9.77

1.79
4.86
0.70
11.76
4.17
35.10
10.06
26.85
3.34
1.96
12.67
32.64
12.73
23.29
12.95

q(%) qt(%)
0.03
5.26
0.86
0.40
0.41
0.56
0.16
-

0.73
40.37
27.72
2.37
13.09
33.21
23.45
-

l(%)

l(%)

lt(%)

3.34
0.47
0.34
28.48
18.21
29.86
0.16
30.52
7.16
0.75
17.08
31.14
0.47
40.22
41.14

2.20
0.25
0
0.18
0.07
0.08
2.37
0.64
1.89
0.26
0.28
0.27
52.28
0.04
0.21

5.55
0.72
0.34
28.66
18.28
29.95
2.53
31.16
9.06
1.02
17.37
31.42
52.76
40.26
41.35

Las rayas indican que el sesgo calculado para el clasificador cuadrtico era muy
elevado, por lo que no se hace factible su construccin. Obsrvese la viabilidad de los
clasificadores lineales de Fisher ante los cuadrticos, stos se muestran ms robustos
con el nmero de muestras utilizados, conclusin tambin esbozada con las
componentes de la distancia de Bhattacharyya, ya que predominaba el efecto de 1
respecto a 2. Las discrepancias entre el error superior de Bhattacharyya y los
calculados numricamente son debido a que la distancia de Bhattacharyya considera que
las probabilidades de los grupos enfrentados son iguales, p(1) = p(2), y que el
mximo se da a s = 0.5, ver 6.1.2.2.

DISAM-UPMT-98-015

261

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

6.5.3

Carlos Platero

Modificacin del algoritmo no paramtrico OLVQ


Con el objeto de comprobar el correcto funcionamiento de las modificaciones
realizadas sobre el algoritmo LVQ, se realizaron una serie de pruebas para confirmar el
correcto funcionamiento del mismo.
Con este propsito se particularizo el estudio para el caso unidimensional, ya
que sus expresiones resultan fciles de analizar. De esta manera, las expresiones de
aprendizaje quedan como:
mc (t + 1) = mc (t ) + s (t ) (t )

x mc (t )
c2 (t )

x mc (t )

(t + 1) = (t ) + s (t ) (t )
2

t
(
)
c

2
c

( 6.213 )
2

2
c

( 6.214 )

donde s(t) es +1 si coinciden las etiquetas de las muestras con los vectores de
aprendizaje y s(t) es 1 en caso contrario. Para el anlisis del algoritmo propuesto se
estudia el efecto de la convergencia considerando una sola neurona y un slo grupo.
Para el caso de mantener constante la varianza, la regla de actualizacin correspondera
al OLVQ1. Mayor atencin se precisa sobre la evolucin de la covarianza. Si se estudia
la convergencia de la expresin ( 6.213 ) para el caso de un nico grupo, se desprende
que la variacin de c2 con el tiempo es montonamente creciente con independencia
del tipo de distribucin del cluster. Efecto que muestra la falta de convergencia del
algoritmo. Ante esta evidencia se propone efectuar la siguiente modificacin:

c2 (t + 1) =

1
2
c2 (t )( N (t ) 1) + r (t )(x mc (t ) )
N (t )

( 6.215 )

siendo r(t) +1 en el caso de pertenecer la muestra al grupo y 0 en caso contrario.


Esta nueva expresin viene avalada por la propia definicin de varianza, donde se ha
tomado la media segn ( 6.213 ) como la mejor estimacin de sta en el instante t.
Otro aspecto estudiado son los valores iniciales de las medias y las covarianzas.
Segn las pruebas realizadas a partir de poblaciones normales y uniformes, el algoritmo
converge partiendo de valores aleatorio. Sin embargo, se ha observado que si los valores
iniciales son tomados segn las medias y covarianzas de la poblacin de aprendizaje de
cada grupo, el nmero de iteraciones requeridos para la convergencia disminuye.

262

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

A continuacin se presenta algunos de los experimentos realizados. El primero


consiste en observar como ante una poblacin normal de media cero y covarianza uno,
la neurona converge partiendo de valores aleatorios.

Figura 6.14 Convergencia del algoritmo propuesto para una poblacin normal N(0,1).

Otros de los experimentos realizados es la comparacin de los resultados de


clasificacin entre los paramtricos y los no paramtricos. Con tal propsito se va a ver
el error de clasificacin para dos poblaciones con distribucin normal y con distribucin
uniforme. Para los clasificadores paramtricos se ha utilizado el cuadrtico de ( 6.211 )
y el lineal de ( 6.212 ), cuyos parmetros han sido estimados con una poblacin de
1000 muestras para cada grupo. Estas poblaciones tambin sirvieron para el
entrenamiento de los algoritmos OLVQ y el propuesto.
Para la fase de test se dispuso de 3000 muestras para cada grupo y cada tipo de
funcin de distribucin. En la tabla 6.6 muestra el nmero de muestras mal clasificadas
respecto a las 6000 totales para cada uno de los clasificadores.
Tabla 6.6 Comparacin de los diferentes clasificadores para dos grupos con distribuciones
normales y uniformes
Clasificador

N1(0,1)-N2(1,1)

Cuadrtico

1824

13

1536

Lineal

1824

13

1001

OLVQ

1848

12

13

1222

Propuesto

1869

48

1194

DISAM-UPMT-98-015

N1(0,1)-N2(1,1) U1(0-1)U2(1-2) U1(0,1)-N2(0,3)

263

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

6.5.4

Carlos Platero

Comparacin con otras tcnicas tradicionales de clasificacin


En la evolucin temporal del proyecto para la deteccin y clasificacin de los
defectos locales en el aluminio colado, se trabaj en la confeccin de un sistema
hbrido, esto es, la conjuncin de diferente tcnicas de Inteligencia artificial para la
clasificacin de patrones[Kanal92]. Las razones venan avaladas por varios motivos,
necesidad de exactitud en la clasificacin y el tiempo para la clasificacin no era crtico,
por lo que se pudo intervenir con distintos caminos para el reconocimiento, en este caso
se utiliz uso de redes neuronales MLP y LVQ, adems de sistemas basados en reglas.
Esta actitud permiti con posterioridad facilitar el proceso de comparacin entre las
diferentes tcnicas de clasificacin, tanto las tradicionales como las aqu propuestas.
La bsqueda de subsistemas de clasificacin con caractersticas
complementaras hizo elegir las tcnicas a emplear. La estructura de informacin
basadas en primitivas (ver 5.4) aconsejaba el uso de gramticas de libre contexto, por
tanto se dise un bloque basado en reglas de produccin y adems se abri una lnea
de trabajo de diseo de reglas con antecedentes borrosos[Plate94][Ruiz92]. Artculos
con caractersticas parecidas a la solucin de este problema abogaban por el uso de
redes neuronales de retropropagacin[Sikka92]. Adems se utilizo el algoritmo LVQ
por ser un clasificador prximo a Bayes. De esta etapa de anlisis sali como resultado
el primer nivel de clasificacin, formado por:
1.

Sistemas basados en reglas. Uso de gramticas de libre contexto para


cada tipo de defecto.

2.

MLPs con algoritmos de aprendizaje de retropropagacin por su


capacidad de generalizacin.

3.

Red LVQ por ser un clasificador basado en el vecino ms cercano.

En un estadio superior de clasificacin se encontraba un supervisor neuronal que


elaborara la conclusin definitiva, implementado por un MLP con algoritmo de
retroalimentacin. Esta red supervisora se alimentaba de las salidas de los tres anteriores
clasificadores. Los resultados que se obtuvieron fueron muy buenos, tal como se
expresa en las tablas 6.7 y 6.8, por lo que tambin servirn para ser comparados con los
algoritmos propuestos. No obstante, no existe una expresin del sesgo tal como se ha
utilizado en los clasificadores paramtricos

264

DISAM-UPMT-98-015

Carlos Platero

Captulo 6: Clasificadores estticos

Tabla 6.7 Resultados a cinco defectos


Tipo defecto

MLP

LVQ

Sintctico

Supervisor

Paramtrico

Pegado de rodillos

88

87.5

100

100

80.8

Faltas de material

86

95.5

100

100

82.5

Bandas longitudinales

100

95

100

100

86.6

Bandas transversales

97

100

94

94

88.6

Cristalizacin anormal

89

66.7

68

68

77.5

Tabla 6.8 Resultados a ocho tipos de defectos

6.6

Tipo defecto

MLP

LVQ

Pegado de rodillos

88

75

Bandas brillante

100

Falta de material
pequeo

Sintctico

Supervisor

Paramtrico

88

88

80

100

100

100

82.6

86

94.7

100

100

82.5

Falta de material
grande

83

66

66

83

Bandas
longitudinales

84

88.9

68

68

90.8

Araazos

72

54.5

100

100

82.5

Bandas transversales

97

100

94

94

88.6

Cristalizacin
anormal

89

66.7

68

68

77.5

Conclusiones
Se ha presentado el desarrollo de un nuevo modelo de parametrizacin,
seleccin de las caractersticas y clasificacin, en las que se considera tanto el nmero
de muestras cmo el error de clasificacin, y en la que se favorece la insercin de
conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el
cual fue recogido en el captulo 5.

DISAM-UPMT-98-015

265

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

Carlos Platero

El nuevo mtodo se basa en la parametrizacin de dos clusters enfrentados entre


s con etiquetas distintas. La regin definida por ambos grupos es transformada a un
subespacio, con las caractersticas de normalidad para cada grupo y en menor error de
Bayes posible, atendiendo al nmero de muestras. Para ello, se busca la transformacin
Box Cox ptima marginal, de la que se aprovecha la utilizacin del intervalo de
confianza para la caracterstica transformada en los dos clusters, localizando el
ptimo comn. A ello le acompaa la distancia de Bhattacharyya, que determinar un
lmite superior del error de Bayes. Esta informacin ser utilizada para determinar el
subespacio comn ms discriminante. Pero no slo se utiliza la distancia, sino que
adems se calcula el sesgo y la varianza de la medida, con el objeto de conocer la
validez de la medida considerando el nmero de muestras. Adems, orientar el diseo
hacia clasificadores lineales o cuadrticos, segn el valor de 1 o 2.
Una vez que han sido determinadas las parametrizaciones de los grupos, se pasa
al diseo de los clasificadores, de los que tambin se ha trabajado en la localizacin del
error y de su sesgo. Se han obtenido expresiones analticas tanto de los parmetros del
clasificador como del error y del sesgo, todo ello para grupos que tienen distribuciones
normales I-, siendo stas algunas de las aportaciones de esta tesis.
A tenor del trabajo realizado se plantea la modificacin del algoritmo no
paramtrico LVQ. Un estudio sobre este mtodo cognitivo concluye que los codebooks
tienden a situarse en la frontera de Bayes, mediante uso de hiperplanos, los cuales se
presentan como clasificadores lineales. Si en vez de utilizar la distancia eucldea se
utiliza la de Mahalanobis, es posible el paso de clasificadores lineales a cuadrticos.
Esta modificacin ha sido estudiada.
Por ltimo, el trabajo experimental ha estado basado en la clasificacin de
defectos locales en el aluminio colado. Este problema ha servido como bancada de
trabajo para el diseo de los clasificadores, tanto de tcnicas tradicionales como las
propuestas aqu recogidas. Las conclusiones obtenidas muestran que el mtodo
propuesto ayuda a introducir conocimiento a priori, haciendo los clasificadores ms
exactos y generalistas que aquellos basados tanto en reglas como en ejemplos. La
explicacin viene dada por el hecho de tener expresiones analticas que muestran con
objetividad las caractersticas de cada subespacio en funcin del error y del nmero de
nuestras del universo. Obviamente este proceder no puede ser dado por los mtodos
tradicionales. Aunque los mtodos leave-one-out o holdout son lmites superiores de
error, stos no opinan sobre el sesgo del error, esto es, no consideran el nmero de
muestras. Tampoco buscan por si mismos la seleccin de las caractersticas.

266

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

Aplicaciones industriales de la
tesis

En el devenir de esta tesis se han implementado dos SIVA industriales. El primero


por orden cronolgico y en el periodo comprendido del 92 al 96, se trabaj en el diseo de
un SIVA aplicado al aluminio colado. Y el segundo, elaborado en el plazo transcurrido del
97 al 98, se ha centrado en la determinacin de defectos locales en la pasta de papel.
Ambos proyectos han servido de bancada para el trabajo experimental y en el fragor de
estos desarrollos nacieron las motivaciones que han sido presentadas a lo largo de esta
tesis. Por eso, este captulo tiene como objetivo mostrar los resultados a modo de
aplicaciones industriales. Presentndose en primer lugar el SIVA diseado para el aluminio
colado y luego el SIVA realizado para la pasta de papel

7.1

Inspeccin visual del aluminio colado


El SIVA que se muestra a continuacin ha sido desarrollado dentro del proyecto
BRITE Euram 4336, On line Quality Control of Cast Aluminum Alloys, y ste se encuentra
instalado en la factora de COMSAL del grupo ALUMIX, en Portovesme, Cerdea, Italia.

DISAM-UPMT-98-015

267

Inspeccin automatizada de superficies homogneas mediante Visin artificial

7.1.1

Carlos Platero

Proceso de obtencin del aluminio colado


El proceso de obtencin de planchas de aluminio comienza a partir del aluminio
fundido, con algunas de las siguientes aleaciones:
Al 1050A (Al, 0.25% Si, 0.40% Fe)
Al 8079

(Al, 0.25% a 0.30 Si, 0.70 a 0.90% Fe)

Al 3030

(Al, 0.25% Si, 0.40% Fe)

La aleacin, se mantiene en el horno a una temperatura entre 690C y 710C, y se


hace descender del mismo, por gravedad, hasta los cilindro del moldeo ( caster ) en donde,
por contacto, solidifica a una temperatura entre 200C y 270C, adoptando la forma de una
plancha de 7 mm de grosor y un ancho entre 1500 y 1670 mm que se bobina en unidades
de hasta 40 toneladas. La plancha as obtenida es laminada posteriormente, en etapas
sucesivas, para obtener lminas de aluminio de diferentes grosores, hasta un espesor
mnimo de 5 micras.
El proceso de moldeo (casting) se ha optimizado hasta el punto de llevarse a cabo
en una lnea totalmente automatizada, que incluye mezcladores de aleacin, tolvas de
llenado, horno, desgasificador, rodillos de moldeo, y seccin de enrollado. El moldeo es
controlado desde una estacin de trabajo, denominada supervisor, en la cual se ajustan los
parmetros del proceso, que incluyen, como los ms significativos, la temperatura del
horno, el flujo del aluminio fundido hacia la boquilla de alimentacin de los cilindros, la
velocidad de los cilindros de moldeo, la presin relativa entre los cilindros de moldeo, la
temperatura de entrada y salida del agua que refrigera los cilindros de moldeo, el par de
traccin que ejerce la bobinadora y los niveles de gas en el aluminio fundido.
Desde el supervisor se monitoriza el estado de los parmetros y es posible
establecer valores de consignas para los mismos, que son transferidos al proceso de moldeo
mediante un controlador programable multitarea, capaz de conducir el proceso en funcin
del modelo asignado. Sin embargo, la nica tarea realizada por operadores humanos es la
de inspeccin del producto, constituida por las siguientes operaciones:
1. Espesor de la plancha. A este efecto, se toman medidas peridicas con
micrmetros y se lleva un registro por bobina producida. Se toman
aproximadamente 100 medidas en las secciones laterales y central de la
plancha.
2. Acabado superficial. Se necesitan conocer las variaciones de rugosidad de la
superficie. Se clasifica en acabado fino, esto es, rugosidad media superficial de
50 micras, acabado normal (75 micras) y acabado basto, superior a 75 micras.
El acabado fino, consigna deseable, se produce con los rodillos de moldeo
recin reparados y en condiciones ptimas de lubrificacin. En situaciones de
acabado basto es necesario advertir a los operarios del moldeo que verifiquen

268

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

las causas y, o bien cambien los cilindros, o bien se ajuste el sistema de


lubrificacin. El acabado superficial se evala analizando muestras obtenidas
peridicamente, seccionando la plancha y haciendo un estudio de rugosidad de
la superficie fuera de lnea.
3. Presencia de defectos en la superficie de la pancha por ambas caras. Es
necesario detectar los defectos de la superficie, pues condicionan el destino de
la bobina en cuanto al nivel de laminacin a que puede someterse (a mayor
calidad, mayor nivel es posible de laminacin) o, en su caso, la baja calidad de
la bobina har que se la destine de nuevo al fundido. Estos defectos se detectan
por inspeccin visual de la pancha de aluminio y su temprana deteccin
permitir actuar adecuadamente sobre los parmetros de la lnea, indicados en el
epgrafe anterior.
4. Temperatura con la cual la superficie de aluminio abandona los cilindros de
moldeo. La temperatura con la que la plancha abandona los rodillos de moldeo,
junto con su uniformidad en la seccin transversal, condicionan las propiedades
mecnicas de la misma, fundamentales stas para el posterior proceso de
laminado. La temperatura se verifica peridicamente por contacto de doce
puntos a lo largo del perfil transversal de la plancha.
De esta realidad nace el mencionado proyecto europeo, con vocacin de
automatizar la inspeccin del proceso. A tal fin, se propone el sistema de control llamado
Qualicast, y que se muestra en la figura 7.1. ste consta de dos grandes bloques
funcionales:
1. Sistema de inspeccin no destructivo. Compuesto por un sistema de inspeccin
visual automatizado, para la deteccin y anlisis de defectos visuales y
determinacin del acabado superficial; un sistema de infrarrojos, para la
obtencin del mapa de distribucin de temperatura de la superficie y un sistema
de corrientes inducidas, para la determinacin del espesor de la plancha de
aluminio.
2. Sistema supervisor, formando por un sistema experto, el cual decide tanto la
calidad de la plancha de aluminio producida, como las acciones correctoras que
son necesarias de efectuar ante anomalas detectadas.
De estos dos bloque funcionales, slo se ha participado en la construccin y diseo
del SIVA. Por lo que se presenta a continuacin los resultados del SIVA implementado.

DISAM-UPMT-98-015

269

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Figura 7.1 Sistema de control Qualicast

7.1.2

SIVA aplicado a las planchas de aluminio colado


Las tareas de inspeccin visual se efectan para verificar el acabado superficial y
para detectar las faltas locales en las planchas, como ha sido comentado anteriormente. Se
muestra a continuacin el catlogo de defectos crticos en la aplicacin, junto con una
fotografa de la apariencia tpica.

Figura 7.3 Plancha sin defecto.

270

Figura 7.2 Inclusin de gas. Lneas finas


brillantes de 0.5 mm de grosor tpico.

DISAM-UPMT-98-015

Carlos Platero

Figura 7.7 Cristalizacin anormal.


Bandas opacas longitudinales con
espesores desde 1 mm hasta varios cm.

Figura 7.5 Pegado. Manchas claras


debido a la alteracin de la superficie,
junto con zonas ms oscuras
originadas por alabeo de sta.

Captulo 7: Aplicaciones industriales de la tesis

Figura 7.6 Faltas de material.


Desconchones en la plancha desde 1
2
2
mm hasta varios cm .

Figura 7.4 Grafito. Puntos oscuros de


0.5 a 3 mm de radio.

Las especificaciones para el diseo del sistema de inspeccin visual automatizada,


incluyen:
1. Funcionamiento en lnea. Inspeccin de la plancha de dimensin transversal
entre 1500 y 1670 mm, por ambas caras, producida a una velocidad de 2m/min.
2. Mnima dimensin de defecto a detectar: 1 mm2, lo cual exige una resolucin
mnima de 2 pxeles por milmetro en ambos sentidos, longitudinal y
transversal.

DISAM-UPMT-98-015

271

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

3. Deteccin del acabado superficial y de los defectos locales con inspeccin del
100%.
4. Clasificacin de las faltas en lnea
Si bien el SIVA adems de la deteccin de los defectos debe determinar el acabado
superficial, este ltimo objetivo no ha sido tratado en esta tesis. Para una mayor
informacin sobre este asunto ver [Fernn97]. A parte de este aspecto, la implementacin
del SIVA para el aluminio colado est constituido por los tres grandes bloques: formacin
de imgenes, deteccin de los defectos y clasificacin de los defectos.
7.1.2.1 Formacin de imgenes
Los defectos en superficies metlicas se caracterizan por alteraciones en la
estructura superficial. Puesto que los defectos que aparecen en las superficies metlicas
suponen una deformacin material de las misma, la observacin de la componente
especular de la luz reflejada da como resultado la deteccin de defectos locales. Debido al
alto coeficiente de reflexin de la luz superficial del aluminio se convierte en necesidad
disear un sistema de iluminacin adecuado.
Atendiendo a los criterios vistos en el captulo 3, se opt por bateras de cmaras
CCD matriciales entrelazadas como las
ms apropiadas para la aplicacin,
principalmente por dos razones: la
velocidad mxima no supera los 2
m/min, lo que permite tener tiempos de
integracin hasta 50 ms, junto con una
escena de iluminacin cuasi uniforme en
bandas transversales,
debido a la
iluminacin planar transversal. La
resolucin utilizada fue de 2 pixel/mm, y
el tamao de buffer procesado era de
478 x 501, cubriendo una superficie de
291 mm en la direccin del tren
laminado por un ancho de 376 mm. La
figura 7.8 muestra la disposicin de Figura 7.8 Formacin de imgenes en la
inspeccin del aluminio
cmara - iluminacin - superficie.
7.1.2.2 Deteccin de los defectos
Una vez obtenida la imagen del aluminio, sta se procesa para encontrar los
defectos. Para la localizacin de defectos se realiza un anlisis local, pues debido a la
textura y al tipo de iluminacin utilizada no es posible un enfoque global, aunque esta lnea
de trabajo fue intentada, realizando operaciones morfolgicas acompaadas de
umbralizaciones globales, obteniendo resultados similares pero con mayores tiempos de
computacin[Plate92].

272

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

La alta rugosidad del aluminio origina en la imagen que pxeles con niveles altos
aparecen entremezclados con otro ms bajos. Algunos defectos no producen una variacin
significativa en los valores absolutos de nivel de gris, sino que producen una alteracin en
la distribucin espacial de los mismos, por lo que se dio el siguiente procesado a la seal.
Previo al procesado se adquiere la imagen con la mnima apertura del diafragma y con el
mximo nivel de contraste en la digitalizadora, manteniendo el mximo rango dinmico de
medida y sin saturaciones. Algoritmos basados en el anlisis textural fueron desarrollados
para la deteccin de los defectos[Fernn94], aunque el exceso de tiempo computacional los
han descartado en la implementacin final. Segn las conclusiones sobre procesado de
imgenes en tiempo real [Lee90], se admite que los mtodos de deteccin basados en
parmetros estadsticos de primer y segundo orden son los ptimos para las aplicaciones de
Visin artificial. El algoritmo usado se basa en considerar que la distribucin de niveles de
grises en una franja transversal depende slo de la materia del producto, esto es, se
considera cuasi uniforme la iluminacin por filas; por lo que se aplica un filtro binomial
3x3 y un umbral local. Se considera un pixel procesado, gm,n, no defectuoso aquel que
cumpla:
mm ,n u i g m,n mm, n + u s

( 7.1 )

siendo mm,n la media del entorno 3 x 3 colocado en m,n, y ui y us las cuantas de


niveles de grises alrededor de la media sin considerarlo defetuoso. Las etapas de
procesamiento y segmentacin son mnimas, filtrado binomial y comparacin de umbrales
locales, segn la expresin ( 7.1 ). El resultado definir tres tipos de categoras: pxeles no
defectuosos, pxeles defectuosos con apariencia oscura y pxeles defectuosos con tonalidad
clara. La ausencia de defectos en las imgenes segmentadas propiciar la renovacin de
los estadsticos, mm,n, con el fin de eliminar errores producidos por las variaciones de luz
en la escena con el transcurso del tiempo. En la tabla 7.1 se muestras los resultados de la
deteccin segn las conclusiones de Fernndez [Fernn97].
La presencia de pxeles defectuosos originar una etapa posterior de etiquetamiento
de objetos, en claros y oscuros. En el caso de que el nmero de objetos etiquetados fuera
excesivo, se pasar a aumentar el rango alrededor de la media, es decir, se modificar ui y
us. La experiencia ha demostrado que la identificacin de los objetos no requiere de un
nmero abultado de objetos, pues la representacin de stos mantiene caractersticas
espaciales bien diferenciadas. Por tanto, la umbralizacin es local y de carcter dinmico.

DISAM-UPMT-98-015

273

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

Tabla 7.1 Resultados de la deteccin de defectos en el aluminio


Tipo de defecto

%deteccin

Inclusin de grafito (Bandas oscuras)

100%

Faltas de material

100%

Pegado de los rodillos

100%

Cristalizacin anormal

100%

Inclusin de gas (Bandas brillantes)

98.7%

El sistema fsico de procesamiento de imgenes ha sido desarrollado


especficamente para esta aplicacin. Se trata de un sistema autnomo diseado por la
empresa SECAD, uno de los socios del proyecto BRITE. El hardware se basa en uno o dos
DSP IGOR para el tratamiento de imgenes y un procesador principal RISC AMD29240 a
50 MHz. Para la implementacin de los algoritmos se utiliza el compilador cruzado HighC o Cygnus C. Como caractersticas a destacar se dira que tiene tres canales CCIR o
RS170, procesamiento a 16 Mpxeles por segundo, 4 entradas y 4 salidas TTL, lneas serie
RS232 y RS423, y por supuesto, su bajo precio en comparacin con arquitecturas basadas
en PC o en estaciones de trabajo.
7.1.2.3 Clasificacin de los defectos

Figura 7.9 Grupos de los defectos del


aluminio: : 1- Bandas transversales oscuras
pequeas, 2- Bandas transversales oscuras
medianas, 3- Manchas oscuras, 4- Araazos,
5- bandas longitudinales oscuras medianas
6- bandas longitudinales oscuras grandes,
7- Faltas de material grande, 8 - Faltas de
material grande, 9- Cristalizacin anormal I
10- Cristalizacin anormal II 11- Pegado de
rodillos, 12- Bandas brillantes

274

La clasificacin de los defectos


locales en el aluminio ha servido de
bancada para los trabajos experimentales
abordados en los captulos 5 y 6,
referindose al anlisis exploratorio de los
datos y a la clasificacin de patrones
estticos. En ambos captulos queda
constancia de las tcnicas implementadas.
A modo de resumen se dira que una vez
segmentada la imagen y etiquetados los
objetos, se hace una representacin de los
defectos mediante la aplicacin de
mtodos sintcticos (ver 5.4.1), stos
sirven para la utilizacin de clasificadores
basados en reglas as como para la
obtencin del vector de caractersticas. A
partir de este vector se pasa a un anlisis
de los datos mediante los mapas auto

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

organizados, las U-Matriz, la descripcin de los patrones y la bsqueda de espacios


normales, cuyos resultados puede verse en la figura 7.9.
Uno de los mayores inconvenientes en la clasificacin de los defectos del aluminio
era la falta de muestras sobre el universo del problema, en total se contaba con slo 157
faltas registradas, lo que supone un handicap importante. Por eso se ha hecho tanto
hincapi en la seleccin de las caractersticas y en la capacidad de generalizacin de los
clasificadores, midindose el error de clasificacin y su sesgo a partir del nmero de
muestras obtenidas. Para la clasificacin de los defectos se ha utilizado un sistema hbrido,
constituido por una red neuronal MLP y otra LVQ ms un clasificador sintctico. Los
resultados de estos tres sistemas eran entregados a una MLP supervisora que daba la
decisin definitiva. Por ltimo, la tabla 7.2 muestra los resultados de la clasificacin del
sistema hbrido que a su vez es comparada con las prestaciones dadas por los clasificadores
paramtricos. Las conclusiones de estas tablas pueden ser vistas en 6.5.

Tabla 7.2 Resultados de la clasificacin de defectos


Tipo defecto

MLP

LVQ

Sintctico

Supervisor

Paramtrico

Pegado de rodillos

88

87.5

100

100

80.8

Faltas de material

86

95.5

100

100

82.5

Bandas longitudinales

100

95

100

100

86.6

Bandas transversales

97

100

94

94

88.6

Cristalizacin anormal

89

66.7

68

68

77.5

Tipo defecto

MLP

LVQ

Pegado de rodillos

88

75

88

88

80

Falta de material pequeo

86

94.7

100

100

82.5

Falta de material grande

83

66

66

83

Bandas longitudinales

84

88.9

68

68

90.8

Araazos

72

54.5

100

100

82.5

Bandas transversales

97

100

94

94

88.6

Bandas brillante

100

100

100

100

82.6

Cristalizacin anormal

89

77.8

68

68

77.5

DISAM-UPMT-98-015

Sintctico Supervisor

Paramtrico

275

Inspeccin automatizada de superficies homogneas mediante Visin artificial

7.2

Carlos Platero

Inspeccin visual de la pasta de papel


Este SIVA ha sido implementado para la cadena de produccin de pasta de papel de
la empresa ENCE, ubicada en la provincia de Pontevedra.

7.2.1

Proceso de obtencin de la pasta de papel


El proceso de fabricacin consta bsicamente de las etapas siguientes:
almacenamiento de madera, descortezado, digestin, tamizado, lavado, deslignificacin
con oxgeno, lavado, blanqueo, secado, embalaje y almacenamiento.
La materia prima utilizada para la fabricacin de la celulosa es madera de eucalipto.
Al llegar es descortezada por va seca, en tambores descortezadores, y se astillan los
troncos. Las astillas son tamizadas para mejorar su calidad y su utilizacin en el proceso de
coccin y reducir prdidas de fibras. Antes de la digestin, las astillas son tratadas con
vapor e impregnadas con leja blanca. La digestin tiene lugar a unos 170C y a una
presin de 8 kg/cm2, y en ella se produce la separacin de las fibras por disolucin de la
lignina en el licor de coccin. La digestin no es suficiente para eliminar toda la lignina sin
destruir la fibra, esto se consigue en las etapas posteriores de blanqueo. Despus de la
digestin, la pasta es tamizada y lavada. Para conservar las propiedades de rendimiento y
resistencia de la pasta, se termina la coccin cuando se alcanza un contenido de lignina
alrededor de un 3%. Antes del blanqueo, se procede a la deslignificacin con oxgeno
extrayndose casi el 50% de la lignina restante. Las materias orgnicas e inorgnicas
disueltas en la etapa de oxgeno son enviadas a la recuperacin de productos qumicos y
utilizadas para producir energa. La deslignificacin con oxgeno reduce as la carga del
efluente final del blanqueo. La pasta procedente del lavado se blanquea segn el tipo de
producto a producir, habiendo tres formas distintas. stas son: OXY con cloro gas, dixido
de cloro y sosa custica, representa el proceso convencional, aunque con un menor
consumo de reactivos debido a la deslignificacin con oxgeno; ECF con dixido de cloro,
oxgeno y agua oxigenada; y TCF utilizando productos sin cloro, como oxgeno, agua
oxigenada, ozono y peroxicidos. Antes de proceder a su secado, la pasta blanqueada se
somete a una depuracin final, para eliminar los materiales extraos y mejorar su limpieza
y calidad.

7.2.2

Inspeccin de la pasta de papel


La calidad de la pasta de papel depende de su blancura, su limpieza y otras
caractersticas de produccin y almacenamiento. Adems este control se efecta mediante
tcnicas de muestreo, hacindose necesario por el volumen de pasta producido que puede
alcanzar hasta las 280.000 toneladas/ao. La calidad es determinada en lnea por seleccin
de planchas del lote, aunque es contrastada en laboratorio con un menor nmero de
muestras.
La aplicacin desarrollada se centra en determinar la limpieza en pasta segn la
norma 404 de ENCE. Esta norma tiene como objeto definir la limpieza de pasta como mm 2
de superficie de impurezas por kilogramo de pasta seca. A tal fin se deposita la muestra de

276

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

papel ante una exposicin de luz transmitida y se cuenta manualmente las impurezas
visibles. La composicin qumica de las impurezas no es un factor determinante a la hora
de clasificar la limpieza de la pasta de papel. La mota de suciedad se cuantifica nicamente
por su tamao, y se da el valor en mm2 de rea de impurezas por kilogramo de pasta de
papel.
Sin embargo, que en la pasta de papel no se tome en cuenta de que sustancia se
compone las impurezas, no quiere decir que no sea importante distinguir los distintos tipos.
Fundamentalmente hay dos formas bsicas de impurezas: impurezas de tipo pitch,
procedentes de suciedad en general, esto es, de la que cae en la pasta de papel durante el
proceso de produccin ( por ejemplo, la grasa de las mquinas que estn en contacto
durante el tamizado, secado, etc.); e impurezas de tipo shive, su composicin es
bsicamente celulosa ( cuando las astillas no se disuelven totalmente durante los diferentes
procesos de transformacin quedan atrapadas en el interior de la pasta en forma de
pequeas motas ). Si bien hay otros tipos de impurezas sus frecuencias son muy reducidas
y stos no han sido consideradas. De otro lado, los defectos tipo pitch son ms comunes
que los shives, los primero representan casi el 96 % de las impurezas totales.
Estos dos tipos de defectos son fciles de diferenciar a simple vista por su color:
los defectos tipo pitch tienen un color negro intenso, mientras que los shives son
anaranjados, aunque en algunos casos se traten de un naranja muy oscuro. La razn de que
tomen este color vienen de que estos ltimos en realidad son pequeas astillas de madera
incrustadas dentro de la pasta. Por otra parte, los defectos tipo shive suelen ser de un gran
tamao.
La presencia de los pitch es mucho ms perjudicial para la calidad final de la pasta
que los shives, dado que la pasta de papel se usa como materia prima en procesos
siguientes, en los que los shives son fciles de disolver y los pitch no. Y como en la
determinacin de la limpieza de la pasta se mete a todos en el mismo grupo, es importante
tener control del nmero de defectos de cada
tipo que se encuentran. Sin embargo, dado
que la presencia de defectos tipo shive es
relativamente baja, no se hace imprescindible
la determinacin de la clase a la que
pertenece.
El procedimiento a seguir versa de la
siguiente manera, el inspector humano coge
una plancha de pasta de papel de 740 x 820
mm, y lo expone a trasluz con una potencia
de iluminacin de 756 W, teniendo una
intensidad lumnica alrededor de unos 31.000
luxes. El rea iluminada y por tanto de
inspeccin es de 500 x 500 mm2, lo que Figura 7.10 Inspeccin visual humana
viene a significar que no se inspecciona la
totalidad del pliego. Esta operacin se efecta por ambas caras de la hoja. El inspector
visual marca las impurezas y en funcin de su tamao le asigna una categora, que puede

DISAM-UPMT-98-015

277

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

ser de tipo P, C, B y A. Estas categoras son reflejadas en la tabla 7.3. Debida a las
limitaciones visuales humanas en cuanto a la mtrica, el inspector humano asigna una de
estas etiquetas en funcin del tamao que cree tener el defecto, lo que evidencia un cierto
nivel de subjetividad. El operario, a su buen juicio, determinar una etiqueta segn estime
en que rango de dimensin de rea es la impureza (ver tabla 7.3). Una vez etiquetadas
todas las impurezas localizadas en ambas caras, cuenta el nmero de defectos tipo P, C, B
y A, ponderando cada clase por el valor de rea asignada, segn se indica en la tabla. De
este proceder se saca la superficie total defectuosa que junto con el gramaje de la hoja
determinar el nivel de limpieza en pasta .
Tabla 7.3 Clasificacin de los defectos en la pasta de papel

7.2.3

Tipo de defecto

rea de las
impurezas(mm2)

rea asignada
al defecto(mm2)

Menores a 0.04 (no se


encuentran)

Entre 0.04 y 0.1

0.04

Entre 0.1 y 0.3

0.1

Entre 0.3 y 0.8

0.3

Mayores a 0.8

SIVA implementando para la limpieza de la pasta de papel


Atendiendo a la norma 404 de ENCE,
relativa a la determinacin de la limpieza en
los pliegos de papel, se ha efectuado el diseo
de un SIVA para esta tarea. Dicha labor
consiste en determinar la limpieza de pasta de
papel en mm2 de superficie defectuosa por
kilogramo de pasta. Con tal propsito se
inspecciona un pliego y se busca visualmente
las faltas locales. Para su automatizacin se ha
construido la mquina que se ilustra en la
figura 7.11. El usuario alimenta al sistema con
pliegos de pasta de papel que pueden ir de 740
a 750 mm longitudinales, y de 820 a 840 mm
transversales, dimensiones dadas segn las dos
cortadoras utilizadas en la fbrica. No obstante,
el rango en la mquina puede ser mayor. Una

278

Figura 7.11 SIVA para la pasta de papel

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

vez introducido el pliego, la mquina determinar el nivel de limpieza del pliego


efectuando una inspeccin sobre una superficie de 280320 mm2. Esta operacin se efecta
por cada cara de manera independiente.
La arquitectura de la mquina est constituida por una mesa X-Y que desplaza el
papel ante el sistema de adquisicin de imgenes. Este modelo fue optado al ofrecer ms
garantas que mover solidariamente el binomio cmaras luces. Por dos motivos, primero, el
pliego de papel junto con su soporte cristalino, ofrece menor par mecnico que el
desplazamiento de cmaras y luces, y en segundo lugar, resulta ms difcil el diseo
mecnico que garantice en el movimiento una traslacin mimtica entre las cmaras y las
luces, cuestin vital para obtener una escena SIVA de iluminacin uniforme. Por contra,
este modo de actuar implica una mayor dimensin del bastidor de la mquina, al
producirse un desplazamiento del papel, pero ste es razonablemente pequeo, de 192 mm
en direccin X y 219 mm en direccin Y.
La mesa X-Y sigue una trayectoria
ptima de inspeccin, minimizando el tiempo
que tarda en la determinacin de la limpieza en
la pasta. La figura 7.12 muestra el recorrido
efectuado en filas y columnas de 73 y 48 mm
respectivamente. La mesa es manipulada por dos
motores de continua de 80 W, uno por cada eje.
Cada motor lleva asociado una reductora,
calculada segn el par mecnico y la trayectoria
de desplazamiento, y de relacin 1:98 para el eje
X y 1:68,2 para el eje Y. El control de los
motores es efectuado por una tarjeta de potencia
de configuracin en puente y control por Figura 7.12 Trayectoria de inspeccin
modulacin del ancho del pulso (PWM), junto
con una tarjeta de control insertada en una
ranura ISA del PC. El modelo de esta tarjeta es SMCC-01 de KELVIN. Como lazo de
realimentacin utilizan un encoder de 2000 pulsos por vuelta. Y por cada eje se ha
implementado un regulador PD digital. Las trayectorias de desplazamientos se caracterizan
por perfiles trapezoidales de velocidad y parablicos de posicionamiento. Adems a la
mesa se le ha aadido un circuito elctrico de seguridad, capaz de desconectar la fuente de
alimentacin de los motores en caso de prdida de control por parte del programa
informtico de inspeccin.
Se ha optado por cuatro escenarios paralelos por las siguientes razones: al usar una
batera de cmaras entrelazadas supone que los movimientos de la mesa van a ser paso a
paso, por las razones esgrimidas en el captulo 3 y que luego sern comentadas en 7.2.3.1.
Esto significa que se adquieren las imgenes y mientras se procesan stas, se desplaza la
mesa a la siguiente posicin. Se observ que los mayores tiempos de la inspeccin se
dedicaban al movimiento de la mesa. Al ser actividades asncronas y en paralelo, se
pretenda que el programa informtico tuviera ms informacin entre cada desplazamiento,
lo que adems supona reducir el nmero de desplazamientos para cada inspeccin. De otro
lado, el nmero de cuatro cmaras viene dado por el nmero de canales multiplexados que

DISAM-UPMT-98-015

279

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

tiene la digitalizadora utilizada, junto con una disposicin geomtrica adecuada para las
trayectorias seguidas por la mesa. Este proceder a supuesto una reduccin drstica del
tiempo dedicado a la inspeccin de un pliego, prximo a los 42s. Aun as, el mayor cuello
de botella sigue siendo la mecnica. El algoritmo de inspeccin sin desplazamientos
mecnicos tarda tan slo 11.7 s.
La aplicacin informtica corre sobre Windows95, con cdigo a 32 bits y con
operaciones MMX para el procesamiento de imgenes. La aplicacin est disponible para
migrar a NT4.0. La eleccin de Windows95 fue debida a que en un principio las libreras
suministradas por el fabricante de las tarjetas de control sobre motores eran de 16 bits, lo
que oblig a un diseo de 32 bits en toda la aplicacin, excepto para el control de los
motores que se realizaba bajo cdigo de 16 bits. No obstante, el conocimiento sobre diseo
de dispositivos de control (drivers) tanto en NT como en Windows95, hizo posible
posteriormente que toda la aplicacin se ejecutase en cdigo a 32 bits.
El SIVA implementado sigue la filosofa de esta tesis en cuanto a sus bloques
funcionales. Existe un diseo propio tanto para la formacin de imgenes como para la
deteccin de los defectos. En cambio, no aparece un bloque especfico de clasificacin de
los defectos por las razones esgrimidas en 7.2.2, esto es, al ser mayoritarios los defectos de
tipo pitch respecto a los shives, no hay necesidad de distinguirlos. Adems slo interesa la
superficie total defectuosa, independientemente del tipo de defecto o de tamao. Aunque
est afirmacin lleva matizaciones tal como se ha comentado anteriormente. En todo caso,
la mquina al detectar las impurezas, y en funcin de su tamao le asigna una etiqueta tipo
P, C, B o A. Sin embargo esta catalogacin es de carcter informativo, pues lo importante
es la suma total de rea defectuosa para luego convertirlo en limpieza en pasta.
Seguidamente se expone la formacin de la imgenes en el SIVA y cmo se detectan los
defectos.
7.2.3.1 Formacin de imgenes
La iluminacin de la escena es de luz transmitida, adems para poder aplicar una
umbralizacin global se precisa que sea uniforme en el campo de inspeccin de cada
cmara, esto es, la luz debe ser cuasi uniforme en una superficie de 73 x 48 mm. Otro
inconveniente aadido, es el hecho de tener no
slo una escena sino cuatro a la vez, lo que
supone acoplamientos lumnicos entre ellas. A
tal fin, se han diseado pantallas de
separacin
lumnica
evitando
las
interferencias entre los diferentes focos. Su
diseo fue tratado en el captulo 3, donde se
aborda la colocacin de los focos respecto a la
superficie as como la disposicin de las
pantallas.
Por otro lado, las caractersticas de los
focos son tambin especiales. Se requera un
foco de tipo direccional, uniforme y potente.

280

Figura 7.13 Sistema de iluminacin

DISAM-UPMT-98-015

Carlos Platero

Captulo 7: Aplicaciones industriales de la tesis

Direccional porque la direccin de la escena es invariante, uniforme para poder aplicar


algoritmos de umbralizacin global y potente porque se necesitaba mucha energa lumnica
para atravesar la pasta de papel. Recurdese que el operario utiliza una iluminacin de
31.000 luxes. En las pruebas experimentales y para los sensores elegidos, la iluminacin
necesaria oscila por encima de los 12.000 luxes. Por todas estas caractersticas se eligi
una novedosa clase de lmparas de halogenuros metlicos de PHILIPS, modelo
MASTERCOLOR PAR30L. Este foco da una intensidad luminosa de 2400 lmenes, con
una potencia de 35 W. Tiene un ngulo mximo de dispersin de 30. En este tipo de
lmparas, la temperatura del color permanece estable a lo largo de toda su vida, con un
valor de 3000K y una variacin mxima de un 5%. Adems, la vida de las lmparas
superan las 5000 horas, volvindolas ideales para la aplicacin realizada. Por otro lado,
estas lmparas de descargas pueden ser alimentadas con unas reactancias electrnicas de
90 Hz, permitiendo tener tiempos de integracin en las cmaras de hasta 5 ms.
En cuanto a las cmaras, se han elegido de tipo matriciales y entrelazadas, por
utilizar inspeccin visual paso a paso, lo que abarata los costes y permite usar mltiples
cmaras. El modelo de cmara empleado es una WATEC902A. Respecto a la
digitalizadora, es una tarjeta PCI con transferencia en DMA de las imgenes en tiempo
real. Su nombre comercial es PULSAR-LC de MATROX, la cual lleva incorporado un
multiplexor de cuatro canales.
7.2.3.2 Deteccin de los defectos
Por cada desplazamiento se adquieren
cuatro imgenes, una por cada cmara. stas son
captadas a motor parado, con la mnima apertura
de iris, con el AGC de las cmaras activado y
con un tiempo de integracin de 20 ms. Los
parmetros del digitalizador son contraste e
intensidad. El valor de contraste es constante y
corresponde con el mximo, mientras la
intensidad se autoajusta con la primera imagen
adquirida. Su razn viene motivada por las
variaciones de gramaje de la pasta, lo que
significa que el flujo luminoso refractado vara
en funcin de los gramos por mm2 de pasta. A
medida de un aumento de gramaje, la cantidad Figura 7.14 Sistema de formacin de
de luz transmitida disminuye. Por lo que se imgenes
necesita variar el nivel de intensidad de la tarjeta
digitalizadora en funcin del gramaje. Esta
operacin es automtica y no precisa de intervencin por parte del usuario.
Una vez que las cuatro imgenes son almacenadas, se ordena al planificador de
trayectorias que se mueva a la siguiente posicin. Simultneamente, el algoritmo de
deteccin de defectos locales es pasado sobre las cuatro imgenes adquiridas, cuyo
proceder fue explicado en el punto 4.6. Una vez detectada una impureza, se pasa a medir
su rea y asignarle una etiqueta en funcin de lo indicado en la tabla 7.3. El rea

DISAM-UPMT-98-015

281

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

defectuosa es sumada a otras reas ya detectadas, y al finalizar la ltima posicin de


inspeccin se calcula la limpieza en pasta.
7.2.4

Resultados
La mquina fue entregada a ENCE el da 24 de abril de 1998. En los momentos de
escribir estas pginas la citada empresa est calibrando los resultados del SIVA,
procediendo a comparar la limpieza en pasta del inspector humano con los dados por la
mquina. Los resultados preliminares dados por ENCE son mostrados en la figura 7.15

Figura 7.15 Resultados preliminares del SIVA

El ndice de correlacin de los datos con el modelo lineal da un valor de R de 0.7.


Las causas de las discrepancias entre el inspector y la mquina vienen dadas por las
siguientes motivaciones. En primer lugar, la superficie de inspeccin utilizada por el
operario y la mquina son distintas. En segundo lugar, el contraste entre la mquina y el
inspector est basada en 186 pliegos, de las que la mquina detect 673 defectos y el
inspector 649, pero la discrepancia viene dada por la catalogacin de los defectos. Mientras
el SIVA clasific 38 tipos A y 132 tipo B, el inspector slo encontr 6 A y 67 B. Esta
discrepancia viene dada por el efecto lupa, que el inspector elimina raspando la pasta de
papel, accin que no realiza la mquina.
De otro lado, se ha constatado la muy buena precisin de las medidas por parte de
la mquina. Mientras el inspector humano utiliza una plantilla para determinar el tamao
del defecto y adems redondea, la precisin de la mquina en sus medidas es una de sus
mejores virtudes.
Tambin se ha observado que el bajo tiempo dedicado para cada pliego, 42 s.,
cumple con las exigencias de la fbrica. No obstante, el algoritmo de inspeccin slo
necesita 11.7 s., por lo que se puede plantear mejorar la mecnica de desplazamiento.

282

DISAM-UPMT-98-015

Carlos Platero

7.3

Captulo 7: Aplicaciones industriales de la tesis

Conclusiones
Se han presentado dos SIVA industriales, uno dedicado a la inspeccin del
aluminio colado y otro a la pasta de papel. Ambos han servido como marco de referencia
para el trabajo experimental realizado en el transcurso de esta tesis. Se observa que la
inspeccin visual de superficies planas y homogneas, simple para un inspector humano,
resulta compleja de automatizar. La riqueza de matices que efecta el operario en un
proceso de inspeccin visual, hace que los SIVA sean especficos de tarea, problemticos y
con limitaciones. As por ejemplo, el SIVA implementado para la pasta de papel, no es
capaz de detectar la mayora de los shives, pues debido a su tonalidad anaranjada, queda
diluida la informacin de luminancia respecto al fondo. Esta ancdota muestra como aun
en el diseo especfico las limitaciones se hacen evidentes. De todo ello se puede
pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no
cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente de
estos sistemas efectuada por la industria actual.

DISAM-UPMT-98-015

283

Carlos Platero

Captulo 8: Conclusiones

Conclusiones

Al inicio de esta tesis se ha abordado la problemtica de la Inspeccin industrial,


del que se evidenci una necesidad creciente de insertar las operaciones de inspeccin
dentro del proceso productivo. De las muchas tcnicas empleadas, la inspeccin visual
automatizada es una rama fundamental para esta nueva filosofa, sobre todo en las
industrias de materias primas o en sectores que requieren el 100% de la inspeccin. No
obstante, las dificultades de esta tecnologa hacen lenta su evolucin, convirtindose en
tema de estudio para muchos investigadores.
De partida existen tres hitos importantes en los SIVA: la formacin de imgenes, la
deteccin de los defectos y la clasificacin de stos. En formacin de imgenes hay que
abordar tanto el tipo de iluminacin que sea capaz de aumentar todo lo posible el realce de
la escena, as como la seleccin de los sensores a emplear. Respecto a la deteccin de los
defectos, se trata de analizar las imgenes recibidas con el propsito de separar la
componente de defecto respecto al fondo. En esta fase habr de considerar tanto el
procesamiento de las imgenes como su segmentacin. Una vez fijada la posicin de los
defectos, stos son pasados para su catalogacin en etiquetas. Se puede decir que estas tres
problemticas han servido de lnea argumental en el desarrollo de esta tesis.
El xito de un SIVA empieza con la eleccin oportuna del sistema de formacin de
imgenes, el cual debe determinar el tipo de iluminacin, la localizacin de las fuentes
luminosas y las cmaras, y las tecnologas de adquisicin a emplear. Esta tarea se inicia
con un estudio sobre los elementos que definen la calidad de imagen, del que se destaca

DISAM-UPMT-98-015

285

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

que dependiendo del nivel de exactitud de la mtrica habr de considerar ms elementos a


modelar. Para el caso de los SIVA tratados, slo ha sido necesario modelar las superficies
a inspeccionar y las fuentes luminosas. Por lo que se pasa al estudio de los modelos de
reflexin en superficies planas y de fuentes luminosas. Este desarrollo permite presentar
una metodologa basada en la modelizacin de la escena SIVA, utilizando el
comportamiento de reflexin de la luz en superficies planas, as como de las fuentes
luminosas. Con el modelo obtenido se puede localizar la ptima posicin del foco y la
cmara mediante la simulacin de stos en diferentes puntos del espacio. En este modelo,
la cmara ha sido reducida a un punto en el espacio, sin considerar la informacin
luminosa en cada pixel. Esta metodologa es aplicada tanto al SIVA dedicado a la
inspeccin del aluminio como el diseado para la pasta de papel. Para acabar con este
apartado, se presenta un rbol dicotmico que sirva de gua en la eleccin del tipo de
tecnologa CCD a emplear, dependiendo de las condiciones de la inspeccin visual.
Luego se pasa a presentar un esquema metodolgico para la deteccin de defectos
locales en superficies planas y homogneas. El sistema de deteccin de defectos se basa en
tres etapas: realzado, segmentacin y post procesado. Respecto al realzado, se han
estudiado filtros lineales discretos, proponindose un procedimiento novedoso para el
diseo de las mscaras. Esta tcnica se basa en el uso de la correlacin lineal con variables
cualitativas. Adems tambin se han explorado tcnicas de realce soportadas en
procesamiento morfolgico. En cuanto a la etapa de segmentacin, fue abordada desde las
funciones de densidad en niveles de grises del defecto y del fondo, introducindose el
concepto de pxeles de alto y medio contrastes. Convirtiendo el problema de segmentacin,
en la localizacin ptima del umbral mediante una funcin de coste, donde se tiene en
cuenta los dos errores tpicos, defectos sin detectar y falsas alarmas. Las tcnicas de post
procesado han sido aplicadas con una doble intencionalidad, eliminacin de falsas alarmas
y reconstruccin de defectos a partir de los pxeles de alto contraste. A continuacin, se ha
pasado a definir un conjunto de medidas con el objeto de calibrar cul es el mejor mtodo
de deteccin de defectos. Estas medidas se basan en las funciones de distribucin en
niveles de grises del fondo y de los defectos. Y por ltimo, se ha implementado esta
metodologa para la deteccin de faltas locales en la pasta de papel, donde se han
desarrollado experimentalmente las tcnicas propuestas, ofreciendo los resultados del
diseo para cada una de las etapas y cmo stas han sido evaluadas.
Seguidamente, se presenta una nueva metodologa de clustering paramtrico que
empieza en el captulo 5 y finaliza en el captulo 6. Su fundamento est en los mapas auto
organizados, en la parametrizacin del espacio mediante funciones normales y en las
transformaciones Box Cox. Si bien los mapas de Kohonen permiten conocer la estructura
inherente de los patrones, sin embargo, la formacin de cluster no es inmediata a partir de
la informacin otorgada por dichas neuronas, ms bien es el principio. Ults et al proponen
las U-Matriz como elemento de apoyo en la formacin los clusters. La experiencia ha
mostrado que si bien es una buena herramienta, en los casos estudiados no deciden de
forma evidente las fronteras entre los grupos. En esta coyuntura, se plantea reforzar la
decisin de agrupamiento mediante la bsqueda de subespacios normales.
Una vez extrados los grupos inherentes de los datos se pasa a su parametrizacin.
Para ello se ha utilizado las transformaciones normalizantes de Box Cox, las cuales

286

DISAM-UPMT-98-015

Carlos Platero

Captulo 8: Conclusiones

permiten obtener los subespacios normales de los clusters, tal que dicha transformacin sea
comn con otros grupos cercanos, motivando una bsqueda que maximice la distancia
entre grupos disjuntos y a la vez cercanos. Con tal propsito, en el siguiente captulo se
expone la teora de clasificadores paramtricos y sus medidas, pudiendo de esta forma
acabar la tcnica de clustering parametrizado, propuesta original de esta tesis.
Se ha presentado el desarrollo de un nuevo modelo de parametrizacin, seleccin
de las caractersticas y clasificacin, en el que se considera tanto el nmero de muestras as
como el error de clasificacin de Bayes, y en el que se favorece la insercin de
conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el
cual fue recogido en el captulo 5.
El nuevo mtodo de parametrizacin se basa en la modelizacin del espacio de dos
clusters enfrentados entre s con etiquetas distintas. La regin definida por ambos grupos
es transformada a un subespacio, con las caractersticas de normalidad para cada grupo y el
menor error de Bayes posible, atendiendo al nmero de muestras utilizadas para la
estimacin. Para ello, se busca la transformacin Box Cox ptima marginal, de la que se
aprovecha la utilizacin del intervalo de confianza para la caracterstica transformada en
los dos clusters, localizando el ptimo comn. A ello le acompaa la distancia de
Bhattacharyya, que determina un lmite superior del error de Bayes. Esta informacin ser
utilizada para determinar el subespacio comn ms discriminante. Pero no slo se utiliza la
distancia, sino que adems se calcula el sesgo y la varianza de la medida, con el objeto de
conocer la validez de la mtrica considerando el nmero de muestras utilizado.
Una vez que han sido parametrizados los grupos, se pasa al diseo de los
clasificadores tanto lineales como cuadrticos, de los que tambin se ha trabajado en la
localizacin de su error y de su sesgo. Se han obtenido expresiones analticas tanto de los
parmetros del clasificador como del error y del sesgo, todo ello para grupos que tienen
distribuciones normales.
A tenor del trabajo realizado se plantea la modificacin del algoritmo no
paramtrico LVQ. Un estudio sobre este mtodo cognitivo concluye que los codebooks
tienden a situarse en la frontera de Bayes, mediante uso de hiperplanos, los cuales se
presentan como clasificadores lineales. Si en vez de utilizar la distancia eucldea se utiliza
la de Mahalanobis, es posible el paso de clasificadores lineales a cuadrticos. Esta
modificacin ha sido estudiada y se han comparado los resultados.
Con el objeto de verificar el anlisis propuesto, se ha trabajado experimentalmente
en la clasificacin de defectos locales en el aluminio colado. Este problema ha servido
como bancada de trabajo para el diseo de los clasificadores, tanto de tcnicas
tradicionales como las propuestas aqu recogidas. Las conclusiones obtenidas es que el
mtodo propuesto ayuda a introducir conocimiento a priori, haciendo de los clasificadores
ms exactos y generalistas, que aquellos basados tanto en reglas como en aprendizaje con
ejemplos. La explicacin viene dada por el hecho de tener expresiones analticas que
muestran con objetividad las caractersticas de cada subespacio en funcin del error y del
nmero de muestras del universo. Obviamente este proceder no puede ser dado por los
mtodos tradicionales. Aunque los mtodos de testeo como leave-one-out o holdout son

DISAM-UPMT-98-015

287

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

lmites superiores de error, stos no opinan sobre el sesgo del error, esto es, no consideran
el nmero de muestras, y tampoco buscan por si mismos la seleccin de las caractersticas.
Para acabar, se han presentado dos SIVA industriales, uno dedicado a la inspeccin
del aluminio colado y otro a la pasta de papel. Ambos han servido como marco de
referencia para el trabajo experimental realizado en el transcurso de esta tesis. Se observa
que la inspeccin visual de superficies planas y homogneas, simples para un inspector
humano, resultan complejas de automatizar. La riqueza de matices y las actividades
inteligentes que efecta el operario en un proceso de inspeccin visual hace que los SIVA
sean especficos de tarea, problemticos y con limitaciones. De todo ello se puede
pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no
cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente
efectuada por la industrial actual.

8.1

Aportaciones de la tesis
A modo de resumen las aportaciones realizadas podran ser expuestas atendiendo a
los tres hitos ya mencionados. En la formacin de imgenes se ha presentado un diseo del
sistema de iluminacin basado en el las propiedades de reflexin de la luz sobre superficies
planas y en los modelos de las fuentes luminosas. Primero se estudia si existe alguna zona
del espectro luminoso que pueda incrementar el realce entre defecto y fondo. En segundo
lugar, se pasa a ver qu modelo de superficie rugosa puede ser empleado, definiendo el
tipo de modelo de reflexin que puede aplicarse. En tercer lugar, se estudia el prototipo de
fuentes luminosas, centrndose en diseo de sistemas de iluminacin uniforme. Una vez
modelizado el problema, se pasa a su simulacin con el propsito de localizar la ptima
disposicin geomtrica de la superficie, los focos luminosos y las cmara. Si bien el
mtodo presentado no es una aportacin, pues ya ha sido propuesto por otros autores,
existen algunas contribuciones singulares, como la modelizacin de las fuentes mediante
funciones de ponderacin y el uso de la simulacin para la determinacin geomtrica de las
fuentes luminosas capaces de dar una iluminacin uniforme sobre el escenario SIVA.
En cuanto a la deteccin de los defectos, dos aportaciones originales se han hecho.
Respecto a la primera, se ha propuesto un mtodo de diseo de las mscaras de
convolucin lineal, basndose esta tcnica en regresin lineal con variable cualitativa. Y en
segundo lugar, se ha presentado un mtodo de calibracin de las tcnicas empleadas para la
deteccin de los defectos. Estas medidas se fundamentan en la funcin de distribucin del
fondo y de los pxeles de alto contraste.
Sobre la extraccin de las caractersticas tambin se ha trabajado. proponiendo la
conversin de los objetos etiquetados en primitivas de gramticas libres. Este proceder
tiene como ventaja la posibilidad de disear tanto clasificadores basados en reglas como en
vectores de caractersticas. Del que tambin se aporta cmo han sido transformadas las
primitivas en partes del vector de caractersticas.
Otra de las aportaciones de esta tesis, es la tcnica presentada de clustering
paramtrico, basada en los mapas auto organizados, en las U-Matriz, en la descripcin

288

DISAM-UPMT-98-015

Carlos Platero

Captulo 8: Conclusiones

textual de los patrones y en las tranformaciones normalizantes Box Cox. Adems, esta
nueva tcnica tambin realiza la seleccin de las caractersticas.
Una de las propiedades de los diseos de clasificadores para SIVA, es el bajo
nmero de muestras de que se parte para cada tipo de defecto. Por lo que se han estudiado
el clculo del sesgos para clasificadores paramtricos tanto cuadrticos como lineales.
Presentndose de forma novedosa el clculo del sesgo para clasificadores lineales y
cuadrticos de dos grupos enfrentados y en el espacio unidimensional. Adems se ha
iniciado el desarrollo de algoritmos LVQ con mtrica de Mahalanobis, en la motivacin de
utilizar cudricas en vez de hiperplanos de separacin entre los clusters.
Todo ello ha sido implementado y comprabado en los dos SIVA industriales
realizados.

8.2

Futuros trabajos
Como posibles lneas de trabajo a continuar podran citarse las siguientes:
En formacin de imgenes habra de seguir trabajando en incorporar ms elementos
al modelaje de la escena SIVA. Empezando por los sensores, si bien se ha iniciado un
breve estudio sobre los modelos de las cmaras CCD, hay que continuar en la lnea de
integrar las ecuaciones de comportamiento de las superficies, focos y cmaras, con el
objetivo de poder predecir la informacin luminosa en cada uno de los pixel del sensor.
Respecto a la deteccin de los defectos, se debera continuar la lnea de diseo de
los filtros, primero en cuanto a la determinacin de las mascaras lineales y empezar
tambin con la aplicacin de filtros recursivos para el realce de los defectos. En esta lnea
ya se puede encontrar algunas referencias bibliogrficas.
Habra de continuar en el estudio y generalizacin del clculo del sesgo para
clasificadores lineales y cuadrticos.
De otro lado, parece que la lnea natural empleada en el diseo de los clasificadores
paramtricos se debera intentar para los clasificadores no paramtricos, sobre todo en
algoritmos LVQ, investigando en la capacidad de determinar el error y el sesgo teniendo
en cuenta el nmero de muestras. Adems de seguir estudiando los comportamiento de
LVQ en mtrica de Mahalanobis.
En cuanto a las aplicaciones SIVA implementadas, los meses venideros seguirn en
el esfuerzo de mejorar el SIVA dedicado a la pasta de papel, sobre todo en tres direcciones
principalmente: un primer camino en la bsqueda de la regin espectral de la luz capaz de
aumentar el realce de tipo shive, ya sea por la interposicin de un filtro de transmitancia

DISAM-UPMT-98-015

289

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

entre la escena y el sensor, ya sea con el cambio de la fuente luminosa. Otra de las
direcciones que pueden ser muy fructfera es el cambio de tecnologa de adquisicin,
conducentes a introducir cmaras TDI para la determinacin de la limpieza en pasta en la
misma lnea de produccin. Y por ltimo, mejorar los resultados de deteccin mediante el
diseo de nuevos filtros para el realce de los defecto, objetivo ligado con las anteriores
pretensiones.

290

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

Bibliografa
[Abbas93]

Abbaszadeh, S., The Automated Inspection Of Garments Using Machine


Vision, tesis doctoral de la Universidad de Montfort, 1993.

[Aero93]

Aeoryne Products, WI-3000:Automatic surface inspection system, catlogo


comercial, 1930 Zaventem, Belgium, 1993

[Amore90]

Amorese, P., Bloomfield, J., A slew of Standards for Camera Systems,


Datacube World Review, 1990.

[ANSI78]

American National Standards Institute, Surface Texture, ANSI / AMSE B46.11978, ANSI, New York, 1978

[Andre71]

Andrews, D.F., Gnanadesikan, R., Warner, J.L., Transformation of


multivariante data, Biometrics, 27, pp. 825-840, 1971.

[Atkin89]

Atkinson, A.C., Lawrance, A.J., A Comparison of Asymptotically Equivalent


Test Statistics for Regression Transformation, Biometrika, 76, 223 229, 1989.

[Avi-I96]

Avi-Itzhak, H., Diep, T., Arbitrarily Tight Upper and Lower Bounds on the
Bayesian Probability of Error, PAMI, V18, N 1, January, 1996.

[Awcoc95]

Awcock, G.J., Thomas, R., Applied Image Processing, Macmillan, 1995

DISAM-UPMT-98-015

291

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Balst92]

Baltsavias, E.P., Beyer, H.A., Fritsch, D., Lenz, R.K., Fundamentals of RealTime Photogrammetry. Tutorial notes for XVIIth ISPRS Congress, Washington,
DC, 1992

[Bank90]

Banks, S, Signal Processing Image and Pattern Recognition, McGraw Hill,


1990.

[Barri69]

Barrie, G., Sampling Inspection and Quality Control, Methuen and Company,
Ltd., London, 1969.

[Batch92]

Batchelor,B.G., Braggins,D.W., Commercial vision systems, Computer Vision:


Theory and Industrial Applications, Springer-Verlag, New York, pp 405-452,
1992.

[Beckm63]

Beckmann, P., Spizzichino, A. The Scattering of Electromagnetic Waves from


Rough Sources, Pergamon, London, 1963.

[Beyer93]

Beyer, H.A., Performance Analysis of CCD-Cameras for industrial inspection,


SPIE, V 1989 Computer Vision for Industry, 1993.

[Beyer93a]

Beyer, H.,A., Determination of Radiometric and Geometric Characteristics of


Frame Grabbers, SPIE, V 2067, Videometrics II, 1993

[Bezde92]

Bezdek, J.C., Pal, S.K. Fuzzy models for pattern recognition. Methods that
search for srtuctures a data, IEEE, Inc,. New York, 1992.

[Bhatt43]

Bhattacharyya, A., On a measure of divergence between two statistical


populations defined by their probability distributions, Bull. Calcutta Math.
Soc., 35, pp 99-110, 1943.

[Blouk87]

Blouke, M.M., Janesick, J.R., Elliot, T., Hall, J.E., Current Status of the 800
x 800 Charge-Couple-Device Image Sensor. Optical Engineering, V 26 N 9,
pp 864-874, September 1987.

[Box64]

Box, G.E.P., Cox, D.R., An analysis of transformation, Journal of the Royal


Statistical Society 26, pp 211-252, 1964

[Brads94]

Bradshaw, M., The automated inspection of web fabrics using machine vision,
tesis doctoral Universidad de Montfort, 1994.

[Brite92]

BRITE 4336, System definition, Technical Manager, BREU-CT91_0393,


Novara, May 1992.

292

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

[Cancel86]

Cancela, R., Estudio de problemas notales en el anlisis cluster. Universidad


de Santiago de Compostela, 1986

[Carpen88]

Carpenter G., Grosberg S. The ART of Adaptive Pattern Recognition by a


self-organizing neural network, IEEE Computer, 77-88, March,1988

[Chamb95]

Chamberlain, S.G., Kamasz, S.R. A 26.3 Million Pixel CCD Image Sensor,
IEEE Proceedings of the International Conference on Electron Devices, pp 151155, Washington DC, December 10, 1995.

[Cases97]

Cases, F., Anlisis textural de la pasta de papel, Asignatura de doctorado:


Tcnicas avanzadas de procesamiento de imgenes, DISAM-UPM, 1997.

[Chin82]

Chin, R.T., Harlow, C.A., Automated Visual Inspection: A survey. IEEE Trans.
Pattern Analysis and Machine Intelligent, 6, pp 557-573, 1982

[Chin88]

Chin, R.T., Automated Visual Inspection: 1981 to 1987. Computer Vision


Graphics Image Process, 41, pp 346-381, 1988

[Chin92]

Chin, R.T., Automated visual inspection algorithms. En Computer Vision:


Theory and Industrial Applications, ed. Torras, pp 377-404, 1992.

[Chern52]

Chernoff, H., A measure of asymptotic efficiency for test of a hypothesis based


on the sum of observation, Ann.Math.Stat., 23, pp 493-507, 1952.

[Coole71]

Cooley, W.W. Lohnes, P.R., Multivariate Data Analysis, New York, Wiley,
1971.

[Cottr87]

Cottrell, M., Fort, J.C. Etude dun algoritme dauto-organisation. Annales de


IInstitute Henri Poincar, 23, 1, pp1-20, 1987.

[Cuadr91]

Cuadras,C.M., Mtodos de Anlisis multivariante, pp 269-294. PPU, Barcelona


1991.

[Dahle90]

Dahle, O., Sommerfelt, A., On line inspection of extruded profile geometry,


Proc. SME Vision 90 Conference, pp 61 69, 1990.

[Devij82]

Devijver, P.A., and Kittler, J. Pattern Recognition. A Statistical Approach.


Prentice-Hall International, London, 1982.

[Domin94]

Dominguez,S., Campoy, P., Aracil, R., A Neural Network Based Quality


Control for Steel Strip Manufacturing, Proceedings of the IFACAIRTC94.

DISAM-UPMT-98-015

293

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Dough92]

Dougherty, E.R., An Introduction to Morphological Image Processing, SPIE


Tutorial Texts Series, 1992

[Dough94]

Dougherty, E.R., Astola, J., An Introduction to Nonlinear Image Processing,


SPIE Tutorial Texts Series, 1994

[EES92]

Europan Electronic Systems, CCD5020. High speed surface inspection with


classification, System Manual, BH235AG, England, 1992

[Ence94]

ENCE, Control proceso final: limpieza en pastas, Norma 404 ENCE, Enero
1994.

[Erwin92]

Erwin, E., Obermayer, K., Schulten, K. Self-Organizing maps: Ordernig,


convergence properties and energy functions. Biological Cybernetics, 67, pp
47-55, 1992.

[Escud77]

Escudero, L. Reconocimiento de patrones, Paraninfo, 1977

[Feng93]

Feng, O., Computerized image quality inspection system, Machine Vision


Applications in Industrial Inspection, SPIE Vol. 1907, pp 133-138, 1993

[Fernn94]

Fernndez, C., Platero, C., Campoy, P., Aracil, R., Surface inspection of flat
products by means of texture analysis. On-line implementation using neural
networks, European Symposium on Optics for Productivity in Manufacturing,
Frankurt, 1994.

[Fernn97]

Fernndez, J.C., Inspeccin de superficies mediante Visin Artificial.


Integracin en tiempo real en procesos productivos, tesis doctoral de la UPM,
1997

[Fernn97a]

Fernndez, J., Fernndez, C., Aracil, R., On line integral quality control of
ceramic tiles by artifical vision, Proc. International Conference on Quality
Control by Artificial Vision QCAV97, 1997

[Freem89]

Freeman, H. Machine vision for inspection and measurement. Academic Press


1989

[Fu88]

Fu, K. Robotics: Control, Sensing, Vision and Intelligence. McGraw Hill, 1988

[Fu82]

Fu, K.S. Syntactic pattern recognition with applications, Prentice Hall, 1982.

[Fukun89]

Fukunaga, K., Hayes, R., Effect of sample size in classifier design, PAMI, V
11, N 8, pp 873-885, august 1989

294

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

[Fukun90]

Fukunaga, K., Introduction to Statistical Pattern Recognition, Academic


Press,1990

[Gallar97]

Gallardo, C., Estudio para la deteccin de defectos en pasta de papel mediante


tcnicas de Visin Artificial. Proyecto fin de Carrera de DISAM-UPM, 1997

[Garc97]

Garca, C., Clasificadores paramtricos lineales y cuadrticos, aplicados a la


catalogacin de defectos locales del aluminio colado. Proyecto fin de Carrera
de DISAM-UPM, 1997

[Garc98]

Garca, L., Estudio sobre distribuciones de campos luminosos sobre superficies


planas, Documento interno de DISAM, 1998.

[Genne93]

Gennert, M.A., Wittles, N, Leatherman, G.L., Uniform Frontal Illumination


of Planar Surfaces: Where to Place the Lamps, Optical Eng.,32, pp 1261-1270,
1993

[Genne94]

Gennert, M.A., Wittles, N, Leatherman, G.L., Uniform Frontal Illumination


of Planar Surfaces: Criteria for Optimal Lighting Design, SPIE vol. 2065, pp
62-69, 1994

[Gile92]

Giles, C.L. Second-order recurrent neuronal networks for grammatical


inference. Proc. Int. Joint Conference on Neural Networks,1992.

[Glasb93]

Glasbey, C.A., An analysis of Histogram-Based Thresholding Algorithms,


CVGIP, Vol. 55, N 66, pp 532-537, 1993.

[Gonz98]

Gonzlez, A. Adquisicin y modelado tridimensional en Visin artificial


mediante tcnicas de luz estructurada, tesis doctoral de la UPM, 1998.

[Guine91]

Guinea, D., Ruiz, A., Barrios, L.J., Multi-sensor integration: An automatic


feature selection and state identification methodology for tool wear estimation,
Computer in Industry, V 17, N 2&3, L. Monostori, pp. 121-130, Elsevier,
Nov, 1991.

[Hall65]

Hall, D.J., Ball, G.B., ISODATA: A novel method of data analysis and pattern
classification, Technical report, Stanfort Research Institute, Menlo Park, CA,
1965.

[Han93]

Han, J.H.,Yoon, D.M., Kang M.K., Feature for automatic surface inspection,
SPIE V 1907 Machine Vision Applications in Industrial Inspection,1993.

[Hect84]

Hecht, Zajac, ptica, Addision Wesley, 1984

DISAM-UPMT-98-015

295

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Hertz91]

Hertz, J., Krough, A., Palmer, R., Introduction to the theory of Neural
Computation. Addison-Wesley, 1991.

[Holst96]

Holst, G.C., CCD arrays, cameras and displays, SPIE Press, 1996.

[Hughe68]

Hughes, G.F, On the mean accuracy of statistical pattern recognizers, Trans.


IEEE Inform. Theory, IT-14, pp. 55-63, 1968.

[Ikeuc94]

Ikeuchi, K., Surface Reflection Mechanism, Handbook of Pattern Recognition


and Image processing: Computer Vision, V 2, Academic Press, pp 131-156,
1994

[Intec93a]

Intec, System 3000: Automatic Inspection System for Continuous Web Products,
Catlogo comercial, North Billerica, MA 01862, 1993

[Intec93b]

Intec, On-Line Pulp Inspection System, Catlogo comercial, North Billerica,


MA 01862, 1993

[Jhne93]

Jhne, B., Digital Image Processing. Concepts, algorithms and applications,


Springer-Verlag,1993.

[Jhne97]

Jhne, B., Digital Image Processing: Concepts, Algorithms and Scientific


Applications, Springer, 1997

[Jain89]

Jain, A.K., Fundamentals of Digital Image Processing, Prentice Hall, 1989

[Kanal92]

Kanal, L., Raghavan, R., Hybrid systems a key to intelligent pattern


recognition. Proceedings of the International Joint Conference on Neural
Networks, pp IV 177-182, Baltimore, June 1992.

[King85]

King, K., Just, J., Osheroff, Berke, G., Spidaliere, P., Ngoc, T., Robotic
technology: An assessment and forecast, Robotics and Flexible Manufacturing
Technologies, Noyes, Park Ridge, NJ, 1985.

[Kohon82]

Kohonen, T., Self-organized formation of topologically correct features maps.


Biological Cybernetics, 43, pp 59-69, 1982

[Kohon82a]

Kohonen, T. Analysis of a simple self-organizing process. Biological


Cybernetics, 44, pp 135-140, 1982.

[Kohon88]

Kohonen, T. The self Organizing Map. Proceedings of the IEEE, V 78, N ,


pp1464-1480,1988

296

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

[Kohon92]

Kohonen,T. Kangas,J., Laaksonen, J. LVQ_PAK: A Program Package for the


Correct Application of Learning Vector Quantization Algorithms. Proceedings
of the International Joint Conference on Neural Networks, pp I 725-730,
Baltimore, june 1992, IEEE.

[Kohon95]

Kohonen, T. Self-Organizing Maps. Springer-Verlag, Heidelberg, 1995

[Kung93]

Kung, S.K., Digital neural networks. Prentice Hall, 1993.

[Lambe60]

Lambert, J.H., Photometria sive de mensura de gratibus luminis colorum et


umbrac, Eberhard Klett, Augsburg, 1760

[LeBea90]

LeBeau , C.J., Machine vision platform requirements for successful


implementation and support in the semiconductor assembly manufacturing
environment, Proceeding of SPIE Machine Vision System Integration in
Industry Conference, Boston, SPIE V 1368, pp 228-231, 1990

[Lee90]

Lee,S.U., Chung, S.Y., Park,R.H., A Comparative Performance Study of


Several Global Thresholding Techniques for Segmentation, Computer Vision,
Graphics, and Image Processing 52, pp 177-190, 1990

[Macai93]

Macaire, L., Postaire, J.G., Flaw detection on galvanized metallic strips in real
time by adaptive thresholding, Computer Vision for Industry, V 189, pp 1425,SPIE 1993.

[Malsb73]

von der Malsburg, Ch. Self-organization of orientated sensitive cells in the


striate cortex. Kybernetik, N14, pp 85-100, 1973.

[Marav93]

Maravall, D., Reconocimiento de Formas y Visin artificial, Ra-ma, 1993.

[Marsh90]

Marshall, A.D., Automatically inspection gross features of machined objects


using three-dimensional depth data, Proceedings of the SPIE Conference on
Machine System Integration in Industry, Boston, 1990, pp 243 - 254.

[Marti90]

Martinez J.A., Contribucin al anlisis y estimacin en imgenes digitales


mediante la teora de la informacin, tesis doctoral de la Universidad de
Granada, 1990.

[Mart95]

Martn del Brio, B., Procesamiento Neuronal con Mapas Autoorganizados:


Arquitecturas Digitales, pp 49-114, tesis doctoral de la Universidad de
Zaragoza, 1995.

[Mathe75]

Matheron, G., Random Set and Integral Geometry, John Wiley, New York,
1975.

DISAM-UPMT-98-015

297

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Matro97]

Matrox, User Guide, Manual N 10513-MN-0500, pp 135-158, 1997

[McLac92]

McLachlan, G.J., Discriminant Analysis and Statistical Pattern Recognition,


New York, John Wiley, 1992.

[Newma95]

Newman,T.S., Jain, A.K., A Survey of Automated Visual Inspection, Computer


Vision and Image Understanding, V 61, March, pp 231-262,1995.

[Miett93]

Miettinen, J., Hrkonen, A., Procedure for image acquisition design, SPIE
Vol.1989 Computer Vision for Industry, pp 70-80, 1993.

[Mulie92]

Mulier, V., Cherkaassky, V. : Proc. 12 ICPR, Int. Conf. On Pattern Recognition


(IEEE Services Center, Piscataway, NJ 1994), p.II-224, 1994

[Nayar91]

Nayar, S.K., Ikeuchi, K., Kanade, T. Surface reflection: Physical and


geometrical perspectives, PAMI 13 (7), 661-634, 1991.

[Ninom92]

Ninomiya, T., Yoshimura, K., Nomoto, M., Automatic screen-printed circuit


pattern inspection using connectivity preserving image reduction and
connectivity comparison, Proc. 11th ICPR, V A, pp 53-56, 1992.

[Norto82]

Norton-Wayne, The detection of defects in automated visual inspection, British


thesis, 1982.

[Norton83]

Norton-Wayne, L., Finkelstein L. Signal Processing for automatic surface


inspection of steel strip, Trans Inst M C, V. 5, N  3, 1983.

[Ohta86]

Ohta, K., Sakue, K., Tanura, H., Pattern Recognition Of Fabric Surfaces,
Journal Of The Textile Machinery Of Japon, V32,N1, pp 7-10, 1986.

[Oulu97]

Oulu University, Information Processing and Computer Engineering


Laboratory, Electrical Engineering Department, Oulu Univeaity,
http://www.ee.oulu.fi, 1997.

[Parsy97]

Parsytec Co., http://www. Parsytec.de, 1997.

[Parth87]

Parthasarathy, S., Wolf, D., Hu, E., Hackwood, S., Beni, G., A color vision
system for film thickness determination, Proceedings of the IEEE International
Conference on Robotics and Automation, Raleigh, NC, pp 515-519, 1987

[Patri72]

Patrick E.A. Fundamentals of Pattern Recognition, pp 411-418. Prentice Hall,


1972.

298

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

[Pea87]

Pea, D., Estadstica, modelos y mtodos, Alianza Editorial, 1987.

[Phong75]

Phong, B.T., Illumination for computer generated pictures, Commun. ACM


18 (6), pp 311-317, 1975.

[Piiro90]

Piironen, T., Silven, O., Pietikinen, M., Laitinen, T. Automated Visual


Inspection of Rolled Metal Surface, Machine Vision and Applications, V 3, pp
247-254, Springer-Verlag, New York, 1990.

[Poole89]

Poole, H., Fundamentals of Robotics Engineering, Van Nostrand Reinhold,


New York, 1989.

[Plate92]

Platero, C., Deteccin y clasificacin de defectos en las planchas de aluminio


mediante Visin artificial, Proyecto fin de Carrera, DISAM-UPM, TFC
92/185,1992.

[Plate94]

Platero, C., Fernndez, C., Campoy, P., Aracil, R., Surface analysis of cast
alumnium by means of artificial vision and AI-based techniques, Symposium
on: Electronic Imaginig: Science & Technology, 1994

[Plate95]

Platero, C., Fernndez, C., Campoy, Aracil, R., Hybrid system : Aplication to
defect clasification in cast aluminum, International Conference on Quality
Control by Artificial Vision, pp 48-58, 1995

[Plate95a]

Platero, C., Fernndez, C. , Campoy, P., Aracil, R., Surface analysis of cast
aluminum by means of artificial vision and A.I. based techniques, International
conference on Quality Control by Artificial Vision, Le Creusot, France, 1995.

[Plate97]

Platero,C., Crespo,C., Garcia,J., Campoy, P.,Aracil, R., Feature space


parametrization by means Self organizing maps and Box Cox transformations,
VII SNRFAI, Barcelona, 25 April, 1997.

[Plate97a]

Platero, C., Inspeccin de etiquetas en productos farmacuticos,


Documentacin interna de FAIS-UPM.

[Plate98]

Platero, C., Inspeccin visual automatizada de superficies homogneas


mediante Visin Artificial con aportaciones al Reconocimiento de Formas,
tesis doctoral de la UPM, 1998.

[Pratt91]

Pratt, W.,K., Digital Image Processing, A Wiley-Interscience Publication,


Second Edition, 1991.

[Rao71]

Rao, C.R. Taxonomy in anthropology. Mathematics in the Archeological and


Historical Sciences, Edinburg University Press, 1971

DISAM-UPMT-98-015

299

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Raube95]

Rauber,T.W., Barata, M.M., Steiger-Garcao, A.S., A toolbox for analysis and


visualization of sensor data in supervision. Universidade Nova de Lisboa,1995.

[RealA96]

Real Academia Espaola, Diccionario de la Lengua espaola, Espasa Calpe,


1996.

[Ritte88]

Ritter H., Schulten K.,Convergence properties of Kohonen's topology


conserving maps: Fluctuations, stability, and dimension selection, Biological
Cibernetics, 60, 59-71, 1988.

[Reino96]

Reinoso, O., Anlisis y generalizacin de algoritmos de Visin Artificial con


precisin subpixel, tesis Doctoral UPM, 1996

[Rober93]

Rober,J.W., Rose, S.D., Jullien, G., A PC-based Real Time Defect Imaging
System for High Speed Web Inspection, SPIE, V 1907 Machine Vision
Applications in Industrial Inspection, pp164-176, 1993

[Rolan87]

Roland, T.C. Automated visual inspection: 1981 to 1987. CVGIP 41, pp 346381,1987

[Ruz92]

Ruz,R.,Barro,S.,Presedo.J, Clasificacin borrosa basada en conocimiento.


Estudios de lgica borrosa y sus aplicaciones. Universidad de Santiago de
Compostela,1992.

[Snch98]

Snchez, F., Tcnicas fotogramtricas para el control dimensional, Documento


registrado DISAM-UPM, R98-017v1.0, 1998.

[Sears81]

Sears, F.S., Zemansky, M.W., Fsica General, Aguilar, 1981, pp 837-842

[Sebas90]

Sebastian, J.M., Campoy, P., Reinoso, L. Jimnez, L.M., Introduccin a la


Visin Artificial, Documento interno de DISAM-UPM.

[Sebas95]

Sebastian, J.M., Parallel processing and scheduling techniques applied to the


quality control of bill sheets. Proc. IAPR, pp 399 403, 1995

[Serran93]

Serrano, C., Martin del Brio, B. Gallizo, J.L. Mapas Neuronales


Autoorganizados: una nueva herramienta de anlisis contable. Reunin de la
Asociacin Espaola de Contabilidad y Administracin de Empresas,
AECA93, Vitoria , sept.1993

[Serran95]

Serrano, J., Procesado morfolgico de imgenes. Aplicacin para control


industrial, Eurofach Electrnica, marzo 1995.

300

DISAM-UPMT-98-015

Carlos Platero

Bibliografa

[Sikka92]

Sikka,D.,Two dimensional curve shape primitives for detecting line defects in


silicon wafers, Proceedings of the International Joint Conference on Neural
Networks, pp III 591-596, Baltimore, June 1992, IEEE.

[SOM92]

SOM PACK. The Self-organizing Map Program Package, University of


Technology, Helsinki (Finland) Nov, 1992.

[Sahoo88]

Sahoo, P.K., Soltani, S., Wong, K.,C., A Survey of Thresholding Techniques,


GVCIP, N 41, pp 233-260, 1988.

[Serra82]

Serra, J., Image analysis and mathematical morphology, Academic Press,


London, 1982.

[Silva92]

Silva, J., Pais, C.P., Freitas, J.C., Carvalho, F.D., Rodrigues, F.C., Detection
And Automatic Classification Of Defect in Ceramic Products, SPIE V 1713,
International Conference On Manufacturing Automation, pp 22-28, 1992.

[Smith93]

Smith, B., Making war on defects : Six-sigma design, IEEE Spectrum 30 (9),
pp 43-47, September, 1993

[Spieg88]

Spiegel, M.R. Statistical . McGraw Hill, New York, 1988.

[Takat88]

Takatoo, M., Takagi, Y., Mori, T., Automated Fabric Inspection System Using
Image Processing Rechnique, SPIE V 1004, Automated Inspection and High
Speed Vision Architectures II, pp 151-158, 1988.

[Torre67]

Torrance. K.,Sparrow, E., Theory off-specular reflection from roughness


surfaces, J.Opt.Soc.Amer. N 57,pp 1105-1114, 1967

[Ultsc90]

Ultsch, A., Siemon, H.P. Kohonens self-organizing feature maps for


exploratory data analysis. Proc Int. Neural Networks Conf. INNC 90, Paris,
Ed. Kluwer, pp 305-208, 1990.

[Vando90]

Vandommelen, C.H., Fundamentals of Camera Selection for Machine Vision,


Applied Intelligent Systems, Inc., 1990.

[VanGo91]

Van Gool, L. Wambacq, P., Oosterlinck, Intelligent robotic visions systems,


Intelligent Robotic Systems, pp 457 - 507, Dekker, New York, 1991

[Varfi92]

Varfis, A., Versino, C., Clustering of socio-economic data with Kohonen maps,
Neural Networks World, 2, 6, pp 813-833, 1992.

DISAM-UPMT-98-015

301

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Carlos Platero

[Velil92]

Velilla, S., A note on the multivariate Box-Cox transformation to normality,


Working Paper 92-08, Universidad Carlos III de Madrid, Febrero de 1992.

[Velil94]

Velilla, S., Barrio, J.A., A discriminant rule under transformation,


Technometrics, V 36, N 4, november 1994.

[Venon91]

Venon, D., An overview of techniques for shape description, Machine Vision,


Prentice Hall, 1991.

[Vitri92]

Vitri i Marca, J. Estudi sobre lautomatizacio de lnalisi visual de circuits


integrats mitjanant morfologia matemtica, tesis doctoral de la Universitat
Autnoma de Barcelona, 1992.

[Widro62]

Widrow, B. Self-Organizing Systems , Spartan Books, Washington, D.C., 435,


1962.

[Winch96]

Winchell, W., Inspection and Measurement in Manufacturing, Society of


Manufacturing Engineers, 1996.

[Wrigh88]

Wright, P.K., Bourne, Manufacturing Intelligence, Addison-Wesley, New


York, 1988.

[Xie91]

Xie, X., Beni, G., A vality measure for fuzzy clustering, IEEE PAMI, col. 13,
pp 841-847, 1991

[Zador87]

Zador, P : IEEE Trans. Inform. Theory IT-28, 139, 1987

[Zeuch88]

Zeuch, N., Applying Machine Vision, Wiley, New York, 1988

302

DISAM-UPMT-98-015

También podría gustarte