Está en la página 1de 226

 

TESIS DOCTORAL

TESIS DOCTORAL - Clasificación de placas de pizarra de techar


basada en técnicas de inteligencia artificial mediante visión artificial
Clasificación de placas de pizarra de techar basada
en técnicas de inteligencia artificial mediante
visión artificial

Carla Iglesias Comesaña

2017
Carla Iglesias Comesaña

2017
i
ii
 

Escuela  Internacional  de  Doctorado  

Carla Iglesias Comesaña

TESIS DOCTORAL
Clasificación de placas de pizarra de techar basada en técnicas
de inteligencia artificial mediante visión artificial

Dirigida por los doctores:


Javier Taboada Castro
Javier Martínez Torres

Año:
2017
iv
Agradecimientos

Tras un largo camino, al fin me veo escribiendo estas líneas que suponen
la finalización de una etapa tan gratificante como agotadora. En estos años
son muchas las personas a las que debería nombrar en este apartado, pues el
viaje hasta aquí ha estado lleno de buena compañía.

En primer lugar, quisiera agradecer a mis directores el apoyo prestado du-


rante el desarrollo de este proyecto. He aprendido muchísimo de los campos
en él implicados, especialmente de visión artificial y de aprendizaje automáti-
co. Tengo, además, la gran suerte de haber contado con el ánimo, generosidad
y guía de un gran profesional, matemático, compañero y amigo: gracias de
todo corazón, Javi.

Ya que ha aparecido la palabra mágica, seguiré con ellos: mis amigos. No


quiero poner ningún nombre porque corro el riesgo de olvidarme de alguien.
Pero sí quiero decir que forman una parte fundamental e insustituible de mi
vida y de mí misma. Me siento enormemente afortunada de conservar amis-
tades desde los cuatro años, y de crear nuevos vínculos con otros personajes
que aparecen en escena con la película más avanzada (y en distintas versio-
nes). Gracias a todos por acompañarme y dejarme acompañaros. No habría
sido lo mismo sin vosotros.

A mi familia le tengo que agradecer el apoyo incondicional que siempre


me han mostrado. No sería quien soy ni estaría donde estoy si no hubiese
sido por ellos, mis padres y mis abuelos. Por suerte o por desgracia, según
se mire, han llegado hasta aquí conmigo tres de ellos. Espero que los que se
quedaron por el camino se sientan orgullosos de ver a su nieta como doctora
(aunque sea, como digo yo, del tipo “inútil” porque no puedo salvar vidas).
Guardaré una copia de este documento impreso en la librería de madera que
con tanto mimo se talló allá por inicios de 2013.

v
vi

Si hasta ahora he hablado de grandes profesionales, compañeros, amigos,


apoyos y familia, hay una persona que integra todos esos conceptos. El que
más me ha aguantado y acompañado en los últimos diez años, y por supuesto
el que (después de mis padres) más me ha querido. Tengo muchísima suerte
de tenerte a mi lado. Hugo, agárrate fuerte, que seguimos avanzando.

Por último, debo agradecer el apoyo económico que me ha ofrecido el Mi-


nisterio de Educación, Cultura y Deporte, a través de la beca FPU 12/02283.
Gracias a esta beca he podido iniciarme en la docencia y descubrir una pro-
fesión que realmente me gusta.

En este camino que estoy recorriendo, y en el que un largo tramo parece


llegar a su fin, nuevas metas aparecen en el horizonte.
Resumen

En un escenario industrial cada vez más competitivo y en el que la inves-


tigación y desarrollo está a la orden del día, el sector de los recursos naturales
no es ajeno a estos avances, que buscan una producción más ágil, adaptable,
flexible y menos lesiva para las personas.
La pizarra, una de las rocas ornamentales de mayor importancia en Espa-
ña (principal productor mundial), es un recurso muy valorado como elemento
de construcción por sus características de impermeabilidad, fisilidad, resis-
tencia al fuego y relativo bajo peso. Tradicionalmente se ha empleado como
elemento de techar, usándose para tal fin las placas elaboradas con distintas
geometrías obtenidas tras sucesivas etapas de corte y labrado del material
extraído en cantera.
El proceso de elaboración en nave finaliza con la inspección visual de
cada placa con el fin de evaluar su aptitud para la venta, comprobando la
presencia de una serie de defectos y su acabado. Esta evaluación la realiza
manualmente un operario experto, con la consiguiente subjetividad inherente
al criterio humano, además de la fatiga que implica dicha tarea.
Este estudio aborda el desarrollo de un sistema de clasificación de placas
de pizarra que, mediante un sistema de visión artificial, captura la infor-
mación de la placa y la analiza en un software de visión empleando unos
algoritmos de inspección específicamente diseñados a este efecto.
El sistema de visión recoge la información en escala de grises, de color y
tridimensional, y en base a dichos datos se evalúan los principales defectos que
determinan la calidad comercial de la pizarra: el escuadrado (falsa escuadra),
el alabeo, las faltas de material, la regularidad de la superficie, la presencia
de carbonatos y la presencia de sulfuros.
El sistema se completa con un modelo matemático que simula el criterio
del experto y asigna a cada placa la calidad oportuna en función de los defec-
tos detectados en el paso anterior. A este efecto, en este estudio se han testado
diversos modelos, pudiendo diferenciar dos tipos principales: un decisor em-
pírico y modelos basados en técnicas de inteligencia artificial, concretamente

vii
viii

de aprendizaje automático (árboles de decisión, redes neuronales y máquinas


de vectores soporte).
Para ello se emplea una base de datos compuesta de 70 placas que han
sido previamente evaluadas por dos expertos, quienes indicaron los defectos
que observaban y la calidad (primera, segunda o rechazo) que a su juicio
merece cada una. La comparación de ambos criterios pone de manifiesto la
disparidad de criterios, habiendo entre ellos varias discrepancias.
Los algoritmos de análisis de imagen y las técnicas de clasificación em-
pleadas han demostrado ser aplicables al problema de la asignación de calidad
a las placas de pizarra, y se han determinado las variables más adecuadas
e influyentes en la calidad, así como la técnica de clasificación que mejor se
adapta a la naturaleza de este problema: los árboles de decisión.
La vida consiste en la gente que conoces
y las cosas que creas con ellos.

I
II
Índice general

1. Introducción 1
1.1. Antecedentes y objetivos . . . . . . . . . . . . . . . . . . . . . 3
1.2. Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4. Aportaciones científicas . . . . . . . . . . . . . . . . . . . . . . 12
1.5. Líneas futuras de investigación . . . . . . . . . . . . . . . . . . 17

2. Industria y caracterización 19
2.1. La industria pizarrera española . . . . . . . . . . . . . . . . . 21
2.1.1. Mercado de la pizarra española . . . . . . . . . . . . . 26
2.2. Geología de la pizarra española . . . . . . . . . . . . . . . . . 31
2.2.1. Descripción de la zona de estudio . . . . . . . . . . . . 35
2.2.2. Estructuras que condicionan la explotabilidad de los
yacimientos de pizarra . . . . . . . . . . . . . . . . . . 37
2.3. Características comerciales . . . . . . . . . . . . . . . . . . . . 40
2.3.1. Calidad de la pizarra. Factores que la definen . . . . . 41
2.3.2. Características técnicas. Normativa . . . . . . . . . . . 47
2.3.3. Marcado CE . . . . . . . . . . . . . . . . . . . . . . . . 51

3. Técnicas de visión artificial 53


3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2. Elementos sistema visión artificial . . . . . . . . . . . . . . . . 57
3.2.1. Elementos hardware del sistema . . . . . . . . . . . . . 58
3.2.2. Elementos de software del sistema . . . . . . . . . . . . 74
3.3. Parámetros a controlar en el sistema de visión artificial . . . . 76
3.4. Medición en 3D . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.5. Métodos de análisis de imagen . . . . . . . . . . . . . . . . . . 87

4. Fundamento matemático 95
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2. El problema de aprendizaje . . . . . . . . . . . . . . . . . . . 98

III
IV ÍNDICE GENERAL

4.3. Proceso de aprendizaje . . . . . . . . . . . . . . . . . . . . . . 99


4.3.1. El problema de clasificación . . . . . . . . . . . . . . . 100
4.3.2. Evaluación del modelo . . . . . . . . . . . . . . . . . . 102
4.4. Técnicas de aprendizaje automático . . . . . . . . . . . . . . . 106
4.4.1. Árboles de decisión. CART . . . . . . . . . . . . . . . . 106
4.4.2. Redes neuronales. MLP . . . . . . . . . . . . . . . . . 108
4.4.3. Máquinas de vectores soporte (SVM) . . . . . . . . . . 111
4.5. Reducción de variables. ACP . . . . . . . . . . . . . . . . . . . 115

5. Sistema de clasificación 119


5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.2. Adquisición de imágenes . . . . . . . . . . . . . . . . . . . . . 123
5.2.1. Descripción física y elementos . . . . . . . . . . . . . . 123
5.2.2. Defectos de placa analizados . . . . . . . . . . . . . . . 125
5.2.3. Comparativa prototipo 2010 vs prototipo 2017 . . . . . 127
5.3. Análisis y caracterización de las placas . . . . . . . . . . . . . 128
5.3.1. Preproceso . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.3.2. Proceso . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.4. Clasificación de placas de pizarra . . . . . . . . . . . . . . . . 145
5.4.1. Asignación de calidad según decisor empírico . . . . . . 147
5.4.2. Análisis de las variables del vector característico . . . . 148
5.4.3. Configuración de los modelos entrenados . . . . . . . . 155
5.4.4. Resultados obtenidos con el decisor empírico y con los
modelos CART, MLP y SVM . . . . . . . . . . . . . . 158
5.4.5. Discusión de los resultados . . . . . . . . . . . . . . . . 169

6. Conclusiones 175

Bibliografía 181

Índice alfabético 203


Índice de figuras

1.1. Portadas de los artículos científicos publicados relacionados


con este estudio. . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2. Congresos científicos en los que se han presentado trabajos
relacionados con este proyecto. . . . . . . . . . . . . . . . . . . 16
1.3. Modelo de Utilidad concedido. . . . . . . . . . . . . . . . . . . 16

2.1. Valor de la producción minera total en España en el periodo


2009–2014. Fuente: [157]. . . . . . . . . . . . . . . . . . . . . . 21
2.2. Evolución de los tonelajes producidos, exportados e importa-
dos de pizarra en España en el periodo 2001–2014. Elaborado
a partir de [218]. . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Esquema del proceso de extracción y elaboración de la pizarra
hasta la obtención de las placas comerciales. Imágenes toma-
das de www.cafersa.com y www.pizarrascampo.es . . . . . . . 24
2.4. Características del mercado mundial de la pizarra en 2011: im-
portaciones y exportaciones en (1) millones de dólares, (2) en
miles de toneladas, (3) precio de venta en dólares por tonelada
y (4) precio de compra en dólares por tonelada [42]. Tomado
de: http://roofingslates.wordpress.com . . . . . . . . . . . . . 26
2.5. Exportaciones de pizarra manufacturada en 2015 [218]. . . . . 27
2.6. Formatos y dimensiones de las placas de pizarra comercializa-
das habitualmente. Fuente: http://clusterdapizarra.com. . . . 28
2.7. Shizuoka Convention and Arts Center en Osaka, con cubierta
de pizarra verde de Lugo. Fuente: http://www.granship.or.jp. . 30
2.8. División en zonas del Macizo Ibérico en el noroeste peninsular
[47, 72, 116]. Fuente: [188]. . . . . . . . . . . . . . . . . . . . . 32
2.9. Distintas nomenclaturas dadas a la estructura del Sinclinal de
Truchas por los autores que lo han estudiado. Fuente: [188]. . 33
2.10. Corte que muestra la estructura del sinclinal de Truchas según
Catalán et al. [47] y Heredia et al. [97]. Tomado de [188]. . . . 36

V
VI ÍNDICE DE FIGURAS

2.11. Esquema de una bregada o kink-band. Fuente: Norma UNE-


EN 22190-1:1998 EX. . . . . . . . . . . . . . . . . . . . . . . . 38
2.12. Esquema del clivaje de crenulacion. Tomado de [88]. . . . . . . 39
2.13. Esquema que muestra la presencia de un cubo de pirita en una
placa de pizarra. Fuente: Norma UNE-EN 22190-1:1998 EX. . 42
2.14. Esquema que muestra la presencia de un nudo (izquierda) y
un rucio (derecha) en una placa de pizarra. Fuente: Norma
UNE-EN 22190-1:1998 EX. . . . . . . . . . . . . . . . . . . . . 43
2.15. Esquema que muestra la crenulación o rayela en una placa de
pizarra. Fuente: Norma UNE-EN 22190-1:1998 EX. . . . . . . 45
2.16. Tercios de la placa de pizarra con las dos nomenclaturas ha-
bituales. Fuente izquierda: [140]. Fuente derecha: [150]. . . . . 47
2.17. Ejemplo de etiqueta de marcado CE de un producto de pizarra
[41]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.1. Diagrama que muestra los elementos generales de un sistema


de visión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2. Iluminación por fibra óptica directa puntual (izquierda), ani-
llo (medio) y para iluminación por contraste o backlight (de-
recha). Fuente: http://www.infaimon.com. . . . . . . . . . . . 59
3.3. Iluminación LED directa en formato barra (izquierda), anillo
(medio) y para iluminación por contraste o backlight (dere-
cha). Fuente: http://www.infaimon.com . . . . . . . . . . . . . 60
3.4. Luz láser con patrón de varias líneas (izq.) y modelo emplea-
do en el prototipo desarrollado (dcha.). Fuente imagen izq.:
http://www.infaimon.com. . . . . . . . . . . . . . . . . . . . . 60
3.5. Comparativa entre la escena iluminada con luz de longitud de
onda del espectro visible (recuadro superior derecho) y con luz
infrarroja. Fuente: http://www.infaimon.com . . . . . . . . . . 61
3.6. Iluminación de campo oscuro (dark field ). A la izquierda, es-
quema general, y a la derecha un ejemplo de aplicación en
el que se observa la imagen registrada con una iluminación
frontal (medio) y de campo oscuro (derecha). Se aprecia có-
mo este tipo de iluminación realza los defectos superficiales.
Fuente: http://www.microscan.com . . . . . . . . . . . . . . . 62
3.7. Diagrama de un sistema de visión con iluminación por con-
traste o backlight. Adaptado de http://www.effilux.fr. . . . . . 63
3.8. Diagrama de funcionamiento de la iluminación coaxial (izq.) y
ejemplos de fuentes de luz LED para este tipo de iluminación
(dcha.). Fuente: http://www.infaimon.com. . . . . . . . . . . . 63
ÍNDICE DE FIGURAS VII

3.9. Diagrama de funcionamiento de la iluminación coaxial tipo do-


mo (izq.), con panel difusor (medio) y varios ejemplos de fuen-
tes de luz LED para este tipo de iluminación (dcha.). Fuente:
http://www.infaimon.com. . . . . . . . . . . . . . . . . . . . . 63
3.10. Fotografía tomada con una Nikon D3100 y un objetivo Sigma
10-20mm, de los llamados “gran angular”. . . . . . . . . . . . . 65
3.11. Composición de varios objetivos en los que se muestran distin-
tas aperturas de diafragma y su valor correspondiente. Fuente:
www.bdebaca.com/blog–tutoriales/profundidad-de-campo. . . 66
3.12. Ejemplo ilustrativo del concepto de profundidad de campo
y su relación con la apertura de diafragma. Fuente: https://
elcinenosdejaplanos.blogspot.com.es/2012/08/profundidad-de-
campo.html. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.13. Objetivo empleado en este estudio, de f=25 mm con F1.4. . . 67
3.14. Ópticas telecéntricas. Fuente: http://www.infaimon.com . . . 67
3.15. Algunos ejemplos de ópticas especiales: panorámica de imáge-
nes y medición de cavidad interior (izq.), y óptica pericéntrica
que permite una visión 3D periférica de objetos sin la ayuda
de espejos (dcha.). Fuente: http://www.infaimon.com . . . . . 67
3.16. Sensores CCD (izquierda) y CMOS (derecha) de Teledyne Dal-
sa. Fuente: www.teledynedalsa.com. . . . . . . . . . . . . . . . 70
3.17. Espectro de funcionamiento de las cámaras infrarrojas. Adap-
tado de http://www.flir.es. . . . . . . . . . . . . . . . . . . . . 71
3.18. Comparación de un par de imágenes tomada con una cámara
ordinaria (espectro visible, izquierda) y con una cámara SWIR
(derecha). Fuente: http://www.xenics.com/es. . . . . . . . . . 72
3.19. Ejemplo de fotografía de alta velocidad. Foto de Jasper Nance,
https://www.flickr.com/photos/nebarnix/ . . . . . . . . . . . 72
3.20. Esquema que muestra la adquisición de imágenes de diferente
naturaleza con una cámara Multiscan y dos fuentes de ilumi-
nación: se obtiene la intensidad que indica la tercera dimensión
del objeto, la imagen en escala de grises, y las componentes
R, G y B de una sola pasada. . . . . . . . . . . . . . . . . . . 73
3.21. Modelo de “smart camera” o sistema de visión integrado de
Teledyne Dalsa. Fuente: www.teledynedalsa.com. . . . . . . . 74
3.22. Respuesta aproximada de los distintos filtros de las filas de
color estándar. Mediante la línea negra se indica la respuesta
de las filas no cubiertas por ningún filtro del sensor. Fuente:
http://www.sick.com. . . . . . . . . . . . . . . . . . . . . . . . 77
VIII ÍNDICE DE FIGURAS

3.23. Esquema de funcionamiento del método de triangulación láser


3D, en el que un láser incide sobre los objetos a observar y
la cámara registra la deformación de la línea láser (adaptado
de [202]). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.24. Ejemplo de aplicación de un patrón de luz estructurada com-
puesto por una nube de puntos (imagen izquierda) y el mode-
lado 3D de la superficie resultante (en el medio, vista frontal,
y a la derecha, vista en perspectiva). Tomado de [193]. . . . . 80
3.25. Ejemplo ilustrativo del principio de medida de intensidad de
luz, en el que (a) se emite una light wall, que (b) es reflejada por
el objeto. En (c) se representa la luz reflejada total del objeto,
mientras que en (d) se observa la porción de luz “cortada”
por el sensor, cuyo tamaño es inversamente proporcional a la
distancia del objeto al sensor. Tomado de [123]. . . . . . . . . 81
3.26. Dos ejemplos de aperturas codificadas con distintos niveles de
transmisión (los píxeles blancos permiten el paso de la luz,
mientras que los negros la bloquean). Tomado de [191]. . . . . 82
3.27. Distintas configuraciones del sistema de triangulación con plano
de luz. Adaptado de [164]. . . . . . . . . . . . . . . . . . . . . 83
3.28. Problemas de sombras (arriba) y oclusiones (abajo). Adaptado
de [164]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.29. Modelo espacial del modelo de calibración de Tsai [150, 220]. . 85
3.30. Resultado de la aplicación de distintos algoritmos de análisis
de imagen en un ejemplo de una moneda. De izquierda a dere-
cha: imagen real, resultado del umbral o threshold, resultado
de la dilatación y de la erosión. Fuente: [150]. . . . . . . . . . 92

4.1. Número de resultados obtenidos en Scopus al realizar una bús-


queda del término machine learning en tres intervalos tempo-
rales: hasta 2000, de 2001 a 2010 y desde 2011 hasta enero de
2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2. Ejemplo de un problema de clasificación (izquierda), en el que
las observaciones pertenecen a la clase 1 o a la clase 2, y uno
de regresión (derecha), en el que las observaciones se ajustan
mediante una función que representa tales valores continuos. . 101
4.3. Ejemplo de un conjunto de datos con dos clases (izquierda)
delimitadas por fronteras paralelas a los ejes x1 y x2 . A la
derecha, el árbol de decisión correspondiente. . . . . . . . . . . 107
4.4. Ejemplo de un conjunto de datos con dos clases delimitadas
por una frontera que no es paralela a los ejes x1 y x2 . . . . . . 108
ÍNDICE DE FIGURAS IX

4.5. Estructura de una red neuronal con sus capas de entrada, in-
termedia (u oculta) y de salida. Ejemplos con a) varias neu-
ronas en la capa de salida y con b) una única neurona en la
capa de salida. Las conexiones entre las distintas capas están
afectadas por los pesos wij y ci . Adaptado de [77]. . . . . . . . 109
4.6. Ejemplo de transformación de un espacio bidimensional (iz-
quierda) en uno tridimensional (derecha) con la función kernel.
Fuente: [151]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.7. Hiperplano separador de margen máximo para un problema
de clasificación con dos clases linealmente separables (círculos
y diamantes). Fuente: [151]. . . . . . . . . . . . . . . . . . . . 113

5.1. Esquema general de tratamiento de los datos registrados por


el sistema de visión artificial. . . . . . . . . . . . . . . . . . . . 122
5.2. Prototipo actual y sus componentes. . . . . . . . . . . . . . . 124
5.3. Cámara Sick ColorRanger E50 empleada en este estudio. . . . 125
5.4. Defectos considerados en este proyecto. . . . . . . . . . . . . . 126
5.5. Preproceso de las imágenes recogidas por el sistema de visión
y ejemplos de su implementación en Halcon. . . . . . . . . . . 130
5.6. Proceso de análisis de la uniformidad general de la placa y
resultado mostrado en pantalla en Halcon. . . . . . . . . . . . 131
5.7. Proceso de análisis de la presencia de irregularidades locales y
ejemplo de su implementación. . . . . . . . . . . . . . . . . . . 132
5.8. Proceso de análisis de la falta de material en la placa (entera
y por tercios) y ejemplo de resultados obtenidos en Halcon. . . 134
5.9. Esquema del proceso de análisis del alabeo de la placa y mues-
tra de la implementación en Halcon. . . . . . . . . . . . . . . . 135
5.10. Esquema del análisis del correcto escuadrado de la placa y
resultados mostrados en pantalla. . . . . . . . . . . . . . . . . 136
5.11. Cambio de espacio de color de RGB a YUV. Se observa cómo
las regiones amarillas se intensifican en la componente Y del
espacio YUV, facilitando su detección. . . . . . . . . . . . . . 137
5.12. Proceso de análisis de la presencia de carbonatos o flores blan-
cas en las imágenes en escala de grises de las placas. La imagen
(b) muestra un ejemplo de carbonato detectado por el algorit-
mo de inspección. . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.13. Proceso de análisis de la presencia de carbonatos alterados en
las imágenes a color de las placas. La imagen (b) muestra dos
carbonatos detectados siguiendo dicho proceso. . . . . . . . . . 139
5.14. Esquema del proceso de análisis de la presencia de sulfuros en
las placas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
X ÍNDICE DE FIGURAS

5.15. Placa con sulfuros artificiales empleada para la calibración del


algoritmo de detección y resultados obtenidos con el código de
inspección implementado. . . . . . . . . . . . . . . . . . . . . 143
5.16. Varianza explicada de las variables básicas y su acumulado
para las componentes principales calculadas con el Input A. . 151
5.17. Varianza explicada de las variables básicas y auxiliares y su
acumulado para las componentes principales calculadas con el
Input B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.18. Muestra de la clasificación efectuada en Halcon siguiendo la
estrategia del decisor empírico. Arriba, de izquierda a derecha,
se muestran las imágenes en escala de grises, color e intensidad
3D. En la parte inferior se muestra el resumen de resultados
de evaluación de cada defecto y la calidad comercial asignada. 159
5.19. Árboles correspondientes al conjunto de entrada Input A y los
criterios de salida de los Expertos no 1 y no 2. . . . . . . . . . . 161
5.20. Árboles correspondientes al conjunto de entrada Input B y los
criterios de salida de los Expertos no 1 y no 2. . . . . . . . . . . 162
5.21. Árboles correspondientes al conjunto de entrada Input PCA-A
y los criterios de salida de los Expertos no 1 y no 2. . . . . . . . 163
5.22. Árboles correspondientes al conjunto de entrada Input PCA-B
y los criterios de salida de los Expertos no 1 y no 2. . . . . . . . 164
Índice de tablas

2.1. Características principales de las variedades comerciales de


Valdeorras [16, 188]. . . . . . . . . . . . . . . . . . . . . . . . . 41

4.1. Ejemplo de matriz de confusión para el caso de estudio de tres


clases Y = {1, 2, 3}, en el que la clase 1 equivale a la primera
calidad, la clase 2 a la segunda calidad y la clase 3 al rechazo
(pizarra no apta para su comercialización). . . . . . . . . . . . 103

5.1. Defectos y valores límite considerados en este estudio para la


detección de cada singularidad. . . . . . . . . . . . . . . . . . 127
5.2. Comparativa entre los prototipos desarrollados en la tesis de
Martínez [150] y en el presente estudio. . . . . . . . . . . . . . 128
5.3. Resumen de las variables definidas para cada singularidad. . . 144
5.4. Descripción de la muestra: número de placas de cada calidad
comercial y defectos detectados por los dos expertos. . . . . . 146
5.5. Matriz de confusión resultante al enfrentar los criterios de los
dos expertos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.6. Resumen de los defectos representados por cada componente
principal de los análisis realizados sobre el Input A e Input B. 156
5.7. Resumen de la configuración de los modelos de predicción de la
calidad de las placas de pizarra implementados: Entradas (In-
puts) y Salidas (Outputs) consideradas, y número de variables
de entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.8. Matriz de confusión del decisor empírico. . . . . . . . . . . . . 158
5.9. Resumen de tasas de error obtenidas para los modelos CART
implementados con las 8 configuraciones definidas. . . . . . . . 160
5.10. Matriz de confusión media del árbol de clasificación obtenido
con el Input A. . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.11. Matriz de confusión media del árbol de clasificación obtenido
con el Input B. . . . . . . . . . . . . . . . . . . . . . . . . . . 160

XI
XII ÍNDICE DE TABLAS

5.12. Matriz de confusión media del árbol de clasificación obtenido


con el Input PCA-A. . . . . . . . . . . . . . . . . . . . . . . . 163
5.13. Matriz de confusión media del árbol de clasificación obtenido
con el Input PCA-B. . . . . . . . . . . . . . . . . . . . . . . . 164
5.14. Resumen de tasas de error obtenidas para los modelos MLP
implementados con las 8 configuraciones definidas. . . . . . . . 166
5.15. Matriz de confusión media de la red neuronal óptima obtenida
con el Input A. . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.16. Matriz de confusión media de la red neuronal óptima obtenida
con el Input B. . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.17. Matriz de confusión media de la red neuronal óptima obtenida
con el Input PCA-A. . . . . . . . . . . . . . . . . . . . . . . . 167
5.18. Matriz de confusión media de la red neuronal óptima obtenida
con el Input PCA-B. . . . . . . . . . . . . . . . . . . . . . . . 167
5.19. Resumen de tasas de error obtenidas para los modelos SVM
implementados con las 8 configuraciones definidas. . . . . . . . 168
5.20. Matriz de confusión media del modelo SVM óptimo obtenido
con el Input A. . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.21. Matriz de confusión media del modelo SVM óptimo obtenido
con el Input B. . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.22. Matriz de confusión media del modelo SVM óptimo obtenido
con el Input PCA-A. . . . . . . . . . . . . . . . . . . . . . . . 169
5.23. Matriz de confusión media del modelo SVM óptimo obtenido
con el Input PCA-B. . . . . . . . . . . . . . . . . . . . . . . . 169
5.24. Resumen de los resultados de los modelos CART, MLP y SVM
para la predicción de la calidad de las placas de pizarra. . . . . 171
Capítulo 1

Introducción
2 CAPÍTULO 1. INTRODUCCIÓN
1.1. ANTECEDENTES Y OBJETIVOS 3

1.1. Antecedentes y objetivos


En las últimas décadas, países emergentes como China han irrumpido en
la escena mundial de los mercados, erigiéndose como productores cada vez
más competitivos y siendo una alternativa a tener en cuenta no sólo por su
coste, sino también por su calidad. En este escenario, el futuro de los siste-
mas de producción europeos se ha convertido en una preocupación en dicho
continente, y la mayor apuesta la constituyen las tecnologías con alto valor
añadido (Key Enabling Technologies, KETs), como analizan Brissaud et al.
en [37].

Según la Comisión Europea, estas KETs constituyen la base de la inno-


vación en un amplio abanico de productos en todos los sectores industriales,
siendo un objetivo prioritario en las políticas industriales a nivel europeo [70].
La Estrategia Europea para las KETs tiene el fin de incrementar la explo-
tación de estas tecnologías en la Unión Europea y revertir el declive de la
producción, estimulando el crecimiento y el empleo. A grandes rasgos, se
identifican seis KETs distintas: (1) micro y nanoelectrónica, (2) nanotecno-
logía, (3) biotecnología industrial, (4) materiales avanzados, (5) fotónica, y
(6) tecnologías de fabricación avanzada.

En consonancia con lo anterior, la inversión tanto pública como privada


en el desarrollo de bases de conocimiento en estas tecnologías, la investiga-
ción y desarrollo (I+D) y la producción de bienes que las incorporan se ha
multiplicado por diez desde la primera década del s. XXI [37].

Las nuevas tecnologías se muestran actualmente como una herramienta


para la mejora de las actividades económicas en Europa, como así lo demues-
tran las constantes inversiones de las empresas privadas en I+D. De hecho,
el diseño y la fabricación en Europa es uno de los focos estratégicos en el
mercado globalizado de hoy en día, y el desarrollo de nuevas tecnologías de
fabricación avanzadas es una prioridad para seguir siendo competitivos, ade-
más de para mejorar la relación de las organizaciones con las personas y el
medio ambiente [80]. La inteligencia que incorporan estas tecnologías permite
la elaboración de complejos productos, limpios y con elevado valor añadido,
todo ello en un proceso de evolución a nivel productivo que permite reducir
los tiempos de proceso, incrementar la productividad y abastecer al mercado
doméstico.

En lo que a sistemas de producción se refiere, estas tecnologías optimizan


el conjunto de diseño, procesado y servicio del producto, influyendo en los
4 CAPÍTULO 1. INTRODUCCIÓN

equipos, en su uso y en la organización de las fábricas. De este modo, los


sistemas de producción industrial se convierten en más ágiles, adaptables y
flexibles.

Además, las nuevas tecnologías no influyen solamente en el proceso de


producción a nivel producto, procesos y maquinaria, sino que el personal im-
plicado también se ve afectado a través de la reducción del estrés físico por
la introducción de robots, y la continua adaptación de los lugares de trabajo
a las necesidades del personal y de las tareas a desarrollar. Así, el bienestar
y la seguridad de los trabajadores se beneficia también de la evolución tec-
nológica de la industria.

En este amplio contexto industrial, el aprovechamiento de los recursos na-


turales, en este caso mediante técnicas mineras, juega un papel fundamental
en la sociedad moderna, ya que provee de materias primas básicas al resto de
la industria. Uno de los materiales naturales que más se ha empleado tradi-
cionalmente en construcción es la pizarra, ya que sus propiedades la dotan de
una gran resistencia a la degradación bajo condiciones atmosféricas, además
de ser impermeable con baja conductividad térmica, características ambas
que hacen de ella un óptimo recurso como material para techar.

El proceso de elaboración, que tradicionalmente se caracterizaba por ser


eminentemente manual, ha ido evolucionando en los últimos años y, a día de
hoy, la mayor parte de las etapas del proceso de elaboración de las placas de
pizarra dispone de una alternativa automatizada, implantándose maquinaria
en las naves de elaboración para reducir las tareas tradicionalmente manuales.

Sin embargo, la inspección y clasificación según su calidad comercial, una


de las últimas etapas del proceso, se continúa realizando de manera manual,
sin existir ningún sistema automático alternativo. En ella, un experto analiza
visualmente una a una cada placa y determina si son aptas para su comercia-
lización. La ejecución manual de esta tarea trae inevitablemente asociados los
inconvenientes del factor humano en labores repetitivas, como son la fatiga y
la inherente subjetividad presente en el criterio de decisión, además del coste
de formación de este personal cualificado [86].

Teniendo en cuenta lo anterior, el objetivo final de este estudio es la


construcción de un modelo de clasificación automática de placas de pizarra
por calidades comerciales que, dado el enfoque industrial del proyecto, sea
robusto en cuanto a su rendimiento. Dicho objetivo final se puede desgranar
en los siguientes objetivos parciales:
1.2. METODOLOGÍA 5

1. Diseñar un sistema de visión artificial portátil que mejore el prototipo


anterior.

2. Optimizar los algoritmos de visión utilizados en la detección de defectos


de la pizarra en base a las variables más importantes en este tipo de
aplicaciones industriales: robustez y tiempo.

3. Implementar el análisis de imágenes con librerías de visión específicas,


de robustez comprobada.

4. Introducir en el modelo la detección de los sulfuros de hierro presentes


en las placas.

5. Diseñar un modelo de clasificación de las placas objetivo.

1.2. Metodología
La investigación aquí presentada se puede definir como interdisciplinar,
ya que engloba distintas áreas científicas y tecnológicas que podemos resumir
en: minería, visión artificial y técnicas de inteligencia artificial. Partiendo de
un problema típicamente minero como es la clasificación de placas de pizarra
según sus características comerciales, se emplean técnicas de visión artificial
y de estadística avanzada (machine learning o aprendizaje automático) para
dar respuesta a dicha necesidad industrial.

Siguiendo esta idea, las fases de investigación se pueden resumir como


sigue:

1. Evaluación de las muestras disponibles por parte de varios


expertos. Inspección y caracterización de los defectos presentes en las
placas de pizarra de la muestra representativa de la variedad comercial
estudiada, construyendo la base de datos de partida para el modelo de
clasificación automática.

2. Definición física del nuevo sistema de visión. Mejora mecánico-


estructural del prototipo anteriormente desarrollado, sustituyendo las
cámaras 2D y 3D por una única cámara 3D a color. Adaptación de
las conexiones para una configuración del sistema portátil. Definición
del sistema de visión a incorporar al prototipo para la detección de
los sulfuros de hierro de las placas de pizarra, acorde con los últimos
avances tecnológicos en la materia.
6 CAPÍTULO 1. INTRODUCCIÓN

3. Implementación del software del nuevo sistema de visión. Op-


timización de los algoritmos de visión artificial utilizados en desarrollos
previos, incorporando al sistema librerías de visión artificial específi-
cas que aportan mayor potencia y robustez. Incorporación del nuevo
defecto: los sulfuros.

4. Desarrollo de los nuevos algoritmos de procesado de imágenes


para caracterizar las placas de pizarra. En el nuevo software,
implementación de los algoritmos de análisis de imagen para extraer la
información necesaria para caracterizar las placas de pizarra, en base a
la cual se realizará el proceso de clasificación.

5. Construcción de un modelo de clasificación. Empleando técni-


cas de aprendizaje automático y a partir de la muestra obtenida en
el primer paso, se desarrolló un modelo de clasificación de placas de
pizarra.

1.3. Estado del arte


La apariencia física de algunos materiales industriales puede ser un fac-
tor determinante en aquellos casos en que su valor estético sea elevado, como
puede ser el caso de las rocas ornamentales, la cerámica, la madera o la te-
la [86]. Habitualmente, la medida de esta apariencia visual se realiza de modo
manual, y en los últimos años se ha tratado de lograr una cuantificación ob-
jetiva de las propiedades de un material dado en base a las cuales un experto
humano asigna una determinada calidad o categoría.

El análisis manual del aspecto físico de los materiales es una tarea te-
diosa, prolongada, difícilmente reproducible y altamente subjetiva, por lo
que numerosas empresas están evolucionando de estas tareas manuales hacia
sistemas automáticos de visión artificial, capaces de proveer estándares de
calidad más altos, una mejor reproducibilidad y unos registros del producto
más fiables [86, 120].

En un mercado global a nivel mundial cada vez más competitivo, una


evaluación fiable y eficaz de la calidad del producto es un punto clave para
mantener unos estándares de calidad elevados y, por tanto, para el éxito de
una compañía. Es en este punto donde entran en juego las clasificaciones
automáticas mediante técnicas de visión artificial e inteligencia artificial.
1.3. ESTADO DEL ARTE 7

Los sistemas de visión artificial caracterizan la apariencia física del ma-


terial a partir del análisis de una imagen. Dicho análisis se centra principal-
mente en las propiedades de color, textura, contraste o brillo, dependiendo
de la aplicación concreta. Además, para completar la caracterización de un
producto es habitual añadir a las citadas propiedades superficiales sus singu-
laridades dimensionales, ya sean en dos o en tres dimensiones.

Según las necesidades concretas, los sistemas de caracterización automáti-


ca del aspecto de los materiales pueden aplicarse a varios tipos de problemas,
como la clasificación, la inspección superficial o la búsqueda de imá-
genes por contenido [201, 228].

En este caso, con clasificación nos referimos al proceso de agrupar los


productos en conjuntos con similar apariencia, lo que es habitual en las cade-
nas de suministro de materiales de construcción, por ejemplo. Establecidas
unas categorías de producto con unas ciertas singularidades físicas, el primer
paso será, dado un producto nuevo, extraer sus características visuales para
a continuación asignar la etiqueta correspondiente [136, 221].

La inspección superficial se ocupa de la detección de defectos superficiales


visibles en los materiales analizados, como venas, nudos, grietas o manchas.
Se trata de un problema de reconocimiento visual que constituye un reto y
está presente en varias etapas de los procesos de fabricación [234].

La búsqueda de imágenes por contenido (content–based image retrieval )


es uno de los campos de investigación más activos en la visión por compu-
tador, ya que el crecimiento de internet y el material multimedia dan pie a la
necesidad de realizar búsquedas no sólo textuales, sino también de contenido
multimedia (imágenes o sonidos) [71, 131].

Los sistemas de búsqueda se basan en los vectores de características que


describen el contenido de las imágenes, que suelen incluir como indicadores
fundamentales el color, la textura y las características de forma [228].

Es un tipo de problema habitual en medicina, por ejemplo, donde un


número enorme de imágenes de diferentes pruebas se realizan diariamente,
se analizan y posteriormente se almacenan, pudiendo ser interesante realizar
búsquedas posteriores en su contenido. Una recopilación de aplicaciones mé-
dicas de este tipo de tareas se puede encontrar en [161].
8 CAPÍTULO 1. INTRODUCCIÓN

Las aplicaciones de este tipo de sistemas de visión por computador en


la industria son innumerables, ya sea para la inspección de características
superficiales de los productos, para el conteo de piezas, para el control de
las dimensiones requeridas, etc. Así, por ejemplo, en el sector textil se han
empleado estos sistemas para detectar defectos en telas [1,45,50]; en la indus-
tria del acero se han desarrollado sistemas de inspección para la evaluación
de las características estructurales de sus productos [4, 118, 240, 243]; y en
el sector alimentario se han empleado para la detección de frutas en malas
condiciones [39], para su clasificación según grados de maduración [160] o
incluso para su recolección mediante robots [119, 133].

Si nos centramos en los sistemas de inspección y clasificación apli-


cados a recursos naturales, podemos hablar de (1) la madera, (2) los
productos cerámicos y (3) las rocas ornamentales (granito, mármol y piza-
rra).

(1) La madera presenta singularidades en cuanto a su color y a su tex-


tura por los nudos y vetas naturales que posee, y que determinan su valor
estético y de mercado. Dichas singularidades son analizadas visualmente por
operarios durante el proceso de elaboración de los productos madereros, pero
desde hace años varios trabajos han abordado el desarrollo de diversos siste-
mas automáticos para la evaluación de estos defectos y su clasificación según
características homogéneas [25, 53, 192].

(2) Los productos cerámicos presentan una problemática similar a la


de la pizarra: durante su proceso de fabricación se originan en los productos
finales una serie de defectos (relativos a su color, patrón de imagen, irre-
gularidades superficiales y dimensiones), que son evaluados en un control de
calidad por un experto humano y que definen en base a sus características di-
mensionales y de superficie una cierta categoría de producto comercial [120].
En la búsqueda de la optimización del proceso de fabricación, varios tra-
bajos han abordado la definición de un sistema de clasificación automáti-
co [33, 99, 122, 206].

(3) En lo que respecta a las rocas ornamentales, diversos trabajos se


pueden encontrar en la literatura sobre sistemas de visión aplicados a la in-
dustria del mármol, el granito o la pizarra. Todos tienen un denominador
común: es el valor estético del producto final, el cual depende de la presen-
cia de unos determinados defectos. Tradicionalmente la evaluación de tales
defectos la han hecho operarios experimentados manualmente, pero en las úl-
timas décadas han aparecido proyectos que tratan de automatizar esta etapa.
1.3. ESTADO DEL ARTE 9

Una vez se tienen las losas de mármol finales, la calidad de su color y tex-
tura, sus dimensiones, la calidad de su pulido y otras propiedades se deben
evaluar, pudiendo encontrar varios trabajos que se ocupan del control de los
defectos presentes en dichas losas. El color y la textura son los parámetros
principales empleados para la clasificación en las distintas calidades comer-
ciales [5, 13, 84, 154].

Un trabajo representativo de los disponibles en la literatura clasifica la


variedad de mármol conocida como Royal Peralto de Coreno en función de
su color y la cantidad y dispersión de fósiles y algas que se observan en su
superficie [46]. Se emplea para ello el análisis de la imagen en escala de grises
y la varianza de su histograma, así como el análisis de las componentes RGB
de la imagen a color para descartar aquellas losas cuyas características no
sean admisibles en una primera etapa del proceso de clasificación.

Algunos de estos trabajos emplean, tras el análisis de las imágenes para


la extracción de características de las losas de mármol, técnicas de aprendi-
zaje automático para su clasificación, como clustering jerárquico [8], redes
neuronales [196] o máquinas de vectores soporte [153].

En el caso del granito, una de las rocas más empleadas en construcción,


muchas son las variedades comerciales que se pueden encontrar, caracteri-
zadas básicamente por su color y textura (tamaño de grano). Esta roca no
presenta defectos estéticos propiamente dichos como sí lo hacen el mármol o
la pizarra, de modo que los sistemas de visión encontrados en la literatura se
centran en la clasificación según su aspecto, en cuanto a lograr una comer-
cialización de lotes homogéneos, fundamentalmente.

En el mercado del granito, un problema habitual es la controversia entre


clientes y proveedores relativa a la apariencia del producto, ya que en un
mismo lote pueden existir variaciones estéticas debido a la variabilidad na-
tural de la roca [26]. Para poner remedio a este problema los fabricantes han
implementado un procedimiento de inspección visual (mayormente manual).

Varios estudios han encarado la automatización de estos procesos en los


últimos años. En primer lugar, cabe citar el trabajo de Álvarez et al. [9], quie-
nes desarrollaron un motor de búsqueda de variedades de granito a partir de
sus imágenes, empleando para dicha búsqueda las características de color y
textura. El objetivo era diseñar un buscador–comparador de variedades de
granito capaz de, a partir de una imagen dada, encontrar la variedad a la que
10 CAPÍTULO 1. INTRODUCCIÓN

pertenece, para facilitar así la catalogación de las imágenes y la venta por


internet de estos productos. Para ello, analizaron un total de 30 variedades,
con imágenes propias y otras recopiladas de internet. Concluyeron que los
mejores resultados se obtienen combinando la información de color de los
tres canales RGB con la información relativa a la textura de la roca, calcu-
lada ésta a partir de su imagen en escala de grises.

En la misma línea que el trabajo anterior, Bianconi et al. [26] construye-


ron un sistema automático de clasificación que simula el criterio del experto
para diferenciar 12 variedades de granito a partir de sus características de co-
lor y textura. Emplearon para ello distintos clasificadores como Vecino Más
Cercano (Nearest Neighbourhood ), Promedio Más Cercano (Nearest Mean
Classifier ), Naive Bayes, clasificación lineal (Linear classifier ) y las Máqui-
nas de Vectores Soporte para clasificación (Support Vector Classifier ), siendo
este último el algoritmo que mejores resultados ofreció.

Debe tenerse en cuenta, sin embargo, que ambos trabajos [9, 26] asumen
que las condiciones de iluminación y escala en que se toman las imágenes de
las rocas son siempre las mismas, dada la influencia que tiene sobre el color
una iluminación variable. Así, los autores advierten de que la precisión de la
clasificación puede descender drásticamente en presencia de una iluminación
variable [26].

En una línea algo diferente, la clasificación de granito se ha analizado


también a partir de los datos obtenidos con un espectrofotómetro [14, 137].
En [137], la información de color de la roca se recogió con el espectrofotó-
metro, obteniendo el espectro correspondiente. A partir de un proceso de
suavizado (smoothing), los espectros de color registrados se convierten en
funciones que constituyen la base de datos. De este modo, la caracterización
y clasificación de las variedades de granito se llevan a cabo desde un enfoque
funcional.

Con respecto a la pizarra, a día de hoy apenas existen estudios que traten
la clasificación de las placas de pizarra naturales mediante sistemas de visión
artificial (sistemas que combinan herramientas de software y hardware con
la finalidad de obtener, procesar y analizar cualquier información obtenida a
través de cámaras digitales).

En trabajos previos, un primer antecedente del estudio de la calidad de


las pizarras se puede consultar en [213], donde, con técnicas estadísticas, se
definió un índice de calidad aplicable a los testigos de los sondeos practicados
1.3. ESTADO DEL ARTE 11

para la exploración de un yacimiento. En un siguiente paso, la evaluación de


la calidad de los bloques de pizarra se ha tratado en [15], donde se emplearon
distintas técnicas de aprendizaje automático para definir un índice de calidad
ornamental objetivo. Sin embargo, tales trabajos abordan etapas anteriores
a la de la evaluación final de la calidad de las placas en la nave de elaboración.

La inspección de su superficie y la clasificación por calidades de pizarras


pintadas se ha estudiado en varios trabajos de investigación [44, 82, 83]. En
ellos, el sistema desarrollado se centra en la inspección de las placas de piza-
rra a la salida de la línea del proceso de pintado. Sin embargo, no se analiza el
material natural sino la pizarra pintada. El sistema de visión se compone de
una cámara monocromo lineal y una iluminación de luz colimada. Este siste-
ma se conecta al PC, en el que se reciben las imágenes y se analizan con un
algoritmo de inspección. La textura de las placas pintadas se analiza a partir
de la luz reflejada en las mismas y capturada por el sensor de la cámara, y
se analizan las características geométricas de la placa, la localización de los
orificios en ella practicados para su posterior instalación, la homogeneidad
de la capa de pintura aplicada y los posibles defectos en dicha capa. Estos
últimos dos aspectos son el objetivo esencial de su sistema: analizar no la
superficie y características de la pizarra natural, sino la superficie pintada
resultante del proceso industrial de aplicación del pigmento.

El análisis de los defectos naturales presentes en las placas de pizarra se


aborda en los trabajos de López et al. [138, 139], cuyo objetivo final es la
caracterización según su calidad comercial. El sistema desarrollado se define
como un híbrido 2D–3D láser escáner, que con dos cámaras recoge las imáge-
nes de las placas para su análisis y clasificación según su calidad comercial.
En este caso, las placas se hacían pasar por debajo de una cámara lineal
2D (que recoge la imagen monocroma) y un láser escáner 3D (que recoge la
información de la tercera dimensión).

En dicho trabajo, la clasificación automática de la pizarra se realizó me-


diante técnicas de aprendizaje automático supervisadas y no supervisadas,
cuyos resultados se presentaron en [152], en una investigación que dio lu-
gar a la proposición de un nuevo algoritmo de clasificación basado en las
SVM [151]. Finalmente, el sistema híbrido 2D–3D completo y los resultados
obtenidos se presentan en [150].

Este sistema híbrido 2D–3D láser escáner es el punto de partida del pre-
sente estudio. Con la combinación de los equipos descritos se logró analizar
las características dimensionales de las placas de pizarra y la presencia de
12 CAPÍTULO 1. INTRODUCCIÓN

irregularidades superficiales y carbonatos, pero se trata de un análisis in-


completo: por tratarse de cámaras monocromas no se realizaba el registro de
información de color, con lo que los sulfuros presentes en las placas no po-
dían ser detectados. Este punto es la principal aportación de este proyecto:
al incorporar una cámara 3D de color, a la información que se recogía ante-
riormente se le añade el color, lo que posibilita una caracterización completa
de los principales defectos de las placas de pizarra y su posterior clasificación
por calidades.

En comparación con la primera versión del sistema, que data de 2010, a la


mejora del sistema de visión por el cambio de los sensores empleados hay que
añadirle la modificación de dos aspectos principales: por una parte, el análi-
sis de las imágenes se realiza con un nuevo software de visión industrial que
proporciona más control sobre los algoritmos empleados; y por otra parte,
esta nueva versión dispone de una caja de conexiones portátil de reducidas
dimensiones que centraliza el cableado del sistema y facilita su traslado e
instalación en una nueva ubicación.

1.4. Aportaciones científicas


Fruto de este proyecto de investigación han surgido numerosas aportacio-
nes científicas en forma de artículos científicos, comunicaciones en congresos
y un modelo de utilidad. A continuación se presentan de manera resumida
las principales contribuciones.

Las publicaciones comprenden no sólo la investigación de los datos de


las placas de pizarra, sino también de otros campos de conocimiento, siendo
el denominador común la aplicación de las técnicas de inteligencia artificial
con el fin de validar los modelos de clasificación y testar así su eficacia.
La finalidad de estos Así, los diversos trabajos dieron lugar a las siguientes
publicaciones (Fig. 1.1):

1. Martínez J, Iglesias C, Matías JM, Taboada J, Araújo M. Solving the


slate tile classification problem using a DAGSVM multiclassification al-
gorithm based on SVM binary classifiers with a one-versus-all approach.
Applied Mathematics and Compututation 2014;230:464–72. Se presen-
ta un nuevo algoritmo para problemas de clasificación basado en las
SVM, que se valida con los datos de las placas de pizarra de la tesis de
Javier Martínez [150].
1.4. APORTACIONES CIENTÍFICAS 13

2. Iglesias C, Martínez Torres J, García Nieto PJ, Alonso Fernández JR,


Díaz Muñiz C, Piñeiro JI, Taboada J. Turbidity Prediction in a River
Basin by Using Artificial Neural Networks: A Case Study in Northern
Spain. Water Resources Management 2014;28(2):319–31. Se analizan
los datos de calidad de las aguas recogidos en una estación del río Nalón
(Asturias) para predecir una de las variables medidas, la turbidez, a
partir de las restantes. Se emplean para ello las redes neuronales.
3. Anjos O, Iglesias C, Peres F, Martínez J, García Á, Taboada J. Neural
networks applied to discriminate botanical origin of honeys. Food Che-
mistry 2015;175:128–36. Se desarrolla una herramienta basada en las
redes neuronales para predecir el origen botánico de distintas varieda-
des de miel a partir de sus parámetros físico-químicos.
4. García Á, Anjos O, Iglesias C, Pereira H, Martínez J, Taboada J. Pre-
diction of mechanical strength of cork under compression using machine
learning techniques. Materials & Design 2015;82:304–11. En este tra-
bajo se aplicaron distintas técnicas matemáticas (regresión lineal múl-
tiple, clustering, árboles de decisión y redes neuronales) para predecir
las principales propiedades mecánicas a compresión del corcho a partir
de sus propiedades físicas.
5. Iglesias C, Anjos O, Martínez J, Pereira H, Taboada J. Prediction of
tension properties of cork from its physical properties using neural net-
works. European Journal of Wood and Wood Products 2015;73(3):347–
56. En un estudio similar al anterior, las redes neuronales se emplearon
para predecir las características mecánicas del corcho bajo esfuerzos de
tracción. Las variables de entrada de las redes son, nuevamente, sus
propiedades físicas.
6. Iglesias C, Santos A, Martínez J, Pereira H, Anjos O. Influence of
Heartwood on Wood Density and Pulp Properties Explained by Ma-
chine Learning Techniques. Forests 2017;8(20):1–10. Varias técnicas
matemáticas (regresión lineal múltiple, árboles de decisión, redes neu-
ronales y SVM) se usaron para modelar los datos de las propiedades
de una pulpa de origen forestal y predecir sus propiedades conociendo
la composición del material antes del tratamiento y la posición de las
muestras en el árbol originario.
7. Iglesias C, Martínez J, Taboada J. Automated vision system for quality
inspection of slate slabs. Computers in Industry. En proceso de revisión
a mayo de 2017. Se presenta el sistema de visión artificial y los códigos
de inspección de defectos desarrollados en este estudio.
14 CAPÍTULO 1. INTRODUCCIÓN

Asimismo, se citan las aportaciones a congresos nacionales e interna-


cionales (Fig. 1.2):

1. J Martínez, C Iglesias, JM Matías, J Taboada. DAGSVM multiclass


algorithm based on SVM binary classifiers with 1vsAll approach to the
slate tile classification problem. En el congreso Mathematical Mode-
lling in Engineering & Human Behaviour 2012 celebrado en Valencia
(España) del 4 al 7 de septiembre de 2012.

2. C. Iglesias, J. Martinez, P J. Garcia, J. R. Alonso, C. Díaz, J. l. Piñei-


ro, J. Taboada. Study of water quality in the Nalón river basin (NW
Spain) from the turbidity estimation using artificial neural networks.
En la International Conference on Approximation Methods and Nume-
rical Modelling in Environment and Natural Resources (MAMERN’13)
celebrada en Granada (España) del 22 al 25 de abril de 2013.

3. C Iglesias, O Anjos, J Martínez, F Perez, Á García, J Taboada. Apli-


cación de redes neuronales en la determinación de origen botánico de
miel a partir de sus propiedades físico-químicas. En el III Congresso
Ibérico de Apicultura celebrado en Mirandela (Portugal) del 13 al 15
de abril de 2014.

4. C Iglesias, AJ Santos, J Martínez, H Pereira, O Anjos. Influence of


heartwood on pulp properties explained by machine learning techni-
ques. En el congreso internacional Wood QC 2016 celebrado en Quebec
(Canadá) del 12 al 17 de junio de 2016.

Por último, el proyecto de investigación ha dado lugar también a la con-


cesión de un Modelo de Utilidad que protege el sistema de visión desarro-
llado. Bajo el número de publicación ES1093606, se concede a la Universidad
de Vigo el Modelo de Utilidad titulado “Sistema para la caracterización de
placas de pizarra”, siendo los inventores Javier Taboada Castro, Carla Igle-
sias Comesaña, Javier Martínez Torres, José Antonio Vilán Vilán y Marcos
López Lago (Fig. 1.3).
1.4. APORTACIONES CIENTÍFICAS 15

Figura 1.1: Portadas de los artículos científicos publicados relacionados con


este estudio.
16 CAPÍTULO 1. INTRODUCCIÓN

Figura 1.2: Congresos científicos en los que se han presentado trabajos rela-
cionados con este proyecto.

Figura 1.3: Modelo de Utilidad concedido.


1.5. LÍNEAS FUTURAS DE INVESTIGACIÓN 17

1.5. Líneas futuras de investigación


Una vez finalizadas las etapas de este estudio, y tomando como referencia
el sistema desarrollado y su desempeño, quedan abiertas las siguientes líneas
de investigación:

1. Implantación del sistema de visión artificial e inteligencia artificial en


una línea de producción real de pizarra. Supondría el paso definitivo
del proyecto e implicaría el ajuste a nivel físico del sistema desarrollado
a la línea de producción real. A la salida del sistema de visión debería
incorporarse algún tipo de sistema mecánico que derivara las placas en
una dirección u otra en función de la salida del modelo de clasificación
implementado.

2. Optimización del sistema de visión artificial, testando distintas fuentes


de iluminación que mejoren el input del software de análisis de defectos.

3. Optimización de los códigos de inspección y detección de defectos en


las placas. En consonancia con el punto anterior, si los componentes
físicos del sistema (iluminación, cámaras,...) se modifican, sería preciso
ajustar los códigos desarrollados a los nuevos datos adquiridos.

4. Implantación y desarrollo de una interfaz completa de extremo a extre-


mo para el proceso de clasificación por calidades de las placas. Dicha
interfaz estaría enfocada al empleo del sistema clasificador por parte
de un usuario no experto, quien proporcionaría al sistema una placa y
obtendría directamente la calidad asignada.
18 CAPÍTULO 1. INTRODUCCIÓN
Capítulo 2

La pizarra. Industria y
caracterización
20 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN
2.1. LA INDUSTRIA PIZARRERA ESPAÑOLA 21

2.1. La industria pizarrera española


Las sustancias minerales se suelen clasificar según sus posibilidades de uso
en: productos energéticos, minerales metálicos, minerales industriales (no me-
tálicos ni energéticos), roca ornamental y otros productos de cantera (cuya
utilización principal se da en el sector de la construcción). Según la Estadísti-
ca Minera más reciente, en España la producción de minerales fue en 2014 de
3.017 Me, de los cuales el 13 % correspondió a las rocas ornamentales [157].
Cabe señalar que el sector extractivo se ha resentido de la crisis económica
que se inició en 2007, como no podía ser de otra manera, mostrando sus
cifras de negocio continuos descensos interanuales desde entonces y hasta el
periodo 2011–2013, en que parece estabilizarse, para sufrir nuevamente un
descenso en 2014 (Fig. 2.1).

En España, las rocas ornamentales extraídas son alabastro, arenisca, cali-


za, cuarcita, granito, mármol y pizarra. De ellas, algo más del 50 % del valor
de la producción de rocas ornamentales en España se atribuye a la pizarra,
en unas cifras globales que mostraron un ascenso en 2013 tras varios años
consecutivos de reducción del valor global de la producción de rocas ornamen-
tales, y que nuevamente registraron un retroceso en 2014. Según el valor de
la producción de rocas ornamentales, las principales comunidades autónomas
son Galicia (pizarra y granito), Comunidad Valenciana (caliza marmórea) y
Castilla y León (pizarra) [157].

En el caso de la pizarra, en 2014 se extrajeron 709.289 t con un valor


de 185.373.760e, de los cuales cerca de 496.000 t se exportaron (el 70 % en
peso), en su mayor parte como pizarra elaborada (el 96,9 %) y una mínima

Figura 2.1: Valor de la producción minera total en España en el periodo


2009–2014. Fuente: [157].
22 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Figura 2.2: Evolución de los tonelajes producidos, exportados e importados


de pizarra en España en el periodo 2001–2014. Elaborado a partir de [218].

parte en bruto [157, 218]. El valor de las exportaciones en dicho año se cifró
en 8.331.840epara la pizarra en bruto o desbastada, por 258.088.270epara
la pizarra elaborada, representando un valor total de las exportaciones de
266.420.110e [218].

Las cifras muestran el carácter eminentemente exportador de España co-


mo productor de pizarra ornamental, con unas cifras que, a pesar de haber
sufrido recaídas durante el periodo de recesión económica, se mantienen en
unas cifras relativamente estables de producción y exportación desde hace
años (Fig. 2.2). La pizarra importada representa un porcentaje reducido de
manera sistemática.

Teniendo en cuenta estas cifras, este proyecto se centra en uno de los


recursos mineros de mayor importancia en España y, especialmente, en el
noroeste del país: la pizarra. Su buena fisilidad e impermeabilidad son las
propiedades básicas que hacen de ella un recurso de elevado valor económico,
empleando la de mayor calidad como elemento para cubiertas y, cuando el
grano es mayor y las placas obtenidas son más gruesas, destinándola a reves-
timientos y solados. En cuanto a sus cifras, tras varios años de recesión, en
2014 había un total de 106 explotaciones de pizarra ornamental responsables
de algo más de 2.500 empleos directos, de los cuales la mayor parte se hallan
en Galicia (52 explotaciones, casi 1.800 empleos directos) y Castilla y León
(35 explotaciones, algo más de 700 empleos directos), cifras que ponen de
manifiesto el peso de este sector industrial en la economía de ambas regiones.

Las explotaciones de pizarra se localizan principalmente en las siguientes


zonas: O Barco de Valdeorras (provincia de Ourense), Cabrera (provincia de
2.1. LA INDUSTRIA PIZARRERA ESPAÑOLA 23

León, colindante con O Barco de Valdeorras), O Caurel (en el vértice de las


provincias de Ourense, Lugo y León), A Terra Chá (Lugo), Monte Rande (A
Coruña), El Bierzo (León), Los Oscos (en el límite entre Lugo y Asturias),
Aliste (Zamora), Bernardos (Segovia) y Villar del Rey (Badajoz).

Actualmente, prácticamente todas son explotaciones a cielo abierto, exis-


tiendo tan sólo 3 subterráneas en activo: Villamartín, A Fraguiña en Carba-
lleda de Valdeorras y La Campa en Folgoso do Courel. La primera de ellas
se explota en cámaras de 18 m de ancho, de hasta 25 m de alto y longitudes
desde los 200 m, mientras que la segunda (A Fraguiña) es la mina de pizarra
más grande del mundo, explotada mediante minería subterránea desde 1990.

Hasta la comercialización de las placas de pizarra, este recurso sigue un


proceso de extracción y elaboración que consta de varias etapas resumidas en
la Figura 2.3. Comenzando en la cantera, el proceso se inicia con la extracción
de los bloques o rachones de un tamaño mínimo determinado, independizán-
dolos del resto del macizo mediante diversos métodos.

Hace años, el arranque se basaba en técnicas manuales o semi-mecanizadas


(martillos neumáticos, cuñas, etc.), aprovechando las superficies de debilidad
de la pizarra y las fracturas existentes o provocadas para tal fin. Posterior-
mente, la pólvora negra de mina permitió aumentar la productividad al crear
fracturas artificiales que facilitaban el arranque mediante medios mecánicos,
empleando el cazo de palas o excavadoras. Sin embargo, la introducción de
sistemas alternativos de corte en banco posibilitó el incremento de los ren-
dimientos en cantera y nave, desplazando el uso de la pólvora negra, que
provocaba un mayor daño en el macizo.

El corte con hilo diamantado, que es actualmente la técnica más em-


pleada, es un sistema mediante el que se introduce en el macizo un hilo
diamantado que se hace girar gracias a un bastidor montado sobre carriles,
cortando el material rocoso e independizando así partes del macizo de las
cuales se extraen posteriormente los rachones (primera etapa de la Figura
2.3).

Tras la creación de dicho plano de corte por cualquiera de los métodos


citados, una práctica habitual en las canteras de pizarra es la separación de
los rachones del macizo mediante medios mecánicos, aprovechando los planos
de pizarrosidad propios del material. De este modo, se emplean cuñas o el
cazo de la excavadora para separar el rachón según se muestra en la primera
etapa de la Figura 2.3.
24 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

-./#$))0+,'%"('#$)*+, !"##$%&'%"('#$)*+,

-.6&(0$)0+,'7$,8$('%"'(&2'
1&#/"' %"'($2'3($)$2'
9(&:8"2

1($2060)$)0+,'2";<,')$(0%$%

4$("/05$%&

Figura 2.3: Esquema del proceso de extracción y elaboración de la pi-


zarra hasta la obtención de las placas comerciales. Imágenes tomadas de
www.cafersa.com y www.pizarrascampo.es
2.1. LA INDUSTRIA PIZARRERA ESPAÑOLA 25

Una vez extraído, el rachón se transporta a la nave de elaboración, que


con frecuencia se localiza en los terrenos de la propia explotación. Si es nece-
sario, antes de entrar en la nave se procede a dividir nuevamente con medios
mecánicos los rachones de grandes dimensiones hasta que sus medidas sean
las adecuadas, aprovechando para ello los planos de pizarrosidad.

Después de este exfoliado primario, los rachones de espesor adecuado se


introducen en la nave para su serrado con sierras de disco, cuyo diámetro
condiciona el espesor máximo de los rachones, en un proceso que se ha au-
tomatizado en las instalaciones modernas (segunda etapa de la Figura 2.3).
El resultado del serrado son los llamados tochos, bloques paralelepipédicos
cuyas dimensiones en una de sus caras son cercanas a las de las plantillas
comerciales de las placas finales.

El exfoliado final de los tochos (o labrado) permitirá la obtención de


las placas de pizarra de espesores milimétricos, procediendo a la separación
de dichas placas por sus planos de pizarrosidad manualmente con uñetas y
mazas (tercera etapa de la Figura 2.3) o con máquinas automáticas que re-
cientemente se están introduciendo en la industria pizarrera. Dependiendo
del mercado de destino, las placas deberán tener un espesor u otro: por ejem-
plo, 3 mm para Francia y entre 4 y 6 mm para las cubiertas alemanas.

Una vez se tienen las placas de espesores comerciales y dimensiones lige-


ramente mayores de las buscadas, se procede a darles las dimensiones finales
según la plantilla pertinente en las máquinas troqueladoras (cuarta etapa de
la Figura 2.3 y Fig. 2.6). Existe una amplia variedad de plantillas, con distin-
tas formas y tamaños de placa, para responder a las demandas del mercado
(Fig. 2.6).

El proceso de elaboración finaliza con la clasificación de las placas según


su calidad comercial y su empaquetado en palets para su posterior comercia-
lización (últimas dos etapas de la Figura 2.3).

La caracterización de las placas de pizarra en las distintas calidades se


basa en la observación de la presencia o ausencia de una serie de defectos es-
téticos y superficiales, que hacen que el material sea de mejor o peor calidad
(y por tanto mayor o menor valor comercial), o pueden incluso hacer que no
sea vendible por sus pésimas características que impedirían su instalación y
adecuado comportamiento como material para techar.
26 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Esta calidad comercial se dictamina siguiendo un criterio que depende


del mercado al que se destine el producto, siendo ligeramente diferentes las
exigencias a nivel estético, fundamentalmente, según el país de destino.

2.1.1. Mercado de la pizarra española


Las características de la producción y comercialización de la pizarra en
España han sido exhaustivamente estudiadas por Cárdenes et al. en [43],
quienes reunieron las exigencias de los principales mercados mundiales, es-
pecialmente europeos, en dicha publicación. A continuación se resumen los
rasgos fundamentales de tales mercados.

Las cifras a nivel mundial pertenecientes al mercado de la pizarra en el


año 2011 (Fig. 2.4 [42]) indican, a grandes rasgos, que España es el expor-
tador líder, seguido de China y Brasil tanto en valor como en peso, aunque
en el caso de considerar las exportaciones en peso la diferencia entre España
y China es menor (gráficas 1 y 2, Fig. 2.4). Entre los países importadores,
por su parte, Francia está a la cabeza, seguida de Reino Unido, Alemania y
Estados Unidos.

Figura 2.4: Características del mercado mundial de la pizarra en 2011: impor-


taciones y exportaciones en (1) millones de dólares, (2) en miles de toneladas,
(3) precio de venta en dólares por tonelada y (4) precio de compra en dólares
por tonelada [42]. Tomado de: http://roofingslates.wordpress.com
2.1. LA INDUSTRIA PIZARRERA ESPAÑOLA 27

Figura 2.5: Exportaciones de pizarra manufacturada en 2015 [218].

Los principales destinos de la pizarra exportada en España son Reino


Unido (además de demandar pizarra elaborada, es el principal comprador de
producto bruto), Francia (sobre todo, producto manufacturado), Bélgica y
Alemania. La Figura 2.5 muestra la distribución en tonelaje de la pizarra de
techar exportada durante 2015 [218].

Analizando los precios de venta, la pizarra española tiene un valor de


venta menor que la media, aunque superior al de sus competidores directos
(China y Brasil) (gráfica 3, Fig. 2.4). Dichos países, además, compran poca
pizarra pero a un precio muy elevado, como se observa en la gráfica 4 de la
Figura 2.4.

Francia
Se trata del principal mercado de la pizarra de nuestro país, siendo las zo-
nas de Normandía, Bretaña, Pirineos y la zona centro donde más se emplean
como elemento para techar. Las dimensiones más demandadas son 32x22
(32 cm de largo y 22 cm de ancho, con forma rectangular), y los mayores
problemas para comercializar las placas suelen deberse a razones estéticas
(alteraciones u oxidaciones), además de los defectos en su fabricación. Admi-
ten, sin embargo, primera, segunda y tercera calidad.

Antes de la entrada en vigor del marcado CE, el país vecino tenía sus pro-
pias normas para certificar la idoneidad de la pizarra, la AFNOR P-32301
y la AFNOR P-32302, siendo el Laboratorio Nacional de Ensayos (LNE) el
organismo encargado de su verificación.

La primera de dichas normas era obligatoria para la comercialización


de pizarra para techar en Francia, mientras que la segunda era de carácter
28 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Figura 2.6: Formatos y dimensiones de las placas de pizarra comercializadas


habitualmente. Fuente: http://clusterdapizarra.com.

informativo y clasificaba la pizarra en A, B o C según los resultados obtenidos


en una serie de ensayos (densidad, espesor, resistencia a la flexión, resistencia
al hielo, absorción de agua, contenido en sulfuros de hierro y contenido en
carbonatos).

Alemania
Otro de los mercados tradicionales de la pizarra española, más exigente
en general en cuanto a calidad que el francés. El espesor mínimo demandado
es de 5 mm, por los 3 mm de Francia, y sus formatos característicos son los
tipo Schuppen y media luna (Fig. 2.6), que se emplean en Alemania y zonas
fronterizas de los países que lindan con los germanos.
2.1. LA INDUSTRIA PIZARRERA ESPAÑOLA 29

En este caso, las oxidaciones que puedan presentar las placas no reciben la
misma importancia que en otros países. Las antiguas normas DIN tenían ca-
rácter informativo y no era obligatoria la realización de ensayos para emplear
la pizarra en tierras bávaras.

Benelux: Holanda, Bélgica y Luxemburgo


En estas tres naciones el consumo de pizarra es desigual: mientras que en
Holanda se emplea fundamentalmente para la restauración de monumentos
de su patrimonio y no es un gran consumidor, en Bélgica y Luxemburgo se
comercializan de manera estable anualmente considerables volúmenes y cali-
dades de nuestra pizarra.

En estos dos últimos se emplea tradicionalmente el formato 35x25 de 4-5


mm de espesor, habitualmente de primera calidad. Las quejas habituales se
deben a la presencia de oxidaciones, a defectos en el acabado o al alabeo de
las placas, y se prefieren los tonos grises a los negros.

Antiguamente, las pizarras debían estar homologadas por la norma STS


para su instalación en edificios públicos, pero no era un requisito para su
comercialización.

Reino Unido
Es habitual el uso de pizarra en todo el territorio, demandando plantillas
de gran tamaño como 50x25 y 60x30, por lo que las exportaciones desde Es-
paña son menores que a los otros países. Al igual que en el caso de Alemania,
se valora especialmente la planicidad de las placas, no siendo tan importante
la presencia de oxidaciones, y se comercializan todas las calidades.

La norma seguida antiguamente era la BS-680, aunque sus resultados no


se consideraban del todo fiables por la metodología de ensayos seguida, ya
que cada productor o comerciante era el encargado de enviar sus muestras al
laboratorio.

España
En nuestro país, principal productor a nivel mundial y gran exporta-
dor, las importaciones son tradicionalmente escasas, anecdóticas incluso. Las
regiones que más pizarra consumen son el noroeste (Galicia y León), pero
también las zonas de montaña como la sierra madrileña o los Pirineos.
30 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

La demanda habitual comprende los formatos pequeños, aunque en los


últimos años se empezó a emplear también el 30x20 por su mayor rendimiento
en la colocación en obra. Las calidades consumidas son en muchas ocasiones
segunda y tercera, y tradicionalmente no se exigía homologación para la
pizarra, sino que se establecía un acuerdo al adquirirla entre el cliente y el
proveedor.

Fuera de Europa: EE. UU., Japón, China, Brasil


En Estados Unidos se consume pizarra proveniente de algunas canteras
locales, así como de Canadá, siendo un mercado con una gran capacidad
para adquirir pizarra española pero con el hándicap de que falta personal
colocador cualificado, lo que entorpece la entrada de nuestro producto en
dicho país. Se suelen demandar los formatos intermedios, 40x25, 40x20 y en
algunas zonas los formatos grandes, de 50x25 y mayores, con un espesor de
al menos 5 mm.

En cuanto a Japón, la pizarra española está muy bien considerada y se ha


empleado en algunas grandes obras como recubrimiento para muros y facha-
das. El mejor ejemplo es el Shizuoka Convention and Arts Center de Osaka
(Fig. 2.7), en el que se empleó la pizarra Verde Pol lucense.

Figura 2.7: Shizuoka Convention and Arts Center en Osaka, con cubierta de
pizarra verde de Lugo. Fuente: http://www.granship.or.jp.

Dos países que merecen ser mencionados también son Brasil y China, ya
que ambos cuentan con reservas de pizarra y son exportadores. En el caso del
país carioca, la gama de colores de su pizarra es más amplia que en España,
lo que las sitúa en una posición competitiva en el mercado.
2.2. GEOLOGÍA DE LA PIZARRA ESPAÑOLA 31

China, por su parte, es un buen consumidor y goza de yacimientos aptos


para su explotación, aunque el nivel de desarrollo de su minería aún es preca-
rio. Hasta el momento, la pizarra proveniente del país asiático se caracteriza
por una calidad desigual y defectos de fabricación, pero en los últimos años
está experimentando una mejoría y llegará a ser un productor plenamente
competitivo.

2.2. Geología de la pizarra española


La pizarra es una roca metamórfica de bajo o muy bajo grado de meta-
morfismo, formada a partir de una roca pelítica. La pelita original sufre una
serie de fenómenos tectónicos regionales que alteran las condiciones termodi-
námicas existentes, desembocando en unos cambios a nivel mineral, textural
y estructural que dan lugar a la pizarra.

A nivel mineralógico, la composición de las pizarras de techar presenta


cierta variabilidad, pero como minerales esenciales se señalan la clorita, el
cuarzo y la sericita, siendo accesorios el rutilo, feldespatos, carbonatos, clo-
ritoide, arcillas, moscovita, grafito, biotita, turmalina, sulfuros de hierro o
circón. La textura lepidoblástica que da lugar a la fisilidad de la pizarra se
debe a la orientación subparalela de los filosilicatos, así como a la presencia
de porfidoblastos.

La orogenia varisca o hercínica que tuvo lugar al final del Paleozoico es


la responsable de la formación de las montañas y cordilleras europeas, siendo
el Macizo Ibérico (también llamado Macizo Hespérico o Macizo Hercínico)
la sección de la península ibérica. Varios autores han estudiado la geolo-
gía del Macizo Ibérico y han propuesto su división en distintas zonas según
sus características estructurales, estratigráficas, metamórficas y magmáticas.
Como consecuencia de los sucesivos estudios, estas divisiones han ido evo-
lucionando a lo largo de los años. Según la división inicialmente propuesta
por Lotze [142], modificada por Julivert et al. [116], la pizarra objeto de este
estudio pertenecería a la Zona Asturoccidental-leonesa (ZAOL), aunque pos-
teriores modificaciones de estas divisiones hacen que se enmarque en la Zona
Centroibérica (ZCI) [47,72]. La Figura 2.8 muestra la localización de la zona
de estudio según dicha división modificada.

En contraposición con lo anterior, Fernández [73] ubica esta región den-


tro del dominio de Truchas, perteneciente a la rama sur de la ZAOL, y cuyo
límite al norte sería la falla denominada Villavieja, y lo correlaciona con el
32 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Figura 2.8: División en zonas del Macizo Ibérico en el noroeste peninsular


[47, 72, 116]. Fuente: [188].

Cabalgamiento Basal del Manto de Mondoñedo al noroeste. Por su parte,


Heredia et al. [97] lo correlaciona con la Falla del Morredero. El límite sur
del dominio de Truchas es el contacto con la Formación Ollo de Sapo.

Históricamente, dicha región del dominio de Truchas ha sido una impor-


tante región de extracción de pizarras de techar [187]. A nivel geológico, en
el sinclinal de Truchas se han establecido distintas divisiones y límites, por
lo que se emplea una variedad de nomenclaturas resumidas en la Figura 2.9.

A nivel estratigráfico, el sinclinal de Truchas se caracteriza por tener una


escasa variedad de litologías en materiales del Ordovícico y Silúrico. Predo-
minan las pizarras con un contenido arenoso variable y ocasionales niveles
carbonatados alternados con cuarcitas. Tectónicamente, se trata de una es-
tructura varisca que tiene pliegues menores asociados y en general con pocos
cabalgamientos. De hecho, se considera localizado en una sola lámina cabal-
gante durante la fase principal de deformación, sin desplazamientos signifi-
cativos a posteriori. Muestra, además, en el borde sureste un cierre periclinal
abierto hacia el noroeste, con trazas paralelas a las estructuras del arco As-
túrico en la Zona Cantábrica y en la Zona Asturoccidental-leonesa en los
bordes norte y sur, respectivamente.
2.2. GEOLOGÍA DE LA PIZARRA ESPAÑOLA 33

Figura 2.9: Distintas nomenclaturas dadas a la estructura del Sinclinal de


Truchas por los autores que lo han estudiado. Fuente: [188].

Siguiendo la Figura 2.9 y siguiendo los trabajos de Barros [18], Barba et


al. [17], Sarmiento et al. [194] y Fernández [73], desde el punto de vista es-
tratigráfico, en el sinclinal de Truchas se distinguen, de muro a techo, varias
secuencias pelítico-arenosas datadas en el Ordovícico y Silúrico [188]:

Pizarras de los Montes: son pizarras grises y negras de escasa potencia,


con intercalaciones arenosas y un nivel de cuarcitas o conglomerados
hacia su base. Su potencia oscila entre los 200 y los 600 m.
Cuarcita Armoricana: se trata de cuarcitas blancas masivas y areniscas
con huellas fósiles, en facies armoricana y con intercalaciones de mate-
riales pizarrosos de escasa potencia. La potencia total es de unos 300
m.
Pizarras de Luarca: constituidas por una sucesión monótona de pizarras
grises y negras con ocasionales intercalaciones centimétricas de arenis-
cas y materiales vulcanosedimentarios. El espesor máximo individual
es de 30 m. El techo de esta formación se define localmente por una
brecha ferruginosa de 0,5-2m de espesor. La potencia de la formación
oscila entre 180 y 300 m.
Formación Casaio: es una serie arenoso-cuarcítica que se alterna con
niveles pizarrosos y lentejones calcáreos esporádicos con un espesor de
0-3m (calizas del Trigal ). Se corresponde con los materiales de la serie
que se halla a techo de las Pizarras de Luarca, es decir, equivale al
miembro inferior de la Formación Agüeira y al Miembro Casaio [149,
176]. La potencia varía desde los 400 m en el flanco norte hasta los 150
m en el flanco sur y oeste.
34 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Formación Rozadais: se trata del miembro medio de la Formación Agüei-


ra y está principalmente constituida, de muro a techo, por 15-20 m de
pizarras con abundantes laminaciones arenosas y sulfuros metálicos, 40
m de pizarras gris oscuro-negro de grano fino y laminaciones arenosas,
y cuarcitas en bancos de espesor centimétrico-decimétrico. A techo de
dicho nivel, cuya potencia oscila entre los 5 y los 8 m, se encuentran
5 m de pizarras con laminaciones arenosas y otros 20 m de pizarras
limolíticas con ocasionales cantos de caliza o areniscas y sulfuros cú-
bicos de gran desarrollo. El siguiente nivel está formado por 25-30 m
de pizarras grises de grano medio-grueso y con lentejones arenosos y
otros carbonatados menos frecuentes. Le siguen 70-80 m de pizarras li-
molíticas grises con abundantes cantos predominantemente calcáreos y
con diámetros de entre 0,1 y 25 cm, más frecuentes en la parte noreste
y central de la estructura. A continuación, se hallan pizarras grises de
grano medio-grueso y lentejones de espesor centimétrico, con pizarras
limolíticas con abundantes cantos calizos. La potencia total oscila entre
los 200 m en el flanco meridional hasta los 325 m en el septentrional,
con un espesor de 400-500 m en la parte central.
Formación Losadilla: está a techo de la anterior formación pero es li-
geramente discordante. Constituida por pizarras con intercalaciones de
laminaciones arenosas, con una potencia aproximada de 150 m en el
flanco meridional y 300 m en el septentrional.
Formación Llagarinos: formada por pizarras negras silíceas con lamina-
ciones de escaso espesor e intercalaciones arenosas lenticulares, presenta
una potencia que excede los 100 m.
Materiales del Terciario: de escasa importancia en la zona, se trata
de depósitos neógenos del tipo conglomerado, formados por cantos de
cuarcitas, pizarras y areniscas en una matriz arcillo-arenosa rojiza. Su
potencia depende del paleorrelieve inferior y del grado de erosión.
Depósitos cuaternarios: se trata de depósitos glaciares, periglaciares o
fluviales, a los que hay que añadir los coluviales, que pueden ocupar
grandes extensiones con espesores limitados.
Los materiales hasta ahora descritos sufrieron los esfuerzos tectónicos
de la Orogenia Varisca, caracterizada por tres fases de deformación [18,47,97].

La primera fase de deformación, la más intensa y de mayor desarrollo, es


responsable de la foliación dominante asociada a los pliegues asimétricos me-
nores de dirección NO-SE. Los principales pliegues de la región se formaron
2.2. GEOLOGÍA DE LA PIZARRA ESPAÑOLA 35

durante esta fase, que además subdividió la estructura en compartimentos


anticlinales (Ollo de Sapo y Teleno) y Sinclinales (Truchas) a modo de res-
puesta al acortamiento en dirección N-S sufrido por la Península Ibérica.

Las estructuras alteradas durante esta primera etapa se caracterizan por


tener una dirección NNO-SSE, con una esquistosidad del plano axial muy
bien desarrollada en las pizarras pero más grosera en las cuarcitas y arenis-
cas. Dicho plano axial buza subhorizontalmente o ligeramente hacia el SO
(10o -20o ) en el borde sur, en contraste con el borde norte del sinclinal, donde
el buzamiento va desde los 30o hasta la verticalidad.

La segunda fase de deformación es la responsable de los cabalgamientos


y micropliegues, aunque en este dominio del sinclinal de Truchas son prácti-
camente inexistentes.

Finalmente, la tercera fase de deformación provocó la formación de plie-


gues de amplia longitud de onda que deformaron a los de la fase anterior,
por lo que éstos tienen asociada una crenulación vertical o con buzamiento
hacia el sur a raíz del plegamiento de la foliación heterogénea de primera fa-
se, mejor desarrollada en los niveles pizarrosos que en los de areniscas. Esta
última fase concuerda con el acortamiento E-O del macizo Varisco.

En esta fase aparecen estructuras variscas tardías como los pliegues de


tipo kink-band y las fallas de componente inversa, cuyas direcciones y buza-
mientos son variables con mayoría de NO-SE. Asociadas a estas estructuras
están las rocas de tipo cataclasítico de varios metros de potencia, así como
los cabalgamientos de bajo ángulo y escaso acortamiento longitudinal. Las
citadas fallas ponen en evidencia que la Orogenia Alpina se tradujo en esta
zona en una fracturación de componente inversa, con un levantamiento ge-
neralizado de la antigua cordillera plegada durante el Varisco.

Estructuralmente, este sinclinal es de gran simetría y verge hacia el no-


reste, con una traza axial paralela a la del Arco Astúrico [73] (Fig. 2.10).

2.2.1. Descripción de la zona de estudio


Los yacimientos de pizarra se concentran en el noroeste de la península
ibérica, encontrándose la práctica totalidad de las explotaciones en dos co-
munidades autónomas, Galicia y Castilla y León. En dichas comunidades se
encuentran las formaciones geológicas que se enumeran a continuación: sin-
clinal de Truchas (Ourense, León, Valdeorras y sierra de Cabrera), sinclinal
36 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Figura 2.10: Corte que muestra la estructura del sinclinal de Truchas según
Catalán et al. [47] y Heredia et al. [97]. Tomado de [188].

del Caurel (desde Lugo hasta León) y pizarras de Cándana (en la Terra Chá
lucense). Entre dichas formaciones, la del sinclinal de Truchas (entre León
y Ourense) ha destacado tradicionalmente por la cantidad y calidad de las
explotaciones que atesora [43]. De menor entidad que las anteriores son las
formaciones de Monte Rande (en A Coruña) y Navia-Alto Sil (en la que hay
explotaciones aisladas en León, Lugo y Asturias) [16].

En concreto, la zona de estudio se localiza en el Sinclinal de Truchas,


que abarca las sierras de Cabrera, Eixe y Teleno, entre las provincias de Ou-
rense (Galicia) y León (Castilla y León). Las pizarras analizadas pertenecen
a la variedad Mormeau, definida en la publicación “Pizarras de España” del
IGME [111] y descrita en la Tabla 2.1. Geológicamente, la concesión se locali-
za en las hojas 229 Encinedo y 191 Silván de la cartografía MAGNA 1:50.000.

La explotación en la que se extrajeron las placas empleadas en este es-


tudio se halla en Carballeda de Valdeorras (Ourense), en una región que
concentra un gran número de canteras de pizarra. La región de Valdeorras es
una de las más nororientales de Ourense, cuyo núcleo principal es O Barco
de Valdeorras tanto a nivel demográfico como administrativo. Limita con las
provincias de Lugo, León y Zamora, con las regiones leonesas de Cabrera y
el Bierzo al este-noreste, Sanabria al sureste y Pobla de Trives al suroeste.

Esta zona se caracteriza por una orografía pronunciada y con dos lineacio-
nes montañosas de importancia: la Serra do Caurel al norte y la Serra do Eixe
al sur, con picos en ambos casos que rondan los 1.500 m de altitud. Abundan
2.2. GEOLOGÍA DE LA PIZARRA ESPAÑOLA 37

en la zona los cursos fluviales tributarios de otros principales, encontrándose


el resto de la región a una cota de alrededor de 900 m y formando las terrazas
del Sil. Precisamente asociada al curso del río Sil se han desarrollado terrazas
fluviales fértiles que sirven de lecho a otra de las principales industrias de la
región: la vinícola.

2.2.2. Estructuras que condicionan la explotabilidad de


los yacimientos de pizarra
La estructura interna de la pizarra viene determinada por dos planos: la
estratificación o S0 , y la pizarrosidad o S1 . La pizarrosidad (plano S1 ) es la
foliación que permite el exfoliado de las placas de pizarra, por lo que es la
principal estructura de esta roca. La intersección de este plano con la estrati-
ficación (plano S0 ) produce una familia de líneas que pueden ser más o menos
visibles según la pizarra, y constituye una dirección de debilidad de la roca.

Genera una anisotropía estructural en el bloque que se tiene en cuenta


durante el proceso de serrado en nave, de modo que la dimensión mayor de
las placas se hace coincidir con la dirección de esta lineación de intersección
S1 /S0 o hebra.

Los esfuerzos tectónicos actuantes sobre los yacimientos originales, ya


sean los que afectaron a la pelita durante su metamorfismo o los que tuvie-
ron lugar a posteriori, dieron lugar a una serie de estructuras que afectan a la
continuidad de la fábrica pizarrosa, rompiéndola y afectando negativamente
al yacimiento en cuanto a su aprovechamiento como roca ornamental. Estas
estructuras, que son de carácter no penetrativo a escala microscópica, son las
fallas, las diaclasas, los kink-bands (o bregadas) y las crenulaciones.

Las primeras, las fallas, pueden afectar en general a cualquier tipo de


macizo rocoso, no son específicos de la pizarra. Se trata de planos de fractura
por los que se produce un desplazamiento relativo entre los bloques rocosos
que los delimitan, y sus principales características son las elevadas continui-
dades (desde unos pocos hasta cientos de metros) y la alteración del material
de dichos planos. Esta alteración se debe a la fricción que sufre el material
en los bordes de contacto a causa del desplazamiento y afecta a una franja
de espesor variable. Por tanto, las fallas afectan a considerables volúmenes
de roca, a diferencia de las diaclasas.
38 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Las diaclasas son planos de fractura del material que provocan la divi-
sión del macizo en bloques irregulares de volumen variable. Considerándolas
como estructuras bidimensionales, su continuidad será en general reducida
(desde decímetros hasta decámetros, aproximadamente), pero su presencia
abundante y variedad de orientaciones condiciona el tamaño máximo de los
bloques naturales. Así, si dichos bloques no tienen unas determinadas di-
mensiones mínimas, esa zona del yacimiento resulta no ser rentable y por
lo tanto no se explotará debido a la baja recuperación y el elevado coste
de elaboración de cada tocho resultante. Por lo tanto, el tamaño mínimo de
bloque explotable es otro de los parámetros técnico-económicos definidos en
una explotación.

La tercera estructura, los kink-bands, sí son típicas de la pizarra. Se


trata de estructuras planas que pueden presentar una continuidad mayor o
menor según el yacimiento, cuya formación se debe a la existencia de esfuer-
zos cortantes actuando sobre el macizo pizarroso. Habitualmente, se hallan
como bandas subparalelas cuyo espesor puede alcanzar la escala centimétri-
ca, afectando a la continuidad de los planos de pizarrosidad (Fig. 2.11) e
impidiendo el exfoliado de las placas de un bloque. En aquellos casos en los
que el espesor de los kink-bands sea de milímetros, no impide su explotación
pero sí afecta a la calidad de la pizarra, y por tanto a su valor comercial.

Figura 2.11: Esquema de una bregada o kink-band. Fuente: Norma UNE-EN


22190-1:1998 EX.

Estos esfuerzos cortantes, además, pueden tener un efecto diferente sobre


la pizarra, provocando pliegues en los planos de pizarrosidad y dando lugar
al conocido como clivaje de crenulación. Se trata de un caso particular
de clivaje (que en general se define como la estructura con fábrica planar
gracias a la cual se puede separar el material en planos), que se desarrolla en
rocas que poseen una fábrica mineral o anisotropía (Fig. 2.12). Con clivaje de
crenulación nos referimos a unos micro plegamientos que dotan a la pizarra
de una superficie ondulada o dentada, en lugar de plana. Sin embargo, puede
2.2. GEOLOGÍA DE LA PIZARRA ESPAÑOLA 39

ocurrir que el ángulo que forma la pizarrosidad y el clivaje de crenulación


sea pequeño, en cuyo caso la pizarra se exfolia en forma de cuña. Es lo que
se conoce como pizarras quemadas.

Figura 2.12: Esquema del clivaje de crenulacion. Tomado de [88].

Asociada al clivaje de crenulación se define la panilla, que no es más que


la lineación producida por la intersección entre los planos anteriores y los de
pizarrosidad. Los canteros pizarreros diferencian, además, una panilla más in-
tensa (rayela) que provoca que la pizarra rompa por los planos de debilidad
durante la exfoliación de las placas. Por este motivo, la crenulación presente
en la pizarra deberá ser leve, poco intensa, para que pueda ser explotada.

Además de las anteriores, otras estructuras afectan a la explotabili-


dad de un yacimiento. Por ejemplo, la presencia de diques de cuarzo, o las
intercalaciones de otros materiales como cuarcitas o areniscas, rompen la
continuidad de los filones de pizarra. También pueden aparecer en forma de
bolos o cantos, de manera puntual, provocando la desviación de la planicidad
de la pizarrosidad.

Cuando la presencia de cuarzo, cuarcitas, areniscas y laminaciones are-


nosas es menos acusada, se suele hablar de xeixo, ferreño y rucios, respecti-
vamente. La afección en cuanto a la explotabilidad y aprovechamiento de la
pizarra depende del espesor que presenten y de su frecuencia, de modo que
si son intercalaciones continuas tendrán un efecto similar al de una falla y
provocarán el descarte de toda la zona.

Otro término habitual es el de pizarras mosqueadas, empleado para refe-


rirse al producto del metamorfismo de contacto sobre la roca que provoca la
aparición de minerales de gran tamaño que impiden el exfoliado regular de
la pizarra.
40 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Desde el punto de vista minero, la presencia de todas estas estructuras


será un factor condicionante de la explotabilidad y rentabilidad del yacimien-
to en cuestión, ya que influyen no sólo en la recuperación sino también en la
calidad (y por tanto, valor comercial) del material extraído.

Además, los yacimientos de pizarra se localizan en capas plegadas, de mo-


do que habrá zonas explotables en posiciones de charnela y de flanco. Esto
tiene una influencia directa sobre el espesor de los yacimientos, ya que las zo-
nas de charnela se caracterizan por presentar un mayor grosor de capa, siendo
por lo tanto más interesantes desde el punto de vista minero. Sin embargo,
una ventaja que presentan las capas de los flancos es que el ángulo formado
por la estratificación y la pizarrosidad es reducido, por lo que esta última
presenta en general un mejor desarrollo y por lo tanto origina superficies de
rotura de las placas más lisas (de mejor calidad, a priori).

2.3. Características comerciales de las pizarras


de techar
Una vez caracterizada la pizarra geológicamente, en esta sección se tratan
distintos aspectos de este material natural desde una perspectiva diferente:
considerándolo como material de construcción, y por lo tanto como roca or-
namental.

De este modo, hablando desde un punto de vista más comercial, se suelen


distinguir las siguientes regiones de producción de placas de pizarra: Val-
deorras, Cabrera, Caurel, Cándana, Monte Rande, Dominio de Navia-Alto
Sil, Villar del Rey, Bernardos y Aliste. En cada una de dichas regiones se
pueden distinguir, a su vez, variedades comerciales diferenciables según sus
características estéticas debido a variaciones en la composición, esquistosi-
dad o estratificación [16]. De este modo, dentro de la zona de Valdeorras se
diferencian las variedades comerciales de la Tabla 2.1.

Como se ha mencionado, las placas analizadas en el presente estudio per-


tenecen a la variedad Mormeau. Tal y como se explica en la Tabla 2.1, estas
pizarras de Mormeau son de color grisáceo en lugar de negro, en general
presentan buenas características para su aprovechamiento como pizarra de
techar (grano medio a fino y superficie lisa y homogénea) y la presencia de
sulfuros metálicos de pequeño tamaño (inferior a 2 mm) es habitual.
2.3. CARACTERÍSTICAS COMERCIALES 41

Tabla 2.1: Características principales de las variedades comerciales de Val-


deorras [16, 188].
Variedad Formación Color Caract. Composi- Minerales acce-
comercial superf. ción sorios
Casayo Pizarras de Negro Lisa y ho- Clorita y Cuarzo y pequeñas
Luarca mogénea sericita inclusiones de sul-
furos de hierro
Castañeiro Pizarras de Negro Lisa y ho- Clorita y Cloritoide, cuar-
Luarca mogénea sericita zo e inclusiones
redondeadas de
minerales metálicos
(<3 mm)
Mormeau Formación Gris Lisa y ho- Clorita, Turmalina, circón y
Agüeira mogénea sericita y sulfuros metálicos
cuarzo (<2 mm)
Rozadais Formación Negro Lisa con li- Clorita, Turmalina y sulfu-
Agüeira neaciones sericita y ros metálicos cúbi-
cuarzo cos (<3 mm)
Los Moli- Formación Gris Lisa Sericita, Opacos, turmalina
nos Agüeira cuarzo y y circón
clorita
Domiz Formación Gris Lisa y ho- Clorita, Circón, turmalina,
Agüeira mogénea sericita, plagioclasa e inclu-
cuarzo y siones de sulfuros
moscovita metálicos no detec-
tables de visu

2.3.1. Calidad de la pizarra. Factores que la definen


El producto final resultante de la elaboración de la pizarra se clasifica
en distintas variedades comerciales para su puesta en mercado, evaluando
las características de las placas tanto a nivel mecánico como dimensional y
estético. Asimismo, hay factores que dependen del mercado en cuestión, de
modo que la valoración de una misma placa en dos países distintos puede no
coincidir.

De este modo, los factores que definen la calidad de la pizarra se pue-


den agrupar en dos grandes categorías: petrológicos y tectónicos [43]. Los
primeros dependen de la composición intrínseca de la roca y su estructura
primaria, es decir: a su composición mineralógica, tamaño de grano, homoge-
neidad textural y presencia de intercalaciones arenosas. Los tectónicos, por
su parte, determinan la estructura de la roca y condicionan en mayor o menor
medida su explotabilidad y calidad comercial.
42 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Además, derivado del proceso de elaboración de las placas de pizarra, se


debe considerar una tercera categoría que afecta a la calidad comercial de las
mismas: las características dimensionales de las placas finales.

Factores petrológicos
La composición mineralógica de la pizarra suele estar definida por la
presencia de minerales mayoritarios como cuarzo (17-45 %), filosilicatos (40-
70 %) y plagioclasas (2-25 %), con otros minerales en concentraciones inferio-
res al 10 % como el cloritoide, los carbonatos o los sulfuros de hierro. Estos
dos últimos constituyen grupos de minerales perjudiciales para las placas de
pizarra para cubiertas, pues su descomposición una vez expuestas a los fac-
tores climatológicos puede provocar la aparición de manchas y alteraciones
que incluso pueden llegar a perforar la placa.

La presencia de minerales que se pueden alterar es una causa poten-


cial de indeseables manchas antiestéticas (como manchas de óxido), e incluso
de roturas si los procesos de hidratación provocan un incremento de volumen
(como ocurre con el sulfato de calcio). Aquellos minerales alterables presen-
tes en cantidades significativas en la pizarra como para afectar a su calidad
comercial son los siguientes: sulfuros con tendencia a la oxidación (pirrotita,
pirita y marcasita principalmente), y carbonatos (como las flores blancas),
cuya disolución puede producir manchas blancas o transformarse en sulfato
de calcio hidratado, capaz de provocar la rotura final de la placa.

En el caso de la pirita, se suele encontrar en forma de cubos de dimensiones


mayores que el espesor de la placa, con aristas desde los 2 hasta los 20 mm
(Fig. 2.13). Son minerales altamente estables, por lo que su alteración una
vez colocada la placa no es un problema. Sin embargo, estos cubos perforan
la placa y dificultan e incluso llegan a impedir la división de las placas de
pizarra por los planos de pizarrosidad.

Figura 2.13: Esquema que muestra la presencia de un cubo de pirita en una


placa de pizarra. Fuente: Norma UNE-EN 22190-1:1998 EX.
2.3. CARACTERÍSTICAS COMERCIALES 43

En cuanto a la pirrotina, suele presentarse en forma de escamas o lentejo-


nes en tamaños que van desde el medio milímetro hasta los 60 mm, y sí sufre
procesos de oxidación, lo que hace que sea una forma de sulfuros de hierro
más perjudicial que la anterior.

Las flores se originan por la oxidación de pirita, pirrotina laminar muy


fina o carbonatos sobre los planos de pizarrosidad S1 , que producen manchas
con forma de flor. Estas manchas no afectan habitualmente a las propiedades
mecánicas de la placa sino a su estética. El color más frecuente es blanque-
cino (carbonatos), aunque es posible también encontrar flores que exhiben
colores amarillentos o dorados.

Las pizarras de techar suelen tener un tamaño de grano inferior a los


75µm, diferenciando grano fino (menor de 30 µm), medio (30-50 µm) y grue-
so (mayor de 50 µm). Las primeras se caracterizan por un mejor exfoliado,
aunque la homogeneidad del tamaño es clave para una buena elaboración.

Por su parte, las intercalaciones arenosas pueden estar presentes en un


yacimiento de pizarra, y según su cantidad, espesor y espaciado llegar a ha-
cerlo inexplotable. Se trata de niveles de granos de cuarzo que se depositaron
durante la sedimentación de las arcillas que tras el metamorfismo originaron
la pizarra, y aparecen por tanto intercaladas entre capas de la misma.

Figura 2.14: Esquema que muestra la presencia de un nudo (izquierda) y


un rucio (derecha) en una placa de pizarra. Fuente: Norma UNE-EN 22190-
1:1998 EX.

Además, la presencia poco acusada de granos minerales como cuarcitas


o areniscas puede provocar la desviación de la planicidad de la pizarrosidad,
lo que se traduce en la aparición de bultos o irregularidades locales en
las placas. Según el desarrollo y el origen de tales bultos se habla de nudos
(escala centimétrica) o rucios (escala decimétrica) (Fig. 2.14). Además, se
habla también de refollos, protuberancias laminares producidas por la falta
de continuidad de los planos de foliación.
44 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Factores tectónicos

Otros factores a tener en cuenta son los tectónicos, que determinan la


estructura de la roca según se describió en el Apartado 2.2.2. Partiendo de la
base de que las placas resultantes deben ser lo más planas posible para una
correcta colocación en el tejado, distintos factores geológicos pueden alterar
la planicidad natural de la pizarra y afectar por tanto a su uso como material
para cubiertas.

De este modo, un primer defecto a tener en cuenta es el alabeo, que se


define como la desviación que puede presentar la superficie de la placa con
respecto a un plano.

Siguiendo con la misma idea de la necesidad de una superficie plana, las


estructuras que inciden de manera directa en la calidad de los yacimientos
son la pizarrosidad, la hebra, los pliegues tipo kink-band, la crenulación y las
fracturas o diaclasas en la roca.

La pizarrosidad, como ya se ha descrito, permite el exfoliado de las placas


de pizarra, por lo que es la principal estructura de esta roca. La fisilidad de la
pizarra depende directamente de que la pizarrosidad esté bien desarrollada,
lo que condiciona los espesores que se podrán obtener durante el labrado en
la nave de elaboración.

La hebra (lineación de intersección S1 /S0 ) es una dirección de debilidad


de la pizarra, y en aquellos casos en que esté muy marcada puede afectar
a las propiedades mecánicas de las placas. Además, la dirección de la hebra
se tiene en cuenta durante el serrado de los bloques, de modo que se hace
coincidir con la dimensión mayor de las placas para que tengan una mayor
resistencia mecánica [40].

La presencia de irregularidades superficiales en la placa es indeseable,


sean generalizadas y distribuidas por toda la extensión de la misma o loca-
lizadas en lugares específicos. Dado que se trata de una roca metamórfica,
el proceso de formación de la pizarra incluye fuerzas de compresión que dan
lugar a su característica estructura foliada, pero también a microestructuras
que pueden alterar su fisilidad, resistencia, textura y estética. Un desarrollo
considerable de estas estructuras puede hacer que la pizarra no sea apta para
techar, afectando negativamente a su regularidad superficial.
2.3. CARACTERÍSTICAS COMERCIALES 45

Entre estas microestructuras, los pliegues tipo kink-band o bregadas son


frecuentes en algunos yacimientos de pizarra. Se trata de estructuras planares
de continuidad variable que se forman por esfuerzos compresivos actuantes
sobre la pizarra, provocan que se deformen los planos originales y formen un
cierto ángulo. En cuanto a las bregadas, no sólo afectan a la colocación de las
placas en los tejados sino que pueden influir negativamente en sus propiedades
mecánicas. Según lo acusado de estos pliegues, pueden llegar a impedir el
aprovechamiento de la roca, ya que impiden su exfoliado o provocan la rotura
de las placas. Pueden tener dimensiones milimétricas a centimétricas.

Figura 2.15: Esquema que muestra la crenulación o rayela en una placa de


pizarra. Fuente: Norma UNE-EN 22190-1:1998 EX.

De un modo similar, el clivaje de crenulación aparece como respuesta de


la roca a una deformación posterior y aparece como una foliación no continua
que origina pequeñas ondulaciones sobre los planos S1 y dificultan o incluso
impiden el aprovechamiento de un yacimiento en determinadas zonas (Fig.
2.15). Como se definió en el apartado 2.2.2, el clivaje de crenulación dota a
la placa de una superficie dentada, no plana, e incluso puede provocar que la
pizarra exfolie en forma de cuña si el ángulo formado por la pizarrosidad y
el clivaje es pequeño (pizarras quemadas).

Asociado a este clivaje de crenulación, se define una lineación producto


de la intersección entre la pizarrosidad y los planos de clivaje de crenulación
que se conoce entre los canteros como panilla, y que constituye un defecto de
placa cuando es intensa, ya que puede provocar la rotura de las placas.

El último factor tectónico a tener en cuenta son las fracturas de la roca,


que pueden presentar relleno o no. Estas fracturas pueden, por una parte,
provocar la rotura de las placas durante su elaboración, o incluso hacer que
se descarten durante el proceso de labrado en previsión de la probable rotura
del producto final.
46 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

Factores dimensionales de las placas

El proceso de elaboración de las placas incluye varias etapas de corte hasta


alcanzar las formas y dimensiones de placa comerciales. Así, la geometría
final es objeto de control para garantizar a los clientes las características
dimensionales adecuadas. Este control incluye la medida de la desviación
con respecto a la ortogonalidad (falsa escuadra), y la comprobación de que
no hay faltas de material resultado de la rotura de las placas durante su
manipulación. Estos defectos en el acabado de las placas pueden deberse a
una mala calibración de las tijeras usadas para recortar las placas, o también
a pequeños errores en el uso de las máquinas troqueladoras, que pueden
provocar roturas o escalones en las placas [40].

Otras consideraciones

Asimismo, debe tenerse en cuenta el procedimiento a la hora de instalar


las placas en las cubiertas, ya que se colocan de modo que la parte superior de
una placa está por debajo de otra placa (las filas inferiores, que se colocan en
primer lugar, quedan parcialmente cubiertas por las inmediatamente supe-
riores, favoreciendo una correcta evacuación del agua de lluvia, por ejemplo),
de modo que se pueden diferenciar tres partes en la placa (Fig. 2.16) [140]:

Tercio vista (V): parte de la placa expuesta al aire, vista.

Tercio semivista (también llamado solape, SO): es la parte media, y se


cumple que su área es igual a la del tercio vista.

Tercio de solape (también llamado recubrimiento, R): parte de la placa


que queda por debajo de las placas de las hileras superiores, de modo
que se evita la penetración de agua en la cubierta. Este tercio puede
ser igual a los demás (cubierta terciada) o algo inferior (cubierta menos
que terciada). No debe ser superior que los otros tercios.

La manera en que se instalan las cubiertas de placas de pizarra hace


que una parte de cada placa no se vea, quedando por debajo de la fila su-
perior (parte cubierta), por lo que algunas de las singularidades o defectos
comentados se deben evaluar considerando toda la superficie de la placa (en
el caso de aquellos que afectan a las propiedades mecánicas), mientras que
otros se deben estudiar considerando los tres tercios citados (singularidades
estéticas).
2.3. CARACTERÍSTICAS COMERCIALES 47

Figura 2.16: Tercios de la placa de pizarra con las dos nomenclaturas habi-
tuales. Fuente izquierda: [140]. Fuente derecha: [150].

Calidades comerciales definidas habitualmente


En función de los factores descritos, las placas se etiquetan según calida-
des comerciales, diferenciándose así tres grupos de pizarras para cubiertas:
primera calidad, estándar (segunda) y económica o ECO (tercera) [40].

La primera calidad se caracteriza por ser pizarra de grano fino y homogé-


neo, con tonalidades variables pero capaz de exfoliarse en placas de espesores
muy finos (1.5-4 mm), y con pocos o ningún sulfuro metálico.

La segunda calidad o calidad estándar es algo más basta que la primera,


no exfolia en placas tan finas, siendo su espesor habitual de 4-9 mm, y con
un color más claro. Contiene más sulfuros metálicos que la anterior.

En cuanto a la tercera calidad comercializada, la económica o ECO, se


caracteriza por tener espesores mayores de 1 cm.

2.3.2. Características técnicas. Normativa


Actualmente, existe una normativa a nivel europeo exigible a toda la pi-
zarra comercializada en los países miembros para garantizar el cumplimiento
de unos estándares de calidad. Las normas específicas a seguir son:

UNE-EN 12326-1:2015 Productos de pizarra y piedra natural para teja-


dos inclinados y revestimientos. Parte 1: Especificaciones para pizarras
y pizarras carbonatadas.
48 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

UNE-EN 12326-2:2012 Productos de pizarra y piedra natural para te-


jados inclinados y revestimientos. Parte 2: Métodos de ensayo para
pizarras y pizarras carbonatadas.

UNE-EN 22190-3 EX Sistemas de colocación.

En dichas normas se evalúan las características de los productos de piza-


rra a partir de un cierto número de ensayos de tipo, diferenciando entre la
evaluación de producto (mediante ensayos de tipo) y los requisitos de pro-
ducción en fábrica (mediante controles rutinarios).

Entre las propiedades estudiadas se incluyen, fundamentalmente, las si-


guientes: fisilidad, porosidad, resistencia al dióxido de azufre, a los cambios
térmicos, contenido en carbonatos, presencia de minerales alterables, presen-
cia de microestructuras, color, tolerancias dimensionales y aspecto exterior.

Por otra parte, se tiene en cuenta también que las características de una
superficie construida dependen no sólo del material que la constituye, sino
que el diseño, su instalación, las condiciones de uso y el entorno en que se
instala son también factores de interés.

La norma UNE-EN 12326-1 determina los valores máximos y mínimos


admisibles de cada propiedad, mientras que la norma UNE-EN 12326-2 de-
fine tales características y detalla los métodos a seguir para su determinación.

Estas normas europeas dictan los requisitos que debe cumplir la pizarra
y la pizarra carbonatada para su uso en tejados y revestimientos externos,
entendiendo como pizarra tal aquella cuyo contenido en filosilicatos y carbo-
natos es de al menos el 20 %, y con una exfoliación esquistosa importante. Se
especifican también los métodos de ensayo de las pizarras y pizarras carbo-
natadas de cara a su empleo en tejados y revestimientos de paredes. A partir
de un cierto número de pizarras de un lote, se caracteriza la roca siguiendo
las siguientes definiciones:

Longitud y anchura, desviaciones: empleando una regla metálica, se


determina la desviación en porcentaje con respecto a la dimensión es-
pecificada. Se emplean placas de pizarra enteras, y se expresan en por-
centaje las desviaciones en ancho y largo con respecto a las dimensiones
especificadas.

Rectitud de los bordes: también con una regla metálica, se mide la


desviación de los bordes longitudinales con respecto a una línea recta
2.3. CARACTERÍSTICAS COMERCIALES 49

y se expresa en mm (para longitudes de placa inferiores a 500 mm) o


como porcentaje con respecto a la longitud de la pizarra (en caso de
que sean iguales o mayores de 500 mm). El proceso se realiza para cada
borde de la placa.

Rectangularidad: el objetivo es evaluar la desviación con respecto a la


ortogonalidad de los ángulos de la placa formados por bordes contiguos.
Se mide la desviación máxima en las cuatro esquinas y se calcula la
desviación de la rectangularidad como un porcentaje sobre la longitud
de la placa en mm.

Espesor individual: se mide el espesor medio de la placa a partir de las


medidas en cuatro puntos de la misma efectuadas con un micrómetro.
Los puntos seleccionados son los puntos medios de los lados de la placa,
a una cierta distancia del borde para evitar que el bisel influya en la
medida. Además del valor medio, se calcula la desviación máxima con
respecto a dicha media, en porcentaje.

Curvatura: con un dispositivo comparador, se mide la máxima curva-


tura de la placa y se expresa en porcentaje con respecto a la longitud
de la pizarra.

Resistencia a la flexión, determinación del módulo de rotura y el módulo


de rotura característico: se realiza el ensayo de flexión a tres puntos
sobre dos probetas preparadas de pizarra. A partir de sendas placas,
se cortan las probetas con las dimensiones especificadas en la Norma
en las direcciones longitudinal y transversal de la placa. Aplicando la
velocidad de carga apropiada para el espesor de las probetas, se obtiene
el módulo de rotura, el módulo de rotura medio y el módulo de rotura
característico (este último tras ensayar 20 pizarras).

Absorción de agua: el principio de este ensayo es la inmersión en agua


destilada de probetas de pizarra secas, a temperatura ambiente y du-
rante 48 horas, determinando la cantidad de agua absorbida como la
diferencia de masas en húmedo y seco. Se emplean 5 probetas cortadas
de otras tantas placas con las dimensiones marcadas por la Norma, y
se expresa la media de las cinco absorciones calculadas, registrando el
espesor de las probetas.

Hielo/deshielo: se analiza la variación del módulo de rotura caracterís-


tico expuesto anteriormente cuando las probetas se someten a 50 ciclos
de hielo/deshielo. Tales ciclos se realizan introduciendo las probetas en
una cámara de heladicidad durante al menos 3 h a una temperatura
50 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

constante de (−20 ± 2)o C, y sumergiéndolas en agua destilada durante


1 h como mínimo. Tras los ciclos, las probetas se secan en estufa y se
ensayan a flexión, calculando el módulo de rotura medio.

Contenido de carbono no carbonatado y contenido de carbonato. De-


terminación del contenido de carbonato cálcico y de carbono no carbo-
natado por descomposición térmica catalítica: se calcula el contenido
de carbono total mediante descomposición térmica en presencia de un
acelerador de wolframio o estaño, empleando un detector de infrarro-
jos para tomar la medida. Por otra parte, se calcula el contenido de
carbono no carbonatado al atacar las probetas con una disolución de
ácido clorhídrico. Una vez determinado el carbono total y el carbono
no carbonatado, el carbono carbonatado se calcula como diferencia de
los anteriores. Además, asumiendo que todo el contenido de carbono
carbonatado proviene de carbonato cálcico, se calcula el porcentaje en
masa de carbonato cálcico aparente a partir del porcentaje de carbono
carbonatado determinado.

Exposición al SO2 inferior o igual al 20 % de carbonato: se expone a las


probetas a atmósferas de dióxido de azufre durante 21 días, y se observa
los cambios físicos que sufren. Se emplean dos disoluciones distintas de
dióxido de azufre, con dos concentraciones diferentes, y se sumergen en
ellas las probetas. Se registran los cambios observados al finalizar los
ensayos.

Exposición al SO2 superior al 20 % de carbonato: en este caso, el pro-


cedimiento es ligeramente diferente al anterior. Se determina el reblan-
decimiento de una pizarra tras la exposición a una atmósfera húmeda
de dióxido de azufre al raspar con un dispositivo especial su superficie
antes y después de dicha exposición, y midiendo la profundidad de las
huellas.

Ciclos térmicos: se somete a las probetas a 20 ciclos de secado a (110 ±


5)o C e inmersión en agua a (23 ± 5)o C, y se evalúa la posible aparición
de cambios físicos (de color, principalmente) indicativos de la presencia
de minerales metálicos nocivos. Se apuntan los cambios observados dife-
renciando entre pátinas que afectan a la superficie del mineral metálico,
manchas de oxidación en la superficie sin afectar a la estructura de la
pizarra, y manchas de oxidación asociadas a alteraciones estructurales
de la pizarra.
2.3. CARACTERÍSTICAS COMERCIALES 51

Se describe, asimismo, el examen petrográfico de la pizarra para expresar


las características que influyen sobre su comportamiento físico, químico y
mecánico. Se examinarían láminas delgadas o plaquetas pulidas de la pizarra
mediante difracción de rayos X, analizando la estratificación y pizarrosidad,
las fisuras y su relleno, las discontinuidades, fallas, kinkbands, la presencia
de carbonatos, la materia carbonosa y la presencia de minerales metálicos.

2.3.3. Marcado CE
Con su entrada en vigor en 2006 se homogeneizaron los criterios para
la comercialización de los productos de pizarra en la Unión Europea, con
independencia de su país de origen. La directiva 89/106/CEE de diciem-
bre de 1988 menciona expresamente los productos de construcción dentro
de las medidas de la Comisión Europea para avanzar en el establecimiento
de un mercado único entre los países miembros. Posteriormente, la directiva
93/68/CEE, de julio de 1993, complementa la anterior y define claramente
el marcado CE. En España, el Real Decreto 1630/1992 y su modificación
posterior, el Real Decreto 1328/1995, transponen dicha directiva.

El objetivo es garantizar que los productos empleados en obra civil cum-


plan los requisitos básicos de resistencia, estabilidad, seguridad en caso de
incendio, higiene, salud, medio ambiente, seguridad de utilización, protección
contra el ruido, ahorro de energía y aislamiento térmico.

En el caso de la pizarra para cubiertas, tales requisitos se certifican con


la declaración de conformidad y el marcado CE siguiendo las espe-
cificaciones de la norma UNE-EN 12326-1 Especificaciones del producto y
UNE-EN 12326-2 Métodos de ensayo.

Los ensayos de tipo se elaboran en un organismo o laboratorio autorizado


antes de la certificación de la clase de pizarra, determinando la calidad de
fabricación, resistencia a la flexión, petrografía, absorción de agua y compo-
nentes indeseados como carbonatos, sulfuros de hierro o carbono. Además, en
la propia fábrica o nave de elaboración, cada fabricante implanta un control
de producción (CPF) para asegurar que la pizarra vendida cumple con las
características determinadas en los ensayos.

La declaración de conformidad recoge la autorización de cada fabricante


para el marcado CE de sus productos, figurando los datos completos del fabri-
cante, la descripción del producto, declaración de los requisitos que cumple,
condiciones particulares aplicables al uso del producto, datos de la persona
52 CAPÍTULO 2. INDUSTRIA Y CARACTERIZACIÓN

que firma la declaración y explicación de los resultados de los ensayos y ran-


gos de aceptación o requisitos aplicables. Este documento debe adjuntarse en
cada lote de pizarra que se venda.

Figura 2.17: Ejemplo de etiqueta de marcado CE de un producto de pizarra


[41].

Por último, con la información incluida en la declaración de conformidad


se confeccionan las etiquetas del marcado CE, que no indica calidades de
pizarra, sino que informa sobre las características del producto. La etiqueta
debe contener, en el idioma del país en que se comercialice, los siguientes
datos: datos completos del fabricante, últimos dos dígitos del año en que
se colocó el marcado, referencia de la norma seguida, tipo de producto, ca-
racterísticas esenciales incluidas en la declaración de conformidad, variación
dimensional, resistencia mecánica, permeabilidad al agua y durabilidad. La
Figura 2.17 contiene un ejemplo [41] de etiqueta de marcado CE.
Capítulo 3

Técnicas de visión artificial


54 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL
3.1. INTRODUCCIÓN 55

3.1. Introducción
Desde hace años, los científicos y los escritores de ciencia ficción han en-
contrado fascinante la idea de poder construir máquinas inteligentes, para
lo cual deberían estar dotadas de la capacidad de comprender el mundo vi-
sual, del mismo modo que buena parte de nuestro cerebro está dedicado a la
visión [198]. La visión artificial forma parte de la ciencia de la inteligencia
artificial, y se puede definir como la capacidad de un sistema para modelar
objetos mediante procesos matemáticos que equivalen a la percepción visual
de los seres vivos [60]. Sin embargo, el objetivo no se ciñe únicamente a su
modelado, sino también a la toma útil de decisiones sobre objetos físicos
reales y escenas basadas en imágenes adquiridas [198].

Esta toma de decisiones debe apoyarse, habitualmente, en un modelo o


descripción del objeto observado, que se construirá a partir de la imagen.
De este modo, algunas de las cuestiones clave son la formación de imágenes
mediante un sensor (adquisición), la codificación de dicha información, la re-
presentación de los objetos y sus partes, propiedades y relaciones, y cuáles
son los métodos de análisis más adecuados para procesar la información re-
cabada. Otra característica, además, es que todo este proceso de adquisición,
procesamiento, análisis y comprensión de las imágenes se lleva a cabo sin
contacto.

Las personas percibimos la estructura tridimensional del mundo que nos


rodea con sencillez, en un proceso complejo que no está exento de “imperfec-
ciones”, como las ilusiones ópticas de las que a menudo somos víctimas [211].
La investigación en el campo de la visión por computador ha ido de la mano
del desarrollo de algoritmos y técnicas matemáticas para recuperar la forma
y aspecto tridimensional de los objetos, algo para nada trivial. La visión es
un problema complejo, en parte por el hecho de que es un problema inverso:
tratamos de recuperar partes desconocidas a partir de información insufi-
ciente para especificar por completo la solución. De este modo, necesitamos
modelos físicos y probabilísticos con los cuales deshacer ambigüedades de las
posibles soluciones. Sin embargo, modelar el mundo visual real con toda su
rica complejidad es de una dificultad más que elevada [211].

Hasta llegar al punto de desarrollo actual han sido necesarias varias dé-
cadas de investigaciones que comenzaron en la década de los 70, resumidas
en [211] y en [235]. En aquel momento, la percepción visual se contempla-
ba como una etapa más de la construcción de robots con comportamiento
inteligente, sin considerarlo de una complejidad especial, sino al contrario,
56 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

como un paso previo sencillo para la posterior resolución de problemas de


alto nivel (razonamiento y planificación) [31]. Pronto el asunto se llenó de
complejidad y en la década de los 80 fueron muchos los esfuerzos enfocados
al análisis cuantitativo de las imágenes y escenas mediante técnicas matemá-
ticas [30, 74, 79, 101, 117, 175, 237].

Los 90 vieron cómo las técnicas matemáticas anteriores se perfeccionaban


y permitían realizar el seguimiento de objetos en movimiento [98,158,203], la
reconstrucción completa de superficies tridimensionales [35, 54, 212, 222, 244]
o la segmentación de imágenes [56, 128, 162, 199], por citar algunos ejemplos.
La interacción con los gráficos por ordenador, posibilitando la manipulación
de imágenes reales para crear nuevas animaciones, es uno de los puntos clave
de dicha década [195].

Ya a principios del siglo XXI se desarrollaron algoritmos y técnicas más


precisas para problemas más concretos, como el análisis de texturas [66], la
interpretación de distintas iluminaciones, con y sin flash [67,135], el reconoci-
miento de objetos y de escenas [179,242] o el reconocimiento de contornos [20]
y regiones [159]. Otra tendencia significativa de investigación fue en la línea
de determinar algoritmos más eficientes para problemas complejos de opti-
mización global [29].

En la actualidad, Szelinski [211] señala que uno de los campos de la inves-


tigación en reconocimiento visual es el de la aplicación de técnicas sofisticadas
de machine learning a problemas de visión por computador, lo que coincide
con la creciente disponibilidad de enormes cantidades de datos parcialmente
clasificados en internet a partir de los cuales es factible aprender categorías
de objetos sin la supervisión humana [76].

Algunas de las aplicaciones más destacadas de la visión por computador,


de las cuales se pueden encontrar ejemplos en [211], son las siguientes:
Optical character recognition (OCR): lectura de textos y números tanto
manuscritos [147] como a máquina [51, 232].

Inspección automática de piezas: para comprobar rápidamente las di-


mensiones de las piezas fabricadas [181], o para descartar que presenten
defectos [167].

Construcción de modelos 3D para fotogrametría: a partir de imágenes


aéreas, reconstrucción del modelo tridimensional del terreno o de las
construcciones ubicadas en él [231].
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 57

Seguridad en la carretera: detección de obstáculos en la carretera, re-


conocimiento de señales viarias, e incluso conducción autónoma [23,24,
210].

Imágenes médicas: registro de imágenes antes y durante las interven-


ciones, o estudios a largo plazo de la evolución de la morfología del
cerebro con la edad, por ejemplo [161, 172].

Vigilancia: control de entrada de intrusos [165], análisis de tráfico, moni-


torización de espacios concretos para detectar la presencia de personas
que puedan precisar ayuda (por ejemplo, en una piscina) [91, 104].

Identificación de huellas dactilares y biometría: para habilitar el acceso


automático o para realizar tareas forenses [89, 143].

3.2. Elementos de un sistema de visión artificial


Un sistema de visión artificial se compone de un conjunto de elementos
cuyas funciones son preparar la escena, capturar la información de dicha esce-
na y transmitirla al ordenador para su posterior procesado. Así, los elementos
básicos de un sistema de visión artificial son los siguientes (Fig. 3.1):

1. Iluminación: parte elemental de todo sistema de visión, ya que pro-


porciona la luz adecuada a la escena para que las imágenes del objeto
puedan ser capturadas. Tipos principales: halógena (fibra óptica), fluo-
rescente, LED y láser (incluyendo la luz estructurada).

2. Óptica: es la lente que proyecta la luz del exterior y la envía al sen-


sor para formar una imagen. Tipos principales: estándar o entocéntrica
(causan distorsiones geométricas en la representación plana de las imá-
genes captadas), telecéntricas (hacen que la luz incida perpendicular,
colimada, al sensor y eliminan la distorsión) y pericéntricas (logran una
perspectiva lateral del objeto desde una posición cenital sin emplear es-
pejos). Además, se pueden añadir filtros para restringir el paso de la luz
de una determinada longitud de onda, dependiendo de las caracterís-
ticas del proyecto desarrollado, así como ópticas zoom para magnificar
la imagen capturada.

3. Sensor: captura la luz recibida de la óptica y la convierte en una imagen


digital que posteriormente será transferida a un sistema electrónico ex-
terno (framegrabber, monitor, etc.) siguiendo un estándar determinado
58 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.1: Diagrama que muestra los elementos generales de un sistema de


visión.

por el tipo de cámara. Pueden distinguirse varios tipos de sensores se-


gún cómo se realice la salida de datos (analógica, GigE, USB2.0, etc.),
su resolución, su espectro (visible, ultravioleta, infrarrojo, térmico,...)
o el formato del sensor (lineal, de área,...), principalmente.

4. Elementos de comunicación: cables de conexión, framegrabbers (si es


el caso) y otros elementos cuya misión es transferir los datos recabados
por el sensor a la computadora.

5. Software de análisis: este sería el último elemento del sistema, encar-


gado de manejar la información recogida para producir los resultados
requeridos para la aplicación objeto de desarrollo. Habitualmente se ha-
bla de librerías de programación (Halcon, Sapera LT, Open CV, etc.)
o entornos GUI (Sherlock, NI Vision Acquisition, Inspect, entre otros).
Asimismo, se pueden utilizar otros programas que, sin ser específicos
de este campo de aplicación, disponen de extensiones o toolboxes para
este tipo de operaciones (por ejemplo, MatLab).

3.2.1. Elementos hardware del sistema


Técnicas de iluminación
Como ya se ha indicado, de una buena iluminación depende la adquisición
satisfactoria de imágenes, sea cual sea su finalidad. Teniendo en cuenta que
las cámaras o sensores capturan la luz reflejada de los objetos, la finalidad
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 59

Figura 3.2: Iluminación por fibra óptica directa puntual (izquierda), ani-
llo (medio) y para iluminación por contraste o backlight (derecha). Fuente:
http://www.infaimon.com.

de la iluminación seleccionada es adaptar la forma en que la cámara captará


el objeto para así enfatizar aquellos aspectos de interés (forma, color, locali-
zación, etc.).

Para ello, varias son las técnicas de iluminación posibles, que dependen,
por una parte, de la fuente de generación (halógena o fibra óptica, fluo-
rescente, LED y láser), pero también de la posición de dicha fuente con
respecto al sensor. Con respecto a la fuente de generación, las necesi-
dades de la aplicación en cuanto a intensidad lumínica, duración, flexibilidad
de diseños y precio son los principales factores a tener en cuenta para su
selección.
Iluminación halógena o por fibra óptica: proporciona la mayor inten-
sidad de luz. Se trata de luz fría, lo que hace que sea especialmente
adecuada en aplicaciones donde el calentamiento de los sistemas sea
un problema, o incluso en ambientes deflagrantes. Se componen de una
bombilla halógena, cuya potencia de iluminación se controla mediante
un reostato, una fuente de alimentación y un estabilizador de corriente.
La duración media de las lámparas halógenas es de 1.000-2.000 horas.
Se puede encontrar en distintos tamaños y geometrías, algunas de las
cuales se muestran en la Figura 3.2.

Iluminación fluorescente: aunque este tipo de lámparas se fabrica en


una limitada variedad de formas geométricas (lo cual dificulta su adap-
tación a determinados sistemas), se emplean con cierta frecuencia en
aplicaciones de visión artificial industrial, siendo siempre modelos que
funcionen a alta frecuencia para evitar el efecto de parpadeo típico de
un fluorescente estándar. Normalmente se emplean fluorescentes con
espectro lumínico conocido, casi monocromáticos. Su vida media es de
unas 10.000 horas.
60 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.3: Iluminación LED directa en formato barra (izquierda), anillo


(medio) y para iluminación por contraste o backlight (derecha). Fuente:
http://www.infaimon.com

Figura 3.4: Luz láser con patrón de varias líneas (izq.) y mode-
lo empleado en el prototipo desarrollado (dcha.). Fuente imagen izq.:
http://www.infaimon.com.

Iluminación por LED (Fig. 3.3): la relación intensidad de ilumina-


ción/coste de este tipo de fuente es uno de sus puntos fuertes, además
de la gran duración de los LED (unas 100.000 horas). Habitualmente se
emplean LED rojos para aplicaciones monocromas, pero también infra-
rrojo, verde, azul o blanco. Los LED se pueden disponer en barra, anillo
o línea, con distintas geometrías para su aplicación como luz directa,
difusa, coaxial, por contraste o de campo oscuro.

Iluminación láser (Fig. 3.4): se trata de un tipo de luz llamada es-


tructurada, cuya principal aplicación es la medición 3D de los objetos.
Básicamente, el sensor y el láser se colocan formando un cierto ángu-
lo de manera que al registrar la distorsión del haz láser cuando incide
sobre el objeto, se interpreta la tercera dimensión (altura o profundi-
dad). Dependiendo de la aplicación concreta, se selecciona un patrón
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 61

Figura 3.5: Comparativa entre la escena iluminada con luz de longitud de


onda del espectro visible (recuadro superior derecho) y con luz infrarroja.
Fuente: http://www.infaimon.com

de láser determinado (una o varias líneas, patrones de puntos, cruces,


mallas, círculos concéntricos). Los láseres empleados en visión artificial
se clasifican según su potencia y longitud de onda como clase II, IIIA o
IIIB. Están disponibles, además, en varias longitudes de onda: 375 nm
(UV), 405 nm (violeta), 445 nm (azul), 520-532nm (verde), 635 a 690
nm (rojo) y 785 a 980 nm (infrarrojo).
Iluminación infrarroja (Fig. 3.5): es un caso particular que se caracte-
riza por emplear una fuente de luz infrarroja de alta potencia. Puede
alcanzar una distancia máxima de iluminación de 200 metros.

Por otra parte, la posición relativa entre la fuente de luz y la


cámara que la capta es responsable de varias técnicas, que realzan diferentes
características de los objetos observados y por tanto serán seleccionados en
función de la aplicación concreta a desarrollar:
Iluminación frontal (campo claro): cámara y luz están orientadas en el
mismo sentido. Se aplica sobre todo en superficies con pocos reflejos.
Iluminación lateral: la cámara se coloca en posición cenital y la ilumi-
nación lateralmente, de modo que se consigue realzar detalles en los
objetos que con otra orientación de la luz no serían visibles.
Iluminación de campo oscuro (dark field ) (Fig. 3.6): con la cámara en
posición cenital, se emplean anillos de luz que rodean e iluminan el
62 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.6: Iluminación de campo oscuro (dark field ). A la izquierda, esquema


general, y a la derecha un ejemplo de aplicación en el que se observa la imagen
registrada con una iluminación frontal (medio) y de campo oscuro (derecha).
Se aprecia cómo este tipo de iluminación realza los defectos superficiales.
Fuente: http://www.microscan.com

objeto de manera que la luz se emite perpendicularmente a la cámara.


Permiten resaltar los defectos en superficie.

Iluminación por contraste (backlight) (Fig. 3.7): el objeto a observar


está en medio de la fuente de luz y la cámara, de modo que la luz cap-
tada por el sensor es la que atraviesa el objeto. Es útil para realzar las
siluetas por contraste, y para analizar el interior de objetos translúcidos
o transparentes sin que los detalles superficiales los enmascaren.

Iluminación en el mismo eje o coaxial (Fig. 3.8): se aplica cuando la


superficie de los objetos a observar es reflectante, y consiste en una
fuente de luz que emite lateralmente sobre un espejo semitransparente,
de modo que los haces de luz se reflejan sobre el objeto formando una
luz difusa homogénea. Al tratarse de un espejo semitransparente, la luz
transmitida desde el objeto puede pasar a través de él y llegar hasta la
cámara.

Iluminación difusa continua (Fig. 3.9): se conoce también como «de


día nublado» y su principal característica es que no produce sombras.
Se consigue mediante una cúpula que refleja la luz de unas fuentes
colocadas en sus extremos, más una fuente coaxial superior (tipo domo).
Otra opción es colocar un plato difusor entre la fuente de luz y el objeto
iluminado. Se emplea para iluminar superficies reflectantes irregulares
o complejas.
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 63

Figura 3.7: Diagrama de un sistema de visión con iluminación por contraste


o backlight. Adaptado de http://www.effilux.fr.

Figura 3.8: Diagrama de funcionamiento de la iluminación coaxial (izq.) y


ejemplos de fuentes de luz LED para este tipo de iluminación (dcha.). Fuente:
http://www.infaimon.com.

Figura 3.9: Diagrama de funcionamiento de la iluminación coaxial tipo domo


(izq.), con panel difusor (medio) y varios ejemplos de fuentes de luz LED
para este tipo de iluminación (dcha.). Fuente: http://www.infaimon.com.
64 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Tipos de ópticas
El sensor de la cámara recibe la luz de la escena capturada a través de
la óptica de una manera controlada, de modo que el enfoque es el apropiado
para registrar el objeto u objetos deseados. Una de las claves para una buena
definición del sistema de visión artificial radica en seleccionar la óptica, lente
u objetivo adecuado para el trabajo a desarrollar (del mismo modo que un
fotógrafo selecciona el objetivo idóneo según vaya a realizar un retrato, un
evento deportivo o un paisaje).

Cualquiera que sea el ámbito de aplicación (visión artificial o fotografía),


la elección de la óptica se realiza a partir del conocimiento de algunos pará-
metros como el tamaño del sensor de la cámara, la distancia a la que estará el
objeto y el campo de visión a abarcar. A partir de estos conceptos es posible
calcular el parámetro más característico de la óptica, la distancia focal (f ),
a partir de la siguiente relación:

Tamaño del sensor * Distancia al objeto


Distancia focal=
Tamaño del objeto
La distancia focal, que habitualmente se expresa en mm, se refiere a la
distancia entre el plano del objeto observado y la imagen formada en el sensor
de la cámara, y va a determinar la distancia mínima a la que debe situarse
la óptica para lograr una imagen nítida del objeto, así como la amplitud de
la escena observada. Algunos objetivos tienen una focal fija, mientras que
en otros es variable (permiten hacer zoom). Aquellos objetivos con una fo-
cal menor (en fotografía, serían los de menos de 20 mm, aproximadamente)
permiten tomar imágenes nítidas de objetos más cercanos y en un campo de
visión mayor (Fig. 3.10).

Otra clave de las ópticas es la luminosidad o apertura relativa del


diafragma (F ), que indica la máxima cantidad de luz que se permite atra-
vesar la óptica. Se expresa (y calcula) como el resultado de la relación entre
la distancia focal f y el diámetro de la pupila de la lente, en la forma f/.
Expresan una superficie, un área por la que la luz penetra hasta el sensor
de la cámara, y tiene un efecto clave en el logro de una correcta exposición.
Los objetivos se suelen designar a partir de su distancia focal y su apertura
máxima de diafragma: 50mm f/1.4 es el típico en fotografía de retratos, por
ejemplo.

Teóricamente, al tomar imágenes con una cámara a través de un objetivo


sólo puede estar enfocado un elemento de la escena. Por lo tanto, cuando más
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 65

Figura 3.10: Fotografía tomada con una Nikon D3100 y un objetivo Sigma
10-20mm, de los llamados “gran angular”.

lejos se encuentren los demás objetos, más desenfocados se verán, y, depen-


diendo del valor de la apertura, el área de nitidez será mayor √ o menor (Fig.
3.11). Se mide en una escala normalizada en progresión de 2, y algunos
valores habituales son 1.0, 1.4, 2.0, 2.8, hasta 16, 22 ó 32, habituales en fo-
tografía. Además, la luminosidad es inversamente proporcional al tamaño de
la óptica y a su coste, siendo muy valorados aquellos objetivos más luminosos.

En línea con el parámetro anterior, se habla de la profundidad de cam-


po, que está relacionado con la apertura del iris de la óptica y hace referen-
cia a la distancia a la que puede estar un objeto enfocado. Es inversamente
proporcional a la apertura, por lo que las exigencias de iluminación serán
mayores cuanto mayor sea la profundidad de campo (Fig. 3.12). Depende,
asimismo, de la distancia del objeto a la lente y de la distancia focal: a menor
focal y mayor distancia del objeto a la lente, mayor profundidad de campo.

Además de los anteriores, se usan otros parámetros técnicos para definir


una óptica, como puede ser la magnificación. Se define como la relación
entre el tamaño de la imagen y el del objeto observado, y depende tanto de
la óptica como de la distancia existente entre ella y el objeto.

Por otra parte, la actuación de la óptica se puede evaluar con otros pará-
metros como son la uniformidad relativa de iluminación, la función de
modulación de transferencia, la aberración cromática o la distorsión.
El primero de ellos hace referencia a la variación de la intensidad lumínica
que se produce en la superficie de la óptica, en la que se observan pequeñas
66 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.11: Composición de varios objetivos en los que se muestran


distintas aperturas de diafragma y su valor correspondiente. Fuente:
www.bdebaca.com/blog–tutoriales/profundidad-de-campo.

Figura 3.12: Ejemplo ilustrativo del concepto de profundidad de cam-


po y su relación con la apertura de diafragma. Fuente: https://
elcinenosdejaplanos.blogspot.com.es/2012/08/profundidad-de-campo.html.

diferencias entre los bordes y la zona central. Puede ser debido a motivos na-
turales en los bordes de la lente, o a un defecto mecánico que bloquea parte
de la luz (vignetting).

En cuanto a la MTF o Función de modulación de transferencia, es una


medida de la atenuación de una frecuencia, e indica la eficiencia de la transfe-
rencia de la óptica. La aberración cromática, por su parte, se produce por la
desigual refracción de las distintas longitudes de onda que llegan a la óptica
y se puede corregir con lentes específicas.
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 67

Figura 3.13: Objetivo empleado en este estudio, de f=25 mm con F1.4.

Figura 3.14: Ópticas telecéntricas. Fuente: http://www.infaimon.com

Figura 3.15: Algunos ejemplos de ópticas especiales: panorámica de imáge-


nes y medición de cavidad interior (izq.), y óptica pericéntrica que permite
una visión 3D periférica de objetos sin la ayuda de espejos (dcha.). Fuente:
http://www.infaimon.com
68 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Por último, la distorsión es el resultado de la difracción de los rayos de


luz en la lente, que puede provocar que las imágenes formadas presenten una
forma diferente a la real en el plano de la imagen. El espesor ligeramente
variable del vidrio con el que se fabrica la lente, y la falta de planicidad de
las superficies, son responsables de esta distorsión, que alcanza su máximo
en los bordes.

Dependiendo de las necesidades del sistema de visión desarrollado, deberá


seleccionarse la óptica más adecuada de entre los siguientes tipos:
Ópticas estándar (Fig. 3.13): disponibles en distancias focales que van
desde 3.5 hasta 200mm, son las más habituales. Están diseñadas para
casos en los que el objeto se sitúe a pocos centímetros de la lente, hasta
el infinito. Disponen de tornillos de fijación para el iris y el enfoque y
son de construcción robusta, resistente a las vibraciones y golpes sin
que el enfoque y la apertura se vean afectados.
Ópticas zoom estándar: con un control manual o motorizado, permiten
cambiar el zoom, enfoque y diafragma para capturar la imagen con
diferentes magnificaciones sin cambiar de óptica.
Ópticas zoom de precisión: su aplicación es similar a las anteriores, pero
con una mayor precisión requerida.
Ópticas para cámaras de alta resolución: este tipo de ópticas se diferen-
cia de las estándar en su calidad, ya que presenta una menor distorsión
y un MTF mayor.
Ópticas para microcámaras o microópticas: concebidas para conectarse
a microcámaras o cámaras de cabezal remoto.
Ópticas de gran formato: concebidas para cámaras en las que el sensor
es mayor de lo convencional. Habitualmente, se componen de varios
módulos, que precisan de adaptadores y espaciadores para lograr la
distancia de enfoque buscada.
Ópticas telecéntricas (Fig. 3.14): se aplican en aquellos sistemas donde
se realizan medidas de precisión, especialmente cuando se tiene una
cierta profundidad de campo. Se pueden acoplar a cámaras estándar
para tomar imágenes sin la proyección de perspectiva producida por
los rayos que no son perpendiculares a la óptica.
Ópticas especiales (Fig. 3.15): de tipo periscopio, para superficies inte-
riores, endoscopios industriales, adaptadores para microscopios, ópticas
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 69

de 60o y de 185o , son algunos ejemplos de ópticas no convencionales es-


pecíficamente desarrolladas para aplicaciones muy concretas.

Multiplicadores: su finalidad es aumentar la magnificación sin cambiar


la distancia de trabajo, colocándolos entre la óptica y la cámara.

Tubos o anillos de extensión: se han concebido para permitir el enfoque


de regiones de menor tamaño o más cercanas de las que permitiría la
óptica de manera estándar, y se pueden combinar para lograr mayores
longitudes. Su funcionamiento se basa en el hecho de que cuanto mayor
sea el espacio entre el elemento trasero del plano del sensor y la óptica,
más cerca podrá estar el objeto para lograr su enfoque. Así, los tubos de
extensión permiten aumentar la distancia entre el objetivo y el sensor
de la cámara, logrando así imágenes ampliadas de la escena.

Tipos de sensores y cámaras


Las cámaras empleadas en el campo de visión artificial son de una sofis-
ticación mayor que las convencionales, ya que permiten controlar multitud
de parámetros adicionales para ajustar el comportamiento del sistema a los
requisitos de la aplicación científica o industrial desarrollada.

Los sensores incorporados en las cámaras tienen la función principal de


capturar la luz recibida y proyectar una imagen del objeto observado para
posteriormente transferirla a algún sistema electrónico para su visualización,
almacenamiento o interpretación. Se podrían clasificar según distintas carac-
terísticas, presentándose a continuación las principales.

En primer lugar, dentro de las cámaras empleadas en visión artificial en-


contramos dos grandes familias: (1) lineales y (2) matriciales.

(1) Las cámaras lineales constan de sensores lineales de gran calidad con
los cuales se toman líneas individuales del objeto en cuestión para posterior-
mente construir la imagen completa mediante la relación de dichas líneas.
Se precisa el desplazamiento relativo de la cámara y el objeto, de modo que
se capturen líneas de toda su extensión. Se caracterizan habitualmente por
el número de elementos del sensor y por su velocidad. El primero indica el
tamaño del sensor, que condiciona la óptica necesaria, mientras el segundo
determina el número de píxeles que pueden leerse por unidad de tiempo. Este
es precisamente uno de los puntos fuertes de las cámaras lineales frente a las
matriciales: su mayor velocidad [61].
70 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.16: Sensores CCD (izquierda) y CMOS (derecha) de Teledyne Dalsa.


Fuente: www.teledynedalsa.com.

(2) Las cámaras matriciales, a diferencia de las anteriores, están com-


puestas por un sensor formado por una matriz de píxeles, de manera que
se produce la imagen de un área. Habitualmente, se trata de sensores CCD
(Charge Coupled Devices) o CMOS (Fig. 3.16), que convierten los fotones en
carga eléctrica a través de un material sensible a la luz.

Otra clasificación que no es excluyente de la anterior se basa en la región


del espectro que capturan las cámaras. Así, podemos hablar de: cámaras mo-
nocromas, a color o infrarrojas/térmicas. Mientras que las primeras registran
las imágenes en escala de grises, las cámaras a color capturan las componen-
tes RGB y las infrarrojas/térmicas (que determinan la temperatura de los
objetos según su radiación infrarroja) capturan la radiación infrarroja lejana,
más allá de 1µm.

Las cámaras térmicas capturan la energía irradiada por los objetos en


las longitudes de onda del espectro infrarrojo (Fig. 3.17), aprovechando que
hay bandas de longitud de onda con buenas capacidades de transmisión de
esta energía [238]. Algunas de las aplicaciones más habituales de las cámaras
infrarrojas son la detección de problemas de salud (que se hacen patentes por
una distribución anormal de la temperatura de la piel humana) [115, 127],
detección de defectos en piezas manufacturadas [185,233], detección de fugas
en instalaciones [146], clasificación de distintos productos naturales [6], por
ejemplo.
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 71

Figura 3.17: Espectro de funcionamiento de las cámaras infrarrojas. Adapta-


do de http://www.flir.es.

Dependiendo de las longitudes de onda captadas, se diferencian tres casos:

Longitud de onda infrarroja de banda larga o LWIR: de 9 a 12 µm, se


caracteriza por la buena visibilidad de los objetos terrestres.

Longitud de onda infrarroja de banda media, MWIR o MIR: de 3,3 a


5,0 µm, presenta menores niveles de ruido ambiental que el anterior.

Luz visible y de longitud de onda infrarroja corta (SWIR) o de infra-


rrojo cercano (NIR): de 0,35 a 2,5 µm, tiene los mayores niveles de
claridad y resolución de las tres bandas, ya que esta tiene picos de ilu-
minación solar y elevada transmisión. Estos sensores aprovechan, en
gran medida, luz reflejada por lo que sus imágenes son similares a las
del espectro visible monocromo en cuanto a resolución y detalle (Fig.
3.18).

Por su velocidad de captura, se distinguen las cámaras de alta veloci-


dad con sensor CMOS, caracterizadas por una velocidad de captura desde
1.000 hasta 1.000.000 imágenes/s. Su principal campo de aplicación son prue-
bas en las que se requiere el análisis de sucesos de elevada velocidad, que el
ojo humano no es capaz de observar, como balística, fluidos, etc. (Fig. 3.19).

Otro tipo de equipo son las cámaras 3D, capaces de tomar medidas
en tres dimensiones del espacio a partir de la imagen 2D gracias a distintas
72 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.18: Comparación de un par de imágenes tomada con una cámara


ordinaria (espectro visible, izquierda) y con una cámara SWIR (derecha).
Fuente: http://www.xenics.com/es.

Figura 3.19: Ejemplo de fotografía de alta velocidad. Foto de Jasper Nance,


https://www.flickr.com/photos/nebarnix/

técnicas (con un sistema de análisis de luz estructurada, mediante tiempo de


vuelo, con varias cámaras o con cámaras estereoscópicas) que se describirán
en la sección 3.4 [63].

La principal característica es que esta medida de la tercera dimensión de


los objetos se realiza a distancia, sin contacto físico, de modo que se trata
de una técnica no intrusiva que abre un abanico de posibilidades a la hora
de analizar los objetos observados. Sus aplicaciones son múltiples, no sólo
en el campo de la industria sino también en el estudio y restauración del
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 73

patrimonio [3]. Además, algunas de estas cámaras pueden funcionar en mo-


do Multiscan, en que adquieren en distintas regiones del sensor información
tridimensional, monocroma o de color, por ejemplo.

Las cámaras Multiscan (Fig. 3.20) han supuesto un gran avance en el


campo de la visión artificial, ya que la posibilidad de adquirir varias imáge-
nes y datos de distinta naturaleza simultáneamente elimina la necesidad de
emplear múltiples cámaras para cada parámetro a medir, con la consiguiente
simplificación del sistema de visión [177]. Además, la velocidad de adquisi-
ción de los datos deseados ha aumentado con el desarrollo de las modernas
cámaras Multiscan, y actualmente la industria tiende a demandar este tipo
de equipos en los que de una sola pasada se pueden tomar datos de múltiples
espectros de luz, dimensiones, color u otra información requerida [177].

Figura 3.20: Esquema que muestra la adquisición de imágenes de diferente


naturaleza con una cámara Multiscan y dos fuentes de iluminación: se obtiene
la intensidad que indica la tercera dimensión del objeto, la imagen en escala
de grises, y las componentes R, G y B de una sola pasada.

Un caso particular de cámaras son las llamadas smart cameras o “cámaras


inteligentes”, que constituyen un sistema de visión integrado y simplifi-
can los tradicionales. En aplicaciones industriales de complejidad moderada,
actualmente es habitual el uso de estos sistemas (Fig. 3.21). En el cabezal de
estos dispositivos se agrupan el sensor (que puede ser monocromo, de color
o infrarrojo cercano), la cámara (lineal o matricial), el procesador, las cone-
xiones y las entradas/salidas, permitiendo conectar en un único elemento de
proceso varios cabezales de visión remotos.
74 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.21: Modelo de “smart camera” o sistema de visión integrado de


Teledyne Dalsa. Fuente: www.teledynedalsa.com.

De este modo, estas “cámaras inteligentes” constituyen un sistema de


visión artificial completo en un solo componente. El coste de estos sistemas
suele ser inferior al de los tradicionales, por lo que constituyen una alternativa
interesante para un buen número de aplicaciones industriales en las que las
operaciones a controlar con el sistema están acotadas o son de complejidad
baja a moderada [236]. Habitualmente, incorporan software sencillos, con
escasa o nula programación, que el cliente puede manejar y ajustar fácilmente.

3.2.2. Elementos de software del sistema


Transmisión de datos al PC
Los datos adquiridos por la cámara deben ser transmitidos al PC para,
mediante el software elegido, realizar su análisis. Esta comunicación entre la
cámara y el PC puede realizarse de varias maneras, pudiendo diferenciar dos
situaciones, principalmente: con frame grabber o sin él.

Actualmente, los interfaces de conexión de las cámaras de visión artificial


son: USB2, Cameralink, Cameralink HS, Firewire, Gigabit Ethernet (bajo el
estándar GigE Vision) o las recientes USB3 y Coaxpress. Tanto esta última
como la interfaz Cameralink requieren el uso de un frame grabber.

La función básica del frame grabber es recibir las imágenes capturadas


por la cámara, almacenarlas y enviarlas al ordenador con la mejor calidad
posible para su posterior análisis.
3.2. ELEMENTOS SISTEMA VISIÓN ARTIFICIAL 75

En aquellos sistemas en que se requiere la captura de imágenes a alta


velocidad es habitual montar este componente, solventando así la limitada
velocidad de proceso de los ordenadores frente a la alta velocidad de adqui-
sición de imágenes.

Software de tratamiento de imágenes


A pesar de que las técnicas de visión artificial son relativamente recien-
tes, la mayoría de los algoritmos empleados actualmente en el análisis de
imagen datan de los años 60 [235]. Desde entonces, el desarrollo de ordena-
dores cada vez más potentes y accesibles para los usuarios llevó también a
la aparición de numerosos programas a cargo de las principales empresas del
sector como Microscan (www.microscan.com), Matrox (www.matrox.com),
MVTec (www.mvtec.com) o Teledyne Dalsa (www.teledynedalsa.com), por
citar algunas.

Las librerías de visión actuales presentan la ventaja de que se pueden


instalar en entornos estándar tanto a nivel de procesador, como de sistema
operativo (desde Windows hasta Linux). Asimismo, es habitual el uso de
entornos de programación escalables que facilitan la definición de un nuevo
sistema de visión.

Según sus funciones, se pueden distinguir dos grandes grupos de softwa-


re, que no tienen por qué ser mutuamente excluyentes: de adquisición y de
procesado de imágenes.

En términos generales, cuando se habla de software de visión se suele


diferenciar entre varios niveles según su complejidad a nivel usuario y las
posibilidades de desarrollo de aplicaciones específicas:

Sistemas de programación a bajo nivel: se basan en SDK (Software


Development Kit en inglés, Kit de Desarrollo de Software en español)
y emplean lenguajes de programación como Visual Basic o Visual C.
Requieren amplios conocimientos tanto del hardware como del software
de visión, y emplean librerías en dll o Active X. Algunos ejemplos son
Halcon de MvTec [163], Sapera LT de Teledyne Dalsa [216] o Matrox
Imaging Library de Matrox [156].

Interfaz gráficas de usuario o GUI: constituyen entornos gráficos de pro-


gramación. Sherlock [214] e iNspect Express [215], ambos de Teledyne
Dalsa, son dos ejemplos de este tipo de software.
76 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Sistemas de programación por menú: se trata de entornos en los que a


través de menús se configuran los aspectos necesarios para la aplicación
concreta, sin la necesidad de programar como tal.

Aplicaciones específicas: constituyen el caso más sencillo a nivel usua-


rio, y son capaces de realizar tareas concretas sin requerir ninguna
programación adicional. Por ejemplo, iGuard de IDS Imaging [108], un
software de seguridad y vigilancia.

La elección entre el amplio abanico de posibilidades obedecerá a varios


factores, como el nivel de conocimiento de programación y sistemas de vi-
sión, velocidad requerida de la aplicación, complejidad de la misma, tiempo
disponible para su desarrollo, y, cómo no, el coste, por nombrar algunos.

3.3. Parámetros a controlar en el sistema de


visión artificial
La resolución del sensor, que representa el número de elementos sensi-
bles que posee, condiciona el tamaño de la escena que cubre cada píxel, y
por lo tanto la fidelidad o detalle de la imagen formada. A mayor resolución,
mayor definición, pero también mayor coste computacional a la hora de rea-
lizar los análisis y a la hora de adquirir el equipo.

Otro parámetro que define el sensor es su sensibilidad, que determina el


rango de longitudes de onda que es capaz de capturar. La Figura 3.22 mues-
tra la respuesta de la cámara ColorRanger E50 empleada en este proyecto.

El tiempo de exposición, que se relaciona directamente con la velo-


cidad de obturación, es uno de los parámetros clave. Se relaciona con la
velocidad del obturador del sensor y representa el tiempo durante el cual se
permite la entrada de luz para formar la imagen en el mismo. Debe tenerse
en cuenta la velocidad a la que pasará el objeto a capturar y la iluminación
de la escena, principalmente: si el objeto pasa a gran velocidad, el tiempo
de exposición deberá ser corto y por lo tanto la iluminación deberá ser más
intensa [61].

Un concepto también relacionado con el funcionamiento del obturador es


la integración, que indica el tiempo que los píxeles acumulan luz. En aque-
llas aplicaciones en las que la iluminación sea escasa, se puede emplear este
parámetro para aumentar la sensibilidad de la cámara y compensar así las
3.3. PARÁMETROS A CONTROLAR EN EL SISTEMA DE VISIÓN ARTIFICIAL77

Figura 3.22: Respuesta aproximada de los distintos filtros de las filas de


color estándar. Mediante la línea negra se indica la respuesta de las filas no
cubiertas por ningún filtro del sensor. Fuente: http://www.sick.com.

condiciones lumínicas en que se debe realizar la captura de la imagen. Como


es lógico, el tiempo de integración viene limitado por el ruido térmico que
presente el sensor.

El accionamiento del obturador se puede controlar mediante un dispa-


rador o trigger, un mecanismo electrónico-mecánico que da la orden de
iniciar la captura. Dependiendo de cómo se inicia la captura diferenciamos
dos modos de captura: síncrona o asíncrona. En el modo asíncrono, el
obturador se libera en el instante en que la señal externa de disparo llega a
la cámara, mientras que en el modo síncrono el obturador se libera cuando
llega la señal de sincronismo vertical [61].

Dependiendo del tipo y tamaño del sensor, se pueden diferenciar varios


tipos de transferencia: transferencia interna línea (ITL), transferencia de
cuadro y transferencia de cuadro entero o full frame.

Transferencia interna línea (ITL): es la tecnología de los sensores CCD


comunes, en que se emplean registros de desplazamiento intercalados
entre las líneas de píxeles para almacenar los datos de la imagen y
transferirlos a continuación. Tiene una velocidad de obturación elevada,
pero como hándicap presenta una menor sensibilidad y precisión con
respecto a las otras tecnologías. Su factor de relleno (la proporción del
área del píxel sensible a la luz) y rango dinámico son menores.
78 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Transferencia de cuadro: se da en los sensores CCD que poseen un


área dedicada al almacenamiento de la luz diferenciada del área activa,
además de otra área para los píxeles activos gracias a los cuales el factor
de relleno es mayor. Sin embargo, estos sensores son más costosos y su
velocidad de obturación es menor que en el primer tipo.

Transferencia de cuadro entero o full frame: se trata de sensores con


una arquitectura menos compleja, en los que se emplea un registro
paralelo simple para almacenar la exposición de los fotones, integrar y
transportar la carga.

En el caso de montar un frame grabber en el sistema (componente físico


que recibe y almacena la imagen de la cámara, y la transfiere al ordenador),
se habla también de los conceptos de sincronización y píxel clock, referi-
dos a la recuperación del sincronismo de la captura de imágenes cuando hay
una interrupción en la toma de datos.

Cuando se cambia de una cámara a otra, o cuando un frame grabber tiene


entradas multiplexadas, los cambios en el origen de las imágenes hacen que
el frame grabber pierda el sincronismo, necesitando una señal de sincronismo
independiente para ser capaz de interpretar correctamente la señal de vídeo
recibida.

3.4. Medición en 3D
La medición de objetos en las tres dimensiones con un sistema de visión
artificial se puede realizar de acuerdo con varios métodos que se diferencian
en la manera en que se determina la altura o profundidad del objeto obser-
vado (dimensión que coincide con el eje longitudinal de la cámara). Sea cual
fuere el método de cálculo de la tercera dimensión, una característica común
es la ausencia de contacto físico con el objeto a medir, lo que convierte a este
tipo de técnicas en no-invasivas e inocuas [3].

Algunos de los más empleados son los siguientes:

1. Triangulación o visión en estéreo: utilizando una cámara estéreo, carac-


terizadas por poseer dos o más lentes con su respectivo sensor. Simulan
la visión humana y capturan imágenes tridimensionales producto de
la unión de los pares de imágenes capturadas. Es un método menos
robusto en comparación con los que se basan en luz estructurada [22].
3.4. MEDICIÓN EN 3D 79

2. Triangulación con plano de luz (sheet of light triangulation) o trian-


gulación láser: la distorsión de un haz de luz que ilumina el objeto
observado permite calcular la tercera dimensión de cada perfil de di-
cho objeto. Habitualmente, se emplea una luz láser, cuyo punto de luz
se deforma con un espejo para conseguir una línea. De este modo, se
analiza la distorsión de este haz al incidir sobre la escena e intersecar
con la superficie del objeto (Fig. 3.23), precisando un desplazamiento
relativo entre el objeto y el láser para lograr hacer un barrido en toda
la extensión del objeto. Al formar un ángulo entre el haz láser y la
cámara, las variaciones en el espesor de dicho objeto se podrán calcular
a partir de la desviación del ángulo original. En este caso, la precisión
vendrá determinada por la geometría de la pieza y la posición relativa
cámara-láser, siendo la oclusión y las sombras los principales problemas
(Fig. 3.28).

Figura 3.23: Esquema de funcionamiento del método de triangulación láser


3D, en el que un láser incide sobre los objetos a observar y la cámara registra
la deformación de la línea láser (adaptado de [202]).

3. Luz estructurada: se podría contemplar como una variante del méto-


do anterior, ya que una sola imagen iluminada con luz estructurada
permite obtener la información de todo el objeto en 3D. La luz es-
tructurada consiste habitualmente en un conjunto o patrón de líneas
paralelas horizontales y/o verticales, o en puntos, que al incidir sobre el
objeto observado se adapta a su superficie y realza su forma. Midiendo
80 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.24: Ejemplo de aplicación de un patrón de luz estructurada com-


puesto por una nube de puntos (imagen izquierda) y el modelado 3D de
la superficie resultante (en el medio, vista frontal, y a la derecha, vista en
perspectiva). Tomado de [193].

su distorsión mediante una o, más habitualmente, varias cámaras se


puede calcular la geometría tridimensional del objeto, permitiendo así
realizar el modelado 3D de los objetos (Fig. 3.24).

4. Tiempo de vuelo (time of flight, ToF): el principio básico consiste en


considerar el tiempo de vuelo de la luz desde que se emite, hasta que
se recibe después de ser reflejada en la superficie del objeto observa-
do. Así, con el mismo principio de funcionamiento que los radares, el
tiempo que tarda en regresar a la cámara el pulso de luz se utiliza para
calcular la profundidad del objeto (la distancia hasta su superficie en
cada punto) [123]. A pesar de la aparente sencillez del modelo, presen-
ta inconvenientes a la hora de obtener medidas de precisión, ya que la
medida del tiempo y la generación de pulsos de luz emitida conllevan
una cierta incertidumbre inherente a sus tasas de repetición [123]. Una
posible solución es el uso de disparadores de imagen de elevada veloci-
dad, con los que se mide la intensidad de luz acumulada en lugar del
tiempo de vuelo de la luz pulsada [107]. En este caso, el emisor genera
un pulso láser infrarrojo (llamado light wall ) y el receptor acumula la
luz reflejada, que viene acompañada de una imagen de los objetos. La
información de la profundidad se extrae de la deformación del pulso
láser infrarrojo original (deformed light wall ) al proyectarla sobre el
sensor CCD y bloquear la luz entrante (Fig. 3.25).

5. Interferometría: se emplea un instrumento óptico llamado interferóme-


tro, con el que se divide un haz de luz proveniente de una única fuente
3.4. MEDICIÓN EN 3D 81

Figura 3.25: Ejemplo ilustrativo del principio de medida de intensidad de


luz, en el que (a) se emite una light wall, que (b) es reflejada por el objeto.
En (c) se representa la luz reflejada total del objeto, mientras que en (d) se
observa la porción de luz “cortada” por el sensor, cuyo tamaño es inversamente
proporcional a la distancia del objeto al sensor. Tomado de [123].

en dos haces para recombinarlos y crear un patrón de interferencia. A


partir de este patrón, se pueden analizar las diferencias entre ambos
haces y determinar las características dimensionales de la superficie so-
bre la que inciden. Así, considerando que el rango de la imagen es una
función más o menos continua de las coordenadas de la imagen, se pue-
de obtener la profundidad a partir del cambio de fase de la luz reflejada
con respecto a la fuente de luz llamada “luz coherente”. La fuente de luz
puede ser monocromática o blanca, dependiendo de la aplicación. Es un
método empleado con frecuencia en microscopios [180], en aplicaciones
médicas [112] o en astronomía [184], por ejemplo.

6. Apertura codificada: utilizando aperturas de geometría conocida que


dejan pasar o no la luz desde el objeto hacia la cámara, se puede obtener
información de su profundidad con técnicas de convolución inversa. Se
pueden usar distintas formas (Fig. 3.26) para la apertura codificada
dependiendo de la aplicación concreta, así como de la cámara empleada
[121,130]. En síntesis, la forma del objeto medido se reconstruye a partir
del desenfoque del patrón proyectado (que proviene del proyector con
82 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.26: Dos ejemplos de aperturas codificadas con distintos niveles de


transmisión (los píxeles blancos permiten el paso de la luz, mientras que los
negros la bloquean). Tomado de [191].

apertura codificada). Un primer paso consiste en la calibración de los


efectos del desenfoque registrado, estimando la profundidad a partir de
dicho desenfoque. Seguidamente, tras la calibración es posible estimar
la profundidad del patrón observado al ser proyectado sobre el objeto.

En esta investigación se ha utilizado el método de triangulación con un


haz de luz, por ser de los más extendidos en las aplicaciones industriales y
adecuarse perfectamente a nuestros objetivos. En este método, una fina línea
de luz se proyecta contra la superficie del objeto a reconstruir, capturando
dicha imagen con la cámara. La proyección de la línea de luz (por ejemplo,
un haz láser) construye un plano llamado “plano de luz” (sheet of light en
inglés). El eje óptico de la cámara y el plano de luz forman el ángulo de
triangulación, y la intersección entre la línea láser y la visión de la cámara
depende de la altura del objeto. Si el objeto tiene una determinada altura,
la línea láser no se aparecerá como una línea sino que representará un perfil
del objeto, gracias al cual se puede obtener la diferencia de altura del mismo.
Desplazando el objeto por el sistema de medida, se obtienen todos los perfiles
que permitirán reconstruir la superficie completa.

Los elementos necesarios son básicamente un proyector de línea de luz


(habitualmente un láser), una cámara, un sistema de posicionamiento (por
ejemplo, una cinta transportadora) y el objeto a medir. En el sistema, la
relación entre el proyector de luz, la cámara y el sistema de posicionamiento
se mantienen invariables, mientras que el objeto a medir sí se traslada.
3.4. MEDICIÓN EN 3D 83

Figura 3.27: Distintas configuraciones del sistema de triangulación con plano


de luz. Adaptado de [164].

La posición relativa de la cámara y el proyector de luz puede variar de un


sistema a otro, siendo las disposiciones posibles las mostradas en la Figura
3.27.

La configuración debe seleccionarse en función de las características geo-


métricas del objeto a medir, procurando minimizar las sombras y oclusiones
(Figura 3.28). En cualquier caso, el ángulo de triangulación debe estar entre
30o y 60o para lograr una buena precisión sin muchos problemas de oclusiones
y sombras.

Calibración del sistema

La finalidad de la calibración del sistema es relacionar los parámetros


geométricos de los objetos observados por la cámara con los de las imágenes
formadas. Para ello, los procesos de calibración suelen basarse, a nivel prácti-
co, en la determinación de los parámetros intrínsecos de la cámara (distancia
focal, distorsión de la lente, centro del plano del sensor) a partir de una
geometría conocida y observada en unas condiciones de escena controladas.
84 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

 
     
      


  

   

    

 
 
 
  
  
  

  
  
 
 

  

 



  
 

   
 



    



   

     


     
 






 



   
  
  
   

  

   

Figura 3.28: Problemas de sombras (arriba) y oclusiones (abajo). Adaptado


de [164].

El objetivo, matemáticamente hablando, consiste en determinar el vector de


traslación y la matriz de rotación que permite relacionar los puntos del es-
pacio observado con los puntos correspondientes proyectados en el sensor.

Desde un punto de vista teórico, en las aplicaciones de visión artificial


se suele emplear la calibración de Tsai [220] para determinar el vector de
traslación y la matriz de rotación. Asimismo, se tiene en cuenta la ligadura
radial relativa a la calibración coplanar [241]. Siguiendo la notación y el mo-
delo espacial de la Figura 3.29 ya aplicados por Martínez [150], se definen los
sistemas de referencia del mundo real (Or Xr Yr Zr ), de la cámara (Oc Xc Yc Zc ,
que sufrió una rotación R y una traslación T), del plano de proyección τp
(Op Xp Yp Zp ), cuya distancia focal efectiva es df y del sensor (Ou Xu Yu ).

De este modo, dado un punto en coordenadas reales Pr = (xr , yr , zr ),


su correspondiente proyección sobre τp será Pp = (xp , yp ) de manera ideal,
y Pd = (xd , yd ) si se considera la distorsión provocada en la lente. Por su
parte, dado un punto (xu , yu ) del plano de proyección, el punto Op tendrá las
coordenadas (xuop , yuop ) con respecto al sistema de coordenadas en píxeles
Ou Xu Yu .
3.4. MEDICIÓN EN 3D 85

Figura 3.29: Modelo espacial del modelo de calibración de Tsai [150, 220].

Teniendo en cuenta que la transformación del sistema de referencia del


mundo real al de la cámara se obtiene a partir de un vector de traslación
T = (Tx , Ty , Tz ) y una matriz de rotación R = (rij ), se pueden escribir las
ecuaciones de calibración incluidas en [150]:

(xu − xuop ) r11 xr + r12 yr + r13 zr + Tx


(1 + k1 q 2 ) = df (3.1)
Nx r31 xr + r32 yr + r33 zr + Tz

(yu − yuop ) r21 xr + r22 yr + r23 zr + Ty


(1 + k1 q 2 ) = df (3.2)
Ny r31 xr + r32 yr + r33 zr + Tz

en las que Nx y Ny representan cuántos píxeles hay por unidad de longitud


en la imagen en los ejes Xu e Yu , k1 es el coeficiente de distorsión
 radial de
 
(xu −xuop ) 2 (yu −yuop ) 2
primer orden de la óptica, y se cumple que q 2 = Nx
+ Ny
.

Por otra parte, se define otra ecuación de calibración del plano de trian-
gulación del láser τl , tomando el hiperplano Al x + B l y + C l z + Dl = 0 con
respecto a su sistema de coordenadas e incorporando las anteriores ecuaciones
3.1 y 3.2, definiéndose así la expresión [245]
86 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Al (r11 xr + r12 yr + r13 zr + Tx ) + B l (r21 xr + r22 yr + r23 zr + Ty )+ (3.3)

+C l (r31 xr + r32 yr + r33 zr + Tz ) + Dl = 0

Así, las ecuaciones 3.1, 3.2 y 3.3 definen la calibración Tsai completa.

En el proceso de calibración del sistema desarrollado en este proyecto de


investigación deben tenerse en cuenta algunos aspectos, que darán lugar a
una simplificación práctica de este proceso.

En primer lugar, hay que recordar que las medidas se realizan sobre una
cinta transportadora plana. Sin embargo, aunque la cinta se haya fabricado
con extrema precisión y se mueva sobre una superficie absolutamente plana,
no es posible calibrar todos sus puntos ya que el sistema se detiene por mo-
tivos de calibración, por ejemplo, mientras la cinta continúa en movimiento.
En consecuencia, no siempre es posible saber con exactitud qué sección de la
cinta se está escaneando.

En segundo lugar, aunque es necesario estimar las dimensiones y las ca-


racterísticas de textura de las placas, no es necesaria una gran precisión en
estas medidas, ya que la finalidad es la inspección o detección en las imáge-
nes, por lo que se admite un cierto margen de error (5 %) de medida.

Teniendo en cuenta lo anterior, se aplican las siguientes hipótesis al mo-


delo de calibración de Tsai citado con el objetivo de reducir el tiempo de
procesado de las imágenes y las variables manejadas:

1. La cámara y su sensor están en posición exactamente cenital para ase-


gurar el paralelismo con el plano de medida. Es decir, R = I.

2. No existe distorsión radial, por lo que k1 = 0.

3. No existen diferencias de resolución a lo largo de distintas direcciones,


por lo que Nx = Ny .

4. El haz láser pasa por el eje Yc , por lo que Al xr + C l zr = 0.

5. Las placas tienen un espesor muy pequeño en comparación con su des-


plazamiento, es decir, z <<< Tz ⇒ zr + Tz ' Tz .
3.5. MÉTODOS DE ANÁLISIS DE IMAGEN 87

De este modo, con tales hipótesis se puede reescribir el problema de cali-


bración como:

(xu − xuop ) xr + Tx xr + Tx
= df ' df (3.4)
Nx zr + Tz Tz
(yu − yuop ) yr + Ty yr + Ty
= df ' df (3.5)
Nx zr + Tz Tz
Al xr + C l zr = 0 (3.6)

Estas hipótesis son totalmente válidas para el caso de las placas de piza-
rra, ya que la pérdida de precisión se ve compensada por la simplicidad del
proceso. Además, para esta aplicación industrial es perfectamente asumible
una pequeña pérdida en la precisión de las medidas. Esta simplificación de
las ecuaciones (3.4), (3.5) y (3.6) hace que el proceso de calibración pueda
ejecutarlo personal menos experimentado, reduciendo así el coste operacional
de una tarea que deberá repetirse periódicamente para mantener un funcio-
namiento del sistema homogéneo a lo largo del tiempo.

3.5. Métodos de análisis de imagen


La detección de defectos superficiales puede realizarse mediante diversas
estrategias de análisis de imagen. Karimi y Asemani presentan en [120] una
recopilación de los algoritmos de procesado de imagen empleados en los tra-
bajos de investigación que atacaron el problema de la detección de defectos,
diferenciando las siguientes categorías: (1) aplicación de filtros, (2) técnicas
de estructura, (3) métodos estadísticos y (4) técnicas basadas en modelos.

(1) La aplicación de filtros se basa en el uso de traslaciones y filtros


matemáticos o métodos de reconocimiento de patrones. Ejemplos: la trans-
formada Wavelet, la transformada Contourlet, los algoritmos genéticos, el
algoritmo de Análisis de Componentes Independientes (ICA), las redes neu-
ronales y los filtros de Gabor.
Transformada Wavelet: se usan dos filtros, uno de paso bajo y otro de
paso alto, para extraer las características texturales de la imagen [81].
Se señala la utilidad de este método para la detección de cambios suaves
de textura [126], pero también la dependencia del número de datos
disponibles para el entrenamiento [239] y la importancia de la selección
de la onda adecuada [120].
88 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Transformada Contourlet: basada en la anterior, combina un laplaciano


piramidal con un banco de filtrado directo en dos dimensiones. Muestra
buenos resultados en la mejora de imágenes y eliminación de ruido
[69], pero la necesidad de información extra para la transformada es la
principal desventaja [120].

Algoritmos genéticos: basados en la biología, este tipo de algoritmos


pretende replicar comportamientos biológicos a partir de la selección
natural y de la genética, ejecutando tareas de búsqueda de una so-
lución óptima al problema planeado [85, 100]. Si se establecen las ca-
racterísticas de los píxeles correspondientes a defectos superficiales, los
algoritmos genéticos pueden analizar las relaciones estadísticas existen-
tes entre ellos y optimizar tales parámetros. A pesar de que se considera
un método simple, la etapa de entrenamiento presenta una complejidad
elevada [243].

Algoritmo de Análisis de Componentes Independientes (ICA): es un


método de separación de fuentes que, aplicado al procesamiento de
imágenes, supone que cada imagen es la combinación de dos o más
imágenes independientes, las cuales trata de definir [106]. En la de-
tección de defectos, se supone que la imagen se compone de una capa
(imagen) de defectos mezclada con una imagen de fondo, por lo que
el algoritmo trata de separar la imagen en primer término del fondo.
Este método requiere disponer de una imagen patrón sin defectos, y la
presencia de ruido en las imágenes afecta drásticamente a los resultados
obtenidos [219].

Redes neuronales: se emplean como clasificador en los sistemas de de-


tección de defectos a partir del análisis de imagen, para lo que se pre-
cisa extraer un vector de características de la imagen estudiada. De
este modo, la red neuronal clasifica los vectores de características como
patrones defectuosos o sin defectos [134].

Filtros de Gabor: estos filtros se caracterizan por tener la misma repre-


sentación en los dominios espacial y de frecuencia, y se obtienen a partir
de la combinación de una función exponencial y una Gaussiana [113].
Autores como Chen et al. propusieron un método para la detección de
defectos en la industria textil basado en los filtros Gabor [50], pero la
complejidad computacional es elevada y requiere una imagen exenta de
defectos para su correcta aplicación.
3.5. MÉTODOS DE ANÁLISIS DE IMAGEN 89

(2) Las técnicas de estructura principales son los algoritmos de detec-


ción de bordes y el procesamiento morfológico de imágenes.

Algoritmos de detección de bordes: los bordes se definen como una fron-


tera entre dos regiones diferentes de una imagen, y se pueden detectar
a través de varios métodos como el gradiente, el uso de umbrales o de
algoritmos que emplean los pixeles de la imagen para enfatizar estas
fronteras [95]. Los defectos superficiales se pueden encontrar con estos
métodos.

Métodos morfológicos: a partir de la morfología de las imágenes binarias


o en escala de grises es posible mejorar, suavizar y reducir el ruido
en aquellas imágenes defectuosas a partir de los valores de un píxel
y sus vecinos [58, 90]. Asimismo, se pueden usar para la detección de
bordes [32].

(3) Los métodos estadísticos se caracterizan por su simplicidad y baja


complejidad. Se suelen emplear las matrices de co–ocurrencia, los histogra-
mas, la distribución de Weibull y la autocorrelación.

Histogramas: describen el número de pixeles para nivel de iluminación


de la imagen, por lo que en ellos es habitual poder identificar las regio-
nes defectuosas como intervalos de iluminación fuera de lo normal. De
este modo, con un umbral o threshold adecuado se puede extraer la re-
gión o regiones que representen un defecto [205]. Es un método sencillo
de implementar, pero en ocasiones conlleva errores considerables [166].

Matrices de co–ocurrencia: en una imagen en escala de grises, estas ma-


trices contienen información sobre la relación existente entre los valores
de pixeles vecinos. Para calcularlas es preciso seleccionar una dirección
de análisis de la imagen, a partir de la cual se computan las distancias
entre pixeles y su relación, siendo habitual el cálculo en seis direccio-
nes para la detección de defectos y extracción de características [68]. Se
suelen usar para la extracción de características como entropía, contras-
te, segundo momento angular, correlación y momento de la diferencia
inversa [174].

Distribución de Weibull: una textura aleatoria se puede analizar a tra-


vés de una distribución de este tipo dividiendo la imagen en varias
partes, calculando la amplitud del gradiente de cada parte, calculan-
do el histograma del gradiente de los trozos de imagen y ajustando
una distribución de Weibull a dichos histogramas. De este modo, una
90 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

vez obtenidos los parámetros de la distribución y considerándolos como


componentes del vector de características, los defectos de la imagen se
pueden calcular a través de la comparación de dichos parámetros [120].

Autocorrelación: representa la similaridad entre pixeles, y consiste en


analizar la correlación entre segmentos de imágenes y patrones para ha-
llar los defectos existentes. En un proceso de varias etapas, se comienza
extrayendo el patrón de textura original de una imagen sin defectos
(etapa de entrenamiento), se calcula a continuación la diferencia exis-
tente entre la imagen defectuosa y dicha textura patrón, y finalmente
la región defectuosa se diferencia del fondo a través de un umbral (th-
reshold) [62].

(4) Por último, las técnicas basadas en modelos aplican modelos de


procesamiento de imágenes como el Hidden Markov o el Auto–Regresivo
(AR). Se selecciona un modelo para analizar la imagen y se trata de hallar
los parámetros de dicho modelo.

Modelo de Hidden Markov: se considera un modelo formado por estados


interconectados cuyo nexo es una serie de líneas de probabilidad, y
donde cada característica de la imagen estudiada se asigna a un estado
[48]. Es un modelo complejo a nivel de computación estadística [120].

Modelos AR: una vez que se han determinado los parámetros de la


textura analizada, aquellas regiones cuya textura es incompatible con
los parámetros del modelo se consideran regiones defectuosas [148].
Tras una fase de entrenamiento, los resultados son no–determinísticos
y estadísticos, lo que se considera una desventaja [120].

Los métodos de análisis de imagen aplicados en este proyecto pertenecen


al segundo grupo, el de las técnicas de estructura. Por la naturaleza del
problema y las características de las imágenes a analizar, la detección de
defectos se ha basado en los algoritmos de detección de bordes y en las
técnicas de procesamiento morfológico, que se detallan en la siguiente sección.

Algoritmos de análisis de imagen empleados


El primero de los algoritmos empleados es el umbral o threshold, una
de las técnicas más simples y populares en el campo del análisis de imágenes,
cuyo objetivo es segmentar la imagen en regiones de interés (conocidas como
Regions of Interest, ROIs) y eliminar las regiones que carezcan de él.
3.5. MÉTODOS DE ANÁLISIS DE IMAGEN 91

El threshold global es aquél según el cual los pixeles se codifican como 0 si


no superan el umbral establecido, y 1 en caso contrario [190]. Sea a ∈ RX la
imagen fuente y [h, k] el rango de threshold. La imagen threshold b ∈ {0, 1}X
viene dada por, 
 1 si h ≤ a(x) ≤ k
b(x) =
0 en otro caso

Una variante del anterior es el llamado semithreshold, que asigna el valor


0 a los pixeles que no superan el umbral y mantiene el valor original de
aquellos que sí lo superan [190]. Sea a ∈ RX la imagen fuente y [h, k] el
rango de threshold. La imagen semithreshold b ∈ RX viene dada por,

 a(x) si h ≤ a(x) ≤ k
b(x) =
0 en otro caso

De este modo, estableciendo un valor umbral para la intensidad de los pi-


xeles de la imagen en cuestión, es posible segmentar las regiones de la placa
con respecto al fondo de la imagen, o de los defectos presentes en su superficie.

Otra de las técnicas empleadas es la detección de bordes, fronteras


o escalones (edges), una de las operaciones de mayor interés en la mayoría
de las aplicaciones de análisis de imagen además de la segmentación, el reco-
nocimiento de caracteres y el análisis de escena [150].

Las transformaciones de detección de bordes se pueden clasificar en varios


tipos según su base matemática [186]: de simple ventana para encontrar las
fronteras de objetos booleanos, de aproximación de gradiente, de aplicación
de plantillas con distintas orientaciones, o de intensidad local bajo modelos
de eje paramétricos.

El algoritmo empleado se basa en la definición de una región de interés en


la imagen, analizando sus valores de gris en pequeñas porciones para obtener
un perfil unidimensional, al cual se aplica un kernel de suavizado Gaussiano.
Analizando las derivadas de dicho kernel se obtiene la posición de los bordes
en la región de interés [163]. Se analiza así la presencia de irregularidades
superficiales, así como la geometría de la placa.

Dos operaciones fundamentales dentro del procesamiento morfológico de


una imagen son la dilatación y la erosión, que permiten eliminar el ruido
de una imagen y perfeccionar las regiones de interés detectadas, por ejem-
plo, tras la aplicación de un umbral. Se basan en un elemento estructural
92 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL

Figura 3.30: Resultado de la aplicación de distintos algoritmos de análisis de


imagen en un ejemplo de una moneda. De izquierda a derecha: imagen real,
resultado del umbral o threshold, resultado de la dilatación y de la erosión.
Fuente: [150].

que actúa como máscara, de modo que se aumenta (dilatación) o disminuye


(erosión) el tamaño de los objetos de la imagen (Fig. 3.30).

Dos algoritmos que se podrían definir como complementarios a los ante-


riores son el de conectividad (connectivity) y el de unión. El primero de
ellos determina los componentes conectados de una región, de modo que en
la práctica permite diferenciar las regiones individuales que componen una
región resultante de la aplicación de un umbral. El segundo realiza el paso
contrario, uniendo en una sola región aquellas que hayan sido independizadas.

Los cuatro algoritmos anteriores (erosión, dilatación, conectividad y unión)


son útiles para la detección y perfeccionamiento de defectos superficiales co-
mo los carbonatos y los sulfuros esperados en las placas de pizarra.

Una vez aisladas las regiones de interés, se calculan ciertos parámetros


geométricos que se definen a continuación: rectangularidad (rectangularity),
circularidad (circularity) y redondez (roundness). Se trata de factores de
forma que se calculan como sigue [163]:

Rectangularidad: dada una región, se calcula un rectángulo cuyos mo-


mentos de primer y segundo orden sean iguales a los de dicha región.
La rectangularidad se determina como la diferencia de áreas de la re-
gión normalizada con respecto al área del rectángulo calculado. Toma
valores de 0 a 1, siendo mayor cuanto más se aproxime la región a un
rectángulo perfecto.

Circularidad: este factor de forma calcula la similitud de la región con


respecto a un círculo. Nuevamente, sus valores van de 0 a 1, siendo este
3.5. MÉTODOS DE ANÁLISIS DE IMAGEN 93

último el valor para un círculo perfecto. Si F es el área de la región


y max es la máxima distancia del centro a todos los pixeles de su
contorno, el factor de forma C se define como:

F
C0 =
(max2 ∗ π)
C = mı́n(1, C 0 )

Redondez: es un factor de forma del contorno de una región que exa-


mina la distancia entre el contorno y el centro del área. Se calcula a
partir de la relación entre la distancia media de los puntos del contorno
al centro, y la desviación estándar de dichas distancias. El rango de
valores y su interpretación es el mismo que para la circularidad. Si p
es el centro del área, pi son los píxeles y F el área del contorno, la
redondez se calcula como sigue:

1 X
Distancia = kp − pi k
F
1 X
Sigma2 = (kp − pi k − Distancia)2
F
Sigma
Redondez = 1 −
Distancia
94 CAPÍTULO 3. TÉCNICAS DE VISIÓN ARTIFICIAL
Capítulo 4

Fundamento matemático
96 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO
4.1. INTRODUCCIÓN 97

4.1. Introducción
Las técnicas de aprendizaje automático (machine learning) constituyen
una rama de la inteligencia artificial y comprenden un conjunto de mode-
los matemáticos capaces de resolver problemas de elevada no-linealidad de
distinta naturaleza: predicción, clasificación, asociación de datos o concep-
tualización de datos. Está considerado como un proceso de generación de
conocimiento en el cual los sistemas, una vez entrenados y con una configu-
ración inicial, son capaces de mejorar de manera automática y autónoma con
la experiencia [209].

Habitualmente se clasifican en dos grandes grupos según su estrategia de


aprendizaje, hablando de técnicas de aprendizaje supervisado y de aprendi-
zaje no supervisado.

Aprendizaje supervisado: es un tipo de aprendizaje automático en el


que al algoritmo empleado se le proporciona una serie de ejemplos con
sus correspondientes respuestas. Es decir, el modelo se crea empleando
su salida o output. Los métodos de aprendizaje supervisado más em-
pleados son los árboles de decisión, las máquinas de vectores soporte
(support vector machines, SVM) y las redes neuronales (ANN) en su
versión más popular, el perceptrón multicapa (multilayer perceptron,
MLP).

Aprendizaje no supervisado: estos métodos se suelen emplear en el lla-


mado “análisis exploratorio de datos”, cuando los grupos naturales que
se pretende encontrar no se conocen de antemano y debe analizarse
un gran conjunto de datos. Asimismo, se usan con frecuencia cuando
las clases del conjunto de datos se conocen de antemano y se quiere
validar el proceso de entrenamiento y los conjuntos de variables esco-
gidos. Los algoritmos más conocidos son el empleado en el clustering
(algoritmo k-means [145]) y los mapas auto-organizativos de Kohonen
(self-organizing maps [125]). Este tipo de aprendizaje puede tener dife-
rentes objetivos: agrupamiento, generalización de jerarquías, reducción
de la dimensionalidad o interpretación y visualización.

Durante las últimas dos décadas el crecimiento de los trabajos de investi-


gación que emplean técnicas de aprendizaje automático ha sido exponencial,
encontrando un gran número de campos de estudio en los que se han apli-
cado. Sirva como ejemplo la Figura 4.1, que muestra los resultados de una
búsqueda reciente en la base de datos Scopus.
98 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Figura 4.1: Número de resultados obtenidos en Scopus al realizar una búsque-


da del término machine learning en tres intervalos temporales: hasta 2000,
de 2001 a 2010 y desde 2011 hasta enero de 2017.

Las técnicas comentadas en los siguientes apartados se han aplicado a


datos de diferente naturaleza, ya sea dentro del campo de los materiales [27,
77,170,217], medio ambiente [110,132,169,204,229], la visión por computador
[26, 122, 200] o la seguridad informática [2, 10, 105, 197], por poner algunos
ejemplos.

4.2. El problema de aprendizaje


Varios son los autores que desarrollaron el planteamiento del problema de
aprendizaje, tanto en lo referente al proceso empírico [178,226,227] como a la
toma de decisiones [21] y al factor computacional del problema [12, 223, 230].
El planteamiento inicial, además, no contemplaba un factor tan importante
como es el ruido presente en el conjunto de datos analizado, que se introdujo
en una aportación posterior [93].

El desarrollo del problema de aprendizaje se desarrolló a posteriori de


un modo interdisciplinar aunando la matemática con la computación y la
estadística [12, 34, 59, 223, 230], principalmente, hasta el punto actual en el
que es posible definir unos componentes básicos en un problema de esta
naturaleza [155]:
4.3. PROCESO DE APRENDIZAJE 99

1. Un input X cuyos valores pertenecen al conjunto X ⊂ Rm , cuyas enti-


dades a procesar se representan como {xi }ni=1 , donde xi = (xi1 , ..., xim ) ∈
X, siendo xij el atributo j-ésimo (j = 1, ..., m) de la instancia i-ésima
xi (i = 1, ..., n). Los m atributos o características descriptoras de las
entidades pueden ser numéricos (discretos o continuos) o no numéricos
(booleanos o k-valentes).

2. Un supervisor (oracle) que, para a partir de cada atributo x produce


una respuesta Y, cuyos valores pertenecen conjunto Y. Cuando el su-
pervisor, que puede ser determinista o aleatorio, es una función target
de un espacio T , éste se denomina espacio objetivo.

3. Una máquina de aprendizaje, llamada espacio


n de hipótesis,
o que apli-
ca una familia de funciones medibles F= f : X −→ Yb con Yb ⊂ Y .
Habitualmente, la familia F depende de un conjunto de parámetros Θ
por lo que:
n o
F = fθ = f (·, θ) : X −→ Y, θ ∈ Θ
b

Teniendo en cuenta lo anterior, el problema de aprendizaje se puede sin-


tetizar en la selección de una función del espacio de hipótesis F considerando
algún criterio de interés. En el caso de un aprendizaje supervisado, el criterio
suele atender al ajuste entre el valor de respuesta y y el obtenido a través de
la hipótesis elegida en F.

4.3. Proceso de aprendizaje


La consecución de un modelo matemático adecuado tal que su f propor-
cione una relación óptima entre el espacio de entrada X y el de salida Y
requiere un proceso de aprendizaje en el cual se diferencian dos etapas: la
primera, de entrenamiento, y la segunda, de selección del modelo óptimo.

A nivel matemático, se define un algoritmo o familia de modelos como


un conjunto de hipótesis pertenecientes al mismo espacio funcional que está
definido por un conjunto de parámetros θ ∈ Θ ⊂ Rd de modo que:

f (x; θ) con θ ∈ Θ ⊂ Rd

con Θ = Θ1 ∪ Θ2 , y siendo Θ1 los parámetros a optimizar en la primera


fase (entrenamiento del modelo), y Θ2 los hiperparámetros a optimizar en la
segunda fase (selección del modelo óptimo entre todos los pertenecientes a la
misma Familia de Modelos).
100 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Por lo tanto, se estructura un algoritmo de aprendizaje como sigue:


1. Entrenamiento del modelo (o conjunto de modelos). Algorit-
mo de entrenamiento. Se optimiza una función objetivo que im-
plementa algún criterio de bondad, y se obtienen distintos valores de
θ1 ∈ Θ1 . El modelo óptimo se selecciona a partir de dichos valores.
Distintos algoritmos se han desarrollado a tal efecto [114, 171].

2. Selección del modelo óptimo de la familia. Constituye la última


fase de la generación de la hipótesis a partir de los datos de entrada
del modelo, por lo que forma parte del algoritmo de aprendizaje en sí
mismo. Se logra así determinar la función f (x; θ2 ) con θ2 ∈ Θ2 ⊂ Rd2 .
Asimismo, en el proceso de entrenamiento y selección del modelo óptimo
se consideran los siguientes aspectos: la muestra D = {xi , yi }ni=1 se divide en
dos conjuntos disjuntos, el de entrenamiento D1 = {xi , yi }ri=1 , empleado en la
etapa de aprendizaje, y el de test D2 = {xi , yi }ti=1 , empleado en la evaluación
del modelo definitivo tomando algún criterio de bondad del ajuste.

4.3.1. El problema de clasificación


Dependiendo del tipo de respuesta que se obtiene del supervisor (salida
del modelo) se diferencian dos tipos principales de problemas de aprendizaje:
regresión, en el que la respuesta son valores continuos, y clasificación, en
el que la respuesta son clases (Fig. 4.2).

El problema de clasificación consiste en la partición del espacio de ca-


racterísticas en varias regiones excluyentes entre sí. Asociando a cada región
una clase Cj , j = 1, ..., c, el problema consistirá en decidir, dado un patrón
determinado, a qué clase de entre las disponibles pertenece una muestra [87].
Dada una muestra X y un conjunto Y = {1, ..., c}, donde c son las clases, se
define la regla de clasificación como aquella función g : X → Y tal que:

 1 si x ∈ X1

g(x) = .. .. con {Xj }cj=1 partición de X : {|∪cj=1 Xj =
 . .
 c si x ∈ X
c

= X Xj ∩ Xl =Ø si j 6= l (4.1)
que asigna cada ejemplo X = x a la clase Cj si x ∈ Xj .
4.3. PROCESO DE APRENDIZAJE 101

Figura 4.2: Ejemplo de un problema de clasificación (izquierda), en el que


las observaciones pertenecen a la clase 1 o a la clase 2, y uno de regresión
(derecha), en el que las observaciones se ajustan mediante una función que
representa tales valores continuos.

Para algunos algoritmos de clasificación, dicha regla también se puede


expresar como:
g : X →Y
x g(x) = ŷ = arg máxfˆj (x)
j

donde cada fˆj es una función discriminante. En el caso particular de algo-


ritmos de clasificación que tratan de estimar probabilidades, esta fˆj equivale
a la estimación de la probabilidad:
fˆj (x) = P(Y
b = j|X = x) =P(Y
b (x) = j)

El caso que nos ocupa en esta investigación es el correspondiente a un


problema de clasificación, en el que las características de la placa determinan
su calidad comercial (una variable categórica, por tanto).

Atendiendo a la complejidad del problema de clasificación, se diferencian


dos situaciones: que las clases sean linealmente separables o que no lo
sean. En el primer caso, las etiquetas de las clases no contienen ruido, y
constituye un problema en el que el establecimiento de la relación entre la
entrada y la salida es más sencillo. El segundo caso, frecuente en la vida real,
se da en problemas de mayor complejidad y/o con ruido en los datos, en los
que las distintas clases no son linealmente separables.
102 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Sea cual fuere la separabilidad de las clases, un proceso de clasificación


se caracteriza por involucrar una secuencia de dos etapas:

1. Aprendizaje. Esta primera etapa consiste en presentar al clasificador los


patrones de entrenamiento para que sea capaz de reconocer las clases
que forman el conjunto de entrenamiento. Dependiendo de la informa-
ción sobre las clases de salida que se le aporte al clasificador se habla
de aprendizaje supervisado o aprendizaje no supervisado.

2. Producción o Explotación. Con el modelo clasificador construido y en-


trenado en la etapa anterior, en este paso se etiquetan o clasifican nue-
vos patrones.

4.3.2. Evaluación del modelo


La evaluación del modelo de aprendizaje construido se basa en la proba-
bilidad de error resultante, que se estimará mediante distintos métodos. La
bondad del ajuste del modelo se puede estimar con varios indicadores, entre
los que destacan la matriz de confusión, el error absoluto medio MAE y las
tasas de error.

Matriz de confusión
La matriz de confusión es una herramienta que se emplea con frecuen-
cia para representar los resultados obtenidos en la clasificación. Se trata de
una tabla de contingencia en la que se relacionan las clases reales yi con las
clases predichas ŷi (Tabla 4.1), de modo que es posible visualizar los errores
de clasificación cometidos. En esta matriz, los elementos de la diagonal prin-
cipal se corresponden con instancias correctamente clasificadas, mientras que
los de fuera de dicha diagonal serán errores de clasificación.

Es una herramienta muy útil a la hora de presentar y analizar los resulta-


dos de la clasificación gracias a la capacidad de la matriz para hacer patentes
los conflictos entre clases, de modo que más allá de los aciertos se tiene in-
formación relativa a la fiabilidad de cada clase y a las principales confusiones
que se producen en la asignación de categorías.

Derivados de la matriz de confusión, se definen también tres tipos de


errores que servirán para comparar los resultados de las distintas técnicas
aplicadas al problema de clasificación de placas de pizarra. Tomando como
positivo la detección de una placa defectuosa (asignación de clase 3), y nega-
tivo la circunstancia contraria (asignación de clases 1 ó 2).
4.3. PROCESO DE APRENDIZAJE 103

Tabla 4.1: Ejemplo de matriz de confusión para el caso de estudio de tres


clases Y = {1, 2, 3}, en el que la clase 1 equivale a la primera calidad, la
clase 2 a la segunda calidad y la clase 3 al rechazo (pizarra no apta para su
comercialización).
Clase Predicha
1 2 3
Clase 1 75 15 10 100
Real 2 22 152 26 200
3 8 12 680 700
105 179 716 1000

1. Falso positivo (FP ): placa a la que se le asigna calidad rechazo (clase 3)


cuando su calidad real es primera o segunda. Se trata del error menos
deseado, ya que implica el descarte de material aprovechable, apto para
su venta, con la consiguiente pérdida económica. En el ejemplo de la
Tabla 4.1 ocurre así con un total de 36 instancias, de las cuales 10 son
clase 1 y otras 26, clase 2.

2. Falso negativo (FN ): placa defectuosa, no apta para la venta, a la que


el modelo de clasificación asigna clase 1 ó 2. Es un error no deseado,
pero a la hora de optimizar el sistema de clasificación se ha priorizado
evitar los falsos positivos frente a los falsos negativos. En el ejemplo,
se da en 20 ocasiones (8 placas de primera calidad y 12 de segunda).

3. Error neutro: errores de clasificación en los que se acierta al no descartar


la placa, pero se falla al asignar primera o segunda calidad. No son,
para el problema de este estudio, errores tan significativos como los
anteriores. En el ejemplo, se observan 37 errores de este tipo (15 placas
de primera calidad a las que se asigna segunda, y 22 en las que ocurre
lo contrario).

Error absoluto medio (MAE)


Relacionado con la matriz de confusión, se define otro indicador de la
bondad del ajuste como es el error absoluto medio o MAE. Este indicador
proporciona información sobre el error cometido en la clasificación, y se cal-
cula sobre el conjunto de test como
t
P
|yi − ŷi |
i=1
M AE = (4.2)
t
104 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Tiene sentido definir el MAE cuando las categorías tienen características


ordinales, de modo que los errores entre clases consecutivas son “menos gra-
ves” que entre clases no consecutivas.

Así, interpretando la expresión anterior, el MAE representa el promedio


de las diferencias entre la clase real y la predicha en valor absoluto, y es una
referencia de la cercanía de las predicciones a los valores reales. Por tanto,
a mayor MAE, mayores errores en la clasificación, ya que más se alejan las
clases predichas de las reales.

Tasas de error
El indicador más intuitivo de la bondad del ajuste de un modelo clasifica-
dor es quizás el de la tasa de error, obtenida con el método de restitución o
clasificación, que proporciona una medida de las instancias incorrectamente
clasificadas por el modelo en relación a las instancias totales.

De un modo formal [65], se considera un conjunto de datos D = {xi , yi }ni=1 ,


en el que xi son vectores de la forma (xi,1 , xi,2 , ..., xi,m ), cada xi,j se refiere
a una característica o atributo de xi , con un total de m atributos (ya sean
numéricos o categóricos), y la etiqueta asociada a cada instancia es yi . Si se
emplean los mismos n patrones pertenecientes a la muestra para entrenar y
testar el clasificador g, la probabilidad de error de clasificación del algoritmo
se estimará como n
1X
T E(g, D) = 1{yi 6=g(xi )}
n i=1
expresión en la que 1{yi 6=g(xi )} es la función indicador tal que

1 si yi 6= g(xi )
1{yi 6=g(xi )} =
0 si yi = g(xi )

Sin embargo, esta propuesta de restitución o reclasificación tiene un in-


conveniente: el sesgo resultante de la estimación de la probabilidad de error
es optimista, ya que la tasa de error antes definida se calcula empleando dos
conjuntos de patrones iguales. En consecuencia, el modelo analizado tendrá
un sobreajuste con respecto a los datos manejados en la fase de entrena-
miento. Lo correcto sería estimar la bondad de la clasificación del modelo
empleando un conjunto de datos diferente al manejado para su construcción.

Teniendo en cuenta lo anterior, un método alternativo que pretende sol-


ventar este inconveniente es el de partición mediante un conjunto de
4.3. PROCESO DE APRENDIZAJE 105

prueba [124]. Este método se basa en la división aleatoria de la muestra


D = {xi , yi }ni=1 en otros dos conjuntos disjuntos: D1 = {xi , yi }ri=1 , que cons-
tituye el conjunto de entrenamiento, y D2 = {xi , yi }ti=1 , que constituye el
conjunto de test. Con el primer conjunto se induce el modelo o regla de cla-
sificación g, y con el segundo (que contiene datos nuevos para dicha g) se
estima la bondad del clasificador, de modo que la probabilidad de cometer
un error en la clasificación se estima como
1 X
T
d E(g, D2 ) = 1{y6=g(x)} (4.3)
t x∈D
2

Validación cruzada
La validación cruzada [7,78,124,208] es un método de selección del modelo
que se basa en dividir los datos en s grupos de igual tamaño (aproximadamen-
te), estimando el modelo tantas veces como grupos se definen, y empleando
cada vez todos los datos menos los de un grupo si . A continuación, se realiza
la predicción con los datos de dicho grupo si y se calcula el error de predicción
sobre él. De este modo, se define
n
1X
CVs = (yi − fbn(i) (xi ))2
n i=1

(i)
en la que fbn (xi ) es la estimación en xi del modelo estimado con todos los
datos a excepción del grupo al que pertenece la observación i-ésima.

La selección del modelo óptimo se ha realizado en este caso a través de


un proceso de validación cruzada de doble capa, entendiendo el proceso de
aprendizaje como una primera capa y el testado de la bondad del ajuste del
algoritmo como la segunda capa. De manera algo más detallada, este proceso
se puede describir como:

1. División de la muestra inicial D en s grupos, obteniendo así los grupos


D1 , D2 , ...Ds .

2. Se aísla Dj como conjunto de test del modelo (para la segunda capa).

3. Se entrena
S el modelo con los conjuntos restantes s − 1, de modo que se
tiene i6=j Di (primera capa).

4. Se testa el model entrenado empleando para ello el conjunto Dj .


106 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

5. Se repite el proceso s veces hasta que toda la muestra inicial ha sido


introducida en el modelo y ha sido empleada tanto para entrenar como
para testar el algoritmo.

Así, mientras que la segunda capa evalúa el modelo óptimo resultante de


cada familia, la primera capa sirve para llevar a cabo el proceso de selección
del modelo dentro del proceso de aprendizaje sin sobreajustarlo. Además,
al incluir diferentes técnicas a un tiempo se logra comparar resultados de
manera ecuánime a través del proceso de validación cruzada en dos capas,
minimizando así el factor aleatorio al elegir el conjunto de test.

4.4. Técnicas de aprendizaje automático


4.4.1. Árboles de decisión. CART
Los árboles de decisión, clasificación o identificación son uno de los mo-
delos de aprendizaje supervisado más destacados. Constituyen un modelo
fácil de entender y de representar gráficamente, por lo que son una opción
atractiva para el usuario final.

La construcción de los árboles de decisión persigue obtener un árbol que


revele información de interés de cara a futuras predicciones. Se construyen
a través de un proceso de inducción con una estrategia “de arriba a abajo”,
partiendo de los conceptos generales hasta llegar a casos particulares. De ahí
que el acrónimo TDIDT, del inglés Top-Down Induction on Decision Trees,
se use para referirse a la familia de algoritmos usada para su construcción.

En estos modelos, la clasificación de una observación de entrada x se lo-


gra a través de un proceso de decisiones binarias sucesivas, recorriendo el
árbol, de manera que cada nodo se divide en dos ramas en base a un criterio
de decisión 4.3. Varios son los algoritmos que se pueden emplear, incluyendo
algunos clásicos como el ID3 [182], el C4.5 [183] o el CART [36] aquí aplicado.

Entre las claves de la construcción de los árboles de clasificación figuran


cómo dividir cada nodo y las reglas de poda, que indican hasta qué nivel
queremos profundizar en las reglas de clasificación [52]. Un posible criterio
podría ser el error obtenido: parar la subdivisión en ramas cuando el error
sea menor de un determinado umbral.
4.4. TÉCNICAS DE APRENDIZAJE AUTOMÁTICO 107

Figura 4.3: Ejemplo de un conjunto de datos con dos clases (izquierda) deli-
mitadas por fronteras paralelas a los ejes x1 y x2 . A la derecha, el árbol de
decisión correspondiente.

Sin embargo, habitualmente el proceso es el siguiente: se construye un


árbol grande con un criterio de parada basado en el número de datos aso-
ciado a cada nodo final, y a continuación se poda siguiendo un criterio que
equilibra el error residual frente a la complejidad del modelo.

La finalidad de las reglas de poda es eliminar, o minimizar, la influencia de


los valores anómalos presentes en el conjunto de datos a modelizar. Un intento
por predecir correctamente todas las observaciones iniciales podría conducir,
en el caso de haber estas anomalías, a un sobreajuste o sobreaprendizaje que
provocaría la pérdida de la capacidad de generalización buscada en el modelo.

Los árboles de decisión se pueden aplicar tanto a problemas de regresión


como de clasificación. En el primer caso, se emplea la suma de los cuadrados
del error residual (SSE) (Eq. 4.4) como medida del error del modelo, mientras
que en el segundo se suele emplear el índice de Gini (Eq. 4.5) o medidas de
entropía para medir la diversidad de un nodo.
n
X
SSE = (yi − ŷi )2 (4.4)
i=1

El índice de diversidad de Gini mide la diversidad de un nodo conside-


rando un número de clases j, siendo p(j) la fracción observada en el nodo de
la clase j. Un nodo “puro” tendría una sola clase y su índice de Gini sería
cero según la ecuación 4.5.
X
Índice de diversidad de Gini = 1 − p2 (j) (4.5)
j=1
108 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Figura 4.4: Ejemplo de un conjunto de datos con dos clases delimitadas por
una frontera que no es paralela a los ejes x1 y x2 .

La mayor fortaleza de estos árboles es la facilidad de interpretarlos por


parte de cualquier persona [28]. Su estructura, además, proporciona infor-
mación acerca de la importancia de las distintas variables en el proceso de
decisión [77].

Además de los efectos perjudiciales de valores anómalos en el conjunto


de entrada, podemos señalar otros dos principales inconvenientes de esta
técnica supervisada [28,92]. El primero de ellos, que pequeñas variaciones en
el conjunto de entrenamiento pueden provocar cambios importantes en las
bifurcaciones de las ramas del modelo. El segundo tiene que ver con la filosofía
particional de esta técnica: se basa en particiones del espacio de entrada
hasta definir regiones que se corresponden con las clases de salida, siendo las
reglas de decisión las fronteras entre dichas regiones. En consecuencia, estas
fronteras están alineadas con los ejes del espacio de características, por lo
que en el caso de que la frontera óptima forme un ángulo de 45o con tales
ejes, la clasificación se complicaría incluyendo un gran número de nodos 4.4.

4.4.2. Redes neuronales. MLP


En los años 40 del pasado siglo, el neurocientífico Warren McCulloch, en
colaboración con el matemático Walter Pitts, desarrollaron un novedoso tra-
bajo de investigación en el que trataban de entender cómo nuestro cerebro
es capaz de desarrollar complejos patrones empleando muchas celdas básicas
conectadas entre sí [144]. Estas celdas cerebrales básicas son las neuronas, y
constituyen la base de la analogía biológico-matemática en la que se funda-
menta este modelo de inteligencia artificial.
4.4. TÉCNICAS DE APRENDIZAJE AUTOMÁTICO 109

Figura 4.5: Estructura de una red neuronal con sus capas de entrada, inter-
media (u oculta) y de salida. Ejemplos con a) varias neuronas en la capa de
salida y con b) una única neurona en la capa de salida. Las conexiones entre
las distintas capas están afectadas por los pesos wij y ci . Adaptado de [77].

La arquitectura de la red se caracteriza por la distribución en capas de


las neuronas, distinguiéndose tres partes: una capa de entrada (input layer ),
una o varias capas ocultas (hidden layer ) y una capa de salida (output layer )
(Fig. 4.5). Así, una primera clasificación de los tipos de redes se basa en el
número de capas que posee.

Además, otras características de la red son: (i) los pesos, que actúan so-
bre las entradas de las neuronas y dotan a cada input de una importancia
mayor o menor; (ii) el umbral y la función de activación, que actúan so-
bre las señales de entrada; y (iii) la función de transferencia, de la que se
obtiene la salida de cada neurona. Según estas interconexiones dentro de la
estructura de la red neuronal se pueden otras clasificaciones de tipos de redes.

Una vez establecida la arquitectura de la red, una parte clave del modelo
es el algoritmo de entrenamiento, o de aprendizaje, que será el encargado de
optimizar los valores de las interconexiones de las neuronas en busca de una
respuesta lo más ajustada posible a los datos de salida reales proporcionados.

Si consideramos el modelo funcional de la red, nos centraremos en las re-


des feed-forward, en las que cada capa se conecta únicamente en la dirección
del siguiente avance de modo que se puede representar con un gráfico acíclico,
con sus correspondientes funciones de activación y pesos.
110 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

La red neuronal implementa la función f : X ⊂ Rd → Y ⊂ Rc , siendo d


la dimensión del espacio de entrada y c la del espacio de salida. Las funciones
de la red feed-forward se pueden formular como:

f (x) = φ(ψ(x))/ φ : X ⊂ Rd → T ⊂ Rp
ψ : T ⊂ Rp → Y ⊂ Rc

donde φ es la función de activación de la capa oculta, ψ es la función de


activación de la capa de entrada, T es el espacio de las variables ocultas y
p es su dimensión, que indica además el número de neuronas de dicha capa,
llamado espacio característico.

Un caso particular de las redes neuronales feed-forward es el perceptrón


multicapa o MLP (del inglés multilayer perceptron), en el que cada nodo es
un perceptrón. El concepto de perceptrón fue introducido en 1958 [189], y la
idea básica es que las entradas de cada perceptrón pasan por un preproceso
en el que se detectan ciertas características de los datos de entrada, mejoran-
do la detección de patrones en los mismos.

El algoritmo típico de entrenamiento de la MLP se conoce como algo-


ritmo de propagación hacia atrás (back-propagation algorithm) [19, 55, 94].
Este enfoque de propagación hacia atrás pretende calcular las derivadas de
la función objetivo con respecto a los parámetros de una manera eficiente.
La propagación hacia atrás de los errores resultantes del proceso de entre-
namiento permiten su reducción hasta que la red logra el aprendizaje de los
datos analizados [109].

Se puede escribir la función de la MLP como [77, 96]:


p
X
f (x) = φj (cj ψ(wjT x + w0 ) + c0 )
j=1

donde wj y w0 son los pesos de la capa de entrada y cj y c0 los de la capa


oculta. A través de distintos algoritmos se pueden ajustar los pesos de la
red, en un proceso de entrenamiento o aprendizaje. En las redes neurona-
les empleadas en esta investigación se implementó la función de activación
Gaussiana y el algoritmo de back-propagation.

Con respecto al algoritmo de entrenamiento, un paso esencial es la ini-


ciación del mismo. El método más común es el propuesto por Nguyen y
Widrow [168], quienes proponen, básicamente, escoger los valores iniciales de
4.4. TÉCNICAS DE APRENDIZAJE AUTOMÁTICO 111

los pesos de modo que el dominio del espacio de entrada se distribuya según
las salidas de la red. Además, es de destacar el carácter de consistencia del
algoritmo, logrando incluso tasas de convergencia y demostrando su norma-
lidad asintótica.

La estructura de la MLP, combinada con su no-linealidad y sus pesos, así


como su ajuste con el algoritmo de entrenamiento es capaz de crear aproxima-
ciones generales de una función que permite la generación de prácticamente
cualquier otra función no-lineal [129].

Por último, la definición de la red se completa con un proceso de validación


cruzada, con el que se optimizan los pesos [208]. El conjunto de datos original
se divide en un número de grupos determinado, empleando todos menos uno
para la fase de entrenamiento y el restante para testar el rendimiento de
la red. Este proceso se repite tantas veces como grupos se hayan definido,
empleando cada vez un grupo distinto para testar.

4.4.3. Máquinas de vectores soporte (SVM)


Cortés y Vapnik se consideran los pioneros en la introducción del concepto
de hiperplano separador óptimo de un conjunto de datos en un problema de
clasificación, sobre el cual se fundamenta la técnica de las máquinas de vecto-
res soporte o SVM [57,224]. En los últimos años ha gozado de una importante
popularidad en problemas de reconocimiento de patrones por su carácter de
óptimo global, capacidad de predicción, parsimonia y flexibilidad [38].

Originalmente, las máquinas de vectores soporte se concibieron para se-


parar observaciones pertenecientes a distintas clases en un problema de cla-
sificación, aunque también se pueden aplicar a problemas de regresión, en
cuyo caso se suelen renombrar como regresión de vectores soporte (support
vector regression, SVR) [75, 207].

Las máquinas de vectores soporte se basan en clasificaciones binarias,


por lo que los problemas multiclase se abordan siguiendo distintas estrate-
gias, construyendo clasificadores binarios y enfrentando las clases una a una,
o una contra todas [103, 141].

Los hiperplanos separadores, sin embargo, tienen dos puntos débiles: la


necesidad de separabilidad lineal de la muestra y su carácter lineal. Aten-
diendo lo anterior, podemos señalar varios puntos clave en el desarrollo de
esta técnica:
112 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

Figura 4.6: Ejemplo de transformación de un espacio bidimensional (izquier-


da) en uno tridimensional (derecha) con la función kernel. Fuente: [151].

La generación del espacio de características (feature space) a partir


del espacio de entrada (input space) a través de una transformación.
Empleando una transformación inversa, las fronteras lineales de los
hiperplanos separadores dan lugar a fronteras no-lineales en el espacio
de entrada. A este método se le conoce como Kernel Trick (Fig. 4.6).

La aparición del algoritmo Soft Margin o margen blando para pro-


blemas en los que una separabilidad perfecta no es interesante (por
ejemplo, problemas en los que hay ruido en las observaciones y que
darían lugar a un sobreajuste del algoritmo).

La generalización de las SVM a problemas de regresión a través del


factor definido por Vapnik de pérdida insensible  [64].

El problema de clasificación se puede interpretar como la partición de una


población de individuos en subpoblaciones mutuamente excluyentes Cj , j =
1, ..., c,. Si lo individuos se caracterizan por un vector de características x =
(x1 , x2 , ..., xd ) con valores en un conjunto X , y las clases son Y = {1, 2, ..., c} ∈
Y , el problema de clasificación consiste en determinar, según algún criterio
óptimo, la regla de clasificación g : X → Y:
 
 1 if x ∈ X1 
 
g(x) = .
. .
.
 . . 
 c if x ∈ Xc 
4.4. TÉCNICAS DE APRENDIZAJE AUTOMÁTICO 113

Figura 4.7: Hiperplano separador de margen máximo para un problema de


clasificación con dos clases linealmente separables (círculos y diamantes).
Fuente: [151].

Sea zn , zi = (xi , yi ) una muestra linealmente separable con xi ∈ X ⊂


Rd , yi ∈ Y = {−1, 1}, i = 1 : n, es decir, que se puede separar con la función
de decisión fw,b (x) = sign(hw, xi + b), w ∈ Rd , b ∈ R.

El hiperplano separador óptimo se define como aquél que maximiza la


distancia a las clases (Fig. 4.7). Sea τw,b ≡ {x ∈ X / hw, xi + b = 0} . El mar-
gen (o margen geométrico) del hiperplano τw,b con respecto a la muestra zn
se define como:
1 1 1
γ(τw,b ) = mı́n |hw, xi + b| = mı́n |hw, xi + b| = χ(τw,b )
i∈{1:n} kwk kwk i∈{1:n} kwk

donde χ(τw,b ) se denomina margen funcional.

El hiperplano separador óptimo se obtiene como la solución del siguiente


problema:
 
máx γ(τw,b ) = mı́n |hw, xi + b|
w∈Rd ,b∈R i∈{1:n}

condición : kwk = 1

Considerando la normalización del margen funcional en lugar del vector


w, el problema se puede reformular como:

1
mı́n kwk2 (4.6)
w∈Rd ,b∈R 2
condición : yi (hw, xi + b) ≥ 1, i = 1, 2, ..., n
114 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

La solución se puede obtener del problema dual resultante de la combina-


ción lineal de un subconjunto de observaciones conocidas como vectores de
soporte [225]:
X X
w= βi xi =⇒ fw,b (x) = βi hxi , xi + b (4.7)
i∈SV i∈SV

De este modo, dado un nuevo punto x para su clasificación, la solución se


obtiene a través del producto interno con los vectores de soporte, definiendo
el margen del hiperplano separador.

Aplicando el concepto de Soft Margin o margen blando citado anterior-


mente, se introduce el parámetro C para expresar la importancia asignada a
las clases incorrectamente clasificadas:

( n
)
1 X
mı́n kwk2 + C ξi
w,b,ξ 2 i=1
condición : yi (hw, xi + b) ≥ 1 − ξi , ξi ≥ 0, i = 1, 2, ..., n

Por último, a través el kernel trick se logra resolver problemas de clasifi-


cación no lineales gracias a la aplicación de una transformación no lineal del
espacio de entrada (espacio de características). Si X es un espacio topológico
y k es una función definida positiva continua en X × X , entonces existe un
espacio de Hilbert H y una aplicación continua φ : X −→ H, tal que ∀x, x0 ,
verifying k(x, x0 ) = hφ(x), φ(x0 )i .

En consecuencia, la expresión (4.7) se escribe ahora en el espacio de ca-


racterísticas como:
X
w= βi φ(xi ) ⇒
i∈SV
X X
fw,b (x)= βi hφ(xi ), φ(x)i + b = βi k(xi , x) + b
i∈SV i∈SV

Esta última es la fórmula general de las SVM para clasificación tanto


de margen duro como blando, resultante de la solución de los respectivos
problemas en el espacio de características.
4.5. REDUCCIÓN DE VARIABLES. ACP 115

4.5. Reducción de variables. Análisis de com-


ponentes principales
Al tomar información de una muestra de datos, una tendencia común es
tomar el mayor número posible de variables. Sin embargo, esto presenta dos
inconvenientes principales: en primer lugar, el número de posibles coeficien-
tes de correlación será muy elevado y dificultará la definición de relaciones
entre variables; en segundo lugar, las variables pueden presentar una fuerte
correlación.

Por estos motivos, es conveniente tratar de reducir el número de variables


de modo que cada una aporte la mayor información posible, entendiendo por
“información” la variabilidad o varianza de los datos que explique.

Las técnicas de análisis de componentes principales, propuestas por Pear-


son [173] y desarrolladas fundamentalmente por Hotelling [102], estudian las
relaciones existentes entre unas variables correladas p, de modo que transfor-
man el conjunto inicial de dichas variables en otro nuevo que están incorre-
ladas entre sí. Este nuevo conjunto es el de componentes principales, donde
cada una incluye información que no incluyen las demás (sin redundancia,
por lo tanto).

Las componentes principales se calculan como combinación lineal de las


variables originales, cumpliéndose que las nuevas variables están ordenadas
en orden decreciente según la varianza total que explican de la muestra.

Sea un conjunto de variables (x1 , x2 , ..., xp ) que describe un grupo de indi-


viduos. El cálculo de un nuevo conjunto de variables y1 , y2 , ..., yp incorreladas
entre sí, siendo cada yj , con j = 1, ..., p, combinación lineal de las x1 , x2 , ..., xp
de modo que
yj = aj1 x1 + aj2 x2 + ... + ajp xp
= a0 j x
donde a0 j = (aj1 , aj2 , ..., ajp ) es un vector de constantes y
 
x1
x =  ... 
 
xp
Para calcular los sucesivos componentes, se obtienen los coeficientes aij
maximizando la varianza. Manteniendo la ortogonalidad de la transformación
116 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

e imponiendo que el vector a0 j sea unitario, se tiene que el problema de


maximizar la varianza de y1 se puede escribir como

V ar(y1 ) = V ar(a0 1 x) = a0 1 Σa1

El problema se resuelve aplicando los multiplicadores de Lagrange, de


modo que se construye y maximiza la función L

L(a1 ) = a0 1 Σa1 − λ(a0 1 a1 − 1)

Del sistema lineal de ecuaciones resultante se deduce que λ es un autovalor


de Σ. La matriz de covarianzas Σ, de orden p y definida positiva, está formada
por p autovalores diferentes λ1 , λ2 , ..., λp de valor decreciente. Así, se tiene
que

V ar(y1 ) = V ar(a0 1 x) = a0 1 Σa1 = a0 1 λIa1 = λa0 1 a1 = λ

Por lo tanto, tomando el mayor autovalor (λ1 ) y su correspondiente au-


tovector a1 se maximiza la varianza de y1 . Repitiendo el proceso para los si-
guientes componentes de modo que cada uno sea incorrelado con respecto al
anterior (sus vectores, por tanto, serán ortogonales), para los p componentes
y se puede escribir el problema en forma matricial como una matriz de au-
tovectores multiplicada por el vector de las variables originales x = x1 , ..., xp

y = Ax

con      
y1 a11 a12 · · · a1p x1
 y2   a21 a22 · · · a2p   x2 
y= ,A =  ,x = 
     
.. .. .. . . . .. .. 
 .   . . .   . 
yp ap1 ap2 · · · app xp

Teniendo en cuenta que V ar(yp ) = λp , la matriz de covarianzas de y es


 
λ1 0 ··· 0
 0 λ2 ··· 0 
Λ=
 
.. .. .. .. 
 . . . . 
0 0 · · · λp

donde y1 , y2 , ..., yp son variables incorreladas.


4.5. REDUCCIÓN DE VARIABLES. ACP 117

Esta transformación en la que cada autovalor corresponde a la varianza


del componente yi cumple que la suma de todos los autovalores es igual a la
varianza total de los componentes:
p p
X X
V ar(yi ) = λi = traza(Λ)
i=1 i=1

Las propiedades del operador traza hacen que la suma de las varianzas de
las variables originales sea igual a la suma de las varianzas de las componentes
calculadas,
p
X
traza(Λ) = traza(Σ) = V ar(xi )
i=1

Esta propiedad hace que se pueda referir al porcentaje de varianza total


explicada por un componente principal:
λ λi
Pp i = Pp
i=1 λi i=1 V ar(xi )

Finalmente, al aplicar la técnica de las componentes principales a un


conjunto inicial de p variables se logra obtener un número m de dichos com-
ponentes, siendo m < p, que explican un amplio porcentaje de la varianza
total inicial.

Estandarización de las variables iniciales


En problemas donde el conjunto de variables iniciales consta de medidas
en diferentes escalas o unidades, previamente al análisis de componentes prin-
cipales es necesario realizar una estandarización de las variables originales.

Una estandarización típica es el cálculo del z−score de la variable X, con


media µ y desviación típica σ. Para cada valor x, su z−score es

(x − µ)
z=
σ
Este z−score mide la distancia del punto al valor medio, todo ello en
términos de su desviación típica. Así, se convierten las variables iniciales a
otras con media 0 y varianza 1 que conservan las propiedades de forma del
conjunto original.

Aplicado al análisis de componentes principales, tras la estandarización


las componentes principales se tomarán de la matriz de correlaciones (que
118 CAPÍTULO 4. FUNDAMENTO MATEMÁTICO

coincide, por tratarse de variables estandarizadas, con la matriz de cova-


rianzas). De este modo, los componentes serán autovectores de la matriz de
correlaciones y las variables originales se tendrán en cuenta en la misma me-
dida.

La variabilidad total (traza) será igual al número de variables de la mues-


tra, la suma de los autovectores será p y, en consecuencia, la proporción de
variabilidad o varianza que explica el autovector j−ésimo es λj /p.
Capítulo 5

Sistema de clasificación de placas


de pizarra
120 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN
5.1. INTRODUCCIÓN 121

5.1. Introducción
Este capítulo describe el sistema de clasificación automática de placas
implementado, tanto a nivel físico como de procesado de la información. En
la Figura 5.1 se representa el esquema general del sistema, que incluye varias
etapas que se pueden diferenciar:
1. Adquisición de imágenes: esta primera etapa la realizan los componen-
tes de visión del sistema, explicados en el Capítulo 3. La finalidad es
capturar la información de las placas y proveer al sistema de análisis y
clasificación de los datos necesarios.

2. Preproceso: ya centrados en el análisis de los datos, un primer paso


sería el preproceso, en el cual se preparan las imágenes para que la
placa aparezca enderezada y centrada en la pantalla. El objetivo es
proporcionar una entrada homogénea a la siguiente fase, en la que se
analizarán las imágenes.

3. Proceso: una vez preparadas las imágenes 3D, RGB y monocromo, se


analizan con los códigos diseñados a tal efecto para detectar los rasgos
propios de los defectos de las pizarras. Se obtiene en este punto un
vector característico de la placa. Esta etapa se adapta a las condiciones
del yacimiento estudiado.

4. Postproceso: a partir del vector característico de la placa y siguiendo


el criterio del experto se determina la calidad comercial de cada placa.
Esta etapa final se ajusta a las condiciones del mercado en el que se
comercializarán las placas de pizarra.
La adquisición de imágenes y el sistema físico desarrollado se describen en
detalle en el Apartado 5.2, incluyendo una comparativa entre los prototipos
desarrollados en 2010 y en 2017.

El análisis de los datos recogidos para caracterizar las placas (Apartado


5.3), que se divide en las etapas de preproceso y proceso, se describe en el
Apartado 5.3.1 y 5.3.2, respectivamente. Se detallan los algoritmos de inspec-
ción de las imágenes desarrollados expresamente en el software Halcon para
la detección de los defectos considerados.

Finalmente, el postproceso es la etapa en que se dictamina la calidad


comercial en base a las características particulares de la placa y a los re-
querimientos de un mercado en cuestión. Entra en juego, pues, el criterio
del experto para discernir entre primera calidad (básicamente, sin defectos),
122 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

ADQUISICIÓN
ADQUISICIÓN DE DATOS

Imagen 3D Imagen escala Componente R Componente G Componente B


grises

RECORTE Y ENDEREZADO RECORTE Y ENDEREZADO RECORTE Y ENDEREZADO


IMAGEN 3D IMAGEN GRAY COMPONENTES RGB

Placa 3D recortada Placa gray recortada Comp. RGB placa


PREPROCESO

y enderezada y enderezada recortadas y enderezadas

DEFINICIÓN Y RECORTE DEFINICIÓN Y RECORTE DEFINICIÓN Y RECORTE


REGIÓN INTERIOR REGIÓN INTERIOR REGIÓN INTERIOR
PLACA 3D PLACA GRAY COMPONENTES RGB

Placa 3D Placa gray Componentes RGB


zona interior zona interior zona interior

ANÁLISIS PRESENCIA
ANÁLISIS PRESENCIA ANÁLISIS FALTA ANÁLISIS ANÁLISIS FALSA ANÁLISIS
CARBONATOS
IRREGULARIDADES SUPERFICIE
DE MATERIAL ALABEO ESCUADRA PRESENCIA
ANÁLISIS ANÁLISIS SULFUROS
IRREGULARIDAD Medidas de área IMAGEN GRAY IMAGEN RGB
Diferencias de Medidas de
GLOBAL de placa por alturas de ángulos en las
tercios esquinas y centro esquinas Parámetros de zonas Parámetros de
de la placa sospechosas
PROCESO

Desv. típica valores zonas sospechosas


intensidad 3D
ANÁLISIS
ANÁLISIS COMP. RGB
IRREGULARIDADES
LOCALES Parámetros de zonas
sospechosas
Parámetros de
gradientes en varias
direcciones de placa
Vector característico de la placa
POSTPROCESO

CRITERIO EXPERTO

Calidad comercial de
la placa

Figura 5.1: Esquema general de tratamiento de los datos registrados por el


sistema de visión artificial.
5.2. ADQUISICIÓN DE IMÁGENES 123

segunda calidad (con defectos estéticos) y rechazo (con defectos que hacen
que la pizarra no sea apta para su puesta en mercado).

Este criterio del experto trata de simularse mediante técnicas matemáti-


cas, como se expondrá en el Apartado 5.4.

5.2. Adquisición de imágenes


5.2.1. Descripción física y elementos
Esta primera etapa, la de adquisición de las imágenes, la realiza el sis-
tema de visión artificial descrito a continuación. El prototipo construido en
el laboratorio simula la línea de producción de las naves de elaboración de
placas de pizarra, en las que las placas se transportan de unas etapas a otras
sobre cintas de rodillos.

El funcionamiento es el siguiente: se coloca una placa de pizarra sobre


la cinta transportadora, que se mueve alternativamente en un sentido y otro
gracias a un motor gobernado por un variador de frecuencia. Además, a dicho
motor se le ha asociado un encoder para evitar la distorsión de las imágenes
recogidas por la cámara. Conforme la cinta transportadora se mueve, la placa
pasa por debajo del sistema de visión y es iluminada por las dos fuentes de
luz del sistema. Cuando las fotocélulas detectan que la placa ha pasado, la
cámara la escanea y transfiere la información al ordenador.

La disposición del conjunto cámara-láser que caracteriza al prototipo se


corresponde con la geometría ordinaria, en la cual la cámara se coloca en-
cima del objeto a observar, en posición cenital, y el láser lo ilumina desde
una posición lateral formando un cierto ángulo (Fig. 3.27). Esta geometría es
la recomendada para realizar medidas a color, pues permite un mejor ajuste
de la iluminación para la recogida equilibrada de los componentes RGB [202].

El sistema (mostrado en la Figura 5.2) está formado por los siguientes


componentes:
a) Cámara: Sick ColorRanger E50 (Ranger-E50434) (Fig. 5.3), matricial,
capaz de realizar un “MultiScan” y recabar información 3D y RGB en
distintas partes del sensor CMOS. Concretamente permite la adquisi-
ción de información 3D (range), RGB, monocromo (gray) y luz dispersa
(scatter). La resolución del sensor es de 1536x512 píxeles y la lente em-
pleada es una f=25mm/F1.4. Su velocidad máxima de adquisición 3D
124 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Figura 5.2: Prototipo actual y sus componentes.

es de 35.000 perfiles/s, y 13.000 líneas/s en el caso de la adquisición de


color RGB. Se conecta al PC mediante un cable Gigabit Ethernet.
b) Iluminación: para la recogida de datos de color y dimensionales son
necesarias dos fuentes de iluminación diferentes:
b.1) Barra LED CCS blanca: barra de luz blanca que proporciona ilu-
minación directa a las placas para la adquisición de datos de color
y escala de grises.
b.2) Láser: de clase IIIB, proporciona un haz lineal de luz láser roja
(luz estructurada), de 625 nm de longitud de onda y 35 mW de po-
tencia, para la obtención de información tridimensional mediante
triangulación láser.
c) Cinta transportadora: sirve de soporte para el transporte de las placas
de pizarra y simula las cintas de rodillos típicas de las naves de elabo-
ración. Transporta las placas bajo el sistema de visión a una velocidad
de 9.6 cm/s. Se desplaza alternativamente en un sentido y otro gracias
a un alternador de frecuencia.
d) Encoder: el sistema incorpora un encoder incremental de eje saliente
Hohner Serie 58 de 2000 impulsos. Este componente se conecta al motor
5.2. ADQUISICIÓN DE IMÁGENES 125

Figura 5.3: Cámara Sick ColorRanger E50 empleada en este estudio.

de la cinta transportadora y a la cámara y asegura que las proporciones


de la imagen registrada no se vean influidas por los cambios en la
velocidad de la cinta.
e) Fotocélulas: dos pares de fotocélulas se encargan de, por una parte,
detectar el inicio y final de carrera para hacer que las placas se desplacen
alternativamente en un sentido y otro (impidiendo que caigan al suelo),
y por otra parte se comunican con la cámara y actúan de trigger. Así, el
primer par se conecta a un variador de frecuencia Lenze encargado de
invertir el sentido de desplazamiento de la cinta. El otro par se posiciona
antes y después del campo de visión de la cámara y su cometido es
asegurar que se captura la imagen de toda la placa de pizarra.
f) PC: recibe la información de la cámara a través de una conexión Et-
hernet, para a continuación ejecutar las tareas de preproceso, proceso
y postproceso con las imágenes de las placas. Se emplea el software de
MVTec Halcon 12 [163].
g) Caja de conexiones compacta y portátil: aúna las conexiones de los
distintos componentes del sistema y sus alimentaciones eléctricas, ha-
ciendo que su desplazamiento e instalación en una nueva ubicación sea
más sencillo que en el primer prototipo desarrollado en 2010.

5.2.2. Defectos de placa analizados


Como se expuso en el Capítulo 2, las propiedades estéticas y dimensio-
nales que se deben evaluar en las placas vienen condicionadas por la norma
UNE-EN 12326-1:2015, que establece los requisitos que deben satisfacer las
placas de pizarra de techar.
126 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

En base a dichos requisitos y a las características de la variedad de pizarra


estudiada, en este proyecto se han contemplado los siguientes defectos indi-
viduales de carácter petrológico y tectónico: presencia de flores, presencia de
sulfuros e irregularidades superficiales (bregadas, nudos, refollos, etc.). Asi-
mismo, la geometría final de las placas elaboradas debe comprobarse antes
de ser puestas en mercado, por lo que la falsa escuadra, las faltas de material
y el alabeo también se consideran. Todos se muestran en la Figura 5.4.

(a) Falta de material (b) Falsa escuadra (c) Alabeo

(d) Def. de superficie (e) Carbonatos (f) Sulfuros

Figura 5.4: Defectos considerados en este proyecto.

Como se definió en el Apartado 2.3.1, algunos de estos defectos se evalúan


en toda la superficie de la placa, mientras que otros, considerados de menor
gravedad y de carácter más bien estético, se analizan por tercios de placa
(Fig. 2.16). Entre los primeros se encuentran el alabeo, las irregularidades
superficiales y la falsa escuadra. Entre los segundos, la falta de material, la
presencia de carbonatos y la presencia de sulfuros.
5.2. ADQUISICIÓN DE IMÁGENES 127

Tabla 5.1: Defectos y valores límite considerados en este estudio para la


detección de cada singularidad.
Defecto Umbrales Región
considerada
Alabeo Intensidad 3D>15 con respecto al centro
y Intensidad 3D>25 de esquina a esquina contigua
Irregularidades Desviación típica de intensidad 3D>7.5 Placa
superficiales o alguna amplitud máxima de bordes >10 entera
Falsa escuadra Factor de rectangularidad <0.975
y diferencia con respecto a la ortogonal>2o
Flores Área mínima 600 pix2 y circularidad media>0.47
Sulfuros Área comprendida entre 200 y 600 pix2 Tercios
Falta Factor de rectangularidad tercio medio<0.995
de material Ratio en extremos<98.75 % y factor de rect.<0.98

Teniendo en cuenta lo anterior, en el presente trabajo de investigación se


han considerado los valores umbral recogidos en la Tabla 5.1, que aúnan los
requerimientos impuestos por la normativa vigente, así como el criterio del
experto y las características del sistema de visión desarrollado.

5.2.3. Comparativa prototipo 2010 vs prototipo 2017


Como se ha comentado, el prototipo actual constituye una versión me-
jorada y más completa del desarrollado en 2010 por Martínez [150]. Aquel
primer desarrollo estaba basado en la captura de datos 3D y 2D en escala
de grises con dos cámaras diferentes (carecía de la información de color),
para posteriormente realizar el tratamiento de los datos con un sistema de
preproceso, proceso y postproceso basado en el software Sherlock.

Entonces, a partir del criterio de un experto de la empresa pizarrera, que


había previamente inspeccionado las placas y asignado su calidad comercial,
se simulaba dicho criterio mediante algoritmos de machine learning de un
modo análogo al empleado en este estudio.

Se puede decir que la principal mejora ha sido la sustitución del par de


cámaras anterior (3D láser escáner y 2D lineal) por una única cámara 3D
MultiScan a color capaz de recabar la información RGB de las placas, básica
para la detección de sulfuros. Se completa así el espectro de defectos de placa
más habituales que se pueden inspeccionar y detectar con el sistema descrito.
128 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Además de esta mejora del sistema de visión a nivel físico, el nuevo soft-
ware proporciona más control sobre los algoritmos de visión empleados, todo
ello en un sistema que puede ser fácilmente trasladado e instalado en nuevas
ubicaciones gracias a la renovada caja de conexiones portátil (letra g en la Fi-
gura 5.2). Una comparativa más detallada entre los prototipos desarrollados
se puede ver en la Tabla 5.2.

Tabla 5.2: Comparativa entre los prototipos desarrollados en la tesis de Mar-


tínez [150] y en el presente estudio.
Prototipo 2010 [150] Prototipo 2017
Cámara(s) Conjunto de dos cámaras: 3D lá- Cámara única: SICK ColorRan-
ser escáner SICK Ranger C55 y ger E50 3D MultiScan color
2D lineal DALSA Spyder3
Conexión de Mediante un frame grabber Directamente a través de una co-
la cámara al nexión Gigabit Ethernet
PC
Defectos de- Un total de 5: alabeo, falsa escua- Un total de 6: alabeo, falsa escua-
tectados dra, falta de material, irregulari- dra, falta de material, irregulari-
dades de superficie, carbonatos dades de superficie, carbonatos,
sulfuros
Iluminación Luz láser estructurada patrón de Luz láser estructurada patrón de
1 línea (para 3D) y unidad LED 1 línea (para 3D) y unidad LED
HLND de luz roja (para 2D) CCS de luz blanca (para 2D)
Software Sherlock de Telelyne DALSA Halcon 12 de MVTec [163]: una
[214]: herramienta de desarrollo poderosa librería de visión por
rápido, un software de visión por computador 2D y 3D totalmente
computador diseñado para sim- independiente del hardware em-
plificar el desarrollo de aplicacio- pleado y en la que se pueden pro-
nes de análisis de imagen, crea- gramar aplicaciones específicas
das sin programación

5.3. Análisis y caracterización de las placas


La información 3D, RGB y monocromo registrada con la cámara de las
placas es transferida al ordenador mediante la conexión Gigabit Ethernet
para su tratamiento siguiendo el esquema de la Figura 5.1. Las etapas sub-
siguientes, el preproceso y el proceso, analizan los datos capturados por el
sistema de visión con la finalidad de caracterizar la placa.

En los siguientes apartados se detallan las dos etapas citadas y los códigos
de inspección de las imágenes diseñados a tal efecto.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 129

5.3.1. Preproceso
En esta primera fase de preproceso se distinguen dos operaciones diferen-
ciadas. En primer lugar, debe tenerse en cuenta que las placas llegan a la
zona de clasificación sobre los rodillos en una posición variable, por lo que
las imágenes capturadas por el sistema de visión y recibidas por el PC son
heterogéneas en lo que a la posición y orientación de las placas se refiere.
Es preciso, por lo tanto, realizar unas operaciones previas de tratamiento de
las imágenes para prepararlas para las siguientes etapas de análisis: de este
modo, se realiza un recorte y enderezado de las imágenes 3D, color (las
tres componentes RGB) y escala de grises.

Por otra parte, mientras algunos defectos (falta de material y falsa escua-
dra) se basan en los límites de la placa, las restantes singularidades (presencia
de irregularidades, alabeo, carbonatos y sulfuros) se analizan en la región in-
terior de la placa. Para evitar que las irregularidades típicas de los bordes de
las placas (debido a su corte con las troqueladoras) distorsionen los resulta-
dos de los análisis de dichas singularidades, un segundo paso en el preproceso
consiste en la definición y recorte de la región interior de la placa en
las componentes 3D, color (RGB) y escala de grises.

Una vez los diferentes canales (intensidad 3D, escala de grises, R, G, B)


están preparados según los pasos anteriores (Fig. 5.5), se aplican los algorit-
mos de inspección explicados en el siguiente apartado para caracterizar cada
placa.

5.3.2. Proceso
En esta fase es en la que se realiza la inspección de las imágenes en busca
de las singularidades que definirán la calidad comercial de la placa (irregu-
laridades superficiales, falta de material, alabeo, falsa escuadra, presencia de
carbonatos y presencia de sulfuros). El resultado de los códigos de inspec-
ción será un , en base al cual se procederá a su clasificación de calidad en el
siguiente paso.

Algunos de los defectos o singularidades inhabilitan la placa si se hallan


presentes en ella sea donde fuere, mientras que otros pueden o no descartar-
la para su comercialización dependiendo de su posición. Consecuentemente,
algunos de los defectos se analizan para la placa entera mientras que otros se
analizan por tercios, tal y como se explica en cada apartado.
130 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Imagen adquirida por el sistema de


visión artificial

Detección de la placa mediante un


umbral (threshold)

Región real de la placa

Ajuste del menor rectángulo Detección de la placa mediante un


exterior a la placa umbral (threshold)

Orientación del rectángulo Región real de la placa enderezada


(y de la placa)
Reducción de la región a un 95% de
Rotación de la imagen para su tamaño original
enderezarla
Intersección y recorte de los píxeles
Recorte de la imagen de la placa con de la imagen según la región
un margen fijo alrededor reducida

Imagen de la placa recortada y Imagen de la zona interior de la


enderezada placa

(a) Etapas del preproceso y resultados

(b) Imagen 3D adquirida (input) (c) Detección de placa y cálculo de


orientación original

Figura 5.5: Preproceso de las imágenes recogidas por el sistema de visión y


ejemplos de su implementación en Halcon.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 131

Presencia de irregularidades superficiales


Las placas deben tener una superficie regular para una adecuada instala-
ción como elemento de techar, por lo que la evaluación de esta característica
es básica. Ocasionalmente, las placas pueden presentar irregularidades super-
ficiales generalizadas (por ejemplo, la llamada “panilla”) o bien irregularidades
locales (como los nudos, los “refollos” o las bregadas). En consecuencia, esta
singularidad se considera según dos procedimientos de análisis: por una par-
te se estudia la uniformidad global (Fig. 5.6), y por otra las irregularidades
locales (Fig. 5.7).

Región interior de la imagen 3D

Detección de la placa a través de un umbral

Región real de la placa

Cálculo del valor medio y desviación de las


intensidades 3D de los píxeles

Valor medio Desviación de los


de los píxeles valores de los
píxeles (v1)

(a) Proceso de análisis de la uniformidad (b) Resultado obtenido


general de placa

Figura 5.6: Proceso de análisis de la uniformidad general de la placa y resul-


tado mostrado en pantalla en Halcon.

En ambos casos se inspecciona la región interior de la imagen 3D de la


placa (sin sus bordes). En el análisis de la uniformidad global se calcula el
valor medio y la desviación estándar de los valores de intensidad 3D de los
píxeles de la imagen, considerando este último parámetro como un indicador
de la uniformidad de la superficie.
132 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Región interior de la imagen 3D

Definición de una región


rectangular interior a la placa

Definición de varias regiones de interés (ROIs) en


las 4 direcciones principales (vertical, horizontal y
ambas diagonales)

ROIs Dirección ROIs Dirección ROIs Dirección ROIs Dirección


Horizontal Vertical Diagonal 45º Diagonal 135º

Detección de escalones en los ROIs

Número, amplitud Número, amplitud Número, amplitud Número, amplitud


máxima, amplitud máxima, amplitud máxima, amplitud máxima, amplitud
media, varianza de la media, varianza de la media, varianza de la media, varianza de la
amplitud y distancia amplitud y distancia amplitud y distancia amplitud y distancia
media entre media entre media entre media entre
escalones en ROIs escalones en ROIs escalones en ROIs escalones en ROIs
Dir. Horizontal Dir. Vertical Dir. Diagonal 45º Dir. Diagonal 135º
(v1,v2,v3,v4,w1) (v1,v2,v3,v4,w1) (v1,v2,v3,v4,w1) (v1,v2,v3,v4,w1)

(a) Proceso de análisis de irregularidades locales de superficie

(b) Imagen 3D (input) (c) Ejemplo de detección de bordes

Figura 5.7: Proceso de análisis de la presencia de irregularidades locales y


ejemplo de su implementación.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 133

En lo tocante a las irregularidades locales, estas estructuras pueden seguir


diferentes direcciones dentro de la placa, por lo que se han considerado las
cuatro principales: vertical, horizontal y ambas diagonales. En dichas direc-
ciones, se analiza la presencia de escalones, cambios bruscos en los valores
de intensidad 3D, y se calculan sus coordenadas, amplitud y distancia entre
escalones consecutivos.

Falta de material

Este defecto se analiza a partir de la imagen 3D completa de la placa, en


la que se procede a detectar la región correspondiente a la totalidad de la
misma. Siguiendo el procedimiento de la Figura 5.8 se emplea dicha región
para calcular el rectángulo teórico de la placa (que representaría una placa
perfectamente cortada). De manera análoga se calculan las regiones reales
de cada tercio (superior, medio e inferior) de la placa y a partir de ellas sus
rectángulos teóricos.

Finalmente, se calculan los ratios entre las regiones reales de la placa y


sus teóricas, tanto para la placa entera como para los tres tercios, siguiendo
la expresión de la Ecuación 5.1.

Área región real de placa detectada


Ratio falta de material = (5.1)
Área rectángulo teórico de dicha región

El factor de rectangularidad también se obtiene para las regiones de placa


(reales) detectadas. Este factor de forma se calcula en Halcon siguiendo la
definición presentada en la sección 3.5. Los valores de ambos indicadores,
ratio y rectangularidad, están comprendidos entre 0 y 1.

Alabeo

Para que las placas puedan ser colocadas correctamente en los tejados de-
ben ser lo más planas posibles, siendo el alabeo un defecto crítico. Su análisis
se basa en la inspección de la región interior de los valores de intensidad 3D,
siguiendo el proceso descrito en la Figura 5.9.

Las diferencias entre las alturas de las zonas correspondientes a las es-
quinas y al centro de la placa caracterizarán la planicidad de la superficie e
indicarán el posible alabeo de la misma.
134 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Imagen 3D recortada y enderezada

Detección de la placa con un umbral

Área de la región real Rectangularidad


Región real de la placa
de la placa placa entera
(w1)
Cálculo del rectángulo teórico de la Ratio áreas
placa placa entera
(v1)
Región teórica de la Área de la región teórica
placa entera de la placa entera

División imagen de la placa en tercios

Tercio superior Tercio medio Tercio inferior

Detección de la placa con un umbral Rectangularidad tercios


superior, medio, inferior
(w1,w2,w3)

Región real Región real Región real Área región real tercios
Tercio superior Tercio medio Tercio inferior superior, medio, inferior
Ratio áreas
tercios
Cálculo del rectángulo teórico de cada superior,
tercio de placa medio, inferior
(v1,v2,v3)

Región teórica Región teórica Región teórica Área de la región teórica


Tercio superior Tercio medio Tercio inferior de los tercios superior,
medio, inferior

(a) Esquema del proceso de análisis

(b) Resultados obtenidos en un tercio de placa

Figura 5.8: Proceso de análisis de la falta de material en la placa (entera y


por tercios) y ejemplo de resultados obtenidos en Halcon.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 135

Región interior de la imagen 3D

Recorte de las 4 esquinas de la imagen y la zona


central

Región real de la placa en cada esquina y en la zona


central

Cálculo del valor medio y la desviación típica de los


valores de intensidad 3D en las esquinas y zona central

Diferencias entre las intensidades 3D medias de las 4


esquinas entre ellas y con respecto a la zona central
(v1,v2,v3,v4,v5,v6,v7,v8,v9,v10)

(a) Esquema del proceso (b) Ejemplo de resultado del


análisis esquina inf. derecha

Figura 5.9: Esquema del proceso de análisis del alabeo de la placa y muestra
de la implementación en Halcon.

Falsa escuadra

Las dimensiones de la placa se analizan para determinar si su corte ha


sido adecuado y su forma es regular, sin distorsiones indeseadas. Las placas
objeto de estudio son de forma rectangular, por lo que el criterio a la hora de
analizar el correcto escuadrado se basa en el ángulo que forman los bordes
de la placa en cada una de las cuatro esquinas.

En esta ocasión el código de inspección parte de la imagen 3D de la placa


entera (Fig. 5.10). Se detectan los cuatro bordes (superior, inferior y ambos
límites laterales), y a partir de ellos se consideran los pares que constitu-
yen las cuatro esquinas para calcular los ángulos que forman. Finalmente,
se calcula la diferencia de dichos ángulos con respecto al ángulo recto y se
almacenan dichos valores.

Además, dado que se obtiene la región de la placa entera, se almacena


el valor de su factor de rectangularidad (explicado en la sección 3.5) como
indicador adicional.
136 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Imagen recortada y
enderezada

Detección de los bordes de la placa Detección de la región


de la placa
Cálculo de los ángulos de cada esquina
Rectangularidad
de la placa
Diferencias de los ángulos de las (w1)
esquinas con respecto a 90º
(v1,v2,v3,v4)

(a) Proceso de análisis

(b) Resultado de análisis de los (c) Resultado rectangularity


ángulos

Figura 5.10: Esquema del análisis del correcto escuadrado de la placa y re-
sultados mostrados en pantalla.

Presencia de carbonatos

La búsqueda de carbonatos o flores se realiza de dos maneras para ajustar-


se a las características de las placas analizadas. Por una parte, los carbonatos
blanquecinos (las clásicas flores blancas) se analizan en la imagen en escala de
grises siguiendo el proceso de la Figura 5.12. Por otra, las placas presentan en
ocasiones carbonatos que han sufrido procesos de alteración, con tonalidad
amarillenta en lugar de blanquecina. De acuerdo con lo anterior, los carbo-
natos alterados (en adelante, “flores doradas”) se buscan en las componentes
RGB de la placa (Fig. 5.13).
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 137

Los criterios son esencialmente los mismos: los carbonatos se caracteri-


zan por la circularidad y color de las regiones así como por su considerable
tamaño (lo que permitirá diferenciarlos de los sulfuros en muchas ocasiones).

La principal diferencia entre procesar la imagen en escala de grises y las


componentes de color es que en el segundo caso es necesario efectuar una
transformación a otro espacio de color para potenciar los tonos dorados o
amarillentos y facilitar así su detección.

(a) Imagen RGB (b) Componente Y del (c) Zonas amarillas de-
espacio YUV tectadas

Figura 5.11: Cambio de espacio de color de RGB a YUV. Se observa cómo


las regiones amarillas se intensifican en la componente Y del espacio YUV,
facilitando su detección.

El espacio de color YUV consta de los componentes de luminancia (Y),


cromaticidad (U) y concentración (V). El cambio de espacio de color de RGB
a YUV se basa en la transformación lineal expresada en la Ecuación 5.2.

Y = 0.299R + 0.587G + 0.114B


U = −0.14713R − 0.28886G + 0.436B
V = 0.615R − 0.51499G − 0.10001B (5.2)

Para resaltar las tonalidades amarillas de los carbonatos alterados se rea-


liza una transformación del espacio de color RGB al YUV [49,246] (Fig. 5.11).
138 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Región interior de la imagen en


escala de grises

División imagen de la placa en tercios

Tercio superior Tercio medio Tercio inferior

Detección con un umbral (threshold) de


las regiones blancas de cada tercio

Eliminación del ruido (erosión, dilatación


y área mínima de 50 píxeles)

Filtro: área mínima (750 pix) y


circularidad mínima (0.39)

Cálculo de los parámetros de las


regiones sospechosas de cada tercio

Área media, circularidad Área media, circularidad Área media, circularidad


media y redondez media de media y redondez media de media y redondez media de
las regiones sospechosas las regiones sospechosas las regiones sospechosas
Tercio superior Tercio medio Tercio inferior
(v1,v2,w1) (v1,v2,w1) (v1,v2,w1)

(a) Esquema del análisis sobre la imagen en escala de grises


      

(b) Ejemplo de carbonato detectado

Figura 5.12: Proceso de análisis de la presencia de carbonatos o flores blancas


en las imágenes en escala de grises de las placas. La imagen (b) muestra un
ejemplo de carbonato detectado por el algoritmo de inspección.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 139

Región interior comp. G

Región interior comp. R Región interior comp. B

Cambio espacio de color RGB>YUV

Componente U Componente Y Componente V

División de la imagen en tercios

Tercio superior Tercio medio Tercio inferior

Detección con un umbral (threshold) de


las regiones doradas de cada tercio

Eliminación del ruido (erosión, dilatación


y área mínima de 50 píxeles)

Filtro: área mínima (600 pix) y


circularidad mínima (0.39)

Cálculo de los parámetros de las


regiones sospechosas de cada tercio

Área media, circularidad Área media, circularidad Área media, circularidad


media y redondez media de media y redondez media de media y redondez media de
las regiones sospechosas las regiones sospechosas las regiones sospechosas
Tercio superior Tercio medio Tercio inferior
(v1,v2,w1) (v1,v2,w1) (v1,v2,w1)

(a) Esquema del análisis sobre la imagen a color

(b) Ejemplo de carbonato detectado

Figura 5.13: Proceso de análisis de la presencia de carbonatos alterados en


las imágenes a color de las placas. La imagen (b) muestra dos carbonatos
detectados siguiendo dicho proceso.
140 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Presencia de sulfuros

Desde un punto de vista físico, los carbonatos alterados (amarillentos o


dorados) y los sulfuros son similares, por lo que sus procedimientos de ins-
pección tienen pasos en común. Dado que su principal característica es el
color, la búsqueda de ambas singularidades se basa en las componentes RGB
de las imágenes de las placas.

La principal diferencia es su tamaño: mientras los carbonatos o flores son


habitualmente de tamaño medio-grande y fácilmente detectables a simple
vista, los sulfuros son mucho más pequeños y en ocasiones difíciles de distin-
guir para nuestros ojos.

Teniendo en cuenta ambas circunstancias, el código diseñado para la de-


tección de sulfuros sigue la estructura mostrada en la Figura 5.14.

La detección de sulfuros en las placas del conjunto de estudio resultó ser


un reto por su pequeño tamaño (menor de 2 mm) y por la presencia de pun-
tos blancos sobre la superficie de las placas. Estos pequeños puntos blancos
provocan una detección defectuosa de sulfuros: dependiendo de los paráme-
tros establecidos en el código de inspección, los sulfuros no se detectan o,
por el contrario, se detectan pero también hay falsos positivos debido a los
citados puntos blancos.

En una placa limpia, sin puntos blancos, se detectaron correctamente


sulfuros reales cuyas componentes de color eran las siguientes: R=[36 − 57],
G=[33 − 57], B=[28 − 56] y la componente Y del espacio de color YUV era de
[34 − 58]. Sin embargo, las muestras de placas limpias con sulfuros resultan
insuficientes para testar el funcionamiento del código de inspección desarro-
llado.

Teniendo en cuenta lo anterior, se prepararon dos placas con sulfuros arti-


ficiales para poder así calibrar la detección de los sulfuros en las placas reales
con nuestro código.

El primer calibrador incluyó dos tonos de amarillo (detectados) y dos


tonos de naranja (no detectados), permitiendo establecer unos primeros um-
brales de detección de los colores objetivo (tonos amarillos).
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 141

Región interior comp. R Región interior comp. G Región interior comp. B

Cambio espacio de color RGB>YUV

Componente V Componente U Componente Y

División de la imagen en tercios División de la imagen en tercios

Tercio superior Tercio medio Tercio inferior Tercio superior Tercio medio Tercio inferior

Detección con un umbral (threshold) de Detección con un umbral (threshold) de


las regiones doradas de cada tercio las regiones doradas de cada tercio

Reg. Sospechosas Reg. Sospechosas Reg. Sospechosas Reg. Sospechosas Reg. Sospechosas Reg. Sospechosas
Tercio superior Tercio medio Tercio inferior Tercio superior Tercio medio Tercio inferior

Filtro: área (15-500 pix) y mínima Filtro: área (15-500 pix) y mínima
circularidad (0.3) circularidad (0.3)

Dilatación de las regiones Dilatación de las regiones

Filtro: área (200-600 pix) y mínima Filtro: área (200-600 pix) y mínima
circularidad (0.5) circularidad (0.5)

Regiones Sospechosas Regiones Sospechosas Regiones Sospechosas


Tercio superior Tercio medio Tercio inferior

Cálculo de los parámetros de las regiones


sospechosas de cada tercio

Área media, circularidad Área media, circularidad Área media, circularidad


media y redondez media de media y redondez media de media y redondez media de
las regiones sospechosas las regiones sospechosas las regiones sospechosas
Tercio superior Tercio medio Tercio inferior
(v1,v2,w1) (v1,v2,w1) (v1,v2,w1)

Figura 5.14: Esquema del proceso de análisis de la presencia de sulfuros en


las placas.
142 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

A continuación se construyó una segunda placa con nuevos sulfuros ar-


tificiales cuyos colores dorado-amarillentos se asemejaban al de los sulfuros
naturales. En esta placa (calibrador no 2, mostrado en la Figura 5.15a) se
simularon cuatro sulfuros de tonos dorados ligeramente diferentes caracteri-
zados por los siguientes intervalos de componentes de color:
Sulfuro tipo 1: R=[40,80], G=[33,72], B=[28,49], YUVY =[34,62],
Sulfuro tipo 2: R=[49,95], G=[40,90], B=[34,59], YUVY =[40,88],
Sulfuro tipo 3: R=[37,75], G=[33,70], B=[27,47], YUVY =[31,60],
Sulfuro tipo 4: R=[40,87], G=[38,81], B=[33,53], YUVY =[36,86].
Asimismo, los sulfuros artificiales del calibrador no 2 tienen diferentes
formas y tamaños:
Formas: cuadrada, elíptica y circular.
Tamaños: extra pequeño (2-4 mm de diámetro), pequeño (4-7 mm de
diám.), mediano (6-9 mm de diám.) y grande (10-18 mm de diám.).
Los resultados de detección al aplicar el código de inspección diseñado se
muestran en la Figura 5.15b. El código de inspección es capaz de detectar los
sulfuros artificiales de menor tamaño (2-4 mm de diámetro) en una placa sin
puntos blancos. Los sulfuros artificiales de mayor tamaño se descartan, ya
que, mientras que los carbonatos se caracterizan por tamaños mayores, los
sulfuros son habitualmente pequeños. En este calibrador no 2, por tanto, se
puede decir que la exactitud de la detección es del 100 % (todos los sulfuros
artificiales cuyas características coinciden con las de los reales se detectan).

De los resultados obtenidos del calibrador no 2 se pueden deducir los lími-


tes de detección del código de inspección de sulfuros: regiones amarillas cu-
yas componentes RGB pertenecen a los intervalos R = [37, 95], G = [33, 90],
B = [27, 59], cuya componente Y del espacio de color YUV está en el in-
tervalo Y U VY = [31, 88], y con un área comprendida entre los 7 y los 30
mm2 .

Vector característico resultante


Fruto de la inspección de las imágenes con los códigos desarrollados en
el programa Halcon se obtiene el vector característico de la placa, que está
compuesto por 71 variables, 53 de ellas básicas (denotadas como vi ) y 18
auxiliares (denotadas como wi ). Tales variables y la singularidad a la que se
refieren se describen en la Tabla 5.3.
5.3. ANÁLISIS Y CARACTERIZACIÓN DE LAS PLACAS 143

(a) Placa calibradora de sulfuros

(b) Resultados de detección de sulfuros

Figura 5.15: Placa con sulfuros artificiales empleada para la calibración del
algoritmo de detección y resultados obtenidos con el código de inspección
implementado.
144

Tabla 5.3: Resumen de las variables definidas para cada singularidad.


Singularidad Variable Unidad Descripción Código
Falta RatiosFM**∈ R4 Adimens. Ratios entre área real y teórica de placa falta_mat_ratio_
de material (+)RectangFM**∈ R4 Adimens. Factor de rectangularidad falta_mat_rect_
Falsa AngleFE∈ R4 Grados sexag. Diferencias de los ángulos de las esqui- falsa_esc_
nas con respecto a 90o
escuadra (+)RectangFE Adimens. Factor de rectangularidad falsa_esc_rect
Alabeo AngA∈ R10 Intens. de píxel Diferencias entre los valores medios de alabeo_
intensidad de los píxeles
de las esquinas entre sí y con respecto
a la zona central
Irreg. superfi- DesvSup Intens. de píxel Desviación típica de los valores de in- def_superf_desv_tip
ciales tensidad de los píxeles
NumEdges*∈ R4 Adimens. Número de bordes def_superf_num_edges
MaxAmplEdg*∈ R4 Intens. de píxel Amplitud máxima de los bordes def_superf_ampli_max_
MeanAmplEdg*∈ R4 Intens. de píxel Amplitud media de los bordes def_superf_ampli_media_
VarAmplEdg*∈ R4 Intens. de píxel Desviación de la amplitud de los bordes def_superf_ampli_desv_
(+)MeanDistEdg*∈ R4 Píxel Distancia media entre bordes def_superf_dist_media
Presencia de MAreaCBW**∈ R3 P ixel2 Área media reg. de interés (esc. grises) flores_gray_area_med_
carbonatos MCircCBW**∈ R3 Adimens. Circularidad media reg. interés (esc. flores_gray_circu_med_
grises)
(+)MRoundCBW**∈ R3 Adimens. Redondez media reg. de interés (esc. flores_gray_round_med_
grises)
MAreaCRGB**∈ R3 P ixel2 Área media reg. de interés (color) flores_rgb_area_med_
MCircCRGB**∈ R3 Adimens. Circularidad media reg. interés (color) flores_rgb_circu_med_
(+)MRoundCRGB**∈ R3 Adimens. Redondez media reg. de interés (color) flores_rgb_round_med_
Presencia de MAreaS**∈ R3 P ixel2 Área media reg. de interés (color) sulfuros_area_med_
sulfuros MCircS**∈ R3 Adimens. Circularidad media reg. interés (color) sulfuros_circu_med_
(+)MRoundS**∈ R3 Adimens. Redondez media reg. de interés (color) sulfuros_round_med_
* Direcciones consideradas: vertical, horizontal y las dos diagonales principales. / ** Estudio por tercios / (+) Variable auxiliar
CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 145

5.4. Clasificación de placas de pizarra


Esta etapa sería la correspondiente al postproceso de los datos, según el
esquema inicialmente descrito. El análisis de las imágenes en escala de grises,
RGB y 3D da como resultado un vector característico de cada placa, en el
cual las componentes representan los parámetros de cada uno de los defectos
contemplados. Una vez se dispone del vector de características de la placa,
se establece su calidad comercial en base a algún criterio.

El clasificador al completo se estructura en 3 capas, entendiendo como


tales las siguientes etapas en la asignación de calidad:

1. Extracción de variables de caracterización de defectos: la primera capa


consiste en la elección de los parámetros que definen cada defecto o
singularidad de la placa.

2. Categorización de defectos: en base a las variables anteriores, se es-


tablecen unos umbrales de detección de cada defecto. Estos umbrales
vendrán determinados por las características del yacimiento, de las pla-
cas de pizarra.

3. Clasificador final por calidades comerciales: dependiendo de los defectos


encontrados, de su posición (en el caso de las singularidades evaluadas
por tercios) y de las exigencias del mercado objetivo se asigna la calidad
comercial a la placa. Esta última etapa depende en gran medida, por
tanto, de las características del mercado.

La tercera capa del clasificador se ha tratado de simular siguiendo dos


estrategias. Por una parte, se ha tratado de definir una estructura tipo árbol
de decisión manualmente, teniendo en cuenta el criterio seguido por los ex-
pertos que analizaron y categorizaron las placas (decisor empírico, Apartado
5.4.1).

Por otra parte, se han empleado distintas técnicas de aprendizaje auto-


mático para construir un modelo capaz de aprender el criterio del experto y
simularlo para clasificar nuevas muestras (Apartado 5.4.3).

Los resultados de ambas estrategias se recogen en el Apartado 5.4.4 y se


discuten en el Apartado 5.4.5.
146 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Descripción de la muestra

La muestra con la que se ha trabajado está compuesta de la evaluación de


70 placas de pizarra por parte de dos expertos diferentes, quienes evaluaron
la presencia de los 6 defectos considerados y asignaron una calidad comercial
según su propio criterio.

La Tabla 5.4 contiene la información relativa al número de placas de cada


tipo. Cabe comentar, en primer lugar, que en varias de las placas los expertos
identificaron más de un tipo de defecto. Asimismo, se destaca la discrepancia
existente entre ambos expertos, quienes a pesar de ser conocedores de este
material y su mercado no poseen el mismo criterio, como así se manifiesta en
la disparidad de sus apreciaciones, recogidas en dicha tabla.

Tabla 5.4: Descripción de la muestra: número de placas de cada calidad co-


mercial y defectos detectados por los dos expertos.
Experto no 1 Experto no 2
Calidad Primera 4 7
Segunda 6 11
Rechazo 60 52
Total 70 70
Defecto Falsa escuadra 1 1
Alabeo 1 0
Falta de material 2 5
Defectos de superficie 25 41
Carbonatos 28 24
Sulfuros 20 11

Las calidades asignadas según cada uno de los expertos se han cruzado
en la Tabla 5.5, de modo que se pueden observar cómo hay 58 coincidencias
y 12 discrepancias (tasa de error del 17 %).

Si se toma el Experto no 1 como referencia, y se supone que la asigna-


ción de calidades del Experto no 2 es la predicción del modelo entrenado, se
tendrían 9 falsos negativos (placas que deberían haber sido rechazadas y son
aceptadas como calidad 1 ó 2), 1 falso positivo (placa que se rechaza cuando
el Experto no 1 la había aceptado) y 2 errores neutros.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 147

Tomando el Experto no 2 como referencia, los tipos de errores serían los


contrarios: 9 falsos positivos (placas que el experto de referencia aceptó y
salen rechazadas por el “modelo”), 1 falso negativo (placa erróneamente acep-
tada) y los mismos 2 errores neutros.

Esto pone de manifiesto la dificultad de modelación del criterio de deci-


sión, ya que ni siquiera dos personas expertas clasifican de la misma manera
una muestra común.

Tabla 5.5: Matriz de confusión resultante al enfrentar los criterios de los dos
expertos.
Clase
Experto no 2
1 2 3
Clase 1 3 1 0 4
Experto 2 1 4 1 6
no 1 3 3 6 51 60
7 11 52 70

5.4.1. Asignación de calidad según decisor empírico


Esta primera aproximación a la clasificación automática de las placas con-
siste en la construcción de un árbol de decisión de manera manual, teniendo
en cuenta los criterios de los dos expertos conocidos así como los requisitos
de la normativa aplicable a las placas de pizarra para techar.

De este modo, se tienen en cuenta los siguientes aspectos a la hora de


definir los umbrales y el proceso de decisión:

1. El alabeo y el mal escuadrado de la placa son defectos determinantes.


En caso de detectarse alguno de ellos, la placa se descarta directamente.

2. La falta de material se evalúa por tercios: si se detecta este defecto en


el tercio medio o en los dos tercios extremos, se descarta la placa. En
caso contrario, no tiene por qué afectar a la calidad y su clasificación
dependerá de los restantes parámetros.

3. Si en uno de los tercios presenta una falta de material y en el otro


presenta sulfuros y/o carbonatos, se rechaza.
148 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

4. Si el único defecto detectado son carbonatos o sulfuros: si se detectan


en el tercio medio o en ambos tercios extremos, la placa se descarta; si
se detectan sólo en uno de los tercios, se asigna segunda calidad.

5. Si los defectos superficiales se detectan pero no son acusados, se asigna


segunda calidad. En caso de ser importantes, hacen que la placa sea
rechazada.

6. Si la placa fue catalogada como de segunda calidad por dos defectos


diferentes (presencia de flores y/o sulfuros en algún tercio extremo, o
defectos superficiales poco acusados), se rechaza.

5.4.2. Análisis de las variables del vector característico


El conjunto de variables de entrada de los modelos, sea cual fuere la téc-
nica matemática empleada, debe aportar información útil para la predicción
de la variable de salida. De este modo, el primer paso consiste en eliminar
del conjunto de entrada aquellas variables cuya amplitud es nula, ya que no
aportan información al modelo.

En el caso de las 70 placas analizadas, las siguientes variables han resul-


tado con amplitud cero y han sido por tanto eliminadas de los conjuntos de
entrada de los modelos:

Área media de las flores encontradas en el tercio inferior de la imagen


en escala de grises.

Circularidad media de las flores encontradas en el tercio inferior de la


imagen en escala de grises.

Redondez media de las flores encontradas en el tercio inferior de la


imagen en escala de grises.

Área media de las flores encontradas en el tercio inferior de la imagen


a color.

Circularidad media de las flores encontradas en el tercio inferior de la


imagen a color.

Redondez media de las flores encontradas en el tercio inferior de la


imagen a color.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 149

Sin embargo, debe tenerse en cuenta que lo anterior no significa necesa-


riamente que dichas variables no sean importantes o representativas de la
calidad de una placa, cualquiera que sea, sino que en el conjunto de placas
analizado han resultado no ser parámetros relevantes.

En el caso que nos ocupa, las variables con amplitud nula eran las re-
lativas a las flores en el tercio inferior de las placas. Es evidente que no es
un parámetro a despreciar, ya que la presencia de carbonatos es un factor
que afecta a la calidad de la pizarra, pasando a calificarse como de segunda
calidad o rechazo, dependiendo de la posición y de la presencia o no de más
carbonatos en los otros tercios. Sin embargo, el procesado de las imágenes
tomadas dio como resultado la no detección de carbonatos en el tercio infe-
rior, por lo que las variables de área, circularidad y redondez medias aparecen
como valores constantes en la base de datos manejada para la construcción
del modelo de clasificación automática.

Análisis de componentes principales


En la construcción de modelos de aprendizaje automático, una parte cru-
cial es la definición de las variables de entrada de modo que aquellas seleccio-
nadas sean lo más representativas posibles de los datos a modelar. No es tan
importante el número de variables como la información que aporten, como
así se comprobó en trabajos como [11].

Tras la inspección de las imágenes de las placas con los códigos diseñados,
un total de 71 variables (53 básicas y 18 auxiliares) caracterizan la placa en
cuestión. Con el objetivo de que las variables aporten la mayor información
posible al modelo de aprendizaje automático construido posteriormente, un
primer paso consiste en eliminar aquellas cuya amplitud es nula en la muestra
analizada (Apartado 5.4).

Sin embargo, el número de variables disponibles sigue siendo elevado: 49


básicas y 16 auxiliares (65 en total). Esto presenta, principalmente, dos in-
convenientes, como se expuso en el Apartado 4.5: la dificultad en el estudio
de las relaciones entre las variables y la probable correlación entre ellas, lo
que resultaría en información redundante.

Con el ánimo de solventar esta problemática, se realiza un análisis de


componentes principales sobre los conjuntos de entrada definidos
inicialmente: por una parte, sobre las variables básicas; por otra, sobre el
150 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

conjunto de todas (básicas y auxiliares). Para ello, las variables de entrada


se estandarizan según el z−score, eliminando así el efecto de las distintas uni-
dades de medida de las variables y empleando en el análisis de componentes
principales la matriz de correlaciones.

Análisis de componentes principales de las variables básicas


Tras analizar las componentes principales de las 49 variables básicas, se
obtiene que la información se encuentra muy repartida entre todas ellas. La
Figura 5.16a muestra el porcentaje de varianza inicial explicado por cada una
de las componentes principales. Se observa cómo, a pesar de que las primeras
5 componentes principales explican un porcentaje mayor, la explicación de
la varianza está en general muy repartida: las 5 primeras explican apenas
el 57 % del total, y para alcanzar el 80 % es preciso tomar las 12 primeras.
Finalmente, tomando aquellas componentes principales que explican más del
2 % de dicha varianza, se tiene que las primeras 13 explican el 83.3 % de la
varianza total (Fig. 5.16b).

La matriz de coeficientes obtenida, que recoge la construcción de cada


componente principal como combinación lineal de las variables iniciales, in-
dica el peso o importancia de cada variable inicial en las nuevas componentes.
Analizando los coeficientes de las 13 primeras componentes principales se tie-
ne lo siguiente:

Comp. Principal 1: representa el escuadrado de la placa.

Comp. Principal 2: las variables que más pesan en esta componente son
relativas a las flores en el tercio superior y las irregularidades superfi-
ciales locales.

Comp. Principal 3: recoge las características dimensionales de la placa


(escuadrado y alabeo), así como la regularidad de su superficie.

Comp. Principal 4: nuevamente el escuadrado de la placa pesa en es-


ta componente, apareciendo también los parámetros que describen los
sulfuros presentes en los tercios superior y medio de la placa.

Comp. Principal 5: representa la presencia de sulfuros en el tercio in-


ferior.

Comp. Principal 6: la presencia de sulfuros en cualquiera de los tercios,


el escuadrado y la falta de material definen esta componente.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 151

ACP Variables básicas


25

20
%Varianza explicada

15

10

0
0 5 10 15 20 25 30 35 40 45 50
Componente principal

(a) Varianza explicada


ACP Variables básicas
100

83.29
%Varianza explicada acumulada

80

60

40

20

0
13
5 10 15 20 25 30 35 40 45 50
Componente principal

(b) Varianza explicada acumulada

Figura 5.16: Varianza explicada de las variables básicas y su acumulado para


las componentes principales calculadas con el Input A.

Comp. Principal 7: definida por las variables relativas al alabeo y a las


irregularidades superficiales locales.

Comp. Principal 8: representa el alabeo y la falta de material en el


tercio medio.

Comp. Principal 9: determinada por las características dimensionales


(escuadrado y alabeo) y el acabado (falta de material en los tercios
superior e inferior).

Comp. Principal 10: alabeo e irregularidades superficiales locales.


152 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Comp. Principal 11: nuevamente las irregularidades superficiales locales


entran en juego, así como la falta de material en el tercio medio de la
placa.

Comp. Principal 12: representa una conjunción de defectos como las


irregularidades superficiales locales, el alabeo, la falta de material en el
tercio medio y la presencia de sulfuros en el tercio inferior.

Comp. Principal 13: representa el escuadrado de la placa y la falta de


material en su tercio superior.

Con estas 13 primeras componentes principales se construye una nueva


base de datos para el entrenamiento de los modelos de aprendizaje automáti-
co. Para ello, se multiplica la matriz de la base de datos inicial, estandarizada
con su z−score, por la matriz de coeficientes resultante del análisis de com-
ponentes principales.

De la matriz obtenida, cuyas dimensiones son 70x49 (70 observaciones,


49 componentes principales construidas como combinación lineal de las va-
riables básicas iniciales), se toman las primeras 13 columnas, pues son las
correspondientes a las componentes principales analizadas, que explican el
83.3 % de la varianza total. Este es el denominado Input PCA-A.

Análisis de componentes principales de las variables básicas y au-


xiliares
Siguiendo un procedimiento análogo al explicado en el apartado anterior,
se realiza el análisis de componentes principales del conjunto de variables
totales (básicas y auxiliares). La Figura 5.17a representa el porcentaje de va-
rianza inicial explicado por cada una de las nuevas componentes principales,
en la que se observa, nuevamente, cómo la información está muy repartida.

En este caso, las componentes principales que más varianza explican son
las 8 primeras, con cerca del 68 % de la varianza total. Las siguientes com-
ponentes explican porcentajes menores del 3 %, siendo preciso tomar las pri-
meras 17 (cada una de las cuales explica más del 1.5 %) para reunir el 87.6 %
de la varianza explicada total (Fig. 5.17b).

Tras analizar la matriz de coeficientes que relaciona las variables iniciales


con las componentes principales construidas, se puede decir lo siguiente de
las primeras 17 componentes:
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 153

ACP Variables básicas y auxiliares


25

20
%Varianza explicada

15

10

0
0 10 20 30 40 50 60 70
Componente principal

(a) Varianza explicada


ACP Variables básicas y auxiliares
100

87.6
%Varianza explicada acumulada

80

60

40

20

0 17
10 20 30 40 50 60 70
Componente principal

(b) Varianza explicada acumulada

Figura 5.17: Varianza explicada de las variables básicas y auxiliares y su


acumulado para las componentes principales calculadas con el Input B.

Comp. Principal 1: representa el escuadrado de la placa.

Comp. Principal 2: viene determinado por la presencia de flores en


los tercios superior y/o medio, y por las irregularidades superficiales
locales.

Comp. Principal 3: esta tercera componente integra varios defectos,


como son la falta de material, el alabeo, el escuadrado de la placa y la
regularidad general de su superficie.

Comp. Principal 4: definida por el alabeo, la regularidad de la superficie


y la presencia de sulfuros en los tercios extremos (superior y/o inferior).
154 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Comp. Principal 5: representa, por una parte, las características di-


mensionales de la placa (falta de material y escuadrado), y por otra las
características superficiales en cuanto a su regularidad general y a la
presencia de sulfuros en los tercios medio y/o superior.

Comp. Principal 6: representa el alabeo y la presencia de sulfuros en el


tercio inferior.

Comp. Principal 7: nuevamente el alabeo determina esta componente,


así como las irregularidades superficiales locales.

Comp. Principal 8: de un modo similar a la quinta componente, repre-


senta las características dimensionales de la placa (falta de material y
escuadrado) y las irregularidades superficiales locales.

Comp. Principal 9: determinada por el alabeo, la falta de material y


las irregularidades superficiales locales.

Comp. Principal 10: representa las características dimensionales de la


placa en cuanto a alabeo y faltas de material.

Comp. Principal 11: en este caso, la presencia de flores en el tercio su-


perior define esta componente junto con el alabeo y las irregularidades
superficiales locales.

Comp. Principal 12: esta componente representa las características di-


mensionales globales de la placa, incluyendo su escuadrado, faltas de
material, alabeo y las irregularidades superficiales locales.

Comp. Principal 13: similar a la anterior, comprende las faltas de ma-


terial, el escuadrado y las irregularidades superficiales locales.

Comp. Principal 14: representa las irregularidades superficiales locales


y el alabeo de la placa.

Comp. Principal 15: al igual que la novena componente, viene determi-


nada por el alabeo, la falta de material y las irregularidades superficiales
locales.

Comp. Principal 16: integra los mismos defectos que las componentes
9 y 15.

Comp. Principal 17: representa la falta de material y las irregularidades


superficiales locales.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 155

Del mismo modo que se expuso anteriormente, se construye una nueva


base de datos multiplicando la matriz de datos inicial (que contiene las varia-
bles básicas y auxiliares cuya amplitud es diferente de cero), estandarizada,
por la matriz de coeficientes del análisis de componentes principales.

Se obtiene una matriz de tamaño 70x65 (70 observaciones y 65 com-


ponentes principales), de la que se toman las primeras 17 columnas, que
corresponden a las componentes principales que explican el 87.6 % de la va-
rianza total, analizadas más arriba. Se construye así el llamado Input PCA-B.

A modo de recapitulación, la Tabla 5.6 muestra una síntesis de los de-


fectos considerados en este estudio y su representación en las componentes
principales resultantes.

5.4.3. Configuración de los modelos entrenados


Mediante la aplicación de técnicas de aprendizaje automático, se cons-
truyen distintos modelos matemáticos para simular el criterio del experto y
predecir la calidad comercial a partir del vector característico de la placa.

La configuración de tales modelos se analiza en busca no sólo de la técni-


ca matemática más adecuada, sino también de las variables de entrada más
indicadas para un buen desempeño. Así, se han empleado un total de cuatro
conjuntos de entrada, definidos a continuación.

Las variables básicas de la Tabla 5.3 constituyen el primer conjunto,


Input A, con el que se construyen los primeros modelos. El segundo con-
junto, Input B , está compuesto por la base de datos completa, que incluye
las variables principales y las auxiliares de la misma tabla.

En estos primeros conjuntos se analiza la presencia de variables con am-


plitud nula (pág. 148), de modo que tras la eliminación de tales variables, los
Inputs A y B se reducen como sigue:

Input A: variables básicas (un total de 53), quedan reducidas a 49 (cifra


mostrada entre paréntesis en la Tabla 5.7). Tras el análisis de las 70
placas disponibles, las siguientes 4 variables resultan con amplitud igual
a cero:

• Área media de las flores encontradas en el tercio inferior de la


imagen en escala de grises.
156 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Tabla 5.6: Resumen de los defectos representados por cada componente prin-
cipal de los análisis realizados sobre el Input A e Input B.
Código PCA-A (Input A) Código PCA-B (Input B)
CP1A Escuadrado CP1B Escuadrado
CP2A Carbonatos CP2B Carbonatos
Defectos de superficie Defectos de superficie
CP3A Escuadrado CP3B Escuadrado
Alabeo Alabeo
Defectos de superficie Defectos de superficie
Falta de material
CP4A Escuadrado CP4B Alabeo
Sulfuros Defectos de superficie
Sulfuros
CP5A Sulfuros CP5B Sulfuros
Escuadrado
Falta de material
Defectos de superficie
CP6A Escuadrado CP6B Alabeo
Sulfuros Sulfuros
Falta de material
CP7A Alabeo CP7B Alabeo
Defectos de superficie Defectos de superficie
CP8A Alabeo CP8B Escuadrado
Falta de material Falta de material
Defectos de superficie
CP9A Alabeo CP9B Alabeo
Falta de material Falta de material
Escuadrado Defectos de superficie
CP10A Alabeo CP10B Alabeo
Defectos de superficie Falta de material
CP11A Defectos de superficie CP11B Alabeo
Falta de material Carbonatos
Defectos de superficie
CP12A Alabeo CP12B Alabeo
Defectos de superficie Defectos de superficie
Falta de material Falta de material
Sulfuros Escuadrado
CP13A Escuadrado CP13B Escuadrado
Falta de material Falta de material
Defectos de superficie
CP14B Alabeo
Defectos de superficie
CP15B Alabeo
Falta de material
Defectos de superficie
CP16B Alabeo
Falta de material
Defectos de superficie
CP17B Falta de material
Defectos de superficie
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 157

• Circularidad media de las flores encontradas en el tercio inferior


de la imagen en escala de grises.
• Área media de las flores encontradas en el tercio inferior de la
imagen a color.
• Circularidad media de las flores encontradas en el tercio inferior
de la imagen a color.

Input B: todas las variables disponibles, 53 básicas y 18 auxiliares,


quedan reducidas a 65 (cifra mostrada entre paréntesis en la Tabla 5.7).
En este caso, 6 variables resultan tener amplitud igual a cero, añadiendo
así a las anteriores, comunes con el Input A, las dos siguientes:

• Redondez media de las flores encontradas en el tercio inferior de


la imagen en escala de grises.
• Redondez media de las flores encontradas en el tercio inferior de
la imagen a color.

Por último, un tercer y un cuarto conjuntos de modelos se construyeron


con las variables resultantes del estudio de componentes principales de los
conjuntos iniciales: del llamado Input A, resulta el Input PCA-A que in-
cluye las componentes principales del conjunto inicial A; por su parte, del
Input B resulta el conjunto Input PCA-B , con las componentes principales
del conjunto inicial B.

Asimismo, las salidas de los modelos atienden a la calidad de cada placa,


disponiéndose de dos salidas diferenciadas: las calidades asignadas según el
criterio del Experto no 1 y las asignadas según el criterio del Experto no 2. La
Tabla 5.7 muestra un resumen de los modelos entrenados.

Tabla 5.7: Resumen de la configuración de los modelos de predicción de la


calidad de las placas de pizarra implementados: Entradas (Inputs) y Salidas
(Outputs) consideradas, y número de variables de entrada.
Input A Input B Input PCA-A Input PCA-B
Criterio 53 71 13 17
Experto no 1 (49) (65)
Criterio 53 71 13 17
o
Experto n 2 (49) (65)
158 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

5.4.4. Resultados obtenidos con el decisor empírico y


con los modelos CART, MLP y SVM
Resultados del decisor empírico
Tras analizar las 70 placas y aplicar el árbol de decisión cuyos umbrales
establecidos de manera manual tratan de emular el criterio del experto, se
tienen los resultados que se resumen en la Tabla 5.8. El resultado de este
criterio se muestra en pantalla de la forma que se recoge en la Figura 5.18.

Tabla 5.8: Matriz de confusión del decisor empírico.


Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 4 0 0 7 0 0
2 4 0 2 9 0 2
3 32 8 20 24 8 20
MAE = 1.114 MAE = 0.957

Resultados de los modelos CART


La Tabla 5.9 contiene un resumen de las tasas de error obtenidas para los
modelos implementados. Se emplearon 4 conjuntos de variables de entrada
distintos (Input A, Input B, Input PCA-A e Input PCA-B) y dos salidas,
que corresponden a las calidades asignadas por los dos expertos.

El árbol construido con el conjunto de entrada Input A y es el mismo que


el resultante al emplear el Input B cuando se simula el criterio del Experto
no 1 (Fig. 5.19a y Fig. 5.20a). Consta de dos niveles y cuatro nodos finales en
los que aparecen representadas las tres clases de placa definidas. La variable
que tiene una mayor influencia y establece el primer criterio de decisión hace
referencia a los defectos de superficie locales.

En cuanto a los árboles construidos con el Input A y el Input B para


simular el criterio del Experto no 2, se observa que son iguales (Fig. 5.19b
y Fig. 5.20b), y similares a los obtenidos con el Experto no 1. Se tiene un
árbol de dos niveles y cuatro nodos finales en los todas las clases aparecen
representadas, y nuevamente el primer decisor es un parámetro relativo a los
defectos de superficie locales.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 159

Figura 5.18: Muestra de la clasificación efectuada en Halcon siguiendo la


estrategia del decisor empírico. Arriba, de izquierda a derecha, se muestran
las imágenes en escala de grises, color e intensidad 3D. En la parte inferior se
muestra el resumen de resultados de evaluación de cada defecto y la calidad
comercial asignada.
160 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Tabla 5.9: Resumen de tasas de error obtenidas para los modelos CART
implementados con las 8 configuraciones definidas.
Output
Experto no 1 Experto no 2
Input
0.057 0.100
A Fig. 5.19a Fig. 5.19b
Matriz conf.: ver Tabla 5.10
0.057 0.100
B Fig. 5.20a Fig. 5.20b
Matriz conf.: ver Tabla 5.11
0.100 0.086
PCA-A Fig. 5.21a Fig. 5.21b
Matriz conf.: ver Tabla 5.12
0.100 0.086
PCA-B Fig. 5.22a Fig. 5.22b
Matriz conf.: ver Tabla 5.13

Tabla 5.10: Matriz de confusión media del árbol de clasificación obtenido con
el Input A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 4 0 0 4 1 2
2 1 5 0 0 7 4
3 3 0 57 0 0 52
MAE = 0.100 MAE = 0.129

Tabla 5.11: Matriz de confusión media del árbol de clasificación obtenido con
el Input B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 4 0 0 4 1 2
2 1 5 0 0 7 4
3 3 0 57 0 0 52
MAE = 0.100 MAE = 0.129
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 161

def_superf_ampli_desv_V < 1.06278 def_superf_ampli_desv_V >= 1.06278

falsa_esc_ID < -0.0424956 falsa_esc_ID >= -0.0424956


3

def_superf_ampli_max_H < 6.02516 def_superf_ampli_max_H >= 6.02516


3

1 2

(a) Input A, Experto no 1

def_superf_ampli_desv_V < 0.307039 def_superf_ampli_desv_V >= 0.307039

alabeo_II_ID < 6.75804 alabeo_II_ID >= 6.75804


3

alabeo_SI_SD < 5.12236 alabeo_SI_SD >= 5.12236


3

2 1

(b) Input A, Experto no 2

Figura 5.19: Árboles correspondientes al conjunto de entrada Input A y los


criterios de salida de los Expertos no 1 y no 2.
162 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

def_superf_ampli_desv_V < 1.06278 def_superf_ampli_desv_V >= 1.06278

falsa_esc_ID < -0.0424956 falsa_esc_ID >= -0.0424956


3

def_superf_ampli_max_H < 6.02516 def_superf_ampli_max_H >= 6.02516


3

1 2

(a) Input B, Experto no 1

def_superf_ampli_desv_V < 0.307039 def_superf_ampli_desv_V >= 0.307039

alabeo_II_ID < 6.75804 alabeo_II_ID >= 6.75804


3

alabeo_SI_SD < 5.12236 alabeo_SI_SD >= 5.12236


3

2 1

(b) Input B, Experto no 2

Figura 5.20: Árboles correspondientes al conjunto de entrada Input B y los


criterios de salida de los Expertos no 1 y no 2.

El árbol correspondiente al Input PCA-A y Experto no 1 (Fig. 5.21a) es


más sencillo que los anteriores, con tan sólo un nivel, y con tres nodos finales
en los que la clase 2 no está recogida. En este caso, la primera componente
principal (que representa el escuadrado de la placa, Tabla 5.6) es la respon-
sable del primer corte en el proceso de decisión.

En lo tocante al árbol construido con el conjunto de entrada Input PCA-B


para el mismo experto (Fig. 5.21b), consta de dos niveles y seis nodos finales
distribuidos homogéneamente en las distintas ramas. Todas las clases están
representadas en ellos, y la primera componente principal se mantiene como
primer decisor.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 163

Tabla 5.12: Matriz de confusión media del árbol de clasificación obtenido con
el Input PCA-A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 3 0 1 5 0 2
2 2 0 4 2 7 2
3 0 0 60 0 0 52
MAE = 0.114 MAE = 0.114

CP1A < -3.4265 CP1A >= -3.4265

CP3A < -0.372892 CP3A >= -0.372892


3

1 3

(a) Input PCA-A, Experto no 1

CP1A < -2.26363 CP1A >= -2.26363

CP5A < 0.357166 CP5A >= 0.357166 CP6A < 0.558337 CP6A >= 0.558337

CP5A < -0.633522 CP5A >= -0.633522 CP1A < -1.11417 CP1A >= -1.11417
3 3

1 2 2 3

o
(b) Input PCA-A, Experto n 2

Figura 5.21: Árboles correspondientes al conjunto de entrada Input PCA-A


y los criterios de salida de los Expertos no 1 y no 2.
164 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Tabla 5.13: Matriz de confusión media del árbol de clasificación obtenido con
el Input PCA-B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 4 0 0 5 1 1
2 3 0 3 0 8 3
3 1 0 59 0 1 51
MAE = 0.114 MAE = 0.100

CP1B < -2.84567 CP1B >= -2.84567

CP11B < -0.0276095 CP11B >= -0.0276095


3

1 3

(a) Input PCA-B, Experto no 1

CP1B < -2.31323 CP1B >= -2.31323

CP10B < 0.555872 CP10B >= 0.555872


3

CP1B < -2.97126 CP1B >= -2.97126


3

CP6B < -0.452746 CP6B >= -0.452746


2

1 2

(b) Input PCA-B, Experto no 2

Figura 5.22: Árboles correspondientes al conjunto de entrada Input PCA-B


y los criterios de salida de los Expertos no 1 y no 2.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 165

El árbol resultante del Input PCA-B y Experto no 1 (Fig. 5.22a) es muy


similar al obtenido con el Input PCA-A: tiene un nivel y tres nodos finales
en los que no aparece la clase 2, y la primera componente principal es la
responsable de la primera división.

Por último, la estructura resultante del Input PCA-B y Experto no 2 (Fig.


5.22b) consta de tres niveles y cinco nodos finales que recogen las tres cla-
ses de la muestra. El primer decisor vuelve a ser la componente principal no 1.

Resultados de los modelos MLP

La Tabla 5.14 resume los resultados de las redes neuronales implementa-


das, con los cuatro conjuntos de entrada y los dos criterios de salida descritos
anteriormente.

Las redes se construyeron dividiendo la base de datos en 3 conjuntos,


y realizando una validación cruzada del siguiente modo: en cada vuelta, 2
conjuntos se empleaban para entrenar y el restante para testear, rotando los
conjuntos de manera que todos ellos se emplearon como conjuntos de entre-
namiento y de test.

Al tratarse de un problema de clasificación, el número de observaciones


de cada clase limita el número de conjuntos en que se puede dividir la base de
datos inicial para la construcción del modelo. De este modo, el máximo nú-
mero de conjuntos que se pueden definir para este problema es 3 (k–fold=3,
3–fold).

Las matrices de confusión incluidas a continuación se calculan como la


media, redondeada al valor entero más cercano, de las matrices de confusión
obtenidas para cada uno de los tres conjuntos de test. A partir de las tres ma-
trices de confusión (3–fold) se calcula el error absoluto medio, y el promedio
de los tres errores absolutos medios es el que se expresa bajo cada matriz de
confusión. Se pretende con esto dar una medida lo más representativa posible
del acierto de cada red neuronal.
166 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Tabla 5.14: Resumen de tasas de error obtenidas para los modelos MLP
implementados con las 8 configuraciones definidas.
Output
Experto no 1 Experto no 2
Input
Tasa error entrenam. = 0.143 Tasa error entrenam. = 0.256
A Tasa error test = 0.142 Tasa error test = 0.254
(37 neuronas) (25 neuronas)
Matriz de confusión: ver Tabla 5.15
Tasa error entrenam. = 0.143 Tasa error entrenam. = 0.181
B Tasa error test = 0.142 Tasa error test = 0.254
(35 neuronas) (20 neuronas)
Matriz de confusión: ver Tabla 5.16
Tasa error entrenam. = 0.035 Tasa error entrenam. = 0.226
PCA-A Tasa error test = 0.156 Tasa error test = 0.254
(2 neuronas) (10 neuronas)
Matriz de confusión: ver Tabla 5.17
Tasa error entrenam. = 0.071 Tasa error entrenam. = 0.234
PCA-B Tasa error test = 0.171 Tasa error test = 0.254
(4 neuronas) (22 neuronas)
Matriz de confusión: ver Tabla 5.18

Tabla 5.15: Matriz de confusión media de la red neuronal óptima obtenida


con el Input A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 0 2
2 0 0 2 0 0 4
3 0 0 20 0 0 17
MAE = 0.199 MAE = 0.353

Tabla 5.16: Matriz de confusión media de la red neuronal óptima obtenida


con el Input B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 0 2
2 0 0 2 1 0 3
3 0 0 20 0 1 17
MAE = 0.199 MAE = 0.340
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 167

Tabla 5.17: Matriz de confusión media de la red neuronal óptima obtenida


con el Input PCA-A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 0 2
2 0 1 1 0 0 4
3 0 0 20 0 0 17
MAE = 0.186 MAE = 0.353

Tabla 5.18: Matriz de confusión media de la red neuronal óptima obtenida


con el Input PCA-B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 0 2
2 0 0 2 0 0 4
3 0 1 18 0 0 17
MAE = 0.257 MAE = 0.353

Resultados de los modelos SVM

Los modelos de máquinas de vectores soporte se han implementado de un


modo análogo a las redes neuronales: se emplearon 8 configuraciones distintas
(4 entradas y 2 salidas), y un proceso de validación cruzada de 3 conjuntos.
La Tabla 5.19 contiene el resumen de los mejores resultados obtenidos para
cada configuración.

Del mismo modo que con las redes neuronales, las matrices de confusión
son las medias, redondeada al valor entero más cercano, de las matrices de
confusión obtenidas de los tres conjuntos de test. El error absoluto medio,
asimismo, es nuevamente el promedio de los tres errores absolutos medios de
cada matriz de confusión.
168 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Tabla 5.19: Resumen de tasas de error obtenidas para los modelos SVM
implementados con las 8 configuraciones definidas.
Output
Experto no 1 Experto no 2
Input
Tasa error entrenam. = 0 Tasa error entrenam. = 0
A Tasa error test = 0.142 Tasa error test = 0.196
(C=10, sigma=10) (C=10, sigma=10)
Matriz de confusión: ver Tabla 5.20
Tasa error entrenam. = 0 Tasa error entrenam. = 0
B Tasa error test = 0.142 Tasa error test = 0.211
(C=1, sigma=1000) (C=10, sigma=10)
Matriz de confusión: ver Tabla 5.21
Tasa error entrenam. = 0 Tasa error entrenam. = 0.127
PCA-A Tasa error test = 0.142 Tasa error test = 0.224
(C=1, sigma=100) (C=1, sigma=1)
Matriz de confusión: ver Tabla 5.22
Tasa error entrenam. = 0 Tasa error entrenam. = 0
PCA-B Tasa error test = 0.142 Tasa error test = 0.254
(C=1, sigma=10) (C=1, sigma=10)
Matriz de confusión: ver Tabla 5.23

Tabla 5.20: Matriz de confusión media del modelo SVM óptimo obtenido con
el Input A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 1 1 1
2 0 1 1 1 2 1
3 0 1 19 0 2 16
MAE = 0.198 MAE = 0.221

Tabla 5.21: Matriz de confusión media del modelo SVM óptimo obtenido con
el Input B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 1 1 1
2 0 0 2 1 1 2
3 0 0 20 0 1 17
MAE = 0.199 MAE = 0.237
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 169

Tabla 5.22: Matriz de confusión media del modelo SVM óptimo obtenido con
el Input PCA-A.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 1 1
2 0 0 2 0 2 2
3 0 0 20 0 1 16
MAE = 0.199 MAE = 0.265

Tabla 5.23: Matriz de confusión media del modelo SVM óptimo obtenido con
el Input PCA-B.
Experto no 1 Experto no 2
Pred.
1 2 3 1 2 3
Real
1 0 0 1 0 0 2
2 0 0 2 0 0 4
3 0 0 20 0 0 17
MAE = 0.199 MAE = 0.353

5.4.5. Discusión de los resultados


Del análisis de componentes principales se puede concluir que los seis ti-
pos de defectos definidos son definitorios de la calidad de las placas, ya que
todos ellos aparecen representados en las componentes principales calculadas
y en posiciones tempranas (participando en aquellas que explican un porcen-
taje mayor de varianza de la muestra). Los porcentajes de explicación de la
varianza indican, además, que la información está muy repartida entre todas
las variables, en términos generales.

Analizando las primeras 6 componentes principales, que son aquellas que


explican un mayor porcentaje de varianza total (un 60–62 %), se pueden ex-
traer algunas lecturas. Tanto para las variables básicas (Input A e Input
PCA–A) como para las totales (Input B e Input PCA–B) se tiene que las
dos primeras componentes principales representan exactamente los mismos
defectos: el escuadrado, la presencia de carbonatos y los defectos de superfi-
cie. En la siguiente componente principal aparece, en ambos casos, el alabeo,
y en la cuarta y quinta la presencia de sulfuros.
170 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

En cuanto a las faltas de material, en el caso de las variables básicas no


aparece hasta la sexta componente principal, mientras que está presente en
la tercera y quinta componentes calculadas para las variables totales.

A partir de la sexta componente principal, los defectos más representados


son el alabeo, la falta de material y los defectos de superficie, siendo ocasional
la aparición de los defectos de escuadrado, carbonatos y sulfuros.

El decisor empírico no predice acertadamente la segunda calidad, identifi-


cando más de la mitad de las observaciones pertenecientes a dicha clase como
primera y unas pocas como rechazo. El criterio de ambos expertos en cuanto
a la primera calidad se simula acertadamente, con un 100 % de acierto, pero
comete muchos errores de clasificación de placas defectuosas, con altas cifras
de falsos negativos.

El acierto en general es muy bajo y los falsos negativos muy elevados, lo


que se explica por la dificultad a la hora de establecer los umbrales óptimos
de decisión en el proceso de asignación de calidad, así como por la búsqueda
de un sistema robusto en el que primen bajas cifras de falsos positivos. Sin
embargo, este árbol presenta la ventaja de tener en cuenta defectos que se
saben importantes aunque no estén presentes en las 70 placas de la muestra.

La Tabla 5.24 resume los resultados obtenidos con los modelos matemá-
ticos aplicados al problema de clasificación de placas de pizarra para cada
configuración, discutidos a continuación.

En lo tocante a los modelos basados en los árboles de decisión, se ob-


tienen exactamente los mismos resultados con el Input A que con el Input
B, lo que demuestra que las variables auxiliares no aportan información de
interés para la construcción del modelo. Por tanto, los árboles de decisión
son iguales para cada criterio de salida (para el Experto no 1, Fig. 5.19a y
Fig. 5.20a; Experto no 2, Fig. 5.19b y Fig. 5.20b), así como las matrices de
confusión correspondientes.

Estos primeros modelos simulan muy bien los criterios de ambos exper-
tos, con unas tasas de error bajas (5.7 % para el Experto no 1 y 10.0 % para
el no 2). La principal diferencia se encuentra en los errores de clasificación:
mientras que simulando el criterio del Experto no 1 se cometen 4 errores (3 de
ellos falsos negativos, 1 neutro y ningún falso positivo), al simular el criterio
del Experto no 2 se cometen 7 errores (1 neutro y 6 falsos positivos, sin falsos
negativos), lo que es una situación menos deseable.
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 171

Tabla 5.24: Resumen de los resultados de los modelos CART, MLP y SVM
para la predicción de la calidad de las placas de pizarra.
Input Exp. CART MLP SVM
Tasa error Tasa error entr. = 0.143 Tasa error entr.= 0
1 = 0.057 Tasa error test = 0.142 Tasa error test = 0.142
MAE = 0.100 MAE = 0.199 MAE = 0.198
A (37 neuronas) (C=10, sigma=10)
Tasa error Tasa error entr. = 0.256 Tasa error entr. = 0
2 = 0.100 Tasa error test = 0.254 Tasa error test = 0.196
MAE = 0.129 MAE = 0.353 MAE = 0.221
(25 neuronas) (C=10, sigma=10)
Tasa error Tasa error entr. = 0.143 Tasa error entr. = 0
1 = 0.057 Tasa error test = 0.142 Tasa error test = 0.142
MAE = 0.100 MAE = 0.199 MAE = 0.199
B (35 neuronas) (C=1, sigma=1000)
Tasa error Tasa error entr. = 0.181 Tasa error entr. = 0
2 = 0.100 Tasa error test = 0.254 Tasa error test = 0.211
MAE = 0.129 MAE = 0.340 MAE = 0.237
(20 neuronas) (C=10, sigma=10)
Tasa error Tasa error entr. = 0.035 Tasa error entr. = 0
1 = 0.100 Tasa error test = 0.156 Tasa error test = 0.142
MAE = 0.114 MAE = 0.186 MAE = 0.199
PCA (2 neuronas) (C=1, sigma=100)
-A Tasa error Tasa error entr. = 0.226 Tasa error entr. = 0.127
2 = 0.086 Tasa error test = 0.254 Tasa error test = 0.224
MAE = 0.114 MAE = 0.353 MAE = 0.265
(10 neuronas) (C=1, sigma=1)
Tasa error Tasa error entr. = 0.071 Tasa error entr. = 0
1 = 0.100 Tasa error test = 0.171 Tasa error test = 0.142
MAE = 0.114 MAE = 0.257 MAE = 0.199
PCA (4 neuronas) (C=1, sigma=10)
-B Tasa error Tasa error entr. = 0.234 Tasa error entr. = 0
2 = 0.086 Tasa error test = 0.254 Tasa error test = 0.254
MAE = 0.100 MAE = 0.353 MAE = 0.353
(22 neuronas) (C=1, sigma=10)

Observando los árboles resultantes, sin embargo, al simular el criterio del


Experto no 1 la decisión se basa tan sólo en defectos de superficie locales y en
la falsa escuadra. Para el Experto no 2, por su parte, se emplean los paráme-
tros de defectos superficiales locales y alabeo.

Cualquiera de ellos parece no tener en cuenta defectos importantes, como


la presencia de carbonatos o sulfuros, a la hora de realizar la predicción.
172 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN

Analizando los resultados del CART con las entradas del análisis de com-
ponentes principales, se observan diferencias entre los modelos construidos a
partir del Input PCA–A y del PCA–B, así como diferencias según se tenga
por objetivo el Experto no 1 o el no 2. En el caso del Experto no 1, ninguno
de los inputs aporta suficiente información al modelo como para discernir la
segunda calidad, siendo todas las observaciones de dicha calidad clasificadas
como 1 ó 3. La calidad 3 se predice casi siempre bien, y en general las tasas
de acierto son muy elevadas en las cuatro configuraciones.

Las principales diferencias se hallan en el tipo de error cometido: la Tabla


5.12 muestra cómo con el Input PCA–A no se incurre en falsos negativos,
pero sí en 5 y 4 falsos positivos al simular a los Expertos no 1 y no 2, respec-
tivamente; para el Input PCA–B, el número de falsos positivos es menor (3
y 4, respectivamente), con tan sólo un falso negativo en cada caso.

Considerando como un error menos deseable los falsos positivos, y pri-


mando una tasa de error lo más baja posible, el modelo construido con el
Input A y el criterio del Experto no 1 proporciona los mejores resultados con
esta técnica.

En lo tocante a las redes neuronales, lo primero que cabe destacar es la


evidente dificultad que han mostrado para modelar el criterio de los expertos,
especialmente del no 2, lo que se pone de manifiesto en los errores y matrices
de confusión obtenidos.

Si se analizan las matrices de confusión medias, se observa cómo en 5 de


los 8 modelos (los 2 construidos con el Input A, el del Input B y Experto
no 1, y los de Input PCA–A y PCA–B para el Experto no 2) son incapaces de
adquirir el conocimiento necesario de los datos como para asignar las clases
1 y 2, por lo que clasifican todas las observaciones como 3.

En los restantes casos, evaluando los aciertos y errores se comprueba nue-


vamente una tendencia a asignar clase 3 a las observaciones, aunque sí hay
algunas identificadas como clase 1 ó 2. El modelo construido con Input PCA–
A y Experto no 1 es el que mejores resultados ofrece, con las menores tasas
de error y error absoluto medio, aunque, al igual que los demás, tiene difi-
cultades en la asignación de calidades distintas a rechazo.

Por último, en los modelos de SVM la situación es muy similar a la co-


mentada para las redes neuronales. Los modelos SVM implementados tienen
dificultades en aprender el criterio de los expertos para asignar las tres cali-
5.4. CLASIFICACIÓN DE PLACAS DE PIZARRA 173

dades y reproducir la variabilidad de las salidas, tendiendo a clasificar como 3


las observaciones para minimizar su error. Esto se hace especialmente patente
en el caso del Experto no 1, ya que el humano catalogó 60 de las 70 placas co-
mo calidad 3 y, en consecuencia, los modelos SVM construidos para simular
este criterio asignan de manera sistemática dicha clase 3 (así ocurre con todos
los Inputs excepto con el A). La predicción sistemática de la clase 3 se obser-
va, asimismo, con el Input PCA–B sea cual fuere el criterio experto simulado.

Las configuraciones con las que los modelos SVM parecen ser capaces de
aprender a discernir las tres clases son: Input A y ambos expertos, Input
B y Experto no 2, e Input PCA–A y Experto no 2. De ellos, los que simulan
el criterio del Experto no 2 ofrecen resultados muy similares, con errores en
test que rondan el 20 % y cifras de falsos positivos y falsos negativos también
parecidas. El modelo construido con el Input A y el Experto no 1 mejora los
anteriores, con menores errores de clasificación, y es el mejor de los ocho
implementados con esta técnica.
174 CAPÍTULO 5. SISTEMA DE CLASIFICACIÓN
Capítulo 6

Conclusiones
176 CAPÍTULO 6. CONCLUSIONES
177

En el escenario mundial actual, el futuro de los sistemas de producción


europeos pasa por incorporar las nuevas tecnologías de fabricación de modo
que se mantenga la competitividad y se mejore la relación de las organiza-
ciones con las personas y con el medio ambiente. Se busca la incorporación
de sistemas de producción ágiles, adaptables y flexibles que no sólo mejoren
el proceso a nivel producto, sino también el ambiente de trabajo para las
personas reduciendo el estrés físico y mejorando su bienestar y su seguridad.

El aprovechamiento de los recursos naturales juega un papel fundamental


en la sociedad moderna, proveyendo de materias primas básicas al resto de
los sectores industriales. En el caso de la minería de la pizarra, sus caracte-
rísticas hacen de ella un material de construcción óptimo para su uso como
elemento de cubierta, como se viene empleando desde hace décadas.

Las cifras de producción minera disponibles dejan patente la importancia


de la pizarra en el sector extractivo español. Su proceso de extracción y ela-
boración ha ido evolucionando a lo largo de los años, incorporando equipos
más modernos que aumentan la productividad y mejoran el aprovechamien-
to de este recurso tanto en cantera como en nave. Sin embargo, a pesar de
que el proceso de elaboración de las placas, tradicionalmente manual en su
mayor parte, avanza en la línea de la automatización de las distintas etapas,
la clasificación según su calidad comercial se sigue realizando a mano por un
operario experto en la materia.

Con el fin de lograr que la clasificación por calidad comercial siga unos
criterios objetivos y reproducibles, el objetivo de este estudio es construir un
modelo de clasificación automática robusto y adaptable a las características
de un yacimiento y un mercado dados. El sistema desarrollado se compone
de un entorno de visión artificial que registra la información de color y di-
mensional (en las tres dimensiones) de las placas, que una vez transferida al
ordenador es analizada mediante un software avanzado de visión mediante
unos algoritmos de detección de defectos específicamente diseñados para este
problema.

El análisis de las imágenes comprende la búsqueda de defectos geomé-


tricos y superficiales intrínsecos a esta roca, estableciendo para ello unos
umbrales de detección, para caracterizar así cada placa. Seguidamente, la se-
gunda parte está compuesta por el modelo de clasificación mediante técnicas
de aprendizaje automático (machine learning), de modo que, tras una etapa
inicial de aprendizaje, se clasifique cada placa en su correspondiente calidad
comercial atendiendo a los resultados de la inspección de las imágenes.
178 CAPÍTULO 6. CONCLUSIONES

Este estudio supone una evolución del realizado en 2010 con el mismo fin,
el de construir un clasificador objetivo de placas de pizarra. Las diferencias
más notables se sintetizan en la renovación del sistema de visión artificial
para integrar en una sola cámara la adquisición de información, incluyendo
la de color para detectar así los sulfuros, y la implementación de los códigos
de inspección de placas en una librería de visión por computador.

Las principales características del sistema son su carácter no intrusivo, la


capacidad para aprender nuevos defectos futuros y su alto grado de ajuste.
La primera de ellas es una característica intrínseca de los sistemas de visión
artificial, y la segunda a los sistemas de aprendizaje automático. En cuanto
al grado de ajuste, se trata de un sistema parametrizable tanto a nivel de
detección de defectos como a nivel de clasificación en calidades comerciales,
de modo que, por una parte, se puede adaptar a las características de un
yacimiento de pizarra diferente (cuyas placas presentarán los defectos típicos
de la variedad explotada en dicho yacimiento), y por otra se puede ajustar a
los requisitos de un mercado determinado.

La construcción de un modelo que clasifique según un criterio objetivo


es una tarea compleja, como así se deduce de los juicios emitidos por dos
personas expertas, quienes, en base a sus conocimientos y siguiendo su crite-
rio individual, asignaron la calidad comercial pertinente a las placas de este
estudio. La discrepancia observada entre ambos expertos, tanto entre las dos
calidades aptas para su venta como en el descarte de las placas no aptas,
pone de relieve este hecho.

Los modelos de aprendizaje automático implementados han sido los árbo-


les de decisión (CART), las redes neuronales (concretamente, el perceptrón
multicapa o MLP) y las máquinas de vectores soporte (SVM). En los dos
últimos casos se observó una tendencia generalizada de los modelos a asignar
siempre la calidad “rechazo” por ser ésta la más frecuente en la muestra, sien-
do incapaces de reproducir el criterio de los expertos y diferenciar los tres
casos posibles. Los árboles de decisión, sin embargo, mostraron resultados
favorables, con bajas tasas de error en general y errores absolutos medios
próximos a cero.

El hecho de que los árboles de decisión se ajusten mejor a los datos que las
redes neuronales y las máquinas de vectores soporte indica que las clases del
problema son linealmente separables. Es decir, que la asignación de una clase
comercial determinada se realiza siguiendo un proceso de decisión escalonado,
179

de manera que unos defectos son más determinantes que otros y la clasifi-
cación es más directa o menos en función de las características de cada placa.

Además de los modelos de aprendizaje automático, se ha implementado


un decisor empírico que asigna la calidad comercial en base a una serie de
umbrales obtenidos en función de las características de las pizarras de la
muestra. Este decisor no mejora la actuación del CART óptimo, incurriendo
en un gran número de falsos negativos que se traducen en un nivel bajo de
detección de placas defectuosas. Sin embargo, la manera en que el decisor em-
pírico realiza el proceso de asignación de calidad se basa en los factores que se
saben importantes gracias a la opinión experta a la hora de evaluar las placas.

Por otra parte, la mayoría de los errores cometidos por los modelos en ge-
neral y por el decisor empírico en particular se dan en las placas con sulfuros,
y se pueden explicar por el pequeño tamaño de los mismos y la dificultad de
su detección. Derivada de la dificultad de detección de los sulfuros presentes
en las placas de la muestra manejada, se diseñó una placa con sulfuros arti-
ficiales para calibrar el código desarrollado.

Los algoritmos de análisis de imagen y las técnicas de clasificación han


demostrado ser aplicables al problema de la asignación de calidad a las placas
de pizarra. Tras la finalización de este estudio se han determinado con éxito
las variables más adecuadas a incorporar en el vector característico de la pla-
ca, así como la técnica de clasificación que mejor se adapta a la naturaleza
de este problema.

Bajo la premisa de no incurrir en descartes de placas válidas, este sistema


de clasificación ha demostrado ser robusto y podría constituir un primer fil-
tro en la etapa de clasificación dentro de la línea de producción de esta roca
ornamental. Esto permitiría descargar al personal experto de un considerable
volumen de placas, de modo que se podría centrar en la evaluación de otros
defectos más particulares.

Para concluir, entre las líneas de trabajo futuro que se plantean se en-
cuentra la optimización de los elementos de iluminación del sistema de visión,
tratando de proveer al software de análisis de unas imágenes en las que los
sulfuros se aprecien con mayor claridad. Al mismo tiempo, los códigos de ins-
pección podrían optimizarse para aumentar su rendimiento. Por otra parte,
la puesta en práctica de este sistema pasaría por la integración del mismo en
la línea de producción, para lo cual sería necesario adaptar los componentes
para que su funcionamiento sea el adecuado.
180 CAPÍTULO 6. CONCLUSIONES
Bibliografía

[1] Ahmed Abouelela, Hazem M. Abbas, Hesham Eldeeb, Abdelmonem A.


Wahdan, and Salwa M. Nassar. Automated vision system for locali-
zing structural defects in textile fabrics. Pattern Recognition Letters,
26(10):1435–1443, 2005.

[2] S. Abu-Nimeh, D. Nappa, X. Wang, and S. Nair. A comparison of


machine learning techniques for phishing detection. Proceedings of the
anti-phishing working groups 2nd annual eCrime researchers summit
on - eCrime ’07, pages 60–69, 2007.

[3] S. Adolf. Optical Measurement Techniques for multi-dimensional mea-


surement of Cultural Heritage. In Electronic Visualisation and the Arts
(EVA 2011), London (UK), 2011. The Chartered Institute for IT.

[4] Y. Ai and K. Xu. Feature extraction based on contourlet transform


and its application to surface inspection of metals. Journal of Optical
Engineering, 51(11), 2012.

[5] O. Akkoyun. An evaluation of image processing methods applied to


marble quality classification. In ICCTD 2010 - 2010 2nd International
Conference on Computer Technology and Development, Proceedings,
pages 158–162, 2010.

[6] N. Aleixos, J. Blasco, F. Navarrón, and E. Moltó. Multispectral ins-


pection of citrus in real-time using machine vision and digital signal
processors. Computers and Electronics in Agriculture, 33(2):121–137,
2002.

[7] D. Allen. The relationship between variable selection and data argu-
mentation and a method for prediction. Technometrics, 16:125–127,
1974.

[8] M. Alper Selver, O. Akay, F. Alim, S. Bardak, and M. Ölmez. An


automated industrial conveyor belt system using image processing

181
182 BIBLIOGRAFÍA

and hierarchical clustering for classifying marble slabs. Robotics and


Computer-Integrated Manufacturing, 27(1):164–176, 2011.
[9] M.J. Álvarez, E. González, F. Bianconi, J. Armesto, and A. Fernández.
Colour and texture features for image retrieval in granite industry.
DYNA (Colombia), 77(161):121–130, 2010.
[10] Ola Amayri and Nizar Bouguila. A study of spam filtering using
support vector machines. Artificial Intelligence Review, 34(1):73–108,
2010.
[11] Ofélia Anjos, Carla Iglesias, Fátima Peres, Javier Martínez, Ángela
García, and Javier Taboada. Neural networks applied to discriminate
botanical origin of honeys. Food Chemistry, 175:128–136, 2015.
[12] M Anthony and P Barlett. Neural network learning: theoretical foun-
dations. Cambridge University Press, 1999.
[13] I. Ar and Y.S. Akgul. A generic system for the classification of marble
tiles using Gabor filters. In 2008 23rd International Symposium on
Computer and Information Sciences, ISCIS 2008, 2008.
[14] M. Araújo, J. Martínez, C. Ordóñez, and J.A.V. Vilán. Identification of
granite varieties from colour spectrum data. Sensors, 10(9):8572–8584,
2010.
[15] M. Araújo, J.M. Matías, T. Rivas, and J. Taboada. Machine learning
techniques applied to the construction of a new geomechanical quality
index. International Journal of Computer Mathematics, 88(9):1830–
1838, 2011.
[16] Asesoramiento Tecnología e Investigación SL, Amador Ordóñez Puime,
and Rubén Alonso Crespo. Labrado y conformado de la pizarra. IC
Editorial, 2013.
[17] P. Barba, N. Heredia, L.R. Rodríguez Fernández, and A. Suárez. Es-
tratigrafía. In Memoria explicativa del Mapa Geológico de la provincia
de León 1:200.000, pages 13–90. ITGE, Madrid, 1994.
[18] J.E. Barros. Nuevos datos geológicos y cartográficos sobre el flanco
Sur del Sinclinorio de Truchas. Cuadernos Laboratorio Xeolóxico Laxe,
14:93–116., 1989.
[19] R. Battiti. First and second-order methods for learning: between steep-
set descent and newton method. Neural Computation, 4:141–166, 1992.
BIBLIOGRAFÍA 183

[20] S. Belongie, J. Malik, and J. Puzicha. Shape matching and object recog-
nition using shape contexts. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 24(4):509–522, 2002.

[21] J.O. Berger. Statistical decision theory and bayesian analysis. Springer,
1985.

[22] F. Bernardini, C.L. Bajaj, J. Chen, and D.R. Schikore. Automatic


reconstruction of 3D CAD models from digital scans. International
journal of computational geometry and applicattions, 9(4-5):327–369,
1999.

[23] M. Bertozzi and A. Broggi. GOLD: A parallel real-time stereo vision


system for generic obstacle and lane detection. IEEE Transactions on
Image Processing, 7(1):62–81, 1998.

[24] M. Bertozzi, A. Broggi, A. Fascioli, T. Graf, and M.-M. Meinecke.


Pedestrian detection for driver assistance using multiresolution infrared
vision. IEEE Transactions on Vehicular Technology, 53(6):1666–1678,
2004.

[25] F. Bianconi, A. Fernández, E. González, and S.A. Saetta. Performance


analysis of colour descriptors for parquet sorting. Expert Systems with
Applications, 40(5):1636–1644, 2013.

[26] F. Bianconi, E. González, A. Fernández, and S. A. Saetta. Automatic


classification of granite tiles through colour and texture features. Expert
Systems with Applications, 39(12):11212–11218, 2012.

[27] A. F. Bingöl, A. Tortum, and R. Gül. Neural networks analysis of


compressive strength of lightweight concrete after high temperatures.
Materials & Design, 52:258–264, 2013.

[28] C.M. Bishop. Pattern Recognition and Machine Learning. Springer-


Verlag New York, New York, 2006.

[29] A. Blake, P. Kohli, and C. Rother, editors. Advances in Markov Ran-


dom Fields. MIT Press, 2010.

[30] A. Blake, A. Zisserman, and G. Knowles. Surface descriptions from


stereo and shading. Image and Vision Computing, 3(4):183–191, 1985.

[31] M.A. Boden. Mind As Machine: A History of Cognitive Science. Oxford


University Press, Oxford , England, 2006.
184 BIBLIOGRAFÍA

[32] N. Bouaynaya, M. Charif-Chefchaouni, and D. Schonfeld. Spatially


variant morphological restoration and skeleton representation. IEEE
Transactions on Image Processing, 15(11):3579–3591, 2006.

[33] C. Boukouvalas, J. Kittler, R. Marik, and Maria Petrou. Automatic


color grading of ceramic tiles using machine vision. IEEE Transactions
on Industrial Electronics, 1997.

[34] O Bousquet and A Elisseeff. Algorithmic stability and generalization


performance. In K.T. Leen, G.T Tresp, and V. Dietterich, editors,
Advances in neural information processing systems. MIT Press, 2001.

[35] E. Boyer and M.O. Berger. 3D surface reconstruction using occluding


contours. International Journal of Computer Vision, 22(3):219–233,
1997.

[36] L. Breiman and J. Friedman. Classification and Regression Trees.


Wadsworth, 1984.

[37] D. Brissaud, Y. Frein, and V. Rocchi. What Tracks for Sustainable


Production Systems in Europe? Procedia CIRP, 7:9–16, 2013.

[38] C.J.C. Burges. A tutorial on support vector machines for pattern re-
cognition. Data Mining and Knowledge Discovery, 2(2):121–167, 1998.

[39] G. Capizzi, G. Lo Sciuto, C. Napoli, E. Tramontana, and M. Wozniak.


Automatic classification of fruit defects based on Co-occurrence matrix
and neural networks. In Proceedings of the 2015 Federated Conference
on Computer Science and Information Systems, FedCSIS 2015, pages
861–867, Lodz (Poland), 2015.

[40] V. Cárdenes, M. Lombardero, J. García-Guinea, and J.C. Barros. Fac-


tores de calidad en la elaboración de placas de pizarra para cubiertas
en Galicia y León. Roc Maquina, 67:90–98, 2001.

[41] V. Cárdenes Van den Eynde. Marcado CE en pizarras para cubiertas,


2013.

[42] V. Cárdenes Van den Eynde. Mercado mundial de la pizarra durante


el año 2011, 2013.

[43] V. Cárdenes Van den Eynde, V. País Diz, J. García Guinea, and F. Gó-
mez Fernández. Pizarras de techar. In M.Á. García del Cura and J.C.
Cañaveras, editors, Seminarios de la Sociedad Española de Mineralogia
BIBLIOGRAFÍA 185

Vol. 2. Utilización de Rocas y Minerales Industriales, pages 183–216.


Sociedad Española de Mineralogía, 2005.

[44] T. Carew, O. Ghita, and P.F. Whelan. Exploring the effects of a


factory-type test-bed on a painted slate defect detection system. In In-
ternational Conference on Mechatronics, ICOM 2003, pages 365–370,
2003.

[45] M. Carfagni, R. Furferi, and L. Governi. A real-time machine-vision


system for monitoring the textile raising process. Computers in In-
dustry, 56(8-9):831–842, 2005.

[46] L Carrino, W Polini, and S Turchetta. An automatic visual system for


marble tile classification. Proceedings of the Institution of Mechanical
Engineers Part B-Journal of Engineering Manufacture, 216(8):1095–
1108, 2002.

[47] J. R. M. Catalán, M. P. H. Rodríguez, P. V. Alonso, A. Pérez-Estaún,


and F. G. Lodeiro. Lower Paleozoic Extensional Tectonics in the Limit
between the West Asturian-Leonese and Central Iberian Zones of the
Variscan Fold-Belt in NW Spain. Sonderdruck aus Geologische Runds-
chau, 81(2):545–560, 1992.

[48] G. Celeux, F. Forbes, and N. Peyrard. EM procedures using mean


field-like approximations for Markov model-based image segmentation.
Pattern Recognition, 36(1):131–144, 2003.

[49] Jose M. Chaves-González, Miguel A. Vega-Rodríguez, Juan A. Gómez-


Pulido, and Juan M. Sánchez-Pérez. Detecting skin in face recognition
systems: A colour spaces study. Digital Signal Processing, 20(3):806–
823, 2010.

[50] S. Chen, J. Feng, and L. Zou. Study of fabric defects detection through
gabor filter based on scale transformation. In IASP 10 - 2010 Inter-
national Conference on Image Analysis and Signal Processing, pages
97–99, 2010.

[51] X. Chen and A.L. Yuille. Detecting and reading text in natural scenes.
In Proceedings of the IEEE Computer Society Conference on Computer
Vision and Pattern Recognition, volume 2, pages II366–II373, 2004.

[52] V. Cherkassky and F. Mulier. Learning from data: concepts, theory and
methods. John Wiley and Sons, 1998.
186 BIBLIOGRAFÍA

[53] J. Ciccotelli and J.F. Portala. Applications of artificial vision in the


wood industry. Industrial Metrology, 2(3-4):185–194, may 1992.

[54] R. Cipolla and A. Blake. Surface shape from the deformation of appa-
rent contours. International Journal of Computer Vision, 9(2):83–112,
1992.

[55] Bishop. C.M. Neural networks and pattern recognition. Oxford Univer-
sity Press, 1995.

[56] D. Comaniciu and P. Meer. Mean shift: A robust approach toward


feature space analysis. IEEE Transactions on Pattern Analysis and
Machine Intelligence, 24(5):603–619, 2002.

[57] C. Cortes and V. Vapnik. Support-vector networks. Machine Learning,


20(3):273–297, 1995.

[58] J. Crespo, J. Serra, and R.W. Schafer. Theoretical aspects of morp-


hological filters by reconstruction. Signal Processing, 47(2):201–225,
1995.

[59] F Crucker and S Smale. On the mathematical foundations of learning.


Bulletin of the american mathematical society, 30:1–49, 2001.

[60] A. Cruz Bernal and G. Moreno Aguilar. Vision System via USB for Ob-
ject Recognition and Manipulation with Scorbot-ER 4U. International
Journal of Computer Applications, 56(18):10–15, 2012.

[61] E. De la Fuente López and F.M. Trespaderne. Visión artificial indus-


trial. Procesamiento de Imágenes para Inspección Industrial y Robótica.
Secretariado de Publicaciones e Intercambio Editorial, Universidad de
Valladolid, Valladolid, 2012.

[62] R. Drobina and M.S. Machnio. Application of the image analysis tech-
nique for textile identification. Autex Research Journal, 6(1):40–48,
2006.

[63] M.-A. Drouin and J.-A. Beraldin. Active 3D imaging systems. In


3D Imaging, Analysis and Applications, pages 95–138. Springer-Verlag
London Ltd, London (UK), 2014.

[64] H. Drucker, C. Burges, L. Kaufman, A. Smola, and V. Vapnik. Support


Vector Regression MAchines. MIT Press, 1997.
BIBLIOGRAFÍA 187

[65] B. Efron. Estimating the error rate of a prediction rule: Improvement


on cross-validation. Journal of the American Statistical Association,
78(382):316–331, 1983.

[66] A. A. Efros and W. T. Freeman. Image quilting for texture synthesis


and transfer. In ACM SIGGRAPH 2001 Conference Proceedings, pages
341–346, 2001.

[67] E. Eisemann and F. Durand. Flash photography enhancement via


intrinsic relighting. ACM Transactions on Graphics, 23(3):673–678,
2004.

[68] A. Eleyan and H. Demirel. Co-occurrence matrix and its statistical


features as a new approach for face recognition. Turkish Journal of
Electrical Engineering and Computer Sciences, 19(1):97–107, 2011.

[69] R. Eslami and H. Radha. Wavelet-based contourlet transform and its


application to image coding. In Proceedings - International Conference
on Image Processing, ICIP, volume 2, pages 3189–3192, 2004.

[70] European Commission. Communication from the Commission to the


European Parliament, the Council, the European Economic and Social
Committee and the Committee of the Regions - Preparing for our fu-
ture: Developing a common strategy for key enabling technologies in
the EU, 2009.

[71] C. Faloutsos, R. Barber, M. Flickner, J. Hafner, W. Niblack, D. Petko-


vic, and W. Equitz. Efficient and effective Querying by Image Content.
Journal of Intelligent Information Systems, 3(3-4):231–262, 1994.

[72] P. Farias, G. Gallastegui, F. González, J. Marquínez, L. M. Martín,


J. R. Martínez, J.G. Pablo, and L. R. Rodríguez. Aportaciones al
conocimiento de la litoestratigrafía y estructura de Galicia Central.
Memóias Facultade de Ciencias Universidade Porto, 1:411–431, 1987.

[73] F.J. Fernández. Características estratigráficas y estructurales del mar-


gen noroccidental del Sinclinorio de Truchas: Geología aplicada a la
prospección y explotación de pizarras para techar. Revista de la Socie-
dad Geológica de España, 14(3-4):161–173, 2001.

[74] M. A. Fischler and O. Firschein. Readings in Computer Vision. Morgan


Kaufmann Publishers, Inc., Los Altos, US, 1987.
188 BIBLIOGRAFÍA

[75] R Fletcher. Practical Methods of Optimization. John Wiley & Sons,


Inc, New York, 1989.
[76] W. Freeman, P. Perona, and B. Scholkopf. Guest editorial: Special
issue on machine learning for vision. International Journal of Computer
Vision, 77(1-3):1, 2008.
[77] A. García, O. Anjos, C. Iglesias, H. Pereira, J. Martínez, and J. Taboa-
da. Prediction of mechanical strength of cork under compression using
machine learning techniques. Materials & Design, 82:304–311, 2015.
[78] S. Geisser. The predictive sample reuse method with applications.
Journal of the American Statistical Association, 70:320–328, 1975.
[79] S. Geman and D. Geman. Stochastic Relaxation, Gibbs Distributions,
and the Bayesian Restoration of Images. IEEE Transactions on Pattern
Analysis and Machine Intelligence, PAMI-6(6):721–741, 1984.
[80] A. Geyer, F. Scapolo, M. Boden, T. Dory, and K. Ducatel. The Future
of Manufacturing in Europe 2015-2020. The Challenge for Sustainabi-
lity. Technical report, European Commission Joint Research Centre,
2003.
[81] M. Ghazvini, S.A. Monadjemi, N. Movahhedinia, and K. Jamshidi. De-
fect detection of tiles using 2D-wavelet transform and statistical featu-
res. World Academy of Science, Engineering and Technology, 37:901–
904, 2009.
[82] O. Ghita, T. Carew, and P. Whelan. A vision based system for inspec-
ting painted slates. Sensor Review, 26(2):108–115, 2006.
[83] O. Ghita, P.F. Whelan, T. Carew, and N. Padmapriya. Quality grading
of painted slates using texture analysis. Computers in Industry, 56:802–
815, 2005.
[84] M.K. Gökay and I.B. Gundogdu. Color identification of some Turkish
marbles. Construction and Building Materials, 22(7):1342–1349, 2008.
[85] David E Goldberg. Genetic Algorithms in Search, Optimization, and
Machine Learning. Addison Wesley, 1989.
[86] E. González, F. Bianconi, M.X. Álvarez, and S.A. Saetta. Automa-
tic characterization of the visual appearance of industrial materials
through colour and texture analysis: An overview of methods and ap-
plications, 2013.
BIBLIOGRAFÍA 189

[87] A.D. Gordon. Classification. Chapman and Hall, 2nd edition, 1999.

[88] D.R. Gray and D.W. Durney. Crenulation cleavage differentiation: im-
plications of solution-deposition processes. Journal of Structural Geo-
logy, 1(1):73–80, jan 1979.

[89] D.W. Hansen and Q. Ji. In the Eye of the Beholder: A Survey of
Models for Eyes and Gaze. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 32(3):478–500, 2010.

[90] R.M. Haralick, S.R. Sternberg, and X. Zhuang. Image Analysis Using
Mathematical Morphology. IEEE Transactions on Pattern Analysis
and Machine Intelligence, PAMI-9(4):532–550, 1987.

[91] I. Haritaoglu, D. Harwood, and L.S. Davis. W4: Real-time surveillance


of people and their activities. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 22(8):809–830, 2000.

[92] T. Hastie, R. Tibshirani, D. Botstein, and P. Brown. Supervised har-


vesting of expression trees. Genome biology, 2(1), 2001.

[93] D. Haussler. Decision theoretic generalizations of the PAC model for


neural net and other learning applications. Information and Compu-
tation, 100(1):78–150, 1992.

[94] S. Haykin. Neural netowrks. A comprehensive foundation. Prentice


Hall, 1999.

[95] M. Heath, S. Sarkar, T. Sanocki, and K. Bowyer. Comparison of Edge


Detectors: A Methodology and Initial Study. Computer Vision and
Image Understanding, 69(1):38–54, 1998.

[96] J Heaton. Introduction to the math of neural networks. Heaton Re-


search, New York, 2012.

[97] N. Heredia, L.R. Rodríguez Fernández, and A. Suárez. Tectónica.


In Memoria explicativa del Mapa Geológico de la provincia de León
1:200.000, pages 91–131. ITGE, Madrid, 1994.

[98] A. Hilton, P. Fua, and R. Ronfard. Modeling people: Vision-based un-


derstanding of a person’s shape, appearance, movement, and behaviour.
Computer Vision and Image Understanding, 104(2-3):87–89, 2006.
190 BIBLIOGRAFÍA

[99] Z. Hocenski, I. Aleksi, and R. Mijaković. Ceramic tiles failure detection


based on FPGA image processing. In IEEE International Symposium
on Industrial Electronics, 2009.

[100] J H Holland. Adaptation in Natural and Artificial Systems. University


of Michigan Press, 1975.

[101] B.K.P. Horn. Robot vision. MIT Press, Cambridge, Massachusetts, US,
1986.

[102] H. Hotelling. Analysis of a Complex of Statistical Variables Into Princi-


pal Components. Journal of Educational Psychology, 24:417–441,498–
520, 1933.

[103] C.W. Hsu and C.J. Lin. A comparison of methods for multiclass
support vector machines. IEEE Transactions on Neural Networks,
13(2):415–425, 2002.

[104] W. Hu, T. Tan, L. Wang, and S. Maybank. A survey on visual survei-


llance of object motion and behaviors. IEEE Transactions on Systems,
Man and Cybernetics Part C: Applications and Reviews, 34(3):334–352,
2004.

[105] H. Huang, L. Qian, and Y. Wang. A SVM-based technique to detect


phishing URLs. Information Technology Journal, 11(7):921–925, 2012.

[106] A. Hyvarinen, J. Karhunen, and E. Oja. Independent Component


Analysis. Wiley, New York (US), 2001.

[107] G. Iddan and G. Yahav. Videometrics and Optical Methods for 3D


Shape Measurements. In Proceedings of SPIE, pages 48–55, 2001.

[108] IDS Imaging. iGuard, 2013.

[109] C. Iglesias, O. Anjos, J. Martínez, H. Pereira, and J. Taboada. Predic-


tion of tension properties of cork from its physical properties using neu-
ral networks. European Journal of Wood and Wood Products, 73(3):347–
356, 2015.

[110] C. Iglesias, J. Martínez Torres, P. J. García Nieto, J. R. Alonso Fernán-


dez, C. Díaz Muñiz, J. I. Piñeiro, and J. Taboada. Turbidity Prediction
in a River Basin by Using Artificial Neural Networks: A Case Study in
Northern Spain. Water Resources Management, 28(2):319–331, 2014.
BIBLIOGRAFÍA 191

[111] IGME. Pizarras de España. Technical report, Instituto Geológico y


Minero de España, 1991.

[112] G.J. Jaffe and J. Caprioli. Optical coherence tomography to detect and
manage retinal disease and glaucoma. American Journal of Ophthal-
mology, 137(1):156–169, 2004.

[113] Anil K. Jain and Farshid Farrokhnia. Unsupervised texture segmenta-


tion using Gabor filters. Pattern Recognition, 24(12):1167–1186, 1991.

[114] T. Joachims. Machine large-scale SVM learning practical. MIT Press,


1999.

[115] B.F. Jones. A reappraisal of the use of infrared thermal image analysis
in medicine. IEEE Transactions on Medical Imaging, 17(6):1019–1027,
1998.

[116] M. Julivert, J. M. Fontbote, A. Ribeiro, and L. E. Nabais. Mapa


Tectónico de la Península Ibérica y Baleares E: 1:1.000.000, 1972.

[117] T. Kanade, editor. Three-Dimensional Machine Vision. Kluwer Aca-


demic Publishers, Boston, US, 1987.

[118] D. Kang, Y.J. Jang, and S. Won. Development of an inspection system


for planar steel surface using multispectral photometric stereo. Optical
Engineering, 52(3), 2013.

[119] K. Kapach, E. Barnea, R. Mairon, Y. Edan, and O. Ben-Shahar. Com-


puter vision for fruit harvesting robots – state of the art and challenges
ahead. International Journal of Computational Vision and Robotics,
3(1-2), 2012.

[120] M.H. Karimi and D. Asemani. Surface defect detection in tiling Indus-
tries using digital image processing methods: Analysis and evaluation.
ISA Transactions, 53(3):834–844, 2014.

[121] H. Kawasaki, Y. Horita, H. Morinaga, Y. Matugano, S. Ono, M. Ki-


mura, and Y. Takane. Structured light with coded aperture for wide
range 3D measurement. In Proceedings - International Conference on
Image Processing, ICIP, pages 2777–2780, 2012.

[122] T. Keser, Z. Hocenski, and V. Hocenskp. Intelligent machine vision


system for automated quality control in ceramic tiles industry. Stro-
jarstvo, 52(2), 2010.
192 BIBLIOGRAFÍA

[123] D. Kim and S. Lee. Advances in 3D camera: Time-of-flight vs. acti-


ve triangulation. In Intelligent Autonomous Systems 12, volume 193
AISC, pages 301–309. Springer-Verlag Berlin Heidelberg, 2013.

[124] R. Kohavi. A study of cross-validation and bootstrap for accuracy


estimation and model selection. In Proceedings of the joint conference
on artificial intelligence, pages 1137–1145, 1995.

[125] T. Kohonen. Self-organizating formation of topologically correct fea-


ture maps. Biological Cybernetics, 43:59–69, 1982.

[126] A. Kumar and G. Pang. Identification of surface defects in textured


materials using wavelet packets. In Conference Record - IAS Annual
Meeting (IEEE Industry Applications Society), volume 1, pages 247–
251, Chicago (IL, United States), 2001.

[127] B.B. Lahiri, S. Bagavathiappan, T. Jayakumar, and J. Philip. Medical


applications of infrared thermography: A review. Infrared Physics and
Technology, 55(4):221–235, 2012.

[128] Y.G. Leclerc. Constructing simple stable descriptions for image parti-
tioning. International Journal of Computer Vision, 3(1):73–102, 1989.

[129] S. Lek and Y.S. Park. Multilayer Perceptron. In Encyclopedia of Eco-


logy, pages 2455–2462. Elsevier, 2008.

[130] A. Levin, R. Fergus, F. Durand, and W.T. Freeman. Image and depth
from a conventional camera with a coded aperture. In Proceedings of
the ACM SIGGRAPH Conference on Computer Graphics, San Diego,
CA (USA), 2007.

[131] M.S. Lew, N. Sebe, C. Djeraba, and R. Jain. Content-based multimedia


information retrieval: State of the art and challenges. ACM Transac-
tions on Multimedia Computing, Communications and Applications,
2(1):1–19, 2006.

[132] J. Li, A.D. Heap, A. Potter, and J.J. Daniell. Application of machine
learning methods to spatial interpolation of environmental variables.
Environmental Modelling and Software, 26(12), 2011.

[133] Peilin Li, Sang-heon Lee, and Hung-Yao Hsu. Review on fruit harves-
ting method for potential use of automatic fruit harvesting systems.
Procedia Engineering, 23:351–366, 2011.
BIBLIOGRAFÍA 193

[134] H.D. Lin. Automated defect inspection of light-emitting diode chips


using neural network and statistical approaches. Expert Systems with
Applications, 36(1):219–226, 2009.

[135] D. Lischinski, Z. Farbman, M. Uyttendaele, and R. Szeliski. Interacti-


ve local adjustment of tonal values. ACM Transactions on Graphics,
25(3):646–653, 2006.

[136] F. López, J.M. Valiente, J.M. Prats, and A. Ferrer. Performance eva-
luation of soft color texture descriptors for surface grading using experi-
mental design and logistic regression. Pattern Recognition, 41(5):1761–
1772, 2008.

[137] M. López, J. Martínez, J.M. Matías, J. Taboada, and J.A. Vilán.


Functional classification of ornamental stone using machine learning
techniques. Journal of Computational and Applied Mathematics,
234(4):1338–1345, 2010.

[138] M. López, J. Martínez, J.M. Matías, J.A. Vilán, and J. Taboada. Appli-
cation of a hybrid 3D-2D laser scanning system to the characterization
of slate slabs. Sensors, 10(6):5949–5961, 2010.

[139] M. López, J. Taboada, J. Martínez, J. M. Matías, and J. A. Vilán.


Slate characterization using 3D laser scanning. In AIP Conference
Proceedings, pages 1170–1173, 2012.

[140] F. López González-Mesones. Diseño y construcción de cubiertas de


pizarra. Cluster da Pizarra de Galicia, 2014.

[141] A. C. Lorena, A. De Carvalho, and J. M. P. Gama. A review on


the combination of binary classifiers in multiclass problems. Artificial
Intelligence Review, 30(1-4):19–37, 2008.

[142] F. Lotze. Observaciones Respecto a la División de las Variscides de la


Meseta Ibérica. Publ. Extr. Geol. España, 5:149–166, 1950.

[143] J. Lu, X. Zhou, Y.-P. Tan, Y. Shang, and J. Zhou. Neighborhood


repulsed metric learning for kinship verification. IEEE Transactions
on Pattern Analysis and Machine Intelligence, 36(2):331–345, 2014.

[144] W.S. MacCulloch and W.S. Pitts. A logical calculus of the ideas inma-
nent in nervous activity. Bulletin of Mathematical Biophysics, 5:115–
133, 1943.
194 BIBLIOGRAFÍA

[145] J.B. MacQueen. Some methods for classification and analysis of mul-
tivariate observations. In Proceeding of 5th Berkeley Symposium on
Mathematical Statistics and Probability, pages 281–297, 1967.

[146] E.J. Male, W.L. Pickles, E.A. Silver, G.D. Hoffmann, J. Lewicki,
M. Apple, K. Repasky, and E.A. Burton. Using hyperspectral plant
signatures for CO2 leak detection during the 2008 ZERT CO2 seques-
tration field experiment in Bozeman, Montana. Environmental Earth
Sciences, 60(2):251–261, 2010.

[147] R. Manmatha and J.L. Rothfeder. A scale space approach for auto-
matically segmenting words from historical handwritten documents.
IEEE Transactions on Pattern Analysis and Machine Intelligence,
27(8):1212–1225, 2005.

[148] J. Mao and A.K. Jain. Texture classification and segmentation using
multiresolution simultaneous autoregressive models. Pattern Recogni-
tion, 25(2):173–188, 1992.

[149] A. Marcos. Las series del Paleozoico inferior y la estructura herciniana


del occidente de Asturias. Brevioria Geologica Asturica, 14:13–28, 1973.

[150] J. Martínez. Clasificación de placas de pizarra mediante técnicas de


visión artificial y machine learning. PhD thesis, University of Vigo,
2010.

[151] J. Martínez, C. Iglesias, J.M. Matías, J. Taboada, and M. Araújo. Sol-


ving the slate tile classification problem using a DAGSVM multiclassi-
fication algorithm based on SVM binary classifiers with a one-versus-all
approach. Applied Mathematics and Computation, 230:464–472, 2014.

[152] J. Martínez, M. López, J.M. Matías, and J. Taboada. Classifying slate


tile quality using automated learning techniques. Mathematical and
Computer Modelling, 57(7-8):1716–1721, 2013.

[153] J. Martínez-Alajarín. Supervised classification of marble textures using


support vector machines. Electronics Letters, 40(11):664–666, 2004.

[154] J. Martínez-Alajarín, J.D. Luis-Delgado, and L.M. Tomás-Balibrea.


Automatic system for quality-based classification of marble textures.
IEEE Transactions on Systems, Man and Cybernetics Part C: Appli-
cations and Reviews, 35(4):488–497, 2005.
BIBLIOGRAFÍA 195

[155] J.M. Matías. Redes neuronales para regresión y clasificación. Nuevos


algoritmos y aplicaciones. PhD thesis, Universidad de Santiago de
Compostela, 2003.

[156] Matrox. Matrox Imaging Library, 2014.

[157] Ministerio de Industria Energía y Turismo. Estadística Minera de Espa-


ña 2014. Centro de Publicaciones del Ministerio de Industria, Energía
y Turismo, Madrid, 2016.

[158] T.B. Moeslund, A. Hilton, and V. Kruger. A survey of advances in


vision-based human motion capture and analysis. Computer Vision
and Image Understanding, 104(2-3):90–126, 2006.

[159] G. Mori, X. Ren, A. Efros, and J. Malik. Recovering human body con-
figurations: combining segmentation and recognition. In IEEE Com-
puter Society Conference on Computer Vision and Pattern Recognition
(CVPR’2004), pages 326–323, 2004.

[160] G. Muhammad. Date fruits classification using texture descriptors and


shape-size features. Engineering Applications of Artificial Intelligence,
37:361–367, 2015.

[161] H. Müller, N. Michoux, D. Bandon, and A. Geissbuhler. A review of


content-based image retrieval systems in medical applications - Clini-
cal benefits and future directions. International Journal of Medical
Informatics, 73(1):1–23, 2004.

[162] D. Mumford and J. Shah. Optimal approximations by piecewise smooth


functions and variational problems. Communications in Pure Applied
Mathematics, XLII(5):577–685, 1989.

[163] MVTec. Halcon 12, 2015.

[164] MVTec Software GmbH. Machine vision in 3D world coordinates, Ver-


sion 12.0 - Solution Guide III–C, 7th edition, 2014.

[165] P. Natarajan, P.K. Atrey, and M. Kankanhalli. Multi-camera coordina-


tion and control in surveillance systems: A survey. ACM Transactions
on Multimedia Computing, Communications and Applications, 11(4),
2015.

[166] Hui-Fuang Ng. Automatic thresholding for defect detection. Pattern


Recognition Letters, 27(14):1644–1649, 2006.
196 BIBLIOGRAFÍA

[167] H.Y.T. Ngan, G.K.H. Pang, and N.H.C. Yung. Automated fabric defect
detection-A review. Image and Vision Computing, 29(7):442–458, 2011.

[168] D. Nguyen and B. Widrow. Improving the learning speed of 2-layer


neural network by choosing initial values of the adaptative weights. In
Proceedings of the joint conference on neural network, 1990.

[169] S. Oppel, A. Meirinho, I. Ramírez, B. Gardner, A.F. O’Connell, P.I.


Miller, and M. Louzao. Comparison of five modelling techniques to
predict the spatial distribution and abundance of seabirds. Biological
Conservation, 156, 2012.

[170] A. R. Oskouei, H. Heidary, M. Ahmadi, and M. Farajpur. Unsupervi-


sed acoustic emission data clustering for the analysis of damage mecha-
nisms in glass/polyester composites. Materials & Design, 37:416–422,
2012.

[171] E. Osuna, R. Freund, and F. Girosi. An improved training algorithm


for support vector machines. In Proceedings of the IEEE workshop,
1997.

[172] S.C. Park, M.K. Park, and M.G. Kang. Super-resolution image re-
construction: A technical overview. IEEE Signal Processing Magazine,
20(3):21–36, 2003.

[173] Karl Pearson. On lines and planes of closest fit to systems of points in
space. Philosophical Magazine, 2(11):559–572, 1901.

[174] S.H. Peckinpaugh. An improved method for computing gray-level co-


occurrence matrix based texture measures. CVGIP: Graphical Models
and Image Processing, 53(6):574–580, 1991.

[175] A P Pentland. Local shading analysis. IEEE Transactions on Pattern


Analysis and Machine Intelligence, 6(2):170–179, 1984.

[176] A. Pérez-Estaún. Estratigrafía y estructura de la rama sur de la Zona


Asturoccidental-Leonesa, volume 92. IGME, Madrid, 1978.

[177] Leah Pickett. Shifting Focus: Multi-Scan Cameras, 2014.

[178] D Pollard. Convergence of stochastic processes. Springer, 1984.

[179] J. Ponce, M. Hebert, C. Schmid, and A. Zisserman, editors. Toward


Category-Level Object Recognition. Springer, New York (US), 2006.
BIBLIOGRAFÍA 197

[180] G. Popescu, L.P. Deflores, J.C. Vaughan, K. Badizadegan, H. Iwai, R.R.


Dasari, and M.S. Feld. Fourier phase microscopy for investigation of
biological structures and dynamics. Optics Letters, 29(21):2503–2505,
2004.
[181] H. Pottmann, S. Leopoldseder, M. Hofer, T. Steiner, and W. Wang.
Industrial geometry: Recent advances and applications in CAD. CAD
Computer Aided Design, 37(7):751–766, 2005.
[182] J. R. Quinlan. Induction on decision trees. Machine Learning, 1:81–
106, 1986.
[183] J. R. Quinlan. C4.5: Programas for Machine Learning. Morgan Kauf-
mann, 1993.
[184] D. Raghavan, H.A. McAlister, T.J. Henry, D.W. Latham, G.W. Marcy,
B.D. Mason, D.R. Gies, R.J. White, and T.A. Ten Brummelaar. A
survey of stellar families: Multiplicity of solar-type stars. Astrophysical
Journal, Supplement Series, 190(1):1–42, 2010.
[185] J. Rantala, D. Wu, and G. Busse. Amplitude-modulated lock-in vi-
brothermography for NDE of polymers and composites. Research in
Nondestructive Evaluation, 7(4):215–228, 1995.
[186] G. Ritter and J. Wilson. Handbook of computer vision algorithms in
image algebra. CRC Press Book, 2001.
[187] M. A. Rodríguez Sastre and L. Calleja. Caracterización del comporta-
miento elástico de materiales pizarrosos del Sinclinal de Truchas me-
diante ultrasonidos. Trabajos de Geología, 24:153–164, 2004.
[188] M.A. Rodríguez Sastre. Materiales pizarrosos del sinclinal de Truchas
(León-Orense). PhD thesis, Universidad de Oviedo, 2003.
[189] F Rosenblatt. The perceptron: a probabilistic model for information
storage and organization in the brain. Psychological review, 65(6):386–
408, 1958.
[190] A. Rosenfeld and A. Kak. Digital picture processing. Academic Press,
New York (US), 1982.
[191] H. F. Rueda Chacon, A. Parada Mayorga, and H. Arguello Fuen-
tes. Spectral resolution enhancement of hyperspectral imagery by a
multiple-aperture compressive optical imaging system. Ingeniería e
Investigación, 34(3):50–55, 2014.
198 BIBLIOGRAFÍA

[192] G.A. Ruz, P.A. Estevez, and P.A. Ramirez. Automated visual inspec-
tion system for wood defect classification using computational intelli-
gence techniques. International Journal of Systems Science, 40(2):163–
172, 2009.

[193] J. Salvi, S. Fernandez, T. Pribanic, and X. Llado. A state of the art in


structured light patterns for surface profilometry. Pattern Recognition,
43(8):2666–2680, aug 2010.

[194] G.N. Sarmiento, J.C. Guitiérrez-Marco, and M. Rodabert. Conodontos


ordovìcicos del noroeste de España. Aplicaciòn al modelo de sedimen-
taciòn de la regiòn limìtrofe entre las zonas Asturoccidental- Leonesa
y Centroibèrica durante el Ordovìcico superior. Revista de la Sociedad
Geológica de España, 12(3-4):477–500, 1999.

[195] S. Seitz and R. Szeliski. Applications of computer vision to computer


graphics. Computer Graphics, 33(4):35–37, 1999.

[196] M.A. Selver, O. Akay, E. Ardali, B.A. Yavuz, O. Önal, and G. Öz-
den. Cascaded and hierarchical neural networks for classifying surface
images of marble slabs. IEEE Transactions on Systems, Man and Cy-
bernetics Part C: Applications and Reviews, 39(4):426–439, 2009.

[197] A. Shabtai, U. Kanonov, Y. Elovici, C. Glezer, and Y. Weiss. “Andro-


maly”: A behavioral malware detection framework for android devices.
Journal of Intelligent Information Systems, 38(1), 2012.

[198] L. Shapiro and G. Stockman. Computer Vision. Pearson, New York


(US), 1st edition, 2001.

[199] J. Shi and J. Malik. Normalized cuts and image segmentation. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 22(8):888–
905, 2000.

[200] J. Shotton, T. Sharp, A. Fitzgibbon, A. Blake, M. Cook, A. Kipman,


M. Finocchio, and R. Moore. Real-Time human pose recognition in
parts from single depth images. Communications of the ACM, 56(1),
2013.

[201] N. Shrivastava and V. Tyagi. Content based image retrieval based on


relative locations of multiple regions of interest using selective regions
matching. Information Sciences, 259:212–224, 2014.

[202] SICK AG. Ranger E/D Reference manual, 2014.


BIBLIOGRAFÍA 199

[203] H. Sidenbladh, M. J. Black, and D. J. Fleet. Stochastic Tracking of 3D


Human Figures Using 2D Image Motion. In Sixth European Conference
on Computer Vision (ECCV 2000), pages 702–718, Dublin, Ireland,
2000.

[204] K.P. Singh, N. Basant, and S. Gupta. Support vector machines in water
quality management. Analytica Chimica Acta, 703(2), 2011.

[205] S. Singh and M Kaur. Machine vision system for automated visual
inspection of tile’s surface quality. IOSR J Eng, 2(3):429–432, 2012.

[206] M.L. Smith and R.J. Stamp. Automated inspection of textured ceramic
tiles. Computers in Industry, 43(1):73–82, 2000.

[207] A.J. Smola and B. Schölkopf. A tutorial on support vector regression.


Statistics and Computing, 14(3):199–222, 2004.

[208] M Stone. Cross-validatory choice and assessment of statistical pre-


dictions. Journal of the Royal Statistical Society Series B-Statistical
Methodology, 36:111–147, 1974.

[209] P. Stone and M. Veloso. Multiagent systems: a survey from a machine


learning perspective. Autonomous Robots, 8(3), 2000.

[210] Z. Sun, G. Bebis, and R. Miller. On-road vehicle detection: A re-


view. IEEE Transactions on Pattern Analysis and Machine Intelligen-
ce, 28(5):694–711, 2006.

[211] R. Szeliski. Computer Vision: Algorithms and Applications. Springer,


draft edition, 2010.

[212] R. Szeliski and R. Weiss. Robust shape recovery from occluding con-
tours using a linear smoother. International Journal of Computer Vi-
sion, 28(1):27–44, 1998.

[213] J. Taboada, A. Vaamonde, A. Saavedra, and A. Arguelles. Quality


index for ornamental slate deposits. Engineering Geology, 50(1-2):203–
210, 1998.

[214] Teledyne DALSA. Sherlock, 2009.

[215] Teledyne DALSA. iNspect Express, 2010.

[216] Teledyne DALSA. Sapera LT, 2016.


200 BIBLIOGRAFÍA

[217] S. Tiryaki, S. Ozsahin, and I. Yildirim. Comparison of artificial neural


network and multiple linear regression models to predict optimum bon-
ding strength of heat treated woods. International Journal of Adhesion
and Adhesives, 55:29–36, 2014.

[218] M. Trio Maseda and M. Guillermo Ortuño. Piedra natural 2014. In


Panorama Minero, pages 385–428. Instituto Geológico y Minero de
España, 2016.

[219] D.M. Tsai, P.C. Lin, and C.J. Lu. An independent component analysis-
based filter design for defect detection in low-contrast surface images.
Pattern Recognition, 39(9):1679–1694, 2006.

[220] R.Y. Tsai. Versatile camera calibration technique for high-accuracy


3d machine vision metrology using off-the-shelf tv cameras and lenses.
IEEE journal of robotics and automation, 3(4):323–344, 1987.

[221] M. Tuceryan and A.K. Jain. Texture analysis. In C.H. Chen, L.F. Pau,
and P.S.P. Wang, editors, Handbook of Pattern Recognition and Com-
puter Vision, pages 207–248. World Scientific Publishing, 2nd edition,
1998.

[222] R. Vaillant and O.D. Faugeras. Using Extremal Boundaries for 3-D
Object Modeling. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 14(2):157–173, 1992.

[223] L.G. Valiant. A theory of the learnable. Communications of the ACM,


27:1134–1142, 1984.

[224] V. Vapnik. Estimation of dependences based on empirical data. Sprin-


ger, 1982.

[225] V. Vapnik. Statistical learning theory. John Wiley, 1998.

[226] V Vapnik and A.Y. Chervonenkis. On the uniform convergence of


relative frequencies of events to their probabilities. Theory of probability
and its applications, 16(2):264–279, 1971.

[227] V Vapnik and A.Y. Chervonenkis. Necessary and sufficient conditions


for the uniform convergence of means to their expectations. Theory of
probability and its applications, 26:532–553, 1981.

[228] N.S. Vassilieva. Content-based image retrieval methods. Programming


and Computer Software, 35(3):158–180, 2009.
BIBLIOGRAFÍA 201

[229] F A Vega, J M Matías, M L Andrade, M J Reigosa, and E F Covelo.


Classification and regression trees (CARTs) for modelling the sorption
and retention of heavy metals by soil. Journal of hazardous materials,
167(1-3):615–24, 2009.
[230] M Vidyasagar. A theory of learning and generalization with applications
to neural networks and control systems. Springer, 1997.
[231] H. Wang, S. Shen, and X. Lu. Comparison of the camera calibration
between photogrammetry and computer vision. In Proceedings 2012
International Conference on System Science and Engineering, ICSSE
2012, pages 358–362, Dalian, Liaoning, China, 2012.
[232] K. Wang, B. Babenko, and S. Belongie. End-to-end scene text recogni-
tion. In Proceedings of the IEEE International Conference on Computer
Vision, pages 1457–1464, 2011.
[233] B. Weekes, D.P. Almond, P. Cawley, and T. Barden. Eddy-current
induced thermography - Probability of detection study of small fati-
gue cracks in steel, titanium and nickel-based superalloy. NDT and E
International, 49:47–56, 2012.
[234] D. Weimer, H. Thamer, and B. Scholz-Reiter. Learning Defect Classi-
fiers for Textured Surfaces Using Neural Networks and Statistical Fea-
ture Representations. Procedia CIRP, 7:347–352, 2013.
[235] A. Wilson. Machine vision: The past, the present and the future. Vision
Systems Design, pages 1–30, 2013.
[236] A. Wilson. Smart Cameras Challenge PC-based Vision Systems for
Dominance. Vision Systems Design, 2013.
[237] A.P. Witkin. Recovering surface shape and orientation from texture.
Artificial Intelligence, 17(1-3):17–45, 1981.
[238] Xenics Infrarred Solutions. Tecnologías infrarrojas.
[239] X. Yang, J. Gao, G. Pang, and N. Yung. Textile defect classifica-
tion using discriminative wavelet frames. In ICIA 2005 - Proceedings
of 2005 International Conference on Information Acquisition, volume
2005, pages 54–58, Hong Kong (China), 2005.
[240] J.P. Yun, S.H. Choi, B. Seo, and S.W. Kim. Real-time vision-based
defect inspection for high-speed steel products. Optical Engineering,
47(7), 2008.
202 BIBLIOGRAFÍA

[241] X. Zexiao, W. Jianguo, and J. Ming. Study on a full field of view


laser scanning system. International Journal of Machine Tools and
Manufacture, 47(1):33–43, 2007.

[242] J. Zhang, M. Marszałek, S. Lazebnik, and C. Schmid. Local fea-


tures and kernels for classification of texture and object categories:
A comprehensive study. International Journal of Computer Vision,
73(2):213–238, 2007.

[243] H Zheng, L.X Kong, and S Nahavandi. Automatic inspection of me-


tallic surface defects using genetic algorithms. Journal of Materials
Processing Technology, 125:427–433, 2002.

[244] J.Y. Zheng. Acquiring 3-D models from sequences of contours. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 16(2):163–
178, 1994.

[245] F. Zhou and G. Zhang. Complete calibration of a structured light stripe


vision sensor through planar target of unknown orientations. Image and
Vision Computing, 23(1):59–67, 2005.

[246] S. Zhou, Z. Wei, B. Wang, X. Zheng, C. Zhou, and Q. Zhang. Encry-


ption method based on a new secret key algorithm for color ima-
ges. AEU - International Journal of Electronics and Communications,
70(1):1–7, 2016.
Índice alfabético

árboles de decisión, 106 CART, 106


óptica, 57, 64 circularidad, 92
clivaje de crenulación, 38
adquisición de imágenes, 121, 123 componentes principales, 115, 156
alabeo, 44, 129, 133 comunicación, 58, 74
algoritmo de aprendizaje, 100 congresos, 14, 16
algoritmo de conectividad, 92
algoritmo de dilatación, 91 decisor empírico, 147, 158
algoritmo de erosión, 91 declaración de conformidad, 51
algoritmo de unión, 92 descripción de la muestra, 146
algoritmos de análisis de imagen, 90 detección de bordes, 89, 91
análisis de componentes principales, distancia focal, 64
115, 149
edges, 91
apertura codificada, 81
elementos sistema de visión, 57
apertura del diafragma, 64
error absoluto medio, 103
aplicaciones software específicas, 76
error neutro, 103
aprendizaje no supervisado, 97, 102
espacio de color YUV, 137
aprendizaje supervisado, 97, 102
estandarización de las variables origi-
arquitectura de la red neuronal, 109
nales, 117
búsqueda de imágenes por contenido,
factores de calidad de la pizarra, 41
7
falsa escuadra, 46, 129, 135
bregadas, 45
falso negativo, 103
cámara lineal, 69 falso positivo, 103
cámara matricial, 69 falta de material, 129, 133
cámaras, 69 faltas de material, 46
cámaras 3D, 71 fibra óptica, 59
cámaras de alta velocidad, 71 filtros, 87
calibración del sistema, 83 flores, 42, 129, 136
calidades comerciales, 47 Halcon, 75
campo claro, 61
campo oscuro, 61, 62 iluminación, 57, 58
carbonatos, 42, 129, 136 iluminación coaxial, 62, 63

203
204 ÍNDICE ALFABÉTICO

iluminación de campo oscuro, 61, 62 nudos, 43


iluminación difusa, 62
iluminación fluorescente, 59 oclusión, 79
iluminación frontal, 61
pirita, 42
iluminación halógena, 59
pizarras de Mormeau, 36, 41
iluminación infrarroja, 61 placa calibradora de sulfuros, 140
iluminación láser, 60 plantillas comerciales, 25
iluminación lateral, 61 posición relativa luz-cámara, 61, 83
iluminación LED, 60 postproceso, 121
iluminación por contraste, 62, 63 preproceso, 121, 129
iluminación por fibra óptica, 59 presencia de carbonatos, 129
inspección superficial, 7 presencia de sulfuros, 42, 129, 140
interfaz gráfica de usuario o GUI, 75 problema de clasificación, 100
interferometría, 80 proceso, 121, 129
irregularidades superficiales, 44, 129, proceso de extracción y elaboración,
131 23
irregularidades superficiales generali- producción de pizarra, 21
zadas, 131 productos cerámicos, 8
irregularidades superficiales locales, 131profundidad de campo, 65
prototipo de 2010, 128
kink-bands, 38
prototipo de 2017, 128
publicaciones, 12, 15
láser, 60, 79
labrado, 25 rectangularidad, 92
luminosidad, 64 red neuronal, 108
luz estructurada, 79 redondez, 92
refollos, 43
máquinas de vectores soporte, 111 resolución del sensor, 76
mármol, 9 rocas ornamentales, 8
métodos estadísticos de análisis de ima-
gen, 89 sensibilidad del sensor, 76
métodos morfológicos, 89 sensor, 57, 69
madera, 8 separabilidad de las clases, 102
MAE, 103 sinclinal de Truchas, 35
magnificación, 65 sistema de visión integrado, 73
marcado CE, 51 sistemas de programación a bajo ni-
matriz de confusión, 102, 103 vel, 75
medición 3D, 60, 78 sistemas de programación por menú,
minerales alterables, 42 76
MLP, 108 sobreajuste, 104, 107
modelo de utilidad, 14 software de visión, 58, 75
ÍNDICE ALFABÉTICO 205

sombras, 79
sulfuros, 42, 129, 140
SVM, 111

técnicas de análisis de imagen basa-


das en modelos, 90
técnicas de estructura, 89
tasa de error, 104
tercios, 46
threshold, 90
tiempo de exposición, 76
tiempo de vuelo, 80
tipos de ópticas, 68
tipos de error considerados, 102
transmisión de datos, 74
triangulación láser, 79, 82
trigger, 77

umbral, 90

validación cruzada, 105, 111


variables auxiliares del vector carac-
terístico de la placa, 142, 144
variables básicas del vector caracte-
rístico de la placa, 142, 144
variedades comerciales de Valdeorras,
41
vector característico de la placa, 142,
144
vector de características de la placa,
129
velocidad de obturación, 76
visión en estéreo, 78

z-score, 117

También podría gustarte