Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AUTOMATIZACIÓN INDUSTRIAL
MECATRÓNICA
Es evidente como las imágenes son afectadas a medida que desplazamos los histogramas
hacia la izquierda o derecha en la escala de grises. A medida que el histograma es
desplazado hacia la izquierda, la imagen se oscurece, por el contrario, a medida que es
desplazado hacia la derecha, se esclarece. Estos efectos pueden ayudar a encontrar
detalles o información en las imágenes las cuales a simple vista no son perceptibles.
Este tipo de técnica, también llamada estiramiento de contraste es una operación de punto
lineal que expande el histograma de la imagen para llenar todo el rango de escala de grises
disponible. Un aspecto interesante de esta técnica, es que hoy en día, casi todas las
cámaras de video comerciales de uso doméstico y profesionales aplican el estiramiento
de histograma a escala completa como una función básica antes de que las imágenes sean
Ecualización de histograma
En esta imagen se puede apreciar claramente el efecto que tiene emparejar el histograma
equilibrando los pixeles en toda la escala de grises. Al igual que el estiramiento de
histograma, este tipo de técnica es muy útil cuando las imágenes digitales presentan
problemas de contraste, siendo capaz de resaltar zonas que en su forma original son muy
difíciles de detectar a simple vista, solo basta mirar los detalles del mar en la imagen de
la derecha.
Histogramas de gradientes
Es bastante común que una imagen de entrada posea demasiada información adicional
que no es necesaria para la clasificación y posterior análisis. Por lo tanto, el primer paso
en la clasificación de imágenes es simplificar la imagen extrayendo la información
importante contenida en esta y dejando de lado el resto. Este paso se llama extracción de
características. En los enfoques tradicionales de visión por computador, el diseño de estas
características es crucial para el rendimiento del algoritmo. Algunas técnicas utilizadas
en la visión por ordenador son los detectores de características de Haar (Wang, 2014),
Histograma de Gradientes Orientados (HOG), Transformación de Caracteres Invariantes
(SIFT), Función Robusta Acelerada (SURF), entre otras.
Sin embargo, OpenCV permite además personalizar más la rotación multiplicando por un
factor de escala. Por otra parte, también permite cambiar el centro de rotación. La matriz
de transformación modificada, con estas dos nuevas opciones, tiene la forma:
donde
Transformación Afín
En una transformación afín todas las líneas paralelas en la imagen original seguirán siendo
paralelas en la imagen de salida. Para encontrar la matriz de transformación, necesitamos
tres puntos de la imagen de entrada y sus ubicaciones correspondientes en la imagen de
salida.
Transformación de Perspectiva
Operaciones aritméticas
La suma de dos imágenes está definida como: g(x, y) = f1(x, y) + f2(x, y) donde g(, x, y)
es la imagen resultada, f1(x, y) es una imagen original y f2(x, y) también es una imagen
original. La suma de dos imágenes corresponde a sumar los valores de cada pixel en sus
respectivas coordenadas.
Resta La resta de dos imágenes está definida como: g(x, y) = f1(x, y) f2(x, y) donde g(,
x, y) es la imagen resultada, f1(x, y) es una imagen original y f2(x, y) también es una
imagen original. La resta de dos imágenes corresponde a restar los valores de cada pixel
en sus respectivas coordenadas.
La multiplicación de dos imágenes está definida como: g(x, y) = f1(x, y) ⇤ f2(x, y) donde
g(, x, y) es la imagen resultada, f1(x, y) es una imagen original y f2(x, y) también es una
imagen original. La multiplicación de dos imágenes corresponde a multiplicar los valores
de cada pixel en sus respectivas coordenadas.
La división de dos imágenes está definida como: g(x, y) = f1(x, y) /f2(x, y) donde g(, x,
y) es la imagen resultada, f1(x, y) es una imagen original y f2(x, y) también es una imagen
original. La división de dos imágenes corresponde a dividir el valor del pixel de la imagen
1 entre el valor del pixel de la imagen 2 en sus respectivas coordenadas.
Operaciones lógicas
La operación lógica AND de dos imágenes esta definida como: g(x, y) = f1(x, y)&f2(x,
y) donde g(, x, y) es la imagen resultado, f1(x, y) es una imagen original, f2(x, y) también
es una imagen original y el operador & representa la operación lógica AND. La operación
AND es realizada a nivel de bits para los valores de los pixeles de cada imagen.
La operación lógica OR de dos imágenes esta definida como: g(x, y) = f1(x, y)|f2(x, y)
donde g(, x, y) es la imagen resultado, f1(x, y) es una imagen original, f2(x, y) también
es una imagen original y el operador | representa la operación lógica OR. La operación
OR es realizada a nivel de bits para los valores de los pixeles de cada imagen.
La operación lógica NOT aplicada a una imagen como: g(x, y) =!f1(x, y) = ¬f1(x, y)
donde g(, x, y) es la imagen resultado, f1(x, y) es una imagen original, y el operador ! o
¬ representa la operación lógica NOT. La operación OR es realizada a nivel de bits para
los valores de los pixeles. Es similar a obtener el Inverso de una imagen
Bibliografía
• Gonzalez, R. C., Woods, R, E., Digital Image Processing, 3a edición, EUA, Prentice Hall, 2008,
ISBN-10: 013168728X.
• Petrou, M., Bosdoganni, P., Image Processing: The Fundamentals, 1a edición, EUA,
WileyBlackwell, 1999, ISBN-10: 0471998834.
• Pratt, W. K., Digital Image Processing, 3a edición, EUA, John Wiley & Sons Interscience, 2001,
ISBN 0471374075.
• Davies, E. R., Machine Vision: Theory, Algorithms, Practicalities, 3a edición, EAU, Elsevier-
Morgan Kaufmann, 2004, ISBN 0122060938.
• Jain, A. K., Fundamentals of Digital Image Processing1a edición, EUA, Prentice Hall Englewood
Cliffs, 1988, ISBN 0133361659.