Está en la página 1de 5

1

Transformada rápida de Fourier y su


aplicación en tratamiento de imágenes y
audio

Fast Fourier Transform and its application in image processing and audio

Autor: Angie Vanessa Jaramillo Castrillón


Facultad de Ingenierías, programa de sistemas y computación
Universidad Tecnológica de Pereira
Correo: anvajaramillo@utp.edu.co

Resumen— la FFT es la forma optimizada de la DFT, logrando así La transformada rápida de Fourier es la versión más rápida de
menos complejidad en sus algoritmos pudiéndose aplicar en temas la transformada discreta de Fourier (DFT). La FFT utiliza
“complejos” para realizar sus procedimientos de un manera más algunos algoritmos inteligentes para hacer lo mismo que la
fácil o más analítica. Sus diferentes e innumerables aplicaciones DFT pero en mucho menos tiempo.
dan a demostrar su gran efectividad en el campo de la ciencia y la La DFT es extremadamente importante en el área del análisis
ingeniería. Su énfasis en el tratamiento de imágenes y audio
de la frecuencia debido a que se necesita una señal discreta en
permite el análisis de datos retornando patrones que con análisis
detallado se pueden desarrollar grandes aplicaciones. el dominio del tiempo y que transforma la señal en su
representación de dominio de frecuencia discreta.
La FFT es de gran importancia en una amplia variedad de
Palabras clave— FFT, DFT, minucias, frecuencia de muestreo, aplicaciones mencionaré algunas como:
patrón.  Tratamiento de imagen (jpeg) y audio (mp3).
 Reducción de ruido en señales, como el ruido blanco.
Abstract— the FFT is the optimized form of the DFT, achieving
 Análisis en frecuencia de cualquier señal discreta.
less complexity in their algorithms and can be applied to
"complex" issues to make their procedures easier or more  Análisis de vibraciones.
analytical way. Its various and innumerable applications give  Análisis de materiales y estadística.
demonstrate its great effectiveness in the field of science and  Síntesis, mediante la transformada inversa.
engineering. His emphasis on imaging and audio data analysis  Procesamiento de imagen lineal.
allows returning detailed analysis patterns that can develop large  Técnicas de imagen especial.
applications.
 Redes neuronales.
 Comprensión de datos.
Key Word — FFT, DFT, minutiae, sampling frequency, pattern.  Procesamiento de señales digitales.
 Software DSP.
I. INTRODUCCIÓN  Propagación del calor (fundamentos de la
termodinámica).
Jean Baptiste Joseph Fourier (Auxerre, Francia, 21 de marzo de  Algoritmo de encriptación.
1768 – París, 16 de mayo de 1983), matemático y físico francés  Complejidad computacional.
conocido por sus trabajos sobre la descomposición de En este artículo haré énfasis sobre la aplicación de la FFT en
funciones periódicas en series trigonométricas convergentes tratamiento de imagen y audio.
llamadas series de Fourier, método con el cual consiguió
resolver la ecuación del calor. La transformada de Fourier II. CONTENIDO
recibe su nombre en su honor.
FFT es la abreviatura usual del inglés Fast Fourier Transform A. Contexto
de un eficiente algoritmo que permite calcular la transformada
discreta de Fourier y su inversa. 1. Tratamiento digital de imágenes.
2
un lenguaje adaptado a las necesidades de la representación del
El tratamiento digital de imágenes es un campo en constante sonido. El “fuente” es un partitura electrónica que indica
evolución en su vertiente tecnológica, tanto en capacidad de cuando se debe sonar un nota, por cuanto tiempo, con que
procesamiento y transmisión con crecimiento exponencial, volumen y cómo debe terminar. Después de un cierto proceso
pero también por el gran avance que han experimentado las de compilación, en vez de producir un ejecutable normal,
técnicas de procesado digital en áreas como el filtrado producen un sonido binario. Es decir, un fichero .wap, .au, .snd,
compresión y análisis de imágenes. .mid, .mp3, .aiff entre otros.

Las aplicaciones actuales del Tratamiento Digital de Imágenes B. Ejemplo tratamiento de imágenes: Reconocimiento de
son prácticamente innumerables y prometen deparamos huellas dactilares.
grandes sorpresas en un futuro próximo. La televisión digital,
los videojuegos, la telefonía móvil, el cine de animación, son La huella dactilar tiene características únicas llamadas
solo algunos ejemplos del impacto que tiene actualmente en la minucias, las cuales son puntos donde los bordes terminan o se
sociedad de consumo. En el ámbito industrial y de servicios dividen.
destacan las aplicaciones de visión artificial en inspección y El sistema de reconocimiento consiste de siete pasos:
robótica, así como el desarrollo espectacular que ha producido Adquisición, Etapa de Preprocesamiento, Aclaración,
en la generación y tratamiento de imágenes médicas. Adelgazamiento, Extracción de Minucias, Reconocimiento y
algunas veces una etapa de Verificación.
Desde una perspectiva histórica, el Tratamiento Digital de
Imágenes representa una generalización multidimensional de 1. Etapa de Preprocesamiento.
las técnicas de tratamiento digital de la señal unidimensional.
Los orígenes del procesamiento digital de la señal se remontan Para evitar posibles errores en el reconocimiento, la
al siglo XIX, aunque su desarrollo práctico no se produce hasta información en los extremos será eliminada, para poder
la década de los años 60, cuando Cooley y Tukey propusieron asegurar que solamente la información central sea procesada al
un algoritmo eficiente para el cálculo de la transformada de momento de la extracción de minucias. En caso de que esta
Fourier: La FFT (Fast Fourier Transform). Después, con la distorsión no fuera eliminada, el algoritmo podría detectar
irrupción de los microprocesadores, se diseñaron procesadores falsas minucias. Por lo tanto, la imagen fue recortada en un 10%
adaptados para el cálculo de FFT’s, los denominados DSP’s. en cada uno de sus lados tomando en cuenta que esto no elimina
Estas dos circunstancias han sido decisivas para que se información importante de la huella dactilar por lo mencionado
produjera el espectacular avance del procesamiento digital de anteriormente.
la señal, que hoy día, ha penetrado en todos los sectores de la
sociedad y, especialmente, en el tratamiento digital de 2. Aclaración.
imágenes.
El objetivo de un algoritmo de aclaración es mejorar la claridad
2. Tratamiento digital de sonido. de la estructura de los bordes en las regiones recuperables y
marcar las regiones no-recuperables con demasiado ruido para
El almacenamiento y reproducción puede hacerse usando dos un posterior procesamiento. La mayoría de las técnicas
criterios: magnetófono y partitura. existentes están basadas en el uso de filtros contextuales cuyos
parámetros dependen de la frecuencia y orientación de los
2.1 Magnetófono (Sistema de muestreo) bordes locales. Los filtros pueden ser definidos en el dominio
de Fourier o en el dominio espacial. En este trabajo se utilizó
El sistema magnetófono digitaliza la onda por el procedimiento una combinación de filtros en los dos dominios para una mejor
de anotar repetidamente su amplitud en intervalos de tiempo aclaración.
muy pequeños; es el denominado sistema de muestreo. En
todos los casos la onda es transformada en una serie de valores 2.1 Filtro en el dominio espacial
numéricos que se almacenan en un fichero. Posteriormente el
fichero puede ser leído por un programa especial, y sus datos El filtro incrementa el contraste en una dirección perpendicular
enviados secuencialmente a un dispositivo que es capaz de a los bordes mientras realiza un alisamiento en la dirección de
regenerar una tensión eléctrica proporcional a los valores los bordes. Los filtros de Gabor tienen una propiedad
(numéricos) recibidos, de forma que se asemeja a la forma de importante que consiste en una óptima resolución de
onda original. La tensión producida es entregada a su vez a un frecuencia. La función simétrica de Gabor tiene la forma de la
altavoz que la transforma finalmente en “sonido”. ecuación (1):

2.2 Partitura

El sistema partitura utiliza un lenguaje especial, parecido al de


los músicos, para almacenar información sobre cada nota. Es
3

2.2 Filtro en dominio de Fourier. posible en el reconocimiento. Así, la información que se


almacena de la huella dactilar consiste en una matriz de tamaño
Cada imagen es convolucionada con filtros precalculados del 4x500. La matriz se compone de 500 vectores y cada vector de
mismo tamaño que la imagen. Sin embargo, el algoritmo asume 4 valores que consisten de las dos coordenadas de la primer
que la frecuencia de los bordes es constante a lo largo de la minucia, la distancia a la siguiente minucia y el ángulo de la
imagen con el fin de evitar tener un gran número de filtros primer minucia con respecto al eje Y. Por lo tanto, el tamaño
precalculados. Por lo tanto, el algoritmo no utiliza toda la total de nuestra matriz almacenada es de 1000x500 (5 huellas
información contextual proporcionada por la imagen de la por persona y 50 personas diferentes).
huella dactilar. Watson propuso otra técnica de aclaración
completamente en el dominio de Fourier. En esta técnica la 6. Etapa de verificación
imagen es dividida en bloques los cuales son traslapados, la
imagen aclarada es obtenida con las ecuaciones Esta etapa consiste en analizar la dirección y el número de
(2) y (3): píxeles que fue movida la imagen de entrada. Cuando dos
imágenes de la huella dactilar de una misma persona son
comparadas y una de estas imágenes está trasladada, todas las
minucias de la huella dactilar se mueven en la misma dirección
y la misma cantidad de píxeles.

C. Ejemplo de reconocimiento de audio: Reconocedor de


voz mediante el uso de la FFT.
3. Adelgazamiento.
Haciendo uso de un programa implementado en MATLAB: se
Después del proceso de aclaración la imagen es binarizada, es graban dos segundos de audio con una frecuencia de muestreo
decir, está formada de ceros y unos, donde un “1” significa un de 20KHz. La grabación da como resultado un vector de 40 mil
píxel blanco y un “0” significa un píxel negro. El algoritmo datos, de los que se discriminarán los datos significativos
consiste en encontrar píxeles internos en nuestra imagen y mediante un umbral de 0.1. Con base en el vector de datos
después eliminar los píxeles límite. Este proceso es realizado obtenidos, se realiza el siguiente procesamiento:
hasta no encontrar más píxeles internos.
1. Aplicar el filtro de preénfasis para acentuar las
4. Extracción de minucias frecuencias altas de la señal de voz, debido a que el
modelo de tracto vocal utilizado no filtra
El algoritmo consiste en calcular el número de píxeles que adecuadamente las señales de frecuencia alta, no
cruzan el píxel central (Pc), esto se calcula con la ecuación (4): sonoras: las consonante, sonoras: las vocales. El filtro
de preénfasis está dado por la ecuación (1).

2. Segmentar la señal en tramos de 20 a 30ms, puesto que


en este período de tiempo se considera a la señal de
voz como estacionaria. En este proyecto, se fracciona
en tramos de 24ms, por lo tanto, cada vector resultante
tiene 480 datos y, se analiza utilizando un overlap de
80 datos. Para ellos usamos la ecuación (2) y podemos
visualizar en la figura 1.
Esta es la razón por la cual se ha propuesto combinar dos etapas
de aclaración y de esta forma evitar que algunas minucias sean
eliminadas durante el proceso.

5. Etapa de reconocimiento.

El reconocimiento se realizó con tres importantes


características: coordenadas, distancia y ángulos. La razón de
usar tres características es poder obtener el mínimo error

____________________________
4

El contenido debe tener capítulos y subcapítulos enumerados


3. Aplicar una ventana Hamming a cada tramo de datos, con números arábigos, tipo de letra Times New Roman de 10
para así eliminar las discontinuidades provocadas al puntos en negrita.
segmentar, ya que éstas podrían llegar a interpretarse debe definir su procedencia.
como altas frecuencias. En la ecuación (3) se resume
lo antes mencionado. III. CONCLUSIONES

 La FFT presentada bueno resultados analizando las


minucias en huella dactilares cerca de las regiones de
alta curvatura.
4. Obtener la FFT de cada tramo ecuación (4), con el  La combinación de la FFT y los filtros de Gabor
objetivo de generar una superficie en la que se pueda generan un reconocimiento de minucias casi
observar las frecuencias y su variación en el tiempo completo.
(figura 2). Se promedian las FFT de cada tramo, para  La FFT permite observar las frecuencias y sus
obtener un patrón de la palabra pronunciada (figura 3). variaciones en el tiempo permitiendo decodificar un
audio entregado.
 Un promedio de FFT retorna un patrón de audio.

REFERENCIAS

Libros:

 The Scientist and Engineer’s Guide to Digital Signal


Processing, second edition, Steven W. Smith.

Artículos:

 Reconocimiento de huellas dactilares usando


características locales, Gualberto Aguilar, Gabriel
Sánchez, Karina Toscano, Mariko Nakano, Héctor
Pérez.
 Reconocedor de voz mediante el uso de la FFT,
Andrés Fuentes Hernández, Álvaro Anzueto Ríos.
5

Links:

 http://www.zator.com/Hardware/H10_2.htm
 http://cv1.cpd.ua.es/ConsPlanesEstudio/cvFichaAsiE
EES.asp?wlengua=C&wcodasi=20024
 http://www.phys.nsu.ru/cherk/fft.pdf
 http://www.phys.nsu.ru/cherk/fft.pdf
 http://es.wikipedia.org/wiki/Transformada_r%C3%A
1pida_de_Fourier

Anexos:

 Imagen: canes.jpg
 Txt: aplicativosFFT.txt

____________________________

También podría gustarte