Está en la página 1de 13

INVESTIGACIÓN PROYECTO MATEMATICAS ESPECIALES

INTEGRANTES

JOHAN SEBASTIAN CRUZ CASALLAS


73237

PABLO ESTEBAN CASTIBLANCO RIAÑO


82445

UNIVERSIDAD ECCI
BOGOTA D.C.
2021
ÍNDICE
1. INTRODUCCIÓN........................………………1 reconocimiento de voz.
2.PLANTEAMIENTO………………....2 enfoque del proyecto y
explicación.
2.1 análisis de los espectros de la voz………………………………….....…..2
3.OBJETIVO GENERAL……………………………………………..……...3
4 OBJETIVOS ESPECÍFICOS………………………………………..……..3
5.CÁLCULOS Y CONSIDERACIONES………………………………..…..4
5.1. La transformada de Fourier en el análisis de la voz…………………….…...4
5.2. Transformada discreta de Fourier directa (DFT)............................................4
5.3. Transformada discreta de Fourier inversa (IDFT)..........................................5
5.4. Procesamiento de audio o voz………………………………………...……….5
5.5. Sonoridad: Presión sonora y decibelios……………………………….…..….6
5.6. Frecuencia de muestreo…………………………………………………..…….7
5.7. Representación en Software(Matlab)................................................................8
5.8. Representación en Software(python)................................................................9
5.9. Eliminar ruido de frecuencia de una audio……………….………………….9
6. CONCLUSIONES…………………………………………………………………..12
7. BIBLIOGRAFÍA…………………………………………………………..13

1. INTRODUCCIÓN
El reconocimiento de voz es cada vez más importante en la vida cotidiana de las
personas pues una gran parte de la información que recibimos y percibimos cada día
está en forma de audio, como cuando tenemos una conversación. Sin embargo en la
actualidad se ha hecho más frecuente el uso de la tecnología con su rápido
crecimiento, lo que ha provocado que por medio de dispositivos de comunicación o
dispositivos amplificadores de audio escuchemos dichos sonidos.

Los sonidos producidos por estas máquinas se generan a partir de la información


almacenada en su interior, o bien las ondas electromagnéticas son captadas por una
antena, procesadas y luego convertidas en sonido. Durante este proceso se observan
diferentes propiedades internas que permiten realizar esto como la verificación de
dichas ondas donde se cataloga su frecuencia y su amplitud, lo cual permite mediante
algoritmos identificar y almacenar dichos datos de audio lo que ahora suele pasar a
denominarse como sonido digital.

Lo que percibimos como sonido corresponde al fenómeno físico de ligeras


variaciones de la presión del aire cerca de nuestros oídos. Las variaciones más
grandes significan sonidos más fuertes, mientras que las más rápidas corresponden a
sonidos con un tono más alto. La presión del aire varía continuamente con el tiempo,
pero en un momento dado tiene un valor preciso. Esto significa que el sonido puede
considerarse una función matemática la cual podemos representar.

En matemáticas, la transformada discreta de Fourier (DFT) es un tipo específico de


transformada de Fourier, utilizada en el análisis de Fourier. Transforma una función
en otra, que se denomina representación en el dominio de la frecuencia, o
simplemente DFT, de la función original. Pero la DFT requiere una función de
entrada que sea discreta y cuyos valores distintos de cero tengan una duración
limitada (finita). Estas entradas suelen crearse mediante el muestreo de una función
continua, como la voz de una persona. En términos matemáticos esta transformada es
un operador (F) que aplicado a una función temporal g(t) la convierte en otra función
de la frecuencia G(f) que nos aporta la misma información que la primera.

2. PLANTEAMIENTO DEL PROYECTO


2.1 ANÁLISIS DE LOS ESPECTROS DE LA VOZ
El proyecto consiste en el estudio y representación de los espectros de la voz para lo
cual observamos diferentes características utilizando números complejos, electrónica
y sistemas; para realizar esto usaremos la Transformada de Fourier que permite hacer
la descomposición en senos y cosenos de los diferentes espectros de tal forma que se
aprecien sus componentes de frecuencia, amplitud y fase para su posterior
reconstrucción por síntesis aditiva. De igual forma, se pueden evaluar algunas
características básicas del sonido asociadas a su forma de onda tales como el tono y el
timbre.
Para esto se requiere recibir la información de un audio percibido ya sea por medio de
un micrófono el cual sea convertido en datos informáticos para identificar por medio
de software, por lo tanto se observará el funcionamiento de circuitos para percibir los
audios y qué propiedades se le aplican para la transformación en datos para realizar la
representación gráfica.
Se parte de la base de que toda señal genérica, por compleja que sea se puede
descomponer en una suma de funciones periódicas simples de distinta frecuencia. En
definitiva, la Transformada de Fourier visualiza los coeficientes de las funciones
sinusoidales que forman la señal original

Figura 1. Coeficientes de las funciones sinusoidales


Si aplicamos la transformada a la señal genérica de la figura anterior nos daría como
resultado una proporción de los coeficientes que hemos utilizado para generarla

3. OBJETIVO GENERAL
- Analizar los espectros de la voz usando las series de Fourier aplicando de esta
manera los números complejos para así reconocer su funcionamiento y su
representación gráfica.

4. OBJETIVOS ESPECÍFICOS

- Realizar el estudio sobre el procesamiento de un audio utilizando elementos


físicos y digitales.
- Reconocer la aplicación de la transformada de fourier dentro de los aspectos
de la voz de forma digital
- Reconocer las propiedades que tienen los audios como sus frecuencias y sus
decibelios.

5. CÁLCULOS Y CONSIDERACIONES
Para el desarrollo del proyecto con el objetivo de realizar y analizar el estudio de los
espectros de la voz, se plantea el uso de la transformada de Fourier utilizando tanto
elementos físicos como virtuales para realizar un reconocimiento de la voz y poder
transformar este a elementos informáticos donde se puede realizar el estudio del
espectro mediante las frecuencias de una función.
- Dentro de los elementos físicos encontramos el micrófono, el controlador de
audio y el computador.
- Dentro de los elementos virtuales encontramos el procesamiento de audio, el
software y la programación.

5.1La transformada de Fourier en el análisis de la voz


El análisis de Fourier es la técnica que produce algo llamado Transformada de
Fourier, que contiene la información del espectro.

Para el análisis de las señales de voz se utiliza la transformada ordinaria denominada


transformada rápida de Fourier (FFT en inglés). La FFT proporciona la representación
estándar de una señal de voz en el dominio de la frecuencia. Mientras que la
transformada corta de Fourier es capaz de mantener los cambios de frecuencia en el
tiempo. Pero dentro de esta encontramos el impedimento de que no es apropiada para
las señales cuyas frecuencias varían en el tiempo, por lo que en el caso de la FFT se
asume que las señales son de naturaleza estacionaria. La FFT es un algoritmo rápido,
para calcular la transformada discreta de Fourier.
5.2Transformada discreta de Fourier directa (DFT):

5.3Transformada discreta de Fourier inversa (IDFT):

5.4Procesamiento de audio o voz

Figura 2. Gráfica Amplitud vs tiempo del espectro


Las técnicas de procesamiento de la señal de voz/audio comienzan convirtiendo el
habla en bruto en una secuencia de vectores de características acústicas que llevan las
características de la señal. Esto se conoce como preprocesamiento, es decir, la
extracción de características se completa aquí y también se denomina procesamiento
frontal.
Dentro de la tecnología actual encontramos dispositivos que realizan este proceso
donde las ondas electromagnéticas son captadas por una antena, procesadas y luego
convertidas en sonido el cual es almacenado en su interior (EF, 2012). El sonido
almacenado en el interior de las máquinas o captado por las antenas suele
representarse como sonido digital. Esto tiene ciertas limitaciones, pero al mismo
tiempo hace que sea muy fácil manipular y procesar el sonido en un computador.

5.5 Sonoridad: Presión sonora y decibelios

Figura 3. Gráfica presión sonora y cambios de decibelios


En la figura se muestra un ejemplo de un sonido sencillo en el que se representan las
oscilaciones de la presión del aire en función del tiempo en esta observamos que la
presión del aire inicial tiene el valor 101 325 y luego la presión empieza a variar cada
vez más hasta oscilar regularmente entre los valores 101 323 y 101 327.
En la zona en la que la presión del aire es constante, no se oirá ningún sonido, pero a
medida que las variaciones aumentan de tamaño, el sonido se hace cada vez más
fuerte hasta aproximadamente el tiempo t = 0,6, donde el tamaño de las oscilaciones
se hace constante.

5.6Frecuencia de muestreo.
Figura 4. Gráfica de la frecuencia de muestreo
El sistema de análisis de señales muestreadas temporalmente supone una deformación
considerable de la señal, que, de por sí, suele presentar una perfecta continuidad. El
problema se va incrementando a medida que el muestreo se pueda realizar a intervalos
más pequeños. Ahora bien, como que el algoritmo (FFT) trabaja con un número
determinado de, muestras, la comprensión de las mismas en un tiempo relativamente
corto no nos permite detectar fenómenos que manifiestan su periodicidad en un
tiempo más largo (como, por ejemplo, la periodicidad fundamental de las cuerdas
vocales).

5.7 Representación en Software(Matlab)

Figura 5. Gráfica del espectro en matlab


En este ejemplo podemos observar la representación gráfica de una transformada de
Fourier aplicada en el espectro de la voz por medio del software Matlab. Donde
después de haber sido procesado el audio y almacenado en un archivo se adquieren
sus propiedades para representarse.
5.8 Representación en Software(python)
Figura 6. Ejemplo en el reconocimiento de las palabras (si) y (no).

Figura 7. Representación gráfica frecuencia vs amplitud

En las figuras 6 y 7 podemos observar una de las aplicaciones de la transformada de


fourier utilizando por medio de programación de python la identificación del espectro
para reconocer el momento en que se dicen las palabras sí y no.

5.9 ELIMINAR RUIDO DE FRECUENCIA EN UN AUDIO


En este ejemplo podemos observar la representación gráfica de una transformada de
Fourier aplicada en el espectro de la voz utilizando un fragmento del audio de una
conferencia ya que aquí puede haber ruido causado por factores externos como
personas hablando o el ruido de los carros de la calle; donde por medio del software
matlab utilizando programación y el uso del modelo matemático de la rápida
transformada de fourier se obtienen las gráficas correspondientes a las diferentes
características de el audio original y del audio final filtrado para eliminar el ruido de
las frecuencias.
Figura 8. Código en matlab

En la figura 1 podemos observar el código en matlab donde luego de realizar la


limpieza del workspace se hace una lectura del archivo que contiene el audio, a partir
de este se obtienen valores aplicando la función interna que permite realizar las
rápidas transformadas de fourier más fácilmente con un comando para así lograr
obtener datos como la frecuencia y la amplitud del espectro del audio los cuales
posteriormente se manipulan para eliminar el ruido.
Figura 10. Gráfica de la señal original
En la figura 10 podemos ver la representación del espectro en una gráfica a partir de
los datos obtenidos del archivo.

Figura 11. Filtro de frecuencias de ruido


En la figura 11 observamos la identificación de la pendiente del filtro para eliminar y
mantener ciertas frecuencias según lo deseado.
Figura 12. Señal filtrada
En esta figura 12 obtenemos la representación de la señal filtrada donde las
frecuencias de ruido fueron eliminadas y las frecuencias necesarias permanecen.

6. CONCLUSIONES
Como podemos observar en el estudio de los espectros de la voz tenemos diferentes
aplicaciones para manipular y mejorar aspectos de la voz como el ruido y otros
factores que afectan a la correcta escucha de un audio, también podemos identificar
palabras y distintas voces dentro de un audio, lo cual actualmente podemos observar
en aplicaciones como el asistente de google o el asistente de amazon alexa los cuales
identifican la voz y las palabras que decimos. Así mismo, también se observan
diferentes formas de manipular las transformadas de fourier donde una
implementación de la transformada rápida de fourier es más eficiente en términos de
el número de operaciones aritméticas que una implementación directa de la DFT y
como esta nos permite la facilidad de graficar de forma más sencilla la representación
en el dominio de la frecuencia de una función. También vemos la caracterización de
las gráficas y como la transformada de fourier relaciona una función del dominio en el
tiempo con una función en el dominio de la frecuencia.
En otras palabras, la transformada de Fourier se utiliza para conocer las características
de frecuencia de las señales y el comportamiento de los sistemas lineales ante estas
señales; así mismo es capaz de resolver ecuaciones diferenciales con mayor facilidad.
7. BIBLIOGRAFÍA
- UTSI. (2019). Voice recognition via Fourier Transform (N.o 1). IUT.
- EF. (2012). Fourier analysis and applications to sound processing (N.o 1). UIO.
https://www.uio.no/studier/emner/matnat/math/nedlagte-emner/MAT-INF2360/v12/
part1.pdf
- Transformada Discreta de Fourier. Análisis de audio en tiempo real con Python
(Scipy). (2020, 19 noviembre). [Vídeo]. YouTube. https://www.youtube.com/watch?
v=5QPdlTg1z-I
- Transformada de Fourier [FFT] en MATLAB paso a paso 2020. (2020, 1 julio).
[Vídeo]. YouTube. https://www.youtube.com/watch?v=SrFkYY_VmNE
- Marti, J. (1987). FFT COMO HERRAMIENTA DE ANÁLISIS EN FONÉTICA (N.o
1). LA SALLE BONANOVA.
https://www.ub.edu/journalofexperimentalphonetics/pdf-articles/EFE-III-JMarti-
FFT_herramienta.pdf
- C. (s. f.). Casdreams.CESF. http://www.casdreams.com/cesf/foc/fo/transformada
%20de%20fourier.pdf
- Gil, J. A. (2020, 24 mayo). Filtro de un audio a partir de la transformada rápida de
fourier. YouTube. https://www.youtube.com/watch?
v=OOX2Y7xH3yQ&feature=youtu.be

También podría gustarte