Está en la página 1de 4

Jefferson Stalyn Núñez Quishpe, Roberto Carlos Vallejo Morales, Jonathan Wladimir Tercero Gualpa, Alex

Vinicio Guanopatin Claudio - Universidad de las Fuerzas Armadas “ESPE”, Latacunga - Ecuador
jsnunez3@espe.edu.ec, rcvallejo1@espe.edu.ec, jwtercero@espe.edu.ec, , avguanopatin@espe.edu.ec.
ANÁLISIS DE AUDIO DE LAS VOCALES EN
SIMULINK

La Transformada rápida de Fourier, conocida por la
abreviatura FFT (del inglés Fast Fourier Transform) es un
Resumen – A continuación, se verá uno de los aspectos algoritmo eficiente que permite calcular la transformada de
básicos para desarrollar un análisis de audio con ayuda de Fourier discreta (DFT) y su inversa. La FFT es de gran
Matlab, consiste en cargar un archivo de audio y poder importancia en una amplia variedad de aplicaciones, desde el
realizar algún proceso de análisis básico, como lo es el tratamiento digital de señales y filtrado digital en general a la
cálculo de la TRANSFORMADA DE FOURIER, para resolución de ecuaciones en derivadas parciales o los
obtener una visualización del comportamiento de la señal en algoritmos de multiplicación rápida de grandes enteros.
el dominio de la frecuencia además de su visualización en el
dominio del tiempo
Al obtener toda la información lo siguiente es graficar la
información en el tiempo y la frecuencia.
I. INTRODUCCIÓN
Para analizar la señal es necesario conocer el rango de
El software utilizado para la realización de este proyecto es
frecuencia de cada una de las vocales.
simulink.

Simulink es un entorno de programación visual, que funciona


sobre el entorno de programación Matlab.

Es un entorno de programación de más alto nivel de


abstracción que el lenguaje interpretado Matlab (archivos con
extensión .m).

Ilustración 1 Interfaz de simulink


Ilustración 2 Frecuencia (en Hz) y desviación estándar del
Gracias a simulink se realizar la obtención del audio, su primer y del segundo formante en una muestra de 16
análisis, a continuación, se muestrea la señal y se utiliza la informantes masculinos.
transformada rápida de Fourier. -

La transformada de Fourier se utiliza para pasar una señal del


dominio del tiempo al dominio de frecuencia para así obtener
información que no es evidente en el dominio temporal.

Por ejemplo, nos permite saber sobre qué ancho de banda se


concentra la energía de una señal analizándola en el dominio
de la frecuencia. II. DESARROLLO
El procesamiento digital de señales de voz tiene una gran
En este caso se utiliza la transformada rápida de Fourier
variedad de aplicaciones, existe una base para el tratamiento
digital de señales, que puede ser implementada para lograr
obtener lo que nos interese según la aplicación.

El Sistema de Reconocimiento de Voz es una de las Ilustracion2. Espectro de frecuencia de la lera a
aplicaciones del procesamiento digital de señales de voz.
El sistema consiste en obtener una señal de voz que permita Para la letra e de igual manera utilizamos el mismo
reconocer qué palabra se esta hablando. Consta de una algoritmo.
interfaz gráfica que permite la interacción del usuario por
medio de un micrófono con la computadora, la que procesa
automáticamente los datos adquiridos.

Basado en los resultados de este sistema, se puede ver como


se plantea la base del procesamiento digital de señales de voz
y queda a la libre imaginación como puede ser utilizado para
otras aplicaciones, a demás del de reconocimiento de voz.

El identificador de voz a desarrollar esta orientado a


implementar un sistema de reconocimiento de voz basado en
parámetros LPC como medida de la señal de entrada, como
muestra la figura. 1, el proyecto total constaría de varias
etapas, por ello se muestra el diagrama de bloques
correspondiente:

Ilustracion3. Diagrama de bloques para la letra e

Figura 1 Diagrama de bloques de un Identificador de voz

A continuación, se detalla los diferentes diagramas de


bloques utilizados en simulink, para observar los espectros de
frecuencia de cada unA de las vocales.

Ilustracion4. Espectro de frecuencia de la lera e

Al obserbar el espectro de frecuencia de la letra i se pudo


determinar que fue en especro de mayor amplitud.

Ilustracion1. Diagrama de bloque para la letra a

Ilustracion5. Diagrama de bloques utilizadp para la letra i


Ilustracion6. Espectro de frecuencia de la letra i

Para la siguiente vocal utilizamos el mismo algoritmo, con el


diagrama de bloque. Ilustracion9. Diagrama de bloques de la letra u

Ilustracion10. Espectro de frecuencia de la letra u


Ilusracion7. Diagrama de bloques de la letra o
UNIÓN DE DOS VOCALES.

Ilustracion11. Diagrama de bloques de la letra a.e

Ilusracion8. Espectro de frecuencia de la letra o

La ultima vocal a ingresar fue la letra u, en esta letra se


obtuvo el minino espectro de frecuencia.
 Rodríguez Correa, J. D. Diseño de una Red Modular
Ilustracion12. Espectro de frecuencia de la letra a.e Auto-organizada con aplicación en reconocimiento
de fonemas(Bachelor's thesis, Facultad de Ciencias).

Ilustracion13. Señal en ytiempo real letra a.e

III. CONCLUSIONES
 Para generar palabras se debe ingresar la grabación
en diferentes momentos para formar una palabra.
 Al observar el espectro de frecuencia de cada una de
las vocales, se determinó que la frecuencia más alta

 es la letra i, consecuentemente la frecuencia más


baja es la letra u.
 Con este método no es posible generar palabras,
puesto que las frecuencias se mezclan.

IV. RECOMENDACIONES
 Para ingresar la grabación es necesario utilizar un
micrófono adecuado
 Las señales deben ser muestreadas para generar un
mejor espectro al momento d mezclar las vocales.
 No grabar la señal con n celular puesto que la señal
tiende a tener errores.

V. BIBLIOGRAFIA
 Argüello García, L. N. (2016). Análisis de la
modulación de voz ocasionada por el temblor vocal.
 Erazo, E. R. A. TRATAMIENTO DIGITAL DE LA
SEÑAL DE AUDIO UTILIZANDO EL DSP
SHARCK 21061.

También podría gustarte