Sadsdsad

Jefferson Stalyn Núñez Quishpe, Roberto Carlos Vallejo Morales, Jonathan Wladimir Tercero Gualpa, Alex
Vinicio Guanopatin Claudio - Universidad de las Fuerzas Armadas “ESPE”, Latacunga - Ecuador
jsnunez3@espe.edu.ec, rcvallejo1@espe.edu.ec, jwtercero@espe.edu.ec, , avguanopatin@espe.edu.ec.
ANÁLISIS DE AUDIO DE LAS VOCALES EN
SIMULINK

La Transformada rápida de Fourier, conocida por la
abreviatura FFT (del inglés Fast Fourier Transform) es un
Resumen – A continuación, se verá uno de los aspectos algoritmo eficiente que permite calcular la transformada de
básicos para desarrollar un análisis de audio con ayuda de Fourier discreta (DFT) y su inversa. La FFT es de gran
Matlab, consiste en cargar un archivo de audio y poder importancia en una amplia variedad de aplicaciones, desde el
realizar algún proceso de análisis básico, como lo es el tratamiento digital de señales y filtrado digital en general a la
cálculo de la TRANSFORMADA DE FOURIER, para resolución de ecuaciones en derivadas parciales o los
obtener una visualización del comportamiento de la señal en algoritmos de multiplicación rápida de grandes enteros.
el dominio de la frecuencia además de su visualización en el
dominio del tiempo
Al obtener toda la información lo siguiente es graficar la
información en el tiempo y la frecuencia.
I. INTRODUCCIÓN
Para analizar la señal es necesario conocer el rango de
El software utilizado para la realización de este proyecto es
frecuencia de cada una de las vocales.
simulink.
Simulink es un entorno de programación visual, que funciona

sobre el entorno de programación Matlab.
Es un entorno de programación de más alto nivel de

abstracción que el lenguaje interpretado Matlab (archivos con
extensión .m).
Ilustración 1 Interfaz de simulink

Ilustración 2 Frecuencia (en Hz) y desviación estándar del
Gracias a simulink se realizar la obtención del audio, su primer y del segundo formante en una muestra de 16
análisis, a continuación, se muestrea la señal y se utiliza la informantes masculinos.
transformada rápida de Fourier. -
La transformada de Fourier se utiliza para pasar una señal del

dominio del tiempo al dominio de frecuencia para así obtener
información que no es evidente en el dominio temporal.
Por ejemplo, nos permite saber sobre qué ancho de banda se

concentra la energía de una señal analizándola en el dominio
de la frecuencia. II. DESARROLLO
El procesamiento digital de señales de voz tiene una gran
En este caso se utiliza la transformada rápida de Fourier
variedad de aplicaciones, existe una base para el tratamiento
digital de señales, que puede ser implementada para lograr
obtener lo que nos interese según la aplicación.

El Sistema de Reconocimiento de Voz es una de las Ilustracion2. Espectro de frecuencia de la lera a
aplicaciones del procesamiento digital de señales de voz.
El sistema consiste en obtener una señal de voz que permita Para la letra e de igual manera utilizamos el mismo
reconocer qué palabra se esta hablando. Consta de una algoritmo.
interfaz gráfica que permite la interacción del usuario por
medio de un micrófono con la computadora, la que procesa
automáticamente los datos adquiridos.
Basado en los resultados de este sistema, se puede ver como

se plantea la base del procesamiento digital de señales de voz
y queda a la libre imaginación como puede ser utilizado para
otras aplicaciones, a demás del de reconocimiento de voz.
El identificador de voz a desarrollar esta orientado a

implementar un sistema de reconocimiento de voz basado en
parámetros LPC como medida de la señal de entrada, como
muestra la figura. 1, el proyecto total constaría de varias
etapas, por ello se muestra el diagrama de bloques
correspondiente:
Ilustracion3. Diagrama de bloques para la letra e
Figura 1 Diagrama de bloques de un Identificador de voz
A continuación, se detalla los diferentes diagramas de

bloques utilizados en simulink, para observar los espectros de
frecuencia de cada unA de las vocales.
Ilustracion4. Espectro de frecuencia de la lera e
Al obserbar el espectro de frecuencia de la letra i se pudo

determinar que fue en especro de mayor amplitud.
Ilustracion1. Diagrama de bloque para la letra a
Ilustracion5. Diagrama de bloques utilizadp para la letra i

Ilustracion6. Espectro de frecuencia de la letra i
Para la siguiente vocal utilizamos el mismo algoritmo, con el

diagrama de bloque. Ilustracion9. Diagrama de bloques de la letra u
Ilustracion10. Espectro de frecuencia de la letra u

Ilusracion7. Diagrama de bloques de la letra o
UNIÓN DE DOS VOCALES.
Ilustracion11. Diagrama de bloques de la letra a.e
Ilusracion8. Espectro de frecuencia de la letra o
La ultima vocal a ingresar fue la letra u, en esta letra se

obtuvo el minino espectro de frecuencia.
 Rodríguez Correa, J. D. Diseño de una Red Modular
Ilustracion12. Espectro de frecuencia de la letra a.e Auto-organizada con aplicación en reconocimiento
de fonemas(Bachelor's thesis, Facultad de Ciencias).
Ilustracion13. Señal en ytiempo real letra a.e
III. CONCLUSIONES
 Para generar palabras se debe ingresar la grabación
en diferentes momentos para formar una palabra.
 Al observar el espectro de frecuencia de cada una de
las vocales, se determinó que la frecuencia más alta
 es la letra i, consecuentemente la frecuencia más

baja es la letra u.
 Con este método no es posible generar palabras,
puesto que las frecuencias se mezclan.
IV. RECOMENDACIONES
 Para ingresar la grabación es necesario utilizar un
micrófono adecuado
 Las señales deben ser muestreadas para generar un
mejor espectro al momento d mezclar las vocales.
 No grabar la señal con n celular puesto que la señal
tiende a tener errores.
V. BIBLIOGRAFIA
 Argüello García, L. N. (2016). Análisis de la
modulación de voz ocasionada por el temblor vocal.
 Erazo, E. R. A. TRATAMIENTO DIGITAL DE LA
SEÑAL DE AUDIO UTILIZANDO EL DSP
SHARCK 21061.

Sadsdsad

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sadsdsad

Cargado por

Copyright:

Formatos disponibles

Jefferson Stalyn Núñez Quishpe, Roberto Carlos Vallejo Morales, Jonathan Wladimir Tercero Gualpa, Alex

Simulink es un entorno de programación visual, que funciona

Es un entorno de programación de más alto nivel de

Ilustración 1 Interfaz de simulink

La transformada de Fourier se utiliza para pasar una señal del

Por ejemplo, nos permite saber sobre qué ancho de banda se

Basado en los resultados de este sistema, se puede ver como

El identificador de voz a desarrollar esta orientado a

Ilustracion3. Diagrama de bloques para la letra e

Figura 1 Diagrama de bloques de un Identificador de voz

A continuación, se detalla los diferentes diagramas de

Ilustracion4. Espectro de frecuencia de la lera e

Al obserbar el espectro de frecuencia de la letra i se pudo

Ilustracion1. Diagrama de bloque para la letra a

Ilustracion5. Diagrama de bloques utilizadp para la letra i

Para la siguiente vocal utilizamos el mismo algoritmo, con el

Ilustracion10. Espectro de frecuencia de la letra u

Ilustracion11. Diagrama de bloques de la letra a.e

Ilusracion8. Espectro de frecuencia de la letra o

La ultima vocal a ingresar fue la letra u, en esta letra se

Ilustracion13. Señal en ytiempo real letra a.e

 es la letra i, consecuentemente la frecuencia más

También podría gustarte