Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autores:
Rafael Daboin
Arturo Briceño
Alexandra Meier
Ender Peña
Ricardo Bermudez
Miguel Baptista
Profesor:
Claudio Condor
Asignatura:
Señales y Sistemas
General
Específicos
Cabe destacar que todo esto fue posible, gracias a la utilización del entorno
informático MatLab, que es una abreviatura de la frase Matrix Laboratory. Se
puede considerar, por otro lado, que es una calculadora totalmente equipada
aunque, en realidad, es mucho más versátil que cualquier calculadora para hacer
cálculos matemáticos. Se trata de una plataforma para el desarrollo de
aplicaciones y para la resolución de problemas en múltiples áreas de aplicación.
III.- Marco Teórico
Los formantes permiten distinguir los sonidos del habla humana, sobre todo
las vocales y otros sonidos. También sirven para los sistemas de reconocimiento
de voz y las transposiciones de altura del audio digital. Cada sonido del habla
humana tiene una marca característica de formantes, es decir, hace un reparto
diferente de la energía sonora entre los diferentes formantes, lo cual permite
clasificarlos o categorizarlos [2].
Una vez obtenido el promedio, el programa principal tiene una sección para
grabar un archivo de audio con las especificaciones antes pautadas, este archivo
es recibido del usuario y debe contener una vocal para su análisis, se calcula el
formante y su FFT, luego de esto es normalizada para acotar los datos y se
compara con el espectro de amplitud de la base de datos para conseguir el primer
vector de errores, este vector es enviado a una función conocida como
“que_vocal” donde se van a determinar 2 vectores de errores más, usando
distintos métodos para saber con mayor precisión cuál fue la vocal que se dijo en
la grabación emitida por el usuario.
Por último el error “dif” calcula el error absoluto entre los formantes
almacenados en la base de datos con los calculados de la prueba del usuario,
finalmente se normalizan los errores para poder posteriormente sumarlos y
promediarlos, esto nos da un match más preciso, así pues, el formante (posición
del vector) que tenga un error menor será la vocal que se dijo por medio de la
grabación del usuario.
Interfaz gráfica
Para elaborar nuestro programa se utilizó una herramienta de Matlab llamada GUI
(Interfaz Gráfica de Usuario). Donde esta GUI debía ser consistente y fácilmente
entendida por el usuario final, ya que al crearla así esto proporcionaba al usuario
con la habilidad de usar un programa sin tener que preocuparse sobre los
comandos para ejecutar un programa en Matlab. Lo componentes habituales de
estas GUI son, los pushbuttons, sliders, list boxes, menús, axes,..etc.
Y en nuestro caso se usaron los pushbuttons, labels, axes, para así poder diseñar
la interfaz lo más entendible posible para su uso. Para poder crear dichos
compontes en conjunto, se utilizó la utilidad de Matlab para el desarrollo interactivo
de interfaces de usuario llamado GUIDE. Para ello se procedió a escribir el
comando guide, donde nos aparece una ventana para seleccionar plantillas o abrir
GUIs existentes
Figura 2: Ventana de inicio del GUI de Matlab
Donde nuestra interfaz consta con tres botones, dos axes y un apartado, resultado
de la vocal. Y se definió sus funciones quedando de la forma:
1. https://mariajesusmusica.files.wordpress.com/2008/09/apuntes-sonido.pdf
2. http://musiki.org.ar/Formantes
3. https://es.wikipedia.org/wiki/Transformada_de_Fourier_discreta
4. https://es.wikipedia.org/wiki/Transformada_r%C3%A1pida_de_Fourier
5. https://en.wikipedia.org/wiki/Linear_predictive_coding
6. https://es.wikipedia.org/wiki/Formante
7. https://www.mathworks.com/help/signal/ug/formant-estimation-with-lpc-
coefficients.html
8. https://www.mathworks.com/help/matlab/ref/audioread.html