Está en la página 1de 3

1

Práctica I: Procesamiento digital de señales


(El espectro de su voz)
Pablo Alfonso González Gómez
Facultad de Ingeniería Electrónica
Fundación Universitaria Juan de Castellanos
Tunja, Colombia
pagonzalez@jdc.edu.co


Resumen – En el presente documento vamos a realizar un B. Objetivos Específicos
análisis básico del comportamiento de diferentes señales de voz
con distintas características y ejecutaremos un algoritmo para la  Explorar algoritmos de procesamiento de voz que nos
obtención de la señal en el dominio del tiempo y la frecuencia permitan un correcto tratamiento de las diferentes
utilizando como herramienta principal MATLAB, esta será de señales.
gran ayuda por su eficiencia computacional y sus propiedades  Obtener una representación gráfica de las diferentes
para el manejo de la Transformada de Fourier la cual nos genera señales y sus características.
un vector con diferentes componentes de magnitud y de fase y así
generar una representación gráfica de los diferentes espectros.
III. MARCO TEORICO
Índice de Términos – Espectro, frecuencia de muestreo, FFT,
dominio, tiempo, representación gráfica.
A. Reconocimiento de voz

I. INTRODUCCION Micrófono: Los micrófonos son dispositivos transductores que


convierten las ondas sonoras en señales de audio, algunos

E ste informe de laboratorio explicara los aspectos teóricos


están diseñados para uso general en muchas situaciones
diferentes. Otros tienen funciones especificas y sólo son
realmente útiles para los fines previstos. Las características a
y prácticos para llevar a cabo el laboratorio de análisis del
procesamiento de señales de voz con diferentes características buscar incluyen propiedades direccionales, respuesta de
donde se aplicara un algoritmo matemático por medio de frecuencia e impedancia. [1]
herramientas computacionales y de esta manera desarrollar un
estudio comparativo de las diferentes muestras y en que se MATLAB: Es un lenguaje de alto nivel y de ambiente
altera al aplicarle frecuencias bajas y altas o simplemente en la interactivo que permite realizar tareas complejas y con una
contaminación de la señal; por ultimo se podrá generar una mayor velocidad que los lenguajes de programación
representación gráfica en el dominio del tiempo y su espectro comúnmente usados, ademas se especializa en cálculos
en frecuencia. numéricos con vectores y matrices, como casos particulares
Es importante tener en cuenta aspectos como lo es la puede trabajar también con otras estructuras de información.
frecuencia de muestreo a la que se grabara la señal y el tiempo Fue seleccionada como herramienta principal gracias a sus
que durara la misma para que su análisis sea óptimo. Otro aportes matemáticos para el procesamiento de señales. [2]
aspecto a tener en cuenta es la aplicación de la Transformada
de Fourier y sus propiedades como herramienta matemática
que esta nos brindara para el desarrollo de la práctica.

II. OBJETIVOS

A. Objetivo General
Analizar diferentes muestras de audio por medio de algoritmos
matemáticos basados en la FFT para observas su espectro.
Figure 1. Logo MATLAB
2

Fourier es de suma importancia en el análisis, diseño y


Señal de voz: La voz humana se produce por medio del realización de algoritmos y sistemas de procesamiento de
aparato fonatorio. Este esta formado por los pulmones como señales dado que brinda mayor eficiencia tanto en tiempo
fuente de energía, en forma de flujo de aire, la laringe que como en recursos.
contiene las cuerdas vocales, la faringe, las cavidades oral y La FFT hace uso de dos propiedades de la Transformada de
nasal y una serie de elementos articulatorios: los labios, los Fourier Discreta. La FFT asume que N es potencia de 2, sin
dientes, el alveolo, el paladar, el velo del paladar y la lengua. embargo, existen métodos para adaptar otros valores de N a
las condiciones necesarias de este algoritmo.[4]

Equation 1. Forma general de la FFT

es una N-ésima raíz de unidad.

Figure 2. Aparato Fonatorio Humano Ventaneo: Se usa para analizar los segmentos de voz
estacionarios, esto se hace mediante una multiplicación de la
señal por una variable ventana. Es importante el studio del
-Formantes: Son componentes distintivos del habla humana comportamiento de cada ventana ya que este nos va a generar
como los son vocales y sonidos sonantes. Se componen en la disminución de los efectos de las discontinuidades.
rangos de frecuencia y determinan propiedades acústicas como
el timbre.[3]

Table 1. Formantes Vocálicos

Figure 3. Ventana Hamming y Hann

IV. PRESENTACIÓN DE RESULTADOS Y ANÁLISIS

Lo que se va a llevar a cabo en la práctica es el análisis de tres


muestras de voz con diferentes características que serán
B. Procesamiento de señales tomadas por un algoritmo mediante MATLAB y
posteriormente serán procesadas para su representación y
Frecuencia de muestreo: Es la cantidad de muestras de audio estudio gráfico, debemos tener en cuenta que nuestra
que se toman por segundo pues cada onda de audio tiene una frecuencia de muestreo es de 8000 muestras por segundo y
altura la cual varia según el tiempo siendo esta diferencia de nuestra ventana de 5 segundos.
alturas la que genera el sonido.
A. Espectro de una sola voz
Transformada Rápida de Fourier (FFT): La FFT es un
algoritmo que permite calcular eficientemente la Transforma
de Fourier Discreta y su inversa. La Transformada Rápida de En la primera fase de la práctica se va a realizar el análisis de
3

la respuesta en el dominio del tiempo y la frecuencia de la


primera muestra de voz de 5 segundos para luego ser
comparada con las demás muestras.
Su representación gráfica se muestra en la figura 4.

Figure 6. Representación grafica de voz contaminada

V. CONCLUSIÓNES

 La FFT es un herramienta matemática muy


Figure 4. Representación gráfica una voz importante para el procesamiento digital de señales
y para el desarrollo de esta practica ya que
podemos cambiar el tamaño de la entrada del
número de muestras para que sea una potencia de 2
B. Espectro de dos voces
y así generar que el cálculo de la transformada sea
más rápido.
La segunda parte de la práctica se compone por la  Se pudo evidenciar como las diferentes
representación y estudio de la segunda muestra de 5 segundos características de cada muestra dan propiedades
que contendrá dos voces, una grave y la otra aguda; estas las especiales en la respuesta del espectro y como
podemos ver respectivamente en la gráfica de la señal en el afecta un ruido a la señal que lleva el mensaje.
tiempo en la figura 5.  Con la práctica se adquirió un mejor entendimiento
de aspectos teóricos importantes y los ajustes
pertinentes que se deben tener en cuenta al
momento de muestrear y graficar un espectro de
audio.

REFERENCIAS

[1] “¿Qué es un micrófono y cuál es su función? ® ¡Te sorprenderá! →


2019,” 2019, 2019. https://comofuncionahoy.com/cual-es-la-
funcion-y-que-es-un-microfono/ (accessed Apr. 08, 2020).
[2] “SISTEMA DE RECONOCIMIENTO DE VOZ EN MATLAB
Genoveva Velásquez Ramírez,” 2008.
[3] R. Sataloff, “La voz humana,” Investig. Cienc., no. 197, pp. 50–57,
Figure 5. Representación grafica dos voces 1993.
[4] A. L. Schmidt, “FFT: Transformada Rápida de Fourier,” pp. 1–3,
2013, [Online]. Available:
http://en.wikipedia.org/wiki/Fast_Fourier_transform#Algorithms,%
0Ahttp://lcr.uns.edu.ar/fvc/NotasDeAplicacion/FVC-Schmidt Ana
C. Espectro de voz contaminada con sonidos de alta Lucía.pdf.
frecuencia.

La última fase de la práctica se compone por una muestra de


voz contaminada por otro sonido de alta frecuencia que no sea
otra voz, para esto se requerirá un silbato, un silbido, una
alarma, una grabación con su teléfono, etc. La representación
gráfica de dicha muestra se presenta en la figura 6 y se puede
evidenciar como cambia el espectro de la señal con respecto a
la muestra uno dejando claro que el mensaje de las dos
muestras es exactamente el mismo.

También podría gustarte