Está en la página 1de 3

Laboratorio 3: Detección de tono mediante Correlación

Edwin Steven Guevara Valencia — Código N.o 20142005141*


Sebastian Rincon Tenjica — Código N.o 20151005127**
Andrés Felipe Gutiérrez Ortíz — Código N.o 20132005119***
7 de Octubre de 2019

Resumen
Una característica de los sonidos es el tono, el cual está relacionado con la frecuencia. En este reporte se
muestra el uso de la auto correlación desde el punto de vista geométrico para hallar el tono correspondiente
en pequeñas ventanas de una grabación. La correlación obtiene información sobre las señales en base a
promedios temporales y su transformada de Fourier permite obtener funciones de Densidad Espectral de
Energía o Potencia, dependiendo de las características de las señales y sistemas bajo estudio. El objetivo de
esta práctica es facilitar la comprensión de la correlación vista como medida de relación o parecido entre
señales..
Palabras clave: Correlación, Fourier, producto punto, tono, señal periódica.

* Estudiante del programa ingeniería electrónica de la universidad distrital Francisco José de Caldas. Correo Electrónico: esgueva-

rav@correo.udistrital.edu.co.
** Estudiante del programa ingeniería electrónica de la universidad distrital Francisco José de Caldas. Correo Electrónico: serin-

cont@correo.udistrital.edu.co.
*** Estudiante de ingeniería electrónica programa de la facultad de ingeniería de la Distrital Francisco José de Caldas. Correo Electrónico:

afgutierrezo@correo.udistrital.edu.co

1
1. Introducción Si ρ = 0, el ángulo α = 90◦ , ambos vectores son orto-
gonales.
La correlación entre dos señales es medir el grado de se-
mejanza entre ambas señales y, por tanto, extraer alguna Si ρ = −1, el ángulo α = 180◦ , ambos vectores son
información que dependa de forma importante de su aplica- colineales en dirección opuesta.
ción.[1] Por otro lado la correlación vista desde la geometría
se traduce algebraicamente en el producto punto de dos se-
ñales representadas como vectores, la cual es quizás la más 3. Resultados
poderosa interpretación del producto punto en los espacios
vectoriales de señales[2]. Observamos en el laboratorio an- Después de filtradas las grabaciones limitando su ancho de
terior que los sonidos vocalizados tienen picos adyacentes banda al rango de frecuencias ”fundamentales”para los so-
a una distancia considerablemente similar lo cual nos lleva nidos vocales, el resultado de dicho proceso se puede ver en
a cuestionar si es posible ver la periodicidad existente en la figura 1.
dichos sonidos. El principal objetivo de esta práctica es to-
mar una señal de voz, detectar la periodicidad en pequeños
segmentos vocalizados solapados y determinar el tono co-
rrespondiente a estos segmentos. Para la realización de este
reporte se utilizaran los segmentos de los sonidos vocaliza-
dos obtenidos en la práctica de laboratorio 2 para reducir
el tiempo en las pruebas y para facilidad nuestra.

2. Formulación del problema


y propuesta de solución
Para esta practica se tiene un fragmento grabación de voz
de una canción del artista John Frusciante y una grabación
base conocida como vozfemenina.wav. la cual se ha venido Figura 1: Grabación filtrada
usando en las practicas.
Una Una vez realizada la extracción de los sonidos vocaliza- Al hallar los picos de la auto correlación y convertir nu-
dos para cada grabación, la señal es filtrada para eliminar mero de muestras a una frecuencia se obtuvo el tono para
las componentes espectrales que se encuentren fuera del ran- cada ventana analizada. Los valores obtenidos se muestran
go de frecuencias de sonidos vocalizados (aproximadamente todos en la figura 2, donde además de la clasificación, en al-
entre 100Hz -400 Hz). El proceso de filtrar la señal se realiza gunos casos hay picos errados que pueden ser debido a que
con un filtro digital de Respuesta al Impulso Finita (FIR). el tono esta por encima o debajo de la octava de trabajo y/o
Finalmente se aplica la auto correlación a cada grabación un manejo inadecuado de los cruces por cero.
con el fin de determinar el periodo para cada instante y con
ello los tonos de la señal durante la grabación.
la correlación entre dos señales se define de la siguiente ma-
nera. Dados los valores muestréales de dos variables aleato-
rias X (x1 , ..., xn ) e Y (y1 , ..., yn ) que pueden ser considera-
das como vectores en un espacio de n dimensiones, pueden
construirse los ”vectores centrados” como:

X (x1 − x̄, ..., xn − x̄) e X (y1 − ȳ, ..., yn − ȳ)


El coseno del ángulo alfa formado entre estos dos vectores
es dado por la siguiente fórmula:
∑N
i=1 (x1 −x̄)(y1 −ȳ)
ρ = cos (α) = √∑N 2 ∑N
i=1 (x1 −x̄). i=1 (y1 −ȳ)2

Pues ρ es el coeficiente de correlación, siendo este el co-


seno del ángulo entre los dos vectores centrados:

Figura 2: Clasificación de tonos de la grabación del artista John Frus-


◦ ciante
Si ρ = 1, el ángulo α = 0 , ambos vectores son para-
lelos.

2
4. Discusión
Un factor importante en la clasificación de los tonos del
fragmento de la canción de John Frusciante es que tiene un
efecto de repetición ligero, dando pie a posibles confusiones
por parte del algoritmo para identificar el tono.
Si el ruido en el ambiente es comparable con la intensidad
de la voz en la grabación, el filtro hace un buen trabajo
reduciéndolo pero al momento de hacer la auto correlación
con la señal sin filtrar, la clasificación se puede ver algo
afectada.

5. Conclusiones
Las señales aleatorias como en este caso las de voz, en las
cuales no se tiene un periodo definido, se puede realizar
una aproximación a una pseudo-periodicidad observando los
puntos que contienen magnitud (picos) y se encuentran se-
parados una distancia en promedio similar, de esta manera
generando ciertos patrones que facilitan el estudio de las
señales. Se pueden generar errores en la identificación de
los periodos al encontrarse señales con magnitud muy pa-
recida que se encuentran cercanas al punto muestreado, de
aquí la importancia de implementar las ventanas de mues-
treo adecuadas, disminuyendo en gran medida el error en la
identificación de los tonos
Se observa de igual manera que todas las señales de voz
poseen diferentes niveles de energía, lo cual requiere de di-
ferentes filtros, dificultando así la generalización en la im-
plementación de estos.

Referencias bibliográficas
[1] A. V. Oppenheim and A. S. Willsky, Señales y sistemas.
Englewood Cliffs, NJ: Prentice Hall, 1975.

También podría gustarte