Está en la página 1de 5

Desafío del espectrograma

Álvaro Villagra Rolleri 2020437424

¿Qué es el espectrograma?
El espectrograma es una herramienta de análisis de señales en donde se calcula la transformada de Fourier
en cada instante de tiempo. De esta forma se puede observar de forma gráfica (como se representa
generalmente) o interpretar de forma numérica que frecuencias componen a una señal para cada instante
de tiempo. Esta herramienta es útil para analizar señales cuyas frecuencias no son constantes en el tiempo.

¿Cómo se generó el archivo de audio?


Entendiendo el espectrograma se puede dar una solución a como generar un texto o codificar imágenes en él.

La base es entender que una señal de frecuencia constante reproducida por un tiempo acotado se observa
como una línea horizontal en el espectrograma. Siempre y cuando el espectrograma represente las frecuencias
en el eje de las ordenadas y el tiempo en el eje de las abscisas. Es decir que, si se logra generar señales de
frecuencias dadas durante tiempos definidos, entonces se puede controlar que aparecerá en el espectrograma
de la señal.

Un instrumento físico que permite generar señales de frecuencias definidas por tiempos arbitrarios es el piano.

En primer lugar se estableció un rango de frecuencias en el cual trabajar, y se determinó de forma experimental
que teclas del piano generaban notas en ese rango. En este caso se determinó que se trabajaría en el rango
de 250 a 550 [Hz] y que las notas comprendidas entre C3 y B3 generaban notas en ese rango. Es importante
notar que las notas de un piano no son frecuencias limpias y puras, si no que cada tecla genera una frecuencia
fundamental y sus armónicos, sin embargo, al definir un rango definido y notas consecutivas entonces en el
espectrograma se observarán únicamente las frecuencias fundamentales.

En segundo lugar, para grabar se le quitaron todos los efectos de reverberación y notas sostenidas que el
piano digital utilizado trae por defecto. Esto porque dificultaba obtener un espectrograma limpio y con notas
definidas. También fue necesario un lugar silencioso donde grabar el audio.

En tercer y último lugar, se determinó que secuencia de notas debían tocarse para generar cada palabra del
texto. Para ilustrar esto se muestra una imagen representativa de como hacer la letra "P" en la figura 1 y 2.

1
Figura 1: Teclas del piano en el espectrograma.

Figura 2: Teclas presionadas en el tiempo.

Espectrograma del archivo de audio generado


Para esta parte se importa el archivo de audio textocompleto.wav utilizando el comando audioread() y se le
realiza el espectrograma por partes (es muy largo para un solo gráfico).

[y,fs]=audioread('textocompleto.wav');

2
figure(); spectrogram(y(1:51*fs,1),hann(2048),[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 3: "Procesamiento" 0 < t < 51 [s].')

figure(); spectrogram(y(53*fs:91*fs,1),1300,[],[],fs,'yaxis'); ylim([0 0.75])


title('Figura 4: "Digital de" 53 < t < 91 [s].')

3
figure(); spectrogram(y(94*fs:120*fs,1),1300,[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 5: "Señales" 94 < t < 120 [s].')

4
figure(); spectrogram(y(125*fs:145*fs,1),1300,[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 6: Figuras extra 125 < t < 145 [s].')

Notar que el espectrograma está limitado a la banda de frecuencia entre 0 y 750 [Hz], esto porque se consideró
que estas frecuencias abodaban principalmente las notas utilizadas del piano.

Espectrograma en software Audacity


Si bien se utilizaron las mismas configuraciones para la visualización del esprectrograma en el software
Audacity que para realizar el espectrograma en Matlab, el resultado de Audacity es más claro. Esto puede
deberse a los colores del mapeo de magnitudes que el software tiene integrado. Por esto, se adjuntan también
imágenes del espectrograma del archivo de audio realizado en Audacity.

Figura 7: Espectrograma de textocompleto.wav en Audacity.

También podría gustarte