Documentos de Académico
Documentos de Profesional
Documentos de Cultura
¿Qué es el espectrograma?
El espectrograma es una herramienta de análisis de señales en donde se calcula la transformada de Fourier
en cada instante de tiempo. De esta forma se puede observar de forma gráfica (como se representa
generalmente) o interpretar de forma numérica que frecuencias componen a una señal para cada instante
de tiempo. Esta herramienta es útil para analizar señales cuyas frecuencias no son constantes en el tiempo.
La base es entender que una señal de frecuencia constante reproducida por un tiempo acotado se observa
como una línea horizontal en el espectrograma. Siempre y cuando el espectrograma represente las frecuencias
en el eje de las ordenadas y el tiempo en el eje de las abscisas. Es decir que, si se logra generar señales de
frecuencias dadas durante tiempos definidos, entonces se puede controlar que aparecerá en el espectrograma
de la señal.
Un instrumento físico que permite generar señales de frecuencias definidas por tiempos arbitrarios es el piano.
En primer lugar se estableció un rango de frecuencias en el cual trabajar, y se determinó de forma experimental
que teclas del piano generaban notas en ese rango. En este caso se determinó que se trabajaría en el rango
de 250 a 550 [Hz] y que las notas comprendidas entre C3 y B3 generaban notas en ese rango. Es importante
notar que las notas de un piano no son frecuencias limpias y puras, si no que cada tecla genera una frecuencia
fundamental y sus armónicos, sin embargo, al definir un rango definido y notas consecutivas entonces en el
espectrograma se observarán únicamente las frecuencias fundamentales.
En segundo lugar, para grabar se le quitaron todos los efectos de reverberación y notas sostenidas que el
piano digital utilizado trae por defecto. Esto porque dificultaba obtener un espectrograma limpio y con notas
definidas. También fue necesario un lugar silencioso donde grabar el audio.
En tercer y último lugar, se determinó que secuencia de notas debían tocarse para generar cada palabra del
texto. Para ilustrar esto se muestra una imagen representativa de como hacer la letra "P" en la figura 1 y 2.
1
Figura 1: Teclas del piano en el espectrograma.
[y,fs]=audioread('textocompleto.wav');
2
figure(); spectrogram(y(1:51*fs,1),hann(2048),[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 3: "Procesamiento" 0 < t < 51 [s].')
3
figure(); spectrogram(y(94*fs:120*fs,1),1300,[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 5: "Señales" 94 < t < 120 [s].')
4
figure(); spectrogram(y(125*fs:145*fs,1),1300,[],[],fs,'yaxis'); ylim([0 0.75])
title('Figura 6: Figuras extra 125 < t < 145 [s].')
Notar que el espectrograma está limitado a la banda de frecuencia entre 0 y 750 [Hz], esto porque se consideró
que estas frecuencias abodaban principalmente las notas utilizadas del piano.