Curso Transmisión y
Análisis FFT (Parte 1)
Pepe Ferrer
pepe@[Link]
FUNDAMENTOS
DE
AUDIO
CADENA DE TRANSMISIÓN
Source EQ X-over Power
-‐ La transmisión es el transporte de una forma de onda de un lugar a otro
-‐ La calidad de la transmisión se juzga por la precisión en la semejanza
con la forma de onda original
-‐ La calidad máxima de una cadena de transmisión viene determinada por
el elemento de menor calidad de la cadena.
-‐ La mayor degradación de la señal original se produce durante la
transmisión acús>ca.
DEFINICIÓN DEL SONIDO
-‐ El sonido consiste en una vibración mecánica que se propaga a través
de un medio elás>co y denso que es capaz de producir una sensación
audi>va
-‐ El desplazamiento de la parCcula fuera de su posición de equilibrio
provoca que las parCculas próximas se muevan de forma similar a como
lo hizo ella.
-‐ El movimiento transmite energía pero no masa.
-‐ La vibración puede describirse como un movimiento ondulatorio.
-‐ Las parCculas se mueven de manera oscilante respecto a su posición
de equilibrio.
DEFINICIÓN DEL SONIDO
-‐ El sonido en el aire produce compresiones y rarefacciones de forma
cíclica.
ONDA SINUSOIDAL
Vp
A
λ/T
-‐ Al número de ciclos por segundo se le denomina frecuencia (f) y se mide
en Herzios (Hz)
-‐ Al >empo necesario para que se repita una oscilación se llama periodo
(T). El periodo es la inversa de la frecuencia f = 1/T su unidad es el ms.
-‐ La longitud de onda (λ) se define como la distancia que avanza la onda
en un periodo. La longitud de onda depende del medio λ = Vp/f = VpT
su unidad es el metro (m)
VELOCIDAD ANGULAR
-‐ La velocidad o frecuencia angular se define como el ángulo de giro o
pulsación por unidad de >empo y equivale a 2π por la frecuencia. Su
unidad es el radian por segundo (rad/s)
ω = 2πf = 2π/T
LA FORMA DE ONDA
-‐ Las ondas a múl>ples frecuencias se combinan simultáneamente para
crear una señal nueva y única que es la suma de las señales
contribuyentes.
-‐ La fase de las frecuencias individuales afectará a la forma general, pero
las dis>ntas frecuencias mantendrán sus iden>dades separadas.
-‐ Cuando se combinan dos señales de la misma frecuencia la relación de
fase tendrá un efecto decisivo en la forma de onda combinada.
LA FORMA DE ONDA
VELOCIDAD DEL SONIDO
-‐ La Velocidad depende de las propiedades del medio y es independiente
del movimiento de la fuente de ondas.
-‐ En un medio como el aire la propagación es longitudinal y viene
expresada por: v = √B/ρ ; donde ρ es la densidad del medio y B el
modulo de compresibilidad
-‐ La velocidad depende de la temperatura, la humedad y la presión
atmosferica. v≃331+0.6T(ºc) (m/s)
PRESIÓN ACÚSTICA
-‐ La presión acús>ca se define como la relación entre la presión
atmosférica normal que ejerce sobre el receptor en condiciones de
reposo y la presión media en presencia de un sonido.
-‐ La presión de mide en Pascales (Pa), un pascal equivale a 10
microbares.
-‐ La relación de presión más tenue que podemos percibir es 20μPa
LEY INVERSA AL CUADRADO
-‐ La ley de la inversa cuadra>ca nos indica como varia el SPL a medida
que nos alejamos de la fuente emisora. Esta variación es de 6dB cada
vez que doblamos la distancia (fuente esférica)
-‐ Definimos la intensidad de una onda sonora como el valor medio de la
energía acús>ca que atraviesa un área unidad en una unidad de >empo
-‐ La Intensidad de una onda es igual a la potencia por unidad de área
(I=P/A)
-‐ Dado que el área de la superficie de una esfera es 4πR², el área sobre la
cual se ex>ende la onda aumenta como R² y por lo tanto la intensidad
disminuye como 1/R²
LEY INVERSA AL CUADRADO
-‐ Como por definición la intensidad es la energía que atraviesa un área
unidad en una unidad de >empo, la Energía por segundo o Potencia (P)
que pasa a través de la esfera de radio R₁ es el producto de la
intensidad a esta distancia y el área:
R₂ (P= A₁ I₁) = (I₁ 4πR₁²)
-‐ De modo Análogo, la potencia que pasa a través
R₁
de una esfera de R₂ es:
(P= A₂ I₂) = (I₂ 4πR₂²)
-‐ Por lo tanto la energía por segundo que pasa por la esfera 1 es igual a la
de la esfera 2:
(I₁ 4πR₁²) = (I₂ 4πR₂²) = I₂= I₁ ( R₁²/ R₂²)
-‐ También podemos definir la intensidad acús>ca como el cociente de la
presión al cuadrado y su impedancia acús>ca. I = p² / ρc
ABSORCIÓN ATMOSFÉRICA
-‐ El aire no es un medio de transmisión lineal, el aire actúa como un filtro
pasa-‐bajos
-‐ Este fenómeno provoca que los sonidos de alta frecuencia se atenúen
más rápidamente que los de baja frecuencia.
-‐ La can>dad de atenuación depende de la temperatura y la humedad
rela>va del medio.
-‐ Ejemplo: A una distancia de 30m la
atenuación para 10 kHz a un 20%
de humedad rela>va es aprox. 9dB,
por lo tanto, la atenuación de SPL
será:
20log(1/30) + 9 = 38.5 dB
REFLEXIÓN
-‐ Una onda es reflejada cuando se encuentra un obstáculo que no puede
traspasar ni rodear.
-‐ El ángulo de la onda reflejada es igual al de la onda incidente (Ley de
Snell)
n1 / n2 = sin ϴ2 /sin ϴ1
-‐ La onda estacionaria se produce por la suma de una onda y su onda
reflejada.
DIFRACCIÓN
-‐ La interferencia se produce cuando la longitud de onda es mayor que
las dimensiones del objeto:
-‐ Si el objeto es menor que la longitud de onda, la onda sonora >ende
a rodearlo.
-‐ Cuando una onda se encuentra con un agujero la onda lo atraviesa.
La can>dad de difracción dependerá de la longitud de onda y el
tamaño del agujero.
ZONA MODAL
-‐ Formula de Rayleigh:
-‐ f = Frecuencia propia
W -‐ c = Velocidad del sonido
-‐ L,W,H = dimensiones de la sala
L -‐ n = numero natural
CAMPO REVERBERANTE
-‐ La presión sonora en un punto cualquiera de un recinto se ob>ene a
par>r de la contribución de las presiones del sonido directo y del
sonido reflejado.
-‐ Campo directo: Es la zona donde predomina el sonido directo y en ella
el nivel de presión sonora (LD) disminuye 6dB cada vez que se dobla la
distancia.
-‐ Campo reverberante: Es la zona donde predomina el sonido reflejado.
A ella pertenecen los puntos más alejados de la fuente sonora. En esta
zona el nivel de presión sonora, nivel de campo reverberante (LR) se
man>ene constante.
-‐ La distancia para la cual LD = LR se denomina distancia cri>ca (DC)
CAMPO REVERBERANTE
-‐ Q = Factor de direc>vidad de la fuente sonora
-‐ R = Constante de la sala: Sᾱ/1-‐ᾱ
-‐ S = Superficie total de la sala
-‐ ᾱ = Coeficiente medio de absorción de la sala ᾱ=⨊αiSi/Stot
FASE
-‐ La ecuación de una onda de presión: p=posin(kx-‐ωt+φ), k=2π/λ
-‐ La ecuación de onda es una función de dos variables (Distancia y
Tiempo)
-‐ Estrictamente hablando la fase en la ecuación de onda nos indica en
que estado de vibración se encuentra la onda al inicio del movimiento.
-‐ Desde el punto de vista del análisis de un sistema visualizaremos la fase
como una diferencia de >empo o distancia entre las dis>ntas señales.
-‐ Podemos encontrar la fase de la señal a través del >empo o la distancia.
φ=ωt φ= kx
-‐ La fase nos indica en que momento de >empo se encuentra la señal.
-‐ Como la onda sonora es periódica, cada vez que la señal ha realizado
un ciclo nos encontramos en el mismo estado de perturbación que al
inicio del movimiento pero ha transcurrido un >empo.
FASE
90º
120º
+3dB
B 45º
0d
+5
150º
d
B
Bd
-6
(Π) 180º -∞dB +6dB 0º (2Π)
-6
d
B
210º
Bd
+5
0d
B
+3dB 315º
240º
270º
SUMA = √( (V²+V²)+2 * V*V *cosΦ)
FASE
FASE
FASE
FACTOR DE CRESTA
-‐ El cociente entre el valor pico y el valor promedio de una señal le
llamamos factor de cresta y se expresa en dB.
-‐ El Factor de cresta de una onda senosoidal es 3dB.
-‐ El Factor nos indicará la capacidad media de potencia en nuestros
amplificadores y por lo tanto >ene un valor decisivo en el cálculo del
consumo eléctrico.
peak
RMS
FACTOR DE CRESTA
-‐ EL valor eficaz (RMS) de una onda sinusoidal es: Ao / √2
-‐ Se define el valor eficaz de una corriente alterna como el valor de la
intensidad de corriente con>nua constante que produce el mismo
calentamiento por el efecto Joule en la resistencia que el producido por
la corriente alterna.
-‐ El valor eficaz (RMS) de una magnitud variable en el >empo se define
como la raíz cuadrada de la media de los cuadrados de los valores
instantáneos
Z=√ V1² + V2² + V3² .... Vn²
N
-‐ Podemos calcular el nivel de tensión en un momento dado aplicando la
ecuación:
Vt = Vo . Sin (2Πf)
FACTOR DE CRESTA
RMS: 1
RMS:0.5774
RMS:0.25
AUDIO DIGITAL
AUDIO DIGITAL
AUDIO DIGITAL
-‐ Los circuitos digitales se ven menos afectados por la distorsión y las
interferencia que los circuitos analógicos.
-‐ En un circuito analógico una vez la forma de onda se ve afectada por
algún >po de degradación esta no puede ser recuperada por la
amplificación
-‐ El circuito digital binario únicamente trabaja en dos estados (0,1) y esto
permite recuperar la señal en una linea de transmisión siempre que no
se sobrepase un umbral de degradación.
AUDIO DIGITAL
SAMPLING
-‐ Una señal de audio con ningún componente por encima de una
frecuencia máxima (fm) puede ser unívocamente determinada por
valores muestreados a intervalos uniformemente distribuidos de:
Ts ≤ 1/2fm (s)
-‐ Esta restricción fijada en términos de la frecuencia de muestreo se
conoce como el criterio de Nyquist
fs ≥ 2fm (Hz)
-‐ El criterio de Nyquist permite reconstruir una señal analógica
completamente desde un set de muestras discretas en el >empo
espaciadas uniformemente.
-‐ Una señal discreta es caracterizada por una secuencia de números
definidos para cada instante de T (Periodo de muestreo).
SAMPLING
CUANTIFICACIÓN
-‐ La cuan>ficación es el proceso que transforma un rango con>nuo de
amplitudes de una señal discreta en el >empo en un conjunto finito.
-‐ El funcionamiento del cuan>ficador depende de 2 parámetros:
-‐ Rango dinámico: Amplitud de la señal de entrada
-‐ Número de bits: Está directamente relacionado con el número de
intervalos en el cual se divide el rango dinámico del cuan>ficador
-‐ Intervalo de cuan>zación: Cada una de las divisiones del rango
dinámico del cuan>ficador.
-‐ Umbral de decisión: Frontera entre dos intervalos consecu>vos (di).
-‐ Valor de reconstrucción:Valor de salida que se asigna a cada entrada
dentro de un intervalo (qi).
-‐ En todo proceso de cuan>ficación existe una perdida de información
que no se puede recuperar
CUANTIFICACIÓN
Midtread Midrise
-‐ El eje horizontal representa la entrada de cuan>ficador (niveles de
decisión)
-‐ El eje ver>cal representa la salida, (valores de reconstrucción)
-‐ La longitud del intervalo se denomina intervalo de decisión (Δ)
qi=Q(x) ; si x ∈ (di,di+1)
CLASIFICACIÓN
-‐ Dependiendo del >po de divisiones realizadas por el cuan>ficador:
-‐ Uniforme: Los valores de los intervalos son constantes.
-‐ No uniforme: La separación entre intervalos no son constantes
-‐ Robusto: Compresión-‐> Cuan>ficación-‐> Expansión
-‐ Op>mo: Max-‐Lloyd algorithm
-‐ Dependiendo si el cuan>ficador varia con el >empo:
-‐ Adapta>vo: El cuan>ficador se adapta a las variaciones de la
señal
-‐ No adapta>vo: No adaptable a la señal
-‐ Dependiendo si la cuan>zación es individual o en bloques:
-‐ Escalar: Trabajan a nivel de frame
-‐ Vector: Usa vectores compuestos por un set de muestras
CUANTIFICADOR UNIFORME
-‐ En un cuan>ficador uniforme los intervalos de decisión están
igualmente espaciados y se ob>enen como:
-‐ Midrise: 2Emax/2ᵇ (Valores pares de reconstrucción)
-‐ Midtread: 2Emax/2ᵇ-‐1 (valores impares de reconstrucción)
-‐ Intervalo de decisión: Δ = di,di+1
-‐ El valor de reconstrucción óp>mo se ob>ene como qi=Δ/2
q1
q2
q3
q4
-‐ Aplicación: En los conver>dores A/D donde a priori no se conoce la
distribución estadís>ca de la señal de entrada.
ERROR DE CUANTIFICACIÓN
-‐ La distorsión causada por el cuan>ficador puede ser vista como un
ruido adi>vo.
-‐ Definimos el error de cuan>ficación como la diferencia entre la señal
de entrada y la cuan>ficada:
y=Q(x)=x+e
-‐ Dis>nguimos dos >pos de error de cuan>ficación:
-‐ Granular: Depende del rango dinámico de la señal
-‐ Overload: Relacionado con la sobrecarga de la señal.
ERROR DE CUANTIFICACIÓN
-‐ En términos de evaluación obje>va de la calidad del cuan>ficador:
-‐ MSEq (Mean Square Error):
-‐ Es una prác>ca común en audio tratar la señal de entrada (x) como una
variable aleatoria con una función de probabilidad uniforme fx(x)
-‐ Tanto el cuan>ficador Midtread como Midrise presentan simetría impar
respecto del eje ver>cal x=0
-‐ Esto implica que la media de la variable aleatoria es: E(x) = 0
-‐ Por lo tanto, podemos reducir el MSEq a la varianza de la señal.
ERROR DE CUANTIFICACIÓN
-‐ Demostración: Si asumimos que:
-‐ El error de sobrecarga es despreciable
-‐ El intervalo de cuan>ficación es mucho más pequeño que el rango
dinámico de la señal de entrada
-‐ La función de densidad de probabilidad es uniforme
fx(x)=1/Δ
-‐ definimos el error e como = x-‐Q(x)
-‐ La función de probabilidad de toda la señal
cuan>ficada será 1/NΔ ya que tenemos N
-‐Δ/2 Δ/2 intervalos de cuan>ficación:
ERROR DE CUANTIFICACIÓN
-‐ Signal to Noise Ra>o (SNR): Es un medida de calidad del cuan>ficador y
se mide como el cociente entre la varianza de la señal respecto del
error de cuan>ficación:
-‐ Como hemos comentado anteriormente el MSEq es igual a la varianza
del error de cuan>ficación MSEq = σ²q
-‐ Para conocer el SNR de un cuan>ficador uniforme necesitamos
determinar la varianza de la señal de entrada, que al asumir media 0, de
acuerdo a la teoría de probabilidad será:
-‐ Por lo tanto, el Mean Square Error to Signal Noise Ra>o es:
-‐ Sabemos que N=2ᵇ, por lo tanto cada vez que aumentamos un bit de
cuan>ficación el SNR mejora 6dB.
ERROR DE CUANTIFICACIÓN
-‐ Ejemplo: Calcular los intervalos de decisión de una señal de amplitud
máxima 5V cuan>ficada con un cuan>ficador midrise de 16 bits:
Δ= 2Emax/2¹⁶ = 10/65536 = 0.000152
-‐ Calcular el error de cuan>ficación:
MSEq= Δ²/12= 1.94x10⁻⁹
-‐ Calcular la varianza de la señal:
σ²x=(NΔ)²/12=8.33
-‐ Calcular el SNR:
SNRms=10log10(((NΔ)²/12)/(Δ²/12)) =96.33dB
ERROR DE CUANTIFICACIÓN
PULSE CODE MODULATION (PCM)
-‐ PCM es el sistema de codificación más frecuente a pesar de que es el
sistema de codificación que más recursos de bits u>liza.
-‐ Cada bit es codificado independientemente.
-‐ En PCM una señal analógica es primero muestreada. Los valores
muestreados son cuan>ficados y finalmente codificados creando una
secuencia de bits.
FILTROS DIGITALES
-‐ Definimos señal a cualquier fuente que nos aporta información y
sistema a cualquier elemento que modifica la señal.
-‐ Cualquier sistema lineal e invariante en el >empo queda unívocamente
determinado por su respuesta al impulso o su función de transferencia.
-‐ Tradicionalmente los filtros digitales se subdividen en dos categorías:
-‐ Aquellos cuya función de transferencia no >enen denominador,
(Finite Impulse Response (FIR)). La respuesta del filtro es una
combinación lineal de un número finito de muestras de entrada
(No-‐recursivos)
-‐ Aquellos cuya función de transferencia >enen denominador,
(Infinite Impulse Response (IIR)). La señal de salida es siempre
computada usando muestras previas de si mismo. La respuesta al
impulso de estos filtros es infinitamente larga.
-‐ La respuesta de fase de cualquier filtro puede ser formalizada a par>r
de dos conceptos matemá>cos: Phase delay & Group delay
FILTRO FIR
-‐ Un Filtro FIR no es más que una combinación lineal de un número finito
de samples de la señal de entrada.
-‐ El filtro FIR más simple es el “Averaging filter”
-‐ Si la respuesta de un filtro FIR es lineal, los delays (Phase & Group) son
idén>cos y coinciden con la pendiente de la respuesta de fase.
-‐ Los filtros FIR introducen latencia, y la can>dad de latencia depende
del orden y frecuencia de corte del filtro.
FILTRO FIR
-‐ Filtros FIR de 4º orden, atenuación 24dB/octava, a medida que
disminuye la frecuencia aumenta el retraso de grupo.
-‐ El retraso de un filtro FIR de fase lineal muestra retraso de grupo
constante.
FILTROS FIR
-‐ La respuesta de fase de un filtro FIR de fase lineal puede ser vista como
la respuesta de un retraso en la señal
FILTRO FIR
-‐ Diferentes filtros de alto orden, visualizados en modo lineal. El delay de
fase es constante para cada filtro, es decir, el >empo de retraso para
cada frecuencia es el mismo.
FILTRO FIR
-‐ Los filtros FIR son u>lizados ampliamente en la actualidad por los
fabricantes de altavoces, sobre todo en el rango de medio agudo,
donde la latencia es asumible.
-‐ Al mantener una respuesta de fase lineal, permite que la mayoría de las
frecuencias sean reproducidas en el mismo >empo.
FILTRO IIR
-‐ En general, un filtro causal IIR es representado por su ecuación
diferencia, donde la señal de salida en un determinado instante se
ob>ene como una combinación lineal de las muestras de la señal de
entrada y salida en previos instantes de >empo.
-‐ La respuesta al impulso de un filtro IIR >ene en general, duración
infinita.
-‐ Los filtros IIR comúnmente usados en los procesadores de audio, no
introducen latencia pero a cambio producen un retraso de grupo no
constante, dependiente de la frecuencia.
-‐ La can>dad de atenuación del filtro queda determinada por su >pología
y orden.
-‐ Los filtros digitales usados comúnmente en nuestros procesadores de
audio son digitalizaciones de proto>pos analógicos.
FILTRO BUTTERWORTH
-‐ El filtro Burerworth produce una atenuación en la frecuencia de corte
de 3dB y una atenuación de N*6dB/Octava, N=orden del filtro
-‐ El desplazamiento de fase en la frecuencia de corte es de: N*45 grados.
FILTRO LINKWITZ-RILEY
-‐ El filtro L-‐R produce una atenuación en la frecuencia de corte de 6dB y
una atenuación de N*6dB/Octava, N=orden del filtro
-‐ El desplazamiento de fase en la frecuencia de corte es de: N*45 grados.
FILTRO CHEBYSHEV I
-‐ Son filtros que únicamente >enen polos, presentan rizado en la banda
pasante y una caída monótona en la banda de rechazo.
-‐ La atenuación en la frecuencia de corte depende de la can>dad de
rizado. (orden impar: rizado nega>vo)
FILTRO CHEBYSHEV I
-‐ En los filtros Chebyshev I el número total de máximos y mínimos en la
banda de paso es igual al orden del filtro.
-‐ Los filtros de orden par >enen rizado posi>vo
FILTRO CHEBYSHEV II
-‐ A diferencia de los Chebyshev I presentan ceros y polos y su rizado es
constante en la banda de rechazo.
-‐ Orden impar: Pendiente con mínimo local.
FILTRO CHEBYSHEV II
-‐ Al igual que en los >po I el orden del filtro determina la can>dad de
máximos y mínimos en la banda de rechazo.
-‐ Orden par: Pendiente asintó>ca al valor del orden del filtro.
FILTRO ELÍPTICO (CAUER)
-‐ Los filtros de Cauer estrechan la zona de transición permi>endo un
rizado constante en en ambas bandas
-‐ Los filtros elíp>cos son los más eficientes al usar menor orden para una
anchura de banda de transición determinada
FILTRO ALL PASS (APF)
-‐ El filtro APF es un filtro IIR que permite modificar la respuesta de fase
de la señal sin modificar la respuesta en frecuencia.
-‐ los filtros APF más usados en audio son los de 1ºorden: desplazamiento
de 90º de fase y 2º orden: desplazamiento de 180º de fase
FILTRO ALL PASS (APF)
-‐ El filtro APF de 2º orden permite modificar su Q, proporcionando
control sobre el delay de fase de las frecuencias adyacentes a la
frecuencia de corte.
-‐ El filtro APF podría ser expresado como “un equalizador de delay”.
PHASE DELAY
-‐ El delay de fase nos muestra el >empo de delay en segundos de cada
componente sinusoidal que está presente en la señal bajo análisis.
-‐ El delay de fase se calcula como el cociente nega>vo entre la fase de la
frecuencia expresada en radianes y la frecuencia angular.
P(ω)= -‐φ(ω)/ω (s)
-‐ Ejemplo: calcular el delay de fase de un filtro Burerworth para 1kHz:
P(ω)= -‐φ(ω)/ω = -‐(-‐pi)/2pi 1kHz = 1/2000 = 0.5 ms
-‐ El delay de fase de un filtro FIR de fase lineal es constante
GROUP DELAY
-‐ El Group delay es una medición de la distorsión de fase, mide la
velocidad de cambio.
-‐ El Group delay se define como la derivada nega>va de la fase (radianes)
respecto de la frecuencia angular
D(ω)= -‐∂φ(ω)/∂ω
-‐ En una señal discreta la derivada se computa como la diferencia entre
muestras consecu>vas.
-‐ Para un filtro FIR de fase lineal el Group delay y la Phase delay son
idén>cos y >enen valor constante.
-‐ La distorsión de delay puede ser compensada aplicando una
ecualización de delay, es decir, añadir retraso a las otras frecuencias
para conseguir un retraso de grupo constante.
-‐ La ecualización de delay se usa Cpicamente con un filtro APF en
cascada al filtro que quiere ser ecualizado.
GROUP DELAY: BUTTERWORTH
GROUP DELAY: LINKWITZ-RILEY
GROUP DELAY: CHEBYSHEV I
COMPARATIVA GROUP DELAY
REFERENCIAS
-‐ Signal Processing First (Mcclellan Schafer Yoder)
-‐ Introducción to sound Processing ( Davide Rochesso)
-‐ Image & video compression for mul>media Engineering (Yun Q-‐Shi,
Huifang Sun)
-‐ Quan>za>on (Julio Carabias, UPF University)
-‐ Basic Sound Theory and room acous>cs (Enric Giné & Nadine Kroher,
UPF University)
-‐ Op>mal design of digital equivalents to analog filters (Grigore I.
Braileanu, Gonzaga University)
-‐ Spectral Audio Signal Processing (Julius O. Smith III, CCRMA)