Capitulo 2

Universidad de Chile
Facultad de Ciencias Físicas y Matemáticas.

Departamento Ingeniería Eléctrica. Capítulo 2.
Procesamiento Digital de
Señales.
2.0 Repaso: Transformada de Fourier

2.1 Muesteo de la Señal.
2.2 Análisis de Señales Discretas.
2.3 Filtros Digitales
2.4 DTF y FFT
2.5 Ventana de Hamming
2.6 LCP
2.7 Cuantización Vectorial.
EM756 Procesamiento de la Voz Profesor: Néstor Becerra
Yoma
Repaso: Transformada de Fourier
• Significado matemático:
Representación de una señal dad en términos de una suma infinita
de exponenciales complejas ponderadas cada una por F(w)df
• Significado en aplicaciones: Completar
Repaso: Transformada de Fourier
∞
jnwo t
fT (t ) = F
∑ n e
n = −∞
1 − jnwo t
Fn = ∫f T (t )e dt
T
2π
wo =
T
2.1. Muestreo de la señal.
{ Consideremos una señal s(t), donde t
es el tiempo.
s (t ) ↔ S (W )
-W0 W0
Yoma
2.1 Muestreo de la señal
Yoma
2.1. Muestreo de la señal
{ Supongamos que la señal s(t) es

muestreada a intervalos regulares T
(fn=1/T, fn es la frecuencia de
muestreo). El espectro de la señal
muestreada es representado por:
-2Πfm -W0 W0 2Πfm

Yoma
2.1 Muestreo de la señal
{ Para que no haya sobre posición,
2πf m > 2W0 = 2 * 2πf 0

fm > 2 f0
Es la máxima frecuencia de la señal a

f0 muestrear.
Yoma
2.2 Análisis de Señales Discretas
{ Una señal muestreada podría ser
representada por S(nT), donde n es un
número entero y T es el período de
muestreo.
{ En realidad las señales muestreadas se
pueden representar como secuencias de
números enteros (digitalizadas) .
{ Indexadas por números enteros se
representan:
s(0), s(1), s(2), s(3),.......
Yoma
2.2 Análisis de Señales Discretas
{ Todos los tipos de procesamiento en
electrónica analógica se pueden
implementar en el dominio discreto.
Ejemplos: Amplificadores, filtros,
multiplicadores, etc.
{ Otras funciones más complejas se pueden

realizar mediante operaciones aritméticas
en programas de computadores.
Yoma
{ Dos tipos: FIR,IIR
FIR (Finite Impulse Response):
•La salida es función únicamente de la entrada .
•El polinomio que describe este filtro:
Y ( n ) = a0 x ( n ) + a1 x ( n − 1) + a2 x ( n − 2) + ......... + ak x ( n − k )
•Un filtro FIR también se puede definir por:

A = [a0 a1 a2 ak ] y k
¿Porqué Respuesta Impulsiva Finita?
Yoma
IIR (Infinite Impulse Response):
•La salida en n depende de la entrada y de la salida hasta n-1.
•El polinomio que describe este filtro:
Y ( n ) = a0 x ( n) + a1 x ( n − 1) + a2 x ( n − 2) + ......... + ak x ( n − k )
+ b1 y ( n − 1) + b2 y ( n − 2) + ........ + bL y ( n − L )
•Un filtro IIR también se puede definir por:

A = [a0 a1 a2 ak ] y k
¿Porqué Respuesta Impulsiva Infinita?

¿Estabilidad?
Yoma
Anexo: Transformada Z
Se emplea para analizar sistemas discretos.
(De forma similar como opera Laplace para sistemas
continuos).
∞
−n
X ( z) = ∑ x ( n )z
n = −∞
Mediante la propiedades de la transformada Z se

puede concluir:
x ( n) ↔ X ( z )
x(n − k ) ↔ X ( z ) z − k
Yoma
Anexo: Transformada Z
Ejemplo:
Considere el filtro FIR
Z{y(n)}= Z{a0 x(n) + a1x(n −1) + a2 x(n − 2) +.....+ ak x(n − k)}

Z{y(n)} = Z{a0 x(n)}+ Z{a1x(n −1)}+ Z{a2 x(n − 2)}+ .....+ Z{ak x(n − k )}
Z{y(n)} = a0Z{x(n)}+ a1Z{x(n −1)}+ a2 Z{x(n − 2)}+ .....+ ak Z{x(n − k )}
Y ( z) = a0 X ( z) + a1 X ( z) z −1 + a2 X ( z) z −2 + .....+ ak X ( z) z −k
Y ( z)
= a0 + a1z −1 + a2 z −2 + .....+ ak z −k
X ( z)
Yoma
Anexo: Respuesta en Frecuencia
{ La respuesta en frecuencia de un sistema
discreto se puede estimar reemplazando Z por:
z = l + jw = cos(w) + jsen( w)
Ejemplo: Sea H ( z ) = 1 + az −1
+ jw
H ( e + jw ) = 1 + ae = 1 + a [cos( w ) − jsen ( w ) ]
H ( e + jw ) = 1 + a ⋅ cos( w ) − j ⋅ a ⋅ sen ( w )
H ( e + jw ) = 1 + 2 a cos( w ) + a 2
+ jw ⎛ − asen ( w ) ⎞
∠ H (e ) = arctan ⎜⎜ ⎟⎟
⎝ 1 + a cos( w ) ⎠
Yoma
2.4 DFT y FFT
2.4.1 DFT (Discrete Fourier Transform)
Una secuencia de N muestras de valor complejo
en el dominio de la frecuencia dado por:
N −1
kn
X (k ) = ∑ x ( n )W N 0 ≤ k ≤ N −1
n=0
Donde: 2π
−j
N
WN = e
Yoma
2.4 DFT y FFT
2.4.1 DFT (Discrete Fourier Transform)
La trasformada inversa se define como:
N −1
1 − kn
x(n) = ∑ X ( k )W N 0 ≤ n ≤ N −1
N k =0
Donde: 2π
−j
N
WN = e
• X(K) es una función periódica con periodo N.
• La propiedades de la DFT son similares a las
propiedades de la transformada de Fourier análoga.
Yoma
2.4 DFT y FFT
2.4.2 FFT(Fast Fourier Transform)
{ La DTF requiere N2 multiplicadores.
{ Empleo de simetría.
{ Algoritmo mas eficiente de cálculo.
{ Calcula N componentes de frecuencia a

partir de N muestras de tiempo para
N=2r, con r cualquier entero postivo.
Yoma
•Para reducir el efecto de discontinuidad

al mínimo debemos emplear tipos de
ventana que tiendan a reducir a 0 los
valores de las muestras en los extremos.
•Aunque existe un buen número de tipos

de ventana, la más común en el análisis
de la voz es la que se conoce como
ventana de Hamming.
Yoma
⎧ ⎡ 2πn ⎤
⎪0.54 − 0.46 * cos ⎢ 0≤n< N
JH ( n) = ⎨ ⎣ N − 1⎥⎦
⎪⎩ 0 n < 0" N ≤ n
Se recomienda que la ventana sea de 10 a 30 ms, pues

en este periodo la señal de voz puede considerarse
estacionaria o quasi-estacionaria.
Yoma
Forma genérica de la ventana de Hamming
Yoma
2.6 LPC (Linear Predictive Coding)
{ En 1927 se propuso que una serie
temporal de muestras correlacionadas
podría ser generada a partir de una serie
de muestras estadísticamente
independientes (ruido blanco) procesadas
a través de un filtro lineal.
{ Existen métodos distintos de
modelamiento que están basados en
procesos estocásticos y/o procesos
AR(autoregresivos).
Yoma
Modelo Auto Regresivo.
{ Es un proceso estocástico genérico.
{ La idea principal se basa en que la voz
puede modelarse a través de una
combinación lineal de p muestras
anteriores más una señal de excitación o
ruido blanco.
p
x[n] = ∑ ak x[n − k ] + e[n]
k =1
Donde x(n) Coeficientes de la señal
ai Habitualmente son LPC
e[n] Ruido blanco
Yoma
Aplicando transformada Z, a la formula anterior,
también conocida como error de predicción.
p
x[n] = ∑ ak x[n − k ] + e[n]
k =1
X (z) = H I (z)E (z)

1 Considerando:
HI = p
ao = 1
−k
∑a z k
ak = −α k
k =0
1≤ k ≤ p
HI(z) corresponde a un filtro IIR
Yoma
El teorema de Wold dice que “cualquier proceso

estocástico discreto en el tiempo y estacionario
puede descomponerse como la suma de un
proceso autoregresivo genérico y un proceso
predictivo, ambos no correlacionados”.
y (n ) = x(n ) + s(n )
y (n) Proceso estocástico discreto
x(n) Proceso no correlacionado.
s(n) Proceso predictivo.
Yoma
Un proceso regular genérico esta representado:
p
x[n] = ∑ bk e[n − k ]
k =0
X ( z) = H F ( z)E( z)
FIR
e[n] p
x[n]
H F ( z ) = ∑ ak z k
k =1
Hf corresponde a un filtro FIR de fase mínima y puede ser

reemplazado por un filtro IIR como el HI esta fórmula
también se conoce como el predictor de orden p.
Yoma
Un análisis de LPC puede ser vista como un modelamiento
AR de una señal de voz en intervalos de tiempo de la señal
son considerados estacionarios. La señal multiplicada por
una ventana de tiempo centrada en 1 esta dada por:
x(n,1) = v(n) w(i − 1)

Simplificando la notación:
x(n) = v(n) w(n)
Yoma
Para determinar los coeficientes del LCP se trabaja a
partir de la ecuaciones de Yule-Walker.(Basadas
error cuadrático medio)
p 2
∞ ∞
2 ⎡ ⎤
E = ∑ e ( n) = ∑ ⎢ x ( n) − ∑ α k x ( n − k ) ⎥
n = −∞ n = −∞ ⎣ k =1 ⎦
∂E
=0 k = 1,2,3,......., p
∂α k
Yoma
Luego se tiene p ecuaciones lineales:
∞ p ∞
k
∑ x(n − i)x(n) = ∑ α ∑ x(n − i) x(n − k )
n = −∞ k =1 i = −∞
i = 1,2,3,......, p
Definimos: N −1
R (i ) = ∑ x ( n ) x ( n − i )
n =i
i = 1,2,3,......, p
Reemplazando:
p
R(i − k ) = R(i ) (**)
∑α k
k =1
i = 1,2,3,......, p
Yoma
De las ecuaciones anteriores tenemos que, la
energía residual mínima o el error de predicción
mínima Ep para un modelo de p polos:
p
E p = R (0 ) − ∑ α k R (k )
k =1
La ecuación (**) en forma matricial:
⎡ R(0) R (1) R (2) ... R( p − 1) ⎤ ⎡ α1 ⎤ ⎡ R(1) ⎤

⎢ R(1) ⎢ ⎥
⎢ R (0) R (1) ... R ( p − 2)⎥⎥ ⎢α 2 ⎥ ⎢⎢ R (2) ⎥⎥
⎢ : : : ... : ⎥⎢ : ⎥ = ⎢ : ⎥
⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢ : : : ... : :
⎥⎢ ⎥ ⎢ : ⎥
⎢⎣ R ( p − 1) R ( p − 2) R ( p − 3) ... R (0) ⎥⎦ ⎢⎣α p ⎥⎦ ⎢⎣ R ( p )⎥⎦
Yoma
El sistema escrito en forma matricial se define:
R * A = r
Donde R matriz de p X p. Invirtiendo la matriz R se
puede obtener el vector A de coeficientes del LPC.
Sin embargo existe un método más eficiente, que
consiste en aprovechar las simetrías de la matriz.
Yoma
Método de Levinson-Durbin
m −1
R(m) − ∑ α km −1 R(m − k )
k =1
km =
Em −1
m
α m = km
α km = α km −1 − k mα mm−−k1
1 ≤ k ≤ m −1
Yoma
Método de Levinson-Durbin
( )
E m = 1 − k m2 ⋅ E m − 1
Donde inicialmente: E 0 = R (0)

α0 = 0
Donde α km indicando el coeficiente LCP en la m-ésima

iteración.
Yoma
2.7 Cuantización Vectorial
{ La “cuantización vectorial” es un
proceso de aproximación por el cual una
señal cuya amplitud presenta valores
continuos es representada por una nueva
señal cuya amplitud se puede asumir con
valores discretos.
{ La cuantización es una herramienta muy
útil para codificación pues el número de
bits a representar es una variable que
puede ser reducida cuanto se quiera
cumpliendo una exigencia de distorsión
máxima exigida.
Yoma
q(T) = z1 | d(X, z1) ≤ d(X, z j )
Ejemplo de cuantización en un espacio

de varias dimensiones
Yoma
{ Un conjunto de todos los zi 1≤i ≤L es
denominado el codebook (Libro de código).
{ Un método comúnmente utilizado en la
elaboración de un codebook es el algoritmo “k-
means”. Este método emplea una minimización
de la distorción global, definida como:
L
D = ∑D i
i =1
Donde Di es la distorsión dentro del la celda i.

Donde d(T,zi) es la distancia entre un padrao de teste localizado
en la celda Ci.
1
Di = ∑ d (T , z ) i
Ni T ∈Ci
1
zi = ∑T
Ni T ∈Ci
{ Algoritmo de K-means.
Paso1. Inicialización, escoger utilizando un
método adecuado un codebook.
Paso2. Clasificación, clasificar cada vector
T (cuadro)…completar….
Paso3.Actualización de Codebook recalcular
cada code-word a través de la media
aritmética de dos elementos no interiores
a la celda correspondiente.
{Algoritmo de K-means.
Paso 4. Test de Convergencia
completar.

Capitulo 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capitulo 2

Cargado por

Copyright:

Formatos disponibles

Universidad de Chile

Facultad de Ciencias Físicas y Matemáticas.

2.0 Repaso: Transformada de Fourier

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

{ Supongamos que la señal s(t) es

-2Πfm -W0 W0 2Πfm

2πf m > 2W0 = 2 * 2πf 0

Es la máxima frecuencia de la señal a

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

{ Otras funciones más complejas se pueden

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

•Un filtro FIR también se puede definir por:

¿Porqué Respuesta Impulsiva Finita?

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

•Un filtro IIR también se puede definir por:

¿Porqué Respuesta Impulsiva Infinita?

Mediante la propiedades de la transformada Z se

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Z{y(n)}= Z{a0 x(n) + a1x(n −1) + a2 x(n − 2) +.....+ ak x(n − k)}

Z{y(n)} = a0Z{x(n)}+ a1Z{x(n −1)}+ a2 Z{x(n − 2)}+ .....+ ak Z{x(n − k )}

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

{ Algoritmo mas eficiente de cálculo.

{ Calcula N componentes de frecuencia a

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

•Para reducir el efecto de discontinuidad

•Aunque existe un buen número de tipos

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Se recomienda que la ventana sea de 10 a 30 ms, pues

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Forma genérica de la ventana de Hamming

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Donde x(n) Coeficientes de la señal

ai Habitualmente son LPC

e[n] Ruido blanco

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

X (z) = H I (z)E (z)

El teorema de Wold dice que “cualquier proceso

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Hf corresponde a un filtro FIR de fase mínima y puede ser

x(n,1) = v(n) w(i − 1)

x(n) = v(n) w(n)

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

⎡ R(0) R (1) R (2) ... R( p − 1) ⎤ ⎡ α1 ⎤ ⎡ R(1) ⎤

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Donde inicialmente: E 0 = R (0)

Donde α km indicando el coeficiente LCP en la m-ésima

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

EM756 Procesamiento de la Voz Profesor: Néstor Becerra

Ejemplo de cuantización en un espacio

Donde Di es la distorsión dentro del la celda i.

También podría gustarte