Está en la página 1de 66

Tema 3. Anlisis de la voz.

Parametrizacin
3.1.- Anlisis localizado de la voz

3.2.- Anlisis temporal localizado

3.3.- Anlisis localizado en frecuencia

3.4.- Anlisis de prediccin lineal

3.5.- Anlisis espectral localizado

3.1.- Anlisis localizado de la voz
La seal de voz solo presenta caractersticas pseudo-
estacionarias a corto plazo

Ser necesario procesar la seal de voz en segmentos
de corta duracin: Anlisis Localizado

El mecanismo que nos permite realizar este anlisis es el
enventanado de la seal
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
3.1.1.- Enventanado de la seal
s[n]: Seal de voz
w[n]: Ventana de anlisis
N: Tamao de la ventana
M: Desplazamiento
S[n]
w[n]
w[M-n] w[2M-n] w[3M-n]
N
M
3.1.1.- Enventanado de la seal
Perfiles: Rectangular, Hanning, Hamming, Blackman
0 10 20 30
0
0.2
0.4
0.6
0.8
1
Rectangular
0 10 20 30
0
0.2
0.4
0.6
0.8
1
Hanning
0 10 20 30
0
0.2
0.4
0.6
0.8
1
Hamming
0 10 20 30
0
0.5
1
Blackman
3.1.1.- Enventanado de la seal
Espectros de los perfiles:
0 0.5 1
-40
-20
0
20
40
Rectangular
d
B
0 0.2 0.4 0.6 0.8
-40
-20
0
20
40
Hanning
d
B
0 0.5 1
-40
-20
0
20
40
Hamming
d
B
0 0.2 0.4 0.6 0.8
-40
-20
0
20
40
Blackman
d
B
Lbulo principal
Lbulos laterales
3.1.1.- Enventanado de la seal
Problemas del enventanado:
Produce derrame espectral (leakage).
El lbulo principal dificulta la identificacin de
frecuencias cercanas entre s.
Los lbulos laterales introducen seal en frecuencias
donde no debera haber nada.

Se debe llegar a un compromiso entre el ancho del lbulo
principal y la minimizacin de los laterales.
Generalmente se prefiere minimizar los lbulos laterales.

Perfiles tpicos para voz: Hanning/Hamming y rectangular.
3.2.- Anlisis temporal localizado
Parmetros tpicos que se suelen calcular:

Energa localizada (o en su defecto la magnitud)

Tasa de cruces por cero

Autocorrelacin

Estimacin de la frecuencia fundamental F0 (Pitch)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
-1
-0.5
0
0.5
1
Forma de onda
Muestras
A
m
p
l
i
t
u
d
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
0
0.1
0.2
0.3
0.4
Muestras
A
m
p
l
i
t
u
d
Energa
3.2.1.- Energa localizada
E[m]: Energa localizada



Energa localizada de la palabra Hipotenusa:
| |

+
=
=
n
m n w n x m E
2
] [ ] [ ] [

=
=
1
0
2 2
] [ ] [
N
n
m n w n x
i p o t e n u s a
3.2.1.- Energa localizada
E[m]: Energa localizada



Esta ecuacin se puede interpretar como:



Esto a su vez se puede interpretar como:

=
=
1
0
2 2
] [ ] [ ] [
N
n
m n w n x m E

=
=
1
0
2
] [ ] [ ] [
N
n
n h n x m E
2
] [ ] [ m n w n h =
Siendo:
x[n]
2
x[n]

h[n]

E[m]

3.2.2.- Magnitud
M[m]: Magnitud




Es un parmetro alternativo a la energa
Menor complejidad
Menor margen dinmico
Muestras elevadas pueden desvirtuar el valor de
la energa al ser elevadas al cuadrado

=
=
1
0
] [ ] [ ] [
N
n
m n w n x m M
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
-1
-0.5
0
0.5
1
Forma de onda
Muestras
A
m
p
l
i
t
u
d
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
0
0.1
0.2
0.3
0.4
0.5
Muestras
A
m
p
l
i
t
u
d
Magnitud
3.2.2.- Magnitud
Ejemplo del clculo de la magnitud para la palabra
Hipotenusa
i p o t e n u s a
3.2.3.- Tasa de cruces por cero
Tcc[m]: Tasa de cruces por cero




Donde sgn() es la funcin signo definida por:

=
n
n m w n x n x
N
m Tcc ) ( ]) 1 [ sgn( ]) [ sgn(
2
1 1
] [

<
> +
=
0 , 1
0 , 1
) sgn(
x
x
x
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
-1
-0.5
0
0.5
1
Forma de onda
Muestras
A
m
p
l
i
t
u
d
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
x 10
4
0
0.1
0.2
0.3
0.4
Muestras
A
m
p
l
i
t
u
d
Tcc
3.2.3.- Tasa de cruces por cero
Indica la relacin entre la energa a baja y alta
frecuencia.
Las seales sonoras dan un tasa menor que las seales
sordas.
Tasa de cruces por cero de Hipotenusa
h i p o t e n u s a
3.2.4.- Aplicaciones E, M y Tcc
Entre las principales aplicaciones se encuentran:
Clasificacin de sonidos
Sonoros/Sordos, etc

Detector de actividad (VAD: Voice Activity Detector)
Uso en codificacin:
Ej. GSM: para reducir interferencias y ahorrar
batera.
Uso en reconocimiento:
Mayor eficiencia y evitar reconocimientos
errneos.
3.2.4.- Aplicaciones E, M y Tcc
Detector de actividad:
E[m] M
>
Umbral?
Tcc[m]
>
Umbral?
Voz
Ruido
Si
Si
No
No
3.2.5.- Autocorrelacin
R
m
[k]: Autocorrelacin





Propiedades:
Es una funcin par
Tiene un mximo en k=0, i.e.:

{ }{ }
...p. 2, 1, , 0
] [ )] ( [ ] [ ] [ ] [
1
0
=
+ + =

=
k
k n x k n m w n x n m w k R
N
n
m
Energa R
m
= ] 0 [
] 0 [ ] [
m m
R k R s
3.2.5.- Autocorrelacin
Para desplazamientos de k igual al periodo de la seal la
autocorrelacin tiene mximos locales
La autocorrelacin de una seal peridica es peridica

0 20 40 60 80 100 120 140 160 180
-20
-10
0
10
20
Segmento sonoro
Muestras
A
u
t
o
c
o
r
r
e
l
a
c
i

n
0 20 40 60 80 100 120 140 160 180
-10
0
10
Segmento sordo
Muestras
A
u
t
o
c
o
r
r
e
l
a
c
i

n
3.2.5.- Autocorrelacin
En una seal de voz:
Los mximos locales de la autocorrelacin
corresponden con el pitch (frecuencia fundamental, f0)
y los formantes del tracto vocal.

3.2.6.- Estimacin del Pitch
A partir de la correlacin
Es el mayor mximo local de la autocorrelacin
(excluyendo el mximo global)
Segmento
Sonoro
Segmento
Sordo
3.2.6.- Estimacin del Pitch
Problema:
No siempre el mayor mximo local corresponde con
el pitch

Para facilitar su localizacin emplearemos una funcin
de recorte

Esta funcin eliminar toda la seal de entrada que no
sobrepase un determinado umbral
3.2.6.- Estimacin del Pitch
Funcin de recorte:
3.2.6.- Estimacin del Pitch
Autocorrelacin de la seal recortada
3.2.6.- Estimacin del Pitch
AMDF, Average Magnitude Difference Function
Estima del pitch empleando la Magnitud en vez de la
correlacin
Menor complejidad y coste computacional
En este caso en vez de buscar mximos se deben
buscar mnimos
| | ] [ ] [ ] [ ] [ ,
1

+
+ =
=
N m
m n
m n w n s m n w n s m AMDF
t
t t t
3.2.6.- Estimacin del Pitch
AMDF, Average Magnitude Difference Function
3.3.- Anlisis localizado en frecuencia
Para realizar un anlisis localizado en frecuencia basta
con calcular la TF de un segmento de seal enventanado.
( ) ] [ ] [ ,

=
m
m j
e m n w m s n S
e
e
3.3.1- Espectrogramas
Tambin denominados Sonogramas
Representan la evolucin del espectro con el tiempo
Estas variables son inversas
Al ganar resolucin en una de ellas, la perdemos en
la otra

Tipos de espectrogramas:
Banda ancha
Banda estrecha
3.3.1- Espectrogramas
Banda ancha (poca resolucin en frecuencia)
Ventanas temporales cortas
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
500
1000
1500
2000
2500
3000
3500
4000
Normalized Frequency (t rad/sample)
T
i
m
e
3.3.1- Espectrogramas
Banda estrecha (poca resolucin en el tiempo)
Ventanas temporales largas
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
500
1000
1500
2000
2500
3000
3500
Normalized Frequency (t rad/sample)
T
i
m
e
3.3.2- Anlisis Homomrfico: Cepstrum
Utilidad:
Permite separar la seal de excitacin de la
respuesta del filtro del tracto vocal

Un segmento sonoro es la convolucin entre:
La seal de excitacin glotal e[n]
El filtro del tracto vocal h[n]


La convolucin en el tiempo es una multiplicacin en
frecuencia
] [ * ] [ ] [ n h n e n s =
] [ ] [ ] [ k H k E k S =
3.3.2- Anlisis Homomrfico: Cepstrum
Aprovechando las propiedades de los logaritmos:



Si ahora regresamos al tiempo: Cepstrum
| | ]) [ log( ] [ k S IDFT n c =
( ) ( ) ( ) ] [ log ] [ log ] [ log k H k E k S + =
s[n]
FFT Log IFFT
c[n]
3.3.2- Anlisis Homomrfico: Cepstrum
El cepstrum puede ser real o complejo:
Cepstrum complejo: tomamos logaritmos del
espectro completo (con la fase desenrollada, unwrapped)

Cepstrum real: slo aplicamos el logaritmo al mdulo
del espectro

El cepstrum complejo se puede deshacer, el real no
al no contener informacin de fase

Para voz se suele emplear el cepstrum real
3.3.2- Anlisis Homomrfico: Cepstrum
La convolucin se ha convertido en una suma:
] [ ] [ ] [ n c n c n c
h e
+ =
0 50 100 150 200 250 300 350 400 450 500
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
quefrency
c
e
p
s
t
r
u
m
Periodo Fundamental
c
e
y c
h
son separables
] [ ] [ ] [ n h n e n s - =
3.3.2- Anlisis Homomrfico: Cepstrum
Obtencin de la envolvente espectral:
Una vez calculado el cepstrum
Extraemos c
h
con una ventana
El espectro de c
h
es la envolvente espectral
0 50 100 150 200 250 300 350 400 450 500
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
quefrency
c
e
p
s
t
r
u
m
0 1 2 3 4 5 6 7 8
-70
-60
-50
-40
-30
-20
-10
0
Frecuencia(KHz)
A
m
p
l
i
t
u
d
(
d
B
)

3.3.2- Anlisis Homomrfico: Cepstrum
Terminologa empleada:

Spectrum Cepstrum
Frecuency Quefrency
Filtering Liftering
Analysis Alanysis
3.4.- Anlisis de prediccin lineal
Modelo del tracto vocal:
Suponemos que el tracto vocal es una serie de tubos
de seccin variable sin prdidas
Suponemos que el sonido se propaga como una onda
plana a travs de los tubos
A
1
A
2


A
N
Glotis
A
Labios

Modelo del tracto vocal










Estructura de filtro en celosa (lattice)
t tiempo de propagacin para atravesar una seccin
3.4.- Anlisis de prediccin lineal
A
1
A
2
A
N
Glotis
A
Labios

t
t t
t
t
t
U
g
-1

U
Labios
1-k
N
k
N
3.4.- Anlisis de prediccin lineal
Coeficientes de reflexin:
-k
m
k
m
1-k
m
1+k
m
A
m
A
m+1
U
m
U
m
+
-
U
m+1
U
m+1
+
-
1
1
+
+
+

=
m m
m m
m
A A
A A
k
Interconexin
de secciones:
Clculo de los coeficientes
de reflexin:
3.4.- Anlisis de prediccin lineal
Trabajando en tiempo discreto:

Si el periodo de muestreo T = 2 t se puede
demostrar que la respuesta en frecuencia del tracto
vocal es un filtro todo polos

Los coeficientes a
k
del filtro se pueden obtener a
partir de los coeficientes de reflexin k
m
(Durbin)
3.4.- Anlisis de prediccin lineal
Prediccin lineal:
Vamos a intentar predecir el valor de s[n] a partir de
sus valores anteriores s[n-1], s[n-2], , s[n-M]

Es decir, s[n] se puede calcular en funcin de sus
muestras anteriores (podemos predecir su valor):


Si la funcin f es lineal: prediccin lineal
{ } ] [ ],..., 2 [ ], 1 [ ] [ M n s n s n s f n s
3.4.- Anlisis de prediccin lineal
Clculo de la prediccin de s[n]:



Coeficientes de prediccin:



Error de prediccin:



] [ ... ] 2 [ ] 1 [ ] [

2 1
P n s a n s a n s a n s
P
+ + + =
{ }
P
a a a ,..., ,
2 1

=
= =
P
i
i
i n s a n s n s n s n e
1
] [ ] [ ] [

] [ ] [
3.4.- Anlisis de prediccin lineal
Clculo de los coeficientes de prediccin:
Son aquellos que minimizan el error de prediccin (la
energa del error de prediccin)



Minimizar: Para cada a
k
derivar e igualar a 0




Obtenemos un sistema de P ecuaciones con P incgnitas

)
`

= =
=
2
1
2
] [ ] [ ] [
P
i
i
i n s a n s n e Ep
P k
a
Ep
k
,.., 1 0 = =
c
c
3.4.- Anlisis de prediccin lineal
Clculo de los coeficientes de prediccin:
0 =
c
c
k
a
Ep

)
`

=
=
2
1
] [ ] [
P
i
i
i n s a n s Ep
( ) 0 ] [ ] [ ] [ 2
1
=
)
`



=
k n s i n s a n s
P
i
i
{ } { }

=
=
P
i
i
k n s i n s a k n s n s
1
] [ ] [ ] [ ] [
] [ k R
s
] [ i k R
s

3.4.- Anlisis de prediccin lineal
Clculo de los coeficientes de prediccin:



Sistema de ecuaciones:
P k para i k R a k R
P
i
s i s
.. 1 ] [ ] [
1
= =

=
] 1 [ ... ] 1 [ ] 0 [ ] 1 [
2 1
+ + + = P R a R a R a R
s p s s s
] 2 [ ... ] 0 [ ] 1 [ ] 2 [
2 1
+ + + = P R a R a R a R
s p s s s
] 0 [ ... ] 2 [ ] 1 [ ] [
2 1 s p s s s
R a P R a P R a P R + + + =
... ... ...
3.4.- Anlisis de prediccin lineal
En forma matricial:
(
(
(
(
(

(
(
(
(

=
(
(
(
(

p
s s s
s s s
s s s
s
s
s
a
a
a
R P R P R
P R R R
P R R R
P R
R
R
...
] 0 [ ... ] 2 [ ] 1 [
... ... ... ...
] 2 [ ... ] 0 [ ] 1 [
] 1 [ ... ] 1 [ ] 0 [
] [
...
] 2 [
] 1 [
2
1
a R r =
r R a =
1
R es una matriz Toeplitz
Ecuaciones de Yule-Walker
3.4.- Anlisis de prediccin lineal
Algoritmo de Durbin:
Solucin recursiva para calcular los coeficientes a
k

aprovechando que R es toeplitz.
Inicio:

Recursin: i=1,...,P
|
|
.
|

\
|
=

] [ ] [
1
1
1
) 1 (
) 1 (
j i r a i r
E
k
i
j
i
j
i
i
i
i
i
k a =
) (
1 ,..., 1
) 1 ( ) 1 ( ) (
= =

i j a k a a
i
j i i
i
j
i
j
( )
) 1 ( 2 ) (
1

=
i
i
i
E k E
] 0 [
) 0 (
r E =
Energa residual
Coef. Reflexin
(PARCOR)
Coef. LPC
3.4.- Anlisis de prediccin lineal
Algoritmo de Durbin:
Calcula los coeficiente de reflexin (PARCOR)
Calcula los coeficientes de prediccin lineal a partir
de los de reflexin
El filtro resultante siempre es estable:
|k
m
|<1

Filtro obtenido: IIR todo polos

+
=
P
k
k
k
z a
b
z H
1
0
1
) (
p
p
z a z a z a
b
z H

+ + + +
=
... 1
) (
2
2
1
1
0
3.4.- Anlisis de prediccin lineal
Clculo de las frecuencias de los formantes:
A partir de los a
k
calcular las races del polinomio
El clculo de estas races debe hacerse de forma aproximada
por mtodos numricos ya que no puede hacerse de forma
analtica para polinomios grandes
-1 -0.5 0 0.5 1
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
Real Part
I
m
a
g
i
n
a
r
y

P
a
r
t
0 Hz
Fs/2 Hz
3.4.- Anlisis de prediccin lineal
Orden de prediccin:
Un par de polos complejos conjugados por cada formante
Aadir dos o tres polos ms
En general P suele estar entre 10 y 14 coeficientes
0 500 1000 1500 2000 2500 3000 3500 4000
-50
-40
-30
-20
-10
0
10
20
Frecuencia (Hz)
A
m
p
l
i
t
u
d

(
d
B
)
LPC-5
LPC-14
LPC-10
3.4.- Anlisis de prediccin lineal
Modelo de produccin de voz:
Excitacin
Peridica
Ruido
Aleatorio
Pitch
Envolvente
espectral
G
Parmetros
Espectrales
Voz
3.4.- Anlisis de prediccin lineal
A partir del error de prediccin y del filtro LPC podemos
obtener s[n]:

=
=
P
i
i
i n s a n s n e
1
] [ ] [ ] [

=
+ =
P
i
i
i n s a n e n s
1
] [ ] [ ] [

=
+
P
i
i
i n s a
1
] [ 1
1
e[n]
s[n]
3.4.- Anlisis de prediccin lineal
Con el filtro LPC inverso y la seal de voz podemos
obtener la seal de error:

=
+
P
i
i
i n s a
1
] [ 1
s[n]
e[n]
0 50 100 150 200 250 300 350 400 450
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
Muestras
A
m
p
l
i
t
u
d
0 50 100 150 200 250 300 350 400 450
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
Muestras
A
m
p
l
i
t
u
d
3.4.- Anlisis de prediccin lineal
Filtros LPC y LPC inverso:








Al pasar s[n] por el filtro LPC inverso obtenemos e[n]
e[n] adems de ser la seal de error es la seal de
excitacin del modelo de produccin de voz
0 500 1000 1500 2000 2500 3000 3500 4000
-70
-60
-50
-40
-30
-20
-10
0
Frecuencia (Hz)
A
m
p
l
i
t
u
d

(
d
B
)
0 500 1000 1500 2000 2500 3000 3500 4000
-50
-40
-30
-20
-10
0
10
20
Frecuencia (Hz)
A
m
p
l
i
t
u
d

(
d
B
)
) (
1
) (
z H
z H
3.4.5.- Mtodo SIFT, estimacin del Pitch
Simplified Inverse Filtering Technique, Markel 1972.
F. Paso Bajo
0-900 Hz
Diezmado
5:1
Anlisis LPC
P=4
Filtro LPC
Inverso
Autocorrelacin
Localizar
Mximo
Interpolacin
Sonoro / sordo?
Estimar F0
x[n] e[n]
S[n]
Fs = 10 kHz
3.4.5.- Mtodo SIFT, estimacin del Pitch
Filtrar paso bajo con fc = 900Hz.
Esto nos permite reducir Fs de 10 kHz a 2 kHz.
Desechamos 4 de cada 5 muestas.
Realizamos un anlisis LPC de orden 4.
No es necesario ms: hasta 1000Hz como mximo 2 formantes.
Procesamos x[n] con el filtro inverso LPC.
Obtenemos e[n] que ser la seal de excitacin.
Calculamos la autocorrelacin de e[n].
Localizamos el mayor valor dentro del rango de pitch probables.
Para obtener mayor resolucin en la estima del pitch,
interpolamos la autocorrelacin en la regin del mximo.
Si el mximo obtenido (normalizado por R[0]) no supera
un umbral, suponer que el segmento es sordo.
3.5.- Anlisis espectral localizado
3.5.1.- Conceptos de percepcin auditiva

MEL: Escala de frecuencias de distribucin no lineal
que responde al mecanismo de percepcin auditiva

Con esta escala medimos la frecuencia en MELs, es
la frecuencia percibida aparente.

Conversin de Hz a MELs
( ) 1 0016 . 0 log 1125 + = f m
3.5.2.- MEL-Frequency Cepstrum (MFCC)
Coeficientes cepstrales derivados del anlisis sobre la
escala MEL
Calculamos el espectro
Calculamos el Log del mdulo (cepstrum real)
Aplicamos la escala MEL
Agrupamos frecuencias en bandas crticas
Calculamos la DCT

FFT DCT Escala MEL Log
3.5.2.- MEL-Frequency Cepstrum (MFCC)
0 100 200 300 400 500 600 700 800 900 1000
-0.4
-0.2
0
0.2
0.4
0.6
a
[samples]
0 500 1000 1500 2000 2500 3000 3500 4000 4500
-60
-50
-40
-30
-20
-10
0
a
[Hz]
3.5.2.- MEL-Frequency Cepstrum (MFCC)
0 1000 2000 3000 4000 5000 6000 7000
0
0.2
0.4
0.6
0.8
1
[Hz]
0 2 4 6 8 10 12 14 16 18
-10
-8
-6
-4
-2
0
Banco de
filtros
Espectro
suavizado
3.5.2.- MEL-Frequency Cepstrum (MFCC)
Cepstrum obtenido:
El nmero de coeficientes resultante es muy inferior
El cepstrum obtenido es una aproximacin
0 2 4 6 8 10 12 14 16
-0.5
0
0.5
1
3.5.3.- Cepstrum LPC (LPCC)
Es posible obtener los coeficientes cepstrales a partir de
los coeficientes LPC
Obtendremos el cepstrum de una seal suavizada
No es necesario calcular el espectro
1
) 1 ( a c =
P n m n c a
n
m
a n c
n
m
m n
.. 2 ) ( 1 ) (
1
1
=
|
.
|

\
|
=

=
P n m n c a
n
m
n c
P
m
m
>
|
.
|

\
|
=

=1
) ( 1 ) (
3.5.4.-Otros parmetros
Existen multitud de representaciones distintas de los
parmetros vistos

Unos parmetros se pueden obtener a partir de los otros

El empleo de unos u otros parmetros es indistinto en
cuanto a mejoras en la sntesis/reconocimiento

La eleccin entre unos u otros se debe principalmente a:
Robustez que ofrecen frente a fallos
Tasa binaria mnima requerida
3.5.4.-Otros parmetros
Coeficientes PARCOR:
PARtial autoCORrelation coefficients.
Se calculan como paso intermedio en el algoritmo de
durbin.
Son los coeficientes de Reflexin ya vistos.

Relacin de reas / Coefs. PARCOR



LAR: Log Area Ratios
i
i
i
i
k
k
A
A
+

=
+
1
1
1
|
|
.
|

\
|
+

=
i
i
i
k
k
L
1
1
log
3.5.4.-Otros parmetros
Coeficientes LSF / LSP:
Line Spectral Frequencies / Line Spectral Pairs
Permiten una representacin distinta de los
coeficientes LPC
El filtro inverso LPC, A(z), se puede descomponer en:




Donde P(z) representa la respuesta del tracto vocal
con la glotis cerrada, y Q(z) con la glotis abierta.

) ( ) ( ) (
1 ) 1 ( +
+ = z A z z A z P
p
) ( ) ( ) (
1 ) 1 ( +
= z A z z A z Q
p
3.5.4.-Otros parmetros
A(z) tiene races dentro de la circunferencia unidad
P(z) y Q(z) slo tienen races sobre la circunferencia
P(z) es un polinomio simtrico y Q(z) antisimtrico
Las races de P(z) y Q(z) se encuentran de forma
alternada en frecuencia
Clculo de las raices:
Tomar z = exp(jw) y evaluar P(z) y Q(z) en una malla
de puntos entre 0 y pi.

Recuperacin de A(z):
| | ) ( ) (
2
1
) ( z Q z P z A + =
3.5.4.-Otros parmetros
Problemas de usar los coeficientes LPC:
El error de cuantificacin es problemtico, el filtro se
puede hacer inestable
Se comportan muy mal al intentar interpolarlos

Ventajas de usar LSF/LSP:
Son ms robustos en cuanto a errores de
cuantificacin
El filtro permanece estable
Al ser una representacin en frecuencia, un error
solo altera un pequeo rango de frecuencias
3.5.5.- Proceso de obtencin de parmetros
Pasos a realizar:
Pre-nfasis de la trama
Enventanado con solapamiento
Clculo de la autocorrelacin
Anlisis LPC, obtencin de los coeficientes
Clculo del cepstrum a partir de la LPC
Anlisis de los parmetros obtenidos

También podría gustarte