Está en la página 1de 3

Medidas

Medidas de
de Distancia
Distancia (ó
(ó Distorsión)
Distorsión)
• Una característica fundamental de los sistemas de reconoci-
miento (de palabra o de locutor) es la forma en que los vectores
característicos son combinados y comparados con los patrones de
referencia.
• Para poder realizar estas operaciones es necesario definir una
medida de distancia entre vectores característicos.
Definición: Una distancia entre dos vectores x e y de un
espacio vectorial X es una función a valores reales d(x, y) sobre el
producto Cartesiano X × X , que verifica las propiedades
(a ) 0 ≤ d (x, y ) < ∞ , ∀ x, y ∈ X , y d (x, y ) = 0 si y solo si x = y
(b ) d (x, y ) = d (y, x ), ∀ x, y ∈ X
(c ) d (x, y ) ≤ d (x, z ) + d (y, z ), ∀ x, y, z ∈ X
ProDiVoz 1

• Algunas de las medidas de distancia más utilizadas son las


distancias o métricas inducidas por las normas en espacios Lp .

Por ejemplo, si f i , f i ' con i = 1,2,L, D son las componentes


de dos vectores característicos f y f ' , pueden definirse las
siguientes métricas inducidas por las normas Lp

D
d1 = ∑ f i − f i
'
distancia L1
i =1

∑(f − f )
D
' 2
d2 = i i distancia Euclidea (o L2 )
i =1

ProDiVoz 2
• Una medida de distancia muy utilizada cuando se emplean como
característica los coeficientes cepstral, que ha probado tener una
muy buena performance en tareas de reconocimiento, es la
distancia Euclidea ponderada,
ponderada definida como

∑ (w (c − c ))
D
' 2
d2w = i i i
i =1

donde
1
wi =
σi
siendo σ i una estima de la varianza del i-ésimo coeficiente
2

cepstral ci . Aquí, los datos que son menos confiables (con


mayor varianza) son pesados menos.

ProDiVoz 3

• Cuando se utiliza el power cepstrum como vector característico,


a la distancia en L2 se la denomina distancia cepstral. Teniendo
en cuenta la identidad de Parseval, resulta

∑ (c ) ( ) ( )
∞ π
1 2
ln X (ω ) − ln X ′(ω )
' 2
∫π
2 2
d ceps = − cm = dω

m
m = −∞ −

En la práctica, sólo se computa un número finito Q de coefi-


cientes power cepstral, resultando

∑ (c )
Q
' 2
d ceps ≅ m − cm
m =1

ProDiVoz 4
• Una formulación más general, que tiene en cuenta la interacción
entre coeficientes a traves de una matriz de covarianza es la deno-
minada distancia de Mahalanobis,
Mahalanobis definida como

dM = (x − µ )T Σ −1 (x − µ )
donde
Ne
1
µ≈
Ne
∑i
x e

i =1
Media de los vectores de entre-
namiento xi
e

Ne

∑ (x − µ )(xie − µ )
1 T Matriz de Covarianza de los
Σ≈ e
i vectores de entrenamiento xi
e
Ne i =1
Nr
1
x=
Nr
∑x r
i
Media de los vectores de reco-
r
ProDiVoz i =1 nocimiento xi 5

También podría gustarte