Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas de
de Distancia
Distancia (ó
(ó Distorsión)
Distorsión)
• Una característica fundamental de los sistemas de reconoci-
miento (de palabra o de locutor) es la forma en que los vectores
característicos son combinados y comparados con los patrones de
referencia.
• Para poder realizar estas operaciones es necesario definir una
medida de distancia entre vectores característicos.
Definición: Una distancia entre dos vectores x e y de un
espacio vectorial X es una función a valores reales d(x, y) sobre el
producto Cartesiano X × X , que verifica las propiedades
(a ) 0 ≤ d (x, y ) < ∞ , ∀ x, y ∈ X , y d (x, y ) = 0 si y solo si x = y
(b ) d (x, y ) = d (y, x ), ∀ x, y ∈ X
(c ) d (x, y ) ≤ d (x, z ) + d (y, z ), ∀ x, y, z ∈ X
ProDiVoz 1
D
d1 = ∑ f i − f i
'
distancia L1
i =1
∑(f − f )
D
' 2
d2 = i i distancia Euclidea (o L2 )
i =1
ProDiVoz 2
• Una medida de distancia muy utilizada cuando se emplean como
característica los coeficientes cepstral, que ha probado tener una
muy buena performance en tareas de reconocimiento, es la
distancia Euclidea ponderada,
ponderada definida como
∑ (w (c − c ))
D
' 2
d2w = i i i
i =1
donde
1
wi =
σi
siendo σ i una estima de la varianza del i-ésimo coeficiente
2
ProDiVoz 3
∑ (c ) ( ) ( )
∞ π
1 2
ln X (ω ) − ln X ′(ω )
' 2
∫π
2 2
d ceps = − cm = dω
2π
m
m = −∞ −
∑ (c )
Q
' 2
d ceps ≅ m − cm
m =1
ProDiVoz 4
• Una formulación más general, que tiene en cuenta la interacción
entre coeficientes a traves de una matriz de covarianza es la deno-
minada distancia de Mahalanobis,
Mahalanobis definida como
dM = (x − µ )T Σ −1 (x − µ )
donde
Ne
1
µ≈
Ne
∑i
x e
i =1
Media de los vectores de entre-
namiento xi
e
Ne
∑ (x − µ )(xie − µ )
1 T Matriz de Covarianza de los
Σ≈ e
i vectores de entrenamiento xi
e
Ne i =1
Nr
1
x=
Nr
∑x r
i
Media de los vectores de reco-
r
ProDiVoz i =1 nocimiento xi 5