Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Miguel Cárdenas-Montes
Objetivos:
No negativo:
D(~
X1 , ~
X2 ) ≥ 0 ∀ ~
X1 , ~
X2 ∈ X
Simetría:
D(~
X1 , ~
X2 ) = D ( ~
X2 , ~
X1 ) ∀ ~
X1 , ~
X2 ∈ X
Desigualdad triangular:
D(~X1 , ~
X2 ) ≤ D ( ~
X1 , ~
X3 ) + D ( ~
X3 , ~
X2 ) ∀ ~
X1 , ~
X2 , ~
X3 ∈ X
Muchas medidas de distancia no son me-
Axioma de coincidencia o identidad de indiscernibles: didas porque no cumplen los requisi-
tos. Por ejemplo, las pseudométricas no
D(~
X1 , ~
X2 ) = 0, si y solo si ~
X1 = ~
X2 cumplen las condiciones: distancias no
negativas ni la identidad de indiscer-
nibles. Las quasimétricas no cumplen la
condición de simetría, y por último las
semimétricas no cumplen la desigual-
2 Distancia Euclídea dad triangular.
Además hay que tener cuidado si tiene atributos con rangos muy
grandes (por ejemplo, ingresos de la persona que pide la hipoteca) y
otros con rangos pequeños (por ejemplo atributo edad de la persona
que pide la hipoteca), ya que unos enmascarará a los otros. La solución
es normalizar adecuadamente todos los atributos (ecuación 2).
v − vmin
v′ = (2)
vmax − vmin
2 m
m
3 Distancia Manhattan
n
D(~
X1 , ~
X2 ) = || X1 − X2 || = ∑ |X1i − X2i | (3)
i =1
4 Distancia Chebyshev
Figura 1: Distancia Manhattan contra También se denomina métrica máxima o métrica L∞ . La distancia
distancia Euclideana: Las líneas roja, de Chebyshev entre dos vectores es la mayor diferencia en cualquiera
azul y amarilla tienen la misma longitud
(12) en las geometrías Euclideana y taxi- de las coordenadas del espacio (ecuación 4).
cab. En la geometría Euclideana,
√ la línea
verde tiene longitud 6 2 ≈ 8,48, y es el
único camino más corto. En la geometría
D(~
X1 , ~
X2 ) = max (| X1i − X2i |) (4)
taxicab, la línea verde tiene longitud 12,
por lo que no es más corta que los otros
caminos.
Wikipedia: Geometría del taxista
5 Distancia del Coseno
7 Distancia Levenshtein
8 Distancia Damerau-Levenshtein
9 Distancia Mahalanobis