Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CIENCIAS E
INGENIERIA
Ingeniería Industrial
Analytics 2
K vecinos
mas cercanos
K vecinos mas cercanos ó k-nn
El método de k vecinos más
2.2.3 k-nn - k vecinos mas cercanos
función de densidad de
probabilidad directamente
tomando la probabilidad a
posteriori que un elemento
x pertenezca a la clase Ci, a
partir de los datos.
distancias k
Se pueden emplear las Se recomienda usualmente tomar k
impares. Cuando hay solo dos clases
métricas usuales de
Eneas y Choi (1996) recomiendan
distancia: determinar:
Fase de clasificación
La evaluación de cada registro, cuya clase es desconocida es
estima por la distancia entre los vectores almacenados y el vector
del registro actual, y se seleccionan los k elementos mas cercanos.
El nuevo ejemplo es clasificado con la que clase que mas se repite.
Omitir algunos
Asignar peso a los
atributos que se
atributos (variables
sospeche que no son
input)
relevantes
Emplear técnicas
Ajustar los pesos
previas para identificar
basados en la propia
que atributos son
base de datos de
importantes para la
entrenamiento.
target
Algoritmo de k-nn
Resumen de los dos algoritmos componentes:
2.2.3 k-nn - k vecinos mas cercanos
Algoritmo de entrenamiento
Algoritmo de clasificación
El efecto de la elección de k en k-nn
Generalmente valores grandes k reducen el efecto de ruido
2.2.3 k-nn - k vecinos mas cercanos
No hay riesgo de permitir que todos los k vecinos puedan contribuir a la clasificación
de x ya que al ser distantes no tienen peso asociado y poca influencia sobre la
clasificación del registro.
de clasificación.
Facilidad para
1 interpretar el
resultado
Tiempo de
cálculo 2
3 Poder
predictivo
FACULTAD DE
CIENCIAS E
INGENIERIA
Ingeniería Industrial
Analytics 2