Está en la página 1de 2

1) Cómo Funciona el algoritmo KNN?

Este algoritmo busca a los datos o “vecinos” más cercanos utilizando la distancia
euclidiana. Luego la calificación que más se repita entre estos vecinos será aplicada al
nuevo dato. Por ejemplo, siendo K = 5 queremos saber que figura geométrica tendrá un
nuevo punto. Si los 5 vecinos más cercanos son 3 triángulos y 2 cuadrados, entonces
el nuevo punto será un triángulo.

2) Que representa la variable K en KNN?


El número de vecinos más cercanos que serán utilizados para hacer la clasificación.

3) Donde podemos aplicar este algoritmo?


Es principalmente utilizado en minería de datos. Por ejemplo, sistemas de
recomendación como el que utilizan Amazon y Netflix.

4) Como seleccionamos el valor correcto de K?


Para encontrar el valor correcto se debe correr el algoritmo varias veces cambiando el
valor de K y observando cómo afecta al Score. Además, el valor de K debe ser mayor a
uno y preferiblemente impar.

5) Ventajas y desventajas de este algoritmo?


Ventajas
 Fácil de implementar.
 Versátil, se puede usar para clasificación y regresión.
 Preciso (relativo).

Desventajas

 Es computacionalmente costoso ya que debe que almacenar todos los datos de


entrenamiento.
 Puede llegar a ser lento haciendo predicciones dependiendo de la cantidad de
datos.
 Es sensible a datos irregulares y faltantes, por lo que hay que hacer una
limpieza previa de datos.
6) Cual es la matemática que está detrás de este algoritmo KNN?
Se utiliza el teorema de Pitágoras para calcular la distancia euclidiana.

También podría gustarte