0% encontró este documento útil (0 votos)

23 vistas8 páginas

Búsqueda Aproximada de Vecinos Cercanos

Cargado por

juanyluna374

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

23 vistas8 páginas

Búsqueda Aproximada de Vecinos Cercanos

Cargado por

juanyluna374

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Nombre del Algoritmo: (1+ε)-approximate nearest neighbor search

Descripción del Problema Computacional para la cual el algoritmo es una

solución.
Delimitación del Problema:
El algoritmo (1+ε)-approximate nearest neighbor search (ANN) busca
resolver el problema de encontrar el punto más cercano (o aproximadamente

de error permitido 𝜖. Este problema surge en situaciones donde la búsqueda

cercano) a una consulta en un espacio de alta Dimensionalidad, con un margen

exacta es computacionalmente costosa debido al tamaño del conjunto de datos

o la Dimensionalidad del espacio.
Comprensión del Problema:
El problema consiste en:
1. Búsqueda de Vecindad: Para un punto de consulta 𝑞, encontrar un punto
𝑝 del conjunto 𝑆 tal que la distancia 𝑑 (𝑝, 𝑞) esté dentro de un factor
de (1+𝜖) de la distancia al vecino exacto más cercano.
2. Aproximación Controlada: Ofrecer un balance entre precisión y
eficiencia.
Clasificación del Problema:
El problema pertenece al área de:
 Búsqueda Aproximada en estructuras de datos.
 Optimización Subóptima en algoritmos geométricos.
 Reducción de Complejidad para espacios de alta Dimensionalidad.
Viabilidad Computacional:
La viabilidad se garantiza al aceptar una aproximación (𝜖>0), lo que
permite reducir el tiempo de cómputo en comparación con algoritmos exactos.
Se utilizan estructuras como Locality-Sensitive Hashing (LSH) o árboles KD
optimizados para aproximaciones.
Contexto del Problema:
El algoritmo es útil en aplicaciones donde:
 La dimensionalidad del espacio es alta (problema de la "maldición de la
dimensionalidad").
 Se requiere alta velocidad en búsquedas con tolerancia a errores, como
en:
 Recuperación de información.
 Reconocimiento de patrones.
 Procesamiento de señales.
Análisis de Datos y Estructura del Problema:
 Entrada: Un conjunto 𝑆 de puntos en un espacio métrico (𝑋, 𝑑).}
 Consulta: Un punto 𝑞 en el mismo espacio.
 Salida: Un punto 𝑝 ∈ 𝑆 tal que 𝑑(𝑝, 𝑞) ≤ (1+𝜖) ⋅ 𝑑(𝑝𝑒𝑥𝑎𝑐𝑡𝑜,𝑞),
donde 𝑝𝑒𝑥𝑎𝑐𝑡𝑜 es el vecino más cercano exacto.
Evaluación de Complejidad:
El enfoque exacto tiene una complejidad 𝑂(𝑛) por consulta para 𝑛
puntos, mientras que los métodos aproximados pueden reducirla a 𝑂 (log 𝑛) o
sublineal dependiendo de la estructura de datos utilizada. Sin embargo, esto se
logra a costa de introducir una probabilidad de error o un factor de
aproximación.
Análisis del Contexto del Problema para la cual el algoritmo es una
solución.
Contexto general del Problema:
En escenarios con grandes bases de datos y espacios de alta
dimensionalidad, buscar vecinos exactos puede ser ineficiente. Por lo tanto, se
adopta una aproximación controlada para acelerar la búsqueda y mantener una
precisión aceptable. Ejemplos:
 Recuperación de imágenes similares en bases de datos visuales.
 Identificación de palabras similares en grandes colecciones de texto.
Identificación de los conjuntos y estructuras de datos:

 Una colección de puntos 𝑆 = {𝑝1, 𝑝2 ,.., 𝑝𝑛} en un espacio

1. Conjuntos de datos:

métrico.
2. Consulta:
 Un punto 𝑞 en el mismo espacio métrico.
3. Estructuras utilizadas:
 Árboles de partición (por ejemplo, árboles KD).
 Locality-Sensitive Hashing (LSH) para espacios no euclidianos.
Formalización del problema:
Dado un conjunto 𝑆 y una métrica 𝑑 (𝑥, 𝑦) para un punto de consulta
𝑞 encontrar un punto 𝑝 ∈𝑆 que cumpla:

Análisis de la Dinámica del Problema:

El problema involucra dos fases principales:

árboles) para organizar los puntos 𝑆.

1. Preprocesamiento: Construcción de la estructura de datos (LSH,

2. Consulta: Uso de la estructura para encontrar rápidamente un vecino

aproximado.
Evaluación de la Complejidad del Contexto:

ser 𝑂 (𝑛⋅log 𝑛).

 Preprocesamiento: Depende de la estructura elegida. Para LSH, suele

 Consulta: Se logra en 𝑂(log𝑛) o sublineal en estructuras eficientes,

sacrificando exactitud.
Identificación de los casos límites y excepciones:
Casos límite:
 Alta dimensionalidad (𝑑≫100: Puede requerir estructuras específicas.
 Datos uniformemente distribuidos: Los métodos aproximados pueden
ser menos efectivos.
Excepciones:
 Tolerancia a errores baja (𝜖→0): El problema se aproxima al caso
exacto.
 Métricas no euclidianas complejas.
Interacción con otros sistemas:
 Aplicaciones en aprendizaje automático: Identificar vecinos en
algoritmos como k-NN.
 Bases de datos: Mejorar tiempos de consulta para datos espaciales.
 Procesamiento multimedia: Encontrar coincidencias aproximadas en
señales.
Especificación Formal:
Definición de las entradas y salidas:

 Conjunto de puntos 𝑆 ⊂ 𝑋.
 Entradas:

 Punto de consulta 𝑞 ∈𝑋.

 Métrica 𝑑(𝑥,𝑦) para medir la distancia.
 Factor de aproximación 𝜖>0.

 Punto 𝑝 ∈ 𝑆 tal que 𝑑(𝑝,𝑞)≤(1+𝜖)⋅𝑑(𝑝𝑒𝑥𝑎𝑐𝑡𝑜,𝑞)

 Salida:

Definición formal del problema mediante funciones:

 Definición de Vecino Exacto:

 Cr
iterio
del

Vecino Aproximado:

Relaciones y Restricciones:

 El algoritmo depende de la métrica 𝑑(𝑥,𝑦).

 Relaciones:

 Factor de aproximación ϵ controla el error permitido.

 Restricciones:
 ϵ>0 para garantizar una búsqueda significativa.
 Estructuras de datos adecuadas según 𝑑(𝑥,𝑦).
Invariantes y propiedades:
 Propiedad de aproximación: La solución siempre está dentro de un
factor (1+𝜖) de la solución exacta.
 Robustez: Funciona en espacios de alta dimensionalidad.
Control de Flujo:
1. Preprocesamiento:
 Construcción de la estructura (por ejemplo, LSH).
 Configuración del parámetro ϵ.

 Evaluar 𝑞 utilizando la estructura.

2. Consulta:

 Encontrar 𝑝𝑎𝑝𝑝𝑟𝑜𝑥.

 Validar que 𝑑 (𝑝𝑎𝑝𝑝𝑟𝑜𝑥, 𝑞) ≤ (1+𝜖) ⋅ 𝑑(𝑝𝑒𝑥𝑎𝑐𝑡𝑜,𝑞).

3. Verificación:

Pseudocodigo del Algoritmo:

Algoritmo BusquedaAproxVecinoCercano
// Entradas:
// datos_entrenamiento: Matriz[n][d], puntos en d dimensiones.
// punto_consulta: Vector[d], punto objetivo.
// epsilon: Tolerancia de aproximación.
// k: Número de vecinos más cercanos requeridos.

Funcion VecinosAproximados(datos_entrenamiento, punto_consulta,

epsilon, k)
Definir vecinos como Lista // Lista de vecinos con sus distancias
Definir r_eps como Real // Rango inicial

// Calcular el rango basado en la tolerancia epsilon

r_eps <- CalcularRadioInicial(datos_entrenamiento, punto_consulta,
epsilon)

// Buscar puntos dentro del rango (1+epsilon) * r_eps

Para i <- 1 Hasta tamaño(datos_entrenamiento)
distancia <- DistanciaEuclidiana(datos_entrenamiento[i],
punto_consulta)
Si distancia <= (1 + epsilon) * r_eps Entonces
Añadir (datos_entrenamiento[i], distancia) a vecinos
FinSi
FinPara

// Ordenar los vecinos por distancia

OrdenarLista(vecinos, "distancia")

// Devolver los k vecinos más cercanos

Retornar SubLista(vecinos, 1, k)
FinFuncion

Funcion CalcularRadioInicial(datos_entrenamiento, punto_consulta,

epsilon)
// Selección de un rango inicial aproximado
r_eps <- Infinito
Para i <- 1 Hasta tamaño(datos_entrenamiento)
distancia <- DistanciaEuclidiana(datos_entrenamiento[i],
punto_consulta)
Si distancia < r_eps Entonces
r_eps <- distancia
FinSi
FinPara
Retornar r_eps
FinFuncion

Funcion DistanciaEuclidiana(punto1, punto2)

Definir suma como Real <- 0
Para j <- 1 Hasta tamaño(punto1)
suma <- suma + (punto1[j] - punto2[j])^2
FinPara
Retornar sqrt(suma)
FinFuncion

// Proceso principal
Escribir "Iniciando búsqueda aproximada de vecinos más cercanos..."
Definir datos_entrenamiento como Matriz[n][d] // Cargar puntos
Definir punto_consulta como Vector[d] // Punto de consulta
Definir epsilon como Real // Tolerancia
Definir k como Entero // Número de vecinos requeridos

vecinos <- VecinosAproximados(datos_entrenamiento, punto_consulta,

epsilon, k)

// Mostrar resultados
Para i <- 1 Hasta tamaño(vecinos)
Escribir "Vecino ", i, ": ", vecinos[i][1], " - Distancia: ", vecinos[i][2]
FinPara
FinAlgoritmo
Casos de usos Posible:
 Búsqueda en Espacios de Alta Dimensionalidad:
 Encontrar documentos similares en una base de datos de
textos representados como vectores TF-IDF.
 Procesamiento de Imágenes:
 Comparar imágenes en una base de datos usando vectores de
características generados por redes neuronales.
 Recomendación de Productos:
 Identificar productos similares a los que ha visto o comprado
un usuario, usando vectores de características.
 Reconocimiento de Voz:
 Emparejar grabaciones de audio con patrones almacenados en
una base de datos.
 Detección de Anomalías:
 Identificar puntos en un conjunto de datos que no tengan
vecinos cercanos, señalando anomalías.

También podría gustarte

Resolución del Vecino Más Cercano con Voronoi
Aún no hay calificaciones
Resolución del Vecino Más Cercano con Voronoi
2 páginas
Algoritmo Vecinos Cercanos en Imágenes
Aún no hay calificaciones
Algoritmo Vecinos Cercanos en Imágenes
6 páginas
Algoritmo Iterativo para Puntos Cercanos
Aún no hay calificaciones
Algoritmo Iterativo para Puntos Cercanos
4 páginas
Algoritmo de Puntos Más Cercanos
Aún no hay calificaciones
Algoritmo de Puntos Más Cercanos
4 páginas
Métodos Numéricos y Computación Científica
Aún no hay calificaciones
Métodos Numéricos y Computación Científica
139 páginas
Ejercicios AlgoritmosFuerzaBruta
Aún no hay calificaciones
Ejercicios AlgoritmosFuerzaBruta
2 páginas
Emparejamiento de Patrones de Puntos
Aún no hay calificaciones
Emparejamiento de Patrones de Puntos
9 páginas
Optimización del Problema del Viajero
Aún no hay calificaciones
Optimización del Problema del Viajero
6 páginas
Ejercicios Resueltos de Visión Artificial
Aún no hay calificaciones
Ejercicios Resueltos de Visión Artificial
11 páginas
Ejercicios de Optimización y Algoritmos
Aún no hay calificaciones
Ejercicios de Optimización y Algoritmos
8 páginas
Laboratorio Par Más Cercano OK OK
Aún no hay calificaciones
Laboratorio Par Más Cercano OK OK
6 páginas
Algoritmo para Encontrar El Camino Mas Corto
Aún no hay calificaciones
Algoritmo para Encontrar El Camino Mas Corto
4 páginas
Heurísticas y Algoritmos de Aproximación
Aún no hay calificaciones
Heurísticas y Algoritmos de Aproximación
38 páginas
Métodos Numéricos y Errores en Computación
Aún no hay calificaciones
Métodos Numéricos y Errores en Computación
134 páginas
02 K Vecinos Mas Cercanos Ejercicio Propuesto - Jupyter Notebook
Aún no hay calificaciones
02 K Vecinos Mas Cercanos Ejercicio Propuesto - Jupyter Notebook
8 páginas
Métodos Omni para Búsqueda Rápida
Aún no hay calificaciones
Métodos Omni para Búsqueda Rápida
13 páginas
Funciones de Búsqueda Local en Python
Aún no hay calificaciones
Funciones de Búsqueda Local en Python
3 páginas
Minimos Ponderados
Aún no hay calificaciones
Minimos Ponderados
179 páginas
Agentes y Algoritmos de Búsqueda en Python
Aún no hay calificaciones
Agentes y Algoritmos de Búsqueda en Python
14 páginas
Complejidad y Algoritmos en Grafos
Aún no hay calificaciones
Complejidad y Algoritmos en Grafos
36 páginas
Algoritmos Codiciosos en Grafos
Aún no hay calificaciones
Algoritmos Codiciosos en Grafos
29 páginas
Optimización con Búsqueda Tabú
Aún no hay calificaciones
Optimización con Búsqueda Tabú
7 páginas
Metaheurísticas en Set Covering Problem
Aún no hay calificaciones
Metaheurísticas en Set Covering Problem
11 páginas
Esquema implícito para el problema del calor
Aún no hay calificaciones
Esquema implícito para el problema del calor
17 páginas
Optimización en Geometría Computacional
Aún no hay calificaciones
Optimización en Geometría Computacional
8 páginas
Introducción A Las Soluciones Aproximadas
Aún no hay calificaciones
Introducción A Las Soluciones Aproximadas
28 páginas
Grafos Avanzados en Python: DFS, BFS y Dijkstra
Aún no hay calificaciones
Grafos Avanzados en Python: DFS, BFS y Dijkstra
23 páginas
KNN en Clasificación Sonar: Resultados y Análisis
Aún no hay calificaciones
KNN en Clasificación Sonar: Resultados y Análisis
5 páginas
Búsqueda de Costo Uniforme
Aún no hay calificaciones
Búsqueda de Costo Uniforme
6 páginas
CALDERÓN BELTRÁN, Elmer Rusbert PDF
Aún no hay calificaciones
CALDERÓN BELTRÁN, Elmer Rusbert PDF
81 páginas
Algoritmo GPU para Diagramas de Voronoi
Aún no hay calificaciones
Algoritmo GPU para Diagramas de Voronoi
80 páginas
Algoritmo de Clasificación de Imágenes
Aún no hay calificaciones
Algoritmo de Clasificación de Imágenes
50 páginas
Búsqueda por Similitud en Base de Datos
Aún no hay calificaciones
Búsqueda por Similitud en Base de Datos
2 páginas
TP2 Extension
Aún no hay calificaciones
TP2 Extension
5 páginas
Optimización del Problema del Viajante
Aún no hay calificaciones
Optimización del Problema del Viajante
18 páginas
Clasificación KNN: Método y Funcionamiento
Aún no hay calificaciones
Clasificación KNN: Método y Funcionamiento
33 páginas
Algoritmos Heurísticos y Aproximados
Aún no hay calificaciones
Algoritmos Heurísticos y Aproximados
28 páginas
Competitive Programming 3-Comprimido (001-100) .En - Es
Aún no hay calificaciones
Competitive Programming 3-Comprimido (001-100) .En - Es
100 páginas
Imputación de Datos con el Algoritmo MINI
Aún no hay calificaciones
Imputación de Datos con el Algoritmo MINI
92 páginas
Guia IIC 2433
Aún no hay calificaciones
Guia IIC 2433
4 páginas
Heuristica
Aún no hay calificaciones
Heuristica
15 páginas
Algoritmos para el Problema del Agente Viajero
Aún no hay calificaciones
Algoritmos para el Problema del Agente Viajero
14 páginas
Arturs Backurs Piotr Indyk Ali Vakilian: Agrupación Justa Escalable
Aún no hay calificaciones
Arturs Backurs Piotr Indyk Ali Vakilian: Agrupación Justa Escalable
16 páginas
KNN para Predicción de Cáncer en Python
Aún no hay calificaciones
KNN para Predicción de Cáncer en Python
11 páginas
Tarea de Programación 1: Compatibilidad Estudiantil
Aún no hay calificaciones
Tarea de Programación 1: Compatibilidad Estudiantil
9 páginas
Algoritmo de Dijkstra: Rutas Mínimas
Aún no hay calificaciones
Algoritmo de Dijkstra: Rutas Mínimas
29 páginas
Informe Trabajo Práctico Computación II
Aún no hay calificaciones
Informe Trabajo Práctico Computación II
13 páginas
Algoritmos de Optimización y Búsqueda Local
Aún no hay calificaciones
Algoritmos de Optimización y Búsqueda Local
17 páginas
Optimización de Identificadores de Células LTE
Aún no hay calificaciones
Optimización de Identificadores de Células LTE
59 páginas
Método Inverso Lineal Subespacial
Aún no hay calificaciones
Método Inverso Lineal Subespacial
5 páginas
Guía de Ejercicios de Programación III
Aún no hay calificaciones
Guía de Ejercicios de Programación III
20 páginas
Implementaci N Del Algoritmo Dijkstra en El Campus UNI PDF
Aún no hay calificaciones
Implementaci N Del Algoritmo Dijkstra en El Campus UNI PDF
8 páginas
Problemas de Análisis de Algoritmos
Aún no hay calificaciones
Problemas de Análisis de Algoritmos
14 páginas
Certamen INF/ILI-285: Algoritmos y Métodos Numéricos
Aún no hay calificaciones
Certamen INF/ILI-285: Algoritmos y Métodos Numéricos
4 páginas
Modelamiento y Optimización IN3701
Aún no hay calificaciones
Modelamiento y Optimización IN3701
105 páginas
Algoritmo para Casco Convexo
Aún no hay calificaciones
Algoritmo para Casco Convexo
35 páginas
Árbol de Aproximación Espacial SAT
Aún no hay calificaciones
Árbol de Aproximación Espacial SAT
4 páginas
TP03 DividirConquistar
Aún no hay calificaciones
TP03 DividirConquistar
4 páginas
Sistema Axiomático de Un Buen Programa (Modelo)
Aún no hay calificaciones
Sistema Axiomático de Un Buen Programa (Modelo)
46 páginas
Clasificación Estadística en Aprendizaje Automático
Aún no hay calificaciones
Clasificación Estadística en Aprendizaje Automático
8 páginas
C4.5 Algorithm
Aún no hay calificaciones
C4.5 Algorithm
8 páginas
Fundamentos de Algoritmia
Aún no hay calificaciones
Fundamentos de Algoritmia
210 páginas
MathigonIA Completo
Aún no hay calificaciones
MathigonIA Completo
5 páginas
La Investigación Educativa en El Estudio de Caso
Aún no hay calificaciones
La Investigación Educativa en El Estudio de Caso
14 páginas
Unidad 3 - Admisión de Personal
Aún no hay calificaciones
Unidad 3 - Admisión de Personal
148 páginas
1 Cuaderno 2
Aún no hay calificaciones
1 Cuaderno 2
30 páginas
Inteligencia Artificial en Educación Superior
Aún no hay calificaciones
Inteligencia Artificial en Educación Superior
14 páginas
Psicología Educativa: Entrevista a César Coll
100% (1)
Psicología Educativa: Entrevista a César Coll
6 páginas
Análisis de Personalidad y Desarrollo Socioemocional
Aún no hay calificaciones
Análisis de Personalidad y Desarrollo Socioemocional
2 páginas
Libro 1 Udea
100% (1)
Libro 1 Udea
180 páginas
Curso de Ingeniería en Prompt AI
Aún no hay calificaciones
Curso de Ingeniería en Prompt AI
2 páginas
15 Luis Fabio Xammar PONENCIA
Aún no hay calificaciones
15 Luis Fabio Xammar PONENCIA
6 páginas
Cuestionario Del Comportamiento Del Consumidor
Aún no hay calificaciones
Cuestionario Del Comportamiento Del Consumidor
6 páginas
Requisitos Grado y Título SUNEDU vs Ley 30220
Aún no hay calificaciones
Requisitos Grado y Título SUNEDU vs Ley 30220
1 página
Examen Parcial Tecnología de Materiales
Aún no hay calificaciones
Examen Parcial Tecnología de Materiales
7 páginas
Reflexiones sobre Pedagogías de las Diferencias
Aún no hay calificaciones
Reflexiones sobre Pedagogías de las Diferencias
4 páginas
Lineamientos Selección Docentes Ecuador
Aún no hay calificaciones
Lineamientos Selección Docentes Ecuador
14 páginas
Actividades y Laboratorios Médicos 2021
Aún no hay calificaciones
Actividades y Laboratorios Médicos 2021
1 página
Informe Del Tutor 2a
Aún no hay calificaciones
Informe Del Tutor 2a
5 páginas
Plan Lector Segundo Grado Septiembre 2024
Aún no hay calificaciones
Plan Lector Segundo Grado Septiembre 2024
20 páginas
Actividad 7 - Curriculum
Aún no hay calificaciones
Actividad 7 - Curriculum
6 páginas
MATRIZ DE NECESIDADES DE APRENDIZAJE POR COMPETENCIAS Parte 1
Aún no hay calificaciones
MATRIZ DE NECESIDADES DE APRENDIZAJE POR COMPETENCIAS Parte 1
5 páginas
Plan Anual de Juegos para Niños
Aún no hay calificaciones
Plan Anual de Juegos para Niños
2 páginas
Comunicación y Texto en Bachillerato
Aún no hay calificaciones
Comunicación y Texto en Bachillerato
283 páginas
Socialización del Sílabo de Sociología
Aún no hay calificaciones
Socialización del Sílabo de Sociología
3 páginas
España en El Corazón Ficha VOZVIVA
Aún no hay calificaciones
España en El Corazón Ficha VOZVIVA
4 páginas
Semana4 - INTERVENCIÓN PSICOPEDAGÓGICA EN LA MATEMÁTICA
Aún no hay calificaciones
Semana4 - INTERVENCIÓN PSICOPEDAGÓGICA EN LA MATEMÁTICA
9 páginas
Sílabo de Matemática para Arquitectura
Aún no hay calificaciones
Sílabo de Matemática para Arquitectura
8 páginas
Guía de Monitoreo Pedagógico
Aún no hay calificaciones
Guía de Monitoreo Pedagógico
19 páginas
Louis Not
Aún no hay calificaciones
Louis Not
4 páginas
Preguntas de Comunicacion 3
Aún no hay calificaciones
Preguntas de Comunicacion 3
8 páginas
Constancia de Inglés PAU 2024
Aún no hay calificaciones
Constancia de Inglés PAU 2024
25 páginas