Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sistema Tararira
Evaluación y Conclusiones
Resumen
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Base de datos
Música en notación simbólica (ej. MIDI)
Enfoque de búsqueda
Comparación de notas (enfoque tradicional)
Comparación de series temporales (enfoque reciente)
Comparación de notas
Método
Transcripción de la consulta a una secuencia de notas
Búsqueda de las mejores ocurrencias del patrón de notas
Inconvenientes
Los errores de la transcripción deterioran el desempeño
Comparación de notas
Método
Transcripción de la consulta a una secuencia de notas
Búsqueda de las mejores ocurrencias del patrón de notas
Inconvenientes
Los errores de la transcripción deterioran el desempeño
Método
Estimación de la frecuencia fundamental (F0) de la voz
Comparación con melodías codificadas como series
temporales de altura
Inconvenientes
El tiempo computacional se torna intolerable
La consulta debe ser un fragmento de melodía
previamente definido
Método
Estimación de la frecuencia fundamental (F0) de la voz
Comparación con melodías codificadas como series
temporales de altura
Inconvenientes
El tiempo computacional se torna intolerable
La consulta debe ser un fragmento de melodía
previamente definido
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Transcripción
Estimación de F0 para establecer altura de las notas
Segmentación de audio para detectar límites entre notas
Análisis melódico para ajustar alturas a escala temperada
Transcripción
Estimación de F0 para establecer altura de las notas
Segmentación de audio para detectar límites entre notas
Análisis melódico para ajustar alturas a escala temperada
Transcripción
Estimación de F0 para establecer altura de las notas
Segmentación de audio para detectar límites entre notas
Análisis melódico para ajustar alturas a escala temperada
Transcripción
Estimación de F0 para establecer altura de las notas
Segmentación de audio para detectar límites entre notas
Análisis melódico para ajustar alturas a escala temperada
Transcripción
Estimación de F0 para establecer altura de las notas
Segmentación de audio para detectar límites entre notas
Análisis melódico para ajustar alturas a escala temperada
Búsqueda
Codificación de notas invariante a la altura y al tempo
Encontrar ocurrencias usando reglas de similitud flexibles
Refinamiento usando series temporales de altura
Búsqueda
Codificación de notas invariante a la altura y al tempo
Encontrar ocurrencias usando reglas de similitud flexibles
Refinamiento usando series temporales de altura
Búsqueda
Codificación de notas invariante a la altura y al tempo
Encontrar ocurrencias usando reglas de similitud flexibles
Refinamiento usando series temporales de altura
Búsqueda
Codificación de notas invariante a la altura y al tempo
Encontrar ocurrencias usando reglas de similitud flexibles
Refinamiento usando series temporales de altura
Búsqueda
Codificación de notas invariante a la altura y al tempo
Encontrar ocurrencias usando reglas de similitud flexibles
Refinamiento usando series temporales de altura
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Problemas
Voz cantada el instrumento musical más difíciles de tratar
La consulta no está afinada a la escala temperada
Ecuación diferencia
d(τ ) = W 2
P
j=1 (xj − xj+τ )
Segmentación de audio
Segmentación de audio
Algoritmo
Busca indicios de eventos en:
la envolvente de amplitud
el contorno de frecuencia fundamental
Cambios de energía
Cambios de altura
Segmentación de audio
Inicio de notas
Análisis melódico
Análisis melódico
Problema
La consulta no respeta la
referencia ni los intervalos
de la escala temperada
Método de ajuste
Hipótesis: tono de
referencia en mente
Estimación mediante
la desviación más
frecuente
Análisis melódico
Transcripción de la consulta
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Búsqueda
Requerimientos
Una melodía puede identificarse a pesar de ser interpretada:
a diferente altura
a diferente tempo
con modificaciones o errores esporádicos
Algoritmo
El algoritmo provee:
invarianza a la altura y tempo en la codificación de notas
tolerancia a errores mediante reglas de similitud flexibles
Codificación
Búsqueda
Codificación
Intervalos de altura
A = (a1 , a2 , . . . , an ) → A = (a2 − a1 , a3 − a2 , . . . , an − an−1 )
Duraciones relativas
D = (d1 , d2 , . . . , dn ) → D = ( dd21 , dd23 , . . . , dn−1
dn
)
Búsqueda
Comparación de notas
Comparación de caracteres
Distancia de Edición
combinando altura y
duración
Calculada usando
Programación Dinámica
Deformación Temporal
Dinámica Local (LDTW)
Comparación de notas permite:
Grupo reducido de
candidatos
Identificación de
fragmentos de melodía
similares
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Evaluación
Canto Tarareo
Cortas Largas Cortas Largas
Número de consultas 68 242 85 32
Promedio de notas 11.15 25.81 12.03 22.40
Top 1 ( %) 73.53 76.86 75.00 83.52
Top 10 ( %) 80.88 83.06 90.62 89.41
Contenido
1 Motivación
El problema
Antecedentes
Visión general del sistema
2 Sistema Tararira
Transcripción
Búsqueda
3 Evaluación y Conclusiones
Evaluación
Conclusiones
Conclusiones
Requerimientos de desarrollo
Un sistema de búsqueda por melodía cantada debe:
ser tolerante a errores de la consulta
no restringir la forma de cantar
retornar unicamente la pieza buscada
permitir la extensión sencilla de la base de datos
Contribuciones
Sistema de transcripción de voz suficientemente robusto
Combinación novedosa de técnicas de búsqueda
de Cheveigné, A. y Kawahara, H.
Yin, a fundamental frequency estimator for speech and
music.
JASA, 111:1917–1930, 2002.
Klapuri, A.P.
Sound onset detection by applying psichoacoustic
knowledge.
ICASSP, 1999.
Pollastri, E. and Haus G.
An audio front end for query-by-humming systems.
Proc. of ISMIR, 2001.