Está en la página 1de 6

Universidad del Valle de Guatemala

Facultad de Ingeniera
Departamento de Ciencia de la Computacin

Clasificador de Msica en Base a Estados Anmicos Basndonos en Anlisis de


Seales y el Contexto Cultural de Guatemala
I.

DESCRIPCION GENERAL DEL TRABAJO


El proyecto consiste en la implementacin de un sistema que pueda
clasificar msica en base al estado anmico que esta genera en el oyente,
basndonos en un modelo psicolgico de clasificacin de estado de animo
bajo el contexto cultural guatemalteco y un set de caractersticas acsticas
que se analizarn de la meloda. Se construirn dos aplicaciones, una para
la recoleccin de datos de las canciones evaluadas por personas
guatemaltecas y otra para la clasificacin de la msica utilizando tcnicas
de aprendizaje supervisado. Todo el cdigo, modelos del diseo y
documentacin se trabajar en un repositorio de Github abierto para
permitir que otros estudiantes colaboren en el futuro con el proyecto.
Todo el desarrollo del proyecto se dar dentro de la Universidad del Valle de
Guatemala, utilizando en su momento estudiantes o cualquier otra persona
guatemalteca para entrenar el algoritmo y poder darle informacin que le
permita comprender la induccin de estados anmicos de la msica en un
oyente guatemalteco. Finalmente se presentarn los resultados de una
prueba en donde se subirn nuevas canciones que sern clasificadas
automticamente y se compararn con las evaluaciones realizadas por las
personas al inicio del trabajo.

II.

DEFINICION DEL PROBLEMA


Investigaciones que exploran el problema:
Automatic Mood Detection from Acoustic Music Data Tshingua
University:
http://esf.ccarh.org/254/254_LiteraturePack1/Emotion1_MoodDetectio
n(Liu).pdf
A method for Music Classification based on Perceived Mood Detection
for Indian Bollywood Music: http://waset.org/publications/15269/amethod-for-music-classification-based-on-perceived-mood-detectionfor-indian-bollywood-music
Mood
Tracking
of
Musical
Compositions:
http://link.springer.com/chapter/10.1007%2F978-3-642-346248_27#page-1
State
of
the
Art
on
Music
Emotion
Recognition:
http://ismir2010.ismir.net/proceedings/ismir2010-45.pdf
El Proyecto pretende aportar datos y resultados que sean relevantes para la
investigacin de la deteccin de emociones en la msica dentro del
contexto cultural guatemalteco. Adems, el proyecto busca explorar la

rama de extraccin de informacin musical relevante de las ondas de


sonido y encontrar relaciones entre las caractersticas sonoras y los estados
de animos inducidos en el oyente. Existen muchas investigaciones que han
desarrollado deteccin de emociones en contextos americano, europeos o
hinds. Sin embargo, existen diferencias en los resultados que son
atribuidas a contextos culturales. Una implementacin bajo un contexto
guatemalteco podra aportar resultados en cuanto a cmo los oyentes
guatemaltecos reaccionan a distintos tipos de msica. Esto puede aportar
en sistemas de reproduccin de msica para adaptar los algoritmos de
deteccin de emociones a la ubicacin de cada usuario y el contexto
cultural del mismo.
III.

JUSTIFICACION
La investigacin de la deteccin de emociones en la msica y la extraccin
de informacin a partir de las ondas sonoras de la pieza han sido muy
utilizados en plataformas de msica que se adapten al estado de nimo del
oyente, o incluso para el desarrollo de algoritmos que compongan melodas
similares, basndose en las caractersticas auditivas de las piezas dadas.
Uno de los grandes problemas con la deteccin de emociones es la
subjetividad de las mismas, pues dependiendo de los lugares donde se
encuentren los oyentes, sus contextos culturales y sociales, estos
reaccionan de manera distintas a las mismas canciones. Los resultados del
trabajo podrn compararse con resultados obtenidos en otras culturas para
conocer las diferencias en las predicciones de los algoritmos al ser
entrenados bajo contextos culturales distintos y as conocer que ajustes se
pueden realizar a nivel geogrfico en una para que plataforma musical que
necesite adaptarse a las emociones de oyentes de todo el mundo.

IV.

OBJETIVOS
Generales
Aplicar algoritmos que permitan la clasificacin de msica en base al
estado anmico que la misma expresa.

Explorar algoritmos de extraccin de datos de msica.

Explorar tcnicas de Machine Learning para clasificacin de datos.

Especficos:
Aplicar Algoritmos de clasificacin de machine learning como Naive
Bayes o Support Vector Machines en la clasificacin de msica.
Aplicar algoritmos como la transformada inversa de fourier, contrase
espectral por octavas, y mtodos estadsiticos de descripcin espectral
del audio para poder extraer caractersticas sonoras relevantes a la
emociones en una pieza musical.
Crear un set de datos con canciones etiquetadas por emocin
clasificados nicamente por personas guatemaltecas para futuros
estudios relacionados a este campo.

V.

MARCO TEORICO

K-mins
Support Vector Machines
Extraccin de Informacin de Msica
Fourier Transform
Fast Fourier Transform
Model Sinusoidal
Extraccin de Centroide del Audio
Extraccin de ancho de banda del audio
Extraccin de Rolloff del audio
Esquema de clasificacin Emociones:
Esquemas discretos vs esquemas continuos
Modelo de Russel en 2D
Model de Thayer
Model de Hevner
Model de Darwin
Paul Ekman clasificaciones
Affective computing
Categorical, dimensiona and appraisal models (firsyear report.pdf)
Music perception and culture http://emotionresearcher.com/musicalemotions-across-cultures/
Estados de nimo expresados por la msica vs estados de nimo percividos
por los oyentes.

VI.

MARCO METODOLOGICO
El desarrollo del proyecto iniciar con una investigacin a detalle de los
mtodos de extraccin de audio y de estudios previos relacionados al tema
de extraccin de emociones de la msica. Se investigarn los modelos de
clasificacin de emociones que existen, las tcnicas y algoritmos ms
importantes para extraer informacin como el ritmo, el timbre, la meloda o
la armona de una cancin y se investigar sobre los algoritmos necesarios
de Machine Learning para la clasificacin de la data. Para lograr una
investigacin ms slida se estudiar el curso: Audio Signal Processing for
Music Applications encontrado en Coursera, que iniciar en Septiembre de
este ao. Con el curso se espera obtener las bases tericas necesarias para
empezar con la implementacin del sistema de deteccin de emociones y
pasar a la parte de experimentacin y pruebas con personas.
Posteriormente se crear un set de datos con un mximo de 500 canciones
etiquetadas por su mood o emocin. Se realizarn tres evaluaciones por
cancin para determinar el estado anmico mayoritario y no sesgar la data
de prueba al criterio de una sola persona. Todo el set de datos ser

construido por personas guatemaltecas para evitar el sesgo cultural que


pueda existir al obtener sets de datos que ya existen en internet. Adems
se utilizar nicamente msica no comercial con licencia Creative Commons
por dos razones; Primero, evitamos el sesgo emocional que pueda existir en
individuos que ya han escuchado ciertas canciones al utilizar msica que no
es popular y seguramente no tendr ninguna asociacin a recuerdos o
situaciones personales de cada individuo. La segunda razn es para evitar
problemas de licensiamiento al utilizar msica comercial, ya que los
servicios que permiten obtener msica por streaming como Spotify, Deezer
o Last.FM nicamente ofrecen el servicio para el consumo de la msica y no
para el anlisis de la misma.
Una vez obtenidas las clasificaciones realizadas por persona y creado el set
de datos de entrenamiento, se iniciar la implementacin del algoritmo de
clasificacin tomando en cuenta nicamente las caractersticas sonoras de
la msica y las clasificaciones de mood obtenidas. Con el clasificador
desarrollado se podrn empezar a clasificar nuevas canciones y evaluar los
resultados del algoritmo con respecto al los corpus de cross validation y
pruebas.
Despus de analizar los resultados del clasficador, se har referencia a los
generos musicales de las canciones utilizadas para determinar correlaciones
entre los moods obtenidos por el clasificador y los generos. Esto nos dar la
oprtunidad para encontrar relaciones entre el mood y las caractersticas
sonoras. Estas datos sern analizados y discutidos para presentar
conclusiones y recomendaciones finales al clasificador.

VII.

DELIMITACIN
El desarrollo del proyecto se limitar tomar datos de evauacin de personas
guatemaltecas nicamente. Las clasificaciones de canciones obtenidas
sern de un mximo de 500 canciones y el tamao del corpus de datos
estar sujetos a la disponibilidad y cantidad de voluntarios que se logren
obtener durante el trabajo. Adems se buscaran modelos de clasificacin
de estados animicos existentes y se enfocar el anlisis de los datos en los
estados anmicos que expresa la msica a travs del anlisis de las seales
de audio y no en los estado anmicos o fisiolgicos particulares que son
inducidos en cada persona, ya que ste anlisis podra tornarse demasiado
extenso se convirtira el presente trabajo en un estudio de Psicologa y no
de Ciencias de la Computacin. No se tomarn datos fisiolgicos de las
personas ni se realizarn anlisis psicolgicos detallados de estas para no
desviar el trabajo de graduacin a la rama de psicologa, antropologa o
musicologa. Sin embargo se realizarn las investigaciones de literatura
pertinentes a estas ramas de estudio tener bases tericas para el anlisis
de los datos obtenidos y se realizar un pequeo cuestionario previo a la
toma de datos para medir las variables que sean viables controlar en

cuanto a tiempo, dinero y recursos humanos De esta manera se podr


enfocar el trabajo en anlisis de audio y las tcnicas de Machine Learning
del clasificador. Se enfocarn esfuerzos en gneros de msica popular
occidental para poder darles datos ms cercanos a la realidad de consumo
de msica del pas y crear un clasificador adaptado a este tipo de msica.
Se utilizarn tcnicas existentes de analisis de audio y extraccin de
caractersticas del sonido existentes para la creacin del clasificador y se
utilizarn el algoritmos de aprendizaje supervisado que ms se adapte al
problema en base a la investigacin que se realice durante el trabajo de
graducacin.
VII.

PLAN DE TRABAJO - CALENDARIO DE ACTIVIDADES


Fecha
15 Agosto 15 Octubre
15 Octubre 15 Diciembre
15 Diciembre 15 Febrero
15 Febrero 15 Mayo
15 Mayo 15 Julio
15 Agosto 15 Octubre

IX.

Actividad
Investigacin
de
Algoritmos
de
Extraccin de caractersticas de
msica
Desarrollo de aplicacin para recabar
datos y creacin de dataset de
entrenamiento para el algoritmo
Obtencin
y
anlisis
de
caractersticas
sonoras
de
las
canciones.
Elaboracin del clasificador utilizando
tcnicas
de
entrenamiento
supervisado.
Anlisis de Resultados y comparacin
de output del clasificador con
respecto a clasificaciones humanas.
Elaboracin de Informes finales y
presentacin de resultados.

REFERENCIAS BIBLIOGRAFICAS

Liu, C.-C. (Sin Fecha) Detecting and Classifying Emotion in Popular


Music, Graduate Institute of Communication Engineering, National Taiwan
University, , p. 4.
Li, T. and Ogihara, M. (Sin Fecha) Detecting emotion in music. Available at:
http://ismir2003.ismir.net/papers/Li.pdf (Accesado: 31 Julio 2016).
Hampiholi, V. (2012) A method for music classification based on perceived
mood detection for Indian Bollywood music, A method for Music
Classification based on Perceived Mood Detection for Indian Bollywood
Music, 6(12), p. 8.
Hampiholi, V. (2012) A method for music classification based on perceived
mood detection for Indian Bollywood music, A method for Music
Classification based on Perceived Mood Detection for Indian Bollywood
Music, 6(12), p. 8.

Hampiholi, V. (2012) A method for music classification based on perceived


mood detection for Indian Bollywood music, A method for Music
Classification based on Perceived Mood Detection for Indian Bollywood
Music, 6(12), p. 8.
Cope, D. (2005) Computer models of musical creativity (MIT press). The MIT
Press.
Cope, D. (2004) Virtual music: Computer synthesis of musical style (MIT
press). The MIT Press.
Miranda, E.R. (2000b) Readings in music and artificial intelligence
(contemporary music studies). Routledge.

También podría gustarte