Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
con
los
de
msica
modelos
de
Markov
En este artculo investigamos si un
computador
puede
componer
msica que es tan agradable para el
oyente humano promedio como
msica compuesta por un ser
humano con experiencia moderada.
En nuestro sistema, la msica se
compone separando el proceso de
composicin en pasos, como la
progresin de acordes, la curva
meldica,
cadencia
y
as
sucesivamente, segn lo propuesto
por Hogberg.
Para cada uno de estos pasos, se
calcula parmetros para autmatas
probabilstico de datos de msica, a
continuacin,
utilizar
estos
autmatas
probabilstico
para
generar nuevas composiciones.
Nuestro sistema, Superwillow, es
una modificacin y extensin del
sistema de composicin Willow.
Willow es un sistema de msicacomposicin basada en reglas que
funciona en la premisa de que el
proceso de composicin puede ser
modelado por las operaciones de los
rboles
sobre
los
rboles
clasificados
usados
como
representacin
msica.
En
SuperWillow, msica simblico (ms
especficamente,
MusicXML,
ver
http: // www.musicxml.org/) se
utiliza para representar la msica
compuesta parcial obtenida despus
de cada uno de los pasos de
composicin.
Adems,
de
estilo
extensible
lenguaje y Document Object Model,
Nosotros
obtuvimos
resultados
prometedores: 38 por ciento de los
encuestados
en
la
encuesta
atribuyeron msica compuesta por
nuestro sistema de computador a
un compositor humano.
Implementacin
La construccin de autmatas
probabilstico para nuestro sistema
de
msica
requiere
filtracin,
extraccin, y anlisis de los datos de
msica. Un filtro se utiliza para
volver a mover las piezas musicales
que SuperWillow no puede analizar,
tal como una pieza con un cambio
de comps.
Esto
da
lugar
a
mltiples
probabilidades de transicin entre
estados qt1 y qt. La complicacin
introducida por orden superior MCs
puede eliminarse mediante el
aumento del nmero de estados y la
adicin de una historia de los
estados.
Para transformar una orden L-TH MC
a una primera orden MC, el espacio
de estados Q se sustituye por
Li=1 Qi
donde
Qi es el conjunto
de secuencias
longitud i.
de
estados
de
q0 el estado de inicio es la
El
espacio
de
Q;
: Qx Q
Es la funcin de
transicin de estado; y
p: Qx [0,1]
Es
la
cadena vaca
;y
Es un alfabeto finito de
smbolos visibles;
Es un conjunto finito de
estados ocultos;
a :Qx Q [0,1]
Es un mapeo
b :Qx [0,1]
Es un mapeo
: Q [0,1]
Es un mapeo
restricciones
se
Conversin
de
un
rbol
de
prediccin sufijo a un PSA se logra
mediante la adicin de todos los
prefijos que faltan para el espacio
de
estados
y
mediante
la
construccin de la
En el caso en el que la secuencia de
estado oculto y secuencia de
observacin estn disponibles como
datos
de
entrenamiento,
los
recuentos empricos se pueden
oculto
As
almacenados por
acompaamiento.
el
anlisis
de
El
alfabeto
oculto
es
una
combinacin del ndice de la nota de
meloda
en
el
escalar y su relacin con la nota
anterior, aunque no est muy oculta
porque las notas de la meloda
estn disponibles. La relacin a la
nota anterior, tambin conocido
como el contorno, se representa por
un signo ms, menos, o igual signo,
dependiendo de si la nota actual es
acordes
requiere
los
nmeros
romanos a representar acordes
reales. Estos acordes se extraen de
los datos de msica por el anlisis
de acompaamiento. El usuario
especifica qu voz es el plomo y que
se se aplica el anlisis de duracin
acorde acompaamiento. a la voz
de
acompaamiento.
Los
parmetros de la MC, que se utiliza
para modelar el acorde duraciones
Se calculan mediante el uso de
conjuntos
de
entrenamiento
contadores. La frecuencia son
simplemente listas de duraciones.
Estas
duraciones
se
calculan
mediante la agrupacin de igual a la
nota anterior la secuencia oculta de
la pieza de msica en la figura 4 es
{= 4, + 2, + 4, -1, + 3, -1} porque f
es el cuarto de tono en el C escala
mayor.
Anlisis de la msica
Despus de extraer la informacin
relevante de cada archivo MusicXML
utilizado como datos, la informacin
extrada se analiza para recuperar
los parmetros requeridos por las
operaciones XML. El ritmo, la escala
y tipo de comps se recuperan sin
rodeos. La duracin de acordes,
progresiones de acordes, y la
progresin
ritmo,
estn
todos
representados por la primera,
superior, las o-orden mezclada MCs.
El arco meldico es descrito por un
HMM de primera, superior, la oorden mezclada. Los acordes de la
progresin de acordes y el arco
meldico estn representados por
nmeros
romanos.
Generando
Generacin de msica
Despus
de
analizar
las
composiciones, los objetos de
anlisis se utilizan para generar
nuevas composiciones o imitar la
msica que se utiliza como datos de
entrenamiento. Generacin no se
logra mediante el clculo de la
secuencia ms probable de notas,
sino
ms
bien
mediante
un
muestreo de las distribuciones
obtenidas a partir del anlisis. En
primer
lugar,
un
estilo
de
generacin se elige aleatoriamente
o especificado por el usuario. A
continuacin, el tempo, comps,
escala
y
los
instrumentos
respectivos se eligen al azar de los
que se encuentran en el estilo
seleccionado.
Los MCs duracin de acordes y el
ritmo de progresin se utilizan para
generar una secuencia de valor de
la nota que resume a una duracin
especificada. Este proceso se logra
mediante la ampliacin del espacio
de estado. Adems del espacio de
estado PSA original, que incluye un
valor de duracin izquierda, que es
la duracin especificada menos la
duracin de los valores de las notas
sumadas en la secuencia generada.
La secuencia se genera as que al
final de la secuencia generada, el
valor a la izquierda duracin es igual
a cero.
Carmel es un paquete transductor
de estados finitos. Transductores,
que se generalizan los autmatas
con entrada y de salida smbolos en
las transiciones, 8 operan mediante
la produccin de smbolos de salida
como smbolos de entrada se
consumen. Carmel se utiliza para
tomar
muestras
de
las
distribuciones
creadas
por
el
anlisis de las composiciones se
utilizan
como
datos.
Ritmo
generacin, como se describe,
utiliza un autmata probabilstico
que se canaliza a travs de Carmel.
Progresin de acordes utiliza un
transductor
probabilstico
para
transformar una cadena de entrada
de la longitud de la progresin de
acordes necesario.
El arco meldico utiliza la
decodificacin de canal ruidoso
como se describe en el tutorial en el
sitio web del Carmel (ver
http://www.isi.edu/licensedsw/carmel/). Sobreajuste de los
datos de msica, pero no fue posible
reunir conjuntos de datos ms
grandes debido a limitaciones de
tiempo y los lmites impuestos a la
msica aceptados como datos por
SuperWillow.
Limitaciones de la composicin
Se
pidi
a
los
compositores
humanos para componer piezas con
dos instrumentos, uno de los
acordes Tocar y la otra una meloda,
de ms o menos ocho medidas de
longitud. Esto no incluye los
usuarios vuelo notaporque sus
composiciones fueron seleccionados
sobre la base de estos criterios. Las
composiciones se mantienen cortos
porque la msica generada por los
modelos de Markov no tienen una
estructura en voladizo. La falta de
voladizo
estructura,
incluyendo
frases y su ordenamiento, es ms
notable para las composiciones ms
largas. Las limitaciones impuestas a
las composiciones creadas por los
compositores humanos fueron los
siguientes:
Figura
5.
Histogramas
que
representan
el
porcentaje
de
encuestados que prefiere (a) una
composicin especfica y (b) al
menos una de las composiciones de
ordenador ms de la composicin
humana.
Conclusin
Los datos del estudio mostr que las
composiciones
humanos
siguen
siendo preferidos, sino tambin que
72 por ciento de los encuestados, o
bien no poda distinguir entre una
composicin
humana
y
el