The Latin Music Database: Uma Base de Dados Para a Classificacao Autom´ tica de Gˆ neros Musicais ¸˜ a e
Carlos N. Silla Jr.1 , Celso A. A. Kaestner2 , Alessandro L. Koerich1 Pontif´cia Universidade Cat´ lica do Paran´ (PUC-PR) ı o a Programa de P´ s-Graduacao em Inform´ tica Aplicada (PPGIA) o ¸˜ a
2 1
Universidade Tecnol´ gica Federal do Paran´ (UTFPR) o a Curitiba - PR - Brasil
silla@ppgia.pucpr.br, kaestner@utfpr.edu.br, alekoe@ppgia.pucpr.br
Abstract. In this paper we present the Latin Music Database, a novel database of Latin musical recordings which was developed for automatic music genre classification but can also be used to other tasks related to music information retrieval (MIR) research. The method for assigning genres to the musical recordings is a novel one and it is based on human perception. Furthermore, the underlying framework allows that the database can be easily expanded and have all the features desired by the research community of audio information retrieval. Resumo. Este artigo descreve a Latin Music Database, uma base de dados nova e in´ dita, que foi originalmente criada para experimentos relacionados a e classificacao autom´ tica de gˆ neros musicais, mas que pode ser utilizada para ¸˜ a e diversas tarefas relacionadas a recuperacao autom´ tica de informacoes musi¸˜ a ¸˜ cais (MIR). O m´ todo para atribuicao de gˆ neros musicais tamb´ m e in´ dito e e ¸˜ e e ´ e e baseado na percepcao humana. Al´ m disso, e apresentado o framework de¸˜ e ´ ´ senvolvido que garante que a base de dados seja facilmente expans´vel e tenha ı todas as caracter´sticas desejadas atualmente pela comunidade cient´fica da ı ı area de recuperacao autom´ tica de informacoes musicais. ¸˜ a ¸˜ ´
1. Introducao ¸˜
´ A area de recuperacao autom´ tica de informacoes musicais tem recebido cada vez mais ¸˜ a ¸˜ ´ atencao nos ultimos anos. Contudo apesar da grande quantidade de m´ todos e aplicacoes ¸˜ e ¸˜ que surgem, o n´ mero de bases de dados p´ blicas e confi´ veis para realizar experimenu u a ´ pequeno. Considerando os trabalhos da area de classificacao autom´ tica de ´ tos ainda e ¸˜ a gˆ neros musicais, que foram impulsionados pelo trabalho de Tzanetakis & Cook [9] que e apresentaram a tarefa de classificacao autom´ tica de gˆ neros musicais como sendo um ¸˜ a e problema de reconhecimento de padr˜ es, existe um d´ ficit muito grande em bases de dao e dos que contenham um n´ mero suficiente de exemplos e que tenham sido rotuladas de u forma a permitir que a base seja utilizada em outros experimentos. Essa quest˜ o s´ foi recentemente abordada no trabalho de McKay et al. [7] onde a o s˜ o descritas as caracter´sticas desejadas na construcao de novas bases de dados musicais, a ı ¸˜ de forma que elas sejam realmente aproveitadas pela comunidade cient´fica ao inv´ s de ı e terem sem uso limitado a dois ou trˆ s experimentos, como normalmente acontece. Neste e ´ mesmo trabalho de McKay et al. [7] e apresentada a base de dados CODAICH, que possui 20.894 m´ sicas no formato MP3 de 1.941 artistas. De acordo com este trabalho, u as caracter´sticas desejadas em novas bases de dados s˜ o: ı a
1. Os dados devem ser distribu´dos para os pesquisadores de forma livre e legal (em ı funcao das quest˜ es de direitos autorais). ¸˜ o 2. A base de dados deve conter diferentes tipos de m´ sica. u 3. A base de dados deve incluir um grande n´ mero de m´ sicas. u u 4. A base de dados deve incluir uma quantia significativa de m´ sicas comerciais, u pois os usu´ rios finais est˜ o principalmente interessados em m´ sicas produzidas a a u profissionalmente. 5. Cada m´ sica deve ser rotulada com a maior diversidade de campos poss´veis, de u ı forma a permitir que a base de dados seja utilizada em uma ampla gama de experimentos. 6. Idealmente, seria poss´vel atribuir r´ tulos n˜ o apenas para a m´ sica como um ı o a u todo, mas tamb´ m para os seus segmentos. e 7. Os r´ tulos de campos subjetivos como gˆ nero ou humor (mood) devem permitir o e uma ampla variedade de r´ tulos poss´veis. o ı 8. A atribuicao dos r´ tulos deve ser correta, completa e consistente. ¸˜ o ´ 9. Deve ser poss´vel atribuir m´ ltiplos r´ tulos independentes para um unico campo, ı u o para que seja poss´vel, por exemplo, classificar uma m´ sica como swing e blues. ı u 10. Meta informacoes devem ser fornecidas aos usu´ rios em formatos que sejam ¸˜ a f´ ceis tanto de lidar manualmente quanto usando ferramentas autom´ ticas. a a 11. M´ sicas inteiras devem estar acess´veis, mesmo que de forma indireta, e n˜ o u ı a apenas trechos das m´ sicas. u 12. Considerando que diferentes m´ todos de compress˜ o podem influenciar os valoe a ´ res das caracter´sticas extra´das, o(s) formato(s) de audio mais comuns ao p´ blico ı ı u devem ser utilizados de forma que os experimentos realizados possam refletir condicoes realistas. ¸˜ ´ Al´ m da CODAICH database, as unicas bases de dados atualmente dispon´veis e ı para a tarefa de classificacao autom´ tica de gˆ neros musicais s˜ o: a base de dados ¸˜ a e a GTZAN, desenvolvida no trabalho de Tzanetakis & Cook [9], que possui 1.000 m´ sicas u de 10 gˆ neros distintos (Blues, Cl´ ssica, Country, Disco, Hiphop, Jazz, Metal, Pop, Rege a gae e Rock), sendo 100 m´ sicas de cada gˆ nero; e a base de dados desenvolvida no u e trabalho de Homburg et al. [3], que possui 1.886 m´ sicas obtidas a partir do site Garau geband. A base est´ dividida em 9 gˆ neros sendo: Blues (120); Electronic (113); Jazz a e (319); Pop (116); Rap/HipHop (300); Rock (504); Folk/Country (222); Alternative (145); Funk/Soul (47). Por´ m essas duas bases possuem s´ rias limitacoes: na primeira est˜ o dispon´veis e e ¸˜ a ı ´ apenas os primeiros 30 segundos de cada m´ sica no formato de audio PCM. Na segunda u est˜ o dispon´veis apenas 10 segundos extra´dos de segmentos aleat´ rios de cada m´ sica. a ı ı o u Com excecao dessas duas bases, as demais bases utilizadas na literatura normalmente ¸˜ possuem poucas m´ sicas, e os gˆ neros utilizados s˜ o normalmente os mesmos (Rock, u e a Cl´ ssica) e normalmente os gˆ neros s˜ o disjuntos, ou seja, n˜ o existem trabalhos com a e a a subgˆ neros realmente pr´ ximos como House e Trance. e o ´ Neste trabalho e apresentada a Latin Music Database e como todos os requisitos desej´ veis para a construcao de uma nova base de dados foram abordados no seu desena ¸˜ volvimento. O restante deste trabalho est´ organizado da seguinte maneira: na secao 2 s˜ o a ¸˜ a apresentados os detalhes referentes a Latin Music Database e o framework desenvolvido para trabalhar com a mesma; e na secao 3 s˜ o apresentadas as conclus˜ es deste trabalho. ¸˜ a o
2. Aspectos Referentes a Latin Music Database e seu Framework
Como visto na secao anterior as bases de dados existentes para realizar a tarefa de ¸˜ classificacao autom´ tica de gˆ neros musicais possuem uma s´ rie de problemas e/ou ¸˜ a e e
limitacoes. Dessa forma existe a necessidade do desenvolvimento de uma nova base de ¸˜ dados para a tarefa, por´ m no intuito de desenvolver uma base de dados confi´ vel e que e a ´ possa ser utilizada como ground-truth em outras pesquisas da area (n˜ o limitadas apenas a a classificacao autom´ tica de gˆ neros musicais) uma s´ rie de cuidados foram tomados. ¸˜ a e e Essas precaucoes s˜ o apresentadas a seguir. ¸˜ a 2.1. Criacao e Manutencao da Base de Dados ¸˜ ¸˜ ´ Tendo em vista as limitacoes das bases desenvolvidas nos trabalhos anteriores na area de ¸˜ classificacao autom´ tica de gˆ neros musicais [2] [4], surgiu a necessidade do desenvolvi¸˜ a e mento de uma nova base de dados para a tarefa. Por´ m considerando o esforco humano e ¸ necess´ rio para fazer a atribuicao manual de gˆ neros as m´ sicas, e tamb´ m que uma base a ¸˜ e u e desenvolvida com cuidado poderia ser utilizada em outras tarefas al´ m da classificacao e ¸˜ autom´ tica de gˆ neros musicais, foi necess´ rio planejar como seria realizada a atribuicao a e a ¸˜ dos gˆ neros e o armazenamento, acesso e recuperacao dessas informacoes. e ¸˜ ¸˜ Antes de iniciar o processo de aquisicao, classificacao e armazenamento das ¸˜ ¸˜ m´ sicas foi definido que seriam adquiridas pelo menos 3.000 m´ sicas de 10 gˆ neros disu u e ´ tintos de forma a poder fazer uma contribuicao real para a area, visto que at´ ent˜ o a base ¸˜ e a de dados mais abrangente (GTZAN) era composta por 1.000 m´ sicas (limitadas a apenas u os primeiros trinta segundos) de 10 gˆ neros. e 2.2. O Processo de Atribuicao de Gˆ neros Musicais ¸˜ e ´ Neste trabalho o processo utilizado para atribuir um gˆ nero a cada m´ sica, e baseado na e u ´ percepcao humana de como cada m´ sica e dancada. Para realizar esse processo foram ¸˜ u ¸ consultados dois profissionais com mais de dez anos de experiˆ ncia no ensino de danca e ¸ e dancas de sal˜ o. Esses profissionais fizeram uma primeira selecao das m´ sicas que ¸ a ¸˜ u eles julgavam pertinentes a um determinado gˆ nero de acordo com a forma que este era e dancado e o primeiro autor deste trabalho verificou cada uma das m´ sicas inicialmente ¸ u selecionadas para evitar que equ´vocos fossem cometidos devido ao desgaste produzido ı pelo esforco humano necess´ rio para realizar a tarefa. Em m´ dia foram classificadas 300 ¸ a e m´ sicas por mˆ s, sendo que o processo total para a criacao da base de dados demorou um u e ¸˜ ano. Como resultado desse esforco, foi desenvolvida a Latin Music Database que conta ¸ com 3.160 m´ sicas de 10 gˆ neros musicais no formato MP3. Os gˆ neros musicais disu e e pon´veis na base e seus respectivos n´ meros de m´ sicas s˜ o: Tango (404); Salsa (303); ı u u a Forr´ (315); Ax´ (304); Bachata (308); Bolero (302); Merengue (307); Ga´ cha (306); o e u Sertaneja (310); Pagode (301). No total a base possui 543 artistas diferentes. ´ E importante ressaltar que na base desenvolvida foi utilizado esse protocolo de inspecao humana utilizando uma perspectiva da percepcao humana de como as m´ sicas ¸˜ ¸˜ u s˜ o dancadas, pois ao contr´ rio do que foi sugerido no trabalho de Aucouturier & Pachet a ¸ a [1] de utilizar CDs de colecoes completas, no caso dos ritmos latinos essa abordagem se ¸˜ mostrou ineficiente. Por exemplo, no caso da coletˆ nea de quatro CDs (Los 100 Mayores a Exitos De La Musica Salsa) apenas metade (50 das 100) das m´ sicas podem ser classiu ficadas como Salsa, as demais m´ sicas dessa coletˆ nea s˜ o de outros gˆ neros musicais u a a e como Merengue, Lambada, Zouk e at´ mesmo Samba. Outra opcao teria sido basear a e ¸˜ ´ classificacao de todas as trilhas de um determinado album de acordo com o perfil do ar¸˜ tista, dessa forma todas as m´ sicas de Carlos Gardel seriam classificados como Tango, u ´ importante ressaltar, que de todas as suas mais de 500 composicoes apenas cerca por´ m e e ¸˜ de 400 s˜ o Tangos, dessa forma introduzindo ru´do desnecess´ rio na base. Por esse moa ı a tivo todas as m´ sicas utilizadas nesta base foram avaliadas manualmente e somente aqueu las que realmente pertencem aos gˆ neros em quest˜ o foram rotuladas como sendo desses e a
gˆ neros. E mesmo no caso de outros artistas de um determinado gˆ nero, como Salsa, e e ´ muito dificilmente todas as trilhas de seus albuns s˜ o apenas Salsas. a Ao longo do processo de criacao da base foi observado que normalmente cerca de ¸˜ uma a trˆ s m´ sicas n˜ o s˜ o do gˆ nero principal do perfil do artista. e u a a e ´ 2.3. Armazenamento, Acesso e Recuperacao das Musicas ¸˜ Al´ m da aquisicao das m´ sicas e suas respectivas atribuicoes de gˆ nero, para o desenvole ¸˜ u ¸˜ e vimento da base e sua ampla utilizacao em outras tarefas, v´ rias reflex˜ es foram realizadas ¸˜ a o no sentido de: criar uma base que possa ser facilmente utilizada para outras tarefas; permitir total reprodutibilidade dos experimentos realizados; evitar duplicidade nas m´ sicas u cadastradas; facilitar o registro de novas m´ sicas e/ou novos gˆ neros. As reflex˜ es reau e o lizadas no desenvolvimento do framework refletem os requisitos desejados apresentados no trabalho de McKay et al. [7] e listados anteriormente. Dessa forma, tendo em mente ` esses v´ rios requisitos, nesta secao s˜ o apresentadas as solucoes adotadas para atingir a ¸˜ a ¸˜ esses objetivos. O processo de armazenamento de uma nova m´ sica na base ocorre da u seguinte forma: 1. Atribuicao de um gˆ nero a m´ sica em quest˜ o seguindo o procedimento descrito ¸˜ e u a na Subsecao 2.2; ¸˜ 2. Inspecao manual do r´ tulo ID3 da m´ sica para verificar se os campos est˜ o preen¸˜ o u a chidos corretamente e tamb´ m de corrigi-los/adapt´ -los a um padr˜ o simples que e a a consiste na padronizacao dos nomes e no uso do caractere especial & para indicar ¸˜ o nome de mais de um artista na mesma m´ sica. Os campos obrigat´ rios para u o cadastrar uma nova m´ sica s˜ o o Artista e o T´tulo da m´ sica. A raz˜ o para essa u a ı u a ´ abordagem e simples, mesmo que apenas uma pessoa esteja trabalhando no ca´ dastro de m´ sicas na base de dados, eventualmente albuns do mesmo artista v˜ o u a ´ conter trilhas com m´ sicas presentes em outros albuns, como por exemplo, no u ´ caso de um album com os maiores sucessos de um artista. Dessa forma, esse procedimento permite evitar duplicidade de m´ sicas interpretadas pelo mesmo artista u ´ na base. Esse controle de duplicidade e realizado no sistema quando uma nova m´ sica vai ser cadastrada. u 3. Cadastramento da m´ sica no sistema. Nessa etapa o sistema obt´ m os dados u e da m´ sica, verifica se n˜ o h´ duplicidade, atribui um c´ digo identificador para u a a o a m´ sica, associa essa m´ sica ao gˆ nero pr´ -determinado e cria uma c´ pia da u u e e o ´ m´ sica. A informacao de qual o gˆ nero da m´ sica e armazenada no banco de dau ¸˜ e u dos pois como visto anteriormente o campo Genre dos r´ tulos ID3 n˜ o e confi´ vel. o a ´ a Al´ m disso, no caso de trabalhos futuros onde seja necess´ rio o uso de alguma e a hierarquia, essa modificacao pode ser incorporada facilmente ao sistema. No mo¸˜ mento do cadastramento o sistema gera uma c´ pia da m´ sica cadastrada em um o u diret´ rio pr´ -determinado seguindo a seguinte convencao: o e ¸˜ DIRETORIO_GENERO\ARTISTA - TITULO - ALBUM - TRACK.MP3 ´ o e onde DIRETORIO GENERO e um diret´ rio com o nome do gˆ nero associado a m´ sica, e ARTISTA, TITULO, ALBUM e TRACK s˜ o informacoes obtidas do u a ¸˜ ´ r´ tulo ID3 da m´ sica no momento em que ela e cadastrada. o u O acesso a base de dados pode ser feito de forma convencional atrav´ s do sistema e de arquivos do sistema operacional, pois como visto, o sistema utiliza uma estrutura de arquivos e algumas regras de convencao simples para cadastrar as m´ sicas. ¸˜ u As principais tabelas no sistema s˜ o: MUSIC, MUSIC INFO e GENRE. Os atria butos da tabela MUSIC s˜ o o ID (Chave prim´ ria) e a localizacao da m´ sica no sistema a a ¸˜ u de arquivos. Os atributos da tabela MUSIC INFO s˜ o as chaves prim´ rias das tabelas a a
´ MUSIC e GENRE, o t´tulo da m´ sica, o nome do artista, o nome do album, o bitrate e ı u o sample rate da m´ sica. Os atributos da tabela GENRE s˜ o o ID (Chave prim´ ria) e o u a a ´ nome do gˆ nero. Com essa descricao textual e poss´vel perceber que a tabela que faz o ree ¸˜ ı ´ lacionamento entre as m´ sicas e seus respectivos gˆ neros e a tabela MUSIC INFO, dessa u e forma, se fosse necess´ rio que uma mesma m´ sica tivesse mais de um gˆ nero poss´vel, a u e ı isso poderia ser facilmente adequado no sistema. Outro motivo pelo uso de banco de dados para armazenar as informacoes e para garantir a integridade dos r´ tulos associados as ¸˜ ´ o m´ sicas cadastradas no sistema. u Al´ m dessas trˆ s tabelas principais, o framework possui outras tabelas referene e tes as caracter´sticas extra´das de diferentes segmentos da m´ sica, sendo uma tabela para ı ı u cada segmento. A vantagem de utilizar tabelas para armazenar as caracter´sticas de diı ´ ferentes segmentos e que uma vez que foi implementado o m´ todo para gerar em algum e formato de sa´da, como por exemplo, arquivos no formato .arff (utilizado pela ferramenta ı WEKA[10] para mineracao de dados), ele pode ser aplicado a qualquer tabela que con¸˜ ´ tenha caracter´sticas extra´das do sinal de audio. ı ı No que diz respeito a reprodutibilidade dos experimentos, com essa abordagem, todas as m´ sicas dispon´veis na base de dados tem dispon´veis as informacoes de Artista u ı ı ¸˜ e T´tulo. Com essas informacoes e poss´vel criar junto com os arquivos arffs, gerados ı ¸˜ ´ ı para os experimentos, uma lista das m´ sicas utilizadas na mesma ordem em que elas v˜ o u a ser utilizadas pelo m´ dulo de classificacao. O arquivo utilizado para armazenar essa lista o ¸˜ ´ ´ e chamado de SAL (Song Artist List). O SAL e uma melhor forma de representar essa informacao por trˆ s motivos: ¸˜ e 1. Algumas vezes artistas diferentes interpretam as mesmas m´ sicas (por´ m, as veu e zes, at´ mesmo em ritmos diferentes), logo utilizar apenas o T´tulo da m´ sica n˜ o e ı u a ´ e suficiente; 2. Utilizar o ID da m´ sica fornecido pelo sistema n˜ o e confi´ vel, pois se por alu a ´ a gum motivo for necess´ rio re-cadastrar todas as m´ sicas, elas dificilmente v˜ o ser a u a cadastradas na mesma ordem em que foram cadastradas originalmente; 3. Pode ser que ao observar a lista das m´ sicas utilizadas seja mais f´ cil de interpretar u a os resultados obtidos. J´ um m´ dulo para extracao das caracter´sticas e seu armazenamento em banco a o ¸˜ ı ´ de dados e uma opcao interessante n˜ o apenas visando a reprodutibilidade dos experi¸˜ a mentos, mas tamb´ m em relacao ao tempo computacional necess´ rio para calcular as e ¸˜ a caracter´sticas de cada m´ sica. Atualmente o framework utilizado para extracao de caı u ¸˜ ´ racter´sticas e o Marsyas [8] que extrai um total de 30 caracter´sticas referentes a textura ı ı ` ` timbral (Timbral texture), relacionadas a batida (beat-related) e relacionadas as variacoes ¸˜ da freq¨ encia da vibracao (pitch-related). Caracter´sticas de textura timbral incluem a uˆ ¸˜ ı m´ dia e a variˆ ncia do centr´ ide espectral, do rolloff espectral, do fluxo espectral, das e a o taxas de cruzamento zero, dos Coeficientes Cepstrais de Freq¨ encia-Mel, e da baixa eneruˆ ` gia. Caracter´sticas relacionadas a batida incluem as amplitudes relativas e as batidas por ı minuto. As caracter´sticas relacionadas ao pitch incluem os per´odos m´ ximos do pico do ı ı a pitch nos histogramas. Estas caracter´sticas formam vetores de trinta dimens˜ es (Textura ı o Timbral: 9 STFT + 10 MFCC; Ritmo: 6; Pitch: 5). 2.4. Distribuicao ¸˜ ´ Um requisito importante apresentado no trabalho de McKay et al. [7] e sobre como realizar a distribuicao de bases de dados musicais, pois as m´ sicas comercias possuem leis de ¸˜ u direitos autorais que n˜ o permitem que elas sejam livremente distribu´das pela internet. a ı
´ Uma solucao apresentada no trabalho de McEnnis et al. [5] e baseada na ¸˜ centralizacao de diversas bases de dados musicais e seu acesso atrav´ s de um frame¸˜ e work que possibilite aos pesquisadores obterem informacoes sobre as m´ sicas cadastradas ¸˜ u ´ nesse sistema. Esse framework e denominado OMEN (On demand Metadata ExtractioN) ´ e sua principal funcionalidade e fornecer uma interface onde o pesquisador seleciona quais as caracter´sticas que deseja trabalhar e a forma como elas devem ser extra´das das ı ı m´ sicas dispon´veis. Atualmente este framework utiliza o JAudio [6] para extracao de u ı ¸˜ caracter´sticas. Caso o pesquisador deseje utilizar um m´ todo que n˜ o exista na plataı e a forma, existe a opcao de submeter os c´ digos fontes em Java para realizar a extracao. ¸˜ o ¸˜ Dessa forma, os pesquisadores obtˆ m as informacoes que precisam das m´ sicas, atrav´ s e ¸˜ u e ´ de meta-informacoes textuais, sem precisar ter acesso aos arquivos de audio. ¸˜ A Latin Music Database ainda n˜ o est´ dispon´vel atrav´ s do OMEN, mas a a ı e os procedimentos necess´ rios para inclu´-la est˜ o sendo tomados. Informacoes sobre a ı a ¸˜ como obter a Latin Music Database, assim como os vetores de caracter´sticas preı viamente computados das m´ sicas utilizando o Marsyas podem ser encontrados em u http://www.ppgia.pucpr.br/∼silla/lmd/.
3. Conclus˜ es o
Neste trabalho foi apresentada a Latin Music Database, uma base de dados in´ dita e dee senvolvida originalmente para a tarefa de classificacao autom´ tica de gˆ neros musicais. ¸˜ a e A Latin Music Database juntamente com o framework desenvolvido atendem a todas as caracter´sticas desejadas listadas no trabalho de McKay et al. [7], pois a base ı contˆ m 3.160 m´ sicas comerciais de 10 gˆ neros musicais no formato MP3. O uso de e u e tabelas em banco de dados para armazenar as informacoes das m´ sicas permitem que ¸˜ u tanto novos campos sejam adicionados facilmente como atribuir mais de um gˆ nero para e ´ e a mesma m´ sica. O processo para realizar a atribuicao de gˆ neros as m´ sicas e in´ dito, u ¸˜ e u e consiste no uso da percepcao humana de como as m´ sicas s˜ o dancadas. Para reali¸˜ u a ¸ zar o procedimento de rotulacao foram consultados professores de danca de sal˜ o com ¸˜ ¸ a mais de dez anos de experiˆ ncia. Dessa forma, tornando o conhecimento de gˆ neros e e musicais t´ cito desses especialistas em conhecimento explicito. As caracter´sticas s˜ o exa ı a tra´das utilizando o framework Marsyas e est˜ o dispon´veis no formato .arff. Os vetores ı a ı de caracter´sticas previamente computados das m´ sicas da Latin Music Database est˜ o ı u a dispon´veis em http://www.ppgia.pucpr.br/∼silla/lmd/. ı Como trabalho futuro, al´ m da inclus˜ o de novos gˆ neros musicais, a base atual e a e deve ser classificada de acordo com uma hierarquia de gˆ neros. Por exemplo, o gˆ nero e e forr´ seria o gˆ nero principal dos subgˆ neros: xote, xaxado e bai˜ o. o e e a
Referˆ ncias e
[1] J. J. Aucouturier and F. Pachet. Representing musical genre: A state of the art. Journal of New Music Research, 32(1):83–93, 2003. [2] M. Grimaldi, P. Cunningham, and A. Kokaram. A wavelet packet representation of audio signals for music genre classification using different ensemble and feature selection techniques. In Proceedings of the 5th ACM SIGMM international workshop on Multimedia information retrieval, pages 102–108, Berkeley, California, 2003. ACM Press. [3] H. Homburg, I. Mierswa, B. M¨ ller, K. Morik, and M. Wurst. A benchmark dataset o for audio classification and clustering. In Proceedings of the Sixth International
Conference on Music Information Retrieval (ISMIR’05), pages 528–531, London, UK, 2005. [4] T. Li, M. Ogihara, and Q. Li. A comparative study on content-based music genre classification. In Proceedings of the 26th annual international ACM SIGIR Conference on Research and Development in Informaion Retrieval, pages 282–289, Toronto, Canada, 2003. [5] D. McEnnis, C. McKay, and I. Fujinaga. Overview of on-demand metadata extraction network (omen). In Proceedings of the Seventh International Conference on Music Information Retrieval (ISMIR’06), 2006. [6] D. McEnnis, C. McKay, I. Fujinaga, and P. Depalle. Jaudio: A feature extraction library. In Proceedings of the Sixth International Conference on Music Information Retrieval (ISMIR’05), pages 600–603, London, UK, 2005. [7] C. McKay, D. McEnnis, and I. Fujinaga. A large publicly accessible database of annotated audio for music research. In Proceedings of the Seventh International Conference on Music Information Retrieval (ISMIR’06), 2006. [8] G. Tzanetakis and P. Cook. Marsyas: A framework for audio analysis. Organized Sound, 4(3):169–175, 1999. [9] G. Tzanetakis and P. Cook. Musical genre classification of audio signals. IEEE Transactions on Speech and Audio Processing, 10(5):293–302, 2002. [10] I. H. Witten and E. Frank. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann, San Francisco, 2nd edition, 2005.