Segue o conteúdo otimizado, mantendo o formato original:
MusicLM apresenta uma nova abordagem para a geração de música condicional, lançando-a como uma tarefa de modelagem hierárquica de sequência para sequência. A música gerada é consistente ao longo de vários minutos e produzida a 24 kHz, superando os sistemas anteriores em qualidade de áudio e aderência às descrições de texto de acordo com seus experimentos. Além disso, o MusicLM pode ser condicionado tanto no texto quanto na melodia, permitindo transformar melodias assobiadas e sussurradas para corresponder ao estilo descrito em uma legenda de texto.
Para apoiar mais pesquisas, a equipe lançou publicamente o MusicCaps, um conjunto de dados que inclui 5,5 mil pares de música e texto com descrições em rich text fornecidas por especialistas humanos. Este conjunto de dados servirá como um recurso valioso para futuros pesquisadores interessados em geração e análise de música.
No geral, o MusicLM oferece uma nova abordagem promissora para geração de música condicional e já demonstrou resultados superiores quando comparado aos sistemas anteriores. O lançamento do MusicCaps, sem dúvida, facilitará mais pesquisas e desenvolvimento no campo da música gerada por IA.