Ecco il contenuto ottimizzato, mantenendo il formato originale:
MusicLM presenta un nuovo approccio alla generazione di musica condizionale presentandola come un'attività di modellazione gerarchica da sequenza a sequenza. La musica generata è coerente per diversi minuti e prodotta a 24 kHz, superando i sistemi precedenti in termini di qualità audio e aderenza alle descrizioni testuali secondo i loro esperimenti. Inoltre, MusicLM può essere condizionato sia dal testo che dalla melodia, consentendogli di trasformare melodie fischiate e canticchiate in modo che corrispondano allo stile descritto in una didascalia di testo.
Per supportare ulteriori ricerche, il team ha rilasciato pubblicamente MusicCaps, un set di dati che include 5.5k coppie musica-testo con descrizioni ricche di testo fornite da esperti umani. Questo set di dati servirà come risorsa preziosa per i futuri ricercatori interessati alla generazione e all'analisi della musica.
Nel complesso, MusicLM offre un nuovo promettente approccio alla generazione di musica condizionale e ha già dimostrato risultati superiori rispetto ai sistemi precedenti. Il rilascio di MusicCaps faciliterà senza dubbio ulteriori ricerche e sviluppi nel campo della musica generata dall'intelligenza artificiale.