Un nuovo impressionante sistema di intelligenza artificiale di Google può generare musica di qualsiasi genere con una descrizione testuale. Ma la società, temendo i rischi, non ha piani immediati per rilasciarlo.

Chiamato MusicLM , quello di Google non è certamente il primo sistema di intelligenza artificiale generativa per la canzone. Ci sono stati altri tentativi, tra cui Riffusion , un’intelligenza artificiale che compone musica visualizzandola, così come Dance Diffusion , AudioML di Google e Jukebox di OpenAI . Ma a causa di limiti tecnici e dati di formazione limitati, nessuno è stato in grado di produrre canzoni particolarmente complesse nella composizione o ad alta fedeltà.

MusicLM è forse il primo che può farlo

Descritto in dettaglio in un documentoaccademico , MusicLM è stato addestrato su un set di dati di 280.000 ore di musica per imparare a generare canzoni coerenti per le descrizioni di – come affermano i creatori – “significativa complessità” (ad esempio “incantevole canzone jazz con un memorabile assolo di sassofono e un cantante solista” o “la techno berlinese degli anni ’90.

Anche se alimentato da descrizioni un po’ lunghe e tortuose, MusicLM riesce a catturare sfumature come riff strumentali, melodie e stati d’animo.

Le capacità di MusicLM vanno oltre la generazione di brevi clip di canzoni. I ricercatori di Google mostrano che il sistema può basarsi su melodie esistenti, canticchiate, cantate, fischiettate o suonate su uno strumento. Inoltre, MusicLM può prendere diverse descrizioni scritte in sequenza (ad es. “tempo di meditare”, “tempo di svegliarsi”, “tempo di correre”, “tempo di dare il 100%”) e creare una sorta di “storia” melodica o narrativa che vanno fino a diversi minuti di lunghezza, perfettamente adatti per la colonna sonora di un film.