Meta je nedavno predstavila novu umjetnu inteligenciju otvorenog koda pod nazivom AudioCraft, koji korisnicima omogućava stvaranje glazbe i zvukova u potpunosti putem generativne AI.
Sastoji se od tri AI modela, a svi se bave različitim područjima generiranja zvuka - MusicGen, AudioGen i EnCodec.
MusicGen uzima tekstualne unose za generiranje glazbe i treniran je na 20.000 sati glazbe u vlasništvu Mete, licencirane posebno za ovu svrhu.
AudioGen stvara zvuk iz pisanih upita, simulirajući lavež pasa ili korake, te je obučen za javne zvučne efekte.
Poboljšana verzija Meta EnCodec dekodera omogućuje korisnicima stvaranje zvukova s manje artefakata — što se događa kada previše manipulirate zvukom.
Predstavnici medija mogli su se uvjeriti u mogućnosti AudioCrafta. Generirana buka zviždanja, sirena i brujanja zvučala je prilično prirodno. Ali, dok su se žice gitare u pjesmama činile stvarnima, još su uvijek djelovale i umjetno.
No, nije Meta na ovom tržištu usamljena. Google je osmislio MusicLM, veliki jezični model koji je generirao nekoliko minuta zvukova na temelju tekstualnih upita. To pomaže i glazbenicima.
Oni već jako dugo eksperimentiraju s elektroničkim zvukom. Ali, računalno generirana glazba često zvuči manipulirano iz postojećeg zvuka. AudioCraft i druga generativna glazba proizvedena umjetnom inteligencijom stvaraju te zvukove samo iz tekstova i goleme biblioteke zvučnih podataka.
Trenutno, AudioCraft zvuči kao nešto što bi se moglo koristiti za glazbu u dizalu ili zalihe pjesama koje se mogu uključiti za malo podizanja atmosfere, a ne kao sljedeći veliki pop hit. Međutim, Meta vjeruje da njen novi model može uvesti novi val pjesama na isti način na koji su sintesajzeri promijenili glazbu nakon što su postali popularni.
Izdavačke kuće i umjetnici već su upozorili na opasnosti umjetne inteligencije, jer se mnogi boje da modeli umjetne inteligencije uzimaju materijal zaštićen autorskim pravima za trening. I to je segment oko kojeg će stručnjaci, ponajprije pravni, morati poraditi.