Fugatto generira zvučne efekte i glazbu iz tekstualnog opisa, uključujući nove zvukove poput lajanja trube poput psa. Od sličnih se softvera razlikuje po tome što može preuzeti i modificirati postojeći zvuk
Nvidia je predstavila novi model umjetne inteligencije za generiranje glazbe i zvuka koji može modificirati glasove i generirati nove zvukove. Ta je tehnologija namijenjena tvorcima glazbe, filmova i videoigara.
U najvećem svjetskom dobavljaču čipova i softvera koji se koristi za stvaranje sustava temeljenih na umjetnoj inteligenciji nemaju neposrednih planova za javno objavljivanje tehnologije koju su nazvali Fugatto (Foundational Generative Audio Transformer Opus 1).
Sličnu tehnologiju koja može generirati audio ili video iz tekstualnog upita nude startupi kao što je Runway i veći igrači kao što je Meta Platforms.
Nvidijina verzija generira zvučne efekte i glazbu iz tekstualnog opisa, uključujući nove zvukove poput lajanja trube poput psa. Od ostalih se razlikuje po tome što može preuzeti i modificirati postojeći zvuk.
Na primjer, frazu odsviranu na klaviru može preobraziti u frazu koju pjeva ljudski glas. Također, može izgovorenu i snimljenu riječ preuzeti i promijeniti joj naglasak i ton.
Nvidijin novi model obučen je na podacima otvorenog koda. Još nisu sigurni hoće li ga javno objaviti i kako. Slično su ranije postupili OpenAI i Meta.
Kreatori generativnih modela umjetne inteligencije tek trebaju utvrditi kako spriječiti zlouporabu tehnologije kao što je korisnikovo generiranje dezinformacija ili kršenje autorskih prava generiranjem znakova zaštićenih autorskim pravima, piše Reuters.