Amazon Web Services (AWS), Amazonov odjel za računarstvo u oblaku, najavio je novu seriju multimodalnih generativnih AI modela nazvanih Nova
Ta serija uključuje četiri modela za generiranje teksta: Micro, Lite, Pro i Premier. Micro, Lite i Pro dostupni su odmah, dok će Premier biti lansiran početkom 2025. godine. Uz to, predstavljeni su i modeli za generiranje slika i videa - Nova Canvas i Nova Reel - koji su također dostupni na AWS platformi.
Karakteristike Nova modela
Modeli za generiranje teksta optimizirani su za 15 jezika (s naglaskom na engleski) i imaju različite razine funkcionalnosti. Micro se usredotočuje na teksutalne zadatke uz brzo vrijeme obrade, Lite obrađuje tekst, slike i video uz umjerenu brzinu, Pro balansira preciznost, brzinu i cijenu te je prilagođen širokom spektru zadataka, dok Premier cilja na složene radne procese i prilagodbu korisničkim potrebama.
Svi osim Micro modela podržavaju analizu i generiranje sadržaja iz različitih medija (tekst, slike, video) te se koriste za zadatke poput sažimanja dokumenata i analiza grafikona. Premier se posebno ističe kao 'učeći model' za prilagodbu vlastitih AI rješenja.
Modeli imaju impresivne mogućnosti obrade sadržaja: Micro podržava kontekstualni prozor od 128.000 tokena, što je otprilike 100.000 riječi, dok Lite i Pro imaju kapacitet do 300.000 tokena, odnosno oko 225.000 riječi ili 30 minuta videa. Do 2025. se planira proširenje prozora na preko dva milijuna tokena, a Amazon tvrdi da su Nova modeli među najbržima u svojoj klasi i najjeftiniji za korištenje. Dostupni su kroz AWS Bedrock platformu za prilagodbu i optimizaciju, piše TechCrunch.
Nova Canvas i Reel
Nova Canvas i Nova Reel su Amazonovi ključni modeli za generativne medije. Canvas korisnicima omogućuje generiranje i uređivanje slika uz kontrole za boje, stilove i kompoziciju. Koristi se i za proširenje postojećih slika ili umetanje novih objekata.
Reel kreira videozapise do šest sekundi na temelju tekstualnih naredbi ili referentnih slika. Uz mogućnosti poput panoramskih pregleda i rotacija od 360 stupnjeva, Reel trenutno generira videozapise za otprilike tri minute. Planira se verzija koja će omogućiti izradu dvominutnih videa.
Oba modela imaju ugrađene alate za odgovornu upotrebu, uključujući vodene žigove i moderaciju sadržaja. AWS je naglasio da sigurnosne mjere sprječavaju širenje štetnih sadržaja poput dezinformacija ili ilegalnog materijala, ali detalji o njihovoj provedbi ostaju nejasni.
AWS nije specificirao koje podatke koristi za treniranje Nova modela, navodeći samo da kombinira vlasničke i licencirane podatke. Tvrtka nudi politiku obeštećenja za slučajeve u kojima modeli generiraju sadržaj koji bi mogao povrijediti autorska prava.
Planovi za budućnost
Planovi za 2025. u prvom kvartalu uključuju lansiranje modela za prijenos govora (speech-to-speech) koji će prepoznati ton i kadencu govora te generirati prirodne, ljudske glasove. Sredinom 2025. planira se 'any-to-any' model, sposoban za unos i generiranje sadržaja u tekstualnom, govornom, slikovnom i video formatu. Ovaj model bi, tim rečeno, mogao donijeti revoluciju u AI pod uvjetom da, naravno, sve radi kako spada.