Je li umjetna inteligencija pred prekretnicom koja bi je mogla učiniti još sveprisutnijom?

Nakon godina dominacije oblika umjetne inteligencije poznatog kao transformator, krenula je potraga za novim arhitekturama

Transformatori podupiru OpenAI-jev model Sora za generiranje videa i oni su u srcu modela za generiranje teksta kao što su Anthropicov Claude, Googleov Gemini i GPT-4o.

Ali, počinju nailaziti na tehničke prepreke.

Transformatori nisu osobito učinkoviti u obradi i analizi golemih količina podataka, barem ako rade na gotovom hardveru. A to dovodi do naglog i možda neodrživog povećanja potražnje za električnom energijom.

Moguća zamjena mogla bi doći u obliku arhitekture nazvane trening u vrijeme testiranja (test-time training, TTT), koju su tijekom godinu i pol razvili istraživači sa Stanforda, UC San Diego, UC Berkeley i iz tvrtke Meta Platforms.

Više podataka, manje računanja

TTT modeli ne samo što mogu obraditi daleko više podataka nego transformatori, već to navodno mogu učiniti bez trošenja toliko računalne snage.

Temeljna komponenta transformatora je takozvano 'skriveno stanje', koje je u biti dugačak popis podataka. Kako transformator nešto obrađuje, dodaje unose u skriveno stanje kako bi 'zapamtio' što je upravo obradio.

Na primjer, ako se model probija kroz knjigu, skrivene vrijednosti stanja bit će stvari poput prikaza riječi (ili dijelova riječi). To, između ostalog, omogućuje učenje u kontekstu.

Skriveno stanje dio je onoga što transformatore čini tako moćnim. Ali, to ih također koči.

Kako bi 'rekao' makar i jednu riječ o knjizi koju je transformator upravo pročitao, model bi morao skenirati cijelu svoju tablicu pretraživanja. Taj je zadatak računalno zahtjevan koliko i ponovno čitanje cijele knjige.

Istraživači su došli na ideju zamijeniti skriveno stanje modelom strojnog učenja.

Potreba za probojem

U suštini, interni model strojnog učenja modela TTT - za razliku od tablice pretraživanja transformatora - ne raste kako obrađuje dodatne podatke.

Umjesto toga, kodira podatke koje obrađuje u reprezentativne varijable (pondere). Bez obzira koliko podataka TTT model obrađuje, veličina njegovog internog modela neće se promijeniti.

Budući modeli mogli bi učinkovito obraditi milijarde podataka, od riječi preko slika do audio zapisa i videa. Daleko više nego današnji modeli, u svakom slučaju.

Zasad je teško prognozirati hoće li TTT modeli zamijeniti transformatore i kad jer su dosad razvijena tek dva mala modela za potrebe istraživanja. Ipak, ubrzani tempo istraživanja alternativa transformatorima ukazuje na sve veće prepoznavanje potrebe za probojem.

Startup Mistral objavio je model, Codestral Mamba, koji se temelji na drugoj alternativi transformatoru koja se zove model prostora stanja (state space model, SSM).

Čini se kako su SSM-ovi, poput TTT modela, računalno učinkovitiji od transformatora i mogu skalirati do većih količina podataka.

AI21 Labs također istražuje SSM-ove. Kao i Cartesia, koja je bila pionir u nekim od prvih SSM-ova i imenjaka Codestral Mamba, Mamba i Mamba-2.

Uspiju li, to bi moglo učiniti generativnu umjetnu inteligenciju još dostupnijom i raširenijom nego što je sada, piše Tech Crunch.

Je li umjetna inteligencija pred prekretnicom koja bi je mogla učiniti još sveprisutnijom?

Više podataka, manje računanja

Potreba za probojem

preporučujemo

Znanstvenici tvrde da su otkrili novu boju: Granice percepcije su pomaknute

Šokantne optužbe protiv Tesle: Milijun vozila ima lažne kilometre na satu?

Sjećate li se Oscarom nagrađenog filma 'Her'? Svijet sve više počinje sličiti na njega

Gasite Skype? OK, ali objasnite to mojoj mami

U Kini po prvi put polumaraton trčali ljudi i roboti

Najbitnije od bitnog

Na nebu je vidljiva meteorska kiša Lirida, evo kad ih je najbolje promatrati

Najstariji aktivni američki astronaut vratio se na Zemlju na svoj 70. rođendan

Povratak mobilnog superhita: Zaigrali smo Crashlands 2

najpopularnije

Ovo je jedini recept za francusku salatu koji će vam ikad trebati

Jeličić o dugu Hajduka: 'Da mi je vidjeti onog koji će u Splitu...'

Izračunali smo koliko će se novca okrenuti na Thompsonovu koncertu i tko će najviše profitirati

Jennifer Lopez sve je zasjenila na utrci Formule 1, a jasno je i zašto

Pogledajte snimku na kojoj se vidi kako je Diallo udario suparnika! Je li to za isključenje?

Ponoćna bomba s Poljuda! Hajduk službeno zatražio od HNS-a da se javno objavi komunikacija iz VAR-sobe

Prijava na newsletter

vezane vijesti

Priprema li OpenAI sljedeći veliki korak naprijed u razvoju umjetne inteligencije?

Kako će izgledati budućnost s AI-jem? Evo što nam je otkrio inovator iz Silicijske doline

Microsoft navodno ima umjetnu inteligenciju koja zvuči kao stvarni ljudi

Više podataka, manje računanja

Potreba za probojem

vezane vijesti

Novi problemi: Apple mora hitno pronaći partnera u Kini koji će zamijeniti OpenAI

Umjetna inteligencija pomogla tržištu osobnih računala, najveći skok u Appleu

Europa želi graditi podatkovne centre u svemiru? 'Izazova je puno, ali to vrijedi truda'

vezane vijesti

AI botovi čine više od pola svog internetskog prometa, napadi su sve sofisticiraniji

Što znate o kvantnoj tehnologiji? Europljani su za nju čuli, ali ne znaju detalje

Trijumf umjetne inteligencije: AI modeli uspjeli uvjeriti ljude da su – ljudi

preporučujemo

Znanstvenici tvrde da su otkrili novu boju: Granice percepcije su pomaknute

Šokantne optužbe protiv Tesle: Milijun vozila ima lažne kilometre na satu?

Sjećate li se Oscarom nagrađenog filma 'Her'? Svijet sve više počinje sličiti na njega

Gasite Skype? OK, ali objasnite to mojoj mami

U Kini po prvi put polumaraton trčali ljudi i roboti

Pratite nas na društvenim mrežama

Najbitnije od bitnog

pročitaj još i ovo

Na nebu je vidljiva meteorska kiša Lirida, evo kad ih je najbolje promatrati

Znanstvenici tvrde da su otkrili novu boju: Granice percepcije su pomaknute

Šokantne optužbe protiv Tesle: Milijun vozila ima lažne kilometre na satu?

Ovo je 5 vještina snalaženja u prirodi koje bi svatko trebao znati – znate li ih sve?

Sjećate li se Oscarom nagrađenog filma 'Her'? Svijet sve više počinje sličiti na njega

Gasite Skype? OK, ali objasnite to mojoj mami

Najstariji aktivni američki astronaut vratio se na Zemlju na svoj 70. rođendan

Ovaj tihi pomagač posjeduje revolucionarnu tehnologiju koja mijenja sve iz temelja

Ovo je jedini recept za francusku salatu koji će vam ikad trebati

Razvikani deterdženti 'pali' na testu, a pobijedio jeftini brend: Evo koje trebate izbjegavati

Živ je Real! Pogledajte golčinu za pobjedu u 93. minuti

Pokrećete biznis ili želite dići firmu na višu razinu? Ova akademija pravi je izbor za vas

Stigle su na police Zare: Zavodljive, a udobne sandale, najpoželjniji model sezone

Zaboravite na žuljeve: Ove sandale tako su mekane i udobne

Jeličić o dugu Hajduka: 'Da mi je vidjeti onog koji će u Splitu...'

Na nebu je vidljiva meteorska kiša Lirida, evo kad ih je najbolje promatrati

Najstariji aktivni američki astronaut vratio se na Zemlju na svoj 70. rođendan

Povratak mobilnog superhita: Zaigrali smo Crashlands 2

najpopularnije

Ovo je jedini recept za francusku salatu koji će vam ikad trebati

Jeličić o dugu Hajduka: 'Da mi je vidjeti onog koji će u Splitu...'

Izračunali smo koliko će se novca okrenuti na Thompsonovu koncertu i tko će najviše profitirati

Jennifer Lopez sve je zasjenila na utrci Formule 1, a jasno je i zašto

Pogledajte snimku na kojoj se vidi kako je Diallo udario suparnika! Je li to za isključenje?

Ponoćna bomba s Poljuda! Hajduk službeno zatražio od HNS-a da se javno objavi komunikacija iz VAR-sobe

Prijava na newsletter