MODEL ZA RAZMIŠLJANJE

Sve smo bliže općoj umjetnoj inteligenciji? OpenAI predstavio o3 modele

23.12.2024 u 08:58

Bionic
Reading

OpenAI je posljednjeg dana svog 12-dnevnog događaja 'Shipmas' objavio svoju najveću ovogodišnju novost – model o3, nasljednika o1 'modela za razmišljanje'. O3 je zapravo obitelj modela koja uključuje standardni o3 i manji, optimizirani model nazvan o3-mini, prilagođen specifičnim zadacima. OpenAI tvrdi da o3, barem pod određenim uvjetima, dostiže razinu umjetne opće inteligencije (AGI). No, taj ambiciozni cilj dolazi s brojnim ograničenjima i upozorenjima

Zanimljivo je da je OpenAI preskočio naziv o2, vjerojatno kako bi izbjegao pravne probleme s britanskim telekom operaterom O2. Tu teoriju djelomično je potvrdio izvršni direktor Sam Altman tijekom prijenosa uživo, dodajući još jedan neobičan detalj u tehnološki svijet koji često iznenađuje.

o3 i o3-mini još nisu široko dostupni. No, istraživači sigurnosti već sada mogu zatražiti pristup o3-mini, dok će pregledna verzija o3 biti dostupna kasnije, vjerojatno nakon kraja siječnja. Altman je naglasio da bi lansiranje o3 trebalo uslijediti ubrzo nakon toga.

Ova najava dolazi nakon Altmanove izjave da bi želio vidjeti federalni okvir za testiranje i regulaciju novih modela prije njihovog šireg uvođenja, zbog potencijalnih sigurnosnih rizika, piše Tech Crunch.

Rizici: Laži i dezinformacije

o3 je, poput svog prethodnika o1, model za razmišljanje koji ima sposobnost 'samoprovjere' tijekom rješavanja zadataka. To mu omogućuje bolje rezultate u domenama poput fizike, znanosti i matematike. Međutim, istraživači su primijetili da o1 ima povećanu tendenciju pokušaja obmane korisnika u usporedbi s klasičnim modelima, uključujući one koje razvijaju Meta, Anthropic i Google.

Hoće li o3 zadržati slične probleme, to ćemo tek vidjeti. OpenAI tvrdi da koristi tehniku nazvanu 'deliberativno usklađivanje' kako bi model prilagodio sigurnosnim standardima, no stvarni testovi će pokazati učinak ove metode.

Za razliku od većine AI modela, o3 uvodi mogućnost prilagodbe vremena potrebnog za razmišljanje prije donošenja odgovora. Modeli mogu biti postavljeni na 'niski', 'srednji' ili 'visoki' način rada, pri čemu dulje razmišljanje o složenim problemima donosi preciznije rezultate i kvalitetnije odgovore.

Unatoč ovim inovacijama, modeli za razmišljanje nisu bez grešaka. Na primjer, o1 je ponekad griješio čak i u jednostavnim igrama poput križić-kružića.

O3 i AGI: Je li ovo korak bliže?

Jedno od najvažnijih pitanja je hoće li o3 označiti korak prema AGI-u, općoj umjetnoj inteligenciji koja nadmašuje ljudske sposobnosti u većini zadataka. Prema testu ARC-AGI, dizajniranom za procjenu sposobnosti modela da uči nove vještine izvan svojih trening podataka, o3 je postigao impresivnih 87,5 posto na najvišoj razini rada.

Ipak, kritičari poput Françoisa Cholleta naglašavaju da o3 i dalje pada na 'vrlo jednostavnim zadacima' te da se razlikuje od ljudske inteligencije. Chollet je upozorio da je dug put do AGI-ja, navodeći kako će se taj cilj postići tek kada zadaci koji su jednostavni za ljude postanu nemogući za AI modele.

o3 je postavio nove standarde na brojnim testovima. Na primjer, ostvario je 96,7 posto na američkom matematičkom prijamnom ispitu, gdje je promašio samo jedno pitanje. Također, o3 je zabilježio impresivne rezultate na testovima kodiranja, s ocjenom od 2727 na Codeforces ljestvici, što ga svrstava među 99,2 posto najboljih programera.