DEEPSEEK I META

Altman najavio preokret u AI-ju: 'Usvojit ćemo dva pristupa'

04.02.2025 u 10:40

Bionic
Reading

DeepSeekovi jeftini i moćni AI modeli uzdrmali su AI industiju, što je potaklo OpenAI-jevog šefa Sama Altmana da usvoji dva pristupa, naglasivši da je njegova kompanija bila 'na pogrešnoj strani povijesti' po pitanju težine modela

Kada konkurenti uspiju s drugačijim pristupom, ponekad je mudro promijeniti smjer. To je poruka Sama Altmana, izvršnog direktora OpenAI-ja, izrečena tijekom Reddit AMA u petak. Rasprava je obuhvatila razne AI teme, no posebna pažnja posvećena je DeepSeeku, kineskom startupu koji je privukao pažnju tehnološke zajednice zahvaljujući AI modelima visokih performansi i niskih troškova korištenja.

Jedan korisnik Reddita upitao je može li OpenAI prikazati 'sve misaone tokene', odnosno prikazati međukorake razmišljanja koje koriste AI modeli za rješavanje složenih zadataka – slično načinu na koji ljudi promišljaju kompleksne probleme.

Dok OpenAI-jevi modeli o1 i o3 koriste ovaj pristup zaključivanja, oni korisnicima prikazuju samo konačne odgovore bez otkrivanja međukoraka. S druge strane, DeepSeekov model R1 transparentno prikazuje svaki korak procesa. Primjerice, prilikom demonstracije modela s DeepThink postavkom, Business Insider je zabilježio čak 16 stranica matematičkih koraka prije dolaska do točnog odgovora.

Altman je na ovo odgovorio: 'Da, uskoro ćemo prikazati mnogo korisniju i detaljniju verziju ovoga. Zasluge idu R1 što nas je potaknuo na promjenu.'

Otvoreni kod i dostupnost modela

Glavni AI znanstvenik u Meti, Yann LeCun, istaknuo je da uspjeh DeepSeeka pokazuje vrijednost otvorenih AI modela u odnosu na vlasničke. Metini LLaMA modeli su uglavnom otvorenog koda, što omogućuje slobodan pristup detaljima poput težina i parametara modela. Ovo omogućuje programerima i tvrtkama da prilagode modele vlastitim potrebama.

Suprotno svom imenu, OpenAI je do sada favorizirao zatvoreniji pristup. Većina njegovih modela je vlasnička, a pristup im se naplaćuje.

Na pitanje hoće li OpenAI razmotriti objavljivanje težina svojih modela i dijeljenje istraživanja, Altman je odgovorio: 'Da, razgovaramo o tome. Osobno mislim da smo do sada bili na pogrešnoj strani povijesti i moramo osmisliti drugačiju strategiju otvorenog koda. Nije da svi u OpenAI-u dijele ovo mišljenje, a trenutno nam to nije ni najveći prioritet.'