U SREDIŠTU POZORNOSTI

Podigao prašinu i uzdrmao tržište: Što je DeepSeek i zašto se toliko priča o njemu

28.01.2025 u 11:43

Bionic
Reading

Najveću svjetsku burzu uzdrmala je vijest da je aplikacija kineske startup tvrtke DeepSeek zasjela na vrh ljestvice najbolje ocijenjenih besplatnih aplikacija u Appleovu App Storu, ispred američkog konkurenta ChatGPT-ja. Kineski startup iznenada se našao u središtu pozornosti jer je predstavio robota za brbljanje i veliki jezični model, proizvod usporediv s američkim predvodnicima u utrci umjetne inteligencije

Robot za brbljanje temeljen na umjetnoj inteligenciji, koji je izradio kineski tehnološki startup DeepSeek, podigao je zadnjih dana puno prašine.

Postao je aplikacija s najviše preuzimanja u Appleovoj trgovini App Store i zabrinuo pojedine analitičare jer je, čini se, dostigao američke lidere u području generativne umjetne inteligencije za djelić troškova koje su te tvrtke dosad uložile.

Pogledajmo o čemu se radi.

Što je DeepSeek?

Kineska aplikacija impresionirala je Silicijsku dolinu, promijenivši iz temelja rašireno mišljenje da SAD zauzima prvo mjesto u svijetu na području umjetne inteligencije i da izvoznim kontrolama efikasno koči kineske kapacitete u sektoru sofisticiranih čipova i AI-ja.

Startup DeepSeek osnovan je 2023. u Hangzhouu u Kini, kada je kineska tražilica Baidu predstavila prvi kineski AI model. Njezinim stopama krenuli su u međuvremenu deseci kineskih tehnoloških tvrtki, velikih i malih, ali DeepSeek je prva kompanija koja je zaradila pohvale američkog tehnološkog sektora.

Tvrde da su na razvoj DeepSeek-R1 potrošili nešto manje od šest milijuna dolara.

Kasnije te godine objavio je svoj prvi veliki jezični model za umjetnu inteligenciju. Njegov izvršni direktor Liang Wenfeng, diplomirani student informatike, prethodno je bio suosnivač jednog od najboljih kineskih hedge fondova, High-Flyer, koji se fokusira na kvantitativno trgovanje vođeno umjetnom inteligencijom.

Fond je do 2022. prikupio klaster od 10.000 Nvidijinih grafičkih procesora visokih performansi A100 za izgradnju i pokretanje sustava umjetne inteligencije. SAD je ubrzo nakon toga ograničio prodaju tih čipova Kini.

U DeepSeeku tvrde da su njihovi nedavni modeli izgrađeni Nvidijinim čipovima H800, a koji su slabijih performansi i nisu zabranjeni u Kini. Ako je to točno, najmoderniji hardver možda neće biti potreban za vrhunska istraživanja umjetne inteligencije.

DeepSeek je prošlog mjeseca počeo privlačiti više pozornosti jer je objavio novi model umjetne inteligencije, usporediv s onima koje nudi OpenAI, ali i učinkovitiji u korištenju skupih Nvidijinih čipova za treniranje sustava na velikim količinama podataka.

Chatbot je postao šire dostupan početkom ove godine, kada se pojavio u trgovinama aplikacija Apple Store i Google Play.

Ali uzbunu je podigao istraživački rad, objavljen prošli tjedan, koji se bavi modelom R1 s naprednim vještinama 'rasuđivanja' (poput, primjerice, sposobnosti ponovnog promišljanja pristupa matematičkom problemu). Znatno je jeftiniji od sličnog OpenAI-jevog modela o1.

Kao Sputnik

Iza drame oko tehničkih mogućnosti DeepSeeka stoji rasprava u SAD-u o tome kako se najbolje natjecati s Kinom u pogledu umjetne inteligencije.

Marc Andreessen, poznat po ulaganjima u startupove, usporedio je pojavu R1 s trenutkom kad je Sovjetski Savez 1957. godine lansirao satelit Sputnik, što je pokrenulo svemirsku utrku između dvije tadašnje supersile. Upozorio je da će pretjerana regulacija omesti američke tvrtke i omogućiti Kini napredak.

Također, R1 dovodi u pitanje ključnu strategiju vanjske politike SAD-a posljednjih godina, a ona se oslanja na ograničavanje prodaje američkih poluvodiča za umjetnu inteligenciju Kini.

Ako Kinezi doista uspijevaju držati korak koristeći stariji hardver, kontrola izvoza mogla bi biti uzaludna ili kontraproduktivna. Vjerojatno će trebati i ponovno promisliti o 500 milijardi američkih dolara vrijednoj inicijativi ulaganja u infrastrukturu za umjetnu inteligenciju Stargate.

Američki predsjednik Donald Trump smatra da je napredak DeepSeeka dobar jer pokazuje da je moguće sniziti troškove umjetne inteligencije. Pozvao je američke tvrtke da se laserski usredotoče na natjecanje kako bi pobijedile.

'Čitao sam nešto o Kini i o nekim tvrtkama u Kini, konkretno o onoj koja je smislila bržu metodu umjetne inteligencije, puno jeftiniju, a to je dobro jer ne morate trošiti tako puno novca. Mislim da je to dobra stvar, prednost', rekao je Trump.

Po čemu je DeepSeek drukčiji?

DeepSeek se od konkurenata kao što je OpenAI bitno razlikuje po tome što su njegovi modeli otvorenog računalnog koda, što znači da su ključne komponente besplatne, pa ih bilo tko može koristiti i mijenjati. Tvrtka nije otkrila koje je podatke koristila za obuku.

Također, nudi nešto što Nvidia naziva 'savršenim primjerom skaliranja vremena testiranja', a što opisuje situaciju u kojoj modeli umjetne inteligencije učinkovito pokazuju svoj tok misli, a zatim to koriste za daljnju obuku bez potrebe da im se daju novi izvori podataka.

U tome, čini se, izravno konkurira OpenAI-ju, vjerojatno i Anthropicu i Googleu, piše AP.

Tehnološki sektor pod pritiskom

Zbog DeepSeeka je u ponedjeljak cijena dionice Nvidije potonula 17 posto, pa je tržišna vrijednost najvećeg svjetskog proizvođača čipova za umjetnu inteligenciju pala za gotovo 600 milijardi dolara, što je najveći dnevni pad vrijednosti neke kompanije u povijesti Wall Streeta. Indeks sektora proizvođača čipova pao je više od devet posto, što je njegov najveći dnevni gubitak od 2020. godine.

Pod pritiskom se našao cijeli tehnološki sektor, pa je cijena dionice Microsofta pala više od dva, a Alphabeta više od četiri posto. Cijena Dell Technologiesa, proizvođača servera za umjetnu inteligenciju, potonula je pak gotovo devet posto.

U utorak DeepSeek je predstavio i novi model AI-ja otvorenog koda Janus-Pro, nadograđenu verziju modela Janus, sa znatno višom razinom 'multimodalnog' razumijevanja i generiranja 'vizuala', citira Global Times informacije s američke platforme za AI Hugging Face.