Metin novi čip za obuku, razvijen u suradnji s TSMC-om, namjenski je akcelerator, što znači kako je dizajniran samo za zadatke specifične za umjetnu inteligenciju
Meta Platforms testira svoj prvi vlastiti čip za obuku sustava umjetne inteligencije. Krenuli su s malom implementacijom čipa i planiraju povećati proizvodnju za široku upotrebu ako test prođe dobro.
Poticanje razvoja vlastitih čipova dio je dugoročnog plana tvrtke za smanjenje ogromnih troškova infrastrukture. Meta predviđa kako će njeni ukupni troškovi u ovoj godini iznositi 114 do 119 milijardi američkih dolara. Od toga će do 65 milijardi dolara kapitalnih izdataka biti uglavnom potaknuti potrošnjom na infrastrukturu za umjetnu inteligenciju.
Kako piše Reuters, Metin novi čip za obuku namjenski je akcelerator, što znači kako je dizajniran samo za zadatke specifične za umjetnu inteligenciju.
To ga može učiniti energetski učinkovitijim od integriranih grafičkih procesorskih jedinica koje se općenito koristi za umjetnu inteligenciju. Razvoj čipa odvija se u suradnji s tajvanskim proizvođačem čipova TSMC-om. Prva faza razvoja - koja obično košta desetke milijuna dolara i traje tri do šest mjeseci – prošla je uspješno, čini se.
Cilj: Vlastiti čipovi do 2026.
Čip je najnoviji u tvrtkinoj seriji Meta Training and Inference Accelerator (MTIA). Program je dosad bio promjenjivog uspjeha. U jednom trenutku ukinuli su razvoj čipa u sličnoj fazi i odlučili se za kupovinu Nvidijinih čipova vrijednu više milijardi dolara.
Međutim, Meta je prošle godine počela koristiti čip MTIA za izvođenje zaključaka, ili proces uključen u pokretanje sustava umjetne inteligencije dok korisnici s njim komuniciraju, za sustave preporuka koji određuju koji se sadržaj pojavljuje na društvenim mrežema.
Žele početi koristiti vlastite čipove do 2026. za obuku. Kao i kod čipa za zaključivanje, cilj čipa za obuku je započeti sa sustavima preporuka i kasnije ga koristiti za proizvode kao što je robot za brbljanje Meta AI.
Vrijednost ulaganja u infrastrukturu dovedena je u pitanje jer su istraživači umjetne inteligencije sve skeptičniji oko toga koliko se može napredovati nastavkom 'povećanja' velikih jezičnih modela dodavanjem sve više podataka i računalne snage. Te su sumnje pojačane nakon lansiranja kineskog DeepSeeka, koji optimizira računalnu učinkovitost oslanjajući se više na zaključivanje od većine postojećih modela.
U globalnom padu koji je uslijedio dionice Nvidije izgubile su čak petinu svoje vrijednosti u jednom trenutku. Nakon toga su povratili veći dio te pozicije, uz podršku ulagača koji su se kladili kako će čipovi tvrtke ostati industrijski standard za obuku i zaključivanje, iako su kasnije ponovno pali zbog drugih razloga.