Tvrtke koje se bave umjetnom inteligencijom se igraju vatrom, pitanje je dana kad će nekome nanijeti štetu, upozorila je šefica BBC-ja
U istraživanju o vijestima koje isporučuju OpenAI-jev ChatGPT, Googleov Gemini, Microsoftov Copilot, BBC je otkrio kako 51 posto svih odgovora umjetne inteligencije imalo značajne probleme u nekom obliku.
Tijekom istraživanja svaki od tih robota na brbljanje trebao je odgovoriti na 100 pitanja o vijestima, koristeći BBC-jeve izvore kada su bili dostupni. Njihove odgovore su zatim ocjenjivali novinari koji su relevantni stručnjaci za temu članka.
Nekoliko primjera problema uključuje Gemini koji sugerira kako britanska zdravstvena agencija National Health Service ne preporučuje vaping kao metodu za prestanak pušenja (što nije točno), kao i ChatGPT i Copilot koji kažu kako političari koji su već napustili položaj i dalje na tim pozicijama.
Što se konkretno tiče njihovih vlastitih članaka, BBC kaže kako 19 posto sažetaka umjetne inteligencije ima činjenične pogreške, pri čemu halucinira, odnosno daje lažne izjave, brojeve i datume. Trinaest posto izravnih citata bilo je ili izmijenjeno u odnosu na izvorni izvor ili ih nema u citiranom članku.
Iako su netočnosti bile neravnomjerno raspoređene među botovima, niti jedan se nije pokazao kao naročito dobar. Copilot i Gemini imali su značajnijih problema nego ChatGPT, koji je ChatGPT i dalje imao problema s više od 40 posto odgovora.
Izvršna direktorica BBC-ja Deborah Turness u blogu je navela kako umjetna inteligencija nudi beskonačne mogućnosti, ali i poručila tvrtkama koje se time bave kako su trenutne implementacije te tehnologije igranje s vatrom. Pitanje je vremena kad će izazvati štetu u stvarnom svijetu, dodala je.
Kako bi proveo testove, BBC je privremeno ukinuo ograničenja koja su umjetnoj inteligenciji sprječavala pristup njegovim stranicama. U međuvremenu su ih ponovno postavili, piše Life Hacker.