SKOK PROMETA

Zbog umjetne inteligencije Wikipediji rastu troškovi. Tko će to platiti?

09.04.2025 u 09:31

Bionic
Reading

Djelovanje robota za indeksiranje i prikupljanje podataka dovelo je do značajnog povećanja korištenja kapaciteta za preuzimanje

Wikimedia je zabilježila 50-postotno povećanje kapaciteta korištenih za preuzimanje multimedijskog sadržaja od siječnja 2024. godine. Ne zato što su ljudi iznenada razvili apetit za konzumiranje članaka na Wikipediji i gledanje videa ili pak preuzimanje datoteka s Wikimedia Commonsa.

Do naglog porasta došlo je zbog indeksiranja za potrebe umjetne inteligencije ili automatiziranih programa koji su skrapirali Wikimedijine slike, videozapise, članke i druge datoteke s otvorenom licencom za treniranje modela generativne umjetne inteligencije.

To bi kao posljedicu moglo imati usporavanje pristupa Wikimedijinim stranicama i imovini, posebno tijekom događaja za koje postoji veliko zanimanje javnosti.

Spremni za ljude, ne i za robote

Naprimjer, bivši američki predsjednik Jimmy Carter umro je u prosincu prošle godine, a tada je povećano zanimanje ljudi za video njegove predsjedničke debate s Ronaldom Reaganom uzrokovalo sporo učitavanje stranica za neke korisnike.

Wikimedia je opremljena za podršku uslijed skokova prometa nastalog djelovanjem čitatelja tijekom takvih događaja, ali ne i za robote s umjetnom inteligencijom, a oni generiraju 'količinu prometa bez presedana i predstavljaju rastuće rizike i troškove', naveli su iz Wikimedije.

Također, ljudi imaju tendenciju tražiti specifične i često slične teme. Naprimjer, veliki broj njih traži iste sadržaje kad su u trendu. Za takve situacije Wikimedia stvara predmemoriju dijela sadržaja koji je više puta zatražen u podatkovnom centru najbližem korisniku, omogućujući brže posluživanje sadržaja.

Ali članci i sadržaji kojima se neko vrijeme nije pristupilo moraju biti posluživani ​​iz središnjeg podatkovnog centra, što troši više resursa i, stoga, više košta.

Kako alati umjetne inteligencije za indeksiranje imaju tendenciju masovnog čitanja stranica, oni češće traže sadržaje koje je potrebno povući iz središnjeg podatkovnog centra. Stoga već 65 posto prometa koji troši resurse dolazi od robota, zbog čega dolazi i do poremećaja, što prisiljava administratore na blokiranje alata za indeksiranje.

Problem je u tome što je do porasta prometa došlo uglavnom bez pripisivanja autorstva, a to je ključno za poticanje novih korisnika na stvaranje novih i održavanje postojećih sadržaja.

Bez novih ljudi voljnih za kreiranje sadržaja i donacija, od kojih Wikimedia živi, uz porast troškova može doći do pada prihoda. Njihov sadržaj jest besplatan za korištenje, ali infrastruktura koja to omogućava - nije. Wikimedia nastoji uspostaviti održive načine pristupa svom sadržaju u nadolazećoj fiskalnoj godini jer ne vidi znakove usporavanja prometa povezanog s umjetnom inteligencijom u skorije vrijeme, piše Engadget.