Povjesničari u budućnosti mogli bi imati problema u razumijevanju toga kako smo živjeli svoje živote početkom 21. stoljeća. Kako zbog digitalnog načina života, tako i zbog manjka (službenog) arhiviranja
Moguće je, zahvaljujući preživjelim fragmentima papirusa, mozaika i voštanih pločica, saznati što su stanovnici Pompeja jeli za doručak prije 2000 godina.
Razumijete li dovoljno srednjovjekovni latinski, saznat ćete koliko se stoke uzgajalo na farmama u Northumberlandu u Engleskoj u 11. stoljeću – zahvaljujući Domesday Booku, najstarijem dokumentu koji se čuva u Nacionalnom arhivu Ujedinjenog Kraljevstva.
Pomoću pisma i romana znamo kako su živjeli ljudi tijekom viktorijanskog razdoblja.
Ali povjesničari u budućnosti možda će imati problema potpuno razumjeti kako smo živjeli svoje živote početkom 21. stoljeća. Kako zbog digitalnog načina života, tako i zbog manjka službenog arhiviranja.
Neformalna skupina organizacija suprotstavlja se silama digitalne entropije, a mnogima od njih upravljaju volonteri s malo institucionalne potpore.
Višestruki rizici
Istraživanje američke organizacije Pew Research Center pokazuje da je nestalo 25 posto web stranica objavljenih između 2013. i 2023. godine.
Ne samo da tehnologija prestaje funkcionirati jer je zastarjela ili ostala bez podrške, već i institucije i tvrtke koje stvaraju sadržaj prestaju poslovati ili postojati.
Istraživači su otkrili da je problem akutniji što je web stranica starija: 38 posto onih kojima je Pew pokušao pristupiti, a koje su postojale 2013. godine, više ne funkcionira. Ali to je također problem za novije publikacije. Otprilike osam posto web stranica objavljenih u nekom trenutku 2023. nestalo je do listopada iste godine, što nije problem samo za ljubitelje povijesti i ljude opsjednute webom.
Naime jedna od pet vladinih web stranica sadrži barem jednu neispravnu poveznicu, a Pew je otkrio da više od polovice članaka na Wikipediji ima neispravnu poveznicu u odjeljku s referencama, što znači da se dokazi koji podupiru informacije online enciklopedije polako raspadaju. Ali, zahvaljujući radu Internet Archivea, svi ti mrtvi linkovi nisu potpuno nedostupni.
Internet Archive, američka neprofitna organizacija sa sjedištem u San Franciscu, koju je 1996. pokrenuo internetski pionir Brewster Kahl, vjerojatno je najambiciozniji projekt digitalnog arhiviranja svih vremena. Dosad je prikupila 866 milijardi web stranica, 44 milijuna knjiga, 10,6 milijuna videozapisa filmova i televizijskih programa...
Desetljećima je arhivski projekt Wayback Machine slao vojske robota da puze kroz kaskadne labirinte interneta. Ovi sustavi preuzimaju funkcionalne kopije web stranica kako se mijenjaju tijekom vremena - često snimajući iste stranice više puta u jednom danu - da bi bile besplatno dostupne javnosti.
Nekoliko drugih organizacija, velikih i malih, radi na sličnim projektima. Američka Kongresna knjižnica, naprimjer, čuva vladine web stranice, stranice članova Kongresa i zbirku američkih stranica s vijestima. Također je sačuvala kopiju svakog pojedinog tweeta poslanog od osnutka Twittera (sada poznatog kao X), sve dok projekt nije ugašen 2017.
Druge vlade pokreću svoje inicijative. UK Web Archive provodi godišnje indeksiranje web stranica s nazivima domena .uk, hvatajući snimku britanskog interneta barem jednom godišnje, a 2022. skupina volontera krenula je spasiti ukrajinski internet nakon što su ga pogodili ruski kibernetički napadi.
No opseg ovih projekata je uzak, a Internet Archive teži sveobuhvatnom pristupu. S obzirom na raspoložive resurse, bilo bi nemoguće prikupiti nešto približno cijelom webu, ali njegovi sustavi nastoje zahvatiti što je više moguće.
Ovisno o tome što tražite, kolekcija Internet Archivea toliko je temeljita da se ponekad može činiti kao funkcionalno potpun zapis weba.
Ne čuva samo web stranice
Smještene u nekolicini podatkovnih centara razasutih diljem svijeta, zbirke Internet Archivea i nekoliko sličnih skupina jedina su brana na putu digitalnom zaboravu.
Nažalost, malo je poticaja usmjerenih dugoročnom čuvanju sadržaja na webu, a javno dostupni dokumenti pomažu u održavanju zapisa o našim životima u digitalnoj eri. Postala je standardna praksa na Wikipediji citirati kopije web mjesta s Wayback Machine Internet Archivea, umjesto samih izvornih web mjesta.
Organizacija također čuva golemu zbirku medija iz razdoblja prije digitalnog doba. Humoristična serija 'Fernwood 2 Night' iz 1977. nije dostupna ni na jednom streaming servisu, ali je možete besplatno gledati na Internet Archiveu. Osim toga, knjige, časopisi i web stranice citiraju skenirane digitalne kopije knjiga Internet Archivea koje nisu dostupne u fizičkim knjižnicama.
U tim nastojanjima za očuvanje digitalnih dokumenata može sudjelovati i javnost. Bilo tko može prenijeti videozapise, web stranice i praktički bilo što drugo na web poslužitelje te organizacije.
Među glavnim zbirkama koje je Wayback Machine spasio iz digitalnog otpada su duboki zapisi web stranica izgrađenih na GeoCitiesu, sada nepostojećoj usluzi web hostinga.
Davno prije društvenih medija GeoCities je bio među prvim platformama koje su svakome olakšale izradu web stranice te ga povjesničari vide kao jedno od najvažnijih poglavlja u ranim danima World Wide Weba. Bez napora Internet Archivea, većina njegovih web stranica bila bi izgubljena.
Kongresni odbor SAD-a oslanjao se tako na internetsku arhivu kako bi sačuvao članke i dokumente povezane s pobunom 6. siječnja.
Web stranica s tehnološkim vijestima CNET suočila se s oštrim reakcijama 2023. godine nakon izvješća da je izbrisala desetke tisuća članaka. Iz CNET-a su uzvratili time da su svi izbrisani članci sačuvani u Wayback Machineu.
Mnogi kritičari tvrdili su da je tvrtka uzimala Internet Archive zdravo za gotovo, prebacujući svoju odgovornost za arhivu na tu organizaciju.
Projekt bez kraja, s rastućim troškovima
Projekt spašavanja weba mogao bi biti jednako prolazan kao i sadržaj koji pokušava zaštititi.
Internet Archive i srodne organizacije suočavaju se s financijskim prijetnjama, tehničkim izazovima, kibernetičkim napadima i pravnim bitkama tvrtki kojima se ne sviđa ideja o slobodno dostupnim kopijama njihova intelektualnog vlasništva.
Internet Archive je neprofitna organizacija koja se financira donacijama dobrotvornih fondacija. To je projekt bez kraja i s eksponencijalno rastućim troškovima. Postala je jedan od stupova weba, u sve većoj mjeri izložen prijetnjama.
Nedavno su najavili partnerstvo s Googleom, u sklopu kojeg je tehnološki div uključio poveznice na Wayback Machine u rezultatima pretraživanja. Financijski aspekti tog sporazuma nisu objavljeni.
S druge strane, nedavno su postali metom tužbe četiri velika izdavača knjiga, a oni su tvrdili da praksa skeniranja fizičkih knjiga i posuđivanja digitalnih kopija krši američki zakon o autorskim pravima.
Prije pandemije Internet Archive je posuđivao samo jednu digitalnu kopiju za svaku fizičku knjigu u svojoj zbirci. No to je ograničenje bilo ukinuto, pa su pokrovitelji mogli posuđivati neograničen broj digitalnih kopija knjiga u vrijeme u kojem nije bilo moguće doći do fizičkih knjižnica.
Američki sud presudio je 2023. godine da je ta praksa nezakonita. Početkom rujna odbijena je žalba Internet Archivea na tu odluku i pristali su platiti izdavačima javnosti nepoznat iznos.
Internet Archive bori se u još jednom sudskom sporu protiv glazbenih izdavača zbog digitalizacije zapisa, što bi ga moglo koštati 400 milijuna američkih dolara. Izgube li spor, njihov opstanak mogao bi biti ugrožen.
U svibnju ove godine bili su metom i velikog DDoS napada, zbog čega su njihove usluge (uključujući Wayback Machine, ali i prikupljanje arhivskog materijala) bile nedostupne.
Manjak građanske odgovornosti
Bez formalnih nastojanja organiziranja napora za očuvanje interneta, projekt je prepušten hobistima, volonterima i skupinama neslužbenih tijela koja općenito djeluju neovisno.
Decentralizirani pristup, sam po sebi, nije loš, ali kao posljedicu ima niz prioriteta i više potencijalnih slabih karika, kao i veće izglede za preklapanje pri prikupljanju.
Prosvjetiteljstvo 18. stoljeća dovelo je do nastanka međunarodnog knjižničarskog pokreta jer su vlade i filantropi preuzeli potrebu za očuvanjem i distribucijom knjiga za javnost.
Taj se osjećaj građanske odgovornosti nije proširio na web.
Razlog tome mogu biti komplicirani poslovni interesi digitalnog svijeta ili samo ogromni tehnički izazovi, piše BBC.