ZAŠTITA PODATAKA

Evo tko spašava stvar kad američke vlasti nemilice uklanjaju podatke online

20.02.2025 u 12:03

Bionic
Reading

Podatke na webu puno je lakše ukloniti ili izmijeniti nego one na fizičkom mediju poput knjiga. Postoje organizacije koje se bave njihovim očuvanjem

Od druge inauguracije predsjednika Donalda Trumpa, vladino masovno uklanjanje podataka i politika koje smatra nepoželjnima ilustrirali su koliko brzo podaci mogu nestati s weba i potaknuli zanimanje među digitalnim arhivistima za očuvanje informacija na mreži.

Tisuće stranica s web stranice agencije Centers for Disease Control and Prevention uklonjeno je u siječnju, iako su neke od stranica ponovno online nakon naloga saveznog suca.

Uklonjene su i web stranice Ministarstva pravosuđa povezane s upadom u Capitol 6. siječnja 2021. godine, informacije o skrbi za transrodne pacijente na Healthcare.gov, stranice o rodnoj raznolikosti TSA-a te stranice o seksualnoj orijentaciji i općoj diskriminaciji identiteta na web odredištima Equal Employment Opportunity Commission i Census Bureau, kao i mnogim drugim.

Iako nije neuobičajeno da predsjedničke administracije brišu ili mijenjaju vladine web stranice, čini se da je druga Trumpova administracija uklonila više sadržaja nego inače, prema Marku Grahamu, direktoru Wayback Machinea.

Arhiv s 916 milijardi web stranica

Wayback Machine, kojim upravlja neprofitna organizacija Internet Archive, alat je osmišljen za pomoć u očuvanju online podataka. Korišten je u prošlosti kada su administracije novih predsjednika preuzimale informacije iz prošlih administracija.

Stranica omogućuje korisnicima unos URL-a. Ako je stranica arhivirana, mogu vidjeti kako je izgledala u prošlosti, od osnutka te baze podataka 1996. godine.

Prikupljanje i arhiviranje obavljaju posebni softverski roboti. No, moguće je i ručno unijeti URL u Wayback Machine, čija baza trenutno raspolaže s više od 916 milijardi web stranica.

Internet Archive, u suradnji s partnerima kao što su Environmental Data & Governance Initiative (EDGI) i Stanford University Libraries, također nudi arhivu End of Term, u kojoj su prikupljeni i pohranjeni sadržaji iz vladinih izvora na kraju svakog predsjedničkog mandata. Prikupljanje za tu arhivu je počelo 2008. godine.

Postoje i mnoga druga arhivska mjesta, uključujući nekoliko koja se posebno fokusiraju na očuvanje državnih podataka.

Harvard Law Library Innovation Center objavio je arhivu data.gov, vladine stranice koja javnosti pruža istraživačke podatke, a sadrži skupove podataka iz 2024. i 2025. Organizacija je prethodno objavila druge alate za arhiviranje, kao što je Perma.CC, koji korisnicima omogućuje stvaranje trajnih URL-ova stranice koju žele arhivirati.

EDGI također radi na očuvanju državnih podataka. Tako su, primjerice, sačuvali digitalni alat koji je pokazivao mjesta u SAD-u s razinom zagađenja višom od uobičajene. Fizičke materijale je relativno lako sačuvati. Knjige se, primjerice, tiskaju u velikom broju primjeraka. A kada se jednom ispišu, sadržaj unutra ne može biti lako uklonjen ili promijenjen. Informacije na webu puno je lakše izgubiti.

Sadržaj na web stranici može se mijenjati na neprimjetan način ili stranice mogu biti potpuno uklonjene. Osim toga, web se temelji na URL-u, izvoru koji pruža samo lokaciju informacija - ne same informacije.

Izvješće Pew Researcha objavljeno u svibnju prošle godine otkrilo je kako 38 posto web stranica dostupnih za pregledavanje 2013. više nije bilo dostupno 10 godina kasnije.

Analiza je također otkrila kako otprilike jedna od pet vladinih web stranica sadrži barem jednu neispravnu poveznicu, piše CNN Business.