Znate li da popularni pretraživači poput Googlea, Yahooa i Binga pretražuju tek 10 posto interneta? Ostalih 90 posto skriveno je od očiju prosječnih korisnika, ali ne i nedostupno
Tijekom godina Google, Bing i druge tražilice uvjerile su korisnike da upravo preko njih mogu pronaći bilo što na internetu. No istina je potpuno drugačija. Pretraživači koje većina korisnika koristi svakodnevno pretražuju otprilike 10 posto interneta. Ostalih 90 posto do kojih je nešto teže doći naziva se 'duboki' ili 'skriveni' internet. To su gomile podataka, dokumenata i web stranica koje jednostavno nisu indeksirane u komercijalnim tražilicama, ali to ne znači da ne postoje.
Googleovi roboti dosad su indeksirali oko 40 milijardi javno dostupnih internetskih stranica, a procjenjuje se kako je na svijetu javno objavljeno više od 100 milijardi stranica. Dodamo li tome još više od 11 milijardi stranica skrivenih od javnosti jer su namijenjene samo određenim korisnicima i više od 450 milijardi stranica koje su rezultat pretraživanja velikih baza podataka, a koje su u potpunosti skrivene od Googleovih robota, jasno je koliko mali dio interneta Google zapravo pretražuje.
Nevidljivi internet prepun skrivenih podataka
No, što je zapravo 'skriveni' internet? To je sadržaj koji je skriven od pretraživača jer nije postojan. Točnije, radi se o dinamičnim web stranicama koje se stvaraju na zahtjev korisnika i kao takve ne postoje dok ih neki korisnik svojim upitom u nekoj bazi podataka ne stvori.
Automatski roboti koje pretraživači koriste za indeksiranje interneta jednostavno nisu dovoljno razvijeni ni dovoljno napredni da mogu čitati i pretraživati te privatne baze podataka. Naime, osim baza podataka, u 'dubokom' internetu skrivene su i privatne mreže, ali i sadržaji zaključani lozinkama.
Za pretraživanje te nepregledne količine podataka potrebni su specijalizirani alati, posebni pretraživači ili kazala koja korisniku mogu otkriti potpuno novi svijet podataka koji je, prema procjenama, barem 500 puta veći od 'vidljivog' interneta.
Kad jednom krenete u istraživanje tog 'nevidljivog' dijela možete otkriti bisere poput različitih stručnih članaka i zbornika, multimedijalnih arhiva, portala, imenika, baza podataka pa sve do besplatnih knjiga, audioknjiga ili filmova.
Istraživanje nepoznatog
Kopanje po 'nevidljivom' dijelu interneta nije ni teško ni zabranjeno, ali zahtjeva jako puno vremena i strpljenja. Kako je većina sadržaja u 'nevidljivom' internetu specijalizirana i vezana za specifične teme, korisnici bi trebali pretraživati barem dva puta.
Prvo bi trebalo iskoristiti glavne tražilice poput Googlea, Yahooa ili kojeg drugog pretraživača kojeg inače koristite, kako biste pronašli određenu bazu podataka. Što su pojmovi za pretraživanje konkretniji to bi i rezultati trebali biti relevantniji. Pokušajte s frazama poput 'poslovi u Rijeci' ili 'vremenska prognoza za Hvar'.
Potom, kad ste pronašli određenu bazu podataka koja sadrži podatke koji bi vam mogli biti od koristi, krenite s pretraživanjem same baze podataka. Taj dio pretraživanja može vam 'ukrasti' sate i dane zbog gomila podataka koje ćete morati ručno pretražiti, a koji vam mogu odvući pažnju od onoga što zapravo tražite.
Pravi pretraživač za pravi zadatak
Ako popularni pretraživači tek zagrebu površinu, kako onda pronaći ono što je duboko skriveno? Pomoću pravog alata.
Tijekom godina razvio se cijeli niz pretraživača koji su se ili specijalizirali za pojedine teme ili baze podataka ili pretražuju na drugačiji način pa onda mogu pružiti i drugačije rezultate pretraživanja.
Za sam početak dobro je krenuti s općim pretraživačem poput Clustya, koji pronalazi informacije i web stranice različite tematike. Osim njega, koristiti možete i CompletePlanet i SurfWax koji objedinjuju rezultate s nekoliko pretraživača kako bi ponudili što više podataka.
Za pretraživanje milijuna blogova koji su tijekom godina objavljeni na različitim servisima tu je Technorati. Ovaj pretraživač specijalizirao se za pretragu blogova i objava, a osim što pretražuje nudi i top listu najpopularnijih i najposjećenijih blogova i web stranica u pojedinim kategorijama.
Želite li pronaći neki forum ili online zajednicu iskoristite snagu Dmoz.orga ili BoardTrackera. Oba će u veoma kratkom vremenu pronaći stotine specijaliziranih foruma ili objava.
Za ljubitelje knjiga BookFinder.com nudi mogućnost pretraživanja tisuća knjižara i prodavatelja knjiga na internetu i usporedbi cijena, dok će oni koji žele čitati besplatne knjige vjerojatno posegnuti za ReadPrint.com.
Tražite li neki multimedijalni sadržaj poput videa, glazbe ili teksta dobro će doći Internet Archive. Ova nevjerojatna baza podataka nudi više od 55 milijardi starih verzija web stranica što može dobro doći ako tražite nešto objavljeno prije dvadesetak godina.
Oni koji žele pronaći informacije o ekonomiji, ljudskim resursima, marketingu ili start-upima mogu se poslužiti Bpubs.comom koji pretražuje milijune objavljenih dokumenata ekonomske i poslovne tematike.
'Nevidljivi' internet možete pretraživati i u potrazi za davno igranom računalnom igrom, vijestima, dijelovima koda ili jednostavno nekom novom igrom kojom možete kratiti vrijeme. FreeOldies pretražuje internet u potrazi za starim i 'napuštenim' igrama koje su najčešće besplatne, a koje vam mogu pomoći da se prisjetite nekih davnih dana i početaka računalnih igara. S druge strane DevMaster namijenjen je programerima i onima koji su zainteresirani za razvijanje samih igara.
Tražite li neku određenu fotografiju ne morate se oslanjati samo na Google Image. Imageafter nudi pregršt fotografija koje možete besplatno preuzet i koristiti u privatne ili komercijalne svrhe. Ithaki je pretraživač koji pretražuje samostalno, ali i putem drugih pretraživača i prikazuje sve rezultate odjednom. Izuzetno koristan pretraživač kad tražite neku rijetku fotografiju.
Uskočite u nepoznato
Ukoliko ste avanturistički raspoloženi ili jednostavno niste zadovoljni rezultatima koje vam nudi vaš internetski pretraživač, pokušajte s pretraživanjem 'nevidljivog' interneta. Moglo bi vas iznenaditi što se sve tamo može pronaći, ako se potrudite.