PIŠE: MARKO PEROŽIĆ

Statistikuliranje – manipulacija zdravim razumom

29.01.2010 u 07:00

Bionic
Reading

Statistika ima ulogu retoričkog topovskog mesa. Njome se kreće da nam se onesposobi logika i razum pa da u drugom valu napada možemo primiti necenzuriranu dozu iskrene 'stvarnosti' ravno u mozak, tj. istine kakvom je zamišlja onaj koji nam se obraća

'Postoje tri vrste laži: laži, proklete laži i statistika', sažeta je to te istinita izjava Benjamina Disraelia koja kao citat stoji na početku knjige 'Kako lagati statistikom', autora Darrella Huffa. Iako nema puno smisla recenzirati knjigu napisanu 1954. godine, itekako je smisleno preporučiti ju za čitanje zbog pristupačnog načina kojim razotkriva metode koje se neprestano koriste da bi se neistina upakirala u omot vjerodostojnosti.

O autoru

Marko Perožić diplomirani je sociolog antropolog. Bavi se prevoditeljstvom i istraživačkim radom, pokrivajući područja od radničkih pokreta do heuristika, što povremeno publicira u različitim medijima. Tportal će nekoliko puta mjesečno objavljivati njegove osvrte na teme iz područja popularne znanosti, sociologije i fenomenologije.

Rijetko koje područje znanosti je tako mnogo i tako dugo zlostavljano kao statistika. Statistikom nemoralni rado i lako moraliziraju, lažljivi uvjeravaju u istine, lopovi pokazuju kako doprinose i slično, jednom riječju - manipuliraju. Ako se tim 'ozbiljnim statističkim pokazateljima' pridoda i poetična interpretacija, torta zablude dobiva svoj šlag. Mnogi članci i leci podsjećaju na metodu sir Olivera iz Alana Forda koji je uvijek negativnim primjerom ukazivao na to kako se nešto radi, tj. ne čineći to poput sir Olivera možemo biti sigurni da smo postupili ispravno. To vrijedi i za sveprisutne popularne statistike.

Statistički trendovi često nisu zanimljivi širem čitateljstvu i vjerojatno bi u nedostatku lirske pratnje u obliku komentara i paušalnih ocjena završili na poslovnim stranicama, ako uopće i tamo. Koje su to verbalno logičke diverzije kojima se interpretatori statistika koriste? 'Hrvatska ustvari i nije u velikoj krizi, a u njoj se živi bolje nego što njeni građani misle i govore', izjavljuje se u tekstu o standardu hrvatskih građana.

Novinar može znati da građani lažu o sebi jedino na uzorku vlastitih prijatelja ili poznanika, što nije dovoljno dobro da bi se predstavilo kao reprezentativan podatak, čak i da na Facebooku ima prijatelja kao Ivo Josipović. Kako izvjestitelj zna što građani misle, nedokučiva je tajna. No oba fenomena koja novinar iskazuje više nalikuju vještinama vidovitog Milana nego ozbiljnoj statistici.

Isti članak nam dalje razotkriva da smo 'u pravilu poznati po tome da nam je percepcija stvarnosti lošija od te same stvarnosti'. Podvući nazivnik mrzovolje jednom narodu u tolikoj je mjeri poopćavanje i teži normiranju do te mjere da ga nitko pri zdravoj pameti ne može ozbiljno shvatiti osim kao stereotip dovoljno dobar da bi se uvrstio u kakav autoironični vodič za ksenofobe. Ne treba smetnuti s uma ni to da je novinar pretpostavio da je upravo on taj koji zna kako stvarnost izgleda.

Kojim je to statističkim metodama autor došao do istine o tome kako nas vide drugi, kako mi sami doživljavamo stvarnost i, naposljetku, o stvarnosti samoj? Gomila predrasuda i stereotipa na jednom mjestu, a znanosti, pa tako i statistike, samo u tragovima. Slobodna interpretacija lošeg uzorka začinjenog unaprijed formiranim stavom i nikakvim znanjem dobitna su kombinacija svakog pravog demagoga, a metafora kako 'svaku statistiku oni s dna piramide doživljavaju kao demagogiju, jer se ne vide niti u jednoj od tih kategorija', što rezultira time da 'ju doživljavaju kao demagogiju', krajnje je neukusna. Ako se 'ovi s dna piramide' ne vide ni u jednoj statistici, je li problem u njima ili u načinu na koji se u takvoj statistici manipulira kategorijama? Ako ne možemo prikazati društvenu statistiku u kojoj se može vidjeti uloga i pozicija svih kategorija tog društva, onda takva statistika zaista jest demagogija.

Da bi u školama bilo pametnije učiti matematiku putem statističkog razmišljanja, a manje kroz aritmetiku i trigonometriju, ukazuju i na Institutu Max Planck. Tamo napominju da je u sve skupljem zdravstvenom sustavu važno dobro procijeniti koji su troškovi nužni, a koji nepotrebni. Jedno istraživanje pokazuje da pet od 1000 žena koje nisu išle na pravovremenu mamografiju umire od raka dojke, dok od 1000 žena koje su se odlučile na pregled umiru njih četiri. U akcijama za prevenciju raka to će se prikazati kao 20 posto manje šanse za smrt uzrokovanu tom bolešću. Interpretacija slijedi ovu logiku: jedan od pet je jedna petina, a to znači 20 posto. Iako ne treba poticati ljude da ignoriraju pregled, tako ne treba ni zdravstveni sustav poticati na paternalistički odnos prema svojim korisnicima.

Isti podaci ispravno prevedeni kazuju sljedeće: ako je rak prisutan, a mamografija izostane, umire pet od 1000 žena, tj. 0,5 posto. Ako je rak prisutan, a ode se na pravovremenu mamografiju, tada umiru četiri od 1000 žena, tj. 0,4 posto. Drugim riječima, pravovremeni odlazak na mamografiju smanjuje šanse od najgorih posljedica za 0,1 posto. Kod izračunavanja postotka potrebno je uzeti u obzir čitav uzorak uzorka, i zdrave i oboljele, a ne samo one kojima se pregledom ustanovio, tj. kojima bi se ustanovila zloćudna bolest.

Problem aritmetičke sredine vjerojatno je najučestaliji način manipuliranja. Srednja vrijednost uglavnom nije i najčešća vrijednost. Prosjek koji nam se predstavlja može značiti puno i ništa. Ako je prosjek ujedno i statistički medijan ili sredina, onda u primjeru s kvadratima saznajemo da pola ispitanih živi u manje, a pola u više od 143 kvadrata. No ako se radi o tome da su 143 kvadrata isključivo srednja aritmetička vrijednost, nismo saznali gotovo ništa. Možda se radi o Todorićevom dvorcu na obroncima Sljemena i gomili skučenih jednosobnih stanova zajedno statistički obrađenih.

Nemojmo zaboraviti ni post hoc zaključivanje koje često biva dijelom neispravnih statističkih analiza, ali ih možemo naći i u komentarima svakodnevice. Komentator će rado zaključiti da radnik ne radi jer ima nekog na kome parazitira. Ako B slijedi iz A, uvriježeno je mišljenje da je A uzrokovalo B. Tu naizgled banalnu pogrešku ljudi često ne zapaze pa ju vješti demagozi naprosto obožavaju, a neki iz neznanja koriste. To što su ulice uvijek mokre nakon što padne kiša ne mora nužno značiti da mokre ulice znače da je kiša padala. To što će lijeni radnici uvijek nekome biti na teret ne znači da su brojni otpušteni radnici koji su nekom na teret bili lijeni. Nekad su ulice mokre jer su ih čistači oprali, a radnici na teret jer je poslodavcima bitan samo profit. Razlika je neizmjerno važna, a zanemarivanje te razlike iskaz je krajnjeg cinizma.

Statistika ima ulogu retoričkog topovskog mesa. Njome se kreće da nam se onesposobi logika i razum pa da u drugom valu napada možemo primiti necenzuriranu dozu iskrene 'stvarnosti' ravno u mozak, tj. istine kakvom je zamišlja onaj koji nam se obraća. Kad god je neki tip pristranosti na vidiku, valja posumnjati u rezultate. Ako novine čija je uređivačka politika sklona jednoj političkoj opciji rade anketu o rezultatima predsjedničkih izbora, znajte da su ti rezultati ništavni. Tko čita te novine i sudjeluje u istraživanju koje te novine provode? Procjenjuje li se anketnim pitanjem o tome čijem dekolteu najviše vjerujete religijski potencijal nečijih grudi ili vaša inteligencija? Laže li vam se ili vam se u svrhu 'višeg dobra' govore neistine, procijenite sami, ali sve što je za tu procjenu potrebno jest doza skepse i zdravog razuma, jer 'pokvareni već znaju ove trikove, na poštenima je da ih nauče u svrhu samoobrane'.