HUB 385 za zagrebačkoj Trešnjevci ugostio je čak 21 znanstvenicu na ovogodišnjem, trećem regionalnom susretu žena koje se bave digitalnom znanošću. Posjetitelje čeka niz zanimljivih predavanja i radionica
Kako sam uz pomoć podataka spasila svoje dijete? Istoimeno predavanje Ane Dumić, podatkovne znanstvenice Hrvatskog Telekoma rasplakalo je samo predavačicu i ganulo publiku koja je njeno izlaganje na trećem izdanju regionalne konferencije žena u podatkovnoj znanosti, WiDS Zagreb 2020, popratila velikim aplauzum i potaknulo niz pitanja.
Podatkovna znanstvenica od malih nogu, Ana je to bila i prije nego je taj termin postojao. Govorili su da je pouzdana, profesionalna, komunikativna, uvijek posvećena dati sve od sebe u izazovima na projektima kako bi se došlo do finalnog rješenja. A onda ju je jednog dana na porodiljnom dočekao izazov veći od života: kako se snaći u zdravstvenom sustavu kad isti iscrpi svoje mogućnosti i spasiti život svom djetetu koje se susrelo s teškim oblikom epilepsije, praćenim s nekoliko rijetkih dijagnoza.
Ana se nije dala i na kraju je uspjela, uz pomoć podataka. A koji su je izazovi dočekali kao roditelja i analitičarku te koje su joj aplikacije i načini obrade podataka pomogli u tome, otkrila je u svom predavanju.
'Glavni uspjeh analiza i pattern recognitiona izvučenih iz gomile podataka iz sinove svakodnevice doveli su do toga da je broj epi-napadaja i spazama drastično smanjen i na kraju zaustavljen', rekla je Ana koja je u svom predavanju objasnila koliko je važna suradnja roditelja i liječnika kako bi podaci o pacijentima mogli biti iskorišteni za nove, naprednije metode liječenja i individualizirani pristup kod djece i odraslih s rijetkim stanjima i bolestima.
Predavanje Ane Dumić, diplomirane ferovke koja u Hrvatskom telekomu uspostavlja data mining rješenja za privatne korisnike, razvija churn prediction modele, priprema marketinške kampanje i sudjeluje u međunarodnim analitičkim projektima bilo je tek jedno u nizu događanja u prostorijama HUB-a 385 na zagrebačkoj Trešnjevci, gdje se kroz dva dana održava niz radionica, uz nastupe čak 20 predavačica.
'U mikrosvemiru podataka neke kompanije većina ih je nevidljiva', otkrila je Ana-Marija Petric iz Poslovne inteligencije. Segmentacija je takva da u većini organizacija samo 12 posto podataka ima poslovnu vrijednost, 23 posto podataka su zastarjeli, nebitni ili suvišni, dok je 65 posto podataka dark data u obliku e-mailova, bilježaka, dokumenata, privitaka, transkripta poziva, recenzija...
Ti nestrukturirani podaci postaju ne samo neiskorišteni resurs nego i potencijalni problem, rekla je Petric, koja je u sklopu predavanja indikativnog naziva 'Svjetlo na kraju mračnog tunela nestrukturiranih podataka iz tekstova' otkrila načine kako pri analizi teksta riješiti probleme s čitanjem, identifikacijom osobnih podataka te usklađenjem s GDPR-om.
Nove regulative poput PSD2 i sve veći pritisci izvana te spajanja mnogih manjih tvrtki i većih korporacija osvijestilo je da podatke treba upoznavati na druge načine i u njih 'uroniti' kako bi se odgovorilo na nove zahtjeve. Jelena Kolega i Darja Barišić iz Mercury Processing Services Internationala pričale su o tome kako vratiti žar u radu s podacima u razvoju produkata i isprobavati neke nove alate i metode u analitici.
E-commerce tvrtke suočavaju se s ogromnom količinom podataka iz kojih treba izvući korisne zaključke i napraviti predikcije prodaje. Koliko se novih korisnika može privući, kako smanjiti odljev postojećih korisnika te koliko vrijedi svaki korisnik i njihov klik, objasnila je Andrijana Brkić, podakovna znanstvenica u Lebesgue. Ona je predstavila matematičke metode za analizu e-commerce podataka, objasnila kako se procjenjuje cjeloživotna vrijednost korisnika i kako se na temelju tih podataka određuje potencijal za rast online prodaje.
'Tehnologije analize i primjene velikih količina podataka imaju znatan utjecaj na različite industrije. Velike količine podataka su neiskorišten potencijal u poslovanju proizvodne i uslužne industrije, u kulturi, zdravstvu, financijskom poslovanju, marketingu...', rekla je Sanja Seljan, profesorica Filozofskog fakulteta Sveučilišta u Zagrebu u sklopu predavanja 'Big Data – Od izvora do novoga znanja'.
'Pojam Big Data označava raznovrsne i promjenjive velike količine podataka koje mogu biti pohranjene u strukturiranim, polustrukturiranim ili nestrukturiranim dokumentima, dostupnima u privatnim ili javnim zbirkama', rekla je Seljan pokazavši kako se otkrivanjem prikrivenih podataka i novih odnosa, u velikoj količini raznovrsnih i promjenjivih izvora, stvaraju nove informacije i novo znanje, korisno u daljnjim procesima odlučivanja.
'Kroz zadnjih tri desetljeća lanac opskrbe postao je važan konkurentski alat koji može povećati efikasnost u poslovanju. Koristeći digitalnu tehnologiju uspio je srušiti silose u kompanijama i natjerati izolirane odjele da djeluju kao koordinirana cjelina. Povezao je nabavu, transport, skladište, proizvodnju i distribuciju s krajnjim korisnicima, ali i s dobavljačima', rekla je u uvodnom predavanju dana Kristina Šorić, profesorica na Rochester Institute of Technology Croatia, koja je doktorat stekla na Odjelu za teorijsku i primijenjenu matematiku Sveučilišta u Padovi.
U poslijepodnevnm programu održan je i panel 'Manje priče, više podataka – Razumijemo li zaista što donosi data science?' u kojem su sudjelovale profesorica Sanda Martinčić-Ipšić, psihologinja Lucija Iličić, konzultantica Kristina Reicher i Mirjana Domazet-Lošo, docentica sa Zavoda za primijenjeno računarstvo na FER-u.
Na panelu diskutiralo o pitanjima koja se tiču sadašnjosti i budućnosti znanosti o podacima. Između ostalog, govorilo se o multidisciplinarnosti, transferu znanja i potrebi bolje suradnje tehničkih i društvenih škola.
Što znači uspješna implementacija modela strojnog učenja i kad je model zaista gotov, objasnila je Kristina Bagarić, voditeljica odsjeka za planiranje i koordinaciju u Hrvatskom Telekomu. Prenijela je svoja iskustva stečena u procesu zapošljavanja i razvoja podatkovnih znanstvenika i objasnila kakve kadrove traže, što sve moraju zadovoljiti, koji se rizici mogu pojaviti ukoliko se ne uzmu u obzir sve business varijable te kako izgledaju timovi koji kreiraju modele strojnog učenja.
O automatskom praćenju i analizi aktivnosti sportaša u rukometnim scenama govorila je Marina Ivašić-Kos, izvanredna profesorica na Odjelu za informatiku Sveučilišta u Rijeci gdje drži predavanja iz područja umjetne inteligencije, računalnog vida, objektnog programiranja i razvoja digitalnih igara.
Analiza pojedinačnih akcija sportaša posebno je zanimljiva jer omogućava praćenje stila i načina izvođenja pojedinih vježbi, sprečavanje ozljeda, praćenje kondicije i napretka te poboljšanje performansi sportaša. Razvoj metoda za automatsku detekciju i praćenje igrača i analizu aktivnosti sportaša trebao bi omogućiti i učinkovitiju analizu performansi i povećati dostupnost sustava za analizu svima koji se bave se sportom.
Taja Kuzmić, growth strategist u tvrtki FIVE, otkrila je kako se pomoću predikcijskih modela i podatkovne znanosti utječe na kreiranje strategije i smjera razvoja Rosetta Stone aplikacije, a Jasmina Kolonić, R&D project manager u Microblinku, govorila je o tome koliko je važno pružiti korisnicima osjećaj sigurnosti pri prikupljanju identitifikacijskih podataka na online servisima, od registracije u banking aplikacije do verifikacije vozača i vozila.
Kako predvidjeti potrese koristeći ionosferske pretkazivače otkrila je Barbara Pongračić, podatkovna znanstvenica u iOLAP-u i vanjska suradnica na Pomorskom fakultetu koja radi na istraživanjima vezanima uz zemljinu atmosferu i satelitsku navigaciju.
Područje istraživanja zanimljivo je s gledišta obrade podataka pa do primjene različitih modela zbog toga što se nažalost potresi prvo trebaju dogoditi kako bi se podaci mogli analizirati. S druge strane, anomalije često izazivaju drugi utjecaji, poput solarnih oluja. Izazov je i velika količina podataka iz raznih izvora. Uz to, da bi sustav predviđanja potresa doista bio funkcionalan, trebao bi biti u realnom vremenu.
Za kraj, Ana Anđal, glavni medijski analitičar RTL-a, otkrila je kako se mjeri gledanost televizije i što sve analitičari televizijskih kuća znaju o svojoj publici, s kakvim podacima raspolažu i što im oni govore.