PRIJEPORI ZBOG GAMS-A

Slovenci razvijaju nacionalni AI model, izdavači i prevoditelji brinu zbog autorskih prava

28.03.2025 u 15:51

Bionic
Reading

Slovenija se pridružila utrci za razvoj nacionalnog jezičnog modela, alata generativne umjetne inteligencije sličnog popularnom ChatGPT-u. Društvo slovenskih književnih prevoditelja i Komora nakladnika izrazili su zabrinutost zbog moguće zloupotrebe tekstova i pitanja autorskog prava

Model pod nazivom GaMS, što je kratica za Generativni model slovenskog jezika, model se razvija u Centru za jezične resurse i tehnologiju na Sveučilištu u Ljubljani u sklopu projekta povejmo.si koji financira država. Njegova druga iteracija, GaMS 9B-Instruct, dostupna je za testiranje na web stranici projekta.

Marko Robnik Šikonja, član projektnog tima i profesor na ljubljanskom Fakultetu računarstva i informatike, rekao je novinarima da je model pokrenut na Gemmi, modelu otvorenog koda Googlea, i obučen sa slovenskim podacima.

Postojeći veliki jezični modeli uglavnom su uvježbani s podacima na velikim jezicima poput engleskog, ali im nedostaju kulturne specifičnosti slovenskog, rekao je.

Ovaj model je uvježban sa skupovima podataka na slovenskom jeziku koji sadrže deset milijardi riječi, ali plan je da se na kraju dobiju skupovi podataka od 40 milijardi riječi i trenutno su u tijeku napori da se prikupe dodatni tekstovi.

Velike nacionalne institucije poput Nacionalne i sveučilišne knjižnice te mediji i izdavači pozvani su da pridonesu svojim tekstovima.

Veliki jezični model radi na Vegi, slovenskom superračunalu, i besplatno je dostupan javnosti. Osmišljen je za korištenje ne samo od strane opće populacije, već i za industrijske i istraživačke svrhe.

Nakladnici upozoravaju: Pitanje autorskih prava nije regulirano

Tim su se povodom oglasili i Komora nakladnika i knjižara te Društvo slovenskih književnih prevoditelja, koji prihvaćaju sudjelovanje u inicijativi, no ukazuju na otvorena pitanja autorskih prava.

Kako u priopćenju ističe Komora nakladnika i knjižara, ubrzani razvoj umjetne inteligencije otvara brojna nova pitanja u vezi s korištenjem objavljenih djela, koja zadiru u temeljne dileme autorstva, prava korištenja i pravedne podjele vrijednosti, a među gorućim problemima je korištenje autorskih djela u velikim jezičnim modelima. Potonji za rad zahtijevaju opsežne korpuse tekstova, često uključujući članke i knjige, za koje tvrtke koje razvijaju te modele nemaju uvijek čak ni suglasnost nositelja autorskih prava, a nositelji autorskih prava ne dobivaju nikakvu naknadu.

Naglasili su kako su autorski tekstovi rezultat dugotrajnog kreativnog i intelektualnog procesa u kojem sudjeluju autori, urednici, prevoditelji, lektori, izdavači i drugi. Iako se veliki jezični modeli često oslanjaju na takva djela u tehnološke i komercijalne svrhe, dionici u lancu knjiga ne dobivaju naknadu za njihovu upotrebu.

Istodobno, granica između javnog interesa i znanstvene uporabe velikih jezičnih modela s jedne strane i komercijalnih interesa privatnih tvrtki s druge strane često ostaje nejasna. Smatraju da sve veća zastupljenost velikih jezičnih modela otvara pitanje pravedne i održive regulacije tog odnosa i primjerenog priznavanja doprinosa nositelja autorskih prava razvoju nove tehnologije.

Ističu da stvaranje pravednih rješenja zahtijeva dijalog svih dionika te da je ključno da se izdavači proaktivno uključe u kreiranje rješenja koja će štititi interese autora, izdavača i ostalih dionika, a istovremeno omogućiti odgovorno i zakonito korištenje književnih i drugih objavljenih djela u razvoju umjetne inteligencije.

Prevoditelje muči i neovlaštena upotreba te širenje

Društvo slovenskih književnih prevoditelja (DSKP) uputilo je nekoliko pitanja Centru za jezične resurse i tehnologije (CJVT) u vezi s kampanjom prikupljanja teksta za razvoj slovenskog velikog jezičnog modela, također vezanih uz autorsko pravo i zaštitu djela od neovlaštene uporabe i širenja. Među ostalim, zanima ih i kakva je metodologija, na koji način će se uvažavati etički standardi te postoje li ograničenja u korištenju tekstova, npr. cijele knjige, predviđa novčanu naknadu.

Kako su napisali, odgovore još nisu dobili, a još čekaju sastanak s predstavnicima tvrtke CJVT koja razvija model. O tome su obaviještene i druge autorske udruge – Društvo slovenskih pisaca, Slovenski centar PEN, Društvo slovenskih književnih kritičara te većina prevoditeljskih i tumačečkih društava.

Budući da, kako su napisali, čak i ako se radi o javno dostupnom, nekomercijalnom modelu, mnoga pitanja vezana uz autorski zaštićeni materijal ostaju otvorena, rezervirani su oko akcije prikupljanja.