NOVA ZNAČAJKA

Može li AI od izumiranja spasiti rijetke i ugrožene jezike u Europi: Što to sprema Meta

01.07.2024 u 12:25

Bionic
Reading

Meta uskoro uvodi mogućnost prikaza objava na Facebooku i Instagramu na 200 rijetko korištenih jezika diljem svijeta. Prema nedavno objavljenom radu u sklopu projekta 'No Language Left Behind' (NLLB), Meta je unaprijedila svoju tehnologiju kako bi obuhvatila i desetak europskih jezika s malim brojem govornika, poput - kako navode - škotskog galskog, galskog, irskog, ligurskog, islandskog i velškog jezika, a navode čak i 'bosanski'. Prema Meti, 'jezik s malim resursima' je onaj koji ima manje od milijun rečenica dostupnih za analizu

Meta trenira svoj sustav umjetne inteligencije (AI) koristeći podatke iz Opus repozitorija, otvorene platforme koja sadrži autentične tekstove na raznim jezicima za strojno učenje. Suradnici na ovom skupu podataka su stručnjaci za obradu prirodnog jezika (NLP); to je grana AI istraživanja koja omogućava računalima prevođenje i razumijevanje ljudskog jezika.

Uz Opus, Meta koristi i podatke s Wikipedije kako bi kreirala višeznačni jezični model (MLM), gdje AI može prevoditi 'između bilo koja dva jezika bez oslanjanja na podatke na engleskom', piše Euronews.

Stručnjaci pozivaju na suradnju s izvornim govornicima

Unatoč napretku, stručnjaci smatraju da bi Meta trebala konzultirati izvorne govornike i jezične stručnjake kako bi unaprijedila uslugu. William Lamb, profesor galske etnologije i lingvistike na Sveučilištu u Edinburghu, naglašava važnost suradnje s izvornim govornicima. 'Ako zaista žele poboljšati prijevode, trebali bi razgovarati s izvornim govornicima galskog koji još uvijek žive i dišu taj jezik', kaže Lamb.

Lamb ističe da su trenutni prijevodi na škotski galski 'još uvijek nedovoljno dobri' zbog korištenja podataka prikupljenih iz raznih izvora. 'Većina izvornih govornika su stariji od 70 godina i ne koriste računala, dok mlađi govornici koriste galski na drugačiji način od svojih djedova i baka.'

Potreba za suradnjom stručnjaka

Alberto Bugarín-Diz, profesor AI-ja na Sveučilištu Santiago de Compostela, vjeruje da bi jezični stručnjaci trebali surađivati s tehnološkim tvrtkama kako bi unaprijedili dostupne skupove podataka. 'Ovo mora biti posao stručnjaka koji mogu pregledati tekstove, ispraviti ih i ažurirati s metapodacima koje možemo koristiti', kaže Bugarín-Diz.

Meta procjenjuje da će nakon potpune implementacije nove tehnologije na feedu na Facebooku, Instagramu i drugim platformama biti više od 25 milijardi prijevoda dnevno. Međutim, Bugarín-Diz upozorava da bi Meta i druge AI tvrtke trebale potražiti kvalitetne podatke online i pridržavati se zakonskih zahtjeva kako bi ih koristile bez kršenja intelektualnog vlasništva.

Dok Lamb izražava oprez i kaže da još ne bi preporučio korištenje Meta prevoditelja zbog pogrešaka u podacima, Bugarín-Diz vjeruje da će, ako korisnici ne koriste prijevode, Meta biti manje voljna ulagati vrijeme i resurse u njihovo poboljšanje. 'Kao i kod drugih AI alata, važno je poznavati slabosti tehnologije prije njezina korištenja', zaključuje Bugarín-Diz.