VAŽNA AŽURIRANJA

Uskoro dostupno svima: ChatGPT unaprijedio generiranje slika

27.03.2025 u 11:26

Bionic
Reading

Modeli su, tvrde iz OpenAI-ja, trenirani na materijalima koji kompaniju neće uvaliti u probleme s krađom intelektualnog vlasništva

Tijekom prijenosa uživo u utorak, izvršni direktor OpenAI-ja Sam Altman najavio je veliko ažuriranje sposobnosti generiranja slika u ChatGPT-u, piše TechCrunch.

ChatGPT sada može koristiti OpenAI-jev model GPT-4o za izvorno stvaranje i uređivanje slika i fotografija. GPT-4o je već neko vrijeme temelj AI chatbot platforme, ali do sada je mogao generirati i uređivati samo tekst – ne i slike.

Altman je rekao da je GPT-4o s generiranjem slika dostupan od danas u ChatGPT-u i Sori, OpenAI-jevom alatu za generiranje videa, ali samo za pretplatnike Pro plana koji košta 200 dolara mjesečno. Tvrtka najavljuje da će značajka uskoro biti dostupna i korisnicima Plus i besplatne verzije ChatGPT-a, kao i programerima putem usluge API.

GPT-4o pri generiranju slika 'razmišlja' malo dulje od DALL-E 3 modela koji ovim ažuriranjem efektivno zamjenjuje, ali zato OpenAI tvrdi da sada stvara točnije i detaljnije slike. GPT-4o može uređivati postojeće slike, uključujući one s ljudima – može ih transformirati ili 'nadopisivati' (inpainting) dodajući detalje u prednji ili stražnji plan slike.

Kako bi omogućio novu funkcionalnost, OpenAI je rekao Wall Street Journalu da je GPT-4o treniran na javno dostupnim podacima te autorskim radovima prikupljenim kroz partnerstva s tvrtkama poput Shutterstocka. Mnogi AI pružatelji vide podatke za treniranje modela kao konkurentsku prednost, zbog čega ih drže u tajnosti. No, detalji o podacima mogu biti i pravni rizik, osobito zbog mogućih tužbi povezanih s intelektualnim vlasništvom.

'Poštujemo prava umjetnika i imamo politike koje sprječavaju generiranje slika koje izravno oponašaju rad živućih umjetnika', rekao je Brad Lightcap, glavni operativni direktor OpenAI-ja.

OpenAI nudi obrazac za isključivanje koji omogućuje autorima da zatraže uklanjanje svojih djela iz skupa podataka za treniranje. Tvrtka također tvrdi da poštuje zahtjeve za zabranu web-scraping botova, koji bi inače mogli prikupljati podatke, uključujući slike, s određenih web stranica.

Nadograđeni alat za generiranje slika u ChatGPT-u dolazi nedugo nakon Googleovog eksperimentalnog modela Gemini 2.0 Flash, koji je također omogućio izvorno generiranje slika. Ta je značajka ubrzo postala viralna na društvenim mrežama – ali ne iz dobrih razloga. Pokazalo se da Gemini 2.0 Flash ima vrlo malo zaštitnih mjera, omogućujući korisnicima uklanjanje vodenih žigova i generiranje slika zaštićenih autorskim pravima.