OPENAI

ChatGPT navodno dobiva osam novih glasova: Poslušajte kako zvuče

05.09.2024 u 14:05

Bionic
Reading

OpenAI navodno planira dodati nove glasove u ChatGPT-ov napredni glasovni mode, a sada su se pojavile prve naznake o tome kako bi oni mogli zvučati. Prema novim izvještajima, otkriveno je osam novih glasova koji bi se mogli pridružiti postojećim opcijama. TestingCatalog je putem reverse engineeringa pronašao potencijalne nove glasovne opcije, a inženjer Tibor Blaho podijelio je na platformi X detaljne uzorke svakog glasa

Navodno novi glasovi koje bismo mogli čuti su: Fathom, Glimmer, Harp, Maple, Orbit, Rainbow, Reef, Ridge i Vale.

Ovi glasovi pridružili bi se postojećim ChatGPT glasovima: Ember, Juniper, Cove i Breeze (glas Sky više nije dostupan nakon kontroverze sa Scarlett Johansson). Novi glasovi, čini se, variraju u spolu i naglascima; Fathom i Vale zvuče kao Britanci, dok Reef ima australski naglasak, piše Mashable.

OpenAI je u svibnju prošle godine predstavio ChatGPT Voice Mode kao dio svog novog modela, GPT-4o, koji integrira tekst, viziju i audio modalitete u jedan model. Iako je GPT-4o impresionirao svojim sposobnostima, pažnju je zasjenila usporedba demo glasa s glasom glumice Scarlett Johansson, koja je tada izjavila da je odbila ponudu Sama Altmana da koristi njezin glas za model.

Unatoč tome, ChatGPT Voice Mode pokrenut je u srpnju za odabrani broj korisnika ChatGPT Plus, no nije bilo novosti o Voice Modeu.

U demou inženjera Tibora Blahoa, glasovi čitaju pasus koji uključuje pseće laveže i krikove vrana, pokušavajući s različitim uspjehom imitirati životinjske zvukove. Neki glasovi jednostavno izgovaraju 'woof' i 'caw', dok drugi pokušavaju stvarno oponašati pse i vrane. Bez ovih pokušaja imitacije, koji ponekad zvuče pomalo robotski, teško bi se prepoznalo da su glasovi generirani umjetnom inteligencijom.

ChatGPT Voice Mode još je uvijek nov i dostupan samo manjem broju korisnika ChatGPT Plus. Budući da nije jasno kada će audio funkcionalnost biti dostupna većem broju korisnika, također ostaje nepoznato kada će novi glasovi biti integrirani.

Međutim najnovije otkriće sugerira da OpenAI i dalje radi na proširenju mogućnosti glasovnih interakcija u ChatGPT-u, što bi moglo značajno obogatiti iskustvo korisnika. Kako se razvija glasovna tehnologija, očekuje se da će AI glasovi postati još prirodniji i prilagođeniji potrebama korisnika.