UMJETNA INTELIGENCIJA

Što je točno Gemini AI i kako funkcionira? Imamo odgovore

13.09.2024 u 09:07

Bionic
Reading

U ovom ćete vodiču saznati sve što je bitno o generativnim modelima Googlea

Google u zadnje vrijeme strašno želi privući što više ljudi na Gemini, svoj vodeći paket generativnih AI modela, aplikacija i usluga. Ali što je to Gemini? Kako ga možete koristiti? I kako se slaže s drugim generativnim AI alatima kao što su OpenAI-jev ChatGPT, Metin Llama i Microsoftov Copilot?

Što je Gemini?

Gemini je Googleova dugo obećana obitelj modela nove generacije AI-ja. Razvijen u Googleovim istraživačkim laboratorijima za umjetnu inteligenciju DeepMind i Google Research, dolazi u četiri verzije:

  • Gemini Ultra
  • Gemini Pro
  • Gemini Flash, brža, 'destilirana' verzija Proa
  • Gemini Nano, dva mala modela: Nano-1 i malo sposobniji Nano-2, namijenjen za rad izvan mreže.

Svi modeli Gemini obučeni su da budu nativno multimodalni - to jest sposobni su raditi i analizirati više od teksta. Google kaže da su bili unaprijed obučeni i fino podešeni na raznim javnim, vlasničkim i licenciranim zvukovima, slikama i videozapisima.

Ovo izdvaja Gemini od modela kao što je Googleov LaMDA, treniran isključivo na tekstualnim podacima. LaMDA ne može razumjeti ni generirati ništa osim teksta (npr. eseje, e-poštu i tako dalje), ali to nije nužno slučaj s modelima Gemini.

Vjerujemo da vrijedi naglasiti da su etika i zakonitost modela obuke na javnim podacima, u nekim slučajevima bez znanja ili pristanka vlasnika podataka, nejasni. Google ima politiku obeštećenja za umjetnu inteligenciju kako bi zaštitio određene klijente Google Clouda od tužbi ako se suoče s njima, ali ova politika sadrži izuzeća.

Nastavite s oprezom - osobito ako namjeravate komercijalno koristiti Gemini.

Koja je razlika između aplikacija i modela Gemini?

Gemini je odvojen i različit od aplikacija na webu i mobitelu (bivši Bard). Aplikacije su klijenti koji se povezuju s različitim modelima i na vrh postavljaju sučelje nalik chatbotu. Zamislite ih kao sučelja za Googleov generativni AI, analogan ChatGPT-ju.

A Gemini za web pronaći ćete ovdje. Na Androidu aplikacija zamjenjuje Google Assistant, a na iOS-u aplikacije Google i Google Search služe kao Gemini klijenti.

Na Androidu je također nedavno postalo moguće prikazati Gemini overlay na vrhu bilo koje aplikacije za postavljanje pitanja o onome što je na ekranu (npr., video na YouTubeu). Samo pritisnite i držite tipku za uključivanje/isključivanje podržanog pametnog telefona ili recite 'Hey Google' - vidjet ćete overlay preko postojeće aplikacije.

Aplikacije mogu prihvatiti slike, kao i glasovne naredbe i tekst, uključujući datoteke poput PDF-ova i uskoro videozapise, bilo prenesene ili uvezene s Googleova diska - i generirati slike. Kao što biste očekivali, razgovori s aplikacijama Gemini na mobilnom uređaju prenose se na Gemini na webu i obrnuto ako ste prijavljeni na isti Googleov račun, piše TechCrunch.

Gemini Advanced

Aplikacije nisu jedini način regrutiranja modela Gemini za pomoć sa zadacima. Polako, ali sigurno, značajke prožete Geminijem probijaju se u osnovne Googleove aplikacije i usluge poput Gmaila i dokumenata.

Da biste iskoristili većinu ovih prednosti, trebat će vam Google One AI Premium plan. Tehnički dio Google One, AI Premium Plan košta 22 eura i omogućuje pristup Geminiju u Googleovim aplikacijama Workspace, kao što su Docs, Slides, Sheets i Meet.

Korisnici tu i tamo dobivaju i dodatke, poput prioritetnog pristupa novim značajkama, mogućnost pokretanja i uređivanja koda u Pythonu izravno u Geminiju, kao i veći 'kontekstni prozor'. Gemini Advanced može zapamtiti sadržaj i razumjeti otprilike 750.000 riječi u razgovoru - u usporedbi s 24.000 riječi koje može obraditi osnovni Gemini.

Još jedna ekskluziva za Gemini Advanced je planiranje putovanja u pretraživanju Googlea, koje stvara prilagođene itinerare putovanja iz upita. Uzimajući u obzir stvari kao što su vrijeme leta (iz e-poruka u korisnikovoj pristigloj pošti na Gmailu), preferencije obroka i informacije o lokalnim atrakcijama (iz pretraživanja i karata), kao i udaljenosti između tih atrakcija, Gemini će generirati plan puta koji se automatski ažurira da odražava sve promjene.

Na svim Googleovim uslugama također je dostupan korporativnim korisnicima kroz dva plana, Gemini Business (dodatak za Google Workspace) i Gemini Enterprise.

U Gmailu Gemini živi u bočnoj ploči koja može pisati e-poštu i sažimati nizove poruka. Pronaći ćete istu ploču u Dokumentima, gdje vam pomaže u pisanju i pročišćavanju sadržaja i osmišljavanju novih ideja.

Geminijev doseg proteže se i na Drive, gdje može sažeti datoteke i dati kratke činjenice o projektu. U međuvremenu, u Meetu prevodi titlove na dodatne jezike, a nedavno je stigao i u Googleov preglednik Chrome u obliku AI alata za pisanje. Možete ga koristiti da napišete nešto potpuno novo ili da prepišete postojeći tekst; Google kaže da će uzeti u obzir web stranicu na kojoj se nalazite kako bi dao preporuke.

Drugdje ćete naznake Geminija pronaći u Googleovim proizvodima baze podataka, sigurnosnim alatima u oblaku i platformama za razvoj aplikacija (uključujući Firebase i Project IDX), kao i u aplikacijama kao što su Google Photos (gdje Gemini obrađuje upite za pretraživanje na prirodnom jeziku), YouTube (gdje pomaže u osmišljavanju videa) i NotebookLM - pomoćnik za bilježenje.

Code Assist (bivši Duet AI for Developers), Googleov paket pomoćnih alata za dovršetak i generiranje koda pokretan umjetnom inteligencijom, prebacuje težak računalni posao na Gemini, kao i Googleovi sigurnosni proizvodi podržani njime, poput Threat Intelligencea, koji može analizirati velike dijelove potencijalno zlonamjernog koda i omogućiti korisnicima pretraživanje prirodnim jezikom u potrazi za tekućim prijetnjama ili indikatorima kompromitacije.

Gemini Gems

Najavljeni na Google I/O 2024., korisnici Gemini Advanceda mogu stvarati Gems, prilagođene chatbotove. Oni se mogu generirati iz opisa prirodnog jezika - naprimjer 'Ti si moj trener trčanja. Daj mi dnevni plan trčanja', što se dijeli s drugima ili ostaje privatno.

Gems su dostupni na stolnom računalu i mobitelu u 150 zemalja i na većini jezika. Na kraju će moći iskoristiti prošireni skup integracija s Googleovim uslugama, uključujući kalendar, Zadatke, Keep i YouTube Music, kako bi dovršili prilagođene zadatke.

Generiranje slike putem Imagena 3

Korisnici Geminija mogu generirati 'umjetnička djela' i 'slike' koristeći Googleov ugrađeni model Imagen 3.

Google kaže da Imagen 3 može točnije razumjeti tekstualne upite koje prevodi u slike u odnosu na svog prethodnika, Imagen 2, i da je 'kreativniji i detaljniji' u svojim generacijama. Osim toga, model proizvodi manje artefakata i vizualnih pogrešaka (barem prema Googleu) i najbolji je model dosad za renderiranje teksta.

U veljači je Google bio prisiljen pauzirati Geminijevu sposobnost generiranja slika ljudi nakon što su se korisnici žalili na povijesne netočnosti. No u kolovozu je tvrtka ponovno uvela generiranje ljudi za određene korisnike, posebno korisnike engleskog jezika koji su se prijavili za jedan od Googleovih plaćenih planova (npr. Gemini Advanced) kao dio pilot programa.

Gemini za tinejdžere

U lipnju je Google predstavio Gemini usmjeren na tinejdžere, omogućujući učenicima da se prijave putem svojih školskih računa Google Workspace for Education.

Gemini usmjeren na tinejdžere ima 'dodatna pravila i mjere zaštite', uključujući prilagođeni proces uključivanja i 'vodič za opismenjavanje za rad s umjetnom inteligencijom' da bi (kako to Google kaže) 'pomogli tinejdžerima da odgovorno koriste umjetnu inteligenciju'. U suprotnom, gotovo je identičan standardnom iskustvu Geminija, sve do značajke 'dvostruke provjere' koja pregledava web kako bi vidjela jesu li odgovori Geminija točni.

Gemini u pametnim kućnim uređajima

Sve veći broj uređaja koje proizvodi Google koristi Gemini za poboljšanu funkcionalnost, od Google TV Streamera preko Pixela 9 i 9 Pro do najnovijeg Nest Learning Thermostata.

Na Google TV Streameru Gemini koristi postavke za odabir prijedloga sadržaja i sažetak recenzija, pa čak i cijelih TV sezona. Na najnovijem termostatu Nest (kao i zvučnicima, kamerama i pametnim zaslonima) Gemini će uskoro poboljšati razgovorne i analitičke mogućnosti Google Asistenta.

Pretplatnici na Googleov plan Nest Aware kasnije ove godine dobit će pregled novih iskustava koja pokreće Gemini, kao što su AI opisi za snimke kamere Nest, videopretraživanje na prirodnom jeziku i preporučene automatizacije. Kamere će razumjeti što se događa u video feedovima u stvarnom vremenu (npr. kada pas kopa po vrtu), dok će popratna aplikacija Google Home prikazati videozapise i izraditi automatizaciju uređaja uz opis (npr. 'Jesu li djeca ostavila svoje bicikle na kolnom prilazu?', 'Neka moj Nest termostat uključi grijanje svaki utorak kad dođem s posla').