Google predstavil množico orodij na temelju Geminija

Jurij Kristan

15. maj 2024 ob 08:01:34

Ob uvodu v razvijalsko konferenco Google I/O 2024 so pri velikanu razkrili kopico programskih novosti, ki se v glavnem tičejo integracije Geminija v njihovo popularno programje, videli pa smo tudi nekaj drugih razkritij, kot je generator videa Veo.

Pričel se je Googlov vsakoletni dogodek za razvijalce, konferenca I/O, ki jo zaštartajo s predstavitvijo novosti, ki nas čakajo v poletnih mesecih (krajši video povzetek). Kot je bilo pričakovati, je bila prezentacija močno osrediščena okoli potiskanja rešitev na osnovi strojnega učenja, se pravi predvsem družine algoritmov Gemini, videli pa smo tudi nekaj drugih zanimivosti. Kot so čivkali že vrabci, bodo skušali z Geminijem nadgraditi tako svoja pisarniška orodja kot iskalnik. Plačljivi uporabniki okolja Workspace, oziroma aplikacij Docs, Slides, Sheets, Drive in Gmail, bodo prihodnji mesec dobili vgrajeno podporo Geminija 1.5 Pro, ki bo zanje sestavljal pošto ali analiziral vsebino dokumentov. Iskalnik za začetek - v ZDA že prihodnji teden - prejme tako imenovane AI Overviews, stranske povzetke povezav, kakršne smo videli že pri konkurenci, za prihodnost pa napovedujejo vse od boljšega rangiranja zadetkov glede na našo zgodovino, pa do samodejnega prečesavanja spleta v ozadju, denimo v iskanju restavracij.

Kot običajno je najbolj zanimiv del odpadel na generativne algoritme. Podjetje je razkrilo tekmeca navdušujoče OpenAI Sore, to je generator videa Google Veo, pa za nameček še zadnjo inkarnacijo generatorja slik, Imagen 3. Veo ima podobne zmogljivosti kot Sora, torej ustvarjanje minuto dolgih video posnetkov v ločljivosti 1080p iz tekstovnih, slikovnih in video pozivov. Bržkone dolgoročno pomembnejši pa je koncept Project Astre, pod katerim se nahaja Googlova ideja univerzalnega strojnega pomočnika, oziroma AI Agenta. To se pravi, "Google Assistanta ali Alexe, le da tokrat v resnici delujeta in sta uporabna". Demis Hassabis je Astro predstavil z izjemnim primerom, za katerega se bo še dolgo ugibalo, v kolikšni meri je bil nemara zrežiran.

Med ostalo množico drobtinic velja omeniti, da zna vizualni iskalnik Lens sedaj brskati po vsebini video posnetkov; da bo poleti Gemini lahko brskal po naših albumih na telefonih in nam neposredno odgovarjal na vprašanja o njihovi vsebini; da bo brskalnik Chrome na računalnikih prejel asistenta na temelju algoritma Gemini Nano, torej lokalnega jezikovnega modela; da bodo Androidni telefoni kmalu lahko prisluškovali našim pogovorom in nas opozorili, če bodo v njih zaznali elemente prevare in tako naprej. Nadgradnjo je ob tem prejel tudi sam Gemini. Različica 1.5 Pro ima kontekst podaljšan na dva milijona zlogov, pokazali pa so tudi novo podrazličico, 1.5 Flash, ki je usmerjena v hitrost, oziroma optimizacijo za točno določene naloge. Kmalu bo mogoče - po vzoru ChatGPTjev - na hitro implementirati tudi lastne različice pogovornih Geminijev, ki jih podjetje imenuje Gems.