»

Google pokazal Nano Banano 2

Slo-Tech - Lani je Google predstavil svoj generator slik z umetno inteligenco, ki mu je nadel ime Nano Banana. V naslednjih tednih in mesecih ga je sproti izboljševal, sedaj pa je napočil čas za novo večjo izdajo. Pred nami je Nano Banana 2.

Prejšnja banana je imela pod pokrovom Gemini 3.0, nova verzija pa temelji na modelu Gemini 3.1 Flash Image. Google pravi, da je podobno zmogljiva kot Nano Banana Pro, a bistveno hitrejša. Od modela Gemini 3.1 pa je podedovala več védenja o svetu, tako da bo risala bolje in verneje.

Do novega modela lahko dostopimo prek spletne strani Gemini. Pri uporabi različic Gemini Fast, Thinking in Pro se bo risanju slik avtomatično sprožila Nano Banana 2. Za zdaj je model Flash, v prihodnosti pa se obeta tudi Nano Banana 2 Pro.

2 komentarja

Kaj je Googlov projekt Genie, ki je prestrašil založnike iger

Slo-Tech - Google je predstavil projekt Genie, ki je včeraj založnikom iger pošteno nagnal strah v kosti. Delnice podjetja Take-Two so izgubile osem odstotkov, Roblox je končal 13 odstotkov niže, Unity pa je potonil kar za 24 odstotkov. Morda je odziv trga pretiran - pogosto je tako - a vendarle velja pogledati, kaj neki je Genie in koga utegne zamenjati.

Genie 3 je model umetne inteligence, ki je namenjen ustvarjanju 3-D svetov za igre. Natrenirali so ga na javno dostopnih podatkih na internetu, so v beli knjigi njegove prve verzije pojasnili v DeepMindu. Genie 3 so prvikrat pokazali že avgusta, odslej pa je na voljo naročnikom Google AI Ultra v ZDA. Naročnina stane 250 dolarjev na mesec.

Projekt Genie je prototip spletne aplikacije, ki jo poganjajo modeli Genie 3, Nano Banana Pro in Gemini. Prvi torej ustvarja svetove, druga skrbi za grafično podobo, Gemini je za komunikacijo in ubeseditev želja. S preprostim besednim pozivom in nalaganjem slik je mogoče opisati in orisati igralski svet...

8 komentarjev

V Gmail dobivamo povzetke, ki jih dela umetna inteligenca

Slo-Tech - V Google je v Gmail AI Overviews prvikrat vgradil lani, ko je povzemal daljše verige elektronskih sporočil. Danes so predstavili še širšo integracijo v Gmail, prav tako pa so nekatere funkcionalnosti ponudili tudi uporabnikom brezplačne različice.

AI Overviews sicer poznamo iz iskanja po Googlu, kjer se pri večini občih iskalnih pojmov nad zadetki izpiše povzetek umetne inteligence. To omogoča, da iščemo že celo človeško, s povsem običajnimi stavki, ne le več s skrbno izbranimi ključnimi besedami. Sedaj se AI Overviews pojavlja tudi pri iskanju po elektronski sporočilih v Gmailu. Iskanje torej ne bo več omejeno na ključne besede, ki se dobesedno pojavijo v pošti, temveč bomo dobili povzetek vseh sporočil s povezavami nanje.

Naročniki plačljivih različic pa bodo (AI Pro in Ultra) pa bodo dobili še nekaj dodatnih funkcionalnosti, na primer preverjanje slovnice in pravopisa, pa tudi slogovne predloge. AI Proofreading uporablja Gemini 3 za fine popravke besedila.

Nekaj srečnih...

8 komentarjev

Google predstavil novo Nano Banano Pro

Slo-Tech - Google je izdal novo verzijo svojega modela umetne inteligence, ki je prilagojen za izdelavo, obdelavo in predelavo slik. Nano Banana, ki je izšla avgusta in je temeljila na modelu Gemini 2.5 Flash, je dobila naslednico. Nano Banana Pro je osnovana na novem modelu Gemini 3 Pro (Image), a so zavoljo javne podobe obdržali ime banana. Do nje pridemo z obiskom Geminija, kjer izberemo model Gemini 3 Pro in nato kliknemo Create Image.

Ključna prednost novega modela je večja poslušnost. Medtem ko je bilo prejšnji verziji mestoma težko dopovedati posamezne detajle, še največ težav pa je imela z vstavljanjem teksta v slike. Gemini 3 Pro Image je tu storil velik korak naprej, saj je besedilo pravilno, slike pa obdeluje s precej večjo natančnostjo. Če mu na primer ukažemo, naj zamenja posamezno osebo, to tudi stori, ne da bi popačil preostalo kompozicijo.

Tudi ustvarjanje slik mu gre bolje. Rezultati so precej bolj realistični, a imajo znameniti vodni žig in še kup drugih identifikatorjev,...

3 komentarji

Google Gemini ni tako avtonomen, kot se je hvalil Google

TechCrunch - Google je ta teden predstavil veliki generativni model Gemini, ki tekmuje z GPT-4 in od katerega pričakujejo domala renesanso, ali pa vsaj zajezitev neusmiljenega pohoda konkurence. A po solidnem začetnem vtisu je že drugi vtis precej klavrn, saj najboljši videoposnetek oziroma reklama za Gemini ni pristen. Posnetek, ki je hitro nabral več kot milijon ogledov, je močno zrežiran. Pri tem ne mislimo na opombo, ki jo poda že sam posnetek (da so umetno skrajšali zakasnitve in da so Geminijeve odzive skrajšali), temveč da je Google res pretiraval.

Kako so v resnici pripravili posnetek, je kasneje razkril tudi Google. O izdelkih, ki jih je pripravil Gemini, ne gre dvomiti, pač pa je težava v predstavitvi. Model ni tako hiter, ni tako natančen in predvsem ni tako odziven, kot kaže videoposnetek. Interakcija z njim je drugačna od te, ki jo vidimo. Primer: v videoposnetku modelu kretnjo z dlanjo, pa ta vzklikne, da že ve, kaj počne uporabnik: igra kamen, papir, škarje. V resnici je to...

13 komentarjev

Google lansiral model Gemini, svojega tekmeca GPTjem

vir: Google
Google - Pri Googlu so naznanili nastop multimodalnega velikega generativnega modela Gemini, neposrednega tekmeca GPT-4 in tehnologije, na kateri nameravajo graditi prihodnost svojih storitev.

Vse od lanskoletnega lansiranja ChatGPTja je bilo videti, da je navezi OpenAIja in Microsofta uspelo svojega poglavitnega tekmeca Googla grdo presenetiti. Čeprav so ravno Googlovi laboratoriji zaslužni za pretežni del teoretičnih prebojev v razvoju strojnega učenja, se je velikan zaradi ChatGPTja nenadoma znašel v zaostanku in znotraj vodstva naj bi zavladala panika, ki je botrovala prenekaterim spremembam, od vrnitve Larryja Paga in Sergeya Brina v aktivnejšo svetovalno vlogo pa do združitve oddelkov Brain in DeepMind. Sedaj so v podjetju najavili prvi praktični rezultat reform, multimodalni generativni UI model Gemini. V osnovi gre za naslednika velikega jezikovnega modela PaLM 2, toda Gemini je bil že od začetka načrtovan mnogo bolj širokopotezno. To se najbolj odraža v njegovi multimodalnosti,...

8 komentarjev