Google Gemini ni tako avtonomen, kot se je hvalil Google

Matej Huš

9. dec 2023 ob 13:58:57

Google je ta teden predstavil veliki generativni model Gemini, ki tekmuje z GPT-4 in od katerega pričakujejo domala renesanso, ali pa vsaj zajezitev neusmiljenega pohoda konkurence. A po solidnem začetnem vtisu je že drugi vtis precej klavrn, saj najboljši videoposnetek oziroma reklama za Gemini ni pristen. Posnetek, ki je hitro nabral več kot milijon ogledov, je močno zrežiran. Pri tem ne mislimo na opombo, ki jo poda že sam posnetek (da so umetno skrajšali zakasnitve in da so Geminijeve odzive skrajšali), temveč da je Google res pretiraval.

Kako so v resnici pripravili posnetek, je kasneje razkril tudi Google. O izdelkih, ki jih je pripravil Gemini, ne gre dvomiti, pač pa je težava v predstavitvi. Model ni tako hiter, ni tako natančen in predvsem ni tako odziven, kot kaže videoposnetek. Interakcija z njim je drugačna od te, ki jo vidimo. Primer: v videoposnetku modelu kretnjo z dlanjo, pa ta vzklikne, da že ve, kaj počne uporabnik: igra kamen, papir, škarje. V resnici je to možno le, če najprej modelu prikažemo vse tri geste, nato pa ga izrecno vpašamo Kaj meniš, da počnem. Šele tedaj bo odgovor tak, kot ga prikaže posnetek. Razlika se morda ne zdi pomembna, a je precej velika.

V večini primerov so bili pozivi (prompts) precej daljši in bolj izrecni in nedvoumno od tega, kar vidimo v videoposnetku. To kaže, da Gemini sicer zmore marsikaj, a vendarle ni tako avtonomen, kot nam ga želi Google predstaviti. Ugovarjali bi lahko, da je tako z vsemi reklamami, a Google je pri razvoju umetne inteligence toliko v zaostanku, da pustijo takšni triki slab priokus.