Konkurenca izrablja kaos v OpenAI za posodobitve lastnih izdelkov

Jurij Kristan

26. nov 2023 ob 14:19:27

Pretekli teden je poleg drame v OpenAI postregel tudi s kopico novosti in posodobitev v širše uporabljanem programju s področja generativne umetne inteligence.

Direndaj v OpenAI, kjer so Sama Altmana najprej vrgli na cesto, nakar se je po bizarni kolobociji zmagoslavno vrnil na najvišji stolček, je industrijo širše spodbudil v lansiranje novih ali prenovljenih lastnih rešitev. Seveda so bile te brez dvoma v pripravi že dlje časa, toda gola količina novosti v preteklem tednu ustvarja vtis, da so inženirji ... malce pohiteli; na strani Microsofta in OpenAI zato, da bi podpornike pomirili, da njihove naložbe niso v nevarnosti, na strani konkurence zato, da bi si nemara odrezali nov košček pogače. OpenAI je še med burlesko odprl glasovno-pogovorne zmogljivosti ChatGPTja za vse uporabnike. Močno dejavni so bili v Googlu, najprej s posodobitvijo Barda. Ta zna v preizkusni različici po novem precej bolje kot ob septembrskem prvem lansiranju funkcije povzemati posnetke z YouTuba. To pomeni, da zmore na primer iz kuharskih vodičev luščiti recepte in delati filmske obnove. Hkrati to rojeva dileme okoli zaobidenja dejanskega ogleda videa in s tem nanj pripetih oglasov, kar bo gotovo v nejevoljo spravljalo tako ustvarjalce kot oglaševalce.

Pri Googlu so obenem pred desetimi dnevi lansirali algoritem za generiranje zvoka Lyria, zadnjega v vrsti generatorjev govora in glasbe, ki kratijo spanec vsem, ki se službeno ukvarjajo s petjem ali muziciranjem. Družbena omrežja so v zadnjih dneh že polna oglasov za izdelke na tej podlagi, s katerimi je mogoče strašljivo pristno klonirati glasove znanih ljudi. V Anthropicu so splovili različico 2.1 svojega pogovornega bota Claude, ki se od ChatGPTja razlikuje predvsem v dodatnih vgrajenih varnostnih mehanizmih, ki naj bi chatbotu onemogočali izrekati neizrekljivosti. Claude 2.1 ima precej višjo vhodno omejitev podatkov, kar 200.000 tokenov oziroma koscev ali zlogov besed, kar preračunano pomeni okrog 500-stransko knjigo. Pri ChatGPTju Turbo ta trenutno znaša 128.000 zlogov. Aktivni so bili tudi v Stability.AI, in sicer z lansiranjem Stable Video Diffusiona, se pravi generatorja videa iz teksta. S tem sledijo podobnim zmogljivostim od drugod, skladno z načeli podjetja pa gre tudi tu za odprto kodo.