»

Anthropic izdal Claude 3.7

Slo-Tech - Iz Anthropica je prispel novi model umetne inteligence Claude 3.7, ki zmore delovati v dveh načinih. Odzivi so lahko klasični ali pa razmišljujoči (reasoning), s čimer lahko rešuje tudi težje zagonetke. Zaradi tega je hibridni model enostavneje uporabljati, zlasi kadar potrebujemo kombinirane odzive. Uporabnik (ki uporablja API) ima nadzor nad njegovim obnašanjem, na primer kako dolgo razmišlja in koliko računske moči troši. Hkrati model izpisuje (scratchpad), kako razmišlja oziroma rešuje problem. To je koristna informacija tudi za uporabnika, ki lahko vidi, ali bi se model bolje odrezal, če bi imel na voljo več časa, in podobno.

Claude 3.7 je precej boljši pri pisanju kode in razvoju, dobil pa je tudi orodje Claude Code za pisanje kode. Inženirji mu lahko delegirajo različna opravila, ki jih morajo rešiti pri programiranju. Razmišljujoči model je dobil dodatni trening na področjih pisanja kode, uporabe računalnikov, odgovarjanja na pravne dileme in podobne naloge, ki jih lahko...

5 komentarjev

Umetno inteligenco največ uporabljamo za programiranje

Slo-Tech - Vsaj za zdaj se strahovi, da bo umetna inteligenca nadomestila ljudi, ne udejanjajo. Eden izmed pionirjev razvoja Anthropic je analiziral pogovore, ki jih imajo ljudje z njegovim pomočnikom Claude.ai, in ugotovil, da nas umetna inteligenca še ne bo izpodrinila. Ključno spoznanje je, da umetna inteligenca dela z ljudmi in ne namesto njih.

Ugotovili so, da tretjina poklicev že redno uporablja umetno inteligenco (torej pri vsaj četrtini opravil), pri štirih odstotkih poklicev pa se uporablja že pri treh četrtinah nalog. V večini primerov, tj. 57 odstotkih, dopolnjuje človeške sposobnosti in sodeluje, v preostalih primerih pa je njen namen avtomatizacija. Največ se uporablja v poklicih, ki so srednje ali dobro plačani, najmanj pa v nizko plačani ali ekstremno visoko plačanih poklicih.

Zanimiva je razčlemba po poklicih. Največji delež uporabnikov Clauda potrebuje pomoč pri računalniških opravilih, zlasti pri pisanju kode. Na drugem mestu je oblikovanje, šport, zabava in mediji, na...

36 komentarjev

Anthropic tožijo zaradi uporabe avtorsko zaščitenih vsebin za trening umetne inteligence

Slo-Tech - Anthropic je naslednje v vrsti podjetij, ki razvijajo umetno inteligenco in so jih doletele tožbe ustvarjalcev avtorsko zaščitenih del. V ponedeljek so pisatelji in novinarji Andrea Bartz, Charles Graeber in Kirk Wallace Johnson vložili tožbo na kalifornijsko zvezno sodišče, v kateri podjetju očitajo uporabo nezakonitih kopij njihovih del za trening umetne inteligence Claude.

Podobne tožbe drugih avtorjev in lastnikov avtorskih pravic so doletele tudi konkurenco, denimo OpenAI in Meto. Tudi v njih podjetjem očitajo, da so brez dovoljenja uporabljali avtorsko zaščitene vsebine za urjenje umetne inteligence. Prav Anthropic pa je ena tovrstna tožba že doletela, in sicer so ga lani tožili glasbeni založniki zaradi uporabe besedil različnih skladb pri pripravi Clauda. Da, tudi besedila skladb so avtorsko zaščitena in jih ni dovoljeno kar poprek kopirati in uporabljati.

V nekaterih primerih se podjetja poravnajo. Reddit sklepa sporazume s podjetji, ki želijo uporabljati vsebine na...

10 komentarjev

Llama 3.1 405B je največji odprti jezikovni model doslej

vir: Meta
Meta - Pri Meti so po mesecih napovedi izdali prvi odprtoutežni jezikovni model s prek 400 milijardami parametrov, Llamo 3.1 405B.

Bržkone največji ideološki boj pri razvoju velikih jezikovnih modelov je ta hip tisti med povsem zaprtimi modeli, kamor spada večina od razvpitih igralcev na trgu - GPT, Gemini, Claude - in pa na drugi strani ... na nek način odprtimi, kjer je vodilna Meta z družino modelov Llama. Tako Mark Zuckerberg kot vodja njegovega laboratorija za generativne modele Yann LeCun sta namreč velika zagovornika bolj odprtega razvoja takšnih algoritmov. Zato ni nenavadno, da je ob lansiranju najnovejše družine, Llama 3.1, Zuckerberg doktrino nadrobno pojasnil v spletni objavi.

Po njegovem tudi tu velja dinamika, ki smo jo lahko spremljali v vojni operacijskih sistemov med Windowsi in Linuxom - čeprav so Okna na površju komercialno uspešnejši izdelek, pa je Linux spričo svoje zanesljivosti, prilagodljivosti in svobodnosti našel pot na mnoga področja, od mobilnih naprav do...

1 komentar

Meta izdala Llamo 3

Slo-Tech - Meta je predstavila novo generacijo generativnih modelov umetne inteligence Llama. V tretji inkarnaciji sta ta hip na voljo Llama 3 8B in Llama 3 70B, ki imata prav toliko parametrov: osem in sedemdeset milijard. V primerjavi z drugo generacijo, ki ima sicer prav toliko parametrov, predstavljata korenit skok v zmogljivosti, so dejali v Meti. Učila sta se na dveh gručah s 24.000 grafičnimi procesorji.

Zagotovo vsak avtor hvali svoj model kot najboljši, zato nas zanimajo oprijemljivi številčni podatki. Meta trdi, da sta modela na testih MMLU, ARC, DROP, GPQA, HumanEval, GSM-8K, MATH, AGIEval in BIG-Bench Hard boljša od konkurence, denimo Mistrala 7B in Gemme 7B. To sicer drži, a na nekaterih testih je Llama 3 8B le za odtenek boljša, omenjena konkurenta pa tudi nista več najnovejša. Llama 3 70B premaga tudi Gemini 1.5 Pro, ne pa na primer Claude 3 Opus. Odveč je dodati, da je na lastnem testu, ki si ga je izmislila Meta, Llama 3 prekosila konkurenco.

Llama 3 je naučen na 15...

8 komentarjev

Anthropic lansiral tretjo generacijo modela Claude

Anthropic - Pri Anthropicu so predstavili družino velikih jezikovnih modelov Claude 3, s katero neposredno žugajo Geminiju in GPT-4.

Medtem ko se pod soji luči vrši dvoboj med navezo OpenAI-Microsoft in Googlom, ter Meta v bližini nekaj motovili z lamami, si skuša na področju velikih jezikovnih modelov svoj kos pogače odrezati tudi kopica manjših izzivalcev. Med bolj prepoznavnimi je družba Anthropic, ki so jo pred tremi leti ustanovili odpadniki iz OpenAI, ki so Samu Altmanu po povezavi z Microsoftom očitali prehitro komercializacijo. Sami razvijajo modele družine Claude, katere posebnost je vdelava spiska dodatnih zavor in smernic, po katerih naj bi se strojna pamet ravnala, čemur pravijo "constitutional AI". Zanimiva je tudi njihova dolgoročna strategija, po kateri želijo prispeti do algoritmov, ki bi se znali - vsaj na določenem ožjem področju - učiti sami in bi bili lahko osnova močnim pametnim pomočnikom. To se pravi, podobno kot pri OpenAI, le da še kanec bolj ambiciozno.

Medtem ko...

25 komentarjev