»

Anthropic ugotavlja, da je vsaka reklama dobra reklama

Slo-Tech - Anthropicov spor s Pentagonom in ameriškim predsednikom je podjetju za zdaj zaprl vrata do ameriške vojske in, če se uresniči grožnja ameriškega predsednika z uvrstitvijo na seznam entitet, ki predstavljajo tveganje za ameriško nacionalno varnost, tudi vseh pogodbenikov ameriške vojske. A podjetje v medijih prisotno kot še nikoli, kar je pozitivno vplivalo na njihovo vidnost. Aplikacija Claude je v zadnjih tednih postala izjemno prepoznavna.

Donald Trump je Anthropic označil kot poblaznelo levičarsko podjetje, ki da je naredilo katastrofalno napako z izsiljevanjem ameriškega ministrstva za vojno, kakor imenuje obrambno ministrstvo. Vse to povečuje popularnost podjetja in njegovega Clauda.

V ZDA se je na Applovem seznamu najpriljubljenejših brezplačnih aplikacij zavihtela na prvo mesto, od koder je izrinila ChatGPT, ki je sedaj drugi. Gemini je četrti. Še 30. januarja je bil Claude na iOS šele 131. najbolj priljubljena aplikacija, februarja pa se je že povzpel med prvo...

9 komentarjev

Anthropic ima tako dober LLM, da reši naloge na razgovoru za delo v Anthropicu

Slo-Tech - Anthropicov Tristan Hume je opisal zanimiv metaproblem, ki ga imajo v podjetju pri preizkušanju novih kandidatov za zaposlitev. Zadnji dve leti uporabljajo test, ki ga lahko kandidati odnesejo domov in rešijo, kar je v dobu velikih jezikovnih modelov lahko problem. Z vsako novo izdajo Clauda morajo test prenoviti, saj ga Claude reši bolje kot velika večina kandidatov.

Od leta 2024 je test reševalo dobrih tisoč kandidatov, izmed katerih so jih več deset tudi zaposlili. To so inženirji, ki so razvijali vse nove verzije od Claude 3, pri čemer so se odlično odrezali. Vsak novi Claude je prejšnje teste v enakem časovnem oknu rešil bolje od velike večine ljudi. Claude 4 je bil boljši od večine, Claude 4.5 pa od vseh. Če so imeli ljudje na voljo neomejeni čas, so tisti najboljši še premagali Claude 4.5.

Konkretni testi so sprva trajali štiri ure, kasneje dve. Kandidati so reševali realistični problem, na voljo pa so imeli vsa orodja, tudi umetno inteligenco. To je smiselno, ker ta...

3 komentarji

Gemini 2.5 je tu

Slo-Tech - Google je predstavil svoj novi model umetne inteligence Gemini 2.5, ki ga reklamirajo kot svoj najinteligentnejši model. Gre za večmodalni model, ki razume besedila in slike.Gemini 2.5 Pro Experimental naj bi odgovarjal tehtneje in pravilneje, tako trdi Google, ker si vzame čas za premislek. Še posebej prilagojen je za kompleksnejše naloge, denimo pisanje programske kode, razvoj sistemov in interaktivnih spletnih aplikacij.

Kot je to v navadi, je Google priložil rezultate več standardnih testov, na katerih je bil novi model boljši ali primerljiv od GPT-4.5, o3-mini, Claude 3.7 Sonnet, Grok 3 Beta in - kar je priznanje, da ga zahodna podjetja resno upoštevajo - DeepSeek R1. V večini testov ga je nekoliko prehitel Grok 3 Beta, a ne zaostaja mnogo. Novi model je na voljo za naročnike na Google AI Studio ali Gemini Advanced.

Google je pokazal nekaj primerov uporabe, denimo v programiranju. Gemini 2.5 je iz kratkega opisa v nekaj vrsticah ustvaril celo primitivno računalniško igro


2 komentarja

Anthropic izdal Claude 3.7

Slo-Tech - Iz Anthropica je prispel novi model umetne inteligence Claude 3.7, ki zmore delovati v dveh načinih. Odzivi so lahko klasični ali pa razmišljujoči (reasoning), s čimer lahko rešuje tudi težje zagonetke. Zaradi tega je hibridni model enostavneje uporabljati, zlasi kadar potrebujemo kombinirane odzive. Uporabnik (ki uporablja API) ima nadzor nad njegovim obnašanjem, na primer kako dolgo razmišlja in koliko računske moči troši. Hkrati model izpisuje (scratchpad), kako razmišlja oziroma rešuje problem. To je koristna informacija tudi za uporabnika, ki lahko vidi, ali bi se model bolje odrezal, če bi imel na voljo več časa, in podobno.

Claude 3.7 je precej boljši pri pisanju kode in razvoju, dobil pa je tudi orodje Claude Code za pisanje kode. Inženirji mu lahko delegirajo različna opravila, ki jih morajo rešiti pri programiranju. Razmišljujoči model je dobil dodatni trening na področjih pisanja kode, uporabe računalnikov, odgovarjanja na pravne dileme in podobne naloge, ki jih lahko...

6 komentarjev

Anthropic tožijo zaradi uporabe avtorsko zaščitenih vsebin za trening umetne inteligence

Slo-Tech - Anthropic je naslednje v vrsti podjetij, ki razvijajo umetno inteligenco in so jih doletele tožbe ustvarjalcev avtorsko zaščitenih del. V ponedeljek so pisatelji in novinarji Andrea Bartz, Charles Graeber in Kirk Wallace Johnson vložili tožbo na kalifornijsko zvezno sodišče, v kateri podjetju očitajo uporabo nezakonitih kopij njihovih del za trening umetne inteligence Claude.

Podobne tožbe drugih avtorjev in lastnikov avtorskih pravic so doletele tudi konkurenco, denimo OpenAI in Meto. Tudi v njih podjetjem očitajo, da so brez dovoljenja uporabljali avtorsko zaščitene vsebine za urjenje umetne inteligence. Prav Anthropic pa je ena tovrstna tožba že doletela, in sicer so ga lani tožili glasbeni založniki zaradi uporabe besedil različnih skladb pri pripravi Clauda. Da, tudi besedila skladb so avtorsko zaščitena in jih ni dovoljeno kar poprek kopirati in uporabljati.

V nekaterih primerih se podjetja poravnajo. Reddit sklepa sporazume s podjetji, ki želijo uporabljati vsebine na...

10 komentarjev

Meta izdala Llamo 3

Slo-Tech - Meta je predstavila novo generacijo generativnih modelov umetne inteligence Llama. V tretji inkarnaciji sta ta hip na voljo Llama 3 8B in Llama 3 70B, ki imata prav toliko parametrov: osem in sedemdeset milijard. V primerjavi z drugo generacijo, ki ima sicer prav toliko parametrov, predstavljata korenit skok v zmogljivosti, so dejali v Meti. Učila sta se na dveh gručah s 24.000 grafičnimi procesorji.

Zagotovo vsak avtor hvali svoj model kot najboljši, zato nas zanimajo oprijemljivi številčni podatki. Meta trdi, da sta modela na testih MMLU, ARC, DROP, GPQA, HumanEval, GSM-8K, MATH, AGIEval in BIG-Bench Hard boljša od konkurence, denimo Mistrala 7B in Gemme 7B. To sicer drži, a na nekaterih testih je Llama 3 8B le za odtenek boljša, omenjena konkurenta pa tudi nista več najnovejša. Llama 3 70B premaga tudi Gemini 1.5 Pro, ne pa na primer Claude 3 Opus. Odveč je dodati, da je na lastnem testu, ki si ga je izmislila Meta, Llama 3 prekosila konkurenco.

Llama 3 je naučen na 15...

8 komentarjev

Anthropic lansiral tretjo generacijo modela Claude

Anthropic - Pri Anthropicu so predstavili družino velikih jezikovnih modelov Claude 3, s katero neposredno žugajo Geminiju in GPT-4.

Medtem ko se pod soji luči vrši dvoboj med navezo OpenAI-Microsoft in Googlom, ter Meta v bližini nekaj motovili z lamami, si skuša na področju velikih jezikovnih modelov svoj kos pogače odrezati tudi kopica manjših izzivalcev. Med bolj prepoznavnimi je družba Anthropic, ki so jo pred tremi leti ustanovili odpadniki iz OpenAI, ki so Samu Altmanu po povezavi z Microsoftom očitali prehitro komercializacijo. Sami razvijajo modele družine Claude, katere posebnost je vdelava spiska dodatnih zavor in smernic, po katerih naj bi se strojna pamet ravnala, čemur pravijo "constitutional AI". Zanimiva je tudi njihova dolgoročna strategija, po kateri želijo prispeti do algoritmov, ki bi se znali - vsaj na določenem ožjem področju - učiti sami in bi bili lahko osnova močnim pametnim pomočnikom. To se pravi, podobno kot pri OpenAI, le da še kanec bolj ambiciozno.

Medtem ko...

25 komentarjev