»

Google: ustvarjanje besedila z LLM letos že 33-krat manj potratno kot lani

Slo-Tech - Google je izdal krajše poročilo o okoljskih vplivih umetne inteligence, v katerem so ocenili tudi porabo energije za ustvarjanje besedila z velikimi jezikovnimi modeli. Čeprav celokupna poraba električne energije raste, je to posledica večje razširjenosti modelov, medtem ko posamezne poizvedbe porabijo čedalje manj energije. V letu dni se je potratnost poizvedb znižala za 33-krat, so ugotovili.

Energija se ne troši le za delovanje čipov, na katerih teče veliki jezikovni model, temveč tudi za podporni infrastrukturi. To so tako drugi deli strojne opreme, kot pomnilnik, shranjevanje podatkov in prenos podatkov, kot tudi hlajenje, transformatorji in ostalo. Google ocenjuje, da ena poizvedba v Geminiju potroši 0,24 Wh električne energije, kar ustreza nekaj sekundam dela na prenosnem računalniku. Temu pripada ogljični odtis 0,03 grama CO2 in 0,26 mililitra porabe vode.

Razčlemba po podatkovnem centru pa pokaže, da 58 odstotkov energije porabijo delujoči čipi za AI, 24 odstotkov...

6 komentarjev

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1

Slo-Tech - V približno tednu dni je dotlej malo znano kitajsko podjetje DeepSeek z lansiranjem naprednega velikega jezikovnega modela R1 področje generativnih algoritmov na videz postavilo na glavo: za bistveno nižjo ceno so namreč napravili izdelek, ki se lahko kosa z OpenAI o1.

Prejšnji ponedeljek - ravno na dan Trumpove druge prisege - je malo znano kitajsko zagonsko podjetje DeepSeek predstavilo družino jezikovnih modelov DeepSeek R1. Natančneje, gre za modele z določeno zmožnostjo sklepanja (simulated reasoning - SR), ki v fazi izvajanja postopek odgovarjanja strukturirajo v nekakšno zaporedje argumentiranega iskanja delnih odgovorov, zaradi česar so uporabni predvsem na področju znanosti, matematike in tehnologije. Prvi algoritem takšne sorte so pri OpenAI predstavili lanskega septembra v obliki o1 in torej veljajo za čelo napredka.

Posebnost R1 pa ni zgolj to, da naj bi kitajski startup v zgolj nekaj mesecih dohitel OpenAI, saj naj bi bil R1 po izkazu sila blizu o1, temveč še bolj v...

169 komentarjev

Googlovo nadgrajeno iskanje ima sila neroden štart

Slo-Tech - Strojni odgovori, ki jih v Googlovem iskalniku postreže z Geminijem podprta tehnologija AI Overviews, so v preteklem tednu postali predmet posmeha širom spleta, saj pogosto halucinirajo.

Sredi maja so pri Googlu na dogodku I/O 2024 predstavili vrsto novosti na temelju Geminija, svoje osrednje platforme generativnih algoritmov. Med njimi AI Overviews, dodatek k običajnim rezultatom svojega iskalnika, ki postreže z jedrnatim generiranim odgovorom na podlagi dosegljivih spletnih vsebin, kakršnih smo zadnje čase vajeni od pogovornih botov. V dneh po prireditvi so pričeli tehnologijo postopno lansirati za uporabnike čez Lužo ... in ti so hitro naleteli na milo rečeno nenavadne in zabavne odgovore ter predloge, ki jim jih je iskalnik vrnil. Med množico hecnih idej iskalnika so trditve, da v ligi NBA igrajo psi, da je Barack Obama musliman, ali da so imeli nekateri ameriški predsedniki po ducat diplom. Največ razburjenja pa je upravičeno povzročil napotek, da naj na pico dodamo nekaj...

30 komentarjev

Microsoft razvija veliki jezkovni model MAI-1

Slo-Tech - Vendarle smo slišali pričakovane vesti iz Redmonda, da Microsoft vendarle razvija lasten veliki jezikovni model. Za zdaj poimenovan MAI-1 bo imel pol bilijona parametrov, s čimer bo konkuriral Googlovemu Geminiju in OpenAI-jevemu ChatGPT-ju četrte generacije. Predstaviti ga utegnejo že ta mesec na konferenci Build. Projekt vodi Mustafa Suleyman iz podjetja Inflection AI, ki ga je Microsoft prevzel marca letos.

Microsoftov poslovni odnos do umetne inteligence je zanimiv. Na pomembnost področja je Bill Gates opozoril že pred leti, podjetje pa je nato investiralo več kot deset milijard dolarjev v OpenAI. Odločitev se jim je izplačala, saj je njihov model GPT-4 med najbolj priljubljenimi na svetu, Microsoft pa ga je smel integrirati v svoj Copilot, Bing in druge izdelke. A vendarle bi bilo nenavadno, če bi Microsoft uporabljal zgolj tuje orodje, sam pa ne bi poizkušal ničesar razviti, razen če je dolgoročni načrt prevzeti OpenAI, kar pa zaradi kompleksne lastniške strukture ni prav...

7 komentarjev

Anthropic lansiral tretjo generacijo modela Claude

Anthropic - Pri Anthropicu so predstavili družino velikih jezikovnih modelov Claude 3, s katero neposredno žugajo Geminiju in GPT-4.

Medtem ko se pod soji luči vrši dvoboj med navezo OpenAI-Microsoft in Googlom, ter Meta v bližini nekaj motovili z lamami, si skuša na področju velikih jezikovnih modelov svoj kos pogače odrezati tudi kopica manjših izzivalcev. Med bolj prepoznavnimi je družba Anthropic, ki so jo pred tremi leti ustanovili odpadniki iz OpenAI, ki so Samu Altmanu po povezavi z Microsoftom očitali prehitro komercializacijo. Sami razvijajo modele družine Claude, katere posebnost je vdelava spiska dodatnih zavor in smernic, po katerih naj bi se strojna pamet ravnala, čemur pravijo "constitutional AI". Zanimiva je tudi njihova dolgoročna strategija, po kateri želijo prispeti do algoritmov, ki bi se znali - vsaj na določenem ožjem področju - učiti sami in bi bili lahko osnova močnim pametnim pomočnikom. To se pravi, podobno kot pri OpenAI, le da še kanec bolj ambiciozno.

Medtem ko...

25 komentarjev

Qualcomm pokazal novega Snapdragona 8 Gen 3

Slo-Tech - Qualcomm je včeraj naznanil novo generacijo procesorskih čipov Snapdragon 8 Gen 3, ki jo bomo v prvih telefonih ugledali prihodnje leto. Prinaša nižjo porabo energije, več zmogljivosti in novo konfiguracijo jeder 1:5:2. To pomeni, da ima eno zelo hitro jedro (3,3 GHz Corte X4), pet srednje hitrih jeder (3,2 GHz) in dve počasnejši jedri za varčevanje z energijo. Po besedah proizvajalca je čip 30 odstotkov hitrejši in 20 odstotkov varčnejši od predhodnika.

Veliko podrobnosti Qualcomm ni razkril, tako da ne poznamo niti točnega tipa grafičnega procesorja Adreno. Igre bo možno igrati z 240 fps, podpira pa tudi Unreal Engine 5.2. Trdijo, da je 25 odstotkov hitrejši in prav toliko učinkovitejši od predhodnika. Novi Snapdragon podpira pomnilnik LPDDR5x (s frekvenco do 4800 MHz) do 24 GB, Wi-Fi 7 in ima modem za X75 5G. Precej dlje pa se je Qualcomm na predstavitvi pomudil pri sposobnostih poganjanja modelov umetne inteligence. V čipu je temu namenjen del (AI Engine), ki je prilagojen za...

9 komentarjev