Arhiv novic @ Slo-Tech

Skoči na vsebino
Navigacija

Zadnje novice

Zadnji članki

☰

Mali oglasi Članki

Prijava

Po mesecih

Napredno

Išči: Avtor:

Novice » Povezane novice

Google: ustvarjanje besedila z LLM letos že 33-krat manj potratno kot lani

Matej Huš :: 23. avg 2025 ob 19:50
Znanost in tehnologija

Slo-Tech - Google je izdal krajše poročilo o okoljskih vplivih umetne inteligence, v katerem so ocenili tudi porabo energije za ustvarjanje besedila z velikimi jezikovnimi modeli. Čeprav celokupna poraba električne energije raste, je to posledica večje razširjenosti modelov, medtem ko posamezne poizvedbe porabijo čedalje manj energije. V letu dni se je potratnost poizvedb znižala za 33-krat, so ugotovili.

Energija se ne troši le za delovanje čipov, na katerih teče veliki jezikovni model, temveč tudi za podporni infrastrukturi. To so tako drugi deli strojne opreme, kot pomnilnik, shranjevanje podatkov in prenos podatkov, kot tudi hlajenje, transformatorji in ostalo. Google ocenjuje, da ena poizvedba v Geminiju potroši 0,24 Wh električne energije, kar ustreza nekaj sekundam dela na prenosnem računalniku. Temu pripada ogljični odtis 0,03 grama CO2 in 0,26 mililitra porabe vode.

Razčlemba po podatkovnem centru pa pokaže, da 58 odstotkov energije porabijo delujoči čipi za AI, 24 odstotkov...

Anthropic izdal Claude 3.7

Matej Huš :: 25. feb 2025 ob 13:03
Znanost in tehnologija

Slo-Tech - Iz Anthropica je prispel novi model umetne inteligence Claude 3.7, ki zmore delovati v dveh načinih. Odzivi so lahko klasični ali pa razmišljujoči (reasoning), s čimer lahko rešuje tudi težje zagonetke. Zaradi tega je hibridni model enostavneje uporabljati, zlasi kadar potrebujemo kombinirane odzive. Uporabnik (ki uporablja API) ima nadzor nad njegovim obnašanjem, na primer kako dolgo razmišlja in koliko računske moči troši. Hkrati model izpisuje (scratchpad), kako razmišlja oziroma rešuje problem. To je koristna informacija tudi za uporabnika, ki lahko vidi, ali bi se model bolje odrezal, če bi imel na voljo več časa, in podobno.

Claude 3.7 je precej boljši pri pisanju kode in razvoju, dobil pa je tudi orodje Claude Code za pisanje kode. Inženirji mu lahko delegirajo različna opravila, ki jih morajo rešiti pri programiranju. Razmišljujoči model je dobil dodatni trening na področjih pisanja kode, uporabe računalnikov, odgovarjanja na pravne dileme in podobne naloge, ki jih lahko...

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1

Jurij Kristan :: 27. jan 2025 ob 21:35
Ostala programska oprema

Slo-Tech - V približno tednu dni je dotlej malo znano kitajsko podjetje DeepSeek z lansiranjem naprednega velikega jezikovnega modela R1 področje generativnih algoritmov na videz postavilo na glavo: za bistveno nižjo ceno so namreč napravili izdelek, ki se lahko kosa z OpenAI o1.

Prejšnji ponedeljek - ravno na dan Trumpove druge prisege - je malo znano kitajsko zagonsko podjetje DeepSeek predstavilo družino jezikovnih modelov DeepSeek R1. Natančneje, gre za modele z določeno zmožnostjo sklepanja (simulated reasoning - SR), ki v fazi izvajanja postopek odgovarjanja strukturirajo v nekakšno zaporedje argumentiranega iskanja delnih odgovorov, zaradi česar so uporabni predvsem na področju znanosti, matematike in tehnologije. Prvi algoritem takšne sorte so pri OpenAI predstavili lanskega septembra v obliki o1 in torej veljajo za čelo napredka.

Posebnost R1 pa ni zgolj to, da naj bi kitajski startup v zgolj nekaj mesecih dohitel OpenAI, saj naj bi bil R1 po izkazu sila blizu o1, temveč še bolj v...

169 komentarjev

OpenAI predstavil novi model O1

Matej Huš :: 15. sep 2024 ob 21:49
Znanost in tehnologija

Slo-Tech - OpenAI je v četrtek predstavil nov generativni model O1, ki je trenutno na voljo v izvedenkah o1-mini in o1-preview. Ključna razlika v primerjavi s predhodnikom GPT-4o je bolj celostno razmišljanje, saj je model namenoma narejen tako, da se odziva nekoliko počasneje in da premisli o celotnem vprašanju, preden izpljune odgovor. To so dosegil tako, da so ga učili na povsem novem podatkovnem nizu, hkrati pa so uporabili nove algoritme. Za zdaj še nima večmodalnosti, zato ne more analizirati fotografij ali slikati.

Hkrati je tudi precej dražji, zato bo uporaba prek API od tri do štirikrat dražja, uporabniki plačljive spletne inačice pa bodo dobili le omejeno število poizvedb na teden. OpenAI O1 v resnici še ni povsem končan, zato ga označujejo kot preview. A kljub temu je pri vprašanjih, ki terjajo celostni premislek, denimo pri reševanju matematičnih zagonetk, presenetljivo natančen. Ker pa nima dostopa do interneta in ima drugačno vrsto znanja, je manj natančen pri odgovarjanju na...

Llama 3.1 405B je največji odprti jezikovni model doslej

Jurij Kristan :: 24. jul 2024 ob 22:22
Ostala programska oprema

vir: Meta

Meta - Pri Meti so po mesecih napovedi izdali prvi odprtoutežni jezikovni model s prek 400 milijardami parametrov, Llamo 3.1 405B.

Bržkone največji ideološki boj pri razvoju velikih jezikovnih modelov je ta hip tisti med povsem zaprtimi modeli, kamor spada večina od razvpitih igralcev na trgu - GPT, Gemini, Claude - in pa na drugi strani ... na nek način odprtimi, kjer je vodilna Meta z družino modelov Llama. Tako Mark Zuckerberg kot vodja njegovega laboratorija za generativne modele Yann LeCun sta namreč velika zagovornika bolj odprtega razvoja takšnih algoritmov. Zato ni nenavadno, da je ob lansiranju najnovejše družine, Llama 3.1, Zuckerberg doktrino nadrobno pojasnil v spletni objavi.

Po njegovem tudi tu velja dinamika, ki smo jo lahko spremljali v vojni operacijskih sistemov med Windowsi in Linuxom - čeprav so Okna na površju komercialno uspešnejši izdelek, pa je Linux spričo svoje zanesljivosti, prilagodljivosti in svobodnosti našel pot na mnoga področja, od mobilnih naprav do...

OpenAI začel uriti nov model

Matej Huš :: 28. maj 2024 ob 20:39
Znanost in tehnologija

Slo-Tech - Špekuliralo se je, da bi lahko GPT-5 dobili že letos poleti, a trenutno nič ne kaže na to. Ravno nasprotno, saj so iz OpenAI sporočili, da so pravkar začeli trening novega modela, ki bo nasledil GPT-4. Prihajajoči GPT-5 se je torej začel uriti, kar bo trajalo več mesecev, morda tudi leto dni. Tudi ko bo trening končan, pa GPT-5 ne bo takoj romal na splet. Pred tem ga morajo temeljito preizkusiti in preveriti, da ne počne (preveč) neumnosti, nato pa prilagoditi za končno uporabo. To vključuje tudi blokado določenih poizvedb, ki so neprimerne za širšo rabo zaradi etičnih ali zakonskih omejitev ali pa zgolj v neskladju s politiko podjetja. Po zelo optimističnem scenariju to izid postavlja v sredino leta 2025.

Ali Sam Altman govori res govori o GPT-5 ali pa morda celo o njegovem nasledniku, ne vemo. Označil ga je kot "frontier model", kar označuje sposobnejši model od trenutnih. Končni cilj podjetja je seveda ustvariti splošno umetno inteligenco (AGI), ki se bo kosala z ljudmi na vseh...

OpenAI izdal GPT-4o

Matej Huš :: 13. maj 2024 ob 23:40
Znanost in tehnologija

Slo-Tech - OpenAI je danes izdal novo verzijo velikega jezikovnega modela GPT-4o, ki je hitrejši in zmogljivejši od predhodnikov, ko gre za obdelovanje besedil, slik in zvoka. Tehnična direktorica Mira Murati je dejala, da bo brezplačno na voljo vsem uporabnikom, bodo pa imeli naročniki plačljive verzije na razpolago do petkrat več računske moči. Nove zmožnosti bodo javnosti predajali postopoma, začenši z besedilom.

Črka o pomeni "omni", so dodali v OpenAI. Pri obdelovanju in razumevanju besedila je enako sposoben kot GPT-4 Turbo, izboljšave pa so predvsem pri tekstu v drugih jezikih poleg angleščine. Sam Altman dodaja, da sta vmesnika za zvok in video najboljša doslej, kar je seveda treba vzeti z zrnom soli. Model je multimodalen, kar pomeni, da se enako dobro znajde v kakršnikoli kombinaciji zvoka, videa in besedila. Za razvijalce bo na voljo tudi API, ki pa bo plačljiv, a pol cenejši od GPT-4 Turbo. Razumevanje zvoka pa pomeni, da se bo možno z modelom pogovarjati kot z vsakim asistentom.
...

Microsoft razvija veliki jezkovni model MAI-1

Matej Huš :: 7. maj 2024 ob 07:06
Znanost in tehnologija

Slo-Tech - Vendarle smo slišali pričakovane vesti iz Redmonda, da Microsoft vendarle razvija lasten veliki jezikovni model. Za zdaj poimenovan MAI-1 bo imel pol bilijona parametrov, s čimer bo konkuriral Googlovemu Geminiju in OpenAI-jevemu ChatGPT-ju četrte generacije. Predstaviti ga utegnejo že ta mesec na konferenci Build. Projekt vodi Mustafa Suleyman iz podjetja Inflection AI, ki ga je Microsoft prevzel marca letos.

Microsoftov poslovni odnos do umetne inteligence je zanimiv. Na pomembnost področja je Bill Gates opozoril že pred leti, podjetje pa je nato investiralo več kot deset milijard dolarjev v OpenAI. Odločitev se jim je izplačala, saj je njihov model GPT-4 med najbolj priljubljenimi na svetu, Microsoft pa ga je smel integrirati v svoj Copilot, Bing in druge izdelke. A vendarle bi bilo nenavadno, če bi Microsoft uporabljal zgolj tuje orodje, sam pa ne bi poizkušal ničesar razviti, razen če je dolgoročni načrt prevzeti OpenAI, kar pa zaradi kompleksne lastniške strukture ni prav...

Meta izdala Llamo 3

Matej Huš :: 18. apr 2024 ob 22:50
Znanost in tehnologija

Slo-Tech - Meta je predstavila novo generacijo generativnih modelov umetne inteligence Llama. V tretji inkarnaciji sta ta hip na voljo Llama 3 8B in Llama 3 70B, ki imata prav toliko parametrov: osem in sedemdeset milijard. V primerjavi z drugo generacijo, ki ima sicer prav toliko parametrov, predstavljata korenit skok v zmogljivosti, so dejali v Meti. Učila sta se na dveh gručah s 24.000 grafičnimi procesorji.

Zagotovo vsak avtor hvali svoj model kot najboljši, zato nas zanimajo oprijemljivi številčni podatki. Meta trdi, da sta modela na testih MMLU, ARC, DROP, GPQA, HumanEval, GSM-8K, MATH, AGIEval in BIG-Bench Hard boljša od konkurence, denimo Mistrala 7B in Gemme 7B. To sicer drži, a na nekaterih testih je Llama 3 8B le za odtenek boljša, omenjena konkurenta pa tudi nista več najnovejša. Llama 3 70B premaga tudi Gemini 1.5 Pro, ne pa na primer Claude 3 Opus. Odveč je dodati, da je na lastnem testu, ki si ga je izmislila Meta, Llama 3 prekosila konkurenco.

Llama 3 je naučen na 15...

Anthropic lansiral tretjo generacijo modela Claude

Jurij Kristan :: 5. mar 2024 ob 22:03
Ostala programska oprema

Anthropic - Pri Anthropicu so predstavili družino velikih jezikovnih modelov Claude 3, s katero neposredno žugajo Geminiju in GPT-4.

Medtem ko se pod soji luči vrši dvoboj med navezo OpenAI-Microsoft in Googlom, ter Meta v bližini nekaj motovili z lamami, si skuša na področju velikih jezikovnih modelov svoj kos pogače odrezati tudi kopica manjših izzivalcev. Med bolj prepoznavnimi je družba Anthropic, ki so jo pred tremi leti ustanovili odpadniki iz OpenAI, ki so Samu Altmanu po povezavi z Microsoftom očitali prehitro komercializacijo. Sami razvijajo modele družine Claude, katere posebnost je vdelava spiska dodatnih zavor in smernic, po katerih naj bi se strojna pamet ravnala, čemur pravijo "constitutional AI". Zanimiva je tudi njihova dolgoročna strategija, po kateri želijo prispeti do algoritmov, ki bi se znali - vsaj na določenem ožjem področju - učiti sami in bi bili lahko osnova močnim pametnim pomočnikom. To se pravi, podobno kot pri OpenAI, le da še kanec bolj ambiciozno.

Medtem ko...

Združenje AI Alliance bo promoviralo odprt razvoj strojnega učenja

Jurij Kristan :: 8. dec 2023 ob 08:50
Ostale najave

Slo-Tech - Zagovorniki odprtega razvoja strojno učenih algoritmov so ustanovili združenje AI Alliance, s katerim se želijo zoperstaviti nevarnosti prevlade najbolj razvpitih komercialnih aplikacij te vrste, ki so v veliki meri zaprte.

Nedavni prevrat v OpenAIju je vnovič razplamtel debate okoli načina, na katerega je najprimerneje raziskovati in razvijati moderne strojno učene algoritme, kot so veliki jezikovni in sorodni generativni modeli. V OpenAI sta se namreč po doslej znanih podatkih pretežno skregali dve poglavitni struji strokovnjakov, ki menita, da nepremišljen razvoj lahko pripelje do slabo nadzorovane splošne umetne inteligence (AGI), ki bi lahko pomenila nevarnost za človeško civilizacijo. Toda kjer je upravni odbor zagovarjal stališče, da mora biti razvoj počasnejši in nekomercialen, bolj po vzoru univerzitetnih raziskav, je krog okoli Altmana menil, da nujno potrebuje Microsoftov denar, če naj izvaja raziskave z dovolj visoko hitrostjo, da ne bo zaostal za konkurenco. Tokrat je...

Konkurenca izrablja kaos v OpenAI za posodobitve lastnih izdelkov

Jurij Kristan :: 26. nov 2023 ob 14:19
Ostala programska oprema

Claude

Claude

Slo-Tech - Pretekli teden je poleg drame v OpenAI postregel tudi s kopico novosti in posodobitev v širše uporabljanem programju s področja generativne umetne inteligence.

Direndaj v OpenAI, kjer so Sama Altmana najprej vrgli na cesto, nakar se je po bizarni kolobociji zmagoslavno vrnil na najvišji stolček, je industrijo širše spodbudil v lansiranje novih ali prenovljenih lastnih rešitev. Seveda so bile te brez dvoma v pripravi že dlje časa, toda gola količina novosti v preteklem tednu ustvarja vtis, da so inženirji ... malce pohiteli; na strani Microsofta in OpenAI zato, da bi podpornike pomirili, da njihove naložbe niso v nevarnosti, na strani konkurence zato, da bi si nemara odrezali nov košček pogače. OpenAI je še med burlesko odprl glasovno-pogovorne zmogljivosti ChatGPTja za vse uporabnike. Močno dejavni so bili v Googlu, najprej s posodobitvijo Barda. Ta zna v preizkusni različici po novem precej bolje kot ob septembrskem prvem lansiranju funkcije povzemati posnetke z YouTuba. To...

ChatGPT bo lahko sprejemal slike in govor

Jurij Kristan :: 26. sep 2023 ob 20:09
Ostala programska oprema

vir: openai.com

openai.com - Pri OpenAI so naznanili skorajšnji prihod novih zmogljivosti v razvpitega pogovornega bota ChatGPT: poleg teksta mu bomo lahko predložili tudi slike in ga spraševali glasovno.

Ko so v OpenAI marca lansirali GPT-4, smo med teoretičnimi zmogljivostmi lahko zasledili tudi multimodalnost, se pravi organsko razumevanje različnih formatov informacij, v tem primeru poleg teksta še podobe. Toda dejansko uporabo teh funkcij v podjetju dozirajo zelo počasi; tako so se poleti povezali z družbo Be My Eyes, ki izdeluje istoimensko aplikacijo za pomoč slabovidnim, medtem ko navadnim uporabnikom tolmačenje slik še ni dosegljivo, domnevno predvsem zaradi bojazni pred nevarnostmi, ki jih takšne zmogljivosti potencialno pomenijo za našo zasebnost. Tudi Microsoft v Bing Chatu takšne dodatke preizkuša precej previdno. Sedaj je nastopil trenutek za preskok na novo stopnico, kajti "v roku dveh tednov" bodo naročniki na storitvi Plus in Enterprise lahko ChatGPTju posredovali tudi podobe ali ga...

OpenAI odprl API za GPT-4 vsem naročnikom

Matej Huš :: 11. jul 2023 ob 07:57
Znanost in tehnologija

Slo-Tech - Čeprav GPT-4 obstaja že nekaj časa in ga naročniki ChatGPT tudi že lahko uporabljajo, je OpenAI šele sedaj najavil splošno dostopnost tega jezikovnega modela. To v praksi pomeni, da ni treba več čakati na vabilo, temveč imajo dostop vse stranke, ki naročijo plačljiv dostop. Na enak način so dostopni tudi GPT-3.5 Turbo, DALL·E in Whisper API.

GPT-4 je izšel marca, odtlej pa je prošnjo za vabilo oddalo več kot milijon strank. Do danes ga uporabljajo že številni izdelki, ki imajo dostop do modela prek API. Sedaj je GPT-4 na voljo strankam z zgodovino plačil, torej obstoječim naročnikom, medtem ko bodo vsi novi naročniki dostop pridobili najpozneje konec meseca. V trenutno dostopni verziji lahko model na enkrat ustvari do 13 strani besedila (8K). Sčasoma bodo te omejitve višje, so dodali.

Predhodnik, GPT-3, pa se bo počasi upokojil. OpenAI je dejal, da ga bodo aktivno podpirali do januarja prihodnje leto, nato pa bodo model ugasniti, da bi lahko računsko moč koristneje uporabili za...

OpenAI naznanil GPT-4

Jurij Kristan :: 14. mar 2023 ob 22:59
Znanost in tehnologija

vir: openai.com

openai.com - Kot smo že nekaj časa pričakovali, so v OpenAI naposled najavili veliki jezikovni model GPT-4. Za rahlo presenečenje pa so obenem poskrbeli v Microsoftu, s priznanjem, da novi Bing Chat v bistvu na njem sloni že od začetka testiranja.

Skoraj 3 leta nas že ločijo od prvih vnašanj ukazov generativnemu jezikovnemu algoritmu, oziroma velikemu jezikovnemu modelu (LLM) GPT-3. Umotvor laboratorija OpenAI je postal eden od sinonimov za eksplozijo generativne strojne inteligence, ki je lani dosegla nove nivoje z generatorji slik in jesenskim lansiranjem pogovornega bota ChatGPT, letos pa z nebrzdano naglico poganja novo tekmo med tehnološkimi velikani. Posledica norije je bilo seveda mrzlično čakanje na novo različico GPTja, ki so ga sicer inženirji medtem iterativno nadgrajevali, tako da je bila lani v bistvu aktualna različica 3.5. Tudi šef OpenAIja, Sam Altman, je večkrat opozoril, da so pričakovanja bržkone prevelika in da bo GPT-4 nova evolucijska stopnja ter še daleč od kakšne...