Arhiv novic @ Slo-Tech

Novice » Povezane novice

Yann LeCun priznal, da so pri testih Llame 4 goljufali

Matej Huš :: 4. jan 2026 ob 10:59
Znanost in tehnologija

Slo-Tech - V daljšem intervjuju za The Financial Times je Yann LeCun, ki je novembra lani najavil svoj odhod z mesta direktorja umetne inteligence pri Meti, priznal zavajanje. Ko so lani aprila izdali Llamo 4, so testi kazali precej boljše rezultate od kasnejših dosežkov v resnični uporabi. V primerjavi s konkurenco je bila Llama 4 sorazmerno slabo sprejeta, podjetje pa so obtoževali zavajanja. LeCun ga je priznal.

Dejal je, da so rezultate testov nekoliko ponaredili. Razvojna ekipa je uporabila različne variante modela za različne teste, nato pa vse skupaj predstavila kot rezultate enotnega modela. Direktor Mark Zuckerberg nad tem početjem ni bil navdušen, dodaja. Izgubil je zaupanje v vse, ki so sodelovali pri tem početju, veliko ljudi je tudi zapustilo podjetje.

LeCun, ki je lani napovedal odhod iz Meta, ustanavlja lastno podjetje Advanced Machine Intelligence Labs, ki bo imelo precej povezav tudi z njegovo rodno Francijo. Podjetja ne bo vodil kot direktor, temveč bo izvršni predsednik...

Preberi več

7 komentarjev

Google predstavil novo Nano Banano Pro

Matej Huš :: 22. nov 2025 ob 08:33
Znanost in tehnologija

Slo-Tech - Google je izdal novo verzijo svojega modela umetne inteligence, ki je prilagojen za izdelavo, obdelavo in predelavo slik. Nano Banana, ki je izšla avgusta in je temeljila na modelu Gemini 2.5 Flash, je dobila naslednico. Nano Banana Pro je osnovana na novem modelu Gemini 3 Pro (Image), a so zavoljo javne podobe obdržali ime banana. Do nje pridemo z obiskom Geminija, kjer izberemo model Gemini 3 Pro in nato kliknemo Create Image.

Ključna prednost novega modela je večja poslušnost. Medtem ko je bilo prejšnji verziji mestoma težko dopovedati posamezne detajle, še največ težav pa je imela z vstavljanjem teksta v slike. Gemini 3 Pro Image je tu storil velik korak naprej, saj je besedilo pravilno, slike pa obdeluje s precej večjo natančnostjo. Če mu na primer ukažemo, naj zamenja posamezno osebo, to tudi stori, ne da bi popačil preostalo kompozicijo.

Tudi ustvarjanje slik mu gre bolje. Rezultati so precej bolj realistični, a imajo znameniti vodni žig in še kup drugih identifikatorjev,...

Preberi več

3 komentarji

Osmina znanstvenih člankov ima prstne odtise umetne inteligence

Matej Huš :: 8. jul 2025 ob 22:09
Znanost in tehnologija

Slo-Tech - Veliki jezikovni modeli, ki so se pojavili v zadnjih letih, so po eni strani močno napredovali in ustvarjajo skorajda človeška besedila, po drugi strani pa so vplivali na besedišče, saj je pogostost uporabe posameznih besed drugačna kot pri naravnih govorcih. To je ena izmed značilnosti, ki jih moremo uporabiti za analizo njihove razširjenosti. Prav to so storili raziskovalci z Univerze Northwestern v Illinoisu in Univerze v Tübingenu v Nemčiji, ko so analizirali 15 milijonov povzetkov (abstract) biomedicinskih znanstvenih člankov iz baze PubMed, ki so nastali v letih 2010-2024. Lani je že 13,5 odstotka vsebin kazalo, da so pri njihovem nastanku avtorju v večji ali manjši meri uporabili velike jezikovne modele (LLM). V nekaterih vedah je ta delež dosegel 40 odstotkov. O raziskavi poročajo v reviji Science Advances.

Članek so ironično naslovili Delving into LLM-assisted writing in biomedical publications through excess vocabulary, saj je prav beseda delve z razmahom LLM-jev...

Preberi več

17 komentarjev

Meta uvedla in začasno umaknila umetno inteligenco v WhatsAppu

Matej Huš :: 12. apr 2025 ob 22:33
Ostale najave

Slo-Tech - Dober teden dni je uporabnike WhatsAppa v Evropi jezil modri krožec, ki je priklical umetno inteligenco Meta AI. V ZDA in Kanadi je na voljo že od leta 2023, lani je začela kapljati tudi na druge kontinente, letos pa je tudi v EU. Dobila sta ga tudi Messenger in Instagram, ki takisto sodita v Metin ekosistem. Medtem ko se uporabniki marsikod spraševali, kako se lahko znebijo novega gumba, je sredi tedna nenadoma izginil. Po besedah Mete zaradi tehničnih težav.

V Meti so potrdili, da je umetna inteligenca ponekod dosegljiva neposredno v pogovorih, če jo prikličemo z navedbo (@Meta AI), v drugih pa sploh ne. Prav tako jo vidimo kot novi stik, ki pa ni vedno na voljo, medtem ko se bo modri gumb vrnil malce pozneje. V EU smo Metino umetno inteligenco dobili še konec marca letos, pa še to v nekoliko okrnjeni obliki. Ker pa je ni bilo možno izključiti, je Meta naletela na burne odzive, o njej so razpravljali celo v Evropskem parlamentu in Evropski uniji.

Meta AI je pogovorni robot...

Preberi več

1 komentar

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1

Jurij Kristan :: 27. jan 2025 ob 21:35
Ostala programska oprema

Slo-Tech - V približno tednu dni je dotlej malo znano kitajsko podjetje DeepSeek z lansiranjem naprednega velikega jezikovnega modela R1 področje generativnih algoritmov na videz postavilo na glavo: za bistveno nižjo ceno so namreč napravili izdelek, ki se lahko kosa z OpenAI o1.

Prejšnji ponedeljek - ravno na dan Trumpove druge prisege - je malo znano kitajsko zagonsko podjetje DeepSeek predstavilo družino jezikovnih modelov DeepSeek R1. Natančneje, gre za modele z določeno zmožnostjo sklepanja (simulated reasoning - SR), ki v fazi izvajanja postopek odgovarjanja strukturirajo v nekakšno zaporedje argumentiranega iskanja delnih odgovorov, zaradi česar so uporabni predvsem na področju znanosti, matematike in tehnologije. Prvi algoritem takšne sorte so pri OpenAI predstavili lanskega septembra v obliki o1 in torej veljajo za čelo napredka.

Posebnost R1 pa ni zgolj to, da naj bi kitajski startup v zgolj nekaj mesecih dohitel OpenAI, saj naj bi bil R1 po izkazu sila blizu o1, temveč še bolj v...

Preberi več

169 komentarjev

Llama 3.1 405B je največji odprti jezikovni model doslej

Jurij Kristan :: 24. jul 2024 ob 22:22
Ostala programska oprema

vir: Meta

Meta - Pri Meti so po mesecih napovedi izdali prvi odprtoutežni jezikovni model s prek 400 milijardami parametrov, Llamo 3.1 405B.

Bržkone največji ideološki boj pri razvoju velikih jezikovnih modelov je ta hip tisti med povsem zaprtimi modeli, kamor spada večina od razvpitih igralcev na trgu - GPT, Gemini, Claude - in pa na drugi strani ... na nek način odprtimi, kjer je vodilna Meta z družino modelov Llama. Tako Mark Zuckerberg kot vodja njegovega laboratorija za generativne modele Yann LeCun sta namreč velika zagovornika bolj odprtega razvoja takšnih algoritmov. Zato ni nenavadno, da je ob lansiranju najnovejše družine, Llama 3.1, Zuckerberg doktrino nadrobno pojasnil v spletni objavi.

Po njegovem tudi tu velja dinamika, ki smo jo lahko spremljali v vojni operacijskih sistemov med Windowsi in Linuxom - čeprav so Okna na površju komercialno uspešnejši izdelek, pa je Linux spričo svoje zanesljivosti, prilagodljivosti in svobodnosti našel pot na mnoga področja, od mobilnih naprav do...

Preberi več

1 komentar

Microsoft razvija veliki jezkovni model MAI-1

Matej Huš :: 7. maj 2024 ob 07:06
Znanost in tehnologija

Slo-Tech - Vendarle smo slišali pričakovane vesti iz Redmonda, da Microsoft vendarle razvija lasten veliki jezikovni model. Za zdaj poimenovan MAI-1 bo imel pol bilijona parametrov, s čimer bo konkuriral Googlovemu Geminiju in OpenAI-jevemu ChatGPT-ju četrte generacije. Predstaviti ga utegnejo že ta mesec na konferenci Build. Projekt vodi Mustafa Suleyman iz podjetja Inflection AI, ki ga je Microsoft prevzel marca letos.

Microsoftov poslovni odnos do umetne inteligence je zanimiv. Na pomembnost področja je Bill Gates opozoril že pred leti, podjetje pa je nato investiralo več kot deset milijard dolarjev v OpenAI. Odločitev se jim je izplačala, saj je njihov model GPT-4 med najbolj priljubljenimi na svetu, Microsoft pa ga je smel integrirati v svoj Copilot, Bing in druge izdelke. A vendarle bi bilo nenavadno, če bi Microsoft uporabljal zgolj tuje orodje, sam pa ne bi poizkušal ničesar razviti, razen če je dolgoročni načrt prevzeti OpenAI, kar pa zaradi kompleksne lastniške strukture ni prav...

Preberi več

7 komentarjev

Meta izdala Llamo 3

Matej Huš :: 18. apr 2024 ob 22:50
Znanost in tehnologija

Slo-Tech - Meta je predstavila novo generacijo generativnih modelov umetne inteligence Llama. V tretji inkarnaciji sta ta hip na voljo Llama 3 8B in Llama 3 70B, ki imata prav toliko parametrov: osem in sedemdeset milijard. V primerjavi z drugo generacijo, ki ima sicer prav toliko parametrov, predstavljata korenit skok v zmogljivosti, so dejali v Meti. Učila sta se na dveh gručah s 24.000 grafičnimi procesorji.

Zagotovo vsak avtor hvali svoj model kot najboljši, zato nas zanimajo oprijemljivi številčni podatki. Meta trdi, da sta modela na testih MMLU, ARC, DROP, GPQA, HumanEval, GSM-8K, MATH, AGIEval in BIG-Bench Hard boljša od konkurence, denimo Mistrala 7B in Gemme 7B. To sicer drži, a na nekaterih testih je Llama 3 8B le za odtenek boljša, omenjena konkurenta pa tudi nista več najnovejša. Llama 3 70B premaga tudi Gemini 1.5 Pro, ne pa na primer Claude 3 Opus. Odveč je dodati, da je na lastnem testu, ki si ga je izmislila Meta, Llama 3 prekosila konkurenco.

Llama 3 je naučen na 15...

Preberi več

8 komentarjev

Google lansiral odprt jezikovni model Gemma

Jurij Kristan :: 25. feb 2024 ob 15:34
Ostala programska oprema

vir: Google

Google - Pretekli teden so pri Googlu pokazali Gemmo, svoj prvi veliki jezikovni model z javnimi utežnimi parametri, ki je očitno namenjen predvsem spopadu z Metino družino odprtih modelov LLaMA.

Na področju velikih jezikovnih modelov poteka vrsta ideoloških bitk; poleg tiste med "doomerji", ki menijo, da lahko LLMji pripeljejo do nevarne splošne umetne inteligence, in njihovimi nasprotniki, pa spopada med podjetji in strokovnjaki za etiko, še najmanj tisti med pristaši zaprtih in odprtih modelov. Med prve spadajo trenutno najbolj razvpiti velikani, kot sta OpenAI in Google, ki v svoje programje ne dovolijo kdovekoliko vpogleda. Med drugimi so razvijalci LLMjev, ki o svojih stvaritvah objavijo več podatkov, v prvi vrsti strukturo nevronske mreže in pa "uteži" (weights), najpomembnejšo podmnožico parametrov nekega modela, ki določa, kaj se je mreža naučila iz podatkov. Malce ironično je tu glavni igralec Meta, po zaslugi svojega laboratorija FAIR, kjer razvoj vodi Yann LeCun, in modelov...

Preberi več

12 komentarjev

Google lansiral model Gemini, svojega tekmeca GPTjem

Jurij Kristan :: 6. dec 2023 ob 23:09
Ostala programska oprema

vir: Google

Google - Pri Googlu so naznanili nastop multimodalnega velikega generativnega modela Gemini, neposrednega tekmeca GPT-4 in tehnologije, na kateri nameravajo graditi prihodnost svojih storitev.

Vse od lanskoletnega lansiranja ChatGPTja je bilo videti, da je navezi OpenAIja in Microsofta uspelo svojega poglavitnega tekmeca Googla grdo presenetiti. Čeprav so ravno Googlovi laboratoriji zaslužni za pretežni del teoretičnih prebojev v razvoju strojnega učenja, se je velikan zaradi ChatGPTja nenadoma znašel v zaostanku in znotraj vodstva naj bi zavladala panika, ki je botrovala prenekaterim spremembam, od vrnitve Larryja Paga in Sergeya Brina v aktivnejšo svetovalno vlogo pa do združitve oddelkov Brain in DeepMind. Sedaj so v podjetju najavili prvi praktični rezultat reform, multimodalni generativni UI model Gemini. V osnovi gre za naslednika velikega jezikovnega modela PaLM 2, toda Gemini je bil že od začetka načrtovan mnogo bolj širokopotezno. To se najbolj odraža v njegovi multimodalnosti,...

Preberi več

8 komentarjev

Stability AI izdal svoj veliki jezikovni model

Matej Huš :: 25. apr 2023 ob 07:50
Znanost in tehnologija

Slo-Tech - Kakor je Stability mešal štrene OpenAI-ju s svojim modelom za ustvarjanje slik Stable Diffusion, mu bodo tudi pri jezikovnih modelih. Pripravili so odprtkodni jezikovni model StableLM, ki je pod licenco CC BY-SA-4.0 na voljo vsakomur. Koda je dostopna na GitHubu, preizkusimo pa jo lahko na Hugging Face ali Replicate. Verzija za pogovor je takisto že dostopna.

StableLM je naučen na treh in sedmih milijardah parametrov, kar je precej manj od ChatGPT-jevih 175 milijard. Sicer prihajata tudi verziji s 15 in 65 milijardami parametrov, a velikost modela ni vse. StableLM v svoji srži smiselno nadaljuje besedilo, ki ga začne človek z ukazom (prompt), rezultat pa so smiselni odgovori. StableLM se lahko pogovarja kot človek, lahko pa tudi piše kodo. Ta je po prvih preizkusih še malce bolj robata kakor pri ChatGPT, a večja modela bosta bržkone boljša. Še vedno pa je boljši od Facebookovega LLaMA, dasiravno GPT-3.5 ali GPT-4.0 še ne dosega. StableLM se je učil na odprtem korpusu podatkov, ki...

Preberi več

4 komentarji

Google vstopa na polje umetne inteligence

Matej Huš :: 14. mar 2023 ob 23:19
Ostalo

Slo-Tech - Google se pridružuje jezikovnim modelom, ki so kljub že precej dolgi zgodovini šele v zadnjih mesecih obnoreli svet. Da ne bi OpenAI s svojimi modeli GPT pobegnil predaleč, je Google odprl API za dostop do svojega modela PaLM. Ta je podoben kot GPT ali Metin LLaMA, prvikrat pa so ga napovedali že pred letom dni. PaLM je večnamenski model, ki ga lahko natreniramo za pisanje kode, iskanje informacij, povzemanje besedil ali zgolj pogovarjanje.

Hkrati je Google izdal še aplikacijo MakerSuite, ki omogoča lažje rokovanje s PaLM-om. Z njim lahko enostavno vnašamo pozive (prompt), dodajamo sintetične podatke v podatkovne zbirke in prilagajamo obstoječe modele. To lahko storimo kar v brskalniku, računsko zahtevnejši del pa se izvede v Google Cloudu. Poleg tega je Google predstavil še precej orodij za poslovni svet, kjer moramo omeniti platformo Vertex AI za generativno umetno inteligenco - z njo podjetja urijo lastne modele strojnega učenja, ima pa dostop do nekaterih modelov Google...

Preberi več

10 komentarjev

Meta pokazala svoj jezikovni model

Matej Huš :: 25. feb 2023 ob 15:10
Znanost in tehnologija

Slo-Tech - ChatGPT je zaslovel, ker je bil dovolj dober in in dostopen sleherniku, a še zdaleč ni edini. Svoj jezikovni model (LLM) je razvila tudi Meta, ki se je pohvalila, da je primerljivo kakovosten, dasiravno desetkrat manjši. Poimenovali so ga LLaMA in prihaja v več inačicah, ki imajo od sedem do 65 milijard parametrov. GPT-3, na katerem temelji ChatGPT, jih ima 175 milijard. LLaMA-13B s trinajst milijardami parametri naj bi bil že boljši od ChatGPT, trdi Meta.

Meta trdi, da je njihov model povsem združljiv z avtorskimi pravicami, saj so pri treningu uporabljali le prosto dostopna besedila. V praksi so to na primer Wikipedia, korpus Common Crawl in C4. Zato je lahko celoten model tudi javno dostopen, če se bo Meta za to odločila. Za zdaj se še ni v celoti, tako da ga enostavno ne moremo preizkusiti, lahko pa to storijo raziskovalci. Oskubljena lama je na voljo na Githubu, raziskovalci pa lahko zaprosijo za dostop do polnega modela.

Znižanje zahtevnosti modela in njegova odprtost...

Preberi več

10 komentarjev

Tudi OpenAIjev pogovorni bot trpi za podobnimi hibami kot tekmeci

Jurij Kristan :: 5. dec 2022 ob 22:17
Ostala programska oprema

vir: openai.com

openai.com - Prejšnji teden je svoj pogovorni algoritem predstavil tudi OpenAI. ChatGPT je osnovan na jezikovnem modelu GPT-3, uporabniki pa so ga kljub vgrajenim varovalkam že sprovocirali v izgovarjanje vsakovrstnih neumnosti.

Fiasko računalniške sogovornice Tay je očitno pozabljen, kajti letos so velikani s področja strojnega učenja preporodili javno preizkušanje chatbotov, torej pogovornih algoritmov. Po Meti in Googlu so se sedaj opogumili tudi pri OpenAIju in predstavili ChatGPT, pogovornega bota, ki je seveda osnovan na njihovem proslavljenem velikem jezikovnem modelu GPT-3. Bot je na voljo prosto in trenutno tudi še brez oglasov, zato ga je v le nekaj dneh že preizkusilo milijon ljudi, ni pa še jasno, kako dolgo bo tako dostopen, ker vodja družbe Sam Altman pravi, da so cene procesiranja visoke. ChatGPT je deklarirano še za odtenek zmogljivejši od konkurentov; in sicer zato, ker so klasičnemu receptu botov na osnovi velikih jezikovnih modelov - se pravi popolnjevanju teksta z...

Preberi več

7 komentarjev

Zadnje novice

Zadnji članki

Išči:

Novice » Povezane novice

Yann LeCun priznal, da so pri testih Llame 4 goljufali

Google predstavil novo Nano Banano Pro

Osmina znanstvenih člankov ima prstne odtise umetne inteligence

Meta uvedla in začasno umaknila umetno inteligenco v WhatsAppu

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1

Llama 3.1 405B je največji odprti jezikovni model doslej

Microsoft razvija veliki jezkovni model MAI-1

Meta izdala Llamo 3

Google lansiral odprt jezikovni model Gemma

Google lansiral model Gemini, svojega tekmeca GPTjem

Stability AI izdal svoj veliki jezikovni model

Google vstopa na polje umetne inteligence

Meta pokazala svoj jezikovni model

Tudi OpenAIjev pogovorni bot trpi za podobnimi hibami kot tekmeci