Gemma 4 12B je ravno pravšnja za domače računalnike @ Slo-Tech

Novice » Znanost in tehnologija »
Gemma 4 12B je ravno pravšnja za domače računalnike

Gemma 4 12B je ravno pravšnja za domače računalnike

Matej Huš :: 5. jun 2026 ob 15:55
Znanost in tehnologija

Slo-Tech - Google je družini jezikovnih modelov Gemma 4 izdal novega člana, ki je ravno dovolj velik in zmogljiv, da še teče na osebnih računalnikih. Gemma 4 12B ima 11,95 milijarde parametrov, ki so dostopni pod permisivno licenco Apache 2.0, torej si lahko model prenesemo in poganjamo lokalno. Zadostuje že povprečen procesor in 16 GB pomnilnika. To je posebej uporabno v primerih, ko podatki nikakor ne smejo zapustiti računalnika, bi jih pa vseeno želeli obdelati z velikim jezikovnim modelom na lokalnem računalniku. Za lokalne gruče grafičnih kartic so seveda na voljo še večji modeli Gemma 4. Model lahko snamemo neposredno s Hugging Facea ali Kaggla.

Gemma 4 12B je večmodalni model, ki neposredno razume besedilo, slike in videoposnetke brez dodatnega procesiranja ali pretvarjanja. Google temu pravi poenotena struktura (Unified Structure). Običajni jezikovni modeli imajo različne enkoderje za pretvarjanje zvoka in videa v ustrezno obliko, ki jo model razume. Gemma 4 12B jih ne potrebuje, zato teče hitreje in na skromnejši strojni opremi. Google pravi, da je po sposobnostih zelo podobna večjim modelom 26B. Vhodi lahko obsegajo 256 tisoč žetonov, kar omogoča obdelavo res velikih količin podatkov hkrati. Zvočni posnetki so omejeni na 30 sekund, video pa na 60 sekund.

Glavna prednost je odprtokodnost in pripravljenost na delovanje v tem ekosistemu, saj podpira orodja, kot so vLLM, SGLang, MLX in llama.cpp.

40 komentarjev

filip007 :: 5. jun 2026, 16:05:34

Ne razumem nič, za kaj se sploh gre?

Zero games, zero talk.
https://pristytools.neocities.org

tony1 :: 5. jun 2026, 16:07:57

Z glasom Marge Simpson: "Wow. The future is here!"

Za to se gre

wajdouc :: 5. jun 2026, 16:08:39

Že vlečem!

https://rtv-ekspoze.org/
"Merjenje in sekiranje je najboljši način, da ti neka stvar škodi.
Celo zelo zanesljivo deluje ta sistem." feryz, 2025

karafeka :: 5. jun 2026, 16:16:57

Men še Phi-3.5 Mini (3.8B) samo vsakih par minut nekaj izpljune. A 12b bi pa bilo ravno pravšnje? Hahaha

Aja, kaj je povprečen procesor? Na arhitekturi ivy bridge verjetno ne, ali?

Zgodovina sprememb…

spremenil: karafeka (5. jun 2026 ob 16:20:06)

WhiteAngel :: 5. jun 2026, 17:18:15

karafeka je 5. jun 2026 ob 16:16:57 izjavil:

Men še Phi-3.5 Mini (3.8B) samo vsakih par minut nekaj izpljune. A 12b bi pa bilo ravno pravšnje? Hahaha

Aja, kaj je povprečen procesor? Na arhitekturi ivy bridge verjetno ne, ali?

Si bo treba eno B200tko umislit ane. 8-)

Sej to je domač hardver. Vtakneš ga v običajen PCIExpress slot.

karafeka :: 5. jun 2026, 17:22:57

50.000$ ??? Saj nisem brodnjak.

LeQuack :: 5. jun 2026, 17:40:58

filip007 je 5. jun 2026 ob 16:05:34 izjavil:

Ne razumem nič, za kaj se sploh gre?

Tako kot vsak članek zadnjih par let. AI, saj drugega sploh ne slišiš več.

Quack !

karafeka :: 6. jun 2026, 00:03:38

Kaj pa te nvidia jetson-e ima kdo za lokalne LLM modele?

Cr00k :: 6. jun 2026, 01:00:28

Jetsoni so bolj za edge... ne mores ravno kaj veliko laufat gor. Sploh ti nano... z 4GB rama.

Gemma4 12B sicer cist lepo v entry level graficni laufa. Jaz zdele za foro laufam na 4060ti z 8gb rama.

Markoff :: 6. jun 2026, 16:34:50

LLMji so sedaj kar zastonj? Brez omejitev uporabe? Pa je to uporabno? Za kaj več kot igračkanje, učenje dela z AI?

Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

c3p0 :: 6. jun 2026, 17:39:40

Geema 4 24B mi laufa na 5060 16GB bp, cca. 10token/s.

Vidim da so tudi že abliterated/uncensored verzije na HF, potestiram.

Seveda so te zadeve lahko precej uporabne. Nekateri jih kombinirajo s paid modeli, dajo slednjim le težje taske, večino pa naredi lokalni.

driftwood :: 6. jun 2026, 18:02:42

avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

LeQuack :: 6. jun 2026, 18:08:11

driftwood je 6. jun 2026 ob 18:02:42 izjavil:

avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

Epstein files.

Quack !

driftwood :: 6. jun 2026, 18:35:23

in kako pridobi potrebne podatke za obdelavo? jih povleče iz interneta?

tony1 :: 6. jun 2026, 18:47:17

driftwood je 6. jun 2026 ob 18:02:42 izjavil:

avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

Na primer podatke strank, ki jih nočeš / pogodbeno ne smeš obdelovati na tretjih sistemih. Večina tukaj butasto miži vsaj pred Mikrosoftom, in se dela, da je z njim vse v redu, ker ga bogato plačuje, ampak če te varovanje zasebnosti zares zanima, moraš to početi lokalno.

BmoQuh :: 6. jun 2026, 18:48:33

driftwood je 6. jun 2026 ob 18:35:23 izjavil:

in kako pridobi potrebne podatke za obdelavo? jih povleče iz interneta?

Včitaš iz datoteke, recimo.

DamijanD :: 6. jun 2026, 20:20:55

A obstaja kakšna preglednica kako hitro ta model dela z različnimi gpuji?

Sheteentz :: 6. jun 2026, 20:27:26

šenka kdo 3090 za pecto evrov?

Furbo :: 6. jun 2026, 21:11:46

driftwood je 6. jun 2026 ob 18:02:42 izjavil:

avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

Karkoli zasebnega.

Ker če greš brati čreva pogojev uporabe marsikje, si kar prilastijo, karkoli uploadaš in še prodajajo drugim tvoje podatke.

i5-13600K, Noctua NH-D15, TUF Z790-F, 64GB DDR5, 2TB Samsung 990PRO,
Toughpower GF3 1000W, RTX 5080 AORUS, ALIENWARE AW3423DWF, Dell S2722QC

Matko :: 6. jun 2026, 21:20:46

tony1 je 6. jun 2026 ob 18:47:17 izjavil:

driftwood je 6. jun 2026 ob 18:02:42 izjavil:
avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

Na primer podatke strank, ki jih nočeš / pogodbeno ne smeš obdelovati na tretjih sistemih. Večina tukaj butasto miži vsaj pred Mikrosoftom, in se dela, da je z njim vse v redu, ker ga bogato plačuje, ampak če te varovanje zasebnosti zares zanima, moraš to početi lokalno.

Načeloma so to vsi za katere nimaš izrecnega soglasja

Cr00k :: 6. jun 2026, 23:06:53

Markoff je 6. jun 2026 ob 16:34:50 izjavil:

LLMji so sedaj kar zastonj? Brez omejitev uporabe? Pa je to uporabno? Za kaj več kot igračkanje, učenje dela z AI?

Itak da je uporabno... med ~70B in ~400B modeli je veliko manjša razlika, kot bi si človek mislil.
Npr. OpenClaw samo z ollamo in lokalnimi modeli laufaš, če ti je kaj mar za zasebnost.

Probi... ollama in webui, ki je zelo podoben openai vmesniku. Kar je pomembno je, da imas dovolj rama v graficni v katero nalozis cel model, da dela spodobno.
Gre sicer tudi na cpu, samo bistveno pocasneje... meni 400B modele na 2x64core EPYC serverju in 512gb rama laufa s cca 0.5-3tokne/s. Ni bas nekaj, dela pa :)

Cr00k :: 6. jun 2026, 23:12:10

btw/fyi: vceraj sem narocil Google AI Pro (5 TB) (Google One) za tri mesece. Ima google neko akcijo za cca 5,49eur/mesec za 3mesece skupaj.

Samodejno vam bomo zaračunavali 5,49 €/mesec toliko mesecev: 3, nato 21,99 €/mesec

Mogoce se komu prav pride.

JanBrezov :: 6. jun 2026, 23:51:12

driftwood je 6. jun 2026 ob 18:02:42 izjavil:

avtor članka navaja, da je to uporabno za "podatke, ki nikakor ne smejo zapustiti računalnika".
lahko navedete kakšen primer?

Kakšen mesec dni nazaj je bila na slo-tech novica Claude rešil pet bitcoinov, kjer je nek uporabnik iskal geslo za bitcoin denarnico, ki se ga ni spomnil. V AI je naložil vso vsebino računalnika in ta mu je uspešno našel to geslo. Verjetno ni zaželeno, da je vsa vsebina računalnika na voljo komerkoli.

bm1973 :: 7. jun 2026, 08:56:30

Cr00k je 6. jun 2026 ob 23:12:10 izjavil:

btw/fyi: vceraj sem narocil Google AI Pro (5 TB) (Google One) za tri mesece. Ima google neko akcijo za cca 5,49eur/mesec za 3mesece skupaj.

Samodejno vam bomo zaračunavali 5,49 €/mesec toliko mesecev: 3, nato 21,99 €/mesec

Mogoce se komu prav pride.

Pazi kaj delaš, kolega je dobil kljub plačanemu accountu, račun za 13.000 USD, ker mu je neka skripta delala AI v backgroundu...

Preberi droben tisk...

Hlapci! Za hlapce rojeni, za hlapce vzgojeni, ustvarjeni za hlapčevanje.
Gospodar se menja, bič pa ostane, in bo ostal za vekomaj; zato, ker je hrbet
skrivljen, biča vajen in željan! [Ivan Cankar]

BmoQuh :: 7. jun 2026, 09:10:48

bm1973 je 7. jun 2026 ob 08:56:30 izjavil:

Cr00k je 6. jun 2026 ob 23:12:10 izjavil:
btw/fyi: vceraj sem narocil Google AI Pro (5 TB) (Google One) za tri mesece. Ima google neko akcijo za cca 5,49eur/mesec za 3mesece skupaj.

Samodejno vam bomo zaračunavali 5,49 EUR/mesec toliko mesecev: 3, nato 21,99 EUR/mesec

Mogoce se komu prav pride.

Pazi kaj delaš, kolega je dobil kljub plačanemu accountu, račun za 13.000 USD, ker mu je neka skripta delala AI v backgroundu...

Preberi droben tisk...

V bistvu drži - verjetno si je postavil billing account v google console in je pustil, da se avtomatsko podaljšuje po poteku 3 nahakljalnih mesecih oz otvoritvenem dobropisu $300. To opozorilo je jasno zapisano - domnevam, da je bilo to to.

Drugače je naročnina striktno omejena (je dovolj za normalno uporabo) - da bi samo kliknil in bi šlo toliko v minus. Ko porabiš naročene kapacitete, lahko sicer dovoliš prekoračenje, ampak spet samo, dokler je dobropis na voljo.

Zgodovina sprememb…

spremenilo: BmoQuh (7. jun 2026 ob 09:11:30)

Cr00k :: 7. jun 2026, 13:23:21

Ja, navadno narocnino, nimas kaj skrbet... se celo omejujejo, ce v dolocenem casu prevec porabis.

Za kaksen openclaw in podobne agente, pa je bolje da lokalne modele laufas, tudi zaradi takih presenecenj :)

a_borlak :: 7. jun 2026, 13:23:40

BTW, tudi slovenski Gams je zastonj in baje vsaj tako dober ali celo boljši, kot nekateri drugi.

Cr00k :: 7. jun 2026, 13:25:52

a_borlak je 7. jun 2026 ob 13:23:40 izjavil:

BTW, tudi slovenski Gams je zastonj in baje vsaj tako dober ali celo boljši, kot nekateri drugi.

Gams je super... sicer tudi finetunana Gemma2 in 3.

karafeka :: 7. jun 2026, 13:33:42

a_borlak je 7. jun 2026 ob 13:23:40 izjavil:

BTW, tudi slovenski Gams je zastonj in baje vsaj tako dober ali celo boljši, kot nekateri drugi.

A to je na povejmo.si?
Sem ga vprašal kdo je predsednik vlade, po slovensko. A bi uganili koga je imenoval? Li Qiang. Izmed vseh možnosti, imenuje kitajskega.
Poleg tega misli, da je danes 4.4.2025.
Hvalevredno, da so se lotili tega projekta, ampak dvomim da je zaekrat na istem nivoju kot ostali. Pa dvomim, da dobivajo na desetine milijard od koga za razvoj.

Cr00k :: 7. jun 2026, 14:10:38

karafeka je 7. jun 2026 ob 13:33:42 izjavil:

a_borlak je 7. jun 2026 ob 13:23:40 izjavil:
BTW, tudi slovenski Gams je zastonj in baje vsaj tako dober ali celo boljši, kot nekateri drugi.

A to je na povejmo.si?
Sem ga vprašal kdo je predsednik vlade, po slovensko. A bi uganili koga je imenoval? Li Qiang. Izmed vseh možnosti, imenuje kitajskega.
Poleg tega misli, da je danes 4.4.2025.
Hvalevredno, da so se lotili tega projekta, ampak dvomim da je zaekrat na istem nivoju kot ostali. Pa dvomim, da dobivajo na desetine milijard od koga za razvoj.

Mal mesas zadeve.. ni AI, AI :) GaMS ni samostojen model, ampak s slovenskimi besedili dotrenirana Gemma.
Vsak model ima nek cut-off datum podatkov na katerih ga trenirajo, in zato ne pozna danasnjih novic. Imas search/internet funkcijo, ki aktualne informacije/kontekst modela posodobi.

Sploh pa ni primerjave med nevem ChatGPTjem in npr. 12B velikim LLM modelom, ki ga doma laufas.
Imata pa oba svoje prednosti in slabosti, oz. imata drugo poslanstvo.

Ce koga kaj vec o GaMSu zanima: link na huggingface, kjer je zelo podrobno opisano vse

Zgodovina sprememb…

spremenilo: Cr00k (7. jun 2026 ob 14:14:37)

karafeka :: 7. jun 2026, 14:19:23

Potem sem pa pričakoval, da ima internetno funkcijo za aktualne podatke. Pa nisem ga lokalno inštaliral ampak preizkusil na https://povejmo.si/klepet/. Ker vsi ostali, ki sem jih preizkusil, so mi pravilno povedali, kdo je trenutni predsednik vlade v Sloveniji in današnji datum. Sem pa videl na huggingface, da jih je celo nvidia financirala. Ta ima prste vsepovsod.

BmoQuh :: 7. jun 2026, 14:53:49

Izgleda, je že kar nekaj časa, kar AI večinoma niso podpirali branja aktualnih podatkov s spleta na zahtevo - in se zanašali samo na svoje statične uteži, saj zdaj jim tudi moraš dopovedati, da naj preveri - in v novi temi se ne spomni podrobnosti prebranega, ostane v tisti temi, če mu ne poveš. Še v isti temi žal prehitro 'iztrebi' iz konteksta.

3p :: včeraj, 10:19:20

c3p0 je 6. jun 2026 ob 17:39:40 izjavil:

Geema 4 24B mi laufa na 5060 16GB bp, cca. 10token/s.

Glede na hitrost, ti ne teče na GPUju.

c3p0 :: včeraj, 12:33:49

3p je včeraj ob 10:19:20 izjavil:

c3p0 je 6. jun 2026 ob 17:39:40 izjavil:
Geema 4 24B mi laufa na 5060 16GB bp, cca. 10token/s.

Glede na hitrost, ti ne teče na GPUju.

Svež chat in brez drugega loada, slabih 20t/s. Misliš, da je še vedno premalo?

Kako pa tak model, kot je Gemma 4 24B lahko zalaufaš brez GPUja, direktno na CPUju?

Cr00k :: včeraj, 12:37:09

c3p0 je včeraj ob 12:33:49 izjavil:

3p je včeraj ob 10:19:20 izjavil:
c3p0 je 6. jun 2026 ob 17:39:40 izjavil:
Geema 4 24B mi laufa na 5060 16GB bp, cca. 10token/s.

Glede na hitrost, ti ne teče na GPUju.

Svež chat in brez drugega loada, slabih 20t/s. Misliš, da je še vedno premalo?

Kako pa tak model, kot je Gemma 4 24B lahko zalaufaš brez GPUja, direktno na CPUju?

20tokenov ni slabo. Ukaz ollama ps ti pokaze koliko modela je nalozenega v graficno in koliko ga poganja cpu. Glede na to, da je Gemma4 26B v Q4 velika 18gb, ti sigurno del modela ne laufa na graficni.
Tudi samo s CPUjem lahko poganjas, ram je pomemben... je pa pocasnooo.

Zgodovina sprememb…

spremenilo: Cr00k (včeraj ob 12:40:11)

c3p0 :: včeraj, 14:44:49

Saj, zato vprašam, zanima me, ker še nisem videl CPUja, ki bi poganjal tak model z 10tps ;)

Z Gemma4 12B Heretic pa izmerim ~40tps, to pa že kar leti.

Zimonem :: včeraj, 14:46:31

Kar mi ni treba preverjat outputa po rulzih.

3p :: včeraj, 15:33:20

c3p0 je včeraj ob 14:44:49 izjavil:

Saj, zato vprašam, zanima me, ker še nisem videl CPUja, ki bi poganjal tak model z 10tps ;)

Z Gemma4 12B Heretic pa izmerim ~40tps, to pa že kar leti.

Gemma 4 12B je "dense" model, kjer je za vsak token aktivnih 12B parametrov, Gemma 4 26B pa je MOE, kjer je za vsak token aktivnih okoli le del parametrov.

Na PCju pri inferenci RAM tako počasen, da je večina CPUjev dovolj zmogljivih za to, kar zmore RAM. (Če uporabljaš le CPU.)

Če imaš GPU s 16GB pomnilnika, pa bo 12B model šel v celoti v VRAM, ki je vsaj nekajkrat hitrejši... GPU sam pa bo vmes praktično spal.

bm1973 :: včeraj, 15:54:03

3p je včeraj ob 15:33:20 izjavil:

Če imaš GPU s 16GB pomnilnika, pa bo 12B model šel v celoti v VRAM, ki je vsaj nekajkrat hitrejši... GPU sam pa bo vmes praktično spal.

Gre tudi v 12 GB RAM...

Zimonem :: včeraj, 16:09:19

Moe ne vpliva na to koliko rama potrebuješ (cel model moraš imeti v ramu), ampak na hitrost izvajanja. Ker je mreža manjša.

Zgodovina sprememb…

spremenilo: Zimonem (včeraj ob 16:10:38)

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Gemma 4 12B je ravno pravšnja za domače računalnike McHusch Oddelek: Novice / Znanost in tehnologija	40	5290 (2530)	Zimonem včeraj 16:09:19
»	GPT-5 je tu! McHusch Oddelek: Novice / Znanost in tehnologija	14	6217 (3023)	antonija 13. avg 2025 16:04:10
»	Googlovo nadgrajeno iskanje ima sila neroden štart Aggressor Oddelek: Novice / Ostala programska oprema	30	6375 (4049)	SambaShare 31. maj 2024 12:32:05
»	Google lansiral odprt jezikovni model Gemma Aggressor Oddelek: Novice / Ostala programska oprema	12	8550 (4577)	ReRMh 27. feb 2024 08:08:08

Več podobnih tem

Novice » Znanost in tehnologija » Gemma 4 12B je ravno pravšnja za domače računalnike

Gemma 4 12B je ravno pravšnja za domače računalnike

filip007 :: 5. jun 2026, 16:05:34

tony1 :: 5. jun 2026, 16:07:57

wajdouc :: 5. jun 2026, 16:08:39

karafeka :: 5. jun 2026, 16:16:57

WhiteAngel :: 5. jun 2026, 17:18:15

karafeka :: 5. jun 2026, 17:22:57

LeQuack :: 5. jun 2026, 17:40:58

karafeka :: 6. jun 2026, 00:03:38

Cr00k :: 6. jun 2026, 01:00:28

Markoff :: 6. jun 2026, 16:34:50

c3p0 :: 6. jun 2026, 17:39:40

driftwood :: 6. jun 2026, 18:02:42

LeQuack :: 6. jun 2026, 18:08:11

driftwood :: 6. jun 2026, 18:35:23

tony1 :: 6. jun 2026, 18:47:17

BmoQuh :: 6. jun 2026, 18:48:33

DamijanD :: 6. jun 2026, 20:20:55

Sheteentz :: 6. jun 2026, 20:27:26

Furbo :: 6. jun 2026, 21:11:46

Matko :: 6. jun 2026, 21:20:46

Cr00k :: 6. jun 2026, 23:06:53

Cr00k :: 6. jun 2026, 23:12:10

JanBrezov :: 6. jun 2026, 23:51:12

bm1973 :: 7. jun 2026, 08:56:30

BmoQuh :: 7. jun 2026, 09:10:48

Cr00k :: 7. jun 2026, 13:23:21

a_borlak :: 7. jun 2026, 13:23:40

Cr00k :: 7. jun 2026, 13:25:52

karafeka :: 7. jun 2026, 13:33:42

Cr00k :: 7. jun 2026, 14:10:38

karafeka :: 7. jun 2026, 14:19:23

BmoQuh :: 7. jun 2026, 14:53:49

3p :: včeraj, 10:19:20

c3p0 :: včeraj, 12:33:49

Cr00k :: včeraj, 12:37:09

c3p0 :: včeraj, 14:44:49

Zimonem :: včeraj, 14:46:31

3p :: včeraj, 15:33:20

bm1973 :: včeraj, 15:54:03

Zimonem :: včeraj, 16:09:19

Vredno ogleda ...

Novice » Znanost in tehnologija »
Gemma 4 12B je ravno pravšnja za domače računalnike