Llama 3.1 405B je največji odprti jezikovni model doslej

Jurij Kristan :: 24. jul 2024 ob 22:22
Ostala programska oprema

Meta - Pri Meti so po mesecih napovedi izdali prvi odprtoutežni jezikovni model s prek 400 milijardami parametrov, Llamo 3.1 405B.

Bržkone največji ideološki boj pri razvoju velikih jezikovnih modelov je ta hip tisti med povsem zaprtimi modeli, kamor spada večina od razvpitih igralcev na trgu - GPT, Gemini, Claude - in pa na drugi strani ... na nek način odprtimi, kjer je vodilna Meta z družino modelov Llama. Tako Mark Zuckerberg kot vodja njegovega laboratorija za generativne modele Yann LeCun sta namreč velika zagovornika bolj odprtega razvoja takšnih algoritmov. Zato ni nenavadno, da je ob lansiranju najnovejše družine, Llama 3.1, Zuckerberg doktrino nadrobno pojasnil v spletni objavi.

Po njegovem tudi tu velja dinamika, ki smo jo lahko spremljali v vojni operacijskih sistemov med Windowsi in Linuxom - čeprav so Okna na površju komercialno uspešnejši izdelek, pa je Linux spričo svoje zanesljivosti, prilagodljivosti in svobodnosti našel pot na mnoga področja, od mobilnih naprav do oblaka, kjer danes predstavlja hrbtenico informacijskih tehnologij. Zuckerberg meni, da bodo llame po tem kopitu kmalu lahko presegle GPT, Geminija in druge tekmece. Pri tem za Metin pristop uporablja izraz "odprtokodnost" (open-source), ki pa je glede na sprejete konvencije zavajajoč. Llame namreč nimajo odprte kode, temveč zgolj odprte uteži, ki odražajo izučenost nekega modela; za nameček je tudi licenca, pod katero jih lahko uporabljamo, manj svobodna od odprtokodnih.

Da je Zuckerberg svoj manifest objavil ravno sedaj, ima zasluge najmočnejši član družine Llama 3.1, model 405B, kjer številka pomeni 405 milijard parametrov, torej v grobem velikost njegove nevronske mreže. Gre za največji odprti model te sorte doslej, ki je hkrati razlog, da smo novo različico družine prejeli le nekaj mesecev po lansiranju trojke, ko so 405B še trenirali. V grobem naj bi bila Llama 3.1 405B primerljiva z najzmogljivejšimi modeli tekmecev, torej GPT 4o, Geminijem 1.5 Pro ali Claude 3.5 Sonnetom. Poleg sta prispeli tudi manjši različici, 70B in 8B, namenjeni cenejšim chatbotom ali lokalnemu poganjanju.

1 komentar

alternative :: 25. jul 2024, 20:58

Malo teorije, kako AI sploh deluje:

Kako ga lahko poganjamo doma offline:

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 ) Aggressor Oddelek: Novice / Ostala programska oprema	169	34645 (23960)	kanarin 6. feb 2025 18:47:39
»	Meta izdala Llamo 3 McHusch Oddelek: Novice / Znanost in tehnologija	8	5369 (1814)	antonija 23. apr 2024 14:53:12
»	Anthropic lansiral tretjo generacijo modela Claude Aggressor Oddelek: Novice / Ostala programska oprema	25	5494 (3331)	sbawe64 28. mar 2024 19:34:03
»	Google lansiral odprt jezikovni model Gemma Aggressor Oddelek: Novice / Ostala programska oprema	12	8743 (4770)	ReRMh 27. feb 2024 08:08:08
»	Meta pokazala svoj jezikovni model McHusch Oddelek: Novice / Znanost in tehnologija	10	6610 (5130)	Likadika 27. feb 2023 02:26:57

Tema

Sporočila

Ogledi

Zadnje sporočilo

Tema

Sporočila

Ogledi

Zadnje sporočilo