Slo-Tech - OpenAI je včeraj izdal nova modela o3 in o4-mini, ki združujeta razmišljanje (reasoning) in dostop do spleta ter pisanje programske kode. Spomnimo, da so o3 napovedali že decembra, a sta bila doslej na voljo le o3-mini in o3-mini-high. Novinca o3 in o4-mini bosta torej nadomestila o1 in o3-mini, na voljo pa sta za naročnike ChatGPt Plus, Pro in Team, medtem ko bodo morali uporabniki Enterprise in Edu počakati še kakšen teden. Kdor uporablja brezplačno različico, lahko o4-mini uporabi z izbiro možnosti Think.
Nova o3 in o4-mini sta na voljo takoj, v prihodnjih tednih pa pričakujemo še o3-pro, ki pa bo na voljo le za naročnike na dražji Pro. Kot ob vsakem izidu nove verzije, tudi to pot OpenAI trdi, da gre za najpametnejša modela doslej. Prav tako sta varčnejša od predhodnikov, kar je ob velikem navalu ključno. Njune vloge bodo različne. Medtem ko bo o3 namenjen kompleksnim analizam, bo o4-mini hitrejši in namenjen enostavnejšim problemom.
Modela sta večmodalna, torej razumeta tudi slike, s katerimi znata manipulirati. OpenAI poudarja, da dejansko razmišljata "s slikami", kar naj bi pomenilo, da zmoreta več od preproste analize slike, temveč izvajata operacije na njej. Razumeta diagrame, fotografije, sheme in skice, tudi kadar je kvaliteta slaba in ločljivost nizka. Prvi testi kažejo, da je o3 približno tako zmogljiv kot Gemini 2.5, razlikujeta se v malenkostih. Uporabniki so precej navdušeni nad novim modelom o3, ki se dobro znajde tudi v znanstvenih besedilih in nalogah.
OpenAI je predstavil tudi aplikacijo za terminal Codex CLI, ki je nekakšen pomočnik oziroma agent za terminal, ki pomaga pri programiranju. Orodje je odprtokodno, potrebuje pa dostop prek API.
Novice » Znanost in tehnologija » OpenAI predstavil o3 in o4-mini

SHA-256 ::
Je kdo med novimi modeli odkril kakega, ki zna risat UML diagrame interakcij na podlagi kode v kontekstu?
Meni nekako vedno nastane zmazek, ki je blizu, ampak zelo daleč od željenega.
Meni nekako vedno nastane zmazek, ki je blizu, ampak zelo daleč od željenega.

gb39 ::

fikus_ ::
AI je marketinški "buzzword".
Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.
PS Ne odgovarjam trolom in provokatorjem!
PS Ne odgovarjam trolom in provokatorjem!

cero ::
me zanima kdaj bojo začeli izdelovati neke namenske čipe prav za LLM-e, podobno kot se za minanje bitcoina uporabljajo ASIC-i. sedaj vsi transformerji bazirajo na navadnih grafičnih karticah in so nevroni tam samo slimulirani.

Ales ::
Že obstaja! V mobilne telefone in prenosnike proizvajalci že zdaj vgrajujejo namenske čipe za LLM-je, imenujejo se NPU, Neural Processing Unit.
AMD jih recimo vgrajuje v prenosnike že nekaj generacij...
Ti NPU zaenkrat niso namenjeni poganjanju zahtevnejših LLM modelov, temveč off-loadingu manjših LLM taskov v ozadje. Izkoriščenost v praksi je pa še v povojih.
Še čez nekaj iteracij, tudi v povezavi z mreženjem večih nodov skupaj, bo to vse bolj zanimivo.
AMD jih recimo vgrajuje v prenosnike že nekaj generacij...
Ti NPU zaenkrat niso namenjeni poganjanju zahtevnejših LLM modelov, temveč off-loadingu manjših LLM taskov v ozadje. Izkoriščenost v praksi je pa še v povojih.
Še čez nekaj iteracij, tudi v povezavi z mreženjem večih nodov skupaj, bo to vse bolj zanimivo.

cero ::
In kaj točno bi počel z "namenskimi čipi"? Pri bitcoinu je to zelo dobro definirano.
Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.
Že obstaja! V mobilne telefone in prenosnike proizvajalci že zdaj vgrajujejo namenske čipe za LLM-je, imenujejo se NPU, Neural Processing Unit.
Ti NPU zaenkrat niso namenjeni poganjanju zahtevnejših LLM modelov, temveč off-loadingu manjših LLM taskov v ozadje. Izkoriščenost v praksi je pa še v povojih.
Lahko napišaš kaj več o tem off-loadingu LLM taskov? A ne laufajo LLM-i preko interneta?

pegasus ::
Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.Nisem tako mislil, ampak nima veze. Poglej si MS bitnet, kako se tem stvarem streže. Inferenca se mora zoptimizirat, v primeru bitneta na ternary operacije (-1, 0, 1) in stvari kar naenkrat lahko tečejo na povprečnem laptop cpuju.

pegasus ::
Drugače pa vsi, ki vas zanima ai "pod haubo", tole je današnji link za vas:
https://alexarmbr.github.io/2024/08/10/...
https://alexarmbr.github.io/2024/08/10/...

Poldi112 ::
In kaj točno bi počel z "namenskimi čipi"? Pri bitcoinu je to zelo dobro definirano.
Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.
Kaj takega?
https://tenstorrent.com/hardware/tt-qui...
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Muskov xAI predstavil model Grok 3Oddelek: Novice / Znanost in tehnologija | 4408 (1422) | Gregor P |
» | OpenAI odgovoril z o3-miniOddelek: Novice / Znanost in tehnologija | 5345 (1939) | BT52 |
» | OpenAI 12. dan pokazal še novi model o3Oddelek: Novice / Znanost in tehnologija | 3227 (1291) | Zimonem |