» »

OpenAI predstavil o3 in o4-mini

OpenAI predstavil o3 in o4-mini

Slo-Tech - OpenAI je včeraj izdal nova modela o3 in o4-mini, ki združujeta razmišljanje (reasoning) in dostop do spleta ter pisanje programske kode. Spomnimo, da so o3 napovedali že decembra, a sta bila doslej na voljo le o3-mini in o3-mini-high. Novinca o3 in o4-mini bosta torej nadomestila o1 in o3-mini, na voljo pa sta za naročnike ChatGPt Plus, Pro in Team, medtem ko bodo morali uporabniki Enterprise in Edu počakati še kakšen teden. Kdor uporablja brezplačno različico, lahko o4-mini uporabi z izbiro možnosti Think.

Nova o3 in o4-mini sta na voljo takoj, v prihodnjih tednih pa pričakujemo še o3-pro, ki pa bo na voljo le za naročnike na dražji Pro. Kot ob vsakem izidu nove verzije, tudi to pot OpenAI trdi, da gre za najpametnejša modela doslej. Prav tako sta varčnejša od predhodnikov, kar je ob velikem navalu ključno. Njune vloge bodo različne. Medtem ko bo o3 namenjen kompleksnim analizam, bo o4-mini hitrejši in namenjen enostavnejšim problemom.

Modela sta večmodalna, torej razumeta tudi slike, s katerimi znata manipulirati. OpenAI poudarja, da dejansko razmišljata "s slikami", kar naj bi pomenilo, da zmoreta več od preproste analize slike, temveč izvajata operacije na njej. Razumeta diagrame, fotografije, sheme in skice, tudi kadar je kvaliteta slaba in ločljivost nizka. Prvi testi kažejo, da je o3 približno tako zmogljiv kot Gemini 2.5, razlikujeta se v malenkostih. Uporabniki so precej navdušeni nad novim modelom o3, ki se dobro znajde tudi v znanstvenih besedilih in nalogah.

OpenAI je predstavil tudi aplikacijo za terminal Codex CLI, ki je nekakšen pomočnik oziroma agent za terminal, ki pomaga pri programiranju. Orodje je odprtokodno, potrebuje pa dostop prek API.

13 komentarjev

SHA-256 ::

Je kdo med novimi modeli odkril kakega, ki zna risat UML diagrame interakcij na podlagi kode v kontekstu?
Meni nekako vedno nastane zmazek, ki je blizu, ampak zelo daleč od željenega.

pegasus ::

Je že kdo pomislil?

gb39 ::

pegasus je izjavil:

Je že kdo pomislil?

Še kako leto ali dve pa bo minilo to obdobje, ko je vsaka nova stvar nek AI. Še ne dolgo nazaj smo temu rekli algoritmi. Ne vsemu, a večini.

fikus_ ::

AI je marketinški "buzzword".
Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.
PS Ne odgovarjam trolom in provokatorjem!

OutOfTheBox ::

Poimenovanja teh modelov so grozna.

pegasus ::

MS bitnet je korak v pravo smer ...

cero ::

me zanima kdaj bojo začeli izdelovati neke namenske čipe prav za LLM-e, podobno kot se za minanje bitcoina uporabljajo ASIC-i. sedaj vsi transformerji bazirajo na navadnih grafičnih karticah in so nevroni tam samo slimulirani.

pegasus ::

In kaj točno bi počel z "namenskimi čipi"? Pri bitcoinu je to zelo dobro definirano.

Ales ::

Že obstaja! V mobilne telefone in prenosnike proizvajalci že zdaj vgrajujejo namenske čipe za LLM-je, imenujejo se NPU, Neural Processing Unit.

AMD jih recimo vgrajuje v prenosnike že nekaj generacij...

Ti NPU zaenkrat niso namenjeni poganjanju zahtevnejših LLM modelov, temveč off-loadingu manjših LLM taskov v ozadje. Izkoriščenost v praksi je pa še v povojih.

Še čez nekaj iteracij, tudi v povezavi z mreženjem večih nodov skupaj, bo to vse bolj zanimivo.

cero ::

pegasus je izjavil:

In kaj točno bi počel z "namenskimi čipi"? Pri bitcoinu je to zelo dobro definirano.


Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.

Ales je izjavil:

Že obstaja! V mobilne telefone in prenosnike proizvajalci že zdaj vgrajujejo namenske čipe za LLM-je, imenujejo se NPU, Neural Processing Unit.
Ti NPU zaenkrat niso namenjeni poganjanju zahtevnejših LLM modelov, temveč off-loadingu manjših LLM taskov v ozadje. Izkoriščenost v praksi je pa še v povojih.


Lahko napišaš kaj več o tem off-loadingu LLM taskov? A ne laufajo LLM-i preko interneta?

pegasus ::

cero je izjavil:

Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.
Nisem tako mislil, ampak nima veze. Poglej si MS bitnet, kako se tem stvarem streže. Inferenca se mora zoptimizirat, v primeru bitneta na ternary operacije (-1, 0, 1) in stvari kar naenkrat lahko tečejo na povprečnem laptop cpuju.

pegasus ::

Drugače pa vsi, ki vas zanima ai "pod haubo", tole je današnji link za vas:
https://alexarmbr.github.io/2024/08/10/...

Poldi112 ::

cero je izjavil:

pegasus je izjavil:

In kaj točno bi počel z "namenskimi čipi"? Pri bitcoinu je to zelo dobro definirano.


Um, recimo poganjal bi LLM lokalno in s precej učinkovito uporabo energije in izrabo prostora, kar pomeni, da bi lahko vsi roboti avtomobili, hiše dobili svojo lokalno pamet, konec koncev bi lahko vsak server v podjetjih imel svojo lokalno LLM enoto ki bi delovala kot nekakšna tajnica.


Kaj takega?

https://tenstorrent.com/hardware/tt-qui...
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Muskov xAI predstavil model Grok 3

Oddelek: Novice / Znanost in tehnologija
424408 (1422) Gregor P
»

OpenAI odgovoril z o3-mini

Oddelek: Novice / Znanost in tehnologija
165345 (1939) BT52
»

OpenAI 12. dan pokazal še novi model o3

Oddelek: Novice / Znanost in tehnologija
143227 (1291) Zimonem

Več podobnih tem