Slo-Tech - DeepMind je razvil že več orodij na osnovi umetne inteligence, ki so zmogla najrazličnejša opravila od igranja šaha do medicinske diagnostike. A praviloma niso uporabljala velikih jezikovnih modelov (LLM), ker so ti pri logično-matematičnih nalogah slabi. Njihov najnovejši dosežek pa združuje prav ta svetova, saj so z LLM-jem reševali matematične probleme, za katere pred tem rešitev nismo poznali. O dosežku pišejo v najnovejši številki revije Nature, prav tako so razkrili kodo.
Veliki jezikovni modeli se najbolje obnesejo, če jih sprašujemo reči, ki so zapisane v vhodnih podatkih za trening, pa še tedaj si lahko kaj izmislijo. DeepMind pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba. Gre za orodje, ki je namenjeno iskanju funkcij (od tod ime), kar ni prvi matematični otrok iz DeepMinda. Spomnimo, da je AlphaTensor iskal hitrejše načine množenja matrik, AlphaDev pa je izboljševal algoritme. Sedaj pa so razvili prvo orodje, ki za matematiko uporablja LLM.
Problema so se lotili tako, da so matematični izziv formulirali v Pythonu, vmes pa pustili prazne vrstice, ki vračajo rezultat. Reševali so znameniti matematični problem, ki predstavlja večrazsežno posplošitev vprašanja, koliko točk lahko postavimo na dvodimenzionalno mrežo, da skozi nobeno trojico ne bo možno potegniti premice. To je sicer nišni problem, a popularen, pristop pa je vsej prej kot nišni.
FunSearch je deloval tako, da je generiral več možnih odgovorov, ki so bili vrstice kode za reševanje problema. Najboljše približke so nato vrnili v program in po več milijonih iteracij so dobili splošen odgovor v obliki kode. Končni izplen so seveda številske rešitve, ki so jih lahko preverili, in so bile za nekatere dimenzije dejansko boljši od trenutno znanih rekordov. V praksi bi lahko tako reševali tudi druge matematične probleme, če bi jih zapisali v ustreznem formatu v Pythonu.
Novice » Znanost in tehnologija » DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema
DamijanD ::
Ko sem najprej prebral ime orodja sem pomislil, kako so zabavni - potem pa sledi "dolgočasna" razlaga pomena imena.
WhiteAngel ::
Sem prebral tale inženirski članek z 12 (!) avtorji in obetavnim abstractom. Nočem biti nesramen, ampak uokviriš pythonovo kodo, potem štartaš generiranje klicov funkcij, ki jih je LLM (na osnovi genetskih algoritmov in menjav vrstic) predlagal po monte carlo metodi, po nekaj milijardah kombinacij ti padejo ven rešitve, ki so "za nekatere dimenzije dejansko boljši od trenutno znanih rekordov"? Najprej, gre samo za aplikativno rabo UI in nekaj integracije. Ne gre pa za noben razvoj. Drugič pa, kaj za vraga vse že objavijo v Nature? A če je "Google" affiliaton gor, potem je avtomatično approve, še sploh, če je trendy tema? CS avtorji iz prejšnjega tisočletja se obračajo v grobu.
stara mama ::
pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba
Torej, če se izogne se izogne, včasih pa tudi ne.
Že kar vidim škandale, ko si bo na nekatera velika matematična (ali fizikalna) vprašanje nekatere dele rešitve kar izmislil in jih dolgo časa ne bo nihče odkril.
tigrr ::
Izgleda Moorov zakon spreminja trend razvoja humane inteligence in napredku sledi nazadovanje. Upam, da se motim.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | DeepMind uporabil veliki jezikovni model za rešitev matematičnega problemaOddelek: Novice / Znanost in tehnologija | 4514 (3499) | tigrr |
» | Google lansiral model Gemini, svojega tekmeca GPTjemOddelek: Novice / Ostala programska oprema | 8720 (5707) | 2dark |
» | Še eno v vrsti javnih opozoril na nevarnosti umetne inteligence (strani: 1 2 )Oddelek: Novice / NWO | 12214 (8093) | darkolord |
» | DeepMind izumil nov algoritem za množenje matrik, človek ga je hitro izboljšalOddelek: Novice / Znanost in tehnologija | 13921 (9706) | MaFijec |
» | Googlov DeepMind napoveduje odpoved ledvicOddelek: Novice / Znanost in tehnologija | 5926 (4740) | Markoff |