» »

DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema

DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema

Slo-Tech - DeepMind je razvil že več orodij na osnovi umetne inteligence, ki so zmogla najrazličnejša opravila od igranja šaha do medicinske diagnostike. A praviloma niso uporabljala velikih jezikovnih modelov (LLM), ker so ti pri logično-matematičnih nalogah slabi. Njihov najnovejši dosežek pa združuje prav ta svetova, saj so z LLM-jem reševali matematične probleme, za katere pred tem rešitev nismo poznali. O dosežku pišejo v najnovejši številki revije Nature, prav tako so razkrili kodo.


Veliki jezikovni modeli se najbolje obnesejo, če jih sprašujemo reči, ki so zapisane v vhodnih podatkih za trening, pa še tedaj si lahko kaj izmislijo. DeepMind pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba. Gre za orodje, ki je namenjeno iskanju funkcij (od tod ime), kar ni prvi matematični otrok iz DeepMinda. Spomnimo, da je AlphaTensor iskal hitrejše načine množenja matrik, AlphaDev pa je izboljševal algoritme. Sedaj pa so razvili prvo orodje, ki za matematiko uporablja LLM.

Problema so se lotili tako, da so matematični izziv formulirali v Pythonu, vmes pa pustili prazne vrstice, ki vračajo rezultat. Reševali so znameniti matematični problem, ki predstavlja večrazsežno posplošitev vprašanja, koliko točk lahko postavimo na dvodimenzionalno mrežo, da skozi nobeno trojico ne bo možno potegniti premice. To je sicer nišni problem, a popularen, pristop pa je vsej prej kot nišni.

FunSearch je deloval tako, da je generiral več možnih odgovorov, ki so bili vrstice kode za reševanje problema. Najboljše približke so nato vrnili v program in po več milijonih iteracij so dobili splošen odgovor v obliki kode. Končni izplen so seveda številske rešitve, ki so jih lahko preverili, in so bile za nekatere dimenzije dejansko boljši od trenutno znanih rekordov. V praksi bi lahko tako reševali tudi druge matematične probleme, če bi jih zapisali v ustreznem formatu v Pythonu.



5 komentarjev

DamijanD ::

Ko sem najprej prebral ime orodja sem pomislil, kako so zabavni - potem pa sledi "dolgočasna" razlaga pomena imena.

WhiteAngel ::

Sem prebral tale inženirski članek z 12 (!) avtorji in obetavnim abstractom. Nočem biti nesramen, ampak uokviriš pythonovo kodo, potem štartaš generiranje klicov funkcij, ki jih je LLM (na osnovi genetskih algoritmov in menjav vrstic) predlagal po monte carlo metodi, po nekaj milijardah kombinacij ti padejo ven rešitve, ki so "za nekatere dimenzije dejansko boljši od trenutno znanih rekordov"? Najprej, gre samo za aplikativno rabo UI in nekaj integracije. Ne gre pa za noben razvoj. Drugič pa, kaj za vraga vse že objavijo v Nature? A če je "Google" affiliaton gor, potem je avtomatično approve, še sploh, če je trendy tema? CS avtorji iz prejšnjega tisočletja se obračajo v grobu.

stara mama ::

pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba

Torej, če se izogne se izogne, včasih pa tudi ne.
Že kar vidim škandale, ko si bo na nekatera velika matematična (ali fizikalna) vprašanje nekatere dele rešitve kar izmislil in jih dolgo časa ne bo nihče odkril.

sbawe64 ::

stara mama
Rešitve se da preveriti, ali pač ?
2020 is new 1984
Corona World order

tigrr ::

Izgleda Moorov zakon spreminja trend razvoja humane inteligence in napredku sledi nazadovanje. Upam, da se motim.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema

Oddelek: Novice / Znanost in tehnologija
54060 (3045) tigrr
»

Google lansiral model Gemini, svojega tekmeca GPTjem

Oddelek: Novice / Ostala programska oprema
87802 (4789) 2dark
»

Še eno v vrsti javnih opozoril na nevarnosti umetne inteligence (strani: 1 2 )

Oddelek: Novice / NWO
8710850 (6729) darkolord
»

DeepMind izumil nov algoritem za množenje matrik, človek ga je hitro izboljšal

Oddelek: Novice / Znanost in tehnologija
1113057 (8842) MaFijec
»

Googlov DeepMind napoveduje odpoved ledvic

Oddelek: Novice / Znanost in tehnologija
55492 (4306) Markoff

Več podobnih tem