DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema

Matej Huš :: 18. dec 2023 ob 22:58
Znanost in tehnologija

Slo-Tech - DeepMind je razvil že več orodij na osnovi umetne inteligence, ki so zmogla najrazličnejša opravila od igranja šaha do medicinske diagnostike. A praviloma niso uporabljala velikih jezikovnih modelov (LLM), ker so ti pri logično-matematičnih nalogah slabi. Njihov najnovejši dosežek pa združuje prav ta svetova, saj so z LLM-jem reševali matematične probleme, za katere pred tem rešitev nismo poznali. O dosežku pišejo v najnovejši številki revije Nature, prav tako so razkrili kodo.

Veliki jezikovni modeli se najbolje obnesejo, če jih sprašujemo reči, ki so zapisane v vhodnih podatkih za trening, pa še tedaj si lahko kaj izmislijo. DeepMind pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba. Gre za orodje, ki je namenjeno iskanju funkcij (od tod ime), kar ni prvi matematični otrok iz DeepMinda. Spomnimo, da je AlphaTensor iskal hitrejše načine množenja matrik, AlphaDev pa je izboljševal algoritme. Sedaj pa so razvili prvo orodje, ki za matematiko uporablja LLM.

Problema so se lotili tako, da so matematični izziv formulirali v Pythonu, vmes pa pustili prazne vrstice, ki vračajo rezultat. Reševali so znameniti matematični problem, ki predstavlja večrazsežno posplošitev vprašanja, koliko točk lahko postavimo na dvodimenzionalno mrežo, da skozi nobeno trojico ne bo možno potegniti premice. To je sicer nišni problem, a popularen, pristop pa je vsej prej kot nišni.

FunSearch je deloval tako, da je generiral več možnih odgovorov, ki so bili vrstice kode za reševanje problema. Najboljše približke so nato vrnili v program in po več milijonih iteracij so dobili splošen odgovor v obliki kode. Končni izplen so seveda številske rešitve, ki so jih lahko preverili, in so bile za nekatere dimenzije dejansko boljši od trenutno znanih rekordov. V praksi bi lahko tako reševali tudi druge matematične probleme, če bi jih zapisali v ustreznem formatu v Pythonu.

5 komentarjev

DamijanD :: 19. dec 2023, 07:14

Ko sem najprej prebral ime orodja sem pomislil, kako so zabavni - potem pa sledi "dolgočasna" razlaga pomena imena.

WhiteAngel :: 19. dec 2023, 08:20

Sem prebral tale inženirski članek z 12 (!) avtorji in obetavnim abstractom. Nočem biti nesramen, ampak uokviriš pythonovo kodo, potem štartaš generiranje klicov funkcij, ki jih je LLM (na osnovi genetskih algoritmov in menjav vrstic) predlagal po monte carlo metodi, po nekaj milijardah kombinacij ti padejo ven rešitve, ki so "za nekatere dimenzije dejansko boljši od trenutno znanih rekordov"? Najprej, gre samo za aplikativno rabo UI in nekaj integracije. Ne gre pa za noben razvoj. Drugič pa, kaj za vraga vse že objavijo v Nature? A če je "Google" affiliaton gor, potem je avtomatično approve, še sploh, če je trendy tema? CS avtorji iz prejšnjega tisočletja se obračajo v grobu.

stara mama :: 19. dec 2023, 10:02

pa je razvil orodje FunSearch, ki se tem težavam sorazmerno uspešno izogiba

Torej, če se izogne se izogne, včasih pa tudi ne.
Že kar vidim škandale, ko si bo na nekatera velika matematična (ali fizikalna) vprašanje nekatere dele rešitve kar izmislil in jih dolgo časa ne bo nihče odkril.

sbawe64 :: 19. dec 2023, 10:12

stara mama
Rešitve se da preveriti, ali pač ?

2020 is new 1984
Corona World order

tigrr :: 19. dec 2023, 17:39

Izgleda Moorov zakon spreminja trend razvoja humane inteligence in napredku sledi nazadovanje. Upam, da se motim.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	DeepMind uporabil veliki jezikovni model za rešitev matematičnega problema McHusch Oddelek: Novice / Znanost in tehnologija	5	5334 (4319)	tigrr 19. dec 2023 17:39:51
»	Google lansiral model Gemini, svojega tekmeca GPTjem Aggressor Oddelek: Novice / Ostala programska oprema	8	10053 (7040)	2dark 9. dec 2023 17:46:58
»	Še eno v vrsti javnih opozoril na nevarnosti umetne inteligence (strani: 1 2 ) Aggressor Oddelek: Novice / NWO	87	15900 (11779)	darkolord 5. jun 2023 23:56:48
»	DeepMind izumil nov algoritem za množenje matrik, človek ga je hitro izboljšal McHusch Oddelek: Novice / Znanost in tehnologija	11	15299 (11084)	MaFijec 21. okt 2022 09:08:14
»	Googlov DeepMind napoveduje odpoved ledvic McHusch Oddelek: Novice / Znanost in tehnologija	5	6803 (5617)	Markoff 6. avg 2019 08:38:20

Tema

Sporočila

Ogledi

Zadnje sporočilo

Tema

Sporočila

Ogledi

Zadnje sporočilo