Turingovo nagrado letos prejela Andrew Barto in Richard Sutton

Matej Huš

6. mar 2025 ob 07:12:53

Letošnjo Turingovo nagrado, ki jo podeljujejo za dosežke na področju računalniških ved in predstavlja ustreznico Nobelove nagrade, saj je za to področje ni, sta prejela Andrew G. Barto in Richard S. Sutton. Association for Computing Machinery jima je nagrado podelila za dosežke na področju spodbujevanega učenja (reinforcement learning). Nagrada vključuje tudi milijon dolarjev, ki jih prispeva Google.

Tehniko, ki je danes gonilna sila moderne umetne inteligence, sta Barto in Sutton začela oblikovati v 80. letih minulega stoletja. Tedaj sta v nizu člankov predstavila zamisel, razvila matematične osnove in postavila prve algoritme. Spodbujevano učenje je eden izmed načinov za trening umetne inteligence, ki se mora naučiti izbrati pravilne poti. Do začetka 80. let je bi napredek na tem področju počasen, zato sta nagrajenca oblikovala nov pristop. Agenti umetne inteligence lahko ravnajo po naključju, nato pa njihove poteze ovrednotimo z nagrajevalno funkcijo, ki favorizira želeno obnašanje. Njihov cilj je povečati količino nagrade, ki jo prejmejo. Barto in Sutton sta razvila številne izvedenke spodbujevanega učenja, o čemer sta pisala v knjigi Reinforcement Learning: An Introduction (1998), ki je na tem področju še vedno kánon. Iz tega pristopa se je sčasoma razvilo globoko spodbujevano učenje, rezultat pa smo videli že leta 2016, ko je AlphaGo začel premagovati najboljše igralce goja. Vsega tega napredka ne bi bilo, če Barto in Sutton ne bi imela tudi drugih znanj, zlasti s področja psihologije, od koder sta si izposodila ideje in terminologijo.

Andrew Barto je zaslužni profesor na Univerzi Massachusetts v Amherstu, kjer je leta 1977 začel kot podoktorski sodelavec in kasneje napredoval vse do profesorja in vodje oddelka. Po izobrazbi je matematik, doktoriral pa je na Univerzi v Michiganu. Richard Sutton je profesor na Univerzi v Alberti, v preteklosti pa je delal tudi v DeepMindu in razvojem laboratoriju AT&T. Z Bartom sodelujeta že od leta 1978, saj je bil Barton njegov mentor na doktoratu. Zanimivo je, da je Sutton diplomiral iz psihologije na Stanfordu, nato pa je pri Bartu doktoriral iz računalništva.