Slovenec na Stanfordu odkril algoritem za napoved naslednjih prijateljev na Facebooku

Matej Huš

12. avg 2011 ob 07:00:39

Današnjo bero dobrih novic nadaljujemo z zadnjimi rezultati dela dr. Jure Leskovca, nekdanjega diplomanta FRI in predavatelja na Univerzi v Stanfordu, kjer se ukvarja predvsem z analizo socialnih omrežij in izluščanjem vzorcev vedenja množic oz. celo predvidevanjem bodočega vedenja. Trenutno je zaključil delo na algoritmu, ki na podlagi seznama Facebook prijateljev in njihove medsebojne komunikacije uspešno predvideva, koga bo določena oseba dodala na seznam svojih prijateljev in koga ne. Algoritem zadane v povprečju polovico novododanih prijateljev, vendar je spisan tako, da se sam uči, zato bo v prihodnosti samo še bolj natančen. Leskovec ga misli še razširiti, npr. za odgovor na vprašanje, ali je socialno omrežje že preveliko in zato povezave v njim nepristne, objav pa preveč za slediti (nekako tako kot twitter feed s 1000 followingi, razen za ljudi z ADHD). Ugotovitve bi lahko bile koristne za Facebook, katerega število uporabnikov in rast sta končno začela upadati, pa tudi za manjše igralce (Twitter, LinkedIn, Foursquare, Groupon, ipd), ki jih ta plato še čaka. Novica je danes prilezla na vrh Slashdota, kar je lep dosežek.

V starejši raziskavi se je lotil spletnih medijev. Dnevno zajame okoli 30 milijonov novic, tako s strani večjih časopisov kot blogov bolj ali manj znanih posameznikov, in išče vzorce v njihovi vsebini, časih objave, pogostosti objave ipd. To lahko pokaže, kako se javno mnenje sčasoma spreminja v poročanju o dlje času trajajočem dogodku, ter kako se širi novica glede na medij objave. Časopisni članki postanejo popularni (digg, retweet, ipd) tako rekoč takoj po objavi, dragulji na blogih pa doživijo zanose obiska z zamikom in vsake toliko časa.

Analiz je še malo morje. Preveril je povezave med komentatorji na Slashdotu, ocenjevalci potrošnih naprav Epinions.com, volivci za wikipedijine administratorje, e-pošto raziskovalnih in poslovnih omrežij, pa citiranje med mednarodnimi revijami, povezave med strokovnimi združenji, nakupnimi navadami in ocenami v Amazonovi spletni trgovini, obnašanju p2p omrežij, wikipedie, twitterja, memetrackerja. Vse to so zelo praktične analize, ki lahko dajo upraviteljem omrežja, vodstvu podjetja, sociologom odgovore na bistvena poslovna vprašanja, ki jih z opazovanjem od spodaj preprosto ni mogoče dognati.

V priznanje njegovih akademskih dosežkov mu je Microsoft podelil dvoletno štipendijo Microsoft Research Faculty Fellowship v znesku 100.000 dolarjev na leto in brez omejitev pri uporabi. Del tega denarja bo verjetno pretopil v lastne projekte, del pa za novo opremo in vsebine za njegove študente. Njegov cilj je zgleda redna profesura na Stanfordu in glede tega je gotovo na dobri poti.

Leskovec je na Fakulteti za računalništvo in informatiko (FRI) diplomiral l. 2004 (sunma cum laude, iz teme Sumarizacija besedila, video zagovora). Že čez štiri leta je, pri 28h, doktoriral na Carnegie Mellon Univerzi, potem se za eno leto podal na postdoktroški študij na newyorški Cornell, od septembra 2009 pa deluje kot predavatelj na že omenjnem Standfordu. Ukvarja se s strojnim učenjem, umetno inteligenco in predvsem procesiranjem velikih podatkovnih zbirk, zlasti podatkov o rabi socialnih omrežij. Na slo-techu se je o njem prvič pisalo že leta 2002, ko je predstavljal program za sintezo slovenskega govora Govorec, izdelan v sodelovanju z IJS, kjer je sicer sodeloval že od srednješolskih let naprej. Najbolj znan je bržčas po analizi sporočil in uporabnikov sistema MSN messenger (video), kjer je tudi potrdil, da kateri koli dve osebi na svetu v povprečju loči le 6 vmesnih prijateljev (točneje 6.6; teoriji se sicer reče six degrees of separation). Rudarjenje socialnih omrežij je nadaljeval na Stanfordu, svoje izvlečke pa redno objavlja. Večje število njegovih predavanj si lahko ogledate na portalu Videolectures.