Algoritmi pravilno napovedali večino prejemnikov oskarjev

Matej Huš

25. feb 2013 ob 15:57:38

Včeraj so v ZDA podelili 85. oskarje za najboljše filmske dosežke v preteklem letu. Prireditev vsako leto pritegne precej pozornosti s celega sveta in to ne samo iz filmskih krogov. Nas zanima napovedna moč modernih algoritmov, s katerimi različni ljudje vsako leto poizkušajo napovedati zmagovalce. Oskarje namreč podeljujejo na podlagi glasov članov Akademije, ki ima nekaj manj kot 6000 članov z glasovalno pravico. Ker je v dobi interneta zbiranje, urejanje in analiziranje podatkov priljubljeno in nadvse dobičkonosno opravilo, ljudje vsako leto svoje algoritme preizkusijo tudi tako, da na podlagi internetnega vrveža poizkusijo vnaprej napovedati zmagovalce. In to jim presenetljivo dobro uspeva.

Primerjali bomo napovedi, ki so jih predvideli pri Googlu na podlagi iskalnih rezultatov pred podelitvijo, Microsoftove napovedi in napovedi Nata Silverja, ki je znan po izjemno točnih napovedi rezultatov ameriških volitev. Princip je skupen vsem. Pridobiti morajo čim več podatkov in potem s pametnimi algoritmi iz njih izluščiti zmagovalca, kar ni nemogoče, saj je članov Akademije že toliko, da statistika da uporabne podatke (če bi glasovalo, denimo, pet ljudi, pa bi bile vsakršne napovedi zelo vprašljive).

Najboljši film včeraj je bil Misija Argo, kar so pravilno napovedali vsi trije. Oskarja za režijo je prejel Ang Lee za Pijevo življenje, pri čemer so se enako zmotili prav vsi trije, saj so napovedali gladko zmago Stevena Spilberga z Lincolnom. Najboljšo moško vlogo je odigral Daniel Day-Lewis v Lincolnu, kar sta zadela Microsoft in Nate Silver, medtem ko je Google stavil na Hugha Jackmana. Pri najboljši igralki ni bilo nobenih dilem, saj so si bili vsi edini, da bo kipec prejela Jennifer Lawrence za Silver Linings Playbook, kar se je tudi zgodilo. Najboljšo moško stransko vlogo je odigral Christoph Waltz v Djangu brez okov, kar je zadel Google, ne pa tudi Nate Silver. Za najboljšo žensko stransko vlogo je bila nagrajena Anne Hathaway v Nesrečnikih, kar so vsi pravilno ugotovili.

Kaj to pomeni? Predvsem to, da smo ljudje statistično predvidljivi. Z zbiranjem obstoječih podatkov, z dovolj širokim vzorčenjem, z upoštevanjem zgodovinskih dogodkov in z uporabo pametnih algoritmov je mogoče iz na videz nepregledne množice neurejenih podatkov izluščiti želeno. Pravzaprav to ni nič novega, saj smo že pisali o spremljanju širjenja gripe z analizo iskanj po Googlu ali pa o povezavi med ključnimi besedami v iskanjih in ekonomsko močjo državo. Včasih se sicer zgodi, da napovedi odstopajo od empiričnih podatkov, a problem je hitro mogoče rešiti z izboljšavo algoritmov in več boljšimi podatki.