Z analizo dogajanja na Wikipediji do napovedi o uspešnosti filmov

Matej Huš

9. nov 2012 ob 13:14:40

Z interneta oziroma podatkov, ki jih ljudje delijo prek interneta, se da izluščiti marsikatero napoved, o čemer smo že pisali. Google Trends je aplikacija, ki kaže pogostost iskanja po posameznih ključnih besedah, in že leta 2008 so ugotovili, da je z analizo teh besed mogoče zelo točno napovedati, kdaj bo kod izbruhnila gripa. Zanimiva je tudi letošnja raziskava, v kateri so odkrili, da je naravnanost državljanov neke države v prihodnost (približek zanjo je število iskanj s ključnimi besedami prihodnjih let) močno korelirana z bogastvom te države. Naslednje vprašanje je, ali bi se dalo z merjenjem internetnega navdušenja (hype) napovedati, kateri izdelki bodo tržne uspešnice in kateri ne. Izkazalo se je, da je za filme to mogoče z analizo Wikipedije.

Taha Yasseri z budimpeške univerze je analiziral 312 filmov, ki so izšli v ZDA leta 2010. Analiziral je njihove strani na Wikipediji, in sicer število sprememb oziroma popravkov članka in število bralcev članka, ter od tod napovedal, koliko denarja bodo filmi zaslužili. Bistveni razmislek pri raziskavi je sposobnost napovedovanja in ne zgolj razlaganja, saj se članki na Wikipediji pojavijo že mesece pred dejanskim izidom filma. Tako je bilo mogoče z analizo dogajanja v članku o nekem filmu pred izidom že tedne pred samim izidom dobiti že zelo dobre informacije o tem, kako dobro se bo film obnesel v ZDA. Primerjali so tudi analizo dogajanja na Twitterju, kjer je časovna komponenta drugačna. Korelacija med uspehom filma in navdušenjem na Twitterju je sicer še nekoliko večja, a prve informacije lahko s Twitterja dobimo šele tik po izidu filma, z Wikipedije pa mnogo prej.

Avtorji raziskave (znanstveni članek je že v repozitoriju arXiv) dodajajo, da so napovedi zelo točne za uspešne filme, nekoliko manj pa za manj uspešne. Z drugimi besedami, filmi z dobro napovedjo se bodo zelo verjetno dobro obnesli, filmi s slabšo pa ne nujno res tako slabo.