Iz iskalnih poizvedb je moč sklepati na raka

Matej Huš

11. jun 2016 ob 19:11:18

Z iskanjem po internetu s ključnimi besedami za seboj puščamo veliko informacij o stvareh, ki nas zanimajo. Da jih je moč zložiti v osupljive osebne napovedi, ni nobena skrivnost, saj so trgovci že pred leti znali ugotoviti, kdo je noseč. Raziskovalci v Microsoftu pa so pokazali, da je mogoče iz ključnih besed precej zanesljivo sklepati, da ima oseba raka trebušne slinavke, četudi tega sama niti ne ve.

Pred osmimi leti je Google iz iskalnih rezultatov že ugotavljal, kako se po ZDA širi gripa. Microsoftovi raziskovalci so dobili podobno, zelo pametno idejo. Iz kopice podatkov so anonimizirano izluščili osebe, ki so pred kratkim prejele diagnozo pankreatični adenokarcinom (najpogostejša vrsta raka trebušne slinavke). Takšno diagnozo je na podlagi iskanj mogoče precej enostavno potrditi - iskanje po imenu bolezni, zdravilih, specialistih itd.

Potem so se vprašali, ali lahko v iskalnih terminih neposredno pred diagnozo najdejo ključne besede, ki bi jih lahko uporabili za zgodnjo napoved raka. Šlo je za 9,2 milijona spletnih poizvedb angleško govorečih uporabnikov Binga med oktobrom 2013 in majem 2015. Ugotovili so, da je to mogoče.

V 5 do 15 odstotkih primerov so že pred postavitvijo diagnoze lahko potrdili, da ima oseba raka trebušne slinavke, saj je iskala po ključnih besedah, ki ustrezajo simptomom. To se sliši precej klavrn rezultat, a je ob treba dodati, da je stopnja lažnih pozitivnih rezultatov zelo nizka - med 0,0001 in 0,00001. To pa že pomeni, da Bing večine obolenj z rakom na trebušni slinavki sicer ne bo odkril, bo pa pozitivni rezultat skoraj zagotovo pomenil, da je oseba bolna. Da si izračunamo Bayesovo verjetnost, potrebujemo še podatek o pogostnosti - 10,9 na 100.000 Američanov.

Ker je to ena izmed najhitreje napredujočih oblik raka, je tudi to zelo vzpodbuden rezultat. Zlasti pa kaže na možnosti, ki jih odpira analiza velikih količin podatkov.