Raziskovalca objavila bazo 70.000 uporabnikov OkCupida

Matej Huš

16. maj 2016 ob 00:49:12

Minuli teden je skupina danskih raziskovalcev na internet (Open Science Framework) postavila urejeno bazo podatkov o 70.000 uporabnikih spletne strani OkCupid za spletne zmenkarije. Čeprav v njej ni imen in elektronskih naslovov, je podatkov toliko, da je mogoče ljudi zelo dobro profilirati in koga tudi prepoznati. Avtorja raziskave pravita, da so podatki tako ali tako javno dostopni, zato jih nista dodatno anonimizirala. To je res, a to še ne pomeni, da jih lahko po mili volji obdelujemo in analiziramo, če nimamo privoljenja njihovih lastnikov. Sploh pa javnost v tem primeru pomeni, da lahko podatke pridobi, kdor je registriran na OkCupidu za namene uporabe strani, a ne v obliki, ki je primerna za podatkovno rudarjenje.

Objavljeni podatki so namreč zelo temeljiti, saj vsebujejo med drugim tudi uporabniška imena, starost, spol, lokacijo, interese, osebnostne lastnosti in odgovore na več tisoč različnih vprašanj, ki jih stran uporablja za profiliranje uporabnikov. Baza podatkov je trenutno nedostopna, razprave o dopustnosti tovrstnega početja pa zelo burne.

Avtorja raziskave - tretji avtor trdi, da je odgovoren zgolj za programsko opremo, ki je bila uporabljena za sistematično snemanje podatkov z OkCupidove spletne stran, in da z raziskavo ni povezan - sta namreč prekršila precej norm, zelo verjetno pa tudi zakonov. Problematično je, da avtorja nista pridobila dovoljenja uporabnikov, katerih podatke sta obdelovala, da sta delovala v nasprotju s pogoji uporabe OkCupida, da sta zelo verjetno kršila evropsko in dansko zakonodajo o varovanju osebnih podatkov ter ameriško zakonodajo o dostopu do računalniških sistemov ter da sta vse skupaj javno priobčila na spletu. Prav tako nista pridobila soglasja univerzitetnega etičnega odbora. Univerza se je od njunega dejanja distancirala. Avtorja priznavata, da je bazo s spleta preneslo že vsaj 500 ljudi, torej je škoda nepovratno storjena. Prvi avtor je trenutno v Londonu in izjav ne daje, dokler se prah ne poleže.

To ni prvikrat, da je bil uporabljen argument, češ podatki so tako ali tako že javni. Že leta 2008, ko se je doba velikih podatkov (big data) šele začenjala, je harvardski raziskovalec s Facebooka snel podatke o 1700 študentih. Nekaj podobnega se je zgodilo dve leti pozneje, o obeh primerih pa kljub javnosti podatkov dejanje ni naletelo na pozitivne odzive. Pri tovrstnih študijah in objavah podatkov je nujno pridobiti informirano soglasje udeležencev, ustrezno varovanje podatkov, anonimizacija objavljenega in upoštevanje sorazmernosti. Tega se avtorja raziskave v tem primeru nista držala.