Tokrat konference z govorom začuda ni otvoril izumitelj interneta Tim Berners-Lee, ampak Googlov glavni internetni evangelist Vint Cerf, ki je govoril o infrastrukturi interneta. Velik pomen je postavil predvsem na čimprejšnjo vzpostavitev IPv6, dejstvo, da četrtina sveta dostopa do Interneta preko mobilnega telefona, nove multimedijske iskalne tehnologije in varnost ter zasebnost v socialnih omrežjih.
Glasno sporočilo je imela Microsoftova raziskovalka Danah Boyd, ki je prav tako izpostavila problem zasebnosti pri analizi velikih podatkovnih baz, kot so na primer socialna omrežja.
Njena teza je, da samo dejstvo, da nekdo poseduje neke podatke o ljudeh, še ne pomeni, da uporaba rezultatov analize ni etično sporna. To je ena izmed prvih situacij, da je nekdo v javnosti raziskovalcem izpostavil razliko med pravico do posedovanja osebnih podatkov in pravico do uporabe le-teh v različne namene. Namreč, ko enkrat imamo tovrstne podatke, je njihovo izkoriščanje zelo prikladno in mamljivo, sploh če nikomur s tem direktno ne škodujemo. Še posebej je izpostavila nedavne prakse Facebooka v povezavi z posredovanjem osebnih podatkov uporabnikom tretjim osebam.
Druga velika tema poleg varstva zasebnosti v socialnih mrežah je bilo odpravljanje administrativnih ovir za dostop do javnih podatkov. V tem tonu je imel tretji uvodni govor ustanovitelj public.resource.org, Carl Malamud, ki je svoje delo posvetil temu, da so javni podatki tam, kjer bi morali biti - javno dostopni. Na srečo se tovrstni dosežki lahko že opazijo tako pri podatkih ameriške kot tudi britanske vlade. Bistveno je pa to, da je za tovrstne iniciative potrebno bistveno več zagona, kot ga ima v sebi povprečna javna uprava. Samo od sebe se namreč še nikjer ni nič premaknilo.
Tovrstne iniciative objavljanja podatkov pa poskušajo doseči še dodaten cilj - objava podatkov tako, da so izraženi in opisani v skupnem jeziku. S tem namreč polnijo vrzeli, ki jih je pred leti prinesla obljuba internetnih raziskovalcev o tako imenovanem semantičnem spletu. Le-ta se je zadnja leta v praksi manifestiral kot Linked Open Data, kjer so vsi decentralizirani viri podatkov izraženi in dostopni v kompatibilnem formatu, kar obljublja manjši trud, potreben za integracijo podatkovnih virov.
V tehničnem delu so še zmeraj zelo zastopane novosti v uporabi algoritmov za rudarjenje podatkov in iskalne tehnologije, kar se kaže v nezanemarljivi zastopanosti člankov iz Microsofta, Yahoo!-ja ter Googla, pozornost raziskav v iskalnih pristopih pa se kaže tudi na uporabi semantičnih tehnologij za iskanje. Prihodnost iskanja se vidi predvsem v izboljšanju rezultatov pri manj pogostih iskanjih, ki spadajo bolj v dolgi rep porazdelitve, uporabniških vmesnikov, ki omogočajo lažjo vsebinsko selekcijo rezultatov, mobilnega iskanja in še posebej uporabo socialnih omrežij v iskanju. Veliko vlogo igra tudi personalizacija same iskalne izkušnje, podrobnejše rezultate si lahko preberete sami.
Trenutno so poleg klasične analize besedil moderna socialna omrežja, še posebej Twitter. Kot zanimivost, izkaže se namreč, da je dinamika socialnega omrežja Twitterja bliže novičarskem mediju kot pa socialnem omrežju.
Da povzamemo:
- Če želite spraviti podatke javnega značaja, ki jih pri sebi hranijo uradi javne uprave v javnost, je treba precej truda in iniciative, vendar ni nemogoče;
- Semantični splet se manifestira kot oblak povezanih podatkovnih virov (Linked Open Data);
- vašega Facebook profila ne vidijo le vaši kolegi, precej živahno se po njemu sprehajajo tudi algoritmi za podatkovno rudarjenje z namenom oglaševanja;
- Tvoj najljubši iskalnik bo kmalu poznal ne le tebe, ampak tudi tvoje prijatelje;