Wikipedija: točnost člankov in detekcija vandalizma

Matej Huš

27. sep 2010 ob 00:37:01

Ta konec tedna je v Leipzigu potekala konferenca Wikipedia - Ein kritischer Standpunkt, na kateri so udeleženci poslušali predavanja o različnih temah, povezani s spletno enciklopedijo Wikipedija in prosto dostopnim znanjem na spletu nasploh: med drugim kritike o virih za Wikipedijo, medijski kompetenci, medijskem arhivu Wikimedia Commmons, prihodnosti itn.

Zanimivo raziskavo je predstavil zgodovinar Peter Haber, ki je s svojimi študenti prečesal mnoge članke o zgodovinskih temah in preverjal njihove razumljivost, objektivnost in pravilnost. Ugotovil je, da čeravno so članki večidel faktografsko pravilni, so rezultati kljub temu klavrni. Obsežnejša in zapletenejša kot je bila tema, tem slabši pregled nad obravnavano snovjo so članki podajali. Problem je tudi, da pisci prispevkov le-te osnujejo le na virih v enem jeziku, kar lahko, še zlasti v humanističnih vedah, precej izkrivi pogled. Situacija je v prirodoslovnih vedah boljša, dodaja, in citira Nature, ki je Wikipediji že pred leti napovedala svetlo prihodnost.

Istočasno pa so na spletu objavljeni rezultati drugega natečaja, ki se go v zvezi Wikipedijo takisto organizirali Nemci. Šlo je za 1. mednarodno tekmovanje v odkrivanju vandalizma na Wikipediji, kjer se je pomerilo devet ekip. Te so dobile korpus 32452 popravkov v 28468 člankih v Wikipediji, kjer je bilo treba najti 2391 primerov vandalizma. Pristopi so bili različni, zmagovalni predlog pa je odkril 20 odstotkov vandalizma brez lažnega pozitivnega rezultata. Če pogoje detekcije poostrimo, zazna 95 odstotkov vandalizma in napačno opredeli 30 odstotkov legitimnih popravkov.