Tehnične novosti v Wiki svetu

Jernej Polajnar

2. maj 2013 ob 19:23:11

Te dni je razburljivo biti wikipedist. V zadnjih mesecih je infrastruktura, ki poganja projekte Fundacije Wikimedia, med njimi vsem znano Wikipedijo, dobila nekaj večjih nadgradenj tehnične narave, ki bodo bistveno spremenile način, kako ta zbirka prostega znanja nastaja in se razvija. Ali bodo spremembe imele pričakovan (pozitiven) učinek bomo še videli, dogaja pa se ogromno.

Wikipodatki


Najočitnejša novost je nov podprojekt z imenom Wikipodatki (Wikidata), katerega razvoj poteka pod okriljem nemške podružnice Fundacije Wikimedia. Gre za obsežno bazo podatkov o enciklopedičnih temah, ki jo je možno brati in zapisovati tako strojno kot ročno. Primarni cilj je poenotiti predstavitev osnovnih dejstev in olajšati delo, saj pri skupaj 37,5 milijonih člankov v 285 jezikih tudi več deset tisoč urejevalcev težko ohrani ažurnost. Vzemimo na primer, da se zamenja predsednik vlade Slovenije: za posodobitev podatka je potrebnih 200 urejanj v ravno toliko Wikipedijah, ki imajo članek o Sloveniji, če pa je z nekaj znaki kode v wikijih določeno, da se ta lastnost objekta črpa iz Wikipodatkov, je dovolj en sam popravek. Objekti (items), lastnosti (properties) ipd. so tu izrazi, ki opisujejo vnose v bazi in relacije med njimi.

Prva faza projekta je bila zagnana lansko jesen, in je obsegala centralizacijo ene dokaj minorne funkcije (vsaj s stališča obiskovalcev Wikipedije) - medjezikovnih povezav. Za urejevalce pa je že ta pomenila precejšnjo razbremenitev, saj so bile do takrat povezave med članki o isti temi v različnih jezikih zapisane v tekstovni obliki na koncu člankov. To je pomenilo množico popravkov ob vsaki ustvaritvi, preimenovanju ali izbrisu članka v katerikoli Wikipediji, za kar je bila napisana cela vojska botov, ki so patruljirali po mreži povezav. Seveda je stotine vsebinsko nebistvenih urejanj obremenjevalo strežnike in oteževalo spremljanje posegov v članke. Zdaj je dovolj en poseg v ustrezen objekt, da se podatek o spremembi strani (članka) na eni Wikipediji preslika v vse povezane strani. Druga faza implementacije Wikipodatkov - centralizacija osnovnih dejstev o enciklopedičnih temah - je v delu že nekaj mesecev odkar je možno objektom pripisovati lastnosti (npr. uradni jeziki neke države ali rod, kateremu pripada neka vrsta organizma), v tem času so razvijalci spolirali uporabniški vmesnik za ročno vnašanje, uporabniki pa vnesli kup podatkov v skupno že 12 milijonov objektov. Od tega tedna jih je možno črpati iz wikipedijskih člankov. Funkcionalnost je namenjena predvsem uporabi v okvirčkih z osnovnimi podatki (t.i. infopoljih), pri čemer se lahko skupnost vsake Wikipedije posebej odloči, ali bo imela podatek zapisan lokalno ali ga bo črpala iz Wikipodatkov. V tretji fazi, ki je še v pripravi, bodo Wikipodatki omogočali poganjanje zahtevkov (queries), kar bo omogočilo avtomatsko kreiranje seznamov in grafikonov po željenih kriterijih (npr. "seznam županov Berlina v 18. stoletju"), ki jih je zaenkrat treba pisati ročno.

Zanimiva je tudi možnost branja baze podatkov od zunaj - zbirko je skupnost dala v javno last, tako da ni avtorskopravnih ovir za izvirne možnosti kombiniranja in uporabe izobraževalnega gradiva, kar je navsezadnje cilj Wikimedie kot celote. Nekaj demonstracij potenciala je že nastalo, recimo GeneaWiki, ki bere podatke o sorodstvenih vezeh in riše družinska drevesa, ter Reasonator, ki že zdaj za nekatere bolje opremljene objekte konkurira spletni strani Notable Names Database.

Lua


Druga novost, skrita "pod pokrovom", sliši na ime Lua in prinaša možnost objektnega programiranja v wikije. Lua je skriptni jezik, ki ga je v 1990. letih razvila skupina brazilskih računalničarjev in je bil pred dobrim mesecem implementiran v programje MediaWiki preko razširitve Scribunto. Dejstvo je namreč, da je MediaWiki za končnega uporabnika dokaj lesen... omogoča hitro in enostavno formatiranje besedila in ustvarjanje hiperpovezav, vendar, kot se za množično odprto skupnost spodobi, je vsebina v vseh teh letih rasla tako v širino kot v globino, tako da je naraščala potreba po funkcionalnostih. MediaWiki pa razen osnovnih računskih operacij in nekaj pogojnih izrazov ponuja bore malo. Nobenih zank in rekurzij, karkoli resnejšega je bilo treba sestaviti na novo iz teh osnov in že funkcije, kakršna je zanka "for", so zahtevale obupno okorne in požrešne hacke. Luine skripte že s pridom uporabljajo v kompleksnejših predlogah v angleški Wikipediji, kjer poročajo o tudi do petkratni pohitritvi parsanja. Potencial je še ogromen, vključno z dinamičnim vključevanjem vsebine iz Wikipodatkov in njeno obdelavo na različne načine, ampak zadeva se šele dobro prijemlje, tako da kaj zanimivejšega še ni možno pokazati.

Kaj to dvoje pomeni za urejevalsko skupnost? Kot smo omenili, je še prezgodaj predvideti, kaj vse bodo nova orodja omogočila, bo pa gotovo korak naprej od skoraj statičnega predstavljanja vsebin, ki povprečnemu uporabniku interneta najbrž delujejo že arhaično. Po drugi strani obstaja možnost, da bodo novosti zaradi kompleksnosti odgnale potencialne nove urejevalce. Že res, da je ogromno dela z vzdrževanjem in ažuriranjem, vendar ima dosedanji sistem to prednost, da je vsebina kot na dlani. Za skoraj vsak podatek je možno z enim klikom priti do izvorne kode in ga spremeniti, kar od zdaj naprej ne bo več možno v enem koraku - en del podatkov bo v članku, drugi del jih bo vanj vključen iz ločene baze, tretji pa bo dinamično generiran s pomočjo skript. Dostopnost čim širšemu občestvu urejevalcev ostaja kljub vsemu ključni strateški cilj Fundacije, tako da bo še zanimivo opazovati, kako se bodo nova orodja razvijala. Seveda se ne branijo pomoči prostovoljnih razvijalcev pri odprtih opravilih.

LilyPond


Muzikalično navdahnjene bralce bo mogoče zanimala zadnja novost, to je možnost zapisovanja glasbene notacije, ki je bila ravno tako vklopljena pravkar, brez posebnega pompa. Razvijalci so uporabili odprtokodno rešitev LilyPond, ki je zdaj na voljo preko razširitve Score. LilyPond je močno orodje, konkurenčno profesionalnim programom kalibra Finale in Sibelius, ki zna poleg vsega generirati zvočne posnetke zapisane notacije, kar je vsekakor bistveno bolj napredno od dosedaj uporabljanih rešitev - bitnih slik za notno črtovje in ločenih zvočnih datotek za predvajanje. Kot zanimivost, prošnja za tako orodje je bila prvič podana že pred devetimi leti, pa nekako ni bilo motivacije. Predlog za usmerjen projekt vpisovanja znanih glasbenih kompozicij je že odprt.