»

Nov rekord v stiskanju podatkov z Wikipedije

Slo-Tech - Kaido Orav je najnovejši prejemnik Hutterjeve nagrade, ki jo Marcus Hutter iz DeepMinda podeljuje za najboljšo kompresijo človeškega znanja. Hutter je pripravil gigabajt veliko datoteko, ki vsebuje članke z Wikipedije in predstavlja nekakšen odsev dostopnega znanja, ki bi ga človek zmogel prebrati v celem življenju. Medtem ko klasičen ZIP datoteko stisne na približno tristo megabajtov, je najnovejši rekord 112 MB.

Kdor se poteguje za nagrado, mora prispevati program, ki implementira algoritem za stiskanje, ter stisnjeno datoteko. Če je njuna skupna velikost manjša od aktualnega rekorda, ki znaša 112 MB, dobi nagrado. Skupna nagrada znaša pol milijona evrov, izplača pa se tolikšen odstotek, za kolikor je novi rekord izboljšal starega. Pogoj je, da algoritem stisnjeno datoteko nazaj razpakira v originalu identično. Natečaj poteka od leta 2020.

Pred razpisom nagrade je bil rekord 116 MB, nato pa so nagrajenci mejo počasi potiskali proti današnjim 112 MB. Obstaja še druga verzija...

7 komentarjev

Wikipedija izdala prvo poročilo o transparentnosti

Wikipedia - Tudi Wikipedija se je pridružila stranem, kot sta na primer Google in Facebook in ki izdajajo poročilo o transparentnosti. K temu jih je spodbodla nova evropska zakonodaja (oziroma njeno tolmačenje), ki od iskalnikov znotraj EU zahteva možnost odstranitve iskalnih rezultatov. Ker je nekaj odstranjenih povezav tudi na članke v Wikipediji, so se odločili, da izdajo svoje prvo poročilo o transparentnosti.

Pri tem ne gre samo za odstranitev povezav z Googlovih rezultatov iskanja, kar je bil povod za to odločitev. Vseeno pa velja omeniti, da je Google med 91.000 zahtevki prejel tudi 50 takih, ki so se nanašali na strani na Wikipediji in da jih je nekaj tudi upošteval. V Wikipediji temu nasprotujejo, zato so začeli objavljati seznam vseh...

3 komentarji

Wikipedija: točnost člankov in detekcija vandalizma

Uspešnost odkrivanja vandalizma

Slo-Tech - Ta konec tedna je v Leipzigu potekala konferenca Wikipedia - Ein kritischer Standpunkt, na kateri so udeleženci poslušali predavanja o različnih temah, povezani s spletno enciklopedijo Wikipedija in prosto dostopnim znanjem na spletu nasploh: med drugim kritike o virih za Wikipedijo, medijski kompetenci, medijskem arhivu Wikimedia Commmons, prihodnosti itn.

Zanimivo raziskavo je predstavil zgodovinar Peter Haber, ki je s svojimi študenti prečesal mnoge članke o zgodovinskih temah in preverjal njihove razumljivost, objektivnost in pravilnost. Ugotovil je, da čeravno so članki večidel faktografsko...

8 komentarjev

FBI terja odstranitev svojega znaka z Wikipedije

BBC - Znak ameriškega Zveznega preiskovalnega urada (FBI), ki ga Slovenci še največkrat vidimo v filmih, je na spletu objavljen marsikod, a ena objava gre FBI-ju še pošteno v nos. Le tako si lahko razložimo, zakaj so poslali sanfranciški pisarni Wikipedije pismo, v katerem jih pozivajo, naj znak umaknejo s svoje strani. V zahtevku utemeljujejo, da je posest teh insignij ali kakršnekoli barvne imitacije kazniva, zato so lahko posestniki kaznovani z globo ali zaporno kaznijo. Posnetek na Wikipediji, ki omogoča reprodukcijo vse do ločljivosti 2000 x 2060 pikslov, je po mnenju FBI-ja še...

17 komentarjev

Microsftova verzija Wikipedia je EntityCube

CNet - Microsoft je javnosti predstavil testno verzijo projekta EntityCube, ki se zgleduje po Wikipediji. V kocki bodo poskušali zbrati biografske podatke o vseh, ki se pojavljajo na spletu. Torej bodo že objavljen material, ki je raztresen po milijonu strani, zbrali na enem mestu. Nato se bo s to zbirko podatkov dalo početi marsikaj zanimivega, na primer narisati bo moč kakšen graf socialne povezanosti in poznanstev, avtomatsko sortirati ljudi po poljubnih kriterijih in podobno.

Microsoft poudarja, da se EntityCube razlikuje od preprostega brskalnika. Tudi slednji sicer lahko najde želene informacije o osebah, a morajo ljudje nato sami preklikati mnogo strani in izluščiti bistvo. Microsoft bo to storil za vas na enem mestu, za razliko od Wikipedije pa se bo omejil pretežno na ljudi.

7 komentarjev

Papirnata Wikipedija

Yahoo News - Jimmy Wales, ustanovitelj največje proste spletne enciklopedija Wikipedija, je v ponedeljek dejal, da razmišlja o papirnati izdaji Wikipedije. Za zdaj je dosegljiva le prek interneta, kar je po njegovem mnenju ovira za dosego cilja proste dostopnosti znanja po celem svetu, ne le tistem koščku s hitrimi internetnimi povezavimi. Tako lahko od sredine prihodnjega leta dalje pričakujemo prvo tiskano izdajo Wikipedije, prav tako pa tudi verzije na CD-jih in DVD-jih, namenjene deželam v razvoju.

Wales je razmišljal tudi o spletnem vandalizmu, težavi, ki prizadene vse spletne strani, kjer uporabniki lahko prosto spreminjajo ali dodajajo vsebine. Kritični članki v Wikipediji so predvsem tisti, ki obravnavajo aktualno problematiko ali kontroverzne teme, naprimer iraško ali vietnamsko vojno, religijo itn. ( Primer vandalizma v članku o vietnamski vojni.) Takšne izpade sicer skrbniki relativno hitro popravijo, a so kljub temu moteči. Jimmy Wales je dejal, da Wikipedija razvija novo...

25 komentarjev

FBI postal nestrpen?

Slashdot - Ameriški zvezni preiskovalni urad FBI je med svojim preiskovanjem napada in vdora naredil precej nenavaden korak. Zaradi suma, da je heker oz. kreker, ki je napad storil, sodoloval na različnih kanalih CIT-ovega IRC strežnika, jim je sodišče izdalo nalog, da lahko pregledajo in poiščejo kakršne koli sledi za napadalcem.

Do tu seveda še nič spornega, vendar pa je najbolj presenetil FBI sam z naslednjim "pripetljajem". Ko so namreč začeli preiskovati več terabajtov podatkov, ki jih CIT Hosting poseduje, so se namreč po več urah preiskovanja odločili, da bodo zasegli vso strojno opremo, katero podjetje, ki se ukvarja z gostovanjem spletnih strani, poseduje. Pri tem so jim zatrdili, da jim jo bodo vrnili takoj, ko si podatke prekopirajo in jih pregledajo. Klik!

6 komentarjev