»

Nov rekord v stiskanju podatkov z Wikipedije

Slo-Tech - Kaido Orav je najnovejši prejemnik Hutterjeve nagrade, ki jo Marcus Hutter iz DeepMinda podeljuje za najboljšo kompresijo človeškega znanja. Hutter je pripravil gigabajt veliko datoteko, ki vsebuje članke z Wikipedije in predstavlja nekakšen odsev dostopnega znanja, ki bi ga človek zmogel prebrati v celem življenju. Medtem ko klasičen ZIP datoteko stisne na približno tristo megabajtov, je najnovejši rekord 112 MB.

Kdor se poteguje za nagrado, mora prispevati program, ki implementira algoritem za stiskanje, ter stisnjeno datoteko. Če je njuna skupna velikost manjša od aktualnega rekorda, ki znaša 112 MB, dobi nagrado. Skupna nagrada znaša pol milijona evrov, izplača pa se tolikšen odstotek, za kolikor je novi rekord izboljšal starega. Pogoj je, da algoritem stisnjeno datoteko nazaj razpakira v originalu identično. Natečaj poteka od leta 2020.

Pred razpisom nagrade je bil rekord 116 MB, nato pa so nagrajenci mejo počasi potiskali proti današnjim 112 MB. Obstaja še druga verzija...

7 komentarjev

Japonci z novim rekordom v hitrosti prenosa podatkov

Slo-Tech - Raziskovalci z japonskega NICT-a (National Institute of Information and Communications Technology) so postavili nov rekord v hitrosti prenosa podatkov po optičnih vlaknih, in sicer so dosegli 1,02 Pb/s. S tem so konkretno izboljšali lanski rekord (0,319 Pb/s) in presegli tudi konceptualno precej drugačen in zapletenejši dosežek izpred dveh let (1,01 Pb/s). Za najnovejši rekord niso uporabili nobene tehnologije ali trikov, ki vsaj načeloma ne bi bili izvedljivi tudi z današnjo komercialno dostopno opremo.

V optičnem vlaknu so združili štiri sredice, medtem ko imajo današnji optični kabli eno, a je kabel še vedno meril le 0,125 mm v premeru, kolikor merijo tudi današnji komercialni kabli. Podatke so prenašali v frekvenčnem razponu 20 THz z uporabo multipleksiranja valovne dolžine (WDM). Tako so prostor razdelili v 801 kanal prek treh pasov (C, L in eksperimentalni S: 256QAM za C in L, 64QAM za S). In tako so na razdalji 51,7 kilometra podatke prenašali s hitrostjo 1,02 Pb/s.

8 komentarjev

Industrija išče naslednika globokega učenja

Ars Technica - Največja konferenca o strojnem učenju na svetu, NeurIPS, je letos minila v znamenju vse večjega zavedanja o kritičnih omejitvah globokih nevronskih mrež in iskanju načinov, kako bi ovire prešli.

Globoko učenje - se pravi, raba globokih nevronskih mrež - si je v zadnjem desetletju praktično podredilo področje strojne inteligence. Dalo nam je algoritme, ki premagujejo ljudi v strateških igrah, prepoznavajo obraze, diagnosticirajo bolezni in vozijo avtomobile ... dokler cesta ni preveč luknjasta, mokra in polna nepredvidljivih kolesarjev. Prav ta zadnji primer pa že kaže, kako omejen je pravzaprav ta pristop, saj se avtonomna vozila kar ne morejo izviti iz primeža eksperimentalnih faz, pa čeprav naj bi bila že nekaj časa tik za ovinkom. Kdor redno bere našo stran, zna našteti šibke točke globokega učenja na izust: občutljivost na šum; ogromne baze podatkov, potrebne za učenje; pristranskost in pa katastrofično pozabljanje, se pravi neučinkovitost izven zelo ozko zastavljenih...

15 komentarjev

FBI terja odstranitev svojega znaka z Wikipedije

BBC - Znak ameriškega Zveznega preiskovalnega urada (FBI), ki ga Slovenci še največkrat vidimo v filmih, je na spletu objavljen marsikod, a ena objava gre FBI-ju še pošteno v nos. Le tako si lahko razložimo, zakaj so poslali sanfranciški pisarni Wikipedije pismo, v katerem jih pozivajo, naj znak umaknejo s svoje strani. V zahtevku utemeljujejo, da je posest teh insignij ali kakršnekoli barvne imitacije kazniva, zato so lahko posestniki kaznovani z globo ali zaporno kaznijo. Posnetek na Wikipediji, ki omogoča reprodukcijo vse do ločljivosti 2000 x 2060 pikslov, je po mnenju FBI-ja še...

17 komentarjev

Slovenska država ne pozna odprtih standardov?

Slo-Tech - V Uradnem listu RS 75/2005 z dne 9. 8. 2005 je bil objavljen Pravilnik o izvrševanju uredbe o upravnem poslovanju, ki v 14. členu določa tehnološke zahteve za sprejem elektronske pošte. Drugače povedano: državni organ mora sprejeti elektronsko pošto državljana, če le-ta ustreza zahtevam v 14. členu. V nasprotnem primeru - če elektronska pošta državljana ne ustreza tehničnim zahtevam - pa pač ne.

In kakšne so te zahteve?

14. člen pravi takole: "Pošta, ki jo organ prejeme v elektronski obliki, je skladna s tehnološkimi zahtevami, če je posredovana v enem od naslednjih formatov:
- Formati produktov Microsoft Office (različica "Office 2000" ali starejša): MS Word (.doc); MS Excel (.xls); MS PowerPoint (.ppt);
– Tekstni formati: ASCII, 8bit (.txt, .asc, .dat,...); RTF (.rtf); XML (.xml) (vsebina določena s posamezno aplikacijo);
– Grafični formati: Adobe Acrobat, različica 6.0 ali starejša (.pdf); JPEG (.jpg, .jpeg); GIF (.gif,); TIFF (. tif, .tiff):
– Ostalo: stisnjene datoteke...

170 komentarjev

Arnes postavil rekord

Arnes - Vsi, ki spremljate Arnesovo stran, veste, kako poredko se pojavijo nove novice. Danes pa sem našel podatek, ob katerem so se mi (na 100Mbit liniji) pocedile sline.

Arnes je namreč preko akademskih omrežij na razdalji 2518 km (med Slovenijo in Španijo) poslal 675 MB veliko datoteko v 11,73 sekunde. S tem so izkazali dobro sodelovanje med skrbniki omrežij in postavili nov rekord v hitrosti povezave. Preko protokola IPv6 so dosegli prenos 483 megabitov/s, poskus pa je potekal ob petih zjutraj, ko je sodeč po statistiki promet na omrežju najmanjši. Tako se sedaj vodilni v tekmovanju za najhitrejši prenos podatkov, kar je priznala tudi komisija za Internet2. Uradno novico najdete tukaj.

Running speedtest: Can not measure the time. Such small unit does not exist.

9 komentarjev