Google - Google je ta teden v svoj iskalnik vključil novo funkcionalnost pri razvrščanju in prikazu zadetkov. Pri naprednem iskanju je namreč odslej na voljo možnost izbire Bralne ravni (reading level), kjer se lahko uporabnik odloči, da Google bodisi zgolj zadetkom pripiše zahtevnostni nivo bodisi jih že pred prikazom filtrira glede na izbrano zahtevnost.
Strani so glede na vsebino razvrščene v tri kakovostne razrede: osnovni (basic), srednje zahtevni (intermediate) in zahtevni (advanced). Wikipedija, recimo, pade v drugega, revija Nature pa v tretjega. Tako lahko učitelj informatike v srednji šoli dijakom priporoči iskanju po prvih dveh nivojih, medtem ko je za iskanje literature za diplomsko nalogo primeren tretji.
Zanimiva pa je uporaba funkcije, da bi videli, kako Google ovrednoti naše strani. Mislimo si seveda lahko, da je funkcija dodelana za angleške strani, saj je v slovenskem Googlu še ni, a tam deluje tudi za tujejezične strani. Sodeč po Googlu je Slo-Techu 70 odstotkov vsebine srednje zahtevnosti in 30 odstotkov osnovne. Vsi članki so srednje zahtevni, na forumu pa so lahkotne in srednje zahtevne teme skoraj enakomerno razporejene, pravi Google.
Ideja je resda še v povojih ampak ko malce bolj pomislim se mi zdi da ima precej potenciala, zaenkrat pa me predvsem zanima po kakšnem algoritmo to vrednoti? Bojim se da zgolj po številu besed ali morda po težavnosti besed (upam da ne s pomočjo kakšnega googlovega prevajalnika)... ali morda nad vsem tem bdi nek supervisor v fizični obliki, ki to po nekih konkretnih in dodelanih standardih ugotavlja, vsekakor bom spremljal to novost da pridem do odgovora kako je dejansko to kredibilna in resna stvar...
Pomoje so primerjali besedišče na straneh ala Nature, straneh ala wikipedia simple english s povprečjem in dobili neko sliko, katere besede/besedne zveze se pogostoje uporabljajo v katerem od primerov. Prevajalnik od googla je pa tut kr fajn za besede prevest, sam za stavke je mal neroden.
how we classify pages The feature is based primarily on statistical models we built with the help of teachers. We paid teachers to classify pages for different reading levels, and then took their classifications to build a statistical model. With this model, we can compare the words on any webpage with the words in the model to classify reading levels. We also use data from Google Scholar, since most of the articles in Scholar are advanced.