Google pomotoma razkril podrobnosti o iskalnem algoritmu

Matej Huš

4. jun 2024 ob 10:12:24

Google je pomotoma na Githubu objavil interne dokumente, ki pojasnjujejo oziroma dokumentirajo delovanje iskalnega algoritma. Njihovo avtentičnost je potrdil, posebej zanimivo pa je, da so bili objavljeni pod licenco Apache 2.0. Kdorkoli jih je videl in prenesel, ima torej trajno, svetovno, neekskluzivno, neodplačno, nepreklicno pravico do uporabe. Dokumenti so zato sedaj brezplačno dostopni marsikje.

Večinoma gre za dokumentacijo. Čeprav dokumenti niso popoln opis iskalnega algoritma, hkrati pa za razumevanje terjajo poznavanje delovanja algoritma, je skupnost iz njih razbrala že marsikaj. V njih je na primer 2596 modulov in 14.014 atributov (funkcionalnosti). Vse to vpliva na razvrščanje strani pri iskanju, med njimi pa je tudi nekaj funkcij, katerih obstoj je v preteklosti Google izrecno zanikal. Parameter Navboost na primer meri tudi, kako dolgo obiskovalci ostanejo na strani, potem ko jo obiščejo. Google precej teh podatkov dobi iz svojega brskalnika Chrome.

V algoritmu je tudi precej ročnega popravljanja, tako da so nekatere strani na posebnih seznamih, ki jih uvrščajo višje, druge pa so namenoma utišane. To je bilo posebej aktualno med pandemijo. Nad novimi razkritji so posebej navdušeni - in do neke mere tudi ogorčeni - strokovnjaki za optimizacijo strani (SEO), ki že leta ugibajo in preizkušajo, kako strani rangirati čim višje. Vsega vseeno ne bodo izvedeli, saj iz dokumentov niso razvidni ponderji. Morda vsi parametri sploh niso vključeni v rangiranje.