»

Google pomotoma razkril podrobnosti o iskalnem algoritmu

Slo-Tech - Google je pomotoma na Githubu objavil interne dokumente, ki pojasnjujejo oziroma dokumentirajo delovanje iskalnega algoritma. Njihovo avtentičnost je potrdil, posebej zanimivo pa je, da so bili objavljeni pod licenco Apache 2.0. Kdorkoli jih je videl in prenesel, ima torej trajno, svetovno, neekskluzivno, neodplačno, nepreklicno pravico do uporabe. Dokumenti so zato sedaj brezplačno dostopni marsikje.

Večinoma gre za dokumentacijo. Čeprav dokumenti niso popoln opis iskalnega algoritma, hkrati pa za razumevanje terjajo poznavanje delovanja algoritma, je skupnost iz njih razbrala že marsikaj. V njih je na primer 2596 modulov in 14.014 atributov (funkcionalnosti). Vse to vpliva na razvrščanje strani pri iskanju, med njimi pa je tudi nekaj funkcij, katerih obstoj je v preteklosti Google izrecno zanikal. Parameter Navboost na primer meri tudi, kako dolgo obiskovalci ostanejo na strani, potem ko jo obiščejo. Google precej teh podatkov dobi iz svojega brskalnika Chrome.

V algoritmu je...

1 komentar

Google aktivno preprečuje širjenje špekulacij o koronavirusu

Slo-Tech - Medtem ko zdravstveni delavci na terenu bijejo bitko za bitko zoper novi koronavirus, poteka še en velik boj na medmrežju, ki se v zadnjih tednih utaplja v pravih in lažnih informacijah o virusu. Google je v tej bitki zavzel doslej redko videno pozicijo, ko iskalnih rezultatov ni prepustil zgolj nezmotljivim(?) algoritmom, temveč je aktivno posredoval. Izvršni direktor Sundar Pichai je zaposlenim poslal okrožnico, v kateri je poudaril, da je ta hip eden izmed velikih trenutkov, ko mora Google upravičiti svojo vlogo in posredovati sveže in zanesljive informacije. Google je temeljito prečistil, kaj vidimo v iskalnih zadetkih.

Kdor išče po novem virusu, bo najprej videl okvirček s povezavami do pomoči in preverjenih informacij na straneh Svetovne zdravstvene organizacije (WHO). Sledijo nasveti za samozaščitno ravnanje in zemljevid prizadetih območij in šele nato iskalnih zadetki. Na prvih straneh najdemo izključno najbolj ugledne vire, torej WHO, CDC, NHS, velike časnike (The...

55 komentarjev

Polovica iskanj na Googlu se ne konča s klikom

Axios - Letos poleti je Google dosegel nenavaden in pomenljiv rekord. Prvikrat v zgodovini se je zgodilo, da se je več kot polovica iskalnih poizvedb končala brez klika na kakšen zadetek. To ne pomeni, da so Googlovi zadetki čedalje slabši. To kaže, da Google uspešno širi svoj ekosistem in da čedalje dlje zadržuje uporabnike v njem. Navsezadnje se danes prek Googla opravi 94 odstotkov vseh iskalnih poizvedb, poleg tega pa Google ponuja še številne druge storitve (YouTube, Gmail, koledar, zemljevid itd.).

Drugi razlog, zakaj se številna iskanja končajo brez zadnjega klika iz Googla, pa je čedalje več odgovorov na vprašanja, ki jih pozna že Google. Pogosto se Google uporablja za preverjanje črkovanja (spellchecker), saj zatipkane iskalne termine sam popravi - običajno...

14 komentarjev

Nov CAPTCHA: Nisem robot

Google - Google razvija novo metodo za ugotavljanje, ali je uporabnik človek ali robot. Doslej je bila standardna reCAPTCHA vnašanje črk in številk iz popačenega teksta, ki pa je zaradi čedalje boljših sposobnosti algoritmov postajal čedalje bolj popačen. Googlovi inženirji so ugotovili, da je to nepotrebno; ljudi lahko preprosto vprašamo, ali so roboti, ter opazujemo njihovo obnašanje.

Nova vrsta reCAPTCHA se imenuje No-CAPTCHA in je že v uporabi na nekaterih spletnih straneh, na primer na WordPressu in Snapchatu. Kot prikazuje primer, nov API postavi preprosto vprašanje, kot je izbira najljubše barve, potem pa mora uporabnik še potrditi izbirno polje, da ni robot. Seveda se v ozadju skriva precej več, a Google o podrobnostih algoritma ni želel govoriti, da ga pisci...

30 komentarjev

"Žal mi je Dave"* - kako regulirati algoritme?

HAL 9000 (Cryteria, Wikipedija)

vir: Wikipedia
Slo-Tech - Ljudje so danes z odprtimi rokami sprejeli udobje tehnologije ne da bi zares razumeli, kako ta deluje ter kakšen abnormalen potencial kopičenja podatkov imajo naše naprave, katere praktično vedo, kdo smo, kje smo in kaj počnemo (ter še na tisoče drugih zadev). To dosežejo s pomočjo "pametnih" ter vedno bolj kompleksnih algoritmov, ki lahko v delčku sekunde najdejo, sortirajo, določijo, kontrolirajo in ukrepajo na podlagi množice podatkov, da nam tako pomagajo pri vsakdanjih življenjskih opravilih; v nasprotnem primeru bi se ljudje najbrž izgubili v preobilici informacij.

Za večino ljudi...

20 komentarjev

Lovro in Marko odkrivata skupnosti v omrežjih

Eurekalert - Lovro Šubelj in Marko Bajec sta pred kratkim objavila zanimiv članek o iskanju skupnosti v poljubnih omrežjih.

Izmislila sta si algoritem za odkrivanje skupnosti v omrežjih. Novi algoritem za določanje tega, v katero skupnost spada vozlišče, upošteva ne samo skupnosti neposrednih sosedov, ampak tudi sosede sosedov. Algoritem pri tem pametno tehta, kako pomembni so neposredni sosedi, kako pomembni pa sosedje sosedov.

Novi algoritem uspešno odkriva različne skupnosti tudi v omrežjih, o katerih je znano le malo dejstev. Nekateri dosedanji algoritmi za iskanje skupnosti, za katere ni nujno značilno to, da so vozlišča v njih med seboj gosto povezana, so namreč potrebovali dodatne podatke, kot je naprimer število iskanih skupnosti.

Algoritem je dovolj hiter, da ga je mogoče uporabiti na milijonih med seboj povezanih vozlišč.

Članek je povzela tudi vrsta tujih novičarskih strani: EPJ.org, IEEE Computer.org, Springer, ACM.org, PhysOrg.com, ScienceDaily, SpaceDaily, EurekAlert! in drugi.

19 komentarjev

Google uvedel novi iskalni algoritem Panda v vseh jezikih

Nad algoritmom bdita Amit Singhal in Matt Cutts

Google - Google je februarja poizkusno predstavil spremembo iskalnega algoritma, poimenovano Panda, s katero so želeli izboljšati zadovoljstvo uporabnikov pri iskanju. Glavna sprememba je bila odstranitev tako imenovanih farm z vsebino iz iskalnih zadetkov, saj te ne nudijo nobenih pomembnih informacij, ampak se zgolj dinamično prilagajajo Googlovim pajkom, da bi se med rezultati zavihtele čim više. Novi algoritem ne ocenjuje več le relevantnosti, ampak tudi kakovost strani. Google je ocenil, da je sprememba vplivala na uvrstitev približno 12 odstotkov strani.

Ker se je sprememba izkazala za pozitivno, so jo aprila razširili na vse iskalne poizvedbe v angleščini. Poleg tega so začeli upoštevati tudi podatke o straneh, ki jih uporabniki blokirajo iz...

8 komentarjev

Google prenovil iskalni algoritem

Ena izmed strani, ki bodo izgubile visoka mesta, bo bržkone tudi eHow

Google - Google vsako leto izvede približno 500 sprememb svojega iskalnega algoritma, izmed katerih je večina manj opaznih. Ta teden pa so najprej za ameriške uporabnike - postopoma bodo spremembo vpeljali po celem svetu - občutneje spremenili algoritem za razvrščanje zadetkov pri iskanju. Ker so se v zadnjih mesecih med prve zadetke prikradle neuporabne strani, ki jih imenujemo tudi farme z vsebino, ker so organizirane tako, da je na njih ogromno neuporabnih tekstovnih podatkov, da bi zadovoljile pajke, je Google algoritem posodobil. Spremembe naj bi vplivale na razvrstitev okoli 12 odstotkov strani, kar je največja sprememba v zadnjih letih, pravi Amit Singhal iz Googla.

Omenjene farme (mednje sodijo največje Yahoo...

25 komentarjev

Mobilni Google Instant gre po svetu

Prikaz zadetkov v francoščini

vir: Google
Google - Google je svojo storitev Instant, kjer se iskalni zadetki prikažejo po vnosu prvega znaka v iskalno polje ter se med tipkanjem ves čas prilagajajo, sprva splavil za namizne brskalnike. Pred kratkim jo je v beta različici razširil še na mobilni platformi iOS in Android, a je bilo to omejeno le na uporabnike teh mobilnih telefonov v ZDA. A nič več, Google Instant je na teh dveh mobilnih platformah zdaj namreč na voljo uporabnikom po celem svetu. Čeprav so geografske omejitve mnogo bolj sproščene, storitev še ni pretirano...

5 komentarjev

Google od AdSensa pobere manj kot tretjino

Google - Google je prvikrat razkril konkretne številke, koliko odstotkov dohodkov od sistema AdSense dobijo založniki in koliko pobere Google. AdSense sestoji iz več delov: najbolj znan je vsebinski del, ki avtorjem omogoča nabiranje denarja s postavitvijo reklam ob vsebino na spletni strani. Priljubljen je še iskalni del, ki se prikaže ob iskalnih zadetkih.

Google lastnikom strani posreduje 68 odstotkov zbranega denarja od oglasov z AdSense, medtem ko preostanek porabijo zase. Kot pravijo, je ta delež konstanten že od splavitve AdSensa leta 2003. Iskalni partnerji dobijo nekoliko manjši delež, in sicer le 51 odstotkov za prikaz oglasov ob iskalnih rezultatih po svetu. Ta delež je konstanten od leta 2005, pred tem pa je bil še manjši. Za druge različice AdSensa (mobilna, za igre itn.) deležev niso želeli razkriti, saj se te še intenzivno spreminjajo.

2 komentarja

Google razvršča strani tudi po hitrosti

Google - Točna formula Googlovega rangirnega algoritma za prikazovanje zadetkov pri iskanju je velika skrivnost, a v grobih obrisih je znano, kaj vsebuje. Te dni je dobila novo sestavino, ki se imenuje hitrost strani.

Amit Singhal in Matt Cutts sta na Googlovem blogu pojasnila, zakaj je hitrost pomembna. Spremenjeni algoritem je v uporabi že nekaj tednov, a so ga uradno predstavili šele včeraj. Odslej se pri rangiranju strani hitrejše strani uvrščajo više, čeprav je ponder za hitrost med dvesto različnimi dejavniki majhen. Google še vedno daje prednost relevantnosti, tako da naj bi novo sortiranje vplivalo na manj kot odstotek strani, pojasnjujeta. Kljub temu pa pošiljajo jasno sporočilo skrbnikom spletnih strani - hitrost je važna!

12 komentarjev

Prenova MSN

The Register -

MSN je predstavil veliko nadgradnjo svojega iskalnega portala, s čimer želi postati bolj konkurenčen Googlu in Yahooju. Glavne novosti sto milijonske investicije Microsoftove podružnice so nov algoritem sortiranja zadetkov pri iskanju, ki razloči med zadetki po vsebini in t.i. sponzoriranimi povezavami, iskanje neposredno po bazi Encarte in za 45 odstotkov večja ustreznost zadetkov.

Zanimivo je, da bo Microsoft zaradi odstranitve sponzoriranih povezav izgubil več deset milijonov dolarjev, a meni, da bo na tak način pridobil uporabnike. Izvirna novica.

6 komentarjev