»

Po Redditu sme iskati le Google

Slo-Tech - Odkar je Reddit spremenil politiko uporabe, ki pajkom prepoveduje brskanje po strani brez izrecnega dovoljenja, je postalo iskanje po strani precej težje. Reddit je namreč zaradi množičnega strganja vsebin s svoje spletne strani, ki so ga izvajali razvijalci umetne inteligence, to prepovedal. V praksi so to storili z vpisom v datoteko robots.txt, ki prepoveduje dostop vsem pajkom razen Googlovemu.

In tako se je primerilo, da vsi ostali iskalniki ne iščejo več po Redditu. Če jih tja izrecno napotite, denimo s predpono site:reddit.com, rezultatov skorajda ne bo. To je prizadelo Bing, DuckDuckGo, Brave in ostale iskalnike.

Datoteko robots.txt so posodobili 25. junija letos, potem ko so opazili povečano zbiranje vsebin, ki so ga izvajali komercialni ponudniki umetne inteligence. Reddit je zato v robots.txt blokiral vse te pajke. Hkrati dodaja, da si lahko kdorkoli ponovno pridobi dostop, če izpolni obrazec na spletu in obljubi, da se bo lepo vedel. Reddit dodatno pojasnjuje, da so se...

22 komentarjev

Funkcija Do Not Track v glavnem nekoristna

Slo-Tech - Funkcija Do Not Track (DNT), ki si jo je pred sedmimi leti izmislila Mozilla za prenos informacij do spletne strani, da obiskovalec ne želi sledenja, se obnese bolj klavrno. Čeprav študije kažejo, da jo uporablja približno četrtina uporabnikov interneta, je večina spletnih strani ne spoštuje.

Zamisel je idealistična in plemenita. Ko odkljukamo to možnost, sporočimo spletni strani, da ne želimo sledenja. Ta bi to morala spoštovati kot džentelmenski dogovor, čeprav je nihče ne more prisiliti v to. In tako večina strani najde izgovore, da tega ne spoštujejo. Najprej so bili problematični brskalniki, ki so privzeto vključili DNT, češ da to ne more odsevati volje uporabnika. Ko se je ta problem rešil, so se našli izgovori....

22 komentarjev

Sodišče EU: linkanje ne predstavlja kršitve avtorske pravice

Slo-Tech - Sodišče EU je včeraj potrdilo, da golo linkanje na avtorsko zaščitene vsebine ne predstavlja kršitve avtorske pravice, ter da torej zanj ni treba plačati. Klipping službe, razni Google Newsi, Twitterji in podobni so lahko malo bolj mirni.

Primer je C-466/12, Nils Svensson in drugi proti Retriever Sverige AB.

Svensson in drugi so novinarji časopisa Göteborgs-Posten, sicer enega bolj branih dnevnikov južnošvedske pokrajine Gotlandija. Retriever Sverige je spletni agregator, ki zbira drugje objavljene novinarske članke, PR najave in druge zanimive vesti, jih razvršča po temah, ter potem raznoraznim firmam in vladnim organizacijam prodaja kot klipping (oz. "business intelligence").

Novinarji so seveda hoteli svoj del te clipping pogače, trdeč, da Retriever uporablja (daje na voljo javnosti) njihove avtorske članke, saj vendar povezave do njih (plus kratek povzetek, kategorizacijo) prodaja svojim naročnikom. Za takšno zaslužkarsko uporabo avtorsko zaščitenih vsebin pa da je treba...

16 komentarjev

Google in Yahoo prepovedala pornografske bloge

ZDNet - Google je konec prejšnjega meseca uporabnike svoje storitve Blogger obvestil, da bo s 1.7. (tri dni kasneje) začel sankcionirati vse bloge s pornografsko vsebino, ki bodo imeli vključene oglase. Kdor bo najden, bo brez vprašanj izbrisan. Sporočilo je bilo torej jasno: če gostujete pornografske vsebine, ne smete služiti z oglasi, ker bi to utegnilo odgnati oglaševalce stran od Googlove platforme. In Google jih še kako rabi, ker jim prihodki več ne rastejo tako hitro kot nekoč, zato potrebuje ves posel, ki ga lahko dobi. Oglaševalci pa znajo biti izjemno občutljivi glede tega, s kakšno vsebino se jih povezuje. V Veliki Britaniji se jim denimo dogaja, da jih uporabniki...

7 komentarjev

Nizozemski študent zbral 15 milijonov elektronskih naslovov uporabnikov Googla

The Register - Nizozemski podiplomski študent Matthijs R. Koot piše doktorsko nalogo s področja zasebnosti na internetu in v okviru tega projekta je preiskal javno dostopne Googlove profile. Odkril je, da je 40 odstotkov profilov javnih, ki so poleg tega še shranjeni na strežnikih v tako prikladni obliki, da je zlahka pridobil 15 milijonov elektronskih naslovov uporabnikov in nekatere druge osebne podatke (poklic, delodajalca, izobrazba, kraj prebivališča in povezave do profilov na drugih socialnih straneh).

Na Googlovi strani je namreč imeniška datoteka profiles-sitemap.xml, ki imenuje povezave do profilov uporabnikov. Sodeč po podatkih v...

13 komentarjev

Kadar želite kaj skriti, bodite temeljiti

Slo-Tech - Kljub temu, da je na internetu ogromno informacij, ki bi jih človek nepovezane le stežka našel, se veliko teh informacij centralno arhivira na različnih iskalnikih, zato načeloma nimamo problemov, če želimo te razpršene informacije najti.

Problem pa nastopi, če kakšne informacije v iskalniku ni. Lastniki spletnih strani namreč lahko na svojem strežniku ustvarijo posebno datoteko z imenom robots.txt, v kateri določijo, do katerih spletnih mest naj iskalni roboti (programi, ki iščejo in arhivirajo spletne strani) ne dostopajo. Sicer se iskalni roboti teh navodil niso obvezani držati, vendar jih načeloma spoštujejo.

Drugo vprašanje je seveda, zakaj bi si kdo želel, da njegove spletne strani ali njenih delov ni v iskalniku. Administratorji spletnih strežnikov se za to možnost pogosto odločajo zato, ker ne želijo, da jim iskalni roboti prekomerno obremenjujejo strežnik, lahko pa si seveda želijo, da nekatere informacije ne bi bile preveč javno dostopne. To morda še bolj velja za...

7 komentarjev