» »

Kadar želite kaj skriti, bodite temeljiti

Kadar želite kaj skriti, bodite temeljiti

Slo-Tech - Kljub temu, da je na internetu ogromno informacij, ki bi jih človek nepovezane le stežka našel, se veliko teh informacij centralno arhivira na različnih iskalnikih, zato načeloma nimamo problemov, če želimo te razpršene informacije najti.

Problem pa nastopi, če kakšne informacije v iskalniku ni. Lastniki spletnih strani namreč lahko na svojem strežniku ustvarijo posebno datoteko z imenom robots.txt, v kateri določijo, do katerih spletnih mest naj iskalni roboti (programi, ki iščejo in arhivirajo spletne strani) ne dostopajo. Sicer se iskalni roboti teh navodil niso obvezani držati, vendar jih načeloma spoštujejo.

Drugo vprašanje je seveda, zakaj bi si kdo želel, da njegove spletne strani ali njenih delov ni v iskalniku. Administratorji spletnih strežnikov se za to možnost pogosto odločajo zato, ker ne želijo, da jim iskalni roboti prekomerno obremenjujejo strežnik, lahko pa si seveda želijo, da nekatere informacije ne bi bile preveč javno dostopne. To morda še bolj velja za različne spletne dokumente starejšega datuma, na katere je morda lastnik spletnega strežnika že malce pozabil. Ali pa je med tem morda celo objavil novejše dokumente v katerih trdi nekaj drugega, kot v starejših ... Seveda takšno "skrivanje" dokumentov ni ravno učinkovito, saj se vsi iskalniki ne držijo navodil v robots.txt. Dokumente je veliko bolje izbrisati.

Podobno so morda razmišljali v Beli hiši. Njihova datoteka robots.txt vsebuje kar 1.604 spletnih mest, za katere Georgie in prijatelji ne želijo, da se znajdejo v iskalnikih. Od tega pa - zanimivo - kar 46,5% oziroma 746 spletnih mest v URL-ju vsebuje besedico Iraq. Hkrati pa so bili administratorji Bele hiše še nekoliko bolj temeljiti in so večino - natančneje 745 od teh spletnih mest tudi izbrisali iz svojega strežnika. Od "prepovedanih" spletnih mest je dostopen samo še en sam samcat URL, ki pa ne vsebuje le nekaj naključnih znakov. Glede na to, da nekoliko bolj specializirano iskanje s pomočjo Googla na področju Bele hiše najde nekaj tisoč zadetkov (včeraj 1.810, danes 2.740), očitno Irak ni na splošno "prepovedana tema", pač pa želi Bela hiša skriti le nekatera spletna mesta. Od spletnih mest, ki v URL-ju vsebujejo besedico "iraq" jih je izbrisanih 99,9 %, od ostalih, ki ne vsebujejo besedice "iraq", pa jih je izbrisanih le 36,4%. Zanimivo, kajne?

Nerodno je tudi, da so bili pri "skrivanju" očitno tako nespretni, da so izbrisana spletna mesta pozabili odstraniti iz robots.txt in je tako ostala elektronska sled o njihovem obstoju.


Vsekakor pa bi bilo zanimivo videti vsebino odstranjenih spletnih mest in jo primerjati z novejšimi ameriškimi izjavami in dokumenti o Iraku ...

7 komentarjev

boom-bar ::

He he to z belo hišo je zakon
Legalizirajte mehke droge!!!

minmax ::

kaj drugega bi pa človek lahko od njih pričakoval? to da bodo povedal resnico in priznal da so lagal in zavajal tako svoje ljudstvo, kot druge države?

Mislim, da je busheva administracija zaigrala ves ugled, ki ga je bela hiša imela... zdaj imajo samo še moč, oziroma bolj natančno, preostane jim le še sila (pa ne tista iz star warsov). Ekonomska in vojaška.

Thomas ::

Spet polivanje žolča po Ameriki. Matr ste dolgocajtni ... |O
Man muss immer generalisieren - Carl Jacobi

mchaber ::

Zakaj je vir Slo-tech?

>...Bela hiša skriti le nekatera spletna mesta. Od spletnih mest, ki v URL-ju vsebujejo besedico "iraq" jih je izbrisanih 99,9%, od ostalih, ki ne vsebujejo besedice "iraq", pa jih je izbrisanih le 36,4%. Zanimivo, kajne?

Pač jim zmankuje prostora.:)
.

ferdo ::

Thomas, pišeš, kot da te je novica prizadela. Kaj pa imaš ti z Ameriko?

PS: ... zato, ker pišeš, da smo dolgočasni.

Thomas, vsak ima pravico do svobodnega izražanja, ti, jaz in VSI, preden pa napišeš, da smo dolgočasni, pa 3x premisli.

hvala lepa

minmax ::

thomas... mislim da je _selektivno_ brisanje že objavljenih podatkov zelo 'zanimiva' praksa, ki ji do sedaj nismo posvečali kake pozornosti. ... tak da si zasluži novičko in seveda pozornost novinarjev, ko bodo iskali za dokumenti...

če bi se kaj podobnega zgodilo v slo, bi imeli iz tega verjetno afero. ...

btw: si prebral 1984? (resno sprašujem...)

Thomas ::

Seveda da sem prebral 1984. To še pred manijo 1984, ki je izbruhnila okoli 1982. Od istega avtorje sem prebral še TRI druga dela. FYI. Pri nas afera? Hehe ... pri nas afera? Če bi vlada pustila en robot.txt gor na svojem sajtu? LOL!
Man muss immer generalisieren - Carl Jacobi


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Objavljanje strani v Google in Bing

Oddelek: Omrežja in internet
7875 (705) win64
»

Google ne najde moje spletne strani

Oddelek: Izdelava spletišč
275342 (4339) Vzdevek
»

Nemci predlagajo drugačno rešitev za časopisno industrijo: obdavčitev spletnih iskaln

Oddelek: Novice / Avtorsko pravo
2410722 (9063) Truga
»

Zakaj mi google ne najde strani?

Oddelek: Izdelava spletišč
225653 (4258) bluefish
»

Kadar želite kaj skriti, bodite temeljiti

Oddelek: Novice / Omrežja / internet
72250 (2250) minmax

Več podobnih tem