» »

Web scraping - legalnost ?

Web scraping - legalnost ?

l0g1t3ch ::

Torej ali je dejansko kaznivo če narediš program, ki dela web scraping ali te lahko lastnik strani samo civilno toži oz. ali te sploh na podli česa lahko toži ?

jype ::

Nič od tega.

l0g1t3ch ::

Torej tudi če na strani piše, da tega ne smeš delati,ti ne more nič razn, da blokira tvoj IP ?

Mesar ::

Lahko, lahko uporabiš proxye ali pa se drugače znajdeš.

Kaj boš parsal stari?

Jaz sem imel v planu celi eprostor.g0w:$i :D pol pa sem prišel do ugotovitve, da sem prelen, da grem za hobi to delat
Your turn to burn!

Zgodovina sprememb…

  • spremenil: Mesar ()

urosz ::

za osebno rabo sparsaš kar ti srce poželi. težave so seveda, če bi te podatke potem hotel uporabiti v svojo korist (beri: jih prodati naprimer)

Mesar ::

Pa vsej pri določenih stvareh je verjetno problem ponovno objavljanje. Like... jaz sparsam celu SloTech pa ga dam na novo domeno gor... pač prijava pa to nebi delalo content pa bi bil... samo tak nea upam, ker bi me modi rejpali.
Your turn to burn!

l0g1t3ch ::

V mojem primeru bi sparsane podatke uporabil za mnogo boljše iskanje in pa za naročanje na obvestila.
Poleg tega bi moja stran/aplikacija prikazovala samo osnovni pozetek za polno vsebino pa bi bil še vedno link na stran od kjer vse skupaj izvira.
Da seveda nebi zabasal izvornih strani bi sam izvedel tudi caching na svojem strežniku.

Na nekaj dohodka pa seveda računam iz naslova oglaševanja in mogoče minimalne naročnine za premium storitve.

Zgodovina sprememb…

  • spremenilo: l0g1t3ch ()

Mesar ::

Meta iskalnik torej... sort of :)

Ja če ti nebojo redno ipje banali si zmago ne..
Your turn to burn!

l0g1t3ch ::

Bolj me skrbi, da mi ne bodo redno spreminjali html-ja.

Mesar ::

manjše spremembe niso problem. No odvisno kako in s čim misliš parsat
Your turn to burn!

misek ::

Ko sem tudi sam periodično parsal eno spletno stran je trajalo samo nekaj dni, da so mi blokirali IP naslov. Tako da previdno s tem. Potrebno lepo počasi stran po stran.

Mavrik ::

Raje se pozanimaj kako je z avtorskimi pravicami - bi znali imeti avtorji tekstov kaj proti, če boš brez dovoljenja objavljal njihove stvari na svojem iskalniku.
The truth is rarely pure and never simple.

urosz ::

sicer pa ne rabiš parsat vsega na 1x in vnaprej.

"parsing on demand" ali kako naj se izrazim ;)

l0g1t3ch ::

Gre se za razne oglase tako, da tukaj pomoje ni težav z avtorskimi pravicami ali pač ?
Parsam on demand in vse rezultate dajem v cache za neki čas, da razbremenim strani zi katerih dol vlečem.

Mesar ::

To pa lahko greš raje kakšnega pravnika prašat.
Your turn to burn!

Mavrik ::

Gre se za razne oglase tako, da tukaj pomoje ni težav z avtorskimi pravicami ali pač ?


Po kakšni logiki pa ne bi bilo težav? A imaš dovoljenje za reprodukcijo? Glede na to, da te skrbi blokada, se mi zdi da ne, kar pomeni da se izpostavljaš morebitnim pravnim težavam če boš komu preveč na žulj stopo.
The truth is rarely pure and never simple.

BlueRunner ::

jype je izjavil:

Nič od tega.

Vse od tega, če se mu "sprdne" in, če mu lokalna zakonodaja to omogoča.

Če si majhna riba, potem pa stroški za zganjanje kaj takšnega preprečijo, da te bi kdo na ta način nadlegoval.

l0g1t3ch ::

Konkretno me zanima za slovenske spletne strani in slovensko zakonodajo.

urosz ::

saj res da je vprašanje legalnosti pa to, po drugi strani pa se vprašajmo: koliko ljudi so v Sloveniji že obsodili zaradi web scrapinga? :D

BlueRunner ::

l0g1t3ch je izjavil:

Konkretno me zanima za slovenske spletne strani in slovensko zakonodajo.

V Sloveniji te za sam scapring lahko toži samo teoretično, kot "povzročanje škode" ali "kršitev pogojev uporabe".

Samo teoretično, ker ga še ni bilo junaka, ki bi s takšno tožbo sploh poskušal. Glede na to, da je najdi.si dovolj velika tarča (tožiti hčerinsko podjetje TS za odškodnine bi tudi lahko bil dober poslovni model), pa ne vem, da bi ga že kdo bil tožil, je to v Sloveniji, za strani iz Slovenije non-issue.

Samo pazi, da ti ne bo pajek podivjal (delaj throttle, da preprečiš nenameren DoS), spoštuj robots.txt (recimo, da je to želja/dovoljenje upravitelja strani) in ne pobiraj vsebine, ki so dostopne samo registriranim in prijavljenim uporabnikom (registracija - pogoji uporabe - lahko se pojavi kakšen težak), pa si IMO varen.

IANAL.

BlueRunner ::

urosz je izjavil:

saj res da je vprašanje legalnosti pa to, po drugi strani pa se vprašajmo: koliko ljudi so v Sloveniji že obsodili zaradi web scrapinga? :D

0 in kolikor vem je bilo tudi 0 tožb. Glede na to, da se tudi "največje ribe" v državi, ki to počne, ne toži, ...

Lahko pa se izmislim nekaj scenarijev ki bi imeli možnost priti do sodne obravnave. Dvomim pa v uspeh takšnih tožb.

Recimo takšni hipotetični scenariji:
- ignoriraš robots.txt - ali je to potem morda k.d. po 221. čl. KZ-1 (Kdor podatke v informacijskem sistemu neupravičeno uporabi, spremeni, preslika, prenaša, ...).
- po nesreči povzročiš DoS - neposredno povzročena škoda lahko obstaja tudi brez k.d. Recimo, da jim nehote prevrneš strežnik zaradi česar utrpijo škodo zaradi dela, da se strežnik zavaruje in ponovno postavi. Potencalno bi lahko tudi to bila podlaga za k.d. po 221. čl. KZ-1 (... ali v informacijski sistem neupravičeno vnese kakšen podatek, ovira prenos podatkov ali delovanje informacijskega sistema, se kaznuje za zaporom do dveh let)
- dostopaš do podatkov, ki so sicer dostopni samo registriranim in prijavljenim podatkom - lahko kršiš kakšno določilo upravitelja, ki je bilo zapisano v "pogojih uporabe" s katerimi si se pri regitraciji verjetno strinjal. Odškodnine iz tega naslova verjetno ne bo, se boš pa znova srečal s famoznim 221. čl. KZ-1.
- podatke, ki si jih pobral, predstaviš naprej - to se bi dalo najti kaj v ZASP s čemer se te bi lahko stisnilo za goltanec.

Pa verjetno sem še kakšno stvar pozabil. Ampak ja. Če bi bil kdo resnično našpičen težak, bi ti verjetno lahko zagrenil življenje. Ampak potem se pojavi vprašanje uspeha takšnega početja, ker izida teh ovadb in tožb verjetno ne bi znal napovedati nihče.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Osmocom-TETRA (strani: 1 2 3 4 )

Oddelek: Loža
15045604 (7003) hipertija
»

Tudi v Sloveniji preizkušajo rudarjenje v brskalnikih (strani: 1 2 )

Oddelek: Novice / Kriptovalute
5622655 (17250) Unknown_001
»

Ali je "vstop" v IS, ki ni vdor, kazniv?

Oddelek: Informacijska varnost
437290 (6438) Kamran
»

EU pripravlja hujše kazni za hekerje

Oddelek: Novice / Varnost
2410228 (8621) poweroff
»

Zakonodaja glede pridobivanja podatkov iz javnih share-ov

Oddelek: Informacijska varnost
71058 (886) poweroff

Več podobnih tem