Forum » Programiranje » Web scraping - legalnost ?
Web scraping - legalnost ?
l0g1t3ch ::
Torej ali je dejansko kaznivo če narediš program, ki dela web scraping ali te lahko lastnik strani samo civilno toži oz. ali te sploh na podli česa lahko toži ?
l0g1t3ch ::
Torej tudi če na strani piše, da tega ne smeš delati,ti ne more nič razn, da blokira tvoj IP ?
Mesar ::
Lahko, lahko uporabiš proxye ali pa se drugače znajdeš.
Kaj boš parsal stari?
Jaz sem imel v planu celi eprostor.g0w:$i pol pa sem prišel do ugotovitve, da sem prelen, da grem za hobi to delat
Kaj boš parsal stari?
Jaz sem imel v planu celi eprostor.g0w:$i pol pa sem prišel do ugotovitve, da sem prelen, da grem za hobi to delat
Your turn to burn!
Zgodovina sprememb…
- spremenil: Mesar ()
urosz ::
za osebno rabo sparsaš kar ti srce poželi. težave so seveda, če bi te podatke potem hotel uporabiti v svojo korist (beri: jih prodati naprimer)
Mesar ::
Pa vsej pri določenih stvareh je verjetno problem ponovno objavljanje. Like... jaz sparsam celu SloTech pa ga dam na novo domeno gor... pač prijava pa to nebi delalo content pa bi bil... samo tak nea upam, ker bi me modi rejpali.
Your turn to burn!
l0g1t3ch ::
V mojem primeru bi sparsane podatke uporabil za mnogo boljše iskanje in pa za naročanje na obvestila.
Poleg tega bi moja stran/aplikacija prikazovala samo osnovni pozetek za polno vsebino pa bi bil še vedno link na stran od kjer vse skupaj izvira.
Da seveda nebi zabasal izvornih strani bi sam izvedel tudi caching na svojem strežniku.
Na nekaj dohodka pa seveda računam iz naslova oglaševanja in mogoče minimalne naročnine za premium storitve.
Poleg tega bi moja stran/aplikacija prikazovala samo osnovni pozetek za polno vsebino pa bi bil še vedno link na stran od kjer vse skupaj izvira.
Da seveda nebi zabasal izvornih strani bi sam izvedel tudi caching na svojem strežniku.
Na nekaj dohodka pa seveda računam iz naslova oglaševanja in mogoče minimalne naročnine za premium storitve.
Zgodovina sprememb…
- spremenilo: l0g1t3ch ()
Mesar ::
Meta iskalnik torej... sort of
Ja če ti nebojo redno ipje banali si zmago ne..
Ja če ti nebojo redno ipje banali si zmago ne..
Your turn to burn!
misek ::
Ko sem tudi sam periodično parsal eno spletno stran je trajalo samo nekaj dni, da so mi blokirali IP naslov. Tako da previdno s tem. Potrebno lepo počasi stran po stran.
Mavrik ::
Raje se pozanimaj kako je z avtorskimi pravicami - bi znali imeti avtorji tekstov kaj proti, če boš brez dovoljenja objavljal njihove stvari na svojem iskalniku.
The truth is rarely pure and never simple.
urosz ::
sicer pa ne rabiš parsat vsega na 1x in vnaprej.
"parsing on demand" ali kako naj se izrazim ;)
"parsing on demand" ali kako naj se izrazim ;)
l0g1t3ch ::
Gre se za razne oglase tako, da tukaj pomoje ni težav z avtorskimi pravicami ali pač ?
Parsam on demand in vse rezultate dajem v cache za neki čas, da razbremenim strani zi katerih dol vlečem.
Parsam on demand in vse rezultate dajem v cache za neki čas, da razbremenim strani zi katerih dol vlečem.
Mavrik ::
Gre se za razne oglase tako, da tukaj pomoje ni težav z avtorskimi pravicami ali pač ?
Po kakšni logiki pa ne bi bilo težav? A imaš dovoljenje za reprodukcijo? Glede na to, da te skrbi blokada, se mi zdi da ne, kar pomeni da se izpostavljaš morebitnim pravnim težavam če boš komu preveč na žulj stopo.
The truth is rarely pure and never simple.
BlueRunner ::
urosz ::
saj res da je vprašanje legalnosti pa to, po drugi strani pa se vprašajmo: koliko ljudi so v Sloveniji že obsodili zaradi web scrapinga? :D
BlueRunner ::
Konkretno me zanima za slovenske spletne strani in slovensko zakonodajo.
V Sloveniji te za sam scapring lahko toži samo teoretično, kot "povzročanje škode" ali "kršitev pogojev uporabe".
Samo teoretično, ker ga še ni bilo junaka, ki bi s takšno tožbo sploh poskušal. Glede na to, da je najdi.si dovolj velika tarča (tožiti hčerinsko podjetje TS za odškodnine bi tudi lahko bil dober poslovni model), pa ne vem, da bi ga že kdo bil tožil, je to v Sloveniji, za strani iz Slovenije non-issue.
Samo pazi, da ti ne bo pajek podivjal (delaj throttle, da preprečiš nenameren DoS), spoštuj robots.txt (recimo, da je to želja/dovoljenje upravitelja strani) in ne pobiraj vsebine, ki so dostopne samo registriranim in prijavljenim uporabnikom (registracija - pogoji uporabe - lahko se pojavi kakšen težak), pa si IMO varen.
IANAL.
BlueRunner ::
saj res da je vprašanje legalnosti pa to, po drugi strani pa se vprašajmo: koliko ljudi so v Sloveniji že obsodili zaradi web scrapinga? :D
0 in kolikor vem je bilo tudi 0 tožb. Glede na to, da se tudi "največje ribe" v državi, ki to počne, ne toži, ...
Lahko pa se izmislim nekaj scenarijev ki bi imeli možnost priti do sodne obravnave. Dvomim pa v uspeh takšnih tožb.
Recimo takšni hipotetični scenariji:
- ignoriraš robots.txt - ali je to potem morda k.d. po 221. čl. KZ-1 (Kdor podatke v informacijskem sistemu neupravičeno uporabi, spremeni, preslika, prenaša, ...).
- po nesreči povzročiš DoS - neposredno povzročena škoda lahko obstaja tudi brez k.d. Recimo, da jim nehote prevrneš strežnik zaradi česar utrpijo škodo zaradi dela, da se strežnik zavaruje in ponovno postavi. Potencalno bi lahko tudi to bila podlaga za k.d. po 221. čl. KZ-1 (... ali v informacijski sistem neupravičeno vnese kakšen podatek, ovira prenos podatkov ali delovanje informacijskega sistema, se kaznuje za zaporom do dveh let)
- dostopaš do podatkov, ki so sicer dostopni samo registriranim in prijavljenim podatkom - lahko kršiš kakšno določilo upravitelja, ki je bilo zapisano v "pogojih uporabe" s katerimi si se pri regitraciji verjetno strinjal. Odškodnine iz tega naslova verjetno ne bo, se boš pa znova srečal s famoznim 221. čl. KZ-1.
- podatke, ki si jih pobral, predstaviš naprej - to se bi dalo najti kaj v ZASP s čemer se te bi lahko stisnilo za goltanec.
Pa verjetno sem še kakšno stvar pozabil. Ampak ja. Če bi bil kdo resnično našpičen težak, bi ti verjetno lahko zagrenil življenje. Ampak potem se pojavi vprašanje uspeha takšnega početja, ker izida teh ovadb in tožb verjetno ne bi znal napovedati nihče.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Osmocom-TETRA (strani: 1 2 3 4 )Oddelek: Loža | 45648 (7047) | hipertija |
» | Tudi v Sloveniji preizkušajo rudarjenje v brskalnikih (strani: 1 2 )Oddelek: Novice / Kriptovalute | 22675 (17270) | Unknown_001 |
» | Ali je "vstop" v IS, ki ni vdor, kazniv?Oddelek: Informacijska varnost | 7295 (6443) | Kamran |
» | EU pripravlja hujše kazni za hekerjeOddelek: Novice / Varnost | 10231 (8624) | poweroff |
» | Zakonodaja glede pridobivanja podatkov iz javnih share-ovOddelek: Informacijska varnost | 1059 (887) | poweroff |