» »

Reddit blokiral Internet Archive

Reddit blokiral Internet Archive

The Verge - Reddit je sporočil, da bodo pajkom storitve Internet Archive onemogočili prebiranje podstrani, torej uporabniških sporočil, komentarjev in profilov. Dostopna bo le prva stran, torej bo Internet Archive v svoje arhive shranil le naslove novic in najpopularnejše teme. Razlog pa ni kakšna posebna antipatija do Internet Archiva, temveč spet boj proti nezakoniti uporabi strani za urjenje umetne inteligence.

Opazili so, da razvijalci umetne inteligence, ki že sedaj ne smejo in ne morejo brezplačno uporabljati Redditovih vsebin za trening svojih modelov, vsebine postrgajo iz Wayback Machina, ki ga upravlja Internet Archive. Redditov tiskovni predstavnik Tim Rathschmidt je dejal, da ni nobene potrebe, da bi bili v Wayback Machine shranjeni vsi pogovori na Redditu. Zato so že stopili v stik z Internet Archivom in jih obvestili, da bodo uvedli omejitve.

Reddit svoje vsebine podjetjem za razvoj umetne inteligence drago prodaja. Leta 2023 so uvedli plačljivi dostop, lani pa so od tega pridobili že 130 milijonov dolarjev prihodkov. Že pred tem so ukinili neodvisne dostope prek API, s čimer so umrli neodvisni odjemalci.

19 komentarjev

LeQuack ::

Reddit svoje vsebine podjetjem za razvoj umetne inteligence drago prodaja..


Naše vsebine.
Quack !

Glugy ::

Podjetja se obnašajo kot da si nas lastijo. Grdo.

_Denny_ ::

Razlog pa ni kakšna posebna antipatija do Internet Archiva, temveč spet boj proti nezakoniti uporabi strani za urjenje umetne inteligence.

Veš da. Vsak, ki je vsaj enkrat obiskal archive.org bo vedel, da je stvar grozno počasna že za browsanje brez slik, kaj šele za kak scrapping.

Razlog bo kar revizija zgodovine; do zdaj je bil kot dokaz za določene vsebine web archive in archive.today, po novem bo pa vse kar "se nikoli ni zgodilo" brisano oz. spremenjeno brez dokaza za edit. Na tej strani se že kakih 10 let zbira gnoj od gnoja, ki kar tako iz dolgčasa nadleguje ljudi zaradi napačnih mnenj ali pa jih celo spravi do samomora...podobno kot je bil nekoč 4chan, le za nasprotni politični pol. Zdaj brez neke revizijske sledi ali neodvisnega snapshota strani pač noben ne bo odgovarjal.
Asrock X670E Taichi, Ryzen 9 7950X3D + NH-D14, 96GB Corsair DDR5-6400 CL32
RTX 5080 16GB, 2TB Kingston KC3000, 2TB ADATA SX8200 Pro, 4TB Micron 5200
Seasonic Focus Plus 850W, Corsair Air 540, Logitech Z-2300, TCL 55C7K 144Hz

brbr21 ::

Glugy je izjavil:

Podjetja se obnašajo kot da si nas lastijo. Grdo.
A bejž no!? Neee!

Brezplačne storitve/aplikacije, ki stanejo debele milijone za obratovanje? Drobni tisk? Ne? Saj nimam kaj skrivati? Tudi ne?
Wake up, Little Suzy, Wake up!

aja pa tisti 'kot da' v tvojem stavku, kar izpusti.

c3p0 ::

"If the product is free, you are the product"

dreta ::

Kdaj s-t?
Vcasih imam obcutek, da isti kot furajo s-t furajo reddit.

borisk ::

Večina vsebine na Reditu ni nekaj na čemer bi želel trenirati LMM. bolj me zanima kako so naredili algoritem za filtracijo podatkov iz redita.

c3p0 ::

Če želiš woke LLM na PMSu, ki ga vodijo čustva, je čisto v redu.

paradajzos ::

Kako se kaj trži ST za iste namene?

Glugy ::

brbr21 je izjavil:

Glugy je izjavil:

Podjetja se obnašajo kot da si nas lastijo. Grdo.
A bejž no!? Neee!

Brezplačne storitve/aplikacije, ki stanejo debele milijone za obratovanje? Drobni tisk? Ne? Saj nimam kaj skrivati? Tudi ne?
Wake up, Little Suzy, Wake up!

aja pa tisti 'kot da' v tvojem stavku, kar izpusti.


Ne to je sam to da ovčke okol prneseš da se ne uprejo: aja sej mam zadevo zastonj torej imajo lahko mojo dušo. Nikol prej se niso podjetja tako lastnilila svoje stranke kot se jih zdej. Nikol. Pa tud prej niso delala zastonj pa tud prej so imela koristi od nas.

fujtajksel ::

_Denny_ je izjavil:

Razlog pa ni kakšna posebna antipatija do Internet Archiva, temveč spet boj proti nezakoniti uporabi strani za urjenje umetne inteligence.

Veš da. Vsak, ki je vsaj enkrat obiskal archive.org bo vedel, da je stvar grozno počasna že za browsanje brez slik, kaj šele za kak scrapping.
...


Mogoče je stvar grozno počasna ravno zaradi masovnega scrappinga za nevemkolk umetnih inteligenc.

eVro ::

Predvsem vidim, da bi razvajene novodobne AI firme rade že prednarejene in prečiščene snaphoste relevantnega dela interneta zastonj. Reddit pa seveda ne bi dal, kaj šele prečiščeno skozi IA. To "pripravljanje podatkov" bi oni "partnerjem" mastno računali. Pa vsak klic API, in podobno.

V resnici pa bi moral biti Reddit že zdavnaj pod zakonom, da so tako veliki in družbeno vplivni, da se pač vsakih privatnih jajc, ki jim padejo na pamet, ne smejo iti. Sam bi takim res velikim dal posebej močno, in sicer da so dolžni počakati na regulacijo ob vsaki novosti, do takrat pa se jo smejo iti samo v omejenem obsegu. Vem, da bi jih to fajn tolklo po prstih, saj to je poanta.

Revidiranje zgodovine pa se mi v tej rundi zdi samo stranski produkt. Ga ni za zanikati in upam, da se kmalu pojavi community-driven add-on za popularne brskalnike, ki med brskanjem uporabnikov scrapa še za IA. Ali kaj podobnega. Trenutno vodstvo Reddita niso ne prvi ne zadnji privatni dripci v zgodovini, ki mislijo, da lahko urejajo internet. Če smo razložili zadeve glasbeni in filmski industriji, bomo pa še tem mozoljavcem.

Na koncu je pa res tudi, da se vedno manj splača strgati tam dol.

Furbo ::

Opazili so, da razvijalci umetne inteligence, ki že sedaj ne smejo in ne morejo brezplačno uporabljati Redditovih vsebin za trening svojih modelov

Samo v tem je problem, za legalnost jih briga.
i5-13600K, Noctua NH-D15, STRIX Z790-F, 32GB DDR5, 2TB Samsung 990PRO,
Toughpower GF3 1000W, RTX3070, ALIENWARE AW3423DWF, Dell S2722QC

FastWIND ::

Wayback - je lahko precej uporaben v kolikor nekdo trdi da nekaj ni bilo ovbjavljeno na spletni strani...

_Denny_ ::

fujtajksel je izjavil:

_Denny_ je izjavil:

Razlog pa ni kakšna posebna antipatija do Internet Archiva, temveč spet boj proti nezakoniti uporabi strani za urjenje umetne inteligence.

Veš da. Vsak, ki je vsaj enkrat obiskal archive.org bo vedel, da je stvar grozno počasna že za browsanje brez slik, kaj šele za kak scrapping.
...


Mogoče je stvar grozno počasna ravno zaradi masovnega scrappinga za nevemkolk umetnih inteligenc.

Vse skupaj je bilo že polžje počasno v časih, ko sta še bila še blockchain in cloud glavna buzzworda dneva oz. še pred 2010...ker gre za brezplačen volonterski projekt se seveda ne smemo pritoževati.

Poleg tega se mi zdi, da se nenehno spreminjajoče strani tipa Reddit, Twitter, itd. sploh ne shranjujejo samodejno 24/7, pač pa samo na zahtevo; določeni bedaki imajo nastavljeno avtomatsko brisanje čisto vseh tem, ko dosežejo 1000 upvotov, da se slučajno ne bi pojavile na r/all in do zdaj jih še nisem našel v nobenih arhivih razen Google cacha dokler nam ga niso vzeli. Še Reveddit in Unddit, strani narejeni samo za Reddit, nista bili sposobni arhivirati čisto vsega, ker se prehitro ustvarja, editira in briše.
Asrock X670E Taichi, Ryzen 9 7950X3D + NH-D14, 96GB Corsair DDR5-6400 CL32
RTX 5080 16GB, 2TB Kingston KC3000, 2TB ADATA SX8200 Pro, 4TB Micron 5200
Seasonic Focus Plus 850W, Corsair Air 540, Logitech Z-2300, TCL 55C7K 144Hz

skumpl ::

Jaz ne vidim nič spornega. Reddit ima vso pravico blokirati IA pajke.

Pithlit ::

skumpl je izjavil:

Jaz ne vidim nič spornega. Reddit ima vso pravico blokirati IA pajke.

Tko kot ima pravico tržit User generated content taistim pajkom?
Life is as complicated as we make it...

sealcradle ::

Pithlit je izjavil:

skumpl je izjavil:

Jaz ne vidim nič spornega. Reddit ima vso pravico blokirati IA pajke.

Tko kot ima pravico tržit User generated content taistim pajkom?

Ja, tocno tako.

twom ::

Jaz vidim večji problem v tem, da gre vse na naročnine, vključno z ogrevanimi sedeži v avtih, ne samo aplikacije in streamingi.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Reddit blokiral Internet Archive

Oddelek: Novice / Omrežja / internet
192022 (588) twom
»

Za MJU je arhiv spletnih strani preprosto Wayback Machine

Oddelek: Novice / Ostale najave
273858 (894) MrStein
»

Internet Archive bo ohranil starejše igre in animacije v Flashu

Oddelek: Novice / Ostala programska oprema
94130 (2862) FTad
»

Internet Archive rešil 9 milijonov povezav na Wikipediji

Oddelek: Novice / Omrežja / internet
55119 (3950) dice7
»

ček dis aut! (hudo)

Oddelek: Loža
72158 (1794) milosm

Več podobnih tem