» »

Kolektivna tožba zoper Microsoft zaradi piratstva

Kolektivna tožba zoper Microsoft zaradi piratstva

Slo-Tech - Microsoft je lani predstavil orodje, ki se je v teoriji zdelo kot nalašč za programerje, saj bi jim lahko prihranilo obilico časa in truda. Github Copilot je pomočnik v obliki umetne inteligence, ki so ga razvili skupaj z GitHubom in OpenAI. Piscem v Pythonu, JavaScriptu, TypeScriptu, Rubyju in Goju pomaga tako, da piše delce kode samostojno, saj je bil prebral vso kodo v javnih repozitorijih na GitHubu in se naučil programirati. V teoriji se to sliši čudovito, v praksi pa ljudje niso najbolj navdušeni, če njihovo avtorsko delo uporabljajo drugo, pri čemer jih niti nič ne vprašajo.

Zato je Github Copilot že od začetka tarča kritik, ki so se še okrepile junija letos, ko je postal komercialno dostopen vsakomur, ki plača 10 dolarjev mesečno. Zaradi tega je bila minuli teden proti Microsoftu, OpenAI in Githubu vložena kolektivna tožba, ki jo vodi Matthew Butterick. V njej Microsoftu očitajo, da nezakonito uporablja odprtokodno programsko opremo, ki je objavljena pod različnimi licencami (MIT, GPL, Apache in druge).

Izid tožbe bo vsekakor izjemno zanimiv in poučen, saj bo ponudil odgovore na nova vprašanja. Če ljudje uporabljajo kodo, ki je dostopna pod odprtokodnimi licencami, mora biti izdelek izdan pod licenco, ki jo dovoljuje licenca za tisti del kode (včasih mora biti enaka, včasih ne). Če pa se je umetna inteligenca naučila iz vseh teh vrstic kode, katere licence potem veljajo za njene izdelke? Po drugi strani pa se tudi ljudje učijo tako, da berejo in študirajo izdelke drugih, ki pa jih seveda ne kopirajo dobesedno.

26 komentarjev

Apple ::

Ko lovec postane plen :)
LP, Apple

l0g1t3ch ::

Karma :)

matobeli ::

win-win

za AI.

l0g1t3ch ::

Torej študenti ki C/P-ja kodo od sošolcev z bežnim razumevanjem kaj zares dela so tudi AI ? :))

fikus_ ::

Je razlika, sošolec ima malo denarja, MS ga ima neprimerno več.
Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.

matobeli ::

l0g1t3ch je izjavil:

so tudi AI ? :))

PLC :))

Mr.B ::

Kot kaže je AI prdrag, kot nadomestek monotonega dela.
No v bistvu se moram popraviti, ker biti script kiddie je v bistvu monotono, ne kreativno delo.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

P4ajo ::

Če pa se je umetna inteligenca naučila iz vseh teh vrstic kode, katere licence potem veljajo za njene izdelke? Po drugi strani pa se tudi ljudje učijo tako, da berejo in študirajo izdelke drugih, ki pa jih seveda ne kopirajo dobesedno.

Če naj bo "AI" subjekt, ki bi mu lahko pripisali neko "samostojnost", ki omogoča avtorstvo ali sploh kakršno koli obliko lastninjenja (da lahko torej funkcijo "črne škatle", ki iz vhodnih podatkov proizvaja izhodne podatke, pojmujemo kot "ne-kopiranje" oziroma "lastno delo"), bi ga morali naprej opredmetit in tako zamejit ("definirat"). Kaj je "on(o/a)", kje se "nahaja", ima materialni obstoj, ali je duša, kako sta povezana, nas razume...? Prej ali slej pridemo do vprašanja, "Ali mi razumemo nj-ega/o?", ne v smislu delovanja, torej ne to, da iz nekih vzhodnih podatkov ustvarja takšne izhodne in kako to počne (čeprav niti tega ne vemo)... torej ne kot črno škatlo ampak kot subjekt. Odgovor je ne, ravno zaradi tega, ker subjekt po definiciji ni črna škatla, ker subjekt lahko razumemo od znotraj, ali imamo vsaj svobodno (ne v smislu izbire, ampak volje) prepričanje (in zato ne iluzijo, tudi ko se motimo), da ga razumemo.
Subjekt je lahko subjekt zgolj med drugimi subjekti, s katerimi si medsebojno pripoznajo njihovo subjektivnost. Solipsistični subjekt je paradoks, ki ga ni še noben človek ali drugi subjekt živel, ne glede na prepričanja ali misli, ki jih imajo lahko nekateri glede solipsizma in čeprav nimamo neposrednega dostopa do misli nikogar drugega, imamo pa sposobnost vživljanja.
Ravno sposobnost vživljanja v drugega (kjer seveda ni nobene "božanske ?G povezave" in so napačna razumevanja del vsakdana) je temelj njegove subjektivitete za nas in obratno. Obratno je potrebno, ker je zadeva po definiciji vzajemna in ker poosebitev nobenega objekta niti ni mogoča, brez da bi pojem subjekta že bil dan - od drugih subjektov... Mogoče so primeri, ko bi tudi o kakšen odnosu med specifično živaljo in človekom lahko pojmovali kot odnos med dvema medsebojno pripoznanima subjektoma, zelo težko pa si kaj takega predstavljam za neko strogo funkcijsko nevronsko mrežo, oziroma kaj takega ni mogoče.
Ne bom pa trdil, da je po definiciji nemogoče, da bi kdaj obstajala umetna inteligenca, ki bi jo lahko pojmovali kot subjekt (gre se predvsem za problem črne škatle in vživetja v njo), ampak to ni to.
Ker tak AI ni subjekt, tudi nima "pravic", ki izhajajo iz tega, da bi torej njegovo funkcijo iz inputa v output pojmovali kot samostojno delo, ki ni "mehansko" mešanje/kopiranje. Saj ljudje tudi delamo "mehansko" (malo drugače, a vseeno "mehansko") mešanje in kopiranje, ampak to lahko pojmujemo kot lastno delo, ker imamo pravice "subjekta".
Je pa tudi tako, da naša subjektivnost je subjektivnost za nas... neki potencialni vesoljci je morda ne bodo prepoznali kot take, itd...
Sem (premalo) pameten, resno.

Zgodovina sprememb…

  • spremenil: P4ajo ()

Zimonem ::

Mit pa Apache licence niso sporne. Gpl pač. Ai tukaj nima kaj dosti veze zgolj licenca.

P4ajo ::

Zimonem je izjavil:

Mit pa Apache licence niso sporne. Gpl pač. Ai tukaj nima kaj dosti veze zgolj licenca.
AI je bistven, ker ljudje se imamo pravico učit tudi na GPL kodi in potem drugje pisat zaprto kodo (ki ni kopija), tukaj AI počne navidez (I/O) enako.
Sem (premalo) pameten, resno.

link_up ::

kristus, zihr ste eni tistih, ki v vsak header tlacite avtorja...
In and Out

Zimonem ::

P4ajo je izjavil:

Zimonem je izjavil:

Mit pa Apache licence niso sporne. Gpl pač. Ai tukaj nima kaj dosti veze zgolj licenca.
AI je bistven, ker ljudje se imamo pravico učit tudi na GPL kodi in potem drugje pisat zaprto kodo (ki ni kopija), tukaj AI počne navidez (I/O) enako.

Kar ni problem. To je tako nekako kot si nebo smel videti monalizo ali sosedovega pa ki je licenciran po gpl. Potem ga pa ne sme narisat.

P4ajo ::

Zimonem je izjavil:

Kar ni problem. To je tako nekako kot si nebo smel videti monalizo ali sosedovega pa ki je licenciran po gpl. Potem ga pa ne sme narisat.
Ampak on tu ne riše sosedovega psa ali monalize, ampak neke tretje pse in portrete... morda mu lahko očitaš, da ti je nasmešek kakega portreta nekam čudno znan in da je ima pes na sliki podobne uhlje, ampak spet... tako delujemo tudi ljudje.
Sem (premalo) pameten, resno.

c3p0 ::

Saj ne bo problema, pri vsaki kodi bo na koncu v komentarju naveden vir, licenca in potem boš lahko potrdil, ali zavrnil.

V settingih morda celo dal pogoj, da zahtevaš le GPLv3 ali Apache license kodo. Code monkey's job just got easier.

XIIT ::

"I give no sources because it is indifferent to me whether what I have coded has already been coded by another before me."



c3p0 je izjavil:

Saj ne bo problema, pri vsaki kodi bo na koncu v komentarju naveden vir, licenca in potem boš lahko potrdil, ali zavrnil.

V settingih morda celo dal pogoj, da zahtevaš le GPLv3 ali Apache license kodo. Code monkey's job just got easier.


AI naj spiše posamezne elemente/funkcije, ti pa potem samo sklikaš kar rabiš. 4 hour work week, code monkey's dreams.
"Only physical beauty is the foundation for a true higher culture of
the mind and spirit as well. Only sun and steel will show you the path."
Beauty is absolutely terrifying to people because it highlights what is ugly.

Zgodovina sprememb…

  • spremenilo: XIIT ()

Irbis ::

Zna pa tale tožba, če bo uspešna, zaplesti še kaj drugega, na primer strojno prevajanje, ker bo tudi tam treba potem preverjati licenco za vsako besedilo v učnem korpusu.

LightBit ::

Zimonem je izjavil:

Mit pa Apache licence niso sporne. Gpl pač. Ai tukaj nima kaj dosti veze zgolj licenca.

Pravzaprav so tudi načeloma lahko sporne.
Samo "public domain", WTFPL, Unlicense, CC0, 0BSD in podobne so varne, ker ne zahtevajo da jih moraš zraven dati.

Zahteve Apache licence so precej jasne in nadležne:

4. Redistribution. You may reproduce and distribute copies of the Work or Derivative Works thereof in any medium, with or without modifications, and in Source or Object form, provided that You meet the following conditions:

a. You must give any other recipients of the Work or Derivative Works a copy of this License; and

b. You must cause any modified files to carry prominent notices stating that You changed the files; and

d. You must retain, in the Source form of any Derivative Works that You distribute, all copyright, patent, trademark, and attribution notices from the Source form of the Work, excluding those notices that do not pertain to any part of the Derivative Works; and

If the Work includes a "NOTICE" text file as part of its distribution, then any Derivative Works that You distribute must include a readable copy of the attribution notices contained within such NOTICE file, excluding those notices that do not pertain to any part of the Derivative Works, in at least one of the following places: within a NOTICE text file distributed as part of the Derivative Works; within the Source form or documentation, if provided along with the Derivative Works; or, within a display generated by the Derivative Works, if and wherever such third-party notices normally appear. The contents of the NOTICE file are for informational purposes only and do not modify the License. You may add Your own attribution notices within Derivative Works that You distribute, alongside or as an addendum to the NOTICE text from the Work, provided that such additional attribution notices cannot be construed as modifying the License.

You may add Your own copyright statement to Your modifications and may provide additional or different license terms and conditions for use, reproduction, or distribution of Your modifications, or for any such Derivative Works as a whole, provided Your use, reproduction, and distribution of the Work otherwise complies with the conditions stated in this License.

TESKAn ::

Sej je simpl, če se 'ai' uči iz kode x, mora upoštevat licenco kode x.
Drugače pa naj zagotovi da generirana koda nikjer ne bo enaka prebrani. In s tem ne mislim 'dodaj komentar na konec vsake vrstice in preimenuj lokalne spremenljivke'.
Uf! Uf! Je rekel Vinetou in se skril za skalo,
ki jo je prav v ta namen nosil s seboj.

matobeli ::

TESKAn je izjavil:

Sej je simpl, če se 'ai' uči iz kode x, mora upoštevat licenco kode x.


Ponavadi piše v licenci oziroma zakonodaji pod kakšnimi pogoji spada koda ali del kode (oziroma avtorsko delo) pod licenco.
Ni popolnoma nič simpl stvari ko pride do licenciranja

XIIT ::

TESKAn je izjavil:

Sej je simpl, če se 'ai' uči iz kode x, mora upoštevat licenco kode x.

Če si jaz pogledam nek del wordpressove kode, dobim navdih in podobno strukturo kode uporabim pri svojem projektu, moram svoj projekt izdati pod GNU GPL?
Kaj pa če ga 'prebere' AI, pa dobi podobno inspiracijo?

Bo OK če 'for' zanko nadomestim z 'while' ali 'if then' solato?

TESKAn je izjavil:

Drugače pa naj zagotovi da generirana koda nikjer ne bo enaka prebrani. In s tem ne mislim 'dodaj komentar na konec vsake vrstice in preimenuj lokalne spremenljivke'.

Če že kaj, naj dovolj velik del kode ne bo enak prebrani.

Kaj pa pri standardnih primerih?
Recimo kalkulator s funkcijo
addition () {
sum = a + b;
return sum;
}

Potem jaz (pri AI assisted programiranju) tega ne smem uporabiti v svojem projektu? Moram poiskati daljšo pot "okoli riti v žep" -- npr. sum = 0.5(2a+2(sqrt(b*b)?
Moram googlat če je že kdo kdaj pred mano prišel do enake ideje in izdal pod kakšno licenco? Kaj če se je iste rešitve še pred njim nekdo domislil, pa tega ni objavil v javnem repozitoriju?



Kako enostavno obiti te zahteve?
Narediš ekstra repozitorij(e) za kodo pod različnimi licencami, v svoj repozitorij dodaš link do compilera ter navodila za compilanje, pa si uporabnik sam scompila.

Če bo problem da uporabnikom daješ navodila, s katerimi kršijo licenco, lahko zapišeš opozorilo "pozor, pri compilanju nikakor ne smete uporabiti *komanda, ki v compilanje vključi licencirano kodo* ker s tem kršite žnj licenco"
"Only physical beauty is the foundation for a true higher culture of
the mind and spirit as well. Only sun and steel will show you the path."
Beauty is absolutely terrifying to people because it highlights what is ugly.

Zgodovina sprememb…

  • spremenilo: XIIT ()

AtaŠtumf ::

Tole je zelo zanimivo vprašanje in tudi marsikdo tukaj postavlja ima zanimive komentarje, ki so več ali manj popolnoma točni.

Je pa še vedno dobro vprašanje, ali je imel MS dovoljenje, da je uporabil kodo uporabnikov za učenje ML?

Da/Ne?

Glede tega učenja ML se čedalje več pojavljajo vprašanja, kako je z licencami in kdo je lastnik novega dela, ki temelji na delu prejšnjih ljudi.

Kompleksno vprašanje, ki zahteva konkretno debato.
#SlovenijaPrva #SLOVEenianLivesMatter #SlavaGasilcem

Zgodovina sprememb…

LightBit ::

@XIIT ti itak lahko napišeš enako kodo kot nekdo drug (brez da bi jo videl). Tudi če skopiraš del kode in jo malo refactoriraš bodo težko dokazali da si to naredil.
Problem je to da se ve da ta AI to dela (ljudje tudi to delamo, se učimo na tuji kodi in kopiramo). Kar se mene tiče so avtorske pravice precej nadležne.
Privoščim pa Microsoftu tole tožbo ker so zagrizeni zagovorniki tega. Sam običajno uporabim 0BSD licenco.

mepako ::

ja, ampak kaj je ločnica med navedbo vira in inspiracijo, ki je ni potrebno navajati. Vsak kreativnež priznava, da je navdih za svoje delo dobil od nekoga ali nekaj, kar je že prej videl, poslušal, vohal, okušal. Bi moral navajati vse te zadeve in jih psihoanalizirati? Pomojem ne. Ima ai storitev sploh možnost, da preveri, kaj vse mixa med sabo ali je to le black box?

Res je, da se nekateri želijo precej poceni okoristiti z delom drugih, ki ga samo malo predrugačijo, dokazovanje takih stvari pa je drago. Vendar pa prava inovativnost izvira iz pravih problemov oziroma potreb, in za reševanje teh izzivov želimo novosti prototipirati čim hitreje in čim ceneje. Patenti in zaščite upočasnjujejo razvoj, veliko je nagajaja, nekateri od tega dobro živijo.

Domnevam, da bo čez par let ustvarjanje filmov, programov in izdelkov potekalo samo z režiserji oziroma vizionarji. Njihove misli bo ai spremenil v besede, slike, filme in izdelke. Inženirji, oblikovalci oziroma obrtniki, bodo postali to, kar so v času industrijske revolucije postali delavci, ki jim je delo prevzel parni stroj.

Vse skupaj bo pozitivno vplivalo na produkcijo. Morda bodo končno vsi lahko uresničili svoje ideje, brez da bi potrebovali znanje in veščine. Izdelkov in storitev bo še več. Ni nujno da bodo vse rešitve dobre.

Vprašanje je, kje bo ozko grlo. Bodo to surovine, okolje, denar, domišljija, pohlep, goljufije? Bomo gradili digitalne svetove, preden jih materializiramo? Matrica, Skynet, Westworld... Morda pa pride digitalna corona in nam uniči digitalno infrastrukturo?

LightBit ::

mepako je izjavil:

ja, ampak kaj je ločnica med navedbo vira in inspiracijo, ki je ni potrebno navajati.

Stvar interpretacije sodnikov.

TESKAn ::

XIIT je izjavil:

TESKAn je izjavil:

Sej je simpl, če se 'ai' uči iz kode x, mora upoštevat licenco kode x.

Če si jaz pogledam nek del wordpressove kode, dobim navdih in podobno strukturo kode uporabim pri svojem projektu, moram svoj projekt izdati pod GNU GPL?
Kaj pa če ga 'prebere' AI, pa dobi podobno inspiracijo?

Bo OK če 'for' zanko nadomestim z 'while' ali 'if then' solato?

TESKAn je izjavil:

Drugače pa naj zagotovi da generirana koda nikjer ne bo enaka prebrani. In s tem ne mislim 'dodaj komentar na konec vsake vrstice in preimenuj lokalne spremenljivke'.

Če že kaj, naj dovolj velik del kode ne bo enak prebrani.

Kaj pa pri standardnih primerih?
Recimo kalkulator s funkcijo
addition () {
sum = a + b;
return sum;
}

Potem jaz (pri AI assisted programiranju) tega ne smem uporabiti v svojem projektu? Moram poiskati daljšo pot "okoli riti v žep" -- npr. sum = 0.5(2a+2(sqrt(b*b)?
Moram googlat če je že kdo kdaj pred mano prišel do enake ideje in izdal pod kakšno licenco? Kaj če se je iste rešitve še pred njim nekdo domislil, pa tega ni objavil v javnem repozitoriju?



Kako enostavno obiti te zahteve?
Narediš ekstra repozitorij(e) za kodo pod različnimi licencami, v svoj repozitorij dodaš link do compilera ter navodila za compilanje, pa si uporabnik sam scompila.

Če bo problem da uporabnikom daješ navodila, s katerimi kršijo licenco, lahko zapišeš opozorilo "pozor, pri compilanju nikakor ne smete uporabiti *komanda, ki v compilanje vključi licencirano kodo* ker s tem kršite žnj licenco"

Podobno strukturo, ne pa c/p.
Na koncu če narediš cp oken, ne bo problema, če te ms ne bo tožil. Če te skrbi, pač ne delaš cp kode in je. Tudi za ta ai, če nočeš da te tožijo boš pogledal v repozitorij kakšno licenco ima in jo upošteval. Te tožijo, jim lepo poveš da uporabljaš samo kodo z xyz licenco, ki ti dovoljuje da delaš s kodo karkoli in nisi k ničemur zavezan, pa je. Če je pa tvoj ai projekt tolk odvisen od točno določene kode pod gplx licenco, ki je ti nočeš...hja, potem pa krši licenco in sprejmi posledice.
Uf! Uf! Je rekel Vinetou in se skril za skalo,
ki jo je prav v ta namen nosil s seboj.

BigWhale ::

Ali je razlika, ce clovek pogleda neko kodo in potem napise nekaj podobnega, ali pa ce to naredi nek algoritem? Morda.

Clovek to naredi v X dnevih ali pa celo tednih, AI naredi v nekaj sekundah. Veckrat zapored, vsakic znova in znova.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Oddelek: Novice / Znanost in tehnologija
95627 (4815) mepako
»

Kaj uporabljate oz. priporocate za code review?

Oddelek: Programiranje
172107 (1048) showsover
»

Apache gre na GitHub

Oddelek: Novice / Ostale najave
336354 (3781) Ales
»

Evropska komisija dovolila Microsoftov prevzem Githuba

Oddelek: Novice / Nakupi / združitve / propadi
4410051 (7617) Ales
»

Kaj programirati?

Oddelek: Programiranje
387090 (4575) brodul

Več podobnih tem