Slo-Tech - Minuli teden je skupina danskih raziskovalcev na internet (Open Science Framework) postavila urejeno bazo podatkov o 70.000 uporabnikih spletne strani OkCupid za spletne zmenkarije. Čeprav v njej ni imen in elektronskih naslovov, je podatkov toliko, da je mogoče ljudi zelo dobro profilirati in koga tudi prepoznati. Avtorja raziskave pravita, da so podatki tako ali tako javno dostopni, zato jih nista dodatno anonimizirala. To je res, a to še ne pomeni, da jih lahko po mili volji obdelujemo in analiziramo, če nimamo privoljenja njihovih lastnikov. Sploh pa javnost v tem primeru pomeni, da lahko podatke pridobi, kdor je registriran na OkCupidu za namene uporabe strani, a ne v obliki, ki je primerna za podatkovno rudarjenje.
Objavljeni podatki so namreč zelo temeljiti, saj vsebujejo med drugim tudi uporabniška imena, starost, spol, lokacijo, interese, osebnostne lastnosti in odgovore na več tisoč različnih vprašanj, ki jih stran uporablja za profiliranje uporabnikov. Baza podatkov je trenutno nedostopna, razprave o dopustnosti tovrstnega početja pa zelo burne.
Avtorja raziskave - tretji avtor trdi, da je odgovoren zgolj za programsko opremo, ki je bila uporabljena za sistematično snemanje podatkov z OkCupidove spletne stran, in da z raziskavo ni povezan - sta namreč prekršila precej norm, zelo verjetno pa tudi zakonov. Problematično je, da avtorja nista pridobila dovoljenja uporabnikov, katerih podatke sta obdelovala, da sta delovala v nasprotju s pogoji uporabe OkCupida, da sta zelo verjetno kršila evropsko in dansko zakonodajo o varovanju osebnih podatkov ter ameriško zakonodajo o dostopu do računalniških sistemov ter da sta vse skupaj javno priobčila na spletu. Prav tako nista pridobila soglasja univerzitetnega etičnega odbora. Univerza se je od njunega dejanja distancirala. Avtorja priznavata, da je bazo s spleta preneslo že vsaj 500 ljudi, torej je škoda nepovratno storjena. Prvi avtor je trenutno v Londonu in izjav ne daje, dokler se prah ne poleže.
To ni prvikrat, da je bil uporabljen argument, češ podatki so tako ali tako že javni. Že leta 2008, ko se je doba velikih podatkov (big data) šele začenjala, je harvardski raziskovalec s Facebooka snel podatke o 1700 študentih. Nekaj podobnega se je zgodilo dve leti pozneje, o obeh primerih pa kljub javnosti podatkov dejanje ni naletelo na pozitivne odzive. Pri tovrstnih študijah in objavah podatkov je nujno pridobiti informirano soglasje udeležencev, ustrezno varovanje podatkov, anonimizacija objavljenega in upoštevanje sorazmernosti. Tega se avtorja raziskave v tem primeru nista držala.
Novice » Zasebnost » Raziskovalca objavila bazo 70.000 uporabnikov OkCupida
Markoff ::
Kako pa sta prišla do podatkov? Menda jih nista pridobivala enega po enega, temveč z masovnim dolpotegom? V tem primeru bi lahko kdorkoli drug naredil enako? In sta samo objavila nekaj, kar je bilo že tako na voljo?
Iz originalne novice namreč ne razberem ravno odgovorov.
Iz originalne novice namreč ne razberem ravno odgovorov.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021
ales85 ::
@Markoff V novici (ST) piše ravno to. Zraven je bil tretji "raziskovalec", ki je omogočil scraping.
111111111111 ::
POdatki niso bili javni. V servis si se moral prijaviti. In ob prijavi obkljukaš pogodobo da tega ne boš počel. Vsekakor imata moralno odgovornost, verjetno je pa tudi kaznivo.
poweroff ::
V tem primeru zagotovo. Če so pa podatki javni in sta jih samo poscrapala in uredila pa ne vidim v čem je problem. Ljudje se bodo pač morali navaditi, da če je nekaj javno, je pač javno. Treba se bo začet obnašat odgovorno.
sudo poweroff
111111111111 ::
Tudi z javnimi podatki ne smeš delat kot svinja z mehom. Lahko vržeš čez statistiko in potegneš neke zaključke in anonimiziraš podatke. Če pa je iz javnih podatkov vidno in enoznačno za koga gre, potem pa je to kršitev, katerega zakona pa sedajle iz glave ne vem. Izmuzneš se lahko samo če konkretiziraš javne osebe, pa še tiste samo do neke meje. V prejšnji službi na faksu, je bilo v povezavi z big data zmeraj sranje, kaj pa kako se lotit, da ti ne pride Pirčeva težit. :) Je bila fora, ki jo je kolega vprašal vsakega diplomanta, ki je diplomiral pri njem. "Se bom moral dobiti s Pirčevo na kavi ali je diploma OK." :)
ripmork ::
Včasih so raziskovalce pošiljali na luno ali nekaj milj pod gladino, danes je pa očitno že vsak nosey nerd samozvani raziskovalec. Če sta morala ustvarit account in bit gor logirana za dostop do podatkov, potem to verjetno kar spremeni vse skupaj v primerjavi s situacijo, ko bi zgolj z Googlanjem prišla do podatkov. Je pa res, folk se mora zavedat, da prave anonimnosti nikjer na spletu pač ni, tu je še vedno vsak sam odgovoren.
Kakorkoli že, Bravo, "raziskovalca".
Kakorkoli že, Bravo, "raziskovalca".
Zgodovina sprememb…
- spremenil: ripmork ()
AndrejO ::
V tem primeru zagotovo. Če so pa podatki javni in sta jih samo poscrapala in uredila pa ne vidim v čem je problem. Ljudje se bodo pač morali navaditi, da če je nekaj javno, je pač javno. Treba se bo začet obnašat odgovorno.
Njun problem je, da sta pobrala in obdelovala osebne podatke in, da živita v EU in, da sta raziskovalca pri univerzi v EU.
V vseh državah članicah velja lokalna zakonodaja, ki transponira direktivo, ki med drugim izrecno zahteva, da se sme osebne podatke uporabljati samo in izključno za namen(e) za katere so bili zbrani. Zato recimo nadebudni neposredni oglaševalec ne sme dolpotegniti telefonskega imenika in začeti klicati fizične osebe. Kar je en zelo jasen primer javno dostopnih osebnih podatkov, ki se jih ne sem uporabljati na nedovoljen način zgolj in samo zato, ker so javno dostopni. To je bilo v EU že nekajkrat razčiščeno.
Ja, treba se bo obnašati odgovorno, ampak s tem njuna odgovornost ne preneha, ker sta še vedno kršila predpise, ki za njiju nesporno veljajo, vsaj dokler živita in delata v EU.
SeMiNeSanja ::
Vprašanje, ali je osebni podatek, da ima JohnLongShlong 15,3cm, Mr.MakeYouFeelGood pa zgolj 12,4cm ponosa, medtem ko ima HasoFromDoboj celih 22,6cm.
Ravno tako je vprašanje, če je osebni podatek, da imata prva dva med prijateljicami HotJane in BoobMouse, HasoFromDoboj pa SanjamJaNjega.
Kar hočem reči: na teh portalih operirajo z Nickname-i. Prava imena praviloma niso znana niti lastniku portala, kaj šele, da bi bila javno dostopna.
S temi nicki pa mislim, da je bila nekoč ena fora, da nekako ne uživajo iste zaščite kot 'pravi' osebni podatki?
Ravno tako je vprašanje, če je osebni podatek, da imata prva dva med prijateljicami HotJane in BoobMouse, HasoFromDoboj pa SanjamJaNjega.
Kar hočem reči: na teh portalih operirajo z Nickname-i. Prava imena praviloma niso znana niti lastniku portala, kaj šele, da bi bila javno dostopna.
S temi nicki pa mislim, da je bila nekoč ena fora, da nekako ne uživajo iste zaščite kot 'pravi' osebni podatki?
mtosev ::
In kaj je na okcupid tak zanimivega? Seksualne preference uporabnikov, kje kdo živi, kolk je star? Kolk vem okcupid ni socialno omrežje tak, da ne vem kaj tak zanimivega naj bi bilo gor
Core i9 10900X, ASUS Prime X299 Edition 30, 32GB 4x8 3600Mhz G.skill, CM H500M,
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013
poweroff ::
To vse razumem, ampak sem mnenja, da bo počasi treba odrasti. Če si podatke javno objavil in si se zavedal, da so javno objavljeni - potem so podatki pač javni.
Namen obdelave - seveda, dokler podatki niso javno dostopni. Ko pa enkrat so (legalno!), je pa zgodba zaključena.
Lahko se sicer pretvarjamo, da se ne smejo uporabljati za druge namene, ampak dejstvo je, da se bodo. Problem je treba reševati pri viru, ne potem, ko je duh izpuščen iz steklenice.
Rezultat tegale bo naslednji: raziskovalca bosta oglobljena, NSA bo še naprej veselo zbirala podatke, telemarketingarji bodo še naprej veselo zbirali podatke, Informacijska pooblaščenka bo pa srečna, ker je tako blazno "učinkovita".
Kaj točno smo s tem rešili?
Ja, treba bo reformo varstva osebnih podatkov.
Namen obdelave - seveda, dokler podatki niso javno dostopni. Ko pa enkrat so (legalno!), je pa zgodba zaključena.
Lahko se sicer pretvarjamo, da se ne smejo uporabljati za druge namene, ampak dejstvo je, da se bodo. Problem je treba reševati pri viru, ne potem, ko je duh izpuščen iz steklenice.
Rezultat tegale bo naslednji: raziskovalca bosta oglobljena, NSA bo še naprej veselo zbirala podatke, telemarketingarji bodo še naprej veselo zbirali podatke, Informacijska pooblaščenka bo pa srečna, ker je tako blazno "učinkovita".
Kaj točno smo s tem rešili?
Ja, treba bo reformo varstva osebnih podatkov.
sudo poweroff
AndrejO ::
SeMiNeSanja je izjavil:
Vprašanje, ali je osebni podatek, da ima ...
Preberi si še enkrat 6.čl. ZVOP, da ne bo potrebno polovice teme posmetiti z ugitavljanjem, če so osebni podatki res osebni podatki.
AndrejO ::
Kaj točno smo s tem rešili?
Ja, treba bo reformo varstva osebnih podatkov.
Reforma varstva osebnih podatkov je v EU šla v smer, da je oseba lastnik osebnih podatkov, da lahko praviloma zgolj lastnik odloča o tem, kaj se z njegovo lastnino sme početi, da sme soglasje za obdelavo kadarkoli umakniti, da lahko pod določenimi pogoji zahteva tudi to, da javnost na nek osebni podatek 'pozabi' in, da se bo za potrebe varovanja teh pravic tudi globe navilo do skrajne meje.
Sem še kaj izpustil pri tej reformi?
Bi se morali vdati, razglasiti poraz in se sprijazniti s tem, da si bodo lahko zasebnost kupili samo še tisti, ki bodo imeli za storitev dovolj denarja?
poweroff ::
Problem je v tem, da tukaj spet nastopa Mama Država. Otroci se lahko obnašajo neodgovorno in po socialnih omrežjih objavljajo karkoli. Ko pa otroci z vžigalicami zanetijo požar, naj pa brž Mama Država pride na pomoč. Otrokom se pa po drugi strani nikakor ne sme vzeti vžigalic. Če so pa tako fajn igrače...
Sama pravica do pozabe je precej problematična. Uveljavlja se jo namreč zgolj zato, ker je tehnično mogoča.
Pravice do pozabe namreč pri fizičnih virih (knjige, tiskani mediji) ni. Prav tako je ni pri človeškem spominu. Zato se mi tukaj postavlja resno vprašanje kakšna pravica je to, da se jo lahko izvršuje samo pri elektronskih komunikacijah?
Če potegnem analogijo - ker je tehnično mogoče prisluškovanje vsem telefonskim komunikacijam, je pač to čisto sprejemljiv trend, da se to počne? Saj konec koncev tudi policije in zlasti obveščevalne službe že govorijo o nekakšni "pravici", da prisluškujejo vsemu. Ne točno s tem izrazom, pa vendarle.
Poglej si recimo argumente FBI - "če bi nekdo ugrabil otroka in ga zaklenil v nek sef, a nimamo pravice razbiti ključavnice". Pri tem se pa pozablja, da kriminalci lahko uporabljajo tudi ne-elektronska komunikacijska sredstva, ki jim pa ni mogoče prisluškovati. Tam pa te "pravice" nenadoma ni več - ker tudi tehničnih sredstev za to ni.
Kar hočem reči je, da je uvajanje "pravic" zgolj zaradi tehničnih zmogljivosti lahko precej nevarno početje. In da je takšno uvajanje "pravic" samo druga plat uvajanja nadzora zgolj zato, ker je tehnično mogoč.
In seveda - globe bodo samo za tiste, ki jih bodo dobili. EU se čisto preveč ukvarja sama s seboj, namesto, da bi se z NSA. Malo se pozablja kdo najbolj ogroža interese EU.
Sama pravica do pozabe je precej problematična. Uveljavlja se jo namreč zgolj zato, ker je tehnično mogoča.
Pravice do pozabe namreč pri fizičnih virih (knjige, tiskani mediji) ni. Prav tako je ni pri človeškem spominu. Zato se mi tukaj postavlja resno vprašanje kakšna pravica je to, da se jo lahko izvršuje samo pri elektronskih komunikacijah?
Če potegnem analogijo - ker je tehnično mogoče prisluškovanje vsem telefonskim komunikacijam, je pač to čisto sprejemljiv trend, da se to počne? Saj konec koncev tudi policije in zlasti obveščevalne službe že govorijo o nekakšni "pravici", da prisluškujejo vsemu. Ne točno s tem izrazom, pa vendarle.
Poglej si recimo argumente FBI - "če bi nekdo ugrabil otroka in ga zaklenil v nek sef, a nimamo pravice razbiti ključavnice". Pri tem se pa pozablja, da kriminalci lahko uporabljajo tudi ne-elektronska komunikacijska sredstva, ki jim pa ni mogoče prisluškovati. Tam pa te "pravice" nenadoma ni več - ker tudi tehničnih sredstev za to ni.
Kar hočem reči je, da je uvajanje "pravic" zgolj zaradi tehničnih zmogljivosti lahko precej nevarno početje. In da je takšno uvajanje "pravic" samo druga plat uvajanja nadzora zgolj zato, ker je tehnično mogoč.
In seveda - globe bodo samo za tiste, ki jih bodo dobili. EU se čisto preveč ukvarja sama s seboj, namesto, da bi se z NSA. Malo se pozablja kdo najbolj ogroža interese EU.
sudo poweroff
SeMiNeSanja ::
Kaj točno smo s tem rešili?
Ja, treba bo reformo varstva osebnih podatkov.
Reforma varstva osebnih podatkov je v EU šla v smer, da je oseba lastnik osebnih podatkov, da lahko praviloma zgolj lastnik odloča o tem, kaj se z njegovo lastnino sme početi, da sme soglasje za obdelavo kadarkoli umakniti, da lahko pod določenimi pogoji zahteva tudi to, da javnost na nek osebni podatek 'pozabi' in, da se bo za potrebe varovanja teh pravic tudi globe navilo do skrajne meje.
Sem še kaj izpustil pri tej reformi?
Bi se morali vdati, razglasiti poraz in se sprijazniti s tem, da si bodo lahko zasebnost kupili samo še tisti, ki bodo imeli za storitev dovolj denarja?
Hja, ravno tu se pa pri Nick-ih zatakne, ker nihče ne ve, kdo je MujoFromDoboj pa JanezFromJesenice - lahko je kdorkoli, lahko ni nihče - zdaj pa dokazuj, da si res TI kot fizična oseba LASTNIK teh podatkov, ki v bistvu sploh niso osebni, ker se ne nanašajo na fizično osebo ampak neko imaginarno 'virtualno' osebo.
Drugo je npr. Facebook, kjer se ljudje vpisujejo z realnim imenom in priimkom. Malo bolj problematično pa je v primeru lažne osebnosti, kar nicki v bistvu so.
Ne glede na vse - nisem pravnik in se ne mislim spuščati v to. Na koncu še pravnikom ni vse skupaj čisto jasno in se obračajo s svojimi mnenji tako, kot zapiha veter.
Se mi pa zdi bedasto, da gredo poročene odrasle izobražene osebe na take 'dating' portale, gor objavljajo svoje fotografije (ne vedno take, ki bi jih dal na cerkveno oglasno desko), po možnosti celo takšne, da se vidi tudi obraz - potem pa se na enkrat nekaj spomnijo na nekakšno zasebnost, pa bi radi da njihovi pretekli grehi kar izpuhtijo.
Če si tako tup, da gor javno objaviš stvari, za katere nočeš, da se ve, potem bi moralo obveljati pravilo 'vsaka šola nekaj stane'. Nema potuhe mame države. Morda boš pa naslednjič malo bolj pametno prebiral, kaj boš o sebi objavljal na netu, vsem na očeh.
Tako, kot se zadeva razvija, bomo enega dne še priča dogodku, da bo žena obtožena posega v zasebnost moža in 'zlorabe osebnih podatkov', če bo na dating portalu naletela na njegov profil, ga prepoznala in se posledično hotela ločiti.
AndrejO ::
SeMiNeSanja je izjavil:
Hja, ravno tu se pa pri Nick-ih zatakne, ...
Nič se ne zatakne.
6. čl. ZVOP-1:
"
...
Posameznik – je določena ali določljiva fizična oseba, na katero se nanaša osebni podatek; fizična oseba je določljiva, če se jo lahko neposredno ali posredno identificira, predvsem s sklicevanjem na identifikacijsko številko ali na enega ali več dejavnikov, ki so značilni za njeno fizično, fiziološko, duševno, ekonomsko, kulturno ali družbeno identiteto, pri čemer način identifikacije ne povzroča velikih stroškov, nesorazmerno velikega napora ali ne zahteva veliko časa.
..."
"With these details, I roughly estimate I could ~90% accurately connect sexual preferences & histories to real names of >10,000 OkC users." Vir
SeMiNeSanja je izjavil:
Ne glede na vse - nisem pravnik in se ne mislim spuščati v to.
Ne rabiš biti pravnik. Samo pismen moraš biti in si namesto 5min za pisanje komentarja vzeti 3min za prebiranje virov.
Zgodovina sprememb…
- spremenil: AndrejO ()
SeMiNeSanja ::
In kako na osnovi seksualnih preferenc določiš realno osebo?
Ob tem, da je polovica podatkov na teh profilih zlaganih, začenši s starostjo osebe. (Da ne omenjam tistih, ki se zlažejo še pri spolu...)
'I ESTIMATE I COULD'...? Sorry, ne verjamem mu. Dečko se krepko precenjuje.
Ob tem, da je polovica podatkov na teh profilih zlaganih, začenši s starostjo osebe. (Da ne omenjam tistih, ki se zlažejo še pri spolu...)
'I ESTIMATE I COULD'...? Sorry, ne verjamem mu. Dečko se krepko precenjuje.
Zgodovina sprememb…
- spremenilo: SeMiNeSanja ()
AndrejO ::
Problem je v tem, da tukaj spet nastopa Mama Država. Otroci se lahko obnašajo neodgovorno in po socialnih omrežjih objavljajo karkoli. Ko pa otroci z vžigalicami zanetijo požar, naj pa brž Mama Država pride na pomoč. Otrokom se pa po drugi strani nikakor ne sme vzeti vžigalic. Če so pa tako fajn igrače...
Kje bi pa ti potegnil mejo do katere je vpletanje mame države še sorazmerno.
Sama pravica do pozabe je precej problematična. Uveljavlja se jo namreč zgolj zato, ker je tehnično mogoča.
V bistvu ravno z pojavom Interneta več ni tehnično mogoča. Dokler so bile informacije vezane na fizičen zapis, je bila pozaba samoumeven naravno zakon. Pomembne zadeve so se arhivirale in kopirale, nerelevantne so s tekom časa postajale vse bolj redke, dokler niso dokončno izginile - najprej iz dosegljivih virov (samostani, javne knjižnice), nato pa še iz nedosegljivih virov (zasebne zbirke in podstrešja).
Že samo hiter pogled v ZVDAGA hitro pokaže kako država organizirano in selektivno pozablja in se spominja. Ljudje in družba pred "izbruhom Interneta" v splošnem nismo bili nič drugačni.
Pravice do pozabe namreč pri fizičnih virih (knjige, tiskani mediji) ni. Prav tako je ni pri človeškem spominu. Zato se mi tukaj postavlja resno vprašanje kakšna pravica je to, da se jo lahko izvršuje samo pri elektronskih komunikacijah?
Pri teh virih ni "pravice", ker je govora o naravnih zakonitostih. T.i. ljudsko izročilo, ki se prenaša iz enega spomina v drugega, je zelo "lossy" in iz sveta vsako letno izginjajo celotni jeziki, kaj šele kakšne malo manj pomembne informacije. Pisni viri, ki so vezani na materialno obliko, ravno tako. Nekaj opravi čas in z njim povezan propad medija, nekaj opravijo nesreče in vojne, nekaj opravijo "optimizacije arhivov", nekaj se izgubi kdo ve kje, ker je knjižničar izgubil nekaj indeksnih listkov.
Enostavno dosegljivi in indeksirani viri po katerih je enostavno iskati, so relativno moderen izum. Kot izziv ti dam nalogo, da mi v roku enega leta našteješ vse moje dokumentirane in v različnih javnih medijih objavljene uspehe iz obdobja moje osnovne šole. Pa se bova po enem letu vrnila k tem izzivu in mo boš povedal kako dobro so fizični viri (knjige in tiskani viri) ohranili "spomin na moja otroška leta".
SeMiNeSanja je izjavil:
In kako na osnovi seksualnih preferenc določiš realno osebo?
Daj si še enkrat preberi napisano, da ne boš brcal v temo.
Zgodovina sprememb…
- spremenil: AndrejO ()
SeMiNeSanja ::
Kateri del od scrapanja javno dostopnih podatkov na portalu za zmenkarije nisem razumel?
Profil: Ljubljančan, 180cm, 90kg, 50let, črnolas, modrook, fakultetno izobražen, samski brez otrok, navdušen nad športom, ljubitelj narave in vsega lepega, vključno z blonkinkami okoli 30 let, ki imajo mere 90-60-90.
Nick: TvojBom
Zdaj pa povej, kdo je to, z imenom, priimkom in naslovom. Z 90% zanesljivostjo!
Da te vidim, junaka!
Profil: Ljubljančan, 180cm, 90kg, 50let, črnolas, modrook, fakultetno izobražen, samski brez otrok, navdušen nad športom, ljubitelj narave in vsega lepega, vključno z blonkinkami okoli 30 let, ki imajo mere 90-60-90.
Nick: TvojBom
Zdaj pa povej, kdo je to, z imenom, priimkom in naslovom. Z 90% zanesljivostjo!
Da te vidim, junaka!
AndrejO ::
SeMiNeSanja je izjavil:
Kateri del od scrapanja javno dostopnih podatkov na portalu za zmenkarije nisem razumel?
Očitno nisi razumel nič od do sedaj napisanega. Žal.
Seveda pa lahko mirno še naprej na pamet filozofiraš. Nihče ti tega ne bo branil.
SeMiNeSanja ::
SeMiNeSanja je izjavil:
Kateri del od scrapanja javno dostopnih podatkov na portalu za zmenkarije nisem razumel?
Očitno nisi razumel nič od do sedaj napisanega. Žal.
Seveda pa lahko mirno še naprej na pamet filozofiraš. Nihče ti tega ne bo branil.
Nehaj nabijat prosim in se delat pametnega.
Sem ti skušal ponazoriti, da je večina profilnih podatkov na teh portalih zlaganih ali najmanj olepšanih, drugi del (najljubša barva, najljubša roža, jed, knjiga, film,...) pa zaradi nezanesljivosti neuporabnih za kakršnokoli zanesljivo določitev konkretne osebe, celo v primeru, da to osebo dejansko poznaš in iščeš njen nick na osnovi realnih podatkov, ki jih o tej osebi veš.
Podatki postanejo zanimivi šele takrat, ko osebo poznaš in tudi veš njen nick, potem pa ugotavljaš, pri katerih vprašanjih se je vse zlagala.
Zanimivi so lahko tudi za nekega obsedenca s statistiko, ki bi raziskoval, koliko in v katero smer se ljudje na takih portalih lažejo pri podatkih, ki jih vpisujejo v svoj profil.
KER se gre večinoma za 'olepšane' in izmišljene podatke, pa je potem vsa debata brezpredmetna.
Popolnoma druga zgodba je pri podatkih, ki so odtekali kanadskemu zmenkarskemu portalu, kjer pa so bili zraven tudi podatki, po katerih se je dejansko dalo osebe nedvoumno identificirati.
111111111111 ::
Glej si na tehnološkem forumu. Vsi se prijavljajo z izmišljenimi imeni, nadiimki itd... Pa še tukaj najdeš nekatere, ki se predstavijo in napišejo naslov. Vzemiva npr. podatka mail in nick in jih združiva. Sosedova Micka Kovač uporablja email micka.kovaceva@gmail.com, če vržem vse skupaj v google, facebook itd... Dobim ven precej zanesljive podatke. Se ti ne zdi? Delno se strinjam s teboj, da si večina zmisli podatke, naštej mi pa pet ljudi, ki jih poznaš (da niso iz tehnične branže), da imajo 2 ali celo bognedaj 3 različne mail naslove. Sam si jih lastim cca. 16.
Potem pa statistika. 70.000 ljudi od tega jih 50% posreduje izmišljene podatke. Od 35.000 jih je 50% tehnološko ozaveščenih in posreduje mail za katerega nihče ne ve, da je njihov. Ostane ti jih cca. 15.000 preprostih ljudi, ki iščejo ljubezen na netu, se zlažejo za kako kilco in ne povedo da imajo mozoljast obraz. Še 33% jih moram stran vzet da pridem do 10.000 (pa če si opazil sem iz 35.000 radodarno podelil v prid tvoji statistiki).
Tvoja mnenja cenim pri mrežni infrastrukturi, pri statistiki pa ne lapat v tri krasne, ampak mi predstavi s številkami, kot to narediš pri mrežnih napravah, zakaj so ene boljše kot druge.
Potem pa statistika. 70.000 ljudi od tega jih 50% posreduje izmišljene podatke. Od 35.000 jih je 50% tehnološko ozaveščenih in posreduje mail za katerega nihče ne ve, da je njihov. Ostane ti jih cca. 15.000 preprostih ljudi, ki iščejo ljubezen na netu, se zlažejo za kako kilco in ne povedo da imajo mozoljast obraz. Še 33% jih moram stran vzet da pridem do 10.000 (pa če si opazil sem iz 35.000 radodarno podelil v prid tvoji statistiki).
Tvoja mnenja cenim pri mrežni infrastrukturi, pri statistiki pa ne lapat v tri krasne, ampak mi predstavi s številkami, kot to narediš pri mrežnih napravah, zakaj so ene boljše kot druge.
SeMiNeSanja ::
@Chuapoiz - tvoje navedbe bi držale, če bi bili zbrani podatki ime, priimek, naslov, mail.
Za kontrast vzami drugo zbirko osebnih podatkov, v kateri ni zlaganih ali izmišljenih podatkov: telefonski imenik.
Mi lahko v telefonskem imeniku najdeš Janeza Novaka iz Ljubljane, če ne veš, v kateri ulici stanuje?
V tvojem primeru se kvazi 10.000 ljudi ni zlagalo in je v profil vpisala samo resnične podatke. S čem pa boš zdaj te podatke primerjal, da boš rekel 'tale pa je Janez Novak z Dunajske ceste, ona pa je Pepca Peternel iz Kranja? Edini podatek, ki je kritičen, je lahko mail naslov - ampak že pred 25 leti so ljudje na podobne 'portale' hodili z 'alternativnimi' naslovi in to ne zgolj 'tehnično osveščeni'.
Skratka KAKO boš 10.000 podatkom avtomatizirano in množično priredil realna imena in priimke, če teh podatkov nimajo eksplicitno navedenih v nicku ali navedenem mail naslovu? Brez primerjalne baze podatkov, ki bi vsebovala tudi ime in priimek, ne bo šlo.
Poznam primere, ko so ženske na takih 'portalih' doživele razočaranja. O tipih so vedele MNOGO več, kot se vpisuje v profile, pa tistega 'grešnika' vseeno niso uspele izslediti, da bi mu povedale, kar mu gre.
Na internetu se tepe raznih 'raziskovalcev', ki bi vse dali za svojih 5 minut slave. Da potem nekdo izjavi 'ocenjujem, da bi lahko' - pa tega ni dokazal, niti ni poskusil dokazati, se mi zdi bahaško nakladanje, poziranje. Vsa debata pa se je razvila ravno na osnovi tega kar je nekdo 'predpostavil, da bi lahko'.
Tudi jaz predpostavljam, da bi se lahko na pamet naučil telefonski imenik Slovenije. Zdaj pa naj vas zgrabi panika, če se bom morda še podal na kakšen zmenkarski portal, ker predpostavljam, da bom po 5 minutah klepeta vsak nick priredil z 95% zanesljivostjo konkretni osebi iz telefonskega imenika in poklical njenega partnerja, če ve, da dotična oseba klepeta na portalu xy.
Kaj res nikomur ne šine, da se pri tovrstnih novicah včasih gre za čisto navaden nateg, ko 'raziskovalci' prenapihnejo svoj strahotni dosežek (scraping spletnih strani res ni neka huda znanost)?
Za kontrast vzami drugo zbirko osebnih podatkov, v kateri ni zlaganih ali izmišljenih podatkov: telefonski imenik.
Mi lahko v telefonskem imeniku najdeš Janeza Novaka iz Ljubljane, če ne veš, v kateri ulici stanuje?
V tvojem primeru se kvazi 10.000 ljudi ni zlagalo in je v profil vpisala samo resnične podatke. S čem pa boš zdaj te podatke primerjal, da boš rekel 'tale pa je Janez Novak z Dunajske ceste, ona pa je Pepca Peternel iz Kranja? Edini podatek, ki je kritičen, je lahko mail naslov - ampak že pred 25 leti so ljudje na podobne 'portale' hodili z 'alternativnimi' naslovi in to ne zgolj 'tehnično osveščeni'.
Skratka KAKO boš 10.000 podatkom avtomatizirano in množično priredil realna imena in priimke, če teh podatkov nimajo eksplicitno navedenih v nicku ali navedenem mail naslovu? Brez primerjalne baze podatkov, ki bi vsebovala tudi ime in priimek, ne bo šlo.
Poznam primere, ko so ženske na takih 'portalih' doživele razočaranja. O tipih so vedele MNOGO več, kot se vpisuje v profile, pa tistega 'grešnika' vseeno niso uspele izslediti, da bi mu povedale, kar mu gre.
Na internetu se tepe raznih 'raziskovalcev', ki bi vse dali za svojih 5 minut slave. Da potem nekdo izjavi 'ocenjujem, da bi lahko' - pa tega ni dokazal, niti ni poskusil dokazati, se mi zdi bahaško nakladanje, poziranje. Vsa debata pa se je razvila ravno na osnovi tega kar je nekdo 'predpostavil, da bi lahko'.
Tudi jaz predpostavljam, da bi se lahko na pamet naučil telefonski imenik Slovenije. Zdaj pa naj vas zgrabi panika, če se bom morda še podal na kakšen zmenkarski portal, ker predpostavljam, da bom po 5 minutah klepeta vsak nick priredil z 95% zanesljivostjo konkretni osebi iz telefonskega imenika in poklical njenega partnerja, če ve, da dotična oseba klepeta na portalu xy.
Kaj res nikomur ne šine, da se pri tovrstnih novicah včasih gre za čisto navaden nateg, ko 'raziskovalci' prenapihnejo svoj strahotni dosežek (scraping spletnih strani res ni neka huda znanost)?
111111111111 ::
Odgovori mi na tole: Naštej mi pet ljudi, ki jih poznaš (da niso iz tehnične branže), da imajo 2 ali celo bognedaj 3 različne mail naslove.
eee ::
Ja fak. Pa sem imel med tabi odprto, da bom kasneje snel, sedaj so pa zaprli. Time to google deep! Če se to pravilno analizira bo 'online dating' veliko lažji :D
Zgodovina sprememb…
- spremenilo: eee ()
SeMiNeSanja ::
111111111111 je izjavil:
Odgovori mi na tole: Naštej mi pet ljudi, ki jih poznaš (da niso iz tehnične branže), da imajo 2 ali celo bognedaj 3 različne mail naslove.
Ne samo, da imajo po tri različne mail naslove, še celo tja do 5 profilov imajo na teh dating straneh (na eni in isti, da ne bo pomote)!
Ravno zato, ker poznam ene par teh tičev in tičk, ki se po takih straneh šetajo - in definitivno niso iz tehničnih branž, ter približno vem, kako zavajajo tam gor, sem tako skeptičen glede uporabnosti tistih podatkov, ki so jih uporabniki sami javno objavljali v svojih profilih.
Morda je nekaj razlike med brezplačnimi in plačljivimi stranmi, ampak če se ne motim, so ponavadi profile odpirali brezplačno, zaračunavali pa potem, če si hotel brskati po podatkih drugih uporabnikov? To pa spet ne deluje nespodbujajoče za tiste, ki bi si radi odprli več profilov. Ker pa za odprtje novega profila običajno ne moreš uporabiti mail naslov, ki si ga že uporabil, se seveda odpirajo tudi dodatni mail accounti.
Jasno, da se to pojavlja predvsem pri uporabnikih, ki so na teh servisih več kot pol leta, pri 'starih mačkih' in 'starih mačkah', ki sčasoma obvladajo fore te scene, ne pa tudi pri naivnih začetnikih. Ti ponavadi zgolj olepšajo leta, kilograme, dodajo malo več izobrazbe,....
Torej če nisi tak bedak, da si boš nick sestavil iz resničnega imena in javno objavil svoj edini 'uradni' mail naslov, se lahko postaviš na glavo, pa samo iz profilnih podatkov, ne boš identificiral osebe.
Seveda pa se najdejo tudi taki bedaki, ki na dating portalu uporabljajo svoj službeni mail naslov - pa ne tistega osebnega, ampak 'info' varianto. Sosedje so dobesedno penili zaradi svojega zaposlenega, ki je bil tako butast, da so na zbirni mail podjetja vletavali maili njegovih 'ljubic'.... Pa so ga rotili, da naj si odpre en gmail account (ga dejansko ni imel!). Na koncu sem mu jaz pomagal odpreti gmail account, ko sem ga samega srečal v pisarni...
Dating portali niso zaznamovani samo z željo po ljubezni - zaznamovani so tudi z ljubosumjem. To pa je eden glavnih vzrokov, zakaj si ljudje gor odpirajo po več profilov. Tip trdi, da se pogovarja samo z 'njo', ona mu pa ne verjame. Odpre si še en profil, navede podatke, za katere ve, da so 'njenemu izbrancu' zelo privlačni in se ga loti 'pecat', da vidi, kaj bo rekel. In seveda tudi obratno. Čeprav moški ponavadi dodajajo profile, ker so z enim 'zamočili' pri izbrani kandidatki, zato pa računajo, da bodo z novim profilom in drugo taktiko bolj uspešni. Potem so tu še stalkerji, pa tisti, ki menijo, da na več trnkov (profilov) lahko več ujameš,....
Skratka zadeve niso tako preproste.
[D]emon ::
@SeMiNeSanja ti si pa pameten o OKC priblizno tako kot digisralcek o avtorskem pravu.
Mavrik ta forum uporablja za daljsanje e-penisa. Ker si ne upa iz hise.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Zaradi hrošča iz Cloudflara več mesecev curljaloOddelek: Novice / Varnost | 4942 (3427) | čuhalev |
» | Mozilla po Eichovem odstopu (strani: 1 2 3 4 5 6 )Oddelek: Novice / Ostale najave | 60113 (54935) | jype |
» | Mozillin novi izvršni direktor po treh dneh na pragu odstopa (strani: 1 2 3 4 )Oddelek: Novice / Ostale najave | 33220 (27417) | jype |
⊘ | izgled = vseOddelek: Loža | 1712 (1510) | zee |
» | Kako se ne programira spletnih zmenkarij (strani: 1 2 3 )Oddelek: Novice / Zasebnost | 26663 (19684) | haiku |