» »

Računalniško prepoznavanje govora ni naučeno angleščine temnopoltih

Računalniško prepoznavanje govora ni naučeno angleščine temnopoltih

Delež napačnih prepoznav besed (word error rate)

Slo-Tech - Sistemi za prepoznavanje govora so v zadnjih letih postali že zelo zmogljivi, tako da jih je možno uporabljati tudi v vsakdanjem življenju. K temu sta pripomogla povečanje korpusa za trening in razvoj metod za strojno učenje. Pet največjih razvijalcev teh sistemov je Amazon, Apple, Google, IBM in Microsoft. Raziskovalci s Stanforda so preverili, kako dobro ti sistemi razpoznavajo govorjeno besedo, in ugotovili, da obstajajo pomembne razlike med rasami (članek v PNAS).

Vseh pet sistemov je dobilo 19,8 ur posnetega materiala, ki je vključeval 42 belih govorcev in 73 temnopoltih. Govorili so z lokalnimi mestnimi govoricami petih mest v ZDA: Princeville (ruralno, večinoma temnopolto prebivalstvo), Rochester (srednje veliko mesto v državi New York), Washington DC, Sacramento (kalifornijska prestolnica) in Humboldt County (ruralno, večinoma belo prebivalstvo). Na koncu so uporabili 2141 izrezkov, ki so v povprečju trajali 17 sekund. Od teh je bilo 44 odstotkov moških, povprečna starost govorcev pa je bila 45 let.

Rezultati so pokazali, da je med tema skupinama govorcev statistično pomembna razlika v prepoznavanju besedil. Računalniški algoritmi so opazno bolje prepoznavali govor belcev. Rasna pristranskost algoritmov ni nekaj novega, saj so jo v preteklosti obravnavali tudi pri sistemih za prepoznavanje obrazov, procesiranje naravnega jezika, spletnem oglaševanju in celo pri programih, s katerimi si ameriška sodišča pomagajo pri določanju dolžine zapornih kazni. Algoritmi znajo, kar jih naučimo, in če jih treniramo na nereprezentativnem vzorcu za celotno populacijo, bodo različno uspešni pri različnih podskupinah.

V odstotku napak (merjeno kot število napačnih, izpuščenih ali vrinjenih besed glede na število vseh besed) so bile razlike očitne. Za temnopolte govorce je bil ta odstotek 35 %, za bele pa zgolj 19 %. Najslabše se je odrezal Applov sistem, najbolje pa Microsoftov, a pri vseh je bila razlika med obema skupinama govorcev približno enaka. Zanimivo je, da so se algoritmi pri temnopoltih moških odrezali dosti slabše kot pri ženskah, pri belcih pa razlika med spoloma ni bila statistično pomembna. Pri temnopoltih govorcih so bile napake pri prepisu enakomerno razporejene po vseh posnetkih, kar pomeni, da so bili večinoma slabše uporabni. Pri belih govorcih krivulja hitreje pada, torej je nekaj posnetkov zelo napačnih, ostali pa so večinoma dobri. Raziskovalci so preverili tudi, da razlog za razlike ni bila uporaba besed, ki jih sistemi ne bi imeli v korpusu. Razlog so bile prozodične prvine, ki so v AAVE (African American Vernacular English) drugačne kakor v govoru belega prebivalstva: ritem, tonemsko in jakostno naglaševanje, dolžina in kakovost samoglasnikov, zvočne premene).

Raziskovalci ugotavljajo, da so te razlike problematične, ker zaradi njih določene skupine prebivalstva ne morejo v popolnosti uporabiti pridobitev modernih tehnologij. Zato opozarjajo na potrebo, da se pri razvoju sistemov vzorči dovolj na široko, da bodo algoritmi sposobni prepoznavati vse dialekte, ki jih uporabljajo prebivalci.

37 komentarjev

Irbis ::

Sem se ob temle spomnil na tole zgodbo:
https://www.theguardian.com/australia-n...

Glugy ::

Naj trenirajo od začetka samo na temnopoltih pa potem vidijo če bo uspeh boljši če algoritem ni že v izhodišču najprej naučen za belce. Me zanima če bo pol bolj uspešen pri temnopoltih? Če bo bazen prepoznave črpal samo od temnopoltih. Mislm vem da verjetno bi to kdo štel za rasno diskriminacijo ampak če bi mel posebej algoritem za vsako skupino ljudi bi mogoče zadeva bolje laufala...

T-h-o-r ::

morda zato, ker džajv ni angleščina
Why have a civilization anymore
if we no longer are interested in being civilized?

Sakin ::

Splosno sprejeto ime je ebonics.
Na Nach Nachma Nachman Meuman!

gus5 ::

Prozodične značilnosti govora so pogojene z barvo kože? :)) Je zaključke študije delal član KKK?

poweroff ::

No, na koncu se bo morda ugotovilo, da bo smiselno, da se bodo za temnopolte in belopolte ter za moške in ženske uporabljali različni modeli.

Kar pa ima pomembno posledico. Sistem bo moral najprej prepoznati in klasificirati osebo po spolu in rasi.

Bo to spet rasizem? Ali gre preprosto za to, da smo si sicer različni, ampak ENAKOPRAVNI (ne pa ISTI, kot histerično trdijo nekateri ideologi in predvsem ideologinje)?
sudo poweroff

fuck_it_ ::

>Računalniško prepoznavanje govora ni naučeno angleščine temnopoltih

ker to ni angleščina ampak že prav nek nov jezik.
Do katere mere je dialekt jezika smatran kot dialekt in ne več kot "nov jezik"?

Angleščina črncev je angleščini podobna točno toliko kot je slovenščina podobna češčini. Saj je podobno ampak pač ni isti jezik.


Pa nočem biti čuden in smotan in rasističen. Ampak dejstvo je da so dialekti hud problem pri strojnem prevajanju.

Zgodovina sprememb…

  • spremenilo: fuck_it_ ()

Markoff ::

Če je kdo kdaj poslušal getogansterščino, ve, da mu še tako izvrstno znanje angleščine bore malo pomaga pri dekodiranju besed. Gre za specifično subkulturo, ki se aktivno trudi biti karseda drugačna od najširše kulture (ki ne zajema belcev, temveč vse Američane, tudi in morda celo predvsem izobražene in svetlopoltejše črnce oz. mulate).

Sicer pa lahko vsak najde rasizem v vsaki neumnosti, če le hoče. S-T npr. je očitno rasističen portal, saj ima privzeto nastavljeno belo ozadje in črne črke. Beline je torej bistveno več in je bolj izpostavljena, ergo rasisti.
Antifašizem je danes poslednje pribežališče ničvredneža, je ideologija ničesar
in neizprosen boj proti neobstoječemu sovražniku - v zameno za državni denar
in neprofitno najemno stanovanje v središču Ljubljane. -- Tomaž Štih, 2021

Gejspodar ::

Rad bi videl potencialne rezultate o slovenščini. Predvsem za prekmursko narečje. Ista zadeva.

FTad ::

Markoff je izjavil:

Če je kdo kdaj poslušal getogansterščino, ve, da mu še tako izvrstno znanje angleščine bore malo pomaga pri dekodiranju besed. Gre za specifično subkulturo, ki se aktivno trudi biti karseda drugačna od najširše kulture (ki ne zajema belcev, temveč vse Američane, tudi in morda celo predvsem izobražene in svetlopoltejše črnce oz. mulate).

Sicer pa lahko vsak najde rasizem v vsaki neumnosti, če le hoče. S-T npr. je očitno rasističen portal, saj ima privzeto nastavljeno belo ozadje in črne črke. Beline je torej bistveno več in je bolj izpostavljena, ergo rasisti.


Lep primer je bila serija The Wire. Tam sem moral res pozorno poslusati + pomoc angleskih podnapisov, da sem se tekom sezone navadil na tisto "anglescino"

Mavrik ::

Gejspodar je izjavil:

Rad bi videl potencialne rezultate o slovenščini. Predvsem za prekmursko narečje. Ista zadeva.


Saj je popolnoma ista zadeva - najmanj izobraženi in najrevneši slovenci tudi ne morejo uporabljati slovenskih sistemov za prepoznavo govora, ker so natrenirani na jeziku najbogatejših slovencev.

poweroff je izjavil:

No, na koncu se bo morda ugotovilo, da bo smiselno, da se bodo za temnopolte in belopolte ter za moške in ženske uporabljali različni modeli.


V praksi so zaključki popolnoma obratni in se modeli kvečjemu združujejo. Verjamem pa da eni hočete modele za diskriminacijo po spolu in rasi, še posebej po vseh tvojih topicih, ki napadajo ženske. ;)
The truth is rarely pure and never simple.

Zgodovina sprememb…

  • spremenil: Mavrik ()

vostok_1 ::

Čemu zanikate nekaj kar lahko vsak malo bolj pozoren človek opazi?
Prav vidim kako se nekateri trudijo opravičevat reči zaradi lastne ideologije.

Takoj ko je neka malo bolj kontroverzna teza, ste že v anksioznem nizkem štartu, kako boste sedaj to opravičevali.

Saj lahko cenzurirate, ampak ljudje vseeno niso taki idjoti, da tega ne bi opazli.

Mavrik je izjavil:


V praksi so zaključki popolnoma obratni in se modeli kvečjemu združujejo. Verjamem pa da eni hočete modele za diskriminacijo po spolu in rasi, še posebej po vseh tvojih topicih, ki napadajo ženske. ;)



Klasičen primer.
Na vsak način se trudi najti, da "le ne bi bilo to slučajno res".

Kaj pa če je?
A si ne boš moral pomagati kot v lagerje strpat take ljudi?
A če se izkaže, da je se ti bo svet sesul?

Ne trolam. Resno vprašanje?
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

Zgodovina sprememb…

  • spremenil: vostok_1 ()

Tear_DR0P ::

vostok_1 je izjavil:

Čemu zanikate nekaj kar lahko vsak malo bolj pozoren človek opazi?
Prav vidim kako se nekateri trudijo opravičevat reči zaradi lastne ideologije.


Hec je, da niti ne veš česa ne veš. Nimaš pojma o lingvistiki, ne veš kako in zakaj se pojavljajo jezikovne razlike in potem to poskušaš vezati na inteligenco, prihodke ali celo raso.

In raziskava zgoraj ne govori o tem, da ni razlik. Dejansko trdi kontra. Razlike so. Ampak razvojne ekipe niso bile zmožne upoštevati teh razlik. In ta del problematizira raziskava.
"Figures don't lie, but liars figure."
Samuel Clemens aka Mark Twain

Zgodovina sprememb…

vostok_1 ::

Iz izkušenj ti povem, da topli kraji imajo drugačno dinamiko, kar vključuje tudi jezik.
Vsaj tisti kraji, ki niso doživeli bistvenih migracij, zgodovinsko, iz povsem obratnih dežel. Recimo Turki v nemčiji.

Ali je to povezano z ekonomskim statusom?
Jz mislim, da je neka povezava. Ne bom trdil, da vem kompletni ustroj zakaj in kako, ampak človek opazi vzorce, če le gleda dovolj pozorno.


In kot drugo...kaj pa je narobe, da smo si različni?

Največja groza mi je, da bi bil svet en sam monoliten blok. Nobenih variacij, nobene pestrosti.
RPG igre bi pravzaprav nikoli ne obstajale, če ne bi imeli človeške variacije.

In kaj, če je neka rasa v povprečju neumnejša?
Vas res skrbi, da boste izvedli genocid ko vas bo luna nosila?

Ko imam jaz poln k**** hladnih severnjakov si prav zaželim it malo na "svobodni" jug, kjer je vse malo tko, nenapisano.
Ali so WCji umazani in razbiti? Vrjetno. Ampak tudi to ima svoj čar.
Vi bi želeli naredit cel svet eno Belgijo.
Fuj.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

Zgodovina sprememb…

  • spremenil: vostok_1 ()

poweroff ::

Mavrik je izjavil:

Verjamem pa da eni hočete modele za diskriminacijo po spolu in rasi, še posebej po vseh tvojih topicih, ki napadajo ženske. ;)

Ravno obratno. Jaz želim model, ki bo kar najbolj univerzalen.

Glede napadanja žensk, si se pa tudi zmotil. Zgolj provociram feministke. Pa še to ne vse, samo tiste, ki zagovarjajo ideje diskriminacije drugih.
sudo poweroff

FormerUser ::

poweroff je izjavil:


Bo to spet rasizem? Ali gre preprosto za to, da smo si sicer različni, ampak ENAKOPRAVNI (ne pa ISTI, kot histerično trdijo nekateri ideologi in predvsem ideologinje)?

Niti en relevanten idelog in predvsem ideologinja ne trdita, da smo ISTI. To so samo tvoji slamni možje, ki jih nastavljaš, da lahko po njih udrihaš.

janezvalva ::

Glugy je izjavil:

Naj trenirajo od začetka samo na temnopoltih pa potem vidijo če bo uspeh boljši če algoritem ni že v izhodišču najprej naučen za belce. Me zanima če bo pol bolj uspešen pri temnopoltih? Če bo bazen prepoznave črpal samo od temnopoltih. Mislm vem da verjetno bi to kdo štel za rasno diskriminacijo ampak če bi mel posebej algoritem za vsako skupino ljudi bi mogoče zadeva bolje laufala...

računalnik ne ve kdo je bel/črn
IQ test: v enem vedru imaš 2l vode, v drugem 1l vode. koliko veder imaš?

Irbis ::

fuck_it_ je izjavil:

>ker to ni angleščina ampak že prav nek nov jezik.
Do katere mere je dialekt jezika smatran kot dialekt in ne več kot "nov jezik"?

V bistvu je za to še najboljši odgovor definicija, da je jezik dialekt z vojsko.
Definicija razlike med dialektom in jezikom je bolj stvar politike kot jezikoslovja.

vostok_1 ::

Meni ni jasno, da če ima človek večje težave opaziti temnopoltega sredi noči, zakaj AI ne bi imel?

Gre za čisto posledico fizikalnih zakonov narave.
Nekateri pa so v kultih, kjer bi radi to naravo vesolja spremenili. Go figure.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

gus5 ::

Računalniško prepoznavanje govora ni naučeno angleščine temnopoltih
Študija je problematična že zato, ker implicira obstoj ras. Kakšni so motivi takšnih študij? Ugotavljanje kavzalnosti gotovo ne, saj študija ni dokazala nobene. Ugotavljanje korelacij? V tem primeru korelacije med barvo kože in računalniškim prepoznavanjem govorov govorcev z različnimi odmerki melanina? Čemu koristi ugotovitev te korelacije?

poweroff je izjavil:

Jaz želim model, ki bo kar najbolj univerzalen.
Sploh obstaja model, ki je hkrati univerzalen in konsistenten? Če verjameš v model spolne binarnosti, potem je ta lahko konsistenten le, če iz modela izključiš medspolnike in vse tiste, katerih prirojene telesne specifike ne odgovarjajo normiranim spolnim indikatorjem. Čim jih izključiš, model ni več univerzalen.

Irbis je izjavil:

Definicija razlike med dialektom in jezikom je bolj stvar politike kot jezikoslovja.
Ja, nastanek jezikovnih standardov praviloma ima politični kontekst. Pogost problem standardov je, da jih večina ljudi ne govori spontano. Spontani so pokrajinski govori, žargon...

Knjižna slovenščina je jezik, ki ga je navrglo nacionalistično 19. stoletje (iz mnogih lokalnih govorov ga je sestavil Anton Janežič oz. po mnenju drugih Fran Miklošič), a ga še danes skoraj nihče ne govori spontano; za razliko od lokalnih govorov, ki so "živi" in v spontani rabi, a "degradirani" v dialektike.

vostok_1 ::

Še eden, ki trdi da evolucija deluje zgolj od vratu navzdol.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

Jarno ::

Knjižna slovenščina je jezik, ki ga je navrglo nacionalistično 19. stoletje (iz mnogih lokalnih govorov ga je sestavil Anton Janežič oz. po mnenju drugih Fran Miklošič), a ga še danes skoraj nihče ne govori spontano; za razliko od lokalnih govorov, ki so "živi" in v spontani rabi, a "degradirani" v dialektike.


Btw., sam sem se na knjižno slovenščino navadil in mi je všeč, da ko nekdo iz drugega dela Slovenije prevede avtorsko delo, mi to po izrazoslovju načeloma ne dela sekundarnih pomislekov oz. preglavic.
Prav tako sem se navadil na uraden angleški jezik.

Je pa res, da bi lahko "jezik temnopoltih" kak AI prepoznaval brez škode za splošnost.
#65W!

Looooooka ::

Prvo knjizni zborni jezik na 100%, da lahko vsi narekujejo, potem pa zarad mene direkt prleski jezik ce to slucajno pomaga pri zaposljivosti v regiji. Jezik nikoli ni bil zabetonirana zadeva.

AndrejO ::

vostok_1 je izjavil:

Meni ni jasno, da če ima človek večje težave opaziti temnopoltega sredi noči, zakaj AI ne bi imel?

Gre za čisto posledico fizikalnih zakonov narave.
Nekateri pa so v kultih, kjer bi radi to naravo vesolja spremenili. Go figure.

Zato, ker t.i. "AI" (oziroma v tvojem primeru senzorika) nima in ne rabi replicirati človeških omejitev (v tvojem primeru sposobnost oči za zaznavanje različnih valovnih dolžin).

Začetek in konec te zgodbe je pri tem, da strojno učenje, kot ena izmed danes zelo popularnih metod t.i. "AI" zelo dobro zajame pristranskost avtorjev modela. Največkrat tako, da zelo dobro zajame lastnosti podatkov iz učnega nabora, ki so ga pripravili ljudje s svojimi pristranskostimi.

Glede na tvoje objave sklepam, da ti bi to moralo biti še kako zanimivo, zato, ker se na drugi strani te enačbe ljudje v povprečju obnašamo to daljinsko upravljane kepe mesa brez lastnih kognitivnih sposobnosti. Verjetno so le redki tukaj, ki se pri uveljavljanju svojih pravic (v zasebni ali pa državni sferi) še niso srečali s težavo "račnalnik tega ne pusti" zgolj zato, ker avtorji aplikacije niso identificirali ali podprli nekih konkretnih okoliščin (npr. moj naslov v tujini ni imel poštne številke, obrazec jo je na vsak način zahteval).

Tukaj namenoma pišem "AI", ker je to splošno sprejet termin, ki pri še več posameznikih vzbuja še več avtoritete in pri njih še bolj povečuje prevalenco izklopa višjih kognitivnih funkcij (t.j. uporabo lastne glave) tudi na račun tega, da je govora o "umetni", torej "strojni", torej nezmotljivi "inteligenci" oziroma "pameti". Seveda strokovnjaki iz področja vemo in razumemo kako zgrešeno in zavajajoče je to poimenovanje. Vendar javnost tega ne ve.

S čemer imamo zato sedaj za opraviti je širjenje lažnih avtoritet, ki so najmanj toliko pristrane, kot so bili zavestno ali podzavestno pristrani njihovi avtorji s tem dodanim bonusom, da za razliko od preteklih valov "AI"-ja, tokrat ni govora o razlagalnih ali ontoloških modelnih pristopih, temveč o modelnih parametrih, ki jih ljudje zaradi njihovega števila fizično ne moremo razumeti in posledično tudi o njih tudi ne moremo logično sklepati.

Vse, kar ima zveze s "temnopoltimi", je udarnost pisca članka, ker bi pri morebitnem testiranju model enako mizerno propadel pri katerihkoli jezikovnih ali narečnih skupinah, ki niso bile ustrezno zajete pri njegovi gradnji. Če bi bilo govora o steampunk Angliji 19. stoletja in njenim "strojim AI-jem", bi pač govorili o Ircih.
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

Zgodovina sprememb…

  • spremenil: AndrejO ()

gruntfürmich ::

AndrejO je izjavil:

...da zelo dobro zajame lastnosti podatkov iz učnega nabora, ki so ga pripravili ljudje s svojimi pristranskostimi.

torej je knjižni jezik pristranskost?
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

AndrejO ::

gruntfürmich je izjavil:

AndrejO je izjavil:

...da zelo dobro zajame lastnosti podatkov iz učnega nabora, ki so ga pripravili ljudje s svojimi pristranskostimi.

torej je knjižni jezik pristranskost?

Tam kjer so takšno obliko predpisali? Absolutno!
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

7982884e ::

Mavrik je izjavil:



Saj je popolnoma ista zadeva - najmanj izobraženi in najrevneši slovenci tudi ne morejo uporabljati slovenskih sistemov za prepoznavo govora, ker so natrenirani na jeziku najbogatejših slovencev.
korelacija izobrazenosti in revnosti z nivojem anglescine je bistveno nizja kot korelacija etnicnosti.
ne govorijo vsi belci redneck speak, docim pri vecini crncev opazis bistveno drugacen nacin govora.

AndrejO ::

7982884e je izjavil:

Mavrik je izjavil:



Saj je popolnoma ista zadeva - najmanj izobraženi in najrevneši slovenci tudi ne morejo uporabljati slovenskih sistemov za prepoznavo govora, ker so natrenirani na jeziku najbogatejših slovencev.
korelacija izobrazenosti in revnosti z nivojem anglescine je bistveno nizja kot korelacija etnicnosti.
ne govorijo vsi belci redneck speak, docim pri vecini crncev opazis bistveno drugacen nacin govora.

Nope, kar opaziš je samo to, da so tebe ta jezik učili ameriški filmi z belimi igralci, belimi režiserji in belimi producenti ali pa bele učitelji oziroma bele učiteljice po knjigah, ki so jih napisali neki drugi beli doktorji ali bele doktorice, ki so za višek svoje omike videli svoj jezik, kakor ga govorijo njihovi prijatelji na njihovi univerzi v njihovem Oxfordu. In verjel ali ne, v neki čisto določeni državi, ki se še danes ni otresla posledic suženjstva, moraš najprej odstraniti vpliv korelacije etnične pripadnosti z možnostjo pridobitve kakršnekoli izobrazbe, vključno z izobrazbo, ki je bila tebi naklonjena brezplačno.

Pa to niti ni nič posebnega. Slovenščina, ki se jo uči, je bila vedno obsojena, da bo jezikovne prvine jemala iz okolja tistih ljudi, ki so pisali slovnice in slovarje. Ti ljudje pa niso živeli med Mariborom in Mursko Soboto, temveč med Ljubljano in Kranjem. In ti ljudje se tudi niso družili z kmeti in njihovo govorico, temveč z ostalimi prijatelji in dobrotniki, ki so imeli nekoliko drugačno govorico. "Omikana" se ji je rekla zgolj zato, ker so jo za takšno poimenovali ali pa označili tisti, ki so znali pisati in so imeli dovolj sredstev, da so svoje ideje dali tudi natisniti.

Kar je za človeka "vhod", bo nujno definiralo tudi njegov "izhod". Pa naj bo to slovnica, knjiga ali pa paramteri za nek model temelječ na strojnem učenju.
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

Zgodovina sprememb…

  • spremenil: AndrejO ()

Reycis ::

Skratka problem je, ker zlobni podtlehni belci preprečujejo plemenitim zatiranim črncem, da bi si sami spisali svoj software.

Edit: oz. jim ga iz čiste nevoščljivosti in zlobe nočemo spisati mi. To, da imajo črnci dostop do strojne prepoznave govora (in tudi do belcev) je ČLOVEKOVA PRAVICA. In to je najbolj sveta stvar na svetu.

Zgodovina sprememb…

  • spremenil: Reycis ()

gruntfürmich ::

7982884e je izjavil:

Mavrik je izjavil:



Saj je popolnoma ista zadeva - najmanj izobraženi in najrevneši slovenci tudi ne morejo uporabljati slovenskih sistemov za prepoznavo govora, ker so natrenirani na jeziku najbogatejših slovencev.
korelacija izobrazenosti in revnosti z nivojem anglescine je bistveno nizja kot korelacija etnicnosti.
ne govorijo vsi belci redneck speak, docim pri vecini crncev opazis bistveno drugacen nacin govora.

korelacija še ne pomeni da je to resnična povezava.

AndrejO je izjavil:

gruntfürmich je izjavil:

AndrejO je izjavil:

...da zelo dobro zajame lastnosti podatkov iz učnega nabora, ki so ga pripravili ljudje s svojimi pristranskostimi.

torej je knjižni jezik pristranskost?

Tam kjer so takšno obliko predpisali? Absolutno!

verjamem da jo lahko označimo za pristransko, ker s tem 'zavržemo' nekaj drugačnega.
ampak je to narobe?
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

Zgodovina sprememb…

AndrejO ::

Težava ni v tem, da nekaj "zavržeš".

Težava je v posledicah, ki jih s tem povzročiš. Če ljudi potem s tako invalidnim modelom oviraš pri njihovih opravilih, potem nisi "zavrgel" samo nekaj v modelu, temveč si posredno "zavrgel" celotno jezikovno skupino.

V kombinaciji s tem, da nekatere generacije ljudi v stiku z računalnikom popolnoma izgubijo razsodnost (računalnik se nikoli ne moti), dobiš svet v katerem postanejo skupine ljudi, ki so diskriminirane v IT, nenadoma diskriminirane tudi v vsakdanjem življenju. S časom to preraste v institucionalizirano diskriminacijo.

Pa, da se ne boš preveč smejal ... po lanski neodvisni raziskavi je bila googlova prepoznava govora 92% pravilna za bele moške iz ZDA, 79% pravilna za bele ženske iz ZDA, 69% za "minority" ženske iz ZDA in, da zaključimo z razlogi za pristranskost modela, 53% pravilna za bele moške iz Škotske.

Nekatere izmed manj zabavnih posledic tako slabih algoritmov v praksi so recimo zavrnjena prošnja Irke, ker je računalnik tako slabo interpretiral njen govor, da je bilo njeno znanje angleščine ocenjeno kot nezadostno. Ali pa, ko pri iskanju službe naletiš na to, da moraš računalniku odrecitirati neke informacije. Potem imamo še navigacijske napake, ki so v kakšni telefonski aplikaciji še zabavne, kaj pa, ko vstopiš v avtonomen taksi brez tipkovnice?

Sucks to be discriminated...
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

cegu ::

Gejspodar je izjavil:

Rad bi videl potencialne rezultate o slovenščini. Predvsem za prekmursko narečje. Ista zadeva.


Res je. Priseljen Prekmurec nikoli ne izgubi narecja. Jaz pa po 1 mesecu v Ljubljani že hengam s frendi.

gruntfürmich ::

AndrejO je izjavil:

Sucks to be discriminated...
vse ok, edino ne vem zakaj uporabljate besedo 'diskriminiran'. pa še rasizem v istem stavku.
to se mi zdi totalno idiotsko. kar je v stilu tega da se mora narediti algoritme bebaste.
tega ni nikjer na svetu.
vsepovsod na svetu in v zgodovini je, bilo, in bo, da če daš čudne inpute dobiš čudne outpute. če nisi dobro seznanjen z delovanjem nečesa potem to tudi napačno deluje.
zakaj je tokrat pa drugače?
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

AndrejO ::

Žal ni drugače ...

In žal je to en izmed tistih garbage-in-garbage-out stvari, ki imajo tudi resne posledice v življenju.

In žal so se nekateri zataknili v raso in pozabili, da se lahko "računalniška diskriminacija" zgodi tudi njim, ter so začeli iskati krivdo na strani diskriminiranih, namesto na strani avtorjev sistemov, ki takšno diskriminacijo omogočajo.

In ja, zgodovina se ponavlja. Lahko se bi že enkrat nekaj naučili iz nje.
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

gruntfürmich ::

ampak izgleda da pa se ti še vedno nisi naučil da ni nujno nekaj diskriminjajoče in kar takoj začneš iskati krivdo čeprav je ni; le samo napačna raba programa s strani uporabnikov.
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

AndrejO ::

gruntfürmich je izjavil:

ampak izgleda da pa se ti še vedno nisi naučil da ni nujno nekaj diskriminjajoče in kar takoj začneš iskati krivdo čeprav je ni; le samo napačna raba programa s strani uporabnikov.

Napačna raba sistema s strani uporabnikov izhaja nesporedno iz lažnih in intelektualno nepoštenih izjav avtorjev tega sistema.

V tem primeru ne bom krivil uporabnikov, da verjamejo sistemu, katerega delovanje ne morejo niti razumeti, temveč bom vedno okrivil tiste, ki prodajajo neresnice zavite v visokoleteče strokovne izraze.

Kar se tiče same novice, prav in absolutno nujno je, da so oglašajo predstavniki skupin, ki so diskriminirane in na to diskriminacijo opozorijo. Dolžnost tistih, ki (še) nismo diskriminirani je, da jim prisluhnemo in podpremo pri njihovih prizadevanjih, da se z diskriminacijo konča.

V primerih uporabe prepoznave govora ta diskriminacija tudi več ni teoretična, temveč kar neposredna in pogosto financirana iz davkoplačevalskega žepa, ker je nek odločevalec pač verjel domnevno strokovnim izjavam prodajalcev sistema.

Bom ven povlekel še en takšen primer, kjer so davkoplačevalci plačali odgovorne osebe, te pa potem, izjav prodajalcev sistema niso dali na test in preverili njihovo ustreznost: Boeing 737 Max.

Si krivi kupci ali proizvajalec, ki je lagal kot pes teče? Ali pa je to morda nepošteno vprašanje in je bolj pravilno vprašanje, kako se porazdeli odgovornost med tistimi, ki ne morejo vedeti in tistimi, ki bi morali biti malo bolj pošteni?
28.3 čl. Pravil: Argumentirano pritožbo mora uporabnik poslati v oddelek
Slo-Tech, tema Pritožbe. Pritožb poslanih po zasebnih sporočilih,
elektronski pošti ali odprte v obliki tem v drugih oddelkih se ne upošteva.

Zgodovina sprememb…

  • spremenil: AndrejO ()

Reycis ::

Še vedno pa je vprašanje zakaj sistem preferira ravno bele moške iz ZDA? Ali so ga ženske ali črnci ali škoti naredili takšnega? Retorično vprašanje, vem.

Nadalje se lahko vprašamo ali bi ta diskriminacija obstajala tudi, če bi ga naredili pripadniki teh skupin. Retorično vprašanje, vem.

Naslednje vprašanje: ZAKAJ GA NISO????? Retorično vprašanje, vem.

To linijo vprašanj lahko nadaljujemo dokler se na koncu vendarle ne vdamo in si priznamo, da je realnost rasistična. Ne glede na to koliko se trudiš te realnosti nikoli ne boš mogel spremeniti. Namesto, da z nedelujočim sistemom trpinčimo vse po vrsti, bi morda lahko rajši sistem poskusili prilagoditi tej realnosti, da bi bila zadeva kar čimboljša za vse.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Skrajni desničarji? Rusi? Ne, nadobudni dvajsetletnik! (strani: 1 2 )

Oddelek: Novice / Varnost
7815222 (10364) Poldi112
»

Paradoks različnosti (strani: 1 2 3 4 )

Oddelek: Problemi človeštva
19233740 (30108) jype
»

Reklame in zdravila samo za črnce (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
8517130 (13264) Unknown_001

Zahodna Civilizacija in Cuckold fetish (strani: 1 2 )

Oddelek: Problemi človeštva
6713305 (11472) jype

Več podobnih tem