Raziskave umetne inteligence imajo velik problem @ Slo-Tech

Novice » Znanost in tehnologija »
Raziskave umetne inteligence imajo velik problem

Raziskave umetne inteligence imajo velik problem

Matej Huš :: 17. feb 2018 ob 17:42
Znanost in tehnologija

Slo-Tech - Umetna inteligenca se v raziskavah približuje medicini in psihologiji, kar je precej slabše, kot se sliši. V zadnjem času ima znanost čedalje večji problem s ponovljivostjo rezultatov, medicina in psihologija pa pri tem prednjačita.

Pričakovali bi, da so rezultati znanstvenih raziskav v specializiranih revijah tako natančno popisani, da jih lahko kadarkoli ponovimo in pridemo do istih zaključkov. Žal je resnica bistveno drugačna. Na vsakem področju se najdejo raziskave, ki jih ni mogoče ponoviti; na nekaterih področjih pa jih je nadpovprečno veliko. Pri tem ne gre nujno za ponarejanje, goljufanje ali namerno izbiranje pozitivnih rezultatov, temveč pogosto za površno izvedbo, nepopoln opis, slabo dokumentacijo itd. Problema se zavedajo tako raziskovalci kakor revije in financerji, a pametnih rešitev še ni.

Raziskave umetne inteligence so med tistimi, kjer je težav s ponovljivostjo največ. Raziskovalci umetne inteligence ne morejo ponoviti starejših raziskav ali tamkajšnjih izsledkov uporabiti za primerjave, ker koda, algoritmi in podatki pogosto niso nikjer javno objavljeni. Neobjavljanje izvorne kode je osnovni problem, zakaj starejših izsledkov ni mogoče vedno uporabiti za primerjavo z novimi. Odd Erik Gundersen z univerze v Trondheimu je pregledal 400 algoritmov, ki so bili opisani v zadnjih dveh letih, in ugotovil, da je le za 6 odstotkov koda dostopna. Le pri tretjini so znani podatki, na katerih so jih urili, in le polovica je opisala vsaj psevdokodo.

Razlogi za neobjavo kode so seveda mnogoteri in legitimni - avtorske pravice, zahteve privatnih financerjev, nedokončanost, odvisnost od druge nejavne kode, izgubljena koda (ljudje menjajo službe, mlajši doktorji še posebej), tekmovalnost v znanosti itd. Tudi če kodo poznamo, je pri umetni inteligenco zelo pomembno, da poznamo podatke za trening. Z različnimi so rezultati lahko zelo drugačni. Potem je tu še cel kup malenkosti, odločitev in podrobnosti, ki so lahko ključne za rezultate, a o njih v člankih ne piše nič.

Psihologija, kjer je bil problem neponovljivosti zelo pereč, je začela težavo reševati. Postavili so nove protokole in smernice, danes je pri objavi rezultatov raziskav ponovljivost ključna. Nekaj podobnega se začenja tudi na področju umetne inteligence. Joaquin Vanschoren z univerze v Eindhovnu je postavil stran OpenML, kamor lahko raziskovalci odložijo algoritme in podatke. IBM Research je predstavil orodje, ki na podlagi znanih informacij poizkuša obnoviti neobjavljeno kodo ostalih nevronskih mrež. Gre za nevronsko mrežo, ki bo raziskovalcem prihranila precej časa. Leta 2015 je bila ustanovljena revija ReScience, ki se posveča predvsem objavi ponovitev, a za zdaj nihče ne upa objaviti negativnih rezultatov (neuspelih ponovitev).

Znanstveniki ob tem poudarjajo, da je glavni problem moderni način financiranja in pritisk. Ker morajo ves čas producirati nove rezultate in članke, nimajo časa preverjati algoritmov na čisto vseh mogočih pogojih, pisati poglobljenih člankov z vsemi nadrobnostmi in poizkusi. Medtem pa vsak dan na arXiv še pred recenzijo pristanejo novi in novi članki.

37 komentarjev

tikitoki :: 17. feb 2018, 19:03

K beres nekatere clanke, te ne cudis, da ni mozna ponovljivost rezulatov. Vbistvu se vprasas, Ce je kater od recenzistov calnek dejansko prebral.

SimplyMiha :: 18. feb 2018, 08:24

Kaj? Da bi preverjali članke, za katere so plačani, da jih objavljajo?

Herezija!

Zdaj pa resno: morali bi zavrniti vse nepopolne raziskave, pa ne bo tega problema.

Zgodovina sprememb…

spremenilo: SimplyMiha (18. feb 2018 ob 08:25)

7982884e :: 18. feb 2018, 09:46

saj ponovljivost ni mogoca, ker je v clankih dalec, dalec premalo informacij. velika vecina jih pac nima objavljenega githuba s kompletno kodo.
to je razumljivo, saj ne delajo vsi open-source, in cez cas se rezultati tako ali drugace vidijo v nekem produktu oz. storitvi.

pegasus :: 18. feb 2018, 10:04

Znanost na splošno ima problem:

Utk :: 18. feb 2018, 10:07

Znanost ni vec znanstveno dokazana. Vse je samo se marketing, nategovanje stevilk v svojo korist.

ginekk :: 18. feb 2018, 17:15

Ne razumem kako ni pametne rešitve? Revije in publicisti naj pač ne objavijo če ne zadostuje znanstvenim kriterijem. Sicer bi bilo njim na škodo, ker zdaj vsak nekateri dajejo prednost kvantiteti pred kvaliteto, ampak če bodo šli tako naprej bomo kmalu spet v inkviziciji. Znanost ne sme bit zgolj orodje posla in politike.

Zgodovina sprememb…

spremenilo: ginekk (18. feb 2018 ob 17:16)

janezvalva :: 18. feb 2018, 17:23

večinoma se objavlja članke v znanstvenih revijah, ker tako zahteva delovno mesto.
pol pa kr neki objavljajo brez repa in glave da lahko obdržijo delovno mesto.
večina je pol samo sebi namen.

kuall :: 18. feb 2018, 17:45

Vzrokov za to je več:

V programiranju je itak največji problem, ko ne moreš ponoviti napake, ki jo javi stranka.

Delajo nekaj, kar še sami ne vedo, zakaj delajo tisto točno. Dejmo reproducirat nevornski sistem gliste, se bomo že kaj naučili, ko bomo to delali. Ko pa kdo vpraša, zakaj točno to delajo in kaj so se iz tega naučili te imajo pa za neumnega. Zato se noben ne upa vprašat, kaj sploh delajo. Kaj je osnovni motiv globalno gledano? To se ne moreš nikoli prevečkrat vprašat, se pa ljudje tako bojijo to spraševat, da ne bi izpadli neumni, da si ne bi uničili ugleda.

Ne naredijo si dovolj dobrega načrta na začetku, kaj mora biti input (testni primeti) in kaj output (testni rezultati) in ne zapišejo si tega. Pol pa seveda ne vedo, kaj naj bi raziskava sploh delala, ko že vse pozabijo čez leta.

Obvladat osnove je bistvo za uspeh.

Mesar :: 18. feb 2018, 18:22

Mogoče sem malo nejasno napisal, vsaka raziskava je uspeh če je ustrezno dokumentirana. Zakaj moramo delo ljudi dajati v nič?

Your turn to burn!

kuall :: 18. feb 2018, 18:30

A iz mojega
"Obvladat osnove je bistvo za uspeh. "
si razumel
"Vse kar so naredili je zanič".

No, sej razumem, da ljudje ne berete kaj dejansko pove človek ampak berete znake med vrsticami, na kaj namiguje. Se moram izboljšat tukaj. Samo še na to mislit, katere namige bo potegnil poslušalec, ne pa kaj dobesedno povem. To mi je postalo precej jasno v zadnjih dneh.

Mesar :: 18. feb 2018, 18:34

Torej problem je slaba komunikacija in dokumentacija? Delo pa vseeno ni zanemarljivo in rezultati, ki so bili ob tem opaženi tudi ne? Se strinjaš?

Your turn to burn!

oxyuranus :: 18. feb 2018, 18:41

AI raziskave imajo tudi se kaksen drug problem

https://logicmag.io/01-interview-with-a...

Those who do not understand UNIX are condemned to reinvent it, poorly.
(hint: linux)

Mesar :: 18. feb 2018, 18:42

dobro anonimizacija je poblem ampak ne če je raziskava opravljena dobro mar ne? zna pa biti malo neugodno če več ni ljudi in manjkajo informacije.

Your turn to burn!

kuall :: 18. feb 2018, 18:46

Seveda je bolje nekaj delati kot pa nič. Pišem o tem, kako še izboljšat stvari, kaj je pomembno, ko delaš. To pa so osnove. Osnove pa so za moje pojme da veš, kaj bi rad dosegel in da veš, kako boš to stestiral, s točnimi primeri in čimveč naj jih bo. Tega jim očitno manjka, če poskusov ne morejo ponoviti. Če bi to imeli bi poskuse že nekako ponovili, če ni na razpolago psevdokode bi pa novo napisali.
Za osnove pa niso poskrbeli zato, ker je to težko področje, v bistvu zelo podobno kot psihologija in so si mislili, da je bolje, da najprej začnejo delat in bodo že vmes ugotovili, kaj točno hočejo doseči. Niso vedeli, kje se lotiti po domače povedano in je bil cel projekt en sam neorganiziran test. Kar je čist razumljivo seveda, to je zelo težko področje.

Mesar :: 18. feb 2018, 18:47

Torej v praksi tudi težko pričakujemo kaj več? Izpostavljaš samo probleme in težave ter njihove obrazložitve ne pa tudi rešitev.

Your turn to burn!

kuall :: 18. feb 2018, 19:05

Površno bereš, naravnan si v kritiko, zato ne vidiš rešitev, kajti tudi rešitev sem ponudil. Pripravit si točne teste in kakšen mora biti rezultat. To je najboljši nasvet za AI. V to smer je treba iti. Vse drugo je tavanje v megli.
Lahko pričakujemo zanimive stvari v AI po moje v kratkem. Že dolgo govorijo to ampak zdaj pa res. Kako vem? Zato ker so že tu. Roboti ki smučajo in vozijo so že tu. Google prevajalnik je tudi impresiven. WTF.

Kaj pa tovarna robotov v Kočevju, ki jo bodo odprli? Ni nobene novice o tem. Lahko bi šli slo tech novinarji mau v akcijo in naredili kakšen intervju. :))

jype :: 18. feb 2018, 19:06

kuall je 18. feb 2018 ob 19:05 izjavil:

Pripravit si točne teste in kakšen mora biti rezultat. To je najboljši nasvet za AI.

Osnove ti žal niso jasne.

Stochastic @ Wikipedia

Mesar :: 18. feb 2018, 19:09

Verjetno veš, da AI projektov ni tako preprosto testirati ter da potrebuješ najmanj snapshote, ker se zadeve učijo in dataseti več niso enaki po vsakem naslednjem poskusu. Včasih pač te zadeve preprosto vzamejo preveč časa in se jih predvidevam da zaradi pomanjkanja sredstev sploh ne lotevajo.

Tovarna v Kočevju? Pojma nimam kaj je s tem.

Your turn to burn!

MrStein :: 18. feb 2018, 19:52

oxyuranus je 18. feb 2018 ob 18:41 izjavil:

AI raziskave imajo tudi se kaksen drug problem

https://logicmag.io/01-interview-with-a...

Kaj je narobe z imenom Benedikt??

Motiti se je človeško.
Motiti se pogosto je neumno.
Vztrajati pri zmoti je... oh, pozdravljen!

kuall :: 18. feb 2018, 19:54

Vse se da, če se hoče. Samo vprašanje je kaj ti je pomembno. Ali ti je pomembno, da veš kaj delaš in točno vse lahko stestiraš ali pa delaš nekaj z občutkom in si zadovoljen s tem. Odvisno od značaja človeka v bistvu. Meni je pomembno, da imam vse pod nadzorom zavesti, z občutkom nerad delam. Tudi AI se da programirat s točnimi testi in točnimi rezultati. Ljudje tega ne delajo, ker čakajo, da se bo program sam napisal in iz lenobe in zaradi značaja.

Stochastični proces je ugibanje: "the formation or expression of an opinion or theory without sufficient evidence for proof. " Čist jypejevsko zveni.
Tudi to bi znalo biti koristno, ko delaš teste, kako nekaj narediti. Ne smeš pa iz tega pričakovat rezultatov, lahko mimogrede naletiš na njih. Podobno brainstormingu, pridobivanju čimveč teorij, ki jih moraš potem tudi preizkusiti v praksi. Ampak tudi tukaj moraš imeti nekaj, kar točno stestira tvojo izmišljeno teorijo. V bistvu je vse, kar je bilo narobe z AI ravno ta način. Upanje na nek čudež, namesto da bi se usmerili v praktične dosežke, korak za korakom in bili zadovoljni z malimi sanjajo o singularnosti in o tem, kako se bo AI sam razvijal. Bedarija.

V Kočevju bodo baje rabili 200 strokovnjakov, največji svetovni proizvajalec industrijskih robotov. Saj v Ribnici že imajo nekaj. Gre se za industrijske robote, kjer prevladuje predvsem strojno znanje po moje, ne toliko programersko. Po moje to okolje ni ravno idealno za razvoj neke hude inteligence, boljše kakšno, kjer imaš opravka z jezikom.

jype :: 18. feb 2018, 20:00

kuall je 18. feb 2018 ob 19:54 izjavil:

Čist jypejevsko zveni.

Seveda - ker deluje.

kuall :: 18. feb 2018, 20:41

No bomo videli, kdo ima prav.
Drgač pa mi tvoja družba ne paše. Ne zato, ker se ne strinjava ampak zarad tvojega značaja. Tako da mi ne več odgovarjat, jaz pa tebi ne bom.

Irbis :: 18. feb 2018, 20:48

MrStein je 18. feb 2018 ob 19:52 izjavil:

oxyuranus je 18. feb 2018 ob 18:41 izjavil:
AI raziskave imajo tudi se kaksen drug problem

https://logicmag.io/01-interview-with-a...

Kaj je narobe z imenom Benedikt??

Benedict Arnold @ Wikipedia

Irbis :: 18. feb 2018, 20:59

kuall je 18. feb 2018 ob 19:05 izjavil:

Google prevajalnik je tudi impresiven.

GT: The Google compiler is also impressive.
compiler?

Površno bereš, naravnan si v kritiko, zato ne vidiš rešitev, kajti tudi rešitev sem ponudil.
GT: You are superbly reading, you are in criticism, so you do not see a solution, because I also offered a solution.
površno -> superbly?

jype :: 18. feb 2018, 21:04

kuall je 18. feb 2018 ob 20:41 izjavil:

Drgač pa mi tvoja družba ne paše. Ne zato, ker se ne strinjava ampak zarad tvojega značaja. Tako da mi ne več odgovarjat, jaz pa tebi ne bom.

OK, samo še eno vprašanje imam zate: Zakaj se ti zdi, da lahko od mene zahtevaš, da te ignoriram? Moja družbena funkcija na tem forumu je, da ljudi spravim v intelektualno zadrego, ker je to eden najboljših katalizatorjev kritičnega razmišljanja.

kuall :: 18. feb 2018, 21:09

Jype, zato ker tako življenje funkcionira, da gremo stran od ljudi, za katere opazimo, da nam škodijo. Če bi videl, da mi debatiranje s teboj koristi ti ne bi tega rekel ampak ni zame taka vrsta pogovarjanja. Če se o nečem pogovarjam s teboj malo izgubim motivacijo za tisto, tega pa ne bi rad.

MrStein :: 18. feb 2018, 21:39

Z drugo besedo: jype je trol, ki odganja normalno debato.
Domišlja si sicer obratno.

Motiti se je človeško.
Motiti se pogosto je neumno.
Vztrajati pri zmoti je... oh, pozdravljen!

kuall :: 18. feb 2018, 21:42

Ja. Ženejo ga čustva k tem početju (ker mu gre in je zasvojen ratal s tem), potem pa si razlaga, da to dela iz koristi za družbo (kot si je že marsikdo pred njim). Ker pač človek ne more živet, če se čustva in razum ne ujemata.

Ghenghiz :: 19. feb 2018, 08:40

Iz lastnih raziskav tekom let vem, da ga ženeta čokolino in nutela.
Raziskave žal niso objavljene in so pomanjkljivo dokumentirane (da ostanemo pri temi).

T-h-o-r :: 19. feb 2018, 16:22

temveč pogosto za površno izvedbo, nepopoln opis, slabo dokumentacijo

a pametnih rešitev še ni.

to je pa najbolj debilna stvar, ki sem jih v zadnjem času prebral

Why have a civilization anymore
if we no longer are interested in being civilized?

Zgodovina sprememb…

spremenilo: T-h-o-r (19. feb 2018 ob 16:23)

gus5 :: 19. feb 2018, 16:51

Umetna inteligenca se v raziskavah približuje medicini in psihologiji, kar je precej slabše, kot se sliši. V zadnjem času ima znanost čedalje večji problem s ponovljivostjo rezultatov, medicina in psihologija pa pri tem prednjačita.

Psihologija je znanost? 8-O

St753 :: 19. feb 2018, 18:11

Tukaj se mal mesajo jabolka in hruske. Ce raziskave ni mozno ponoviti, ker je uporabljena metoda nezanesljiva in da vsakic drugacne rezultate je drugacen problem, kot ce ponovljivost ni mozna zaradi nepopolnih informacij (s katerimi bi lahko dobili enake rezultate). Res je, da pri drugem problemu ostali ne morejo preverit, ce gre tudi za prvi problem, vendar je treba tudi upostevat, da precej clankov zadnje case pride iz industrije, kjer seveda hocejo zascitit intelektualno lastnino. Zakaj bi se oni moral sekirat, ce drugi ne morejo dobit istih rezultatov, oz. se bolje je, ce jih ne morejo, ce zelijo imeti prednost pred konkurenco. Se pa strinjam, da je to problem za znanost, kjer je pa ze tako problem, da se te 'ponovitvene studije' opravljajo zelo redko (kot je bilo receno v eni oddaji: "there is no Nobel prize for fact checking"). Zame je bilo bolj presenetljivo, kako pogosto najdem kodo na githubu za te raziskave, je pa mogoce to specificno za podrocje, ki ga bolj podrobno spremljam.

jype :: 19. feb 2018, 18:14

kuall je 18. feb 2018 ob 21:09 izjavil:

Jype, zato ker tako življenje funkcionira

Ne. Življenje funkcionira tako, da lahko ti mene ignoriraš, če želiš, nimaš pa nobene možnosti zahtevati od mene, da naj ignoriram tebe.

Vazelin :: 19. feb 2018, 18:16

Kaj preprečuje enmu fakerju da ne objavi za 10% boljše rezultate kot jih doseže? Itak ne moreš preveriti rezultatov tudi če bi hotel :d
Potem pa procente na 2 decimalke objavljajo

Zgodovina sprememb…

spremenilo: Vazelin (19. feb 2018 ob 18:26)

St753 :: 19. feb 2018, 18:37

Rezultati se pogosto objavljajo za problem standardne datasete. Ce bi imel rezultate toliko boljse, bi hitro postalo sumljivo, nekje so pa itak tudi public benchmarki, kjer ti test dataseta ne poznas v naprej in potem oni objavijo rezultate. Tiste decimalke so pogosto brezvezne za moje pojme (oz. bi nujno mogli vkljucit se kaksen std, ko se model z istimi hyperparametri 2x natrenira, ali kaj podobnega). Nekateri imajo pa tudi mal napacne predstave, kaj je pomankljiv opis. Se najvecja neznanka tukaj je training data, kjer imajo nekateri prednost zaradi vecje kolicine podatkov, ki so jim na voljo. Za standardne datasete se itak uporablja specificen training dataset, ce se pa tega raziskovalci dejasnko drzijo, je pa druga stvar :)

kuall :: 19. feb 2018, 18:51

jype je 19. feb 2018 ob 18:14 izjavil:

kuall je 18. feb 2018 ob 21:09 izjavil:
Jype, zato ker tako življenje funkcionira
Ne. Življenje funkcionira tako, da lahko ti mene ignoriraš, če želiš, nimaš pa nobene možnosti zahtevati od mene, da naj ignoriram tebe.

A tudi v resničnem življenju rineš za ljudmi, ko ti rečejo, da nočejo nič imeti s teboj?

jype :: 19. feb 2018, 18:57

kuall je 19. feb 2018 ob 18:51 izjavil:

A tudi v resničnem življenju rineš za ljudmi, ko ti rečejo, da nočejo nič imeti s teboj?

Ne vem, nisem še bil tam.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Strah pred umetno inteligenco je odveč (strani: 1 2 ) Gregor P Oddelek: Novice / Znanost in tehnologija	59	17888 (15672)	Cange 28. nov 2019 14:46:28
»	Študij kognitivne znanosti (strani: 1 2 ) genesiss Oddelek: Šola	55	24817 (14479)	labrys 12. mar 2019 20:41:24
»	Raziskave umetne inteligence imajo velik problem McHusch Oddelek: Novice / Znanost in tehnologija	37	8735 (6660)	jype 19. feb 2018 18:57:17
⊘	Raziskave s kirlianovo kamero globalna80 Oddelek: Znanost in tehnologija	40	5538 (4575)	Ziga Dolhar 18. sep 2012 21:51:39
!	Z&T povezave OwcA Oddelek: Znanost in tehnologija	8	42850 (36557)	snow 8. jun 2009 14:13:45

Več podobnih tem

Novice » Znanost in tehnologija » Raziskave umetne inteligence imajo velik problem

Raziskave umetne inteligence imajo velik problem

tikitoki :: 17. feb 2018, 19:03

SimplyMiha :: 18. feb 2018, 08:24

7982884e :: 18. feb 2018, 09:46

pegasus :: 18. feb 2018, 10:04

Utk :: 18. feb 2018, 10:07

ginekk :: 18. feb 2018, 17:15

janezvalva :: 18. feb 2018, 17:23

kuall :: 18. feb 2018, 17:45

Mesar :: 18. feb 2018, 18:22

kuall :: 18. feb 2018, 18:30

Mesar :: 18. feb 2018, 18:34

oxyuranus :: 18. feb 2018, 18:41

Mesar :: 18. feb 2018, 18:42

kuall :: 18. feb 2018, 18:46

Mesar :: 18. feb 2018, 18:47

kuall :: 18. feb 2018, 19:05

jype :: 18. feb 2018, 19:06

Mesar :: 18. feb 2018, 19:09

MrStein :: 18. feb 2018, 19:52

kuall :: 18. feb 2018, 19:54

jype :: 18. feb 2018, 20:00

kuall :: 18. feb 2018, 20:41

Irbis :: 18. feb 2018, 20:48

Irbis :: 18. feb 2018, 20:59

jype :: 18. feb 2018, 21:04

kuall :: 18. feb 2018, 21:09

MrStein :: 18. feb 2018, 21:39

kuall :: 18. feb 2018, 21:42

Ghenghiz :: 19. feb 2018, 08:40

T-h-o-r :: 19. feb 2018, 16:22

gus5 :: 19. feb 2018, 16:51

St753 :: 19. feb 2018, 18:11

jype :: 19. feb 2018, 18:14

Vazelin :: 19. feb 2018, 18:16

St753 :: 19. feb 2018, 18:37

kuall :: 19. feb 2018, 18:51

jype :: 19. feb 2018, 18:57

Vredno ogleda ...

Strah pred umetno inteligenco je odveč (strani: 1 2 )

Študij kognitivne znanosti (strani: 1 2 )

Novice » Znanost in tehnologija »
Raziskave umetne inteligence imajo velik problem