Forum » Programiranje » Apriori algoritem
Apriori algoritem
Bela01 ::
Potrebujem pomoč pri pisanju algoritma za raziskovanje asociativnih pravil. Ali mogoče kdo ve, kam se naj obrnem. Nekaj literature že imam, vendar se nekako ne znajdem iz napisanega. Potrebovala bi kakšne primere (lahko so bolj splošni apriori algoritmi) oz. v čem je sploh finta vsega :)
LP, Ina
LP, Ina
Bela01 ::
Pozdravljen!
Dobila sem naslednje besedilo: klik. Besedilo sem si prevedla, vendar ne vem sploh kam se obrnit, kje sploh začet.
Prosila bi koga za pomoč oz. kakšen nasvet.
LP, Ina
Dobila sem naslednje besedilo: klik. Besedilo sem si prevedla, vendar ne vem sploh kam se obrnit, kje sploh začet.
Prosila bi koga za pomoč oz. kakšen nasvet.
LP, Ina
Thomas ::
Zdej razumem. Tole rabiš
Ane, Bela 01?
for 90% of the rows of the relation, if the row value 1 in the columns set W, then it has 1 also in Column B.
Ane, Bela 01?
Man muss immer generalisieren - Carl Jacobi
Zgodovina sprememb…
- spremenil: Thomas ()
Matako ::
Predlagam, da kot prvi korak raziščeš problematiko, s katerim se članek ukvarja. To se mi zdi zelo pomembno, ker brez tega boš težko brala naprej katerikoli drug akademski umotvor, ki ga utegnejo naplaviti valovi internetnih iskalnikov...
Vse kaže, da gre za iskanje asociacijskih pravil na osnovi množice podatkov. To spada v področje strojnega učenja, točneje data-mining.
Zelo koristen za razumevanje se mi zdi primer, ki ga omenja članek pod 5.1. Izgelda, da gre za bazo podatkov predmetov, na katere so vpisani študenti.
Recimo, da predmete označimo z A,B,C,D itn. Ta njihova baza bi potem izgledala tako - vsak zapis je točno en študent:
1 A B C (Študent št.1 je vpisan na predmete A,B in C)
2 A B (Študent št.2 je vpisan na predmete A in B)
3 A C
4 B
...
Problem je sledeč: Čeprav se študenti lahko vpisujejo po lastni želji, se pokažejo _statistična_ (empirična) pravila povezave med predmeti (asociacije). Treba jih je kar najbolje določiti!
Npr. lahko ze izcimi, da se praktično vsi študenti, ki se vpišejo na D in A vpišejo tudi na C (mogoče je C kak pogoj, mogoče je fora čisto neka druga, kaj veš). To se potem zapiše kot:
DA => C
...in je primer asociacijskega pravila. Normalno bi vsebovalo še kako verjetnost, ampak to sedaj ni pomembno.
Nisem se poglobil v algoritem, ker se mi iskreno rečeno ne da, ampak izgleda, da poizkuša iterativno (v večih korakih) zreducirati množice na "čiste primere" asociacij.
(POZOR!!!! to _ni_ ta algoritem, opisujem ti samo **splošno** zamisel!!)
Npr, če imaš...
DAC, BCDA, ACD, CD, CDAB
bi v naslednjem koraku redukcije (recimo, da odstraniš max 1 atribut) imela npr.
ACD, CD (prvega, ker je posredno ali neposredno vsebovan vsebovan in zadnjega, ker se ga ne da rešiti in se pusti kot je).
V še naslednjem koraku bi ti ostal CD in lahko zaključiš, da sta C in D očitno asociirana, lahko pa končaš tudi prej (po 1. koraku) - kar pomeni, da se odločiš "odrezati" po nekem merilu, ker bi podrobno droblenje naprej preveč zmanjšalo relevantnost pravil.
To rezanje (pruning) je ena izmed znanih fint veliko algoritmov strojnega učenja. Te metode so vse, kljub bombastičnemu imenu v resnici samo statistično procesiranje, ki namesto klasičnih statističnih izdelkov (dobri stari procenti tega in onega) dajejo ven pravila, ki opisujejo tvojo množico podatkov ...
Eeem, pa veselo googlanje in srečno 2008!
Vse kaže, da gre za iskanje asociacijskih pravil na osnovi množice podatkov. To spada v področje strojnega učenja, točneje data-mining.
Zelo koristen za razumevanje se mi zdi primer, ki ga omenja članek pod 5.1. Izgelda, da gre za bazo podatkov predmetov, na katere so vpisani študenti.
Recimo, da predmete označimo z A,B,C,D itn. Ta njihova baza bi potem izgledala tako - vsak zapis je točno en študent:
1 A B C (Študent št.1 je vpisan na predmete A,B in C)
2 A B (Študent št.2 je vpisan na predmete A in B)
3 A C
4 B
...
Problem je sledeč: Čeprav se študenti lahko vpisujejo po lastni želji, se pokažejo _statistična_ (empirična) pravila povezave med predmeti (asociacije). Treba jih je kar najbolje določiti!
Npr. lahko ze izcimi, da se praktično vsi študenti, ki se vpišejo na D in A vpišejo tudi na C (mogoče je C kak pogoj, mogoče je fora čisto neka druga, kaj veš). To se potem zapiše kot:
DA => C
...in je primer asociacijskega pravila. Normalno bi vsebovalo še kako verjetnost, ampak to sedaj ni pomembno.
Nisem se poglobil v algoritem, ker se mi iskreno rečeno ne da, ampak izgleda, da poizkuša iterativno (v večih korakih) zreducirati množice na "čiste primere" asociacij.
(POZOR!!!! to _ni_ ta algoritem, opisujem ti samo **splošno** zamisel!!)
Npr, če imaš...
DAC, BCDA, ACD, CD, CDAB
bi v naslednjem koraku redukcije (recimo, da odstraniš max 1 atribut) imela npr.
ACD, CD (prvega, ker je posredno ali neposredno vsebovan vsebovan in zadnjega, ker se ga ne da rešiti in se pusti kot je).
V še naslednjem koraku bi ti ostal CD in lahko zaključiš, da sta C in D očitno asociirana, lahko pa končaš tudi prej (po 1. koraku) - kar pomeni, da se odločiš "odrezati" po nekem merilu, ker bi podrobno droblenje naprej preveč zmanjšalo relevantnost pravil.
To rezanje (pruning) je ena izmed znanih fint veliko algoritmov strojnega učenja. Te metode so vse, kljub bombastičnemu imenu v resnici samo statistično procesiranje, ki namesto klasičnih statističnih izdelkov (dobri stari procenti tega in onega) dajejo ven pravila, ki opisujejo tvojo množico podatkov ...
Eeem, pa veselo googlanje in srečno 2008!
/\/\.K.
Zgodovina sprememb…
- spremenil: Matako ()
Bela01 ::
Hvala za pomoč oz. za smernico kam sploh gledat. Bom malo preštudirala. Sigurno pa se kaj javim
Pa seveda en malce zakasneli pozdrav: Srečno v letu 2008!
Pa seveda en malce zakasneli pozdrav: Srečno v letu 2008!
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Človeški jezik (strani: 1 2 )Oddelek: Znanost in tehnologija | 17175 (13490) | kuall |
» | Kontakt FDV-jevca/ke (strani: 1 2 3 )Oddelek: Šola | 28439 (25156) | bbbbbb2015 |
» | Družboslovna informatikaOddelek: Šola | 7227 (1860) | ales85 |
» | Naprednješa knjiga o programiranju (koncepti, ...)Oddelek: Programiranje | 6072 (5243) | noraguta |
» | Podiplomski študijOddelek: Šola | 3307 (3112) | mojca |