» »

Apriori algoritem

Apriori algoritem

Bela01 ::

Potrebujem pomoč pri pisanju algoritma za raziskovanje asociativnih pravil. Ali mogoče kdo ve, kam se naj obrnem. Nekaj literature že imam, vendar se nekako ne znajdem iz napisanega. Potrebovala bi kakšne primere (lahko so bolj splošni apriori algoritmi) oz. v čem je sploh finta vsega :)

LP, Ina

Thomas ::

Lahko bolj podrobno opišeš svoj problem?
Man muss immer generalisieren - Carl Jacobi

Bela01 ::

Pozdravljen!

Dobila sem naslednje besedilo: klik. Besedilo sem si prevedla, vendar ne vem sploh kam se obrnit, kje sploh začet.
Prosila bi koga za pomoč oz. kakšen nasvet.

LP, Ina

Thomas ::

Zdej razumem. Tole rabiš

for 90% of the rows of the relation, if the row value 1 in the columns set W, then it has 1 also in Column B.


Ane, Bela 01?
Man muss immer generalisieren - Carl Jacobi

Zgodovina sprememb…

  • spremenil: Thomas ()

Matako ::

Predlagam, da kot prvi korak raziščeš problematiko, s katerim se članek ukvarja. To se mi zdi zelo pomembno, ker brez tega boš težko brala naprej katerikoli drug akademski umotvor, ki ga utegnejo naplaviti valovi internetnih iskalnikov...

Vse kaže, da gre za iskanje asociacijskih pravil na osnovi množice podatkov. To spada v področje strojnega učenja, točneje data-mining.

Zelo koristen za razumevanje se mi zdi primer, ki ga omenja članek pod 5.1. Izgelda, da gre za bazo podatkov predmetov, na katere so vpisani študenti.

Recimo, da predmete označimo z A,B,C,D itn. Ta njihova baza bi potem izgledala tako - vsak zapis je točno en študent:

1 A B C (Študent št.1 je vpisan na predmete A,B in C)
2 A B (Študent št.2 je vpisan na predmete A in B)
3 A C
4 B
...

Problem je sledeč: Čeprav se študenti lahko vpisujejo po lastni želji, se pokažejo _statistična_ (empirična) pravila povezave med predmeti (asociacije). Treba jih je kar najbolje določiti!

Npr. lahko ze izcimi, da se praktično vsi študenti, ki se vpišejo na D in A vpišejo tudi na C (mogoče je C kak pogoj, mogoče je fora čisto neka druga, kaj veš). To se potem zapiše kot:

DA => C

...in je primer asociacijskega pravila. Normalno bi vsebovalo še kako verjetnost, ampak to sedaj ni pomembno.

Nisem se poglobil v algoritem, ker se mi iskreno rečeno ne da, ampak izgleda, da poizkuša iterativno (v večih korakih) zreducirati množice na "čiste primere" asociacij.

(POZOR!!!! to _ni_ ta algoritem, opisujem ti samo **splošno** zamisel!!)

Npr, če imaš...

DAC, BCDA, ACD, CD, CDAB

bi v naslednjem koraku redukcije (recimo, da odstraniš max 1 atribut) imela npr.

ACD, CD (prvega, ker je posredno ali neposredno vsebovan vsebovan in zadnjega, ker se ga ne da rešiti in se pusti kot je).

V še naslednjem koraku bi ti ostal CD in lahko zaključiš, da sta C in D očitno asociirana, lahko pa končaš tudi prej (po 1. koraku) - kar pomeni, da se odločiš "odrezati" po nekem merilu, ker bi podrobno droblenje naprej preveč zmanjšalo relevantnost pravil.

To rezanje (pruning) je ena izmed znanih fint veliko algoritmov strojnega učenja. Te metode so vse, kljub bombastičnemu imenu v resnici samo statistično procesiranje, ki namesto klasičnih statističnih izdelkov (dobri stari procenti tega in onega) dajejo ven pravila, ki opisujejo tvojo množico podatkov ...

Eeem, pa veselo googlanje in srečno 2008!
/\/\.K.

Zgodovina sprememb…

  • spremenil: Matako ()

Bela01 ::

Hvala za pomoč oz. za smernico kam sploh gledat. Bom malo preštudirala. Sigurno pa se kaj javim :8)

Pa seveda en malce zakasneli pozdrav: Srečno v letu 2008!


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Človeški jezik (strani: 1 2 )

Oddelek: Znanost in tehnologija
7317347 (13662) kuall
»

Kontakt FDV-jevca/ke (strani: 1 2 3 )

Oddelek: Šola
10428909 (25626) bbbbbb2015
»

Družboslovna informatika

Oddelek: Šola
297291 (1924) ales85
»

Naprednješa knjiga o programiranju (koncepti, ...)

Oddelek: Programiranje
366122 (5293) noraguta
»

Podiplomski študij

Oddelek: Šola
143328 (3133) mojca

Več podobnih tem