Tiedon louhinnan menetelmät S05
firm-ohjelma assosiaatiosääntöjen louhintaan

Kurssilaisilla on halutessaan käytettävissä Juho Muhosen toteuttama Apriori-algoritmia käyttävä ohjelma assosiaatiosääntöjen etsintään. Alla Juhon antamat ohjelman käyttöohjeet.

(Huom: Ohjelman optiot -m, -d, -b, -B ovat tiettyä tutkimuskäyttöä varten, älkää käyttäkö niitä. Huomatkaa, että optiot -s<min_supp> ja -f<min_freq> tekevät vähän samaa asiaa. Varminta käyttää vain optiota -s<min_supp> rajoittamaan hakua, ja optiota -f ilman arvoa tuottamaan tulosteeseen suhteelliset frekvenssit.)

Ohessa itse sääntölouhija ('firm', executable for Linux) sekä esimerkkidata (exampleset.data). Lyhyet ohjeet ohjelman käyttöön saa suorittamalla ohjelman ilman parametreja.

Esimerkiksi seuraavanlainen komento tuottaa 'exampleset.data':sta kaikki säännöt, joilla on yksi alkio seurausosassa (tätä voi muuttaa parametrilla -nc) ja joilla on tuki 2 tai yli, sekä tulostaa niiden frekvenssin ja luottamuksen tekstitiedostoon 'temp.out'.

      firm -s2 -f -c -text exampleset.data temp.out
    

'temp.out' näyttää tältä:

Rule|Support|Frequency|Confidence
...
...
Smoking:'no'  => Disease_status:'control' |2|0.4|0.667
Disease_status:'control'  => Smoking:'no' |2|0.4|0.667
AGE:']50,100]' Disease_status:'control'  => Gender:'male' |2|0.4|1
...
    

-Juho