Väitöskirjapalkinto Wilhelmiina Hämäläiselle tiedon louhintaa käsittelevästä työstä

Tietotekniikan Tutkimussäätiö on myöntänyt Tietojenkäsittelytieteen Seuran esityksestä vuoden 2011 väitöskirjapalkinnon FT Wilhelmiina Hämäläiselle hänen Helsingin yliopiston Tietojenkäsittelytieteen laitokselle tekemästään väitöskirjasta ”Efficient search for statistically significant dependency rules in binary data”.

Hämäläisen työ liittyy tilastollisten riippuvuuksien etsintään ja analysointiin. Tilastolliset riippuvuudet auttavat ymmärtämään asioiden syy- ja seuraussuhteita, kuten esimerkiksi mitkä geenit tai elämäntavat altistavat tietyille sairauksille ja mitkä puolestaan suojelevat niiltä. Analysoitavaa dataa on nykyaikana valtavasti saatavilla lähes miltä tahansa elämän alueelta. Ongelmana on, ettei kaikkia mahdollisia riippuvuuksia voida tutkia tavallisilla tilastollisilla työkaluilla tai tietokoneohjelmilla. Usein data sisältää vähintään satoja tai jopa kymmeniä tuhansia muuttujia, eikä kaikkien mahdollisten riippuvuussääntöjen tutkiminen ole laskennallisesti mahdollista. Tässä tutkimuksessa on kehitetty tarvittavia tehokkaita laskentamenetelmiä tilastollisesti kaikkein merkitsevimpien riippuvuussääntöjen etsintään binääridatasta, jossa kukin muuttuja voi saada vain kaksi arvoa. Geenitutkimuksen lisäksi tällaista dataa esiintyy luonnostaan mm. biologiassa (eri havaintopaikoilla esiintyvät kasvi- ja eläinlajit) sekä markkinointitutkimuksessa (ns. ostoskoridata eli mitä tuotteita kukin asiakas on ostanut). Mikäli datassa on kuitenkin useampiarvoisia muuttujia, ne voidaan aina tarvittaessa esittää binäärimuodossa.

Aiempiin tiedonlouhintamenetelmiin verrattuna tutkimuksessa kehitetyt menetelmät ovat sekä tehokkaampia että luotettavampia. Tämän tutkimuksen tuloksena kehitetyllä tietokoneohjelmalla on mahdollista hakea kaikkein merkityksellisimmät riippuvuudet jopa kymmeniä tuhansia muuttujia sisältävistä datajoukoista tavallisella pöytätietokoneella. Wilhelmiina Hämäläisen työ on siis merkittävä kontribuutio binäärisen datan tilastotieteellisesti pätevään tiedonlouhintaan.

Työn ohjaajana toimi prof. Matti Nykänen Itä-Suomen yliopistosta.

Palkinto luovutettiin Tietojenkäsittelytieteen päivillä Espoossa 30.-31.5.2011.

Lisätietoja:

http://www.tkts.fi/tietojenk%C3%A4sittelytieteen-v%C3%A4it%C3%B6skirjapalkinto-wilhelmiina-h%C3%A4m%C3%A4l%C3%A4iselle-tilastotieteellisesti-p%C3%A4te...

26.06.2013 - 11:17 Pirjo Moen
06.06.2011 - 10:16 Hannu Toivonen