Esa Junttila väitös 10.8.: Aineiston uudelleenjärjestäminen paljastaa sen sisäisen rakenteen

FM Esa Junttila väittelee keskiviikkona 10.8.2011 kello 12 (Helsingin yliopiston päärakennus, Fabianinkatu 33, Sali 13 (uusi puoli), 3. kerros) aiheesta "Patterns in Permuted Binary Matrices".  Tutkimus kuuluu tietojenkäsittelytieteen alaan ja erityisesti tiedonlouhintaan.

 

Aineiston uudelleenjärjestäminen paljastaa sen sisäisen rakenteen

Elektroniset aineistot ovat usein suuria ja niiden sisältämät hahmot aluksi tuntemattomia, joten hahmojen löytämiseen tarvitaan tehokkaita tietokoneohjelmia. Hahmojen tunnistaminen auttaa kuvailemaan esimerkiksi nisäkäs- ja murresana-aineistojen sekä sosiaalisten verkostojen rakennetta. Parhaimmillaan tämä auttaa aineistoihin liittyvien tosimaailman ilmiöiden selittämisessä. Helsingin yliopistossa tarkastettava Esa Junttilan tietojenkäsittelytieteen alan väitöskirjatutkimus esittelee uusia automaattisia menetelmiä, jotka tunnistavat säännönmukaisuuksia aineistoissa.

Uudet menetelmät perustuvat aineiston uudelleenjärjestämiseen, joka tuo aineiston sisältämän hahmon esiin. Aineistolla tarkoitetaan taulukkomuotoista dataa, joka sisältää vain ykkösiä ja nollia. Esimerkiksi ykköset nisäkkäiden levinneisyystaulukossa merkitsevät, että tietty nisäkäs elää tietyllä seudulla. Menetelmissä taulukon rivit ja sarakkeet järjestetään niin, että hahmo erottuu ihmisille mahdollisimman selvästi. Nisäkäsaineistolle sovellettuna kuvatut menetelmät voivat tuottaa esimerkiksi nisäkkäiden hierarkian, ryhmittymiä tai muun järjestyksen.

Teoreettinen tarkastelu synnyttää hahmojen etsintään nopeita algoritmeja, jotka pystyvät käsittelemään tuhansia rivejä ja sarakkeita. Haasteena on menetelmien kyky sietää virheitä: esiintyvä hahmo on löydettävä silloinkin, kun aineiston laatu on kehno. Räätälöidyt tilastolliset testit kertovat lopulta löydetyn hahmon merkitsevyyden.

Väittelijä on etsinyt kuvatuilla menetelmillä hahmoja esimerkiksi geneettisestä aineistosta, sosiaalisista verkostoista sekä nisäkkäiden, murresanojen ja fossiilien esiintymistä. Löydetty säännönmukaisuus vahvisti käsitystä tutkittujen aineistojen sisäisestä rakenteesta ja rohkaisee jatkotutkimuksiin vastaavilla tutkimusaloilla, kuten ekologiassa ja paleontologiassa.

Väitöskirjan saatavuus

Väitöskirjan elektroninen versio on saatavilla e-thesis-palvelussa ja väittelijän www-sivulla:

http://helda.helsinki.fi/handle/10138/27248

http://www.cs.helsinki.fi/u/ejunttil/publications/Patterns_Junttila_2011.pdf

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään:  040-8234987, esa.junttila@alumni.helsinki.fi

05.08.2011 - 10:03 Hannu Toivonen
05.08.2011 - 09:56 Hannu Toivonen