Yuan Zou väittelee 3.3.2017 aiheesta Bayes-verkkojen ja logistisen regression mallinvalinta

FM Yuan Zou väittelee perjantaina 3.3.2017 klo 14 Helsingin yliopiston Exactum-rakennuksen auditoriossa B123 (Gustaf Hällströmin katu 2b) aiheesta "On Model Selection for Bayesian Networks and Sparse Logistic Regression". Vastaväittäjänä toimii professori Ioan Tabus (Tampereen teknillinen yliopisto) ja kustoksena professori Petri Myllymäki (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Bayes-verkkojen ja logistisen regression mallinvalinnasta

Mallinvalinta on eräs tieteellisen tutkimuksen perustavanlaatuisista ongelmista. Tässä väitöskirjassa käsittelemme useita tutkimuskysymyksiä liittyen tilastollisen mallinvalintaan, jossa tavoitteena on valita aineistoon parhaiten sopiva tilastollinen malli. Tarkastelemme Bayes-verkkojen ja logistisen regression mallinvalintaongelmia sekä teoreettisesta että soveltavasta näkökulmasta.

Vertaamme ensin eri mallinvalintakriteereitä Bayes-verkkojen oppimiseen ja keskitymme Fisher-informaatioapproksimaatioon (Fisher Information Approximation, FIA) pohjautuvaan kriteeriin. Näytämme, että FIA epäonnistuu mallinvalinnassa, kun kandidaattimallit ovat monimutkaisia ja aineiston määrä on rajoitettu. Osoitamme, että vaikka bayesiläinen informaatiokriteeri (Bayesian Information Criterion, BIC) on FIA:ta karkeampi, se tuottaa useimmiten parempia tuloksia.

Seuraavaksi esittelemme rakenteelliseen odotusarvon maksimointiin perustuvan Semstem-algoritmin, jota voidaan käyttää historiallisten käsikirjoitusten evolutionaarisia suhteita mallintavien stemmatologisten puiden oppimiseen Bayes-verkkojen erikoistapauksina. Semstem valitsee parhaat mallit käyttämällä suurimman uskottavuuden kriteeriä, joka on tässä tapauksessa yhtäpitävä BIC:n kanssa. Näytämme, kuinka Semstem tuottaa kahdella suorituskyvyn mittaamiseen käytetyllä aineistolla yleensä tarkempia ja paremmin tulkittavia tuloksia kuin tietyt muut tunnetut menetelmät.

Ennen kuin käsittelemme eräitä toisentyyppisiä Bayes-verkkoja, tarkastelemme tehokasta muuttujienvälisten yhteisvaikutusten oppimista. Sovellamme syötemuuttujiin kantafunktioita pienentääksemme hakuavaruutta ja muunnamme alkuperäisen ongelman logistisen regression mallinvalintaongelmaksi. Näin voimme käyttää Lasso-menetelmää valitsemaan pienen ja tehokkaan osajoukon suuresta joukosta ennustemuuttujia. Näytämme, että Lasso-perustainen menetelmä on useissa eri tilanteissa vakaampi kuin eräs aiempi menetelmä.

Laajennamme Lassoon perustuvaa menetelmää sellaisten Bayes-verkkojen oppimiseen, jotka sisältävät paikallisia rakenteita eli säännönmukaisuuksia ehdollisissa todennäköisyysjakaumissa. Osoitamme menetelmämme olevan tehtävään soveltuvampi kuin eräät klassiset menetelmät, jotka eivät huomioi paikallisia rakenteita. Jos paikalliset rakenteet ovat monimutkaisia, menetelmämme tulokset ovat lisäksi parempia kuin kahden muun paikallisten rakenteiden oppimiseen suunnitellun menetelmän.

Väitöskirjan saatavuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-951-51-2968-0.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: yuan.zou@cs.helsinki.fi.

 

03.03.2017 - 08:34 Pirjo Moen
06.02.2017 - 13:47 Pirjo Moen