Doris Entner väittelee 20.11.2013 aiheesta Kausaalirakenteen oppiminen ja rakenteeseen kuuluvien syy-seuraussuhteiden voimakkuuksien tunnistaminen

Dipl.-Ing. Doris Entner väittelee 20.11.2013 kello 12 (Helsingin yliopiston päärakennus, Fabianinkatu 33, Sali 5 (uusi puoli), 3. kerros) aiheesta "Causal Structure Learning and Effect Identification in Linear Non-Gaussian Models and Beyond". Tutkimus kuuluu tietojenkäsittelytieteen alaan ja erityisesti data-analyysiin. Vastaväittäjänä toimii Senior Research Scientist Kun Zhang (Max Planck Institute of Intelligent Systems) ja kustoksena professori Jyrki Kivinen (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Kausaalirakenteen oppiminen ja rakenteeseen kuuluvien syys-seuraussuhteiden voimakkuuksien tunnistaminen

Monilla tieteenaloilla tutkijat etsivät syy-seuraussuhteita kiinnostavina pitämiensä muuttujien välillä. Suorimman lähestymistavan tähän tarjoavat satunnaistetut kontrolloidut kokeet: esimerkiksi kliinisissä kokeissa uuden lääkkeen vaikutusta johonkin sairauteen arvioidaan jakamalla potilaat satunnaisesti kahteen ryhmään, joista toiselle annetaan oikeaa lääkkeettä ja toiselle ainoastaan lumelääkkettä. Lääkkeen todellinen vaikutus selviää ryhmien tuloksia vertailemalla.

Monissa tapauksissa tällaiset kokeet eivät kuitenkaan ole mahdollisia. Esimerkiksi taloustieteilijöiden tutkiessa koulutuksen vaikutusta tuloihin, kokeeseen osallistuvien henkilöiden koulutustason suora määrääminen olisi sekä epäeettistä että käytännössä mahdotonta. Näin ollen tutkijat joutuvat usein turvautumaan passiivisesti kerättyyn (ei-kokeelliseen) havaintoaineistoon. Tällainen aineisto ei kuitenkaan välttämättä kerro suoraan kausaalisuhteista, sillä havaitsemattomat muuttujat saattavat oleellisesti vaikeuttaa aineiston hyödyntämistä. Esimerkiksi yksilön kyvyt ja lahjakkuus voivat vaikuttaa suoraan sekä hankittuun koulutukseen että saavutettuun tulotasoon. Tällaisten mittaamattomien ominaisuuksien sivuuttaminen voi aiheuttaa merkittävää harhaa aineiston analyysissä.

Tärkeäksi tutkimusaiheeksi on siten muodostunut kausaalisuhteiden oppimisen passiivisesta havaintoaineistosta mahdollistavien menetelmien kehittäminen. Vaikka tutkimusongelma on vanha, aihealueen tutkimus sai 1980-luvun loppupuolella uutta vauhtia ja on ollut hyvin aktiivista siitä lähtien. Tässä väitöskirjassa kehitetään ja sovelletaan menetelmiä syy-seuraussuhteiden oppimiseen ja piilomuuttujien vaikutusten havaitsemiseen passiivisesti kerätyssä havaintoaineistossa. Väitöskirja keskittyy suurelta osin hiljattain kehitettyyn viitekehykseen, joka perustuu lineaarisiin epägaussisiin asyklisiin malleihin (LiNGAM-mallit).

Väitöskirjan alkuosa käsittelee aikasarjoja: ensin LiNGAM-pohjaista menetelmää sovelletaan kahteen taloustieteelliseen havaintoaineistoon, jonka jälkeen aikaisemmin tunnettu algoritmi (joka huomioi sekä piilomuuttujat että epälineaariset vaikutussuhteet) laajennetaan käsittelemään aikasarja-aineistoa. Toisaalta väitöskirja tarjoaa myös uusia työkaluja ei-temporaalisen aineiston analyysiin: LiNGAM-mallia laajennetaan kuvaamaan kausaalirakennetta moniulotteisten muuttujien välillä, ja esitetään menetelmä, jolla yksittäisiä syy-seuraussuhteita voidaan löytää piilomuuttujia sallivissa LiNGAM-malleissa. Lopuksi väitöskirja käsittelee kausaalisuhteen voimakkuuden arviointia havaitsemattomien muuttujien vaikeuttaessa aineiston analyysiä, sekä LiNGAM-malleissa että malleissa ilman parametrisia rajoitteita.

Kaiken kaikkiaan tämä väitöskirja tarjoaa soveltajille useita uusia työkaluja kausaalitiedon löytämiseen passiivisesta havaintoaineistosta.

Väitöskirjan saatavuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-952-10-9407-1.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: doris.entner@cs.helsinki.fi.

07.11.2013 - 09:47 Pirjo Moen
06.11.2013 - 13:11 Pirjo Moen