Tripathi Abhishek: Data fusion and matching by maximizing statistical dependencies.

Tapahtuman tyyppi: 
Väitöstilaisuus
Aika: 
10.02.2011 - 12:00
Paikka: 
Auditorio CK112, Exactum
Kuvaus: 

Vastaväittelijä: Professori Florence d'Alché-Buc
Kustos: Professori Petri Myllymaki

 

Abstrakti:

 

Koneoppimisessa pyritään luomaan tietokoneohjelmia, jotka oppivat
kokemuksen kautta. Tehtävänä on usein oppia tietoaineistoista
säännönmukaisuuksia joiden avulla saadaan uutta tietoa aineiston
taustalla olevasta ilmiöstä ja voidaan ymmärtää ilmiötä paremmin.
Eräs keskeinen koneoppimisen alahaara käsittelee oppimista useita
samaa ilmiötä käsitteleviä tietoaineistoja yhdistelemällä.
Tavoitteena voi olla esimerkiksi solutason biologisen ilmiön
ymmärtäminen tarkastelemalla geenien aktiivisuusmittauksia,
proteiinien konsentraatioita ja metabolista aktiivisuutta
samanaikaisesti. Toisena esimerkkinä verkkosivuja voidaan luokitella
samanaikaisesti sekä niiden tekstisisällön että hyperlinkkirakenteen
perusteella.

Tässä väitöskirjassa esitellään uusia periaatteita ja menetelmiä
useiden tietolähteiden yhdistelemiseen. Työn päätuloksina esitellään
lineaarinen tietoaineistojen yhdistelemismenetelmä tutkivaan
analysiin, uusi menetelmä tekstiaineistojen erilaisten esitystapojen
vertailuun sekä uusi yhdistelemisperiaate tilanteisiin joissa
aineistojen näytteiden vastaavuutta toisiinsa ei tunneta ennalta.
Työssä esitetään kuinka vastaavuus voidaan oppia tietoaineistoista
itsestään, ilman ulkopuolista ohjausta. Uutta menetelmää sovelletaan
työssä esimerkiksi hakemaan vastaavuuksia ihmisten ja hiirten
metaboliamittauksista sekä etsimään samaa merkitseviä lauseita
kahdella eri kielellä kirjoitetuista teksteistä.

 

17.01.2011 - 09:50 Marina Kurtén
17.01.2011 - 09:50 Marina Kurtén