Johannes Wettig väittelee 9.2.2013 aiheesta Todennäköisyyksiin perustuvia, informaatioteoreettisia malleja etymologisen tutkimuksen tarpeisiin

FM Johannes Wettig väittelee lauantaina 9.2.2013 kello 12 (Helsingin yliopiston päärakennus, Unioninkatu 34, Auditorio XIV (vanha puoli), 3. kerros) aiheesta "Probabilistic, Information-Theoretic Models for Etymological Alignment". Tutkimus kuuluu tietojenkäsittelytieen alaan ja erityisesti informaatioteoriaan. Vastaväittäjänä toimii professori Erik Aurell (KTH - Kungliga Tekniska Höskolan, Ruotsi) ja kustoksena professori Petri Myllymäki (Helsingin yliopisto).

Todennäköisyyksiin perustuvia, informaatioteoreettisia malleja etymologisen tutkimuksen tarpeisiin

Tämä väitöskirja käsittelee kolmea aihepiiriä. Ensimmäinen niistä on todennäköisyyslaskenta ja Bayesiläinen päättely. Tämä lähestymistapa on hyödyllinen monessa tapauksessa, kun halutaan kuvata jotakin dataa yleistäen, eristää sen ominaisuuksia tai ennustaa jonkin ei-havaitun ominaisuuden arvo. Tapauksissa, joissa malliluokka eli kuvaamistapa ei ole etukäteen tiedossa, tarvitaan valintakriteeri, jonka avulla sopiva luokka löydetään. Tällaisen kriteerin määritteleminen objektiivisella tavalla on monesti vaativaa. Bayesiläinen päättely tarjoaa tähän tehtävään joitakin työkaluja, mutta usein on suotuisaa valita toisenlaisen lähestymistapa.

Lyhyimmän kuvaamisen periaate MDL katsoo todennäköisyyden maksimoinnin olevan ekvivalentti ongelma kuvaamispituuden minimoinnin kanssa, siis mahdollisimman tehokkaan tiedon pakkaamisen kanssa. Datan kuvaustapa ja sen kautta saavutettu tiedostonkoko ovat useasti helposti määriteltävissä ongelman luonteeseen sopivalla tavalla. Eri kuvaamistapoja, joita voidaan siis pitää eri malliluokkina, on myös helppo verrata keskenään pakkaamistehokkuuden avulla objektiivisella tavalla.

Näitä informaatioteorian maailmasta saatuja tuloksia sovelletaan väitöskirjan kolmannessa teoksen osassa ongelmiin, jotka syntyvät etymologiassa, sanojen historiallisen alkuperän tieteessä. Työssä on kehitetty tietokonemalleja, jotka kuvaavat sukulaiskielten suhteita toisiinsa. Niiden avulla tuotetaan sääntöjä, jotka kertovat, kuinka äänteet vastaavat toisiaan ja kuinka ne ovat muuttuneet. Mallit kertovat myös, mihin kontekstiin kukin sääntö soveltuu. Työssä esitetään mekanismi, joka automatisoidusti arvaa puuttuvat sanamuodot sekä rakentaa kieliperheelle sukupuun. Esimerkkinä työssä käytetään suomalais-ugrilaisia kieliä.

Väitöskirjan saatavuus

Väitöskirjan elektroninen versio on saatavilla Helsingin yliopiston e-thesis-palvelussa osoitteessa http://urn.fi/URN:ISBN:978-952-10-8589-5.

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: 040-4123094 tai hannes.wettig@hiit.fi.

11.02.2013 - 11:57 Pirjo Moen
16.01.2013 - 17:44 Pirjo Moen