Yliopiston etusivulle Suomeksi Inte på svenska No english version available
Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos

58147-9 Koneoppiminen (4 ov)

Kurssin vastuuhenkilö on Jyrki Kivinen. Kurssi luennoidaan keväällä 2005.

Yleistä

Koneoppiminen on perinteisesti katsottu tekoälyn osa-alueeksi, jonka pohjimmainen ongelma on saada älykäs agentti mukautumaan toimintaympäristöönsä siitä tekemiensä havaintojen pohjalta. Nykyään koneoppimistutkimus on pitkälti irtautunut tästä taustasta ja tarkastelee yleisesti algoritmisia menetelmiä päätelmien tekemiseen havaintodatan pohjalta. Tällaisia menetelmiä on tarkasteltu aiemmin tilastotieteessä ja viime aikoina hieman toisista lähtökohdista myös nimellä tiedon louhinta.

Kurssilla esitellään viimeaikaisia tuloksia koneoppimisen perusongelmasta luokittelusääntöjen oppimisesta. Pääpaino on niiden syiden ymmärtämisessä, joiden takia jotkin algoritmit joissain tilanteissa toimivat tai eivät toimi. Käsiteltäviä algoritmeja (tai oikeastaan algoritmiperheitä) ovat mm. Perceptron, SVM ja AdaBoost. Tarkastelutapa on lähinnä matemaattinen, mutta kurssiin kuuluu myös yksinkertaisia tietokoneella tehtäviä käytännön kokeita.

Tarkempia tietoja kurssin sisällöstä on kevään 2005 kurssin kotisivulla.

Asema opetuksessa

Kurssi on algoritmien erikoistumislinjan laudaturkurssi. Se sopii hyvin myös aihepiiristä kiinnostuneille muiden erikoistumislinjojen opiskelijoille sekä jatko-opiskelijoille.

Tarvittavat matemaattiset aputulokset esitellään kurssin kuluessa, joten kovin syvällisiä esitietoja ei tarvita. Opiskelijoilla tulisi kuitenkin olla perustiedot todennäköisyyslaskennasta, lineaarialgebrasta ja differentiaalilaskennasta sekä hieman matemaattista rutiinia.

Muita aihepiiriin liittyviä kursseja ovat tietojenkäsittelytieteen laitoksella Kolme käsitettä, Tekoäly, Tiedon louhinnan menetelmät ja Machine Learning in Bioinformatics sekä monet matematiikan ja tilastotieteen kurssit.

Suorittaminen

Kurssi voidaan suorittaa tavalliseen tapaan joko luentokurssina, johon kuuluu laskuharjoituksia ja kurssikoe, tai erilliskokeella.

Erilliskokeita järjestetään laitoksen tavallisten periaatteiden mukaisesti. Seuraava erilliskoe on kesällä 2005.

Erilliskoe perustuu kurssin viimeisimmän luennointikerran materiaaliin.

Sisältö (kevät 2005, alustava)

  1. Johdanto
    • luokittelijat ja niiden oppiminen
    • lineaariset luokittelijat
    • oppimisen perusmallit ja kysymyksenasettelut
  2. Askeltava oppiminen (online learning)
    • algoritmeja lineaarisille luokittelijoille: perceptron, winnow
    • suppenemistodistukset ja marginaalin käsite
    • soveltaminen epälineaariseen luokitteluun: ydinfunktiot (kernels)
    • yleistyksiä: virhesietoisuus, regressio, muita algoritmeja
  3. Tilastollista oppimisteoriaa
    • perusmalli ja sen soveltaminen
    • oppimisvirheen arviointi: VC-dimensio, Rademacher-vaativuus
    • askeltavan ja tilastollisen oppimisen yhteys
  4. Tukivektorikone (Support Vector Machine)
    • marginaalin maksimointi optimointiongelmana
    • marginaaliin perustuva oppimisvirheanalyysi
    • yleistyksiä, sovelluksia
  5. Oppimisen tehostaminen (boosting)
    • tausta: vahva vs. heikko oppiminen
    • AdaBoost
    • muita aggregointimenetelmiä


Jyrki Kivinen