Yliopiston etusivulle Suomeksi Inte på svenska No english version available
Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos



58307106  Yksityisyyden säilyttävä tiedon louhinta (3 op, 2 ov)

Seminaari on suunnattu erityisesti tiedon hallintaan erikoistuville opiskelijoille.

Sivun sisältö:

Aihepiiri

Tiedon louhinta (data mining) on tietojenkäsittelytieteen osa-alue, joka pyrkii löytämään mielenkiintoisia ja aiemmin tuntemattomia säännönmukaisuuksia ja hahmoja laajoista tietokokoelmista. Tällaiset toistuvat hahmot voivat antaa hyödyllistä informaatiota, mutta myös uhata niiden henkilöiden tai tahojen yksityisyyttä, joita nämä löydetyt hahmot kuvaavat. Tiedon louhinnan alalla onkin viime vuosina yhä enemmän ryhdytty tutkimaan ja etsimään menetelmiä, joilla voitaisiin taata louhinnan kohteiden yksityisyys. Tätä tiedon louhinnan osa-aluetta kutsutaan yksityisyyden säilyttäväksi tiedon louhinnaksi (privacy-preserving data mining).

Tämä seminaari on luonteeltaan opintoseminaari, jossa tutustutaan erilaisiin lähestymistapoihin ja menetelmiin, joilla yksityisyyttä voidaan pyrkiä tiedon louhinnan yhteydessä suojamaan.

Esitiedot

Seminaariin osallistuminen edellyttää Tieteellisen kirjoittamisen kurssin suoritusta. Seminaarin suorittamisen kannalta hyödyksi ovat myös perustiedot tiedon louhinnasta (esimerkiksi kurssien Tietämyksen muodostaminen tai Tiedon louhinnan menetelmät laajuudessa).

Seminaarin suorittaminen ja työtavat

Seminaarin suorittamiseen liittyvät seuraavat tehtävät:

  • Tiivistelmä seminaarityön sisällöstä. Tiivistelmä on noin 1-2 sivun mittainen kuvaus valitusta aihepiiristä kirjallisuusluetteloineen. Tiivistelmät julkaistaan seminaarin verkkosivulla kaksi-kolme viikkoa seminaarin käynnistymisen jälkeen.

  • Kirjallinen alustus. Teksti perustuu valittuun aihepiiriin liittyvään muutamaan tieteellisen artikkeliin tai kirjan lukuun. Alustuksen pituus tulisi olla noin 10-15 sivua. Tekstit julkaistaan seminaarin verkkosivulla hyvissä ajoin ennen esitystä joko ps- tai pdf-muodossa.

  • Suullinen esitys. Kirjallisuuteen pohjautuvassa suullisessa esityksessä voidaan laajentaa ja havainnollistaa asiaa esimerkkien ja kuvien avulla. Esityksen jälkeen on varattu aikaa keskustelulle (kysymyksille ja kommenteille).

  • Aktiivinen osallistuminen ryhmän keskusteluun. Kommenttien ja kysymysten esittäminen esiintyjälle edellyttää etukäteistutustumista kirjallisiin esityksiin. Seminaarissa on läsnäolopakko, ja läsnäolo edellyttää vähintään yhtä asiaan liittyvää kysymystä tai huomautusta tilaisuuden aikana.

  • Palautteen antaminen muiden töistä. Kukin kommentoi kahden muun osallistujan kirjallista työtä sen valmisteluvaiheessa. Kunkin istunnon lopuksi kukin osallistuja kirjaa nimettömänä muutaman vahvan ja muutaman heikon kohdan käsiteltävistä töistä (kirjallinen esitys, suullinen esitys, jäsentely, kalvot, esiintyminen, jne.).

Katso myös laitoksen yleistä seminaariohjetta.

Ohjelma

Seminaari kokoontuu kevätlukukaudella 2007 perjantaisin klo 12-14 salissa C221. Seminaarin vetäjänä toimii Pirjo Moen.

Seminaarin aloitustilaisuus pidetään perjantaina 19.1.2007 klo 12-14. Aloitustilaisuuden yhteydessä sovitaan seminaaritöiden aiheet ja esitelmäaikataulu.

Seminaarin aloitustilaisuuden materiaali:

Esitelmäaikataulu:

Pvm Aihepiiri
16.3. Yksityisyyden turvaaminen tiedon louhinnassa (taustaa)
16.3. Aineiston sekoittaminen
23.3. Aineiston anonyymisointi
23.3. Aineiston puhdistus/ löydettävien hahmojen piilottaminen
30.3. Turvallinen monen osapuolen laskenta
13.4. Yksityisyyden säilyttävä assosiaatioiden laskenta
13.4. Yksityisyyden säilyttävä klusterointi
20.4. Käänteinen tiedon louhinta
20.4. Yhteenveto

Aihepiirin kirjallisuutta


Pirjo Moen