Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos

Tietoa laitoksesta:

 

582448 Tiedon louhinnan menetelmät (6 op, 3 ov), syksy 2005

Tämä sivu: http://www.cs.helsinki.fi/hannu.toivonen/teaching/tilomes05/

Kotikoe + esimerkkivastauksia (18.1.2006).

Kurssilla tutustaan tiedon louhinnan keskeisiin käsitteisiin ja menetelmiin sekä tiedon louhintaprosessiin. Tiedon louhinta tai tietämyksen muodostaminen tietokannoista (knowledge discovery from databases, data mining, database mining) on tietojenkäsittelytieteen osa-alue, jossa pyritään löytämään mielenkiintoisia säännönmukaisuuksia laajoista tietokokoelmista.

Kurssilla sovelletaan ns. tutkivan oppimisen menetelmää, jossa pääosa työskentelystä tapahtuu ryhmissä omatoimisesti ongelmia ratkomalla. Siksi kurssin suorittaminen vaatii tavallista enemmän omatoimisuutta sekä aktiivista osallistumista harjoitusryhmän toimintaan. Työmäärä ei kuitenkaan ole sen suurempi kuin muissa opintopistemääriltään vastaavissa kursseissa. Kurssi sisältää sekä teoreettista että käytännöllistä materiaalia.

Oppimistavoitteet

Kurssin käytyään opiskelija

Opetus

Luennot: 5.9.-28.11. MA 9-12 B222 (Exactum, Gustaf Hällströmin katu 2b, Kumpula)

Harjoitusryhmät: 8.9.-2.12. TO 9-12 BK107 (huom: paikka vaihtuu 22.9. alkaen) (Exactum, Gustaf Hällströmin katu 2b, Kumpula)

Huom: Kurssi sijoittuu syksyn molemmille periodeille. Opetusta ei pidetä koe- ja väliviikoilla 17.10.- 30.10.

Huom: Luentojen ja harjoitusryhmätyöskentelyn raja on häilyvä. Ryhmätöitä käsitellään (esitellään) myös luentoaikoina, ja harjoituksiin varatulla ajalla käydään läpi myös yleistä materiaalia. Osa opetukseen varatusta kuudesta viikkotunnista on ryhmien vapaassa käytössä. Ryhmätyöhön ryhtyvillä on läsnäolovelvollisuus erikseen sovittavissa ohjaus- ja esittelytilaisuuksissa (yllä kurssin opetukseen varattuina aikoina).

Kurssikokeen voi suorittaa joko kotikokeena tai perinteisenä tenttinä 16.12. Suoritustavaksi saa valita vapaasti jomman kumman. Kotikoe on soveltavampi, tentti teknisempi. Kurssi on mahdollista suorittaa myös pelkällä kokeella ilman harjoitustöitä. Koemateriaali: ks. "Course material" alla.

Opettaja: prof. Hannu Toivonen

Harjoitustehtävät/ongelmat

Harjoitustehtävät/ongelmat

Course material

The contents of the course are covered by the book
Jiawei Han and Micheline Kamber: Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, August 2000. 550 pages. ISBN 1-55860-489-8.

Course contents by book chapters:

Kalvoja (Huom: kalvoilla käsitellään vain pieni osa kurssin sisällöstä. Kalvoista EI saa oikeaa kuvaa kurssin sisällöstä tai vaatimuksista!)

(Slides below are not intended to cover all course material. The book and the list above are the definite contents of the course for the exam.)

Aineistoja, ohjelmistoja, muita hyödyllisiä lähteitä

In English

An English group will be set up by Fri 16 Nov. Contact Petteri Sevon (petteri.sevon@cs.helsinki.fi) as soon as possible if you want to participate.

It is also possible to only take the exam, also in English, and get the full credits. This is the same exam that the students from the course will take. The material to be examined is listed above ("Kurssimateriaali", sections of the Han et Kamber book). See the course map for the material.