Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos

Tietoa laitoksesta:

 

581264 Tutkimustiedonhallinnan peruskurssi, 3 ov, kevät 2004

Tämä sivu: http://www.cs.helsinki.fi/hannu.toivonen/teaching/tutihaK04/

Kurssi käsittelee tutkimusaineistojen käsittelyä ja niiden analysoimista laskennallisin menetelmin. Nimestään huolimatta kurssi ei keskity tiedonhallintaan, vaan tiedon analysoinnilla on myös suuri osuus. Osallistujilta edellytetään perustietoja ja -taitoja ohjelmoinnissa. Kurssiin kuuluu olennaisena osana harjoitustyö, joka on tarkoitus tehdä omasta aineistosta.

Kurssikuvaus

Luennot 16.3.-29.4. ti 10-12, to 12-14 (huom: torstain aika muuttunut opinto-oppaassa ilmoitetusta) sali A217, Teollisuuskatu 23, Vallila

(Lasku)harjoitusryhmät: 22.3.-7.5.

  1. Ti 12-14 B453 (tuntiop. Olaf Laczak)
  2. To 14-16 B453 (tuntiop. Olaf Laczak)

Harjoitustyöohjausta (harjoitustyöohjeet):

Kurssipalaute

Ole hyvä ja täytä kurssipalaute. Autat kehittämään laitoksen opetusta!

Ajankohtaista

Muista ilmottautua tenttiin. Tarkista kokeen aika ja paikka tenttilistasta.

Luentokalvot (täydentyvät kurssin aikana)

Luentokalvoista on kolme samansisältöistä versiota:

Luentokalvot yms. materiaali:

Laskuharjoitustehtävät

  1. Laskuharjoitustehtävät (ti 23.3., to 25.3.)
  2. Laskuharjoitustehtävät (ti 30.3., to 1.4.)
  3. Laskuharjoitustehtävät (ti 6.4., to 15.4.)
  4. Laskuharjoitustehtävät (ti 20.4., to 22.4.)
  5. (ei laskareita ti 27.4., to 29.4.)
  6. Laskuharjoitustehtävät (ti 4.5., to 6.5.)

Laskareita pidetään viidet. Vähintään kolmessa on oltava läsnä.

Mallivastauksia

Kurssille ilmottautuville

Kurssiin kuuluu pakollinen harjoitustyö, jonka osuus on kurssista on noin kolmannes. Harjoitustyössä tehdään suunnitelma jonkin aineiston tiedonhallinnasta sekä toteutetaan ja testataan laskennallisia analyysimenetelmiä samalla aineistolla. Harjoitustyö tehdään pareittain tai yksin.

Jokainen opiskelija(pari) on vastuussa oman aineistonsa hankkimisesta. Aineisto voi liittyä esim. omaan tutkimukseen, opiskeluun, työhön tai harrastuksiin. Aineiston etsiminen kannattaa aloittaa jo ennen kurssin alkua. Jos et pysty hankkimaan "omaa" aineistoa, voit etsiä aineistoja esim. tämän kurssin aiemmista harjoitusaineistoista tai internetistä UCI KDD Archivesta tai Machine Learning Repositorysta. Sopiva aineisto on sellainen, jonka sisällön ymmärrät, ja joka käsittelee sinua kiinnostavaa asiaa. Aineistossa olisi hyvä olla vähintään satoja havaintoja (rivejä) ja kymmenen attribuuttia (saraketta).

Kurssiin kuuluvasta pakollisesta harjoitustyöstä tulee erilliset ohjeet. Tarkemmat ohjeet voi katsoa kurssin harjoitustyöohjeista.

Kurssin (suunniteltu) luentoaikataulu

Kurssin tärkeät päivämäärät:

Laskuharjoitustehtävistä

Harjoitustehtävät ovat ylempänä kohdassa "Laskuharjoitustehtävät"

Laskuharjoituksiin osallistuminen on pakollista. Laskuharjoituksia on viidet, joista vähintään kolmessa on oltava läsnä. Läsnäoloksi lasketaan osallistumiskerta, jona opiskelija on tehnyt vähintään puolet harjoituskerran kotitehtävistä.

Laskuharjoitustehtävät tehdään kotiläksynä ennen harjoitusryhmän kokoontumista; opiskelijoiden esittämiä ratkaisuja käsitellään sitten kokoontumisissa. Hyväksi lasketaan vain tehtävät, jotka opiskelija ilmoittaa tehneensä harjoitusten aluksi kiertävällä listalla. Tehtävän merkintä listalle tarkoittaa, että opiskelija on valmis esittämään ratkaisuehdotuksensa laskuharjoituksissa. [Muutos 6.4.04:] Kurssin assistentti (tai tehtävän tekijä) toimittaa malliratkaisun kurssimappiin sekä mielellään verkkoon.

Kurssimateriaali

Kaikki kurssin materiaali on kurssimapissa. Lähteitä [1,2,5] lukuun ottamatta kaikki muu materiaali tullee olemaan saatavilla sähköisesti alla olevasta listasta.

Tenttiin sisältyvä materiaali (täsmennetty 30.4.2004):

Lähteet:

Muuta hyödyllistä oheismateriaalia (ei tule tenttiin)