Tiedon louhinnan menetelmät S05
Ongelmat/harjoitustyöt
Harjoitustyöohje
Esimerkillinen harjoitustyöraportti:
harjoitus 1, klusterointi, ryhmä "Rimaa hipoen"
-
(kauneuspilkkuna java-koodi, jonka olisi voinut mieluummin
korvata määritelmällä tai pseudokoodilla, tai antaa vain liitteessä)
-
täsmennys ohjeisiin: laittakaa jatkossa raportteihin myös
tekijöiden sähköpostiosoitteet
Sisältö. Raportissa kuvataan, miten annettua ongelmaa
lähestyttiin ja käsiteltiin, ehdotetut ratkaisut perusteluineen,
suoritetut kokeet ja niiden tulokset,
johtopäätökset sekä tulosten ja ratkaisun (kriittistä)
pohdintaa.
-
Työn ja raportin painotuksissa kannattaa käyttää apuna mm. kurssin
kotisivulla annettuja oppimistavoitteita.
Keskittykää oleelliseen, ja kysykää tarvittaessa neuvoa
- myös siitä, mikä on oleellista.
-
Erilaiset yksinkertaistukset ja kompromissit ovat sallittuja
(ja suorastaan suotavia työmäärän hallitsemiseksi, etenkin jos
ne koskevat kurssin ydinaineksen ja oppimistavoitteiden ulkopuolisia
asioita).
Dokumentoikaa ja perustelkaa ne. Pohtikaa myös niiden mahdollista
vaikutusta.
-
Tehkää ja raportoikaa enemmän kokeita kuin vain yksi.
Kokeilkaa käytännössä menetelmän toimintaa eri tilanteissa,
ja pyrkikää analysoimaan, ymmärtämään ja selittämään havaitsemianne
ilmiöitä. Esim. klusteroinnissa voi tehkä jonkin tai joitakin
seuraavista kokeista:
-
Tehkää kokeita eri tavoin skaalatuilla attribuuteilla.
Miten saadut klusteroinnit poikkeavat toisistaan? Miksi?
-
Miten attribuuttien valinta vaikuttaa tuloksiin?
-
Tuottaako k:n keskipisteen menetelmä (k-means) samoja vai
eri tuloksia, kun se aloitetaan erilaisista satunnaisista
pisteistä? Kuinka erilaisia tuloksia? Mitähän se voisi
kertoa menetelmästä tai aineistosta?
-
Miten klusterien lukumäärän k vaihteleminen vaikuttaa tuloksiin
(erityisesti k:n keskipisteen menetelmä)? Mitä johtopäätöksiä
tästä voi tehdä?
-
Jakakaa aineisto satunnaisesti kahteen osaan.
Saatteko samantapaiset klusteroinnit molemmista aineistoista?
-
Tulkitkaa saamianne tuloksia. Mikä on vastauksenne alkuperäiseen
ongelmaan? Kuinka varma tai luotettava vastaus on?
-
Raportti kirjoitetaan siten, että sen "kohdeyleisönä" ovat
muut kurssin kävijät tai muut vastaavassa opintojen vaiheessa
olevat (eikä opettaja).
Vähintään yhden kurssin harjoitustöistä on perustuttava ryhmän itse
tekemään toteutukseen tiedon louhinta-algoritmista.
Ulkoasu. Varsinaisen tekstiosan lisäksi työhön on liitettävä kansilehti,
josta käyvät ilmi ainakin työn nimi, työn tyyppi, tekijät,
tekijöiden sähköpostiosoitteet ja
päiväys. Työn ulkoasun ja tyylin on hyvä noudattaa esim. tieteellisen
kirjoittamisen kurssilla annettuja ohjeita, pääasia kuitenkin on
selkeys niin ulkoasussa kuin sisällössäkin.
Ohjeellinen pituus on noin 5 tekstisivua. Jos kuvia on paljon, raportti
voi olla pidempikin. Toteutusteknisiä yksityiskohtia ei tarvitse kuvata.
Jos algoritmi on toteutettu itse, tehdyt keskeiset toteutusratkaisut,
-ongelmat ja -valinnat tulee kuvata lyhyesti. Luetteloita, kaavioita
yms. voi hyvin laittaa myös liitteisiin, jotta varsinainen raporttiteksti
säilyy helpommin luettavana.
Työn palautus.
Kukin harjoitustyö palautetaan perjantaina opettajalle viimeistään klo 15.
Työ palautetaan
-
mieluiten paperilla (Hannu Toivoselle,
huone A320 Exactumin 3. krksessa tai huonetta vastapäisessa aulatilassa
olevalle hyllylle), tai
-
sähköisesti joko sähköpostiviestin liitetiedostona tai linkkinä,
jossain yleisesti käytetyssä ja varmasti tulostuvassa formaatissa
(esim. pdf, ps, doc);
sähköisesti palautettavan työn on oltava yksi tulostettava tiedosto.
Itsearvio
Harjoitustyön lisäksi jokainen harjoitustyöhön osallistunut palauttaa lyhyen,
kriittisen itsearvion työskentelystä ja oppimisesta
(itsearviointipohja).
- Mitä opin tässä harjoituksessa?
- Millaisia oppimistavoitteita minulla tai ryhmällä oli,
ja miten saavutin nämä tavoitteet?
- Mitä jäi epäselväksi?
- Kuinka hyvin ryhmämme toimi? Onnistumiset ja ongelmat?
- Miten omaa ja ryhmäni työskentelyä ja oppimista voisi parantaa?
- Miten harjoitustehtävää, opetusta ja kurssia voisi muuttaa paremmin
tukemaan oppimista?
- Mahdollinen muu palaute ja pohdinta.
Toisessa ja myöhemmissä itsearvioissa listan neljässä viimeisessä kohdassa
voi kertoa mieluummin tapahtuneista muutoksista kuin toistaa edellisiä
arviointeja.
Ryhmän tulosta ei arvioida itsearvion perusteella.
Itsearviossa arvostetaan realistista, analyyttistä ja tarvittassa
kriittistäkin näkemystä omasta ja ryhmänkin työskentelystä.
Ristiinarvio
Jokainen harjoitustyö arvioidaan myös ristiin.
Jokainen ryhmä tekee lyhyen arvion yhden toisen ryhmän työstä.
Arvio palautetaan sähköpostissa suoraan työn tehneelle ryhmälle
(sähköpostiosoitteet raportissa) sekä kopiona Hannu Toivoselle.
Arvio palautetaan viimeistään projektityön palautusta seuraavan
torstain harjoituksen aikana.
Arvion sisältö:
-
Raportin keskeiset asiat omin sanoin muutamalla lauseella kuvattuna:
käytetyn ratkaisun periaatteet, tehdyt valinnat, kokeet, tulokset.
-
Raportin ja raportoidun työn vahvuudet.
Opitteko jotain tai saitteko uusia ideoita lukemalla raportin?
Lyhyet ranskalaiset viivat riittävät.
-
Raportin ja raportoidun työn parannuskohteita.
Lyhyet ranskalaiset viivat riittävät.