581257-8 TIEDONHAKUMENETELMÄT
Kurssin asema ja tavoite
Kurssi on tietojenkäsittelyopin laudaturin erikoiskurssi, laajuudeltaan 3 opintoviikkoa. Kurssin tavoitteena on perehdyttää perinteisiin tiedonhaun (information retrieval) menetelmiin sekä niiden soveltamiseen Internet-ympäristössä.Ajankohtaista
Harjoitustyön arvosteluLopputulokset
Kurssin sisältökohtia
- Johdanto (motivointi, sisällön kuvailu, materiaali)
- Perinteiset tiedonhakumenetelmät (information retrieval; IR)
- Käänteishakemistoon perustuva tiedonhaku, Boolen malli
- Dokumenttien indeksointi
- Vektorimalli
- Dokumenttien automaattinen ryhmittely
- Nimikirjoitustiedostot
- Käytännön tiedonhaun perusteista
- Merkkijonohakuun perustuvat menetelmät
- Informaation suodatus (filtering)
- Hyperteksti ja tiedonhaku
- Digitaaliset kirjastot (digital libraries)
- Metatiedot
- Hakukoneet
Kurssimateriaali
Kurssilla ei ole käytössä yhtenäistä oppikirjaa. Perinteisten menetelmien päälähteinä ovat- Salton. G., Automatic text processing. Addison-Wesley, 1989 (Part 3, ss. 227-373 pääpiirteissään).
- Frakes, W.B. & Baeza-Yates, R. (eds.), Information retrieval: data structures and algorithms. Prentice-Hall, 1992. (osia)
- Witten, I.H., Moffat, A. & Bell, T.C., Managing Gigabytes. Van Nostrand Reinhold, 1994. (osia)
- Järvelin, K., Tekstitiedonhaku tietokannoista. Suomen ATK-Kustannus Oy, 1995. (osia, yleistä taustaa)
Erityisesti kurssin loppupuolella materiaali on enimmäkseen alkuperäisartikkeleita ja WWW-materiaalia.
Harjoitustehtävät
- Harjoitus 1
- Harjoitus 2
- Harjoitus 3
- Harjoitus 4
- Harjoitus 5
- Harjoitus 6
- Harjoitus 7
- Harjoitus 8
- Harjoitus 9
- Harjoitus 10
- Harjoitus 11
- Harjoitus 12
- ...........
Harjoitustyö
Työohje

