Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos

Tietoa laitoksesta:

 

582410 Laajojen dokumenttiaineistojen käsittely (2 ov)

582410 Processing of large document collections (2 cu)


Lopputulokset / Final results

Arvostelusta voi kysellä to 17.1. klo 13.15-14.00 huoneessa B325. / You can ask about grading on Thu 17.1. at 13.15-14.00 in Room B325.


Lectures/luennot: Prof. Helena Ahonen-Myka

Tutoring/harjoitukset: Tuntiop. Lili Aunimo

Kurssi järjestetään monimuoto-opetuksena: 1+2+1 lähipäivää, jolloin 4 tuntia luentoja ja 2 tuntia harjoituksia päivässä, ja lisäksi viikottaisia harjoituksia, jotka "palautetaan" web-sivuina.

Classes/Lähipäivät: ma 17.9. A414, ma 22.10. A414, ti 23.10. A516 ja ma 26.11. A414 10-12, 13-17

Contents/Sisältö

Laajojen tekstiaineistojen, esim. sanakirjojen, korpusten ja teknisen dokumentaation, hallinta, mm. indeksointi ja tiivistäminen. Käsittelymenetelmiä, mm. poiminnat, muokkaus, lyhennelmien tuottaminen ja automaattinen aiheluokittelu. Kieliteknologisten analyysiohjelmien käyttö ja analyysitulosten hyödyntäminen.

Program(tentative)/alustava ohjelma

Material (slides, reading...)

Exercises (Checklist of points)

Exam: Tuesday 4.12. at 16-20 in Auditorio

Newsgroup for the course: hy.opiskelu.tktl.docs

The lectures and exercise sessions will be in Finnish, but all the material will be in English. If enough non-Finnish speakers attend the course, special tutoring classes in English may be considered.



Helena.Ahonen-Myka