Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Tietojenkäsittelytieteen laitos

Tietoa laitoksesta:

 

582413 Tiedon eristäminen tekstistä (2 ov)

582413 Information extraction in text (2 cu)Lectures/luennot: Prof. Helena Ahonen-Myka

Tutoring/harjoitukset: Tuntiop. Lili Aunimo

Classes/Kokoontumiset: pe 31.1. A414, pe 21.2. A414 (harjoitukset B453), ma 17.3. A414 (harj A320) ja ti 18.3. A217 (harj A320)

Lectures/luennot: 12-16

Exercise sessions/harjoitukset: 10-12 (ei 31.1.)

The lectures and exercise sessions will be in Finnish, but all the material will be in English. The lectures and exercise sessions are voluntary, but there will be (partially obligatory) weekly exercises "submitted" as web pages.

Contents/Sisältö

Kurssilla käsitellään erilaisia tapoja tunnistaa tekstistä jonkin sovelluksen kannalta merkityksellistä tietoa, esim. erisnimiä, termejä, tapahtumia tai suhteita. Eristämismenetelmistä tarkastellaan mm. lingvististä analyysia, hahmontunnistusta ja tilastollisia menetelmiä.

Prerequisites/Esitiedot

Kohtuullinen ohjelmointitaito. Hyötyä lienee säännöllisten lausekkeiden ja kielioppien peruskäsitteiden tuntemisesta (esim. kurssilta Ohjelmoinnin ja laskennan perusmallit).Helena.Ahonen-Myka