Vaalibotti Valtteri kirjoittaa vaaliuutisia kolmella kielellä

Tietojenkäsittelytieteen laitoksella on kehitetty vaalibotti Valtteri (vaalibotti.fi), joka kirjoittaa automaattisesti uutisia sunnuntain 9.4.2017 kuntavaalituloksista. Valtteri on poikkitieteellinen tutkimuskonsortion Immersive Automation ensimmäinen konkreettinen tulos. Kehitystyötä on tukenut Helsingin yliopiston Svenska social- och kommunalhögskolanin toimituksellinen ammattitaito.

Botti tuottaa vaaliuutisia suomeksi, ruotsiksi ja englanniksi kaikista Suomen kunnista. Monikielisyys on ollut yksi tutkimuksen lähtökohdista ja Valtteri onkin suunniteltu siten, että eri kieliä olisi helppo lisätä järjestelmään. 

Kieliteknologiaan erikoistunut tohtorikoulutettava Leo Leppänen Helsingin yliopiston tietojenkäsittelytieteen laitokselta on kehittänyt uutisgeneraattoria viime viikkojen ajan.

– Generaattorin ensimmäinen versio on tehty pitkälti käsin. Kokemusten perusteella pyrimme sitten tunnistamaan missä koneoppiminen tuo eniten lisäarvoa, Leppänen kertoo projektin jatkosuunnitelmista.

Valtteri valikoi oikeusministeriön vaalitulosdatasta annettuun teemaan liittyviä faktoja ja muodostaa niistä tekstikappaleita tutkimusryhmän toimittajataustaisten jäsenten tuottamien lausepohjien avulla.

– Kuten monet ihmisten tekemät asiat, tämä vaikuttaa ensisilmäykseltä suhteellisen yksinkertaiselta. Mutta tietokoneelle tässä on suuri haaste: miten kone tietää mikä on kiinnostavaa tai tärkeää? Botillamme on esimerkiksi Helsingistä yli 2 miljoonaa vaalitulosta koskevaa numeroa, muun muassa puolueiden ja ehdokkaiden kannatusten muutoksia. Ihmisellä on oleellisten asioiden poimintaan valtava määrä hiljaista tietoa. Tietokone taas ei tiedä mitään, mitä emme sille erikseen kerro, Leppänen selostaa.

– Seuraavassa vaiheessa Valtteri tavallaan seuraa ihmisjournalisteja ja pyrkii eristämään sellaista hiljaista tietoa jota tällainen järjestelmä tarvitsee.

Leppänen korostaa, että kyseessä on kokeilumielessä tutkimuksen avuksi kehitelty järjestelmä.

 

Immersive Automation -projekti kehittää näkemystä uudenlaisesta mediajärjestelmästä, jossa yhdistyvät käyttäjäelämys, automatisoitu kerronta ja läheinen yhteistyö yleisön kanssa. Datasta ja koneoppimisesta ammentava kerronta mahdollistaa nykyistä huomattavasti yksilöllisemmän ja räätälöidymmän käyttäjäkokemuksen, jossa sisällön mukautuminen on keskeinen ominaisuus.

Projektin tutkimusosapuolet ovat Helsingin yliopiston tietojenkäsittelytieteen laitos (Discovery-tutkimusryhmä), Helsingin yliopiston Svenska social- och kommunalhögskolan sekä VTT.

Projektia rahoittavat Tekes, Helsingin yliopisto, VTT, Viestintäalan tutkimussäätiö, Svenska kulturfonden ja mediayritykset.

Lisätietoa vaalibotti Valtterista ja Immersive Automation -projektista antavat

10.04.2017 - 08:40 Hannu Toivonen
07.04.2017 - 10:06 Hannu Toivonen