Kuvankäsittely, XML, Semanttiset ontologiat.
Semantic Computing -tutkimusryhmä
Marianne Korpela
Semantic Computing -ryhmässä kehitetään älykkäitä, Semantic Web -teknologioihin perustuvia tiedonhaun ja -hallinnan välineitä mm. museokokoelmien WWW-käyttöön liittyen. Semantic Web on World Wide Web -konsortion visio seuraavan polven älykkäästä Internetistä, jonka sisältöjä ymmärtävät ja käyttävät ihmisten ohella myös koneet. Tämän sovelluksen pääalueita ovat digitaalinen kuvankäsittely ja XML-dokumenttien hallinta.
Kuvan merkityksellisiä osia (ikoneita) rajataan kuvankäsittelyvälineillä. Välineitä ovat ainakin nelikulmio-grid, jana-työkalu ja freehand-rajain. Allaoleva kuva ilmentää tilannetta, jossa rajataan eri henkilöiden peittämä alue jana-työkalulla.
Tulosteena ohjelma antaa XML-tiedoston johon sisältyy 1) kuvan tiedostonimi, 2) ikonin nimi, ja 3) ikonin rajaaman alueen koordinaatit. Neliö-gridiä käytettäessä koordinaattipareja tarvitaan vain neljä. Janan tapauksessa vain kaksi per jana. Freehand-rajaimen tapauksessa koordinaattien näytteenottotaajuutta tulee voida säätää. Myös koordinaattien esitystarkkuutta tulee voida säätää. Ohjelmassa tulee olla zoom-työkalu. XML-skeema, eli missä muodossa tiedot tulostetaan, tulee olla määriteltävissä erikseen. XML-tiedot tulee tallettaa lähtokohtaisesti JPG-kuvaformaatin comment-kenttään, mutta ryhmä voi hoitaa talletuksen myös muulla haluamallaan tavalla. Ohjelmalla tulee myös voida ladata sen omia tulosteita jälleenmuokattavaksi.
Tuloksena syntyy yleiskäyttöinen sovellus, ohjelmistokomponentti jonka voi integroida joustavasti eri ohjelmistoihin, ja johon voi lisätä uusia työkaluja vaivattomasti. Lähtokohtaisesti ohjelmaa käytetään prosessissa, jossa kuvan osia linkitetään semanttiseen ontologiaan. Linkitys tapahtuu muiden ohjelmien avulla. Hyötyesimerkki:
Sähköisessä valokuvanäyttelyssä on edellisten kuvien kaltaisia ryhmäkuvia. Kuviin liitty kuvateksti jossa luetellaan kuvassa olevat henkilöt: "Vasemmalla alhaalla Chirac, hänestä oikealla yläviistossa henkilö b, tästä hieman oikealle henkilö c ..." Henkilöt voi rajata toteutettavan ohjelman avulla, ja rajaukset voi yhdistää kuvatekstiin ja muihin ontologian tietoihin. Kun esimerkiksi hiiren siirtää jonkin kuvan henkilön kohdalle, kuvateksti aktivoituu ja katsoja saa tiedon kuka henkilö on kyseessä; siirtämällä hiiren kuvatekstin nimen kohdalle, vastaava alue aktivoituu kuvassa.
Ryhmä voi päättää ohjelmointikielistä ja muusta toteutusympäristöstä.
Osallistujilta toivotaan kokemusta XML:stä (esim. kurssit XML-metakieli ja Rakenteisten dokumenttien käsittely), kuvankäsittelystä ja kiinnostusta semantic web teknologioihin ja tekoälyyn yleensä. Myös käyttöliittymien tuntemuksesta on hyötyä.
Projekti toteutetaan laitoksen yleisen lisenssisopimuksen alaisuudessa sillä lisäoikeudella, että kaikki sopimuksen allekirjoittajat voivat hyödyntää projektin tuloksia myös MIT-sopimuksen mukaisesti.
Kesä 2003.