Metadata-projekti Määrittelydokumentin TR-kokous, 12. 10. 2005 Osallistujat Juuso Vanonen, puheenjohtaja Väinö Ala-Härkönen, sihteeri Olli Niinivaara, asiakas Joni Salmi, ohjaaja Tuomas Tanner Reima Halmetoja Johdanto-osio * Muutos: "raakadata" -> "metadata" * Kohta "samalla selvittämään onko tämän tyyppinen raakadatan tarkastelu ja poiminta mielekästä, eli voidaanko sillä tuottaa haluttuja tuloksia" poistetaan kokonaan Määritelmät-osio * Metadata: jätetään määritelmään vain ensimmäinen lause * Raakadata: loppuun tarkennus "tässä ohjelmassa" * Lähde: maininta siitä, että kyseessä ei ole nimenomaan fyysinen lähde, esimerkiksi "kuten CD-ROM-levy" -> "kuten tiedostopolku" tms. * Atomilause: korjataan "resurssi" -> "tietue" ** Transformoinnin tuloksena saatu tietueen osa * Kohta "CS-tietokanta" poistetaan (sama asia CS-BibTeX:n kanssa) * Rooli: alkuun "resurssityyppi" * Dokumentti: otetaan toinen lause eli yhteyden kuvailu pois (koska ei haluta määritellä tässä kaikkia yhteyksiä, ne on määritelty tarkemmin myöhemmin) * Yhteyden selitys kokonaan pois * Yhteysverkko: lisäys: "resurssiverkon aliverkko" * Resurssiverkko: lisäys: suunnattu, ei-painotettu verkko * Merkitysverkko: lisäys: suunnattu ja painotettu verkko * "CSV-matriisi"-selitys lisätään * PAJEK -> mainitaan pelkkä PAJEK-formaatti, ei ohjelmaa * Matriisimuotoisen CSV-tiedoston formaatti pitää määritellä jossain, samoin PAJEK-formaatin määrittelyyn viite (myöhemmin tässä tekstissä myös puhetta siitä mikä PAJEK-formaateista on se jota tuetaan) Vaatimukset ja toteutettavat toiminnot -osio * Raakadatan luku (liittyen tiedon nouto- ja transformaatiovaiheeseen): pitää varautua siihen että kahdella tiedolla (tietueella?) on sama tunniste, mutta riittää että ohjelma antaa käyttäjälle siitä virheilmoituksen * K1.1.1: Versiomäärittelyt: DC 1.1 simple + myöhemmin määriteltävät qualified-lisät, HTTP 1.0:n yli * K1.1.2: PAJEK: mikä PAJEK-formaateista? Tuetaan sitä formaattia jota Loet käyttää, selvitettävä mikä se on * K1.1.4: Onko BibTeXistä eri versioita? Määriteltävä mitä tuetaan. * K1.3.1: "sen alkuperäisessä muodossa" -> "samassa formaatissa ja semanttisesti samansisältöisenä" * K1.3.1 & K1.3.2: Poistetaan alusta "käyttäjän tuoma" * K1.5.3: mahdollista siirtää useamman lähteen data kerralla * K2.1: Määritelmät viittaavat väärään lukuun (luku 4 vaikka oikeasti 5) ja jos ei kirjoiteta liitteitä suoraan vaatimuksen yhteyteen niin merkitään ne selvästi _vaatimuksen_ liitteiksi * K2.2.1.1: ei hakukerran koko vaan integraation kesto * K2.2.1 kokonaisuus: pitää sopia tarkalleen mitkä kriteerit ovat tärkeät - pitkän vatvomisen jälkeenkin jäi vielä vähän epäselväksi * K2.3.1 liittyen pitää vähintään kirjata vaatimus siitä että testataan voiko samaan järjestelmään asentaa useampaa instanssia ohjelmistosta jotta voitaisiin kiertää yhden resurssiverkon rajoitus (ja asiakkaan mukaan mielellään vaatimus "samaan järjestelmään voi asentaa useamman instanssin ohjelmistosta" jos resursseja riittää eikä useamman resurssiverkon tukeen kuitenkaan riitä...) * K2.4: lokitiedoille jonkinlainen tallennus tai vähintään mahdollisuus copy-pasteta lokiteksti, viimeisen lauseen "epävarmat tapaukset" on määriteltävä tarkemmin * K3.1: "hakuikkunasta" -> hakuikkunan avulla tms. * K3.1.1: tähän kohtaan lisättävä viittaus mainittujen ominaisuuksien määrittelyyn (resurssiverkkokaavioon?) * K3.1.2: Hakuikkunassa tulee olla mahdollisuus "hae vain resurssit joihin viitataan" * K3.1.3: Poistetaan turhana * Uusi vaatimus: kun aluksi on poimittu yleisillä ehdoilla resurssijoukko niin voidaan selausikkunassa laajentaa tuloksena olevaa resurssien joukkoa määritellen esimerkiksi "etsi kaikki resurssit jotka viittaavat tähän resurssiin / näihin resursseihin" jolloin avataan uusi selausikkuna tuloksineen (ts. ne resurssit jotka viittaavat haluttuihin resursseihin). Nämä tulokset pitää voida olla mahdollista lisätä aiemmin muodostettuun yhteysverkkoon mukaan. Siis voidaan tehdä hakutuloksiin ja verkkoon laajennuksia ainakin viittausten perusteella (jäi oman käsitykseni mukaan hiukan epäselväksi millä ehdoilla näitä laajennuksia pitää voida tehdä, kannattaisi ehkä ottaa asiakkaan kanssa puheeksi perjantaina?) * K3.2: "...listan HAUN TULOKSINA OLEVISTA resursseista..." * K3.2.1: määriteltävä täsmällisesti järjestämisehto (esim. päivämäärille aikajärjestys, kirjainjonoille aakkosjärjestys, numerojonoille suuruusjärjestys, tms.) * K3.2.3: määritellään selaustulos tarkemmin ("hakutulos"?) * K3.2.3.1: kuten K3.2.3:ssa * K3.2.4: ominaisuusikkuna määriteltävä tarkasti (siis tarkennettava K3.3:sta) * Asiakkaan vaatima puhdistusvaihe puuttuu kokonaan, siihen on palattava perjantaina * K3.4: resursseja ei välttämättä tarvitse erikseen mainita, koska ne kuuluvat yhteysverkkoon joka tapauksessa (korjataan muotoon "resurssien välisen yhteysverkon") * K3.4.1: nimet tai jonkinlaiset tunnisteet pitää olla näkyvissä verkossa ** Ei välttämättä tarvitse voida "yhdellä katseella" vaan pitää pystyä hahmottamaan ylipäätään verkko ** Tämä muutetaan prioriteetti 1:seen ja muotoon että pitää voida JOLLAIN TAVALLA hahmottaa verkko, tähän voisi ehkä palata asiakkaan kanssa perjantaina * K3.4.3: UCINETista luovuttu, tallennusformaatit PAJEK + CSV-matriisi * Resurssien merkitykset lisätään jo selausikkunavaiheessa, resurssien välisten yhteyksien merkitykset vasta merkitysverkon luonnissa (kannattaisiko tästäkin kysyä tarkennusta asiakkaalta?) ** Yksi merkityskokoelma VOI sisältää useamman tyyppisiä merkityksiä niin että kahden resurssin välillä voi olla useampia yhteyksiä (ja voi myös olla mahdollista että kahden resurssin välillä voi olla useampi samantyyppinenkin yhteys) ** Merkitysyhteydet ovat suunnattuja ja niissä on painot * K3.5.3 liittyen, vaikka alavaatimukseksi: "Ohjelman pitää pystyä näyttämään vähintään yksi merkitysverkko kerrallaan" Muut mahdolliset puutteet dokumentissa * Pikaformaattiin tulevat lisäykset / muutokset käsiteltävä perjantaina Jatkotoimenpiteet * Dokumenttia ei hyväksytä: Vaatimusmäärittelyryhmä tekee halutut muutokset ja dokumenttille järjestetään uusi TR * Neuvottelu asiakkaan kanssa epäselvistä / puuttuvista kohdista perjantaina 14.10. klo 12 * TR maanantaina 17.10. klo 14