581257-8 Tiedonhakumenetelmät - Harjoitus 8/2001 (4.4.)

Merkillä (**) varustettu tehtävä lasketaan kahden tavallisen tehtävän veroiseksi.

1. Tarkastele Dublin Core -metadatastandardin Relation-elementin käyttömahdollisuuksia tiedonhaun kannalta. Mieti esimerkein erilaisia kuvaus- ja hakutarpeita. Mitä muita suhteita voisi olla kuin elementin määritysdokumentissa esitetyt? Sopiiko elementti hypertekstimuotoisen dokumentin kuvaamiseen?
Elementin kuvaus löytyy osoitteesta http://dublincore.org/documents/dcmes-qualifiers/ (elementtien luettelo osoitteesta http://dublincore.org/documents/dces/ ).

2. Tarkastele tehtävää 1 vastaavalla tavalla Dublin Core -standardin Coverage- ja Date-elementtien määrityksiä. Aikaan liittyvien määreiden kohdalla esimerkkidokumentteina voi ajatella esimerkiksi aikataulua, standardia, historiaa koskevaa artikkelia, kommentoitavaa ehdotusta, tuotteen myynti-ilmoitusta jne.

3. a) Tarkastellaan tieteellisiä (tai muita, säännöllistä muotoa noudattavia) artikkeleita, jotka ovat verkossa 'kokonaisina' eli perinteisinä. Siis vaikka hypertekstilinkkejä olisikin, dokumentin olennainen sisältö on kuitenkin yhdessä solmussa. Arvioi dokumentin rakenteeseen liittyvien kuvausten käyttöä tieteellisiin lähdeartikkeleihin kohdistuvan käytännön tiedonhaun kannalta. Millaiset piirteet parantaisivat tiedonhakua?

b) Tee sama arvio aidosti hypertekstimuotoiselle dokumentille, jossa siis dokumentin sisältö muodostuu useasta toisiinsa linkitetystä solmusta.

4. (**) Tutustu artikkeliin [1] ja selvitä siinä esitellyn kopioiden tunnistusjärjestelmän pääperiaatteet.

Lähteet:

1. Monostori, K., Zaslavsky, A. & Schmidt, H., MatchDetectReveal: finding overlapping and similar digital documents. Information Resources Management Conference (IRMA2000), 2000.
http://www.csse.monash.edu.au/~kmonosto/MDR/Papers/irma2000.pdf



Hannu.Erkio@cs.Helsinki.FI