TiKi-tiedonhakusivut


* Pääsivu
* Hakemisto
 
* Käytännön tie-
donhaun perusteet

 
Tiedonhaku kirjastosta
* Laitoksen kirjasto
* Muut kirjastot
 
Tiedonhaku verkosta
* Hakupalvelut
* Hakusanojen valinta
* Linkki ei toimikaan...
* Muut dokumentti-
tyypit

* Luotettavuus ja "luotettavuus"

Hakusanojen valinta

Hyvä hakusana määrittelee hyvin haun kohteen ja vain haun kohteen

Hakusanoiksi pitää valita termit, joilla saadaan esille mahdollisimman suuri osa haluttua aihetta vastaavista tietokannan alkioista (kattavuus, recall). Samalla hakusanojen tulee rajata epäoleelliset alkiot pois vastauksesta (tarkkuus, precision).

Esimerkki: Etsittäessä CHI'96 -konferenssin Rice et al. kirjoittamaa artikkelia WWW:stä käyttöliittymänä Altavista löysi hakuavaimella (CHI NEAR 96) AND Rice neljä sivua. Yksi oli etsitty artikkeli ja yksi USA Todayn urheilusivujen tulosluettelo 4. helmikuuta 96, koska Rice oli urheilijan nimi ja CHI viittasi Chigago Bulls -joukkueeseen.

Nimet ovatkin oivia hakusanoja tai hakutulosten rajaajia, jos ne asetetaan oikeaan asiayhteyteen sopivilla loogisilla operaatioilla. Nimien kirjoitusasu vaihtelee kuitenkin artikkelista toiseen. Etunimi voi olla sukunimen jälkeen tai sitä ennen, etunimen sijasta voi olla vain nimikirjaimet. Järjestysongelman voi kiertää käyttämällä NEAR-operaatiota, jos hakupalvelu sellaisen tarjoaa. Esimerkiksi käyttöliittymä-alan tunnetun gurun Ben Schneidermanin nimen lisääminen (AND -operaattorilla) tuon aihepiirin artikkeleita etsivään kyselyyn aiheuttaa tulosten määrän vähenemisen, mutta samalla niiden relevanttius todennäköisesti kasvaa tieteellistä lähdettä etsittäessä. Gurujen nimiä käytettäessä alan yleisen tietämyksen selvittämiseen kannattaa valita useampi nimi (OR-operaattorilla yhdistäen), jotteivat tulokset jää liian kapeiksi.

Esimerkkinä seuraavat haut Altavistan tietokantaan tuottivat 12.6.1997 taulukossa esitetyn määrän sivuja:

"user interface*" n. 100000
"user interface*" AND schneiderman 145
"user interface*" AND (schneiderman OR nielsen) n. 1000

Näistäkin määristä huomataan, että AltaVistaa käytettäessä kannattaa käyttää tulosten lajittelukriteerejä.

Fraasit, lainausmerkein erotetut sanaryhmät, jotka käsitellään juuri tuossa järjestyksessä peräkkäin, ovat myös erinomaisia hakutermejä. Sama fraasi esiintyy harvoin täysin samanlaisena eri aihepiirien artikkeleissa. Edellisessä esimerkissä haku user AND interface* olisi tuottanut n. 300000 sivua. Fraaseista on erityisesti hyötyä hakiessa aiemmin luettua artikkelia, jota ei enää löydy. Artikkelista mieleenjääneen fraasin avulla artikkelin löytäminen on huomattavasti helpompaa kuin sen etsiminen usean samat avainsanat sisältävän artikkelin joukosta. Otsikko tai osa otsikosta on tietysti paras vaihtoehto hakufraasiksi.

Rakkaalla lapsella on monta nimeä, joten kannattaa myös kokeilla avainsanojen synonyymejä. Toisaalta tieteen maailmassa pyritään nimien yksikäsitteisyyteen väärinkäsitysten välttämiseksi ja tiedonhaun helpottamiseksi. Tietojenkäsittelytieteen alalle löytyy hyviä hakusanoja CR-luokituksen luokkien nimistä.

Hyvien hakutermien lisäksi on oleellista yhdistää termit oikein. Edellämainitut fraasit ovat yleensä tehokkain tapa, mutta niitä eivät kaikki ohjelmat tue. Eri hakuohjelmat mahdollistavat joukon erilaisia kyselytermien yhdistämistapoja, kuten loogiset operaattorit, korvaavat merkit, sulut tms. Ohjelmien erilaisuuden vuoksi lienee turhaa opettaa tässä niiden käyttöä. Jokaiselta hyvältä hakuohjelmasivulta löytyy kuitenkin myös ohjesivu. Esimerkkinä tällaisesta ohjeesta annettakoon AltaVistan suomenkieliset ohjeet lisäehdoilla tapahtuvaa kyselyä varten. Nämä ohjeet selvittävät erityisen hyvin loogisten operaatorien ja sulkujen käyttöä kyselyn rajoittajana. AltaVistan LiveTopics -kyselynrajoittaja on myös kokeilemisen arvoinen, jos käytettävissä on Java-yhteensopiva selain.

Yhden hyvän artikkelin löydyttyä edellämainittujen menetelmien avulla on helppo löytää lisää samanlaisia. Hakusanaksi valitaan sopiva, nimenomaan tälle artikkelille ominainen fraasi. Samojen tekijöiden artikkelit voivat sisältää oleellista lisätietoa ja artikkelin lähdeluettelosta löytyy enemmänkin nimiä.

<- Hakupalvelut
-> Entäpä jos työllä ja tuskalla löytämäsi linkki ei vie mihinkään?


Copyright © 1997, Henri Block - Henri.Block@cs.helsinki.fi
Helsingin yliopisto, Tietojenkäsittelytieteen laitos
Palautetta sivuista voi antaa sähköpostitse.
Viimeisin päivitys: 18. heinäkuuta 1997