581257 Information Retrieval Methods (6 ECTS/op, 3 cu/ov) Spring 2007
Books for use in the library
The
books
- Salton, G., Automatic text processing. Addison-Wesley, 1989.
- Baeza-Yates & Ribeiro-Neto: Modern Information Retrieval. Addison Wesley 1999.
Lecture handouts and other material
The handouts should contain what you need to know in the course. The additional material is for background.
- Lecture 15 Jan 2007: Introduction, handouts,
based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto: [1.3 Tiedonhaun päämäärät ja ongelmat] [2.3 Tiedonhaku- ja -hallintajärjestelmät]
- Salton, G., Automatic text processing: Chapter 8, pp. 229-238.
- Or Baeza-Yates & Ribeiro-Neto: Modern Information Retrieval, chapter 8.2, pp. 192-199.
- See also: Baeza-Yates & Ribeiro-Neto: Modern Information
Retrieval, chapter 1: Introduction, at http://www.dcc.ufmg.br/irbook/
- Lecture 16 Jan 2007: Relevance, evaluation, handouts, based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto: [2.5 Relevanssin käsitteestä] [2.6 Tiedonhaun evaluointi]
- See also: Baeza-Yates & Ribeiro-Neto: Modern Information Retrieval: Beginning of chapter 3, pp. 73-79.
- Lecture 22 Jan 2007: Indexing (1/2), project work, handouts, based on
- Salton, G., Automatic text processing: Chapter 9, s. 275-284.
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto: [3.1 Käänteistiedostot]
- For a discussion on tf.idf, see Stephen Robertson: Understanding Inverse Document Frequency: On theoretical arguments for IDF. Journal of Documentation 60, 5, pp. 503-520.
- Lecture 23 Jan 2007: Indexing (2/2) handouts, based on
- Salton, G., Automatic text processing: Chapter 9, s. 294-305. Chapter 8, s.236-238.
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto: [3.1 Käänteistiedostot]
- Witten,I.H., Moffat, A. & Bell, T.C., Managing gigabytes. s. 231-235.
- Lecture 29 Jan 2007: Matching methods (1/2) handouts, based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto:: [3.2 Täsmäytysmenetelmät][3.3 Täystäsmäytys: Joukko-oppi tiedonhaussa] [3.4 Osittaistäsmäytys: Esimerkkinä vektorimalli dokumenttien indeksoinnissa ja haussa]
- Salton, G., Automatic text processing: Chapter 10, s. 313-319. Chapter 8, s.246-248.
- Witten,I.H., Moffat, A. & Bell, T.C., Managing gigabytes. s. 174-176, 180-188.
- Lecture 30 Jan 2007: Clustering handouts, based on
- Salton, G., Automatic text processing: Chapter 10, (section 10.2.) pp. 326-345.
- Lecture 5 Feb 2007: Matching methods (relevance feedback) (2/2) handouts, based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto:: [3.4 Osittaistäsmäytys: Esimerkkinä vektorimalli dokumenttien indeksoinnissa ja haussa]
- Salton, G., Automatic text processing: Chapter 10, s. 319-326.
- Lecture 6 Feb 2007: Text scanning methods handouts, based on
- Salton, G., Automatic text processing: Chapter 8, s.255-266.
- Baeza-Yates, R. & Ribeiro-Neto, B., Modern information retrieval: s. 209-212.
- Charras, Lecroq: EXACT STRING MATCHING ALGORITHMS, Animation in Java.
- Lecture 12 Feb 2007: Approximate matching: n-grams; From information need to query (Levels of storage and
retrieval; Modifying queries) handouts, based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto:: [3.6 Osittaistäsmäytys: n-grammit][4.1 Tallennuksen ja haun tasoperiaate][4.2 Tiedontarpeen käsiteanalyysi] [4.6 Käsitteistä hakuavaimiksi][5.6 Kyselyjen muotoilu]
- Pirkola, A., Keskustalo, H., Leppänen, E., Känsälä, A.-P., ja Järvelin, K. Targeted s-gram matching: a novel n-gram matching technique for cross- and monolingual word form variants. Information Research, 7(2), 2001.
- Lecture 13 Feb 2007: Retrieval stretgies; User interfaces and visualization
handouts (one slide/page), based on
- Järvelin, K. ja Kekäläinen, J., Tiedonhaun menetelmät -opintoaineisto: [5.2 Selailu ja navigointi][5.4 Sisältöperusteinen suodatus ja reititys]
- Hearst, M. User interfaces and visualization. Chapter 10 in Baeza-Yates, R. & Ribeiro-Neto, B., Modern information retrieval. (The chapter is available on the web, follow the link.)
- Lecture 19 Feb 2007: Parallel and distributed IR: handouts, based on
- Chapter 9 in Baeza-Yates, R. & Ribeiro-Neto, B., Modern information retrieval.
- Lecture 20 Feb 2007: Searching the Web: handouts, based on
- Chapter 13 in Baeza-Yates, R. & Ribeiro-Neto, B., Modern information retrieval.
- Search Engine Showdown: The Users' Guide to Web Searching; Review of Google
- See also Wikipedia for Search Engine, PageRank, Web crawler, Google search, etc.