Webiä voidaan käyttää suoraan ikäänkuin se olisi raakakorpus.
Web korpuksen lähteenä
Ladataan joukko websivuja, joita käytetään korpuksena.
Ideointia
Erityisesti "Web korpuksen lähteenä"
Mitä se on?
Miten aineisto eroaa perinteisten korpusten aineistoista?
Mitä haittoja ja hyötyjä verrattuna perinteiseen korpikseen tai webin suorakäyttöön?
Miten valita, löytää, muodostaa, koostaa sopiva osajoukko webistä?
Alustavat lähteet
HNB07
Hundt, M., Nesselhauf, N. ja Biewer, C., toimittajat,
Corpus Linguistics and the Web. Numero 59 sarjassa
Languages and Computers. Rodopi, Amsterdam, 2007.
MGH03
Meyer, C. F., Grabowski, R., Han, H.-Y., Mantzouranis, K. ja Moses, S.,
The world wide web as linguistic corpus.
Corpus Analysis – Language Structure and Language Use,
Leistyna, P. ja Meyer, C. F., toimittajat,Amsterdam, 2003, Rodopi,
sivut 241–254.
WAC-n
ACLn SIGWACn järjestämien Web as Corpus Workshop ‑tapaamisten julkaisukokoelmat. (Myös Can We Beat Google?)