Seminaariaiheesta

Kielitieteelliset aineistot -seminaari

Juho Kilpikoski

Tapaaminen

Aihepiiri: Web kielitieteellisenä aineistona

Kaksijakoinen:

Web korpuksena
Webiä voidaan käyttää suoraan ikäänkuin se olisi raakakorpus.
Web korpuksen lähteenä
Ladataan joukko websivuja, joita käytetään korpuksena.

Ideointia

Erityisesti "Web korpuksen lähteenä"

Alustavat lähteet

HNB07
Hundt, M., Nesselhauf, N. ja Biewer, C., toimittajat, Corpus Linguistics and the Web. Numero 59 sarjassa Languages and Computers. Rodopi, Amsterdam, 2007.
MGH03
Meyer, C. F., Grabowski, R., Han, H.-Y., Mantzouranis, K. ja Moses, S., The world wide web as linguistic corpus. Corpus Analysis – Language Structure and Language Use, Leistyna, P. ja Meyer, C. F., toimittajat,Amsterdam, 2003, Rodopi, sivut 241–254.
WAC-n
ACLn SIGWACn järjestämien Web as Corpus Workshop ‑tapaamisten julkaisukokoelmat. (Myös Can We Beat Google?)