Eelmine teema
Tagasi sisukorda
Järgmine teema
7. Eesti keele korpused
Tartu ülikooli tekstikorpuse töörühma tekstikogum jaguneb kahte ossa. Selle keskmeks on tekstikorpus kui allkorpuste süsteem, lisaks sellele on arvutis kättesaadavad BNS uudiste tekstikogu, mis sisaldab jooksvaid tekste alates aastast 1994 ja varsti loodetavasti ka ajalehe ‘Postimees’ võrguväljaanded alates aastast 1995.
Eesti tänapäeva kirjakeele korpus
Selle kohta palun lugege järgmisi artikleid: Tiit Hennoste, Tartu University Corpus of Written Estonian: A Survey of the Structure of Texts and Principles of Selection. Estonian in the Changing World. Edited by Haldur Õim. Tartu 1996
Tiit Hennoste, Kadri Muischnek, Helen Potter; Tiit Roosmaa, Tartu Ülikooli eesti kirjakeele korpus: ülevaade tehtust ja probleemidest. Keel ja Kirjandus 1993 lk 587-600.
Ajalehtede ja ilukirjanduse (monitor)korpused 60ndatest, 50ndatest ja 30ndatest aastatest
Vanema eesti kirjakeele korpus
Kaasaegse suulise kõne korpus on koostamisel.
Plaan: dialektid ja sotsiolektid
Plaan: välis-eesti keele korpused
Muud plaanid: lastekeel, tõlkekeel
Eestikeelne materjal paralleelkorpustes
SCLOMB - projekti eesmärgiks on koostada Läänemere-äärsete keelte paralleelkorpus. Igast keelest püütakse valida 1 algupärand ja teistest keeltest selle tõlked. Eesti algupärand on Viivi Luige "Ajaloo ilu".
Projekti MULTEXT raames on loodud paralleelkorpus, mis sisaldab George Orwelli romaani "1984" originaali ja selle tõlkeid kaheksasse keelde, nende hulgas ka eesti keelde.