English

Suulise eesti keele korpus


Suulise eesti keele korpust on kogutud 1997. aastast. Aastal 2011 oli korpuses ca 360 tundi salvestusi, (= ca 2 miljonit sõna), sellest transkribeeritud ca 1 500 000 sõna.

Suulise eesti keele korpus on avatud keelekorpus, s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama. Korpus on orienteeritud eeskätt suhtluspragmaatika uurimiseks.

Põhiosa korpusest on audiosalvestused. Korpuse põhiliigendus on suhtlussituatsiooni omaduste alusel:

Kõik salvestatud situatsioonid on varustatud taustakirjeldusega, millesse on koondatud andmed suhtlejate ja suhtluse omaduste kohta.

Suhtluste transkribeerimisel on kasutatud Gail Jeffersoni loodud vestlusanalüüsi transkriptsiooni veidi kohendatud varianti.

Tüüpilised transkribeeritud argivestluste lõigud ja pikemad institutsionaalsed dialoogid on pikkusega 5-15 minutit, lühemad institutsionaalsed dialoogid on transkribeeritud täielikult.

Nimed, aadressid jm identifitseerimist võimaldavad või tundlikud andmed andmed on transkriptsioonides asendatud rütmiliselt võrdväärsete asendajatega (nt Tiina > Liina).

Materjalid on salvestatud digitaalselt foneetilist analüüsi võimaldavasse wav-heliformaati.

Korpus on kasutatav uurijatele teaduslikel ja õppe-eesmärkidel. Korpuse kasutamiseks tuleb võtta ühendust korpuse administraatoriga ning allkirjastada konfidentsiaalsuskohustus.

Korpusest materjali otsimiseks on kasutatav otsingumootor.

Korpusega seotud materjalid: salvestamise juhised, transkriptsioonimärgid, transkribeerimise juhised, taustakirjeldus, korpuseleping, konfidentsiaalsuskohustus.


Valid XHTML 1.0! Valid CSS! Veebisepp   Viimati muudetud: Sun, 11. December 2011 18:25 EET.