1890ndate korpus - kokku 348 000 sõnet - koosneb järgmistest tekstivaldkondadest.
Valdkond | Failinime algus | Sõnade arv | Protsent korpusest |
---|---|---|---|
Ajakirjandus | aja | 193 000 | 55 % |
Ilukirjandus | ilu | 155 000 | 45 % |
Ajakirjandustekstid on pärit järgmistest väljaannetest:
Ajaleht | Failinime algus | Sõnade arv | Protsent ajakirjandustekstidest | Protsent korpusest |
---|---|---|---|---|
Eesti Postimees | epo | 36 600 | 19 % | 11 % |
Olewik | ole | 33 400 | 17 % | 10 % |
Postimees | pos | 48 000 | 25 % | 14 % |
Ristirahwa pühapäewa leht | rip | 2 100 | 1 % | 1 % |
Sakala | sak | 5 300 | 3 % | 2 % |
Walgus | val | 60 500 | 31 % | 17 % |
Wirmaline | vir | 7 100 | 4 % | 2 % |