1950ndate korpus - kokku 308 000 sõnet - koosneb järgmistest tekstivaldkondadest:
Valdkond | Failinime algus | Sõnade arv | Protsent korpusest |
---|---|---|---|
Ajakirjandus | aja | 242 400 | 79 % |
Ilukirjandus | ilu | 66 000 | 21 % |
Ajakirjandustekstid on pärit järgmistest väljaannetest:
Ajaleht | Failinime algus | Sõnade arv | Protsent ajakirjandustekstidest | Protsent korpusest |
---|---|---|---|---|
Edasi | ed | 31 900 | 13 % | 10 % |
Noorte Hääl | nh | 32 800 | 14 % | 11 % |
Rahva Hääl | rh | 109 200 | 45 % | 35 % |
Sirp ja Vasar | sv | 16 400 | 7 % | 5 % |
Talurahvaleht | tl | 11 400 | 5 % | 4 % |
Õhtuleht | ol | 39 500 | 16 % | 13 % |