Korpused on koostatud kahe eri projekti raames: ETF ja ELAN. Esialgu on tekstid grupeeritud vastavalt projektidele.
Täpitähed jm erisümbolid on sisestatud SGML-koodidena.