Heiki-Jaan Kaalep
Updated information:ETIS
Publications
2022
- Kaalep, Heiki-Jaan; Pirinen, Flammie; Moshagen, Sjur Nørstebø You can’t suggest that?! Comparisons and improvements of speller error models. Nordlyd 46, 1 2022, pp. 125 - 139 pdf file
- Kaalep, Heiki-Jaan Looking into Estonian Syllabification Baltic J. Modern Computing 10 2022, pp. 348 - 359 pdf file
2021
- Kaalep, Heiki-Jaan Verbi algvorm ja teised vormid Keel ja Kirjandus 6 2021, pp. 510 - 531 pdf file
- Kaalep, Heiki-Jaan Raamat õigekeele sõnamuutmisest Keel ja Kirjandus 4 2021, pp. 350 - 355 pdf file
2018
- Kaalep, Heiki-Jaan Statistika koht keelemudelis Keel ja Kirjandus 8-9 2018, pp. 713−727 pdf file
- Kaalep, Heiki-Jaan; Moshagen, Sjur Nørstebø; Trosterud, Trond Estonian Morphology in the Giella Infrastructure. Human Language Technologies – The Baltic Perspective Ed. Muischnek, Kadri; Müürisep, Kaili IOS Press 2018, pp. 47–54 pdf file
- Kaalep, Heiki-Jaan Parallel Forms in Estonian Finite State Morphology Proceedings of the 4th International Workshop for Computational Linguistics for Uralic Languages Association for Computational Linguistics, 2018, pp. 141–155 pdf file
2017
- Orasmaa, Siim; Kaalep, Heiki-Jaan; Can We Create a Tool for General Domain Event Analysis? Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa 21 Ed. Jörg Tiedemann Linköping University Electronic Press Linköping 2017, pp. 192–201 pdf file
2016
- Kaalep, Heiki-Jaan Kas Google on ühe-või kahesilbiline sõna? Keel ja Kirjandus 1 2016, pp. 28–40 pdf file
- Orasmaa, Siim; Petmanson, Timo; Tkatšenko, Aleksandr; Laur, Sven; Kaalep, Heiki-Jaan EstNLTK – NLP Toolkit for Estonian. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016) Ed. Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Marko Grobelnik and Bente Maegaard and Joseph Mariani and Asuncion Moreno and Jan Odijk and Stelios Piperidis ELRA Portorož, Slovenia 2016, pp. 2460–2466 pdf file
2015
- Kaalep, Heiki-Jaan Eesti verbi vormistik. Keel ja Kirjandus 1 2015, pp. 1–15 pdf file
- Kaalep, Heiki-Jaan Estonian Morphology: What is Learned and How? Unpublished pdf fail
2014
- Valdre, E.; Ross, P.; Tsepelina, K.; Veskis, K.; Vaino, T.; Kaalep, H.-J. Radioloogiauuringute vastuste lühendite ja lühendamise korpuslingvistiline analüüs. Eesti Arst, 93 (9) 2014, pp. 502–512 pdf file
2013
- Kaalep, Heiki-Jaan Keelelise küsitluse tõlgendamise ohud Keel ja Kirjandus 6 2013, pp. 440–446 pdf file
2012
- Kaalep, Heiki-Jaan; Muischnek, Kadri Osalausete tuvastamine eestikeelses tekstis kui iseseisev ülesanne. Eesti Rakenduslingvistika Ühingu aastaraamat 8 Toim. Helle Metslang, Margit Langemets, Maria-Maren Sepper Eesti Rakenduslingvistika Ühing Tallinn 2012, pp. 55–68 pdf file
- Muischnek, Kadri; Fišel, Mark; Kaalep, Heiki-Jaan; Koit, Mare; Müürisep, Kaili; Orav, Heili; Vare, Kadri; Õim, Haldur Arvutilingvistika ja keeletehnoloogia Tartu Ülikoolis Emakeele Seltsi Aastaraamat 56 Toim. Erelt, Mati; Mäearu, Sirje TA Kirjastus, Tallinn, 2012, pp. 66–102 pdf file
- Kaalep, Heiki-Jaan Käänamissüsteemi seaduspärasused Keel ja Kirjandus 6 2012, pp. 418–449 pdf file
- Kaalep, Heiki-Jaan; Kirt, Riin; Muischnek, Kadri A trivial method for choosing the right lemma. Human Language Technologies – The Baltic Perspective Tavast, Arvi; Muischnek, Kadri; Koit, Mare (Ed.) IOS Press 2012, pp. 82–89 pdf file
- Kaalep, Heiki-Jaan; Muischnek, Kadri Robust clause boundary identification for corpus annotation. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12) Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mar (Ed.). ELRA Istanbul, Türgi 2012, pp. 1632–1636 pdf file
2011
- Kaalep, H.-J.; Muischnek, K. Morphological analysis of a non-standard language variety. Proceedings of the 18th Nordic Conference of Computational Linguistics: NODALIDA 18, Riia, Läti, 11-13. mai 2011 Ed. Bolette Sandford Pedersen, Gunta Nešpore, Inguna Skadina pp. 130 - 137 pdf file
- Muischnek, K.; Kaalep, H.-J.; Sirel, R. Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile Eesti Rakenduslingvistika Ühingu aastaraamat. Toim. Metslang, H.; Langemets, M.; Sepper, M.-M. Eesti Rakenduslingvistika Ühing Tallinn 2011, pp. 111 − 127 pdf file
2010
- Kaalep, H.-J.; Muischnek, K.; Uiboaed, K.; Veskis, K. The Estonian Reference Corpus: its composition and morphology-aware user interface The Fourth International Conference HUMAN LANGUAGE TECHNOLOGIES : THE BALTIC PERSPECTIVE, Riga, Latvia, October 7-8, 2010, pp. 143 - 146 Viimane mustand: pdf file
- Kaalep, H.-J. Mitmuse osastav eesti keele käändesüsteemis Keel ja Kirjandus, 2, pp. 94 - 111 pdf file
- Kaalep, H.-J.; Koit, M. Kuidas masin tõlgib Keel ja Kirjandus, 10, pp. 724 - 738 pdf file
- Fishel, K.; Kaalep, H.-J. CorporAl: a Method and Tool for Handling Overlapping Parallel Corpora The Prague Bulletin of Mathematical Linguistics, 94, 67 - 76. pdf file
- Muischnek, K.; Kaalep, H.-J. The variability of multi-word verbal expressions in Estonian. Language Resources and Evaluation, 44, 1-2, 115 - 135. pdf file
2009
- Kaalep, H.-J.; Muischnek, K. Eesti keele püsiühendid arvutilingvistikas: miks ja kuidas. Eesti Rakenduslingvistika Ühingu Aastaraamat, 5, 157 - 172. pdf file
- Kaalep, H.-J. Kuidas kirjeldada lühikest sisseütlevat kasutusandmetega kooskõlas? Keel ja Kirjandus, 6, 411 - 425. pdf file
2008
- Kaalep, H.; Mikk, J. Creating specialised dictionaries for foreign language learners: a case study. International Journal of Lexicography, 21(4), 369 - 394. pdf file
- Kaalep, H.-J.; Mikk, J. Põhikooli ainesõnastikud. Keel ja Kirjandus, 10, 790 - 802. pdf file
- Fishel, M.; Kaalep, H.-J. Experiments on Processing Overlapping Parallel Corpora. In: Proceedings of the International Conference on Language Resources and Evaluation: Marrakech, Morocco; 28-30.05.2008. Marrakech, Morocco:, 2008. pdf file
- Kaalep, H.-J.; Muischnek, K. Multi-Word Verbs of Estonian: a Database and a Corpus. In: Proceedings of the LREC Workshop Towards a Shared Task for Multiword Expressions: Marrakech; Morocco; 1. juuni 2008. , 2008, pp. 23 - 26 pdf file
2007
- Kaalep, H.-J. Veskis, K. Comparing Parallel Corpora and Evaluating their Quality. MT Summit XI Proceedings: Machine Translation Summit XI. Copenhagen, Denmark, toim. Bente Maegaard, Kopenhaagen, Taani, 2007, pp. 275 - 280 doc file pdf file
- Fishel, M. Kaalep, H.-J. Muischnek, K. Estonian-English machine translation: the first results. Kogumikus: Proceedings of the 16th Nordic Conference of Computational Linguistics NODALIDA-2007. toim. Nivre, J. Kaalep, H.-J. Muischnek, K. Koit, M. University of Tartu: Tartu, 2007 pp. 278 - 283. pdf file
2006
- Kaalep, H.-J. Muischnek, K. Multi-word verbs in a flective language: the case of Estonian. Proceedings of the EACL workshop on Multi-word expressions in a multilingual context: 11th Conference of the European Chapter of the Association for Computational Linguistics; Trento, Italy; 3 April 2006 Rayson, P. Sharoff, S. Adolphs, S. Association for Computational Linguistics, 2006 pp. 57 - 64. doc file pdf file
2005
- Kaalep, H.-J. Muischnek, K. The corpora of Estonian at the University of Tartu: the current situation. Proceedings of the Second Baltic Conference on Human Language Technologies. Institute of Cybernetics, Tallinn University of Technology. Institute of the Estonian Language. Tallinn 2005 pp. 267-272 pdf file
2004
- Hiie Asser, Heiki-Jaan Kaalep, Siret Linnas, Jaan Mikk, Kadri Muischnek, Merje Songe, Heli Uibo Õpikute keerukuse analüüs arvutitel. TPedÜ Eesti filoloogia osakonna
toimetised 3. Toimiv keel II.
Töid rakenduslingvistika alalt toim. Maria-Maren Sepper, Jane Lepasaar, TPÜ
kirjastus, Tallinn 2004, pp. 72-84 doc file pdf file postscript file
- Heiki-Jaan Kaalep, Kadri Muischnek. Frequency Dictionary of Written Estonian
of the 1990ies. Kogumikus: The First Baltic Conference. Human Language
Technologies. The Baltic Perspective.
Commission of the Official Language at
the Chancellery of the President of Latvia, Riga, 2004 pp. 57-60 doc file pdf file postscript file
- Heiki-Jaan Kaalep Keeping the Speller Lexicon up-do-date for an Inflective Language Kogumikus 1st Workshop on International Proofing Tools and Language
Technologies.
Pre-Proceedings, Patras, Kreeka, 2004 doc file pdf file postscript file
2003
- Kaalep, H-J., Muischnek, K. Inconsistent Selectional Criteria in
Semi-automatic Multi-word Unit Extraction. COMPLEX 2003, 7th Conference
on Computational Lexicography and Corpus Research, Ed. By F. Kiefer, J.Pajzs, Research Institute for Linguistics, Hungarian Academy of
Sciences, Budapest 2003, pp. 27-36 rtf file, pdf file, postscript file
- Kaalep, H-J., Muischnek, K. Püsiühendite leidmine suurtest
tekstikorpustest. Eesti Keele Instituudi toimetised 12.
Toimiv keel I
Töid rakenduslingvistika alalt. Eesti Keele Sihtasutus Tallinn 2003 pp. 101-118 pdf file
- Mikk, J., Kaalep, H.-J., Asser, H., Linnas, S., Songe, M. Käsikirjade
arvutianalüüs õpikute koostamisel. Kogumikus K. Karlep, E. Krull
(toimetajad). Haridus kõigile. TÜ Kirjastus, Tartu 2003, pp. 99 - 107
- Kadri Muischnek, Heili Orav, Heiki-Jaan Kaalep, Haldur Õim. Eesti keele
tehnoloogilised ressursid ja vahendid. Arvutikorpused, arvutisõnastikud,
keeletehnoloogiline tarkvara. Eesti Keele Sihtasutus, Tallinn 2003 pdf file
- Martin Ehala, Heiki-Jaan Kaalep, Annika Kilgi, Ülle Viks. Morfoloogia Kogumikus: Emakeele Seltsi Aastaraamat 48, Tallinn 2003, pp. 36-48 ISBN
9985-9421-1-6
ISSN 0206-3735 pdf file
2002
- Kaalep, H-J., Muischnek, K. Eesti kirjakeele sagedussõnastik TÜ
kirjastus, Tartu 2002, 205 lk
- Kaalep, H-J., Muischnek, K. Using the Text Corpus to Create a Comprehensive List of
Phrasal Verbs Proceedings LREC 2002. Third Intern. Conf. on Language Resources and
Evaluation. M.G. Rodriguez, C.P. Suarez Araujo 1. kd
lk. 101-105
doc file, pdf file, postscript file
- Kaalep, H-J., Muischnek, K. Püsiühendite leidmine teksti abil. Kogumikus Tähendusepüüdja Catcher
of the Meaning”, TÜ üldkeeleteaduse õppetooli toimetised 3, Tartu 2002, pp. 172-184 Toimetamata variant: doc file, pdf file, postscript file
- Dias, G., Kaalep, H-J. Automatic Extraction of Multiword
Units for Estonian: Phrasal Verbs.
In: H.Metslang, M.Rannut (eds) Languages in Development, Lincom-Europa, München, Linguistic Edition 41 2002 doc file, pdf file, postscript file
2001
- Dias, G., Kaalep, H-J., Muischnek, K. Automatic Extraction of Verb
Phrases from Annotated Corpora: A Linguistic Evaluation for
Estonian Association for Computational Linguistics. 39th Annual Meeting and 10th Conference of the European Chapter. Workshop
proceedings: Collocation: Computational Extraction, Analysis and
Exploitation Institut de Recherche en Informatique de Toulouse and Universite des Sciences Sociales. Toulouse, France, 2001, pp. 47-53. doc rtf, pdf file, postscript file
- Dias, G., Kaalep, H-J., Muischnek, K. Automatic Extraction of Verbal
Locutions for Estonian: Validating Results with Pre-existing Phrasal
Lexicons.
Teoses COMPLEX 2001. 6th Conference on Computational Lexicography and Corpus Research "Computational Lexicography and New EU Languages". Centre for Corpus Linguistics. Department of English. University of Birmingham 2001, pp. 75-82.doc file, pdf file, postscript file
2000
- H.-J. Kaalep, K. Muischnek, K. Müürisep, A. Rääbis, K. Habicht. Kas tegelik tekst allub eesti keele
morfoloogilistele kirjeldustele? Eesti kirjakeele testkorpuse
morfosüntaktilise märgendamise kogemusest. Keel ja Kirjandus 9 2000, pp. 623-633 doc file, pdf file, postscript file
- Heiki-Jaan Kaalep, Tarmo Vaino. Teksti täielik
morfoloogiline analüüs lingvisti töövahendite
komplektis.
Kogumikus " Arvutuslingvistikalt inimesele" Tartu 2000 lk 87 - 99Toimetamata variant: doc file, pdf file, postscript file
- Tiit Hennoste, Heiki-Jaan Kaalep, Kadri Muischnek, Leho Paldre, Tarmo Vaino. The Tartu University Corpus of Estonian Literary Language. Congressus Nonus Fenno-Ugristarum Pars IV, lk 337-344, Tartu 2001. Toimetamata variant: doc file, pdf file, postscript file
- Heiki-Jaan Kaalep, Tarmo Vaino. Complete Morphological Analysis in the Linguist’s Toolbox. Congressus Nonus Internationalis Fenno-Ugristarum Pars V, lk 9-16, Tartu 2001. Toimetamata variant: rtf file, pdf file, postscript file
1999
- Heiki-Jaan Kaalep Eesti keele ressursside loomine ja
kasutamine keeletehnoloogilises arendustöös. Diss. phil.
Estonicae univ. Tartuensis.
TÜ Kirjastus 1999 doc file, pdf file, postscript file
- Leho Paldre, Heiki-Jaan Kaalep, Tarmo Vaino. Unix as the Interface of an On-line Text Corpus. Proceedings of the Workshop: Multilingual
Language Technologies, Ljubljana, 1999. doc file, pdf file, postscript file
1998
- Heiki-Jaan Kaalep. Tekstikorpuse abil loodud eesti keele
morfoloogiaanalüsaator. Keel ja Kirjandus 1 1998, lk 22-29. Toimetamata versioon: rtf file, pdf file, postscript file
- Heiki-Jaan Kaalep, Tarmo Vaino. Kas vale meetodiga õiged
tulemused? Statistkale tuginev eesti keele morfoloogiline
ühestamine. Keel ja Kirjandus 1 1998, lk 30-38. Toimetamata versioon: rtf file, pdf file, postscript file
- Ludmila Dimitrova, Tomaz Erjavec, Nancy Ide, Heiki-Jaan Kaalep,
Vladimir Petkevic, Dan Tufis. Multext-East: Parallel and Comparable
Corpora and Lexicons for Six Central and Eastern European languages. COLING-ACL '98, Proceedings of the Conference, 1, pp. 315-319 pdf file.
- Heiki-Jaan Kaalep, Rene Prillop, Epp Ehasalu. The Role of Internet
in Creating, Financing and Integrating Language Resources. Proceedings of the First International Conference on Language
Resources and Evaluation. Granada, 1998. 2, lk 1149-1152. doc file, pdf file, postscript file
kuni 1997
- Heiki-Jaan Kaalep. An Estonian Morphological Analyser and
the Impact of a Corpus on Its Development. Computers and the
Humanities 31 pp. 115-133, 1997. rtf file, pdf file, postscript file
- Heiki-Jaan Kaalep. Toetus eesti keelele tema olelusvõitluses: Ü. Viksi Väike vormisõnastik. Keel ja kirjandus 7 1994, pp. 439-441 rtf file, html file.
Popular science
- Kaalep H-J. Netikeele kirjakeelestumine. Sirp 15.12. 2017 veebifail, pdf file
- Kaalep H-J. Keeletehnoloogia - mis see on. Arvutimaailm nr. 7 1994 pp. 54-55 rtf file, htm file
- Kaalep H-J., Roosmaa T. Eesti keel, tehnoloogia ja tulevik. Postimees nr. 235 11. okt. 1994 pp. 14 rtf file, htm file
- Kaalep H-J. Virtuaalne ingliskeelne Eesti. Kultuurileht 1998 doc file, htm file
- Kaalep H-J. Keeleusk ja tehnoloogiahullus. Päevaleht 15.01. 2002 doc file, htm file
Webmaster
Last modified: December 30 2022 11:31:26.