Калмыцкий корпус

Kalmyk Corpus

Настоящий корпус предназначен для всех, кому интересен калмыцкий язык — для профессиональных лингвистов, специалистов по калмыко- и монголоведению, по лингвистической типологии, для преподавателей калмыцкого языка, составителей калмыцких словарей и грамматик и т.д.

Объем корпуса составляет около 800 тыс. словоупотреблений. Литературные тексты на калмыцком языке — романы, повести, рассказы, очерки, газетные статьи (вторая половина ХХ — начало ХХI в.), включенные в корпус, снабжены морфологической разметкой, позволяющей осуществлять поиск по лексеме, по грамматическим характеристикам, по переводу, а также по сочетаниям словоформ на заданном расстоянии.

В настоящее время расширяется текстовая база корпуса, осуществляется пополнение грамматического словаря и морфологическая разметка текстов.

Корпус создан А. Э. Ванькаевой при финансовой поддержке Программы фундаментальных исследований Президиума РАН «Корпусная лингвистика». Система автоматического морфологического анализа UniParser разработана Т. А. Архангельским. Также выражаем благодарность компании Corpus Technologies за разрешение использовать поисковую платформу Восточноармянского национального корпуса, а также редакции газеты «Хальмг үнн», Национальному архиву Республики Калмыкия, Калмыцкому книжному издательству и НПП «Джангар» за предоставленные материалы.