Алматинский корпус казахского языка (АККЯ)

На этом сайте размещена полноценная версия Алматинского корпуса казахского языка. В настоящий момент размер корпуса составляет более 40 миллионов словоупотреблений. Тексты корпуса размечены с помощью автоматического морфологического анализатора, 86% словоформ корпуса имеют грамматический разбор. Омонимия в корпусе не снималась, т. е. каждой словоформе приписаны все возможные варианты разбора без учёта контекста.

АККЯ – один из возможных вариантов Национального корпуса казахского языка как справочно-информационной системы на основе обширного фонда размеченных текстов литературного казахского языка, государственного языка Республики Казахстан. Для корпуса была адаптирована поисковая система Восточноармянского национального корпуса (EANC). Безусловно, корпус постоянно дополняется, обновляется как количественно, так и качественно, кроме того существенно улучшается поисковая функциональность корпуса.

Основные характеристики разработанного АККЯ:

В перспективе намечаются следующие характеристики АККЯ:

Краткая история и новости проекта:

Работа над проектом Корпуса началась в мае 2012 г. при поддержке ректора КазНУ им. аль-Фараби Мутанова Г.М. и проводилась силами кафедры общего языкознания и иностранной филологии факультета филологии, литературоведения и мировых языков Казахского национального университета им. аль-Фараби под руководством заведующей кафедрой Г.Б. Мадиевой с участием сотрудников факультета филологии НИУ ВШЭ (Москва).

В 2013 г. объем корпуса составлял 650 тыс. словоупотреблений.

В 2015 г. работа над АККЯ осуществлялась в рамках грантового финансирования научных исследований МОН РК по подприоритету «Фундаментальные исследования в области социально-экономических и гуманитарных наук» (номер гранта 4769ГФ4). В результате АККЯ пополнился до 2 млн. словоупотреблений.

С 21 сентября 2015 г. над улучшением морфологической разметки принимает участие ООО «ЭР СИ О».

В начале 2016 г. на сайте была размещена полноценная версия Алматинского корпуса казахского языка, размер корпуса составил около 20 миллионов словоупотреблений.

С октября 2016 г. в улучшении функциональности АККЯ принимает участие кафедра информатики КазНУ им. аль-Фараби благодаря деятельности к.ф.-м.н., доцента Мансуровой М.Е. Информационно-техническим обслуживанием корпуса со стороны КазНУ им. аль-Фараби занимается Ермеков Жантемир.

В настоящее время работа над улучшением базы АККЯ проводится силами кафедры общего языкознания и европейских языков факультета филологии и мировых языков Казахского национального университета им. аль-Фараби под руководством д.филол.н., профессора Г. Б. Мадиевой с участием сотрудников факультета филологии НИУ ВШЭ (Москва).

Участники проекта:

Сотрудники факультета филологии НИУ ВШЭ (Москва):
Михаил Даниэль
Тимофей Архангельский
Светлана Толдова
Ольга Ляшевская

Обновленный состав профессорско-преподавательского состава, докторанты,магистранты и студенты кафедры общего языкознания и европейских языков:
Жанна Уматова
Маншук Мамбетова
Гульназ Искакова
Сауле Бектемирова
Альбина Досанова
Аяужан Таусогарова
Гульнар Борибаева
Анна Данченко
Динара Мадиева
Гульназ Набиева
Айгерим Жаналиева
Улбосын Парманова
Айнура Баймурзина
Гульсара Байжанова
Жолдас Орысбаев
Нургуль Исмайлова
Феруза Молдашева
Улжан Анарбекова
Фариза Хасилан
Асем Токенова
Таншолпан Жамалова
Жазира Алишева

Мы благодарим сотрудников факультета филологии НИУ ВШЭ (Москва), которые внесли существенный вклад в создание Алматинского корпуса казахского языка на базе КазНУ им. аль-Фараби.

Выражаем свою признательность Департаменту информационных технологий под руководством Жаныл Мамыковой за поддержку в работе над АККЯ, библиотеке Казахского национального университета им. аль-Фараби, Издательскому дому «Қазақ университеті» за предоставляемую проекту электронную коллекцию научных и художественных текстов.