КОРПУС КОНТАКТНО-ОБУСЛОВЛЕННОЙ РУССКОЙ РЕЧИ

носителей языков Севера Сибири и Дальнего Востока

Изучение контактно-обусловленной устной речи

На сайте доступен постоянно пополняемый корпус звучащей русской речи носителей автохтонных языков Севера Сибири и Дальнего Востока, а также список исследований, выполненных на его материале, и информация об участниках проекта.

Большая часть текстов, вошедших в корпус, — короткие спонтанные нарративы разных жанров (фольклор, биографические тексты), этнографические описания и под.; в меньшем количестве — диалоги; отдельная небольшая подвыборка текстов — записи свободных социолингвистических интервью.

В корпусе в разном объеме представлены образцы устной русской речи носителей самодийских языков (лесного и тундрового энецкого, нганасанского, ненецкого); тунгусо-маньчжурских (нанайского, ульчского, эвенского); чукотско-камчатских (чукотского). Общий объем корпуса 78452 словоупотреблений (ок. 34 часов аудиозаписей).

В корпусе возможен поиск по морфологическим признакам, а также поиск по специально разработанной разметке контактно-обусловленных явлений (грамматических и лексических отклонений от русского языка монолингвов). Поиск контактно-обусловленных явлений на данный момент доступен для части коллекции объемом 51487 словоупотреблений (ок. 9 часов аудиозаписей).

Корпус работает на платформе Tsakorpus, созданной Т. А. Архангельским: bitbucket.org/tsakorpus/tsakonian_corpus_platform.

Сайт создан при поддержке гранта РНФ 17-18-01649 в рамках проекта "Динамика языковых контактов в циркумполярном регионе".