Исследование контактно-обусловленной русской речи
На сайте доступен постоянно пополняемый корпус звучащей русской речи носителей автохтонных языков Севера Сибири и Дальнего Востока.
Перейти к поиску
В корпусе в разном объеме представлены образцы устной русской речи носителей самодийских языков (лесного и тундрового энецкого, нганасанского, ненецкого); тунгусо-маньчжурских (нанайского, ульчского, эвенского); чукотско-камчатских (чукотского). Общий объем корпуса 78452 словоупотреблений (ок. 34 часов аудиозаписей).
Большая часть текстов, вошедших в корпус, — короткие спонтанные нарративы разных жанров (фольклор, биографические тексты), этнографические описания и под.; в меньшем количестве — диалоги; отдельная небольшая подвыборка текстов — записи свободных социолингвистических интервью.
Корпус работает на платформе Tsakorpus, созданной Т. А. Архангельским.
Корпус создан при поддержке гранта РНФ 17-18-01649 в рамках проекта "Динамика языковых контактов в циркумполярном регионе".
Тексты расшифрованы и размечены П.С. Плешак, Н.М. Стойновой, И.А. Хомченковой.
Речь в разных текстах коллекции очень разнится по степени интерференции со вторым языком: от практически неотличимой от стандартной русской речи больших городов до очевидно нестандартной и не во всем понятной носителям стандартного русского.
В корпусе возможен поиск по морфологическим признакам, а также поиск по специально разработанной разметке контактно-обусловленных явлений (грамматических и лексических отклонений от русского языка монолингвов). Поиск контактно-обусловленных явлений на данный момент доступен для части коллекции объемом 51487 словоупотреблений (ок. 9 часов аудиозаписей).
Ниже представлен инвентарь тэгов, которыми помечаются нестандартные явления.