Как найти словоформу в корпусе?

В окне поиска в строке «Поиск точных форм» наберите нужную словоформу и щелкните на кнопке «Поиск»:

В этом поле также доступен поиск только по нескольким словоформам. Слова делятся по пробелам, вводить их нужно без знаков препинания. Например, вы можете ввести запрос "кто виноват и что делать", но не "кто виноват и что делать?".

В отдельном окне вы получите результаты поиска.

Что такое лексико-грамматический поиск?

Лексико-грамматический поиск позволяет искать все вхождения лексемы, вхождения лексемы в нужной грамматической форме, необходимые тэги ошибок, а так же позволяет искать сочетания нескольких слов.

Чтобы найти все вхождения конкретной лексемы в корпус, на странице поиска в зоне «Лексико-грамматический поиск» в поле «Словоформа» наберите нужное слово и щелкните на кнопке «Поиск» (лексему нужно набирать в основной, словарной форме):

В ответ на этот запрос Вы получите все словоформы, относящиеся к лексеме и входящие в Корпус.

Расстояние между словами

В графе «Расстояние» устанавливается нужное расстояние от первого слова до всех следующих (например, расстояние 1–1 означает, что слово будет непосредственно справа от первого слова поиска, расстояние 1–2 – слово будет справа рядом или справа через одно слово, 2–2 – слово будет справа через одно слово от первого. Расстояние может быть отрицательным (например, -1 и -2). Если Вы ищете последовательность из трех слов, то в первой графе "Расстояние" нужно задать параметры 1-1, а во второй 2-2.

Категория ошибок Тэг Описание Пример Разметка примера
Орфография Graph смешение алфавитов Dруг [‘=друг’] человек, которому вы можно доверять. Graph+Subst
Но маме его не так думала… После этого она мне вообще не геагировала [‘=реагировала’]–через год! Graph+Subst
Hyphen ошибки в дефисном написании Кудато Hyphen+Del
потому-что Hyphen+Insert
Space ошибка в слитно-раздельном написании не достаточный Space+Insert
Немогу Space+Del
Ortho прочие орфографические ошибки карова, прожыть Ortho+Subst
Translit неверная транлитерация имени собственного Гиминьгвэй [вм. Хемингуэй] Translit
Misspell комплексная ошибка, затрагивающая несколько букв (трансформировано написание слова в целом) деяк (вм. денег) Misspell
Морфологические ошибки Deriv случаи словотворчества, когда студент, используя приставки и/или суффиксы, создаёт несуществующее слово Их шармантный акцент делает их обаятельными Deriv
Но это не действителная дружбость [‘=дружба’], а виртуальная подделка Deriv+Insert;
Не только люди, но собаки и котошки [‘=коты/кошки’] может быт другя. Deriv+Insert;
Infl использование окончания, которое отсутствует в парадигме данного слова Я с Кодием [‘=Коди’] будем развиться. Infl+Insert
В статье не говорять о побочним действиях нелегальных наркотиках Infl+Subst
Num употребление слова в неверной числовой форме (несоответствующей контексту или аномальной для этого слова) мы занимались физкультурами Num
Gender изменение родовой принадлежности слова Автор даёт серьезныю комментарию об американcком обществе Gender
Altern ошибка в чередовании основы любю (вместо люблю) Altern
Morph прочие морфологические ошибки
Синтаксические ошибки Asp неверная видовая форма или неверный выбор глаголов ненаправленного или повторяющегося движения (ср. ехать - ездить) Аня была русская женшина, которая не знала английский язык, я просто помню, как мне сразу она нравилась [‘=понравилась’].
я не разу на пляж не ехала
Asp
ArgStr ошибки в аргументной структуре глагола, существительного или прилагательного Исскусство учит человека о эмоциональной глубине ArgStr+Insert
Passive неверное использование пассива лесть часто злоупотребляется… [вм. лестью часто злоупотребляют ] Когда Николас проснулся они были обокрадены Passive
Tense ошибка во временной форме глагола (например, когда по контексту ясно, что требуется прошедшее время, а студент употребил настоящее). NB! Тег описывает только ошибки во времени глагола, не в виде - видовые ошибки маркируются тегом Asp
Mode ошибка в использовании условного наклонения или образовании формы условного наклонения (пропуск частицы бы, не - в вопросах типа "Не могли бы вы прислать мне инструкцию?" ) Экономическая составляющая важно в том, что нужны такие фирмы и организации чтобы помогать этому экологическую региону [вм. которые бы помогали этому региону]
Это возможно, если участники согласились [вм. Если бы все участники согласились]
Mode
Refl неверное употребление возвратных глаголов стречала [= встречалась] с мою подрушку Refl
AgrNum ошибка в согласовании по числу Друг слышал и нравится что вы сказал [‘=сказали’].
Сема взял черепаху в руки, взял все своё принадлежности
AgrNum
AgrCase ошибка в согласовании по падежу (NB Тег AgrCase не используется в случаях нарушения падежного управления: ср. с этом значением vs стречала с мою подрушку. Ошибка в управлении описывается тегом Gov) с этом значением AgrCase
AgrGender ошибка в согласовании по роду (прилагательных, причастий, местоимений или глаголов прошедшего времени) Наша дружба самая важная асппект моей жизни. AgrGender
AgrPers неверное согласование сказуемого по лицу Она никогда не буду стать [‘=станет’] врачом AgrPers
AgrGerund ошибка в согласовании деепричастия Ходя по этому городу мой рот не закрывался от удевления AgrGerund
Gov ошибка в управлении (NB Тег Gov не используется в случаях нарушения согласования по падежу: ср. стречала с мою подрушку vs с этом значением. Ошибка в падежном согласовании описывается тегом AgrCase) Он … полон красотой [вм. полон красоты]чистых и нежных эмоций
Люди думают, что легко найти хороших друзья [вм. найти хороших друзей]
Gov
Ref ошибки в употреблении местоимений (пропуск или неверный выбор местоимения) Я люблю русский язык и никогда не забуду. [вм. никогда его не забуду] Ref+Del
Почему Тарковский назвал его фильм [вм. свой фильм] именно «Иваново детство»?» Ref+Subst
Conj ошибка в употреблении союза Главное, можно понимать причины зачем это случается [вм. почему это случается] Conj
Нам всем интересно, если у меня будет сын или дочь; [вм. ли: будет ли у меня…] Conj+Transfer
WO ошибка в порядке слов С большими трудностями приходится сталкиваться директору приюта ежедневно. WO
Neg неверная постановка отрицания Если человек понимает как язык работает тогдо не будет сложно понимать юмор или поэзю [вм. будет несложно понимать…] Neg
Aux Неверное употребление глагола «есть», глаголов-связок Когда мне грустно, друг всегда есть со мной [вм. друг всегда со мной] Aux+Insert
Brev Употребление кратких/полных прилагательных Чай был такой вкусен! [вм. такой вкусный] Brev
Com ошибки в сравнительных формах Com
GenNeg ошибка в отрицании при инфинитиве В самом деле, у них нет ответы всех вопрос, потому что они не знают все в мире GenNeg
Impers ошибки в безличных и неопределенно личных конструкциях
Syntax прочие синтаксические ошибки, не описанные в классификации
Ошибки в конструкциях Constr неверный выбор конструкции или ошибка внутри конструкции (ошибка затрагивает выбор или форму более одной единицы или связана с пропуском/добавлением единицы) Я имею две собаки [вм. у меня есть]
На большей части моей жизни я не знала, что такое друг
Constr+Subst
Лексические ошибки Lex неверное словоупотребление Наша учительница принципиально проводила урок на русском языке [вм. специально]
У ног башни [вм. у подножия башни] расположен великолепный парк в котором можно прекрасно отдохнуть и насладиться духом этого города
Lex
Prep ошибка в употреблении предлога Нам ['=Для нас'] мнения других слишком важны prep + miss
CS code-switching (использование иноязычного слова, написанного латиницей или кириллицей) У берега бегала dog CS
небо было хелл блау CS
Par паронимия Этот завлекательный [вм. увлекательный] язык
Ближние каникулы [вм. ближайшие]
Par
Idiom ошибка в употреблении устойчивого словосочетания От дубов простыл и свет [вм. след]
Эти мысли застряли в голове [вм. засели в голове]
Idiom
Дополнительные теги (используются только в сочетании с тегами ошибок, приведёнными выше) Transfer интерференция с L1 Я не могу дождадса до кониколов [калька ‘wait till’] но я совсем забыла что мне нужно здават 2 бумаги через неделю [калька “paper”]
Not-clear по контексту невозможно восстановить смысл фразы и исправить ошибку Он не приходит груст тебе, но шоколат и ГУЕННЫ.
Miss пропуск буквы, морфемы или слова Мы наблюдаем разные процессы с явлениями природы [пропуск причастия связанные]
Extra вставка ненужной элемента (буквы, морфемы или слова) У него ещё одна причина, чтобы увидеть, если ли она достойна услышать его теорию [лишний союз если]
Transp перестановка двух соседних элементов (буквы, морфемы или слова)
Subst замена буквы, морфемы или слова
Disc Ошибка в дискурсе(?) (ставится совместно с Lex, WO или Constr) В свою очередь как ['=В то время как'] другие участники…

Начало работы

Чтобы приступить к разметке в корпусе RLC необходимо:

  1. Зайти на сайт под своим логином, кликнув на портрет в верхнем правом углу и заполнив поля логин/пароль в появившемся окне.
  2. Перейти в раздел “Аннотировать” и выбрать текст в нужном разделе. Первый номер перед названием текста означает его порядковый номер в данном разделе, второй номер – уникальный номер в базе данных.
    NB! Поскольку тексты постоянно могут перемещаться из раздела в раздел и менять порядок, для указания текста используется его уникальный номер.

Окно разметки

Разметка

На странице текста, чтобы разметить фрагмент, необходимо его выделить, зажав левую кнопку мыши, а затем нажать .

В открывшемся окне нужно ввести теги и исправления.

Список используемых тэгов расположен справа от текста. Кроме того, в поле ввода тегов при вводе хотя бы одного символа появляется список-подсказка.

При разметке следует помнить следующие правила:

  • Несколько тегов записываются через пробел. Если тег выбран из списка-подсказки, пробел ставится автоматически.
  • Теги могут пересекаться, т.е. внутри размеченного фрагмента можно разметить другой фрагмент.
  • В случаях подобных “Он открыл дверь красивый ключ” тег ставится только у слова “ключ”, так как “красивый” было согласовано правильно, хоть и с неправильной формой существительного.

После того, как разметка текста полностью закончена необходимо нажать оранжевую кнопку “Annotated”, тем самым переместив его в раздел “Annotated, not checked”.

Что дает регистрация в корпусе

Зарегистрировавшись в корпусе, вы сможете:

  • добавлять в корпус новые тексты и информацию об авторах,
  • получить доступ к полным текстам, а не только к результатам поиска с расширенным контекстом,
  • добавлять тэги / комментарии / исправления к текстам,
  • редактировать существующую разметку,
  • размечать примеры непосредственно в поисковой выдаче,
  • перейти от выдачи поиска к полным текстам,
  • сохранять в свою учетную запись выбранные примеры.

Как зарегистрироваться

Чтобы получить доступ к необходимым вам функциям, нужно подать заявку на регистрацию в корпусе RLC, отправив письмо на адрес small.corpora@gmail.com с темой "Регистрация в RLC". Пожалуйста, укажите в письме причины, по которым вам необходим доступ в корпус.

В течение нескольких дней вы получите ответ с вашим персональным логином и временным паролем для первого входа.

Что делать, если я забыл пароль

Если вы забыли пароль, отправьте письмо на адрес small.corpora@gmail.com с темой "Восстановление пароля в RLC". Пожалуйста, укажите в письме ваш логин. Если вы также не помните логин, достаточно просто написать нам с того же электронного адреса, с которым вы были зарегистрированы.

В течение нескольких дней ваш пароль будет сброшен, и вы получите письмо с новым паролем.