Башҡорт шиғриәте корпусы

Был сайтта бер миллиондан ашыу һүҙ һәм һүҙбәйләнештән торған Башҡорт шиғриәте корпусы урынлаштырылған (500 мең самаһы шиғри юл, 101 шағирҙың 13 меңдән ашыу шиғыры). Был башҡорт теленең тәүге шиғриәт корпусы, ә рус теле корпусынан ҡала, донъяла — икенсе шиғриәт корпусы. Уның үҙенсәлеге шунда: корпустың текст коллекцияһы ХХ—ХХI быуат башы башҡорт шағирҙарының шиғри әҫәрҙәренән тупланған.

Корпуста бирелгән текстар һәр бер һүҙ ҡулланылышына тәғәйен беркетелгән морфологик күрһәткестәр менән йыһызландырылған, бынан тыш айырым билдәле бер шиғри үлсәм менән яҙылған юлдарҙа йә рифма зонаһында һ.б. эҙләнеү мөмкинселеген биреүсе махсус шиғри билдәләр ҙә күрһәтелгән. Текста булған һәр бер һүҙҙең руссаға тәржемәһе бар, шунлыҡтан был система менән башҡорт телен белмәгән тел белгестәре лә, ғөмүмән киң профилле филологтар һәм шиғриәт ғилеме, сағыштырма тел ғилеме белгестәре лә файҙалана ала.

Корпус өсөн Көнсығыш әрмән корпусы (EANC) эҙләү системаһы яраҡлаштырылған.

Корпусты төҙөү РФА-ның Тел ғилеме институтының Донъя шиғриәте лингвистик тикшеренеүҙәр үҙәгенең мәғлүмәти һәм мораль ярҙамында башҡорт дәүләт университетының компьютер филологияһы лабораторияһы хеҙмәткәрҙәре тарафынан атҡарыла. Проектты тормошҡа ашырыуҙа РФА-һының ағза-корреспонденты В. А. Плунгян даими консультациялар бирә һәм һәр яҡлап ярҙам күрһәтеп тора.

Һүҙ формаларының грамматик анализы автоматик рәүештә эшләнә. Автоматик морфологик анализ системаһы (Bashmorph) Б. В. Орехов һәм А. А. Ғәлләмов тарафынан эшләнде.

Корпус менән ҡулланыу инструкцияһы менән ошо адрес буйынса танышып була.