В докладе обсуждаются результаты экспериментов по автоматическому выделению конструкций, проводимых на материале Национального корпуса русского языка (НКРЯ). С этой целью разработан компьютерный инструмент, позволяющий извлекать и обрабатывать сочетаемостные данные из выборок НКРЯ. В качестве целевых слов выступают русские имена существительные. Для каждого из целевых слов получены списки конструкций – наиболее частотные сочетания, имеющих бинарную структуру и включающихе целевое слово, частотныйе лексико-семантическийе теги – контекстныйе маркеры того или иного значения целевого слова, а также частотные леммы, характеризуемые этими семантическими тегомами. Например: ВИД (разновидность, тип) + r:abstr t:sport: спорт, футбол, биатлон и т.д. Выделенные конструкции систематизируются по структуре и лексико-семантическому наполнению. В заключение проводится проверка результатов экспериментов, предполагающая сравнение списков конструкций со сведениями о коллокациях, устойчивых сочетаниях и т.д., зарегистрированных
Original languageRussian
Title of host publicationКомпьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 30 мая - 3 июня 2012г.).
PublisherРоссийский государственный гуманитарный университет
Pages370–382
StatePublished - 2012
Externally publishedYes

ID: 4593684