Результаты исследований: Научные публикации в периодических изданиях › статья
Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка. / Митрофанова, О.А.; Ляшевская, О.Н.; Грачкова, М.А.; Шиморина, А.С.; Шурыгина, А.С.; Романов, С.В.
в: СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА, Том 9, 2012, стр. 159-175.Результаты исследований: Научные публикации в периодических изданиях › статья
}
TY - JOUR
T1 - Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка
AU - Митрофанова, О.А.
AU - Ляшевская, О.Н.
AU - Грачкова, М.А.
AU - Шиморина, А.С.
AU - Шурыгина, А.С.
AU - Романов, С.В.
PY - 2012
Y1 - 2012
N2 - Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.
AB - Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.
KW - разрешение лексико-семантической неоднозначности
KW - конструкции
KW - выделение конструкций
KW - Национальный корпус русского языка
KW - классификация контекстов
M3 - статья
VL - 9
SP - 159
EP - 175
JO - СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
JF - СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
SN - 0202-2400
ER -
ID: 5149739