Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка

Standard

Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка. / Митрофанова, О.А.; Ляшевская, О.Н.; Грачкова, М.А.; Шиморина, А.С.; Шурыгина, А.С.; Романов, С.В.

в: СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА, Том 9, 2012, стр. 159-175.

Результаты исследований: Научные публикации в периодических изданиях › статья

BibTeX

@article{1e42ab45d48d4f68a7171d39e52ef620,

title = "Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка",

abstract = "Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.",

keywords = "разрешение лексико-семантической неоднозначности, конструкции, выделение конструкций, Национальный корпус русского языка, классификация контекстов",

author = "О.А. Митрофанова and О.Н. Ляшевская and М.А. Грачкова and А.С. Шиморина and А.С. Шурыгина and С.В. Романов",

year = "2012",

language = "русский",

volume = "9",

pages = "159--175",

journal = "СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА",

issn = "0202-2400",

publisher = "Издательство Санкт-Петербургского университета",

}

RIS

TY - JOUR

T1 - Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка

AU - Митрофанова, О.А.

AU - Ляшевская, О.Н.

AU - Грачкова, М.А.

AU - Шиморина, А.С.

AU - Шурыгина, А.С.

AU - Романов, С.В.

PY - 2012

Y1 - 2012

N2 - Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.

AB - Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.

KW - разрешение лексико-семантической неоднозначности

KW - конструкции

KW - выделение конструкций

KW - Национальный корпус русского языка

KW - классификация контекстов

M3 - статья

VL - 9

SP - 159

EP - 175

JO - СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА

JF - СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА

SN - 0202-2400

ER -

ID: 5149739