Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике материалов конференции
Ещё раз о способах снятия структурной омонимии: выбор единственной структуры в парсере Hurma. / Попов, А.М.; Протопопова, Е.В.; Букия, Г.Т.
Труды XIX Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2016).. 2016.Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике материалов конференции
}
TY - GEN
T1 - Ещё раз о способах снятия структурной омонимии: выбор единственной структуры в парсере Hurma
AU - Попов, А.М.
AU - Протопопова, Е.В.
AU - Букия, Г.Т.
PY - 2016
Y1 - 2016
N2 - Целью проекта Хурма является создание исследовательской платформы для анализа текстов на естественном языке, в первую очередь на русском. Данная платформа предполагает анализ текстов на различных языковых уровнях, в том числе и на синтаксическом. Возможность выбора единственной синтаксической структуры в результате синтаксического анализа востребована в большинстве прикладных задач, использующих синтаксическую информацию: для создания размеченных корпусов, извлечения информации из текста (фактов и именованных сущностей), машинного перевода и т.д. Наше исследование посвящено способам выбора наиболее правильной синтаксической структуры и выделению критериев, по которым такой выбор становится возможным. Мы предлагаем гибридный подход к взвешиванию синтаксических структур, использующий как критерии, задаваемые вручную, так и статистическую информацию о лексической сочетаемости синтаксически связываемых слов.
AB - Целью проекта Хурма является создание исследовательской платформы для анализа текстов на естественном языке, в первую очередь на русском. Данная платформа предполагает анализ текстов на различных языковых уровнях, в том числе и на синтаксическом. Возможность выбора единственной синтаксической структуры в результате синтаксического анализа востребована в большинстве прикладных задач, использующих синтаксическую информацию: для создания размеченных корпусов, извлечения информации из текста (фактов и именованных сущностей), машинного перевода и т.д. Наше исследование посвящено способам выбора наиболее правильной синтаксической структуры и выделению критериев, по которым такой выбор становится возможным. Мы предлагаем гибридный подход к взвешиванию синтаксических структур, использующий как критерии, задаваемые вручную, так и статистическую информацию о лексической сочетаемости синтаксически связываемых слов.
KW - синтаксический анализ
KW - структуры составляющих
KW - структуры зависимостей
KW - взвешенное дерево
KW - лексическая сочетаемость
KW - алгоритм CYK
M3 - статья в сборнике материалов конференции
BT - Труды XIX Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2016).
ER -
ID: 7621239