СТАТИСТИЧЕСКИЙ СПОСОБ ВЫДЕЛЕНИЯ СЛОВ И СЛОВОСОЧЕТАНИЙ ИЗ ВЬЕТНАМСКИХ ПЕЧАТНЫХ ТЕКСТОВ Using application of statistics for word extraction from vietnamese documents.

За последние 20 лет область автоматической обработки текстов (Natural Language Processing, NLP) достигла значительных успехов в сфере разнообразного лексико-грамматического анализа, выявления темы или поиска информации. Тем не менее большинство работ было проведено для западных языков индоевропейской группы и не может применяться к другим языковым группам. Таким образом, сегодня возникает необходимость в разработке инструментов для остальных языковых групп. Вьетнамские ученые только недавно начали заниматься областью NLP. Авторам неизвестны публикации ни по формальной лингвистике, ни по распознаванию формальных правил для определения границ вьетнамских слов и словосочетаний. Основные задачи обработки текстов на вьетнамском языке, такие как лексико-грамматический анализ, синтаксический анализ и т. п., очень сложны для вычислительной лингвистики. В работе рассматриваются способы применения методов статистической обработки для построения списка вьетнамских слов и словосочетаний. Целью нашего проекта является пос

Original language	Russian
Pages (from-to)	161-169
Journal	ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. СЕРИЯ 10: ПРИКЛАДНАЯ МАТЕМАТИКА, ИНФОРМАТИКА, ПРОЦЕССЫ УПРАВЛЕНИЯ
Issue number	3
State	Published - 2009

СТАТИСТИЧЕСКИЙ СПОСОБ ВЫДЕЛЕНИЯ СЛОВ И СЛОВОСОЧЕТАНИЙ ИЗ ВЬЕТНАМСКИХ ПЕЧАТНЫХ ТЕКСТОВ Using application of statistics for word extraction from vietnamese documents.

Links