За последние 20 лет область автоматической обработки текстов (Natural Language Processing, NLP) достигла значительных успехов в сфере разнообразного лексико-грамматического анализа, выявления темы или поиска информации. Тем не менее большинство работ было проведено для западных языков индоевропейской группы и не может применяться к другим языковым группам. Таким образом, сегодня возникает необходимость в разработке инструментов для остальных языковых групп. Вьетнамские ученые только недавно начали заниматься областью NLP. Авторам неизвестны публикации ни по формальной лингвистике, ни по распознаванию формальных правил для определения границ вьетнамских слов и словосочетаний. Основные задачи обработки текстов на вьетнамском языке, такие как лексико-грамматический анализ, синтаксический анализ и т. п., очень сложны для вычислительной лингвистики. В работе рассматриваются способы применения методов статистической обработки для построения списка вьетнамских слов и словосочетаний. Целью нашего проекта является пос
Original languageRussian
Pages (from-to)161-169
JournalВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. СЕРИЯ 10: ПРИКЛАДНАЯ МАТЕМАТИКА, ИНФОРМАТИКА, ПРОЦЕССЫ УПРАВЛЕНИЯ
Issue number3
StatePublished - 2009

ID: 5014269