За последние 20 лет область автоматической обработки текстов (Natural Language Processing, NLP) достигла значительных успехов в сфере разнообразного лексико-грамматического анализа, выявления темы или поиска информации. Тем не менее большинство работ было проведено для западных языков индоевропейской группы и не может применяться к другим языковым группам. Таким образом, сегодня возникает необходимость в разработке инструментов для остальных языковых групп. Вьетнамские ученые только недавно начали заниматься областью NLP. Авторам неизвестны публикации ни по формальной лингвистике, ни по распознаванию формальных правил для определения границ вьетнамских слов и словосочетаний. Основные задачи обработки текстов на вьетнамском языке, такие как лексико-грамматический анализ, синтаксический анализ и т. п., очень сложны для вычислительной лингвистики. В работе рассматриваются способы применения методов статистической обработки для построения списка вьетнамских слов и словосочетаний. Целью нашего проекта является пос
Язык оригиналарусский
Страницы (с-по)161-169
ЖурналВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. СЕРИЯ 10: ПРИКЛАДНАЯ МАТЕМАТИКА, ИНФОРМАТИКА, ПРОЦЕССЫ УПРАВЛЕНИЯ
Номер выпуска3
СостояниеОпубликовано - 2009

ID: 5014269