Ссылки

DOI

В литературе исследование семантического текстового сходства (СТС) описывается как фундаментальная часть многих задач обработки естественного языка. Подходы СТС зависят от наличия и объема лексико-семантической базы. Существуют несколько попыток по улучшению лексико-семантической базы, и представлено большое количество приложений для английского языка. Лингвистическая база бразильского португальского, по сравнению с английской, не имеет одинаковой доступности в отношении семантических связей и содержания, что приводит к потере точности в задачах СТС. В настоящей работе описан подход, сочетающий лексико-семантические онтологические базы бразильского португальского и английского языков, для использования всех возможностей языковых отношений и создания комбинированной модели для измерения семантического текстового сходства. Предложенный подход проанализирован на известном и признанном наборе данных бразильского португальского языка СТС, который позволил выявить преимущества и недостатки комбинированной модели.
Переведенное названиеСемантическое сходство текстов на бразильском португальском языке: Подход, основанный на комбинировании нескольких языков
Язык оригиналаанглийский
Страницы (с-по)235-244
Число страниц10
ЖурналVestnik Sankt-Peterburgskogo Universiteta, Prikladnaya Matematika, Informatika, Protsessy Upravleniya
Том15
Номер выпуска2
DOI
СостояниеОпубликовано - 1 янв 2019

    Предметные области Scopus

  • Компьютерные науки (все)
  • Теория оптимизации
  • Прикладная математика

    Области исследований

  • computational linguistics, natural language processing, ontologies, Semantic textual similarity, компьютерная лингвистика, обработка естественного языка, онтологии, семантическое сходство текстов

ID: 49087634