Semantic Textual Similarity on Brazilian Portuguese › Научные исследования в СПбГУ

Semantic Textual Similarity on Brazilian Portuguese: An approach based on language-mixture models

Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование

Ссылки

http://elibrary.ru/item.asp?id=38552369

DOI

https://doi.org/10.21638/11702/spbu10.2019.207
Конечная издательская версия

A. Silva
A. Lozkins
L.R. Bertoldi
S. Rigo
V.M. Bure

В литературе исследование семантического текстового сходства (СТС) описывается как фундаментальная часть многих задач обработки естественного языка. Подходы СТС зависят от наличия и объема лексико-семантической базы. Существуют несколько попыток по улучшению лексико-семантической базы, и представлено большое количество приложений для английского языка. Лингвистическая база бразильского португальского, по сравнению с английской, не имеет одинаковой доступности в отношении семантических связей и содержания, что приводит к потере точности в задачах СТС. В настоящей работе описан подход, сочетающий лексико-семантические онтологические базы бразильского португальского и английского языков, для использования всех возможностей языковых отношений и создания комбинированной модели для измерения семантического текстового сходства. Предложенный подход проанализирован на известном и признанном наборе данных бразильского португальского языка СТС, который позволил выявить преимущества и недостатки комбинированной модели.

Переведенное название	Семантическое сходство текстов на бразильском португальском языке: Подход, основанный на комбинировании нескольких языков
Язык оригинала	английский
Страницы (с-по)	235-244
Число страниц	10
Журнал	Vestnik Sankt-Peterburgskogo Universiteta, Prikladnaya Matematika, Informatika, Protsessy Upravleniya
Том	15
Номер выпуска	2
DOI	https://doi.org/10.21638/11702/spbu10.2019.207
Состояние	Опубликовано - 1 янв 2019

Предметные области Scopus

Компьютерные науки (все)
Теория оптимизации
Прикладная математика

Области исследований

computational linguistics, natural language processing, ontologies, Semantic textual similarity, компьютерная лингвистика, обработка естественного языка, онтологии, семантическое сходство текстов

ID: 49087634

Pure – это продукт компании Elsevier
На данном информационном ресурсе могут быть опубликованы архивные материалы
с упоминанием физических и юридических лиц, включенных Министерством юстиции
Российской Федерации в реестр иностранных агентов

Вход в Pure