DOI

The paper is devoted to processing parallel and comparable corpora by means of topic modelling. We focus our attention on Russian and English parallel and comparable texts. We use Latent Dirichlet Allocation (LDA) algorithm for building topic models of fiction texts, evaluation of compatibility for the original text and its translation(s), selection of possible translation equivalents.

Язык оригиналаанглийский
Название основной публикацииProceedings of the International Conference on Internet and Modern Society, IMS 2017
РедакторыIrina I. Tolstikova, Nikolai V. Borisov, Victor P. Zakharov, Nikolai V. Borisov, Leonid V. Smorgunov, Radomir V. Bolgov
ИздательAssociation for Computing Machinery
Страницы175-180
Число страниц6
ISBN (электронное издание)9781450354370
DOI
СостояниеОпубликовано - 21 июн 2017
СобытиеXX Международная объединенная научная конференция «Интернет и современное общество»: международная объединенная конференция - Университет ИТМО, Санкт-Петербург, Российская Федерация
Продолжительность: 21 июн 201723 июн 2017
Номер конференции: XX
http://icims.ifmo.ru/
http://ims.ifmo.ru/ru/pages/28/IMS_2017.htm

Серия публикаций

НазваниеACM International Conference Proceeding Series

конференция

конференцияXX Международная объединенная научная конференция «Интернет и современное общество»
Сокращенное названиеIMS-2017
Страна/TерриторияРоссийская Федерация
ГородСанкт-Петербург
Период21/06/1723/06/17
Сайт в сети Internet

    Предметные области Scopus

  • Человеко-машинное взаимодействие
  • Компьютерные сети и коммуникации
  • Компьютерное зрение и распознавание образов
  • Программный продукт

ID: 41188336