The paper presents discussion of the approaches to processing parallel and comparable text corpora in course of topic modelling. We focus our attention on the evaluation of text comparability, selection of possible translation equivalents from bilingual parallel and comparable texts, clustering of lemmata as possible translations, development of polylingual topic models.
Translated title of the contribution POSSIBILITIES OF PARALLEL AND COMPARABLE TEXTS IN THE DEVELOPMENT OF TOPIC MODELS FOR CORPORA
Original languageRussian
Title of host publicationПрикладная лингвистика в науке и образовании: ALPAC Report - полвека после разгрома
Subtitle of host publicationтруды VIII Международной научной конференции
Place of PublicationСПб
PublisherИздательство РГПУ им. А.И. Герцена
Pages194-199
ISBN (Print)978-5-94777-406-1
StatePublished - 2016
EventVIII Международная научная конференция «ПРИКЛАДНАЯ ЛИНГВИСТИКА В НАУКЕ И ОБРАЗОВАНИИ. ALPAC REPORT – ПОЛВЕКА ПОСЛЕ РАЗГРОМА» -
Duration: 24 Nov 201626 Nov 2016

Conference

ConferenceVIII Международная научная конференция «ПРИКЛАДНАЯ ЛИНГВИСТИКА В НАУКЕ И ОБРАЗОВАНИИ. ALPAC REPORT – ПОЛВЕКА ПОСЛЕ РАЗГРОМА»
Period24/11/1626/11/16

ID: 18465826