В статье рассматриваются методы обработки параллельных и сопоставимых корпусов текстов в ходе тематического моделирования. Обсуждаются процедуры оценки сопоставимости текстов в корпусе, отбора пар слов - кандидатов в переводные эквиваленты на основе двуязычных параллельных и сопоставимых текстов, формирования кластеров лексем - кандидатов в переводные эквиваленты, построения многоязычных тематических моделей корпусов.
Переведенное название POSSIBILITIES OF PARALLEL AND COMPARABLE TEXTS IN THE DEVELOPMENT OF TOPIC MODELS FOR CORPORA
Язык оригиналарусский
Название основной публикацииПрикладная лингвистика в науке и образовании: ALPAC Report - полвека после разгрома
Подзаголовок основной публикациитруды VIII Международной научной конференции
Место публикацииСПб
ИздательИздательство РГПУ им. А.И. Герцена
Страницы194-199
ISBN (печатное издание)978-5-94777-406-1
СостояниеОпубликовано - 2016
СобытиеVIII Международная научная конференция «ПРИКЛАДНАЯ ЛИНГВИСТИКА В НАУКЕ И ОБРАЗОВАНИИ. ALPAC REPORT – ПОЛВЕКА ПОСЛЕ РАЗГРОМА» -
Продолжительность: 24 ноя 201626 ноя 2016

конференция

конференцияVIII Международная научная конференция «ПРИКЛАДНАЯ ЛИНГВИСТИКА В НАУКЕ И ОБРАЗОВАНИИ. ALPAC REPORT – ПОЛВЕКА ПОСЛЕ РАЗГРОМА»
Период24/11/1626/11/16

ID: 18465826