DOI

В статье описывается разработанный авторами метод обнаружения тем в коротких текстовых документах из виртуальной музейной коллекции. Данный метод получил название Feature BTM, поскольку основывается на модификации третьего шага генеративного процесса известной тематической модели BTM. Был поставлен эксперимент по оценке качества, который показал преимущество в эффективности детектирования тем модифицированной моделью Feature BTM перед классической моделью BTM. Была описана технология тематической кластеризации документов, необходимая для построения тематических виртуальных музеев. Проведена оценка производительности, показывающая при незначительной потери скорости (менее 30 с) большую эффективность применения Feature BTM для выполнения кластеризации виртуальной музейной коллекции, чем использования классической модели BTM. Полученный авторами метод позволяет решить проблемы зашумленности и смещения темы при их выявлении, которые имеются в модели BTM.
Переведенное названиеМодификация метода тематического моделирования BTM для обнаружения тем в тематических виртуальных музеях
Язык оригиналаанглийский
Страницы (с-по)243-251
Число страниц9
ЖурналVestnik Sankt-Peterburgskogo Universiteta, Prikladnaya Matematika, Informatika, Protsessy Upravleniya
Том14
Номер выпуска3
DOI
СостояниеОпубликовано - 1 янв 2018

    Области исследований

  • тематическая модель, битерм, короткие тексты, модель BTM, кластеризация, тематический виртуальный музей

    Предметные области Scopus

  • Компьютерные науки (все)
  • Теория оптимизации
  • Прикладная математика

ID: 36273770