• Евгений Сергеевич Ларин
В последние годы количество обрабатываемой информации существенно возросло, что породило необходимость в системах тематического моделирования, которые помогли бы эту информацию отсортировать. В данной работе представлен классификатор новостей в основе которого лежит алгоритм Online LDA. Основная особенность данной системы заключается в присвоении нескольких, наиболее релевантных, категорий каждому тексту. Обучение и тестирование проводились на коллекции новостей Reuters, которая состоит из 21578 документов. Несмотря на несколько скромные результаты, метод может быть полезен на практике из-за достаточно хорошей скорости обучения и работы. К тому же, показатели могут быть существенно улучшены более точным подбором гиперпараметров.
Язык оригиналарусский
Страницы (с-по)307-312
Журнал ПРОЦЕССЫ УПРАВЛЕНИЯ И УСТОЙЧИВОСТЬ
Том6
Номер выпуска1
СостояниеОпубликовано - 2019

    Области исследований

  • online lda, text classification, классификация текста

ID: 78410628