В статье рассматриваются современные методы автоматической рубрикации текстов и их недостатки. Предлагается комплексный лингвистический подход, позволяющий избежать этих недостатков. Описывается разработанный алгоритм автоматической обработки текстов и основанный на нем алгоритм выявления и ранжирования релевантных тексту рубрик.
Язык оригиналарусский
Страницы (с-по)135-147
ЖурналСТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
Номер выпуска9
СостояниеОпубликовано - 2012

    Области исследований

  • АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ, НЕОДНОЗНАЧНОСТЬ, ЛОЖНАЯ КОРРЕЛЯЦИЯ, ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ, СЕМАНТИКА ПРЕДЛОЖЕНИЯ, AUTOMATIC TEXT CLASSIFICATION, AMBIGUITY, FALSE CORRELATION, NATURAL LANGUAGE PROCESSING, SENTENTIAL SEMANTICS

ID: 5546585