В статье рассматриваются современные методы автоматической рубрикации текстов и их недостатки. Предлагается комплексный лингвистический подход, позволяющий избежать этих недостатков. Описывается разработанный алгоритм автоматической обработки текстов и основанный на нем алгоритм выявления и ранжирования релевантных тексту рубрик.
Язык оригинала
русский
Страницы (с-по)
135-147
Журнал
СТРУКТУРНАЯ И ПРИКЛАДНАЯ ЛИНГВИСТИКА
Номер выпуска
9
Состояние
Опубликовано - 2012
Области исследований
АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ, НЕОДНОЗНАЧНОСТЬ, ЛОЖНАЯ КОРРЕЛЯЦИЯ, ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ, СЕМАНТИКА ПРЕДЛОЖЕНИЯ, AUTOMATIC TEXT CLASSIFICATION, AMBIGUITY, FALSE CORRELATION, NATURAL LANGUAGE PROCESSING, SENTENTIAL SEMANTICS