В докладе представлены результаты работы по модификации алгоритма RAKE, используемого для быстрого извлечения ключевых слов и словосочетаний. В качестве источника информации о границах синтаксических групп в RAKE предлагаются правила грамматики синтаксического анализатора для русского языка на основе NLTK (NLTK4RUSSIAN). Для определения эффективности работы алгоритма с русскоязычными текстами были проведены эксперименты на материале представительных корпусов.
Язык оригиналарусский
Название основной публикацииКорпусная лингвистика - 2017
Подзаголовок основной публикацииТруды международной конференции
Место публикацииСПб
ИздательИздательство Санкт-Петербургского университета
Страницы268-275
СостояниеОпубликовано - 2017
СобытиеКорпусная лингвистика - 2017 - Санкт-Петербург, Российская Федерация
Продолжительность: 27 июл 201730 июл 2017
http://phil.spbu.ru/nauka/konferencii/arhiv/konferencii-2016-2017-goda/mezhdunarodnaya-nauchnaya-konferenciya-korpusnaya-lingvistika-2017
https://events.spbu.ru/events/anons/corpora-2017/

конференция

конференцияКорпусная лингвистика - 2017
Сокращенное названиеCORPORA 2017
Страна/TерриторияРоссийская Федерация
ГородСанкт-Петербург
Период27/07/1730/07/17
Сайт в сети Internet

    Предметные области Scopus

  • Языки и лингвистика
  • Информационные системы

ID: 9325302