В докладе представлены результаты работы по модификации алгоритма RAKE, используемого для быстрого извлечения ключевых слов и словосочетаний. В качестве источника информации о границах синтаксических групп в RAKE предлагаются правила грамматики синтаксического анализатора для русского языка на основе NLTK (NLTK4RUSSIAN). Для определения эффективности работы алгоритма с русскоязычными текстами были проведены эксперименты на материале представительных корпусов.
Original languageRussian
Title of host publicationКорпусная лингвистика - 2017
Subtitle of host publicationТруды международной конференции
Place of PublicationСПб
PublisherИздательство Санкт-Петербургского университета
Pages268-275
StatePublished - 2017
EventКорпусная лингвистика - 2017 - Санкт-Петербург, Russian Federation
Duration: 27 Jul 201730 Jul 2017
http://phil.spbu.ru/nauka/konferencii/arhiv/konferencii-2016-2017-goda/mezhdunarodnaya-nauchnaya-konferenciya-korpusnaya-lingvistika-2017
https://events.spbu.ru/events/anons/corpora-2017/

Conference

ConferenceКорпусная лингвистика - 2017
Abbreviated titleCORPORA 2017
Country/TerritoryRussian Federation
CityСанкт-Петербург
Period27/07/1730/07/17
Internet address

    Scopus subject areas

  • Language and Linguistics
  • Information Systems

ID: 9325302