В статье описан эксперимент по тестированию гибридного морфоанализатора NLTK4RUSSIAN на материалах соревнований «Dialogue Evaluation» 2017 г. Эксперименты с обучением морфоанализатора выполнены на основе подкорпусов НКРЯ и OpenCorpora. Для тестирования использовались выборки из художественных текстов и текстов социальных сетей. В ходе исследования решен ряд задач, в том числе задача конвертации морфологической разметки из формата Universal Dependencies в формат P yM orphy2, используемый в OpenCorpora. Результаты тестирования гибридного морфоанализатора NLTK4RUSSIAN соответствуют «золотому стандарту» для русского языка.
Переведенное названиеTESTING AND ASSESSMENT OF THE NLTK4RUSSIAN HYBRID MORPHOLOGICAL ANALYZER
Язык оригиналарусский
Страницы (с-по)37-42
ЖурналКомпьютерная лингвистика и вычислительные онтологии
Номер выпуска2
СостояниеОпубликовано - 2018

ID: 95638746