Статья посвящена определению грамматических значений рода и одушевленности у сложносоставных существительных при автоматическом морфологическом анализе как важном компоненте систем обработки текстов на естественном языке. Из имеющихся подходов к компьютерному морфоанализу наиболее распространенным на сегодняшний день является метод, опирающийся на словарь готовых словоформ. Наряду с заметными преимуществами, он имеет существенный недостаток, а именно: неспособность справляться со словами, которых нет в словаре. К ним в частности относятся сложносоставные существительные, поскольку они образуют открытый класс лексических единиц и, следовательно, не могут быть в принципе исчислены и занесены в словарь. В статье принят сугубо формальный подход к выделению объекта исследования и его анализу, что обусловлено специфическим ракурсом рассмотрения, диктуемым потребностями компьютерной обработки текста. В то же время, имеющаяся литература по проблеме рода и одушевленности сложносоставных существительных имеет другую н
Язык оригиналарусский
Название основной публикацииXLIII Международная филологическая конференция (Санкт-Петербург, 11-16 марта 2014 г.): Избранные труды
ИздательИздательство Санкт-Петербургского университета
Страницы386-395
ISBN (печатное издание)978-5-8465-1395-2
СостояниеОпубликовано - 2015
Опубликовано для внешнего пользованияДа

    Области исследований

  • автоматическая обработка естественного языка, морфологический анализ, сложносоставное существительное, категория рода, категория одушевленности.

ID: 4761643