В данной статье рассматривается разработка базы данных, содержащей информацию о предложных конструкциях русского языка. Работа проводится в рамках проекта по созданию квантитативной грамматики русских предложных конструкций. Исходной информацией является материал из нескольких корпусов (Araneum Russicum Minus, подкорпуса НКРЯ) и результаты его семантической обработки. На данный момент размечено 4200 употреблений двадцати пяти первообразных предлогов, на выборке из этих данных построена экспериментальная база данных. Представление накопленного материала в виде базы данных позволяет оптимизировать процесс получения статистической информации об употреблении предлогов, а также упростит изучение связей между семантическими и структурными свойствами конструкций. Так, для каждой конструкции пользователь сможет извлечь информацию о ее частоте, реализованных значениях предлога, получить расширенный контекст, сравнить статистику по корпусам разных жанров. В статье рассматриваются особенности материала, обосновывается структура разрабатываемой базы данных, приводятся примеры запросов. Предварительные результаты говорят о целесообразности дальнейшей разработки.
Переведенное названиеDEVELOPMENT OF A DATABASE ON THE RUSSIAN PREPOSITIONS SEMANTICS
Язык оригиналарусский
Страницы (с-по)106-115
ЖурналКомпьютерная лингвистика и вычислительные онтологии
Номер выпуска3
СостояниеОпубликовано - 2019

    Области исследований

  • РУССКИЕ ПРЕДЛОГИ, ПРЕДЛОЖНЫЕ КОНСТРУКЦИИ, ЗНАЧЕНИЯ ПРЕДЛОГОВ, КОРПУСНАЯ ЛИНГВИСТИКА, база данных

ID: 52271278