Разработка базы данных по семантике русских предлогов

В данной статье рассматривается разработка базы данных, содержащей информацию о предложных конструкциях русского языка. Работа проводится в рамках проекта по созданию квантитативной грамматики русских предложных конструкций. Исходной информацией является материал из нескольких корпусов (Araneum Russicum Minus, подкорпуса НКРЯ) и результаты его семантической обработки. На данный момент размечено 4200 употреблений двадцати пяти первообразных предлогов, на выборке из этих данных построена экспериментальная база данных. Представление накопленного материала в виде базы данных позволяет оптимизировать процесс получения статистической информации об употреблении предлогов, а также упростит изучение связей между семантическими и структурными свойствами конструкций. Так, для каждой конструкции пользователь сможет извлечь информацию о ее частоте, реализованных значениях предлога, получить расширенный контекст, сравнить статистику по корпусам разных жанров. В статье рассматриваются особенности материала, обосновывается структура разрабатываемой базы данных, приводятся примеры запросов. Предварительные результаты говорят о целесообразности дальнейшей разработки.

Переведенное название	DEVELOPMENT OF A DATABASE ON THE RUSSIAN PREPOSITIONS SEMANTICS
Язык оригинала	русский
Страницы (с-по)	106-115
Журнал	Компьютерная лингвистика и вычислительные онтологии
Номер выпуска	3
Состояние	Опубликовано - 2019

Области исследований

РУССКИЕ ПРЕДЛОГИ, ПРЕДЛОЖНЫЕ КОНСТРУКЦИИ, ЗНАЧЕНИЯ ПРЕДЛОГОВ, КОРПУСНАЯ ЛИНГВИСТИКА, база данных

ID: 52271278