Результаты исследований: Научные публикации в периодических изданиях › статья в журнале по материалам конференции › Рецензирование
Разработка базы данных по семантике русских предлогов. / Москвина, Анна Денисовна; Еникеева, Екатерина Владимировна; Захаров, Виктор Павлович.
в: Компьютерная лингвистика и вычислительные онтологии, № 3, 2019, стр. 106-115.Результаты исследований: Научные публикации в периодических изданиях › статья в журнале по материалам конференции › Рецензирование
}
TY - JOUR
T1 - Разработка базы данных по семантике русских предлогов
AU - Москвина, Анна Денисовна
AU - Еникеева, Екатерина Владимировна
AU - Захаров, Виктор Павлович
PY - 2019
Y1 - 2019
N2 - В данной статье рассматривается разработка базы данных, содержащей информацию о предложных конструкциях русского языка. Работа проводится в рамках проекта по созданию квантитативной грамматики русских предложных конструкций. Исходной информацией является материал из нескольких корпусов (Araneum Russicum Minus, подкорпуса НКРЯ) и результаты его семантической обработки. На данный момент размечено 4200 употреблений двадцати пяти первообразных предлогов, на выборке из этих данных построена экспериментальная база данных. Представление накопленного материала в виде базы данных позволяет оптимизировать процесс получения статистической информации об употреблении предлогов, а также упростит изучение связей между семантическими и структурными свойствами конструкций. Так, для каждой конструкции пользователь сможет извлечь информацию о ее частоте, реализованных значениях предлога, получить расширенный контекст, сравнить статистику по корпусам разных жанров. В статье рассматриваются особенности материала, обосновывается структура разрабатываемой базы данных, приводятся примеры запросов. Предварительные результаты говорят о целесообразности дальнейшей разработки.
AB - В данной статье рассматривается разработка базы данных, содержащей информацию о предложных конструкциях русского языка. Работа проводится в рамках проекта по созданию квантитативной грамматики русских предложных конструкций. Исходной информацией является материал из нескольких корпусов (Araneum Russicum Minus, подкорпуса НКРЯ) и результаты его семантической обработки. На данный момент размечено 4200 употреблений двадцати пяти первообразных предлогов, на выборке из этих данных построена экспериментальная база данных. Представление накопленного материала в виде базы данных позволяет оптимизировать процесс получения статистической информации об употреблении предлогов, а также упростит изучение связей между семантическими и структурными свойствами конструкций. Так, для каждой конструкции пользователь сможет извлечь информацию о ее частоте, реализованных значениях предлога, получить расширенный контекст, сравнить статистику по корпусам разных жанров. В статье рассматриваются особенности материала, обосновывается структура разрабатываемой базы данных, приводятся примеры запросов. Предварительные результаты говорят о целесообразности дальнейшей разработки.
KW - РУССКИЕ ПРЕДЛОГИ
KW - ПРЕДЛОЖНЫЕ КОНСТРУКЦИИ
KW - ЗНАЧЕНИЯ ПРЕДЛОГОВ
KW - КОРПУСНАЯ ЛИНГВИСТИКА
KW - база данных
UR - https://www.elibrary.ru/item.asp?id=42618310
M3 - статья в журнале по материалам конференции
SP - 106
EP - 115
JO - Компьютерная лингвистика и вычислительные онтологии
JF - Компьютерная лингвистика и вычислительные онтологии
SN - 2541-9781
IS - 3
ER -
ID: 52271278