Description

Основная цель проекта – описание семантического поля «империя» в русском, английском и чешском языках в виде взаимосвязанных тезаурусов с указанием связей между их элементами, с частотными характеристиками и примерами употребления в корпусах.
Выбор данных языков обусловлен тем что в этих языках понятие «империя» сильно связано с исторической памятью и что оно «живо» в языковом сознании носителей языка. Также нам интересно исследовать разные языки, с одной стороны, принадлежащие к одной языковой семье, с другой – к разным.

2018-2019








Key findings for the project

Целью проекта было формирование семантического поля «империя» на основе корпусов русского, английского и чешского языков и дистрибутивно-статистической методологии. Актуальность исследования заключается в создании лингвистического ресурса для указанных языков и в разработке методов анализа текста статистическими методами на основе корпусных данных. Понятие «семантическое поле» применяется в лингвистике для обозначения совокупности языковых единиц, объединенных каким-то общим семантическим признаком, то есть имеющих некоторый общий компонент значения. В роли таких лексических единиц выступают слова и словосочетания, как нарицательные, так и имена собственные. Был проведен анализ лексикографических источников и намечены варианты их использования. Методом семантического развертывания было определено предъядро поля для каждого из языков. Далее было осуществлено исследование на базе корпусов, а также серия ассоциативных экспериментов. За период проведения исследования были созданы корпусы по теме проекта общим объемом 77 млн слов. Использовались также готовые корпусы и инструменты систем Sketch Engine, Aranea Corpora, Corpus.Byu.Edu и Wortschatz. В результате работы сформировано лексическое наполнение семантического поля «империя» для трех языков. Одним из важнейших результатов исследования является технология формирования семантического поля на основе автоматизированных методов. Данная технология описана в отчете по проекту. Результаты исследований представлены в виде лексикографического продукта (базы данных и макета печатного издания) с количественными характеристиками связанности лексических единиц и примерами употреблений из корпусов. Произведена лингвистическая и культурно-историческая корреляция наполнения семантических полей "империя" для каждого из трех языков. Созданные за период проведения исследования корпусы доступны в текстовом формате (по запросу) и загружены в систему Sketch Engine. Сформированные база данных и сопутствующая информация представлены в Интернете по адресу https://imperium.wordform.ru/contacts/.

Academic ownership of participants (text description)

Захаров В.П. 70%
Гвоздёва Е.В. 15%
Семёнова Н.В. 15%

Transfer of the full copy of the report to third parties for non-commercial use: permitted/not permitted

разрешается

Check of the report for improper borrowing in external sources (plagiarism): permitted/not permitted

разрешается
Short title__
AcronymRFBR_a_2018 - 2
StatusFinished
Effective start/end date19/03/1915/12/19

Documents

ID: 39773170