описание

Основная цель проекта – описание семантического поля «империя» в русском, английском и чешском языках в виде взаимосвязанных тезаурусов с указанием связей между их элементами, с частотными характеристиками и примерами употребления в корпусах.
Выбор данных языков обусловлен тем что в этих языках понятие «империя» сильно связано с исторической памятью и что оно «живо» в языковом сознании носителей языка. Также нам интересно исследовать разные языки, с одной стороны, принадлежащие к одной языковой семье, с другой – к разным.

2018-2019








основные результаты по проекту в целом

Целью проекта было формирование семантического поля «империя» на основе корпусов русского, английского и чешского языков и дистрибутивно-статистической методологии. Актуальность исследования заключается в создании лингвистического ресурса для указанных языков и в разработке методов анализа текста статистическими методами на основе корпусных данных. Понятие «семантическое поле» применяется в лингвистике для обозначения совокупности языковых единиц, объединенных каким-то общим семантическим признаком, то есть имеющих некоторый общий компонент значения. В роли таких лексических единиц выступают слова и словосочетания, как нарицательные, так и имена собственные. Был проведен анализ лексикографических источников и намечены варианты их использования. Методом семантического развертывания было определено предъядро поля для каждого из языков. Далее было осуществлено исследование на базе корпусов, а также серия ассоциативных экспериментов. За период проведения исследования были созданы корпусы по теме проекта общим объемом 77 млн слов. Использовались также готовые корпусы и инструменты систем Sketch Engine, Aranea Corpora, Corpus.Byu.Edu и Wortschatz. В результате работы сформировано лексическое наполнение семантического поля «империя» для трех языков. Одним из важнейших результатов исследования является технология формирования семантического поля на основе автоматизированных методов. Данная технология описана в отчете по проекту. Результаты исследований представлены в виде лексикографического продукта (базы данных и макета печатного издания) с количественными характеристиками связанности лексических единиц и примерами употреблений из корпусов. Произведена лингвистическая и культурно-историческая корреляция наполнения семантических полей "империя" для каждого из трех языков. Созданные за период проведения исследования корпусы доступны в текстовом формате (по запросу) и загружены в систему Sketch Engine. Сформированные база данных и сопутствующая информация представлены в Интернете по адресу https://imperium.wordform.ru/contacts/.

описание вклада в работу каждого из участников (учётная форма ЦИТиС)

Захаров В.П. 70%
Гвоздёва Е.В. 15%
Семёнова Н.В. 15%

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается
Краткое название__
АкронимRFBR_a_2018 - 2
СтатусЗавершено
Эффективные даты начала/конца19/03/1915/12/19

    Области исследований

  • корпусная лингвистика, русский язык, чешский язык, английский язык

Документы

ID: 39773170