Description

Настоящий отчет обобщает и систематизирует данные, полученные в результате исследований по теме: «Моделирование коммуникативного поведения жителей российского мегаполиса в социально-речевом и прагматическом аспектах с привлечением методов искусственного интеллекта».
Объектом исследования является русская устная повседневная коммуникация.
Цель НИР: выявление и описание особенностей повседневной русской устной коммуникации, разработка на их основе формальных методов моделирования коммуникативного поведения жителей российского мегаполиса в реальной жизни, с учетом их социальных характеристик, прагматических задач и других условий коммуникации, а также апробация этих методов.
Метод или методология проведения работы: корпусный, контекстный, дискурсивный, конверсационный и иные виды анализа звукового и текстового материала, современные методы интеллектуальной обработки текстов, квантитативный метод.
Согласно исходной заявке в продолжение реализации проекта решены следующие задачи.
1. Произведено расширение эмпирической базы исследования для привлечения большего объема различных типов коммуникации.
2. Выполнен ряд исследований, направленных на анализ русской устной коммуникации, на разных ее уровнях, с учетом типа общения и характеристик говорящих.
3. Осуществлено описание моделей коммуникативного поведения носителей русского языка с учетом выявленных на практике особенностей их речи.
4. Выполнена экспериментальная проверка и апробация эффективности подготовленных моделей.
5. Построена вторая модель чат-бота, виртуального помощника.

Layman's description

Настоящий отчет обобщает и систематизирует данные, полученные в результате исследований по теме: «Моделирование коммуникативного поведения жителей российского мегаполиса в социально-речевом и прагматическом аспектах с привлечением методов искусственного интеллекта».

Key findings for the stage (in detail)

Согласно исходной заявке, за отчетный период реализации проекта решены следующие задачи.
1) Было произведено расширение эмпирической базы исследования для привлечения большего объема различных типов коммуникации.
1.1) Описаны вокализации как одно из типичных свойств устной повседневной речи. Анализ корпусного материала проведен с учетом таких характеристик говорящего, как гендер и психотип, а также с учетом статуса того языка, на котором производится общение: русский как родной и русский как изучаемый (китайцы-билингвы).
1.2) Предложена и апробирована методика описания функциональных единиц русской повседневной речи на основе анализа просодии и жестикуляции. Проанализировано и описано таким образом функционирование в повседневном дискурсе некоторых прагматических маркеров, с целью дифференциации слова-прототипа и маркера (главным образом – ксенопоказателей), а также разных функциональных типов одного маркера (главным образом – аппроксиматоров).
1.3) Систематизированы прецедентные тексты, весьма частотные в русском повседневном дискурсе и представляющие собой серьезную проблему для дискурсивного анализа, понимания иностранцами и перевода на другие языки, а также для создания моделей искусственного интеллекта.
2) Был выполнен ряд исследований, направленных на анализ русской устной коммуникации, на разных ее уровнях, с учетом типа общения и характеристик говорящих.
2.1) Описано функционирование сочетания ну вот как цельной единицы, которая весьма частотна в нашей повседневной речи, что подтверждено методикой n-грамм-анализа.
2.2) Рассмотрено устройство и статус распространённых в русской разговорной речи конструкций, в которых посессор, представленный в именной группе притяжательным прилагательным или местоимениями мой, твой, наш, ваш, его, её, их, свой, дублируется вне именной группы в так называемой конструкции с экстрапозицией посессора, состоящей из предлога у, управляющего именной группой, кореферентной посессору именной группы.
2.3) Рассмотрен вопрос о фиксациях в речевых корпусах недостаточных глаголов в разных формах речи.
3) Было осуществлено описание моделей коммуникативного поведения носителей русского языка с учетом выявленных на практике особенностей их речи.
3.1) Дифференцированы понятия backchannel и переспрос и варианты их реализации в устном диалоге.
3.2) Рассмотрены проблемы, возникающие при разработке базы конструкций с лексическими повторами.
3.3) Рассмотрены проблемы восприятия и понимания иноязычными говорящими прагматических маркеров русской повседневной речи.
3.4) Проанализированы приемы перевода прагматических маркеров-аппроксиматоров русской повседневной речи на китайский язык.
3.5) Описаны особенности речи носителей языка в зависимости от собеседника.
3.6) Рассмотрены и описаны стратегии и тактики коллоквиализации современных рекламных текстов на упаковке пищевых продуктов.
4) Была выполнена экспериментальная проверка и апробация эффективности подготовленных моделей.
4.1) Проведено сравнение восприятия ключевых выражений в устной и письменной речи и результатов автоматического анализа.
4.2) Проведено тестирование языковых моделей класса ChatGPT в аспекте человеко-машинного взаимодействия.
4.3) Проведено экспериментальное исследование параметров сложности политических текстов на русском и китайском языках.
4.4) Был разработан разговорный интерфейс для приемной комиссии Санкт-Петербургского государственного университета с акцентом на отражение ценностей и бренда университета.
4.5) Было разработано приложение для предсказания профессионального типа пользователя.
4.6) Рассмотрены особенности сгенерированных текстов на примере предметной области «компьютерная лингвистика» и новостных текстов.
4.7) Создана вторая версия чат-бота – виртуального помощника, в образе Петра I, с разделением запросов по уровню образования: бакалавриат, магистратура, аспирантура и ординатура.
4.8) Проведен анализ сложностей машинного перевода лирической поэзии.
Результаты проведенных исследований речевого материала, полученные за отчетный год, представлены в виде серии научных публикаций и докладов на конференциях разного уровня: 13 статей/тезисов опубликованы (в том числе 4 – в изданиях SCOPUS), 25 – приняты к публикации (в том числе 10 – в изданиях SCOPUS и 1 – в издании WoS), сделаны 26 доклада.
Все заявленные на отчетный этап задачи выполнены в полном объеме.

Key findings for the stage (summarized)

Согласно исходной заявке, за отчетный период реализации проекта решены следующие задачи.
1) Было произведено расширение эмпирической базы исследования для привлечения большего объема различных типов коммуникации.
1.1) Описаны вокализации как одно из типичных свойств устной повседневной речи.
1.2) Предложена и апробирована методика описания функциональных единиц русской повседневной речи на основе анализа просодии и жестикуляции.
1.3) Систематизированы прецедентные тексты, весьма частотные в русском повседневном дискурсе.
2) Был выполнен ряд исследований, направленных на анализ русской устной коммуникации, на разных ее уровнях, с учетом типа общения и характеристик говорящих.
2.1) Описано функционирование сочетания ну вот как цельной единицы, которая весьма частотна в нашей повседневной речи, что подтверждено методикой n-грамм-анализа.
2.2) Рассмотрено устройство и статус распространённых в русской разговорной речи ряда конструкций.
2.3) Рассмотрен вопрос о фиксациях в речевых корпусах недостаточных глаголов в разных формах речи.
3) Было осуществлено описание моделей коммуникативного поведения носителей русского языка с учетом выявленных на практике особенностей их речи.
3.1) Дифференцированы понятия backchannel и переспрос и варианты их реализации в устном диалоге.
3.2) Рассмотрены проблемы, возникающие при разработке базы конструкций с лексическими повторами.
3.3) Рассмотрены проблемы восприятия и понимания иноязычными говорящими прагматических маркеров русской повседневной речи.
3.4) Проанализированы приемы перевода прагматических маркеров-аппроксиматоров русской повседневной речи на китайский язык.
3.5) Описаны особенности речи носителей языка в зависимости от собеседника.
3.6) Рассмотрены и описаны стратегии и тактики коллоквиализации современных рекламных текстов на упаковке пищевых продуктов.
4) Была выполнена экспериментальная проверка и апробация эффективности подготовленных моделей.
4.1) Проведено сравнение восприятия ключевых выражений в устной и письменной речи и результатов автоматического анализа.
4.2) Проведено тестирование языковых моделей класса ChatGPT в аспекте человеко-машинного взаимодействия.
4.3) Проведено экспериментальное исследование параметров сложности политических текстов на русском и китайском языках.
4.4) Был разработан разговорный интерфейс для приемной комиссии Санкт-Петербургского государственного университета с акцентом на отражение ценностей и бренда университета.
4.5) Было разработано приложение для предсказания профессионального типа пользователя.
4.6) Рассмотрены особенности сгенерированных текстов на примере предметной области «компьютерная лингвистика» и новостных текстов.
4.7) Создана вторая версия чат-бота – виртуального помощника, в образе Петра I, с разделением запросов по уровню образования: бакалавриат, магистратура, аспирантура и ординатура.
4.8) Проведен анализ сложностей машинного перевода лирической поэзии.

Short titleGZ-2025
AcronymM1_2024 - 2
StatusActive
Effective start/end date1/01/2531/12/25

ID: 103964249