Description

Проект направлен на решение фундаментальной научной проблемы, связанной с описанием того, как происходит восприятие речи и какие факторы влияют на эффективность восприятия. Целью проекта является выявление лингвистических характеристик результативных учительских практик и формулирование рекомендаций по модификации системы обратной связи для учителей с учетом выявленных характеристик. Основным продуктом проекта должен стать корпус речи учителей, снабженный лингвистическим описанием по ряду параметров, актуальных с точки зрения описания функционирования педагогического дискурса. Для реализации проекта применяются методы корпусной лингвистики, автоматической обработки расшифровок устной речи, анализа дискурса, статистические методы, критический анализ литературы, методы автоматического распознавания звучащей речи. Практическим результатом исследования должен стать перечень рекомендаций для учителей, который ляжет в основу сервисов по развитию речи.
В соответствии с условиями конкурса, в рамках которого осуществляется проект, необходимо привлечение из внебюджетных источников средств для софинансирования Проекта (п. 1.6. Объявления об открытом конкурсном отборе заявок на проведение фундаментальных междисциплинарных научных исследований под руководством молодых ученых в интересах индустриального/бизнес-партнера за счет средств СПбГУ, утвержденного распоряжением №2412/1р от 16.06.2022). Бизнес-партнером, в интересах которого осуществляется проект, является ООО «СберОбразование» (далее — Партнер); часть работ осуществляется при полной или частичной финансовой поддержке этой компании в рамках договора между СПбГУ и ООО «СберОбразование» № 230712-107-ЮЛ от 07.08.2023. Все записи уроков, с которыми мы работаем в рамках проекта, предоставляются нам Партнером.

Layman's description

Проект направлен на решение фундаментальной научной проблемы описания того, как происходит восприятие речи и какие факторы влияют на эффективность восприятия. Основная цель проекта - выявить особенности речи успешных (результативных учителей) и разработать рекомендации по усовершенствованию речевого поведения, которые учителя смогут использовать в своей работе. Мы разрабатываем корпус устной речи учителей из разных школ Российской Федерации, который будет снабжен аннотацией на нескольких лингвистических уровнях, и планируем на его основе провести экспериментальные и корпусные исследования для выявления характеристик, способствующих повышению продуктивности обучения. Проект выполняется в интересах партнера – ООО «СберОбразование». Часть работ осуществляется при полной или частичной финансовой поддержке этой компании в рамках договора между СПбГУ и ООО «СберОбразование» № 230712-107-ЮЛ от 07.08.2023.
Поскольку принципы создания корпуса речи зависят от того, для чего он будет использоваться, первый этап нашей работы был посвящен разработке методики аннотирования корпуса. Мы провели опрос школьников и выяснили, какие параметры кажутся им важными в речи идеального и плохого учителя. На основе полученных результатов и анализа литературы по теме мы разработали систему аннотирования, состоящую из 19 уровней. Кроме того, мы протестировали несколько систем автоматического распознавания речи и получили предварительные данные о том, что свободно распространяемая программа Whisper хорошо справляется с распознаванием речи на русском языке и может использоваться при создании корпуса речи учителей для получения орфографических расшифровок записей.
Лингвистический анализ записей устной речи учителей, которые были предоставлены нам ООО «СберОбразование», позволил получить первые данные об особенностях паузации и об устойчивых выражениях в речи результативных учителей, а также об употреблении учителями местоимения «мы».
Более подробное научно-популярное описание проекта представлено на странице проекта на сайте научной группы «Спектр» (руководитель — Е.И. Риехакайнен): https://spektr-spbu.tilda.ws/sberproject; информация о докладах на конференциях размещается в разделе «Новости»: https://spektr-spbu.tilda.ws/news; выходные данные опубликованных работ — в разделе «Публикации»: https://spektr-spbu.tilda.ws/publications.
Полученные результаты представлены на 10 профильных конференциях (в том числе на 6 международных) и отражены в 8 публикациях.

Key findings for the stage (in detail)

На первом этапе реализации проекта были получены следующие результаты, которые соответствуют сформулированным в заявке на выполнение проекта задачам:
1) на основе результатов опроса школьников и анализа научной литературы составлен предварительный перечень лингвистических особенностей учительской речи, которые могут влиять на результативность учительских практик и которые должны быть отражены при аннотировании записей речи учителей;
2) разработана и частично апробирована на материале пяти школьных уроков, предоставленных нам ООО «Сберобразование» (далее — Партнер), методика многоуровневого аннотирования записей речи школьных учителей; результат расшифровки представлен в виде текстовых файлов, которые передаются Партнеру в соответствии с установленной в договоре между СПбГУ и Партнером процедурой;
3) на имевшихся в распоряжении научного коллектива записях устной речи, снабженных акустико-фонетической транскрипцией, сопоставлены результаты автоматического распознавания речи, осуществленного тремя автоматическими системами, две из которых используются Партнером, а третья является свободно распространяемым продуктом, и результаты эталонной расшифровки, выполненной экспертами; выделены и проанализированы критичные и некритичные ошибки, которые совершает автоматическая система; получены данные, свидетельствующие о принципиальной возможности осуществления автоматической расшифровки орфографического уровня с помощью системы Whisper (с последующей экспертной корректировкой), что, как ожидается, значительно сократит время, затрачиваемое на расшифровку;
4) определены принципы и степень детализации фонетической транскрипции, которая будет использоваться при расшифровке речи учителей; начато тестирование создания автоматической фонетической транскрипции с помощью программы Kaldi;
5) получены первые данные о лингвистических характеристиках речи результативных учителей, а именно:
5.1) на материале записей речи двух учителей истории проанализированы особенности паузации в речи результативных учителей: показано, что речь учителя нельзя однозначно отнести ни к спонтанной, ни к подготовленной, поскольку она характеризуется особенностями обоих этих типов речи; общие характеристики речи учителей — преобладание незаполненных по физической природе, синтаксических по позиции и хезитационных по функции пауз, а индивидуальные — длительность пауз в общем, количество и характер заполненных пауз, а также распределение пауз по функциям;
5.2) с помощью автоматического анализа расшифровок записей 74 уроков результативных учителей выделены три группы типичных коллокаций, которые используют учителя в своей речи: конструкция «обратить внимание», адресные конструкции с обращениями, термины;
5.3) на материале 21 урока, проведенного результативными учителями истории, русского языка и литературы, проанализированы особенности употребления местоимения «мы»: несмотря на наличие у учителей индивидуальных предпочтений в использовании местоимения «мы» в том или ином значении, чаще всего в речи всех учителей это местоимение употребляется в инклюзивном значении; в речи учителей истории, которые в целом употребляли «мы» чаще учителей русского языка и литературы, выделено — среди прочих — употребление «мы» в функции дискурсивного маркера;
6) составлена дорожная карта внедрения в практику результатов проекта;
7) для дальнейшего сбора речевого материала и для проведения экспериментов, которые запланированы на второй этап работы по проекту, получено одобрение протокола исследования, формы информированного согласия и проведения исследования от Этического комитета СПбГУ в области исследований с привлечением людей (протокол №115-02-2 от 22.03.2023).
Часть работ осуществлена с привлечением внешнего внебюджетного софинансирования — в рамках договора между СПбГУ и ООО «СберОбразование» №230712-107-ЮЛ от 07.08.2023.
Большая часть полученных на данном этапе работы результатов имеют в первую очередь прикладное практическое значение для дальнейшей работы по проекту, поскольку на их основе будет создаваться корпус речи учителей (пп. 2–4 в перечне результатов выше), они необходимы для разработки дизайна и проведения экспериментов по восприятию речи учителей, которые запланированы на второй этап работы по проекту (пп. 1, 7), или для понимания того, что нужно сделать, чтобы результаты проекта могли использоваться учителями в их практической деятельности (п. 6). Некоторые наработки могут применяться и за пределами проекта: в частности, данные о том, что программа Whisper вполне успешно справляется с распознаванием русской устной речи, позволяют рекомендовать ее в качестве инструмента для расшифровки записей любого корпуса русской устной речи (в частности, Корпуса русской устной речи, который создается в СПбГУ; насколько нам известно, все разрабатываемые лингвистами корпусы русской устной речи до сих расшифровываются по большей части вручную). Предложенная система разметки пауз также может применяться при аннотировании различных корпусов устной речи.
Результаты, описывающие некоторые особенности речи результативных учителей (п. 5 в перечне результатов выше), на данный момент следует считать предварительными, поскольку необходимо как расширение анализируемого материала, так и сопоставление полученных данных с аналогичными данными для нерезультативных учителей.
Результаты работы по проекту были представлены на десяти профильных конференциях, шесть из которых — международные. Проект был воспринят позитивно как педагогами, так и лингвистами, вызвал большой интерес у практиков — школьных учителей. В ходе обсуждений с коллегами были уточнены принципы разметки корпуса и дополнен перечень лингвистических особенностей результативных учительских практик. Подготовлены восемь публикаций: три статьи в журналах, индексируемых Scopus, еще четыре статьи в журналах, индексируемых РИНЦ, и одни тезисы в сборнике, индексируемом РИНЦ. Таким образом, формальные требования к представлению полученных результатов на конференциях и в публикациях на первом году проекта выполнены.
Кроме того, участницей проекта Ю. С. Виноградовой успешно защищена выпускная квалификационная работа бакалавра по направлению 45.03.02 Лингвистика на тему «Особенности паузации в речи педагога при объяснении материала на русском языке», в которой отражены промежуточные результаты работы по проекту.
Научно-популярное описание проекта представлено на странице проекта на сайте научной группы «Спектр» (руководитель — Е.И. Риехакайнен): https://spektr-spbu.tilda.ws/sberproject; информация о докладах на конференциях размещается в разделе «Новости»: https://spektr-spbu.tilda.ws/news; выходные данные опубликованных работ — в разделе «Публикации»: https://spektr-spbu.tilda.ws/publications.

Key findings for the stage (summarized)

В 2023 году получены следующие результаты, которые будут использоваться в дальнейшей работе по созданию корпуса речи учителей и при проведении экспериментов для выявления лингвистических характеристик речи результативных учителей:
1) разработана и частично апробирована на материале пяти школьных уроков методика многоуровневого аннотирования записей речи школьных учителей, в частности получены данные, свидетельствующие о принципиальной возможности осуществления автоматической расшифровки орфографического уровня с помощью системы Whisper (с последующей экспертной корректировкой);
2) на основе результатов опроса школьников и анализа научной литературы составлен предварительный перечень лингвистических особенностей учительской речи, которые могут влиять на результативность учительских практик;
3) получены первые данные о лингвистических характеристиках речи результативных учителей: выявлены некоторые особенности паузации, типичные коллокации в речи результативных учителей, а также проанализированы особенности употребления учителями местоимения «мы»;
4) составлена дорожная карта внедрения в практику результатов проекта.
Полученные результаты представлены на 10 профильных конференциях (в том числе на 6 международных) и отражены в 8 публикациях.

Academic ownership of participants (text description)

Риехакайнен Елена Игоревна, руководитель, введение, заключение, разделы 1, 2.
Браташ Валентина Сергеевна, исполнитель, подраздел 1.2, раздел 3.
Виноградова Юлия Сергеевна, исполнитель, подразделы 1.1, 1.3, 2.1.
Дайтер Мария Владимировна, исполнитель, подразделы 1.3, 2.2.
Зубов Владислав Иванович, исполнитель, введение, подразделы 1.1, 1.2, разделы 4, 5.
Мамаев Иван Дмитриевич, исполнитель, подразделы 1.3, 2.2.
Прокаева Валерия Олеговна, исполнитель, подразделы 1.1, 1.3, 2.1.
Раева Ольга Васильевна, исполнитель, подраздел 1.3.
Судакова Ульяна Андреевна, исполнитель, подразделы 1.3, 2.3.
Хохлова Мария Владимировна, исполнитель, подразделы 1.3, 2.2.

Transfer of the full copy of the report to third parties for non-commercial use: permitted/not permitted

не разрешается

Check of the report for improper borrowing in external sources (plagiarism): permitted/not permitted

разрешается

Rationale of the interdisciplinary approach

Поскольку в рамках проекта планируется изучение лингвистических характеристик педагогического дискурса, которые способствуют стабильному воспроизведению результативных учительских практик, проект является междисциплинарным и находится на стыке педагогики и двух актуальных направлений современной науки о языке — корпусной лингвистики и психолингвистики.
Short titleGZ-2023
AcronymGZ_MDF_2023 - 1
StatusFinished
Effective start/end date1/01/2331/12/23

ID: 101747352