Речевой корпус «Один речевой день» (ОРД) является на сегодняшний день крупнейшим лингвистическим ресурсом, предназначенным для исследования русского языка повседневного общения. Несмотря на высокий научный потенциал материалов корпуса, эффективность его
использования до сих пор существенно ограничена фактом закрытости ресурса для широкого
круга пользователей, что вызвано частным характером большинства звукозаписей повседневной речи. Компромиссным решением представляется веб-публикация анонимизированных
текстовых расшифровок корпуса ОРД. В статье рассматриваются основные сложности, возникающие при подготовке текстовок корпуса ОРД к онлайн публикации, связанные с анонимизацией
текстов и их «цензурной» редактурой, и намечаются пути их решения.
Переведенное названиеON THE PREPARATION FOR WEB-PUBLICATION OF “ONE DAY OF SPEECH” CORPUS OF EVERYDAY SPOKEN RUSSIAN: TEXTS ANONIMIZATION AND SELECTED WORDS ENCODING
Язык оригиналарусский
Название основной публикацииТруды международной конференции «Корпусная лингвистика-2019»
РедакторыВ.П. Захаров
Место публикацииСПб.
ИздательИздательство Санкт-Петербургского университета
Страницы366–372
СостояниеОпубликовано - 2019
СобытиеКорпусная лингвистика - 2019: международная научная конференция - СПб., Российская Федерация
Продолжительность: 24 июн 201928 июн 2019
https://events.spbu.ru/events/corpora-2019

конференция

конференцияКорпусная лингвистика - 2019: международная научная конференция
Сокращенное названиеcorpora-2019
Страна/TерриторияРоссийская Федерация
ГородСПб.
Период24/06/1928/06/19
Сайт в сети Internet

    Предметные области Scopus

  • Прикладные компьютерные науки
  • Языки и лингвистика

    Области исследований

  • Русский язык, повседневная устная речь, речевой корпус, интернет-ресурс, онлайн публикация, анонимизация текстов, кодирование лексики

ID: 51151736