Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
О подготовке к веб-публикации корпуса повседневной русской речи «Один речевой день»: анонимизация текстов и выборочное кодирование лексики. / Шерстинова, Татьяна Юрьевна.
Труды международной конференции «Корпусная лингвистика-2019». ed. / В.П. Захаров. СПб. : Издательство Санкт-Петербургского университета, 2019. p. 366–372.Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
}
TY - GEN
T1 - О подготовке к веб-публикации корпуса повседневной русской речи «Один речевой день»: анонимизация текстов и выборочное кодирование лексики
AU - Шерстинова, Татьяна Юрьевна
N1 - Шерстинова Т. Ю. О подготовке к веб-публикации корпуса повседневной русской речи «Один речевой день»: анонимизация текстов и выборочное кодирование лексики // Труды международной конференции «Корпусная лингвистика-2019». — СПб.: Изд-во С.-Петерб. ун-та, 2019, с. 366–372.
PY - 2019
Y1 - 2019
N2 - Речевой корпус «Один речевой день» (ОРД) является на сегодняшний день крупнейшим лингвистическим ресурсом, предназначенным для исследования русского языка повседневного общения. Несмотря на высокий научный потенциал материалов корпуса, эффективность егоиспользования до сих пор существенно ограничена фактом закрытости ресурса для широкогокруга пользователей, что вызвано частным характером большинства звукозаписей повседневной речи. Компромиссным решением представляется веб-публикация анонимизированныхтекстовых расшифровок корпуса ОРД. В статье рассматриваются основные сложности, возникающие при подготовке текстовок корпуса ОРД к онлайн публикации, связанные с анонимизациейтекстов и их «цензурной» редактурой, и намечаются пути их решения.
AB - Речевой корпус «Один речевой день» (ОРД) является на сегодняшний день крупнейшим лингвистическим ресурсом, предназначенным для исследования русского языка повседневного общения. Несмотря на высокий научный потенциал материалов корпуса, эффективность егоиспользования до сих пор существенно ограничена фактом закрытости ресурса для широкогокруга пользователей, что вызвано частным характером большинства звукозаписей повседневной речи. Компромиссным решением представляется веб-публикация анонимизированныхтекстовых расшифровок корпуса ОРД. В статье рассматриваются основные сложности, возникающие при подготовке текстовок корпуса ОРД к онлайн публикации, связанные с анонимизациейтекстов и их «цензурной» редактурой, и намечаются пути их решения.
KW - Русский язык
KW - повседневная устная речь
KW - речевой корпус
KW - интернет-ресурс
KW - онлайн публикация
KW - анонимизация текстов
KW - кодирование лексики
KW - Russian language
KW - everyday spoken speech
KW - speech corpus
KW - Internet resource
KW - online publication
KW - texts anonymization
KW - word coding
UR - https://events.spbu.ru/eventsContent/events/2019/corpora/corp_sborn_corr.pdf
M3 - статья в сборнике материалов конференции
SP - 366
EP - 372
BT - Труды международной конференции «Корпусная лингвистика-2019»
A2 - Захаров, В.П.
PB - Издательство Санкт-Петербургского университета
CY - СПб.
T2 - Корпусная лингвистика - 2019: международная научная конференция
Y2 - 24 June 2019 through 28 June 2019
ER -
ID: 51151736