Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура

Сергей Александрович Белов, Ольга Владимировна Блинова, Виктория Борисовна Гулида, Владислав Иванович Зубов, Елена Юрьевна Ларионова, Полина Сергеевна Толстикова

Результат исследований: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

13 Downloads (Pure)

Выдержка

В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.
Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.
CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.
Язык оригиналарусский
Название основной публикацииКомпьютерная лингвистика и вычислительные онтологии. Выпуск 2.
Подзаголовок основной публикации(Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей)
РедакторыА.В. Добров, В.П. Захаров, О.А. Митрофанова, М.В. Хохлова
Место публикацииСПб.
ИздательНИУ ИТМО
Страницы112-120
Число страниц9
ISBN (печатное издание)978-5-7577-0584-2
СостояниеОпубликовано - 2018

Серия публикаций

НазваниеКомпьютерная лингвистика и вычислительные онтологии
ИздательУниверситет ИТМО
ISSN (печатное издание)2541-9781

Предметные области Scopus

  • Гуманитарные науки и искусство (все)

Ключевые слова

  • корпус русских локальных документов
  • официально-деловые тексты
  • типы текстов
  • социально-значимые домены

Цитировать

Белов, С. А., Блинова, О. В., Гулида, В. Б., Зубов, В. И., Ларионова, Е. Ю., & Толстикова, П. С. (2018). Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. В А. В. Добров, В. П. Захаров, О. А. Митрофанова, & М. В. Хохлова (Ред.), Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.: (Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей) (стр. 112-120). (Компьютерная лингвистика и вычислительные онтологии). СПб.: НИУ ИТМО.
Белов, Сергей Александрович ; Блинова, Ольга Владимировна ; Гулида, Виктория Борисовна ; Зубов, Владислав Иванович ; Ларионова, Елена Юрьевна ; Толстикова, Полина Сергеевна. / Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.: (Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей). редактор / А.В. Добров ; В.П. Захаров ; О.А. Митрофанова ; М.В. Хохлова. СПб. : НИУ ИТМО, 2018. стр. 112-120 (Компьютерная лингвистика и вычислительные онтологии).
@inproceedings{ecfe2f3928af40db963fb055182fe95a,
title = "Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура",
abstract = "В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.",
keywords = "корпус русских локальных документов, официально-деловые тексты, типы текстов, социально-значимые домены",
author = "Белов, {Сергей Александрович} and Блинова, {Ольга Владимировна} and Гулида, {Виктория Борисовна} and Зубов, {Владислав Иванович} and Ларионова, {Елена Юрьевна} and Толстикова, {Полина Сергеевна}",
year = "2018",
language = "русский",
isbn = "978-5-7577-0584-2",
series = "Компьютерная лингвистика и вычислительные онтологии",
publisher = "НИУ ИТМО",
pages = "112--120",
editor = "А.В. Добров and В.П. Захаров and О.А. Митрофанова and М.В. Хохлова",
booktitle = "Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.",
address = "Российская Федерация",

}

Белов, СА, Блинова, ОВ, Гулида, ВБ, Зубов, ВИ, Ларионова, ЕЮ & Толстикова, ПС 2018, Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. в АВ Добров, ВП Захаров, ОА Митрофанова & МВ Хохлова (ред.), Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.: (Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей). Компьютерная лингвистика и вычислительные онтологии, НИУ ИТМО, СПб., стр. 112-120.

Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. / Белов, Сергей Александрович; Блинова, Ольга Владимировна; Гулида, Виктория Борисовна; Зубов, Владислав Иванович; Ларионова, Елена Юрьевна; Толстикова, Полина Сергеевна.

Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.: (Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей). ред. / А.В. Добров; В.П. Захаров; О.А. Митрофанова; М.В. Хохлова. СПб. : НИУ ИТМО, 2018. стр. 112-120 (Компьютерная лингвистика и вычислительные онтологии).

Результат исследований: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

TY - GEN

T1 - Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура

AU - Белов, Сергей Александрович

AU - Блинова, Ольга Владимировна

AU - Гулида, Виктория Борисовна

AU - Зубов, Владислав Иванович

AU - Ларионова, Елена Юрьевна

AU - Толстикова, Полина Сергеевна

PY - 2018

Y1 - 2018

N2 - В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.

AB - В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.

KW - корпус русских локальных документов

KW - официально-деловые тексты

KW - типы текстов

KW - социально-значимые домены

M3 - статья в сборнике материалов конференции

SN - 978-5-7577-0584-2

T3 - Компьютерная лингвистика и вычислительные онтологии

SP - 112

EP - 120

BT - Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.

A2 - Добров, А.В.

A2 - Захаров, В.П.

A2 - Митрофанова, О.А.

A2 - Хохлова, М.В.

PB - НИУ ИТМО

CY - СПб.

ER -

Белов СА, Блинова ОВ, Гулида ВБ, Зубов ВИ, Ларионова ЕЮ, Толстикова ПС. Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. В Добров АВ, Захаров ВП, Митрофанова ОА, Хохлова МВ, редакторы, Компьютерная лингвистика и вычислительные онтологии. Выпуск 2.: (Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей). СПб.: НИУ ИТМО. 2018. стр. 112-120. (Компьютерная лингвистика и вычислительные онтологии).