Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура. / Белов, Сергей Александрович; Блинова, Ольга Владимировна; Гулида, Виктория Борисовна; Зубов, Владислав Иванович; Ларионова, Елена Юрьевна; Толстикова, Полина Сергеевна.
Компьютерная лингвистика и вычислительные онтологии. Выпуск 2: Труды XXI Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 31 мая – 2 июня 2018 г. Сборник научных статей. ed. / А.В. Добров; В.П. Захаров; О.А. Митрофанова; М.В. Хохлова. СПб. : НИУ ИТМО, 2018. p. 112-120.Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
}
TY - GEN
T1 - Корпус русских локальных документов и актов CorRIDA: цели формирования, состав, структура
AU - Белов, Сергей Александрович
AU - Блинова, Ольга Владимировна
AU - Гулида, Виктория Борисовна
AU - Зубов, Владислав Иванович
AU - Ларионова, Елена Юрьевна
AU - Толстикова, Полина Сергеевна
PY - 2018
Y1 - 2018
N2 - В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.
AB - В статье описывается начальный этап создания лингвистически размеченного корпуса русских локальных документов и актов CorRIDA. В повседневной жизни носители русского языка всё чаще сталкиваются с необходимостью читать и подписывать различные официальные документы. Обычно это так называемые локальные документы, например, «Договоры на оказание платных услуг» или «Информированные согласия». Однако язык локальных документов исследован недостаточно и практически не рассматривался с применением корпусных методов.Существующие корпусы русского языка пока не предоставляют возможностей для систематического анализа языка документа. Это связано в том числе с проблемами жанровой классификации и разметки нехудожественных текстов. Поэтому формирование корпуса локальных документов является актуальной задачей.CorRIDA насчитывает 1,5 млн. слов, охватывает тексты, адресованные широким категориям пользователей (клиентам), принадлежащие трём социально значимым доменам (здравоохранение, образование, культура), и содержит в том числе разметку по типам текстов. Целью формирования корпуса является, во-первых, описание локальных документов разных типов через выделение и сравнение их языковых черт, во-вторых, оценка официально-деловых текстов с точки зрения их языковой сложности, удобства для восприятия и понимания «простым носителем» русского языка.
KW - корпус русских локальных документов
KW - официально-деловые тексты
KW - типы текстов
KW - социально-значимые домены
KW - official texts
KW - Corpus of Russian Internal Documents
KW - genres
KW - Socially Important Domains
UR - https://elibrary.ru/item.asp?id=37295153
M3 - статья в сборнике материалов конференции
SN - 978-5-7577-0584-2
SP - 112
EP - 120
BT - Компьютерная лингвистика и вычислительные онтологии. Выпуск 2
A2 - Добров, А.В.
A2 - Захаров, В.П.
A2 - Митрофанова, О.А.
A2 - Хохлова, М.В.
PB - НИУ ИТМО
CY - СПб.
ER -
ID: 36371138