Представленное исследование выполняется в русле изучения доступности для восприятия и понимания русских официальных документов из социальных доменов здравоохранения, культуры и образования. Материал - Корпус русских локальных документов и актов CorRIDA, подкорпус документов здравоохранения (617 107 токенов). Исследование направлено на выявление лексической специфики официальных документов домена с помощью метода извлечения ключевых словоформ, а также на оценку полученных ключевых словоформ с точки зрения их общеязыковой частотности. Анализируя ключевые словоформы в контексте общеязыковой частотности, мы исходили из идеи, что частотные единицы проще для восприятия и понимания носителями языка. Эта идея традиционно используется при оценке лексической сложности текстов.
Язык оригиналарусский
Страницы166-173
СостояниеОпубликовано - 2019
СобытиеКорпусная лингвистика - 2019: международная научная конференция - СПб., Российская Федерация
Продолжительность: 24 июн 201928 июн 2019
https://events.spbu.ru/events/corpora-2019

конференция

конференцияКорпусная лингвистика - 2019: международная научная конференция
Сокращенное названиеcorpora-2019
Страна/TерриторияРоссийская Федерация
ГородСПб.
Период24/06/1928/06/19
Сайт в сети Internet

    Области исследований

  • client-oriented texts, corpus of Russiandocuments, frequency, key word forms, language complexity, lexical complexity, official documents, reference corpus, target corpus, клиентоориентированные тексты, ключевые словоформы, корпус русских документов, лексическая сложность, нормализованная частота, общеязыковая частотность, официальные документы, референтный корпус, целевой корпус, языковая сложность

ID: 78412936