Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.
Язык оригиналарусский
Название основной публикацииКомпьютерная лингвистика и вычислительные онтологии. Выпуск 4
Подзаголовок основной публикацииТруды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.
Место публикацииСПб.
ИздательНИУ ИТМО
Страницы21-29
ISBN (электронное издание)978-5-7577-0631-3
СостояниеОпубликовано - 2020
СобытиеXXIII Объединенная научная конференция «Интернет и современное общество»
- Университет ИТМО, Санкт-Петербург, Российская Федерация
Продолжительность: 17 июн 202020 июн 2020
Номер конференции: 23
http://ims.ifmo.ru/ru/pages/2/programma.htm

конференция

конференцияXXIII Объединенная научная конференция «Интернет и современное общество»
Сокращенное название IMS 2020
Страна/TерриторияРоссийская Федерация
ГородСанкт-Петербург
Период17/06/2020/06/20
Сайт в сети Internet

    Области исследований

  • корпус текстов, русский рассказ, стилеметрия, частотный словарь, распределение частот

ID: 73037707