Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.
Original languageRussian
Title of host publicationКомпьютерная лингвистика и вычислительные онтологии. Выпуск 4
Subtitle of host publicationТруды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.
Place of PublicationСПб.
PublisherНИУ ИТМО
Pages21-29
ISBN (Electronic)978-5-7577-0631-3
StatePublished - 2020
EventInternet and Modern Society - Университет ИТМО, Санкт-Петербург, Russian Federation
Duration: 17 Jun 202020 Jun 2020
Conference number: 23
http://ims.ifmo.ru/ru/pages/2/programma.htm

Conference

ConferenceInternet and Modern Society
Abbreviated title IMS 2020
Country/TerritoryRussian Federation
CityСанкт-Петербург
Period17/06/2020/06/20
Internet address

ID: 73037707