Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике материалов конференции › научная › Рецензирование
Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. / Гребенников, Александр Олегович; Марусенко, Наталия Михайловна.
Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.. СПб. : НИУ ИТМО, 2020. стр. 21-29.Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике материалов конференции › научная › Рецензирование
}
TY - GEN
T1 - Корпус русского рассказа начала XX века. Пример лингвостатистического анализа
AU - Гребенников, Александр Олегович
AU - Марусенко, Наталия Михайловна
N1 - Conference code: 23
PY - 2020
Y1 - 2020
N2 - Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.
AB - Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.
KW - корпус текстов
KW - русский рассказ
KW - стилеметрия
KW - частотный словарь
KW - распределение частот
UR - https://ojs.itmo.ru/index.php/CLCO/article/view/1142
UR - https://www.elibrary.ru/item.asp?id=44584675
M3 - статья в сборнике материалов конференции
SP - 21
EP - 29
BT - Компьютерная лингвистика и вычислительные онтологии. Выпуск 4
PB - НИУ ИТМО
CY - СПб.
T2 - XXIII Объединенная научная конференция «Интернет и современное общество»<br/>
Y2 - 17 June 2020 through 20 June 2020
ER -
ID: 73037707