Корпус русского рассказа начала XX века. Пример лингвостатистического анализа

Standard

Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. / Гребенников, Александр Олегович ; Марусенко, Наталия Михайловна.

Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.. СПб. : НИУ ИТМО, 2020. p. 21-29.

Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review

Harvard

Гребенников, АО & Марусенко, НМ 2020, Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. in Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.. НИУ ИТМО, СПб., pp. 21-29, Internet and Modern Society, Санкт-Петербург, Russian Federation, 17/06/20.

APA

Гребенников, А. О., & Марусенко, Н. М. (2020). Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. In Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г. (pp. 21-29). НИУ ИТМО.

Vancouver

Гребенников АО , Марусенко НМ. Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. In Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.. СПб.: НИУ ИТМО. 2020. p. 21-29

Author

Гребенников, Александр Олегович ; Марусенко, Наталия Михайловна. / Корпус русского рассказа начала XX века. Пример лингвостатистического анализа. Компьютерная лингвистика и вычислительные онтологии. Выпуск 4: Труды XXIII Международной объединенной научной конференции «Интернет и современное общество», IMS-2020, Санкт -Петербург, 17–20 июня 2020 г.. СПб. : НИУ ИТМО, 2020. pp. 21-29

BibTeX

@inproceedings{c3aa1bcb06594dc880f023b4ecdec8bf,

title = "Корпус русского рассказа начала XX века. Пример лингвостатистического анализа",

abstract = "Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.",

keywords = "корпус текстов, русский рассказ, стилеметрия, частотный словарь, распределение частот",

author = "Гребенников, {Александр Олегович} and Марусенко, {Наталия Михайловна}",

year = "2020",

language = "русский",

pages = "21--29",

booktitle = "Компьютерная лингвистика и вычислительные онтологии. Выпуск 4",

publisher = "НИУ ИТМО",

address = "Российская Федерация",

note = "XXIII Объединенная научная конференция «Интернет и современное общество»<br/>, IMS 2020 ; Conference date: 17-06-2020 Through 20-06-2020",

url = "http://ims.ifmo.ru/ru/pages/2/programma.htm",

}

RIS

TY - GEN

T1 - Корпус русского рассказа начала XX века. Пример лингвостатистического анализа

AU - Гребенников, Александр Олегович

AU - Марусенко, Наталия Михайловна

N1 - Conference code: 23

PY - 2020

Y1 - 2020

N2 - Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.

AB - Исследование строится на базе представительного «Корпуса русских рассказов 1900 – 1930-х гг.». Для выборки из первого периода включенных в Корпус текстов (100 рассказов с 1900 по 1913 гг. отобранных по принципу не более одного рассказа от каждого из включённых в Корпус авторов) был построен частотный словарь. С целью выявления ключевых слов, соответствующих основной тематике рассказов, а также прослеживания влияния крупномасштабных политических изменений на язык художественной прозы первые 100 наиболее частотных знаменательных слов словаря были сопоставлены с данными полученных авторами ранее частотных словарей отдельных русских писателей – признанных мастеров рассказа и материалами частотного словаря русского языка в целом. Также было проведено сравнение с данными для русских рассказов аналогичного периода начала XXI века, полученными из НКРЯ. Для получения объективных результатов сравнения использовался показатель числа употреблений на миллион слов (ipm ). Полученные результаты показывают, что распределение частот знаменательных слов в верхней зоне словаря может служить хорошим индикатором общей тематики произведений не только отдельного писателя, но и отдельной эпохи, а также отражать актуальные внешние аспекты жизни общества.

KW - корпус текстов

KW - русский рассказ

KW - стилеметрия

KW - частотный словарь

KW - распределение частот

UR - https://ojs.itmo.ru/index.php/CLCO/article/view/1142

UR - https://www.elibrary.ru/item.asp?id=44584675

M3 - статья в сборнике материалов конференции

SP - 21

EP - 29

BT - Компьютерная лингвистика и вычислительные онтологии. Выпуск 4

PB - НИУ ИТМО

CY - СПб.

T2 - XXIII Объединенная научная конференция «Интернет и современное общество»<br/>

Y2 - 17 June 2020 through 20 June 2020

ER -

ID: 73037707