Литературные тексты и их язык vs количественные, корпусные и компьютерные методы: взаимное тестирование (Набоков и сопоставительный материал): 2023 г.

Description

Основной научной проблемой, на решение которой направлен проект, является создание и совершенствование современной цифровой (т. е. количественной, корпусной и компьютерной) поэтики, причем преимущественно в российской версии, то есть опирающейся на отечественные научные традиции в области точного литературоведения и лингвистической поэтики.
Истоки отечественной количественной и корпусной поэтики — в методах русского научного стиховедения, точных и квантитативных, в деятельности ряда школ точного литературоведения, в традиционном для русского языкознания внимании к литературному и поэтическому тексту. Однако в последние десятилетия стало невозможно довольствоваться просто подсчетами и обращением к сравнительно небольшим и немногочисленным корпусам. Появление компьютерных технологий большой разрешительной силы, огромных специальных корпусов (прежде всего Национального корпуса русского языка), массивов и баз данных, выдвижение проблематики обращения к большим группам текстов и их анализу диктует выход на новый уровень количественных, корпусных и компьютерных исследований литературного текста. Опора на достижения отечественной филологии должна сочетаться со следованием передовым мировым подходам к обработке и анализу текста компьютерными методами.
На первый план выходит задача (а) корректного, (б) нетривиального и (в) комплексного исследования современными количественными, корпусными и компьютерными методами литературного текста, корпуса текстов, творчества отдельного автора. В настоящее время эти методы еще не доведены до должного уровня точности и полноты; зачастую не применяются к отдельным текстам и авторам, так что методика такого обращения к отдельным текстам и авторам частично не разработана; почти никогда не используются в связке, комплексно; кроме того, во многих случаях результаты количественного, корпусного или компьютерного исследования литературных текстов не представляются информативными и небанальными для изучения идиостилей, исторической поэтики, литературоведческой интерпретации изучаемых авторов и текстов. Передовые авторские методики в области количественной, корпусной и компьютерной поэтики частично затеряны среди более стандартных подходов и в любом случае не собраны воедино в рамках какого-либо одного проекта. Создание цифровой поэтики невозможно без совершенствования и комплексного использования инновационных подходов в области количественного, корпусного и количественного изучения отдельных текстов, авторов и литературной традиции в целом.
В то же время сами методы количественного, комплексного и корпусного исследования литературных текстов нуждаются в проверке и улучшении.
Некоторые из этих методов пока только количественные и корпусные; в своей области они зарекомендовали себя относительно неплохо, но, предположительно, нуждаются в дополнении и усовершенствовании методами математической статистики и специальными программными продуктами. То же относится к имеющимся массивам и базам данных: им нужны специальные программные продукты, находящиеся на современном уровне. Другие подходы, подразумевающие авторские программные разработки, нуждаются в тестировании и усовершенствовании. Наконец, самые продвинутые методы могут испытывать нужду в обращении к удобному и качественному материалу для исследования и проверки. В области создания алгоритмов автоматической обработки языка и шире — в сфере разработки компьютерных программ, ориентированных на применение технологий слабого искусственного интеллекта, выработалась своя система оценки эффективности работы таких программ. Оценка опирается на измеримые характеристики результатов. Прежде всего, это точность и полнота результата. Точность (precision) отражает долю правильных ответов системы от общего числа ответов. Полнота (recall) отражает долю угаданных вариантов от числа правильных. Обе метрики являются важными показателями работоспособности технологии, поэтому для реальной оценки выводится F-мера (F-measure), позволяющая сбалансированно отразить все сильные и слабые стороны системы и сравнить разные системы между собой. Ещё одной важной численной метрикой является каппа Коэна (Cohen's Kappa), отражающая согласие разных аннотаторов в классификации объектов. Например, если нужно разметить ряд высказываний с точки зрения того, негативные или позитивные эти высказывания, то между оценкой нескольких разметчиков обязательно будет расхождение. Каппа Коэна позволяет количественно оценить величину этого расхождения и тем самым составить представление о сложности задачи разметки этого материала.
Ядром материала исследования являются литературные тексты В. Набокова. Творчество Набокова представляется весьма удобным для разрешения предполагаемых задач по следующим причинам.
1. Набоков уверенно причисляется большинством историков литературы к авторам первого уровня (классикам).
2. Набоков двуязычен, он единственный автор такого масштаба, у которого можно изучать как русскоязычные, так и иноязычные (англоязычные) тексты.
3. Набоков не только крупный прозаик, но и заметный, хотя и менее оцененный, поэт, на материале его творчества можно изучать устройство как стиха/поэзии, так и прозы.
4. Русский и английский язык Набокова в диахроническом отношении не слишком отдалились от современного состояния языка, и поправки на диахронию могут быть незначительны.
5. Язык Набокова одновременно «классичен» и «индивидуален» (как обычно описывают общее впечатление); предположительно, это позволит обращаться к анализу как общеязыковых механизмов, так и идиолекта и идиостиля.
6. Корпус сочинений Набокова обладает достаточно удобным для исследования — средним объемом, причем как весь корпус, так и значимые подкорпуса (поэзия и проза, русскоязычный и англоязычный и т. д.), он не слишком мал и не слишком велик.
При этом необходимо учитывать, что:
а) все предлагаемые конкретные методы исследования были изначально разработаны не на материале текстов и языка В.В. Набокова. В осуществленных в соответствии с этими методами и инструментами исследованиях накоплен значительный фонд наблюдений и обобщений по другим авторам и текстам, который на данном этапе может сыграть важную роль сопоставительного материала, в том числе некоторой точки отсчета, с которой может сравниваться новый материал по Набокову;
б) склонность В.В. Набокова к некоей «классичности», сдержанности, иногда нейтральности языковых средств и отчасти литературных структур, являясь, с одной стороны, достаточно любопытным объектом изучения (могут ли предлагаемые методы работать с этой классичностью и нейтральностью), оказывается, с другой стороны, ограничивающим фактором: некоторые особенности языка и литературного искусства перспективнее прослеживать на более «обнаженных», резко заявленных особенностях в соответствующих текстах, будь то сознательная цитатность поэтической фразеологии в классической поэзии или маркированная звуковая фактура поэзии авангарда;
в) некоторые проблемы, заявленные в исследовании, являются, как ясно из предыдущих наблюдений, фактом поэтического языка и литературной поэтики вообще, как в рамках русской, так и англоязычной (и вообще универсальной) литературной традиции: таковы случаи количественных соотношений в грамматике поэтического текста, принципы сочетания прозы и стиха в прозометрических композициях, ритмических форм силлаботоники и структур ритмики в прозе и др.
Поэтому материал, используемый в проекте в целом, может быть описан так:
а) ядро — тексты В.В. Набокова (см. выше);
б) второй по значимости материал — литературная традиция и эволюционирующий язык (так, как он представлен в литературных текстах). Это дает возможность представить тексты Набокова и их язык как определенный этап в развитии традиции, которому нечто предшествовало (более важный аспект) и за которым нечто следовало. Задача изучения традиции и языковой диахронии как таковых тоже важна; в рамках данного исследования она вторична, но нередко напоминает о себе;
б) сопоставительный и контрольный материал — либо
в) прочий материал:
в1) тексты, в ключевых отношениях эквивалентные набоковским, сопоставление с которыми оправданно и плодотворно;
в2) тексты, на материале которых разработаны используемые методы, выполнены предшествующие исследования и данные по которым, таким образом, легко или относительно легко могут быть привлечены к сопоставлению;
в3) принципиально гетерогенный набоковскому текстовой материал, используемый в тех фрагментах исследования, в которых для методологического заострения или инновационного подхода логичнее обратиться к текстам принципиально иной конфигурации, чем набоковские (такой материал используется преимущественно в тех фрагментах исследования, в которых осуществляется экспериментальное тестирование, сопоставительное или инновационное, специфических и новых подходов).

Layman's description

Литературоведческое изучение произведений какого-либо писателя с давних пор и в основном до нынешнего времени основывается на гуманитарных подходах: внимательное чтение, выделение смысла, наблюдение над особенностями стиля, осторожные сопоставления и обобщения. Лингвистическое изучение языка писателя в целом больше нацелено на выявление повторяющихся явлений, больше применяет подсчеты (как для доказательств, так и для понимания природы явлений), но в целом тоже пользуется возможностями математики и компьютеров реже, чем стоило бы. При этом есть области исследования, в которых опора на подсчет или машинные возможности давно или недавно стало базовым подходом: области изучения стиха (более века), словесного состава текста, в частности при составлении различных словарей (более полувека машинной работы нал составлением словарей), определение авторства текстов.
В этом проекте в 2024 году объединились разные подходы к изучению литературных произведений и их языка на основе подсчетов, статистической обработки, больших объемов текста, хранящихся в памяти компьютера, специальных программ и баз (или наборов) данных. Главным автором выбран Владимир Набоков — прозаик и поэт, классик русской и англоязычной литературы (такой разброс очень удобен для исследования).
В 6 из 10 основных разделов итогового отчета зр этот год обсуждаются результаты работы с компьютерными программами и алгоритмами, автоматически определяющими наиболее частые слова разных текстов и различным образом сопоставляющие тексты друг с другом по этим покащателям. Это, видимо, самые точные из доступных сейчас методы выявления и характеристики авторского стиля. Программы определяют и выводят, в частности, в форме наглядных схем, мелу сходства и несходства стилей, произведений и авторов. Кроме того, продолжается исчерпывающе полное изучение форм набоковского стиха, особенностей построения сюжета у Набокова и других писателей, прибегавших к тем же типам сюжета, что и он (фабулы произведений о двойниках подвергнуты математической оценке их сходств и различий), его работы с текстами предшественников (проанализировано влияние Джойса на Набокова). В одном из разделов описано, как искусственный интеллект читает Набокова и создает прозу, пройдя обучение его произведениями.

Key findings for the stage (in detail)

На данном этапе продолжены работы по математическому моделированию сюжетных, мотивных и персонажных параметров группы разнородных текстов, выделенных по сюжетно-тематической близости — тексты о двойниках; у ним принадлежит и «Отчаяние» Набокова. Отсеяны тексты, лишь внешне подобные искомым, введены параметры, по которым замеряется близость сюжетного строения текстов, произведена их квантификация и осуществлена кластеризация по выбранным параметрам. Кроме того, выявляются произведения, в наибольшей степени представляющие, обирающие в себе особенности, характерные для всей группы. Среди полутора десятков повестей и новелл наибольшее количестве релевантных связей с другими текстами формирует «Двойник» Достоевского, написанные так, как если бы его задачей было представлять всю двойническую традицию. «Отчаяние» Набокова представляет собой более авторский, специальный тип реализации фабулы о двойниках.
В отчетный период было продолжено сопоставительное исследование текстов В.В. Набокова и их переводов на основные европейские языки с использованием компьютерной программы T-LAB включающей набор лингвистических, статистических и графических инструментов для различных видов анализа текстов; главной целью исследования является анализ того, каким образом компьютерные технологии позволяют объективизировать процедуру сопоставительного анализа оригинального текста и текстов переводов. Из верхней зоны полученных программными методами частотных распределений (всего списки включат более 100 000 словоупотреблений и более 10 000 лексем по каждому из языков) выделены лексемы, которые, по результатам литературоведческого анализа, наилучшим образом отражают основные темы произведений. Сравнивалась их частотность в оригинале и разных переводах. Определено, что на результаты в меньшей степени влияют язык перевода и личность переводчика, в бОльшей — отнесенность слов к лексическому ядру языка либо к числу «авторских слов» (используемых автором чаще, чем в среднем в языке), особенно это касается слов с обобщающим значением.
Разработан и представлен другой метод работы с частотной лексикой. В Чешском национальном корпусе его разработчиками представлена мера ARF (англ. average reduced frequency), средняя уменьшенная частота. Корпус объемом N единиц делится на f сегментов, где f — частота рассматриваемого слова. Далее подсчитывается количество сегментов, в которых встретилось слово (за счет этого уменьшается влияние того, что слово может встречаться часто в одном и том же документе). Вычисляется сумма частот - от 1 (для слов, у которых абсолютная частота равна 1) до f (для слов, которые равномерно распределены в корпусе). «Частотный словарь современного русского языка» содержит списки значимой лексики — наиболее часто употребляемых слов, характерных для разных функциональных стилей. Появляется возможность сопоставлять частоты в текстах определенных стилей или тематики с частотами в остальных текстах. В случае если значение коэффициента логарифмического правдоподобия превышает 15,31, разница между частотами признается статистически значимой, то есть слово или словосочетания является характерным для данного подкорпуса текстов.
Возможно, самый известный алгоритм, работающий с частотными списками (в данном случае словоформ) назван его основателем, Берроузом, Delta. В 2023 году Delta использовалась в проекте нескольких частных исследованиях. При помощи этого метода была выполнена периодизация поэтического корпуса Борхеса –– не имеющее аналогов в отечественной и зарубежной филологии исследование. При помощи Delta, а также классификаторов Delta и KNN, которыми располагает пакет Stylo, удалось установить, что поэтический корпус Борхеса делится на три части (а не на две, как считают латиноамериканские исследователи; конкурирующая точка зрения — что корпус вообще является неделимым, без внутренней дифференциации). Более того, это разделение нашло подтверждение и на уровне распределения твердых поэтических форм –– нетривиального количественного параметра, предложенного в исследовании для решения задач периодизации. В рамках того же исследования при помощи морфоанализатора Stanza, разработанного учеными из Стэнфордского университета, был произведен грамматико-квантитативный анализ поэтического корпуса Борхеса. Выявлен ряд морфологических тенденций, главнейшей из которых оказывается снижение доли прилагательных и повышение доли глагола на последнем этапе творческого пути Борхеса. Был произведен стилеметрический анализ романного корпуса перуанского писателя, нобелевского лауреата (2010) Марио Варгаса Льосы. При помощи метода Delta удалось показать, что разница между тремя «классическими» тотальными романами Варгаса Льосы 1960-х гг., и другими пятнадцатью его романами является существенной. Романы второго периода делятся на три укрупненных класса; более того, обнаруживается интересная тенденция: романы, объединенные в отдельные группы, имеют сходства не только на уровне стиля, но и на уровне тем, композиции и особенностей повествования, что открывает новые перспективы для применения метода Delta. В рамках данного проекта, посвященного в основном Набокову, эти работы (результаты которых в принципе самоценны) имели значение проверки и «тренировки» метода — что важно, на творчестве авторов с очень сложной, изысканной и интеллектуальной поэтикой.
С использованием этого же метода романы Набокова сопосталялись в приблизительно 4о произведениями других 16 русских романистов 1920-40-х годов. Метод в целом достаточно уверенно кластеризировал Набокова и большинство других авторов, что примечательно само о себе. Однако были и смешения — определенные замеры показывали чрезвычайную близость к набоковскосу стилю «Скутаревского» Леонова и «Вечера у Клэр» Газданова. Из 17 авторов, включая двух, добавленных на заключительном этапе, 13 группировались только компактно — их тексты не смешивались с чужими и не относились в разные части схемы; исключения — Набоков, Леонов, Газданов, Олеша (последний, и только он — во всех замерах). Всегда в одной из двух главных ветвей были Грин — Газданов — Зощенко — Набоков, всегда в другой главной ветви — Катаев — Ильф и Петров — Олеша — Толстой — Федин — Тынянов — Вагинов — Пильняк, перемещались в другую из двух главных ветвей Гайдар — Зайцев, присутствовал в обеих ветвях Леонов. Всегда рядом были Катаев — Ильф и Петров — «Три толстяка», Федин — Тынянов — «Зависть» и Гайдар — Зайцев (но эти переместились в другую главную ветвь). Внутри второй ветви меняли ближайшее соседство Толстой (вначале с одесситами, потом с Пильняком и «Барсуками», потом опять с одесситами), Вагинов и Пильняк плавно колеблются между отделенностью и отдаленными примыканиями во второй ветви. Леонов, разделенный вначале между Набоковым и Толстым, потом объединяется с Платоновым. Выделяются асимметрии между рассеиванием авторов, малых групп и больших групп: Олеша разделен, но «Зависть» всегда рядом со стабильной парой Федин — Тынянов, а «Три толстяка» с такой же связкой Катаева, Ильфа и Петрова; Гайдар и Зайцев вместе, но меняют соседство (стоит напомнить, во второй ветви они всегда отделяются в первую очередь, так что это фактически отдельная группа).
Возможно, эти различия и асимметрии в замерах позволяют говорить о неких «посредничествах». Леонов — такой «посредник» между Набоковым, Толстым и Платоновым (к Набокову притягивается «интеллигентский» «Скутаревский»), Олеша — между группой Катаева, Ильфа и Петрова и связкой Федин — Тынянов. Через Зайцева и Гайдора протягивается отделенная связка Набокова, Газданова, Грина, Зощенко со второй ветвью. Все это, как кажется, не контринтуитивно. Олеша смыкает традицию «южной школы» и линию серпионов, близких опоязовцам. Леонов, начинавший с прозы, пронизанной сказом, орнаментальностью и почвенным натурализмом, в «Скутаревском» присоединяется к традиции артистического, психологически насыщенного романа о герое из интеллигентной среды, используя при этом язык богатый и образный, но в целом сдержанный — точки сближения с Набоковым очевидны. Сближение Набокова с Газдановым, как кажется, требует объяснений в наименьшей степени. Их часто сопоставляют из-за общих черт: поколение, диаспора, артистизм, преобладающий жанр короткого, отточенного, стилистически сдержанного романа, собранного вокруг центрального героя и неразветвленной фабулы. Из 17 авторов, включая двух, добавленных на заключительном этапе, 13 группировались только компактно — их тексты не смешивались с чужими и не относились в разные части схемы; главное из 4 исключений — Олеша, его «Три толстяка» и «Зависть» во всех замерахпопадали в разные ветви. Всегда в одной из двух главных ветвей были Грин — Газданов — Зощенко — Набоков, всегда в другой главной ветви — Катаев — Ильф и Петров — Олеша — Толстой — Федин — Тынянов — Вагинов — Пильняк, перемещались в другую из двух главных ветвей Гайдар — Зайцев, присутствовал в обеих ветвях Леонов. Всегда рядом были Катаев — Ильф и Петров — «Три толстяка», Федин — Тынянов — «Зависть» и Гайдар — Зайцев. Внутри второй ветви меняли ближайшее соседство А. Н. Толстой (вначале с одесситами, потом с Пильняком и «Барсуками», потом опять с одесситами), Вагинов и Пильняк плавно колеблются между отделенностью и отдаленными примыканиями во второй ветви. Леонов, разделенный вначале между Набоковым и А. Н. Толстым, потом объединяется с Платоновым.
Проведено первое специальное исследование неклассического стиха поэта. В ходе анализа впервые учтена не только употребительность самостоятельных размеров, но и частотность размеров, которые встречаются в составе других, более сложных метрических структур, а также учтены корреляции метрических и строфических форм. В числе произведений Набокова зафиксировано 6 полиметрических композиций и 11 сводных форм (текстов, содержащих прозаические и стихотворные фрагменты); всего рассмотрено 658 произведений и звеньев. Статистические подсчеты демонстрируют, что доля неклассического стиха (собственно неклассических размеров, моностихов, фигурных стихов и микрополиметрии) в творчестве поэта невелика — около 10 % произведений и звеньев, 6 % строк — и уступает аналогичным показателям по русской поэзии ХХ в. (12–19 % произведений, согласно подсчетам М. Л. Гаспарова). Вместе с тем полученные данные значительно опережают данные по XIX в., в котором частотность неклассических размеров не превышала 4 % (данные М. Л. Гаспарова). В полиметрических композициях Набокова неклассические размеры имеют больший удельный вес в статистике строк (15 %), в сводных формах — и звеньев, и строк (22 % и 19 %, соответственно), то есть полиметрические композиции и сводные формы маркированы в контексте творчества поэта повышенной долей неклассического стиха. По богатству неклассических размеров Набоков заметно превосходит авторов XIX в. и находится в одном ряду с поэтами своей эпохи: им опробовано 25 форм, на каждую из которых приходится 2,6 произведения (звена). Пропорции размеров также выявляют экспериментальную установку Набокова. В целом он, действительно, избегает дольника, который получил максимальное распространение среди неклассических форм у современников, однако среди дольников разрабатывает не только ходовые 3- и 4-иктные размеры, но и 2-, 6-иктные, разноиктные и вольные. Помимо этого поэт неоднократно обращается к другим формам — как более урегулированным (гекзаметр, 3-сложники с переменной анакрузой, строчные логаэды), так и более свободным (тактовик, акцентный стих, микрополиметрия). Выделить преобладающий, господствующий неклассический размер в поэзии Набокова невозможно (формально на первом месте находится 3-иктный дольник, который встречается лишь в 7 из 66 текстов). Сделанные наблюдения позволяют заключить, что эксперименты Набокова с неклассическим стихом протекали именно в русле поэтических исканий ХХ в. Рассмотрен вопрос о специфике русских нетождественных строф. На основе метрических и строфических указателей, опубликованных в сборниках «Петербургская стихотворная культура» (СПб., 2008; 2013), а также картотек, хранящихся в электронной базе данных по метрике и строфике русского литературного стиха в СПбГУ, были сделаны подсчеты по нетождественным строфам 18 русских поэтов ХХ в. В общей сложности учтено 1572 текста, написанных нетождественными строфами. Анализ этого материала показал: нетождественные строфы в русской поэзии ХХ в. очень разнообразны, существуют индивидуальные предпочтения авторов в разработке нетождественной строфики. На основе анализа литературного наследия Набокова, С. Е. Вольфа и А. Г. Битова под новым углом зрения рассмотрена проблема взаимосвязи стиха и прозы в творчестве русских авторов XX в. Принципиально по-новому исследована проблема формирования стихотворных систем трех авторов — В. В. Набокова, К. К. Вагинова и А. П. Платонова. Все они родились в 1899 году, обрели популярность в качестве прозаиков, но первые шаги в литературе делали как поэты, каждый из авторов по разным причинам оказался по-настоящему не востребован в России при жизни. На основе стиховедческого корреляционного анализа, учитывающего ряд стиховых параметров, выявлено, что все три автора выбирали однозначно «маргинальную» позицию в стратегии, но принципиально отличались друг от друга в тактике формирования поэтических систем.
Возможность обучать нейросети на корпусах текстов с определенными параметрами позволяет как получать произведения определенного жанра (в таких случаях ожидаемо удачными оказываются попытки порождения формульных текстов), так и имитировать индивидуальный стиль. Механизм работы нейронной сети непрозрачен; известно лишь самое общее: нейросети осуществляют распознавание паттернов посредством статистической индукции. Принципиально важно, что, поскольку компьютер не обладает сознанием, творческой волей и не способен породить цельного художественного задания, текст, сгенерированный нейросетью, обученной на массиве текстов одного автора, являет собой пример «чистого» стиля, то есть стиля без нарратора, в том числе «ненадежного», без лирического модуса – словом, без всего того, что происходит из творческой субъектности и в единстве с чем обычно воспринимается стиль в прозе. В этом «нейротексте» стиль предстает в «снятом», очищенном или даже доведенном до абсурда, а оттого особенно очевидном виде. Стилеметрический анализ нейротекстов с помощью Delta последовательно разделяет нейронные и человеческие тексты. Дендрограмма демонстрирует отчетливое деление исследовательского корпуса на два кластера: один объединяет собственно романы Набокова, другой — все тексты, сгенерированные с помощью нейросетей. Любопытно, что текст пародии Владимира Сорокина, который мы интуитивно оценили как непохожий на набоковский, кластеризовался вместе с нейротекстами.
На примере цсетообозначений в стихах Набокова исследовалась возможная роль подключения данных автоматического поика слов-спутников (лексических комбинаций) к общим данным частотного словаря. На конкретных примерах показывается, что дополнительный компонент (результаты добываются методом автоматического поиска) существенно обогащает картину.
Представляется важной и не только не разрешенной, но даже отчасти и не поставленной. задачей установление самой общей концептуальной сетки, на которую можно было бы опереться при подключении к количественно-корпусным исследованиям синтагматически-контекстного компонента (повтор, синонимы, контрастные поля, типы реализации тропа). В работе подробно проанализированы возможные классификации типов повтора и синонимической серии, а также семиотико-грамматической реализации тропа в контексте. Предложено при необходимости (и желательности) подключения к подсчетам частотных слов нового компонента (новых компонентов) ориентироваться прежде всего на различные классификации повтора и близких, соизмеримых явлений; различные классификации типов реализации синонимии в тексте; метод исчисления основных бинарных семантических оппозиций; базовые классификации семиотико-грамматических реализации тропов.

Academic ownership of participants (text description)

Федор Никитич Двинятин разработал общий дизайн проекта, а также план работы на отчетный год, написал Заключение отчета и (в сотрудничестве) вступление, участвовал в исследовании методом Delta стилевой близости романов Набокова и других русских романов 1920-х-40 годов (ему принадлежит основная роль в формировании и дополнении корпуса текстов и в историко литературной интерпретации результатов исследования), в исследовании интертекстуальных и мотивных связей Джойса и Набокова (ему в основном принадлежит набоковедческая часть), в ревизии синтагматических структур реализации лексики в тексте (ему в основном принадлежит сравнение типологий метафоры и проверка общей гипотезы по древнерусским текстам и их поэтике).
Ирина Владимировна Головачева и Михаил Евгеньевич Журавоев исследовали возможности математического моделирования двойнических текстов: И.В.Головачевой принадлежит историко-литературная оработка материала, М.Е.Журавлеву - математические гипотезы.
Екатерина Павловна Иванова, Александр Олегович Гребенников и Мария Владимировна Соловьева (при участии Михаила Витальевича Корышева) исследовали лексический аспект соотношения текстов Набокова и их переводов на европейские языки: Е.А.Иванова осуществляла общее руководство и определяла используемые возможности программы T-LAB, А.О.Гребенников работал с текстами нам английском языке, а также обеспечивал матлингвистическую экспертизу подпроекта, М.В.Соловьева и М.В.Корышев изучали французские и немецкие переводы соответственно. Кроме того, М.В.Корышев был соавтором М.В.Хохловой в статистическом исследовании немецких журналистских текстов.
Помимо этого, Мария Владимировна Хохлова разработала метод исследования частотной лексики на основе специальной формулы и протестировала его на предварительном материале.
Борис Вадимович Ковалев при помощи Delta и других, в данном случае подчиненных, алгоритмов осуществил новаторскую периодизацию поэзии Борхеса, кластеризацию двух десятков романов романов Марио Варгаса Льосы, а также романов Варгаса Льосы и других латиноамериканских романистов его эпохи. Б.В.Ковалев участвовал в исследовании методом Delta стилевой близости романов Набокова и других русских романов 1920-х-40 годов (ему принадлежит вся работа с алгоритмами, уточнение условий эксперимента и существенная часть интерпретации).
Елена Викторовна Хворостьянова и Ольга Сергеевна Лалетина исследовали стих Набокова и его контекст: неклассических стих совместно, нетождественную строфику О.С.Лалетина, Набокова в сопоставлении с другими прозаиками, начинавшими со стихов, Е.В.Хворостьянова.
Любовь Анатольевна Каракуц-Бородина выполнила исследование по нейрочтению текстов Набокова и кластеризации методом Delta его романов и GPT-имитаций, кроме того, ей принадлежит исследованиероли жанра science fiction в творчестве Набокова.
Ирина Викторовна Романова и Лариса Викторовна Павлова совместно завершили подпроект по роли частотных словарей и дополнительных примыкающих к ним инструментов в исследовании набоковской поэзии и характерного для нее словоупотребления.
Андрей Алексеевич Аствацатуров участвовал в исследовании интертекстуальных и мотивных связей Джойса и Набокова (ему принадлежит вся джойсовская часть, также он уаствовал в набоковской части и производил общую редактуру итоговой статьи). Кроме того он, в качестве директора Музея Набокова и искушенного историка литературы, оказывал участникам проекта всевозможную организационную и консультационную помощь.
Жамила Рузмаматовна Двинятина участвовала в написании введения, ей принадлежит ведущая роль в обзоре структур повтора, синонимии, бинарных семантических оппозиций и текстовых реализаций тропов.

Transfer of the full copy of the report to third parties for non-commercial use: permitted/not permitted

разрешается

Check of the report for improper borrowing in external sources (plagiarism): permitted/not permitted

разрешается

Rationale of the interdisciplinary approach

Современная гуманитарная наука всё активнее использует математические методы для того, чтобы включить в сферу анализа и обобщить большой объем текстового материала (big data), который исследовательские процессы в филологии не могут охватить с помощью традиционного инструментария медленного чтения. Математические методы способны показывать и позволять количественно оценивать тенденции на больших историко-литературных дистанциях, создавать крупные модели культурной эволюции, описывать движение стилей и приемов. Активное и опережающее развитие компьютерных методов обработки, анализа и интерпретации текста, в том числе художественного, которые позволяют на примере уникальных литературных корпусов сформулировать решения для ряда историко-литературных задач, чтобы затем эти решения стали модельными для последующих исследований в сфере digital literary studies. В предлагаемом исследовании основным предметом изучения остается литературный корпус, рассматриваемый исследователями, в том числе посредством междисциплинарных подходов, в ракурсе возможностей современных цифровых методов исследований.

Rationale of the intersectoral approach

Short title	GZ-2023
Acronym	M1_2020 - 4
Status	Finished
Effective start/end date	1/01/23 → 31/12/23

Documents

Двинятин
Text, 5.89 MB, PDF document

ID: 94033710