Литературные тексты и их язык vs количественные, корпусные и компьютерные методы: взаимное тестирование (Набоков и сопоставительный материал): 2020 г. этап 1

Проект: исполнение гранта/договораисполнение этапа гранта/договора

Сведения о проекте

описание

Основной научной проблемой, на решение которой направлен проект, является создание и совершенствование современной цифровой(т. е. количественной, корпусной и компьютерной) поэтики, причем преимущественно в российской версии,то есть опирающейся на отечественные научные традиции в области точного литературоведения и лингвистической поэтики. Конкретной задачей является объединение в рамках одного проекта и применение к одному исследуемому большому корпусу — стихотворным и прозаическим сочинениям В.В. Набокова на русском (преимущественно) и английском языках — ряда авторских и инновационных подходов в области исследования стиха,языка и поэтики (структуры текста),количественными, корпусными и компьютерными методами. Другая задача — тестирование, уточнение и углубление самих этих методов на материале текстов Набокова. Значительная часть методик, которые предполагается использовать в проекте, являются полностью или в значительной степени авторскими; они разработаны участниками проекта и использованы в их предыдущих исследованиях; предполагается также обращение к передовым программным продуктам общего пользования. Основными частными областями языковой и литературной системы Набокова, разрабатываемыми в проекте, являются стих, ритмика стиха и прозы, фоника, поэтическая грамматика, анализируемая в различных аспектах лексика, повествование (фабулы, мотивы, персонажи).

В2020 году предполагается:

-провести текстологическую экспертизу книжных изданий Набокова на русском языке с целью отбора в дальнейшем наиболее текстологически выверенных текстов;

-составить и разметить общий корпус сочинений Набокова и начать работу над составлением частных корпусов и наборов данных;

-отобрать и подготовить основной материал для всех предполагаемых целей исследования;

-провести пробные и тестирующие исследования, связанные с используемыми в проекте программами, электронными ресурсами,методиками автоматической обработки текста и математического моделирования;

-провести первые исследования, связанные с количественными замерами по текстам Набокова и их статистической, моделирующей или лексикографической разработкой:фрагмент лексической системы, поэтическая грамматика, ритмика стиха и прозы, фоника (в том числе в контрастивном рассмотрении);

-составить полную электронную картотеку по метрике и строфике Набокова, сопоставить ее данные с данными общей подобной картотеки;

-сопоставить полученные предварительные результаты и внести коррективы в дальнейшие планы исследования.


описание для неспециалистов

Литературоведческое изучение произведений какого-либо писателя с давних пор и в основном до нынешнего времени основывается на гуманитарных подходах: внимательное чтение, выделение смысла, наблюдение над особенностями стиля, осторожные сопоставления и обобщения. Лингвистическое изучение языка писателя в целом больше нацелено на выявление повторяющихся явлений, больше пользуется подсчетами (как для доказательств, так и для понимания природы явлений), но в целом тоже пользуется возможностями математики и компьютеров реже, чем стоило бы. При этом есть области исследования, в которых опора на подсчет или машинные возможности давно или недавно стало базовым подходом: фундаментальные подсчеты в области стиха и ритмики (более века), компьютеры в составлении различных словарей (более полувека), определение авторства текстов.
В этом проекте объединяются разные подходы к изучению литературных произведений и их языка на основе подсчетов, статистической обработки, больших объемов текста, хранящихся в памяти компьютера, специальных программ и баз (или наборов) данных. Подходы эти действительно разные: с одной стороны, по характеру привлекаемых математических и компьютерных возможностей — от простых подсчетов до сложных программ — так и по областям филологического интереса: словарь автора, его поэтическая фонетика и грамматика, ритм его стиха и прозы, неповторимый стиль, сюжеты и отдельные сюжетные ходы. Главным автором выбран Владимир Набоков — прозаик и поэт, классик русской и англоязычной литературы (такой разброс очень удобен для исследования).
В 2020 году участники проекта проверяют, по каким изданиям лучше всего сверять тексты Набокова, составляют большой компьютерный свод его сочинений. Они проводят дополнительные испытания и улучшения своих компьютерных программ и других инструментов исследования. В отдельных областях (более чем в половине из числа намеченных) они проводят первые, отчасти пробные изыскания: это составление частных словарей Набокова (по частоте слов, слов определенной тематики, в определенных жанрах), исследование его поэтической грамматики (предпочтения в использовании разных частей речи, разных времен глагола), определение ритмических закономерностей набоковской прозы, русской и английской, в сопоставлении со стихом, звуковой гармонии набоковской поэзии и прозы. Полностью каталогизироны все виды размеров и строф в поэзии Набокова. Делаются приближения к описанию сюжетов Набокова с помощью математических моделей. Итоги сопоставляются и обобщаются.

основные результаты по этапу (подробно)

Основной целью проекта является совершенствование современной цифровой поэтики, от создания некоторых прежде не существовавших ее фрагментов (подходов, моделей, традиций) до развития устоявшихся, обращения в их рамках к новому материалу и возможного синтеза. Количественные подходы очень характерны для отечественной поэтики и сотрудничающих с ней лингвистических дисциплин. Но научная ситуация развивается: появление огромных специальных корпусов (прежде всего Национального корпуса русского языка), массивов и баз данных, компьютерных технологий большой разрешительной силы, выдвижение проблематики обращения к большим группам текстов и их анализу (distant reading и подобное) требуют расширения инструментальной и методологической базы. Опора на достижения отечественной филологии должна сочетаться со следованиям передовым мировым подходам к обработке и анализу текста компьютерными методами. На первый план выходит задача (а) корректного, (б) нетривиального и (в) комплексного исследования современными количественными, корпусными и компьютерными методами литературного текста, корпуса текстов, творчества отдельного автора. В настоящее время эти методы еще не доведены до должного уровня точности и полноты; зачастую не применяются к отдельным текстам и авторам, так что методика такого обращения к отдельным текстам и авторам частично не разработана; почти никогда не используются в связке, комплексно; кроме того, во многих случаях результаты количественного, корпусного или компьютерного исследования литературных текстов не представляются информативными и небанальными для изучения идиостилей, исторической поэтики, литературоведческой интерпретации изучаемых авторов и текстов. Передовые авторские методики в области количественной, корпусной и компьютерной поэтики частично затеряны среди более стандартных подходов и в любом случае не собраны воедино в рамках какого-либо одного проекта.
В то же время сами методы количественного, комплексного и корпусного исследования литературных текстов нуждаются в проверке и улучшении.
На разрешение этих двух взаимообратимых задач и направлен проект. Методы тестируются новым обращением к новому материалу, материал — полностью новыми или новыми для изучения этого материала методами.
Специфика используемого в работе материала определяется следующим.
Базовым материалом является корпус художественных текстов В. В. Набокова, рассматриваемый как в целом (скорее в рамках общего проекта), так и в тех или иных фрагментах (отдельные тексты или блоки, выделяемые по линиям «проза — поэзия», «русскоязычные тексты — англоязычные тексты» и др.) в пределах конкретных исследований (подпроектов проекта).
Выбор текстов Набокова удобен и логичен, поскольку речь идет о двуязычном авторе (причем одинаково высоко ценимом в обеих традициях), и это дает возможность обращения к материалу на двух языках; поскольку речь идет о прозаике и поэте одновременно (возможность обращения к анализу прозы, поэзии и их взаимодействий); поскольку корпус сочинений Набокова обладает достаточно удобным для исследования — средним — объемом, причем как весь корпус, так и значимые подкорпуса (поэзия и проза, русскоязычный и анеглоязычный и т. д.), он не слишком мал и не слишком велик; а кроме того имеет значение высокий статус Набокова в «классике» или «каноне», его малая смещенность в диахронии относительно современного языка и констатируемое критикой «среднее» положение его языка и литературной манеры между «классичностью» и «традиционностью» и «модернистичностью» и «индивидуальной усложненностью» (что дает возможность замеров и того и другого).
Однако при этом необходимо учитывать: а) накопившийся ценный материал по другим авторам и текстам — он дает возможность сопоставлений и в известном смысле взывает к таким сопоставлениям; б) разрешимость многих теоретических и практических проблем только при обращении к большому контексту, к традиции; в) возможность эффективного решения некоторых проблем на материале, принципиально отличном от текстов Набокова.
Учитывая это, участники проекта иногда дополняют материал текстов В.В.Набокова (остающийся, однако, единственным объектом исследования в качестве комплексного идиостиля) разнообразным сопоставительным материалом. В ряде случаев этот материал, при наличии тесной связи с основным предметом исследования, может быть самодовлеющим объектом отдельных фрагментов и аспектов исследования, нацеленного в конечном счете на взаимное тестирование заявленных методов и исследуемого этими методами языкового и научного материала.
Работа носит междисциплинарный характер. Филология все больше использует математические и компьютерные методы для того, чтобы включить в сферу анализа и обобщить большой объем текстового материала (big data), который филолог просто физически не может охватить с помощью традиционного инструментария медленного чтения. Математические методы способны показывать и позволять количественно оценивать тенденции на больших историко-литературных дистанциях, создавать крупные модели культурной эволюции, описывать движение (в области литературы) комплексных поэтик и отдельных их единиц (структур, моделей, «приемов»). В свою очередь, активное и опережающее развитие компьютерных методов обработки, анализа и интерпретации текста, в том числе художественного, дает возможность на материале уникальных литературных корпусов разработать типовые решения для некоторых поэтологических и историко-литературных проблем, сделав их впоследствии модельными для других изысканий в сфере digital literary studies. При этом очевидна ограничительная роль некоторой разрозненности отдельных математических и компьютерных подходов в области поэтики и истории литературы, отсутствие многопрофильных, комплексных исследований одного текста или корпуса различными количественными, корпусными и компьютерными методами. Разновидностями такой разрозненности или несогласованности проявляются: а) между методами статистического, корпусного и компьютерного изучения языка и количественными и корпусными методами, применяемыми в исследовании литературного текста; б) между наиболее строгими и точными методами исследования лексики и лексической семантики текста (стилеметрия, векторный анализ семантики) и менее строгими и поэтому реже используемыми подходами к корпусному и количественному анализу звукового и грамматического уровней текста, а также лексики за пределами действия наиболее развитых подходов; в) между строгими методами в изучении стиха и ритма и подходами, применяемыми к другим уровням текста и языка; г) между методами, использующими аппарат математической статистики, и количественными и корпусными методами, не вооруженными статистическим инструментарием.
Отсюда задача применения к одному корпусу (творчеству одного автора) гетерогенных и разноуровневых подходов, относящихся, однако, к одному общему дисциплинарному полю математических и компьютерных методов, используемых в области анализа литературного текста (филология и, как ее области, поэтика и история литературы).
Среди методов, используемых в исследовании, выделяются количественные, корпусные и компьютерные.

На протяжении отчетного года участники проекта решали в основном задачи двух типов — впрочем, взаимообусловленные и не всегда четко разделимые.
Задачи первого типа подразумевали ту или иную подготовку инструментов для последующих изысканий: создание корпуса текстов, в том числе с соответствующей разметкой, по теме проекта; дополнение уже имеющегося ресурса или массива данных новым материалом, имеющим отношение к теме проекта; совершенствование и/или тестирование программы или платформы для исследований по теме проекта. Наиболее общей задачей такого рода, потребовавшей специального экспертного заключения, выполненного в рамках проекта, оказался обзор текстов В. В. Набокова на русском языке с точки зрения их текстологической разработанности и аутентичности.
Задачи второго типа предполагали первые этапы собственно исследований по теме проекта, иногда предварительные и пробные; обращение к параллельному материалу для проверки и уточнения метода; в отдельных случаях полный цикл анализа определенной части материала.
Более подробное представление исследований, выполненных за отчетный год, содержится в следующих разделах.
Особой областью работы участников проекта была выработка коллективного подхода к исследованию, научное взаимодействие, регулярные контакты, направленные на формирование единой идеологии и методологии проекта.

Обзор и анализ текстологии и изданий произведений В. В. Набокова на русском языке в России

Текстологическое изучение творчества Набокова — одна из острых проблем современного набоковедения, которая не может быть решена выработкой универсальной методологии в силу разнородности самого материала.
Как известно, Набоков писал на русском, английском и французском языках, — соответственно, эти части творческого наследия диктуют редакторам различные задачи при подготовке текстов к печати. Так, при издании сочинений Набокова на русском языке в текстологическом отношении «русскоязычная» часть представляет наибольшие сложности: например, следует учитывать две реформы орфографии (1917–1918, 1956), которые пришлись на время творчества Набокова. Когда печатаются переводные произведения писателя, то выбор наиболее авторитетного источника публикации касается не оригинального набоковского текста, а текста самого перевода (если ранее он уже издавался); исключение составляют автопереводы (например, роман «Лолита»).
Текстологическое исследование подразумевает обращение к рукописям писателя и прижизненным публикациям его сочинений. В этом смысле для российских издателей известная сложность заключается в том, что рукописное наследие Набокова по большей части хранится в американских архивах — в Нью-Йорке, Вашингтоне и Гарварде. Опись архивов Набокова не завершена, поэтому судить об объемах, характере и, главное, значимости неопубликованных текстов, завершенных и незавершенных (художественная проза, стихи, эпистолярное наследие, переводы, статьи и др.), довольно сложно. Кроме того, в эмигрантских периодических изданиях могут быть обнаружены публикации, до сих пор не известные специалистам и не включенные в корпус сочинений Набокова.
На сегодняшний день на русском языке выпущено единственное Собрание сочинений писателя (Собрание сочинений американского периода: в 5 т. СПб.: Симпозиум, 1997; Собрание сочинений русского периода: в 5 т. СПб.: Симпозиум, 1999–2000). Нужно отметить, что первое систематизированное издание сочинений Набокова, подготовленное при участии специалистов, не является полным: в него не вошли, например, лекции по литературе, сценарий «Лолита», отдельные художественные произведения, статьи, письма др. Тем не менее это была важная веха в истории изучения и популяризации творчества Набокова, и в дальнейшем к этому источнику апеллировали в своих исследованиях литературоведы, и с этого источника, пусть и с последующими уточнениями, тексты воспроизводились в издательстве «Азбука».
С 2005 г. эксклюзивное право на публикацию большей части произведений Набокова на территории Российской Федерации принадлежит издательству «Азбука», входящему в холдинг «Азбука-Аттикус» (книги Набокова выходят в издательствах «Азбука» и «Колибри»). Важно отметить, что «Азбука-Аттикус» — коммерческое предприятие, которое не ставит перед собой задач научной подготовки произведений литературы. Репертуар выпускаемых изданий Набокова ограничен контрактом с правообладателем (The Estate of Vladimir Nabokov, The Wylie Agency). Например, «Азбука» не издает комментарий к «Евгению Онегину».
Тем не менее в издательстве ведется работа по верификации произведений, написанных Набоковым на русском языке, а также работа с переводами его текстов. С этой целью привлекаются специалисты — редакторы-текстологи, а также исследователи творчества Набокова, в том числе имеющие возможность обратиться к американским архивам (в ряде случаев издательство может только положиться на компетентность этих специалистов, не имея возможности оценивать или контролировать принимаемые ими решения). Выпуск книг Набокова осуществляют три штатных редактора (все трое кандидаты филологических наук) — С. А. Антонов (переводы с английского), А. С. Степанова, О. Н. Сабурова.
Не все издания Набокова, предпринятые в «Азбуке», можно считать состоявшимися в текстологическом отношении хотя бы на текущем этапе (при отсутствии результатов соответствующих исследований рукописей, а они фактически не проводились); есть тексты, которые еще не сверялись даже с прижизненными публикациями (они перечислены далее). Однако есть и издания, которые можно рекомендовать как вполне качественные.
Кратко охарактеризуем некоторые наиболее значимые книги Набокова, выпущенные в «Азбуке» и «Колибри» за последнее время.
«Трагедия господина Морна: Пьесы. Лекции о драме» (2008) — наиболее полное издание драматических произведений (1921–1942), подготовленное А. А. Бабиковым (составление, текстология, сопроводительные материалы). В книгу вошли все пьесы, впервые на русском языке опубликована драма «Человек из СССР» (при жизни автора было напечатано только первое действие). Другие пьесы печатаются по прижизненным публикациям с исправлениями Набокова. На основе этого издания в 2018 году был выпущен сборник пьес «Изобретение Вальса».
«Лаура и ее оригинал» (2009) — первая публикация незавершенного романа, написанного по-английски на 138 библиотечных карточках. «Азбука» выпустила книгу в двух вариантах: в одном из них (384 с.) вместе с переводом и сопроводительными статьями факсимильно воспроизведены все карточки оригинальной рукописи. Серьезную критику вызвал перевод Г. А. Барабтарло, признанный рецензентами (Н. Г. Мельников, П. В. Балдицын) излишне вычурным.
«Полное собрание рассказов» (2013) — впервые под одной обложкой изданы 68 рассказов (1920–1951); сборник подготовлен А. А. Бабиковым (составление, текстология, сопроводительные материалы). Русские читатели получили возможность впервые прочесть три набоковских рассказа: «Говорят по-русски», «Звуки» и «Боги» (печатаются по архивным материалам); подавляющее большинство рассказов, написанных по-русски, сверены с прижизненными публикациями. Но, несмотря на это, «Полное собрание рассказов» имеет целый ряд недочетов, в том числе текстологических, устранить которые редакторы издательства не имели возможности: 1) композиция, не оправданная логикой творческого пути Набокова; вперемешку печатаются рассказы из разных авторских сборников; включены рассказы «Mademoiselle O» и «Первая любовь», которые стали главами автобиографической книги «Другие берега», и др.; 2) недостаточно информативные примечания составителя к ранее уже публиковавшимся рассказам и отсылающие за более подробной информацией к Собранию сочинений, выходившему в «Симпозиуме»; 3) неудачный выбор переводов (несколько рассказов, написанных Набоковым на английском, печатаются в переработанных для данного издания переводах Г. А. Барабтарло); 4) орфография, не имеющая единых принципов в разных частях сборника: произведения, созданные Набоковым на русском языке, печатаются с соблюдением современных норм, тогда как в переводах встречаются архаичные написания вроде «нещастлив», «пре-рафаелиты», «троттуар», «шоффер», а также использование приставок «раз-» перед глухими согласными корня («разсказ», «безпрерывно», «разстегнутый» и т. п.), — на этих написаниях настаивал переводчик.
В. Набоков, Э. Уилсон. «Дорогой Пончик. Дорогой Володя: Переписка. 1940–1971» (2013) — первая публикация на русском языке переписки В. Набокова и американского критика, историка, писателя Эдмунда Уилсона (переписка велась на английском). Издание на английском языке было подготовлено С. А. Карлинским (The Nabokov – Wilson Letters: Correspondence Between Vladimir Nabokov and Edmund Wilson, 1940–1971. N. Y., 1979; Dear Bunny, Dear Volodya: The Nabokov – Wilson Letters, 1940–1971. Berkeley; Los Angeles, 2001); перевод на русский язык С. Э. Таска.
«Ада, или Радости страсти» (2014) — издание существенно отредактированного перевода С. Б. Ильина (впервые опубликованного в 1997 г. в Собрании сочинений, издательство «Симпозиум»).
«Защита Лужина» (2014, серия «Вечные книги») — текст романа сверен с прижизненным изданием (ранее публиковался по Собранию сочинений, выпущенному в издательстве «Симпозиум»).
«Просвечивающие предметы» (2014, серия «Вечные книги») — в издание вошли два романа: «Истинная жизнь Себастьяна Найта» (перевод А. Б. Горянина и М. Б. Мейлаха) и «Просвечивающие предметы» (перевод А. А. Долинина и М. Б. Мейлаха); переводы были выполнены в 1991 г., но переработаны специально для данного издания. Статья и комментарии А. А. Долинина.
«Лолита» (2015, серия «Русская литература. Большие книги») — издание романа с сопроводительными материалами А. А. Долинина. Текст произведения был сверен с прижизненным изданием, исправлен ряд расхождений (до этого публиковался по изданию «Симпозиума»).
«Стихи» (2016, серия «Азбука-классика») — наиболее полное издание лирики Набокова. Сборник начинал готовить сам автор (им был сделан отбор текстов), однако книга увидела свет только в 1979 г. (издательство «Ардис», редакция В. Е. Набоковой). В «Азбуке» тексты печатаются в том же составе, по изданию «Ардиса», с учетом современных норм орфографии и пунктуации; вступительная статья и комментарии М. Э. Маликовой.
«Письма к Вере» (2017) — первая публикация на русском языке переписки Набокова с женой, одно из самых проблематичных в текстологическом отношении изданий. Переписка велась на русском языке, однако впервые вышла в английском переводе О. Ю. Ворониной и Б. Бойда, с их комментариями (Nabokov V. Letters to Verá / Transl. and ed. by Olga Voronina and Brian Boyd. L.: Penguin Classics, 2014). В издании «Азбуки» тексты писем опубликованы по компьютерному набору, предоставленному правообладателем (The Estate of Vladimir Nabokov). Этот компьютерный набор был выполнен непрофессионально: с одной стороны, он сохранил особенности оригинала (например, характерные для старой орфографии написания «чорт», «на-днях» и др.), с другой — частично уже был адаптирован к современной орфографии: буквы дореволюционного алфавита были заменены использующимися в современном алфавите; приставки «раз-» перед корнем, начинающимся с глухого согласного, были заменены на «рас-» («разсказ»/«рассказ»); при наличии никак не отмеченных незначительных нарушений орфографических норм (пропуски букв, рассогласования падежных форм) в компьютерном наборе также использовались и редакторские скобки ⟨ ⟩, и редакторские указания на соответствие автографу ⟨sic⟩. Много вопросов у редакторов издательства вызвала расшифровка писем 1932 г. по аудиозаписи (оригиналы писем за этот год не сохранились, существует аудиозапись чтения писем В. Е. Набоковой, сделанная Б. Бойдом). Например: «Я был дома уже в 1 час ночи» (как в аудиозаписи звучит числительное?). Не получив ответы на вопросы или доступ к рукописям и аудиозаписи, сотрудники издательства постарались учесть все особенности источника, привели текст в соответствие современной орфографии и пунктуации, а также, насколько это было возможно, в соответствие правилам подготовки подобного рода изданий.
«Строгие суждения» (2018) — первая публикация на русском языке сборника нехудожественной прозы (интервью, письма к редакторам газет и журналов, статьи, в том числе по энтомологии) в оригинальном авторском составе (Nabokov V. Strong Opinions. N.Y.: McGraw-Hill, 1973). Переводчики: С. А. Антонов, М. А. Дадян, О. М. Кириченко, А. Я. Ливергант, М. Б. Мейлах, В. Г. Минушин, А. Г. Николаевская, М. М. Попцова, Д. Г. Федосов. На русском языке изданию «Азбуки» предшествовала книга: Набоков о Набокове и прочем / ред.-сост. Н. Г. Мельников. М.: Независимая газета, 2002; в нее вошло большинство произведений сборника «Strong Opinions» (с некоторыми купюрами), авторский состав был дополнен другими материалами. В издании «Азбуки» купюры в текстах восстановлены, в некоторые переводы внесены поправки, несколько текстов опубликованы на русском языке впервые.
Другие произведения.
— Написанные на русском языке («Волшебник», «Дар», «Другие берега», «Камера обскура», «Король, дама, валет», «Машенька», «Отчаяние», «Подвиг», «Приглашение на казнь», «Соглядатай»). В основном тексты печатаются по Собранию сочинений, выходившему в издательстве «Симпозиум». Были внесены поправки с учетом современной орфографии и пунктуации (например, в некоторых текстах сохранялись написания «пенснэ», «шоффер», «галлерея» и др., принимаемые издателями за авторские) при сохранении индивидуальных особенностей орфографии Набокова, играющих стилистическую роль, а также связанных с орфоэпическими особенностями («фильма», «свэтер», «гэрл-скаут», «счастье»/«счастие» и др.)
— Написанные на английском языке
«Бледный огонь» — роман издается в переводе В. Е. Набоковой (1983), по тексту, предоставленному правообладателем.
«Взгляни на арлекинов!» — с 2013 г. роман печатается в переводе А. А. Бабикова (ранее в «Азбуке-Аттикус» печатался в переводе С. Б. Ильина под названием «Смотри на арлекинов»).
«Лекции о Дон Кихоте» — цикл лекций о знаменитом романе Сервантеса, прочитанный Набоковым в Гарвардском университете в 1952 г.; впервые издан: Nabokov V. Lectures on Don Quixote. N. Y.; L., 1983. В «Азбуке-Аттикус» печатается по изданию «Независимой газеты» (2002), под общей редакцией М. А. Дадяна.
«Лекции по зарубежной литературе» — цикл лекций, прочитанный Набоковым в Корнеллском университете в 1940–1950-е гг.; впервые был издан: Nabokov V. Lectures on Literature. N. Y.; L., 1980. В «Азбуке-Аттикус» большая часть переводов печатается по изданию «Независимой газеты» (1998).
«Лекции по русской литературе» — цикл лекций, подготовленный Набоковым в 1940–1950-е гг. для студентов колледжа Уэлсли и Корнеллского университета; впервые издан: Nabokov V. Lectures on Russian Literature. N. Y.; L., 1981. В «Азбуке-Аттикус» частично использованы переводы первого издания этой книги на русском языке («Независимая газета», 1996).
«Пнин» — с 2007 г. роман издается в переводе Г. А. Барабтарло (при участии В. Е. Набоковой); текст неоднократно перерабатывался; публикуется в орфографии переводчика.
«Под знаком незаконнорожденных» — роман печатается в переводе С. Б. Ильина (впервые был опубликован в 1997 г. в издательстве «Симпозиум»).
Безусловно, текстологическое изучение наследия Набокова должно быть продолжено, о чем свидетельствует данный обзор. За двадцать лет после выхода Собрания сочинений в издательстве «Симпозиум» проведена большая работа: в тексты произведений вносились поправки, многие тексты были опубликованы впервые на русском языке. Однако без привлечения архивных материалов, в первую очередь рукописей, работу редакторов-текстологов, участвующих в издании произведений Набокова, нельзя считать полноценной.

2. Создание корпуса набоковских текстов, разработка параллельного корпуса, корпусы для изучения транслингвальной языковой личности

Вероятно, наиболее важным достижением в этой области следует считать сбор и предварительную организацию максимально полного корпуса текстов В.В. Набокова на русском и английском языках; собрание включает также единичные французские тексты. Всего собрано и систематизировано более 1650 собственно набоковских текстов: художественные (поэтические, прозаические; драматические), литературно-критические, публицистические, научные (лепидоптерологические); письма и шахматные задачи, – а также переводы (в ряде случаев – множественные), выполненные при личном участии В.В. Набокова, его сына Д.В. Набокова, исповедовавшего переводческие принципы отца, или без их участия, и оригиналы переведенных текстов русской классики (преимущественно поэтических). Хронологические границы корпуса – 1918–1977 гг.
Осуществлена метаразметка означенного корпуса – таким образом, он пригоден для реализации разнообразных задач, описываемых в работах по языковым корпусам.
Продолжена разработка параллельного корпуса текстов В.В. Набокова, проспект которого был заявлен ранее.
По ряду произведений проведены тестовые исследования частотности лексики с помощью веб-приложения с открытым исходным кодом для анализа текста Voyant Tools . Цель – уточнить представления об идеологических параметрах произведений с ориентацией на практику М.Ю. Мухина.
Для решения дальнейших поставленных задач, связанных с максимально полным описанием языковой личности В.В. Набокова , обновлён корпус его окказиональных слов. В настоящий момент в словаре всего 223 окказиональных единицы, в том числе 178 – русских (из них 16 – не собственно набоковских) и 45 английских. Имея в виду потенциального читателя словаря (в том числе читателя-переводчика), которому может быть интересен русский (или, при переводе с русского, соответственно, английский) перевод окказионализма, мы сочли возможным включить в словарь переводческие окказионализмы.
Определены принципы выборки (сплошная выборка с опорой на тренированную интроспекцию профессионального читателя-лингвиста с учетом фактора кодификации); исключены ошибочно включенные в словарь единицы. Определены факторы, осложняющие выборку; разработана структура словарной статьи, куда включена не только собственно лексико-грамматическая информация, но и данные о реализуемых в художественных текстах лексических функциях.
Обобщены материалы по теории окказионализма: от начального периода исследования окказионального слова в СССР до теории билингвизма в части способов передачи окказионального слова.
Продолжена разработка и обоснование, в противовес традиционному концепту билингвизма, теории транслингвальной языковой личности, в том числе в части уточнения понятий переключения кодов, билингвемы и транслингвемы.
С целью моделирования языковой личности Набокова как мультилигвального феномена и обнаружения подходов к описанию сферы функционирования одного из «малых» языков Набокова – итальянского, а также внедрения в практику сопоставительного корпусного набоковедения итальянских переводов его произведений частично осуществлен подбор текстов для составления и анализа параллельного русско-итальянского набоковского корпуса; проанализирован состав итальянского корпуса НКРЯ и отдельные теоретические проблемы би- и мультилингвизма («плюрилингвизма») на Западе.
Продолжен сбор материалов для словаря набоковских прецедентных феноменов.

3. Исследование и электронное представление метрики и строфики Набокова

В 2020 г. составлена электронная картотека по метрике и строфике русскоязычных текстов, включенных в семь авторских прижизненных сборников Набокова: «Стихи» (1916), «Два пути» (1918), «Гроздь» (1923), «Горний путь» (1923), «Возвращение Чорба. Рассказы и стихи» (1930), «Стихотворения 1929–1951» (1952), «Poems and Problems» (1970).
Описание выполнено на основе современного комментированного издания поэзии Набокова. В общей сложности учтено 322 произведения. По охвату материала проведенное исследование не имеет прямых аналогов: прижизненные поэтические книги Набокова впервые рассмотрены последовательно и без исключений.
Исследование творчества Набокова выполнено в соответствии с инструкцией по описанию метрики и строфики русских поэтов, подготовленной участниками стиховедческого семинара СПбГУ).
Электронная картотека по метрике и строфике Набокова создана с помощью разработанного в СПбГУ программного инструментария для хранения, систематизации и обработки материалов по метрико-строфическому репертуару русской поэзии XVIII–XXI вв.
Для каждого из 322 произведений составлен максимально полный «стиховедческий паспорт»: а) карточка произведения, б) карточка текста (или каждого из нескольких текстов, если речь идет о полиметрических композициях), в) карточка каждого стиха, составляющего тексты.
Карточка произведения содержит следующую информацию: автор; название; годы написания и публикации; название сборника Набокова, в который включено стихотворение; оригинальное произведение или переводное; композиция (определяется принадлежность произведений к монометрическим (МК) или полиметрическим (ПК)); издание и страница, на которой напечатано произведение.
Термин «текст» использован в ходе исследования в следующем значении: текстом считается любое монометрическое произведение и любое звено полиметрического произведения; все монометрические произведения состоят из одного текста, все полиметрические композиции — из двух и более. В карточке текста указаны следующие параметры: название произведения, в который входит текст; его номер в произведении; первая строка; количество ритмических стихов; количество графических стихов; литературный род; стихотворный размер и его разновидность (для разноиктных и вольных размеров); наличие отступлений от основного размера; наличие рифмы; строфическая форма; строфическая схема (для текстов строфической и промежуточной формы).
В карточку стиха введен следующий набор характеристик: стихотворный размер; клаузула; цезура; наличие / отсутствие рифмы.
Все введенные параметры объединены в иерархическую систему, которая позволяет осуществлять поиск текстов Набокова по любому из параметров, переходить от формальных характеристик к текстам стихотворений (база данных содержит тексты всех учтенных поэтических произведений Набокова), получать характеристики для заданного произведения, текста и стиха.
Созданная электронная картотека является фундаментом для автоматического построения интерактивных статистических таблиц по метрическому, строфическому, клаузульному репертуарам русскоязычной поэзии Набокова и — далее — для подготовки первого полного метрико-строфического справочника к его произведениям.
В результате предварительного анализа полученных данных по набоковским поэтическим книгам намечены перспективы многоаспектного комплексного описания стиховой системы Набокова в контексте русского стиха ХХ в.
Использование современной терминологии и принципов стиховедческого анализа дало возможность получить максимально полный и дифференцированный перечень метрико-строфических форм Набокова. В ходе исследования были выявлены не отмеченные прежде примеры использования вольного ямба: «Береза в Воронцовском парке», «Два корабля»; определен круг стихотворений, содержащих отступления от основного размера (переходных метрических форм): «Весна», «Озеро», «Каким бы полотном» и др.; уточнен репертуар неклассических размеров Набоков, что позволило полностью отказаться от неопределенной характеристики форм как «Прочих», то есть не поддающихся однозначной квалификации; и др.
Значимость полученных данных определяется и их необходимостью для описания эволюции творчества Набокова-поэта. В составленной базе данных каждое произведение охарактеризовано не только по принадлежности к тому или иному сборнику Набокова, но и по году написания. Использование этих параметров позволяет четко отграничить исследование эволюции метрики и строфики от сборника к сборнику, с одной стороны, от описания реальной эволюции метрико-строфического репертуара Набокова — с другой, и тем самым уточнить концепцию развития набоковского стиха. В частности, полученные в ходе выполнения проекта данные по трехсложным размерам позволяют скорректировать тезис о возрастании доли трехсложных размеров в позднем творчестве Набокова. Статистика размеров по сборникам эту тенденцию не отражает: максимум экспериментов с трехсложниками приходится на первую книгу — «Стихи» (1916 г.). Полученная статистика также уточняет концепцию стиха Набокова, подразумевающую особую роль анапеста; результаты проведенного исследования, позволяют заключить, что в прижизненных сборниках приоритеты расставлялись Набоковым иначе: амфибрахий преобладал над анапестом.
Использование строго определенных выверенных принципов описания форм стиха позволяет корректно сопоставлять полученные данные по поэзии Набокова с данными по русскому стиху XIX–XX вв. Сравнительным материалом в данном случае могут выступать аналогичные электронные базы данных по творчеству русских поэтов, подготовленные в СПбГУ, — авторов метрополии, а также западной и восточной ветвей русской эмиграции. В рамках выполнения проекта были уточнены и дополнены базы данных по поэзии русских эмигрантов: Г. В. Адамовича, М. И. Лопатто, М. Г. Визи, Л. Н. Андерсен, Н. А. Щеголева.
Сопоставительный анализ репрезентативной статистики позволит на следующих этапах выполнения проекта выявить специфику стиха русскоязычной поэзии Набокова, а также получить новые данные по истории русского стиха и, в частности, стиха русских поэтов-эмигрантов.
Выполненное в рамках настоящего проекта описание ритмики 4-стопного ямба Набокова является попыткой апробации современных методов описания стиха, включая корреляционный анализ , позволяющих обратиться от активно обсуждаемой проблемы «метр и смысл», где стараниями преимущественно отечественных стиховедов сделано уже немало, к более актуальной для поэзии XX в. проблеме «ритм и смысл». В этом отношении материал набоковских текстов, написанных 4-стопным ямбом, представлялся показательным Для этого был произведен пересчет ритмических форм и их комбинаций «длинных»текстов, учитывающий также интонационную структуру стиха: «Петербург» (1921), «Университетская поэма» (1927), «Калмбруд» (1931), стихи Ф. Годунова-Чердынцева из романа «Дар» (1938), послание «К кн. С. М. Качурину». Последовательность их рассмотрения обнаруживает кардинальные трансформации ритмической структуры от текста к тексту, обусловленные не столько постепенным становлением своего «поэтического голоса», сколько общим замыслом, диктующим использование определенного репертуара ритмических форм и «фигур».
Не случайно ностальгический «Петербург», стилистически наиболее близкий пушкинской манере, переполненный реминисценциями из его текстов, ритмически строится в нехарактерной Пушкину форме. «Университетская поэма», напротив, насыщена теми «ритмическими фигурами», которые А. Белый перечислял в качестве отличительных черт ритмики пушкинского стиха («малый угол», «малый угол в соединении и крышей», «квадрат», «параллелограмм» и др.). Тем самым заглавие поэмы обретает второй смысл: это не только воспоминания о студенческих годах, проведенных в Кембридже, но и серьезный опыт сознательной работы с комбинациями ритмических форм, который будет реализован в «Даре», однако уже не с ориентацией на Пушкина.
Предпринятый анализ позволяет выдвинуть гипотезу о том, что у поэтов XX века лексическая и ритмическая цитация способны находиться в конфликтных отношениях, не только и не столько отсылая к претексту, сколько вступая в активную полемику с ним. «Наполнение» хрестоматийно известной формы (не только метрической и строфической, но и ритмической) новым материалом перестает быть исключительно прерогативой таких жанров, как пародия и перепев, для которых подобного рода конфликт на протяжении XVIII–XIX вв. был нормой.

4. Ритмика прозы поэта. Квантитативный анализ

В рамках проекта осуществлялось изучение ритмики прозы поэта, прежде всего, В. В. Набокова с помощью современных компьютерных методов анализа текста. Начат анализ влияние стихотворного опыта на прозу Набокова в сравнении с прозой А. С. Пушкина. Составлялись ритмические словари прозы этих авторов, учитывался иноязычный опыт В. Набокова. Проводилось построение речевых и языковых моделей 4-стопного ямба. Исследовалась ритмика случайных четырехстопных ямбов в прозе Пушкина и Набокова.
В классических стиховедческих исследованиях основе прозаических данных была рассчитана модель «естественного» стиха, в основе которой было две гипотезы – гипотеза о независимости и гипотеза об однородности распределения ритмических слов на разных участках текста. Согласно гипотезе о независимости, появление каждого последующего ритмического слова не зависит от выбора предыдущего. Согласно гипотезе об однородности, вероятность появления одних и тех же ритмических слов одинакова для разных текстов. Иными словами, распределение ритмических слов согласно вероятностной модели говорит о том, что поэт пишет стих так, как прозаик – прозу.
В качестве размера, наиболее приближенного к ритмике естественного языка, был взят четырехстопный ямб, который имеет несколько конфигураций:
1. U–ˊ U–ˊ U–ˊ U–ˊ она дала ему три карты
2. U– U–ˊ U–ˊ U–ˊ но сохраняла все привычки
3. U–ˊ U– U–ˊ U–ˊ и снова занялась работой
4. U–ˊ U–ˊ U– U–ˊ в её передней и девичей
5. U– U– U–ˊ U–ˊ не удовлетворить его
6. U– U–ˊ U– U–ˊ и приготовился метать
7. U–ˊ U– U– U–ˊ прищурилась и усмехнулась
8. U– U– U– U–ˊ и не из-за неурожая
В качестве минимальных отрезков для построения модели брались случайные ямбы. После расчета вероятностной модели оказалось, что ритмика случайных ямбов, взятых из прозаических произведений, близка в своих показателях к вероятностной модели, хотя у разных авторов наблюдались определенные отклонения, в связи с чем группа исследователей пришла к выводу, что полная независимость и полная однородность могут рассматриваться лишь как свойства нейтрального эталона.
Показатели вероятностной модели совпадают с показателями случайных ямбов во втором и четвертом икте (четвертый икт всегда ударен). Небольшое отклонение показателей случайных ямбов наблюдается на третьем икте, и еще чуть большее отклонение – на первом икте, однако, в целом ритмика случайных четырехстопных ямбов близка к показателям вероятностной модели, рассчитанной по ритмическому словарю прозы.
Было замечено, что у разных авторов наблюдаются отклонения в показателях случайных ямбов от вероятностной модели, языковой модели (ЯМ). Профиль ударности случайных ямбов прозаических произведений А. С. Пушкина имеет ту же тенденцию, что и профиль ударности его ранних поэм. В обоих профилях ударности третий икт – наименее ударный, между первым и вторым наблюдается небольшое расхождение, четвертый икт всегда ударный. Если мы сравним профиль ударности случайных ямбов прозы А. С. Пушкина с профилем ударности, рассчитанным по показателям вероятностной модели, то обнаружим, что профиль ударности прозы поэта имеет тенденцию к альтернации – происходит расподобление в частоте ударений случайного 4-стопного ямба (Я4) от конца к началу: частота ударений на третьем икте заметно понижается, на втором – повышается. В профилях ударности прозы «чистых» прозаиков такая тенденция, как правило, не обнаруживается. Как правило, показатели вероятностной языковой модели у «чистых» прозаиков оказываются близки показателям «случайных ямбов» или так называемой речевой модели Я4.
Анализ ритмики прозы Набокова показывает, что в целом, показатели стихоподобных фрагментов прозы оказываются близки вероятностным показателям модели и несходны со стихотворной ритмикой. Проанализированный материал обнаруживает аналогию в распределении всех ритмических форм в речевой модели и в ЯМ. При том, что ЯМ предсказывает большую частотность формы 3 и 4 и меньшую в отношении форм 6 и 7, чем в РМ. Практически аналогичная картина наблюдается и в русском тексте романа «Лолита». Только тенденция в распределении некоторых ритмических конфигураций несколько меняется, в данном случае вероятностная модель предсказывает более низкое распределение ритмических структур с одним пиррихием, 3-й и 4-й форм, чем в РМ, но при этом более высокое распределение 6-формы, с пиррихиями на первой и третьей стопах. Тем не менее, графики РМ и ЯМ и случае остаются сходными. Более глубокий анализ ритмики показал, что профили ударности ЯМ и РМ, построенные по текстам “Защиты Лужина” и русского текста «Лолиты» обнаруживают сходство.
Сходство профилей речевой и вероятностной моделей и отсутствие каких-либо возмущающих (стиховых) тенденций в ритмике РМ говорит о том, что проза Набокова, по-видимому, в отличие от пушкинской прозы не испытывала влияния стиха. Анализ ритмических параметров русскоязычной прозы этого автора позволяет сказать, что Набоков проявляет себя в большей степени как «чистый» прозаик, нежели как поэт, пишущий прозу. В целом, РМ и ЯМ в обоих текстах оказываются достаточно близки, несмотря на небольшие отклонения; значит, просодика текстов строится непосредственно в соответствие с языковыми предпосылками.
Анализ англоязычной прозы, а именно оригинального текста «Лолиты» обнаруживает также близость языковым предпосылкам, только, соответственно, английского языка, см. рис.7.
В целом, очевидно, что ритмика английской прозы Набокова заметно отличается от русской. РМ и ЯМ предсказывают большее число первой, полноударной формы ямба, как раз такое количество, которое встречается в реальном английском стихе (около 30%). В данном случае едва ли можно говорить о влиянии стиха. Скорее наоборот, такой относительно высокий процент полноударных ямбов складывается в результате языковых предпосылок. Любопытно, что и в русском стихе обнаруживается такой же высокий процент «чистых» Я4, но он не выводится из языка.
В целом английская речевая модель оказывается более «ударной», чем языковая. Это может быть следствие стиховой тенденции, однако отличие сравнительно небольшое и характеры профилей ударности РМ и ЯМ идентичны. Аналогичная картина наблюдалась и при сравнении ЯМ и РМ русской прозы автора.
Таким образом, проведенный анализ образцов русскоязычной и англоязычной прозы Набокова позволяет предполагать независимость ритмики его прозы от стихотворного опыта. Что, в принципе, достаточно необычно для прозы поэта – и является, очевидно, исключением. В дальнейшем предусмотрено испытание этой гипотезы на более широком материале, с привлечение данных по русскому и английскому стиху.

5. Компьютерное исследование звуковой организации поэзии Набокова

В отчетный период было проведенодальнейшее совершенствование и новое испытание полнофункциональной компьютерной программы автоматического выявления звуковых повторов и измерения звуковой связности текста – веб-сервиса «Фонотекст», доступного по адресу http://phonotext.syllabica.com.
Создание этой программы стало возможным благодаря реализации алгоритмов анализа текста, созданных на базе силлабоцентрической концепции звуковой организации текста. Программа впервые дала возможность многослойного автоматического анализа большого корпуса поэтических, прозаических, рекламных и прочих текстов, а также отдельных фраз и словосочетаний, с точки зрения формы и распределения звуковых связок, и на основе автоматического анализа и формализации его результатов обеспечила визуально представляемое многоаспектное измерение звуковой связности текста на русском и английском языках. Проект, реализованный на основе оригинальной силлабоцентрической концепции звуковой организации текста, не имеет аналогов в мире.
Благодаря программе «Фонотекст» феномен звуковых повторов, общепризнанность которых в качестве организующего средства текста до сих пор опиралась на авторитет и интуицию поэтов, ученых, носителей языка, впервые стал предметом точного, объективного научного анализа, позволив доказать функциональную значимость звуковых повторов в текстах различного рода: звуковые переклички и уподобления в речи не являются пассивным фактором фразо- и тектообразования, а в некоторых типах речи (поэтический дискурс, реклама, фольклорная и книжная паремиология и некот. др.) могут иметь решающее значение как средство обеспечения эстетического, суггестивного и прочих видов воздействия.
В соответствии с задачами проекта решена задача проведения сопоставительного исследования поэзии Владимира Набокова и Осипа Мандельштама с целью выявить существенные черты их индивидуальных стилей на уровне звуковой композиции текста. Для анализа и сопоставления выбирались тексты, примерно соотносимые по объёму – количеству символов, независимо от периода их создания и жанровых характеристик. Программную обработку прошли два корпуса текстов по 30 стихотворений в каждом.
Исследовано строение фоносиллабемы в звуковой структуре стихотворений Набокова и Мандельштама с точки зрения степени ее консолидированности (структурной целостности). Стремление поэта к поддержанию целостности, консолидированности фоносиллабемы рассмотрено как свидетельство его заботы об установлении особой поэтической морфологии текста. Раздробленность фоносиллабемы в большей степени свидетельствует об установке на эвфоническое скрепление синтагмы, а также на прямую лексикализацию повтора. Безусловно, в каждом конкретном случае эти тенденции могут переплетаться: Сутулится на стуле / бесПАЛое ПАЛьто ... // в хрустальнейшем застое, / в отличнейшем Ничто, / а в комнате пустое / сутулится ПАЛьто (Набоков, Формула). Однако количественное преобладание консолидированных фоносиллабов будет указывать на первую тенденцию идиостиля, а преобладание разорванных — на вторую.
Наиболее значимые цифры получены при сравнении произведений двух поэтов по общей силе повторов (она складывается из силы всех выделяемых в тексте фоносиллабов). Обнаружено, что у Мандельштама важнейшую роль играют высоко консолидированные звуковые повторы. Показано, что в звуковой технике Мандельштама контрастно сосуществуют каскадный принцип, обеспечивающий доминантность основного звукового лейтмотива, и принцип уравновешивания нескольких фоносиллабических цепей по их ассоциативной силе, благодаря которому устанавливается взаимодействие фоносиллабем-морфем в составе параморфонологии стиха. Полученные данные доказывают особую функциональной нагруженность параморфологии текста в идиостиле Мандельштама, тенденцию к системной семантизации фоносиллабемы, где она выступает конструктивно базовым элементом произведения.
Звуковая техника Набокова, в свою очередь, реализует существенно дистанцированную от мандельштамовской установку на эвфоничность, благозвучие, которое создается балансом, растеканием созвучий по тексту, на фоне которого сильно выделенные по АС сегменты – скорее парономастические всплески, в частности образующие figura etymologica, моменты выхода поэтического сознания в область языковой игры, остроумия.

6. Исследование количественной поэтической грамматики Набокова

Исследовательский метод определения слоговых долей основных морфологических классов (в поэтических текстах) был предложен сравнительно недавно. На первом этапе углубленного исследования количественной грамматики поэтических текстов Набокова и совершенствования аппарата количественной грамматики поэтического текста ставилась задача предварительного взаимного тестирования подхода и материала: какие новые задачи поставят перед исследовательской моделью поэтические тексты Набокова и какими предстанут они сами, подвергнутые анализу по слоговым долям основных морфологических классов.
Основная цель модели — за более дробной картиной традиционно выделяемых частей речи обнаружить возможность более устойчивых, воспроизводимых морфологических соотношений. При таком подходе количество текстов, относимых к области отклонений или исключений, должно существенно уменьшится, а многие расхождения могут быть описаны как вторичные расхождения в рамках более общих устойчивых соотношений. Этому способствуют два основных принципа: а) подсчет по основным морфологическим классам, или укрупненным частям речи; б) подсчет не по количеству вхождений, а по материальному объему, причем мерой измерения материального объема выбраны слоги (что достаточно удобно и логично для поэтической речи). Прототипами первых трех морфологических классов выступили «главные части речи», как они обычно рассматриваются в лингвистической поэтике (и что не противоречит собственно лингвистическому подходу): имя существительное, глагол и имя прилагательное; еще один возможный участник клуба «главных частей речи», наречие, на основании многократно подтверждавшихся эмпирических наблюдений включен в тот же класс, что и имя прилагательное (стоит подчеркнуть, что речь идет о русском языке. В языках с другим грамматическим слоем возможны другие членения морфологи). Таким образом, в класс S (субстантивы) зачисляются все имена существительные и все субстантивные местоимения, в класс V (глаголы) — все личные формы глагола, инфинитивы, деепричастия и страдательные причастия в предикативной функции, в класс A (атрибутивы и адвербы) — все прилагательные, адъективные местоимения, причастия, кроме страдательных в предикативной функции, и наречия; кроме того, выделяется остаточный класс X, фактически состоящий только из служебных частей речи. В модели существуют способы решения спорных случаев (мера которых в принципе невелика; в частности, приняты принципы по возможности буквального понимания частеречной принадлежности слов и поэлементного, аналитического рассмотрения разного рода сращений). Соотношения внутри классов (сущестивительные и субстантивные местоимения, личные формы глаголов и инфинитивы, прилагательные и наречия и др.) трактуются как вторичные. Отклонениями и исключениями считаются тексты, в которых в значительной степени нарушены базовые стандарты соотношения долей четырех классов.
Для углубленного исследования была взята поздняя (зрелая) лирика Набокова. Проанализированы стихотворения: Как я люблю тебя (1934), Что за ночь с памятью случилось (1938), Поэты (1939), К России (1939), Слава (1942), К кн. С. М. Качурину (1947), Неправильные ямбы (1953), «Какое б счастье или горе...» (1950-е), Какое сделал я дурное дело (1959), С серого севера (1967). Доли классов S, V, A, X по корпусу составили соответственно 40,2%, 17,2%, 30,5%, 12,1%, усредненные данные по всем текстам корпуса — 40,8%, 17,45%, 28,15%, 13,6%. Совпадение результатов при двух разных принципах подсчета косвенно свидетельствует об однородности материала.
Соответствующие данные при подсчете по 100 русским стихотворениям XVIII-XX веков - 41,7%, 21,9%, 27%, 9,4. Таким образом, можно заметить, что суммирующие данные по поздней поэзии Набокова почти не отличаются от суммирующих данных по русской поэтической традиции в целом; явное большинство стихотворений укладываются в общую модель: доля субстантивов от 40% до 45% в 80% текстов, доля глаголов от 14% до 19% в 70% текстов, доля А-слов от 25% до 31% в 80% текстов. Два наиболее объемных текста - «Слава» (1508 слогов) и «К кн. С. М. Качурину» (714 слогов) дают данные, наиболее близкие средним подсчетам по обсуждаемым параметрам; они также наиболее близки между собой. В предварительных подсчетах очень близкие результаты давали все сколько-нибудь пространные тексты, включенные в подсчет. Отклонения от общего стандарта в целом носят мягкий характер, однако существуют и должны быть отмечены. Это, во-первых, последовательно меньшая, чем по явно преобладающему массиву подсчетов, доля глаголов у позднего Набокова-поэта; во-вторых, это несколько бОльшая, чем ожидалось бы, доля служебных слов.
Таким образом, модель подтверждает свой накопительный характер: усредненные стандарты далеко необязательно воспроизводятся на материале отдельных небольших текстов и фрагментов (здесь в значительной мере царит разнообразие: небольшое количество сильных отклонений и значительный процент мягких, частичных отклонений), но начинают воспроизводиться на уровне совсем небольших корпусов и даже пространных отдельных текстов. Действует правило большой грамматической разнородности небольших сегментов текста и существенно большей грамматической однородности пространных сегментов.
Таким образом, данный подход работает и на поздних поэтических текстах Набокова, причем весьма надежно. Можно было бы сказать, что он успешно проходит испытания, а можно, что на этот раз его не удалось фальсифицировать.
Что же касается самих текстов Набокова, то модель скорее подтверждает их грамматическую узуальность, «классичность» или стандартность. Полученные данные по Набокову ставят задачу сопоставления по обозначенным параметрам близких либо, наоборот, контрастных идиостилей. Для этого может оказаться достаточным использование на первом этапе сравнительно небольших корпусов, поскольку, как показывает практика, основные закономерности выявляются уже на сравнительно небольшом по объему материале и в дальнейшем только подтверждаются. Таким образом, можно на первых, не самых трудоемких, замерах вести поиск более интригующих отклонений и расхождений, чем те, которые пока обнаружены.
В отличие от подсчета по основным морфологическим классам, слабо выявляющего эволюцию (диахронию) поэтической грамматики или расхождения групповых манер и идиостилей (он нацелен на описание как можно более устойчивых и общих грамматических закономерностей), подсчет по соотношениям личных форм глагола в поэтических текстах нацелен на выявление диахронии и стилевых расхождений. С методом анализа по укрупненным частям речи он делит особенность, присущую едва ли не всем частным подходам в области количественной грамматики поэтического текста: возможность существенного разброса данных при замерах на малых сегментах текста и существенно более унифицированные данные по значительным корпусам.
Предварительные исследования выявили два наиболее резких известных пока сдвига в количественной грамматике личных форм глагола на двух разных этапах развития поэтической традиции: 1) переход от «одического» стандарта XVIII века (~50% презенса, 20-25% претерита) к «романтическому» (характерному для поэтов эпохи романтизма, вне зависимости от подробностей отношений к романтизму) стандарту, подразумевающему, что претерита на несколько процентов больше, чем презенса, а доля того и другого равна 40±3-4%; 2) переход от поздних стадий этой «романтической» модели к очень резкому возвращению полного господства презенса (более 50%) в поэзии И. А. Бродского и, возможно, некоторых других близких ему поэтов. Данные по будущему времени, повелительному и сослагательному наклонению пока не обнаруживают таких резких переходов, хотя им, безусловно, свойственна своя динамика.
Второй процесс, имеющий отношение к середине XX века, затрагивает и Набокова-поэта.
В отличие от некоторых других процессов эволюции количественных соотношений в поэтической грамматике, которые касаются конфигураций, определяемых автоматически с большим трудом, если вообще определяемых (по крайней мере, пока), автоматический подсчет по соотношению форм настоящего и прошедшего времени возможен с использованием Национального корпуса русского языка и его инструментов.
Поиск по НКРЯ не различает прошедшее время и сослагательное наклонение. Это необходимо учитывать: «данные по прошедшему времени» при обращении к НКРЯ всегда фактически означают «данные по прошедшему времени + сослагательному наклонению». По данным ручных подсчетов по поэтам XIX-XX веков, доля сослагательного наклонения среди личных форм глагола почти всегда равна 2-4%, в классе же форм «прошедшее время изъявительного наклонения + сослагательное наклонение» доля форм сослагательного обычно равна 5-8%; так что если поиск по НКРЯ указывает соотношение форм около 50/50, на самом деле оно, вероятно, равно ~ 52/48 в пользу презенса.
Другие погрешности автоматического поиска форм настоящего и прошедшего времени по НКРЯ (вызванные, например, омонимией форм прошедшего времени и форм имен существительных с суффиксом или последним формантом основы -л-), по-видимому, не имеет серьезного значения.
Для Набокова-поэта НКРЯ выдает следующие данные: соотношение прошедшего, настоящего и будущего времени 3028 — 3217 — 1119 по всему подкорпусу; бросается в глаза редкая однородность показателей по раннему периоду: для стихотворений по 1920 годдоли времен равны 42,25%-43,25%-14,5%, а для стихотворений 1921-26 годов — 41,7%-42,8-15,5%. Они и в дальнейшем сдвинутся незначительно: 39%-45%-16% для 1927-50 (сумма 1603) и 37,5%-56%-6,5% для стихотворений, начиная с 1951. Для последнего периода данных явно мало, чтобы делать решительные выводы, но сдвиг в сторону большего доминирования настоящего все-таки проявляется. Это любопытно, поскольку оказывается, что Набоков зрелых лет хотя бы отчасти участвуют в новом обращении русской лирики к господству презенса.
Общее соотношение претерита и презенса у Набокова равно 48,5% к 51,5%, и это похоже на близкого ему Ходасевича (44/56) и на чуждого Адамовича (45/55), которые в этом отношении близки между собой, у Елагина и Чиннова, которых много в НКРЯ, соотвественно 44/56 и 50/50.
Новые замеры позволяют обнаружить еще один процесс: к реформе Бродского русская поэзия подходит с «отказным движением», усиливая долю претерита (перед резким взлетом доли презенса). У поэтов 1916-45 годов рождения (не считая Бродского) доля претерита сильно возрастает. Становится ясно: то, что ранее воспринималось как сплошная эпоха романтического преобладания прошедшего времени, в принципе неоднородно: посередине этого периода — вероятно, в творчестве старших модернистов и их современников — произошел новый (относительно мягкий) переход к господству презенса, а затем, в поэзии середины века, вновь к претериту. Этот во всех отношениях захватывающий процесс только предстоит расследовать во всех подробностях. Возможности автоматического поиска по НКРЯ, несмотря на указанные очевидные недостатки, должны быть использованы.

7. Поэтический стиль Набокова в динамике: квантитативное исследование грамматики и лексики ранних стихотворений

В рамках работы по проекту в 2020 году проведен пилотный количественный анализ одного из наиболее известных сборников стихотворений В.В. Набокова «Горний путь» с точки зрения внутренней динамики текста.
Материалом стали стихотворные тексты, вошедшие в сборник поэта Горний путь и имеющие объем не менее 30 строк. Введение нижней границы объема текстов стало необходимо для обеспечения достоверности получаемых результатов. В дальнейшем, по мере уточнения модели стиля, станет возможным сопоставление полученных распределений признаков с аналогичным распределением в коротких стихотворениях. К анализу, таким образом, привлекаются следующие произведения: Два корабля, Лестница, Поэт, «Феина дочь утонула в росинке…», M. W., Престолы, Силы, Велосипедист, Перо, Русь, «Звени, мой верный стих, витай, воспоминанье…», Детство, Крым, Сон на акрополе, Лес.
Методика основана на учете соотношений и порядка следования в тексте основных знаменательных частей речи – существительных, глаголов (включая причастия и деепричастия) и прилагательных (в их число включались порядковые числительные). Нужно заметить, что в этом исследовании применялся иной принцип, чем в квантитативных поэтико-грамматических исследованиях, результаты которых излагаются в разделе 6. Это объясняется как необходимостью более простой классификации морфологических классов, чем предлагается в модели исследования по укрупненным частям речи, так и отсутствием необходимости рассматривать грамматическое наполнение текста тотально (а анализ по основным морфологическим классам нацелен на тотальность). Сопоставление проводилось с помощью u-критерия, успешно примененного для подобных задач.
Как свидетельствуют полученные данные, из потенциальных 30 отклонений (15 стихотворений, для каждого глагольное и адъективное отклонение) от ожидаемых величин имеют место 13 (шесть для глаголов и семь для прилагательных). При этом за исключением одного случая речь идет об увеличении глагольности (пять из шести отклонений от ожидаемых соотношений) и адъективности (все случаи отклонения). Для поэта, таким образом, характерно стремление усилить как динамическое (глагольное), так и статическое (адъективное) описание. В произведениях «Феина дочь утонула в росинке…» и «Русь» эти тенденции сочетаются.
Однако помимо общего количества имеет значение ее распределение в тексте. Этот аспект был рассмотрен на следующем этапе исследования, когда проводился анализ распределения глагольной / адъективной лексики в тексте. Для каждого произведения были рассчитаны суммы с нарастающим итогом – количество исследуемых частей речи до каждого следующего существительного.
Указанная последовательность может быть аппроксимирована степенной функцией: f = axb, где x – значения номеров существительных, а переменная b рассчитывается так, чтобы функция принимала значения, максимально возможно близкие соответствующим значениям нарастающей суммы. Значение b отражает увеличение либо падение глагольности от начала к концу текста: если b > 1 то глагольность возрастает, если b < 1, то глагольность падает, а при b = 1 глагольная лексика распределена по тексту равномерно. Аналогичным образом
В итоге значения коэффициентов детерминации оказываются очень высоки, доходя во многих случаях до единицы, т.е. рассчитанные на основании коэффициентов значения в высшей степени точно соответствуют фактически наблюдаемым.
Сам по себе тот факт, что нарастание числа слов двух ведущих частей речи настолько точно описывается несложной математической функцией, уже является достаточно неожиданным, тем более, что речь идет о стихотворном тексте. Внимание привлекает также то, что одной и той же функцией описывается внутренняя частеречная динамика и в текстах длиной чуть более 30 строк (Два корабля, Лестница, Поэт и др.), и в текстах, чья длина превышает 100 строк – Детство («При звуках, некогда подслушанных минувшим…»), Крым («Назло неистовым тревогам…»).
Для стиля Набокова, отраженного в сборнике «Горний путь», характерно равномерное распределение глаголов и прилагательных в тексте. Интересно, что в ряде случаев наблюдается связь между содержанием и динамикой глагольности/адъективности. Так, в стихотворении «Велосипедист» глагольность резко растет к концу текста. При этом доля глагольной лексики в стихотворении, посвященном описанию быстрой езды на велосипеде не превышает ожидаемых для стихотворной речи значений, речь идет именно о ее перераспределении: статичное начало – динамичный (глагольный) конец. Другим произведением, выделяющимся из общего числа, является «M. W.», в котором нарастание имеет место не только для глаголов (число которых выше ожидаемого уровня), сколько для прилагательных без статистически значимого увеличения их общего числа в тексте.

8. Компьютерная лексикография: на На подступах к «Словарю цветообозначений в лирике Владимира Набокова»

Цветообозначения – один из любимых объектов исследователей творчества Владимира Набокова. Палитра его художественного мира рассматривается как попутно, так и целенаправленно, «к слову» или «прежде всего», лингвистами и литературоведами, философами и филологами. Однако выводы о цветовых предпочтениях в разных произведениях отличаются. Одни называют доминантными цветами белый, черный и красный (в разных иерархических порядках перечисления), другие говорят о доминировании фиолетового и/или лилового. Подобная разноголосица мнений и несовпадения в подсчетах – даже при сплошной выборке и добросовестных подсчетах – объясняется отсутствием единого подхода и общепринятой классификации цвета как феномена. Специально составленный «Словарь цветообзначений лирики В. Набокова» (далее – Словарь), послужит надежной базой для восполнения этого пробела в современном набокововедении.
Рубрикация цветов извлечена из автобиографических текстов самого Набокова.
В Словарь были включены метафорические цветообозначения, как узуальные (изумрудный, малиновый, свинцовый, румяный и т.п.), так и окказиональные (фламинговый=розовый).
Набоковские цветометафорические наименования относятся в большинстве своем к следующим тематическим группам: «Материал» (каучуковый, фланелевый, латуневый, жестяной, вулканизированная резина, запачканный складчатый лоскут, стальной, золотистый, медь, жемчуг, розовый кварц и др.); «Еда и напитки» (горький шоколад, вермишель, смоленская каша, миндальное молоко, сухая булка, шведский хлеб, спиртное и др.); «Растительность» (ольховый, черничный, незрелое яблоко, фисташковый, фиалковый и др.); «Атмосферные условия» (грозовая туча); «Одежда и ее части» (коричнево-желтый шнурок от ботинка). Часть подобных наименований, не атрибутированных с точки зрения цвета вынесена в добавочную таблицу. Отдельно представлена и группа цветов, обозначающих масть животного (за исключением «вороного» как однозначно «черного»).
В графе «Цветообозначения в минимальном поэтическом контексте» минимальный контекст какого-то одного цветообозначения неизбежно в ряде случаев включает и другие колоративы. В таком случае фраза будет повторяться в характеристике каждого из встретившихся колоративов.
Вместе с тем даже этот факт свидетельствует о соседстве, в том числе устойчивом, повторяющемся в разных текстах, определенных колоративов, выявляя тем самым повторяющиеся у Набокова цветовые сочетания. Выявление таких устойчивый соседств, а также лексических комбинаций с одним и тем же колоративом – следующий этап исследования, который будет осуществляться с помощью оригинального программного комплекса «Гипертекстовый поиск слов-спутников в авторских текстах».
Цветовые наименования извлекались методом сплошной выборки из поэтических сборников «Гроздь» (1922) и «Горний путь» (1923), из сборника рассказов и стихов «Возвращение Чорба» (1929), сборника «Poems and Problems» (1970) и раздела «Стихотворения, не входившие в прижизненные сборники».
Например, в группе Ахроматических цветов (по набоковской классификации) отмечены: Черный (85), (по)чернеть (7), траурный (7), чернота (5), бурый (3), черно- (2), вороной (1), грифельный (1), коричневый (1), траур (1), -траур (1), угольный (1). Контексты на БУРЫЙ: купол в дымке голубой, / да цепь домов веселых, хмурых, / оливковых, лимонных, бурых <…> («Петербург» Сн); И бурых подберезовиков ряд, / таких родных, пахучих, мшистых («Грибы» Сн); Расшатывая сумрак бурый / огнями, жестяным горбом, / на шинах из слоновой шкуры / гремящий прокатился дом. («Автобус» Сн). Подобным образом представлена и прочая лексика.

9. Разработка и применение электронного Живого стилистического словаря русского языка

Проект лингвистической разработки и создания электронного Живого стилистического словаря русского языка ставит своей целью дать в руки пользователю электронных устройств инструмент определения стилистической семантики русской лексики и фразеологии – автоматического получения данных о тенденциях устойчивого употреблениях слова в базовых социокультурных и эмоционально-оценочных контекстах, инструмент автоматического формирования стилистического портрета слова и устойчивого выражения на основе корпусных данных и применения методов машинного обучения.
Составленные и применяемые для выявления этих характеристик корпуса насчитывают более 40 тысяч текстов с преобладающей социокультурной и тональной спецификой. Живой стилистический словарь обеспечивает базу для целостного автоматического стилистического портретирования русской лексики и фразеологии в синхронии и в динамике ее исторического развития. Размер словаря составил более 8 млн. словоформ.
Второй сервис, разработанный коллективом проекта, - «Стилевой подсказчик» - формирует обобщенный стилевой портрет текста на основе базовых стилистических измерений, в их положительном и отрицательном проявлении. Проведенное экспертное тестирование сервиса показывает его более чем 80-процентную точность при идентификации стилевой принадлежности текста. Разработанные в процессе исследования оригинальные лингвистические модели и методики, ориентирующие при составлении корпусов на контекстуально-ролевую доминанту текста, методика стайлсетов, использованные подходы машинного обучения позволили создать общедоступный лингвистический справочник нового типа.
В 2020 году построенная модель классификации текстов была значительно дополнена использованием подходов, вдохновленных библиотекой FastText от Facebook. При этом в качестве признаков, по которым происходит классификация текстов, используются не сами слова, а наборы всех встречающихся буквенных комбинаций в слове.
Кроме всех встречающихся буквенных комбинаций, отдельно выделялись признаки начала и конца слова, т.н. префиксы и суффиксы. При анализе длины последовательностей было экспериментальным путем установлено, что наилучшее качество дает рассмотрение совокупности последовательностей символов длиной от 4 до 7 с префиксами длиной 1-3 символа и суффиксами длиной 1-4 символа. Это позволило улучшить качество модели в решении задачи классификации текстов с базовых 74% (с использованием модели с TF-IDF и 1-3граммами слов) до 88% правильных ответов.

10. Стилеметрия

Основной задачей стилеметрического компонента проекта является исследование по методу Delta кластера текстов, включающих русские и англоязычные тексты Набокова, его автопереводы и переводы некоторых близких Набокову авторов. Предполагается обследовать текстовый материал русскоязычных романов Набокова и его собственных переводов на русский язык, выявить разброс стилистических показателей по мере Delta между этими текстами и текстами ближайших современников, осуществить сопоставительный стилеметрический анализ русского и американского (англоязычного) Набокова, в частности, ранних произведений и автоперевода «Лолиты», а также подобный анализ В.В.Набокова-автора, Д.В.Набокова-переводчика текстов В.В.Набокова и В.В. и Д.В.Набоковых как совместных переводчиков В.В.Набокова.
С этой целью в 2020 голу осуществлено уточнение работы с Delta и ее возможностями применительно к новому кругу задач. В основу совершенствования метода положено его недавнее тестирование в специальных исследованиях. В рамках одного из них новый перевод «Илиады» александрийским стихом А. И. Любжина сопоставлялся с подобным переводом Е. И. Кострова и рядом соотносимых контрольных текстов. Во-первых, Delta хорошо определила тексты, принадлежащие одному автору. Во-вторых (опуская подробности), она разделила их на два больших кластера, которые оказались далекими один от другого настолько, что объединяются только на финальном шаге кластеризации. Перевод Любжина этой кластеризацией был проинтерпретирован как текст автора, пусть и использующего метр XVIII века, но говорящего на более современном языке Гнедича и Жуковского. В другом исследовании Delta отличила «Тихий Дон» от текстов Крюкова, Севского, Серафимовича, причем все части «Тихого Дона» показаны принадлежащие одному автору, и именно тому, кто написал «Донские рассказы».
Задачи исследования текстов и переводов Набокова и переводов его другими переводчиками подразумевает не столько атрибуционные (хотя в некоторых местах, таких, как совместные переводы В. В. и Н. В. Набоковых, и их тоже), сколько собственно стилеметрические ориентиры.
В 2020 определен базовый круг текстов (и возможности дальнейшего расширения этого круга), тексты возведены к состоянию, пригодному для последующей работы с ними, сделаны предварительные замеры (например, в общем виде определен частотный список, с которым будет иметь дело Delta).

11. Математическое моделирование повествования

В последние годы увеличилось число работ, анализирующих художественные тексты с использованием свойств (черт и характеристик) пространств. Как известно из математики, элементы пространства могут иметь самую разную природу. Этот факт отражается и проявляется в том числе и в работах, посвященных анализу художественного текста: различные исследователи конструируют пространства-модели из локусов, имеющих разную природу, топосов и т.п., то есть, исходя отнюдь не только из «физического», материального пространства, выстроенного писателем. После того, как пространство определено (указаны его элементы), его можно попытаться квантифицировать для того, чтобы затем применить тот или иной способ анализа его структуры.
Исследование предполагало выбор элементов художественного пространства, которые затем объединяются во множества (графы, симплексы, симплициальные комплексы) и исследуются методами соответствующего раздела математики. Поскольку, как уже было сказано, не существует строгих правил определения этих элементов, исследователи производят достаточно произвольный отбор элементов, полагая, что их выбор подкрепляется интуицией и более или менее сходной рецепцией читателей. Одна из задач заключалась в том, чтобы определить, насколько может быть стандартизирована процедура отбора элементов, и какова степень свободы исследователя при анализе того или иного «открытого» художественного произведения. Показано, как можно определить бинарные отношения между выделенными элементами художественного текста. Далее, показано, как можно определенную таким образом структуру исследовать в рамках Q-анализа. Для этого рассмотрено, как именно элементы художественного пространства могут быть соотнесены с основными элементами Q-анализа, такими, как «статический фон», «p-циклы» и т.п. Предварительно рассмотрено, как может быть описана динамика художественного текста на языке Q-анализа. Предложенные подходы иллюстрируются на примере романа Владимира Набокова «Отчаяние». В построенных симплициальных комплексах персонажи романа соответствуют узлам симплексов. Это, среди прочего, позволяет оценить «сложность» персонажей. Наиболее простые, «одномерные» из них – Лида и Орловиус, принадлежат лишь двум симплексам, определяемым топосами «Лжи» и «Эроса» в случае Лиды и «Выгоды» и «Закона» в случае Орловиуса. Полный симплициальный комплекс как результат тщательной проработки всех или большинства топосов, персонажного и композиционного уровней произведения представит полную и многомерную картину.

12. Работа с программой T-LAB

T-LAB - это компьютерная программа итальянского производителя, включающая набор лингвистических, статистических и графических инструментов для различных видов анализа текстов (контент-анализ, анализ тональности, семантический анализ, тематический анализ, интеллектуальный анализ текста, карта восприятия, анализ дискурса, сетевой анализ).
Импортируемый в программу корпус может быть представлен как отдельным текстом, так и совокупностью текстов. Последняя опция представляется наиболее перспективной для проведения сопоставительного исследования переводов, выполненных на романских (французский и испанский языки) и германских языках (немецкий). В настоящий момент программа поддерживает автоматическую лемматизацию вокабул на основных европейских языках и стемминг на некоторых других. Для одновременного использования различных интегрированных в программу инструментов размер загружаемого анализируемого файла (=корпуса) не должен превышать 90 MБ, т.е. приблизительно 55000 страниц в формате txt. Все вышесказанное позволяет заключить, что программа T-LAB по своим функциональным характеристикам представляется оптимальной компьютерной программой для автоматического анализа текста/ов в различных исследовательских парадигмах, позволяя объективизировать результаты сопоставления оригинального и переводных текстов.
Исходной точкой анализа является корпус текстов, складывающийся вокруг фигуры В.В.Набокова в контексте мирового историко-литературного процесса: с одной стороны, исследуется английский текст «Lectures on Literature» (1980) и его переводы на русский (Лекции по зарубежной литературе / Пер. с англ.; предисловие А.Битова. Москва: Независимая газета, 1998), французский (Littératures I: Austen, Dickens, Flaubert, Stevenson, Proust, Kafka, Joyce / avec une introduction de John Updike. Paris: Fayard, 1983), немецкий (Die Kunst des Lesens: Meisterwerke der europäischen Literatur / mit e. Vorw. von John Updike. Frf. am Main: S. Fischer, 1982) и испанский (Curso de literatura europea / Con un prefacio por John Updike. Barcelona/Madrid: B de Bolsillo, 2016) языки. Следующим этапом станет анализ набоковских лекций о русской литературе и о Дон Кихоте, на третьем этапе планируется исследование изучение его новеллистики, среди которых особый интерес представляет «Мадемуазель О» – единственный рассказ писателя, написанный первоначально на французском, а не на русском или английском языке.

Научное взаимодействие участников проекта, направленное на формирование единой идеологии и методологии проекта, в основном шло по четырем направлениям:
а) в тех случаях, когда отдельные темы, развивавшиеся в рамках разных направлений исследования, обнаруживали некоторую близость, параллельность. и эта ситуация позволяла координировать усилия, но требовала определенных усилий с целью избежать дублирования (с самими направлениями этого не могло быть: они были надежно разграничены на этапе формирования проекта);
б) в тех случаях, когда работы, выполнявшиеся в рамках разных направлений исследования, никоим образом не дублировали друг друга, но обнаруживали возможность последовательного сотрудничества, потенциальную последовательность решения проблемы, когда результаты одного могут быть с пользой для общего дела использованы на следующем этапе другим (по отношению к начальным этапам такого старались не допустить, но дальше логика исследования могла изменить положение дел);
в) для создания в итоге целостной картины, когда данные и выводы по отдельным направлениям относительно плотно, по возможности без лакун и зазоров, примыкают друг к другу;
г) для дальнейшего обсуждения и корректировки общей идеологии и методологии проекта.
При этом взаимодействие по пунктам а) и б), а отчасти также в) и г), могло касаться как филологического внутреннего членения исследования, так и применяющихся в нем количественных, корпусных и компьютерных техник исследования.
Самым сильным примером взаимодействия первого типа стало различие подходов к количественным показателям текста на грамматическом уровне, представленных в разделах 6 и 7 данного отчета. Хотя они надежно разграничены и не покрывают друг друга (соответственно, поздняя и ранняя поэзия Набокова, тотальный и выборочный учет морфологического материала, количественный метод и использование аппарата статистики), все-таки очевидны близость материала и разность подходов. Подсчет по «лигвистике стиха» (ЛС) в большей мере выявляет разнообразие, несогласованность текстов, подсчет по «количественной грамматике поэтического текста» (КГПТ) — их единство; обращение к ранней поэзии показывает обилие текстов с повышенной глагольностью, поздняя поэзия — меру глагольности ощутимо ниже средней; ранняя поэзия, размеченная по ЛС, обнаруживает невысокую долю субстантивнеости, поздняя, размеченная по КГПТ, весьма субстантивна. Было предложено несколько конкурирующих, но не противоречащих друг другу рабочих гипотез (диахрония, эволюция поэзии Набокова; роль причастий, в ЛС попадающих в глаголы, а в КГПТ в прилагательные, и местоимений, не учитываемых в ЛС, а в КГПТ распределяемых между существительными и прилагательными; «возмущающий фактор» длины слова, не учитываемый при подсчете по вхождениям, но играющий важную роль при подсчете по слогам: глаголы обычно короче прилагательных, и часто намного). На следующем этапе исследования предполагаются сопоставительные замеры на общем материале для дальнейшего выяснения состояния дел.
Другой образец подобной встречи разных подходов — приближение с двух сторон к задаче составления частотного словаря Набокова, его поэзии с элементами сильной словарной проработки (8) и общего, с тенденцией к общесемантическому истолкованию данных (2).
Яркий пример взаимодействия второго типа дают разделы 1 и 2 данного отчета. Текстологическая проработка текстов и создание либо совершенствования корпуса — проблемы совершенно различные и при этом глубоко связанные между собою. На дальнейшем этапе исследования подразумевается как корректировка корпусных текстов в соответствии с новейшими изданиями, так и использование формирующегося рабочего корпуса как основы для работы других направлений исследования. Это же в целом можно сказать о возникающих параллельных массивах (в том, что касается поэзии) корпуса набоковских текстов и набоковской коллекции электронного ресурса по русскому стиху. Возможность автоматического поиска и классификации текстов, предоставляемые этим ресурсом, могут, наряду с соответствующими инструментами НКРЯ, использоваться при дальнейшей работе.
Предполагается, что на следующих этапах исследования случаев первого и второго типа обнаружится еще больше. С одной стороны, в рамках сразу нескольких направлений проекта предполагается выход к количественному исследованию лексики, почти всегда с использованием данных по частотности. Задачи не пересекаются и исследователи не должны дублировать друг друга, но поле для плодотворного взаимодействия намечается. На втором этапе исследования прямо поставлена задача поиска в текстах Набокова фактов изоморфизма на разных уровнях и в разных режимах построения текста.
Последнее намечает переход к взаимодействию третьего типа. Проект предусматривает обращение к трем основным «большим уровням» языка и идиостиля: звуковому, грамматическому и лексическому. Исследуются такие режимы текста, как стих и повествование, а косвенно и интертекстуальность. К сожалению, намечаются отдельные пробелы: грамматика представлена в основном морфологией, но не синтаксисом, а в изучении лексики упор сделан на словарный состав текстов и отчасти на тропы, но не на механизмы повтора и лексических эквивалентностей (синонимия, контрасты и т. д.) в тексте. Здесь необходима некоторая корректировка.
Если в филологическом отношении исследование структурировано последовательно и в целом равномерно, то область использования количественных, корпусных, компьютерных и математических методов все еще отличается некоторой пестротой, преодолеть которую предполагается на следующих этапах исследования. Однако в этом есть и определенное преимущество: для заявленной цели тестирования этих методов в применении к филологическому исследованию проект располагает значительным количеством уже используемых подходов и продуктов большого разнообразия. С одной стороны, крайне желательна унификация в смысле выхода во всех возможных случаях на более высокий уровень возможностей, с другой стороны, разнообразие имеет свои сильные стороны и прежде всего — возможность проверки сравнительной эффективности разных подходов.
Именно эти задачи предполагается решат в будущем.

основные результаты по этапу (кратко)

Особое значение имеет инновационный подход к творчеству одного автора с широким набором исследовательских инструментов, различающихся как по языковым и поэтологическим областям применения (звуковой, грамматический, лексический уровни языка, стих, повествование, межъязыковая интерференция), так и по характеру количественных, корпусных, компьютерных и математических моделей (простые подсчеты, статистическая обработка, корпуса, автоматический анализ текста, программы, массивы и базы данных).
Сочетание передового филологического инструментария с диджитальными (цифровыми) технологиями, работая на междисциплинарный характер проекта, способствует развитию соответствующей области исследований.

описание вклада в работу каждого из участников, допустима оценка в процентах (учётная форма ЦИТиС)

Двинятин Федор Никитич — руководство проектом, разработка концепции, подготовка документации проекта, сбор данных по поэтико-грамматическому аспекту поэзии Набокова и русской поэтической традиции вообще (основные морфологические классы, личные формы глагола), первые обобщения в этой области; да.
Андреев Вадим Сергеевич — сбор данных по грамматической, семантической и общетекстовой организации поэзии Набокова, подготовка и публикация статьи в издании, входящем в базу данных РИНЦ; да.
Векшин Георгий Викторович — сбор данных по звуковой организации текстов Набокова с использованием авторской системы Фонотекст, проведение испытаний программ по изучению живой стилистики на материале Набокова; да.
Головачева Ирина Владимировна, — сбор данных по нарративной организации прозы Набокова и писателей-романтиков, публикация главы в монографии, издаваемой в авторитетном международном издательстве; да.
Двинятина Жамила Рузмаматовна — сбор данных по поэтико-грамматическому аспекту поэзии Набокова и русской поэтической традиции вообще, сбор информации по интермедиальным трансформациям текстов Набокова, сбор данных по лексической и грамматической составляющим русской прозы Набокова; да.
Журавлев Михаил Евгеньевич — разработка и проведение испытаний математических моделей сюжета и мотивики; да.
Иванова Екатерина Павловна — сбор данных по исследованию текстов в программе T-LAB, создание концепции исследования набоковских переводов на романские языки, составление корпуса для этого исследования; да.
Казарцев Евгений Вячеславович — сбор данных по ритмике русскоязычной и англоязычной прозы Набокова, стиховедческая и математическая обработка этого материала; да.
Каракуц-Бородина Любовь Анатольевна — подготовка набоковских корпусов, включая метаданные, сбор данныхдля различного типа словарей языка и текстов Набокова; да.
Корышев Михаил Витальевич — сбор данных по исследованию текстов в программе T-LAB, создание концепции исследования набоковских переводов на немецкий язык, составление корпуса для этого исследования; да.
Лалетина Ольга Сергеевна — составление электронной картотеки по метрике и строфике русской поэзии Набокова; сбор данныхпо ритмике 4-стопного ямба Набокова; да.
Орехов Борис Валерьевич — сбор данных для стилеметрического изучения Набокова, формирование специального корпуса, дополнительное тестирование метода Delta на материале русской литературы, сбор данныхдля совершенствования общеинформационной основы проекта, подготовка и публикация статьи в издании, входящем в базу данных РИНЦ; да.
Павлова Лариса Викторовна — сбор данных по лексическому составу поэзии Набокова и русской поэтической традиции вообще, подготовка и публикация двух статей (совместно с И.В.Романовой) в издании, входящем в базу данных РИНЦ; да.
Романова Ирина Викторовна — сбор данных по лексическому составу поэзии Набокова и русской поэтической традиции вообще, подготовка и публикация двух статей (совместно с Л.В.Павловой) в издании, входящем в базу данных РИНЦ; да.
Степанова Алла Сергеевна — текстологическая экспертиза русскоязычных изданий произведений Набокова, составление аналитической записки по современному состоянию набоковской текстологии; да.
Хворостьянова Елена Викторовна — составление электронной картотеки по метрике и строфике русской поэзии Набокова; сбор данныхпо ритмике 4-стопного ямба Набокова; да.
Степанов Андрей Дмитриевич — литературоведческий компонент текстологической экспертизы изданий Набокова, сбор данных по проблеме оптимального взаимодействия традиционных аспектов изучения поэтики прозы (нарратив, жанр, авторский стиль, интертекстуальность и топика) и ее цифрового анализа, в частности, применительно к Набокову; да.
Аствацатуров Андрей Алексеевич — сбор данных по месту Набокова в англоязычной традиции, степени изученности англоязычных текстов Набокова, взаимодействия традиционного литературоведения и цифрового анализа; да.

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

обоснование междисциплинарного подхода

06.02.00 Languages and literature
06.02.QD Literature Slavic
01.02.EV Computer Sciences, Interdisciplinary applications

Современная гуманитарная наука всё активнее использует математические методы для того, чтобы включить в сферу анализа и обобщить большой объем текстового материала (big data), который исследовательские процессы в филологии не могут охватить с помощью традиционного инструментария медленного чтения. Математические методы способны показывать и позволять количественно оценивать тенденции на больших историко-литературных дистанциях, создавать крупные модели культурной эволюции, описывать движение стилей и приемов. Активное и опережающее развитие компьютерных методов обработки, анализа и интерпретации текста, в том числе художественного, которые позволяют на примере уникальных литературных корпусов сформулировать решения для ряда историко-литературных задач, чтобы затем эти решения стали модельными для последующих исследований в сфере digital literary studies. В предлагаемом исследовании основным предметом изучения остается литературный корпус, рассматриваемый исследователями, в том числе посредством междисциплинарных подходов, в ракурсе возможностей современных цифровых методов исследований.
Короткий заголовокИзучение литературного наследия В. В. Набокова в междисциплинарной перспективе с использованием методов информационных технологий
АкронимM1_2020 - 1
СтатусЗавершено
Действительная дата начала/окончания23/10/2031/12/20

Ключевые слова

  • количественные методы в филологии
  • компьютерная лингвистика
  • стиховедение
  • звуковая организация текста
  • поэтическая грамматика
  • лексика
  • лексикография
  • идиостиль
  • структура текста