Description

Одной из важнейших проблем мировой иранистики является установление авторства выдающихся памятников персидской литературы. Прежде всего это относится к персидским поэтам и писателям первого ряда, чей вклад в иранскую и мировую культуру неоспорим и признан мировым сообществом. Так, до сих пор не решен вопрос, поставленный в 50-е-60-е гг. ХХ века, о принадлежности родоначальнику персидского героического эпоса и автору поэмы «Шахнаме» («Книга царей») Абу-л-Касиму Фирдауси(ум. 411/1020 или 416/1025) второй поэмы – «Йусуф и Зулейха», написанной на коранический сюжет и тем же стихотворным размером - мутакарибом. Иранский филолог Муджтаба Минави в 50-е-60-е гг. ХХ в. доказывал, что «Йусуф и Зулейха» не может быть поэмой, написанной Фирдауси, ибо ее стиль гораздо слабее, а сюжетные линии и разработка образов более примитивны, чем в «Шахнаме», и что великий поэт не мог сочинить такое невзрачное произведение. По мнению Муджтаба Минави, только иранские ученые, родным языком которых является персидский, способны чувствовать стиль и делать выводы о подлинности того или иного сочинения на персидском языке.
До сих пор не решен вопрос о принадлежности нескольких поэм крупнейшему персидскому суфийскому поэту ХII века, родоначальнику персидской суфийской дидактической поэмы Абу-л-Маджду Мадждуду ибн Адаму Сана’и-йи Газнави (535/1140 или 545/1150). Ни западные, ни иранские ученые не в состоянии точно определить, какие поэмы поэта, за исключением «Хадикат ал-хака’ик» («Сад истин») и «Карнаме-йи Балх»(«Книга подвигов Балха»), являются подлинными, а какие приписанными. В отношении подлинности многих поэм великого персидского суфийского поэта ХIII в. Фарид ад-Дина ‘Аттара (ум.617/1220 или 632/1234) дискуссии в мировой иранистике активно велись в 40-е - 60-е гг. ХХ века, но до конца вопрос не прояснен и до нашего времени. Немецким исламоведом Х.Риттером(H.Ritter) и иранским филологом Бади’ аз-Заманом Фурузанфаром было установлено, что существовало два или даже три ‘Аттара и показано, какие из поэм несомненно принадлежат ‘Аттару, а какие были ему приписаны.
Персидский суфийский поэт Баба Кухи-йи Ширази (или Ибн Бакуйа) (ум.428/1036-1037 или 442/1050-1051) традиционно считался автором примерно 270 газелей (см., например, Бертельс Е.Э., 1965), однако иранский филолог Мухаммад Казвини (1877-1949) и Х.Риттер (1892–1971) доказывали, что эти газели - не что иное, как позднейшая подделка, относящаяся к IX в.х./15 в. До 60-х гг. ХХ в. считалось, что автором мистико-философской поэмы «Мисбах ал-арвах» («Светильник духов»), посвященной путешествию души в потусторонний мир, является знаменитый суфийский шейх ХIII в. Аухад ад-Дин Кирмани (ум.635/1238), однако иранский ученый Бади’ аз-Заман Фурузанфар, а вслед за ним шведский иранист Б.Утас(Utas Bo) доказывали, что автором поэмы является некий деятель второй половины VI в.х./12 в н.э. Шамс ад-Дин Бардасири.
Спор между иранскими учеными ‘Афифом ‘Усайраном и Рахимом Фарманишем, вспыхнувший в 50-е - 60-е гг. ХХ в. в отношении авторства трактата «Лава’их» («Блистания») иранского мистического философа ‘Айн ал-Кудата Хамадани(492 – 525/1098 - 1131), до сих пор не привел ни к какому результату: ‘Усайран полагал, что, с точки зрения стиля произведения, трактат не имеет к Хамадани никакого отношения, в то время как Фарманиш считал, что стиль «Лава’их» схож со стилем других трудов Хамадани и поэтому Хамадани является автором «Лава’их».
Актуальной задачей мировой иранистики является установление и доказательство авторства Фахр ад-Дина ‘Ираки(610 -688/1213 – 1289) в отношении поэмы «’Ушшак-наме»(«Книга влюбленных»).
Важным средством для определения авторства того или иного средневекового персидского сочинения является, помимо изучения биографических, исторических, текстологических, религиозных и прочих факторов, анализ авторского стиля, что подразумевает разбор языка образов, различных стилистических приемов, выделение предпочитаемых автором рифм, редифов, слов и выражений. Анализ стиля без научно обоснованной методики является субъективным и сводится к ощущениям, вкусам и интуиции того или иного исследователя. Цифровые методы работы с текстовыми массивами в состоянии объективно и достаточно быстро выявить стилистические приемы того или иного автора, а сравнение языка образов и средств художественной изобразительности "сомнительного" произведения с тем, в принадлежности которого автору нет никаких возражений, позволяет дать беспристрастный и непредвзятый ответ на вопрос о подлинности текста и со временем разрешить ряд "извечных" проблем мировой иранистики. А, учитывая тот факт, что до сих пор цифровая стилеметрия использовалась почти исключительно для изучения европейской литературы, предлагаемый проект станет, без преувеличения, новаторским в глобальном масштабе.

Layman's description

За прошедший год в рамках проекта «Атрибуция памятников персидской и афганской средневековой поэзии методами цифровой стилеметрии» была проведена работа по адаптации и практическому применению отечественными специалистами комплекса программ стилеметрического анализа «R-Stylo» для атрибуции выдающихся произведений персидской и афганской поэзии, а также апробация стилеметрических инструментов для выявления плагиатав салджукидских прозаических произведениях.
В качестве основного объекта исследования командой ученых была выбрана поэма «Ишк-наме» («Книга любви»), традиционно приписываемая из величайших персидских суфийских поэтов XII в., основоположнику суфийской дидактической поэмы в Иране Абу-л Маджд Мадждуду ибн Адаму Сана̄’ӣ-йи Г̣азнавӣ (ум. 1140/50). Его творчество оказало огромное влияние на многих последующих авторов в персидской суфийской и светской поэзии. Однако по поводу авторства Сана̄’ӣ в отношении коротких поэм в XX в. среди ученых велись споры, которые продолжаются вплоть до наших дней. Особое внимание уделяется поэме «‘Ишк̣-на̄ме» («Книга любви») ― одному из главных суфийских сочинений в персидской литературе на тему мистической любви. Используя комплекс программ цифровой стилеметрии, иранисты СПбГУ во главе с В. А. Дроздовым попытались ответить на вопрос: кто же является автором поэмы «‘Ишк̣-на̄ме»: Сана̄’ӣ или суфийский шейх XIV в.н.э. ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35)?
Для решения поставленных задач стиль «‘Ишк̣-на̄ме» был сопоставлен со стилем подлинных поэм Сана̄’ӣ. Стилеметрические инструменты были использованы для определения «количественных» различий в стиле (стиль, в данном случае, рассматривался как как набор измеряемых признаков, которые демонстрируют уникальное поведение в различных текстах: длина слов, и длина предложений, и частота употребления тех или иных слов, стихотворная форма (ритм, рифма)). В качестве сравнительного материала были использованы сопоставимые по языку и жанру поэтические произведения семи других средневековых авторов.
По результатам вычислений Санā’ӣ оказался наименее вероятным претендентом на авторство среди тех, чьи тексты были изучены. Анализ лексических различий аутентичных стихотворений Сана̄’ӣ и «‘Ишк̣-на̄ме» продемонстрировал несоответствие авторских стилей. Таким образом, команда проекта доказала, что Сана̄’ӣ не имел отношения к созданию «‘Ишк̣-на̄ме». С гораздо большей долей вероятности эта поэма принадлежит другому автору, вероятно, ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35).
Другим направлением исследования стала адаптация инструментария цифровой стилеметрии для атрибуции поэтических произведений на афганском языке (пашто).
‘Абд ал-Хамӣд Моманд (ум. ок. 1732) - один из величайших афганских поэтов-классиков рубежа XVII-XVIII вв. Однако из-за сложности и витиеватости стиля автора оно остается малоизученным как в самом Афганистане, так и за его пределами. Около сорока произведений поэта определяются в специальной литературе как сомнительные. В ходе проведенного стилеметрического эксперимента члены коллектива НИР искали ответ на два вопроса: 1) насколько комплекс программных средств R-Stylo применим для анализа стихотворных текстов на пашто? 2) являются ли подлинными сомнительные газели Хамӣда?
В целом результаты эксперимента показали, что, во-первых, цифровая стилеметрия способна решать задачи исследования афганоязычных текстов, а, во-вторых, Хамӣд, вероятно, является автором спорных газелей. Однако последний вывод нельзя однозначно отнести ко всем спорным текстам.
Наконец, наиболее новаторской задачей, к решению которой вплотную приблизилась команда проекта, стала апробация стилеметрического анализа на материале салджукидских прозаических произведений «Сийар ал-мулук» («Жития владык») и «Фустат ал-‘адала» («Шатёр справедливости»).
Подготовительная работа выявила целый ряд сложностей в подготовке материалов для компьютерной обработки. Поэтому для начала было решено было ревизовать все имеющиеся результаты использования традиционных методов на данном направлении, а также постараться адаптировать для программного анализа прозаические тексты. Общий объём сохранившегося текста – более 87 000 слов (385 000 знаков с пробелами). Это объём является достаточным для получения надёжных результатов при проведении компьютерной стилеметрии отдельно взятых глав «Фустат ал-‘адала» вместе с источниками, которые компилятор использовал для написания этих глав. Однако синтаксическая и лексическая гетерогенность прозаического текста делает его уверенную цифровую атрибуцию делом будущего. Предварительные расчеты позволяют предполагать, что компилятор «Фустат ал-‘адала» прибегнул к скрытому плагиату объёмных фрагментов из разножанровых источников («Сийар ал-мулук», «Тухфат ал-мулук», неустановленный справочник по арабским халифам.), а также к их преднамеренному редактированию с целью получить должность при дворе Музаффар ал-дина б. Алп Йурака (ум. 691/1292) – военачальника и правителя бейлика Чубанидов с административным центром в Кастамону.
Таким образом, второй этап реализации НИР показал огромный потенциал программных средств цифровой стилеметрии в областях востоковедения, где до этого сопоставимые математические методы не применялись.

Key findings for the project

Первой задачей, решение которой осуществлялось под руководством участника проекта А. А. Хисматулина, была апробация стилеметрического анализа на материале салджукидских прозаических произведений «Сийар ал-мулук» («Жития владык») и «Фустат ал-‘адала» («Шатёр справедливости»).
Бюрократическая система Великих Салджуков (431–552/1040–1157) достигла апогея своего развития в связи с обширными завоеваниями и необходимостью эффективно управлять завоёванными территориями. Эта система сохранилась у их анатолийских преемников (ок. 483–707/1081–1308) вместе со способами продвижения по административной карьерной лестнице. Наряду с наследственной преемственностью при государственных назначениях создание литературных подделок, скрытый плагиат и преднамеренное редактирование чужих текстов ради получения высокой должности при дворе Салджукидов занимали среди этих способов не последнее место. Эти способы ярко характеризуют как жанр административной литературы, так и работавших в нём авторов, а структура и содержание их компиляций в данном жанре напрямую зависели от вакансий, на которые они претендовали. «Фустат ал-‘адала» органично вписывается в ряд других текстов, созданных в жанре административной литературы в эпоху Салджукидов.
Подготовительная работа выявила целый ряд сложностей в подготовке материалов для компьютерной обработки. Поэтому для начала было решено было ревизовать все имеющиеся результаты использования традиционных методов на данном направлении, а также постараться адаптировать для программного анализа прозаические тексты. Предварительные расчеты позволяют предполагать, что компьютерная стилеметрия подтвердит выводы, полученные с помощью традиционного текстологического анализа. Можно с большой долей вероятности утверждать, что компилятор «Фустат ал-‘адала» прибегнул к скрытому плагиату объёмных фрагментов из разножанровых источников, а также – к их преднамеренному редактированию с целью получить должность при дворе Музаффар ал-дина б. Алп Йурака (ум. 691/1292) – военачальника и правителя бейлика Чубанидов с административным центром в Кастамону.
Одним из базовых источников для этой компиляции послужила первая редакция «Сийар ал-мулук» («Жития владык»), которая была использована компилятором в первой главе Фустат ал-‘адала. Во второй главе компилятор включил в свой текст анонимный «Тухфат ал-мулук» («Редкий дар владыкам»), представляющий собой цитаты и изречения с числовым соотношением от двух до десяти. Наконец, для написания третьей главы он заимствовал неустановленный текст, который был создан в жанре энциклопедического справочника по арабским халифам.
Общий объём сохранившегося текста – более 87 000 слов (385 000 знаков с пробелами). Это объём является достаточным для получения надёжных результатов при проведении на заключительном этапе реализации проекта компьютерной стилеметрии отдельно взятых глав «Фустат ал-‘адала» вместе с источниками, которые компилятор использовал для написания этих глав.
Вторым источником, подвергшимся изучению, стала поэма «Ишк-наме» («Книга любви»), традиционно приписываемая Абу-л Маджд Мадждуду ибн Адаму Санаи-йи Газнави (ум. 1140/50).
Один из величайших персидских суфийских поэтов XII в. Сана̄’ӣ (ум. 535/1140 или 545/1150) является основоположником суфийской дидактической поэмы в Иране. Его творчество оказало огромное влияние на многих последующих авторов в персидской суфийской и светской поэзии. Однако по поводу авторства Сана̄’ӣ в отношении коротких поэм в XX в. среди ученых велись споры, которые продолжаются вплоть до наших дней. В статье рассматривается история изучения коротких поэм, приписываемых Сана̄’ӣ, особое внимание уделяется поэме «‘Ишк̣-на̄ме» («Книга любви») ― одному из главных суфийских сочинений в персидской литературе на тему мистической любви. Для определения авторства этой поэмы предлагается использовать новейшие компьютерные технологии, в частности, цифровую стилеметрию. Частью коллектива НИР во главе с В. А. Дроздовым была предпринята попытка ответить на вопрос: кто же является автором поэмы «‘Ишк̣-на̄ме»: Сана̄’ӣ или суфийский шейх XIV в.н.э. ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35)?
Для решения поставленных задач стиль «‘Ишк̣-на̄ме» был сопоставлен со стилем подлинных поэм указанного автора. Комплекс средств цифровой стилеметрии был использован для определения «количественных» различий в стиле (стиль, в данном случае, рассматривался как как набор измеряемых признаков, которые демонстрируют уникальное поведение в различных текстах: длина слов, и длина предложений, и частота употребления тех или иных слов, стихотворная форма (ритм, рифма)).
В эксперименте были использованы следующие материалы:
1) Поэма «Мант̣ик̣ ал-‘ушша̄к̣» (Язык влюбленных), или «Дах-на̄ме» (Десять писем) (нап. 706/1306-1307) персидского поэта Аух̣адӣ-йи Мара̄г̣е’ӣ (ум. 738/1338). Мистико-аллегорическая поэма о любви объемом 515 бейтов;
2) Поэма «‘Ушша̄к̣-на̄ме» (Книга влюбленных) (нап. 751/1350) персидского поэта ‘Убайд-и За̄ка̄нӣ (ум. 772/1371). Немистическая поэма о любви с использованием суфийских образов объемом 723 бейта;
3) Поэма «‘Ушша̄к̣-на̄ме» (Книга влюбленных), или «Дах фас̣л» Десять глав) персидского суфийского поэта Фах̱р ад-Дӣна ‘Ира̄к̣ӣ (610 ―689/1213 ―1289). Чисто мистическая поэма о божественной любви объемом 1063 бейта;
4) «Дӣва̄н» (Собрание стихотворений) Фах̱р ад-Дӣна ‘Ира̄к̣ӣ (610 ―689/1213 ― 1289) объемом более 4800 бейтов, включающий в себя газели ― 3070 бейтов, касыды ― 760 бейтов, к̣ит̣‘а ― 43 бейта, строфические стихотворения (тарджӣ‘банды и таркӣббанды) ― 620 бейтов, руба̄‘ӣ ― 334 бейта (167 руба̄‘ӣ);
5) Поэма «Рауд̣ат ал-мух̣иббӣн» (Сад влюбленных), или «Дах-на̄ме» (Десять писем) (нап. 794/1392) персидским поэтом Ибн ‘Има̄д-и Шӣра̄зӣ (ум. 800/1397-98). Мистико-аллегорическая поэма о любви объемом 760 бейтов;
6) Поэма «Сайр ал-‘иба̄д ила̄-л-ма‘а̄д» (Путешествие рабов божьих к месту возврата (= потусторонний мир)) персидского суфийского поэта Сана̄’ӣ-йи Г̣азнавӣ (ум. 535/1140 или 545/1150). Мистико-философская поэма о путешествии души = рассказчика истории, ведомого деятельным разумом, в потусторонний мир. Тема любви отсутствует, объем около 800 бейтов;
7) Поэма «Х̣адӣк̣ат ал-х̣ак̣ӣк̣а ва шарӣ‘ат ат̣-т̣арӣк̣а» (Сад истины и религиозный закон на пути к Богу) персидского суфийского поэта Сана̄’ӣ-йи Г̣азнавӣ (ум.535/1140 или 545/1150), 5-я глава ― «О любви» объемом 520 бейтов. Описание чисто мистической любви;
8) Поэма «‘Ишк̣-на̄ме», приписываемая Сана̄’ӣ (ум. 535/1140 или 545/1150). Согласно альтернативной гипотезе, это поэтический комментарий «Кунӯз ал-асра̄р ва румӯз ал-ах̣ра̄р» (Сокровища тайн и символы праведных) шейха суфийского ордена сухравардӣйа ‘Изз ад-Дӣна Мах̣мӯда Ка̄ша̄нӣ (ум. 735/1334-35) на прозаический персидский трактат о психологии мистической любви «Ас-Сава̄них̣ фӣ-л-‘ишк̣» (Откровения о любви) персидского мистика Ах̣мада ал-Г̣аза̄лӣ (ум. 520/1126). Описание чисто мистической любви объемом более 580 бейтов.
В корпусе изначально не было ни одного другого кандидата на авторство поэмы, кроме самого Санā’ӣ. Поэтому основной задачей стала верификация авторства – установление вероятности того, что поэма «Книга любви» может принадлежать Санā’ӣ. Сочинения остальных поэтов использовались в качестве контрастного фона, а также для дополнительного, метрического контроля корпуса.
Минимальный размер текста составлял около 5000 слов. На этот объем исследователи ориентировались при составлении случайных выборок, чтобы использовать во всех экспериментах соизмеримые тексты.
Метрическая гетерогенность корпуса также не вызывала сомнений: три текста написаны хазаджем, четыре - хафифом. Диван Ираки включает стихотворения смешанных размеров. Если убрать диван и провести предварительную кластеризацию, используя 400 самых частотных слов в качестве признаков, то тексты распределятся по двум метрическим «гиперкластерам».
Чтобы минимизировать структурный эффект метра, были вычленены признаки (слова), связанные с одним или другим размером. Для этого был проведен подсчет корреляции частот с метрическими категориями. В последующих экспериментах указанные слова были исключены из списков самых частотных слов, чтобы уменьшить влияние размера на близости текстов друг к другу. Полностью нейтрализовать глобальное влияние метра оказалось невозможно, однако некоторый контроль за систематическими эффектами был достигнут.
После проверки инструментария «методом самозванцев», команда проекта провела верификацию «Книги любви» в качестве текста с неизвестным авторством. Было проведено 100 «заборов» слов из всех доступных текстов. Для каждой выборки верификация реализовывалась упомянутым «методом самозванцев»: 1000 итераций, при каждой итерации выбираются случайные признаки (от 50% до 90% слов из 500 самых частотных) и метод определения дистанций (классическая дельта, косинусная дельта, Min-Max). По результатам вычислений Санā’ӣ оказался менее вероятным претендентом на авторство, чем даже ‘Ира̄к̣ӣ, который не рассматривается как возможный и реалистичный кандидат. При этом разнообразие методов и разброс значений уверенности может говорить о том, что подлинного автора в корпусе нет, а «близость» «Книги любви» к ‘Ира̄к̣ӣ и Санā’ӣ может определяеться другими факторами (метр или тематика). В любом случае, вероятность традиционной версии авторства невелика, так как анализ лексических различий аутентичных стихотворений Сана̄’ӣ и «‘Ишк̣-на̄ме» с использованием Craig’s Zeta (программного инструмента, наблюдающего за встречаемостью слов в равномерных «отрезках» в двух корпусах) продемонстрировал несоответствие авторских стилей. Даже термины, широко известные в суфийской персидской поэзии, употребляются Сана̄’ӣ и автором «Книги любви» в совершенно разных количествах. Это также указывает на то, что сам Сана̄’ӣ не имел отношения к созданию «‘Ишк̣-на̄ме». По сути, была на новом методологическом уровне подтверждена гипотеза некоторых иранских и западных ученых 50-летней давности о том, что поэма «‘Ишк̣-на̄ме» не является произведением Сана̄’ӣ. С гораздо большей долей вероятности она принадлежит какому-то другому автору, скорее всего, ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35).
Третьим направлением исследования стала адаптация инструментария цифровой стилеметрии для атрибуции поэтических произведений на афганском языке. ‘Абд ал-Хамӣд Моманд (ум. ок. 1732) - один из величайших афганских поэтов-классиков рубежа XVII-XVIII вв. Хамид явился создателем уникального авторского стиля, отличного от стиля предшественников, его творчество оказало огромное влияние на многих последующих авторов в афганской поэзии на языке пашто. Однако из-за сложности и витиеватости стиля автора оно остается малоизученным как в самом Афганистане, так и за его пределами. В частности, порядка сорока произведений поэта определяются в специальной литературе как сомнительные. Для определения авторства этих газелей были использованы методы цифровой стилеметрии. В ходе проведенного эксперимента члены коллектива под руководством Е. П. Писчурниковой искали ответ на два вопроса: 1) насколько комплекс программных средств R-Stylo применим для анализа стихотворных текстов на пашто? 2) являются ли подлинными сомнительные газели Хамӣда?
Группы сомнительных газелей, каждая объёмом 1043-1245 слов, - это более или менее искусственный текст, полученный при соединении вместе коротких стихотворений. Общий объем Дивана Хамӣда, привлечённый для стилеметрического анализа и не включающий сомнительные тексты, составил 38365 слов. В качестве контрастивных корпусов, необходимых для получения определенно “чужого”, неавторского сигнала, были привлечены стихотворное собрание младшего современника Хамӣда Рахмана Баба (64384 слов) и Диван последователя стиля Хамӣда, поэта XIX века Ханнана Баракзая (57832 слов).
В целом результаты эксперимента показывают, что сам Хамӣд, вероятно, является автором спорных газелей. Однако вполне может быть, что этот вывод не может быть одинаково применим ко всем рассматриваемым текстам. Демаскирование показывает, что некоторые тексты вполне могут вести себя как «неоригинальные» (относительно Хамӣда). Стоит иметь в виду, что это может быть связано с сильным тематическим/жанровым изменением корпуса. «Неоригинальный» сигнал от некоторых частей всего корпуса отчасти подтверждает предыдущий вывод и выявляет возможные спорные места в тексте вокруг стихов 15-19 и стихов 22-326 (границы не следует воспринимать как строгие, но шум в классификации этих стихов побуждает к размышлениям о том, почему это происходит).
Результаты эспериментов показывают, что наиболее вероятным автором спорных газелей является сам Абд аль-Хамӣд Моманд. Однако этот вывод нельзя однозначно отнести ко всем сомнительным текстам. Эксперимент «самораскрытие» показал, что тексты третьей группы газелей, приписываемых поэту, ведут себя как «неоригинальные» тексты по сравнению с остальными произведениями автора. Такая разница может быть объяснена сильным тематическим или жанровым изменением корпуса текстов Хамида и требует более детального анализа.
На второй год была запланирована публикация результатов исследований в двух статьях в периодических изданиях, входящих в Scopus или Web of Science и одной статьи в периодических изданиях, включенных в РИНЦ. По итогам указанного отчетного периода в рамках гранта вышли 2 (две) работы журналах, индексируемых в Scopus или Web of Science, а также 2 (две) статьи в изданиях из системы цитирования РИНЦ. Таким образом, публикационная активность участников проекта превысила плановые показатели.
Прошедший этап реализации НИР показал потенциал программных средств цифровой стилеметрии в областях востоковедения, где до этого сопоставимые математические методы, насколько известно участникам проекта, не применялись.

Key findings for the stage (in detail)

Первой задачей, решение которой осуществлялось под руководством участника проекта А. А. Хисматулина, была апробация стилеметрического анализа на материале салджукидских прозаических произведений «Сийар ал-мулук» («Жития владык») и «Фустат ал-‘адала» («Шатёр справедливости»).
Бюрократическая система Великих Салджуков (431–552/1040–1157) достигла апогея своего развития в связи с обширными завоеваниями и необходимостью эффективно управлять завоёванными территориями. Эта система сохранилась у их анатолийских преемников (ок. 483–707/1081–1308) вместе со способами продвижения по административной карьерной лестнице. Наряду с наследственной преемственностью при государственных назначениях создание литературных подделок, скрытый плагиат и преднамеренное редактирование чужих текстов ради получения высокой должности при дворе Салджукидов занимали среди этих способов не последнее место. Эти способы ярко характеризуют как жанр административной литературы, так и работавших в нём авторов, а структура и содержание их компиляций в данном жанре напрямую зависели от вакансий, на которые они претендовали. «Фустат ал-‘адала» органично вписывается в ряд других текстов, созданных в жанре административной литературы в эпоху Салджукидов.
Подготовительная работа выявила целый ряд сложностей в подготовке материалов для компьютерной обработки. Поэтому для начала было решено было ревизовать все имеющиеся результаты использования традиционных методов на данном направлении, а также постараться адаптировать для программного анализа прозаические тексты. Предварительные расчеты позволяют предполагать, что компьютерная стилеметрия подтвердит выводы, полученные с помощью традиционного текстологического анализа. Можно с большой долей вероятности утверждать, что компилятор «Фустат ал-‘адала» прибегнул к скрытому плагиату объёмных фрагментов из разножанровых источников, а также – к их преднамеренному редактированию с целью получить должность при дворе Музаффар ал-дина б. Алп Йурака (ум. 691/1292) – военачальника и правителя бейлика Чубанидов с административным центром в Кастамону.
Одним из базовых источников для этой компиляции послужила первая редакция «Сийар ал-мулук» («Жития владык»), которая была использована компилятором в первой главе Фустат ал-‘адала. Во второй главе компилятор включил в свой текст анонимный «Тухфат ал-мулук» («Редкий дар владыкам»), представляющий собой цитаты и изречения с числовым соотношением от двух до десяти. Наконец, для написания третьей главы он заимствовал неустановленный текст, который был создан в жанре энциклопедического справочника по арабским халифам.
Общий объём сохранившегося текста – более 87 000 слов (385 000 знаков с пробелами). Это объём является достаточным для получения надёжных результатов при проведении на заключительном этапе реализации проекта компьютерной стилеметрии отдельно взятых глав «Фустат ал-‘адала» вместе с источниками, которые компилятор использовал для написания этих глав.
Вторым источником, подвергшимся изучению, стала поэма «Ишк-наме» («Книга любви»), традиционно приписываемая Абу-л Маджд Мадждуду ибн Адаму Санаи-йи Газнави (ум. 1140/50).
Один из величайших персидских суфийских поэтов XII в. Сана̄’ӣ (ум. 535/1140 или 545/1150) является основоположником суфийской дидактической поэмы в Иране. Его творчество оказало огромное влияние на многих последующих авторов в персидской суфийской и светской поэзии. Однако по поводу авторства Сана̄’ӣ в отношении коротких поэм в XX в. среди ученых велись споры, которые продолжаются вплоть до наших дней. В статье рассматривается история изучения коротких поэм, приписываемых Сана̄’ӣ, особое внимание уделяется поэме «‘Ишк̣-на̄ме» («Книга любви») ― одному из главных суфийских сочинений в персидской литературе на тему мистической любви. Для определения авторства этой поэмы предлагается использовать новейшие компьютерные технологии, в частности, цифровую стилеметрию. Частью коллектива НИР во главе с В. А. Дроздовым была предпринята попытка ответить на вопрос: кто же является автором поэмы «‘Ишк̣-на̄ме»: Сана̄’ӣ или суфийский шейх XIV в.н.э. ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35)?
Для решения поставленных задач стиль «‘Ишк̣-на̄ме» был сопоставлен со стилем подлинных поэм указанного автора. Комплекс средств цифровой стилеметрии был использован для определения «количественных» различий в стиле (стиль, в данном случае, рассматривался как как набор измеряемых признаков, которые демонстрируют уникальное поведение в различных текстах: длина слов, и длина предложений, и частота употребления тех или иных слов, стихотворная форма (ритм, рифма)).
В эксперименте были использованы следующие материалы:
1) Поэма «Мант̣ик̣ ал-‘ушша̄к̣» (Язык влюбленных), или «Дах-на̄ме» (Десять писем) (нап. 706/1306-1307) персидского поэта Аух̣адӣ-йи Мара̄г̣е’ӣ (ум. 738/1338). Мистико-аллегорическая поэма о любви объемом 515 бейтов;
2) Поэма «‘Ушша̄к̣-на̄ме» (Книга влюбленных) (нап. 751/1350) персидского поэта ‘Убайд-и За̄ка̄нӣ (ум. 772/1371). Немистическая поэма о любви с использованием суфийских образов объемом 723 бейта;
3) Поэма «‘Ушша̄к̣-на̄ме» (Книга влюбленных), или «Дах фас̣л» Десять глав) персидского суфийского поэта Фах̱р ад-Дӣна ‘Ира̄к̣ӣ (610 ―689/1213 ―1289). Чисто мистическая поэма о божественной любви объемом 1063 бейта;
4) «Дӣва̄н» (Собрание стихотворений) Фах̱р ад-Дӣна ‘Ира̄к̣ӣ (610 ―689/1213 ― 1289) объемом более 4800 бейтов, включающий в себя газели ― 3070 бейтов, касыды ― 760 бейтов, к̣ит̣‘а ― 43 бейта, строфические стихотворения (тарджӣ‘банды и таркӣббанды) ― 620 бейтов, руба̄‘ӣ ― 334 бейта (167 руба̄‘ӣ);
5) Поэма «Рауд̣ат ал-мух̣иббӣн» (Сад влюбленных), или «Дах-на̄ме» (Десять писем) (нап. 794/1392) персидским поэтом Ибн ‘Има̄д-и Шӣра̄зӣ (ум. 800/1397-98). Мистико-аллегорическая поэма о любви объемом 760 бейтов;
6) Поэма «Сайр ал-‘иба̄д ила̄-л-ма‘а̄д» (Путешествие рабов божьих к месту возврата (= потусторонний мир)) персидского суфийского поэта Сана̄’ӣ-йи Г̣азнавӣ (ум. 535/1140 или 545/1150). Мистико-философская поэма о путешествии души = рассказчика истории, ведомого деятельным разумом, в потусторонний мир. Тема любви отсутствует, объем около 800 бейтов;
7) Поэма «Х̣адӣк̣ат ал-х̣ак̣ӣк̣а ва шарӣ‘ат ат̣-т̣арӣк̣а» (Сад истины и религиозный закон на пути к Богу) персидского суфийского поэта Сана̄’ӣ-йи Г̣азнавӣ (ум.535/1140 или 545/1150), 5-я глава ― «О любви» объемом 520 бейтов. Описание чисто мистической любви;
8) Поэма «‘Ишк̣-на̄ме», приписываемая Сана̄’ӣ (ум. 535/1140 или 545/1150). Согласно альтернативной гипотезе, это поэтический комментарий «Кунӯз ал-асра̄р ва румӯз ал-ах̣ра̄р» (Сокровища тайн и символы праведных) шейха суфийского ордена сухравардӣйа ‘Изз ад-Дӣна Мах̣мӯда Ка̄ша̄нӣ (ум. 735/1334-35) на прозаический персидский трактат о психологии мистической любви «Ас-Сава̄них̣ фӣ-л-‘ишк̣» (Откровения о любви) персидского мистика Ах̣мада ал-Г̣аза̄лӣ (ум. 520/1126). Описание чисто мистической любви объемом более 580 бейтов.
В корпусе изначально не было ни одного другого кандидата на авторство поэмы, кроме самого Санā’ӣ. Поэтому основной задачей стала верификация авторства – установление вероятности того, что поэма «Книга любви» может принадлежать Санā’ӣ. Сочинения остальных поэтов использовались в качестве контрастного фона, а также для дополнительного, метрического контроля корпуса.
Минимальный размер текста составлял около 5000 слов. На этот объем исследователи ориентировались при составлении случайных выборок, чтобы использовать во всех экспериментах соизмеримые тексты.
Метрическая гетерогенность корпуса также не вызывала сомнений: три текста написаны хазаджем, четыре - хафифом. Диван Ираки включает стихотворения смешанных размеров. Если убрать диван и провести предварительную кластеризацию, используя 400 самых частотных слов в качестве признаков, то тексты распределятся по двум метрическим «гиперкластерам».
Чтобы минимизировать структурный эффект метра, были вычленены признаки (слова), связанные с одним или другим размером. Для этого был проведен подсчет корреляции частот с метрическими категориями. В последующих экспериментах указанные слова были исключены из списков самых частотных слов, чтобы уменьшить влияние размера на близости текстов друг к другу. Полностью нейтрализовать глобальное влияние метра оказалось невозможно, однако некоторый контроль за систематическими эффектами был достигнут.
После проверки инструментария «методом самозванцев», команда проекта провела верификацию «Книги любви» в качестве текста с неизвестным авторством. Было проведено 100 «заборов» слов из всех доступных текстов. Для каждой выборки верификация реализовывалась упомянутым «методом самозванцев»: 1000 итераций, при каждой итерации выбираются случайные признаки (от 50% до 90% слов из 500 самых частотных) и метод определения дистанций (классическая дельта, косинусная дельта, Min-Max). По результатам вычислений Санā’ӣ оказался менее вероятным претендентом на авторство, чем даже ‘Ира̄к̣ӣ, который не рассматривается как возможный и реалистичный кандидат. При этом разнообразие методов и разброс значений уверенности может говорить о том, что подлинного автора в корпусе нет, а «близость» «Книги любви» к ‘Ира̄к̣ӣ и Санā’ӣ может определяеться другими факторами (метр или тематика). В любом случае, вероятность традиционной версии авторства невелика, так как анализ лексических различий аутентичных стихотворений Сана̄’ӣ и «‘Ишк̣-на̄ме» с использованием Craig’s Zeta (программного инструмента, наблюдающего за встречаемостью слов в равномерных «отрезках» в двух корпусах) продемонстрировал несоответствие авторских стилей. Даже термины, широко известные в суфийской персидской поэзии, употребляются Сана̄’ӣ и автором «Книги любви» в совершенно разных количествах. Это также указывает на то, что сам Сана̄’ӣ не имел отношения к созданию «‘Ишк̣-на̄ме». По сути, была на новом методологическом уровне подтверждена гипотеза некоторых иранских и западных ученых 50-летней давности о том, что поэма «‘Ишк̣-на̄ме» не является произведением Сана̄’ӣ. С гораздо большей долей вероятности она принадлежит какому-то другому автору, скорее всего, ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35).
Третьим направлением исследования стала адаптация инструментария цифровой стилеметрии для атрибуции поэтических произведений на афганском языке. ‘Абд ал-Хамӣд Моманд (ум. ок. 1732) - один из величайших афганских поэтов-классиков рубежа XVII-XVIII вв. Хамид явился создателем уникального авторского стиля, отличного от стиля предшественников, его творчество оказало огромное влияние на многих последующих авторов в афганской поэзии на языке пашто. Однако из-за сложности и витиеватости стиля автора оно остается малоизученным как в самом Афганистане, так и за его пределами. В частности, порядка сорока произведений поэта определяются в специальной литературе как сомнительные. Для определения авторства этих газелей были использованы методы цифровой стилеметрии. В ходе проведенного эксперимента члены коллектива под руководством Е. П. Писчурниковой искали ответ на два вопроса: 1) насколько комплекс программных средств R-Stylo применим для анализа стихотворных текстов на пашто? 2) являются ли подлинными сомнительные газели Хамӣда?
Группы сомнительных газелей, каждая объёмом 1043-1245 слов, - это более или менее искусственный текст, полученный при соединении вместе коротких стихотворений. Общий объем Дивана Хамӣда, привлечённый для стилеметрического анализа и не включающий сомнительные тексты, составил 38365 слов. В качестве контрастивных корпусов, необходимых для получения определенно “чужого”, неавторского сигнала, были привлечены стихотворное собрание младшего современника Хамӣда Рахмана Баба (64384 слов) и Диван последователя стиля Хамӣда, поэта XIX века Ханнана Баракзая (57832 слов).
В целом результаты эксперимента показывают, что сам Хамӣд, вероятно, является автором спорных газелей. Однако вполне может быть, что этот вывод не может быть одинаково применим ко всем рассматриваемым текстам. Демаскирование показывает, что некоторые тексты вполне могут вести себя как «неоригинальные» (относительно Хамӣда). Стоит иметь в виду, что это может быть связано с сильным тематическим/жанровым изменением корпуса. «Неоригинальный» сигнал от некоторых частей всего корпуса отчасти подтверждает предыдущий вывод и выявляет возможные спорные места в тексте вокруг стихов 15-19 и стихов 22-326 (границы не следует воспринимать как строгие, но шум в классификации этих стихов побуждает к размышлениям о том, почему это происходит).
Результаты эспериментов показывают, что наиболее вероятным автором спорных газелей является сам Абд аль-Хамӣд Моманд. Однако этот вывод нельзя однозначно отнести ко всем сомнительным текстам. Эксперимент «самораскрытие» показал, что тексты третьей группы газелей, приписываемых поэту, ведут себя как «неоригинальные» тексты по сравнению с остальными произведениями автора. Такая разница может быть объяснена сильным тематическим или жанровым изменением корпуса текстов Хамида и требует более детального анализа.
На второй год была запланирована публикация результатов исследований в двух статьях в периодических изданиях, входящих в Scopus или Web of Science и одной статьи в периодических изданиях, включенных в РИНЦ. По итогам указанного отчетного периода в рамках гранта вышли 2 (две) работы журналах, индексируемых в Scopus или Web of Science, а также 2 (две) статьи в изданиях из системы цитирования РИНЦ. Таким образом, публикационная активность участников проекта превысила плановые показатели.
Прошедший этап реализации НИР показал потенциал программных средств цифровой стилеметрии в областях востоковедения, где до этого сопоставимые математические методы, насколько известно участникам проекта, не применялись.

Key findings for the stage (summarized)

За прошедший год в рамках проекта «Атрибуция памятников персидской и афганской средневековой поэзии методами цифровой стилеметрии» была проведена работа по адаптации и практическому применению отечественными специалистами комплекса программ стилеметрического анализа «R-Stylo» для атрибуции выдающихся произведений персидской и афганской поэзии, а также апробация стилеметрических инструментов для выявления плагиатав салджукидских прозаических произведениях.
В качестве основного объекта исследования командой ученых была выбрана поэма «Ишк-наме» («Книга любви»), традиционно приписываемая из величайших персидских суфийских поэтов XII в., основоположнику суфийской дидактической поэмы в Иране Абу-л Маджд Мадждуду ибн Адаму Сана̄’ӣ-йи Г̣азнавӣ (ум. 1140/50). Его творчество оказало огромное влияние на многих последующих авторов в персидской суфийской и светской поэзии. Однако по поводу авторства Сана̄’ӣ в отношении коротких поэм в XX в. среди ученых велись споры, которые продолжаются вплоть до наших дней. Особое внимание уделяется поэме «‘Ишк̣-на̄ме» («Книга любви») ― одному из главных суфийских сочинений в персидской литературе на тему мистической любви. Используя комплекс программ цифровой стилеметрии, иранисты СПбГУ во главе с В. А. Дроздовым попытались ответить на вопрос: кто же является автором поэмы «‘Ишк̣-на̄ме»: Сана̄’ӣ или суфийский шейх XIV в.н.э. ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35)?
Для решения поставленных задач стиль «‘Ишк̣-на̄ме» был сопоставлен со стилем подлинных поэм Сана̄’ӣ. Стилеметрические инструменты были использованы для определения «количественных» различий в стиле (стиль, в данном случае, рассматривался как как набор измеряемых признаков, которые демонстрируют уникальное поведение в различных текстах: длина слов, и длина предложений, и частота употребления тех или иных слов, стихотворная форма (ритм, рифма)). В качестве сравнительного материала были использованы сопоставимые по языку и жанру поэтические произведения семи других средневековых авторов.
По результатам вычислений Санā’ӣ оказался наименее вероятным претендентом на авторство среди тех, чьи тексты были изучены. Анализ лексических различий аутентичных стихотворений Сана̄’ӣ и «‘Ишк̣-на̄ме» продемонстрировал несоответствие авторских стилей. Таким образом, команда проекта доказала, что Сана̄’ӣ не имел отношения к созданию «‘Ишк̣-на̄ме». С гораздо большей долей вероятности эта поэма принадлежит другому автору, вероятно , ‘Изз ад-Дӣн Мах̣мӯд Ка̄ша̄нӣ (ум. 735/1334-35).
Другим направлением исследования стала адаптация инструментария цифровой стилеметрии для атрибуции поэтических произведений на афганском языке (пашто).
‘Абд ал-Хамӣд Моманд (ум. ок. 1732) - один из величайших афганских поэтов-классиков рубежа XVII-XVIII вв. Однако из-за сложности и витиеватости стиля автора оно остается малоизученным как в самом Афганистане, так и за его пределами. Около сорока произведений поэта определяются в специальной литературе как сомнительные. В ходе проведенного стилеметрического эксперимента члены коллектива НИР искали ответ на два вопроса: 1) насколько комплекс программных средств R-Stylo применим для анализа стихотворных текстов на пашто? 2) являются ли подлинными сомнительные газели Хамӣда?
В целом результаты эксперимента показали, что, во-первых, цифровая стилеметрия способна решать задачи исследования афганоязычных текстов, а, во-вторых, Хамӣд, вероятно, является автором спорных газелей. Однако последний вывод нельзя однозначно отнести ко всем спорным текстам. Эксперимент «самораскрытие» показал, что тексты третьей группы спорных газелей поэта ведут себя как «неоригинальные» по сравнению с остальными произведениями автора. Такая разница может быть объяснена сильным тематическим или жанровым изменением корпуса текстов Хамида и требует более детального анализа.
Наконец, наиболее новаторской задачей, к решению которой вплотную приблизилась команда проекта, стала апробация стилеметрического анализа на материале салджукидских прозаических произведений «Сийар ал-мулук» («Жития владык») и «Фустат ал-‘адала» («Шатёр справедливости»).
Подготовительная работа выявила целый ряд сложностей в подготовке материалов для компьютерной обработки. Поэтому для начала было решено было ревизовать все имеющиеся результаты использования традиционных методов на данном направлении, а также постараться адаптировать для программного анализа прозаические тексты. Общий объём сохранившегося текста – более 87 000 слов (385 000 знаков с пробелами). Это объём является достаточным для получения надёжных результатов при проведении компьютерной стилеметрии отдельно взятых глав «Фустат ал-‘адала» вместе с источниками, которые компилятор использовал для написания этих глав. Однако синтаксическая и лексическая гетерогенность прозаического текста делает его уверенную цифровую атрибуцию делом будущего. Предварительные расчеты позволяют предполагать, что компилятор «Фустат ал-‘адала» прибегнул к скрытому плагиату объёмных фрагментов из разножанровых источников («Сийар ал-мулук», «Тухфат ал-мулук», неустановленный справочник по арабским халифам.), а также к их преднамеренному редактированию с целью получить должность при дворе Музаффар ал-дина б. Алп Йурака (ум. 691/1292) – военачальника и правителя бейлика Чубанидов с административным центром в Кастамону.
Результаты исследований, осуществленных в рамках проекта, были опубликованы в ведущих рецензируемых периодических изданиях, в том числе, «Manuscripta Orientalia» и «Orientalistica», а также прошли апробацию на XXXI Международном конгрессе по источниковедению и историографии стран Азии и Африки.
Таким образом, второй этап реализации НИР показал потенциал программных средств цифровой стилеметрии в областях востоковедения, где до этого сопоставимые математические методы не применялись.

Academic ownership of participants (text description)

В. А. Дроздов, доцент – руководство проектом, финальная атрибуция поэмы «Ишк-наме» («Книга любви»), традиционно приписываемой Абу-л Маджд Мадждуду ибн Адаму Санаи-йи Газнави (ум. 1140/50).
А. А. Хисматулин, ведущий научный сотрудник - апробация стилеметрического анализа на материале салджукидских прозаических произведений «Сийар ал-мулук» («Жития владык») и «Фустат ал-‘адала» («Шатёр справедливости»).
Е. П. Писчурникова, ассистент - адаптация инструментария цифровой стилеметрии для атрибуции поэтических произведений на афганском языке (‘Абд ал-Хамӣда Моманда, Рахмана Баба, Ханнана Баракзая).
В. А. Шорохов, доцент – обработка фарсиязычных текстов с помощью комплекса программных инструментов цифровой стилеметрии R-Stylo, научная редактура публикаций
Батракова Софья Евгеньевна, студент – набор и формальная унификация текстов «‘Ишк̣-на̄ме» и Мант̣ик̣ ал-‘ушша̄к̣» Аух̣адӣ-йи Мара̄г̣е’ӣ
Вишнякова Ирина Андреевна, студент – набор и формальная унификация текстов «‘Ушша̄к̣-на̄ме» ‘Убайда-и За̄ка̄нӣ и «‘Ушша̄к̣-на̄ме» Фах̱р ад-Дӣна ‘Ира̄к̣ӣ
Смирнова Анастасия Михайловна, студент - набор и формальная унификация текстов «Дӣва̄на» Фах̱р ад-Дӣна ‘Ира̄к̣ӣ и «Рауд̣ат ал-мух̣иббӣн» Ибн ‘Има̄д-и Шӣра̄зӣ
Short titleАтрибуция памятников
AcronymRFBR_a_2020 - 2
StatusFinished
Effective start/end date24/03/2128/12/21

ID: 75290924