Развитие методов управления многоагентными системами в условиях конфликта: 2022 г. этап 1

Петросян, Леон Аганесович (руководитель)
Парилина, Елена Михайловна (исполнитель)
Седаков, Артем Александрович (исполнитель)
Булгакова, Мария Александровна (исполнитель)
Гриних, Александра Леонидовна (исполнитель)
Косян, Давид Агаикович (исполнитель)
Тур, Анна Викторовна (исполнитель)
Кареева, Юлия Сергеевна (исполнитель)
Мазалов, Владимир Викторович (исполнитель)
Реттиева , Анна Николаевна (исполнитель)

описание

Многие процессы, протекающие в информационно-коммуникационных и социально-экономической сферах, в военном деле и международной деятельности, в задачах экологического и природоохранного характера, моделируются посредством многоагентных систем (МАС) и, зачастую, носят конфликтный характер. В таких системах предполагается присутствие интеллектуальных агентов, которые своим поведением могут влиять на состояние самой системы. Одним из важных качеств МАС является децентрализация агентов, позволяющая управлять системой лишь едиными координированным механизмом, а также их ограниченное представление о системе, что позволяет агентам «наблюдать» только некоторую часть системы, а не всю систему полностью.

В проекте предлагается исследовать вопросы управления МАС с интеллектуальными агентами, используя аппарат математической теории игр и ее наиболее актуальный подраздел – теорию дифференциальных и динамических игр. Важной особенностью этих задач является конфликтный характер взаимодействия агентов, что делает необходимым использование методов и подходов математической теории принятия решений в условиях конфликта (математической теории игр). Дополнительно для точного анализа конфликтного процесса взаимодействия необходимо исследовать его во времени.

Важным и нетривиальным вопросом в проекте является формализация, казалось бы, таких очевидных понятий как “оптимальное поведение” интеллектуальных агентов МАС (выработка принципа оптимальности), нахождение условий его существования и единственности, а при исследовании процессов в динамике нахождение условий его динамической устойчивости (состоятельности во времени), и наконец создание программного продукта для нахождения решений, соответствующих принятым принципам оптимальности. В зависимости от характеристик МАС в качестве основного аппарата исследования можно использовать математическую теорию оптимального управления, и такие ее разделы как теория динамических, дифференциальных, стохастических, сетевых, а также в ряде случаев и эволюционных игр. В частности, ограниченное представление агента о системе может быть хорошо формализовано в терминах сетевой игры, где агент взаимодействует не со всеми элементами МАС, а лишь со своими соседями (прямыми или уровня k).

Предполагается рассматривать коллективное поведение МАС, при котором внешний арбитр централизованным образом определяет поведение интеллектуальных агентов, ориентируясь на достижение наилучших показателей для всей системы в целом. При разработке такого поведения желательно обеспечить также индивидуальную рациональность агентов для их мотивации придерживаться заданного поведения. Это позволит использовать результаты кооперативной теории динамических игр для определения в некотором смысле оптимального поведения агентов внутри системы.

В то же время интересными являются исследования поведения, допускающего объедение агентов в некоторые группы (коалиции) внутри МАС. Подобное допущение встречается в литературе, например, в задачах группового консенсуса – такого поведения агентов, которое однотипно внутри одной группы, но может различаться от группы к группе внутри МАС. Таким образом, возможно построение принципов оптимальности для определения поведения внутри МАС в предположении, что агенты могут формировать группы-кластеры (коалиции). Здесь может быть предложен подход, основанный на двухуровневой оптимизации: для агентов внутри группы используется кооперативное поведения, найденное как решение соответствующей кооперативной дифференциальной или динамической игры, а на уровне МАС - более общие решения, которые могут представлять собой равновесия между группами или их кооперация.

В теории кооперативных динамических игр хорошо известно, что для сохранения кооперации и принятых соглашений внутри МАС требуется выполнение более жесткого условия: в процессе реализации решения принцип оптимальности, на основе которого вырабатывалось первоначальное решение, должен оставаться состоятельным в течение всего процесса принятия решений. Это условие носит название “динамической устойчивости” или “состоятельности во времени”. Именно вопросу построения динамически устойчивых (состоятельных во времени) решений будет уделено особое внимание. В частности, аналогичная проблема возникает и при решении задачи двухуровневой оптимизации в МАС, когда возможна кластеризация агентов. Здесь в зависимости от принятых принципов оптимальности (равновесия или кооперативного решения) предполагается провести анализ его динамической устойчивости.

Стоит отметить, что в случае выбора равновесия по Нэшу в качестве принципа оптимальности, такое равновесное поведение в подавляющем большинстве случаев является динамически устойчивым, но может таковым не быть в случае выбора кооперативных решений. Поэтому на первом этапе мы ограничимся равновесными решениями для определения взаимодействия между элементами (самими агентами или кластерами) МАС. Используя математический аппарат теории динамических и дифференциальных игр, предполагается построить новые модели поведения МАС во времени и построение принципов оптимальности (в том числе двухуровневых, включающих в себя как оптимизацию поведения агентов внутри кластеров, так и между кластерами).

Основной задачей проекта является разработка новых динамически устойчивых (состоятельных во времени) механизмов управления, соответствующих выработанным принципам оптимальности, в указанных задачах, в том числе и в сетевой постановке, нахождение условий их существования, получение решений в явном виде, а при невозможности явного аналитического представления – нахождение эффективных вычислительных алгоритмов, а также исследование вопросов стратегической поддержки принципа оптимальности.

Акроним	RSF_RG_2022 - 1
Статус	Завершено
Эффективные даты начала/конца	18/05/22 → 31/12/22

Области исследований

Многоагентная система, сетевое взаимодействие, управление, динамическая игра, равновесие, кооперация

ID: 95195918