Reinforcement learning-based optimal control for stochastic opinion dynamics

Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование

Кафедра искусственного интеллекта в системах управления

DOI

https://doi.org/10.1038/s41598-026-42646-1
Конечная издательская версия

Yajin Chen
Hongwei Gao
Vladimir V. Mazalov
Yanshan Liu

This paper proposes a integrated framework for optimal control of opinion dynamics in social networks, addressing three progressively challenging scenarios: Model-based stochastic control, where agent interactions follow known probability distributions, enabling analytical optimal policies; Model-free Reinforcement Learning (RL), where interaction randomness has unknown distributions but system dynamics are preserved; Data-driven RL for unknown systems, where time-varying network dynamics (with stochasticity constraints) are fully unknown, requiring purely observational learning. By designing an RL control framework grounded in convex quadratic optimization, we bridge model-based control and data-driven learning, offering new insights for social network manipulation and multi-agent coordination. Numerical simulations demonstrate the framework’s effectiveness.

Язык оригинала	английский
Номер статьи	12392
Журнал	Scientific Reports
Том	16
Номер выпуска	1
Дата раннего онлайн-доступа	6 мар 2026
DOI	https://doi.org/10.1038/s41598-026-42646-1
Состояние	Опубликовано - 6 мар 2026

ID: 150015116

Pure – это продукт компании Elsevier
На данном информационном ресурсе могут быть опубликованы архивные материалы
с упоминанием физических и юридических лиц, включенных Министерством юстиции
Российской Федерации в реестр иностранных агентов

Вход в Pure