Научная проблема, на решение которой направлен проект:
Обеспечение высокой точности прогнозирования динамики распространения эпидемий новых вирусов в регионах России в условиях отсутствия априорной информации, недостаточной полноты и существенных неопределенностей исходных данных.
Научная значимость и актуальность решения обозначенной проблемы:Научная новизна решения этой задачи состоит в использовании нового подхода к моделированию и прогнозированию динамики эпидемии вируса неизвестного типа на основе принципа динамического баланса и построении балансовой модели, отличной от модели SIR. Неполнота и неточность исходной информации для моделирования может заключаться: в невозможности полного сбора и учета информации о прогнозируемом процессе; в недостоверности и недостаточности исходной информации вследствие различной организации сбора данных, а также в возможном проявлении особенностей прогнозируемого процесса, существование которых не предполагалось. Более того, сама модель системы также меняется и может эволюционировать со временем. В таких случаях использование традиционных подходов к прогнозированию не обеспечивает получения адекватных результатов ввиду недостаточно обоснованного выбора меняющихся во времени параметров моделей. Примером такого динамического процесса является динамика распространения эпидемии новой инфекции. В начале распространения эпидемии традиционные методы распространения показали свою неэффективность вследствие того, что невозможно однозначно определить модель развития процесса, а степень неопределенности параметров моделей оказалась чрезвычайно высока. Таким образом, острой является проблема разработки новых адаптивных методов прогнозирования динамических процессов с учетом неопределенностей в динамике развития системы. Повышение точности прогнозирования динамики эпидемии как в России, так и отдельных регионах, является актуальной общественно значимой проблемой, так как ее решение обеспечивает возможность для разработки своевременных эффективных мероприятий по борьбе с распространением инфекций.
Конкретная задача (задачи) в рамках проблемы, на решение которой направлен проект, ее масштаб и комплексность:Конкретными задачами в рамках решения проблемы являются: 1. Исследование возможностей альтернативного подхода к моделированию эпидемии COVID-19 и новой дискретной модели распространения эпидемии CIRD (Cumulative Cases, Infected, Recovered, Dead). Эта модель, в отличие от модели SIR, будет иметь иной набор переменных и параметров. 2. Описание процедуры построения цепочки распространения вируса в регионах. 3. Описание и формализация принципа динамического баланса переменных модели CIRD и исследование свойств характеристики динамического баланса эпидемиологических процессов в регионах России. 4. Повышение точности прогнозирования динамики процентного прироста и траекторий характеристики динамического баланса на основе применения методов машинного обучения. Описание процедуры вычисления интервальных оценок для значений показателя R(t).
Масштаб проблемы характеризуется возможностью использования результатов решения сформулированных задач для совершенствования региональных систем здравоохранения в России для целей борьбы с новыми вирусными инфекциями. Комплексность обусловлена транс национальностью процесса распространения вирусов и неравномерностью распространения пандемии вирусов во времени и пространстве.
Научная новизна поставленной задачи, обоснование достижимости решения поставленной задачи и возможности получения запланированных результатов:Проект направлен на развитие новой для научного коллектива тематики, на определение нового объекта и предмета исследования - эпидемий новых вирусов и динамики их распространения. Развитие этой тематики будет опираться на имеющийся опыт исследований в области моделирования, управления и оптимизации потоков в больших транспортных сетях. Особую роль в обеспечении достижимости решения поставленной задачи и возможности получения предполагаемых результатов должен сыграть опыт разработки процедур динамической адаптации алгоритмов маршрутизации транспорта на больших сетях в условиях практически неопределенной информации о множестве допустимых маршрутов. Уровень значимости и научная новизна состоит в создании новой модели и новых алгоритмов и методов прогнозирования эпидемий в условиях отсутствия априорной информации и недостаточной полноты исходных данных с учетом развития инновационных цифровых технологий.
Современное состояние исследований по данной проблеме, основные направления исследований в мировой науке и научные конкуренты:Вспышка коронавирусной инфекции COVID-19, вызванная новым вирусом SARS-CoV-2, быстро распространилась по миру в конце 2019 года, затронув уже более 200 стран. По состоянию на конец сентября 2022 года в мире зарегистрировано более 600 млн. подтвержденных случаев COVID-19. По признанию ВОЗ, наличие своевременных математических моделей играет ключевую роль в принятии решений, основанных на фактах, лицами, определяющими политику здравоохранения.
Модели эпидемии различаются по типу модели, способу получения исходных данных, гипотезе и распределению ключевых входных параметров. Проведенный систематический обзор научной литературы показал, что все исследования пытаются ответить на следующие вопросы: (1) заразность рассматриваемого вируса, и связанная с этим оценка значения базового репродуктивного числа; (2) оценка ключевых временных периодов распространения эпидемии (достижение пика, плато, затухание); (3) прогнозирование распространения инфекции (включая краткосрочное и долгосрочное прогнозирование); (4) оценка воздействия различных мер, направленных на сдерживание эпидемии. Также востребованным вопросом является влияние неизвестной ранее эпидемии на макро- и микроэкономические показатели регионов и стран.
В целом можно выделить четыре основные подхода к моделированию распространения инфекционных заболеваний: камерные модели, модели на основе временных рядов, агентно-ориентированные модели и модели, построенные с использованием методов машинного обучения и эвристических подходов.
Некоторые исследователи использовали ARIMA для прогнозирования распространения пандемии новой коронавирусной инфекции. Так, в [Moftakhar L., Seif M., Safe M.S. Exponentially increasing trend of infected pa-tients with COVID-19 in Iran: a comparison of neural network and ARIMA fore-casting models. Iran Journal of Public Health. vol. 49. pp. 92–100] авторы оценивали количество ежедневных новых случаев заболевания в Иране. Результаты прогнозирования показывали в районе 9 558 новых случаев в день на конец апреля 2020 года. Официально на данную дату было зафиксировано 1 073 новых случая заражения. В работе [Chaudhry R.M. et al. Coronavirus disease 2019 (COVID-19): forecast of an emerg-ing urgency in Pakistan. Cureus. 2020. vol. 12. no. 5. Article ID e8346.] использовался метод простого скользящего среднего для прогнозирования подтвержденных случаев COVID-19 в Пакистане. Авторы прогнозировали более 35 000 случаев заболевания к концу мая 2020 года. (Фактически на конец мая было зафиксировано в 2 раза больше, 72 460 случаев новой коронавирусной инфекции). Тандон с соавт. [Tandon H., Ranjan P., Chakraborty T., Suhag V. Coronavirus (covid-19): Arima based time-series analysis to forecast near future. arXiv:2004.07859 [q-bio.PE]] сравнивает результаты прогнозирования распространения эпидемии COVID-19 в Индии с помощью 7 различных моделей временных рядов. Горизонт моделирования составлял 20 дней. Авторы заключают, что лучшие результаты среди сравниваемых показала модель ARIMA. По данным авторов, к 3 мая 2020 года число случаев заражения должно было быть около 30 990 случаев. Фактически, на данную дату было зафиксировано 42 505 случаев заражения.
Очевидно, что хотя модели временных рядов и являются популярным инструментом прогнозирования, применение данного подхода для оценки распространения новых инфекций имеет свои ограничения. В частности, отсутствие статистики за предыдущие периоды и, как следствие, неизвестные значения параметров не позволяют построить модели достаточной степени точности.
Своеобразным “золотым стандартом” моделирования распространения эпидемии являются камерные модели типа SIR. Некоторые исследователи предпочитают использовать SIR из-за небольшого количества требуемых на входе параметров (эффективная частота контактов, которая влияет на переход из группы восприимчивых в группу инфицированных, и скорость выздоровления, которая влияет на переход из группы инфицированных во множество выздоровевших или умерших). Однако, это преимущество возникает из-за порой чрезмерного упрощения модели за счет относительно нереалистичных предположений. Например, модель предполагает однородное смешивание популяции, а это означает, что все особи в популяции имеют равную вероятность вступить в контакт друг с другом. Это не отражает человеческие социальные структуры, в которых большинство контактов происходит в ограниченных сообществах. Модель SIR также предполагает замкнутую популяцию без миграции, рождений или смертей по причинам, отличным от эпидемии.
В качестве примера можно привести исследование Дил и Макена [Dil S., Dil N., Maken Z.H. COVID-19 trends and forecast in the eastern mediterra-nean region with a particular focus on Pakistan. Cureus. 2020. vol. 12. no. 6. Article ID e8582.], в котором использовали модель SIR для прогнозирования подтвержденных случаев COVID-19 в регионе Восточного Средиземноморья (Иран, Ирак, Саудовская Аравия, ОАЭ, Ливан, Египет и Пакистан). По оценкам авторов, к 20 июня 2020 года предполагалось достичь 2,12 миллиона случаев в Иране, 0,58 миллиона в Саудовской Аравии и 0,51 миллиона в Пакистане. В действительности, число зафиксированных случаев заражения на 20.06.2020 официально составляло 202 584 случаев заражения в Иране, 176 617 случаев – в Пакистане и 154 233 случаев – в Саудовской Аравии (по данным Центра CSSE Университета Джонса Хопкинса [Johns Hopkins Coronavirus Resource Center, URL: https://coronavirus.jhu.edu/data]). В исследовании, посвященном распространению эпидемии COVID-19 в России, на интервале с 20 апреля по 19 мая 2020 года средняя абсолютная ошибка в процентах результатов прогнозирования с помощью модели SIR расчетной траектории числа активных случаев заболевания составила 11%. Более сложные модели используют распределения для каждого параметра вместо точечной оценки для характеристики вероятности различных будущих траекторий. Также, в более сложных адаптациях камерной структуры SIR можно формально включить наблюдаемые данные, чтобы значения параметров калибровались на основе поступающих данных, как это сделано, например, в [Liao Z., Lan P., Liao Z. et al. TW-SIR: time-window based SIR for COVID-19 forecasts. Sci Rep. 2020. vol. 10. Article ID 22454].
Основная проблема всех камерных моделей состоит в том, что прогнозы, полученные с их помощью, очень чувствительны ко входным параметрам. Между тем, эти параметры можно измерить лишь эмпирическим путем, набрав достаточную статистику. Статистические данные обычно собираются в тех странах, где вирус уже достаточно сильно распространен. Для новых инфекций это представляет собой большую проблему. Например, в случае коронавирусной инфекции COVID-19 в первую очередь рассматривали данные Китая и Италии как стран, где эпидемия развивалась раньше всех. Но при этом использовать полученные значения параметров напрямую для моделирования ситуации в другой стране нельзя, так как не учитываются ни региональные особенности.
Среди эвристических методов следует выделить такой подход как рассуждения на основе прецедентов (case-based reasoning) – семейство методов, которые базируются на идее поиска ответа на поставленную задачу среди уже известных способов ее решения [Kondratyev M.A. Forecasting methods and models of disease spread. Computer Research and Modeling. 2013. vol. 5. no. 5. pp. 863-882]. В работах [Zakharov V., Balykina Y., Petrosian O., Gao H. CBRR Model for Predicting the Dynamics of the COVID-19 Epidemic in Real Time. Mathematics. 2020. vol. 8. no. 10. Article ID 1727; Zakharov V.V., Balykina Yu.E. Predicting the dynamics of the coronavirus (COVID-19) epidemic based on the case-based reasoning approach. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2020, vol. 16, no. 3, pp. 249–259.] описана новая модель CBRR на основе прецедентов (case-based rate reasoning) для прогнозирования будущих значений основных параметров эпидемии коронавируса в России, позволяющая строить краткосрочные прогнозы на основе аналогов динамики процентного прироста в других странах. Также описан новый эвристический метод оценивания продолжительности переходного процесса процентного прироста между заданными уровнями, учитывающий информацию о динамике эпидемиологических процессов в странах цепочки распространения.
Методы машинного обучения активно применяются для прогнозирования развития эпидемии COVID-19. Например, в работе [Hu, Z., Ge, Q., Li, S., Jin, L., Xiong, M. Artificial intelligence forecasting of covid-19 in China. arXiv preprint, 2012. arXiv:2002.07112.] авторы применили полносвязную нейронную сеть для прогнозирования числа дневных заражений в Китае, достигнув средней абсолютной относительной ошибки прогноза 3% на 10-дневном интервале. В работе [Devaraj, J., et al. Forecasting of COVID-19 cases using deep learning models: Is it reliable and practically significant?. Results in Physics. 2021. Vol. 21. pp. 103817.] авторы сравнили модель ARIMA с рекуррентными нейронными сетями LSTM и SLSTM, продемонстрировав превосходство последних в задаче прогнозирования числа заболеваний COVID-19. В работе [Zou, D. et al. Epidemic Model Guided Machine Learning for COVID-19 Forecasts in the United States. medRxiv. 2020] авторы предложили расширенную модель SIR, учитывающую незаявленные заражения, и метод машинного обучения для оценки параметров модели, получив среднюю абсолютную относительную ошибку прогноза до 1% на горизонте семи дней. Стоит отметить, что большинство моделей демонстрируют низкую ошибку на при краткосрочном прогнозе (на промежутках до недели), которая, однако, накапливается и значительно возрастает при долгосрочных прогнозах (более одной недели). В работе [Friedman, J. et al. Predictive performance of international COVID-19 mortality forecasting models. Nature communications. 2021. Vol. 12. No. 1. pp. 1-13] авторы провели сравнение нескольких подходов к прогнозированию смертности от COVID-19, получив 1% среднюю ошибку для всех подходов при краткосрочном прогнозе и от 23.6% до 37.6% при долгосрочном прогнозе (12 недель) дневной смертности от COVID-19 в Соединенных Штатах Америки. Более того, в существующих на данных момент работах по применению алгоритмов машинного обучения к прогнозированию развития эпидемии COVID-19 предложенные методы не учитывают историю развития эпидемии в других странах и темпоральные характеристики, такие как погода, социальные события и изменения эпидемиологических ограничений. Подобным методы требуют накопления значительного объема исторических данных, а так же быстро теряют свою актуальность при долгосрочного прогнозе.
Обзор публикаций по прогнозированию эпидемий новых инфекций в зарубежной и российской научной литературе показывает, что в большинстве случаев исследователи используют классическую модель SIR и ее модификации. При этом точность построенных среднесрочных и даже краткосрочных прогнозов, как правило, является невысокой. Проведенные авторами проекта вычислительные эксперименты по применению модели SIR при прогнозировании весенней волны эпидемии COVID-19 в России и ряде зарубежных стран также подтверждают это обстоятельство.
Многие научно-исследовательские группы в США, Китае и Европе занимаются анализом данных по распространению эпидемий и работают над созданием методов прогнозирования распространения новых вирусов в краткосрочном и долгосрочном периодах. Среди таких научных групп можно выделить:
- MIT Bourouiba COVID-19 (https://lbourouiba.mit.edu/research) - научная группа под руководством профессора Lydia Bourouiba, Массачусетский технологический институт, США.
- Рабочая группа при Гарвардской школе общественного здравоохранения (https://www.hsph.harvard.edu/news/hsph-in-the-news/the-latest-on-the-coronavirus/), которой ведётся проект Covidestim (https://www.covidestim.org/) по анализу динамики эпидемии COVID-19 в США.
- Научно-исследовательская группа при Имперском колледже Лондона под руководством Нила Фергюсона (https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/covid-19/), ведущая исследования по анализу развития эпидемии COVID-19 в Великобритании и в мире.
Предлагаемые методы и подходы, общий план работы на весь срок выполнения проекта:
В процессе реализации проекта будет использован новый подход к моделированию эпидемии COVID-19, альтернативный традиционному, базирующемуся на использовании классической модели SIR. Для моделирования динамики эпидемии предлагается использовать новую дискретную стохастическую модель распространения эпидемии CIRD (Cumulative Cases, Infected, Recovered, Dead) и апробировать новую процедуру построения цепочек распространения вируса в регионах России. Эта модель, в отличие от модели SIR, имеет иной набор переменных и описывает дискретную динамику общего количества заболевших (С), общего количества выздоровевших (R) и умерших (D), числа активных случаев (I). Параметрами предлагаемой модели являются процентный прирост величины общего количества заболевших C(t) и характеристика динамического баланса эпидемиологического процесса, впервые вводимая авторами проекта. Оба параметра в общем случае являются стохастическими и нестационарными.
Моделирование и прогнозирование динамики показателя C(t) будет осуществляться с помощью его представления с использованием формулы ежедневной капитализации процента, широко применяемой в теории финансов. При этом процентная ставка приобретает смысл ежедневного процентного прироста показателя C(t), является случайной величиной с неизвестной функцией распределения и входит в число параметров предлагаемой модели. Выбор прогнозируемых значений ежедневного процентного прироста будет основан на методе прецедентов и процедуре выбора цепочки распространения вируса, один из способов применения которых был использован авторами проекта при проведении пробных экспериментов по прогнозированию динамики этого показателя в России в течение мая-июня 2020 года. В целом, эксперимент оказался удачным. Так на промежутке от 23.04.2020 до 30.06.2020 спрогнозированные траектории имели среднее значение отклонения от фактических 0,37%. 30 июня отклонение оказалось равным минус 1,17%. Этот результат был получен при использовании нового прототипа интеллектуальных алгоритмов класса PDRM (Predictive Dynamic Regression Model) на основе методов машинного обучения. Для моделирования и прогнозирования динамики показателя R(t) (общего количества выздоровевших и умерших) предполагается использовать принцип динамического баланса эпидемиологического процесса, констатирующий динамическую сбалансированность значений общего количества заболевших в прошлые периоды и значений общего количества выздоровевших и умерших в текущий момент времени. Для описания сбалансированности указанных показателей будет введено понятие характеристики динамического баланса. Для построения среднесрочных прогнозов динамики показателей R(t) и I(t) будут разработаны прототипы специальных интеллектуальных алгоритмов прогнозирования траектории характеристики динамического баланса, основанные на методах машинного обучения. Предполагается исследование вопроса об оценке эффективности использовании этих алгоритмов, как на промежутках стационарности, так и на промежутках не стационарности эпидемиологического процесса (относительно этой характеристики).
В рамках проекта планируется исследовать возможность применения методов машинного обучения для прогнозирования численных показателей эпидемий и апробировать их на исторических данных развития пандемии COVID-19 в России. В частности, планируется преодолеть основные недостатки существующих подходов, основанных на машинном обучении, такие как невозможность учета развития эпидемии в других странах (1), неприменимость методов при отсутствии или малом объеме исторических данных (2), низкое качество прогнозирования на периоды больше одной недели (3).
Большинство предлагаемых методов машинного обучения использует исторические данные о развитии эпидемии в конкретной локации для оценки параметров модели, игнорируя данные из других географических регионов. Использование данных из множества регионов для оценки параметров модели позволит учитывать выявленные в процессе анализа закономерности динамики некоторых данных из множества регионов (например, стран из цепочки распространения) для прогнозирования развития эпидемии в одном регионе. Подходы few-short learning (обучение по малому числу примеров) и zero-shot learning (обучение без примеров) позволяет как использовать данные о развитии эпидемии в других регионах, так и настраивать параметры модели при отсутствии или малом объеме исторических данных в рассматриваемом регионе.
Для исследования возможности увеличения максимально допустимого горизонта прогнозирования модели CIRD, предполагается разработка итерационной процедуры прогнозирования на основе model-based методологии, предусматривающей последовательное применение на каждом следующем промежутке прогноза результатов прогнозирования с использованием модели CIR на предыдущем промежутке.
Общий план работы
2023 год
1. Формализованное описание региональной модели CIRD, принципа динамического баланса и характеристики динамического баланса
2. Подготовка и публикация широкого обзора научных статей о моделировании и прогнозировании вируса SARS-CoV-2.
3. Проведение исследований цепочек распространения COVID-19 в различных регионах на данных стопкоронавирус.рф и других открытых источников.
4. Разработка методологии сравнения методов прогнозирования развития эпидемий при наличии данных из разных географических регионов. Исследование подходов к использованию исторических данных из множества регионов для прогнозирования развития эпидемии в одном регионе.
5. Проведение вычислительных экспериментов по построению прогнозов динамики показателей модели CIRD в России и ряде регионов.
6. Разработка и оптимизация процедур вычисления интервальных оценок для значений показателей R(t), D(t) и показателя I(t).
7. Разработка новых прототипов алгоритмов для прогнозирования процентного прироста и характеристики динамического баланса.
8. Обобщение результатов применения модели CIRD на тестовых промежутках прогнозирования.
9. Сбор и аннотация исторических данных о внешних факторах, способных повлиять на развитие эпидемии COVID-19, такие как: крупные социальные события, изменения эпидемиологических ограничений.
10. Подготовка и публикация методологической статьи о новой модели CIRD в журнале индексируемом в Scopus.
11. Подготовка и публикация статьи по теме проекта, в журнале, индексируемом в Scopus.
2024 год
12. Разработка методологии учета внешних данных при обучении моделей машинного обучения для прогнозирования развития эпидемии. Проведение экспериментов по сравнению методов учета внешних данных в моделях машинного обучения.
13. Калибровка модели CIR на доступных данных пандемии коронавируса.
14. Исследование свойств характеристики динамического баланса. Проведение анализа динамики характеристики динамического баланса эпидемиологических процессов в России и регионах.
15. Проведение анализа точности прогнозирования статистических показателей пандемии в России при использовании CIRD модели и разработанных в рамках проекта новых алгоритмов.
16. Исследование возможности увеличения максимально допустимого горизонта прогнозирования модели, получение оценок точности прогнозирования для разных горизонтов прогнозирования и стран.
17. Разработка итерационных процедур прогнозирования на основе model-based методологии, позволяющих увеличить максимально допустимый горизонт прогнозирования при заданных ограничениях на точность прогноза.
18. Разработка и тестирование прототипа программного комплекса для прогнозирования статистических показателей эпидемии, предоставляющего возможность автоматической загрузки и обработки необходимых статистических данных.
19. Подготовка и публикация 2 статей
Имеющийся у научного коллектива научный задел по проекту, наличие опыта совместной реализации проектов:
Научный задел коллектива по проекту составляют теоретические и практические результаты применения разработанных в разное время подходов, методов и алгоритмов для решения задач в области моделирования и оптимизации потоков в больших транспортных сетях, маршрутизации транспорта на больших динамических сетях, алгоритмов стохастической оптимизации, методов последовательной подпространственной оптимизации.
В процессе реализации инициативного проекта «Эпидемия коронавируса в России. Аналитические заметки Центра интеллектуальной логистики» члены научной группы предложили новый подход к моделированию эпидемий новых вирусов в России и опубликовали ряд статей в журналах, входящих в Scopus [1-3].
Основные результаты исследований в области моделирования и оптимизации потоков в больших транспортных сетях, маршрутизации транспорта на больших динамических сетях, алгоритмов стохастической оптимизации, которые также могут составить научный задел по проекту, опубликованы в российских и зарубежных изданиях, индексируемых в информационно-аналитических базах данных РИНЦ, SCOPUS и Web of Science (в том числе, в Web of Science Core Collection). В этот период в изданиях, индексируемых в SCOPUS и/или Web of Science, были опубликованы 18 статей и опубликована монография «Optimization Models and Methods for Equilibrium Traffic Assignment» в серии “Tracts on Transportation and Traffic” издательства Springer (Том. 15, 234 стр.). Эти исследования опирались на первый важный результат руководителя проекта, касающийся проблемы временной состоятельности (динамической устойчивости) решений многошаговых динамических кооперативных игр и разработки метода регуляризации оптимальных решений таких играх с целью обеспечения их динамической устойчивости, который можно найти в статье [7]. Здесь были предложены новые оригинальные методы распределения выигрышей игроков вдоль условно-оптимальных траекторий динамической кооперативной игры, обеспечивающие динамическую устойчивость SC-ядра [6]. Идеи предложенного метода нашли свое применение в задачах маршрутизации транспорта на больших сетях при исследовании динамической устойчивости (временной состоятельности), как самих эвристических алгоритмов, так и генерируемых с помощью этих алгоритмов решений [5]. Основой для изучения проблемы временной несостоятельности эвристических алгоритмов, используемых при решении задач маршрутизации на больших сетях, послужили результаты большого количества новых оригинальных численных экспериментов по расчёту уровня временной состоятельности различных известных эвристик при решении тестовых задач из доступных библиотек, проведенные членами научной группы [4,5,8]. Однако, как было обнаружено практически во всех экспериментах, решения, генерируемые в текущих подзадачах маршрутизации, зачастую, обладают бо’льшим, чем в исходной задаче, уровнем динамической устойчивости. Опираясь на это свойство, в работе [4] были описаны новые методы динамической адаптации генетического алгоритма в задачах коммивояжера (TSP) и маршрутизации транспорта класса VRP, а также алгоритма ALNS (Adaptive Large Neighborhood Search) для решения задачи класса IRP (Inventory Routing Problem) [5]. Методология этих исследований может быть использована в целях реализации представленного проекта.
Кандидатская диссертация Балыкиной Ю.Е. по специальности 05.13.18 - математическое моделирование, численные методы и комплексы программ – была посвящена разработкам математических моделей функционирования щитовидной железы. Данный опыт разработки моделей биологических систем несомненно будет необходим и востребован в проекте. Балыкина Ю.Е. активно занимается научной деятельностью и является автором нескольких статей, в том числе индексируемых в РИНЦ, Scopus и WoS. Балыкина Ю.Е. является участником поддержанного РФФИ проекта «Разработка концепции совершенствования национального правового регулирования и наднационального регулирования в ЕврАзЭс в сфере здравоохранения в условиях развития инновационных цифровых технологий» (проект РФФИ № 18-29-16215). На протяжении многих лет Балыкина Ю.Е. занимается оценкой технологий здравоохранения. Одним из основных направлений её исследований является интеллектуальный анализ медицинских данных. Балыкиной Ю.Е. был предложен новый подход к ранжированию результатов поиска медицинских исследований, позволяющий автоматически извлекать из текстов данные о качестве проведенных клинических исследований и ранжировать результаты в соответствии с уровнями их доказательности и релевантности поисковому запросу [9]. Также, ею получены результаты в области моделирования прогнозирования развития резистентности бактерий к антибиотикам. Является соавтором монографии «Исследования реальной клинической практики», изданной в 2020 г. [10].
Список литературы
1. Zakharov V.; Balykina Y.; Petrosian O.; Gao H. CBRR Model for Predicting the Dynamics of the COVID-19 Epidemic in Real Time. Mathematics 2020, 8, 1727. https://doi.org/10.3390/math8101727
2. Zakharov, V., Balykina, Yu. Predicting the dynamics of the coronavirus (COVID-19) epidemic based on the case-based rea-soning approach. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes 2020, 16(3), 249–259.
3. Zakharov, V.; Balykina, Y. Balance Model of COVID-19 Epidemic Based on Percentage Growth Rate. Informatics and Auto-mation 2021, 20(5), 1034-1064. https://doi.org/10.15622/20.5.2
4. Захаров В.В., Мугайских А.В. Динамическая адаптация генетического алгоритма маршрутизации транспорта на больших сетях // Управление большими системами. Выпуск 73. М.: ИПУ РАН, 2018. С.108-133.
5. Zakharov V., Shirokikh V. Heuristic evaluation of the characteristic function in the Cooperative Inventory Routing Game // Journal of Vehicle Routing Algorithms. Volume 1, Issue 1, March 2018. P. 19-32.
6. Петросян, О. Л., Вольф, Д. А. & Захаров, В. В. О существовании ПРД-ядра в дифференциальных кооперативных играх 2017, в: МАТЕМАТИЧЕСКАЯ ТЕОРИЯ ИГР И ЕЕ ПРИЛОЖЕНИЯ. 9, 4, стр. 18-38 стр.
7. Petrosian O., Zakharov, V. IDP-core: Novel cooperative solution for differential games (2020) Mathematics, 8(5), 721
8. Alexander V. Mugayskikh ; Victor V. Zakharov ; Tero Tuovinen. Time- Dependent Multiple Depot Vehicle Routing Problem on Megapolis Network under Wardrop's Traffic Flow Assignment. 2018, 22nd Conference of Open Innovations Association (FRUCT). (http://www.scopus.com/inward/record.url?scp=85055553448&partnerID=8YFLogxK )
9. Камалов М.В., Балыкина Ю.Е., Добрынин В.Ю., Колбин А.С., Вербицкая Е.В. Алгоритм ранжирования результатов медицинских исследований по уровням доказательности на этапе получения ответов на поисковые запросы" Медицинские технологии. Оценка и выбор, no. 3 (29), 2017, pp. 11-21
10. Колбин А.С., Белоусов Д.Ю., Зырянов С.К., Омельяновский В.В., Балыкина Ю.Е. с соавт. Исследования реальной клинической практики — М.: Издательство ОКИ: Буки Веди, 2020. — 208 с.: ил. ISBN 978-5-4465-2902-5