Экспериментальные значения квантовых выходов генерации синглетного кислорода порфиринами были получены из статьи В.А. Ганжа с соавторами (Ganzha et al, 1989). В ходе QSPR моделирования в качестве зависимой переменной использовался квантовый выход в логарифмической форме. QSPR моделирование выполняли с использованием библиотеки scikit-learn языка программирования Python.
Исходные геометрии порфиринов и металлопорфиринов были получены с использованием программного пакета Spartan v. 16.
С использованием программы Spartan v. 16, функционала B3LYP и базиса 6-31G(d) геометрия порфиринов и металлопорфиринов была оптимизирована и рассчитаны основные квантово-химические дескрипторы: дипольны момент, относительная энергия Т1 триплетного состояния, энергии молекулярных орбиталей (HOMO-1, HOMO, LUMO, LUMO+1) и др. Также с использованием программного пакета Gaussian v. 16 был рассчитан ряд квантово-химических дескрипторов методом M06-2X/6-31G(d,p), а именно: энергии молекулярных орбиталей (HOMO-1, HOMO, LUMO, LUMO+1), разница энергий HOMO и LUMO орбиталей, электроотрицательность, дипольный момент, адиабатическая энергия T1 состояния, молекулярный объем, поляризуемость и т.д.
С использованием онлайн приложения OCHEM (Sushko et al, 2011) были рассчитаны значения 5270 дескрипторов, входящих в пакет Dragon v. 7. С помощью программы Genetic Algorithm v. 4.1 (https://dtclab.webs.com/software-tools), разработанного в университете г. Джадавпур (Индия) число Dragon дескрипторов было уменьшено до 157: в том числе были удалены дескрипторы со значением отличным от ноля в менее чем четырех случаях. С учетом квантово-химических общее число дескрипторов, использованных в QSPR анализе и машинном обучении составило 182.
Сначала провели QSPR моделирование только для порфириновых соединений, не имеющих в составе атомов металла. В тестовую выборку вошли пять соединений: (п-Br)4-тетрафенилпорфирин, 5,10-нитро-этиопорфирин, дейтеропорфирина диметиловый эфир, N-метил-октаэтилпорфирин и порфин. Методом случайного леса (RF) построили модель с высокими статистическими параметрами: R2 = 0,962, q2 = 0,787, pred_R2 = 0,869 и RMSE = 0.022. Модель была построена с использованием 8 деревьев и максимальной глубиной 10. Всего при построении модели использовали 54 дескриптора. Наибольший вклад при этом внесли два дескриптора: nDB (число двойных связей; относительный вклад -37.9%) и SpDiam_EA(bo) (топологический дескриптор; относительный вклад -17,8%).
Методом опорных векторов (SVR) построили модель №2 со статистическими параметрами: R2 = 0,968, q2 = 0,561, pred_R2 = 0,694 и RMSE = 0.072. Модель была построена с использованием линейного ядра и значения констант C и epsilon равными 0,0025. При построении модели использовали все 182 дескриптора. Наибольший вклад при этом внесли дескрипторы: MATS1m (относительный вклад -5.9%) и HATS4m (относительный вклад 5.3%).
Методом множественной линейной регрессии (MLR) была построена Модель №3 со статистическими параметрами: R2 = 0,863, q2 = 0,733, pred_R2 = 0,876 и RMSE = 0.043. Полученное регрессионное уравнение:
Log ФΔ = 1.829(+/-0.016) - 0.400(+/-0.228) MATS1e - 0.077(+/-0.026)*Eig02_EA(dm) + 0.345(+/-0.146)*HATS3m - 0.271(+/-0.112)*S1_fOSC
Как видно из уравнения, Модель №3 использует четыре дескриптора. Так, MATS1e (относительный вклад -43.4%) позволяет отличить молекулы, имеющие нитро-группы, которые негативно влияют на величину квантового выхода генерации синглетного кислорода. Дескриптор Eig02_EA(dm) (относительный вклад -37.2%) также позволяет выделить молекулы, несущие -NO2 группы. HATS3m (относительный вклад 16.1%) отличает молекулы, несущие атомы галогенов, что положительно влияет на величину квантого выхода генерации 1О2. S1_fOSC (относительный вклад -3.2%) – это сила осциллятора для электронного перехода S0S1, рассчитанная методом M06-2X/6-31G(d,p) для газовой фазы. Данный дескриптор обратно пропорционален Log ФΔ и вносит незначительный вклад в Модель №3. По-видимому, молекулы с высоким значением данного дескриптора имеют высокую интенсивность флуоресценции и низкую интенсивность интеркомбинационного конверсии, что выражается в снижении значений квантовых выходов ФT и ФΔ.
Далее работали с полным перечнем соединений, включая как порфирины, так и металлопорфирины (всего 32 молекулы). Так, методом случайного леса построили Модель №4 со статистическими параметрами: R2 = 0,949, q2 = 0,619, pred_R2 = 0,875 и RMSE = 0.067. Модель была построена с использованием 12 деревьев и максимальной глубиной 80. Всего при построении модели использовали 70 дескрипторов. Наибольший вклад при этом внесли два дескриптора: SpDiam_EA(bo) (топологический дескриптор; относительный вклад -37,4%) и SaaNH (электротопологический дескриптор; относительный вклад 12,7%).
Методом опорных векторов (SVR) построили модель №5 со статистическими параметрами: R2 = 0,991, q2 = 0,842, pred_R2 = 0,801 и RMSE = 0.013. Модель была построена с использованием линейного ядра и значения констант C и epsilon равных 0,005. При построении модели использовали все 182 дескриптора. Наибольший вклад при этом внесли дескрипторы: S1_energy (относительный вклад 1.4%) и Eig02_EA(dm) (относительный вклад -1.2%). S1_energy – это величина перехода S0S1, рассчитанная методом M06-2X/6-31G(d,p). По-видимому, наличие данного дескриптора отражает хорошо известную обратно-пропорциональную зависимость между энергией S1 синглетного состояния и константой химического тушения синглетного кислорода [Schweitzer, Schmidt, 2003]. Дескриптор Eig02_EA(dm) отличить молекулы, имеющие нитро-группы от молекул их не имеющих. Нитро-группы негативно влияют на квантовый выход генерации сингленого кислорода.
Методом множественной линейной регрессии (MLR) была построена Модель №6 со статистическими параметрами: R2 = 0,889, q2 = 0,744, pred_R2 = 0,866 и RMSE = 0.035. Полученное регрессионное уравнение:
Log ФΔ = -0.470(+/-0.682) - 0.052(+/-0.024* Eig02_EA(dm) - 0.660(+/-0.229)*MATS1e + 0.362(+/-0.138)*SpMax4_Bh(p) + 0.112(+/-0.175)*S1_fOSC + 0.343(+/-0.096)*HL_Gap
Как видно из уравнения, Модель №6 использует пять дескрипторов. Так, Eig02_EA(dm) (относительный вклад -37.2%) позволяет отличить молекулы, имеющие нитро-группы, которые негативно влияют на величину квантового выхода генерации синглетного кислорода. Дескриптор MATS1e (относительный вклад -36.9%) также позволяет выделить молекулы, несущие -NO2 группы. SpMax4_Bh(p) (относительный вклад 16.3%) отличает молекулы, несущие атомы в высокой поляризуемостью. S1_fOSC (относительный вклад 8.4%) – это сила осциллятора для электронного перехода S0S1, рассчитанная методом M06-2X/6-31G(d,p) для газовой фазы. Данный дескриптор прямо пропорционален Log ФΔ и вносит незначительный вклад в Модель №6: коэффициент детерминации R2 = 0.0029. HL_Gap (отн. вклад 1.2%) - это HOMO-LUMO гэп, рассчитанный методом B3LYP/6-31G(d,p) для газовой фазы. Величина данного дескриптора прямо пропорциональна Log ФΔ, но вносит незначительный вклад в модель.
Таким образом, нами доказано, что QSPR методология применима к анализу фотогенерации синглетног кислорода порфиринами и металлопорфиринами. Полученные результаты и модели имеют прикладную и теоретическую ценность.
По итогам работы подготовлена для печати публикация.
1. Ganzha VA, Gurinovich GP, Dzhagarov BM, Egorova GD, Sagun EI, Shul’ga AM. Influence of the molecular structure on the quenching of triplet states of porphyrins by molecular oxygen. J. Appl. Spectrosc. 1989; 50: 402–406.
2. Sushko I, Novotarskyi S, Körner R, Pandey AK, Rupp M, Teetz W, Brandmaier S, Abdelaziz A, Prokopenko VV, Tanchuk VY, Todeschini R, Varnek A, Marcou G, Ertl P, Potemkin V, Grishina M, Gasteiger J, Schwab C, Baskin II, Palyulin VA, Radchenko EV, Welsh WJ, Kholodovych V, Chekmarev D, Cherkasov A, Aires-de-Sousa J, Zhang QY, Bender A, Nigsch F, Patiny L, Williams A, Tkachenko V, Tetko IV. Online chemical modeling environment (OCHEM): web platform for data storage, model development and publishing of chemical information. J Comput Aided Mol Des. 2011; 25(6):533-554
3. Schweitzer C, Schmidt R. Physical Mechanisms of Generation and Deactivation of Singlet Oxygen. Chem Rev. 2003;103(5):1685-1757.