ВВЕДЕНИЕ
В Лаборатории биомолекулярного ЯМР СПбГУ сложились и развиваются следующие основные направления исследований: (1) Применение спектроскопии ЯМР и других биофизических методов в сочетании с методами компьютерного моделирования для исследования фундаментальных вопросов науки о белках; (2) Разработка новых ЯМР экспериментов и методов компьютерного моделирования для исследования белков; (3) Клеточные эксперименты для исследования пептидов и белков с потенциальным применением в области онкотерапии, а также лечения вирусных заболеваний; (4) Разработка методов определения белковых структур с использованием данных рентгеновской кристаллографии и ЯМР спектроскопии; (5) Развитие методов биоинформатики, включая алгоритмы машинного обучения, для характеризации белковых молекул.
В рамках проекта #1 мы завершили работу над нейросетевой программой PCANN для предсказания константы связывания белков по структуре соответствующего белок-белкового комплекса (статья за авторством О.О. Лебеденко, М.С. Половинкина, А.А. Казовской и Н.Р. Скрынникова находится на рецензировании в журнале Proteins: Structure, Function and Bioinformatics). Разработанная нами программа использует графовую модель в сочетании с языковой кодировкой ESM2 для описания интерфейса взаимодействия в белковом комплексе. Для обработки информации используется свёрточная нейронная сеть с механизмом внимания. Тестирование программы PCANN на прежде не использовавшейся выборке из 150 белковых комплексов показало, что новый алгоритм достигает наиболее высокой точности среди всех доступных на сегодняшний день нейросетевых предикторов, PPI-Affinity, ProBAN и BindPPI (1.3 ккал/моль против 1.4 ккал/моль для BindPPI). Проведенный нами анализ показал, что для дальнейшего повышения точности предсказаний необходимо увеличить объём данных, используемых для тренировки нейросетевых предикторов, и учесть вариации в экспериментальных условиях, применяемых при измерении констант связывания.
В рамках проекта #2 мы исследовали возможность использования компьютерных моделей белков, получаемых с помощью различных программ для предсказания белковых структур, в качестве моделей молекулярного замещения (MR) при определении структуры белка методом рентгеновской кристаллографии. Объектом для этого исследования был избран малый антивирусный белок LCB2, разработанный с использованием методов белковой инженерии, структура которого была впервые определена в нашей лаборатории. Как показали наши исследования, шесть программ-предикторов (AlphaFold3, AlphaFold2, MultiFold, Rosetta, RoseTTaFold и trRosetta) успешно справились с задачей создания продуктивных MR моделей. Полученные на их основе экспериментальные координаты LCB2 находятся в прекрасном согласии друг с другом (попарное среднеквадратичное отклонение атомных координат не превышает 0.25 Å), что иллюстрирует отличную сходимость процесса определения белковой структуры. В то же время для ряда боковых цепей на поверхности LCB2 в процессе решения были получены различные конформации. Моделирование кристаллов LCB2 методом молекулярной динамики подтвердило предположение о конформационной лабильности этих боковых цепей. Таким образом, нам удалось установить наличие конформационной динамики в ряде боковых цепей, опираясь на результаты многократного решения структуры с использованием различных стартовых моделей (отметим, что анализ карты электронной плотности не позволяет сделать подобного заключения). Рукопись с изложением описанных результатов за авторством С.А. Корбан, О. Михайловского, Д.А. Лузика, В.В. Гуржего, А.Д. Лёвкиной, О.О. Лебеденко, И.С. Подкорытова и Н.Р. Скрынникова подготовлена для отсылки в журнал International Union of Crystallography Journal – IUCrJ.
В рамках проекта #3 мы исследуем возможности для получения в лаборатории новых мини-белковых лигандов, предназначенных для связывания с избранными мишенями-рецепторами. С этой целью нами была освоена и локализована наиболее современная программа для дизайна белковых лигандов RFdiffusion. Для отдельных мишеней эта программа показывает высокий уровень эффективности, позволяя получить >10% успешных лигандов. Таким образом, открывается возможность для того, чтобы изготовить в лабораторных условиях небольшую партию кандидатных лигандов, подвергнуть их тестированию на предмет связывания с мишенью и идентифицировать среди них успешные конструкции. Для этой цели нами были разработаны специальные эксперименты с использованием метода соосаждения (pull-down assay). С помощью этих экспериментов были исследованы как мини-белки, полученные методом рекомбинантной экспрессии, таки и мини-белки, изготовленные методом твердофазного пептидного синтеза. При этом нам удалось успешно идентифицировать модельные лиганды с константами связывания от 0.5 нМ до 3 мкМ. Тем самым была продемонстрирована практическая возможность для получения новых белковых лигандов (аффител) с использованием минимальных лабораторных ресурсов.
В рамках проекта #4 мы исследуем возможность замены антител на аффитела в области биотехнологических приложений и, конкретно, в сфере клинической диагностики методом иммуногистохимии (ИГХ). Современные методы иммуногистохимии являются одним из эффективных инструментов клинической диагностики, а также могут рассматриваться как один из элементов системы мер для наблюдения за здоровьем. При этом с технической точки зрения ИГХ опирается на использование диагностических антител, которые достаточны сложны в разработке, крайне дороги в изготовлении и предъявляют высокие требования в отношении условий хранения и транспортировки. В качестве альтернативы антителам мы предлагаем использовать малые белки – аффитела, полученные с помощью методов белковой инженерии (см. выше). Аффитела обладают необходимой аффинностью и специфичностью для использования в исследованиях ИГХ. В то же время использование современных методов машинного обучения позволяет радикальным образом упростить разработку новых аффител. В отличие от дорогостоящих антител, аффитела дешевы в изготовлении, легко поддаются модификации (например, конъюгации с флуоресцентными метками) и не требуют особых условий хранения. В настоящем пилотном исследовании мы используем аффитело Zher2, предназначенное для связывания с онкорецептором HER2. Эффективность Zher2 была продемонстрирована нами в экспериментах с HER2-позитивными клеточными линиями карциномы молочной железы BT474 и SK-BR-3. В качестве следующего шага запланировано окрашивание срезов операционной ткани, полученной из HER2-позитивных опухолей (эксперименты проводятся на базе кафедры патологической анатомии РМАНПО). В качестве дополнительных мишеней для исследований с использованием аффител рассматриваются PD-L1, FGFR-4 и BCL2.
В рамках проекта #5 мы разработали классификацию процессов образования белковых комплексов (ассоциации-диссоциации), сопровождаемых изменениями в структурном состоянии белковых молекул (сворачивание-разворачивание). К настоящему времени в литературе описано семь подобных процессов. Например, широко известен механизм "сворачивания при связывании", когда изначально разупорядоченный белок после связывания с мишенью переходит в структурированное состояние. Проведенный нами комбинаторный анализ показал, что в общей сложности существует десять уникальных сценариев комплексообразования, сопровождаемых сворачиванием или разворачиванием взаимодействующих белков. Предметом отдельного анализа в нашей работе явился сценарий, при котором два разупорядоченных белка вступают во взаимодействие друг с другом, формируя в результате полностью структурированный комплекс. Биоинформатический анализ структурной базы данных PDB позволил выявить новые примеры комплексов, формирующихся по этому механизму, ZNHIT3–NUFIP1 и HsCen2–XPC. Нами также был выявлен ряд характерных особенностей, присущих таким комплексам. Сообщение о результатах данного исследования было опубликовано в статье [О.О. Lebedenko, А. Sekhar, N.R. Skrynnikov Proteins 92:1459-1463 (2024)].
В рамках проекта #6 мы предприняли комбинированное исследование отдельных подвижных элементов нуклеосомной частицы, используя для этого гетероядерную спектроскопию ЯМР, а также метод моделирования Молекулярной Динамики. Нуклеосомная частица, которую можно рассматривать как базовую единицу хранения генетической информации, представляет собой сборку из восьми белков-гистонов с навитой вокруг неё двухцепочечной ДНК. В составе гистонов особую важность имеют разупорядоченные концевые участки (так называемые хвосты), отвечающие за функционально значимые взаимодействия нуклеосомы с различными регуляторными белками. В свою очередь эти взаимодействия контролируются ковалентными модификациями индивидуальных остатков в составе гистонового хвоста. В нашей предшествующей работе мы показали, что благодаря электростатическим взаимодействиям разупорядоченный N-концевой хвост гистона H4 локализуется в окрестности нуклеосомной ДНК, что ограничивает его доступность для связывания с хроматин-ассоциированными белками. В данном проекте мы исследуем влияние нейтрализующих мутаций в хвосте H4 на его структурно-динамические свойства. В частности, наши соавторы исследовали эффект мутации R3M в гистоне H4, использовав для этой цели данные спиновой релаксации 15N. Полученные результаты говорят о том, что нейтрализующая мутация R3M ведёт к ослаблению электростатического взаимодействия с ДНК и, как следствие, увеличивает степень конформационной свободы гистонового хвоста. Для полноценной интерпретации полученных экспериментальных данных нами были построены четыре различные МД модели нуклеосомной частицы с использованием наиболее перспективных силовых полей и моделей воды; каждая из моделей представляет собой массив траекторий молекулярной динамики общей длительностью в 6 мкс. Для валидации МД моделей были использованы экспериментальные данные спиновой релаксации. Полученные результаты позволяют заключить, что мутация R3M, имитирующая в данном случае эффект ацетилирования аргинина, имеет следствием частичное высвобождение хвоста с поверхности нуклеосомной частицы и повышение его доступности для связывания с регуляторными факторами.
Наконец, в рамках проекта #7 мы разработали новый подход для реконструкции подвижных петель, отсутствующих в кристаллографических структурах белков. При решении рентгеновской структуры подвижные петли отображаются в виде распределённой электронной плотности низкой интенсивности, что не позволяет стандартными средствами определить координаты таких петель. В качестве альтернативы отсутствующие петли могут быть достроены постфактум с помощью специальных программ (например, соответствующая опция есть в программе Modeller). Однако подобные алгоритмы руководствуются лишь упрощёнными предположениями о конформационных предпочтениях петель, полностью игнорируя при этом их динамический характер. В нашей работе мы используем новый подход, при котором белковый кристалл моделируется в виде элементарной ячейки или суперячейки, содержащей множественные молекулы белка и внутрикристаллическую воду (включая объёмный растворитель). Для оптимизации модели мы записываем короткую траекторию МД, в ходе которой система эволюционирует под контролем (i) силового поля МД и (ii) специального потенциала, отражающего невязку между расчётными и экспериментальными данными рентгеновской дифракции. В результате искомая петля принимает форму конформационного ансамбля, причём система в целом характеризуется низкими значениями Rwork и Rfree, что свидетельствует о том, что модель удовлетворяет экспериментальным данным рентгеновской дифракции. Также следует отметить, что получаемое таким образом представление петли находится в соответствии с данными электронной плотности. Новый алгоритм реализован на платформе программы Amber, оснащённой модулем Xray, который был недавно разработан в нашей лаборатории. Мы рассчитываем, что новый метод позволит получать информацию о функционально важных петлях, конформационная подвижность которых играет роль при распознавании и связывании лигандов, аллостерическом контроле и других проявлениях функциональной динамики.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
1 Разработка нейросетевого алгоритма для предсказания константы связывания белков на основании структуры белок-белкового комплекса
Задача о предсказании константы связывания белков на основе структуры белок-белкового комплекса является одной из наиболее фундаментальных задач структурной биологии. На первый взгляд может показаться, что эта задача имеет достаточно простое решение: достаточно определить площадь гидрофобной поверхности, погребённой при формировании белкового комплекса, а также количество водородных связей и солевых мостиков на интерфейсе связывания, чтобы на этом основании оценить константу диссоциации K_dдля рассматриваемого комплекса (или, что эквивалентно, свободную энергию связывания ∆G^bind). Действительно, существует большое количество алгоритмов, использующих подобные принципы – например, методы MM/PBSA и MM/GBSA. Однако, как показывает многолетняя практика, все эти методы отличаются очень низкой точностью. Очевидно, что, помимо вышеописанных базовых закономерностей, аффинность белок-белкового комплекса определяется сотнями (тысячами) тонких и плохо поддающихся идентификации факторов, которые не учитываются в такого рода упрощённых алгоритмах.
В качестве альтернативы для решения данной задачи могут быть использованы методы машинного обучения, которые естественным образом приспособлены для решения задач со сложными многофакторными зависимостями. В рамках этого подхода мы разработали и реализовали новый алгоритм PCANN (Protein Complex Affinity by Neural Network) для предсказания ∆G^bind на основе структуры белковых комплексов. В этом алгоритме структурная информация отображается в виде графа, вершины которого соответствуют аминокислотным остаткам, расположенным на интерфейсе связывания. Вершинам графа приписаны вектора признаков, полученные из языковой модели ESM-2, кодирующей сложные структурные свойства белковой последовательности. Получаемый таким образом граф обрабатывается итеративным образом с помощью нейронной сети, включающей в себя высокоэффективный слой GAT (графовая сеть внимания) и стандартный слой GCN (графовая свёрточная сеть). Полученный результат редуцируется к значению ∆G^bind с помощью многослойного перцептрона.
Алгоритм PCANN был натренирован на тщательно отобранном наборе из 585 уникальных гетеродимерных белковых комплексов, для которых имеются данные ∆G^bind, полученные с помощью наиболее точных экспериментальных методов (изотермическая титрационная калориметрия и поверхностный плазмонный резонанс). Для последующего тестирования были дополнительно отобраны 150 белковых комплексов, которые никогда не ранее не использовались при тестировании программ, предназначенных для предсказания констант белок-белкового связывания. Этот массив данных был разбит на два набора, testA и testB, и в таком виде использован для тестирования программы PCANN, а также всех остальных разработанных к настоящему времени нейросетевых предикторов, PPI-Affinity [1], ProBAN [2]и BindPPI [3]. Было показано, что новый алгоритм обеспечивает более высокую точность предсказаний, чем все программы-конкуренты. Соответствующая погрешность составляет 1.3 ккал/моль у PCANN против 1.4 ккал/моль у лучшего из ранее созданных предикторов, BindPPI.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 1 – Результаты тестирования нового алгоритма для предсказания констант связывания белков, PCANN, других нейросетевых предикторов, PPI-Affinity, ProBAN и BindPPI, классического предиктора Prodigy [4], а также квази-случайного алгоритма Random. Тестирование проводилось на наборах данных testA и testB (тёмно- и светло-синие маркеры, соответственно), используя в качестве метрики среднюю абсолютную ошибку (mean absolute error, MAE).
Анализируя полученные результаты, мы пришли к выводу, что дальнейшее развитие и улучшение нейросетевых предикторов ограничивается двумя факторами: (1) относительно небольшой объём данных, доступный для тренировки и валидации предикторов, и (2) ограниченная точность экспериментальных данных и, в частности, отсутствие единообразия в том, что касается условий эксперимента (температура, pH, ионная сила раствора и т.д.). В качестве решения мы предлагаем реализовать специальный алгоритм для поиска в научной литературе дополнительных экспериментальных данных по константам диссоциации белковых комплексов; такой алгоритм должен использовать элементы искусственного интеллекта, однако окончательный отбор данных остаётся за квалифицированным специалистом. Мы также предлагаем расширить описание системы, введя в рассмотрение дополнительные параметры, описывающие условия экспериментальных измерений.
2 Использование компьютерных моделей молекулярного замещения для решения белковых структур на примере малого белка LCB2
К настоящему времени 73% всех кристаллографических белковых структур, содержащихся в базе данных PDB, получены с помощью метода молекулярного замещения (molecular replacement, MR). Этот метод использует приближенную MR модель в качестве начальной аппроксимации для дальнейшего получения высокоточной структуры на основе данных рентгеновской дифракции. До недавнего времени в роли MR моделей выступали исключительно структуры белков, обладающих высокой степенью гомологии по отношению к исследуемому белку. Однако после появления нейросетевой программы для предсказания белковых структур, AlphaFold2, появилась возможность для использования в этом качестве компьютерных моделей.
Предметом настоящего исследования стал малый белок LCB2, сконструированный с помощью методов белковой инженерии [5]. Кристаллографическая структура этого белка была недавно получена в нашей лаборатории (PDB код 8c3e). В рамках описываемой работы мы исследовали применимость компьютерных моделей, полученных с помощью различных программ-предикторов, для определения структуры данного белка. Мы выяснили, что модели, сгенерированные программами AlphaFold3 [6], AlphaFold2 [7], MultiFOLD [8], Rosetta [9], RoseTTAFold [10] и trRosetta [11], позволяют успешно решить структуру, в то время как модели QUARK, Phyre2, I-TASSER и SWISS-MODEL оказались непродуктивными.
На Рис. 2 показаны примеры успешных MR моделей и полученных на их основе финальных структур. Как можно видеть, основные структурные различия между ними сводятся к следующему: (i) конформация короткой петли, соединяющей спирали 2 и 3, а также (ii) для структур, полученных из MR моделей RoseTTAFold и trRosetta, сдвиг спирали 3 относительно спиралей 1 и 2. Эти различия удобно визуализировать с помощью так называемого метода главных компонент (principal component analysis, PCA). Получаемая таким образом карта PC1-PC2 иллюстрирует отличную сходимость процесса определения структуры при использовании шести различных стартовых моделей. При этом разработанная нами специальная методика для восстановления структурных моделей по компонентам PC1, PC2, ... PC12 позволила показать, что компонента PC1 преимущественно отражает конформацию петли, а компонента PC2 – сдвиг спирали. Отдельно следует отметить, что изменения в конформации петли является следствием кристаллического контакта в кристалле LCB2. Таким образом, можно констатировать, что программы-предикторы правильно предсказали этот аспект структуры, а наблюдаемые различия связаны со спецификой кристаллографического эксперимента.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 2 – Наложение компьютерных моделей малого белка LCB2 (красный цвет) и полученных с их помощью методом молекулярного замещения финальных кристаллографических структур (синий цвет).
Предметом отдельного исследования послужили боковые цепи LCB2. По большей части конформации боковых цепей воспроизводятся от одного решения к другому. Однако мы наблюдали и исключения из этого правила: для нескольких боковых цепей конформации разнятся от структуры к структуре. Мы предположили, что причиной наблюдаемых расхождений является конформационная лабильность этих боковых цепей. В пользу этой гипотезы говорит тот факт, что такие цепи расположены на поверхности белка и при рентгеноструктурном анализе характеризуются низким уровнем электронной плотности. Чтобы проверить эту гипотезу нами были записаны МД траектории кристаллической ячейки LCB2 для структур, полученных из моделей AlphaFold3, AlphaFold2, MultiFOLD, Rosetta, RoseTTAFold и trRosetta (в общей сложности 6 траекторий, каждая продолжительностью 1 мкс). Как и ожидалось, во всех траекториях наблюдались многочисленные переходы между конформациями рассматриваемых боковых цепей. Интересно отметить, что конформационная динамика данных боковых цепей была обнаружена путём сравнительного анализа различных решений, а не стандартным методом (моделирование альтернативных конформаций).
Нами также было предпринято количественное сравнение стартовых MR моделей и соответствующих финальных структур с использованием следующих параметров: среднеквадратичное отклонение атомных координат (RMSD), глобальный тест на межатомные расстояния высокой точности (GDT-HA) и локальный тест на разницу в межатомных расстояниях (LDDT). Проделанный анализ показывает, что шесть финальных структур LCB2 находятся в отличном согласии друг с другом. Например, RMSD для всех тяжёлых атомов лежит в диапазоне 0.10-0.25 Å. Таким образом, полученные результаты позволяют оценить точность кристаллографической структуры. Все шесть полученных структурных моделей следует рассматривать как равноправные. Расхождения между ними отражают ограниченное разрешение дифракционных данных, что в свою очередь связано с неидеальным характером белкового кристалла (и, в частности, с конформационной динамикой боковых цепей).
3 Разработка экспериментов для валидации малых белковых лигандов, полученных методами белковой инженерии и предназначенных для связывания с фармакологическими белковыми мишенями
За последние несколько лет был достигнут беспрецедентный прогресс в развитии методов белковой инженерии, недавно отмеченный присуждением Д. Бейкеру Нобелевской премии в области химии. В первую очередь, речь идёт о конструировании de novo белков, обладающих высокой связывающей способностью по отношению к фармакологическим мишеням с известной структурой (включая онкологические и вирусные мишени). Два года назад процент успешных конструкций, получаемых в процессе компьютерного дизайна подобных белковых лигандов, составлял 0.01-1.0% в зависимости от избранной мишени [12]. На практике это означало, что для отбора высокоэффективных лигандов необходимо было использовать сложную и громоздкую экспериментальную процедуру на основе методов дрожжевого дисплея, в рамках которой требовалось синтезировать десятки тысяч последовательностей ДНК, кодирующих соответствующие аминокислотные последовательности. Ситуацию удалось заметно изменить к лучшему за счёт применения специальной программы-фильтра [13], использующей передовую платформу для предсказания белковых структур, AlphaFold2 [7]. Вслед за этим появился принципиально новый алгоритм для конструирования белковых лигандов, RFdiffusion, что позволило повысить процент успешных конструкций до 1-10% [14]. Наконец, несколько месяцев назад был обнародован алгоритм AlphaProteo, эффективность которого составляет >10% [15]. Таким образом появилась возможность реализовать успешные de novo лиганды в условиях обычной биохимической лаборатории, оснащённой стандартным оборудованием для рекомбинантной экспрессии белков. В рамках данного проекта мы разработали тесты для экспериментальной валидации мини-белковых лигандов, полученных методом компьютерного дизайна.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 3 – Две схемы экспериментов с использованием метода белковой ко-преципитации (pull-down assays), разработанные для регистрации связывания мини-белкового лиганда с предназначенной для него мишенью. Обозначения приведены справа от рисунка.
Схема двух простых экспериментов для валидации белковых лигандов представлена на Рис. 3. В первом эксперименте исследовалась мишень в виде вирусного белка, полученного в нашей лаборатории методом рекомбинантной экспрессии в культуре P. pastoris, и ряд разработанных для неё малых белковых лигандов [5], полученных методом твердофазного пептидного синтеза с использованием автоматизированного микроволнового синтезатора. Отдельно следует отметить, что полученный в результате синтеза пептидный материал (Pepmic Inc., Китай) применялся без хроматографической очистки, т.к. предлагаемый эксперимент фактически выполняет также и функцию отделения целевого мини-белка от побочных продуктов синтеза. В ходе эксперимента использовались никелевые магнитные наночастицы с покрытием в виде белка-мишени (для этой цели белок-мишень был получен в виде слияния с гистидиновым тэгом). После инкубации наночастиц с раствором кандидатного мини-белка и последующей многократной отмывки, мишень и связавшийся с ней лиганд отделялись от наночастиц посредством отмывки концентрированным раствором имидазола. Для детекции был использован стандартный метод гель-электрофореза ДСН-ПААГ. Присутствие на геле полосы от малого белка свидетельствует об его успешном связывании с мишенью. С помощью данного метода нами было зарегистрировано связывание малых белков с аффинностью в диапазоне от 0.5 до 50 нМ.
Во второй разновидности эксперимента мы использовали рекомбинантные мини-белки, полученные в нашей лаборатории методом экспрессии в культуре E. coli. Мини-белки были экспрессированы с дополнительно введённым в последовательность остатком цистеина, размещённом на N-терминальном конце, а затем помечены в этой позиции флуоресцентной меткой Cy5. После смывания мишени и связанного с ней лиганда с поверхности наночастиц, присутствие мини-белкового лиганда детектируется по ярко-выраженному сигналу поглощения в видимой области спектра. С помощью данной методики нам удалось зарегистрировать связывание с мишенью мини-белкового лиганда с аффинностью 3 мкМ. Таким образом, предлагаемый тест даёт возможность идентифицировать все мини-белковые конструкции, которые классифицируются как перспективные в практике разработки мини-белковых лигандов (т.е. обладают средней или высокой аффинностью к предназначенной для них мишени).
Для тестирования малой серии кандидатных мини-белковых лигандов (ок. 10 конструкций) нами была предложена модификация вышеописанного эксперимента. В данном случае никелевые наночастицы инкубируются с лизатом клеточной культуры E. coli, экспрессирующей мини-белок, оснащённый полигистидиновым тэгом. Таким образом, нам удаётся выделить необходимый для эксперимента мини-белок, не прибегая к стандартной хроматографической очистке. В качестве следующего шага магнитные наночастицы с покрытием из мини-белкового лиганда инкубируются с раствором белка-мишени, конъюгированного с флуоресцентной меткой Cy5. Связывание лиганда с мишенью детектируется при помощи сигнала поглощения аналогично тому, как это показано на Рис. 3.
Разработанные нами экспериментальные протоколы дают возможность реализовать в рамках стандартной биохимической лаборатории полный цикл шагов для получения мини-белковых de novo лигандов с потенциальной биомедицинской и биотехнологической значимостью.
4 Разработка принципов иммуногистохимического исследования с заменой антитела на малый белковый лиганд, полученный методом белковой инженерии
В предшествующей главе мы осветили стремительное развитие методов белковой инженерии и, в частности, методов для разработки белковых лигандов значимых биомедицинских мишеней. Подобные лиганды можно рассматривать как функциональные аналоги антител. Они обладают не менее высокой аффинностью по отношению к мишени и (предположительно) сравнимой специфичностью. К числу преимуществ мини-белковых лигандов, также известных как аффитела, можно отнести дешевизну изготовления, которая выгодно отличает их от антител, высокую стабильность и простоту в хранении. На этом основании можно было бы предположить, что аффитела могут послужить успешной альтернативой для терапевтических антител, которые приобрели огромную важность в терапии онкологических и аутоиммунных заболеваний.
Однако фактически на сегодняшний день аффитела не получили внедрения в клиническую практику. По всей видимости, тому есть несколько причин. Во-первых, это ограниченное время жизни аффител в кровотоке, которое, как правило, не превышает нескольких часов. Во-вторых, по имеющимся данным аффитела обладают определённым (нежелательным) иммуногенным эффектом. В-третьих, имеющиеся методы для дизайна аффител не позволяют пока охватить весь тот круг разнообразных мишеней, против которых могут эффективно использоваться моноклональные антитела.
В этой ситуации мы обратились к потенциальным применениям аффител в области биотехнологии. В отличие от фармакологических приложений, использование аффител в биотехнологии не ограничивается их иммуногенностью или временем пребывания в кровотоке. В качестве пилотного проекта мы инициировали исследование аффител в контексте иммуногистохимических (ИГХ) исследований. Речь идёт об оценке уровня экспрессии определённых белков – онкомаркеров в биологических образцах. Для первой серии экспериментов были отобраны следующие мишени: HER2, PD-L1, FGFR-4 и BCL2. Все эти мишени являются объектом исследований ИГХ, причём первые две исследуются рутинным образом с использованием антител в лабораториях клинической диагностики. Замена дорогих антител на дешёвые аффитела позволяет значительным образом снизить стоимость таких исследований [16-19]. Помимо этого можно отметить тот факт, что аффитела можно легко изготовить в виде конъюгата с флуоресцентной меткой, что даёт дополнительные возможности для регистрации данных ИГХ.
На Рис. 4 показаны результаты выполненного в нашей лаборатории тестирования аффитела Zher2 с клетками A549 (карцинома легкого), BT474 и SK-BR-3 (карциномы молочной железы). Как можно видеть из приведенных данных, аффитело Zher2 показывает высокий уровень специфичности к предназначенной мишени, HER2. В качестве следующего шага аналогичные данные будут получены на срезах операционных тканей. Проект проводится в сотрудничестве с Лабораторией патоморфологии «Laboratoires De Genie» (структурное подразделение ООО «НПФ Хеликс», контактное лицо: руководитель компании А.С. Козлов), а также Л.Э. Завалишиной (д.м.н., профессор кафедры патологической анатомии РМАНПО), являющейся ведущим отечественным специалистом по иммуногистохимии. Мы ставим своей целью показать, что широкий круг лабораторно-диагностических исследований, включая исследования ИГХ, могут успешно проводиться с заменой дорогостоящих диагностических антител на значительно более доступные и простые в хранении аффитела.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 4 – Окраска HER2-негативной клеточной линии A549 (30 транскриптов/млн) и HER2-позитивных клеточных линий BT474 (2000 транскриптов/млн) и SK-BR-3 (2450 транскриптов/млн) с помощью аффитела Zher2 конъюгированного с меткой Cy5. Результаты получены в Лаборатории био-ЯМР СПбГУ.
5 Классификация переходов между структурно упорядоченными и разупорядоченными состояниями белков при образовании белок-белковых комплексов
В классическом представлении, основывающемся на данных рентгеновской кристаллографии, белок представляет собой высокоструктурированную молекулу, архитектура которой уникальным образом определяется её аминокислотной последовательностью. Лишь спустя почти пятьдесят лет после получения первых кристаллографических структур белков появилось представление о том, что многие белковые молекулы в физиологических условиях существуют в альтернативном состоянии, а именно в форме разупорядоченной или частично разупорядоченной полипептидной цепочки. Это открытие существенно изменило облик современной структурной биологии. В частности, большое значение приобрёл вопрос о переходе белков из разупорядоченного в упорядоченное состояние и обратно в контексте физиологических взаимодействий. Было показано, что нативно разупорядоченные белки (intrinsically disordered proteins, IDPs) часто переходят в структурированную форму при связывании с белком-мишенью, обладающим стабильной структурой. Этот механизм получил название "свёртывание при связывании" (folding upon binding) [20]. Однако этот сценарий отнюдь не является единственным. Нередко нативно разупорядоченный белок сохраняет свой разупорядоченный характер и после связывания с мишенью, образуя так называемые "нечёткие комплексы" (fuzzy complexes) [21]. Также были описаны и другие варианты поведения белковых молекул при их связывании друг с другом.
В рамках данного проекта мы впервые предложили полную классификацию для процессов свёртывания/развёртывания взаимодействующих белков в результате их связывания/диссоциации. Как выяснилось, классификация насчитывает десять уникальных процессов, семь из которых уже были описаны ранее в литературе и в той или иной мере получили экспериментальное подтверждение, тогда как ещё три сценария вплоть до публикации нашей работы [22] оставались неописанными. Мы предполагаем, что такого рода новые мотивы рано или поздно будут идентифицированы при исследовании многообразных и сложных белковых взаимодействий.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 5 – Структуры комплексов NUFIP1462–495 / ZNHIT385–155 [25] и HsCen294–172 / XPC847–863 [26], формируемых путём связывания двух разупорядоченных полипептидных цепочек.
Среди известных механизмов мы остановились на сценарии, при котором два разупорядоченных белка, связываясь друг с другом, формируют полностью структурированный комплекс. В рамках проекта был предпринят биоинформатический анализ банка данных PDB с целью отыскать новые примеры белок-белковых комплексов, сформированных подобным образом. Для этого была использована программа flDPnn, позволяющая идентифицировать нативно разупорядоченные последовательности [23], а также эмпирический метод NMA-NIA, позволяющий идентифицировать такого рода белки по структурным данным (после свёртывания IDP при связывании с мишенью) [24]. Проделанный анализ позволил выявить два новых примера искомых комплексов, ZNHIT3–NUFIP1 и HsCen2–XPC. В обоих комплексах первая компонента обладает низкой стабильностью и в отсутствие лиганда существует в виде так называемой "расплавленной глобулы". Однако при взаимодействии с пептидным лигандом оба белка переходят в структурированное состояния, образуя укладку из α-спиралей, напоминающую по форме клипсу (в первом случае П-образную, а во втором случае Λ-образную); при этом пептидный лиганд играет роль вкладыша, трансформируясь в линейную α-спираль. Соответствующие структуры проиллюстрированы на Рис. 5.
6 Исследование динамики подвижного N-концевого хвоста гистона H4 в составе коровой нуклеосомной частицы как функции мутаций, имитирующих ковалентные модификации
Нуклеосомная частица, являющаяся базовой единицей хранения генетической информации, представляет собой сборку из белков-гистонов (по две копии гистонов H2A, H2B, H3 и H4) с навитой вокруг неё в ~1.7 оборота двухцепочечной ДНК. Отличительной особенностью гистонов является наличие у них разупорядоченных концевых последовательностей, известных под названием гистоновых хвостов. Гистоновые хвосты играют роль своего рода причальных концов, к которым крепятся различные хроматин-ассоциированные белки (chromatin associated proteins, CAPs), включая транскрипционные факторы, контролирующие транскрипцию генов. Для регулирования этих сложных процессов используются хроматин-модифицирующие ферменты, осуществляющие ковалентные модификации определённых остатков в составе хвостов, что в свою очередь влияет на их связывание с CAPs.
Со структурной точки зрения гистоновые хвосты представляют собой последовательности с высоким содержанием положительно заряженных остатков, аргинина и лизина. Электростатическое взаимодействие между положительно заряженными гистоновыми хвостами и отрицательно заряженной нуклеосомной ДНК приводит к эффекту "конденсации" хвостов на поверхности нуклеосомной частицы. Однако при этом гистоновые хвосты сохраняют достаточно высокую степень конформационной подвижности, взаимодействуя с ДНК по механизму нечёткого взаимодействия (fuzzy interaction), как это было показано в недавних работах с участием нашей лаборатории [27, 28]. Эффект локализации гистоновых хвостов на поверхности нуклеосомы снижает их доступность для связывания с CAPs, тем самым оказывая определённое влияние на функциональные свойства хроматина.
Нейтрализующие модификации, такие как метилирование остатков аргинина или ацетилирование остатков лизина, ведут к ослаблению взаимодействия гистоновых хвостов с нуклеосомной ДНК и, как следствие, повышают их доступность для связывания с CAPs. В настоящей работе мы задались целью исследовать данное поведение, имитируя эффект ковалентных модификаций путём введения в последовательность гистонов соответствующих нейтрализующих мутаций. В качестве первой мишени был избран остаток R3 в N-концевом хвосте гистона H4, играющий по отношению к данному хвосту роль своеобразного подвижного якоря. Первоначальный план работы предусматривал исследование образца нуклеосомной коровой частицы (nucleosome core particle, NCP), содержащей в своём составе гистон H4 с нейтрализующей мутацией R3A. Однако конструкция H4 R3A показала очень низкий уровень экспрессии; предпринятые в нашей лаборатории попытки оптимизировать последовательность кодонов, используемую для клонирования данной последовательности, и применить альтернативный протокол рефолдинга при экспрессии белка в культуре E. coli не привели к желаемому результату. В силу этого было принято решение использовать конструкцию H4 R3M. Требуемый материал с изотопным обогащением H4 R3M по изотопу 15N был успешно получен в лаборатории наших партнёров и использован для изготовления образца NCP. Для исследования динамики модифицированного гистонового хвоста H4 в данном образце были проведены измерения скоростей спиновой релаксации 15N, что позволяет оценивать степень конформационной подвижности хвоста (см. Рис. 6).
Для того чтобы интерпретировать полученные экспериментальные данные в терминах структурно-динамической модели, мы обратились к методу Молекулярной Динамики (МД). Большой размер исследуемой системы и наличие в её составе протяжённых разупорядоченных фрагментов (гистоновых хвостов) предъявляет особые требования к протоколу МД моделирования. Для того чтобы получить статистически достоверную картину поведения гистоновых хвостов, необходимо использовать расширенную ячейку моделирования и длительные траектории. С тем чтобы решить эту задачу нами был в инициативном порядке организован международный консорциум, куда помимо нашей лаборатории вошли также исследовательские группы проф. А. Онуфриева (Политехнический университет Виргинии, США), проф. А. Панченко (Университет Квинс, Канада), проф. Й Шу (Университет Циньхуа, Китай) и проф. А. Шайтана (МГУ). Путём коллективного обсуждения мы отобрали четыре наиболее перспективных протокола моделирования, использующих следующие комбинации силовых полей и моделей воды: amber ff14SB / TIP4P-D, amber ff99sb-disp / TIP4P D*, amber ff99sb / OPC и amber19sb / OPC. Последняя комбинация дополнительно исследуется в ускоренном варианте (шаг интегрирования 4 фс) с применением схемы перераспределения масс для атомов водорода.
К настоящему моменту силами участников консорциума записан полный набор траекторий МД для нуклеосомной частицы, содержащей гистон H4 дикого типа. В общей сложности, длительность записанных траекторий составляет 26 мкс. Также записано более половины от аналогичного массива данных для нуклеосомы, содержащей H4 R3M. Силами нашей лаборатории подготовлен пакет программных скриптов для обработки полученных траекторий на платформе github. На первом этапе предусматривается оценка траекторий по параметру среднеквадратичного отклонения атомных координат от начальной модели (root mean square deviation, RMSD), а также расчёт скоростей релаксации спинов 15N в подвижном хвосте гистона H4. Изначально предполагалось, что вторая задача будет решаться с использованием отдельных функций из библиотеки pyxmolpp2, разработанной в нашей лаборатории. Однако сложности с установкой данной библиотеки в условиях постоянно эволюционирующей системной среды заставили нас предложить в качестве альтернативного решения программный пакет MDAnalysis [29].
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 6 – (A) Спектры 1HN,15N-HSQC, содержащие сигналы от подвижного N-концевого хвоста гистона H4 в составе нуклеосомной частицы (синий – нативный H4, красный – H4 R3M). Данные получены в лаборатории проф. К. Джароняка (Университет Огайо, США) на ЯМР спектрометре с рабочей частотой 1.2 ГГц. (B) Скорости спиновой релаксации 15N R2 в образцах нуклеосомы, содержащих нативный вариант H4 (синий), H4 R3M (красный), H4 K5Q/K8Q/K12Q/K16Q (оранжевый) и H4 K16Q (зелёный).
Полученные к настоящему времени релаксационные данные свидетельствуют о том, что нейтрализующая мутация R3M в составе N-концевого хвоста гистона H4 ведёт к значительному повышению конформационной подвижности в данной позиции, а также к заметным изменениям в динамике на всём протяжении хвоста. Однако релаксационные данные позволяют лишь условным образом оценить амплитуду движений гистонового хвоста и соответствующие временные константы. Напротив, интерпретация экспериментальных данных с применением (успешной) МД модели позволяет получить исчерпывающую картину происходящего, включая слабоспецифические взаимодействия между гистоновым хвостом и нуклеосомной ДНК и их влияние на доступность хвоста для связывания с хроматин-ассоциированными белками.
7 Реконструкции подвижных петель в кристаллографических структурах белков с помощью метода МД моделирования с ограничениями в виде экспериментальных данных рентгеновской дифракции
Данные рентгеновской кристаллографии составляют фундамент современных знаний о структурной биологии. В частности, кристаллографические структуры глобулярных белков отличаются высокой точностью, что даёт возможность осуществлять на их основе рациональный дизайн лекарственных средств, разрабатывать новые методы белковой инженерии и т.д. Однако рентгеновским структурам белков присущи и определённые ограничения. В частности, в них зачастую отсутствуют координаты подвижных элементов белковых молекул, таких как мобильные боковые цепи, концевые участки пептидной цепи, а также гибкие петли. Такого рода подвижные фрагменты плохо отображаются на карте электронной плотности и не поддаются реконструкции в ходе определения рентгеновской структуры с помощью стандартных инструментов.
В рамках данного проекта мы разрабатываем новый подход для того, чтобы охарактеризовать конформационное многообразие подвижных петель, координаты которых отсутствуют в рентгеновских структурах. Предлагаемый метод основан на том, чтобы дополнить данные рентгеновской дифракции (которые являются в данном случае неполными и низкоинформативными) данными МД моделирования, позволяющими достоверно воспроизводить многие аспекты белковой структуры и динамики. В качестве платформы для решения этой задачи была выбрана программа Amber [30], для которой силами нашей лаборатории был недавно реализован специальный модуль Xray, позволяющий ей работать с данными рентгеновской дифракции [31]. При использовании Amber, оснащённого модулем Xray, пользователем записывается траектория МД для системы, представляющей собой кристаллическую ячейку (или суперячейку), которая содержит множественные молекулы белка, а также внутрикристаллическую воду (включая объёмный растворитель). При этом координаты атомов эволюционируют под воздействием (i) стандартного потенциала силового поля и (ii) специального потенциала, отражающего рассогласование между экспериментальными и расчётными данными рентгеновской дифракции.
При решении задачи о реконструкции подвижных петель мы используем следующую схему (см. Рис. 7). В качестве первого шага конформация петли восстанавливается достаточно произвольным образом с использованием имеющихся для этой цели программных инструментов - например, программы Modeller [32]. Можно обратить внимание на то, что такого рода аппроксимация ведёт к резкому ухудшению показателей качества структуры с точки зрения согласия с данными рентгенодифракционного эксперимента (т.е. резкому росту факторов Rwork и Rfree). Поученная таким образом структура используется для построения кристаллической ячейки, для которой в свою очередь записывается короткая МД траектория, состоящая из фазы нагревания, эволюции, и последующего охлаждения. Моделирование проходит под контролем стандартного потенциала силового поля и, дополнительно, рентгенодифракционного потенциала, как это описано выше. В результате, в рамках кристаллической ячейки реализуются различные конформации петли, которые в совокупности успешно воспроизводят экспериментальные данные рентгеновской дифракции, как о том свидетельствует снижение факторов Rwork и Rfree.
Рисунки см. в файле РИСУНКИ-СКРЫННИКОВ.pdf.
Рисунок 7 – Схема алгоритма для восстановления отсутствующей петли в структуре концевого белка FliD из жгутика B. bacteriovorus (код PDB 6KTY), реализованного на платформе программы Amber с использованием модуля Xray.
Приведенная на Рис. 7 иллюстрация относится к концевому белку FliD из жгутика B. bacteriovorus (код PDB структуры 6KTY). Как можно видеть, реконструкция петли в виде конформационного ансамбля по описанному выше методу позволило улучшить значение Rfree с 0.26 до 0.24. При этом обобщённый индикатор качества структуры, показатель MolProbity, был улучшен с 1.79 до 0.24. Мы также можем видеть, что построенная модель находится в согласии с фрагментами электронной плотности, наблюдаемыми на соответствующей карте. В качестве текущей задачи мы занимаемся оптимизацией разработанного протокола (по отношению к таким параметрам как длительность моделирования, относительный вес двух компонент потенциала и т.д.), что должно привести к дальнейшему улучшению результатов. Предложенный подход реализует своего рода автоматически достигаемый баланс между рентгенодифракционными данными (для хорошо разрешённых элементов белковой структуры) и силовым полем МД (для плохо разрешённых структурных деталей). Мы ожидаем, что новый метод позволит, в частности, получить информацию о функционально важных петлях, конформационная подвижность которых играет роль при распознавании и связывании лигандов, аллостерическом контроле и других аспектах функциональной динамики белков.
ЗАКЛЮЧЕНИЕ
В этом заключительном разделе мы постараемся осветить значение проводимых нами исследований в более широком контексте развития соответствующих областей биофизики, структурной биологии, компьютерного моделирования и биоинформатики.
Наш первый проект посвящён разработке нейросетевого алгоритма для предсказания константы связывания по структуре белок-белкового комплекса. В ходе выполнения работы нам удалось систематическим образом протестировать все имеющиеся на сегодняшний день аналогичные программы-предикторы и сравнить их точность. Проделанный анализ показал, что разработанная нами программа, получившая название PCANN, обладает самой высокой точностью, 1.3 ккал/моль, превосходя по этому параметру всех конкурентов. Мы пришли к заключению, что высокоэффективный алгоритм машинного обучения, реализованный в программе PCANN, способен обеспечить и более высокую точность предсказаний, однако этому препятствует ограниченный объём экспериментальных данных, используемых для тренировки нейросети, а также вариации в условиях экспериментальных измерений. Для решения этой проблемы мы планируем расширить имеющуюся базу данных с помощью автоматизированных средств поиска информации, а также включить в описание системы дополнительные параметры, характеризующие условия измерений.
Во втором проекте мы использовали набор из шести различных компьютерных моделей малого белка LCB2 в качестве моделей молекулярного замещения при решении белковой структуры. В ходе исследования была продемонстрирована сходимость процесса решения структуры независимо от стартовой модели и оценена точность полученных координат LCB2. Рассматривая совокупность полученных решений, мы идентифицировали ряд боковых цепей, обладающих конформационной подвижностью. Этот результат был подтверждён данными МД моделирования соответствующего белкового кристалла. Примечательно, что идентификация конформационной динамики в боковых цепях оказалась возможна только с помощью реализованного нами метода с применением множественных стартовых структур; напротив, стандартные методы уточнения структуры с использованием карты электронной плотности не дают оснований предполагать для рассматриваемых остатков наличие конформационной динамики.
В третьем проекте мы обращаемся к вопросам получения так называемых аффител, то есть малых белковых лигандов, конструируемых с помощью методов белковой инженерии. Эффективность новейших методов дизайна белков достигла такого уровня, при котором >10% всех расчётных конструкций показывают успешное связывание с мишенью in vitro. Таким образом, открывается возможность для создания белковых лигандов к желаемым мишеням силами отдельно взятой исследовательской группы. В рамках данного исследования мы разработали эксперименты на основе метода ко-преципитации, предназначенные для тестирования и валидации кандидатных мини-белковых лигандов. С помощью этих экспериментов нам удалось продемонстрировать успешное связывание с мишенью нескольких малых антивирусных белков, изготовленных стандартным методом рекомбинантной экспрессии либо полученных с помощью твердофазного пептидного синтеза. Возможность создания новых аффител с использованием доступных лабораторных ресурсов расширяет арсенал экспериментальных средств для различных исследований в области молекулярной и клеточной биологии.
В частности, в нашем четвёртом проекте мы изучаем возможность применения аффител для иммуногистохимических исследований. В настоящее время широкий круг исследований ИГХ опирается на применение диагностических антител, которые достаточно сложны в разработке, крайне дороги в изготовлении и предъявляют высокие требования к условиям хранения и транспортировки. С другой стороны, разработка аффител не требует больших ресурсов (см. выше), они дешевы в изготовлении и не нуждаются в особых условиях хранения. Помимо этого, аффитела легко поддаются модификации (например, могут быть оснащены флуоресцентной меткой). В нашей работе мы исследовали аффитело Zher2, разработанное в качестве лиганда известного онкомаркера HER2. Проведенные нами эксперименты с использованием HER2-позитивных клеточных культур карциномы молочной железы человека продемонстрировали высокую аффинность и специфичность Zher2 и, в целом, применимость данного аффитела для ИГХ исследования соответствующих образцов операционной ткани; измерения с использованием гистологического материала проводятся на базе кафедры патологической анатомии РМАНПО.
В следующем, пятом проекте мы обратились к исследованиям структурно разупорядоченных белков. Одним из определяющих свойств таких белков считается их способность переходить в структурно упорядоченную форму при связывании со структурированным партнёром. Однако имеются и другие примеры, когда разупорядоченный белок сохраняет свой стохастический характер и после связывания с мишенью. Отталкиваясь от этих наблюдений, нам впервые удалось разработать классификацию переходов между структурно упорядоченными и неупорядоченными состояниями, происходящих как следствие связывания белков. Новая классификация насчитывает десять уникальных сценариев, семь из которых получили освещение в научной литературе. В нашей работе мы отдельно остановились на сценарии, в котором два разупорядоченных белка при связывании друг с другом формируют полностью структурированный комплекс. Проведенный нами биоинформатический анализ банка данных белковых структур PDB позволил выявить новые примеры такого рода комплексов, ZNHIT3–NUFIP1 и HsCen2–XPC.
Шестой проект посвящён исследованию разупорядоченных концевых участков белков-гистонов в нуклеосомной частице. Подвижные гистоновые "хвосты" играют ключевую роль при взаимодействии нуклеосомы с различными хроматин-ассоциированными белками, причём эти взаимодействия регулируются ковалентными модификациями отдельных остатков в составе хвостов (данный механизм контроля получил известность под названием гистонового кода). В нашей работе мы предположили, что нейтрализующие модификации (например, ацетилирование лизина или метилирование аргинина) ведут к ослаблению электростатического взаимодействия между гистоновым хвостом и нуклеосомной ДНК и тем самым увеличивают доступность хвоста для связывания с регуляторными факторами. Для того чтобы имитировать данный эффект, мы исследовали нейтрализующие мутации в составе гистонов (например, H4 R3M). Данные спиновой релаксации, полученные с помощью спектроскопии ЯМР, а также результаты МД моделирования показывают, что нейтрализующие мутации действительно способствуют высвобождению хвостов с поверхности нуклеосомной частицы, что имеет следствием увеличение подвижности хвостов и их доступности для связывания.
Наконец, в седьмом проекте мы представили новый алгоритм для реконструкции подвижных петель, отсутствующих в кристаллографических структурах белков. Новый подход использует модель белкового кристалла в виде элементарной ячейки или суперячейки, содержащей множественные молекулы белка, а также внутрикристаллическую воду. Начальная модель оптимизируется методом Молекулярной Динамики под контролем стандартного силового поля, а также специального потенциала, отражающего невязку между экспериментальными и расчётными данными рентгеновской дифракции. После оптимизации модели искомая петля принимает форму конформационного ансамбля, что отражает её динамический характер. Получаемая модель в целом характеризуется улучшенными значениями Rwork и Rfree, что свидетельствует о том, что модель удовлетворяет данным рентгенодифракционного эксперимента. Новый алгоритм реализован на базе МД платформы Amber с помощью модуля Xray, недавно разработанного в нашей лаборатории. Полученные результаты способны пролить дополнительный свет на роль подвижных петель в распознавании лигандов, аллостерическом контроле и других функционально важных процессах.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1.Romero-Molina S., Ruiz-Blanco Y. B., Mieres-Perez J., Harms M., Münch J.,Ehrmann M., Sanchez-Garcia E. PPI-Affinity: A Web Tool for the Prediction andOptimization of Protein–Peptide and Protein–Protein Binding Affinity // Journalof Proteome Research. ‒ 2022. ‒ T. 21, № 8. ‒ C. 1829-1841.
2. Bogdanova E. A., Novoseletsky V. N.ProBAN: Neural network algorithm for predicting binding affinity inprotein-protein complexes // Proteins. ‒ 2024.10.1002/prot.26700.
3. Zheng F., Jiang X., Wen Y., YangY., Li M. Systematic investigation of machine learning on limited data: A studyon predicting protein-protein binding strength // Computational and StructuralBiotechnology Journal. ‒ 2024. ‒ T. 23. ‒ C. 460-472.
4. Xue L. C., Rodrigues J. P.,Kastritis P. L., Bonvin A. M., Vangone A. PRODIGY: a web server for predictingthe binding affinity of protein-protein complexes // Bioinformatics. ‒ 2016. ‒T. 32, № 23. ‒ C. 3676-3678.
5. Cao L., Goreshnik I., Coventry B.,Case J. B., Miller L., Kozodoy L., Chen R. E., Carter L., Walls A. C., ParkY.-J., Strauch E.-M., Stewart L., Diamond M. S., Veesler D., Baker D. De novodesign of picomolar SARS-CoV-2 miniprotein inhibitors // Science. ‒ 2020. ‒ T.370, № 6515. ‒ C. 426-431.
6. Abramson J., Adler J., Dunger J.,Evans R., Green T., Pritzel A., Ronneberger O., Willmore L., Ballard A. J.,Bambrick J., Bodenstein S. W., Evans D. A., Hung C.-C., O’Neill M., Reiman D.,Tunyasuvunakool K., Wu Z., Žemgulytė A., Arvaniti E., Beattie C., Bertolli O.,Bridgland A., Cherepanov A., Congreve M., Cowen-Rivers A. I., Cowie A.,Figurnov M., Fuchs F. B., Gladman H., Jain R., Khan Y. A., Low C. M. R., PerlinK., Potapenko A., Savy P., Singh S., Stecula A., Thillaisundaram A., Tong C.,Yakneen S., Zhong E. D., Zielinski M., Žídek A., Bapst V., Kohli P., JaderbergM., Hassabis D., Jumper J. M. Accurate structure prediction of biomolecularinteractions with AlphaFold 3 // Nature. ‒ 2024. ‒ T. 630. ‒ C. 493-500.
7. Jumper J., Evans R., Pritzel A.,Green T., Figurnov M., Ronneberger O., Tunyasuvunakool K., Bates R., Žídek A.,Potapenko A., Bridgland A., Meyer C., Kohl S. A. A., Ballard A. J., Cowie A.,Romera-Paredes B., Nikolov S., Jain R., Adler J., Back T., Petersen S., ReimanD., Clancy E., Zielinski M., Steinegger M., Pacholska M., Berghammer T.,Bodenstein S., Silver D., Vinyals O., Senior A. W., Kavukcuoglu K., Kohli P.,Hassabis D. Highly accurate protein structure prediction with AlphaFold //Nature. ‒ 2021. ‒ T. 596, № 7873. ‒ C. 583-589.
8. McGuffin L. J., Edmunds N. S., GencA. G., Alharbi S. M. A., Salehe Bajuna R., Adiyaman R. Prediction ofprotein structures, functions and interactions using the IntFOLD7, MultiFOLDand ModFOLDdock servers // Nucleic Acids Research. ‒ 2023. ‒ T. 51, № W1. ‒ C.W274-W280.
9. Leman J. K., Weitzner B. D., LewisS. M., Adolf-Bryfogle J., Alam N., Alford R. F., Aprahamian M., Baker D.,Barlow K. A., Barth P., Basanta B., Bender B. J., Blacklock K., Bonet J.,Boyken S. E., Bradley P., Bystroff C., Conway P., Cooper S., Correia B. E.,Coventry B., Das R., De Jong R. M., DiMaio F., Dsilva L., Dunbrack R., Ford A.S., Frenz B., Fu D. Y., Geniesse C., Goldschmidt L., Gowthaman R., Gray J. J.,Gront D., Guffy S., Horowitz S., Huang P.-S., Huber T., Jacobs T. M., JeliazkovJ. R., Johnson D. K., Kappel K., Karanicolas J., Khakzad H., Khar K. R., KhareS. D., Khatib F., Khramushin A., King I. C., Kleffner R., Koepnick B., KortemmeT., Kuenze G., Kuhlman B., Kuroda D., Labonte J. W., Lai J. K., Lapidoth G.,Leaver-Fay A., Lindert S., Linsky T., London N., Lubin J. H., Lyskov S.,Maguire J., Malmström L., Marcos E., Marcu O., Marze N. A., Meiler J., MorettiR., Mulligan V. K., Nerli S., Norn C., Ó’Conchúir S., Ollikainen N.,Ovchinnikov S., Pacella M. S., Pan X., Park H., Pavlovicz R. E., Pethe M.,Pierce B. G., Pilla K. B., Raveh B., Renfrew P. D., Burman S. S. R., RubensteinA., Sauer M. F., Scheck A., Schief W., Schueler-Furman O., Sedan Y., Sevy A.M., Sgourakis N. G., Shi L., Siegel J. B., Silva D.-A., Smith S., Song Y.,Stein A., Szegedy M., Teets F. D., Thyme S. B., Wang R. Y.-R., Watkins A., ZimmermanL., Bonneau R. Macromolecular modeling and design in Rosetta: recent methodsand frameworks // Nature Methods. ‒ 2020. ‒ T. 17, № 7. ‒ C. 665-680.
10. Baek M., DiMaio F., AnishchenkoI., Dauparas J., Ovchinnikov S., Lee G. R., Wang J., Cong Q., Kinch L. N.,Schaeffer R. D., Millán C., Park H., Adams C., Glassman C. R., DeGiovanni A.,Pereira J. H., Rodrigues A. V., van Dijk A. A., Ebrecht A. C., Opperman D. J.,Sagmeister T., Buhlheller C., Pavkov-Keller T., Rathinaswamy M. K., Dalwadi U.,Yip C. K., Burke J. E., Garcia K. C., Grishin N. V., Adams P. D., Read R. J.,Baker D. Accurate prediction of protein structures and interactions using athree-track neural network // Science. ‒ 2021. ‒ T. 373, № 6557. ‒ C. 871-876.
11. Du Z., Su H., Wang W., Ye L., WeiH., Peng Z., Anishchenko I., Baker D., Yang J. The trRosetta server for fastand accurate protein structure prediction // Nature Protocols. ‒ 2021. ‒ T. 16,№ 12. ‒ C. 5634-5651.
12. Cao L., Coventry B., Goreshnik I.,Huang B., Sheffler W., Park J. S., Jude K. M., Marković I., Kadam R. U.,Verschueren K. H. G., Verstraete K., Walsh S. T. R., Bennett N., Phal A., YangA., Kozodoy L., DeWitt M., Picton L., Miller L., Strauch E.-M., DeBouver N. D.,Pires A., Bera A. K., Halabiya S., Hammerson B., Yang W., Bernard S., StewartL., Wilson I. A., Ruohola-Baker H., Schlessinger J., Lee S., Savvides S. N.,Garcia K. C., Baker D. Design of protein-binding proteins from the targetstructure alone // Nature. ‒ 2022. ‒ T. 605, № 7910. ‒ C. 551-560.
13. Bennett N. R., Coventry B.,Goreshnik I., Huang B., Allen A., Vafeados D., Peng Y. P., Dauparas J., BaekM., Stewart L., DiMaio F., De Munck S., Savvides S. N., Baker D. Improving denovo protein binder design with deep learning // Nature Communications. ‒ 2023.‒ T. 14, № 1. ‒ C. 2625.
14. Watson J. L., Juergens D., BennettN. R., Trippe B. L., Yim J., Eisenach H. E., Ahern W., Borst A. J., Ragotte R.J., Milles L. F., Wicky B. I. M., Hanikel N., Pellock S. J., Courbet A.,Sheffler W., Wang J., Venkatesh P., Sappington I., Torres S. V., Lauko A., DeBortoli V., Mathieu E., Ovchinnikov S., Barzilay R., Jaakkola T. S., DiMaio F.,Baek M., Baker D. De novo design of protein structure and function withRFdiffusion // Nature. ‒ 2023. ‒ T. 620, № 7976. ‒ C. 1089-1100.
15. Zambaldi V., La D., Chu A. E.,Patani H., Danson A. E., Kwan T. O., Frerix T., Schneider R. G., Saxton D.,Thillaisundaram A. De novo design of high-affinity protein binders withAlphaProteo // arXiv preprint arXiv:2409.08022. ‒ 2024.
16. Ekerljung L., Lennartsson J.,Gedda L. The HER2-binding affibody molecule (Z(HER2∶342))₂ increases radiosensitivity in SKBR-3 cells // PLoS One.‒ 2012. ‒ T. 7, № 11. ‒ C. e49579.
17. Ciesiołkiewicz A., Lizandra PerezJ., Skalniak L., Noceń P., Berlicki Ł. Miniprotein engineering for inhibitionof PD-1/PD-L1 interaction // Protein Sci. ‒ 2024. ‒ T. 33, № 8. ‒ C. e5106.
18. Cerliani J. P., Vanzulli S. I.,Piñero C. P., Bottino M. C., Sahores A., Nuñez M., Varchetta R., Martins R.,Zeitlin E., Hewitt S. M., Molinolo A. A., Lanari C., Lamb C. A. Associatedexpressions of FGFR-2 and FGFR-3: from mouse mammary gland physiology to humanbreast cancer // Breast Cancer Res Treat. ‒ 2012. ‒ T. 133, № 3. ‒ C. 997-1008.
19. Biesaga B., Niemiec J., Ziobro M.BCL-2, topoisomerase IIα, microvessel density and prognosis of early advancedbreast cancer patients after adjuvant anthracycline-based chemotherapy // JCancer Res Clin Oncol. ‒ 2014. ‒ T. 140, № 12. ‒ C. 2009-19.
20. Dyson H. J., Wright P. E. Couplingof folding and binding for unstructured proteins // Current Opinion inStructural Biology. ‒ 2002. ‒ T. 12, № 1. ‒ C. 54-60.
21. Tompa P., Fuxreiter M. Fuzzycomplexes: polymorphism and structural disorder in protein-protein interactions// Trends in Biochemical Sciences. ‒ 2008. ‒ T. 33, № 1. ‒ C. 2-8.
22. Lebedenko O. O., Sekhar A.,Skrynnikov N. R. Order/Disorder Transitions Upon Protein Binding: A UnifyingPerspective // Proteins. ‒ 2024. ‒ T. 92, № 12. ‒ C. 1459-1463.
23. Hu G., Katuwawala A., Wang K., WuZ., Ghadermarzi S., Gao J., Kurgan L. flDPnn: Accurate intrinsic disorderprediction with putative propensities of disorder functions // NatureCommunications. ‒ 2021. ‒ T. 12, № 1. ‒ C. 4438.
24. Zhou J., Oldfield C. J., Yan W.,Shen B., Dunker A. K. Identification of Intrinsic Disorder in Complexes fromthe Protein Data Bank // ACS Omega. ‒ 2020. ‒ T. 5, № 29. ‒ C. 17883-17891.
25. Quinternet M., Chagot M.-E., RothéB., Tiotiu D., Charpentier B., Manival X. Structural Features of the Box C/DsnoRNP Pre-assembly Process Are Conserved through Species // Structure. ‒ 2016.‒ T. 24, № 10. ‒ C. 1693-1706.
26. Yang A., Miron S., Mouawad L.,Duchambon P., Blouquit Y., Craescu C. T. Flexibility and plasticity of humancentrin 2 binding to the xeroderma pigmentosum group C protein (XPC) fromnuclear excision repair // Biochemistry. ‒ 2006. ‒ T. 45, № 11. ‒ C. 3653-63.
27. Rabdano S. O., Shannon M. D.,Izmailov S. A., Gonzalez Salguero N., Zandian M., Purusottam R. N., Poirier M.G., Skrynnikov N. R., Jaroniec C. P. Histone H4 Tails in Nucleosomes: a FuzzyInteraction with DNA // Angewandte Chemie International Edition. ‒ 2021. ‒ T.60, № 12. ‒ C. 6480-6487.
28. Sun W., Lebedenko O. O., SalgueroN. G., Shannon M. D., Zandian M., Poirier M. G., Skrynnikov N. R., Jaroniec C.P. Conformational and Interaction Landscape of Histone H4 Tails in NucleosomesProbed by Paramagnetic NMR Spectroscopy // Journal of the American ChemicalSociety. ‒ 2023.10.1021/jacs.3c10340.
29. Michaud-Agrawal N., Denning E. J.,Woolf T. B., Beckstein O. MDAnalysis: a toolkit for the analysis of moleculardynamics simulations // J Comput Chem. ‒ 2011. ‒ T. 32, № 10. ‒ C. 2319-27.
30. Amber 2023. / Case D. A., AktulgaH. M., Belfon K., Ben-Shalom I. Y., Berryman J. T., Brozell S. R., Cerutti D.S., Cheatham T. E., Cisneros G. A., Cruzeiro V. W. D., Darden T. A., ForouzeshN., Giambasu G., Giese T., Gilson M. K., Gohlke H., Goetz A. W., Harris J.,Izadi S., Izmailov S. A., Kasavajhala K., Kaymak M. C., King E., Kovalenko A.,Kurtzman T., Lee T. S., Li P., Lin C., Liu J., Luchko T., Luo R., Machado M.,Man V., Manathunga M., Merz K. M., Miao Y., Mikhailovskii O., Monard G., NguyenH., O'Hearn K. A., Onufriev A., Pan F., Pantano S., Qi R., Rahnamoun A., Roe D.R., Roitberg A., Sagui C., Schott-Verdugo S., Shajan A., Shen J., Simmerling C.L., Skrynnikov N. R., Smith J., Swails J., Walker R. C., Wang J., Wang J., WeiH., Wu X., Wu Y., Xiong Y., Xue Y., York D. M., Zhao S., Zhu Q., Kollman P. A.‒ San Francisco: University of California, 2023.
31. Mikhailovskii O., Izmailov S. A.,Xue Y., Case D. A., Skrynnikov N. R. X-ray Crystallography Module in MDSimulation Program Amber 2023. Refining the Models of Protein Crystals //Journal of Chemical Information and Modeling. ‒ 2024. ‒ T. 64, № 1. ‒ C. 18-25.
32. Fiser A., Do R. K. G., Sali A.Modeling of loops in protein structures // Protein Science. ‒ 2000. ‒ T. 9, №9. ‒ C. 1753-1773.
Сведения о привлеченном финансировании из внешних по отношению к СПбГУ источников в 2024 году.
Договор с ЦСП ФМБА 38/04/2023-ЦСП
Оптимизация структуры и исследование свойств модифицированных полипептидов,блокирующих попадание вируса в клетку
PURE ID 104813362
6 000 000 руб.