Проект направлен на разработку новых методов и программных продуктов для анализа больших геномных, метагеномных и метатранскриптомных данных. В рамках данного проекта предполагается развитие трех перспективных направлений: разработка вычислительных методов идентификации биосинтетических генных кластеров нерибосомных пептидов из данных природных метагеномов, разработка вычислительных методов совместной сборки и анализа метатранскриптомных и метагеномных данных и разработка вычислительных методов восстановления полных последовательностей генов из высокофрагментированных сборок метагеномов на примере поиска генов устойчивости к антибиотикам в природных метагеномах.
В рамках гранта получили свое развитие три перспективных направления анализа геномных и транскриптомных данных различных микробиот:
1. Был разработан инструмент Nerpa – вычислительный метод для высокопроизводительного обнаружения новых биосинтетические генные кластера, ответственных за биосинтез известных нерибосомных пептидов. Мы применили Nerpa к 13 399 репрезентативным бактериальным геномам из репозитория RefSeq и базе из 8368 известных НРП и связали 117 предполагаемых генных кластеров со своими продуктами. Дополнительно экспериментально подтвердили неописанный ранее кластер нгерхеумицина из P. galatheae с помощью масс-спектрометрии. Мы рассчитываем, что применение Nerpa научным сообществом ускорит поиск новых нерибосомных пептидов и будет способствовать улучшению фундаментального понимания биосинтеза этого класса соединений.
2. Метатранскриптомика является важным инструментом, дополняющим метагеномные исследования и отвечающим на вопрос какие именно гены работают в сообществе и как их экспрессия зависит от внешних условий. В рамках метатранскриптомного направления были разработаны два новых вычислительных метода: для оценки качества метатранскриптомных сборок и для коррекции метатранскриптомных сборок с помощью метагеномных. Оба инструмента не имеют аналогов, и были протестированы на данных секвенирования в реальных метагеномных проектах.
3. Была разработана вычислительная цепочка GraphAMR для поиска и восстановления полных последовательностей генов, обуславливающих антибиотикорезистентность, из сложных метагеномов природных сообществ. Работа разработанного метода была проверена на реальных данных сточных и подземных вод. В результате сравнения результатов с другими известными методами предсказания генов антибиотической резистентности было обнаружено, что GraphAMR позволяет получать более полные и достоверные результаты. Также GraphAMR был использован для восстановления и анализа резистома из клинических данных больных COVID-19, находящихся в отделении интенсивной терапии.
Коробейников, Шафранская – разработка методов и алгоритмов обнаружения генов антибиотикорезистентности
Пржибельский, Бушманова – анализ данных транскриптомов
Лапидус, Кунявская, Гуревич, Тагирджанов – разработка методов анализа НРП
Acronym | RFBR_Sirius_2019 - 2 |
---|
Status | Finished |
---|
Effective start/end date | 23/11/20 → 25/10/21 |
---|