Layman's description

Проект направлен на разработку новых методов и программных продуктов для анализа больших геномных, метагеномных и метатранскриптомных данных. В рамках данного проекта предполагается развитие трех перспективных направлений: разработка вычислительных методов идентификации биосинтетических генных кластеров нерибосомных пептидов из данных природных метагеномов, разработка вычислительных методов совместной сборки и анализа метатранскриптомных и метагеномных данных и разработка вычислительных методов восстановления полных последовательностей генов из высокофрагментированных сборок метагеномов на примере поиска генов устойчивости к антибиотикам в природных метагеномах.

Key findings for the project

В рамках гранта получили свое развитие три перспективных направления анализа геномных и транскриптомных данных различных микробиот:
1. Был разработан инструмент Nerpa – вычислительный метод для высокопроизводительного обнаружения новых биосинтетические генные кластера, ответственных за биосинтез известных нерибосомных пептидов. Мы применили Nerpa к 13 399 репрезентативным бактериальным геномам из репозитория RefSeq и базе из 8368 известных НРП и связали 117 предполагаемых генных кластеров со своими продуктами. Дополнительно экспериментально подтвердили неописанный ранее кластер нгерхеумицина из P. galatheae с помощью масс-спектрометрии. Мы рассчитываем, что применение Nerpa научным сообществом ускорит поиск новых нерибосомных пептидов и будет способствовать улучшению фундаментального понимания биосинтеза этого класса соединений.
2. Метатранскриптомика является важным инструментом, дополняющим метагеномные исследования и отвечающим на вопрос какие именно гены работают в сообществе и как их экспрессия зависит от внешних условий. В рамках метатранскриптомного направления были разработаны два новых вычислительных метода: для оценки качества метатранскриптомных сборок и для коррекции метатранскриптомных сборок с помощью метагеномных. Оба инструмента не имеют аналогов, и были протестированы на данных секвенирования в реальных метагеномных проектах.
3. Была разработана вычислительная цепочка GraphAMR для поиска и восстановления полных последовательностей генов, обуславливающих антибиотикорезистентность, из сложных метагеномов природных сообществ. Работа разработанного метода была проверена на реальных данных сточных и подземных вод. В результате сравнения результатов с другими известными методами предсказания генов антибиотической резистентности было обнаружено, что GraphAMR позволяет получать более полные и достоверные результаты. Также GraphAMR был использован для восстановления и анализа резистома из клинических данных больных COVID-19, находящихся в отделении интенсивной терапии.

Academic ownership of participants (text description)

Коробейников, Шафранская – разработка методов и алгоритмов обнаружения генов антибиотикорезистентности
Пржибельский, Бушманова – анализ данных транскриптомов
Лапидус, Кунявская, Гуревич, Тагирджанов – разработка методов анализа НРП

Transfer of the full copy of the report to third parties for non-commercial use: permitted/not permitted

разрешается

Check of the report for improper borrowing in external sources (plagiarism): permitted/not permitted

разрешается
AcronymRFBR_Sirius_2019 - 2
StatusFinished
Effective start/end date23/11/2025/10/21

ID: 71360736