описание для неспециалистов

Проект направлен на разработку новых методов и программных продуктов для анализа больших геномных, метагеномных и метатранскриптомных данных. В рамках данного проекта предполагается развитие трех перспективных направлений: разработка вычислительных методов идентификации биосинтетических генных кластеров нерибосомных пептидов из данных природных метагеномов, разработка вычислительных методов совместной сборки и анализа метатранскриптомных и метагеномных данных и разработка вычислительных методов восстановления полных последовательностей генов из высокофрагментированных сборок метагеномов на примере поиска генов устойчивости к антибиотикам в природных метагеномах.

основные результаты по проекту в целом

В рамках гранта получили свое развитие три перспективных направления анализа геномных и транскриптомных данных различных микробиот:
1. Был разработан инструмент Nerpa – вычислительный метод для высокопроизводительного обнаружения новых биосинтетические генные кластера, ответственных за биосинтез известных нерибосомных пептидов. Мы применили Nerpa к 13 399 репрезентативным бактериальным геномам из репозитория RefSeq и базе из 8368 известных НРП и связали 117 предполагаемых генных кластеров со своими продуктами. Дополнительно экспериментально подтвердили неописанный ранее кластер нгерхеумицина из P. galatheae с помощью масс-спектрометрии. Мы рассчитываем, что применение Nerpa научным сообществом ускорит поиск новых нерибосомных пептидов и будет способствовать улучшению фундаментального понимания биосинтеза этого класса соединений.
2. Метатранскриптомика является важным инструментом, дополняющим метагеномные исследования и отвечающим на вопрос какие именно гены работают в сообществе и как их экспрессия зависит от внешних условий. В рамках метатранскриптомного направления были разработаны два новых вычислительных метода: для оценки качества метатранскриптомных сборок и для коррекции метатранскриптомных сборок с помощью метагеномных. Оба инструмента не имеют аналогов, и были протестированы на данных секвенирования в реальных метагеномных проектах.
3. Была разработана вычислительная цепочка GraphAMR для поиска и восстановления полных последовательностей генов, обуславливающих антибиотикорезистентность, из сложных метагеномов природных сообществ. Работа разработанного метода была проверена на реальных данных сточных и подземных вод. В результате сравнения результатов с другими известными методами предсказания генов антибиотической резистентности было обнаружено, что GraphAMR позволяет получать более полные и достоверные результаты. Также GraphAMR был использован для восстановления и анализа резистома из клинических данных больных COVID-19, находящихся в отделении интенсивной терапии.

описание вклада в работу каждого из участников (учётная форма ЦИТиС)

Коробейников, Шафранская – разработка методов и алгоритмов обнаружения генов антибиотикорезистентности
Пржибельский, Бушманова – анализ данных транскриптомов
Лапидус, Кунявская, Гуревич, Тагирджанов – разработка методов анализа НРП

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается
АкронимRFBR_Sirius_2019 - 2
СтатусЗавершено
Эффективные даты начала/конца23/11/2025/10/21

    Области исследований

  • Биоинформатика, вычислительная биология, высокопроизводительные вычисления, разработка методов и алгоритмов, геномика, метагеномика, метатранскриптомика, метаболомика, биологически активные соединения, гены антибиотикорезистентности

ID: 71360736