Биоинформатика микробиоты: 2020 г. этап 2 › Научные исследования в СПбГУ

Коробейников, Антон Иванович (руководитель)
Кунявская, Ольга Александровна (исполнитель)
Бушманова, Елена Алексеевна (исполнитель)
Шафранская, Дарья Дмитриевна (исполнитель)
Тагирджанов, Азат Мухаммедович (исполнитель)
Пржибельский, Андрей Дмитриевич (исполнитель)
Лапидус, Алла Львовна (исполнитель)
Гуревич, Алексей Александрович (исполнитель)

описание для неспециалистов

Проект направлен на разработку новых методов и программных продуктов для анализа больших геномных, метагеномных и метатранскриптомных данных. В рамках данного проекта предполагается развитие трех перспективных направлений: разработка вычислительных методов идентификации биосинтетических генных кластеров нерибосомных пептидов из данных природных метагеномов, разработка вычислительных методов совместной сборки и анализа метатранскриптомных и метагеномных данных и разработка вычислительных методов восстановления полных последовательностей генов из высокофрагментированных сборок метагеномов на примере поиска генов устойчивости к антибиотикам в природных метагеномах.

основные результаты по проекту в целом

В рамках гранта получили свое развитие три перспективных направления анализа геномных и транскриптомных данных различных микробиот:
1. Был разработан инструмент Nerpa – вычислительный метод для высокопроизводительного обнаружения новых биосинтетические генные кластера, ответственных за биосинтез известных нерибосомных пептидов. Мы применили Nerpa к 13 399 репрезентативным бактериальным геномам из репозитория RefSeq и базе из 8368 известных НРП и связали 117 предполагаемых генных кластеров со своими продуктами. Дополнительно экспериментально подтвердили неописанный ранее кластер нгерхеумицина из P. galatheae с помощью масс-спектрометрии. Мы рассчитываем, что применение Nerpa научным сообществом ускорит поиск новых нерибосомных пептидов и будет способствовать улучшению фундаментального понимания биосинтеза этого класса соединений.
2. Метатранскриптомика является важным инструментом, дополняющим метагеномные исследования и отвечающим на вопрос какие именно гены работают в сообществе и как их экспрессия зависит от внешних условий. В рамках метатранскриптомного направления были разработаны два новых вычислительных метода: для оценки качества метатранскриптомных сборок и для коррекции метатранскриптомных сборок с помощью метагеномных. Оба инструмента не имеют аналогов, и были протестированы на данных секвенирования в реальных метагеномных проектах.
3. Была разработана вычислительная цепочка GraphAMR для поиска и восстановления полных последовательностей генов, обуславливающих антибиотикорезистентность, из сложных метагеномов природных сообществ. Работа разработанного метода была проверена на реальных данных сточных и подземных вод. В результате сравнения результатов с другими известными методами предсказания генов антибиотической резистентности было обнаружено, что GraphAMR позволяет получать более полные и достоверные результаты. Также GraphAMR был использован для восстановления и анализа резистома из клинических данных больных COVID-19, находящихся в отделении интенсивной терапии.

описание вклада в работу каждого из участников (учётная форма ЦИТиС)

Коробейников, Шафранская – разработка методов и алгоритмов обнаружения генов антибиотикорезистентности
Пржибельский, Бушманова – анализ данных транскриптомов
Лапидус, Кунявская, Гуревич, Тагирджанов – разработка методов анализа НРП

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

Акроним	RFBR_Sirius_2019 - 2
Статус	Завершено
Эффективные даты начала/конца	23/11/20 → 25/10/21

Области исследований

Биоинформатика, вычислительная биология, высокопроизводительные вычисления, разработка методов и алгоритмов, геномика, метагеномика, метатранскриптомика, метаболомика, биологически активные соединения, гены антибиотикорезистентности

ID: 71360736