Микробиота почв уникального региона Сибири черневая тайга практически не изучена. При этом она может оказаться уникальным источником таких биологически активных молекул, как антибиотики, витамины, иммуномодуляторы, иммунодепрессанты и другие. Биоинформатический анализ ряда геномных сборок метагеномных образцов, собранных в черневой тайге Новосибирской области показал, что в данных из почвы черневой тайги (N1) содержится значительно больше биосинтетических генных кластеров (БГК) вторичных метаболитов с потенциальной биологической активностью, чем в "переходном" (N2) и контрольном образцах (N3). При сравнении результатов метагеномной сборки по одной библиотеке прочтений (ONT для N1 и N2 и Illumina для N3) общее число обнаруженных БГК в N1 (124) в два раза превышает число БГК в N2 (64) и в шесть раз в N3 (20). Более того, метагеномная сборка N1 с использованием дополнительно секвенированной библиотеки прочтений (Illumina) позволила найти более чем два раза больше БГК (256), чем N1 по одной ONT библиотеке (124) что лишний раз подтверждает значение качества сборки для адекватного анализа данных.
Для поиска биосинтетических генных кластеров вторичных метаболитов с потенциальной биологической активностью ко всем сборкам был применен вычислительный конвейер antiSMASH 5.0 [1]. Для сравнения обнаруженных БГК с крупнейшей базой данных кластеров известных вторичных метаболитов MIBiG [2] был использован поиск BLAST по нуклеотидным последовательностям [3].
Помимо значительно большего числа БГК в целом, в N1 наблюдается значительно больше БГК по целому ряду важных классов вторичных метаболитов, известных своими биологическими активностями широкого спектра (к ним относятся многие антибиотики, токсины, противоопухолевые агенты): нерибосомные пептиды (NRPS; 11 (28) сборке N1 (сборке N1, улучшенной по второй библиотеке секвенирования) против 4 и 3 в сборках N2 и N3), поликетиды (PKS; 6 (14) против 2 и 0), терпены (terpene; 46 (83) против 24 и 6), бактериоцины (bacteriocin; 32 (70) против 16 и 3) и арилполиены (arylpolyene; 13 (11) против 2 и 1).
Сравнение найденных БГК с крупнейшей базой известных БГК MIBiG не показала ни одного существенного совпадения, что с одной стороны связано с относительно небольшим размером базы MIBiG (порядка 2000 записей на данный момент), но и может означать наличие большего числа неизвестных прежде БГК и, как следствие, новых вторичных метаболитов, особенно в образце N1.
В 2021 году планируется более детальный анализ полногеномных сборок данных из локации Новосибирск (N) и из локации Томск (Т), которые будут закончены до конца 2020 года (медленные закупки и поставки реактивов повлияли на график работ).
Проект поддержан грантом РНФ 19-16-00049.