Вторичные (специализированные) метаболиты пептидной структуры (ВМПС) являются богатым источником ценных с точки зрения медицины веществ (антибиотики, антимикотики, витамины, иммунодепрессанты и другие).
Успехи последних лет в развитии биотехнологий существенно упростили и ускорили исследования в области ВМПС и позволили накопить огромные объемы данных высокого разрешения о ВМПС. В рамках предложенного проекта будет создана база данных гипотетических ВМПС, полученная на основе высокопроизводительного анализа десятков тысяч геномов микроорганизмов из общедоступных данных. Разработанные алгоритмы и структуры данных позволят быстро сопоставлять с этой базой большие объемы масс-спектрометрических данных (сотни тысяч/миллионы), выявлять и подробно анализировать наиболее вероятные из предсказанных соединений.
В рамках данного этапа планируется выполнить подготовительные работы, необходимые для создания базы данных. Конкретнее по пунктам:
1) Сформировать список исходных геномных последовательностей организмов-продуцентов ВМПС и скачать их из базы NCBI RefSeq.
2) Проанализировать и выбрать сторонние инструменты для предсказания ВМПС по геномным последовательностям.
3) Запустить крупномасштабную обработку скачанных геномных данных выбранными инструментами-предсказателями.
4) Создать утилиту для генерации наборов гипотетических ВМПС на основе предсказанной “базовой” структуры.
5) Разработать интерактивный визуализатор соответствий гипотетический ВМПС--масс-спектр.
Вторичные метаболиты пептидной структуры (ВМПС) -- это синтезируемые микроорганизмами соединения, которые являются богатым источником ценных с точки зрения медицины веществ, такие как антибиотики.
Современные биотехнологические инструменты позволили накопить огромные объемы данных о ВМПС. Для обработки и анализа этих данных требуется создание соответствующих вычислительных методов. В рамках предлагаемого проекта будет создана база данных гипотетических ВМПС, полученная на основе компьютерного анализа общедоступных данных о ВМПС. Созданное программное обеспечение позволит быстро сопоставлять с Базой большие объемы экспериментальные данных ВМПС, выявлять и подробно анализировать наиболее вероятные из предсказанных соединений. Таким образом, у ученых-исследователей ВМПС появится новых инструмент, которые поможет ускорить поиск новых потенциально полезных природных соединений.
В рамках данного этапа будут выполнены подготовительные работы к созданию базы данных. В частности, будут собраны и предобработаны исходные данных из общедоступных баз данных; будет создана часть программных методов для работы с будущей базой данных.