Елена Алексеевна Бушманова - Докладчик

Андрей Дмитриевич Пржибельский - Докладчик

Дмитрий Юрьевич Антипов - Докладчик

Технологии секвенирования следующего поколения (NGS) открыли новые
возможности для изучения нуклеиновых последовательностей. С появлением
протокола RNA-Seq за один эксперимент стало возможным прочитать
транскриптом целиком. Для обработки большого количества данных RNA-Seq
были разработаны различные программные продукты. Наибольшей
популярностью на сегодняшний день пользуются утилиты для выравнивания
прочтений РНК на геном (TopHat2, STAR) и последующей оценки
дифференциальной экспрессии (Deseq2, Cufflinks). Однако, применение
этих методов возможно только к модельным организмам, для которых известен
референсный геном и база генов, таким, как человек и мышь. В случае, когда
геном неизвестен необходимы альтернативные методы обработки данных RNASeq.
De novo cборка (с нуля) данных RNA-Seq может быть полезна когда,
например, секвенирование и сборка генома в силу его сложности и размера
требуют заметных финансовых, вычислительных и человеческих ресурсов.
Сборка транскриптома с нуля также используется в метатранскриптомных
проектах и исследованиях, нацеленных на поиск фьюжн генов (fusion genes),
способных вызывать раковые заболевания.
Сборка транскриптома из коротких прочтений с нуля является
алгоритмически сложной задачей, которую нельзя назвать решенной.
Основными проблемами являются ошибки секвенирования, крайне
неравномерное покрытие данных (из-за различных уровней экспрессии у
различных генов), а также наличие различных изоформ у одного гена и
присутствие паралогичных генов.
Раздел биоинформатики именуемый метагеномикой исследует целые
бактериальные сообщества. При секвенировании, как правило, ДНК или РНК
выделяются из всех бактерий сразу, что заметно усложняет последующий анализ
данных, так как неизвестно, какие виды присутствуют в колонии и какие
прочтения принадлежат каким бактериям. Так, в метатранскриптомике
покрытие еще большее варьируется не только из-за различного уровня
экспрессии, но из-за различной представленности видов в бактериальных
колониях. Также, несмотря на простую структуру генов прокариот, в
метатранскриптомных данных могут присутствовать прочтения с паралогичных и родственных генов из разных организмов, что, безусловно, затрудняет задачу
сборки.
В данной работе мы представляем новый de novo ассемблер для данных
RNA-Seq, именуемый rnaSPAdes. Этот программный продукт был разработан на
основе геномного сборщика SPAdes и на сегодняшний день демонстрирует
результаты, по многим параметрам превосходящие аналогичный программные
продукты, такие как Trinity и Trans-ABySS. Для сравнения различных
транскриптомных ассемблеров и оценки качества сборки нами также был
разработана утилита rnaQUAST.
12 июл 201716 июл 2017

Событие (конференция)

ЗаголовокТретья ежегодная конференция Института трансляционной биомедицины СПбГУ «Актуальные проблемы трансляционной биомедицины
Период15/07/1716/07/17
Веб-адрес (URL-адрес)
МестоположениеЛенинградская обл., Выборгский муниципальный р-н, Приморское городское поселение, Высокинский массив, Морской пр. д. 1, База отдыха «Дом у моря» https://www.seahomeresort.ru
ГородСанкт-Петербург
Страна/TерриторияРоссийская Федерация
Степень признанияместный уровень

ID: 36118838