DOI

SWaveform, недавно созданный открытый интернет ресурс, содержит информацию о сигнале, отражающем глубину покрытия секвенирования вблизи точек разрыва, соответствующих структурным вариантам (SV). Ресурс призван стимулировать развитие вычислительных инструментов и алгоритмов для обнаружения событий геномных перестроек на основе данных секвенирования. Структурные варианты являются важнейшей силой, формирующей геномы, вносящей существенный вклад в генетическое разнообразие. На данный момент надежное и эффективное нахождение структурных вариантов по данным полногеномного секвенирования сопряжено с определенными трудностями, что задерживает их внедрение в клиническую практику и приводит к нерациональному использованию ценных ресурсов. SWaveform включает базу данных, содержащую ~7 миллионов профилей глубины покрытия секвенирования, в окрестности точек разрыва, вызванных структурной вариацией. Профили сигнала покрытия были извлеченны из 911 геномов индивидов, отсеквенированных в рамках проекта "Разнообразие генома человека", обобщенные модели сигнала в точках разрыва, интерфейс для навигации и загрузки данных, а также набор инструментов для развертывания ресусов на локальном вычислительном узле для работы с данными пользователя. Набор данных может представлять огромную ценность для сообществ биоинформатиков и инженеров, поскольку он позволяет с легкостью применять интеллектуальные методы обработки сигналов и машинного обучения для обнаружения событий геномных перестроек и тем самым открывает возможности для разработки инновационных алгоритмов и программного обеспечения.
Переведенное названиеКоллекция профилей глубины прочтений в точках разрыва, соответствующих структурным вариантам
Язык оригиналаанглийский
Номер статьи186
ЖурналNature Scientific Data
Том10
Номер выпуска1
DOI
СостояниеОпубликовано - 6 апр 2023

ID: 106363910