Введение. Течение COVID-19 у пациентов варьируется от бессимптомного до тяжелого и крайне тяжелого, что может быть обусловлено генетической изменчивостью. Поскольку ранее опубликованные исследования показали, что восприимчивость и тяжесть COVID-19 имеют полигенную основу, можно предположить, что оценка полигенного риска (ОПР) может облегчить выявление людей с высоким риском тяжелого течения заболевания. За счет стратификации риска можно скорректировать план лечения пациентов на ранней стадии заболевания, не дожидаясь явных признаков ухудшения состояния.
Цель и задачи. Используя клинические данные пациентов, а также результаты полногеномного исследования ассоциаций (ПГИА) из консорциума COVID-19 host genetics initiative, ставилась задача построения полигенной модели с последующим анализом ее применимости для пациентов из российской популяции. Основной целью данной задачи являлась оценка производительности предсказательной модели, включающей в себя предиктор ОПР.
Материалы и методы. В рамках исследования COVID-19 был проведен сбор биоматериала (кровь) и клинических данных пациентов с COVID-19, госпитализированных в инфекционное отделение Санкт-Петербургского государственного бюджетного учреждения здравоохранения «Городская больница №40 Курортного района».
Всего было собрано 5,398 образцов биоматериала, из них было секвенировано 1,348 образцов, разделенных на 50 групп. Секвенирование с низким покрытием было проведено на приборе MGISEQ-2000 (BGI, Китай) с использованием реагентов MGIEasy FS DNA Library Prep Set (MGI) на ячейке DNBSEQ-G400 High-throughput Sequencing Set (PE150, 540 Гб) (MGI). Для прочтений, полученных в результате секвенирования, были проведены: анализ качества (FastQC), выравнивание (BWA), дедупликация (samtools) и коллинг вариантов (bcftools). Далее, для обеспечения высокой точности обнаружения вариантов при низком покрытии последовательностей был использован алгоритм импутации GLIMPSE. В качестве референсной выборки была использована панель 1000 Genomes. Для построения моделей ОПР были использованы данные 658 образцов. Разделение по тяжести течения было проведено по следующим критериям: в группу случаев вошли образцы от 204 пациентов (129 мужчин и 75 женщин, 63±14 лет) с поражением легких более 50% (КТ-3 и КТ-4), в контрольную группу — образцы от 454 пациентов (237 мужчин и 217 женщин, 57±15 лет). Для построения моделей полигенных рисков использовался байесовский подход SBayesR, реализованный в программном обеспечении GCTB, и данные консорциума COVID-19 Host Genetics Initiative.
Основные результаты. В результате секвенирования глубина покрытия прочтениями составила от 1 до 5, среднее значение — 3. В результате использования метода SBayesR была построена модель полигенных рисков на основе суммарных статистик из консорциума COVID-19 Host Genetics Initiative, предоставляющий в свободном доступе результаты метаанализа ПГИА, в котором были сведены вместе результаты 60 отдельных исследований из 25 стран. Данная модель представляет собой набор переоцененных эффектов однонуклеотидных полиморфизмов (ОНП), позволяющих рассчитать ОПР для предрасположенности к тяжелому течению COVID-19. Число ОНП, вошедших в модель, составляло 1,092,235. Из представленных в модели ОНП в среднем 95% присутствовали в полученных данных. Для каждого из 658 образцов было посчитано значение ОПР как сумма генотипов, представленных в модели, взвешенная на размеры переоцененных эффектов ОНП. Таким образом, для групп случаев и контролей были получены векторы значений ОПР, которые использовались для дальнейшего сравнения распределения ОПР между этими группами и построения моделей логистической регрессии. Сравнение средних значений ОПР для групп случаев и контролей, выполненное с помощью t-критерия Стьюдента для двух независимых выборок, показало значимые различия. Для групп, разделенных по тяжести течения, значение p-value было равно 1.7e-06. Используя описанный выше сценарий разбиения образцов на группы случаев и контролей, далее были получены модели логистической регрессии с разным набором предикторов: 1) только ОПР; 2) только пол и возраст; 3) пол, возраст и ОПР.
Также, мы разделили исследуемую выборку по полу и оценили качество предсказания логистических моделей отдельно для мужчин и женщин. Результаты показали, что в группе мужчин параметр ОПР предсказывает тяжелое течение заболевания с более высоким качеством, чем в группе женщин (AUC=0.66 [95% ДИ: 0.60-0.72] и AUC=0.56 [95% ДИ: 0.48-0.64], соответственно). При этом модель предсказания только по возрасту имеет примерно одинаковое качество для мужчин и женщин (AUC=0.63 [95% ДИ: 0.57-0.69] и AUC=0.62 [95% ДИ: 0.55-0.70], соответственно).
Далее, было подсчитано отношение шансов (ОШ) на смертельный исход между группой с самыми высокими значениями ОПР (10%) и всеми остальными. Результаты показали, что ОШ = 2.05 с p-value = 0.026. Таким образом, в группе с самыми высокими значениями ОПР вероятность смертельного исхода при тяжелом течение заболевания значительно выше. Далее, анализ выживаемости, выполненный с помощью метода Каплана–Мейера, показал, что средний риск тяжелого течения, который достигается в возрасте 60 лет, в группе с самыми высокими ОПР (10%) достигается уже в 45 лет.
Выводы. Результаты показывают, что средние значения распределения ОПР в группах случаев и контролей в задаче исследования предрасположенности к тяжелому течению COVID-19 значимо отличаются. Из этого можно сделать вывод, что ОПР позволяется стратифицировать людей в соответствие с генетической предрасположенностью к тяжелому течению COVID-19. В дальнейшем предполагается увеличение размера исследуемой выборки, что позволит улучшить мощность анализа. В целом расчет ОПР и последующее их сравнение продемонстрировали возможность использования моделей полигенных рисков, построенных на основе суммарных статистик (результаты ПГИА) из открытых данных с получением значимых результатов.
Исследование выполнено в рамках проекта Санкт-Петербургского государственного университета ID 94029859.
Original languageRussian
Title of host publicationМолекулярная диагностика
Subtitle of host publicationСборник трудов
PublisherАО «САЙЕНС МЕДИА ПРОДЖЕКТС»
Pages300-301
Number of pages2
ISBN (Electronic)978-5-60489946_8_2
StatePublished - Nov 2023
EventМолекулярная диагностика - 2023: Современные достижения и перспективы - Москва, ГК «Космос», Москва, Russian Federation
Duration: 14 Nov 202317 Nov 2023
https://mdxconf.ru/mdx2023/ru/

Conference

ConferenceМолекулярная диагностика - 2023
Abbreviated titleMDx-2023
Country/TerritoryRussian Federation
CityМосква
Period14/11/2317/11/23
Internet address

ID: 114440645