описание для неспециалистов

Колониальные организмы встречаются в филогенетически отдаленных группах Metazoa, но только книдарии, мшанки и оболочники включают представителей с полиморфными колониями. Среди мшанок наибольшая степень полиморфизма проявляется у представителей отряда Cheilostomata. Зооиды в их колониях зачастую обладают весьма контрастными морфотипами, которые формируются на основе единого генома. Феномен формирования гетерозооидов известен давно, но морфологические и молекулярные аспекты процессов его реализации слабо изучены или вовсе неизвестны. В условиях бурно развивающихся методик NGS-секвенирования РНК, впервые появилась возможность совместить морфологические и молекулярно-биологические подходы к изучению полиморфизма колоний на принципиально новом уровне. Это направление исследований и было магистральным в рамках данного проекта. В качестве объектов исследования были выбраны морские хейлостоматные мшанки: Terminoflustra membranaceotruncata, Aquiloniella scabra, Caberea ellisii, Dendrobeania fruticosa. Эти виды обладают разными типами гетерозооидов: кенозооидами, обеспечивающими прикрепление колонии к субстрату, и авикуляриями, которые, вероятнее всего, выполняют защитную функцию. Оба типа гетерозооидов значительно модифицированы, не могут питаться и не имеют половых желез.
В рамках нашей работы, методика NGS-секвенирования РНК позволила получить новые уникальные данные как об экспрессии отдельных генов в различных типах зооидов мшанок, так и в целой колонии. Мы провели NGS-секвенирование транскриптомов трех видов мшанок: D. fruticosa, T. membranaceotruncata и C. ellisii. Мы секвенировали тотальную РНК, выделенную из целых колоний и отдельных типов гетерозооидов. Это позволило сопоставить уровни экспрессии генов в каждом из типов зооидов. Был разработан процесс деконтаминации транскриптомов, позволяющий одновременно исключать потенциально контаминирующие последовательности, оставляя консервативные и специфичные для определенного вида животного. Нами выявлены особенности дифференциальной экспрессии более тысячи различных генов D. fruticosa. Помимо анализа дифференциальной экспрессии, мы провели подробную аннотацию референсных транскриптомов, предсказали доменную организацию белковых продуктов многочисленных транскриптов, выполнили GO-аннотацию. Это позволило связать активность многих генов с биологией объектов: мы выявили специфичную экспрессию транскрипционных факторов и гомеобокс-содержащих генов в гетеро- и аутозооидах. Благодаря подробной аннотации, мы впервые осветили такой важный аспект биологии мшанок, как процессы старения организма. Анализ генной онтологии выявил различия в обогащении клеточных процессов в различных гетерозооидах и в аутозооидах. Мы организовали полученные данные в виде публично доступной базы данных, позволяющей так же проводить бласт-поиск транскриптов и их белковых продуктов.
С помощью различных морфологических методик мы исследовали строение авикуляриев T.membranaceotruncata, D.fruticosa, A.scabra, C.ellisii. Несмотря на ярко выраженные внешние отличия в форме, размерах и пропорциях основных структурных элементов, нами выявлены сходные черты в строении и авикуляриев, и вибракуляриев всех четырёх видов.
Вестигиальные полипиды авикуляриев исследованных видов включают одинаковые компоненты: (i) рудиментарный лофофор, окружённый щупальцевым влагалищем, (ii) церебральный ганглий и (iii) мышцы-ретракторы полипида. Мы выделили 4 типа клеток в составе эпидермиса рудиментарного лофофора у авикуляриев D.fruticosa. Рудиментарный лофофор у T.membranaceotruncata содержит похожие клетки, а A.scabra и C.ellisii лишены секреторных клеток. Нервная система авикуляриев всех исследованных видов демонстрирует удивительное однообразие. Вариабельным оказалось лишь количество первично-чувствующих сенсорных нейронов. Основываясь на наших данных о расположении и ультраструктуре сенсорных клеток фронтальной мембраны, мы предполагаем, что их возможная функция – регистрировать изменения натяжения фронтальной мембраны. Также обнаружены глие-подобные клетки, окружающие элементы нервной системы. Мышечная система авикуляриев исследованных видов имеет общий план строения и включает: (i) парные крупные аддукторы, (ii) мышцы-абдукторы, (iii) ретракторы полипида, (iv) продольные мышцы щупальцевого влагалища, и (v) диафрагмальные мышцы. Нами впервые показано наличие специализированных сухожильных клеток двух типов у мшанок и описана их ультраструктура.
Нами впервые детально исследовано строение кенозооидов D.fruticosa, C.eliisii и A.scabra, а также корневых нитей T. membranaceotruncata. Показано, что корневые нити T. membranaceotruncata нельзя считать настоящими кенозооидами. Кроме полученных морфологических данных о строении стенки тела кенозооидов и ризоидов, нами описано тонкое строение поровой пластинки между ризоидом и аутозооидом у D.fruticosa и предложен механизм транспорта питательных веществ.
Объёмная полость тела всех исследованных гетерозооидов (авикуляриев/вибракуляриев и кенозооидов) имеет уникальную природу: она не соответствует ни целомической полости (отсутствует целотелий), ни первичной полости тела (отсутствует внеклеточный матрикс).

основные результаты по проекту в целом

В рамках реализации проекта были получены новые оригинальные данные по дифференциальной экспрессии генов у мшанок. В результате глубокого секвенирования РНК, полученной от разнообразных типов зооидов Bryozoa, и дальнейшего разностороннего анализа полученных последовательностей, мы сравнили экспрессию генов у кенозооидов, авикуляриев, аутозооидов и в «теле» колоний. Для Dendrobeania fruticosa выявлено 1387 диффренциально экспрессирующихся генов. Нами впервые обнаружена связь между уровнями экспрессии различных генов с биологическими особенностями и морфологией ауто- и гетерозооидов. Наибольшее количество «подавленных» (down-regulated) генов отмечено для пары «авикулярии и кенозооиды» – 833, кроме того, для каждого из типов гетерозооидов характерны уникальные «подавленные» гены: 214 выявлено у кенозооидов и 19 у авикуляриев. Мы выявили специфичную экспрессию транскрипционных факторов и гомеобокс-содержащих генов в гетеро- и аутозооидах. Модификация и упрощение строения как авикуляриев, так и кенозооидов хорошо согласуется с набором «подавленных» у них генов, которые вовлечены в процесс формирования внеклеточного матрикса, ассоциированы с цилиогенезом и функционированием ресничных структур, нервной и мышечной систем и связаны с различными аспектами гаметогенеза и развития. Полученные данные организованы в виде публично доступной базы данных, позволяющей так же проводить бласт-поиск транскриптов и их белковых продуктов.

Нами впервые получены данные по тонкому строению кенозооидов трех видов и корневых нитей одного вида мшанок. Нами впервые исследовано строение авикуляриев и вибракуляриев четырех видов мшанок с использованием комбинации разных методов (трансмиссионная и сканирующая электронная микроскопия, гистология, конфокальная микроскопия). Использованный нами подход позволил выявить неизвестные ранее особенности строения авикуляриев.
Нами впервые показано, что полость тела и авикуляриев/вибракуляриев, и кенозооидов имеет уникальную природу: она не соответствует ни целомической полости (отсутствует целотелий), ни первичной полости тела (отсутствует внеклеточный матрикс). Нами впервые описаны разные типы сухожильных клеток, обеспечивающих крепление мышечных элементов авикуляриев. Дистальные концы наиболее крупных мышечных пучков (аддукторов и абдукторов) крепятся к специализированным выростам эктоцисты, которые являются функциональным аналогом аподем и аподемальных нитей артропод.
Нами впервые проведён сравнительный анализ организации нервной и мышечной систем у авикуляриев 4 видов мшанок. Мышечная система авикуляриев исследованных видов имеет общий план строения. Аддукторы являются единственным постоянным элементом мышечной системы, в то время как все остальные компоненты демонстрируют разную степень вариабельности у исследованных видов. Нервная система авикуляриев всех исследованных видов демонстрирует удивительное однообразие, вариабельным оказалось лишь количество первично-чувствующих нейронов как в эпидермисе рудиментарного лофофора, так и в пределах фронтальной мембраны. Нами впервые описана ультраструктура серотонин-положительных клеток в пределах фронтальной мембраны, рецепторная часть которых ветвится и погружена в толщу эктоцисты.
Вестигиальные полипиды обоих видов (D.fruticosa и T.membranaceotruncata) включают одинаковые компоненты, но клеточный состав рудиментарных лофофоров отличается. Нами впервые проведён сравнительный анализ организации нервной и мышечной систем у авикуляриев 4 видов мшанок (T.membranaceotruncata, D.fruticosa, A.scabra и C.ellisii). Мышечная система авикуляриев исследованных видов имеет общий план строения. Аддукторы являются единственным постоянным элементом мышечной системы, в то время как все остальные компоненты демонстрируют разную степень вариабельности у исследованных видов. Нервная система авикуляриев всех исследованных видов демонстрирует удивительное однообразие, вариабельным оказалось лишь количество первично-чувствующих нейронов как в эпидермисе рудиментарного лофофора, так и в пределах фронтальной мембраны.
Были продемонстрированы различия в организации фуникулярной системы аутозооидов и гетероморф и проведен сравнительный анализ тонкого строения поровых пластинок между зооидами разных типов.

основные результаты по этапу (подробно)

1. Ассемблирование и аннотирование референсных транскриптомов.
Ассемблированы и проаннотированы референсные транскриптомы с использованием различных типов программ (использованы пакеты программного обеспечения «Trimmomatic», «Trinity», «CD-HIT»). Суммарно в референсные транскриптомы вошло: 286 507 261 пн для Dendrobeania fruticosa, 217 713 864 пн для Terminoflustra membranaceotruncata. Значения BUSCO: C:98.0%[S:42.1%,D:55.9%],F:1.0%,M:1.0%,n:978 для D.fruticosa, C:99.0%[S:33.5%,D:65.5%],F:0.5%,M:0.5%,n:978 для T.membranaceotruncata. Таким образом, нами получены транскриптомы очень высокого качества. Они были использованы при подготовке результатов для статьи «Polyzoa is back: The effect of complete gene sets on the placement of Ectoprocta and Entoprocta» (DOI: 10.1126/sciadv.abo4400). Референсный транскриптом D.fruticosa также использован для анализа дифференциальной экспрессии генов (данные включены в поданную в журнал «Scientific Reports» статью «Putative links between gene activity and morphology of polymorphic zooids in Dendrobeania fruticosa (Bryozoa: Cheilostomata)».
Для Caberea ellisii нами получено 297 534 880 ридов (целая колония, полипиды, аутозооиды, кенозооиды, вибракулярии, суммарные библиотеки «аутозооиды + авикулярии». Дальнейшая обработка данных для Caberea ellisii и Aquiloniella scabra оказалась затруднена по независящим от нас обстоятельствам: в ЦОД РЦ «Вычислительный центр СПбГУ» в течение первой половины 2022 года с практически раз в месяц происходили различные аварии, которые прерывали обработку данных (в общем доступе имеется новостная лента РЦ, ссылка <http://www.cc.spbu.ru/ru/news>), а с 5 августа по 14 декабря все виртуальные машины были недоступны. Выделенная под данный проект виртуальная машина до сих пор недоступна из-за ее нестандартной конфигураци, поскольку начатые 23.12.2022 ремонтные работы продолжаются.
В настоящий момент мы завершаем обработку данных с использованием вычислительных мощностей «compagen.unit.oist.jp» (Япония).
2. Деконтаминирование референсных транскриптомов Dendrobeania fruticosa и Terminoflustra memebranaceotruncata.
На первом этапе мы осуществляли проверку наличия контаминирующих сиквенсов от потенциальных пищевых объектов (или их таксономически близких родственников) мшанок. Созданная база данных включает в себя 9 геномов: Stylonychia lemnae, Oxytricha trifallax, Tetrahymena thermophila, Paramecium tetraurelia, Phaeodactylum tricornutum, Reticulomyxa filosa, Thalassiosira pseudonana, Vitrella brassicaformis. После blast -поиска (blastn, 1e-20) было показано, что контаминация транскриптомов сиквенсами потенциальных пищевых объектов пренебрежимо мала (<2%). Для следующего этапа деконтаминации была создана отдельная база данных на основе хорошо аннотированных последовательностей из БД SwissProt организмов из 13 «групп»: Viruses (taxid 10239), Bacteria (taxid 2), Fungi (taxid 4751), Amoebazoa (taxid 554915), Cryptophycea (taxid 3027), Discoba (taxid 2611352), Haptista (taxid 2608109), Hydrozoa (taxid 6074), Rhodophyta (taxid 2763), SAR (taxid 2698737), Spongia (taxid 6040), Viridiplantae (taxid 33090), Homo sapiens (taxid 9606). Мы проводили blast-поиск при разных пороговых значениях e-value для всех групп (1e-5, 1e-7, 1e-10, 1e-20). По результатам blast-поиска при разных пороговых значениях e-value мы определяли значения, при котором существенного изменения «best hits» не происходило. Так же мы принимали в расчет наличие сильных различий в последовательностях вирусов и прокариот от последовательностей эукариотических организмов. В результате, итоговый blast-поиск проводили при пороговых значениях e-value 1e-5 для вирусов, бактерий и архей, и 1e-20 для всех остальных видов и «групп». Эта стратегия позволила различить потенциально контаминирующие последовательности от консервативных, представленных во всех группах организмов. Все найденные «blast hits» при заданных порогах были удалены. На следующем этапе мы окончательно подтверждали отсутствие выраженной контаминации и присутствие консервативных «тринити-генов» в референсных транскриптомах при помощи скрининговой базы данных, собранной на основе протеомов следующих многоклеточных организмов: Ascaris suum, Branchiostoma florida, Capitella teleta, Clytia hemisphaerica, Crassostrea gigas, Daphnia pulex, Dendronephthya gigantea, Hydra magnipapillata, Lingula ungus, Mizuhopecten yessoensis, Nematostella vectensis, Oxytricha trifallax, Paramecium tetraurelia, Phaeodactylum tricornutum, Pristionchus pacificus, Reticulomyxa filosa, Stentor coeruleus, Stylonychia lemnae, Stylophora pistilata, Tetrahymena thermophila, Thalassiosira oceanica, Tribolium castaneum, Trichoplax adhaerens. Наши ожидания были следующие: если референсные транскриптомы очищены от контаминирующих последовательностей, то среднее число blast-хитов будет приблизительно одинаковым за пределами Lophotrochozoa и значительно выше в пределах Lophotrochozoa. В случае с T.membranaceotruncata, мы обнаружили значительно большее число соответствий между ее референсным предсказанных протеомом и протеомами клитии, гидры и стентора. Соответствующие последовательности были удалены без явного ущерба для референсного транскриптома (показатели BUSCO для протеома, предсказанного с деконтаминированного транскриптома, составили C:95.9%[S:80.6%,D:15.3%],F:1.6%,M:2.5%,n:978). Это единственный случай, потребовавший удаления дополнительных последовательностей на данном этапе.
В конечном итоге, у нас появилась возможность отбирать интересующие нас белок-кодирующие последовательности по специфичности экспрессии в разных типах библиотек/зооидах, доменной архитектуре белков, закодированных в транскриптах, наличию полной/неполной рамки считывания у транскрипта, принадлежности к тому или иному GO-термину. Так же, стал возможен прямой поиск по результатам аннотации (т.е. по названию белкового продукта) и бласт-поиск в ассемблированных транскриптомах.
3. Анализ дифференциальной экспрессии генов.
Столкнувшись с невозможностью проводить анализ данных в ЦОД РЦ «Вычислительный центр СПбГУ» в 2022 г. (см. Задачу 1), мы приняли решение провести анализ дифференциальной экспрессии генов, специфичных для ауто- и гетерозооидов для одного из исследуемых видов D.fruticosa. В связи с меньшим объем данных проведение данного анализа оказалось возможным с использованием обычного ПК.
Данный анализ был проведен с использованием 13 библиотек: целая колония, аутозооиды и кенозооиды (по 3 биологические повторности) и авикулярии (4 повторности). Мы использовали только транскрипты, кодирующие полные рамки считывания (всего 14860 транскриптов). Анализ главных компонент, проведенный с использованием шкалированных логарифмированных ТРМ, продемонстрировал четкую группировку библиотек по типу зооида как по первой, так и по второй компоненте. Вдоль PC1 (объясняющей 34,23% дисперсии) библиотеки аутозооидов и целой колонии сформировали кластер с очень низкими отрицательными нагрузками, в то время как библиотеки авикуляриев и кенозооидов получили очень высокие положительные нагрузки. Вдоль PC2 (14,32%) библиотеки авикуляриев получили самые низкие отрицательные нагрузки, а библиотеки кенозооидов – самые высокие положительные. Библиотеки автозооидов и целой колонии вновь сформировали компактную группу и заняли промежуточное положение.
Нами выявлено всего 1387 диффренциально экспрессирующихся генов (при пороге 1e-5). Библиотеки сформировали два кластера: один включает аутозооидов и целую колонию, а второй – авикулярии и кенозооиды.
Данный вариант кластеризации напрямую связан с особенностями анатомии разных типов зооидов. И авикулярии, и кенозооиды не имеют половых желез и пищеварительной системы и не могут питаться; особенности их строения были детально исследованы нами. Авикулярий является сильно модифицированным аутозооидом, хотя и содержит многие компоненты первого: оперкулюм, отверстие зооида, рудиментарный полипид, щупальцевое влагалище, мышечную систему, ганглий и некоторые другие элементы нервной системы и др. Что касается кенозооидов D. fruticosa, то у них отсутствуют все перечисленные выше структуры, а общими с аутозооидами остаются только два компонента: стенка тела и фуникулярная система.
Наибольшее количество «подавленных» (down-regulated) генов отмечено для пары «авикулярии и кенозооиды» – 833, кроме того, для каждого из типов гетерозооидов характерны уникальные «подавленные» гены: 214 выявлено у кенозооидов и 19 у авикуляриев. Модификация и упрощение строения как авикуляриев, так и кенозооидов хорошо согласуется с набором «подавленных» у них генов (при этом эти же гены имеют повышенный уровень экспрессии у аутозооидов).
Среди «подавленных» генов, общих для авикуляриев и кенозооидов, мы можем выделить несколько групп. (i) Несколько «подавленных» генов у обоих типов гетерозооидов вовлечены в процесс формирования внеклеточного матрикса (ВКМ) и участвуют в клеточной адгезии (например, fibrillin 1, fibronectin, nidogen 2, dentin sialophosphoprotein-like, sushi), что хорошо соотносится с отсутствием ВКМ в их стенке тела. Хотя авикулярии и содержат очень небольшое количество ВКМ вдоль стенки щупальцевого влагалища, тем не менее, его количество на несколько порядков меньше такового в пределах лофофора аутозооидов. (ii) Несколько «подавленных» генов как у кенозооидов, так и у авикуляриев связаны с цилиогенезом, структурой и функцией ресничек (например, trochin, lophotrochin, dynein_axonemal-associated_protein_1-like, dynein_heavy_chain_domain-containing_protein_1-like_isoform_X1, CFAP36, TTC29, AKAP14, LRRC56, C9orf135, C11orf63). Это неудивительно, поскольку кенозооиды полностью лишены ресничных образований, а рудиментарный полипид авикулярия снабжен лишь несколькими сенсорными ресничками. (iii) Несколько «подавленных» генов связаны с нервной системой (например, neurensin, NETO2, hemicentin-2, G-protein coupled receptors) и мускулатурой (HPGDS) – обе системы органов значительно редуцированы у авикуляриев и кенозооидов. (iv) Наконец, и авикулярии, и кенозооиды D. fruticosa лишены гонад и не способны отпочковываться от других зооидов, что хорошо согласуется с большим количеством подавленных генов, ассоциированных с различными аспектами размножения и развития.
Интересно, что для кенозооидов характерно наличие и уникальные «подавленных» генов, связанные с указанными выше морфологическими деталями: ВКМ (laminin_subunit_alpha-1), нервной системой (innexin_unc-9_isoform_X3, G-protein_coupled_receptor_Mth2, F-box/LRR-repeat_protein_fbxl-1_isoform_X2), мускулатурой (unc-15), ресничными образованиями (PPP1R32) и размножением (testis-expressed_protein_45). Несомненно, многие гены DE остаются не охарактеризованными, и дальнейший анализ, основанный на более полных данных, вероятно, выявит многие интересные детали.

Список обогащенных терминов GO, их p-значения и количество генов варьировали в зависимости от типа зооида. Однако есть несколько отчетливых паттернов, которые согласуются с морфологией и биологией D. fruticosa. В дополнение к различным метаболическим процессам мы обнаружили три группы обогащенных терминов GO, общие для всех типов зооидов. В первую группу входят несколько обогащенных терминов GO, связанных с реакцией на стресс. Мы предполагаем, что это может быть результатом содержания колоний мшанок в фильтрованной морской воде без пищи в течение 24 ч перед фиксацией. Отсутствие пищи требует изменений в различных метаболических процессах, включая инициацию использования запасенных питательных веществ и реструктуризацию транспорта питательных веществ по всей колонии. Вторая группа расширенных терминов GO, общая для всех типов образцов, связана с ангиогенезом и миграцией эндотелиальных клеток у модельных организмов. Мы предполагаем, что эти термины GO могут быть связаны с функционированием фуникулярной системы, которая присутствует у всех типов зооидов и отвечает за транспорт питательных веществ.
Третья группа обогащенных GO терминов, отмеченная во всех типах зооидов, связана с регуляцией клеточного старения, пролиферации и миграции. Интересно, что для кенозооидов зафиксирован как самый короткий список, так и самые низкие p-значения. Мы полагаем, что эти результаты хорошо согласуются с морфологией и биологией D. fruticosa. Так, кенозооиды являются единственным типом зооидов, лишенным полипида и, следовательно, повторяющихся циклов дегенерации и регенерации полипида, характерных для аутозооидов. Для авикуляриев ряд исследователей отмечает их возможность дегенерировать, а иногда даже и регенерировать. Однако какие-либо описания обоих процессов отсутствуют, а сведения о продолжительности жизни авикуляриев по отношению к таковой у всей колонии полностью отсутствуют. Важно отметить, что кенозооиды содержат минимум живых тканей (эпидермис и фуникулярную систему), но функционируют на протяжении всей жизни колонии. И, вероятно, дальнейший детальный анализ генов из этой группы терминов GО позволит понять, какие из них отвечают за долголетие, а какие, наоборот, за старение.
Очень многие обогащенные GO термины являются специфичными для аутозооидов. Часть из них ассоциирована с детерминацией пола и гаметогенезом. Это хорошо согласуется с жизненным циклом D. fruticosa. Колонии этого вида имеют продолжительность жизни не менее 3-4 лет, а основной пик выхода личинок приходится на Белое море ранней осенью, с менее обильным нерестом поздней весной (наши наблюдения). Хотя мы собирали пробы в июле, перед сезоном размножения, гаметогенез уже начался, и это хорошо видно на наших суммарных препаратах и срезах. Во-вторых, существует группа обогащенных терминов GО, связанных с антибактериальным иммунитетом. Бактериальные симбионты обнаружены у нескольких видов хейлостомных мшанок, главным образом в фуникулярной системе аутозооидов и у личинок. Однако роль бактериальных симбионтов для мшанок до сих пор неизвестна. У аутозооидов D. fruticosa недавно обнаружены фуникулярные тела, содержащие бактерий. Мы предполагаем, что обогащенные термины GO, связанные с антибактериальной активностью, вероятно, участвуют во взаимодействиях хозяина и симбионта.

основные результаты по этапу (кратко)

1. Ассемблирование и аннотирование референсных транскриптомов.
Ассемблированы и проаннотированы референсные транскриптомы для Dendrobeania fruticosa и Terminoflustra membranaceotruncata. Значения BUSCO: C:98.0%[S:42.1%,D:55.9%],F:1.0%,M:1.0%,n:978 для D.fruticosa, C:99.0%[S:33.5%,D:65.5%],F:0.5%,M:0.5%,n:978 для T.membranaceotruncata. Таким образом, нами получены транскриптомы очень высокого качества. Они были использованы при подготовке результатов для статьи «Polyzoa is back: The effect of complete gene sets on the placement of Ectoprocta and Entoprocta» (DOI: 10.1126/sciadv.abo4400). Референсный транскриптом D.fruticosa также использован для анализа дифференциальной экспрессии генов (данные включены в поданную в журнал «Scientific Reports» статью «Putative links between gene activity and morphology of polymorphic zooids in Dendrobeania fruticosa (Bryozoa: Cheilostomata)».
Для Caberea ellisii нами получено 297 534 880 ридов (целая колония, полипиды, аутозооиды, кенозооиды, вибракулярии, суммарные библиотеки «аутозооиды + авикулярии». Дальнейшая обработка данных для Caberea ellisii и Aquiloniella scabra оказалась затруднена по независящим от нас обстоятельствам: в ЦОД РЦ «Вычислительный центр СПбГУ» в течение первой половины 2022 года с практически раз в месяц происходили различные аварии, которые прерывали обработку данных (в общем доступе имеется новостная лента РЦ, ссылка <http://www.cc.spbu.ru/ru/news>), а с 5 августа по 14 декабря все виртуальные машины были недоступны. Выделенная под данный проект виртуальная машина до сих пор недоступна из-за ее нестандартной конфигураци, поскольку начатые 23.12.2022 ремонтные работы продолжаются.
В настоящий момент мы завершаем обработку данных с использованием вычислительных мощностей «compagen.unit.oist.jp» (Япония).
2. Деконтаминирование референсных транскриптомов Dendrobeania fruticosa и Terminoflustra memebranaceotruncata.
На первом этапе мы осуществляли проверку наличия контаминирующих сиквенсов от потенциальных пищевых объектов (или их таксономически близких родственников) мшанок. Созданная база данных включает в себя 9 геномов. После blast -поиска (blastn, 1e-20) было показано, что контаминация транскриптомов сиквенсами потенциальных пищевых объектов пренебрежимо мала (<2%). Для следующего этапа деконтаминации была создана отдельная база данных на основе хорошо аннотированных последовательностей из БД SwissProt организмов из 13 «групп»: Viruses, Bacteria, Fungi, Amoebazoat, Cryptophycea, Discoba, Haptista, Hydrozoa, Rhodophyta, SAR, Spongia, Viridiplantae, Homo sapiens. Мы проводили blast-поиск при разных пороговых значениях e-value для всех групп (1e-5, 1e-7, 1e-10, 1e-20). По результатам blast-поиска при разных пороговых значениях e-value мы определяли значения, при котором существенного изменения «best hits» не происходило. Так же мы принимали в расчет наличие сильных различий в последовательностях вирусов и прокариот от последовательностей эукариотических организмов. В результате, итоговый blast-поиск проводили при пороговых значениях e-value 1e-5 для вирусов, бактерий и архей, и 1e-20 для всех остальных видов и «групп». Эта стратегия позволила различить потенциально контаминирующие последовательности от консервативных, представленных во всех группах организмов. Все найденные «blast hits» при заданных порогах были удалены. На следующем этапе мы окончательно подтверждали отсутствие выраженной контаминации и присутствие консервативных «тринити-генов» в референсных транскриптомах при помощи скрининговой базы данных, собранной на основе протеомов следующих многоклеточных организмов: Ascaris suum, Branchiostoma florida, Capitella teleta, Clytia hemisphaerica, Crassostrea gigas, Daphnia pulex, Dendronephthya gigantea, Hydra magnipapillata, Lingula ungus, Mizuhopecten yessoensis, Nematostella vectensis, Oxytricha trifallax, Paramecium tetraurelia, Phaeodactylum tricornutum, Pristionchus pacificus, Reticulomyxa filosa, Stentor coeruleus, Stylonychia lemnae, Stylophora pistilata, Tetrahymena thermophila, Thalassiosira oceanica, Tribolium castaneum, Trichoplax adhaerens.
3. Анализ дифференциальной экспрессии генов.
Столкнувшись с невозможностью проводить анализ данных в ЦОД РЦ «Вычислительный центр СПбГУ» в 2022 г. (см. Задачу 1), мы приняли решение провести анализ дифференциальной экспрессии генов, специфичных для ауто- и гетерозооидов для одного из исследуемых видов D.fruticosa. В связи с меньшим объем данных проведение данного анализа оказалось возможным с использованием обычного ПК.
Данный анализ был проведен с использованием 13 библиотек: целая колония, аутозооиды и кенозооиды (по 3 биологические повторности) и авикулярии (4 повторности). Мы использовали только транскрипты, кодирующие полные рамки считывания (всего 14860 транскриптов). Анализ главных компонент, проведенный с использованием шкалированных логарифмированных ТРМ, продемонстрировал четкую группировку библиотек по типу зооида как по первой, так и по второй компоненте. Нами выявлено всего 1387 диффренциально экспрессирующихся генов (при пороге 1e-5). Библиотеки сформировали два кластера: один включает аутозооидов и целую колонию, а второй – авикулярии и кенозооиды. Данный вариант кластеризации напрямую связан с особенностями анатомии разных типов зооидов. И авикулярии, и кенозооиды не имеют половых желез и пищеварительной системы и не могут питаться; особенности их строения были детально исследованы нами. Наибольшее количество «подавленных» (down-regulated) генов отмечено для пары «авикулярии и кенозооиды» – 833, кроме того, для каждого из типов гетерозооидов характерны уникальные «подавленные» гены: 214 выявлено у кенозооидов и 19 у авикуляриев. Модификация и упрощение строения как авикуляриев, так и кенозооидов хорошо согласуется с набором «подавленных» у них генов (при этом эти же гены имеют повышенный уровень экспрессии у аутозооидов).

описание вклада в работу каждого из участников (учётная форма ЦИТиС)

Шунатова Н.Н., доцент - морфологические исследования, подготовка рукописи статьи, написание отчета
Щенков С.В., лаборант - ассемблирование референсных транскриптомов, анализ дифференциальной экспрессии, подготовка рукописи статьи
Денисова С.А., лаборант - морфологические исследования, подготовка рукописи статьи
Халтурин К.В., Researcher in OIST - ассемблирование референсных транскриптомов, анализ дифференциальной экспрессии
Стогов И.А., старший преподаватель - сбор материала, первичная пробоподготовка, осуществление закупок
Мовчан Е.А., ассистент - сбор материала, первичная пробоподготовка, осуществление закупок
Филиппов А.И., студент - поддержание культуры мшанок, фиксация материала
Харитонов Д.Э., студент - поддержание культуры мшанок, фиксация материала

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

не разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается
АкронимRFBR_a_2020 - 3
СтатусЗавершено
Эффективные даты начала/конца28/03/2228/12/22

    Области исследований

  • Колониальные животные, полиморфизм, Bryozoa, Gzmnolaemata, Cheilostomatida, авикулярии, вибракулярии, кенозооиды, ультраструктура, транскриптомный анализ, референсный транскриптом, дифференциальный анализ экспрессии генов, база данных экспрессии генов

ID: 93803740