Характеризация CRISPR-CasY нуклеаз: 2020 г. этап 1

  • Severinov, Konstantin (PI)
  • Ширяева, Анна Александровна (CoI)
  • Абрамова, Марина Викторовна (CoI)
  • Французова, Ирина Владимировна (CoI)
  • Казалов, Максим Алексеевич (CoI)
  • Shcheglova, Nataliia (CoI)

Project

Project Details

Description

CRISPR-Сas системы – защитные системы бактерий и архей, способные обеспечивать адаптивный иммунитет против разнообразных мобильных генетических элементов, таких как транспозоны, бактериофаги и плазмиды (Marraffini et al., 2010). Работа этих систем основана на действии РНК-белковых комплексов, состоящих из Cas эффекторов и направляющих РНК. За счет комплементарного спаривания направляющих РНК с чужеродным геномом, Cas эффекторы специфически распознают конкретные сайты в нуклеиновой кислоте захватчика и вносят в них разрыв, препятствуя дальнейшему распространению инфекции. Используя направляющие РНК различной последовательности можно направлять Cas эффекторы на желаемые сайты генома эукариотических и прокариотических организмов для внесения в них двунитевых разрывов в целях генетической инженерии (Jinek et al., 2012; Cong et al., 2013). Характеризация новых CRISPR-Cas белков позволяет расширить спектр потенциальных инструментов геномной инженерии и получить фундаментальные данные о работе бактериальных защитных систем.
Данный проект посвящен характеризации CRISPR-CasY систем. Эти системы принадлежат к второму классу CRISPR-Cas систем: основные функции узнавая и разрезания ДНК выполняются одним белком-нуклеазой CasY. Такое простое устройство эффекторного комплекса позволяет рассматривать CasY нуклеазы как перспективные инструменты геномной инженерии, потенциально способные наравне с Cas9 эффекторами использоваться в эукариотических клетках.
CRISPR-CasY локусы были открыты при изучении метагенномных данных CPR (Сandidate Phyla Radiation) бактерий в 2017 году (Burstein et al, 2017). CPR бактерии не культивируемы в лабораторных условиях и представляют более 15% всего бактериального разнообразия. Предположительно являясь симбионтами других прокариот, эти организмы характеризуются малым размером клеток и небольшими геномами. CRISPR -CasY системы, найденные в этих бактериях, также отличаются небольшим размером генов эффекторов.
Так, типичный локус CRISPR-CasY включает CRISPR кассету, ген белка ответственного за адаптацию Cas1 и ген эффекторного белка CasY, кодирующего нуклеазу около 1200 аминокислот. Последовательности прямых повторов CRISPR-кассеты также укорочены и представляют короткие участки ДНК длиной 17-19 нуклеотидов.
Во время начала работы над проектом, активность ни одной из CasY систем не была реконструирована in vitro, однако было показано, что клетки, несущие локус CRISPR-CasY способны к интерференции, защите от чужеродных мобильных элементов.
В процессе нашей работы над проектом, в августе 2020 года вышла статья Harrington et al., показывающая возможность реконструкции CRISPR-CasY систем in vitro, на примере белка CasY15, найденного в микробиоме термита. В частности, коллегами была определена PAM последовательность CasY15 белка (несколько нуклеотидов, фланкирующих целевой сайт ДНК, необходимых для успешного узнавания ДНК нуклеазой) и показано, что CasY15 эффекторный комплекс требует дополнительной скаутной РНК для работы (см. далее в тексте отчета)
Работы текущего проекта посвящены характеризации других представителей CRISPR-CasY систем, CasY1 и CasY2.
Так, Система CRISPR-CasY1 из Катанобактерий, изучению которой посвящена работа первого этапа проекта, мало охарактеризована. Несмотря на то, что на ее примере была показана активность CasY систем в бактериях (Burstein et al, 2017), ее работа не была показана in vitro. Система CRISPR-CasY2, обнаруженная биоинформатическим анализом, также не изучена – так, неизвестны ее PAM последовательность и последовательности направляющих РНК. Обе эти системы могут оказаться активными in vitro и потенциально использоваться в геномной инженерии.
Цель работ первого этапа – воссоздание работы системы CRISPR-CasY1 из in vitro.
Задачи работы:
1) Проведение биоинформатического анализа CRISPR-CasY локусов
2) Определение PAM CRISPR-CasY1 системы проведением экспериментов в баткриях
3) Определение последовательностей направляющих РНК путем малого секвенирования РНК молекул, экстрагированных из клеток, несущих системы
4) Получение рекомбинатной формы нуклеазы CRISPR-CasY1
5) Характеризация CRISPR-CasY1 in vitro

В данном отчете представлены результаты работ по изучению CRISPR-CasY1 системы, основанные на проведенных нами исследованиях в 2020 году.

Layman's description

Так же как и клетки растений и животных, бактерии вынуждены защищать себя от вирусов прокариот, бактериофагов. Для этого в них существует ряд систем защиты, одной из которых являются CRISPR-Cas системы. Эти системы очень разнообразны и представлены разными белками в различных видах бактерий. Однако механизм работы всех этих разнообразных систем основан на принципе узнавания генома "захватчика" c помощью коротких направляющих РНК и разрушения генома, путем внесения в него разрывов с помощью Cas нуклеаз. Используя направляющие РНК различной последовательности можно вносить разрывы в конкретные сайты генома и эукариот, что сделало CRISPR-Cas системы популярным средство гоночного редактирования и инженерии. Cas нуклезы разнообразны - они имеют разное доменное устройство, специфичность и требования к разрезаемой ДНК. Для использования Cas белков в генетической инженерии они должны быть охарактеризованы - нужно узнать последовательности направляющих РНК, требования к PAM ( несколько нуклеотидов, ограничивающих целевой сайт, необходимые для] успешного разрезания мишени). Данный проект посвящен изучению CRISPR-CasY нуклеаз, недавно найденных Cas белков небольшого размера, интересных как с фундаментальной так и прикладной стороны. Эти системы пока до конца не охарактеризованы, а также неясно могут ли они использоваться в клетках эукариот.
В ходе работ мы провели биоиформатический поиск, чтобы дополнить список обнаруженных CRISPR-CasY систем и выбрать перспективные для изучения. В 2020 году мы также подучили рекомбинантную версию белка CasY1 и показали, что он может работать in vitro (в пробирке).

Key findings for the stage (in detail)

1. Результаты биоинформатического анализа последовательностей CRISPR-CasY систем.
Биоинформатический анализ локуса CRISPR-CasY1 из Катанобактерии показывает, что система состоит из гена cas1, кодирующего белок размером 1041п. о. и эффекторного гена сasY1 размером 3378 п. о. Система включает в себя 14 спейсеров длиной 17-18 нуклеотидов разделенных повторяющимися последовательностями повторов длиной 26 нуклеотидов. Перед CRISPR кассетой располагается последовательность, кодирующая скаутную РНК (см. далее в тексте отчета). Транскрипция скаутной РНК и CRISPR РНК осуществляется в одном направлении (Рис. 2.1.1 см. в файле отчета).


Система CRISPR-CasY2 из Вогелбактерии также состоит из гена cas1, длиной 1041п. о., а также сasY1 длиной 3681 п. о. Кассета начитывает 18 спейсеров, а средняя их длина составляет 17.3 п. о., что несколько больше чем в случае CasY.1 системы (17.1 п. о.) Для системы CRISPR-CasY.2 также была описана последовательность перед CRISPR кассетой предположительно кодирующая скаутную РНК.

2. Подтверждение PAM последовательности CRISPR-CasY1 системы интерференционным тестом в бактериальных клетках.

В работе Harrington et al. 2017 было показано, что CRISPR-CasY1 система способна защищать клетки от плазмид и выявлен предположительный PAM, необходимый для успешного разрезания плазмид системой. Мы решили подтвердить полученные результаты проведением аналогичного эксперимента в бактериях.
Для оценки активности CRISPR-CasY1 системы были проведены интерференционные тесты in vivo. Для проведения таких тестов были созданы плазмидные библиотеки, представляющие собой смесь плазмид, несущих протоспейсер соответствующий одному из спейсеров CRISPR-кассеты, фланкированный четырьмя рандомизированными нуклеотидами (далее 4N PAM библиотеки). Кроме того, плазмиды библиотеки несли устойчивость к ампициллину.
Получение 4N PAM библиотек.
Для получения библиотек было проведено клонирвоание вставка одигонуклеотида gcaggtcgactctagagccagagtttggtattgatNNNNgatccccgggtaccgagctcga в вектор PUC19 методом Гибсона по сайту рестрикции BamHI. Далее полученная рекомбинационная смесь была трансформирована в E. coli DH5alfa. Более 2000 выросших клонов было смыто с чашек, содержащих твёрдую LB среду с ампициллином. Из полученной клеточной массы была выделена плазмидная ДНК 4N PAM библиотеки.
Полученные лазмидные библиотеки были трансформированы в клетки E. сoli, содержащие вектор, несущий систему CRISPR-CasY1, а также в контрольные клетки с пустым pACYC184 вектором. Успешное узнавание плазмид, несущих распознаваемый CRISPR-CasY1 мишенью PAM, приводило к разрезанию плазмид, и потери устойчивости к ампициллину. В связи с этим, в трансформированных библиотекой CRISPR-CasY1 клетках, высеянных на селективную среду с ампициллином, наблюдалась деплеция в представленности членов библиотеки, по сравнению с контрольными клетками, не несущими защитную систему. Разница в представленности челнов библиотек в обоих видах клеток определялась с помощью высокопроизводительного секвенирования.
Результат скрининга в бактериях подтвердил работоспособность системы и ранее описанную в литературе (Burstein et al, 2017) ДНК последовательность PAM “TA” (Рис. 2.2.1 см. в файле отчета). Таким образом, система CRISPR CasY.1 содержит все необходимы элементы для работы, и они успешно синтезируются в E.coli.


3. Определение последовательностей направляющих РНК.
В основе действия CRISPR-Cas систем лежит специфическое узнавание нуклеиновых кислот за счет комплементарного спаривания направляющих CRISPR РНК с мишенью. Определение последовательностей направляющих РНК – один из главных шагов в характеризации CRISPR-Cas систем.
Для определения последовательностей направляющих РНК системы CRISPR-CasY1 было проведено секвенирование малых РНК, выделенных из клеток, несущих данную систему (Рис.2.3.1 см. в файле отчета). Полученные данные позволили сделать вывод о направлении транскрипции CRISPR кассеты, однако не выявили последовательности зрелых CRISPR РНК. Несмотря на это, было решено синтезировать предполагаемые молекулы CRISPR РНК, руководствуясь общими знаниями о работе CRISPR-Cas систем и определённого направления транскрипции.

Ряд CRISPR-Cas систем требуют для своей работы помимо направляющих РНК, транскрибируемых с CRISPR-кассеты, дополнительные молекулы РНК, обеспечивающие правильный фолдинг РНК-белкового комплекса, как например трейсерная РНК в случае Cas9. В случае CRISPR-CasY1 системы мы не обнаружили никаких дополнительных РНК, транскрибируемых с локуса. Однако, проведенные нами эксперименты по разрезанию ДНК CasY1 белком в комплексе с CRISPR-РНК показали, что для активности системы необходима дополнительная вспомогательная РНК, последовательность которой была неизвестна. В августе 2020 года научная группа под руководством Дженифер Дудны выявляли такую дополнительную молекулу на примере белка CasY15 и назвали ее скаутной. Такая дополнительная РНК гибридизуется с CRISPR РНК в последовательности длиной 5 нуклеотидов и образует комплекс аналогичный по функциям дуплексу трейсерная РНК – CRISPR РНК для Cas9, но обладающих совершенно другой структурой (Рис. 2.3. см. в файле отчета).

Анализ локуса CRISPR-CasY1 выявил присутствие последовательности, возможно кодирующей РНК молекулу с таким же фолдингом перед геном cas1. Обнаруженная молекула РНК была синтезирована in vitro с помощью Т7 РНК полимеразы.
Следующим шагом работы было воссоздание ДНК-разрезающей активности CRISPR-CasY1 in vitro. Для этого было проведено получение рекомбинантного CasY1 белка.

4. Получение рекомбинантного белка CasY1

Для получения рекомбинантного белка CasY1 клетки E. coli (Rosetta) трансформировали плазмидой pET21a CasY_MBP, содержащей последовательность, кодирующую соответствующий белок, промотор T7 РНК полимеразы и последовательность, кодирующую His-tag (6xHis) и MBP-tag. Для получения растворимой фракции белка были протестированы различные условия роста клеток и составы лизисного буфера (Таблица 2.4.1). По результатам этих тестов были подобраны оптимальные условия для наработки белка.

Таблица 2.4.1. Подбор оптимальных условий наработки белка и подходящего лизисного буфера. Оптимальные условия выделены жирным шрифтом.

буфер pHсоль температура, время индукции
Tris 50mM8NaCl 200mM37°C, 3ч
Tris 50mM8NaCl 500mM37°C, 3ч
Tris 50mM7NaCl 200mM37°C, 3ч
Tris 50mM7NaCl 500mM37°C, 3ч
MOPS 50mM6.5NaCl 500mM22°C, ON
MOPS 50mM8NaCl 500mM22°C, ON
MOPS 50mM8.5NaCl 500mM22°C, ON
MOPS 50mM + Triton8NaCl 500mM22°C, ON
HEPES 50mM + 10% глицерол7,5NaCl 500mM16°C, ON

После побора оптимальных условий, следовали приведенному ниже протоколу. 15 мл ночной культуры разводили в 500 мл среды TB (Terrific broth) с ампициллином, и растили клетки при температуре 37 оС до достижения оптической плотности 0.6 отн.ед. Синтез CasY.1 индуцировали добавлением IPTG до концентрации 1 мМ, после чего клетки инкубировали при температуре 16 оC ночь. Затем проводили центрифугирование клеток на скорости 4000g в течение 30 минут, полученные осадки замораживали при температуре -20 оС. Осадки ресуспензировали в 15 мл подобранного лизисного буфера (50 mM Hepes-HCl pH=7.5, 500 мМNaCl, 10% глицерин, 1 мМ бета-меркаптоэтанол) с добавлением 15 мг лизоцима и снова инкубировали на льду в течение 30 минут. Далее клетки соницировали в течение 30 минут и центрифугировали 1 час на скорости 16000g.
Полученный супернатант пропускался через фильтр 0.22мкм и наносился на колонку HisTrap HP 1 mL (GE Healthcare) на скорости 0.3 мл/мин. В процессе подбора условий очистки белка, скорость нанесения лизата, промывки и эллюции белка оказалась критическим фактором.
Аффинную хроматографию проводили при помощи FPLC хроматографа AKTA (GE Healthcare) на скорости 0.3 мл/мин. Колонку с нанесенным белком промывали 30 мл лизисного буфера с добавлением 20 мМ имидазола, после чего белок элюировали лизисным буфером с добавлением 300 мМ имидазола. Отобранные фракции концентрировались на концентраторе Amicon Ultra-4 centrifugal unit (Merc Millipore, UFC803008) с фильтром на 30 кДа со скоростью 2000g до объема 600мкл. Полученную фракцию наносили на гель фильтрационную колонку Superdex 200 Increase 10/300 GL (GE Healthcare) уравновешенную буфером содержащим 50 мМ Hepes-HCl pH=7.5, 500 мМ NaCl, 1 мМ DTT и 10% глицерина (Рис. 2.4.1 см. в файле отчета)


Фракции 3-5 были объединены и сконцентрированы на концентраторе Amicon Ultra-4 с размером пор 30 кДа со скоростью 2000g до объема 250мкл. Очищенный CasY1 белок был заморожен в жидком азоте с последующим хранением на -80С.
Таким образом, в ходе работ первого этапа были получены все компоненты системы, необходимые для воссоздания работы CasY1 in vitro.

5. In vitro характеризация CasY1
Для воссоздания активности рекомбинантной системы CasY1 in vitro были проведены эксперименты по разрезанию плазмидной ДНК.
В качестве ДНК-мишени использовалась плазмида PUC19, содержащая последовательность PAM “TA” перед соответствующим протоспейсером – мишенью (PUC19TA). Компоненты системы, смешанные в буфере CutSmart (NEB) в концентрациях, приведенных в Таблице 2, инкубировались в течение часа при температуре 37°С. Далее пробы были нанесены на агарозный гель и подвергнуты электрофорезу.

Таблица 2.5.1. Условия проведения in vitro реакций разрезания плазмидной ДНК
puc19TACasY.1crRNAscRNA
6.55 nM430 nM4700 nM4700 nM

В качестве контроля использовалась плазмида-мишень (PUC19TA), линеаризованная по сайту рестрикции Hind III, а также плазмида-мишень, инкубированная с CasY1 в отсутствии направляющих РНК. При проявлении нуклеазной активности белком CasY1 и разрезании мишени в районе протоспейсера будет наблюдаться увеличение фракции линеаризованной плазмидной ДНК. В результате эксперимента была детектирована слабая нуклеазная активность CasY1 (Рис.2.5.1 см. в файле отчета)

Для проверки того, что нуклеаза разрезает ДНК в районе протоспейсера, были проведены аналогичные эксперименты с использованием в качестве мишени линейного фрагмента ДНК длиной 520 пар оснований. Фрагмент был синтезирован методом ПЦР, используя в качестве матрицы плазмиду PUC19 TA. Компоненты реакции, смешанные в буфере CutSmart (NEB) в концентрациях, приведенных в Таблице 3, инкубировались в течение часа при температуре 37°С.
Таблица 2.5.2. Условия проведения in vitro реакций разрезания линейной ДНК
DNA targetCasY.1crRNAscRNA
50 nM450 nM4650 nM4650 nM

Далее пробы были разделены на две части и проанализированы методом электрофореза в нативном агарозном геле, а также в денатурирующем ПААГ. Денатурирующий ПААГ позволяет выявить наличие ников в ДНК. При разрезании CasY1 линейного фрагмента ДНК образовывались продукты ДНК соответствующего размера, что свидетельствовало о внесении двунитевого разреза в районе протоспейсера (Рис. 2.5.1 см. в файле отчета) Интересно, что продукты разрезания видны также и на денатурирующем геле, что предполагает частичное никирование мишени.

Таким образом, на данном этапе работ были определены и получены все необходимые компоненты системы CRISPR CasY1, в том числе рекомбинантный белок CasY1. Также была показана нуклеазная активность системы in vitro.
Использование направляющих РНК не оптимальной формы может снижать активность CasY1 РНК-белкового комплекса. В связи с этим в ходе дальнейших работ планируется провести оптимизацию формы скаутной РНК, а также оптимизировать условия проведения in vitro реакции.

Key findings for the stage (summarized)

CRISPR-CasY системы имеют уникальное строение в сравнении с другими представителями класса 2 типа V, к которому они относятся. Так, удивительным является короткая длина прямых повторов и спейсеров, отсутствие в системах гена cas2, обычно выступающего вместе с cas1 в качестве адаптационного модуля. Эффекторные CasY белки также не похожи по последовательности на других представителей семейства V.
На первом этапе работы мы смогли проанализировать локусы CRISPR-CasY систем и отобрать для дальнейшего изучения наиболее интересные. В результате работ получилось воссоздать in vitro работу CRISPR-CasY1. Дальнейшими шагами будет оптимизация вида направляющий РНК и уcловий реакции, а также создание sgRNA форм (слития скаутной РНК и CRISPR РНК молекул) для этой системы, тестирование разрезания различных ДНК мишеней. Система CRISPR-CasY2 будет исследована в течение дальнейших этапов работ над проектом.
Полученные результаты имеют фундаментальное значение - в данной работы подучены новые данные о работе CRISPR-CasY систем. Кроме того потенциально, такие системы могут оказаться полезными для биотехнологии.
По результатам рвот была опубликована научная статья в журнале Nucleic Acids Research.

Academic ownership of participants (text description)

1. Северинов Константин Викторович - руководство, планирование экспериментов, написание статей и отчёта; да
2. Ширяева Анна Александровнам-биоинформатический анализ данных, написание статей; да
3. Абрамова Марина Викторовна- клонирование генетических конструкций, несущих CRISPR-CasY систему; да
4. Казалов Максим Алексеевич - исследование активности системы с помощью in vitro реакций; да
5. Французова Ирина Владимировна - получение рекомбинатных CasY белков; да
6. Щеглова Наталья Вадимовна - исследование CRISPR-CasY систем в бактериях; да






Transfer of the full copy of the report to third parties for non-commercial use: permitted/not permitted

не разрешается

Check of the report for improper borrowing in external sources (plagiarism): permitted/not permitted

разрешается
Short titleGZ-2020
AcronymМ1_2020 - 1
StatusFinished
Effective start/end date22/06/2031/12/20