Редактирование генома – это намеренное внесение конкретных изменений в последовательность ДНК живых клеток или организма. В более широком смысле под этим термином понимают любые направленные манипуляции с геномами живых объектов.
Разработка эффективных и надёжных методов такого редактирования – давняя цель специалистов в области биологии и медицины. С одной стороны, это существенно обогатило бы инструментарий для фундаментального исследования геномов, с другой – открыло бы новые возможности по следующим направлениям:
CRISPR (от англ. «Clustered Regularly Interspaced Short Palindromic Repeats») – это локусы повторяющихся коротких повторов (18-50 н.п.), разделённых уникальными спейсерными последовательностями (17-84 н.п.), встречающиеся в геномах бактерий и архей.
В непосредственной близости от локусов CRISPR располагаются гены так называемых Cas-белков (от англ. «CRISPR-assosiated») и последовательность, кодирующая tracrРНК (trans-activating CRISPR РНК).
Установлено, что основная функция CRISPR/Cas систем в организмах прокариот – адаптивный иммунный ответ на вторжение ДНК плазмид и бактериофагов.
Последовательность уникальных спейсеров в локусах CRISPR (разноцветные шестиугольники на Рис.1) совпадают с фрагментами чужеродной ДНК, с которой клетка (или её предшественники) когда-либо сталкивалась.
Рис. 1. Схема адаптивного иммунного ответа на примере системы CRISPR/Cas9.1
Иммунный ответ запускается в тот момент, когда в бактерию или архею проникает ДНК фага или плазмиды. В случае CRISPR/Cas9 системы (Рис. 1) происходят следующие события:
Если же клетка никогда не сталкивалась с данным бактериофагом или плазмидой, то подобного расщепления не происходит. Но при этом другие белки Cas встраивают фрагменты чужеродной ДНК в локусы CRISPR2. И при повторной встрече с патогеном, активируется иммунный ответ
Уникальная способность гибридов tracrРНК/crРНК программировать работу нуклеаз Cas9 не могла остаться незамеченной специалистами, занимающимися разработкой методов геномного редактирования.
Ведь по сути, одним и тем же ферментом Cas9 можно направленно расщепить совершенно разные участки ДНК с PAM-мотивом. Для этого достаточно, чтобы последовательность спейсера в составе tracrРНК/crРНК совпадал с целевой последовательностью ДНК.
Более того, оказалось, что такая система будет работать, даже если искусственным путём объединить tracrРНК и crРНК в единую укороченную РНК-химеру, получившую название гидовой РНК (sgРНК - от англ. «single guide РНК»)4.
В 2012-2013 гг. были опубликованы первые работы, авторам которых удалось осуществить сайт-специфическое расщепление ДНК в клетках эукариот с помощью компонентов CRISPR/Cas9 системы.
Что же происходит после того, как нуклеаза Cas9 вносит двухцепочечный разрыв в геном живой клетки?
Рис. 2. Варианты репарационных механизмов, активирующихся после двухцепочечного разрыва ДНК.8
Основной механизм репарации такого разрыва - негомологичное соединение концов (NHEJ). Он очень неточен и в подавляющем числе случаев сопровождается образованием инсерций и/или делеций в месте стыковки. Репарация NHEJ внутри экзона может привести к сдвигу рамки считывания, образованию преждевременного стоп-кодона и, в конечном итоге, к нокауту гена (Рис. 3)
Если же у клетки есть образец для восстановления последовательности (например, сестринская хроматида в поздней S- и G2-фазах клеточного цикла), то репарация пойдет также по пути гомологичной рекомбинации (HDR)
Кроме того, можно предоставить клетке и свой образец ДНК (донорную ДНК). Его концы должны быть гомологичны свободным концам ДНК, образовавшимся в результате разрыва. Таким образом можно заменить отдельные нуклеотиды в целевой последовательности или внести необходимую инсерцию (Рис. 3)
Рис. 3. Возможные результаты геномного редактирования с помощью сайт-специфических нуклеаз.1
Даже в присутствии донорной ДНК эффективность репарации по механизму HDR значительно уступает эффективности репарации NHEJ. Чтобы увеличить вероятность гомологичной рекомбинации, специалисты тестируют разные подходы, например, ингибирование пути NHEJ, синхронизация клеточных линий в одинаковой фазе клеточного цикла, использование клеточных линий, дефицитных по компонентам NHEJ.1
Две основные альтернативные технологии редактирования генома - ZFN и TALEN - заключаются в использовании химерных нуклеаз, состоящих из ДНК-связывающих и ДНКазных доменов.
В случае нуклеаз ZFN (от англ. «zink-finger nucleases») в качестве ДНК-связывающих доменов используют цинковые пальцы, каждый из которых способен узнать последовательность из трех нуклеотидов. В роли ДНКазного домена выступает каталитический домен рестриктазы FokI.
Поскольку фермент FokI функционирует только в виде димера, то для редактирования конкретного участка генома необходимо создать две нуклеазы ZFN (Рис. 4).
Распознавание тринуклеотидов цинковыми пальцами нельзя назвать строгим. Поэтому частота расщепления ДНК в нецелевых участках относительно высока.
Рис. 4. Устройство нуклеаз ZFN.1
В случае нуклеаз TALEN (от англ. «Transcription Activator-like Effector Nucleases») также используется каталитический домен рестриктазы FokI. За связывание же с целевым участком ДНК отвечают домены на основе белков TALE (от англ. «Transcription Activator-like Effectors»), каждый из которых узнает один нуклеотид. Такая система более специфична, по сравнению с ZFN.
Рис. 5. Устройство нуклеаз TALEN.1
Для создания нуклеаз ZFN и TALEN исследователь должен владеть широким спектром методов генной инженерии и иметь немалый практический опыт. К тому же, каждый новый проект по редактированию требует разработки, как минимум, двух новых ферментов
В случае же CRISPR/Cas систем для изменения специфичности нуклеазы достаточно всего лишь синтезировать другую гидовую РНК. Сравнение технологий по другим характеристикам см. в Табл. 1.
Таблица 1. Сравнение харатеристик технологий ZFN, TALEN и CRISPR/Cas.2
Характеристика | ZFN | TALEN | CRISPR/Cas9 |
---|---|---|---|
Компонент, ответственный за распознавание целевого участка ДНК |
Белковый домен |
Белковый домен |
Гидовая РНК |
Компонент, требующий дизайна |
Белок | Белок | Гидовая РНК |
Специфичность и эффективность |
Низкие | Средние | Высокие |
Нецелевой мутагенез |
Переменная частота |
Низкая частота |
Средняя частота |
Стоимость |
Очень дорого |
Дорого | Дёшево |
В настоящее время исследователи используют для редактирования геномов не только нативные нуклеазы Cas9 различных видов прокариот, но и их модифицированные варианты (Табл. 2). Также всё большую популярность приобретают белки Cas12a, а также белки Cas13, которые при участии sgРНК способны связываться и расщеплять молекулы РНК.
Таблица 2. Примеры белков Cas9, используемых в протоколах CRISPR/Cas.9
Название | Описание | PAM (5’→3’) | Особые характеристики |
---|---|---|---|
SpCas9 | Нативный Cas9 Streptococcus pyogenes | NGG | 1 368 а.о. |
VRER SpCas9 | D1135V, G1218R , R1335E, T1337R | NGCG | Альтернативный PAM |
VQR SpCas9 | D1135V, R1335Q, T1337R | NGAN или NGNG | Альтернативный PAM |
EQR SpCas9 | D1135E, R1335Q, T1337R | NGAG | Альтернативный PAM |
xCas9-3.7 | A262T, R324L, S409I, E480K , E543D, M694I, E1219V | Альтернативный PAM | |
eSpCas9 | K810A , K1003A , R1060A | NGG | Повышенная специфичность |
Cas9-HF1 | N497A , R661A , Q695A , Q926A | NGG | Повышенная специфичность |
HypaCas9 | N692A , M694A , Q695A , H698A | NGG | Повышенная специфичность |
evoCas9 | M495V, Y515N, K526E, R661Q | NGG | Повышенная специфичность |
HiFi Cas9 | R691A | NGG | Повышенная специфичность |
ScCas9 | Нативный Cas9 Streptococcus canis | NNG | 1 375 а.о. |
StCas9 | Нативный Cas9 Streptococcus thermophilus | NNAGAAW | 1 121 а.о. |
NmCas9 | Нативный Cas9 Neisseria meningitidis | NNNNGATT | 1 082 а.о. |
SaCas9 | Нативный Cas9 Staphylococcus aureus | NNGRRT | 1 053 а.о. |
CjCas9 | Нативный Cas9 Campylobacter jejuni | NNNVRYM | 984 а.о. |
CasX | Deltaproteobacteria и Planctomycetes | TTCN | 980 а.о. |
SpRY | Мутантная форма SpCas9 (near-PAMless) | NRN>NYN | - |
Отдельно стоит выделить две мутантные формы белка Cas9 Streptococcus pyogenes – nCas9 и dCas9.
В состав нативного SpCas9 входят два нуклеазных домена – HNH и RuvC. Каждый из них расщепляет только одну строго определённую цепь ДНК.
Если один из доменов инактивирован, то фермент превратится в никазу (nCas9). Обычно этого добиваются, внося мутацию D10A в домен HNH или мутацию H840A в домене RuvC.
Для редактирования генома в таком случае приходится подбирать два рядом лежащих целевых ДНК-участка и, соответственно, две sgРНК (Рис.6).
В результате одновременной обработки двумя никазами в ДНК появляются два ника. В отсутствии донорной ДНК они восстанавливаются по механизму репарации однонитевых разрывов (SSBR). Но если клетке предоставить образец, то дополнительно запустится механизм гомологичной рекомбинации HDR.10
При использовании никаз количество нуклеотидов, которые должны распознать рибонуклеопротеиновые комплексы, в два раза больше, чем при стандартной схеме. Таким образом удаётся существенно увеличить специфичность CRISPR/Cas системы и снизить частоту нецелевых событий редактирования.
Рис. 6. Принцип редактирования генома с помощью никаз nCas9.8
Нуклеаза Cas9, S. pyogenes - нативная РНК-зависимая ДНК-эндонуклеаза Cas9 Streptococcus pyogenes. Катализирует сайт-специфическое расщепление дцДНК за 3 нуклеотида до PAM-мотива (5’-NGG-3’). При этом PAM-мотив должен следовать за целевым участком ДНК, а 5’-конец гидовой РНК должен быть комплементарен минус-цепи целевого участка. Идеально подходит для расщепления дцДНК in vitro.
Нуклеаза EnGen® Spy Cas9 NLS - модифицированная форма нуклеазы Cas9 S. pyogenes. Содержит на N- и С-концах сигналы ядерной локализации (NLS) T-антигена вируса SV40, облегчающие проникновение комплексов Cas9/sgРНК в ядра клеток. Идеально подходит для расщепления дцДНК in vitro.
Нуклеаза EnGen® Sau Cas9 - нативная РНК-зависимая ДНК-эндонуклеаза Staphylococcus aureus. Катализирует сайт-специфическое расщепление дцДНК за 3 нуклеотида до PAM-мотива (5’-NNGRRT-3’). При этом PAM-мотив должен следовать за целевым участком ДНК, а 5’-конец гидовой РНК должен быть комплементарен минус-цепи целевого участка.
Никаза EnGen® Spy Cas9 - модифицированная форма нуклеазы EnGen® Spy Cas9 NLS с точечной мутацией (D10A) в нуклеазном домене RuvC и сигналами ядерной локализации (NLS) T-антигена вируса SV40 на N- и C-концах. Фермент способен только никировать дцДНК. Для редактирования генома требуется подбор двух целевых участков и двух sgРНК.
EnGen® Spy dCas9 (SNAP-tag®) - модифицированная форма нуклеазы EnGen® Spy Cas9 NLS с инактивированными нуклеазными доменами. При этом белок сохраняет РНК-зависимую ДНК-связывающую активность. На N-конце EnGen® Spy dCas9 (SNAP-tag®) присутствует метка SNAP-tag®, с которой могут ковалентно взаимодействовать флуорофоры, биотин и ряд других субстратов.
Нуклеаза EnGen® Lba Cas12a (Cpf1) - РНК-зависимая ДНК-эндонуклеаза Cas12a Lachnospiraceae bacterium. Катализирует сайт-специфическое расщепление дцДНК через ~18 нуклеотидов после PAM-мотива (5’-TTTN-3’). При этом целевой участок ДНК должен следовать за PAM-мотивом, а 3’-конец гидовой РНК должен быть комплементарен минус-цепи целевого участка. Продукты расщепления нуклеазой EnGen® Lba Cas12a (Cpf1) имеют 5’-липкие концы.
Фермент направляется более короткой, чем в случае Cas9, гидовой РНК (40-44 н.). На N- и С-концах он содержит сигналы ядерной локализации (NLS), облегчающие проникновение комплексов Cas12a/sgРНК в ядра клеток.
Нуклеаза активна в диапазоне температур от 16°C до 48°C и подходит для редактирования геномов холоднокровных организмов, например Danio rerio и Xenopus.
Задача по доставке компонентов CRISPR/Cas в исследуемый объект состоит из двух частей. Во-первых, надо определить, в какой форме лучше всего доставлять нуклеазу Cas, sgРНК и, в случае необходимости, донорную ДНК. А во-вторых – каким способом.
Что касается формы, то sgРНК можно доставлять в готовом виде, либо в составе экспрессионного ДНК-вектора под промотором, узнаваемым РНК полимеразой III (например, U6).
Нуклеазы Cas доставляют в живые клетки либо в виде белков, либо в виде мРНК, либо опять же в составе экспрессионного ДНК-вектора. В последнем случае кодоны в последовательности гена Cas должны быть оптимизированы в соответствии с предпочтениями исследуемого объекта.
Если сравнивать преимущества и недостатки различных форм доставки компонентов CRISPR/Cas, то самым предпочтительным вариантом оказывается использование готового белка Cas и синтезированной sgРНК (Табл. 3). Причем в живые клетки их вводят не по отдельности, а в виде заранее подготовленных рибонуклеопротеиновых комплексов Cas/sgРНК.
Таблица 3. Сравнение форм доставки компонентов CRISPR/Cas в живые системы.
Формы доставки |
![]() |
![]() |
![]() |
---|---|---|---|
Эффективность редактирования | Низкая и вариабельная | Низкая и вариабельная | Высокая и повторяющаяся |
Специфичность редактирования | Низкая | Высокая | Высокая |
Скорость подготовки | Низкая | Средняя | Высокая |
Скорость получения результата | Низкая | Средняя | Высокая |
Нежелательное встраивание в геном | Возможно | Невозможно | Возможно |
Стоимость | Очень низкая | Средняя | Низкая |
Донорную ДНК можно доставлять в виде одноцепочечного ДНК-олигонуклеотида или в составе плазмиды.
В следующей таблице перечислены различные продукты New England Biolabs, которые могут быть полезны на разных этапах подготовки компонентов системы CRISPR/Cas.
О последнем продукте стоит рассказать немного подробнее, поскольку он существенно упрощает самостоятельный синтез sgРНК и оптимизирован для работы с белками Cas9 производства New England Biolabs.
Данный набор предназначен для простого и быстрого синтеза 4-25 мкг гидовой РНК (sgРНК) с помощью входящих в комплект реагентов и таргет-специфичного ДНК-олигонуклеотида, подобранного пользователем. Получаемая таким образом sgРНК может управлять активностью следующих вариантов нуклеазы Cas9:
Процесс синтеза sgРНК с помощью набора EnGen® состоит из следующих этапов:
Рис.7. Синтез сгРНК с помощью набора EnGen®.
Для подбора таргет-специфичного олигонуклеотида компания New England Biolabs разработала с пециальный онлайн-инструмент EnGen™ sgRNA Template Oligo Designer. Его 5’-конец должен содержать промотор фага T7, средняя часть - соответствовать целевой последовательности редактируемой ДНК, а 3’-конец - быть комплементарным 5’-концу скаффолд-олигонуклеотида, входящего в состав набора.
На первом этапе синтеза таргет-специфичный ДНК олигонуклеотид и скаффолд-олигонуклеотид отжигаются друг на друге. Затем происходит достройка вторых цепей этой конструкции с помощью ДНК-полимеразы. В результате последующей in vitro транскрипции и образуется sgРНК (Рис. 7).
Их разделяют на 3 основные группы:
Более подробно указанные способы доставки освещаются в публикации Lino C.A. et al.1
Если говорить о растительных объектах, то стоит упомянуть такие методы, как трансформация с помощью агробактерий и Ti-плазмид, доставка с помощью вирусных систем (например, на основе геминивирусов), биобаллистика.
Оценивать результаты редактирования генома можно на трёх уровнях: ДНК, мРНК и белков.
Выбор метода анализа ДНК зависит от того, какие мутации вы хотели внести редактированием (см. Табл. 5).
Рестриктный анализ возможен в случае, если в целевом участке ДНК должен был появиться или, наоборот, исчезнуть сайт узнавания какой-либо рестриктазы.
Если в результате редактирования целевой участок должен был претерпеть достаточно длинные инсерции или делеции, то можно воспользоваться методом ПЦР и сравнить количества ампликонов разной длины.
Также для детекции инсерций и делеций, а также точечных мутаций подходит метод реал-тайм ПЦР с ДНК-зондами.
Секвенирование даст прямой ответ на вопрос, какие конкретно изменения произошли в целевом участке ДНК.
Таблица 5. Продукция New England Biolabs для анализа результатов редактирования геномов.
Еще один метод детекции мутаций после редактирования генома основан на использовании T7 эндонуклеазы I. И компания New England Biolabs предлагает специальный набор для такого анализа: набор EnGen® для детекции мутаций.
Принцип детекции мутаций заключается в способности T7 эндонуклеазы I распознавать и расщеплять в двухцепочечной ДНК участки неспаренных оснований длиной более 1 н.п.
Протокол анализа состоит из следующих этапов:
Рис. 8. Принцип детекции мутаций с помощью набора EnGen®.
Любой эксперимент по геномному редактированию состоит из следующих этапов: дизайн, подготовка компонентов CRISPR/Cas9, доставка компонентов CRISPR/Cas9, анализ результатов.
В предыдущих разделах мы уже рассмотрели основные варианты реализации этапов 2 - 4. Теперь, опираясь на эту информацию, мы можем резюмировать, что для успешного проведения эксперимента в ходе дизайна необходимо:
Одним из самых ответственных этапов дизайна эксперимента является подбор целевых участков для редактирования ДНК и, соответственно, sgРНК.
В случае нуклеазы Cas9 S. pyogenes целевой участок должен иметь длину 20 н.п. и находиться с 5’-стороны от PAM-мотива с последовательностью 5’-NGG-3’. В среднем такие мотивы в геноме человека встречаются каждые 8 н.п., а их общее число в сборке GRCh38 достигает 303 795 341. То есть теоретически для редактируемой области генома можно подобрать даже несколько sgРНК.
Однако следует учитывать, что выбранный 20-нуклеотидный фрагмент вместе с PAM может встречаться в нескольких местах генома. Также белок Cas может быть толерантным по отношению к мисматчам при взаимодействии спейсера в составе sgРНК и целевого участка ДНК (в особенности к тем, которые находятся далеко от PAM). Более того, в некоторых случаях белок Cas может узнавать неканонический мотив PAM.
Эти факторы увеличивают вероятность нецелевого (off-target) редактирования генома, которые обязательно нужно учитывать на этом этапе дизайна. Также необходимо помнить о том, что геном данного конкретного объекта может отличаться от последовательности, выложенной в GenBank. Яркий пример – постоянные клеточные линии человека и сборка GRCh38.
В настоящее время разработано большое количество онлайн-инструментов, помогающих подбирать sgРНК для разных белков Cas в разных геномах. Во всех из них реализованы алгоритмы просчёта вероятности нецелевого редактирования и определения наиболее удачного варианта sgРНК.
Инжиниринг антител в клетках млекопитающих
В 2019 году группа специалистов из Высшей технической школы в Цюрихе16 разработала методику стабильной интеграции кассет генов лёгких и тяжёлых цепей антител в геном с помощью CRISPR/Cas-редактирования. В результате удалось получить эффективную систему дисплея и секреции антител.
При этом исследователи использовали оригинальный подход к доставке в клетки донорной ДНК (для HDR репарации). Изначально они включали её в состав дцДНК плазмиды. Но после электропорации всех компонентов системы CRISPR в клетки гибридомы комплекс Cas9/sgРНК вырезал донорную ДНК из плазмиды. Свои последующие функции она выполняла уже в виде фрагмента дцДНК.
Самое примечательное, что в вырезании донорной ДНК принимали участие те же Cas9 и sgРНК, что и в интеграции генных кассет в геном. Это достигалось за счёт встраивания в состав плазмиды такого же целевого участка ДНК, что и в сайте интеграции.
Анализ редких генетических вариантов
В феврале 2020 года группа исследователей из Китая и Саудовской Аравии17 разработала метод мечения единичных молекул ДНК перед секвенированием следующего поколения для анализа генетических вариантов с частотой встречаемости до 4x10-5. Эта стратегия получила название Individual DNA Molecule sequencing (IDMseq)
Секвенирование проводили на платформах Oxford Nanopore, PacBio, Illumina. Для анализа его данных авторы предложили специальный биоинформатический алгоритм - Variant Analysis with UMI for Long-read Technology (VAULT).
Систему редактирования CRISPR/Cas в данном случае использовали для моделирования редких генетических вариантов.
Выявление генов, участвующих в регенерации спинного мозга после повреждения
В апреле 2020 года Keatinge M. et al.18 проанализировали, как нарушение рамки считывания в 30 макрофаг-ассоциированных генах влияет на скорость регенерации спинного мозга данио-рерио после повреждения. Мутации в исследуемые гены вносили методом геномного редактирования CRISPR/Cas.
В качестве РНК, программирующей специфичность нуклеазы Cas9, исследователи использовали пару tracrРНК/crРНК. При этом они провели скрининг 350 различных crРНК и в дальнейшей работе использовали только те из них, которые приводили к самому эффективному редактированию генов.
Авторы считают, что такой подход к выбору crРНК может быть более продуктивным, чем скрупулезный подбор единичных вариантов в соответствии с сущестующими рекомендациями.
Исследование нецелевых эффектов редактирования генома в раковых клеточных линиях
В конце 2019 года научная группа из Великобритании19 провела исследование нецелевых мутаций при редактировании генома трёх раковых клеточных линий: COLO320, HCC2998 и SW1463. Для их детекции авторы разработали быстрый и недорогой метод анализа на основе FISH.
Оказалось, что нецелевые эффекты могут быть весьма значительны и включать в себя не только протяжённые делеции, но и хромосомные перестройки. При этом sgРНК и белки Cas9 доставляли в клетки как в форме экспрессионных плазмид, так и в виде рибонуклеопротеинового комплекса.
Авторы полагают, что практика оценки нецелевых эффектов должна стать обязательным условием для любой публикации о редактировании генома.
Детекция вируса SARS-CoV-2 методом DETECTR
В 2018 году исследователи из США обнаружили, что фермент Cas12a обладает неспецифической транс-нуклеазной активностью по отношению к оцДНК (nonspecific ssDNA trans-cleavage activity).20 Это проявляется в том, что когда комплекс Cas12a/crРНК связывается с целевым участком ДНК, у нуклеазы Cas12a появляется способность неспецифически расщеплять любые молекулы оцДНК, присутствующие в системе.
На основе этого феномена авторы разработали метод детекции папилломавирусов HPV16 и HPV18 в анальных мазках людей, который получил название DETECTR (DNA Endonuclease-Targeted CRISPR Trans Reporter). Спустя ровно два года другая научная группа из США предложила модифицированный вариант этой методики для детекции коронавируса SARS-CoV-2 в мазках из носоглотки людей.21
Протокол SARS-CoV-2 DETECTR состоит из трех основных этапов:
За 7 лет с момента публикации первых работ по геномному редактированию CRISPR/Cas количество статей в базе данных PubMed по запросу «genome editing» достигло почти 18 000. Несмотря на это, многие молекулярно-биологические лаборатории ещё не взяли на вооружение этот метод.
В данном обзоре мы познакомили вас с самыми основами геномного редактирования. Надеемся, эта информация и продукция New England Biolabs помогут вам начать освоение этой технологии.
Кроме того, мы сотрудничаем с ещё одним производителем реагентов для CRISPR/Cas редактирования – южнокорейской компанией ToolGen. В её каталоге вы найдёте не только готовые Cas-белки и наборы, но и услуги по дизайну и синтезу компонентов системы CRISPR/Cas.
Присоединяйтесь к нам в Telegram!
Вебинары
Новости
Oxford Nanopore Technologies объявили о сотрудничестве с 10x Genomics
Мы в соцсетях