Реактивы, оборудование и
расходные материалы
для лабораторий
8 (800) 333-12-26 info@skygen.com
пн-пт: 9:30-18:00 по МСК

#64 Новый метод обогащения длинных фрагментов генома с помощью нуклеазы Cas9 от Oxford Nanopore Technologies

27.05.2020

Технологии высокопроизводительного секвенирования (NGS) позволяют получать огромное количество данных и даже определять последовательности целых геномов. Однако это требуется далеко не всегда.

В некоторых случаях, для максимально информативного результата с минимальными финансовыми затратами достаточно проанализировать только определенные локусы. Это послужило предпосылкой разработки методов обогащения целевых участков генома.

Первые NGS-платформы позволяли получать лишь короткие прочтения длиной не более нескольких сотен нуклеотидов. Поэтому и первые технологии обогащения были предназначены для работы с короткими фрагментами.

С развитием NGS-секвенирования длинных прочтений и соответствующих платформ появилась потребность в методах обогащения длинных участков генома. Один из таких методов для своих нанопоровых секвенаторов MinION, GridION и PromethION разработали специалисты компании Oxford Nanopore Technologies (ONT), и именно ему посвящен наш свежий обзор.

В данном обзоре мы рассмотрим:

Классические методы обогащения целевых фрагментов ДНК
Традиционное применение нуклеазы Cas9 в молекулярной биологии
Принцип обогащения длинных фрагментов с помощью нуклеазы Cas9 от ONT
Варианты протокола обогащения с помощью нуклеазы Cas9 от ONT
Подбор целевых участков для расщепления в ходе Cas9-обогащения
Продукты New England Biolabs для обогащения по методу ONT

Классические методы обогащения целевых фрагментов ДНК

В настоящее время существует два основных подхода к обогащению целевых участков генома: амплификация и гибридизация.

Классические методы обогащения целевых фрагментов ДНК
Рис. 1. Классические методы обогащения целевых фрагментов ДНК.

Обогащение с помощью амплификации (Рис. 1, слева) подразумевает постановку ПЦР с праймерами, фланкирующими целевой участок. Главные недостатки такого подхода – ошибки, совершаемые ДНК-полимерзами, и ограничения по длине ампликонов.

Специальные полимеразы (например, LongAmp® Taq ДНК-полимераза от New England Biolabs) позволяют амплифицировать относительно длинные фрагменты, но их размер все же не превышает 30-40 т.п.н. Зачастую это значение меньше длины целевого участка. Тем не менее до сих пор именно этот метод использовали для обогащения образца перед нанопоровым секвенированием.

Второй поход заключается в гибридизации специфических олигонуклеотидов (зондов) с целевыми фрагментами ДНК и связывании образовавшихся комплексов с твердым носителем (Рис. 1, справа). Например, это могут быть шарики со стрептавидином, которые взаимодействуют с биотином на концах гибридизованных зондов. После отмывки нагруженного носителя от нецелевых компонентов образца, проводят элюцию обогащенной ДНК.

Длина целевых фрагментов, получаемых методом гибридизации, еще меньше, чем в случае амплификации – всего несколько сотен нуклеотидов.

Таким образом, ни один из двух классических подходов не позволяет обогатить образец по-настоящему длинными фрагментами, которые вмещали бы целые гены, мобильные элементы и т.д. И ни один их них не дает возможности в полной мере использовать потенциал платформ ONT.

Традиционное применение нуклеазы Cas9 в молекулярной биологии

Дезоксирибонуклеаза Cas9 (CRISPR associated protein 9) – один из компонентов системы адаптивного иммунитета некоторых бактерий, которая обеспечивает их защиту от чужеродной ДНК вирусов и плазмид.

Уникальная особенность этого фермента заключается в том, что его специфичность можно программировать с помощью особой crРНК (CRISPR РНК). При этом для каталитической активности нуклеазы Cas9 нужна еще одна РНК - tracrРНК (trans-activating CRISPR РНК), которая частично комплементарна crРНК.</p>

Рибонуклеопротеиновый комплекс Cas9/crРНК/tracrРНК способен распознавать участки ДНК, идентичные 20 н.п. на 5’-конце crРНК. При этом с 3’-стороны такого участка должен присутствовать так называемый PAM-мотив с определенной последовательностью (например, NGG в случае нуклеазы Cas9 Streptococcus pyogenes).

Распознав PAM-мотив, белок Cas9 с ним связывается, а затем расплетает двухцепочечную спираль ДНК с 5’-стороны. В свою очередь 5’-конец crРНК за счет комплементарности гибридизуется с минус-цепью ДНК. После этого нуклеаза расщепляет обе цепи ДНК между 3 и 4 н.п. (если считать в направлении 3’-5’ от PAM-мотива).

Схема расщепления дцДНК рибонуклеопротеиновым комплексом Cas9/crРНК/tracrРНК
Рис. 2. Схема расщепления дцДНК рибонуклеопротеиновым комплексом Cas9/crРНК/tracrРНК.

Таким образом, используя разные crРНК, можно расщеплять разные участки ДНК одним и тем же ферментом Cas9. Это замечательное свойство системы легло в основу одной из технологий редактирования геномов, получившей название CRISPR/Cas.

Суть технологии заключается в доставке в живые клетки эукариот рибонуклеиновых комплексов Cas9/crРНК/tracrРНК (или их предшественников) с целью расщепления ДНК в определенных сайтах. После расщепления в клетках запускаются механизмы репарации, в ходе которых можно заменить исходную последовательность участка ДНК на другую.

Ключевой этап такого эксперимента – подбор crРНК, подходящей для расщепления целевого сайта ДНК. Для этой цели было разработано большое количество различных онлайн-инструментов.

Принцип обогащения длинных фрагментов с помощью нуклеазы Cas9 от ONT

Помимо экспериментов по редактированию геномов, нуклеаза Cas9 находит применение и в других областях молекулярной биологии. Так недавно специалисты ONT разработали метод обогащения длинных фрагментов ДНК перед нанопоровым секвенированием с использованием этого фермента.

Метод получил название Cas9 targeted sequencing, и его протокол уже доступен в базе знаний The Nanopore Community. Там же вы можете найти видеозапись обучающего вебинара Cas9 PCR-free enrichment.

Принцип данного обогащения состоит в блокировании концов нецелевых фрагментов, приводящем к невозможности лигирования к ним моторных белков. В самом простом случае протокол состоит из следующих этапов.

  1. Дефосфорилирование с помощью фосфатазы 5’-концов фрагментов ДНК в исходном образце.
  2. Добавление в образец двух рибонуклеопротеиновых комплексов Cas9/crРНК/tracrРНК, связывающихся с последовательностями на противоположных концах ROI (от англ. «Region of Interest» - исследуемый участок). При этом один комплекс узнает участок на плюс-цепи ДНК, а второй – на минус-цепи.
  3. Вырезание ROI c 5’-фосфатными группами на концах и аденилирование с помощью Taq ДНК-полимеразы и дАТФ 3’-концов. Белки Cas9 при этом остаются, как правило, связанными с нецелевыми фрагментами, отщепившимися от ROI.
  4. Лигирование адаптеров с моторными белками. Поскольку большинство концов нецелевых фрагментов «спрятано» от лигазы в ходе дефосфорилирования и нуклеазами Cas9, то адаптеры в основном лигируются только с целевыми фрагментами.
  5. Очистка на магнитных частицах.
  6. Нанесение библиотеки на проточную ячейку и запуск секвенирования.
Общая схема протокола Cas9 targeted sequencing
Рис. 3. Общая схема протокола Cas9 targeted sequencing.

В результате такого протокола нецелевые фрагменты ДНК остаются в образце и вместе с целевыми фрагментами попадают в проточную ячейку. Но они не несут на своих концах моторных белков и не способны связаться с нанопрой. Соответственно, нецелевые фрагменты не расходуют ресурсы проточной ячейки.

Варианты протокола обогащения с помощью нуклеазы Cas9 от ONT

В предыдущем разделе мы рассмотрели схему самого простого варианта протокола Cas9-обогащения под названием Excision (Вырезание). Его советуют использовать в следующих случаях:

  • Длина исследуемого фрагмента <20 т.п.н.,
  • Последовательность ДНК с его обоих концов известна.

В одном протоколе можно одновременно вырезать до 100 и более ROI, используя целый пул соответствующих crРНК. При этом чтобы повысить эффективность обогащения, специалисты ONT рекомендуют делать двойные «разрезы» с обеих концов исследуемого фрагмента.

Для этого необходимо подобрать 4 участка для расщепления длиной 20 н.п. (2 - на плюс-цепи ДНК с одной стороны ROI, 2 – на минус-цепи ДНК с другой стороны) и 4 соответствующих crРНК.

Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Excision
Рис. 4. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Excision.

Второй вариант протокола носит название Single cut and read out. Он заключается в разрезании ДНК только с одного конца исследуемого фрагмента. Используется в случаях, когда:

  • Длина ROI меньше 20 т.п.н.,
  • Известна последовательность только одного конца ROI.

Этот вариант идеально подходит, например, для характеризации сайта интеграции какого-либо элемента в геном.

Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Single cut and read out
Рис. 5. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Single cut and read out.

Если длина исследуемого фрагмента больше 20 т.п.н., то эффективность протоколов Excision и Single cut and read out снижается. Это связано с тем, что длина фрагментов геномной ДНК в исходном материале ограничена даже при использовании самых эффективных методов выделения (например, с помощью набора Monarch® от New England Biolabs).

В таком случае специалисты ONT рекомендуют использовать третий вариант протокола Cas9-обогащения – Tiling. Суть его заключается в подборе двух пулов crРНК, которые позволили бы разрезать ROI на несколько кусочков длиной 5-10 т.п.н. При этом кусочки, образующиеся при использовании первого и второго пула, должны перекрываться.

Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Tilling
Рис. 5. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Tilling.

Расщепление ДНК с разными пулами crРНК, последующее 3’-аденилирование и лигирование адаптеров с моторными белками в таком варианте протокола проводят в разных пробирках. Объединение образцов происходит только перед очисткой на магнитных частицах.

Схема протокола Tilling
Рис. 6. Схема протокола Tilling.

Какой бы вариант протокола вы не выбрали, на входе вам понадобится 1-10 мкг ДНК. Также необходимо помнить, что вырезаемые участки ДНК должны быть длиннее 3 т.п.н. Иначе вы можете потерять их на этапе очистки.

Подбор целевых участков для расщепления в ходе Cas9-обогащения

Как и в случае геномного редактирования, подбор целевых участков для расщепления и crРНК – ключевой фактор успеха эксперимента.

Специалисты ONT советуют использовать с этой целью онлайн-сервис CHOPCHOP ( hopchop.cbu.uib.no). Конкретные рекомендации по работе с ним вы можете найти в брошюре Targeted amplification-free DNA sequencing using CRISPR/Cas.

Здесь же мы приведем лишь несколько общих соображений, которыми стоит руководствоваться при подборе целевых участков.

  1. Длина целевого участка для расщепления составляет 20 н.п.
  2. Сразу за целевым участком должен следовать PAM-мотив NGG (если вы используете нуклеазу Cas9 S. pyogenes).
  3. Длина ROI должна быть не меньше 3 т.п.н. (если она меньше, то включите в него фланкирующие последовательности).
  4. Если последовательность ROI содержит повторы или не очень гетерогенна, необходимо включить в нее более гетерогенные фланкирующие участки.
  5. Обязательно проверяйте наличие SNP в подобранных целевых участках. В идеале, подобранные целевые участки должны быть уникальны в геноме и не иметь аналогов даже с 1 и 2 мисматчами.
  6. GC-состав целевых участков должен составлять 40-80 %.
  7. PAM последовательность нельзя включать в состав crРНК, иначе расщепления нуклеазой Cas9 не произойдет.
  8. Необходимо оценивать возможность формирования нежелательных вторичных структур в подобранных crРНК.

Продукты New England Biolabs для обогащения по методу ONT

Активные пользователи нанопоровых секвенаторов ONT знают, что в ходе подготовки различных библиотек широко применяются реагенты производства New England Biolabs. Протокол Cas9 targeted sequencing - не исключение.

В ходе его реализации ONT рекомендует использовать следующие продукты New England Biolabs:

Артикул Наименование Этап протокола
M0525 Быстрая щелочная фосфатаза из кишечника теленка Дефосфорилирование исходной ДНК
M0273 Taq ДНК-полимераза со стандартным Taq буфером 3’-аденилирование концов фрагментов ДНК
N0440 Раствор дАТФ
E6056 Модуль NEBNext® для быстрого лигирования Лигирование адаптеров

Чтобы сделать заказ или узнать дополнительную информацию, позвоните по телефону 8 (495) 215-02-22 или 8 (800) 333‑22‑26, напишите по электронной почте info@skygen.сom или свяжитесь с менеджером по вашему региону.