Технологии высокопроизводительного секвенирования (NGS) позволяют получать огромное количество данных и даже определять последовательности целых геномов. Однако это требуется далеко не всегда.
В некоторых случаях, для максимально информативного результата с минимальными финансовыми затратами достаточно проанализировать только определенные локусы. Это послужило предпосылкой разработки методов обогащения целевых участков генома.
Первые NGS-платформы позволяли получать лишь короткие прочтения длиной не более нескольких сотен нуклеотидов. Поэтому и первые технологии обогащения были предназначены для работы с короткими фрагментами.
С развитием NGS-секвенирования длинных прочтений и соответствующих платформ появилась потребность в методах обогащения длинных участков генома. Один из таких методов для своих нанопоровых секвенаторов MinION, GridION и PromethION разработали специалисты компании Oxford Nanopore Technologies (ONT), и именно ему посвящен наш свежий обзор.
В данном обзоре мы рассмотрим:
✔ Классические методы обогащения целевых фрагментов ДНК
✔ Традиционное применение нуклеазы Cas9 в молекулярной биологии
✔ Принцип обогащения длинных фрагментов с помощью нуклеазы Cas9 от ONT
✔ Варианты протокола обогащения с помощью нуклеазы Cas9 от ONT
✔ Подбор целевых участков для расщепления в ходе Cas9-обогащения
✔ Продукты New England Biolabs для обогащения по методу ONT
В настоящее время существует два основных подхода к обогащению целевых участков генома: амплификация и гибридизация.
|
Рис. 1. Классические методы обогащения целевых фрагментов ДНК.
|
Обогащение с помощью амплификации (Рис. 1, слева) подразумевает постановку ПЦР с праймерами, фланкирующими целевой участок. Главные недостатки такого подхода – ошибки, совершаемые ДНК-полимерзами, и ограничения по длине ампликонов.
Специальные полимеразы (например, LongAmp® Taq ДНК-полимераза от New England Biolabs) позволяют амплифицировать относительно длинные фрагменты, но их размер все же не превышает 30-40 т.п.н. Зачастую это значение меньше длины целевого участка. Тем не менее до сих пор именно этот метод использовали для обогащения образца перед нанопоровым секвенированием.
Второй поход заключается в гибридизации специфических олигонуклеотидов (зондов) с целевыми фрагментами ДНК и связывании образовавшихся комплексов с твердым носителем (Рис. 1, справа). Например, это могут быть шарики со стрептавидином, которые взаимодействуют с биотином на концах гибридизованных зондов. После отмывки нагруженного носителя от нецелевых компонентов образца, проводят элюцию обогащенной ДНК.
Длина целевых фрагментов, получаемых методом гибридизации, еще меньше, чем в случае амплификации – всего несколько сотен нуклеотидов.
Таким образом, ни один из двух классических подходов не позволяет обогатить образец по-настоящему длинными фрагментами, которые вмещали бы целые гены, мобильные элементы и т.д. И ни один их них не дает возможности в полной мере использовать потенциал платформ ONT.
Дезоксирибонуклеаза Cas9 (CRISPR associated protein 9) – один из компонентов системы адаптивного иммунитета некоторых бактерий, которая обеспечивает их защиту от чужеродной ДНК вирусов и плазмид.
Уникальная особенность этого фермента заключается в том, что его специфичность можно программировать с помощью особой crРНК (CRISPR РНК). При этом для каталитической активности нуклеазы Cas9 нужна еще одна РНК - tracrРНК (trans-activating CRISPR РНК), которая частично комплементарна crРНК.</p>
Рибонуклеопротеиновый комплекс Cas9/crРНК/tracrРНК способен распознавать участки ДНК, идентичные 20 н.п. на 5’-конце crРНК. При этом с 3’-стороны такого участка должен присутствовать так называемый PAM-мотив с определенной последовательностью (например, NGG в случае нуклеазы Cas9 Streptococcus pyogenes).
Распознав PAM-мотив, белок Cas9 с ним связывается, а затем расплетает двухцепочечную спираль ДНК с 5’-стороны. В свою очередь 5’-конец crРНК за счет комплементарности гибридизуется с минус-цепью ДНК. После этого нуклеаза расщепляет обе цепи ДНК между 3 и 4 н.п. (если считать в направлении 3’-5’ от PAM-мотива).
|
Рис. 2. Схема расщепления дцДНК рибонуклеопротеиновым комплексом Cas9/crРНК/tracrРНК.
|
Таким образом, используя разные crРНК, можно расщеплять разные участки ДНК одним и тем же ферментом Cas9. Это замечательное свойство системы легло в основу одной из технологий редактирования геномов, получившей название CRISPR/Cas.
Суть технологии заключается в доставке в живые клетки эукариот рибонуклеиновых комплексов Cas9/crРНК/tracrРНК (или их предшественников) с целью расщепления ДНК в определенных сайтах. После расщепления в клетках запускаются механизмы репарации, в ходе которых можно заменить исходную последовательность участка ДНК на другую.
Ключевой этап такого эксперимента – подбор crРНК, подходящей для расщепления целевого сайта ДНК. Для этой цели было разработано большое количество различных онлайн-инструментов.
Помимо экспериментов по редактированию геномов, нуклеаза Cas9 находит применение и в других областях молекулярной биологии. Так недавно специалисты ONT разработали метод обогащения длинных фрагментов ДНК перед нанопоровым секвенированием с использованием этого фермента.
Метод получил название Cas9 targeted sequencing, и его протокол уже доступен в базе знаний The Nanopore Community. Там же вы можете найти видеозапись обучающего вебинара Cas9 PCR-free enrichment.
Принцип данного обогащения состоит в блокировании концов нецелевых фрагментов, приводящем к невозможности лигирования к ним моторных белков. В самом простом случае протокол состоит из следующих этапов.
|
Рис. 3. Общая схема протокола Cas9 targeted sequencing.
|
В результате такого протокола нецелевые фрагменты ДНК остаются в образце и вместе с целевыми фрагментами попадают в проточную ячейку. Но они не несут на своих концах моторных белков и не способны связаться с нанопрой. Соответственно, нецелевые фрагменты не расходуют ресурсы проточной ячейки.
В предыдущем разделе мы рассмотрели схему самого простого варианта протокола Cas9-обогащения под названием Excision (Вырезание). Его советуют использовать в следующих случаях:
В одном протоколе можно одновременно вырезать до 100 и более ROI, используя целый пул соответствующих crРНК. При этом чтобы повысить эффективность обогащения, специалисты ONT рекомендуют делать двойные «разрезы» с обеих концов исследуемого фрагмента.
Для этого необходимо подобрать 4 участка для расщепления длиной 20 н.п. (2 - на плюс-цепи ДНК с одной стороны ROI, 2 – на минус-цепи ДНК с другой стороны) и 4 соответствующих crРНК.
|
Рис. 4. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Excision.
|
Второй вариант протокола носит название Single cut and read out. Он заключается в разрезании ДНК только с одного конца исследуемого фрагмента. Используется в случаях, когда:
Этот вариант идеально подходит, например, для характеризации сайта интеграции какого-либо элемента в геном.
|
Рис. 5. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Single cut and read out.
|
Если длина исследуемого фрагмента больше 20 т.п.н., то эффективность протоколов Excision и Single cut and read out снижается. Это связано с тем, что длина фрагментов геномной ДНК в исходном материале ограничена даже при использовании самых эффективных методов выделения (например, с помощью набора Monarch® от New England Biolabs).
В таком случае специалисты ONT рекомендуют использовать третий вариант протокола Cas9-обогащения – Tiling. Суть его заключается в подборе двух пулов crРНК, которые позволили бы разрезать ROI на несколько кусочков длиной 5-10 т.п.н. При этом кусочки, образующиеся при использовании первого и второго пула, должны перекрываться.
|
Рис. 5. Схема расщепления дцДНК и распределение покрытия при нанопоровом секвенировании по протоколу Tilling.
|
Расщепление ДНК с разными пулами crРНК, последующее 3’-аденилирование и лигирование адаптеров с моторными белками в таком варианте протокола проводят в разных пробирках. Объединение образцов происходит только перед очисткой на магнитных частицах.
|
Рис. 6. Схема протокола Tilling.
|
Какой бы вариант протокола вы не выбрали, на входе вам понадобится 1-10 мкг ДНК. Также необходимо помнить, что вырезаемые участки ДНК должны быть длиннее 3 т.п.н. Иначе вы можете потерять их на этапе очистки.
Как и в случае геномного редактирования, подбор целевых участков для расщепления и crРНК – ключевой фактор успеха эксперимента.
Специалисты ONT советуют использовать с этой целью онлайн-сервис CHOPCHOP ( hopchop.cbu.uib.no). Конкретные рекомендации по работе с ним вы можете найти в брошюре Targeted amplification-free DNA sequencing using CRISPR/Cas.
Здесь же мы приведем лишь несколько общих соображений, которыми стоит руководствоваться при подборе целевых участков.
Активные пользователи нанопоровых секвенаторов ONT знают, что в ходе подготовки различных библиотек широко применяются реагенты производства New England Biolabs. Протокол Cas9 targeted sequencing - не исключение.
В ходе его реализации ONT рекомендует использовать следующие продукты New England Biolabs:
Артикул | Наименование | Этап протокола |
M0525 | Быстрая щелочная фосфатаза из кишечника теленка | Дефосфорилирование исходной ДНК |
M0273 | Taq ДНК-полимераза со стандартным Taq буфером | 3’-аденилирование концов фрагментов ДНК |
N0440 | Раствор дАТФ | |
E6056 | Модуль NEBNext® для быстрого лигирования | Лигирование адаптеров |
Чтобы сделать заказ или узнать дополнительную информацию, позвоните по телефону 8 (495) 215-02-22 или 8 (800) 333‑22‑26, напишите по электронной почте info@skygen.сom или свяжитесь с менеджером по вашему региону.