Первые инструменты для редактирования генома появились в конце 1980-х гг. и представляли собой ферменты, называемые мегануклеазами. Они входят в более широкое семейство ферментов, именуемых эндонуклеазами. Как следует из названия («эндо» – внутри, «нукле» – ядро, «аза» – фермент), эти ферменты могут распознавать и вырезать фрагменты ДНК. Первым шагом в редактировании генома является разрыв ДНК (двухнитевый разрыв) в интересующей нас точке. Далее на место разрыва можно вставить новую последовательность и произвести репарацию ДНК, так сказать подлатать ее. После этого пусть клетки развиваются своим чередом. Это сродни перелому собственных ног, чтобы стать выше. Двухнитевые разрывы ДНК делаются в строго определенных местах (сайтах), длина которых может варьировать от 14 до 40 нуклеотидов, т. е. они очень специфичны и локализуются в конкретных областях генома. Однако мегануклеаза существует на для каждой известной последовательности ДНК, и это сильно ограничивает ее терапевтический потенциал.
Следовательно, требовались новые, более масштабируемые методы. С 1980-х гг. появились три таких генно-инженерных инструмента. Во-первых, это нуклеазы цинковых пальцев[7] (ZFN), во-вторых, транскрипционные активатор-подобные эффекторные нуклеазы (TALE-нуклеазы, TALEN), в-третьих, короткие палиндромные повторы, регулярно расположенные группами (CRISPR). Первые клинические исследования, в которых использовались такие генно-инженерные инструменты, появились в 2008 г., и с тех пор их количество и разнообразие непрерывно растет. С 2015 г. в этой области наблюдается такой серьезный прогресс, что сегодня эти методы вошли в стандартную программу школ и колледжей.
Искусственные нуклеазы с доменами цинковых пальцев. При исследованиях, касающихся ZFN, активно используются знания, полученные в ходе изучения факторов транскрипции (TF) с «цинковыми пальцами». TF – это ведущие регуляторы экспрессии генов, постоянно сканирующие геном, чтобы определить, какие гены следует включить, а какие выключить. Если сравнить ваши гены с кухонной техникой (холодильник, тостер, плита, кофемолка), то факторы транскрипции можно сравнить с руками, нажимающими кнопки «вкл.» и «выкл.». Поскольку эти ферменты сотни миллионов лет натаскивались на чтение конкретных последовательностей ДНК (их называют мотивами), они умело управляют клеточными функциями, когда находят узнаваемый мотив. Поэтому ZFN-ферменты стали очевидными кандидатами на роль инструментов для ювелирного нацеливания на последовательности ДНК.
Но даже у транскрипционных факторов есть собственные регулирующие рычаги и переключатели. Например, «заграбастав» ион цинка, транскрипционный фактор ZFN становится более стабильным, и именно это помогает ему распознавать заданный мотив и взаимодействовать с ДНК. Следовательно, если сравнить геном с патологией с открытой страницей текста, на которой вы хотите применить команду «найти и заменить», то транскрипционный фактор выполняет именно функцию «найти», а ион цинка подобен клавише «ввод». Все, что в данном случае требуется сделать, – сочленить его с другим ферментом, который сыграет роль функции «заменить».
Нуклеазы с доменами цинковых пальцев выполняют функцию «найти и заменить», сшивая фрагменты двух белков (получается так называемый гибридный белок). Большинство белков – крупные молекулы со сложной трехмерной структурой, в которой выделяется множество областей (доменов). Отдельные подсекции в этих 3D-структурах можно сшивать друг с другом, и ZFN в данном случае не исключение. Следовательно, ту часть нуклеазы, которая режет ДНК (например, мегануклеаза), можно связывать с фрагментами белка, распознающими строго конкретные сайты (то же касается мотивов транскрипционных факторов ZFN). Это позволяет разрезать геном в строго конкретных сайтах.
Правда, отдельный мотив транскрипционного фактора очень короток (состоит из всего трех-четырех пар оснований) и поэтому не слишком специфичен. Если в геноме лишь четыре основания, то множество мишеней, которые можно сгенерировать на основе трех или четырех оснований, включает всего 43 (n = 64) или 44 (n = 256) комбинаций, что слишком мало для выстраивания мишеней многих типов. Чтобы преодолеть эту преграду, исследователи из лаборатории Джордано в 2002 г. использовали от семи до восьми таких сайтов распознавания цинковых пальцев. Их собирали в единую конструкцию так, чтобы ZFN позволяли одновременно нацеливаться на 20–24 основания. Таким образом команда научилась нацеливаться на гены, отвечающие за ангиогенез в онкологической мышиной модели. Это был один из первых примеров, на которых удалось продемонстрировать специфичность и силу ZFN. В 2008 г. аналогичным методом исследователи смогли нацелиться на клетки глиобластомы (in vitro) и повысить их восприимчивость к обработке глюкокортикоидами. Но это не единственный способ редактирования генома.
TALE-нуклеазы. TALE-нуклеазы (TALEN) похожи на ZFN тем, что имеют тот же домен нуклеазы, который отвечает за разрезание ДНК. Но сила TALE-нуклеаз заключается в распознавании нужных сайтов по «маячкам», а не по факторам транскрипции, как в случае с ZFN. Их домен для распознавания сайтов ДНК гораздо длиннее и включает 34 аминокислоты, для которых характерна высокая консервативность. TALE-белки секретируются бактериями Xanthomonas (фитопатогенами) и служат для перепрограммирования растения-хозяина. Перепрограммирование происходит так: белок связывается с промоторными последовательностями растения-хозяина и управляет активацией различных генов этого растения, помогающих Xanthomonas в процессе инфицирования.
Поскольку «область распознавания» у TALEN длиннее, чем у ZFN, в начале 2010-х гг. первые быстро стали предпочтительным методом редактирования генома. У TALEN достаточно длинные сайты связывания (> 30 пар оснований), они отличаются высокой специфичностью и, работая с ними, ниже шанс «промазать» при разрезании молекулы. Это важно, например, чтобы не повредить тот сайт, который мы редактировать не собирались (допустим, онкоген). Кроме того, последовательности TALEN отличаются регулярностью, и поэтому их проще конструировать. В совокупности эти свойства привели к тому, что TALEN стали считать наиболее точным инструментом редактирования генов и поиска наиболее подходящего сайта, через который удобно бороться с болезнью. Так было до появления CRISPR.
CRISPR. Технология CRISPR напоминает как TALEN, так и ZFN в том, что в данном случае также имеется молекула, которой мы пользуемся в качестве ориентира при движении по геному. С ее помощью мы находим интересующий сайт, разрезаем ДНК и вносим в цепочку ДНК заданные изменения. Однако революционная особенность CRISPR – легкость редактирования генома при помощи этой технологии. При работе с CRISPR используется гидовая РНК (гРНК), буквально подводящая молекулярный механизм к нужной точке. Поэтому разрез ДНК выполняется прицельно. Здесь важно отметить, что в качестве «сканирующего элемента» данной технологии служит последовательность РНК, а не белковый мотив. Таким образом, можно легко и непосредственно синтезировать молекулу, нужную для нацеливания на конкретные области генома, как только станет известна искомая последовательность. С учетом сложности преобразования последовательности нуклеотидов в соответствующие им аминокислотные последовательности гораздо проще синтезировать совершенно новые мишени при помощи РНК, чем синтезировать новые белки с высокоспецифичными мотивами.
Революция CRISPR
История CRISPR, а также связанных с ней инструментов, методов и базовых механизмов помогает увидеть и понять, насколько быстро случайная находка может привести к революции в медицине. Технология CRISPR, опирающаяся на накопленные за многие десятилетия инновации и разработки, теперь стала неотъемлемой частью молекулярной биологии и клинической практики. Стремительное развитие биологических методов редактирования и конструирования геномов в ближайшие 500 лет будет только ускоряться. Кроме того, нас ждет плодотворное взаимодействие сравнительной геномики, тщательно подготовленных механистических экспериментов и простых, но глубоких биологических наблюдений. Краткий обзор истории разработки CRISPR, по сути, является предварительным просмотром того, что мы можем обнаружить при исследовании других планет.
Как часто случается в науке, технология CRISPR была открыта случайно. Этот метод был найден в 1987 г. японскими исследователями (в том числе Ёсидзуми Исино). Они изучали один из генов клонированного ими фермента, этот ген называется iap. Клонируя ДНК, ученые заметили необычные повторы в полученной молекуле. Повторы – частое явление в генетике, они встречаются либо в последовательных сегментах, либо в тандемах, но эти оказались очень необычными.
В первый момент было непонятно, что означают эти повторы, но новые факты не заставили себя ждать. В 1993 г. нидерландский ученый Ян ван Эмбден и его коллеги исследовали палочку Коха (Mycobacterium tuberculosis), возбудителя туберкулеза. Они также заметили у этой бактерии одну странность. В ее геноме наблюдались кластеры повторяющихся последовательностей, которые были названы прерывистыми прямыми повторами. Оказалось, что у разных штаммов туберкулеза эти последовательности неодинаковы. Поначалу такое явление удивило команду ван Эмбдена, но затем ученые выяснили, что расхождение повторов специфично для каждого штамма. Это открывало возможность получать праймеры, обеспечивающие ювелирное нацеливание на конкретный штамм M. tuberculosis, например на более вирулентный, а не на сравнительно безвредный. Олигонуклеотиды (праймеры) для каждого вида бактерий позволяли быстро генотипировать все найденные штаммы. Соответствующий процесс называют сполиготипированием и используют по сей день. По мере того как в 1990-х гг. накапливались все данные по секвенированию геномов, стало возможно проследить подобные тенденции и у других микроорганизмов. Сегодня бактерии, археи и прочие организмы, поддающиеся анализу, изучают методом автоматического секвенирования по Сэнгеру. Этот метод дал массу данных для открытий, в том числе для выявления всего необычного.