Сначала неизбежно идут: мысль, фантазия, сказка. За ними шествует научный расчет. И уже, в конце концов, исполнение венчает мысль.
Начало — половина целого.
После открытия структуры ДНК и расшифровки содержащегося в ней генетического кода сразу же начался следующий важный этап — изучение организации целых геномов. Но до прямого определения всех нуклеотидных последовательностей гигантских молекул ДНК было еще очень далеко. Дело в том, что в 60-х и начале 70-х годов прошедшего столетия технические возможности и методические подходы к исследованиям столь больших биологических молекул были еще весьма несовершенны. Однако энтузиазм ученых после установления основных особенностей структуры ДНК был огромным, и на эту главную молекулу жизни навалились со всех возможных сторон многочисленные специалисты, используя все доступные на то время методы и средства.
Хромосомы дают первые сведения о структуре генома
Выше уже говорилось, что в ядре клетки молекулы ДНК расположены в особых структурах, получивших название хромосомы. Их исследование началось еще свыше 100 лет назад с помощью обычного светового микроскопа. Уже к концу XIX века выяснилось кое-что о поведении хромосом в процессе деления клеток и высказывалась мысль об их участии в передаче наследственности.
Хромосомы становятся видимыми в микроскопе при делении клетки на определенной стадии клеточного цикла, называемой митозом. Хромосомы в этом состоянии представляют собой компактные палочковидные структуры разной длины с довольно постоянной толщиной, у большей части хромосом имеется перетяжка, которая делит хромосому на два плеча. В области перетяжки расположена важная для удвоения хромосом структура, называемая центромерой. При делении клетки в ходе митоза происходит удвоение числа хромосом, в результате которого обе вновь образующиеся клетки в конечном итоге обеспечиваются одним и тем же стандартным набором хромосом.
Лишь в 1956 г. впервые Ю. Тио и A. Леван описали хромосомный набор человека, определили количественный состав хромосом и дали их общую морфологическую характеристику. По сути дела эти работы и положили начало изучению структуры генома человека. У человека в каждой клетке тела содержится 46 хромосом, физические длины которых находятся в пределах от 1,5 до 10 мкм (рис. 7).
Рис. 7. Вид под микроскопом полного набора хромосом, содержащихся в ядре каждой отдельной клетки человека
Напомним читателю, что набор хромосом во всех клетках человека (за исключением половых) называют диплоидным (двойным), поскольку каждая из хромосом представлена двумя копиями (всего 23 пары). Каждая соматическая клетка человека (кроме красных кровяных клеток крови) содержит по 2 полных набора хромосом. В каждом единичном (гаплоидном) наборе присутствует 23 хромосомы — 22 обычные хромосомы (аутосомы) и по одной половой хромосоме — X или Y. Таким образом, геном каждого конкретного человека состоит из 23 пар гигантских молекул ДНК, распределенных в разных хромосомах, а если говорить о геноме человека вообще (мужчин и женщин), то общее число таких молекул равно 24. Это первое базовое сведение, которое было получено о геноме человека при анализе хромосом.
Изучение строения (размера и формы) хромосом человека показало, что большинство из них по внешнему виду напоминают кегли, состоящие из двух толстых частей (хроматид) и тонкой перетяжки (центромеры) между ними. Сходство с кеглями, а не с гантелями заключается в том, что центромера чаще всего расположена не в центре хромосомы, а смещена к одному из ее концов. Размеры хромосом сильно варьируют, самая короткая хромосома примерно в десять раз меньше, чем самая длинная. Это второе принципиально важное сведение о структуре генома человека — составляющие его 24 молекулы ДНК имеют разный размер.
Если сравнивать число и размер хромосом у человека и у других видов организмов, то можно увидеть огромные отличия. Например, у коровы, размер генома которой примерно равен геному человека, имеется 60 пар хромосом. У шпорцевой лягушки содержится всего 18 хромосом, но даже самые маленькие из них больше, чем самые крупные хромосомы человека. У птиц, наоборот, число хромосом достигает 40 и более и все они очень небольшие по размерам. Таким образом, разнообразие хромосом в природе весьма велико.
С помощью световой микроскопии были определены размеры всех хромосом человека. Затем все неполовые хромосомы были пронумерованы по уменьшению размера — от 1 до 22. Половым хромосомам не присвоили номер, а назвали X и Y. Как показали более точные последующие исследования, хромосома 21 реально оказалась чуть меньше 22, однако нумерацию хромосом не изменили (чтобы не вносить путаницу). Различие в хромосомных наборах между мужчинами и женщинами состоит в том, что у женщин имеются две половые X-хромосомы (т. е. хромосомы во всех 23-х парах одинаковы), а у мужчин пару с X-хромосомой образует мужская половая хромосома — Y. Каждую хромосому можно рассматривать как отдельный том большого двадцатичетырехтомного собрания сочинений под названием Энциклопедия человека.
Половые клетки человека, в отличие от клеток тела взрослого организма (соматических клеток), содержат не 2 набора томов ДНКового текста, а всего лишь один. Перед зачатием каждая отдельная хромосома (отдельный том в Энциклопедии человека) сперматозоида отца и яйцеклетки матери состоят из смешанных в разном сочетании различных глав ДНКового текста их родителей. Любая из хромосом, полученная нами от отца, образовалась в его семенниках незадолго до того, как мы были зачаты. Ранее, за всю историю человечества, точно такая хромосома никогда не существовала. Она была сформирована в процессе случайного перемешивания, происходящего при делении, постепенно образуясь из объединяющихся друг с другом участков хромосом предков со стороны отца. Также обстоит дело и с хромосомами яйцеклеток, за исключением того, что они формируются в организме нашей матери задолго до нашего рождения (почти сразу после рождения самой матери).
В зиготе, образующейся в результате слияния сперматозоида и яйцеклетки, материнские и отцовские гены смешиваются и перетасовываются в разных сочетаниях. Это происходит в результате того, что хромосомы не остаются неизменными в поколениях — они вступают во взаимодействие со своей случайно встреченной парой, обмениваясь с ней материалом. Такой постоянно идущий процесс получил название рекомбинации. И следующему поколению часто достается уже гибридная хромосома — часть от дедушки и часть от бабушки. Далее в ряду поколений пути генов постоянно пересекаются и расходятся. В результате слияния уникальной яйцеклетки с уникальным сперматозоидом и возникает уникальный во всех отношениях геном. И в этом смысле все мы уникумы. Каждый человеческий индивид хранит уникальную генетическую информацию, состоящую из случайной комбинации разных вариантов генов.
Отдельный ген можно рассматривать как единицу, продолжающую существовать в ряду многочисленных поколений. И в этом смысле ген бессмертен! Существует даже такая оригинальная точка зрения, что не сами люди, а их гены правят миром, а каждый конкретный живой организм служит лишь временным прибежищем для них. Эта не бесспорная мысль принадлежит Ричарду Докинзу, автору книги «Эгоистичный ген». По его мнению, гены практически бессмертны в отличие от живых организмов, в которых они существуют. Некоторым генам десятки и даже сотни миллионов лет. Гены, пользуясь терминологией Докинза, делают все возможное, чтобы выжить. Приспосабливаются к жаре и холоду, выбирая себе местечко получше, мигрируют с помощью человека и вступают в новые комбинации. Человек оказался довольно непоседливым хозяином. За тысячи лет он сильно исколесил мир, распространяя свое присутствие, влияние и свою начинку — гены. (Подробнее с идеями и аргументацией Р. Докинза любознательный читатель может познакомиться в Приложении 1). Такая точка зрения далеко не бесспорна, и из дальнейшего изложения нам станет понятно, что гены — это в первую очередь не эгоисты, а трудоголики. Имеются гены — «сторожа» генома, гены — «дворники», гены — «повара» и гены — «домоуправители». Обеспечивая свое существование, они обеспечивают и существование нас.
Сразу после зачатия будущий человек представляет собой всего одну клетку (зиготу), наделенную одной исходной ДНКовой библиотекой, содержащей 46 томов. Среди 46 томов всегда 23 получены от отца, а другие 23 — от матери. Тексты 23 отцовских и 23 материнских томов хотя и очень сходны в целом, тем не менее отличаются в деталях. Например, в отцовском томе № 18 на странице 253 существует предложение-предписание (в виде гена), в котором сказано, что глаза у ребенка должны быть карими, а в этом же материнском томе на той же странице тоже написано о цвете глаз, но согласно этому тексту цвет должен быть голубыми. Первое указание более строгое (доминирующее), чем второе, и в результате у ребенка глаза будут иметь карий цвет. Ген, который диктует свои права, называют доминирующим, а тот, который уступает свои права, — рецессивным. Голубой цвет глаз имеют только те люди, у которых и в материнском, и в отцовском тексте содержатся рецессивные гены, в которых есть указание на голубоглазость. Затем зигота делится на две клетки, каждая из них вновь делится и так до появления миллиардов клеток. Схематически процесс деления клеток изображен на рис. 8.
При каждом делении клетки содержащиеся в библиотеках тома ДНКового текста точно копируются, причем практически без ошибок. Организм взрослого человека состоит в среднем из 1014 клеток. Например, в головном мозге и печени насчитывается примерно по 10 млрд. клеток, в иммунной системе — 300 млрд. клеток. В течение всей жизни человека в его организме происходит около 1016 клеточных делений. Клеточный состав многих органов за 70 лет жизни обновляется несколько раз. И каждая из этих клеток содержит одни и те же 46 томов ДНКового текста.
В конце 60-х годов XX века был осуществлен важный прорыв в исследовании хромосом. Обусловлен он был всего лишь тем, что для их окраски стали использовать специальное контрастное вещество — акрихин-иприт, а затем и другие сходные с ним соединения. Такая окраска позволила выявить внутри хромосом большое число разных субструктур, которые не обнаруживались под микроскопом без окрашивания. После окрашивания хромосом специфическим красителем Гимза-Романовского они выглядят как зебры: вдоль всей длины видны поперечные светлые и темные полосы, имеющие окраску разной интенсивности.
Рис. 8. Основные стадии клеточного цикла, приводящего к делению клетки
Эти полосы получили название хромосомных G-сегментов или полос (рис. 9). Картина сегментации сильно отличается у разных хромосом, но расположение хромосомных сегментов постоянно у каждой из хромосом во всех типах клеток человека.
Природа полос, выявляемых при окраске, до конца еще не ясна. Сейчас установлено только, что участки хромосом, соответствующие темным полосам (названные R-полосами), реплицируются раньше, чем светлые участки (названные G-полосами). Таким образом, полосатость хромосом скорее всего все же имеет некий до конца еще не понятый смысл.
Окрашивание хромосом очень облегчило их идентификацию, а в дальнейшем способствовало определению расположения на них генов (картированию генов).
Рис. 9. Специфические хромосомные G-сегменты, выявляемые при окраске хромосом человека, и система их обозначения согласно решению международной конференции в Париже в 1971 году. Цифрами под хромосомами указаны их номера. X и Y — половые хромосомы, p — короткое плечо, q — длинное плечо хромосом
Хотя детальные процессы, происходящие при окрашивании, еще не до конца ясны, очевидно, что картина окраски зависит от такого параметра, как увеличенное или уменьшенное содержание в отдельных полосах хромосом АТ или ГЦ-пар. И это еще одно общее сведение о геноме — он не однороден, в нем есть районы, обогащенные определенными парами нуклеотидов.
Это, в частности, может быть связано с повторяемостью некоторых типов нуклеотидных последовательностей ДНК в определенных районах.
Дифференциальная окраска хромосом нашла широкое применение для выявления и идентификации небольших индивидуальных изменений генома конкретного человека (полиморфизма), в частности, приводящих к различным патологиям. Примером этому может служить обнаружение так называемой филадельфийской хромосомы, встречающейся у больных с хроническим миелоидным лейкозом. С помощью окраски хромосом установлено, что у пациентов с этим заболеванием определенный фрагмент исчезает на хромосоме 21 и появляется на конце длинного плеча хромосомы 9 (перенос фрагмента или транслокация, сокращенно t). Генетики обозначают такое событие как t (9; 21). Таким образом, хромосомный анализ свидетельствует о том, что разные молекулы ДНК могут обмениваться между собой отдельными участками, в результате чего в геноме образуются «гибриды», состоящие из молекул ДНК разных хромосом. Анализ уже изученных свойств хромосом позволил сформировать представление о полиморфизме генома человека.
Для выяснения локализации отдельных генов на хромосомах (то есть картирования генов) используют целый арсенал специальных зачастую весьма сложных по замыслу и исполнению методов. Один из основных — молекулярная гибридизация (образование гибрида) гена или его фрагмента с фиксированными на твердой подложке препаратами хромосом, выделенными из клеток в чистом виде (это называют гибридизацией in situ). Суть метода гибридизации in situ заключается во взаимодействии (гибридизации) между денатурированными (расплетенными) нитями ДНК в хромосомах и комплементарными нуклеотидными последовательностями добавленных к препарату хромосом, индивидуальных однонитевых ДНК или РНК (их называют зондами). При наличии комплементарности между одной из нитей хромосомной ДНК и зондом между ними образуются довольно стабильные молекулярные гибриды. Зонды маркируют предварительно с помощью разных меток (радиоактивных, флуоресцентных или др.). Места образования гибридов на хромосомах выявляют по положению этих меток на препаратах хромосом. Так, еще до появления методов генной инженерии и секвенирования ДНК выяснили, например, расположение в геноме человека генов, кодирующих большие и малые рибосомные РНК (рРНК). Гены первых оказались локализованными в пяти разных хромосомах человека (13, 14, 15, 21 и 22), тогда как основная масса генов малой рРНК (5S РНК) сконцентрирована в одном месте на длинном плече хромосомы 1.
Пример картины, получаемой при гибридизации меченых флюоресцентным красителем генов-зондов, приведен на рис. 10 на цветной вклейке.
Рис. 10. Гибридизация хромосом человека с генами-зондами, мечеными красным и зеленым флюоресцентными красителями. Стрелками указано расположение соответствующих генов на концах двух разных хромосом (справа вверху дано увеличение картины гибридизующихся хромосом).
Гены, расположенные на одной хромосоме, определяют как сцепленные (связанные) гены. Если гены расположены на разных хромосомах, они наследуются независимо (независимая сегрегация). Когда же гены находятся на одной и той же хромосоме (т. е. сцеплены), они неспособны к независимой сегрегации. Изредка в половых клетках могут происходить различные изменения хромосом в результате рекомбинационных процессов между гомологичными хромосомами. Один из таких процессов получил название кроссинговера. Из-за кроссинговера сцепление между генами одной группы никогда не бывает полным. Чем ближе расположены друг к другу сцепленные гены, тем меньше вероятность изменения расположения таких генов у детей по сравнению с родителями. Измерение частоты рекомбинаций (кроссинговера) используется для установления линейного порядка генов на хромосоме внутри группы сцепления. Таким образом, при картировании хромосом первоначально устанавливают, находятся ли данные гены в одной и той же хромосоме, без уточнения, в какой именно. После того, как хотя бы один из генов данной группы сцепления локализуют в определенной хромосоме (например, с помощью гибридизации in situ), становится ясным, что все другие гены этой группы сцепления находятся в той же самой хромосоме.
Первым примером связи генов с определенными хромосомами может служить обнаружение сцепления определенных наследуемых признаков с половыми хромосомами. Чтобы доказать локализацию гена в мужской половой Y-хромосоме, достаточно показать, что данный признак всегда встречается только у мужчин и никогда не обнаруживается у женщин. Группа сцепления женской X-хромосомы однозначно характеризуется отсутствием наследуемых признаков, передающихся от отца к сыну, и наследованием признаков матери.
Особенно важным для изучения генома человека на первых этапах его исследования стал метод, называемый гибридизацией соматических клеток. При смешивании соматических (неполовых) клеток человека с клетками других видов животных (чаще всего для этой цели использовали клетки мышей или китайских хомячков) в присутствии определенных агентов может происходить слияние их ядер (гибридизация). При размножении таких гибридных клеток происходят потери некоторых хромосом. По счастливой для экспериментаторов случайности в гибридных клетках человек-мышь происходит потеря большей части хромосом человека. Далее отбираются гибриды, в которых остается только какая-нибудь одна человеческая хромосома. Исследования таких гибридов позволили связать некоторые биохимические признаки, свойственные клеткам человека, с определенными хромосомами человека. Постепенно благодаря использованию селективных сред научились добиваться сохранения или потери отдельных хромосом человека, несущих определенные гены. Схема отбора, хотя и не очень проста на первый взгляд, довольно хорошо показала себя в эксперименте. Так, придумали специальную селективную среду, на которой могут выживать только те клетки, в которых синтезируется фермент тимидинкиназа. Если для гибридизации с клетками человека взять в качестве партнера мутантные клетки мыши, не синтезирующие тимидинкиназу, то будут выживать только те гибриды, которые содержат хромосомы человека с геном тимидинкиназы. Таким путем впервые удалось установить локализацию гена тимидинкиназы на хромосоме 17 человека.
Несмотря на то, что изучение генома человека на уровне хромосом дало ряд важных его характеристик, они были самыми общими и дали относительно мало для полного понимания устройства и функционирования генетического аппарата человеческих клеток.
Как двухметровая молекула умещается в микроскопическом ядре?
Как уже говорилось, молекулы ДНК, содержащиеся во всех хромосомах одной клетки человека, имеют общую длину около 2 метров. Это в среднем в миллион раз больше, чем диаметр клеточного ядра, составляющий порядка микрометра. Как же умещаются столь гигантские молекулы в таком маленьком ядре? Изучение структуры хромосом позволило ответить на этот вопрос. Оказывается, в ядре осуществляется «насильственная» упаковка молекул ДНК. Это достигается с помощью специальных механизмов, обеспечивающих изгибание двойной спирали ДНК. Существует несколько уровней «компактизации» ДНК в клетке (рис. 11).
Некоторые из особенностей упаковки ДНК изучены хорошо, а о некоторых существуют пока лишь приблизительные представления. Первый уровень компактизации заключается в накручивании нити ДНК, как нитки на катушку, на специальный комплекс ядерных белков (гистонов).
Рис. 11. Стадии упаковки ДНК в хромосомах (от двойной спирали до целых хромосом)
Нить ДНК делает около двух оборотов вокруг одного комплекса, а затем снова около двух оборотов вокруг второго комплекса и т. д. В результате образуется структура, напоминающая бусы. Отдельные бусинки в этой структуре получили название нуклеосомы. На одной нуклеосоме размещается около 200 пар нуклеотидов ДНК. Между нуклеосомами остается фрагмент ДНК размером до 60 пар оснований, называемый линкером. Этот уровень укладки позволяет уменьшить линейные размеры ДНК в 6–7 раз.
На втором уровне компактизации «бусы» укладываются в спираль, состоящую из шести нуклеосом на виток. При этом линейные размеры ДНК уменьшаются в сумме до 1 мм, т. е. в 25–30 раз.
Третий уровень компактизации молекул ДНК изучен еще плохо. Скорее всего, это петельная укладка фибрилл — образование петельных доменов, которые под углом отходят от основной оси хромосомы (уплотнение в 680 раз). Их можно видеть в обычный световой микроскоп.
На последнем уровне компактизации ДНК происходит ее уплотнение примерно в 10000 раз.
Анализ суммарной ДНК — новые сведения о структуре генома человека
На первом этапе непосредственного исследования структуры генома человека, когда еще не существовала методология генной инженерии, для изучения ДНК применяли традиционные физико-химические методы. В этих опытах использовали суммарные препараты ДНК, целиком выделенные из ядер клеток человека.
Пожалуй, первые сведения о молекулярной структуре генома человека были получены в результате центрифугирования в пробирке растворов ДНК в хлористом цезии при довольно высоких скоростях. В процессе вращения соли цезия создают тонкие слои раствора с различной плотностью (градиент плотности) вдоль пробирки и молекулы ДНК перемещаются в этом градиенте, пока не достигнут такой области, где плотность солевого раствора будет точно такой же, как их собственная. А плотность ДНК сильно зависит от содержания АТ и ГЦ-пар нуклеотидов, т. е., как говорят, от нуклеотидного состава. Оказалось, что основная масса ДНК человека после центрифугирования располагается преимущественно в одной зоне градиента (это соответствует среднему содержанию ГЦ-пар в геноме человека, равному 42 %). Однако наряду с этим неожиданно обнаруживались и небольшие (минорные) полосы, в которых также содержались молекулы ДНК, но с иной плотностью и, следовательно, с иным содержанием нуклеотидных пар. Такие минорные, или дополнительные фракции ДНК получили название «сателлитных». Такое имя дали этим фракциям не случайно. В то время как раз был запущен первый советский спутник (лат. satellitis — спутник). Это и натолкнуло исследователей на такое название.
Вскоре после того, как была установлена двухспиральная структура ДНК, обнаружили, что при сильном нагревании ДНК две ее цепи расходятся (расплавляются) и ДНК из двунитевой превращается в однонитевую. Это приводит к нарушению ее естественной структуры, что получило отражение в названии данного процесса — денатурация ДНК. Однако при охлаждении денатурированной ДНК комплементарные цепи находят друг друга и соединяются строго так, как они располагались в исходной неденатурированной молекуле, по типу застежки — «молнии». Этот процесс получил название ренатурации или реассоциации. Сразу же после обнаружения этого явления оно было использовано экспериментаторами в целях изучения структуры генома.
Немного совсем простой математики для тех самых любопытных, кто недавно закончил ВУЗ, изучал химию и еще не забыл все, чему его учили. Процесс реассоциации ДНК во многом сходен с обычной химической реакцией второго порядка и, по этой причине, может быть описан довольно простой формулой:
Сt /C0 = 1/(1 + k2 (C0 t)),
где C0 и Сt — концентрации однонитевых ДНК соответственно в начальный (нулевой) момент времени и в момент времени t после начала реакции реассоциации, k2 — константа скорости реакции второго порядка.
Для удобства изображения процесса реассоциации строят график, в котором по оси ординат откладывают долю реассоциированных молекул, а по оси абсцисс — величину C0 t. При таком изображении кривые кинетики реассоциации ДНК простейших организмов (вирусов и бактерий) имеют S-образный вид. Это соответствует кинетике химической реакции второго порядка. Если в эксперименте наблюдают отклонения от этой кривой, то это должно указывать на гетерогенность цепей ДНК по скорости взаимодействия друг с другом: одни реагирует быстрее, другие, соответственно, медленнее. Когда ДНК человека порезали на куски небольшого размера и измерили кинетику их реассоциации, то обнаружилось, что кривая, описывающая этот процесс, далека от стандартной (рис. 12).
Это явилось результатом того, что в ДНК человека имеются нуклеотидные последовательности, реассоциирующие с разной скоростью, а суммарная кривая реакции, наблюдаемая в опыте, отражает совокупность множества независимых реакций второго порядка. Когда были проведены эти эксперименты, уже существовал математический аппарат, позволяющий, хотя и очень грубо, вычленять из сложной суммарной кривой отдельные относительно однородные кинетические компоненты. Различия в скоростях реассоциации разных компонентов ДНК человека были связаны с разной представленностью в ДНК отдельных нуклеотидных последовательностей. Участки, которые присутствуют в геноме всего один раз, назвали уникальными. Если в геноме определенная нуклеотидная последовательность не уникальна, а представлена неким числом одинаковых копий (т. е. повторяется, отсюда и название — повторяющаяся), то такая последовательность, естественно, по чисто химическим законам, будет в растворе находить комплементарную цепь и взаимодействовать с ней (реассоциировать) значительно быстрее первой.
В результате такого анализа нашли, что в геноме человека около 75 % участков ДНК представлены 1 копией (уникальные) на гаплоидный геном (естественно, в ядре, являющемся диплоидным, имеется 2 копии каждой уникальной нуклеотидной последовательности). Остальную часть генома составляют повторяющиеся последовательности (повторы), среди которых 10 % представлены очень быстро реассоциирующими повторами (104 и более копий на геном) и около 15 % — умеренными повторами. Заметим сразу, что в дальнейшем эти оценки были существенно пересмотрены. Однако некоторые из этих результатов остались в силе до сих пор.
Рис. 12. Кинетика восстановления двунитевых молекул из искусственно разделенных комплементарных цепей ДНК человека (реассоциация). ДНК разбивают на небольшие фрагменты, денатурируют путем нагревания, а затем при охлаждении разошедшиеся цепи ДНК вновь соединяются. Чем чаще в смеси встречаются те или иные последовательности, тем быстрее они находят друг друга в растворе и реассоциируют. По этой кинетике определяли общее содержание повторяющихся и неповторяющихся (уникальных) нуклеотидных последовательностей в геноме человека
Первоначальные анализы показали, что среди быстро взаимодействующих друг с другом при реассоциации фрагментов ДНК присутствует некоторое количество таких, кинетика реассоциации которых отличается от реакции второго порядка. Причина этому оказалось в том, что эти участки представляют собой так называемые обращенные повторы, или палиндромы — взаимокомплементарные последовательности, расположенные не на разных, а на одной нити ДНК.
Таким образом, в ДНКовом текте присутствуют «предложения» — палиндромы («перевертыши»), одинаково читаемые слева направо и справа налево. Перевертыши хорошо известны из литературы — это предложения, которые читаются одинаково слева направо и справа налево без учета знаков препинания и интервалов между словами. В качестве примера приведем один из таких перевертышей:
УЖРЕДКОРУКОЮОКУРОКДЕРЖУ.
В ДНК перевертышами называют отрезки двойной антипараллельной спирали, которые имеют одинаковую нуклеотидную последовательность при чтении по обеим цепям в одинаковом направлении. Это выглядит как, например, в ниже приведенном случае:
Здесь стрелками показано направление цепей ДНК, а звездочками — водородные связи, образуемые между парами нуклеотидов. Общее число таких «перевертышей» в геноме человека оценено в интервале от 105 до 106. При этом они относительно равномерно распределены по ДНК.
Имеются в геноме человека и нуклеотидные последовательности, которые на всем своем протяжении построены из одной единственной «буквы». Если в одной цепи ДНК эта буква А, то в другой цепи, соответственно, будет буква Т. Такие участки названы гомополимерными. В случае приведенного выше примера последовательность нуклеотидов записывается, как поли(А) — поли(Т). Таким образом, выяснилось, что в геноме человека (а параллельно это изучали и в геномах других организмов) имеются все варианты нуклеотидных последовательностей, состоящих из 4 «букв», которые только можно себе мысленно представить.
Используя различные модификации метода реассоциации ДНК, установили также, что в большей части генома человека повторяющиеся и уникальные нуклеотидные последовательности перемежаются друг с другом, а средние длины перемежающихся повторяющихся и уникальных фрагментов ДНК составляют соответственно 300 и 2000 п. н.
Приведенные выше данные были, конечно же, усредненными и поверхностно отражали общую картину устройства генома человека. Тем не менее они послужили хорошей основой для дальнейших более углубленных исследований. Важно, что одновременно такие же работы проводились и с использованием других эукариотических организмов. Многие моменты оказались сходными у разных высших организмов и растений. Так постепенно начали вырисовываться в общих чертах основные принципы организации генома человека.
Новый этап — анализ индивидуальных элементов ДНК (генная инженерия)
Мысль ученых продолжала интенсивно работать. И в результате в 1970-х годах были разработаны принципиально новые методы работы с ДНК. Ее научились резать на фрагменты, сшивать их друг с другом, а затем переносить в клетки и целые организмы. На практике это сводится к созданию в пробирке (т. е. in vitro) новых молекул ДНК, состоящих из фрагментов разного происхождения (так называемых рекомбинантных ДНК), которые в естественных условиях не могут возникнуть благодаря установленным и тщательно охраняемым Природой межвидовым барьерам. Датой рождения нового революционизирующего направления, получившего название генной инженерии, принято считать 1972 год, когда в США была создана первая рекомбинантная молекула ДНК.
Становление генной инженерии происходило очень непросто. Уже в самом начале (в 1973 году) участники Гордоновской конференции направили письмо президенту Национальной Академии наук США, в котором высказывали серьезные опасения о возможной опасности рекомбинантных ДНК для здоровья человека и окружающей среды. Прозвучал даже призыв к мораторию на некоторые виды генно-инженерных исследований. Два года спустя состоялась конференция в Асиломаре (США), где также шла речь об опасности генно-инженерных манипуляций и их ограничении. Один из основных исследователей структуры ДНК Э. Чаргафф, в частности, вопрошал: «Имеем ли мы право посягать необратимым образом на эволюционную мудрость миллионов лет только для того, чтобы удовлетворить амбицию и любопытство нескольких ученых?» Озабоченность ученых объяснялась теоретической возможностью создания в пробирке новых генетических структур, способных вызывать необычные формы инфекционных заболеваний человека, или созданием организмов, неблагоприятно воздействующих на окружающую среду. Однако как тогда, так и по прошествии трех десятков лет не существует никаких подтверждений тому, что рекомбинантные ДНК представляют опасность для человека. Современное состояние молекулярной генетики и как вершина ее развития — секвенирование генома человека — свидетельствуют о том, что генная инженерия полностью оправдала большие надежды ученых и поддерживающей ее общественности. Сейчас уже практически нет спора в отношении важности и необходимости использования генной инженерии для решения как научных, так и практических задач, стоящих перед человечеством.
Генная инженерия как принципиально новая технология возникла в значительной мере на базе достижений, которых ученые добились при изучении молекулярных процессов, которые происходят в бактериальной клетке. Было сделано несколько важных открытий, прежде чем исследователи научились легко и направленно манипулировать с ДНК, а не просто смешивать фрагменты ДНК с бактериями и отбирать среди них случайно возникающие варианты (рекомбинанты).
Бактерии имеют высокоэффективный механизм защиты от чужеродной ДНК. Исследование этой проблемы привело к обнаружению в бактериях специальных ферментов, получившие название рестриктаз. Первые из них получены еще в 1970 г. Сейчас уже выделено несколько сот разнообразных рестриктаз из клеток разных видов бактерий. Каждый из таких ферментов «узнает» строго определенные короткие (обычно 4–6 п. н.) нуклеотидные последовательности ДНК, которые чаще всего представляют собой палиндромы, и разрезает ДНК на фрагменты по этим участкам. В результате этих свойств рестриктазы стали незаменимым инструментом в исследовании генома, своеобразным скальпелем для ДНК.
Большой удачей для экспериментаторов было то, что в большинстве случаев при нарезании рестриктазами ДНК образующиеся фрагменты содержат «липкие» концы, т. е. способны в дальнейшем соединяться друг с другом. Для восстановления химической связи таких слипшихся фрагментов стали использовать еще один новый класс ферментов — лигазы. Так появились первые инструменты, позволяющие целенаправленно манипулировать с молекулами ДНК in vitro. Следующий важный этап — размножение сконструированных рекомбинантных ДНК, чтобы можно было с ними работать дальше. Для этой цели стали использовать специальные ДНК — векторы, которые представляют собой или бактериофаги, или внехромосомные кольцевые молекулы — плазмиды, которые обладают способностью размножаться в бактериальных клетках. Если любой фрагмент ДНК внести в состав ДНК бактериофагов или плазмид, то при переносе в бактериальные клетки он будет там размножаться вместе с вектором. Наконец, были разработаны специальные подходы для отбора бактериальных клеток, в которых содержатся необходимые рекомбинантные ДНК. Все эти достижения позволили проводить клонирование ДНК, т. е. выделять из сложной смеси молекул определенные участки ДНК и размножать их.
Клонирование фрагментов ДНК дало в руки исследователей принципиально новый подход к выделению из сложной смеси ДНКовых фрагментов конкретных индивидуальных последовательностей. При этом они могли содержать осмысленные тексты (гены) или не содержать таковых. Традиционная биохимия не могла обеспечить подобную процедуру в силу того, что различные фрагменты ДНК химически очень сходны. Но генной инженерии это оказалось вполне под силу. Схематически процесс клонирования ДНК изображен на рис. 13.
Рис. 13. Схема процесса клонирования ДНК с использованием в качестве вектора бактериальной плазмидной ДНК
После разрезания ДНК на фрагменты с помощью рестриктазы все они соединяются ковалентно с вектором (вектор разрезан той же рестриктазой) в результате «слипания» концов молекул и последующей обработки «гибридов» лигазой. Так в пробирке создается искусственная или рекомбинантная ДНК. Затем осуществляют перенос множества образовавшихся рекомбинантных молекул в бактериальные клетки — трансформацию. Особенность процесса трансформации заключается в том, что в одну бактериальную клетку попадает лишь одна рекомбинантная молекула ДНК. После этого, благодаря отбору, размножаются только бактерии с рекомбинантными ДНК, содержащими требуемые нуклеотидные последовательности.
Для изучения структуры генома необходимо не только клонировать все его участки в виде рекомбинантных молекул, но, главное, расшифровать в них последовательность нуклеотидов, т. е. «прочесть» ДНКовый текст.
Важным моментом во всей этой генно-инженерной «кухне» было создание принципиально новой технологии размножения индивидуальных фрагментов ДНК in vitro. Этот удивительно простой метод получения фрагментов ДНК в неограниченном количестве копий был придуман при необычных обстоятельствах — ночью, во время автомобильной поездки в горах Калифорнии. Автор этой идеи нобелевский лауреат Кэри Б. Мюллис так вспоминает момент озарения. «Иногда удачная идея приходит в голову совершенно неожиданно. Со мной, например, это случилось в одну из апрельских ночей в 1983 г., когда я, сидя за рулем автомобиля, пробирался по освещенной луной горной дороге в секвойные леса Северной Калифорнии. Мысль моя случайно натолкнулась на процесс, благодаря которому можно получать копии генов в неограниченных количествах. Теперь он называется «полимеразной цепной реакцией». За создание новой технологии ее автор получил Нобелевскую премию.
Полимеразная цепная реакция (сокращенно ПЦР) дает возможность в течение дня из одной молекулы ДНК получать 100 миллиардов идентичных по структуре молекул. Эта реакция довольно проста в исполнении: нужны лишь ДНК, пробирка, несколько реагентов и источник нагревания и охлаждения. Препарат ДНК, который необходимо копировать, может быть получен и из кусочка ткани, и из капли засохшей крови, и из засушенной мумии, и даже из тела мамонта, пролежавшего несколько тысяч лет в вечной мерзлоте. Суть этого метода изображена на рис. 14 на цветной вклейке.
Сама процедура ПЦР заключается в следующем. Прежде всего, ДНК денатурируют, нагревая ее до 98 °C. При этом две цепи ДНК, относительно слабо связанные между собой, разделяются друг от друга. Далее в ход идут так называемые затравки (праймеры) — короткие однонитевые фрагменты ДНК, которые комплементарны краям того участка генома, который собираются размножать (амплифицировать). Эти затравки гибридизуются с комплементарными участками однонитевых молекул ДНК, после чего специальный фермент (ДНК-полимераза) удлинняет затравки, строя молекулу ДНК по матрице (цикл 1). Затем продукты реакции вновь денатурируют и процедуру повторяют необходимое число раз. За 20–30 циклов из одной молекулы можно получить миллионы копий ДНК. Этот процесс подобен цепной ядерной реакции, но осуществляется в пробирке с помощью специального фермента — термостабильной ДНК-полимеразы. По этой причине он и получил название полимеразной цепной реакции.
Рис. 14. Схема протекания полимеразной цепной реакции (ПЦР).
Конечная цель — определение полной последовательности нуклеотидов в ДНК человека
Длительное время искали эффективные методы, позволяющие определять последовательность нуклеотидов в длинных молекулах ДНК (такое определение нуклеотидной последовательности получило название секвенирование, от анг. sequence — последовательность). Только в середине 70-х годов секвенирование протяженных участков ДНК стало возможным. Связано это было с изобретением принципиально новых подходов. В 1976 г. А. Максамом и У. Гилбертом был разработан метод прямого секвенирования, основанный на химической деградации ДНК. В данном случае осуществляется специфическая химическая фрагментация длинной цепи ДНК (полинуклеотида), радиоактивно меченной с одного конца. Затем препарат меченой ДНК разделяют на четыре порции и каждую из них обрабатывают реагентом, модифицирующим одно или два из четырех оснований, содержащихся в ней. После разделения в специальном геле меченых фрагментов по размерам (с помощью электрофореза) на рентгеновских пленках смотрят, что при этом происходит с нуклеотидной последовательностью, и на основании этого делают вывод о порядке расположения нуклеотидов друг за другом в каждом фрагменте ДНК. Однако метод оказался довольно сложным. В становлении этого метода на его начальных этапах существенную роль сыграл российский ученый академик А. Д. Мирзабеков, работавший в лаборатории У. Гилберта.
Чуть раньше английский ученый Фред Сэнгер предложил иной способ расшифровки структуры ДНК, который в конечном итоге после разных модификаций стал основным. Согласно методу Сэнгера молекулу ДНК с помощью специальной обработки ферментами не только расщепляют на фрагменты, но и «расплетают» ее двойную спираль на две нити. Потом по каждому из полученных обрывков «нитей» с помощью специальных затравок восстанавливают недостающую вторую нить ДНК. При этом синтез второй нити осуществляется не полностью, а с помощью специального приема обеспечивается прекращение синтеза строго на одном из 4 нуклеотидов. В результате этого получался набор цепей ДНК с разной длиной — «лесенка». Эта «лесенка» становится видимой глазом после разделения всех фрагментов по размерам за счет того, что концы всех фрагментов содержат специфическую — или радиоактивную, или флуоресцентную метку. Следует отметить, что в разработку этого поистине революционизирующего метода существенный вклад был сделан и двумя российскими учеными: профессором С. К. Василенко и академиком Е. Д. Свердловым.
За разработку методов секвенирования Гилберт и Сэнгер получили Нобелевскую премию. Интересно, что для Сэнгера эта была уже вторая премия, первую он получил за расшифровку аминокислотной последовательности первого белка — инсулина.
Все автоматы-секвенаторы, которые появились позднее, были построены по принципу метода Сэнгера, поскольку он оказался более удобным для автоматизации процесса и компьютерной регистрации результатов. В настоящее время ряд крупных фирм занимается производством таких автоматов, а также стандартных наборов реактивов для анализа ДНК. Секвенирование стало достаточно рутинной лаборантской работой. А метод Максама — Гилберта имеет сейчас скорее историческое, чем практическое значение.
Во всех случаях основное правило заключается в том, чтобы в препарате ДНК, который собираются секвенировать, все фрагменты имели, по крайней мере, один одинаковый конец, т. е. одну точку отсчета. В этот фиксированный конец вводят радиоактивную (или флуоресцентную) метку. После этого проводят дальнейшие специфические расщепления молекул с помощью ферментов или химических агентов по строго определенным азотистым основаниям. Условия расщепления при этом таковы, что на каждый меченый фрагмент в среднем приходится один разрыв. В результате после расщепления образуется набор фрагментов разной длины, каждый из которых начинается в точке отсчета, а заканчивается на или перед определенным типом нуклеотида.
Полученные фрагменты разделяют по размерам с помощью электорофореза в гелях. Маленькие фрагменты движутся быстрее более крупных, и в результате такой процедуры все фрагменты выстраиваются друг за другом в зависимости от своей длины. Результат такого разделения изображен схематически на рис. 15.
Рис. 15. Схема, поясняющая процесс подготовки и прочтения ДНКового текста
Так осуществляют секвенирование небольших фрагментов ДНК (не более 1000 нуклеотидов). Но геномы даже самых примитивных организмов имеют размер свыше 500 000 п. н. Как же их секвенируют? Для этого разработано несколько стратегий. Не будем вдаваться в подробности, но укажем на некоторые основные из них.
Секвенирование простых геномов
Для определения нуклеотидной последовательности (т. е. первичной структуры) конкретного района ДНК в первую очередь необходимо упростить ее, что достигается путем разрезания ее на относительно короткие фрагменты. Сделать это можно, например, с помощью специальных «скальпелей» для ДНК — ферментов рестриктаз, о которых уже шла речь выше.
При секвенировании простейших организмов, у которых геном относительно невелик, обычно используют процедуру, называемую условно «сверху вниз». Всю ДНК «разрезают» на кусочки с помощью уже упоминавшихся выше ферментов рестриктаз, затем секвенируют эти кусочки по отдельности, а после «склеивают» из них полный геном. «Склеивание» оригинала осуществляется за счет того, что нуклеотидные последовательности разных кусочков перекрываются друг с другом, т. е. одинаковы по концам. Эта методология получила название «дробовика». Суть данной процедуры отражена на рис. 16.
Рис. 16. Схема стратегии «дробовика», используемая для секвенирования больших молекул ДНК
Однако в случае такого очень сложного генома, как геном человека, начали с другого, а именно с определения положения известных генов и других генетических маркеров на отдельных хромосомах, то есть с генетического картирования генома. Подобную задачу генетическими экспериментами на более простых объектах пытался решить еще Т. Морган, который за свои работы получил Нобелевскую премию в 1933 году. Теперь появились более эффективные методы. Один из них, называемый методом «радиационных гибридов», заключается в следующем. Клетки человека, растущие вне организма в питательной среде, облучают рентгеном, что приводит к гибели клеток в результате разрыва хромосомной ДНК на куски, содержащие от 2,5 до 25 млн. п. н. Но прежде, чем убитые облучением клетки распадутся, их сливают с клетками хомяка, в результате чего в разные клетки хомячка попадают разные наборы фрагментов ДНК человека. Затем «гибридные» клетки размножают в культуре, при этом в них наряду с собственной ДНК реплицируются и фрагменты чужеродной ДНК. Затем определяют состав известных генов и других генетических маркеров в каждой клеточной линии и, статистически обработав полученные данные, выводят наиболее вероятное их взаимное расположение в хромосомах. В качестве генетических маркеров использовали как гены, так и фрагменты ДНК с неизвестной функцией. Для картирования хромосом важным свойством маркеров являлся их полиморфизм, т. е. существование разных форм среди индивидуумов.
Так были построены первые генетические карты генома человека, на которых первоначально были отмечены различные генетические маркеры, отстоящие друг от друга на расстоянии не более 2 миллионов нуклеотидных пар (млн. н. п.).
Затем были составлены физические карты хромосом: первоначально с разрешением 0,1 млн. н. п., а затем 0,001 млн. н. п. Для этой цели на первом этапе применяли методы окрашивания хромосом и гибридизации с хромосомами in situ. И лишь позднее использовали рестриктазы. С помощью этих удивительно точно работающих ферментов «дробили» ДНК по строго определенным участкам на миллионы перекрывающихся между собой по нуклеотидной последовательности фрагментов, «разбирали» каждый из них по отдельности, после чего из них «склеивали» оригинал. «Склеивание» проводили на основании перекрывания фрагментов по нуклеотидной последовательности. Так постепенно шли все выше и выше. Поэтому данная стратегия получила название «снизу вверх». Со всей очевидностью можно сказать, что решалась грандиозная по масштабам и сложности задача. И решить ее ученые смогли только с помощью суперкомпьютеров. В результате были созданы физические карты разных областей ДНК и целых хромосом, состоящие из последовательно перекрывающихся друг с другом фрагментов. Набор таких «родственных» фрагментов получил название контиг (рис. 16).
А далее наступила очередь секвенирования отдельных рестрикционных фрагментов. Это привело в конечном итоге к построению секвенсовых карт, на которых степень разрешения была доведена до своего максимального значения. Если 20 лет назад расшифровка нуклеотидной последовательности ДНК длиной 1000 п. н. считалась большим научным достижением (за это можно было сразу получить степень доктора наук), то уже к 1990 году секвенирование ДНК стало массовой технологией. А сейчас квалифицированный лаборант проделывает такую работу всего за несколько часов.
После появления эффективных методов секвенирования ДНК и нескольких стратегий использования этого метода стал стремительно нарастать вал расшифрованных нуклеотидных последовательностей, в первую очередь таких простых организмов, как вирусы, а также отдельных клонированных фрагментов ДНК различных видов высших организмов. Так, еще в конце 1970-х годов была расшифрована структура первого живого объекта — вируса бактерий — бактериофага, обозначаемого как φΧ 174, имеющего длину 5386 п. н. Затем последовала очередь других.
В конце 80-х гг. были начаты крупные международные проекты, целью которых было полное секвенирование геномов бактерий, грибов, дрожжей, дрозофилы, мыши, пшеницы, человека и др. Первоначально была определена первичная структура ДНК микроорганизмов с размерами генома до 20 млн. п. н., к концу 1998 г. их число составило уже 18 (см. табл. 2). Наименьший размер генома у свободно живущих организмов (например, у бактерии Mycoplasma genitalium) составляет лишь около 600 000 п. н. У этой бактерии содержится всего 500 генов, причем 150 из них (если их удалять по одиночке) никак не влияют на её жизнеспособность. Так возникло предположение, что элементарная «машина жизни» теоретически должна работать при наличии всего лишь 350 генов.
Первые объекты для секвенирования были выбраны неслучайно. Большинство из этих микроорганизмов (архебактерии, спирохеты, хламидобактерии, кишечная палочка, возбудители пневмоний, сифилиса, гемофилии, метанобразующие бактерии, микоплазмы, риккетсии, цианобактерии) способны вызывать различные патологии у человека. В настоящее время многие из этих проектов уже завершены; исследовано свыше 800 полных клеточных геномов микоплазм, архебактерий, кишечной палочки, возбудителей ряда болезней человека, а также пекарских дрожжей, маленького червя-нематоды, дрозофилы и весьма интересного в практическом плане растения арабидопсиса. Весьма вероятно, что истинное число секвенированных к настоящему времени геномов гораздо больше, потому что многие фармацевтические фирмы засекречивают свои результаты, не публикуя их в открытой печати.