Прогресс в биологии — это переход от ложного знания к истинному незнанию.
В природе нет ничего бесполезного.
Теперь стало возможным оценить, что РНК синтезируется лишь максимум на 25–28 % нуклеотидных последовательностей генома человека. А на кодирование белков используется вообще всего лишь чуть более 1 % генома. Остальные транскрибируемые участки ДНК — это интроны белок-кодирующих генов и гены для РНК, не кодирующих белки. Таким образом, большая часть генома (свыше 70 %) не имеет, по-видимому, прямого отношения ни к каким генам и инертна в плане транскрипции. Как это ни странно на первый взгляд, но факт остается фактом. Большая часть генома не кодирует ни белки, ни какую-нибудь РНК вообще, т. е. не относится к генам или каким-то другим, функционирующим на уровне транскрипции (РНК), нуклеотидным последовательностям.
В ДНК, на которой не образуется никакая РНК и которая, таким образом, для кодирования информации совершенно нейтральна, записаны длинные тексты, которые сегодня представляются для ученых полной абракадаброй, смысл и происхождение которой совершенно не ясен. Зачем нужны клетке эти «бессмысленные» и никак, на первый взгляд, не работающие участки ДНК, пока никто не знает, хотя априори ясно, что ничего лишнего в природе не должно быть. При полном секвенировании генома человека, естественно, была определена последовательность не только генов, но и этих пока ничего не обозначающих для ученых участков. Но из чего-то они все-таки состоят. Когда провели их детальный анализ, то выяснилось, что здесь присутствует скопище всех мыслимых и немыслимых вариантов расположения букв, бессмысленных слов и предложений, различных повторов одного и того же «текста», палиндромов и так далее и так далее. Рассмотрим подробнее хотя бы основные из них.
ДНКовый текст человека перенасыщен повторами
Как уже было показано в ранних экспериментах, описанных выше, в ДНК человека содержатся многочисленные элементы, которые не кодируют никакие белки, но при этом многократно встречаются в ДНКовом тексте. В «догеномную» эру считалось, что такие повторы составляют около 25 % генома человека. Секвенирование ДНК показало, что их существенно больше: повторяющиеся последовательности в сумме занимают около 50 % ДНКового текста. А общее число таких повторов в геноме человека равно приблизительно 5 миллионам. Для сравнения: у дрозофилы доля повторов в геноме составляет менее 5 %, у червя — 6–7 %, а у других млекопитающих — чуть меньше, чем у человека. Повторы напоминают бессмысленные фразы, которые с упорным постоянством в разных вариациях повторяются в тексте, но от этого смысл в них все равно не возникает.
На рис. 25 приведены некоторые основные варианты расположения повторов в геноме человека, а далее мы подробнее остановимся на описании отдельных из них.
Рис. 25. Основные варианты расположения повторяющихся последовательностей в геноме человека. Повторы обозначены стрелками, неповторяющиеся участки — серыми линиями
Перевёртыши (обращенные повторы)
В ДНКовых текстах человека, как, впрочем, и в ДНК других организмов, присутствуют уже упоминавшиеся обращенные повторы, перевертыши или, как их еще часто называют, палиндромы. Уже говорилось о том, что перевертыши-палиндромы хорошо известны из литературы — это предложения, которые читаются одинаково слева направо и справа налево без учета знаков препинания и интервалов между словами. Считается, что палиндромы известны еще со времен Древней Греции, т. е. свыше двух тысяч лет. На Руси палиндромы когда-то назывались «рачьими стихами». В качестве примера приведем две державинские строки:
Я разуму уму заря,
Я иду с мечем судия.
Особое свойство таких участков ДНК заключается в том, что при определенных состояниях ДНК они способны образовывать структуры, называемые крестами. На рис. 26 дан пример одного из таких возможных крестов.
Рис. 26. Крест, способный образовываться последовательностью ДНК, состоящей из обращенных повторов
В реальной ситуации в клетке такие структуры действительно могут формироваться. Но зачем это нужно? Окончательного ответа на этот вопрос нет. Одно из предположений сводится к тому, что кресты могут быть местами связывания с какими-то специфическими белками, обеспечивающими регуляцию или процессов транскрипции, или репликации ДНК. С другой стороны, при транскрипции таких структур в РНК должны формироваться «шпильки», а такие структуры в РНК часто являются значимыми (то есть выполняют определенные функции — или способствуют транскрипции, или, наоборот, препятствуют ей).
Простые тандемные повторы (сателлиты)
Как и у других организмов, в геноме человека присутствуют короткие повторяющиеся нуклеотидные последовательности, которые расположены вплотную друг за другом (тандемно). Их часто называют сателлитными ДНК. Мы уже говорили о сателлитных ДНК ранее. Это те участки ДНК, которые при центрифугировании в градиенте солей цезия осаждаются отдельно вне области основной массы ДНК. В разных типах сателлитной ДНК различные копии представлены неодинаково — их численность варьируется от сотен до миллионов. Если записать их структуру текстом, то это выглядит, как, например, предложение из одного и того же слова: столстолстолстолстолстолстолстолстол. Ясно, что такие предложения не могут кодировать никакую серьезную информацию. Тем не менее выяснилось, что с сателлитными нуклеотидными последовательностями в некоторых случаях могут специфически взаимодействовать отдельные белки. А это уже некоторое довольно серьезное указание на возможное участие таких повторов в каких-то клеточных процессах.
К настоящему времени в геноме человека обнаружено по крайней мере шесть видов сателлитных повторов. Это в первую очередь три типа так называемых классических сателлитов. Сателлит 1 состоит из элементарной повторяющейся последовательности нуклеотидов длиной 42 п. н. (располагается на семи разных хромосомах); сателлиты 2 и 3 состоят из элементарных повторяющихся единиц длиной 5 п. н. (первый из них обнаружен на четырех, а второй — на двенадцати разных хромосомах).
Кроме того, во всех хромосомах человека присутствуют альфа-сателлитные повторы. Они имеют элементарную повторяющуюся нуклеотидную последовательность длиной 171 п. н. Существуют еще бета-сателлитные повторы с элементарной повторяющейся единицей длиной 68 п. н., которые встречаются лишь на девяти хромосомах. Еще реже представлены в геноме человека гамма-сателлитные повторы, имеющие элементарную повторяющуюся единицу длиной 220 п. н. Такие повторы присутствуют только на двух хромосомах человека (8 и X).
Распределение всех сателлитных ДНК вдоль хромосом не выглядит случайным. Так, некоторые из них «гнездятся» в районах, прилежащих к концам хромосом, и в области центромеры (перетяжка на хромосомах, которая не всегда расположена в самом центре, см. рис. 7). В частности, центромеры всех хромосом человека, размер которых варьирует от 0,1 до 4 млн. п.н., состоят преимущественно из альфа-сателлитных ДНК.
Наряду с типичными сателлитными ДНК, в геноме человека имеются нуклеотидные последовательности, получившие название мини- и микросателлитов, которые разбросаны по большинству участков всех хромосом и в сумме составляют около 3 % генома человека. В среднем один из таких сателлитов содержится в каждых 2 тыс. п. н. человеческого генома. Минисателлиты представляют собой повторяющиеся нуклеотидные последовательности размером от 11 до 500 п. н. Кластеры таких повторов занимают от 0,1 до 20 тысяч п. н. в человеческом геноме, а общее число таких районов во всех хромосомах человека составляет несколько тысяч. Еще меньше по размерам микросателлиты. Их повторяющаяся нуклеотидная последовательность состоит из 10 и меньше п. н. Микросателлиты занимают в геноме человека обычно небольшие участки (до 150 п. н.). Когда же в тексте повторяется всего одна «буква» из четырех, такие структуры называют гомополимерными нуклеотидными последовательностями. Примером гомополимерной последовательности нуклеотидов в геноме человека может служить последовательность ААААААААААААААААААААААА на одной нити и, соответственно, ТТТТТТТТТТТТТТТТТТТТТТТ на другой.
Микросателлиты, состоящие из двух пар нуклеотидов (динуклеотидные повторы), занимают около 0,5 % генома человека. Наиболее частыми динуклеотидами являются АЦ и АТ (50 и 35 % всех динуклеотидов, соответственно). А вот динуклеотидный повтор, состоящий из пары ГЦ, в ДНКовом тексте человека занимает всего лишь 0,1 %. Наиболее частые из более «сложных» микросателлитов (тринуклеотидных повторов) являются ААТ (33 % от всех тринуклеотидных повторов) и ААЦ (21 %). Триплет ЦГГ, который довольно редок в геноме, присутствует в гене FMR–1, определяющем синдром ломкости X-хромосомы. У нормальных людей число копий ЦГГ в гене варьирует от 6 до 54. А вот у больных индивидуумов такие триплеты «размножаются» и их число в гене может достигать 200–1300 копий. Подробнее о связи между сателлитными повторами и различными заболеваниями человека мы еще поговорим далее. Но остается загадкой: зачем такие нуклеотидные последовательности вообще нужны геному.
Выше приведенный пример и множество других случаев указывают на то, что микро- и минисателлиты весьма изменчивы, т. е., как говорят, полиморфны. Их распределение и число в геноме каждого конкретного человека столь специфично, что может использоваться в качестве аналога отпечатков пальцев. Как только это было обнаружено, этим фактом сразу воспользовались. В настоящее время ненужная вроде бы фракция генома человека (а на самом деле возможно и нужная, но мы просто о ней мало что знаем) стала востребована человеком для своих практических целей. На основании вариабельности сателлитных ДНК была развита диагностика родственных связей между людьми, склонности человека к различным заболеваниям и др. (см. об этом подробнее далее в разделе о геномной дактилоскопии).
И, наконец, еще один вид сателлитной ДНК был обнаружен при секвенировании генома человека, который получил название мегасателлитов. Эти тандемные повторы имеют размер от 2,5 до 5 тыс. п. н. и повторяются от 50 до 400 раз. Мегасателлиты присутствуют лишь в небольшом числе хромосом (в 4, 8, 19 и X).
Диспергированные повторы
В ДНКовом тексте генома человека содержится множество более длинных повторяющихся нуклеотидных последовательностей, которые в отличие от сателлитных повторов рассеяны (диспергированы) по всему геному. Эти повторы называют вездесущими, так как они присутствуют во всех районах всех хромосом, а иногда обнаруживаются даже и внутри генов. В сумме около половины ДНКового текста генома человека представлено такими повторами.
Исследователи разделяют эти разбросанные по геному (диспергированные) повторы на четыре основных типа. Наиболее представленными в геноме являются длинные диспергированные повторы (сокращенно ДДП). Их длина достигает 6 тыс. п. н., а повторяются они в геноме человека примерно 8,5х105 раз (в сумме ДДП составляют около 21 % генома). Далее — это короткие диспергированные повторы (сокращенно КДП) длиной 100–400 п. н. В ДНК человека содержится примерно 1,5х106 копий КДП (это составляет около 13 % генома). Имеются еще повторяющиеся элементы, окруженные с двух сторон дополнительными повторами (последние называют длинными концевыми повторами). Их назвали ретротранспозонами. (Как появилось такое сложное название, будет ясно из дальнейшего изложения). Длина этих повторов варьирует от 1,5 до 11 тыс. п. н., а общее число копий в ДНК человека составляет около 4,5х105, (8 % генома). Наконец, в геноме человека присутстуют повторы, названные ДНК-транспозонами. Длины разных ДНК-транспозонов существенно отличаются (от 80 до 3000 п. н.). В геноме их меньше, чем других повторов (всего 3 %), а общее число составляет 3х105.
Более подробно о структуре и характерных особенностях этих типов повторов мы поговорим далее в связи с одной чрезвычайно важной их особенностью — способностью перемещаться в геноме. Здесь же отметим, что имеется большое различие в распределении всех этих диспергированных повторов вдоль молекул ДНК. Хотя повторы имеются во всех участках хромосом, некоторые места почему-то сильно заселены ими, а другие, наоборот, практически их не содержат. Так, область размером 525 тыс. п.н. в хромосоме 11 на 89 % состоит из таких повторяющихся элементов. А вот в хромосоме 2 имеется участок ДНК размером 100 тыс. п.н., в котором расположены кластеры генов некого семейства HOX, ответственных за процессы развития при эмбриогенезе, и который содержит всего около 2 % рассеянных повторов. Однозначного объяснения этому нет, можно строить только разные предположения. Например, в случае с блоком генов HOX отсутствие здесь повторов, возможно, связано с очень сложной координированной регуляцией в этой области, а наличие бесполезных повторов могло бы нарушить такую регуляцию.
Диспергированные повторы умеют «прыгать»
В соответствии с законами классической генетики ожидалось, что в геноме все должно быть четко размечено, все гены-предложения должны располагаться в строго определенных местах текста. И большинство элементов генома действительно подчиняется этому общему правилу. Но из общего правила всегда есть исключения. Оказалось, что некоторые участки ДНК могут «путешествовать», меняя свое место, вытесняя друг друга. Подавляющее большинство генов никогда не покидают родную хромосому. Но в отличие от них определенные специфические нуклеотидные последовательности ДНК изредка с корнем вырываются из генома, выпрыгивают из одной хромосомы и приземляются в случайном месте на другой. При этом они могут влезть в середину гена, вызывая хаос, а могут примкнуть с края, слегка видоизменяя его регуляцию.
Впервые данное явление обнаружила у растений американская исследовательница Барбара Мак-Клинток еще в конце 30-х годов. Но очень долгое время ей никто не верил, исходя из общего принципа: «этого не может быть, поскольку не может быть никогда». Генетикам трудно было даже представить, чтобы гены прыгали с места на место, «ломая» наследственную информацию. Маститые ученые, если речь заходила о Мак-Клинток, с иронией приводили «прыгающие гены», «скачущие гены» как пример научной торопливости, некритического отношения к собственным результатам, стремления прославиться. Но прошло время и российские ученые (академик Г. П. Георгиев и член-корреспондент В. А. Гвоздев) обнаружили перемещения некоторых участков и в ДНК животного организма (дрозофилы). В конечном итоге научная общественность воздала Мак-Клинток должное. Она дождалась своего звездного часа и получила за свое открытие под конец своей жизни Нобелевскую премию (1983 г.).
Таким образом, было установлено, что отдельные участки генома высших организмов, подобно некоторым индивидуумам в нашем обществе, могут не хотеть жить по общим правилам. Их мало интересует постоянная прописка, и при определенной ситуации они берут и просто «переезжают» в любое заинтересовавшее их по каким-то причинам место или, как говорят, «перепрыгивают» в иные, видимо, более удобные для них районы ДНК. Другими словами, стало ясно, что геном не так уж и стабилен, законсервирован, как он казался многим исследователям до этого.
У человека возможность перестроек в геноме впервые была продемонстрирована при изучении генов иммуноглобулинов, связанных непосредственно с иммунной системой организма. Оказалось, что в процессе индивидуального развития в лимфоцитах (белые кровяные шарики) происходит перетасовка отдельных участков этих генов, в результате чего и формируются тысячи и даже миллионы новых вариантов иммуноглобулинов-антител, убивающих многочисленные чужеродные вмешательства различных живых агентов в человеческий организм. Это позволяет за счет сравнительно небольшого набора исходных генов обеспечивать образование огромного разнообразия всесторонне направленных иммуноглобулинов. Другие хорошо известные гены никогда не «прыгают». Такая ситуация оказалась уникальной именно для иммуноглобулиновых генов. Основное перемещение в геноме человека осуществляют не гены, а элементы совершенно другого типа, получившие название транспозонов. К ним относят различные элементы, входящие во все четыре выше перечисленных основных типа диспергированных повторов генома. Транспозоны способны к разным инновациям в геноме. Перемещаясь, они могут изменять регуляцию других генов и даже принимать участие в создании новых генов. Так, после полного секвенирования генома человека в нем удалось обнаружить около пятидесяти генов, произошедших из транспозонов. Несколько сотен генов в геноме человека используют длинные концевые повторы транспозонов в качестве терминаторов при транскрипции.
Теперь рассмотрим по отдельности структурные особенности разных семейств этих «прыгающих» время от времени элементов генома человека.
Семейство повторов по имени LINE
Как среди населения земли имеются многочисленные нации и меньшинства, так и в геноме одни повторы редки, а другие представлены большим числом копий. Основной представитель длинных диспергированных повторов генома человека — семейство повторов, получившее имя LINE (сокращенно от англ. long interspersed elements). Отличительная особенность этих повторов заключается в том, что они способны кодировать два белка-фермента, которые и принимают участие в перемещении их самих, а заодно они способны обеспечивать «перепрыгивание» и коротких диспергированных повторов (КДП). Это осуществляется главным образом за счет уже упоминавшегося фермента ревертазы. РНК, образующиеся после транскрипции LINE-повторов, превращаются в ДНК-копии, которые и встраиваются в новые места генома. В процессе синтеза ДНК-копии на РНК иногда происходит преждевременная остановка этого процесса, поэтому в геноме человека наряду с «полноразмерными» ДДП присутствуют элементы укороченной длины. Ферменты, кодируемые LINE-повторами, участвуют и в процессе появления в геноме некоторых псевдогенов, т. е. генов, которые вообще не способны функционировать. Но, как оказалось, не только их. Сейчас уже известно с десяток нормально функционирующих генов, которые возникли за счет обратной транскрипции мРНК. Такие гены, конечно же, не содержат интронов (их называют безинтронными).
Итак, в геноме человека источником активной ревертазы являются, по-видимому, ретротранспозоны L1, число копий которых достигает 100 тыс. Однако реально число активных перемещающихся копий составляет всего 30–60 тыс., тогда как остальные настолько повреждены, что не транскрибируются и, следовательно, уже не могут перемещаться.
Семейство повторов по имени Alu
Основную массу коротких диспергированных повторов (КДП) составляют так называемые Alu-повторы, которые занимают в ДНКовом тексте генома человека почти в 10 раз больше места, чем все последовательности, кодирующие белки. Свое название они получили по имени рестриктазы, для которой у них имеется определенный сайт. В сумме в геноме насчитывают около одного миллиона Alu-повторов. Такое их огромное количество не поддается нашему пониманию. Для чего они нужны? Ведь это относительно короткие повторы (около 300 п. н.), которые не способны кодировать никакие белки. Более того, разные члены семейства Alu-повторов не полностью похожи друг на друга, хотя родство между ними прослеживается однозначно (в среднем последовательности двух любых Alu-повторов сходны на 85 %). Считается, что этот вид повторов появился в ходе эволюции у приматов (и только у них) свыше 65 млн. лет назад. Попав в геном человека, Alu чудовищно размножились и причудливо расселились по разным хромосомам, то скапливаясь в некоторых местах, то перемежаясь с генами или даже влезая в некоторые из них. В частности, Alu-повторы нередко присутствуют в тех районах генов, которые транскрибируются при образовании мРНК, но не транслируются при синтезе белка. При этом, как число, так и расположение Alu-повторов в геноме может заметно отличаться у разных индивидуумов.
Большинство из диспергированных повторяющихся элементов ДНКового текста обладают способностью к перемещению в геноме. Свидетельства этому «перепрыгиванию» были получены, в частности, при сравнительных исследованиях структуры отдельных районов генома у человека и других близкородственных приматов. Более того, и сейчас продолжается время от времени регистрация перемещения отдельных повторов. Так, установлено, что Alu-повторы изредка встречаются у некоторых людей в тех местах генома, где у большинства других их нет. Один из таких ярких примеров — обнаружение внедрения Alu-повтора в ген фактора свертываемости крови VIII при такой патологии, как гемофилия А.
Итак, геном — это не застывшая ДНК, а динамическая структура, чем-то напоминающая атом. Последний имеет не только стабильное ядро, но и целый рой перемещающихся вокруг его элементов (в частности, электронов). Именно поэтому академик Г. П. Георгиев справедливо отметил, что «ген постоянен в своем непостоянстве»!
Стоит сразу оговориться, что перемещение транспозонов происходит крайне редко. Тем не менее его значимость для генома человека весьма велика и определяется, по-видимому, тем, что этот процесс продолжается безостановочно на протяжении многих тысячелетий. Можно думать, что в результате этого подвижные или мобильные элементы способны в ходе эволюции заметно «тасовать» текст Энциклопедии человека подобно тому, как игроки тасуют колоду карт.
Перечень подвижных элементов генома не ограничивается различными описанными выше диспергированными повторами. К таковым относятся и некоторые элементы, доставшиеся нам в ходе эволюции от таких простейших организмов, как вирусы и бактерии.
Вирусы — составная часть генома человека
Незримая борьба между человеком и такими «внутриклеточными паразитами», как вирусы, происходила на протяжении тысячелетий. Только после обнаружения вирусов Д. И. Ивановским в 1892 году человечество наконец-то распознало своего невидимого врага, который, проникая в клетку человека, использует все ее возможности в своих корыстных целях, тем самым нарушает нормальный метаболизм клетки и вызывает различные тяжелые патологии. Ряд вирусов обладает способностью внедряться в геном человека и по сути становиться как бы его собственными генами. В первую очередь это относится к так называемым ретровирусам. Они так были названы по своему образу жизни. Исходно геном этих вирусов представляет собой РНК. Но, попав в клетку, вирус на своей РНК с помощью обратной транскриптазы строит ДНК-копию (см. основную догму молекулярной биологии). После этого ДНК-копия вируса встраивается в геном клетки, что служит обязательным условием для жизненного цикла ретровируса. Встраиваемая в геном клеток человека ДНК-копия вируса была названа провирусом. Затем на провирусе синтезируются вирусные РНК, на базе которых образуются новые вирусные частицы. Таков жизненный цикл обычного ретровируса. Так ведет себя, например, хорошо известный ретровирус, получивший название вируса иммунодефицита человека (ВИЧ), когда он инфицирует клетки крови.
Казалось, что все это есть проблема отдельных инфицированных клеток. И действительно, вирусы инфицируют в основном соматические клетки. Затем вирусы и провирусы погибают вместе с теми клетками, в которых они похозяйничали. Т. е. вирусы сами подготавливают и свою собственную смерть. Однако это не всегда так происходит. Очень редко в эволюции человека происходило инфицирование вирусами клеток зародышевого пути, образовывались провирусы, но организм выживал и внедренный провирус становился наследуемым элементом генома человека. Так в клетке появляется «лжепрограмма» (провирус), которая изменяет геном гораздо сильнее, чем это возможно при «нормальной» эволюционной изменчивости.
Когда секвенировали геном человека и многих других млекопитающих, оказалось, что в их составе содержится очень большое число повторяющихся элементов, имеющих сходство с инфекционными вирусами. Повторяющиеся элементы, способные кодировать 2–3 белка и окруженные с двух сторон еще одними особыми повторами — названными длинными концевыми повторами (ДКП), — были отнесены к семейству, получившему название ретротранспозонов. У человека они составляют довольно существенную часть — около 8 % генома. Такие элементы назвают часто эндогенными ретровирусами, в отличие от типичных ретровирусов, существующих в природе вне организмов (их называют экзогенными ретровирусами). Структура типичного эндогенного ретровируса (провируса) изображена на рис. 27 на цветной вклейке. Она напоминает структуру отдельных современных экзогенных ретровирусов (на рисунке вверху), хотя часто существенно отличается от них. Все-таки за миллионы лет древним провирусам трудно было остаться неизменными. Большая часть этих элементов представляет собой дефектные вирусные последовательности или даже отдельные их короткие фрагменты. Происходило это главным образом за счет накопления точечных мутаций и различных делеций. В частности, у многих эндогенных ретровирусов отсутствует ген env. Концевые участки ретровирусов, названные длинными концевыми повторами (ДКП), нередко существуют в геноме человека сами по себе, оторвавшись от своего эндогенного ретровируса в ходе эволюции и собственного перемещения по геному.
Рис. 27. Типичные структуры инфекционных и эндогенных ретровирусов, а также их отдельных элементов в геноме человека. ДКП — длинный концевой повтор (обозначен желтым цветом). Типичные гены ретровирусов — gag, pol, env. Черные горизонтальные линии — последовательности генома человека. Черные поперечные полосы в генах — мутации.
Мутации, накопившиеся в ходе эволюции в эндогенных ретровирусах, не позволяют им образовывать новые инфекционные вирусные частицы, как это происходит обычно в случае типичных экзогенных вирусов (например, вируса иммундефицита человека, вызывающего такое страшное заболевание, как СПИД).
Согласно проведенным оценкам, такие провирусы появились в геноме человека от 10 до 50 млн. лет назад в результате инфицирования зародышевых клеток наших предшественников и с тех пор передаются по наследству, как и все другие собственные элементы генома. Так «чужие» молекулы ДНК стали частью нашего генома. В сумме их насчитывается несколько десятков тысяч, они состоят из более 200 различных групп и подгрупп. Ретротранспозоны генома человека часто рассматривают как «ископаемые останки» древних ретровирусов.
Появление провирусов в геноме человека сродни процессу, который в лингвистике называют лексическим заимствованием. Во всяком языке имеются слова «свои» и «чужие» — те, которые пришли из других языков. Заимствование слов считается естественным ходом событий, необходимым для языкового развития. Возможно, и появление провирусов повлияло на ход становления человека как вида. По крайней мере известно, что число провирусов в геноме человека существенно больше, чем в геноме обезьян.
Итак, эндогенные провирусы являются «следами» от вирусов, которые инфицировали наших предков миллионы лет назад. Поселившиеся в геноме наших предков, они со временем потеряли способность образовывать новые вирусные частицы. Большинство таких «реликтовых» ретровирусов «молчит» (не функционирует). Однако сейчас уже установлено, что при определенных воздействиях на геном они могут «заговорить» и этим нарушить нормальный метаболизм в клетке. Таким образом, потенциально некоторые из них и по прошествии тысячелетий продолжают представлять потенциальную опасность для человека.
Выяснилось, что отдельные члены семейства ретровирусов сохранили способность синтезировать РНК, а также обладают склонностью к рекомбинациям и перемещению в геноме. Так, анализ эндогенных провирусов генома человека позволяет заключить, что отдельные из них являются копиями, появившимися в результате так называемой ретропозиции. Ретропозиция — это процесс появления новых копий в геноме не за счет нового инфицирования вирусом, а в результате транскрипции уже имеющегося в геноме провируса. Сначала образуется вирусная РНК-копия, затем на ней с помощью обратной транскрипции образуется ДНК-копия, и уже она внедряется в новое место в геноме. Другие элементы эндогенных провирусов, обнаруживаемые в геномах современных людей, возникли в результате рекомбинаций, таких, как, например, рекомбинации между концами провирусов, что привело к исчезновению внутренних участков провирусов и образованию коротких ретровирусподобных элементов. Таким образом, провирусы эндогенных ретровирусов — не просто окаменелые остатки прошлых эпох, а элементы генома человека, которые определяют присущую ему нестабильность (об этом подробнее поговорим дальше).
В геноме человека эндогенные ретровирусы встречаются во многих местах, но их распределение по хромосомам не совсем равномерное. Имеются участки, обогащенные ими, и в то же время некоторые области хромосом человека не содержат подобные элементы. Иногда отмечают, что местонахождение эндогенных ретровирусов и их производных коррелирует с распределение генов в геноме. Часто они располагаются в регуляторных областях генов. И в этом ученые усматривают особый смысл: регуляторные элементы эндогенных ретровирусов могут вмешиваться в регуляцию работы обычных генов человека.
Академик Е. Д. Свердлов считает, что вирусы могли сыграть решающую роль в «очеловечивании» обезьяны. Возможно, что в процессе эволюции молекулы ДНК человека включили в свой состав уже готовые фрагменты генетического материала вирусов с одной лишь целью — облегчить конструирование собственных генов для кодирования новых признаков. Включение генетического материала вирусов в геном человека служит еще одним подтверждением универсального характера молекул ДНК, имеющихся у всех живых существ — от самых простейших организмов вплоть до человека.
Еще одна группа спонсоров человеческого генома (ДНК-транспозоны)
В результате секвенирования ДНК человека был раскрыт еще один секрет генома. Кроме вирусов, проникших в наш геном извне и со временем сильно размножившихся там, заметную часть генома человека составляют и гены, пришедшие к нам от других наших постоянных симбионтов — бактерий. В геноме человека содержится множество так называемых ДНК-транспозонов. Они в сумме составляют около 3 % генома человека и представлены в нем примерно 300 000 копиями, которые в свою очередь подразделяются на 7 разных классов. Все они по своей структуре очень напоминают ранее обнаруженные перемещающиеся элементы у бактерий — бактериальные транспозоны. Сходство выражается в первую очередь тем, что ДНК-транспозоны человека, как и бактериальные транспозоны, способны кодировать специальный фермент транспозазу, который и обеспечивает их подвижность.
Кроме бактериальных транспозонов, в геноме человека содержится свыше 220 генов, доставшихся нам «в наследство» непосредственно от бактерий, обитающих у нас в кишечнике. Половина из этих генов широко распространена в разных видах бактерий, но среди эукариот встречается только у позвоночных. Теперь стало окончательно ясно, что бактерии, также как и вирусы, внесли свой вклад в формирование генома современного человека. Все это, по-видимому, есть результат длительного сожительства человека с бактериями, когда при некоторых случайных событиях гены бактерий попали в геном человека и там закрепились. Мы давно знаем, что в нашем кишечнике живет много разных видов бактерий, которые не только для нас не вредны, но, наоборот, полезны, так как они служат поставщиками ряда биологически активных продуктов (в частности, некоторых витаминов). Перенос генов «по горизонтали», т. е. от одного вида организма в другой, в принципе был известен давно. В частности, он активно реализуется между разными видами бактерий.
Но то, что он столь масштабно выражен и между геномами таких эволюционно далеких организмов, как человек и бактерии, безусловно, стало для исследователей полной неожиданностью. Интересно, что гены, доставшиеся человеку от бактерий, содержат, как и многие другие, интроны. Последних нет у бактерий. Следовательно, в процессе эволюции после переноса бактериальных генов в геном человека произошло еще одно событие: в состав «бактериальных» генов, ставших генами человека, внедрились дополнительные нуклеотидные последовательности, которые теперь являются интронами.
Гены, доставшиеся человеку от бактерий, не случайно сохранились в геноме. Многие из них играют важную роль в метаболизме ксенобиотиков (чужеродных для человеческого организма веществ) и в ответе клеток на стресс. Можно отметить один из таких генов — ген МАО, кодирующий белок, на который направлено действие разных психофизиологических лекарств. Следовательно, приобретение по крайней мере некоторых из бактериальных генов дало человеку определенные селективные преимущества.
На этой почве существуют разные спекуляции. Одна из них изложена 3. Ситчиным в своей книге «Генезис пересмотренный и космический код». Согласно его рассуждениям, некие пришельцы из космоса по имени аннунаки прибыли на 3емлю приблизительно 450 тысяч лет назад. Они высадились на 3емлю в поисках полезных ископаемых, и им понадобилась рабочая сила. Рабочих решили не привозить издалека, а слегка усовершенствовать существовавшего тогда на 3емле гоминоида, добавив ему некоторые гены более «продвинутых» аннунаков. И космические генные инженеры внесли в геном гоминоида те гены, которые мы теперь называем бактериальными. А бактерии потом приобрели их от нас. Сформулировано, конечно, красиво, однако весьма напоминает фантастический роман.
В любом случае, геном человека представляет собой некое собрание генов, которые достались человеку от их предков, и генов, которые явно ведут свое происхождение от неродственных организмов — вирусов и бактерий. То есть можно сказать, что наш геном — это книга, в которой отдельные «предложения» заимствованы из других независимо написанных источников.
Нуклеотидные последовательности — «близнецы»
В результате секвенирования генома человека в нем, наряду с типичными повторяющимися элементами, были обнаружены протяженные нуклеотидные последовательности, которые представлены всего в двух-пяти копиях. Чаще всего эти копии очень похожи друг на друга, как близнецы (сходство по последовательности достигает 99 %). Общее количество таких элементов в геноме человека составляет порядка 5 %. Это значительно больше, чем в других секвенированных к настоящему времени геномах, таких, например, как червь и дрозофила. Появление в геноме ДНКовых текстов-близнецов связывают с процессом, названным сегментальной дупликацией, то есть случайным удвоением отдельных сегментов генома. Размер таких «близняшек» составляет от 1 до 200 тыс. п. н. Последовательности-близнецы иногда располагаются на одной и той же хромосоме, а иногда присутствуют на совершенно разных хромосомах. Например, геномный сегмент X-хромосмы размером 9,5 тыс. п. н., известный как участок, ответственный за развитие адренолейкодистрофии, присутствует практически в неизмененном виде на хромосомах 2, 10, 16 и 22. А в хромосоме 17 имеется пять копий одного сегмента размером 200 тыс. п. н., которые разделены между собой довольно длинными последовательностями. При анализе разных хромосом выявилось, что дуплицированные последовательности распределены по ним не равномерно. Больше всего их имеется в Y-хромосоме, а менее всего в хромосоме 7. Неравномерно они распределены и вдоль хромосом, концентрируясь в районах центромер и теломер. Предполагается, что появление последовательностей-близнецов может быть связано с эволюционным процессом и приводит к увеличению разнообразия белков за счет «тасования» уже существующих экзонов.
В таблице 4 даны суммарные данные о содержании разных видов последовательностей в геноме человека.
Имеется ли в геноме «эгоистичная» ДНК?
Когда полностью секвенировали довольно крупный геном круглого червя С. elegans, то обнаружили, что в нем 27 % нуклеотидных последовательностей кодируют структурные белки, 26 % принимают участие только в начальной стадии кодирования и в дальнейшем от синтеза белка отстраняются (интроны), а оставшиеся 47 % приходятся на повторы и межгенные участки, которые в кодировании белков не участвуют и в настоящее время представляются нам «лишним» материалом. При сравнении этих данных с геномами животных, стоящих на различных ступенях эволюционной лестницы, выяснилось, что чем сложнее устроен организм, тем меньше в его геноме доля кодирующих участков и тем больше в нем доля непонятной для нас информации. И больше всего ее в геноме человека. На первый взгляд это выглядело парадоксально.
Так в чем же дело? Этот вопрос возник еще в конце 70-х годов прошлого века. В 1980 году лауреатом Нобелевской премии Дж. Уотсоном и рядом других исследователей было впервые предложено считать участки, не способные кодировать белки, и при этом повторяющиеся в геноме, никчемными, лишними. Появился даже специальный термин «selfish DNA», что переводится как «эгоистичная ДНК». По мнению Уотсона, эгоистичная ДНК существует сама по себе и сама для себя. Накопление избыточной некодирующей белки ДНК — не что иное, как «эгоистическое» самоумножение селективно нейтральных молекул. В попытках объяснить наблюдаемое явление ученые пренебрежительно назвали «лишнюю» «эгоистичную» ДНК строительным «мусором», издержкой эволюции, которая служит платой за совершенство остальной ее части. В одном из последних изданий Oxford English Dictionary приводится такое значение слова эгоистичный: «Применительно к гену или генетическому материалу: обладающий тенденцией к воспроизведению или распространению, несмотря на отсутствие фенотипического (т. е. проявляемого внешне) эффекта».
После секвенирования генома человека, когда было установлено, что и в ДНК человека подавляющая часть последовательностей представляют собой участки, не кодирующие никакие белки или функционально значимые РНК (рРНК, тРНК и др.), стало ясно, что в отличие от трудяг-генов основная масса ДНК действительно не работает, т. е. не выдает никакой информации для производства белков или РНК. И это при любом расчете более 70 % всей ДНК! Что-то слишком много для эгоистичной ДНК или «мусора». Такого количества геномного «мусора» нет ни у бактерий, ни у дрожжей, ни у мух.
Что это значит? Или наш геном в отличие от геномов более примитивных организмов ленится выгребать накапливающийся «мусор», или это совсем не мусор, а некое ценное эволюционное приобретение, которое дало когда-то человеку определенные преимущества, и поэтому геном от такого «мусора» не спешит избавиться.
На сегодняшний день мы еще многого не знаем об этой огромной части генома человека, пока условно называемой «эгоистичной». Однако уже сейчас ясно, что определение «эгоистичности» или «бессмысленности» для большинства участков генома на самом деле нельзя признать полностью справедливым. Если мы сегодня не в состоянии понять, для чего нужны какие-то участки ДНК, это еще не значит, что они пренебрежительно могут быть названы мусором. У бактерий «бессмысленных» участков вообще нет. У дрожжей почти нет. Но по мере повышения уровня организации живого организма накапливается все больше и больше вроде бы ничего не кодирующей ДНК. Трудно согласиться с предположением, что это результат некой неосознанной деятельности эволюции. Можно предположить, например, что эти нуклеотидные последовательности ДНК являются резервуаром эволюции, складом «запчастей». Если с каким-либо геном что-то не в порядке, клетка использует фрагменты некодирующей ДНК для «ремонта» поврежденного. Сегодня ученые вынуждены отказываться от многих своих первоначальных, довольно ограниченных представлений. Время идет, и сейчас уже по крайней мере у некоторых из этих участков обнаружены определенные специфические функции.
И каковы же эти функции у ДНК, считавшейся много лет «эгоистичной»? Давно уже известно, что повторами в геноме человека являются представленные сотнями копий гистоновые гены, имеются тысячи копий генов, кодирующих рибосомные РНК, транспортные РНК и др. В дальнейшем выяснилось, что существуют и повторы, расположенные в концевых некодирующих белки участках мРНК, которые принимают, по-видимому, участие в таком важном процессе, как трансляция этих молекул. Оценено, что у человека такие элементы встречаются в 12 % начальных некодирующих участков мРНК и в 36 % некодирующих участков, расположенных в конце молекулы, что существенно выше, чем у других организмов. Повторы, расположенные в участках, кодирующих мРНК, несут определенную функциональную нагрузку. Они нередко участвуют в правильном и своевременном считывании информации при образовании белка на мРНК. Однако в сумме доля таких значимых или потенциально значимых повторяющихся участков генома человека весьма невелика.
Среди транспозонов, которые также были прежде отнесены к «эгоистичной» ДНК, постепенно обнаруживаются различные неизвестные ранее регуляторные последовательности, которые управляют работой ряда генов. Некоторые из транспозонов выступают в роли энхансеров (усилители транскрипции), сайленсеров (ослабители транскрипции), терминаторов транскрипции и прочих красиво звучащих элементов генома. Более того, выяснилось, что не менее полусотни генов генома человека имеют свое происхождение из транспозонов. Наконец, следует отметить, что определенные некодирующие белки участки ДНК обеспечивают процесс ее репликации, другие — упаковку в хромосомы, третьи — прикрепление к определенным структурам в ядре и т. д.
Можно привести ряд конкретных примеров. Так, Alu — повторы, о которых шла речь выше, обычно рассматривали как типичные представители «эгоистичной» ДНК, поскольку они имеют высокую повторяемость и при этом ничего не кодируют. Тем не менее и им может быть найдено применение в геноме, например, в регуляции работы генов. Похоже, в эволюции геномной ДНК действует некий «принцип слоненка Киплинга». Хобот у слоненка возник из-за его желания узнать, что ест крокодил на обед. Слоненок вначале огорчился своему носу, но не растерялся и нашел ему разные полезные применения. Так и повторяющиеся последовательности генома. Они возникают и меняются по своим внутренним молекулярно-генетическим законам, но для их вариаций потом может найтись полезная функция в геноме. Сейчас выяснилось, что способность Alu-повторов к перемещению может играть существенную роль в эволюции генома. Например, описаны случаи, когда, внедряясь в экзон или интрон какого-нибудь гена, такой повтор менял регуляцию его экспрессии. Alu-повтор способен также модулировать процесс репликации ДНК, регулировать сплайсинг и некоторые другие генетические процессы. Имеются данные, что эти повторы участвуют в подавлении трансляции РНК при клеточном ответе на стрессовые воздействия. Различные описанные в литературе функции, выполняемые Alu-повторами, помогают понять и объяснить причину их длительной «фиксации» в человеческом геноме. Скорее всего действительно многие из Alu сидят без дела до поры до времени, но отдельные представители не просто живут и размножаются, а и иногда работают.
Не находятся совсем без дела и длинные повторяющиеся последовательности. Так, показано, что они могут участвовать в процессе «тасования экзонов» (подробно тасованию карт), т. е. перемещения экзонов из одних генов в другие и формирования за счет этого новых генов.
Наконец, «бессмысленные» участки ДНК иногда могут осмысленно работать в хромосоме, например, когда они защищают свой вид от вторжения чужеродной ДНК. Выяснилось, что пустые концевые участки хромосом, как и область центромер (первичные места спаривания родительских парных хромосом), важны для сохранения вида: они определяют строгое распознавание макрорельефа хромосомы как органеллы клетки (а не микрорельефа — как молекулы ДНК) одного вида по принципу «ключ-замок». В результате этого сперматозоиды обезьяны не оплодотворяют яйцеклетки человека, т. к. хромосомы двух видов не распознают друг друга.
Таким образом, согласно современным оценкам, в участках «эгоистичной» ДНК скрыта определенная эволюционная информация. В результате перестройки некодирующих белки участков, что вообще-то не влияет на структуру самих генов, может происходить изменение в наборе формирующихся в конкретной клетке мРНК за счет изменения в их процессинге (альтернативный сплайсинг), использование альтернативных промоторов или даже формирование новых генов.
И последний пример функциональной значимости «эгоистичной» ДНК, который мы приведем здесь, — данные о строении концов хромосом.
Концы молекул ДНК — объект повышенного внимания
Устройство концов хромосом давно интересовало исследователей. Теперь стало ясно, что они устроены по особому. И эту некодирующую белки ДНК никак нельзя назвать «эгоистичной». Концевой участок ДНК, называемый теломерным, представляет собой область размером 3–20 тыс. п. н., состоящую из тандемно расположенных повторов TTAГГГ (рис. 28). С этими участками образуют комплекс различные специфические белки, и такой комплекс получил название теломера.
Самый-самый (в данном случае левый) кончик хромосомы человека выглядит так:
ГГГАТТГГГАТТГГГАТТГГГАТТГГГАТТГГГАТТ…
ЦЦЦТААЦЦЦТААЦЦЦТААЦЦЦТААЦЦЦТАА…
То есть каждый том Энциклопедии человека начинается с буквы Г, и первые 6 букв — это однонитевая ДНК, а вовсе не двунитевая, какова она на всем дальнейшем протяжении. В английском языке с буквы Г (G) начинается слово Бог (God), и некоторые исследователи склонны видеть в этом некий глубокий смысл. При определенном желании, конечно же, можно найти много всяких аналогий, но эта — безусловно случайная.
Рис. 28. Структура концов ДНК в хромосомах — теломер
3а короткими повторами располагаются более длинные повторяющиеся последовательности, которые назвали повторами, ассоциированными с теломерой. Далее следуют уникальные для каждой хромосомы последовательности, которые на практике используются для различения разных концов разных хромосом. Теломеры защищают основную часть ДНК от действия ферментов, которые в отсутствие теломер разрушали бы молекулы ДНК. Кроме того, теломеры способствуют правильной рекомбинации хромосом и их прикреплению к оболочке ядра.
Концевые участки хромосом не статичны. При каждом делении клеток происходит их укорочение в среднем на 50 п. н. Все известные ДНК-полимеразы, которые участвуют в процессе репликации ДНК, неспособны полностью реплицировать концы молекул. Поэтому каждая следующая копия короче предыдущей. Как если бы машинистка, перепечатывая книгу, всегда ленилась бы перепечатать последнюю страничку.
Чтобы не происходила потеря генетического материала при делении клеток, у эмбрионов концы молекул ДНК наращиваются перед каждой репликацией короткими повторяющимися последовательностями. В этом участвует специальный фермент — теломераза. Однако в клетках взрослого организма этот фермент перестает работать, и в результате хромосомы постоянно укорачиваются, съеживаются, как шагреневая кожа, при каждом цикле репликации ДНК. Так происходит до определенного предела, после чего деление клеток становится, по-видимому, невозможным и наступает их гибель.
«Белые пятна» генома
На фоне всеобщей эйфории, связанной с секвенированием генома человека, мало внимания было обращено на то, что необходимо еще некоторое время для получения действительно полной последовательности нуклеотидов генома. На современной карте генома человека все еще зияет множество «белых пятен». В сумме они составляли на начало 2002 года всего около 3–5 %, что вообще-то сопоставимо с долей генома, занимаемой всеми генами. Причина этого заключается в первую очередь в существовании серьезных технических трудностей при секвенировании и картировании отдельных специфических участков ДНК. Так, некоторые нуклеотидные последовательности обладают нестандартной структурой, что усложняет процесс их расшифровки стандартными методами. В частности, это относится к таким районам хромосом, как теломеры — концевые участки, которые имеют необычную структуру. Их порой трудно выделять из общей массы нуклеотидных последовательностей в силу того, что они расположены на концах молекул ДНК. Другие участки трудно идентифицировать в связи с тем, что они часто повторяются и их пока не удается «вписать» в общий текст, поскольку не ясно, где их истинное место. Эти участки порой так похожи друг на друга, что нелегко понять, где какой из них точно расположен («Фигаро здесь, Фигаро там»). Такая ситуация характерна в основном для центромерных областей хромосом, содержащих тандемные кластеры альфа-сателлитных последовательностей, и районов расположения микро- и минисателлитов. Имеются проблемы и с секвенированием коротких «плечей» некоторых хромосом. Однако если сравнить эти проблемы с начальными этапами работы, то они теперь сродни «семечкам», большинство из которых исследователи безусловно «отщелкают» в самое ближайшее время, возможно даже еще до выхода в свет этой книги.