За гранью ДНК
Первым человеком, который узнал о своих собственных генетических данных – и их ограничениях – был пионер геномики и предприниматель Крейг Вентер[49], который в 2000 г. возглавил частную попытку создать первый черновой вариант последовательности генома человека. 4 сентября 2007 г. группа под руководством Сэма Леви из Института Дж. Крейга Вентера в Роквилле, штат Мэриленд, завершила чтение генетического кода Вентера, что ознаменовало публикацию первого полного (шесть миллиардов букв) генома отдельного человека[50].
Роджер редактировал автобиографию Вентера «Расшифрованная жизнь»[51] и помнит, что даже Вентер был удивлен тем, как мало его геном смог раскрыть. В то время никто не знал, как правильно читать геномы. Это одна из причин, почему в более позднем проекте под названием Human Longevity Inc. (HLI) Вентер, как и Лерой Худ и другие, не только собрал геномную информацию, но и связал ее с фенотипами: анатомией, физиологией и поведением пациентов, от когнитивных онлайн-тестов до эхокардиограммы и анализа походки[52].
С помощью HLI скрининг выявил широкий набор дополнительных рисков возрастных хронических заболеваний, связанных с преждевременной смертностью, и улучшил интерпретацию полногеномного анализа[53]. «В клинике мы каждый день спасаем жизнь по крайней мере одному человеку, обнаруживая серьезную опухоль, о которой он даже не подозревал», – сказал нам Вентер, приводя несколько убедительных, но анекдотических примеров. В его случае, когда обычные методы объявили его свободным от рака, скрининг HLI выявил рак простаты, который начал распространяться. У нобелевского лауреата Хэма Смита, давнего сотрудника Вентера, обнаружили серьезную опухоль легких. Эти своевременные диагнозы были поставлены не на основе генетики, а с помощью мощного МРТ-сканера мощностью 3 Тесла (примерно в 60 000 раз сильнее, чем магнитное поле Земли) с расширенным анализом изображений. Вентер рассказал нам, что в этом сканере «опухоли загораются, как лампочки»[54].
Фенотип (то есть наблюдаемые черты и характеристики тела, от цвета глаз до рака) очень далек от генотипа или генетического рецепта тела. Думать, что единственный вид данных, обнаруженный в геноме, может раскрыть суть человека, – все равно, что пытаться определить внешний вид, вкус и ощущение торта по рецепту. Некоторые вещи – фрукты и смородина – сразу понятны, но многие другие гораздо менее очевидны.
Хотя секвенирование человеческого генома ознаменовало конец почти столетних усилий по поиску генов, кодирующих белки, оно подчеркнуло, как мало мы знаем о регуляторных элементах, не кодирующих белки, но составляющих геном[55]. Из трех миллиардов букв ДНК в геноме человека только около 2 % кодируют белки, которые строят и поддерживают наше тело. Хотя последние два десятилетия стали золотым веком открытия генов, около 20 % человеческих генов с жизненно важными функциями остаются окутанными тайной (согласно исследованию неизвестного генома, проведенному Шоном Манро из Лаборатории молекулярной биологии в Кембридже и Мэтью Фриманом из Школы патологии Данна Оксфордского университета)[56]. Нам предстоит еще много работы, помимо понимания генов. Когда-то интроны были среди огромных участков человеческой ДНК (около 98 %), отбрасываемых, как бессмысленный мусор. Теперь мы знаем, что эти некодирующие области генома содержат важные регуляторные элементы, которые определяют, как контролируется экспрессия генов, но всего мы по-прежнему не понимаем[57].
Также огромный всплеск интереса к использованию генов в организме произошел в области, называемой эпигенетикой. Деление клеток на разные типы связано с особенностями экспрессии генов, а не с изменениями в самой ДНК. Питательная среда начинается с хромосомы – пучка ДНК в наших клетках. Хромосомы четко организованы, как и белки, которые с ними взаимодействуют, и эта организация, по-видимому, важна для использования генов[58]. Паттерны использования генов могут быть основаны на химических модификациях ДНК (например, украсив ген химическими фрагментами, называемыми метильными группами, вы его выключите), а также на гистонах – крошечных белках, которые прикрепляются к ДНК, как бусины на ожерелье, и играют роль в упаковке ДНК и регулировании способа активации генов. В результате связь между генотипом и фенотипом не является прямой.
От ДНК к белку
Истории ДНК могут быть запутанными. Традиционные генетические исследования искали вариант ДНК, связанный с определенным заболеванием. Иногда все просто: мутации в гене, ответственном за фактор свертывания крови, вызывают наследственное заболевание – гемофилию, которую иногда называют королевской болезнью, поскольку она широко распространена в европейских королевских семьях.
Однако зачастую эти корреляции рассказывают сложную историю. Когда дело доходит до распространенных заболеваний головного мозга, таких как шизофрения и болезнь Альцгеймера, огромный объем информации поступает в результате полногеномного поиска ассоциаций (GWAS), в котором исследователи стремятся сравнить генетические последовательности тысяч людей с определенным признаком. Хорошей новостью является то, что сотни геномных регионов могут быть связаны с риском развития заболевания головного мозга у человека. Но иногда это триумф данных над пониманием. Объяснение того, почему спектр генетических вариантов влияет на здоровье, остается сложной задачей[59]. Даже если мы действительно связываем варианты с заболеванием, исследования диабета, например, показали, что на генетику приходится только около 10 % различий, наблюдаемых при заболевании, а остальное зависит от образа жизни и питания[60].
Сопоставление данных о генотипе с фенотипом осложняется тем фактом, что количество наших генов значительно превосходит количество белков. Гены можно перетасовать и использовать разными способами. Способность каждого гена кодировать множество белков обусловлена процессом, известным как альтернативный сплайсинг, при котором биты кода, называемые интронами, соединяются, а оставшиеся части гена, известные как экзоны, при создании белка могут включаться или бездействовать. Теоретически из одного гена можно получить до 100 белков[61].
Даже при кодировании участков ДНК не существует прямого соответствия между линейным кодом ДНК и трехмерной формой белков в организме, что имеет решающее значение для их работы – например, для ускорения клеточной химической реакции. Для белка, содержащего всего 100 аминокислот, число альтернативных структур, которые он может принять в водной среде клетки, колеблется где-то между 2100 и 10100 возможных конформаций (форм). Изучение каждой из них заняло бы вечность, но этот одномерный код приобретает правильную трехмерную форму (что имеет решающее значение для его работы) с помощью различных видов поддержки.
Одним из способов принятия правильной формы является непрерывное движение молекул в клетках, вызванное тепловой энергией. Многие из жизненно важных компонентов живой клетки достаточно малы, чтобы подвергаться постоянным ударам моря окружающих молекул (броуновское движение), что может помочь белку принять наиболее стабильную форму, даже если количество возможных стабильных конфигураций варьируется от миллионов до триллионов[62]. Кроме того, существует множество механизмов точной настройки того, как организм интерпретирует генетические данные и превращает их в белки.
Некоторые из способов, помогающие белкам сворачиваться в наших клетках, можно найти в замечательной молекулярной машине, называемой рибосомой, состоящей из примерно полумиллиона атомов и размером около одной миллионной дюйма в поперечнике. Эта машина лежит в центре двух эпох жизни на Земле: одной – знакомой, а другой – окутанной тайной. Первая состоит из сегодняшних живых существ, основанных на ДНК, а вторая отражает самые первые существа, которые делились и, как предполагается, основывались на РНК – тонком, но гибком виде генетического материала, который не только хранит информацию, но, в отличие от ДНК, также может катализировать химические реакции. Действительно, рибосома – это рибозим, фермент, состоящий из РНК, свернутой в сложную структуру.
Загляните глубоко внутрь рибосомы, как это сделали структурные биологи, и вы увидите древнее ядро, которое превращало инструкции в белки для построения живых существ на протяжении большей части четырех миллиардов лет. Там вокруг центрального механизма РНК, чтобы отточить его работу, развилась белковая оболочка, различная в зависимости от существа: например, наши рибосомы почти в два раза больше, чем у насекомых, которые нас заражают.
Для работы рибосомы необходимы различные ингредиенты: во-первых, молекула матричной РНК, которая несет в себе инструкции по созданию белка из ДНК. Чтобы превратить этот код в белок, рибосома использует второй тип РНК – транспортную, которая несет в себе строительные блоки белков, называемые аминокислотами.
Сейчас мы знаем атомные детали того, как рибосома превращает данные ДНК в плоть и кости, благодаря получившим Нобелевскую премию рентгеновским исследованиям Венки Рамакришнана в Великобритании, Ады Йонат в Израиле и Томаса Стейца в США. Они обнаружили, что рибосома состоит из трех разных молекул РНК и более 50 различных белков, разделенных на два компонента (60S/40S в наших клетках и 50S/30S у бактерий). Один из них – «мозг», считывающий генетический код, а другой – большое «сердце», производящее белок (рис. 8). Они расходятся и объединяются по мере того, как молекулярные связи создаются и разрушаются, производя белки, которые строят тело и управляют им.