Но едва ли не все, чему я научился в университете, было неизвестно в 1953 году Уотсону и Крику. Давно стал общим местом тезис, что «белки закодированы в генах». Но в начале 50-х годов даже по этому вопросу у ученых не было единого мнения. Уотсон впервые приехал в Кембридж в 1951 году, и очень скоро его стал раздражать скептицизм Макса Перуца и Джона Кендрю. По их мнению, еще нельзя было считать окончательно доказанным, что гены записаны в ДНК, а не в белках. Хотя молекулярная структура ДНК не была пока известна, ее химический состав был уже вполне ясен, и было известно, что он почти не меняется от одного вида к другому. Если гены действительно составляют основу наследственности и в них закодированы бесчисленные отличительные черты разных особей и видов, то как можно было пытаться объяснить все богатство и разнообразие жизни этим однородным соединением, по составу которого даже животные и бактерии не слишком отличаются друг от друга? Казалось, что белки с их бесконечным многообразием гораздо лучше подходят на роль носителя наследственной информации.

Уотсон был одним из тех немногих, кого убедили результаты экспериментов американского биохимика Освальда Эвери, опубликованные в 1944 году и свидетельствовавшие о том, что гены записаны в ДНК. Только энтузиазм и убежденность Уотсона побудили Крика взяться за насущную проблему разгадки структуры ДНК. Когда эта проблема была решена, ребром встал вопрос о генетическом коде. И здесь степень неосведомленности ученых того времени тоже просто удивительна для людей нового поколения. Молекулы ДНК состоят из последовательностей, составленных из всего четырех букв, расположенных на первый взгляд в случайном порядке. Было не так уж сложно догадаться, что этот порядок должен каким-то образом кодировать белки. Молекулы белков тоже состоят из последовательности «строительных блоков», которые называют аминокислотами. Последовательностями букв в ДНК были предположительно закодированы последовательности аминокислот в белках. Но если код был универсальным для всех организмов (чего на тот момент уже можно было ожидать), то набор аминокислот, входящих в состав белков, тоже должен был оказаться универсальным. А в этом еще отнюдь не было уверенности. Саму эту возможность мало кто обсуждал, пока Уотсон и Крик за обедом все в том же «Орле» не составили канонический список двадцати аминокислот, который сейчас можно найти во всех учебниках. Любопытно, что хотя ни один из дуэта не был биохимиком, они угадали все с первого же раза.

Теперь задача сразу стала ясна. Все свелось к математической головоломке, варианты решения которой не ограничивались никакими фактами из тех, что пришлось зубрить следующим поколениям студентов, изучавших молекулярную биологию. Четыре буквы в молекулах ДНК должны были кодировать двадцать аминокислот. Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте. Дублетный код тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот (4 x 4 = 16). Минимальное число букв было три, то есть код мог быть триплетным (впоследствии Фрэнсис Крик и Сидней Бреннер доказали, что это именно так). Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (4 x 4 x 4 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же их было только двадцать? Секрет этого фокуса должен был объяснить смысл четырехбуквенного «алфавита», организованного в шестьдесят четыре трехбуквенных «слова», кодирующие двадцать аминокислот.

Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий (Джордж) Гамов, больше известный своими теориями, касающимися Большого взрыва. Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали. Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной. Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации. Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее. Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц. Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее. И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.

Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом. Но Фред Сэнгер, скромный гений, впоследствии получивший две Нобелевских премии (одну за метод прочтения последовательностей аминокислот в белках, другую — за метод прочтения букв в ДНК), занимался в то время выяснением последовательности аминокислот в молекуле инсулина. Вскоре он выяснил, что аминокислоты в белке могут располагаться в любом порядке и ограничений на их последовательности в белках в природе нет. Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота. Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.

Следующую попытку разгадать загадку кода предпринял Крик. Он высказал идею настолько красивую, что ее немедленно все приняли, хотя самого автора и смущала нехватка доказательств. Крик воспользовался новыми открытиями, сделанными в нескольких молекулярно-биологических лабораториях, в первую очередь в новой лаборатории Уотсона в Гарварде. Уотсон глубоко увлекся исследованиями РНК — более короткой одноцепочечной молекулы, близкой к ДНК и находимой как в цитоплазме клеток, так и в ядре. Кроме того, он обратил внимание на то, что РНК составляет неотъемлемую часть крошечных структур, теперь называемых рибосомами, на которых, судя по всему, и синтезировались белки. Итак, неактивная ДНК сидит в ядре. Когда нужно синтезировать какой-либо белок, соответствующий участок ДНК используется в качестве матрицы, чтобы синтезировать его РНК-копию. Она физически выходит из ядра и достигает ожидающих ее снаружи рибосом, синтезирующих этот белок, используя в качестве матрицы уже молекулу РНК. Эта разновидность РНК впоследствии получила название матричной РНК (мРНК). Уотсон еще в 1952 году писал Крику: «ДНК делает РНК делает белок». Крика теперь интересовало вот что: как точная последовательность букв молекулы матричной РНК переводится (транслируется) в последовательность аминокислот в белке?

Крик крепко задумался. Он предположил, что матричная РНК транслируется с помощью набора особых молекул — адаптеров, по одной на каждую аминокислоту. Адаптеры тоже должны состоять из РНК, у каждого из них должен быть антикодон, способный узнавать соответствующий кодон матричной РНК и связываться с ним. Принцип этого связывания, как считал Крик, должен быть точно таким же, как в ДНК: Ц образует пару с Г, А — с Т, и так далее[10]. Существование адаптеров предполагалось тогда чисто гипотетически, но они действительно были открыты несколько лет спустя, и оказалось, что они действительно состоят из РНК, как и предсказывал Крик. Теперь их называют транспортными РНК (тРНК). Вырисовывалась система, напоминающая детский конструктор, детали которого соединялись друг с другом и вновь разделялись, образуя изумительные, хотя и недолговечные структуры.

вернуться

10

На самом деле в состав молекул РНК вместо тимина (Т) входит немного отличающееся от него другое азотистое основание — урацил (У). Это одно из всего двух различий в строении молекул РНК и ДНК. Второе заключается в том, что в основе РНК лежит немного другой сахар — рибоза (в основе ДНК лежит дезоксирибоза). Нам еще предстоит убедиться в том, что эти два скромных химических различия вызывают огромную функциональную разницу.


Перейти на страницу:
Изменить размер шрифта: