Факультет

Студентам

Посетителям

Полинуклеотидные «коды»

Обсуждение генетической роли ДНК не может быть полным без упоминания о попытках найти «код», при помощи которого структура синтезируемого белка зашифрована в последовательности оснований.

Для этого нам не нужно обладать специальными знаниями в области органической химии, достаточно лишь усвоить следующие два факта: 1) белки состоят в основном из полипептидных цепей, образованных из 20 аминокислот, которые располагаются в определенной последовательности, специфичной для каждого белка; 2) последовательности, установленные для некоторых белков и нуклеотидов, приведены в ряде обзоров, опубликованных в различных изданиях. Необходимо обладать также некоторыми математическими способностями и значительной долей воображения.

Мы разберем здесь только один код, так называемый код «без запятых», предложенный Криком, Гриффитом и Орджелом. Это удачный пример, так как до сих пор не получено экспериментальных данных, которые опровергали бы этот код; кроме того, эта работа весьма изящно иллюстрирует подход к основной криптографической проблеме: «каким образом последовательность четырех веществ (нуклеотидов) определяет последовательность двадцати веществ (аминокислот)».

Поскольку (обычно) имеется лишь четыре основания, код, построенный на соответствии между парами оснований и аминокислотными остатками, непригоден, так как при этом возможны лишь 4 X 4 = 16 таких пар. Если же использованы тройки оснований, то их оказывается слишком много (4X4X4 = 64) и необходимо вводить какие-то ограничения. В качестве примера ограничения числа возможных комбинаций Крик, Гриффит и Орджел рассмотрели случай «неперекрывающихся кодов». Если буквами А, В, С и D обозначить четыре основания, то мы можем разделить полинуклеотидную цепь, состоящую из таких оснований, на неперекрывающиеся тройки, причем каждая тройка соответствует одному аминокислотному остатку. «Если концы цепи неизвестны, то можно разбить основания на тройки несколькими способами. Проблема состоит в том, как прочитать закодированное сообщение, если запятые стерты, т. е. если код не содержит запятых».

Основные правила кодирования в данном случае следующие: 1) некоторые из 64 троек «имеют смысл», а другие «бессмысленны», 2) встречаются все возможные последовательности аминокислот, но на любом участке нити возможна лишь правильная расшифровка (иными словами, две тройки, имеющие смысл, могут стоять рядом, но если при этом образуются перекрывающиеся тройки, то они всегда должны быть «бессмысленными»; например, если в последовательности ABCDAA, ABC и DAA имеют смысл, то BCD и CDA всегда должны давать бессмыслицу).

Ясно, что таким образом можно закодировать максимум 20 аминокислот, что позволяет нам исключить тройки ААА, ВВВ и т. д., потому что если в последовательности АААААА тройка ААА соответствует аминокислоте а, то комбинацию из шести А можно прочитать неверно, связав аминокислоту а со вторым — четвертым или же с третьим — шестым А из шестерки. При этом число возможных троек сократится с 64 до 60. Эти 60 троек можно сгруппировать в 20 наборов по 3 тройки в каждом, причем каждый набор представляет собой циклическую перестановку другого. Если, например, тройка ВСА определяет аминокислоту б, то сочетание ВСА ВСА соответствует бб, а сочетания САВ и ABC следует отбросить как «бессмысленные». Поскольку, таким образом, из каждого набора можно выбрать лишь одну тройку, мы получаем «магическое число» — 20.

Показав, что, приняв данную систему, можно при помощи 4 оснований закодировать не более 20 аминокислот, авторы дают ряд решений. Читатель может убедиться, что любые две тройки из этого набора можно поставить рядом и при этом перекрывающихся троек, принадлежащих к данному набору, не образуется. Всего возможно 288 различных решений, удовлетворяющих правилам.

Если строение ДНК действительно имеет какое-то отношение к генетической информации, то, помимо последовательности оснований, несомненно, следует принимать во внимание также многие другие структурные особенности, в частности связанные с геометрическим расположением полинуклеотидной цепи. Таким образом, в настоящее время создание кодов, которые могут иметь какое-то отношение к проблеме передачи информации от ДНК к белку, имеет главным образом теоретическое значение. Однако со временем исследование этой проблемы, без сомнения, станет более плодотворным. Химики, изучающие белки, начинают сейчас собирать данные о химических последствиях мутаций, и скоро мы будем располагать достаточным материалом для рассмотрения. Эти данные большей частью будут весьма косвенными. Например, изменение в одном гене, в результате которого вместо нормального гемоглобина образуется гемоглобин С, сопровождается заменой определенного остатка глутаминовой кислоты остатком лизина. Аналогичная замена произошла в процессе эволюции в молекуле рибонуклеазы: в рибонуклеазе быка имеется остаток лизина, а в ферменте овцы он заменен глутаминовой кислотой. В первом случае мы можем считать, что замена вызвана мутацией. Во втором случае также предполагается наличие мутации, но, поскольку быка нельзя скрестить с овцой, доказать это невозможно. Дальнейшее накопление подобных данных, возможно, позволит нам решить, существует ли некий единый тип соответствия между генотипом и строением белка.