Появление генетического кода. Понятие о гене, генетическом коде

Появление генетического кода. Понятие о гене, генетическом коде
Появление генетического кода. Понятие о гене, генетическом коде

Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

- единая система записи наследственной ин­формации в молекулах нуклеиновых кислот в виде последова­тельности нуклеотидов. Генетический код основан на использо­вании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода следующие:

1. Генетический код триплетен. Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав бел­ков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот оста­ются незакодированными). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, оказыва­ется равным трем. (В этом случае число возможных триплетов нуклеотидов составляет 4 3 = 64).

2. Избыточность (вырожденность) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими трип­летами (поскольку аминокислот 20, а триплетов - 64). Исключение составляют метионин и триптофан, которые кодируются только одним триплетом. Кроме того, некоторые триплеты вы­полняют специфические функции. Так, в молекуле иРНК три из них УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп-сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Одно­временно с избыточностью коду присуще свойство однозначнос­ти, которое означает, что каждому кодону соответствует только одна определенная аминокислота.

4. Код коллинеарен, т.е. по­следовательность нуклеотидов в гене точно соответствует после­довательности аминокислот в белке.

5. Генетический код непере­крываем и компактен, т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп-сигналов (терминирующих кодонов). Например, в иРНК следующая последовательность азотистых оснований АУГГУГЦУУААУГУГ будет считываться только такими трип­летами: АУГ, ГУГ, ЦУУ, ААУ, ГУГ, а не АУГ, УГГ, ГГУ, ГУГ и т. Д. или АУГ, ГГУ, УГЦ, ЦУУ и т. д. или еще каким-либо образом (допустим, кодон АУГ, знак препинания Г, кодон УГЦ, знак пре­пинания У и Т. п.).

6. Генетический код универсален, т. е. ядер­ные гены всех организмов одинаковым образом кодируют инфор­мацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Благодаря процессу транскрипции в клетке осуществляется передача информации от ДНК к белку: ДНК - и-РНК - белок. Генетическая информация, содержащаяся в ДНК и в и-РНК, заключена в последовательности расположения нуклеотидов в молекулах. Каким же образом происходит перевод информации с "языка" нуклеотидов на "язык" аминокислот? Такой перевод осуществляется с помощью генетического кода. Код, или шифр,- это система символов для перевода одной формы информации в другую. Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в информационной РНК. Насколько важна именно последовательность расположения одних и тех же элементов (четырех нуклеотидов в РНК) для понимания и сохранения смысла информации, можно убедиться на простом примере: переставив буквы в слове код, мы получим слово с иным значением - док. Какими же свойствами обладает генетический код?

1. Код триплетен. В состав РНК входят 4 нуклеотида: А, Г, Ц, У. Если бы мы пытались обозначить одну аминокислоту одним нуклеотидом, то 16 из 20 аминокислот остались бы не зашифрованы. Двухбуквенный код позволил бы зашифровать 16 аминокислот (из четырех нуклеотидов можно составить 16 различных комбинаций, в каждой из которых имеется два нуклеотида). Природа создала трехбуквенный, или триплетный, код. Это означает, что каждая из 20 аминокислот зашифрована последовательностью трех нуклеотидов, называемых триплетом или кодоном. Из 4 нуклеотидов можно создать 64 различные комбинации по 3 нуклеотида в каждой (4*4*4=64). Этого с избытком хватает для кодирования 20 аминокислот и, казалось бы, 44 кодона являются лишними. Однако это не так.

2. Код вырожден. Это означает, что каждая аминокислота шифруется более чем одним кодоном (от двух до шести). Исключение составляют аминокислоты метионин и триптофан, каждая из которых кодируется только одним триплетом. (Это видно из таблицы генетического кода .) Тот факт, что метионин кодируется одним триплетом АУТ, имеет особый смысл, который вам станет понятен позже ( 16).

3. Код однозначен. Каждый кодон шифрует только одну аминокислоту. У всех здоровых людей в гене, несущем информацию о бета-цепи гемоглобина , триплет ГАА или ГАГ, I стоящий на шестом месте, кодирует глутаминовую кислоту. У больных серповидноклеточной анемией второй нуклеотид в этом триплете заменен на У. Как видно из таблицы, триплеты ГУА или ГУГ, которые в этом случае образуются, кодируют аминокислоту валин. К чему приводит такая замена, вы уже знаете из раздела о ДНК .

4. Между генами имеются "знаки препинания". В печатном тексте в конце каждой фразы стоит точка. Несколько связанных по смыслу фраз составляют абзац. На языке генетической информации таким абзацем являются оперон и комплементарная ему и-РНК. Каждый ген в опероне кодирует одну полипептидную цепочку - фразу. Так как в ряде случаев по матрице и-РНК последовательно создается несколько разных полипептидных цепей, они должны быть отделены друг от друга. Для этого в генетическом коде существуют три специальные триплета - УАА, УАГ, УГА, каждый из которых обозначает прекрдщение синтеза одной полипептидной цепи. Таким образом, эти триплеты выполняют функцию знаков препинания. Они находятся в конце каждого гена. Внутри гена нет "знаков препинания". Поскольку генетический код подобен языку, разберем это свойство на примере такой составленной из триплетов фразы: жил был кот тих был сер мил мне тот кот. Смысл написанного понятен, несмотря на отсутствие "знаков препинания. Если же мы уберем в первом слове одну букву (один нуклеотид в гене), но читать будем также тройками букв, то получится бессмыслица: илб ылк отт ихб ылс ерм илм нет отк от Нарушение смысла возникает и при выпадении одного или двух нуклеотидов из гена. Белок, который будет считываться с такого испорченного гена, не будет иметь ничего общего с тем белком, который кодировался нормальным геном.

6. Код универсален. Генетический код един для всех живущих на Земле существ. У бактерий и грибов, пшеницы и хлопка, рыб и червей, лягушки и человека одни и те же триплеты кодируют одни и те же аминокислоты.

Под генетическим кодом принято понимать такую систему знаков, обозначающих последовательное расположение соединений нуклеотидов в ДНКа и РНКа, которая соответствует другой знаковой системе, отображающей последовательность аминокислотных соединений в молекуле белка.

Это важно!

Когда учёным удалось изучить свойства генетического кода, одним из главных была признана универсальность. Да, как ни странно это звучит, все объединяет один, универсальный, общий генетический код. Формировался он на протяжении большого временного промежутка, и процесс закончился около 3,5 миллиардов лет назад. Следовательно, в структуре кода можно проследить следы его эволюции, от момента зарождения до сегодняшнего дня.

Когда говорится о последовательности расположения элементов в генетическом коде, имеется в виду, что она далеко не хаотична, а имеет строго определённый порядок. И это тоже во многом определяет свойства генетического кода. Это равнозначно расположению букв и слогов в словах. Стоит нарушить привычный порядок, и большинство того, что мы будем читать на книжных или газетных страницах, превратится в нелепую абракадабру.

Основные свойства генетического кода

Обычно код несёт в себе какую-либо информацию, зашифрованную особым образом. Для того чтобы расшифровать кода, необходимо знать отличительные особенности.

Итак, основные свойства генетического кода - это:

  • триплетность;
  • вырожденность или избыточность;
  • однозначность;
  • непрерывность;
  • уже указанная выше универсальность.

Остановимся подробнее на каждом свойстве.

1. Триплетность

Это когда три соединения нуклеотидов образуют последовательную цепочку внутри молекулы (т.е. ДНК или же РНК). В результате создаётся соединение триплета или кодирует одну из аминокислот, место её нахождения в цепи пептидов.

Различают кодоны (они же кодовые слова!) по их последовательности соединения и по типу тех азотистых соединений (нуклеотидов), которые входят в их состав.

В генетике принято выделять 64 кодоновых типа. Они могут образовывать комбинации из четырёх типов нуклеотидов по 3 в каждом. Это равносильно возведению числа 4 в третью степень. Таким образом, возможно образование 64-х нуклеотидных комбинаций.

2. Избыточность генетического кода

Это свойство прослеживается тогда, когда для шифрования одной аминокислоты требуется несколько кодонов, обычно в пределах 2-6. И только и триптофана можно кодировать с помощью одного триплета.

3. Однозначность

Она входит в свойства генетического кода как показатель здоровой генной наследственности. Например, о хорошем состоянии крови, о нормальном гемоглобине может рассказать медикам стоящий на шестом месте в цепочке триплет ГАА. Именно он несёт информацию о гемоглобине, и им же кодируется А если человек болен анемией, один из нуклеотидов заменяется на другую букву кода - У, что и является сигналом заболевания.

4. Непрерывность

При записи этого свойства генетического кода следует помнить, что кодоны, как звенья цепочки, располагаются не на расстоянии, а в прямой близости, друг за другом в нуклеиновой кислотной цепи, и цепь эта не прерывается - в ней нет начала или конца.

5. Универсальность

Никогда не следует забывать, что всё сущее на Земле объединено общим генетическим кодом. И потому у примата и человека, у насекомого и птицы, столетнего баобаба и едва проклюнувшейся из-под земли травинки одинаковыми триплетами кодируются схожие аминокислоты.

Именно в генах заложена основная информация о свойствах того или иного организма, своего рода программа, которую организм получает в наследство от живших ранее и которая существует как генетический код.

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .