유전 암호는 무엇입니까: 일반 정보.  유전암호의 명확성은 다음과 같은 사실에서 드러난다.

유전 암호는 무엇입니까: 일반 정보. 유전암호의 명확성은 다음과 같은 사실에서 드러난다.

유전자- 특정 특성이나 속성의 발달을 제어하는 ​​유전의 구조적 및 기능적 단위. 부모는 번식하는 동안 일련의 유전자를 자손에게 전달합니다. 유전자 연구에 큰 공헌을 한 러시아 과학자: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V.(2011)

현재 분자 생물학에서 유전자는 하나의 단백질 분자 또는 하나의 RNA 분자의 구조에 대한 모든 필수 정보를 전달하는 DNA 부분이라는 것이 확립되었습니다. 이들 및 기타 기능적 분자는 유기체의 발달, 성장 및 기능을 결정합니다.

동시에, 각 유전자는 유전자의 발현 조절에 직접적으로 관여하는 프로모터와 같은 다수의 특정 조절 DNA 서열을 특징으로 합니다. 조절 서열은 단백질을 암호화하는 오픈 리딩 프레임(open reading frame)의 바로 근처에 위치하거나 프로모터의 경우와 같이 RNA 서열의 시작(소위 시스 시스 조절 요소), 그리고 인핸서, 절연체 및 억제제(때때로 트랜스- 규제 요소 초 규제 요소). 따라서 유전자의 개념은 DNA의 암호화 영역에 국한되지 않고 조절 서열을 포함하는 더 넓은 개념입니다.

원래 용어 유전자이산 전송의 이론적인 단위로 등장 유전 정보. 생물학의 역사는 유전 정보의 운반자가 될 수 있는 분자에 대한 논쟁을 기억합니다. 대부분의 연구자들은 단백질의 구조(20개 아미노산)가 단 4가지 유형의 뉴클레오티드로 구성된 DNA 구조보다 더 많은 옵션을 생성할 수 있기 때문에 단백질만이 그러한 운반체가 될 수 있다고 믿었습니다. 후에 유전정보를 담고 있는 것이 DNA라는 것이 실험적으로 증명되었고, 이는 다음과 같이 표현되었다. 중앙 교리분자 생물학.

유전자는 돌연변이를 겪을 수 있습니다. 즉, DNA 사슬의 뉴클레오타이드 서열이 무작위로 또는 의도적으로 변경됩니다. 돌연변이는 서열의 변화로 이어질 수 있으며, 따라서 단백질 또는 RNA의 생물학적 특성의 변화로 이어질 수 있으며, 이는 차례로 유기체의 일반적 또는 국부적 변경 또는 비정상적 기능을 초래할 수 있습니다. 그러한 돌연변이는 결과가 질병이거나 배아 수준에서 치명적이기 때문에 어떤 경우에는 병원성입니다. 그러나 뉴클레오타이드 서열의 모든 변화가 단백질 구조의 변화(유전 암호의 퇴화의 영향으로 인해) 또는 서열의 상당한 변화를 초래하며 병원성이 없는 것은 아닙니다. 특히, 인간 게놈은 단일 염기 다형성 및 카피 수 변이를 특징으로 한다. 사본 번호 변형), 전체 인간 뉴클레오티드 서열의 약 1%를 구성하는 결실 및 중복과 같은 것이다. 특히 단일 뉴클레오티드 다형성은 동일한 유전자의 다른 대립 유전자를 정의합니다.

DNA의 각 가닥을 구성하는 단량체는 복잡합니다. 유기 화합물, 질소 염기 포함: 아데닌(A) 또는 티민(T) 또는 시토신(C) 또는 구아닌(G), 5원자 당-펜토스-데옥시리보스, 그 이름을 따서 DNA 자체 및 인산 잔기가 명명되었습니다. 이러한 화합물을 뉴클레오티드라고 합니다.

유전자 속성

  1. 이산성 - 유전자의 비혼화성;
  2. 안정성 - 구조를 유지하는 능력;
  3. 불안정성 - 반복적으로 돌연변이하는 능력;
  4. 다중 대립 유전자 - 많은 유전자가 다양한 분자 형태로 집단에 존재합니다.
  5. 대립 유전자 - 이배체 유기체의 유전자형에서 두 가지 형태의 유전자 만;
  6. 특이성 - 각 유전자는 고유한 특성을 인코딩합니다.
  7. 다면발현 - 유전자의 다중 효과;
  8. 표현력 - 형질에서 유전자의 발현 정도;
  9. 침투성 - 표현형에서 유전자 발현의 빈도;
  10. 증폭 - 유전자 사본 수의 증가.

분류

  1. 구조 유전자는 특정 단백질 또는 일부 유형의 RNA를 인코딩하는 단일 서열을 나타내는 게놈의 고유한 구성요소입니다. (또한 기사 유전자 참조 가정).
  2. 기능 유전자 - 구조 유전자의 작용을 조절합니다.

유전자 코드- 뉴클레오티드의 서열을 사용하여 단백질의 아미노산 서열을 코딩하는 모든 살아있는 유기체에 고유한 방법.

4개의 뉴클레오티드가 DNA에 사용됩니다 - 아데닌(A), 구아닌(G), 시토신(C), 티민(T)은 러시아어 문헌에서 문자 A, G, C 및 T로 표시됩니다. 이 문자는 구성 유전자 코드의 알파벳. RNA에서는 문자 U(러시아어 문헌의 U)로 표시되는 유사한 뉴클레오티드인 우라실로 대체되는 티민을 제외하고 동일한 뉴클레오티드가 사용됩니다. DNA 및 RNA 분자에서 뉴클레오티드는 사슬로 정렬되어 유전 문자의 서열을 얻습니다.

유전자 코드

자연에서 단백질을 만드는 데 사용되는 20가지 다른 아미노산이 있습니다. 각 단백질은 엄격하게 정의된 서열의 사슬 또는 여러 아미노산 사슬입니다. 이 서열은 단백질의 구조를 결정하고 따라서 모든 생물학적 특성. 아미노산 세트는 또한 거의 모든 살아있는 유기체에 보편적입니다.

살아있는 세포에서 유전 정보의 구현(즉, 유전자에 의해 암호화된 단백질 합성)은 전사(즉, DNA 주형에서 mRNA 합성) 및 유전 코드 번역의 두 가지 매트릭스 프로세스를 사용하여 수행됩니다. 아미노산 서열로 (mRNA에 폴리펩타이드 사슬 합성). 3개의 연속된 뉴클레오티드는 20개의 아미노산과 단백질 서열의 끝을 의미하는 정지 신호를 인코딩하기에 충분합니다. 세 개의 뉴클레오티드 집합을 삼중항이라고 합니다. 아미노산 및 코돈에 해당하는 허용되는 약어가 그림에 나와 있습니다.

속성

  1. 삼중성- 코드의 중요한 단위는 3개의 뉴클레오티드(삼중항 또는 코돈)의 조합입니다.
  2. 연속성- 삼중항 사이에는 구두점이 없습니다. 즉, 정보를 계속해서 읽습니다.
  3. 겹치지 않는- 동일한 뉴클레오티드가 동시에 둘 이상의 삼중항의 일부일 수 없습니다(여러 프레임이동 단백질을 암호화하는 바이러스, 미토콘드리아 및 박테리아의 일부 중복 유전자에 대해서는 관찰되지 않음).
  4. 명확성(특이성)- 특정 코돈은 하나의 아미노산에만 해당합니다(그러나 UGA 코돈은 유플로테스 크라수스시스테인과 셀레노시스테인의 두 가지 아미노산 코드)
  5. 퇴화(중복)여러 코돈이 동일한 아미노산에 해당할 수 있습니다.
  6. 다재- 유전자 코드는 유기체에서 동일한 방식으로 작동합니다. 다른 수준복잡성 - 바이러스에서 인간에 이르기까지(유전 공학 방법은 이를 기반으로 합니다. 아래 "표준 유전자 코드의 변형" 섹션에 있는 표에 나와 있는 몇 가지 예외가 있습니다.)
  7. 노이즈 내성- 암호화된 아미노산의 종류에 변화를 일으키지 않는 뉴클레오티드 치환의 돌연변이를 보수적인; 암호화된 아미노산의 종류에 변화를 일으키는 뉴클레오티드 치환 돌연변이를 근본적인.

단백질 생합성 및 그 단계

단백질 생합성- mRNA 및 tRNA 분자의 참여로 살아있는 유기체 세포의 리보솜에서 발생하는 아미노산 잔기로부터 폴리펩티드 사슬 합성의 복잡한 다단계 과정.

단백질 생합성은 전사, 가공 및 번역의 단계로 나눌 수 있습니다. 전사하는 동안 DNA 분자에 암호화된 유전 정보가 판독되고 이 정보가 mRNA 분자에 기록됩니다. 일련의 연속적인 처리 단계에서 후속 단계에서 필요하지 않은 일부 단편이 mRNA에서 제거되고 뉴클레오티드 서열이 편집됩니다. 코드가 핵에서 리보솜으로 수송된 후, 단백질 분자의 실제 합성은 성장하는 폴리펩타이드 사슬에 개별 아미노산 잔기를 부착함으로써 발생합니다.

전사와 번역 사이에 mRNA 분자는 폴리펩티드 사슬 합성을 위한 기능 템플릿의 성숙을 보장하는 일련의 연속적인 변화를 겪습니다. 5'말단에는 cap이, 3'말단에는 poly-A tail이 붙어 있어 mRNA의 수명을 연장시킨다. 진핵 세포에서 처리의 도래와 함께 유전자 엑손을 결합하여 DNA 뉴클레오티드의 단일 서열에 의해 암호화된 더 다양한 단백질을 얻는 것이 가능하게 되었습니다.

번역은 메신저 RNA에 암호화된 정보에 따라 폴리펩타이드 사슬을 합성하는 것으로 구성됩니다. 아미노산 서열은 다음을 사용하여 배열됩니다. 수송아미노산과 복합체를 형성하는 RNA(tRNA) - 아미노아실-tRNA. 각 아미노산에는 mRNA 코돈과 "일치하는" 상응하는 안티코돈이 있는 고유한 tRNA가 있습니다. 번역하는 동안 리보솜은 폴리펩티드 사슬이 형성됨에 따라 mRNA를 따라 움직입니다. 단백질 합성을 위한 에너지는 ATP에 의해 제공됩니다.

그런 다음 완성된 단백질 분자는 리보솜에서 절단되어 세포의 올바른 위치로 운반됩니다. 일부 단백질은 활성 상태에 도달하기 위해 추가적인 번역 후 변형이 필요합니다.

0

유전자 코드모든 생물체의 특징인 DNA 분자의 염기서열을 이용하여 단백질의 아미노산 서열을 암호화하는 방식이다.

살아있는 세포에서 유전 정보의 구현(즉, DNA에 암호화된 단백질 합성)은 전사(즉, DNA 매트릭스에서 mRNA 합성) 및 번역(폴리펩타이드 사슬 합성)의 두 가지 매트릭스 프로세스를 사용하여 수행됩니다. mRNA 매트릭스).

DNA는 아데닌(A), 구아닌(G), 시토신(C), 티민(T)의 4가지 뉴클레오티드를 사용합니다. 이 "문자"는 유전자 코드의 알파벳을 구성합니다. RNA는 우라실(U)로 대체되는 티민을 제외하고 동일한 뉴클레오티드를 사용합니다. DNA 및 RNA 분자에서 뉴클레오티드는 사슬로 정렬되어 "문자"의 서열을 얻습니다.

DNA의 뉴클레오티드 서열에는 미래의 단백질 분자의 각 아미노산에 대한 코드 "단어"가 있습니다 - 유전 코드. 그것은 DNA 분자의 특정 염기 서열로 구성됩니다.

3개의 연속적인 뉴클레오티드는 하나의 아미노산의 "이름"을 인코딩합니다. 즉, 20개의 아미노산 각각은 중요한 코드 단위(트리플릿 또는 코돈이라고 하는 3개의 뉴클레오티드 조합)에 의해 암호화됩니다.

현재 DNA 코드는 완전히 해독되었으며 DNA의 "언어"에서 단백질의 "언어"로 정보 번역을 제공하는 이 독특한 생물학적 시스템의 특징인 특정 속성에 대해 이야기할 수 있습니다.

유전 정보의 운반자는 DNA이지만, DNA 가닥 중 하나의 사본인 mRNA가 단백질 합성에 직접 관여하기 때문에 유전 암호는 "RNA 언어"로 작성되는 경우가 가장 많습니다.

아미노산 코딩 RNA 삼중항
알라닌 GCU GCC GCA GCG
아르기닌 TsGU TsGTs TsGA TsGG AGA AGG
아스파라긴 AAU AAC
아스파르트산 가우 GAC
발린 구구구구구구구
히스티딘 CAU CAC
글리신 GSU GGC GGA GYY
글루타민 CAA CAG
글루탐산 GAA 개그
이소류신 AAU AUC AUA
류신 츠츠츠츠츠츠츠츠츠우아우우그
라이신 AAA AAG
메티오닌 8월
프롤린 CCC CCC CCA CCG
고요한 UCU UCC UCA UCG ASU AGC
티로신 UAU UAC
트레오닌 ACC ACC ACA ACG
트립토판 어그
페닐알라닌 우우우우우우우우우우우우우우우우
시스테인 UGU UHC
멈추다 UGA UAG UAA

유전자 코드의 속성

3개의 연속적인 뉴클레오티드(질소 염기)는 하나의 아미노산의 "이름"을 암호화합니다. 즉, 20개의 아미노산 각각은 중요한 코드 단위에 의해 암호화됩니다. 세 쌍둥이 또는 코돈.

삼중항(코돈)- 합성 과정에서 단백질 분자에 특정 아미노산의 포함을 결정하는 DNA 또는 RNA 분자의 3개 뉴클레오티드(질소 염기)의 서열.

  • 명확성(이산성)

하나의 삼중항은 두 개의 다른 아미노산을 암호화할 수 없으며 오직 하나의 아미노산만 암호화합니다. 특정 코돈은 하나의 아미노산에만 해당합니다.

각 아미노산은 하나 이상의 삼중항으로 정의될 수 있습니다. 예외 - 메티오닌그리고 트립토판. 즉, 여러 코돈이 동일한 아미노산에 해당할 수 있습니다.

  • 겹치지 않는

같은 염기가 두 개의 인접한 코돈에 동시에 존재할 수 없습니다.

일부 삼중항은 아미노산을 암호화하지 않지만 개별 유전자(UAA, UAG, UGA)의 시작과 끝을 결정하는 일종의 "도로 표지판"이며, 각각은 합성의 중단을 의미하며 각각의 끝에 위치합니다. 유전자, 그래서 우리는 유전 암호의 극성에 대해 이야기할 수 있습니다.

동물과 식물, 곰팡이, 박테리아 및 바이러스에서 동일한 삼중항은 동일한 유형의 아미노산을 암호화합니다. 즉, 유전 코드는 모든 생명체에 대해 동일합니다. 즉, 보편성은 바이러스에서 인간에 이르기까지 복잡성 수준이 다른 유기체에서 동일한 방식으로 작동하는 유전 코드의 능력입니다. DNA 코드의 보편성은 지구상의 모든 생명체의 기원의 통일성을 확인시켜줍니다. 유전 공학 방법은 유전 코드의 보편성 속성의 사용을 기반으로 합니다.

유전자 코드 발견의 역사에서

처음으로 존재에 대한 생각 유전자 코드 1952-1954년에 A. Down과 G. Gamow에 의해 공식화되었습니다. 과학자들은 특정 아미노산의 합성을 유일하게 결정하는 뉴클레오티드 서열이 최소한 3개의 연결을 포함해야 한다는 것을 보여주었습니다. 나중에 그러한 서열이 3개의 뉴클레오타이드로 구성되어 있음이 증명되었습니다. 코돈또는 세 쌍둥이.

어떤 뉴클레오타이드가 특정 아미노산을 단백질 분자에 통합시키는 역할을 하는지, 그리고 얼마나 많은 뉴클레오타이드가 이 포함을 결정하는지에 대한 질문은 1961년까지 해결되지 않은 채로 남아 있었습니다. 이론적인 분석에 따르면 코드는 하나의 뉴클레오티드로 구성될 수 없습니다. 이 경우에는 4개의 아미노산만 인코딩될 수 있기 때문입니다. 그러나 코드는 이중선이 될 수 없습니다. 즉, 4글자 "알파벳"의 2개 뉴클레오티드 조합은 모든 아미노산을 포함할 수 없습니다. 왜냐하면 이러한 조합은 이론적으로 16개만 가능하기 때문입니다(4 2 = 16).

3개의 연속적인 뉴클레오티드는 20개의 아미노산을 인코딩하기에 충분할 뿐만 아니라 가능한 조합의 수가 64(4 3 = 64)일 때 단백질 서열의 끝을 의미하는 "정지" 신호를 인코딩하기에 충분합니다.

민법의 기원을 설명하는 일련의 기사는 우리가 거의 흔적이없는 사건에 대한 조사로 간주 될 수 있습니다. 그러나 이러한 기사를 이해하려면 단백질 합성의 분자 메커니즘을 이해하는 데 약간의 노력이 필요합니다. 이 글은 유전암호의 기원에 관한 일련의 자동출판물에 대한 소개 글이며, 이 주제에 대해 알기 시작하기에 가장 좋은 곳입니다.
대개 유전자 코드(GC)는 DNA 또는 RNA의 1차 구조에 단백질을 코딩하는 방법(규칙)으로 정의된다. 문헌에서는 이것이 합성된 단백질의 1개의 아미노산 또는 단백질 합성의 종점에 대한 유전자의 3개의 뉴클레오티드 서열의 일대일 대응이라고 가장 자주 쓰여집니다. 그러나 이 정의에는 두 가지 오류가 있습니다. 이것은 예외 없이 모든 살아있는 유기체의 단백질의 일부인 20개의 소위 표준 아미노산을 의미합니다. 이 아미노산은 단백질 단량체입니다. 오류는 다음과 같습니다.

1) 표준 아미노산은 20개가 아니라 19개입니다. 아미노산은 아미노기 -NH 2 와 카르복실기 - COOH를 동시에 포함하는 물질이라고 부를 수 있습니다. 사실 단백질 단량체인 프롤린은 아미노기 대신 이미노기를 포함하고 있기 때문에 아미노산이 아니므로 프롤린을 이미노산이라고 부르는 것이 더 정확합니다. 그러나 앞으로 HA에 대한 모든 기사에서 편의상 표시된 뉘앙스를 암시하는 약 20개의 아미노산을 작성할 것입니다. 아미노산 구조는 그림 1에 나와 있습니다. 하나.

쌀. 1. 표준 아미노산의 구조. 아미노산은 그림에서 검은색으로 표시된 불변 부분과 빨간색으로 표시된 가변(또는 라디칼) 부분이 있습니다.

2) 코돈에 대한 아미노산의 대응이 항상 명확한 것은 아닙니다. 고유성 위반 사례에 대해서는 아래를 참조하십시오.

HA의 발생은 암호화된 단백질 합성의 발생을 의미한다. 이 사건은 최초의 생명체가 진화적으로 형성되는 데 중요한 사건 중 하나입니다.

HA의 구조는 그림 1에 원형으로 표시되어 있습니다. 2.



쌀. 2. 유전자 코드원형으로. 안쪽 원은 코돈의 첫 글자, 두 번째 글자는원 - 코돈의 두 번째 문자, 세 번째 원 - 코돈의 세 번째 문자, 네 번째 원 - 세 글자 약어의 아미노산 지정; P - 극성 아미노산, NP - 비극성 아미노산. 대칭성을 명확하게 하기 위해 선택한 기호 순서가 중요합니다. U-C-A-G.

그럼 HA의 주요 속성에 대한 설명으로 넘어가도록 하겠습니다.

1. 삼중성.각 아미노산은 3개의 뉴클레오티드 서열에 의해 암호화됩니다.

2. 유전적 구두점의 존재.유전자간 구두점에는 번역이 시작되거나 끝나는 핵산 서열이 포함됩니다.

번역 나는 어떤 코돈으로도 시작할 수 없지만 엄격하게 정의된 - 시작. 시작 코돈은 번역을 시작하는 AUG 삼중항입니다. 이 경우, 이 삼중항은 메티오닌 또는 다른 아미노산인 포르밀메티오닌(원핵생물에서)을 암호화하며, 이는 단백질 합성이 시작될 때만 켜질 수 있습니다. 폴리펩티드를 암호화하는 각 유전자의 끝에는 3개 중 적어도 하나가 있습니다. 종결 코돈, 또는 브레이크 등: UAA, UAG, UGA. 그들은 번역(리보솜에서 소위 단백질 합성)을 종료합니다.

3. 간결함 또는 유전자 내 구두점의 부재.유전자 내에서 각 뉴클레오티드는 중요한 코돈의 일부입니다.

4. 겹치지 않음.코돈은 서로 겹치지 않으며, 각각은 인접한 코돈의 유사한 집합과 겹치지 않는 고유한 정렬된 뉴클레오티드 집합을 가지고 있습니다.

5. 퇴화.아미노산-코돈 방향의 역 대응은 모호합니다. 이 속성을 퇴화라고 합니다. 시리즈하나의 아미노산을 암호화하는 코돈의 집합입니다. 즉, 그룹입니다. 등가 코돈. 코돈을 XYZ로 생각하십시오. XY가 "의미"(즉, 아미노산)를 정의하면 코돈은 강한. 코돈의 의미를 결정하기 위해 특정 Z가 필요한 경우 그러한 코돈을 약한.

코드의 퇴화는 코돈-안티코돈 짝짓기의 모호성과 밀접하게 관련되어 있습니다(안티코돈은 메신저 RNA의 코돈과 상보적으로 짝을 이룰 수 있는 tRNA의 3개 뉴클레오티드 시퀀스를 의미합니다(이에 대한 두 개의 기사 참조). 코드 퇴화를 보장하기 위한 분자 메커니즘그리고 라거퀴스트의 법칙. 대칭과 Rumer의 관계에 대한 물리 화학적 입증). tRNA당 하나의 안티코돈은 mRNA당 1~3개의 코돈을 인식할 수 있습니다.

6.명확성.각 삼중항은 하나의 아미노산만 인코딩하거나 번역 종결자입니다.

세 가지 알려진 예외가 있습니다.

첫 번째. 첫 번째 위치에 있는 원핵생물에서( 대문자) 그것은 포르밀메티오닌 및 기타 메티오닌을 인코딩합니다. 유전자의 시작 부분에서 포르밀메티오닌은 일반적인 메티오닌 코돈 AUG와 발린 코돈 GUG 또는 류신 UUG에 의해 인코딩되며, 이는 유전자 내부에서 발린과 류신을 인코딩합니다. 각기.

많은 단백질에서 포르밀메티오닌이 절단되거나 포르밀기가 제거되어 포르밀메티오닌이 일반 메티오닌으로 전환됩니다.

초. 1986년에 여러 연구자 그룹이 mRNA에서 UGA 종결 코돈이 특별한 뉴클레오티드 서열이 뒤따른다면 셀레노시스테인을 인코딩할 수 있다는 것을 한 번에 발견했습니다(그림 3 참조).

쌀. 3. 21번째 아미노산 - 셀레노시스테인의 구조.

~에 대장균(이것은 Escherichia coli의 라틴어 이름입니다) selenocysteyl-tRNA는 번역 중에 mRNA의 UGA 코돈을 인식하지만 특정 상황에서만 e: UGA 코돈을 의미 있는 것으로 인식하기 위해 45개 뉴클레오티드 길이의 서열은 다음 위치에 있습니다. UGA 코돈이 중요합니다.

고려된 예는 필요한 경우 살아있는 유기체가 표준 유전자 코드의 의미를 변경할 수 있음을 보여줍니다. 이 경우 유전자에 포함된 유전 정보는 보다 복잡한 방식으로 암호화됩니다. 코돈의 의미는 e의 맥락에서 특정 긴 염기서열과 몇 가지 매우 특정한 단백질 인자의 참여로 결정됩니다. 셀레노시스테인 tRNA가 생명체의 세 가지(고세균, 진핵생물 및 진핵생물) 모두의 대표자에서 발견된 것이 중요합니다. 이는 셀레노시스테인 합성 기원의 고대를 나타내며 아마도 마지막 보편적 공통 조상(이것은 다른 기사에서 논의될 것입니다). 아마도 셀레노시스테인은 예외없이 모든 살아있는 유기체에서 발견됩니다. 그러나 각 개별 유기체에서 셀레노시스테인은 수십 개 이하의 단백질에서 발견됩니다. 그것은 일반 시스테인이 비슷한 위치에서 기능할 수 있는 많은 동족체에서 효소의 활성 부위의 일부입니다.

최근까지 UGA 코돈은 셀레노시스테인 또는 말단으로 읽힐 수 있다고 믿어졌지만 최근에는 섬모에서 유플로테스 UGA 코돈은 시스테인 또는 셀레노시스테인을 암호화합니다. 센티미터. " 유전자 코드불일치 허용"

세 번째 예외. 일부 원핵생물(고세균 5종과 진균 1종 - Wikipedia의 정보는 매우 구식임)에는 특별한 산인 피롤리신이 있습니다(그림 4). 표준 코드에서 번역 종결자 역할을 하는 UAG 삼중항에 의해 인코딩됩니다. 이 경우 셀레노시스테인을 코딩하는 경우와 마찬가지로 UAG를 pyrrolysine codon으로 읽는 것은 mRNA의 특수한 구조로 인해 발생한다고 가정한다. 피롤리신 tRNA는 안티코돈 CTA를 포함하고 클래스 2 APCase에 의해 아미노아실화됩니다(APCase의 분류에 대해서는 "Codases가 어떻게 유전자 코드 ").

UAG는 정지 코돈으로 거의 사용되지 않으며, 그렇다면 다른 정지 코돈이 뒤따르는 경우가 많습니다.

쌀. 4. 피롤리신의 22번째 아미노산의 구조.

7. 다재.지난 세기의 60년대 중반에 민법의 해독이 완료된 후, 오랫동안코드는 모든 유기체에서 동일하다고 믿어졌으며 이는 지구상의 모든 생명체의 기원의 통일성을 나타냅니다.

GC가 보편적인 이유를 이해하려고 노력합시다. 사실은 신체에서 적어도 하나의 코딩 규칙이 변경되면 단백질의 상당 부분의 구조가 변경되었다는 사실로 이어질 것입니다. 그러한 변화는 너무 극적이어서 거의 항상 치명적일 것입니다. 왜냐하면 단 하나의 코돈 의미의 변화가 평균적으로 모든 아미노산 서열의 1/64에 영향을 미칠 수 있기 때문입니다.

이로부터 한 가지 매우 중요한 생각이 나옵니다. HA는 35억 년 전에 형성된 이후 거의 변하지 않았습니다. 따라서 그 구조에는 발생의 흔적이 있으며 이 구조를 분석하면 GC가 정확히 어떻게 발생할 수 있는지 이해하는 데 도움이 될 수 있습니다.

실제로 HA는 박테리아, 미토콘드리아, 일부 섬모 및 효모의 핵 코드에서 약간 다를 수 있습니다. 이제 표준 코드와 1-5개의 코돈이 다른 적어도 17개의 유전 코드가 있습니다. 알려진 변종보편적인 GC로부터의 편차, 코돈의 의미에 대한 18개의 다른 치환이 사용됩니다. 표준 코드와의 대부분의 편차는 미토콘드리아 - 10으로 알려져 있습니다. 척추 동물, 편형 동물, 극피 동물의 미토콘드리아는 다른 코드로 인코딩되고 곰팡이 균류, 원생 동물 및 coelenterates는 하나로 인코딩됩니다.

종의 진화론적 근접성은 그들이 유사한 GC를 갖는다는 보장이 결코 아닙니다. 유전자 코드는 사람마다 다를 수 있습니다. 다른 유형마이코플라스마(일부 종에는 표준 코드가 있는 반면 다른 종은 다릅니다). 효모에서도 비슷한 상황이 관찰됩니다.

미토콘드리아는 세포 내부에 살기 위해 적응한 공생 유기체의 후손이라는 점에 주목하는 것이 중요합니다. 그들은 게놈이 크게 감소했으며 일부 유전자는 세포 핵으로 이동했습니다. 따라서 HA의 변화는 더 이상 그렇게 극적이지 않습니다.

나중에 발견된 예외는 코드 진화의 메커니즘을 밝히는 데 도움이 될 수 있기 때문에 진화론적 관점에서 특히 흥미로운 것입니다.

1 번 테이블.

다양한 유기체의 미토콘드리아 코드.

코돈

범용 코드

미토콘드리아 코드

척추동물

무척추 동물

누룩

식물

우가

멈추다

trp

trp

trp

멈추다

AUA

만난

만난

만난

CUA

레우

레우

레우

시간

레우

아가

인수

멈추다

세르

인수

인수

AGG

인수

멈추다

세르

인수

인수

코드에 의해 암호화된 아미노산을 변경하는 세 가지 메커니즘.

첫 번째는 일부 뉴클레오티드(GC 구성) 또는 뉴클레오티드 조합의 불균일한 발생으로 인해 일부 유기체가 일부 코돈을 사용하지 않거나 거의 사용하지 않는 경우입니다. 결과적으로 이러한 코돈은 사용에서 완전히 사라질 수 있으며(예: 해당 tRNA의 손실로 인해), 향후에는 신체에 심각한 손상을 입히지 않고 다른 아미노산을 코딩하는 데 사용할 수 있습니다. 이 메커니즘은 아마도 미토콘드리아에서 암호의 일부 방언이 나타나는 원인일 것입니다.

두 번째는 정지 코돈을 새로운 의미로 변형시키는 것입니다. 이 경우 번역된 단백질 중 일부에 첨가물이 있을 수 있습니다. 그러나 많은 유전자가 종종 하나가 아닌 두 개의 중지 코돈으로 끝나는 사실에 의해 상황이 부분적으로 저장됩니다. 중지 코돈을 아미노산으로 읽는 번역 오류가 가능하기 때문입니다.

세 번째는 일부 균류에서 발생하는 특정 코돈의 모호한 판독 가능성입니다.

8 . 연결성.등가 코돈의 그룹(즉, 동일한 아미노산을 코딩하는 코돈)은 시리즈. GC는 정지 코돈을 포함하여 21개의 시리즈를 포함합니다. 다음 내용에서는 명확성을 위해 모든 코돈 그룹을 호출할 것입니다. 연락,이 그룹의 각 코돈에서 연속적인 뉴클레오티드 치환에 의해 동일한 그룹의 다른 모든 코돈으로 전달될 수 있는 경우. 21개의 계열 중 18개가 연결되어 있으며 2개의 계열은 각각 하나의 코돈을 포함하고 아미노산 세린의 경우 1개의 계열만 연결되지 않고 2개의 연결된 하위 계열로 나뉩니다.


쌀. 5. 일부 코드 시리즈에 대한 연결 그래프. a - 연결된 일련의 발린; b - 연결된 류신 계열; 세린 계열은 관련이 없으며 두 개의 연결된 하위 계열로 나뉩니다. 그림은 V.A.의 기사에서 가져온 것입니다. 라트너 " 유전자 코드시스템처럼."

연결의 속성은 형성 기간 동안 HA가 이미 사용된 것과 최소한으로 다른 새로운 코돈을 포착했다는 사실로 설명할 수 있습니다.

9. 규칙성세쌍둥이의 뿌리에 의한 아미노산의 성질. U 삼중항에 의해 암호화된 모든 아미노산은 비극성이며 극단적인 특성과 크기가 아니며 지방족 라디칼을 가지고 있습니다. 모든 C-루트 삼중항은 강한 염기를 가지며, 이에 의해 암호화되는 아미노산은 상대적으로 작습니다. 루트 A를 가진 모든 삼중항은 약한 염기를 갖고 비-소극성 아미노산을 암호화합니다. G-root 코돈은 아미노산과 시리즈의 극단적이고 비정상적인 변이가 특징입니다. 이들은 가장 작은 아미노산(글리신), 가장 길고 가장 평평한(트립토판), 가장 길고 "가장 서투른"(아르기닌), 가장 반응성이 높은(시스테인) 아미노산을 암호화하고, 세린의 비정상적인 부분 집합을 형성합니다.

10. 막힘.범용 CC는 "블록" 코드입니다. 이것은 유사한 물리화학적 특성을 가진 아미노산이 하나의 염기에 의해 서로 다른 코돈에 의해 암호화된다는 것을 의미합니다. 코드의 블록성은 다음 그림에서 명확하게 볼 수 있습니다.


쌀. 6. 민법의 블록 구조. 흰색은 알킬기가 있는 아미노산을 나타냅니다.


쌀. 7. 책에 기술된 값에 따른 아미노산의 물리화학적 특성의 색상 표현스티어스 "생화학". 왼쪽 - 소수성. 오른쪽은 단백질에서 알파 나선을 형성하는 능력입니다. 빨간색, 노란색 및 파란색 색상은 높은, 중간 및 낮은 소수성을 가진 아미노산(왼쪽) 또는 알파 나선을 형성하는 능력의 해당 정도(오른쪽)를 나타냅니다.

블록성 및 규칙성의 속성은 또한 형성 기간 동안 HA가 이미 사용된 것과 최소한으로 다른 새로운 코돈을 포착했다는 사실로 설명할 수 있습니다.

동일한 첫 번째 염기(코돈 접두사)를 갖는 코돈은 유사한 생합성 경로를 갖는 아미노산을 암호화합니다. shikimate, pyruvate, aspartate 및 glutamate 계열에 속하는 아미노산의 코돈에는 각각 접두사 U, G, A 및 C가 있습니다. 아미노산의 고대 생합성 경로 및 현대 코드의 특성과의 연결에 대해서는 "고대 이중선"을 참조하십시오. 유전자 코드아미노산의 합성에 의해 미리 결정되었습니다 ". 이러한 데이터를 기반으로 일부 연구자들은 코드의 형성이 큰 영향아미노산 사이의 생합성 관계를 나타냅니다. 그러나 생합성 경로의 유사성이 이화학적 특성의 유사성을 의미하는 것은 아닙니다.

11. 노이즈 내성.아주에서 일반보기 GA의 노이즈 내성은 임의의 점 돌연변이 및 번역 오류가 아미노산의 물리화학적 특성을 크게 변경하지 않는다는 것을 의미합니다.

대부분의 경우 삼중항에서 하나의 뉴클레오티드를 교체하면 암호화된 아미노산이 교체되지 않거나 동일한 극성의 아미노산으로 교체됩니다.

GK의 노이즈 내성을 보장하는 메커니즘 중 하나는 축퇴입니다. 평균 축퇴는 - 암호화된 신호의 수/코돈의 총 수이며, 여기서 암호화된 신호는 20개의 아미노산과 번역 종결 기호를 포함합니다. 모든 아미노산 및 종결 기호에 대한 평균 축퇴는 인코딩된 신호당 3개의 코돈입니다.

노이즈 내성을 정량화하기 위해 두 가지 개념을 소개합니다. 코딩된 아미노산의 종류에 변화를 일으키지 않는 뉴클레오티드 치환의 돌연변이를 보수적인.암호화된 아미노산의 클래스를 변경하는 뉴클레오티드 치환 돌연변이를 근본적인 .

각 삼중항은 9개의 단일 치환을 허용합니다. 아미노산을 암호화하는 삼중항은 총 61개이므로 모든 코돈에 대한 가능한 염기 치환 수는 다음과 같습니다.

61 x 9 = 549. 이들 중:

23개의 뉴클레오티드 치환으로 정지 코돈이 생성됩니다.

134개의 치환은 암호화된 아미노산을 변경하지 않습니다.
230개의 치환은 암호화된 아미노산의 클래스를 변경하지 않습니다.
162개의 치환은 아미노산 클래스의 변화로 이어진다. 급진적이다.
3번째 뉴클레오타이드의 183개 치환 중 7개는 번역 종결자가 나타나도록 하고 176개는 보존적입니다.
첫 번째 뉴클레오티드의 183개 치환 중 9개는 터미네이터의 출현으로 이어지고 114개는 보존적이며 60개는 라디칼이 나타납니다.
두 번째 뉴클레오타이드의 183개 치환 중 7개가 터미네이터의 출현을 초래하고, 74개가 보존적이며, 102개가 라디칼입니다.

이러한 계산을 바탕으로 우리는 부량코드의 노이즈 내성(급진적 치환 수에 대한 보존적 치환 수의 비율). 364/162=2.25와 같습니다.

소음 면역에 대한 퇴화의 기여도를 실제로 평가하려면 종에 따라 달라지는 단백질의 아미노산 발생 빈도를 고려해야 합니다.

코드의 노이즈 내성이 있는 이유는 무엇입니까? 대부분의 연구자들은 이 속성이 대체 HA를 선택한 결과라고 생각합니다.

Stephen Freeland와 Lawrence Hurst는 이러한 코드를 무작위로 생성했으며 100개의 대체 코드 중 하나만 범용 GC보다 노이즈 내성이 낮지 않다는 것을 알아냈습니다.
더 나아가 흥미로운 사실이 연구자들이 DNA 돌연변이 패턴 및 번역 오류의 실제 경향을 설명하기 위해 추가 제약을 도입했을 때 발견되었습니다. 이러한 조건에서 백만 개 중 단 하나의 코드만이 표준 코드보다 나은 것으로 판명되었습니다.
이처럼 유전암호의 전례 없는 생명력은 유전암호가 자연 선택. 아마도 언젠가 생물학적 세계각각 고유한 오류 민감도를 가진 많은 코드가 있었습니다. 그들에게 더 잘 대처한 유기체는 생존 가능성이 더 높았고 표준 코드는 단순히 생존 투쟁에서 승리했습니다. 이 가정은 매우 현실적입니다. 결국 우리는 대체 코드가 존재한다는 것을 알고 있습니다. 노이즈 내성에 대한 자세한 내용은 Coded Evolution(S. Freeland, L. Hurst "Code Evolution". // In the world of science. - 2004, No. 7)을 참조하십시오.

결론적으로 나는 20개의 표준 아미노산에 대해 생성할 수 있는 가능한 유전자 코드의 수를 계산할 것을 제안합니다. 웬일인지 이 번호는 나에게 오지 않았다. 따라서 생성된 GC에서 최소한 하나의 CODON에 의해 ​​인코딩된 20개의 아미노산과 정지 신호가 필요합니다.

정신적으로 우리는 코돈에 어떤 순서로 번호를 매길 것입니다. 우리는 다음과 같이 추론할 것입니다. 우리가 정확히 21개의 코돈을 가지고 있다면, 각 아미노산과 정지 신호는 정확히 하나의 코돈을 차지할 것입니다. 이 경우 21개의 가능한 GC가 있습니다!

22개의 코돈이 있으면 21개의 의미 중 하나를 가질 수 있는 추가 코돈이 나타나며 이 코돈은 22개 위치 중 어느 곳에나 위치할 수 있지만 나머지 코돈은 다음과 같이 정확히 하나의 다른 의미 y를 갖습니다. 21코돈. 그런 다음 조합 수 21!x(21x22)를 얻습니다.

23개의 코돈이 있는 경우 유사하게 논증하면 21개의 코돈이 정확히 s의 다른 의미를 갖고(21! 옵션), 2개의 코돈이 21개의 다른 의미를 갖는다는 것을 알게 됩니다(21 2개의 의미는 이들의 FIXED 위치에서 코돈). 이 두 코돈의 다른 위치 수는 23x22입니다. 23개 코돈에 대한 GK 변이체의 총 수 - 21!x21 2x23x22

코돈이 24개라면 GC의 수는 21!x21 3 x24x23x22, ...

....................................................................................................................

64개의 코돈이 있는 경우 가능한 GC의 수는 21!x21 43x64!/21! = 21 43 x64! ~ 9.1x10 145

다른 유기체의 유전 코드에는 몇 가지 공통된 속성이 있습니다.
1) 삼중성. 유전 정보를 포함한 모든 정보를 기록하기 위해 특정 암호가 사용되며 그 요소는 문자 또는 기호입니다. 이러한 기호의 모음이 알파벳을 구성합니다. 개별 메시지는 코드 그룹 또는 코돈이라는 문자 조합으로 작성됩니다. 두 문자로만 구성된 알파벳이 알려져 있습니다. 이것이 모스 부호입니다. DNA에는 4개의 문자가 있습니다. 질소 염기(A, G, T, C) 이름의 첫 글자는 유전 알파벳이 4자로만 구성되어 있음을 의미합니다. 코드 그룹, 또는 한마디로 유전 코드란 무엇입니까? 20개의 기본 아미노산이 알려져 있으며, 그 내용은 유전 코드로 작성되어야 합니다. 즉, 4개의 문자는 20개의 코드 단어를 제공해야 합니다. 단어가 하나의 문자로 구성되어 있다고 가정하면 4개의 코드 그룹만 얻을 수 있습니다. 단어가 두 개의 문자로 구성된 경우 이러한 그룹은 16개뿐이며 이는 분명히 20개의 아미노산을 인코딩하기에 충분하지 않습니다. 따라서 코드 단어에는 3개 이상의 뉴클레오티드가 있어야 하며, 이는 64(43) 조합을 제공합니다. 이 수의 삼중항 조합은 모든 아미노산을 암호화하기에 충분합니다. 따라서 유전자 코드의 코돈은 뉴클레오티드의 삼중항입니다.
2) 퇴화(중복) - 한편으로는 중복 삼중항, 즉 동의어를 포함하고 다른 한편으로는 "무의미한" 삼중항을 포함한다는 사실에서 유전 코드의 속성입니다. 코드에는 64개의 조합이 포함되어 있고 20개의 아미노산만 인코딩되기 때문에 일부 아미노산은 여러 삼중항(아르기닌, 세린, 류신 - 6, 발린, 프롤린, 알라닌, 글리신, 트레오닌 - 4, 이소류신 - 3, 페닐알라닌, 티로신, 히스티딘, 라이신, 아스파라긴, 글루타민, 시스테인, 아스파라긴산 및 글루탐산 - 2개, 메티오닌 및 트립토판 - 1개 삼중항). 일부 코드 그룹(UAA, UAG, UGA)은 의미적 로드를 전혀 전달하지 않습니다. 즉, "의미 없는" 삼중항입니다. "무의미한" 또는 말도 안되는 코돈은 사슬 종결자(유전 텍스트의 구두점)로 작용하여 단백질 사슬 합성의 끝을 알리는 신호 역할을 합니다. 이 코드 중복성은 큰 중요성유전 정보 전달의 신뢰성을 향상시킵니다.
3) 겹치지 않음. 코드 트리플렛은 절대 겹치지 않습니다. 즉, 항상 함께 브로드캐스트됩니다. DNA 분자에서 정보를 읽을 때 한 삼중항의 질소 염기를 다른 삼중항의 염기와 함께 사용하는 것은 불가능합니다.
4) 독창성. 동일한 삼중항이 하나 이상의 산에 해당하는 경우는 없습니다.
5) 유전자 내 분리 문자의 부재. 유전자 코드는 쉼표 없이 특정 위치에서 읽습니다.
6) 다양성. ~에 다양한 종류살아있는 유기체(바이러스, 박테리아, 식물, 균류 및 동물), 동일한 삼중항은 동일한 아미노산을 암호화합니다.
7) 종 특이성. DNA 사슬에 있는 질소 염기의 수와 서열은 유기체마다 다릅니다.

유전자 코드는 단백질의 아미노산에 해당하는 코돈을 형성하는 DNA 또는 RNA의 뉴클레오티드 서열의 특정 교대를 기반으로 핵산 분자의 유전 정보를 기록하는 시스템입니다.

유전자 코드의 속성.

유전자 코드에는 몇 가지 속성이 있습니다.

    삼중성.

    퇴화 또는 중복.

    명확성.

    극성.

    겹치지 않음.

    컴팩트함.

    다재.

일부 작성자는 다음과 관련된 코드의 다른 속성도 제공합니다. 화학적 특징코드에 포함된 뉴클레오타이드 또는 신체 단백질의 개별 아미노산 발생 빈도 등 그러나 이러한 속성은 위에서 따온 것이므로 여기에서 고려할 것입니다.

ㅏ. 삼중성. 복잡하게 조직된 많은 시스템과 마찬가지로 유전자 코드는 가장 작은 구조적 단위와 가장 작은 기능 단위를 가지고 있습니다. 삼중항은 유전자 코드의 가장 작은 구조 단위입니다. 3개의 뉴클레오티드로 구성되어 있습니다. 코돈은 유전자 코드의 가장 작은 기능 단위입니다. 일반적으로 mRNA 삼중항을 코돈이라고 합니다. 유전자 코드에서 코돈은 여러 기능을 수행합니다. 첫째, 주요 기능은 하나의 아미노산을 암호화한다는 것입니다. 둘째, 코돈은 아미노산을 코딩하지 않을 수 있지만 이 경우에는 다른 기능을 합니다(아래 참조). 정의에서 알 수 있듯이 삼중항은 다음을 특징짓는 개념입니다. 초등학교 구조 단위유전자 코드(3개의 뉴클레오타이드). 코돈의 특징 기본 의미 단위게놈 - 3개의 뉴클레오티드가 한 아미노산의 폴리펩티드 사슬에 대한 부착을 결정합니다.

기본 구조 단위를 먼저 이론적으로 해독한 다음 실험적으로 그 존재를 확인했습니다. 실제로, 20개의 아미노산은 하나 또는 두 개의 뉴클레오티드로 암호화될 수 없습니다. 후자는 4개에 불과합니다. 4개의 뉴클레오티드 중 3개는 4 3 = 64개의 변이체를 제공하며, 이는 살아있는 유기체에 존재하는 아미노산의 수보다 많습니다(표 1 참조).

표 64에 제시된 뉴클레오티드의 조합에는 두 가지 특징이 있습니다. 첫째, 삼중항의 64개 변이체 중 61개만이 코돈이고 모든 아미노산을 암호화합니다. 감각 코돈. 세 개의 트리플렛은 인코딩하지 않습니다.

아미노산은 번역의 끝을 표시하는 정지 신호입니다. 이렇게 세쌍둥이가 있다 UAA, UAG, UGA, 그들은 "무의미한"(넌센스 코돈)이라고도합니다. 트리플렛의 한 뉴클레오티드가 다른 뉴클레오티드로 교체되는 것과 관련된 돌연변이의 결과로 의미 없는 코돈이 센스 코돈에서 발생할 수 있습니다. 이러한 유형의 돌연변이를 넌센스 돌연변이. 이러한 정지 신호가 유전자 내부(정보 부분)에서 형성되면 이 곳에서 단백질 합성 과정이 지속적으로 중단됩니다. 단백질의 첫 번째(정지 신호 전) 부분만 합성됩니다. 그러한 병리를 가진 사람은 단백질 결핍을 경험하고 이 결핍과 관련된 증상을 경험할 것입니다. 예를 들어, 이러한 종류의 돌연변이는 헤모글로빈 베타 사슬을 코딩하는 유전자에서 발견되었습니다. 짧은 비활성 헤모글로빈 사슬이 합성되어 빠르게 파괴됩니다. 결과적으로 베타 사슬이 없는 헤모글로빈 분자가 형성됩니다. 그러한 분자가 그 임무를 완전히 수행할 가능성은 없다는 것이 분명합니다. 용혈성 빈혈의 유형에 따라 발병하는 심각한 질병이 있습니다(베타 제로 지중해빈혈, 그리스어 "Talas"-이 질병이 처음 발견된 지중해).

정지코돈의 작용기전은 센스코돈의 작용기전과 다르다. 이것은 아미노산을 코딩하는 모든 코돈에 대해 해당 tRNA가 발견되었다는 사실에서 비롯됩니다. 넌센스 코돈에 대한 tRNA는 발견되지 않았습니다. 따라서 tRNA는 단백질 합성을 멈추는 과정에 관여하지 않습니다.

코돈8월 (때로는 박테리아에서 GUG) 아미노산 메티오닌과 발린을 인코딩할 뿐만 아니라브로드캐스트 개시자 .

비. 퇴화 또는 중복.

64개의 삼중항 중 61개가 20개의 아미노산을 암호화합니다. 아미노산 수에 비해 삼중항 수가 3배 이상 많다는 것은 정보 전달에 두 가지 코딩 옵션을 사용할 수 있음을 시사합니다. 첫째, 64개의 모든 코돈이 20개의 아미노산을 코딩하는 데 관여할 수는 없지만 20개만 코딩할 수 있으며, 둘째, 아미노산은 여러 코돈에 의해 코딩될 수 있습니다. 연구에 따르면 자연은 후자의 옵션을 사용했습니다.

그의 취향은 분명합니다. 64개의 삼중항 변이체 중 20개만 아미노산 코딩에 관여했다면, 44개의 삼중항(64개 중)은 비암호화로 남아 있을 것입니다. 무의미한(넌센스 코돈). 앞서 우리는 돌연변이의 결과로 코딩 삼중항이 넌센스 코돈으로 변형되는 것이 세포의 생명에 얼마나 위험한지 지적했습니다. 정상적인 작업 RNA 중합 효소, 궁극적으로 질병의 발병으로 이어집니다. 현재 우리 게놈에는 3개의 넌센스 코돈이 있으며, 이제 넌센스 코돈의 수가 약 15배 증가하면 어떻게 될지 상상해 보세요. 그러한 상황에서 정상 코돈의 넌센스 코돈으로의 전환은 측량할 수 없을 정도로 높을 것이 분명합니다.

하나의 아미노산이 여러 삼중항에 의해 암호화되는 코드를 축퇴 또는 중복이라고 합니다. 거의 모든 아미노산에는 여러 개의 코돈이 있습니다. 따라서 아미노산 류신은 6개의 삼중항(UUA, UUG, CUU, CUC, CUA, CUG)으로 암호화될 수 있습니다. 발린은 4개의 삼중항으로, 페닐알라닌은 2개로만 암호화됩니다. 트립토판과 메티오닌하나의 코돈으로 인코딩됩니다. 동일한 정보를 다른 문자로 기록하는 것과 관련된 속성을 호출합니다. 퇴화.

하나의 아미노산에 할당된 코돈의 수는 단백질에서 아미노산의 발생 빈도와 잘 관련됩니다.

그리고 이것은 우연이 아닐 가능성이 큽니다. 단백질에서 아미노산의 발생 빈도가 높을수록 이 아미노산의 코돈이 게놈에 더 자주 존재할수록 돌연변이 인자에 의한 손상 가능성이 높아집니다. 따라서 돌연변이된 코돈이 고도로 퇴화되면 동일한 아미노산을 코딩할 가능성이 더 높다는 것이 분명합니다. 이러한 위치에서 유전자 코드의 퇴화는 인간 게놈을 손상으로부터 보호하는 메커니즘입니다.

축퇴라는 용어는 분자 유전학에서도 다른 의미로 사용된다는 점에 유의해야 합니다. 코돈에 있는 정보의 주요 부분은 처음 두 개의 뉴클레오티드에 속하기 때문에 코돈의 세 번째 위치에 있는 염기는 거의 중요하지 않은 것으로 판명되었습니다. 이 현상을 "제3기의 퇴화"라고 합니다. 후자의 기능은 돌연변이의 영향을 최소화합니다. 예를 들어, 적혈구의 주요 기능은 폐에서 조직으로 산소를 운반하고 이산화탄소조직에서 폐까지. 이 기능은 적혈구의 전체 세포질을 채우는 호흡 색소 - 헤모글로빈에 의해 수행됩니다. 그것은 해당 유전자에 의해 인코딩되는 단백질 부분-글로빈으로 구성됩니다. 단백질 외에도 헤모글로빈에는 철을 포함하는 헴이 포함되어 있습니다. 글로빈 유전자의 돌연변이는 다양한 옵션헤모글로빈. 대부분의 경우 돌연변이는 다음과 관련이 있습니다. 한 뉴클레오타이드가 다른 뉴클레오타이드로 치환되고 유전자에 새로운 코돈이 나타나는 현상, 헤모글로빈 폴리펩타이드 사슬에서 새로운 아미노산을 암호화할 수 있습니다. 트리플렛에서는 돌연변이의 결과로 첫 번째, 두 번째 또는 세 번째 뉴클레오타이드가 대체될 수 있습니다. 수백 개의 돌연변이가 글로빈 유전자의 무결성에 영향을 미치는 것으로 알려져 있습니다. 가까운 400 그 중 유전자의 단일 뉴클레오티드의 교체 및 폴리펩티드의 해당 아미노산 치환과 관련이 있습니다. 이 중 오직 100 치환으로 인해 헤모글로빈이 불안정해지고 다양한 종류경증에서 매우 중증에 이르는 질병. 300개(약 64%)의 치환 돌연변이는 헤모글로빈 기능에 영향을 미치지 않으며 병리학을 일으키지 않습니다. 그 이유 중 하나는 세린, 류신, 프롤린, 아르기닌 및 일부 다른 아미노산을 암호화하는 삼중항에서 세 번째 뉴클레오티드의 교체가 동의어 코돈의 출현으로 이어질 때 위에서 언급한 "세 번째 염기의 축퇴"입니다. 동일한 아미노산을 인코딩합니다. 표현형으로 그러한 돌연변이는 나타나지 않을 것입니다. 대조적으로, 100%의 경우에 삼중항에서 첫 번째 또는 두 번째 뉴클레오티드의 교체는 새로운 헤모글로빈 변이체의 출현으로 이어집니다. 그러나 이 경우에도 심각한 표현형 장애가 없을 수 있습니다. 그 이유는 헤모글로빈의 아미노산을 첫 번째 것과 유사한 다른 아미노산으로 대체하기 때문입니다. 물리화학적 성질. 예를 들어, 친수성을 갖는 아미노산이 다른 아미노산으로 대체되지만 동일한 특성을 갖는 경우입니다.

헤모글로빈은 헴의 철 포르피린 그룹(산소 및 이산화탄소 분자가 결합되어 있음)과 단백질 - 글로빈으로 구성됩니다. 성인 헤모글로빈(HbA)에는 두 개의 동일한- 사슬과 두-쇠사슬. 분자- 사슬은 141개의 아미노산 잔기를 포함하고,- 체인 - 146,- 그리고- 사슬은 많은 아미노산 잔기가 다릅니다. 각 글로빈 사슬의 아미노산 서열은 자신의 유전자에 의해 암호화됩니다. 유전자 인코딩- 사슬은 16번 염색체의 짧은 팔에 위치하며,-유전자 - 11번 염색체의 짧은 팔에 있습니다. 유전자 인코딩의 변화- 첫 번째 또는 두 번째 뉴클레오티드의 헤모글로빈 사슬은 거의 항상 단백질에 새로운 아미노산의 출현, 헤모글로빈 기능의 붕괴 및 환자에게 심각한 결과를 초래합니다. 예를 들어, CAU(히스티딘) 삼중항 중 하나에서 "C"를 "U"로 바꾸면 또 다른 아미노산인 티로신을 암호화하는 새로운 UAU 삼중항이 나타납니다. 표현형으로 이것은 심각한 질병에 나타날 것입니다 .. A 위치 63에서 유사한 교체- 히스티딘 폴리펩타이드의 티로신에 대한 사슬은 헤모글로빈을 불안정하게 할 것입니다. 질병 메트헤모글로빈혈증이 발생합니다. 돌연변이의 결과로 글루타민산이 6위에서 발린으로 변경사슬은 겸상 적혈구 빈혈의 심각한 질병의 원인입니다. 슬픈 목록을 계속하지 맙시다. 우리는 처음 두 개의 뉴클레오티드를 교체할 때 아미노산이 물리화학적 특성에서 이전 아미노산과 유사하게 나타날 수 있다는 점에 주목합니다. 따라서 글루탐산(GAA)을 암호화하는 삼중항 중 하나에서 두 번째 뉴클레오티드가"Y"의 사슬은 발린을 암호화하는 새로운 삼중항(GUA)의 출현을 초래하고, 첫 번째 뉴클레오티드를 "A"로 교체하면 아미노산 라이신을 암호화하는 AAA 삼중항을 형성합니다. 글루탐산과 라이신은 물리화학적 성질이 유사합니다. 둘 다 친수성입니다. 발린은 소수성 아미노산입니다. 따라서 친수성 글루탐산을 소수성 발린으로 대체하면 헤모글로빈의 특성이 크게 변화하여 궁극적으로 겸상 적혈구 빈혈이 발생하고 친수성 글루타민산을 친수성 라이신으로 대체하면 헤모글로빈의 기능이 덜 변합니다 - 환자 개발하다 온화한 형태빈혈증. 세 번째 염기를 교체한 결과 새로운 삼중항은 이전 것과 동일한 아미노산을 암호화할 수 있습니다. 예를 들어, 우라실이 CAH 삼중항에서 시토신으로 대체되고 CAC 삼중항이 발생하면 실제로 사람의 표현형 변화가 감지되지 않습니다. 이것은 이해할 수 있습니다. 왜냐하면 두 삼중항은 동일한 아미노산인 히스티딘을 암호화합니다.

결론적으로 유전암호의 퇴화와 일반적인 생물학적 위치로부터의 제3염기의 퇴화는 DNA와 RNA의 독특한 구조에 진화에 통합되는 보호기제라는 점을 강조하는 것이 적절하다.

안에. 명확성.

각 삼중항(무의미한 것을 제외하고)은 단 하나의 아미노산을 암호화합니다. 따라서 코돈 - 아미노산 방향에서 유전 코드는 모호하지 않고 아미노산 - 코돈 방향으로 모호합니다 (퇴화).

분명한

코돈 아미노산

퇴화하다

그리고 이 경우 유전 암호의 명확성이 필요합니다. 또 다른 변형에서는 동일한 코돈을 번역하는 동안 다른 아미노산이 단백질 사슬에 삽입되어 결과적으로 다른 기본 구조와 다른 기능을 가진 단백질이 형성됩니다. 세포의 신진대사는 "하나의 유전자 - 여러 개의 폴리펩타이드" 작동 방식으로 전환됩니다. 그러한 상황에서는 유전자의 조절 기능이 완전히 상실될 것이 분명합니다.

g. 극성

DNA와 mRNA에서 정보를 읽는 것은 한 방향으로만 발생합니다. 극성은 중요성고차 구조(2차, 3차 등)를 정의합니다. 앞에서 우리는 낮은 차수의 구조가 높은 차수의 구조를 결정한다는 사실에 대해 이야기했습니다. 단백질의 3차 구조와 고차 구조는 합성된 RNA 사슬이 DNA 분자에서 멀어지거나 폴리펩타이드 사슬이 리보솜에서 멀어지는 즉시 형성된다. RNA 또는 폴리펩타이드의 자유 말단이 3차 구조를 획득하는 동안, 사슬의 다른 말단은 여전히 ​​DNA(RNA가 전사되는 경우) 또는 리보솜(폴리펩타이드가 전사되는 경우)에서 계속 합성됩니다.

따라서 (RNA와 단백질 합성에서) 정보를 읽는 단방향 과정은 합성 물질의 뉴클레오티드 또는 아미노산 서열을 결정할 뿐만 아니라 2차, 3차 등의 엄격한 결정에 필수적입니다. 구조.

e. 겹치지 않음.

코드는 겹칠 수도 있고 겹칠 수도 있습니다. 대부분의 유기체에서 코드는 겹치지 않습니다. 일부 페이지에서 중복 코드가 발견되었습니다.

비중첩 코드의 본질은 한 코돈의 뉴클레오티드가 동시에 다른 코돈의 뉴클레오티드가 될 수 없다는 것입니다. 코드가 겹치는 경우 7개 뉴클레오티드(GCUGCUG)의 서열은 겹치지 않는 코드의 경우와 같이 두 개의 아미노산(알라닌-알라닌)(그림 33, A)을 인코딩할 수 없지만 세 개(하나의 뉴클레오티드인 경우 공통)(그림 33, B) 또는 5개(두 개의 뉴클레오티드가 공통인 경우)(그림 33, C 참조). 마지막 두 경우에는 뉴클레오티드의 돌연변이가 2, 3 등의 순서를 위반하게 됩니다. 아미노산.

그러나, 하나의 뉴클레오티드의 돌연변이는 항상 폴리펩티드에 하나의 아미노산이 포함되는 것을 방해한다는 것이 발견되었습니다. 이것은 코드가 겹치지 않는다는 사실을 뒷받침하는 중요한 주장입니다.

그림 34에서 이를 설명하겠습니다. 굵은 선은 비중첩 및 중복 코드의 경우 아미노산을 인코딩하는 삼중항을 나타냅니다. 실험은 유전 코드가 겹치지 않는다는 것을 분명히 보여주었습니다. 실험의 세부 사항으로 들어가지 않고 뉴클레오티드 서열의 세 번째 뉴클레오티드를 교체하면 (그림 34 참조)~에 (별표로 표시) 다른 사람에 다음:

1. 겹치지 않는 코드를 사용하면 이 서열에 의해 제어되는 단백질은 하나의 (첫 번째) 아미노산(별표로 표시됨)을 대체합니다.

2. 옵션 A에서 중복되는 코드를 사용하면 두 개(첫 번째 및 두 번째) 아미노산(별표로 표시)에서 교체가 발생합니다. 옵션 B에서 치환은 3개의 아미노산(별표로 표시)에 영향을 미칩니다.

그러나 수많은 실험을 통해 DNA의 뉴클레오티드 하나가 끊어지면 단백질은 항상 하나의 아미노산에만 영향을 미치는 것으로 나타났습니다. 이는 겹치지 않는 코드에 일반적입니다.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCC CUG

*** *** *** *** *** ***

알라닌 - 알라닌 Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

겹치지 않는 코드 겹치지 않는 코드

쌀. 34. 게놈에 겹치지 않는 코드의 존재를 설명하는 계획(텍스트 설명).

유전 코드가 겹치지 않는 것은 다른 속성과 관련이 있습니다. 정보 읽기는 특정 지점에서 시작됩니다-개시 신호. mRNA에서 이러한 개시 신호는 AUG 메티오닌을 암호화하는 코돈이다.

사람은 여전히 ​​​​에서 벗어나는 적은 수의 유전자를 가지고 있다는 점에 유의해야합니다. 일반 규칙그리고 겹칩니다.

e. 컴팩트함.

코돈 사이에는 구두점이 없습니다. 즉, 삼중항은 예를 들어 하나의 무의미한 뉴클레오티드에 의해 서로 분리되지 않습니다. 유전 코드에 "구두점"이 없다는 것은 실험에서 입증되었습니다.

그리고. 다재.

코드는 지구에 사는 모든 유기체에 대해 동일합니다. 유전자 코드의 보편성에 대한 직접적인 증거는 DNA 서열을 상응하는 단백질 서열과 비교함으로써 얻어졌다. 모든 박테리아 및 진핵 생물 게놈에서 동일한 코드 값 세트가 사용되는 것으로 나타났습니다. 예외가 있지만 많지는 않습니다.

유전 암호의 보편성에 대한 첫 번째 예외는 일부 동물 종의 미토콘드리아에서 발견되었습니다. 이것은 아미노산 트립토판을 인코딩하는 UGG 코돈과 동일한 것으로 읽는 종결자 코돈 UGA에 관한 것입니다. 보편성에서 벗어난 다른 드문 일탈도 발견되었습니다.

DNA 코드 시스템.

DNA의 유전 암호는 64개의 뉴클레오티드 세 쌍으로 구성됩니다. 이 삼중항을 코돈이라고 합니다. 각 코돈은 단백질 합성에 사용되는 20개 아미노산 중 하나를 암호화합니다. 이것은 코드에 약간의 중복성을 제공합니다. 대부분의 아미노산은 하나 이상의 코돈에 의해 인코딩됩니다.
하나의 코돈은 두 가지 상호 관련된 기능을 수행합니다. 번역 시작을 알리고 아미노산 메티오닌(Met)이 성장하는 폴리펩타이드 사슬로 통합되는 것을 암호화합니다. DNA 코드 시스템은 유전자 코드가 RNA 코돈 또는 DNA 코돈으로 표현될 수 있도록 설계되었습니다. RNA 코돈은 RNA(mRNA)에서 발생하며 이 코돈은 폴리펩티드 합성(번역이라고 하는 과정) 동안 정보를 읽을 수 있습니다. 그러나 각 mRNA 분자는 해당 유전자로부터 전사 시 뉴클레오티드 서열을 획득합니다.

2개의 아미노산(Met 및 Trp)을 제외한 모든 아미노산은 2~6개의 다른 코돈으로 암호화될 수 있습니다. 그러나 대부분의 유기체의 게놈은 특정 코돈이 다른 코돈보다 선호된다는 것을 보여줍니다. 예를 들어 인간에서 알라닌은 GCG보다 4배 더 자주 GCC에 의해 인코딩됩니다. 이것은 아마도 일부 코돈에 대한 번역 장치(예: 리보솜)의 번역 효율이 더 높다는 것을 나타냅니다.

유전자 코드는 거의 보편적입니다. 동일한 코돈이 동일한 아미노산 스트레치에 할당되고 동일한 시작 및 중지 신호는 동물, 식물 및 미생물에서 압도적으로 동일합니다. 그러나 몇 가지 예외가 발견되었습니다. 이들 중 대부분은 3개의 종결 코돈 중 1개 또는 2개를 아미노산에 할당하는 것을 포함합니다.