O que é o código genético: informações gerais.  A inequívoca do código genético se manifesta no fato de que

O que é o código genético: informações gerais. A inequívoca do código genético se manifesta no fato de que

Gene- uma unidade estrutural e funcional de hereditariedade que controla o desenvolvimento de uma determinada característica ou propriedade. Os pais transmitem um conjunto de genes para seus descendentes durante a reprodução. Uma grande contribuição para o estudo do gene foi feita por cientistas russos: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V. (2011)

Atualmente, em biologia molecular, foi estabelecido que genes são seções de DNA que carregam qualquer informação integral - sobre a estrutura de uma molécula de proteína ou de uma molécula de RNA. Essas e outras moléculas funcionais determinam o desenvolvimento, crescimento e funcionamento do corpo.

Ao mesmo tempo, cada gene é caracterizado por uma série de sequências de DNA reguladoras específicas, como promotores, que estão diretamente envolvidos na regulação da expressão do gene. As sequências reguladoras podem estar localizadas na vizinhança imediata do quadro de leitura aberta que codifica a proteína, ou no início da sequência de RNA, como é o caso dos promotores (os chamados cis elementos reguladores cis), e a uma distância de muitos milhões de pares de bases (nucleotídeos), como no caso de intensificadores, isolantes e supressores (às vezes classificados como trans-elementos regulatórios elementos transregulatórios). Assim, o conceito de gene não se limita à região codificadora do DNA, mas é um conceito mais amplo que inclui sequências regulatórias.

Originalmente o termo gene apareceu como uma unidade teórica de transmissão discreta informações hereditárias. A história da biologia lembra disputas sobre quais moléculas podem ser portadoras de informações hereditárias. A maioria dos pesquisadores acreditava que apenas as proteínas podem ser tais carreadores, já que sua estrutura (20 aminoácidos) permite criar mais opções do que a estrutura do DNA, que é composto por apenas quatro tipos de nucleotídeos. Mais tarde, provou-se experimentalmente que é o DNA que inclui informações hereditárias, expressas como dogma central biologia molecular.

Os genes podem sofrer mutações - mudanças aleatórias ou propositais na sequência de nucleotídeos na cadeia de DNA. As mutações podem levar a uma mudança na sequência e, portanto, uma mudança nas características biológicas de uma proteína ou RNA, que, por sua vez, pode resultar em um funcionamento alterado ou anormal geral ou local do organismo. Tais mutações em alguns casos são patogênicas, já que seu resultado é uma doença, ou letais em nível embrionário. No entanto, nem todas as alterações na sequência nucleotídica levam a uma alteração na estrutura da proteína (devido ao efeito da degenerescência do código genético) ou a uma alteração significativa na sequência e não são patogénicas. Em particular, o genoma humano é caracterizado por polimorfismos de nucleotídeo único e variações no número de cópias. variações de número de cópias), como deleções e duplicações, que compõem cerca de 1% de toda a sequência nucleotídica humana. Os polimorfismos de nucleotídeo único, em particular, definem diferentes alelos do mesmo gene.

Os monômeros que compõem cada fita de DNA são complexos compostos orgânicos, incluindo bases nitrogenadas: adenina (A) ou timina (T) ou citosina (C) ou guanina (G), um açúcar-pentose-desoxirribose de cinco átomos, após o qual o próprio DNA foi nomeado, bem como um resíduo de ácido fosfórico. Esses compostos são chamados de nucleotídeos.

Propriedades do gene

  1. discrição - imiscibilidade de genes;
  2. estabilidade - a capacidade de manter uma estrutura;
  3. labilidade - a capacidade de mutar repetidamente;
  4. alelismo múltiplo - muitos genes existem em uma população em uma variedade de formas moleculares;
  5. alelismo - no genótipo de organismos diplóides, apenas duas formas do gene;
  6. especificidade - cada gene codifica sua própria característica;
  7. pleiotropia - efeito múltiplo de um gene;
  8. expressividade - o grau de expressão de um gene em uma característica;
  9. penetrância - a frequência de manifestação de um gene no fenótipo;
  10. amplificação - um aumento no número de cópias de um gene.

Classificação

  1. Os genes estruturais são componentes únicos do genoma, representando uma única sequência que codifica uma proteína específica ou alguns tipos de RNA. (Veja também o artigo genes doméstico).
  2. Genes funcionais - regulam o trabalho dos genes estruturais.

Código genético- um método inerente a todos os organismos vivos para codificar a sequência de aminoácidos de proteínas usando uma sequência de nucleotídeos.

Quatro nucleotídeos são usados ​​no DNA - adenina (A), guanina (G), citosina (C), timina (T), que na literatura de língua russa são denotados pelas letras A, G, C e T. Essas letras compõem o alfabeto do código genético. No RNA, os mesmos nucleotídeos são usados, com exceção da timina, que é substituída por um nucleotídeo semelhante - uracil, indicado pela letra U (U na literatura em russo). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

Existem 20 aminoácidos diferentes usados ​​na natureza para construir proteínas. Cada proteína é uma cadeia ou várias cadeias de aminoácidos em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, toda a sua propriedades biológicas. O conjunto de aminoácidos também é universal para quase todos os organismos vivos.

A implementação da informação genética em células vivas (ou seja, a síntese de uma proteína codificada por um gene) é realizada por meio de dois processos matriciais: transcrição (ou seja, a síntese de mRNA em um molde de DNA) e tradução do código genético em uma sequência de aminoácidos (síntese de uma cadeia polipeptídica no mRNA). Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, assim como o sinal de parada, que significa o fim da sequência da proteína. Um conjunto de três nucleotídeos é chamado de tripleto. As abreviaturas aceitas correspondentes a aminoácidos e códons são mostradas na figura.

Propriedades

  1. Triplicidade- uma unidade significativa do código é uma combinação de três nucleotídeos (tripleto ou códon).
  2. Continuidade- não há sinais de pontuação entre os trigêmeos, ou seja, a informação é lida continuamente.
  3. não sobreposto- o mesmo nucleotídeo não pode fazer parte simultaneamente de dois ou mais trigêmeos (não observado para alguns genes sobrepostos de vírus, mitocôndrias e bactérias que codificam várias proteínas frameshift).
  4. Sem ambiguidade (especificidade)- um certo códon corresponde a apenas um aminoácido (no entanto, o códon UGA em Euplotes crasso códigos para dois aminoácidos - cisteína e selenocisteína)
  5. Degeneração (redundância) Vários códons podem corresponder ao mesmo aminoácido.
  6. Versatilidade- o código genético funciona da mesma maneira nos organismos Niveis diferentes complexidade - de vírus a humanos (os métodos de engenharia genética são baseados nisso; há várias exceções, mostradas na tabela na seção "Variações do código genético padrão" abaixo).
  7. Imunidade a ruídos- mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas conservador; As mutações de substituição de nucleotídeos que levam a uma mudança na classe do aminoácido codificado são chamadas radical.

Biossíntese de proteínas e suas etapas

Biossíntese de proteínas- um processo complexo de vários estágios de síntese de uma cadeia polipeptídica a partir de resíduos de aminoácidos, ocorrendo nos ribossomos de células de organismos vivos com a participação de moléculas de mRNA e tRNA.

A biossíntese de proteínas pode ser dividida em etapas de transcrição, processamento e tradução. Durante a transcrição, a informação genética codificada em moléculas de DNA é lida e esta informação é escrita em moléculas de mRNA. Durante uma série de estágios sucessivos de processamento, alguns fragmentos desnecessários em estágios subsequentes são removidos do mRNA e as sequências de nucleotídeos são editadas. Depois que o código é transportado do núcleo para os ribossomos, a síntese real de moléculas de proteína ocorre pela ligação de resíduos de aminoácidos individuais à cadeia polipeptídica em crescimento.

Entre a transcrição e a tradução, a molécula de mRNA sofre uma série de mudanças sucessivas que garantem a maturação de um molde funcional para a síntese da cadeia polipeptídica. Uma tampa é anexada à extremidade 5' e uma cauda poli-A é anexada à extremidade 3', o que aumenta a vida útil do mRNA. Com o advento do processamento em uma célula eucariótica, tornou-se possível combinar éxons gênicos para obter uma maior variedade de proteínas codificadas por uma única sequência de nucleotídeos de DNA - splicing alternativo.

A tradução consiste na síntese de uma cadeia polipeptídica de acordo com a informação codificada no RNA mensageiro. A sequência de aminoácidos é organizada usando transporte RNA (tRNA), que formam complexos com aminoácidos - aminoacil-tRNA. Cada aminoácido tem seu próprio tRNA, que possui um anticódon correspondente que “corresponde” ao códon do mRNA. Durante a tradução, o ribossomo se move ao longo do mRNA, à medida que a cadeia polipeptídica se acumula. A energia para a síntese de proteínas é fornecida pelo ATP.

A molécula de proteína finalizada é então clivada do ribossomo e transportada para o lugar certo na célula. Algumas proteínas requerem modificação pós-traducional adicional para atingir seu estado ativo.

0

Código genéticoé uma forma de codificar a sequência de aminoácidos de proteínas usando a sequência de nucleotídeos na molécula de DNA, característica de todos os organismos vivos.

A implementação da informação genética em células vivas (ou seja, a síntese de uma proteína codificada no DNA) é realizada por meio de dois processos matriciais: transcrição (ou seja, síntese de mRNA em uma matriz de DNA) e tradução (síntese de uma cadeia polipeptídica em uma matriz de DNA). uma matriz de mRNA).

O DNA usa quatro nucleotídeos - adenina (A), guanina (G), citosina (C), timina (T). Essas "letras" compõem o alfabeto do código genético. O RNA usa os mesmos nucleotídeos, exceto a timina, que é substituída por uracila (U). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de “letras”.

Na sequência de nucleotídeos do DNA existem "palavras" de código para cada aminoácido da futura molécula de proteína - o código genético. Consiste em uma certa sequência de nucleotídeos na molécula de DNA.

Três nucleotídeos consecutivos codificam o "nome" de um aminoácido, ou seja, cada um dos 20 aminoácidos é criptografado por uma unidade de código significativa - uma combinação de três nucleotídeos chamada tripleto ou códon.

Atualmente, o código do DNA foi completamente decifrado, e podemos falar sobre certas propriedades características desse sistema biológico único, que fornece a tradução da informação da "linguagem" do DNA para a "linguagem" da proteína.

O portador da informação genética é o DNA, mas como o mRNA, uma cópia de uma das fitas de DNA, está diretamente envolvido na síntese de proteínas, o código genético é mais frequentemente escrito na "linguagem do RNA".

Aminoácido Codificando trigêmeos de RNA
Alanina GCU GCC GCA GCG
Arginina TsGU TsGTs TsGA TsGG AGA AGG
Asparagina AAU AAC
Ácido aspártico GAU GAC
Valina GUA GUA GUA GUA
Histidina CAU CAC
Glicina GSU GGC GGA GYY
Glutamina CAA CAG
Ácido glutâmico GAA GAG
Isoleucina AAU AUC AUA
Leucina TSU TSUT TSUA TSUG UUA UUG
Lisina AAA AAG
Metionina AGO
Prolina CCC CCC CCA CCG
Sereno UCU UCC UCA UCG ASU AGC
Tirosina UAU UAC
Treonina ACC ACC ACA ACG
triptofano UGG
Fenilalanina uuu uuc
Cisteína UGU UHC
PARE UGA UAG UAA

Propriedades do código genético

Três nucleotídeos consecutivos (bases nitrogenadas) codificam o "nome" de um aminoácido, ou seja, cada um dos 20 aminoácidos é criptografado por uma unidade de código significativa - uma combinação de três nucleotídeos chamada trio ou códon.

Trigêmeo (códon)- uma sequência de três nucleotídeos (bases nitrogenadas) em uma molécula de DNA ou RNA, que determina a inclusão de um determinado aminoácido na molécula de proteína durante sua síntese.

  • Sem ambiguidade (discrição)

Um tripleto não pode codificar dois aminoácidos diferentes; ele codifica apenas um aminoácido. Um certo códon corresponde a apenas um aminoácido.

Cada aminoácido pode ser definido por mais de um tripleto. Exceção - metionina e triptofano. Em outras palavras, vários códons podem corresponder ao mesmo aminoácido.

  • não sobreposto

A mesma base não pode estar presente em dois códons adjacentes ao mesmo tempo.

Alguns trigêmeos não codificam aminoácidos, mas são uma espécie de "sinais de trânsito" que determinam o início e o fim de genes individuais (UAA, UAG, UGA), cada um dos quais significa a cessação da síntese e está localizado no final de cada gene, para que possamos falar sobre a polaridade do código genético.

Em animais e plantas, em fungos, bactérias e vírus, a mesma trinca codifica o mesmo tipo de aminoácido, ou seja, o código genético é o mesmo para todos os seres vivos. Em outras palavras, universalidade é a capacidade do código genético funcionar da mesma forma em organismos de diferentes níveis de complexidade, de vírus a humanos. A universalidade do código do DNA confirma a unidade da origem de toda a vida em nosso planeta. Os métodos de engenharia genética baseiam-se no uso da propriedade de universalidade do código genético.

Da história da descoberta do código genético

Pela primeira vez a ideia de existência Código genético formulado por A. Down e G. Gamow em 1952-1954. Os cientistas mostraram que uma sequência de nucleotídeos que determina exclusivamente a síntese de um determinado aminoácido deve conter pelo menos três ligações. Mais tarde provou-se que tal sequência consiste em três nucleotídeos, chamados códon ou trio.

As questões de quais nucleotídeos são responsáveis ​​por incorporar um determinado aminoácido em uma molécula de proteína e quantos nucleotídeos determinam essa inclusão permaneceram sem solução até 1961. A análise teórica mostrou que o código não pode consistir em um nucleotídeo, pois neste caso apenas 4 aminoácidos podem ser codificados. No entanto, o código também não pode ser um dupleto, ou seja, uma combinação de dois nucleotídeos de um "alfabeto" de quatro letras não pode abranger todos os aminoácidos, pois apenas 16 dessas combinações são teoricamente possíveis (4 2 = 16).

Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, além de um sinal de “parada”, que significa o fim da sequência da proteína, quando o número de combinações possíveis é 64 (4 3 = 64).

A série de artigos que descrevem as origens do Código Civil pode ser considerada como uma investigação de eventos sobre os quais temos pouquíssimos vestígios. No entanto, entender esses artigos requer um pouco de esforço para entender os mecanismos moleculares da síntese de proteínas. Este artigo é o artigo introdutório de uma série de auto-publicações dedicadas à origem do código genético, e é o melhor lugar para começar a conhecer este tema.
Usualmente Código genético(GC) é definido como um método (regra) de codificação de uma proteína na estrutura primária de DNA ou RNA. Na literatura, é mais frequentemente escrito que esta é uma correspondência um-para-um de uma sequência de três nucleotídeos em um gene para um aminoácido na proteína sintetizada ou o ponto final da síntese proteica. No entanto, há dois erros nesta definição. Isso implica em 20 chamados aminoácidos canônicos, que fazem parte das proteínas de todos os organismos vivos, sem exceção. Esses aminoácidos são monômeros de proteínas. Os erros são os seguintes:

1) Os aminoácidos canônicos não são 20, mas apenas 19. Podemos chamar de aminoácido uma substância que contém simultaneamente um grupo amino -NH 2 e um grupo carboxila - COOH. O fato é que o monômero proteico - prolina - não é um aminoácido, pois contém um grupo imino em vez de um grupo amino, por isso é mais correto chamar a prolina de iminoácido. No entanto, no futuro, em todos os artigos sobre HA, por conveniência, escreverei cerca de 20 aminoácidos, implicando na nuance indicada. As estruturas de aminoácidos são mostradas na fig. 1.

Arroz. 1. Estruturas de aminoácidos canônicos. Os aminoácidos têm partes constantes, marcadas em preto na figura, e variáveis ​​(ou radicais), marcadas em vermelho.

2) A correspondência de aminoácidos com códons nem sempre é inequívoca. Veja abaixo a violação de casos de exclusividade.

A ocorrência de HA significa a ocorrência de síntese de proteínas codificadas. Este evento é um dos principais para a formação evolutiva dos primeiros organismos vivos.

A estrutura do HA é apresentada de forma circular na fig. 2.



Arroz. 2. Código genético em forma circular. O círculo interno é a primeira letra do códon, a segunda um círculo - a segunda letra do códon, o terceiro círculo - a terceira letra do códon, o quarto círculo - designações de aminoácidos em uma abreviação de três letras; P - aminoácidos polares, NP - aminoácidos não polares. Para maior clareza de simetria, a ordem escolhida dos símbolos é importante U-C-A-G.

Então, vamos prosseguir para a descrição das principais propriedades do HA.

1. Triplicidade. Cada aminoácido é codificado por uma sequência de três nucleotídeos.

2. A presença de sinais de pontuação intergenéticos. As marcas de pontuação intergênicas incluem sequências de ácido nucleico nas quais a tradução começa ou termina.

Tradução Eu não posso começar com nenhum códon, mas apenas com um códon estritamente definido - iniciando. O códon de início é o tripleto AUG, que inicia a tradução. Nesse caso, esse tripleto codifica a metionina ou outro aminoácido, a formilmetionina (em procariontes), que só pode ser ativado no início da síntese proteica. No final de cada gene que codifica um polipeptídeo está pelo menos um dos 3 códons de terminação, ou luzes de freio: UAA, UAG, UGA. Eles terminam a tradução (a chamada síntese de proteínas no ribossomo).

3. Compacidade ou ausência de sinais de pontuação intragênicos. Dentro de um gene, cada nucleotídeo é parte de um códon significativo.

4. Não sobreposto. Os códons não se sobrepõem uns aos outros, cada um tem seu próprio conjunto ordenado de nucleotídeos, que não se sobrepõe a conjuntos semelhantes de códons vizinhos.

5. Degeneração. A correspondência inversa na direção aminoácido-códon é ambígua. Essa propriedade é chamada de degeneração. Seriesé um conjunto de códons que codificam um aminoácido, ou seja, é um grupo códons equivalentes. Pense em um códon como XYZ. Se XY define “significado” (ou seja, aminoácido), então o códon é chamado Forte. Se um certo Z é necessário para determinar o significado de um códon, então tal códon é chamado fraco.

A degenerescência do código está intimamente relacionada com a ambiguidade do emparelhamento códon-anticódon (um anticódon significa uma sequência de três nucleotídeos em um tRNA que pode complementarmente emparelhar com um códon no RNA mensageiro (veja dois artigos sobre isso com mais detalhes: Mecanismos moleculares para garantir a degeneração do código e Regra de Lagerquist. Substanciação físico-química de simetrias e relações de Rumer). Um anticódon por tRNA pode reconhecer de um a três códons por mRNA.

6.Sem ambiguidade. Cada tripleto codifica apenas um aminoácido ou é um terminador de tradução.

Existem três exceções conhecidas.

Primeiro. Em procariontes na primeira posição ( letra maiúscula) codifica formilmetionina, e em qualquer outro - metionina. No início do gene, a formilmetionina é codificada tanto pelo códon de metionina AUG usual, quanto também pelo códon de valina GUG ou leucina UUG, que dentro do gene codificam valina e leucina, respectivamente.

Em muitas proteínas, a formilmetionina é clivada ou o grupo formil é removido, resultando na conversão da formilmetionina em metionina comum.

Segundo. Em 1986, vários grupos de pesquisadores descobriram imediatamente que, no mRNA, o códon de terminação UGA pode codificar a selenocisteína (veja a Fig. 3), desde que seja seguido por uma sequência especial de nucleotídeos.

Arroz. 3. A estrutura do 21º aminoácido - selenocisteína.

No E. coli(este é o nome latino para Escherichia coli) selenocisteil-tRNA durante a tradução e reconhece o códon UGA no mRNA, mas apenas em um determinado contexto e: para o reconhecimento do códon UGA como significativo, a sequência de 45 nucleotídeos de comprimento, localizada após o códon UGA, é importante.

O exemplo considerado mostra que, se necessário, um organismo vivo pode alterar o significado do código genético padrão. Nesse caso, a informação genética contida nos genes é codificada de forma mais complexa. O significado de um códon é determinado no contexto de e com uma certa longa sequência de nucleotídeos e com a participação de vários fatores proteicos altamente específicos. É importante que o tRNA de selenocisteína tenha sido encontrado em representantes de todos os três ramos da vida (arqueias, eubactérias e eucariotos), o que indica a antiguidade da origem da síntese de selenocisteína e, possivelmente, sua presença no último universal ancestral comum(Isso será discutido em outros artigos). Muito provavelmente, a selenocisteína é encontrada em todos os organismos vivos, sem exceção. Mas em cada organismo individual, a selenocisteína é encontrada em não mais do que algumas dezenas de proteínas. Faz parte dos sítios ativos das enzimas, em vários homólogos dos quais a cisteína comum pode funcionar em uma posição semelhante.

Até recentemente, acreditava-se que o códon UGA poderia ser lido como selenocisteína ou como terminal, mas recentemente foi demonstrado que em ciliados Euplotes O códon UGA codifica para cisteína ou selenocisteína. Cm. " Código genético permite inconsistências"

Terceira exceção. Em alguns procariontes (5 espécies de archaea e uma eubactéria - as informações na Wikipedia estão muito desatualizadas) existe um ácido especial - pirrolisina (Fig. 4). Ele é codificado pelo tripleto UAG, que no código canônico serve como um terminador de tradução. Supõe-se que neste caso, como no caso da codificação da selenocisteína, a leitura de UAG como um códon de pirrolisina ocorre devido a uma estrutura especial no mRNA. O tRNA de pirrolisina contém o anticódon CTA e é aminoacilado por APCases classe 2 (para a classificação de APCases, consulte o artigo "Codases ajudam a entender como Código genético ").

O UAG raramente é usado como um códon de parada e, se for, geralmente é seguido por outro códon de parada.

Arroz. 4. Estrutura do 22º aminoácido da pirrolisina.

7. Versatilidade. Após a decodificação do Código Civil ter sido concluída em meados dos anos 60 do século passado, por muito tempo acreditava-se que o código é o mesmo em todos os organismos, o que indica a unidade da origem de toda a vida na Terra.

Vamos tentar entender por que o GC é universal. O fato é que, se pelo menos uma regra de codificação fosse alterada no corpo, isso levaria ao fato de que a estrutura de uma parte significativa das proteínas mudou. Tal mudança seria muito dramática e, portanto, quase sempre letal, uma vez que uma mudança no significado de apenas um códon pode afetar, em média, 1/64 de todas as sequências de aminoácidos.

Um pensamento muito importante decorre disso - o HA quase não mudou desde sua formação, há mais de 3,5 bilhões de anos. E, portanto, sua estrutura carrega um traço de sua ocorrência, e a análise dessa estrutura pode ajudar a entender como exatamente o CG poderia surgir.

Na realidade, o AH pode diferir ligeiramente em bactérias, mitocôndrias, código nuclear de alguns ciliados e leveduras. Agora existem pelo menos 17 códigos genéticos que diferem do canônico por 1-5 códons. variantes conhecidas desvios do GC universal, 18 substituições diferentes para o significado de um códon são usadas. A maioria dos desvios do código padrão são conhecidos nas mitocôndrias - 10. Vale ressaltar que as mitocôndrias de vertebrados, platelmintos, equinodermos são codificadas por códigos diferentes, e fungos de mofo, protozoários e celenterados - por um.

A proximidade evolutiva das espécies não é de forma alguma uma garantia de que elas tenham GCs semelhantes. Os códigos genéticos podem diferir mesmo entre tipos diferentes micoplasmas (algumas espécies têm um código canônico, enquanto outras são diferentes). Uma situação semelhante é observada para a levedura.

É importante notar que as mitocôndrias são descendentes de organismos simbióticos que se adaptaram a viver dentro das células. Eles têm um genoma altamente reduzido, alguns dos genes se mudaram para o núcleo da célula. Portanto, as mudanças no AH neles não são mais tão dramáticas.

As exceções descobertas posteriormente são de particular interesse do ponto de vista evolutivo, pois podem ajudar a esclarecer os mecanismos da evolução do código.

Tabela 1.

Códigos mitocondriais em vários organismos.

códon

Código universal

Códigos mitocondriais

Vertebrados

Invertebrados

Fermento

Plantas

UGA

PARE

trp

trp

trp

PARE

AUA

ile

Conheceu

Conheceu

Conheceu

ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

PARE

Ser

Arg

Arg

AGG

Arg

PARE

Ser

Arg

Arg

Três mecanismos para alterar o aminoácido codificado pelo código.

A primeira é quando algum códon não é utilizado (ou quase não é utilizado) por algum organismo devido à ocorrência desigual de alguns nucleotídeos (composição GC), ou combinações de nucleotídeos. Como resultado, esse códon pode desaparecer completamente do uso (por exemplo, devido à perda do tRNA correspondente) e, no futuro, pode ser usado para codificar outro aminoácido sem causar danos significativos ao corpo. Este mecanismo é provavelmente responsável pelo aparecimento de alguns dialetos de códigos nas mitocôndrias.

A segunda é a transformação do códon de parada no significado do novo. Neste caso, algumas das proteínas traduzidas podem ter adições. No entanto, a situação é parcialmente salva pelo fato de que muitos genes geralmente terminam com não um, mas dois códons de terminação, uma vez que erros de tradução são possíveis, nos quais os códons de parada são lidos como aminoácidos.

A terceira é a possível leitura ambígua de certos códons, como ocorre em alguns fungos.

8 . Conectividade. Grupos de códons equivalentes (ou seja, códons que codificam o mesmo aminoácido) são chamados Series. O GC contém 21 séries, incluindo códons de parada. No que se segue, por definição, qualquer grupo de códons será chamado ligação, se de cada códon deste grupo é possível passar para todos os outros códons do mesmo grupo por sucessivas substituições de nucleotídeos. Das 21 séries, são conectadas 18. 2 séries contêm um códon cada, e apenas 1 série para o aminoácido serina é desconectada e se divide em 2 subséries conectadas.


Arroz. 5. Gráficos de conectividade para algumas séries de códigos. a - série conectada de valina; b - série conectada de leucina; a série de serina não está relacionada, dividindo-se em duas subséries conectadas. A figura foi retirada de um artigo de V.A. Ratner" Código genético como um sistema."

A propriedade de conectividade pode ser explicada pelo fato de que durante o período de formação, o HA capturou novos códons que diferiram minimamente dos já utilizados.

9. Regularidade propriedades dos aminoácidos pelas raízes dos trigêmeos. Todos os aminoácidos codificados por tripletos U são apolares, não possuem propriedades e tamanhos extremos e possuem radicais alifáticos. Todos os trigêmeos de raiz C têm bases fortes e os aminoácidos codificados por eles são relativamente pequenos. Todos os tripletos com raiz A têm bases fracas e codificam aminoácidos polares não pequenos. Os códons da raiz G são caracterizados por variantes extremas e anormais de aminoácidos e séries. Eles codificam o menor aminoácido (glicina), o mais longo e achatado (triptofano), o mais longo e "mais desajeitado" (arginina), o mais reativo (cisteína) e formam um subconjunto anormal para a serina.

10. Bloqueio. O CC universal é um código de "bloco". Isso significa que aminoácidos com propriedades físico-químicas semelhantes são codificados por códons que diferem entre si por uma base. O bloqueio do código é claramente visível na figura a seguir.


Arroz. 6. Estrutura de blocos do Código Civil. A cor branca indica aminoácidos com um grupo alquila.


Arroz. 7. Representação de cores das propriedades físico-químicas dos aminoácidos com base nos valores descritos no livroStyers "Bioquímica". Esquerda - hidrofobicidade. À direita, a capacidade de formar uma hélice alfa em uma proteína. As cores vermelha, amarela e azul indicam aminoácidos com hidrofobicidade alta, média e baixa (esquerda) ou o grau correspondente de capacidade de formar uma hélice alfa (direita).

A propriedade de blockiness e regularidade também pode ser explicada pelo fato de que durante o período de formação, o HA capturou novos códons que diferiram minimamente dos já utilizados.

Códons com a mesma primeira base (prefixo de códon) codificam aminoácidos com vias biossintéticas semelhantes. Os códons de aminoácidos pertencentes às famílias chiquimato, piruvato, aspartato e glutamato têm prefixos U, G, A e C, respectivamente. Para os caminhos da antiga biossíntese de aminoácidos e sua conexão com as propriedades do código moderno, consulte "Ancient doublet Código genético foi predeterminado pela síntese de aminoácidos". Com base nesses dados, alguns pesquisadores concluem que a formação do código grande influência uma relação biossintética entre aminoácidos. No entanto, a semelhança das vias biossintéticas não significa de forma alguma a semelhança das propriedades físico-químicas.

11. Imunidade a ruídos. No muito visão geral A imunidade ao ruído do AG significa que mutações pontuais aleatórias e erros de tradução não alteram muito as propriedades físico-químicas dos aminoácidos.

A substituição de um nucleotídeo em um tripleto na maioria dos casos não leva à substituição do aminoácido codificado ou leva a uma substituição por um aminoácido com a mesma polaridade.

Um dos mecanismos que garantem a imunidade ao ruído do GK é a sua degenerescência. A degenerescência média é - número de sinais codificados/número total de codões, em que os sinais codificados incluem 20 aminoácidos e o sinal de terminação da tradução. A degenerescência média para todos os aminoácidos e o sinal de terminação é de três códons por sinal codificado.

Para quantificar a imunidade ao ruído, introduzimos dois conceitos. Mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas de conservador. Mutações de substituição de nucleotídeos que alteram a classe do aminoácido codificado são chamadas radical .

Cada tripleto permite 9 substituições simples. Existem 61 tripletos codificando aminoácidos no total. Portanto, o número de substituições de nucleotídeos possíveis para todos os códons é

61 x 9 = 549. Destes:

23 substituições de nucleotídeos resultam em códons de parada.

134 substituições não alteram o aminoácido codificado.
230 substituições não alteram a classe do aminoácido codificado.
162 substituições levam a uma mudança na classe de aminoácidos, ou seja, são radicais.
Das 183 substituições do 3º nucleotídeo, 7 levam ao aparecimento de terminadores de tradução e 176 são conservadoras.
Das 183 substituições do 1º nucleotídeo, 9 levam ao aparecimento de terminadores, 114 são conservadoras e 60 são radicais.
Das 183 substituições do 2º nucleotídeo, 7 levam ao aparecimento de terminadores, 74 são conservadoras e 102 são radicais.

Com base nesses cálculos, obtemos quantificação imunidade ao ruído do código, como a razão entre o número de substituições conservativas e o número de substituições radicais. É igual a 364/162 = 2,25

Em uma avaliação real da contribuição da degenerescência para a imunidade ao ruído, é necessário levar em conta a frequência de ocorrência de aminoácidos nas proteínas, que varia nas diferentes espécies.

Qual é o motivo da imunidade ao ruído do código? A maioria dos pesquisadores acredita que essa propriedade seja consequência da seleção de AHs alternativos.

Stephen Freeland e Lawrence Hurst geraram esses códigos aleatórios e descobriram que apenas um dos cem códigos alternativos não tem menos imunidade a ruídos do que o GC universal.
Ainda mais fato interessante foi descoberto quando esses pesquisadores introduziram uma restrição adicional para explicar as tendências reais nos padrões de mutação do DNA e erros de tradução. Sob tais condições, APENAS UM CÓDIGO DE UM MILHÃO POSSÍVEL acabou sendo melhor que o código canônico.
Essa vitalidade sem precedentes do código genético pode ser mais facilmente explicada pelo fato de que ele foi formado como resultado de seleção natural. Talvez em algum momento mundo biológico havia muitos códigos, cada um com sua própria sensibilidade ao erro. O organismo que lidava melhor com eles tinha mais chances de sobreviver, e o código canônico simplesmente venceu a luta pela existência. Essa suposição parece bastante realista - afinal, sabemos que existem códigos alternativos. Para mais informações sobre imunidade a ruídos, veja Coded Evolution (S. Freeland, L. Hurst "Code Evolution". / / In the world of science. - 2004, No. 7).

Em conclusão, proponho contar o número de códigos genéticos possíveis que podem ser gerados para 20 aminoácidos canônicos. Por alguma razão, esse número nunca chegou até mim. Portanto, precisamos ter 20 aminoácidos e um sinal de parada codificado por PELO MENOS UM CÓDÃO nos GCs gerados.

Mentalmente, numeraremos os códons em alguma ordem. Raciocinaremos da seguinte forma. Se tivermos exatamente 21 códons, cada aminoácido e sinal de parada ocuparão exatamente um códon. Neste caso, haverá 21 GCs possíveis!

Se houver 22 códons, aparece um códon extra, que pode ter um dos 21 significados, e esse códon pode estar localizado em qualquer um dos 22 lugares, enquanto os códons restantes têm exatamente um significado diferente y, como no caso de 21 códons. Então obtemos o número de combinações 21!x(21x22).

Se houver 23 códons, então, argumentando de forma semelhante, obtemos que 21 códons têm exatamente um significado diferente de s (21! opções), e dois códons têm 21 significados diferentes de a (21 2 significados de s em uma posição FIXA desses códons). O número de posições diferentes para esses dois códons será 23x22. Número total de variantes GK para 23 códons - 21!x21 2x23x22

Se houver 24 códons, então o número de GCs será 21!x21 3 x24x23x22, ...

....................................................................................................................

Se houver 64 códons, então o número de GCs possíveis será 21!x21 43x64!/21! = 21 43x64! ~ 9,1x10 145

O código genético de diferentes organismos tem algumas propriedades comuns:
1) Triplicidade. Para registrar qualquer informação, incluindo informações hereditárias, é usada uma determinada cifra, cujo elemento é uma letra ou símbolo. A coleção de tais símbolos compõe o alfabeto. As mensagens individuais são escritas como uma combinação de caracteres chamados grupos de códigos ou códons. Um alfabeto composto por apenas dois caracteres é conhecido - este é o código Morse. Existem 4 letras no DNA - as primeiras letras dos nomes das bases nitrogenadas (A, G, T, C), o que significa que o alfabeto genético consiste em apenas 4 caracteres. O que é um grupo de código, ou, em uma palavra, um código genético? São conhecidos 20 aminoácidos básicos, cujo conteúdo deve ser escrito no código genético, ou seja, 4 letras devem dar 20 palavras de código. Digamos que a palavra consiste em um caractere, então obteremos apenas 4 grupos de códigos. Se a palavra consistir em dois caracteres, haverá apenas 16 desses grupos, e isso claramente não é suficiente para codificar 20 aminoácidos. Portanto, deve haver pelo menos 3 nucleotídeos na palavra-código, o que dará 64 (43) combinações. Este número de combinações de tripletos é suficiente para codificar todos os aminoácidos. Assim, o códon do código genético é um tripleto de nucleotídeos.
2) Degeneração (redundância) - propriedade do código genético que consiste, por um lado, no fato de conter trigêmeos redundantes, ou seja, sinônimos e, por outro lado, trigêmeos “sem sentido”. Uma vez que o código inclui 64 combinações, e apenas 20 aminoácidos são codificados, alguns aminoácidos são codificados por vários trigêmeos (arginina, serina, leucina - seis; valina, prolina, alanina, glicina, treonina - quatro; isoleucina - três; fenilalanina, tirosina, histidina, lisina, asparagina, glutamina, cisteína, ácidos aspártico e glutâmico - dois; metionina e triptofano - um tripleto). Alguns grupos de código (UAA, UAG, UGA) não carregam nenhuma carga semântica, ou seja, são trigêmeos "sem sentido". "Sem sentido", ou sem sentido, os códons atuam como terminadores de cadeia - sinais de pontuação no texto genético - servem como um sinal para o fim da síntese da cadeia proteica. Esta redundância de código tem grande importância para melhorar a confiabilidade da transmissão da informação genética.
3) Não sobreposição. Os tripletos de código nunca se sobrepõem, ou seja, eles são sempre transmitidos juntos. Ao ler a informação de uma molécula de DNA, é impossível usar a base nitrogenada de uma trinca em combinação com as bases de outra trinca.
4) Singularidade. Não há casos em que o mesmo tripleto corresponderia a mais de um ácido.
5) A ausência de caracteres de separação dentro do gene. O código genético é lido de um determinado lugar sem vírgulas.
6) Versatilidade. No vários tipos organismos vivos (vírus, bactérias, plantas, fungos e animais), os mesmos trigêmeos codificam os mesmos aminoácidos.
7) Especificidade da espécie. O número e a sequência de bases nitrogenadas na cadeia de DNA variam de organismo para organismo.

O código genético é um sistema de registro de informações hereditárias em moléculas de ácidos nucléicos, baseado em uma certa alternância de sequências de nucleotídeos no DNA ou RNA que formam códons correspondentes aos aminoácidos de uma proteína.

Propriedades do código genético.

O código genético tem várias propriedades.

    Triplicidade.

    Degeneração ou redundância.

    Sem ambiguidade.

    Polaridade.

    Não sobreposto.

    Compacidade.

    Versatilidade.

Deve-se notar que alguns autores também oferecem outras propriedades do código relacionadas a características químicas nucleotídeos incluídos no código ou com a frequência de ocorrência de aminoácidos individuais nas proteínas do corpo, etc. No entanto, essas propriedades seguem do acima, então vamos considerá-las lá.

uma. Triplicidade. O código genético, como muitos sistemas organizados de forma complexa, tem a menor unidade estrutural e a menor unidade funcional. Um trio é a menor unidade estrutural do código genético. É composto por três nucleotídeos. Um códon é a menor unidade funcional do código genético. Como regra, trigêmeos de mRNA são chamados de códons. No código genético, um códon desempenha várias funções. Primeiro, sua principal função é codificar um aminoácido. Segundo, um códon pode não codificar um aminoácido, mas neste caso tem uma função diferente (veja abaixo). Como pode ser visto a partir da definição, um trio é um conceito que caracteriza elementar unidade estrutural código genético (três nucleotídeos). códon caracteriza unidade semântica elementar genoma - três nucleotídeos determinam a ligação à cadeia polipeptídica de um aminoácido.

A unidade estrutural elementar foi primeiro decifrada teoricamente, e então sua existência foi confirmada experimentalmente. De fato, 20 aminoácidos não podem ser codificados por um ou dois nucleotídeos. os últimos são apenas 4. Três dos quatro nucleotídeos dão 4 3 = 64 variantes, o que mais do que cobre o número de aminoácidos presentes nos organismos vivos (ver Tabela 1).

As combinações de nucleotídeos apresentadas na Tabela 64 têm duas características. Primeiro, das 64 variantes de trigêmeos, apenas 61 são códons e codificam qualquer aminoácido, são chamados códons de sentido. Três trigêmeos não codificam

aminoácidos a são sinais de parada que marcam o fim da tradução. Existem três trigêmeos UAA, UAG, UGA, eles também são chamados de "sem sentido" (códons sem sentido). Como resultado de uma mutação, que está associada à substituição de um nucleotídeo em um tripleto por outro, um códon sem sentido pode surgir de um códon de sentido. Esse tipo de mutação é chamado mutação sem sentido. Se esse sinal de parada for formado dentro do gene (em sua parte informativa), durante a síntese de proteínas neste local, o processo será constantemente interrompido - apenas a primeira parte (antes do sinal de parada) da proteína será sintetizada. Uma pessoa com tal patologia experimentará falta de proteína e apresentará sintomas associados a essa falta. Por exemplo, esse tipo de mutação foi encontrado no gene que codifica a cadeia beta da hemoglobina. Uma cadeia de hemoglobina inativa encurtada é sintetizada, que é rapidamente destruída. Como resultado, uma molécula de hemoglobina desprovida de uma cadeia beta é formada. É claro que é improvável que tal molécula cumpra plenamente suas funções. Existe uma doença grave que se desenvolve de acordo com o tipo de anemia hemolítica (talassemia beta-zero, da palavra grega "Talas" - o Mar Mediterrâneo, onde esta doença foi descoberta).

O mecanismo de ação dos códons de terminação é diferente do mecanismo de ação dos códons de sentido. Isso decorre do fato de que para todos os códons que codificam aminoácidos, os tRNAs correspondentes foram encontrados. Nenhum tRNA foi encontrado para códons sem sentido. Portanto, o tRNA não participa do processo de interrupção da síntese de proteínas.

códonAGO (às vezes GUG em bactérias) não apenas codifica o aminoácido metionina e valina, mas também éiniciador de transmissão .

b. Degeneração ou redundância.

61 dos 64 tripletos codificam 20 aminoácidos. Esse excesso de três vezes o número de trigêmeos sobre o número de aminoácidos sugere que duas opções de codificação podem ser usadas na transferência de informações. Em primeiro lugar, nem todos os 64 códons podem estar envolvidos na codificação de 20 aminoácidos, mas apenas 20 e, em segundo lugar, os aminoácidos podem ser codificados por vários códons. Estudos mostraram que a natureza usou a última opção.

Sua preferência é clara. Se apenas 20 das 64 variantes de tripleto estivessem envolvidas na codificação de aminoácidos, então 44 tripletos (de 64) permaneceriam não codificantes, ou seja, sem sentido (códons sem sentido). Anteriormente, apontamos o quão perigoso para a vida de uma célula é a transformação de um tripleto de codificação como resultado de uma mutação em um códon sem sentido - isso viola significativamente trabalho normal RNA polimerase, levando ao desenvolvimento de doenças. Existem atualmente três códons sem sentido em nosso genoma, e agora imagine o que aconteceria se o número de códons sem sentido aumentasse cerca de 15 vezes. É claro que em tal situação a transição de códons normais para códons sem sentido será imensamente maior.

Um código no qual um aminoácido é codificado por vários trigêmeos é chamado de degenerado ou redundante. Quase todo aminoácido tem vários códons. Assim, o aminoácido leucina pode ser codificado por seis trigêmeos - UUA, UUG, CUU, CUC, CUA, CUG. A valina é codificada por quatro trigêmeos, a fenilalanina por dois e apenas triptofano e metionina codificado por um códon. A propriedade que está associada à gravação da mesma informação com diferentes caracteres é chamada degeneração.

O número de códons atribuídos a um aminoácido correlaciona-se bem com a frequência de ocorrência do aminoácido nas proteínas.

E isso provavelmente não é acidental. Quanto maior a frequência de ocorrência de um aminoácido em uma proteína, mais frequentemente o códon desse aminoácido está presente no genoma, maior a probabilidade de seu dano por fatores mutagênicos. Portanto, é claro que um códon mutado tem maior probabilidade de codificar o mesmo aminoácido se for altamente degenerado. A partir dessas posições, a degeneração do código genético é um mecanismo que protege o genoma humano de danos.

Deve-se notar que o termo degenerescência é usado em genética molecular em outro sentido também. Como a parte principal da informação no códon recai sobre os dois primeiros nucleotídeos, a base na terceira posição do códon acaba sendo de pouca importância. Esse fenômeno é chamado de “degeneração da terceira base”. O último recurso minimiza o efeito de mutações. Por exemplo, sabe-se que a principal função dos glóbulos vermelhos é transportar oxigênio dos pulmões para os tecidos e dióxido de carbono dos tecidos aos pulmões. Esta função é realizada pelo pigmento respiratório - hemoglobina, que preenche todo o citoplasma do eritrócito. Consiste em uma parte da proteína - globina, que é codificada pelo gene correspondente. Além da proteína, a hemoglobina contém heme, que contém ferro. Mutações nos genes da globina resultam em várias opções hemoglobinas. Na maioria das vezes, as mutações estão associadas a substituição de um nucleotídeo por outro e o aparecimento de um novo códon no gene, que pode codificar um novo aminoácido na cadeia polipeptídica da hemoglobina. Em um tripleto, como resultado de uma mutação, qualquer nucleotídeo pode ser substituído - o primeiro, o segundo ou o terceiro. Várias centenas de mutações são conhecidas por afetar a integridade dos genes da globina. Aproximar 400 dos quais estão associados à substituição de nucleótidos únicos no gene e à correspondente substituição de aminoácidos no polipéptido. Destes, apenas 100 substituições levam à instabilidade da hemoglobina e vários tipos doenças que variam de leves a muito graves. 300 (aproximadamente 64%) mutações de substituição não afetam a função da hemoglobina e não levam a patologia. Uma das razões para isso é a “degeneração da terceira base” mencionada acima, quando a substituição do terceiro nucleotídeo no tripleto que codifica serina, leucina, prolina, arginina e alguns outros aminoácidos leva ao aparecimento de um códon sinônimo codificando o mesmo aminoácido. Fenotipicamente, tal mutação não se manifestará. Em contraste, qualquer substituição do primeiro ou segundo nucleotídeo em um trigêmeo em 100% dos casos leva ao aparecimento de uma nova variante de hemoglobina. Mas mesmo neste caso, pode não haver distúrbios fenotípicos graves. A razão para isso é a substituição de um aminoácido na hemoglobina por outro semelhante ao primeiro. propriedades físicas e químicas. Por exemplo, se um aminoácido com propriedades hidrofílicas for substituído por outro aminoácido, mas com as mesmas propriedades.

A hemoglobina consiste em um grupo de ferro porfirina de heme (moléculas de oxigênio e dióxido de carbono estão ligadas a ele) e uma proteína - globina. A hemoglobina adulta (HbA) contém duas- correntes e dois-correntes. Molécula-cadeia contém 141 resíduos de aminoácidos,- corrente - 146,- eAs cadeias diferem em muitos resíduos de aminoácidos. A sequência de aminoácidos de cada cadeia de globina é codificada por seu próprio gene. O gene que codifica- a cadeia está localizada no braço curto do cromossomo 16,-gene - no braço curto do cromossomo 11. Mudança na codificação do gene- a cadeia de hemoglobina do primeiro ou segundo nucleotídeo quase sempre leva ao aparecimento de novos aminoácidos na proteína, interrupção das funções da hemoglobina e sérias consequências para o paciente. Por exemplo, substituir "C" em um dos trigêmeos CAU (histidina) por "U" levará ao aparecimento de um novo trio UAU que codifica outro aminoácido - tirosina. Fenotipicamente, isso se manifestará em uma doença grave .. A substituição semelhante na posição 63A cadeia do polipeptídeo histidina em tirosina desestabilizará a hemoglobina. A doença metemoglobinemia desenvolve-se. Mudança, como resultado de mutação, de ácido glutâmico para valina na 6ª posiçãocadeia é a causa de uma doença grave - anemia falciforme. Não vamos continuar a lista triste. Observamos apenas que ao substituir os dois primeiros nucleotídeos, um aminoácido pode apresentar propriedades físico-químicas semelhantes ao anterior. Assim, a substituição do 2º nucleotídeo em um dos trigêmeos que codificam o ácido glutâmico (GAA) em-cadeia em "Y" leva ao aparecimento de um novo tripleto (GUA) que codifica a valina, e a substituição do primeiro nucleotídeo por "A" forma um tripleto AAA que codifica o aminoácido lisina. O ácido glutâmico e a lisina são semelhantes em propriedades físico-químicas - ambos são hidrofílicos. A valina é um aminoácido hidrofóbico. Portanto, a substituição do ácido glutâmico hidrofílico por valina hidrofóbica altera significativamente as propriedades da hemoglobina, o que acaba levando ao desenvolvimento da anemia falciforme, enquanto a substituição do ácido glutâmico hidrofílico por lisina hidrofílica altera em menor grau a função da hemoglobina - pacientes desenvolve forma leve anemia. Como resultado da substituição da terceira base, o novo tripleto pode codificar os mesmos aminoácidos que o anterior. Por exemplo, se a uracila foi substituída por citosina no trigêmeo CAH e um trigêmeo CAC surgiu, então praticamente não serão detectadas alterações fenotípicas em uma pessoa. Isso é compreensível, porque Ambos os trigêmeos codificam o mesmo aminoácido, a histidina.

Em conclusão, é oportuno enfatizar que a degenerescência do código genético e a degenerescência da terceira base de uma posição biológica geral são mecanismos protetores que são incorporados na evolução na estrutura única do DNA e do RNA.

dentro. Sem ambiguidade.

Cada trio (exceto os sem sentido) codifica apenas um aminoácido. Assim, na direção do códon - aminoácido, o código genético é inequívoco, na direção do aminoácido - códon - é ambíguo (degenerado).

inequívoco

códon aminoácido

degenerar

E neste caso, a necessidade de não ambiguidade no código genético é óbvia. Em outra variante, durante a tradução de um mesmo códon, diferentes aminoácidos seriam inseridos na cadeia protéica e, como resultado, seriam formadas proteínas com diferentes estruturas primárias e diferentes funções. O metabolismo da célula mudaria para o modo de operação "um gene - vários polipeptídeos". É claro que em tal situação a função reguladora dos genes seria completamente perdida.

g. Polaridade

A leitura de informações do DNA e do mRNA ocorre apenas em uma direção. A polaridade tem importância para definir estruturas de ordem superior (secundária, terciária, etc.). Anteriormente falamos sobre o fato de que estruturas de ordem inferior determinam estruturas de ordem superior. A estrutura terciária e as estruturas de ordem superior nas proteínas são formadas imediatamente assim que a cadeia de RNA sintetizada se afasta da molécula de DNA ou a cadeia polipeptídica se afasta do ribossomo. Enquanto a extremidade livre do RNA ou polipeptídeo adquire uma estrutura terciária, a outra extremidade da cadeia ainda continua a ser sintetizada no DNA (se o RNA for transcrito) ou ribossomo (se o polipeptídeo for transcrito).

Portanto, o processo unidirecional de leitura de informações (na síntese de RNA e proteína) é essencial não apenas para determinar a sequência de nucleotídeos ou aminoácidos na substância sintetizada, mas para a determinação rígida de secundários, terciários, etc. estruturas.

e. Não sobreposição.

O código pode ou não se sobrepor. Na maioria dos organismos, o código não se sobrepõe. Um código sobreposto foi encontrado em alguns fagos.

A essência de um código não sobreposto é que o nucleotídeo de um códon não pode ser o nucleotídeo de outro códon ao mesmo tempo. Se o código estivesse sobreposto, então a sequência de sete nucleotídeos (GCUGCUG) poderia codificar não dois aminoácidos (alanina-alanina) (Fig. 33, A) como no caso de um código não sobreposto, mas três (se um nucleotídeo é comum) (Fig. 33, B) ou cinco (se dois nucleotídeos são comuns) (veja Fig. 33, C). Nos dois últimos casos, uma mutação de qualquer nucleotídeo levaria a uma violação na sequência de dois, três, etc. aminoácidos.

No entanto, descobriu-se que uma mutação de um nucleotídeo sempre interrompe a inclusão de um aminoácido em um polipeptídeo. Este é um argumento significativo a favor do fato de que o código não é sobreposto.

Vamos explicar isso na Figura 34. As linhas em negrito mostram trigêmeos que codificam aminoácidos no caso de código não sobreposto e sobreposto. Experimentos mostraram inequivocamente que o código genético não se sobrepõe. Sem entrar nos detalhes do experimento, notamos que, se substituirmos o terceiro nucleotídeo na sequência de nucleotídeos (veja a Fig. 34)No (marcado com um asterisco) para algum outro então:

1. Com um código não sobreposto, a proteína controlada por esta sequência teria um substituto para um (primeiro) aminoácido (marcado com asteriscos).

2. Com um código sobreposto na opção A, ocorreria uma substituição em dois (primeiro e segundo) aminoácidos (marcados com asteriscos). Na opção B, a substituição afetaria três aminoácidos (marcados com asteriscos).

No entanto, vários experimentos mostraram que quando um nucleotídeo no DNA é quebrado, a proteína sempre afeta apenas um aminoácido, o que é típico para um código não sobreposto.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCU CUG

*** *** *** *** *** ***

Alanina - Alanina Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

código não sobreposto código sobreposto

Arroz. 34. Esquema explicando a presença de um código não sobreposto no genoma (explicação no texto).

A não sobreposição do código genético está associada a outra propriedade - a leitura da informação começa a partir de um determinado ponto - o sinal de iniciação. Tal sinal de iniciação no mRNA é o códon que codifica a metionina AUG.

Deve-se notar que uma pessoa ainda tem um pequeno número de genes que se desviam regra geral e sobreposição.

e. Compacidade.

Não há sinais de pontuação entre os códons. Em outras palavras, os tripletos não são separados uns dos outros, por exemplo, por um nucleotídeo sem sentido. A ausência de "pontuações" no código genético foi comprovada em experimentos.

e. Versatilidade.

O código é o mesmo para todos os organismos que vivem na Terra. A prova direta da universalidade do código genético foi obtida comparando sequências de DNA com sequências de proteínas correspondentes. Descobriu-se que os mesmos conjuntos de valores de código são usados ​​em todos os genomas bacterianos e eucarióticos. Há exceções, mas não muitas.

As primeiras exceções à universalidade do código genético foram encontradas nas mitocôndrias de algumas espécies animais. Isso dizia respeito ao códon terminador UGA, que lê o mesmo que o códon UGG que codifica o aminoácido triptofano. Outros desvios mais raros da universalidade também foram encontrados.

Sistema de código de DNA.

O código genético do DNA consiste em 64 tripletos de nucleotídeos. Esses trigêmeos são chamados de códons. Cada códon codifica um dos 20 aminoácidos usados ​​na síntese de proteínas. Isso dá alguma redundância no código: a maioria dos aminoácidos é codificada por mais de um códon.
Um códon desempenha duas funções inter-relacionadas: sinaliza o início da tradução e codifica a incorporação do aminoácido metionina (Met) na cadeia polipeptídica em crescimento. O sistema de código de DNA é projetado para que o código genético possa ser expresso como códons de RNA ou como códons de DNA. Os códons de RNA ocorrem no RNA (mRNA) e esses códons são capazes de ler informações durante a síntese de polipeptídeos (um processo chamado tradução). Mas cada molécula de mRNA adquire uma sequência de nucleotídeos na transcrição do gene correspondente.

Todos, exceto dois aminoácidos (Met e Trp) podem ser codificados por 2 a 6 códons diferentes. No entanto, o genoma da maioria dos organismos mostra que certos códons são favorecidos em relação a outros. Em humanos, por exemplo, a alanina é codificada pelo GCC quatro vezes mais frequentemente do que no GCG. Isso provavelmente indica uma maior eficiência de tradução do aparelho de tradução (por exemplo, o ribossomo) para alguns códons.

O código genético é quase universal. Os mesmos códons são atribuídos ao mesmo trecho de aminoácidos e os mesmos sinais de início e término são predominantemente os mesmos em animais, plantas e microorganismos. No entanto, algumas exceções foram encontradas. A maioria deles envolve a atribuição de um ou dois dos três códons de parada a um aminoácido.