O que é o código genético: informações gerais. Código genético como forma de registrar informações hereditárias

CÓDIGO GENÉTICO, sistema de registro informação hereditária na forma de uma sequência de bases nucleotídicas em moléculas de DNA (em alguns vírus - RNA), que determina a estrutura primária (arranjo de resíduos de aminoácidos) em moléculas de proteínas (polipeptídeos). Problema Código genético foi formulado após provar o papel genético do DNA (microbiologistas americanos O. Avery, K. McLeod, M. McCarthy, 1944) e decifrar sua estrutura (J. Watson, F. Crick, 1953), após estabelecer que os genes determinam a estrutura e funções das enzimas (o princípio de "um gene - uma enzima" por J. Beadle e E. Tatem, 1941) e que existe uma dependência da estrutura espacial e atividade da proteína em sua estrutura primária (F. Senger, 1955 ). A questão de como combinações de 4 bases de ácidos nucleicos determinam a alternância de 20 resíduos de aminoácidos comuns em polipeptídeos foi levantada pela primeira vez por G. Gamow em 1954.

A partir de um experimento no qual foram estudadas as interações de inserções e deleções de um par de nucleotídeos, em um dos genes do bacteriófago T4, F. Crick e outros cientistas em 1961 determinaram propriedades gerais código genético: tripleto, ou seja, cada resíduo de aminoácido na cadeia polipeptídica corresponde a um conjunto de três bases (tripleto ou códon) no DNA do gene; a leitura dos códons dentro de um gene parte de um ponto fixo, em uma direção e "sem vírgulas", ou seja, os códons não são separados por nenhum sinal uns dos outros; degeneração, ou redundância, - o mesmo resíduo de aminoácido pode codificar vários códons (códons sinônimos). Os autores sugeriram que os códons não se sobrepõem (cada base pertence a apenas um códon). O estudo direto da capacidade de codificação de trigêmeos foi continuado usando um sistema de síntese de proteínas livre de células sob o controle de RNA mensageiro sintético (mRNA). Em 1965, o código genético foi completamente decifrado nas obras de S. Ochoa, M. Nirenberg e H. G. Korana. Desvendar o mistério do código genético foi uma das realizações notáveis ​​da biologia no século XX.

A implementação do código genético na célula ocorre no curso de dois processos de matriz - transcrição e tradução. O mediador entre um gene e uma proteína é o mRNA, que é formado durante a transcrição em uma das fitas de DNA. Nesse caso, a sequência de bases do DNA, que carrega informações sobre a estrutura primária da proteína, é "reescrita" na forma de uma sequência de bases do mRNA. Então, durante a tradução nos ribossomos, a sequência de nucleotídeos do mRNA é lida pelo RNA de transferência (tRNA). Estes últimos possuem uma extremidade aceitadora, à qual está ligado um resíduo de aminoácido, e uma extremidade adaptadora, ou anticódon tripleto, que reconhece o códon do mRNA correspondente. A interação de códon e anti-códon ocorre com base no pareamento de bases complementares: Adenina (A) - Uracila (U), Guanina (G) - Citosina (C); neste caso, a sequência de bases do mRNA é traduzida na sequência de aminoácidos da proteína sintetizada. Vários organismos use sinônimos de códons diferentes para o mesmo aminoácido com frequências diferentes. A leitura do mRNA que codifica a cadeia polipeptídica começa (inicia) a partir do códon AUG correspondente ao aminoácido metionina. Menos comumente em procariotos, os códons de iniciação são GUG (valina), UUG (leucina), AUU (isoleucina), em eucariotos - UUG (leucina), AUA (isoleucina), ACG (treonina), CUG (leucina). Isso define o chamado quadro, ou fase, de leitura durante a tradução, ou seja, toda a sequência de nucleotídeos do mRNA é lida triplo por trio de tRNA até que qualquer um dos três códons terminadores, geralmente chamados de códons de parada, seja encontrado no ARNm: UAA, UAG , UGA (tabela). A leitura desses tripletos leva à conclusão da síntese da cadeia polipeptídica.

Os códons AUG e stop estão localizados no início e no final das regiões de mRNA que codificam polipeptídeos, respectivamente.

O código genético é quase universal. Isso significa que existem pequenas variações no significado de alguns códons em diferentes objetos, e isso diz respeito, em primeiro lugar, aos códons terminadores, que podem ser significativos; por exemplo, nas mitocôndrias de alguns eucariontes e em micoplasmas, o UGA codifica o triptofano. Além disso, em alguns mRNAs de bactérias e eucariotos, o UGA codifica um aminoácido incomum, a selenocisteína, e o UAG, em uma das arqueobactérias, codifica a pirrolisina.

Existe um ponto de vista segundo o qual o código genético surgiu por acaso (a hipótese do “caso congelado”). É mais provável que ele tenha evoluído. Essa suposição é corroborada pela existência de uma versão mais simples e, aparentemente, mais antiga do código, que é lida nas mitocôndrias de acordo com a regra “dois de três”, quando apenas duas das três bases do trigêmeo determinam o amino ácido.

Lit.: Crick F. N. a. cerca de. Natureza geral do código genético das proteínas // Natureza. 1961 vol. 192; O código genético. N.Y., 1966; Ichas M. Código biológico. M., 1971; Inge-Vechtomov S. G. Como o código genético é lido: regras e exceções // ciência natural moderna. M., 2000. T. 8; Ratner V. A. Código genético como um sistema // Soros Educational Journal. 2000. V. 6. No. 3.

S. G. Inge-Vechtomov.

Aula 5 Código genético

Definição de conceito

O código genético é um sistema de registro de informações sobre a sequência de aminoácidos em proteínas usando a sequência de nucleotídeos no DNA.

Como o DNA não está diretamente envolvido na síntese de proteínas, o código é escrito na linguagem do RNA. O RNA contém uracilo em vez de timina.

Propriedades do código genético

1. Tripletidade

Cada aminoácido é codificado por uma sequência de 3 nucleotídeos.

Definição: Um tripleto ou códon é uma sequência de três nucleotídeos que codifica um aminoácido.

O código não pode ser monopleto, pois 4 (o número de nucleotídeos diferentes no DNA) é menor que 20. O código não pode ser duplo, porque 16 (o número de combinações e permutações de 4 nucleotídeos por 2) é menor que 20. O código pode ser tripleto, porque 64 (o número de combinações e permutações de 4 a 3) é maior que 20.

2. Degeneração.

Todos os aminoácidos, com exceção da metionina e do triptofano, são codificados por mais de um trio:

2 AKs para 1 trigêmeo = 2.

9 AKs x 2 trigêmeos = 18.

1 AK 3 trigêmeos = 3.

5 AKs x 4 trigêmeos = 20.

3 AKs x 6 trigêmeos = 18.

Um total de 61 códigos tripletos para 20 aminoácidos.

3. A presença de sinais de pontuação intergênicos.

Definição:

Gene é um segmento de DNA que codifica uma cadeia polipeptídica ou uma molécula tPHK, rRNA ousPHK.

genestPHK, rPHK, sPHKas proteínas não codificam.

No final de cada gene que codifica um polipeptídeo, há pelo menos um dos 3 trigêmeos que codificam códons de parada de RNA ou sinais de parada. No mRNA, eles se parecem com isso: UAA, UAG, UGA . Eles encerram (finalizam) a transmissão.

Convencionalmente, o códon também se aplica a sinais de pontuação AGO - o primeiro após a sequência do líder. (Ver aula 8) Desempenha a função de uma letra maiúscula. Nesta posição, codifica formilmetionina (em procariontes).

4. Singularidade.

Cada tripleto codifica apenas um aminoácido ou é um terminador de tradução.

A exceção é o códon AGO . Em procariotos na primeira posição ( letra maiúscula) codifica formilmetionina e, em qualquer outro, codifica metionina.

5. Compacidade ou ausência de sinais de pontuação intragênicos.
Dentro de um gene, cada nucleotídeo faz parte de um códon significativo.

Em 1961, Seymour Benzer e Francis Crick provaram experimentalmente que o código é trigêmeo e compacto.

A essência do experimento: mutação "+" - a inserção de um nucleotídeo. Mutação "-" - perda de um nucleotídeo. Uma única mutação "+" ou "-" no início de um gene corrompe todo o gene. Uma mutação dupla "+" ou "-" também estraga todo o gene.

Uma mutação tripla "+" ou "-" no início do gene estraga apenas parte dele. Uma mutação quádrupla "+" ou "-" novamente estraga todo o gene.

O experimento prova que o código é trigêmeo e não há sinais de pontuação dentro do gene. O experimento foi realizado em dois genes de fagos adjacentes e mostrou, além disso, a presença de sinais de pontuação entre os genes.

6. Versatilidade.

O código genético é o mesmo para todas as criaturas que vivem na Terra.

Em 1979 Burrell abriu ideal código mitocondrial humano.

Definição:

“Ideal” é o código genético no qual a regra de degeneração do código quase-duplo é cumprida: se os dois primeiros nucleotídeos em dois trigêmeos coincidem e os terceiros nucleotídeos pertencem à mesma classe (ambos são purinas ou ambos são pirimidinas) , então esses trigêmeos codificam o mesmo aminoácido .

Há duas exceções a essa regra no código genérico. Ambos os desvios do código ideal no universal dizem respeito aos pontos fundamentais: o início e o fim da síntese de proteínas:

códon

Universal

o código

códigos mitocondriais

vertebrados

Invertebrados

Fermento

plantas

PARE

PARE

Com UA

A G A

PARE

PARE

230 substituições não alteram a classe do aminoácido codificado. à rasgabilidade.

Em 1956, Georgy Gamov propôs uma variante do código sobreposto. De acordo com o código Gamow, cada nucleotídeo, a partir do terceiro no gene, faz parte de 3 códons. Quando o código genético foi decifrado, descobriu-se que não era sobreposto, ou seja, cada nucleotídeo faz parte de apenas um códon.

Vantagens do código genético sobreposto: compacidade, menor dependência da estrutura da proteína da inserção ou deleção de um nucleotídeo.

Desvantagem: alta dependência da estrutura da proteína na substituição de nucleotídeos e restrição nos vizinhos.

Em 1976, o DNA do fago φX174 foi sequenciado. Possui um DNA circular de fita simples de 5375 nucleotídeos. O fago era conhecido por codificar 9 proteínas. Para 6 deles, genes localizados um após o outro foram identificados.

Descobriu-se que há uma sobreposição. O gene E está completamente dentro do gene D . Seu códon de iniciação aparece como resultado de um deslocamento de um nucleotídeo na leitura. Gene J começa onde o gene termina D . Códon de iniciação do gene J se sobrepõe ao códon de terminação do gene D devido a um deslocamento de dois nucleotídeos. O design é chamado de "mudança de quadro de leitura" por um número de nucleotídeos que não é um múltiplo de três. Até o momento, a sobreposição só foi mostrada para alguns fagos.

Capacidade de informação do DNA

Existem 6 bilhões de pessoas na Terra. Informações hereditárias sobre eles
encerrado em 6x10 9 espermatozoides. De acordo com várias estimativas, uma pessoa tem de 30 a 50
mil genes. Todos os humanos têm ~30x10 13 genes, ou 30x10 16 pares de bases, que compõem 10 17 códons. A página média do livro contém 25x10 2 caracteres. O DNA de 6x10 9 espermatozóides contém informações iguais em volume a aproximadamente

4x10 13 páginas do livro. Essas páginas ocupariam o espaço de 6 prédios da NSU. 6x10 9 espermatozóides ocupam metade de um dedal. Seu DNA ocupa menos de um quarto de dedal.

Sob o código genético, costuma-se entender tal sistema de sinais que denota o arranjo sequencial de compostos de nucleotídeos no DNA e no RNA, que corresponde a outro sistema de sinais que exibe a sequência de compostos de aminoácidos em uma molécula de proteína.

É importante!

Quando os cientistas conseguiram estudar as propriedades do código genético, a universalidade foi reconhecida como uma das principais. Sim, por mais estranho que pareça, tudo está unido por um código genético comum, universal. Foi formado durante um longo período de tempo e o processo terminou há cerca de 3,5 bilhões de anos. Portanto, na estrutura do código podem ser traçados traços de sua evolução, desde o momento de sua criação até hoje.

Quando se fala em sequência de elementos no código genético, significa que está longe de ser caótico, mas tem uma ordem estritamente definida. E isso também determina em grande parte as propriedades do código genético. Isso é equivalente ao arranjo de letras e sílabas em palavras. Vale a pena quebrar a ordem usual, e a maior parte do que leremos nas páginas de livros ou jornais se transformará em bobagens ridículas.

Propriedades básicas do código genético

Normalmente, o código carrega algumas informações criptografadas de uma maneira especial. Para decifrar o código, você precisa saber características distintas.

Assim, as principais propriedades do código genético são:

  • trigêmeo;
  • degeneração ou redundância;
  • singularidade;
  • continuidade;
  • a versatilidade já mencionada acima.

Vamos dar uma olhada em cada propriedade.

1. Tripletidade

É quando três compostos de nucleotídeos formam uma cadeia sequencial dentro de uma molécula (ou seja, DNA ou RNA). Como resultado, um composto tripleto é criado ou codifica um dos aminoácidos, sua localização na cadeia peptídica.

Os códons (são palavras-código!) se distinguem por sua sequência de conexão e pelo tipo daqueles compostos nitrogenados (nucleotídeos) que os compõem.

Em genética, costuma-se distinguir 64 tipos de códons. Eles podem formar combinações de quatro tipos 3 nucleotídeos cada. Isso equivale a elevar o número 4 à terceira potência. Assim, é possível a formação de 64 combinações de nucleotídeos.

2. Redundância do código genético

Essa propriedade é observada quando vários códons são necessários para criptografar um aminoácido, geralmente entre 2-6. E apenas o triptofano pode ser codificado com um único trigêmeo.

3. Singularidade

Está incluído nas propriedades do código genético como um indicador de herança genética saudável. Por exemplo, o trigêmeo GAA em sexto lugar na cadeia pode informar os médicos sobre um bom estado do sangue, sobre a hemoglobina normal. É ele quem carrega a informação sobre a hemoglobina, e ela também é codificada por ele, e se a pessoa está anêmica, um dos nucleotídeos é substituído por outra letra do código - U, que é um sinal da doença.

4. Continuidade

Ao escrever essa propriedade do código genético, deve-se lembrar que os códons, como elos de cadeia, estão localizados não à distância, mas em proximidade direta, um após o outro na cadeia do ácido nucléico, e essa cadeia não é interrompida - tem sem começo nem fim.

5. Versatilidade

Nunca se deve esquecer que tudo na Terra está unido por um código genético comum. E, portanto, em um primata e uma pessoa, em um inseto e um pássaro, um baobá de cem anos e uma folha de grama que mal saiu do solo, aminoácidos semelhantes são codificados em trigêmeos idênticos.

É nos genes que estão armazenadas as informações básicas sobre as propriedades de um organismo, uma espécie de programa que o organismo herda daqueles que viveram antes e que existe como código genético.

Gene- uma unidade estrutural e funcional de hereditariedade que controla o desenvolvimento de um traço ou propriedade particular. Os pais transmitem um conjunto de genes para seus filhos durante a reprodução. Uma grande contribuição para o estudo do gene foi feita por cientistas russos: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V. (2011)

Atualmente, em biologia molecular foi estabelecido que os genes são seções de DNA que carregam qualquer informação integral - sobre a estrutura de uma molécula de proteína ou uma molécula de RNA. Estas e outras moléculas funcionais determinam o desenvolvimento, crescimento e funcionamento do corpo.

Ao mesmo tempo, cada gene é caracterizado por uma série de sequências de DNA regulatórias específicas, como promotores, que estão diretamente envolvidos na regulação da expressão do gene. As sequências regulatórias podem estar localizadas nas imediações do quadro de leitura aberto que codifica a proteína ou no início da sequência de RNA, como é o caso dos promotores (os chamados cis elementos cis-regulatórios), e a uma distância de muitos milhões de pares de bases (nucleotídeos), como no caso de intensificadores, isoladores e supressores (às vezes classificados como trans-elementos regulatórios elementos transregulatórios). Assim, o conceito de gene não se limita à região codificante do DNA, mas é um conceito mais amplo que inclui sequências regulatórias.

Originalmente o termo gene apareceu como uma unidade teórica para a transmissão de informações hereditárias discretas. A história da biologia lembra as disputas sobre quais moléculas podem ser portadoras de informações hereditárias. A maioria dos pesquisadores acreditava que apenas as proteínas poderiam ser tais transportadoras, já que sua estrutura (20 aminoácidos) permite criar mais opções do que a estrutura do DNA, que é composta por apenas quatro tipos de nucleotídeos. Mais tarde, provou-se experimentalmente que é o DNA que inclui as informações hereditárias, expressas como o dogma central da biologia molecular.

Os genes podem sofrer mutações - mudanças aleatórias ou intencionais na sequência de nucleotídeos na cadeia de DNA. As mutações podem levar a uma mudança na sequência e, portanto, uma mudança nas características biológicas de uma proteína ou RNA, o que, por sua vez, pode resultar em um funcionamento alterado ou anormal geral ou local do organismo. Tais mutações, em alguns casos, são patogênicas, pois seu resultado é uma doença, ou letais no nível embrionário. No entanto, nem todas as alterações na sequência de nucleotídeos levam a uma alteração na estrutura da proteína (devido ao efeito da degenerescência do código genético) ou a uma alteração significativa na sequência e não são patogênicas. Em particular, o genoma humano é caracterizado por polimorfismos de nucleotídeo único e variações no número de cópias. variações de número de cópia), como deleções e duplicações, que compõem cerca de 1% de toda a sequência de nucleotídeos humanos. Polimorfismos de nucleotídeo único, em particular, definem diferentes alelos do mesmo gene.

Os monômeros que compõem cada fita de DNA são complexos compostos orgânicos, incluindo bases nitrogenadas: adenina (A) ou timina (T) ou citosina (C) ou guanina (G), um açúcar-pentose-desoxirribose de cinco átomos, que deu nome ao próprio DNA, bem como um resíduo de ácido fosfórico. Esses compostos são chamados de nucleotídeos.

Propriedades do gene

  1. discrição - imiscibilidade dos genes;
  2. estabilidade - a capacidade de manter uma estrutura;
  3. labilidade - a capacidade de sofrer mutações repetidamente;
  4. alelismo múltiplo - muitos genes existem em uma população em uma variedade de formas moleculares;
  5. alelismo - no genótipo de organismos diplóides, apenas duas formas do gene;
  6. especificidade - cada gene codifica sua própria característica;
  7. pleiotropia - efeito múltiplo de um gene;
  8. expressividade - o grau de expressão de um gene em uma característica;
  9. penetrância - a frequência de manifestação de um gene no fenótipo;
  10. amplificação - um aumento no número de cópias de um gene.

Classificação

  1. Os genes estruturais são componentes únicos do genoma, representando uma única sequência que codifica uma proteína específica ou alguns tipos de RNA. (Veja também o artigo genes doméstico).
  2. Genes funcionais - regulam o trabalho dos genes estruturais.

Código genético- um método inerente a todos os organismos vivos para codificar a sequência de aminoácidos de proteínas usando uma sequência de nucleotídeos.

Quatro nucleotídeos são usados ​​​​no DNA - adenina (A), guanina (G), citosina (C), timina (T), que na literatura em russo são indicados pelas letras A, G, C e T. Essas letras constituem o alfabeto do código genético. No RNA, os mesmos nucleotídeos são usados, com exceção da timina, que é substituída por um nucleotídeo semelhante - uracil, que é indicado pela letra U (U na literatura em russo). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

Existem 20 aminoácidos diferentes usados ​​na natureza para construir proteínas. Cada proteína é uma cadeia ou várias cadeias de aminoácidos em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas. O conjunto de aminoácidos também é universal para quase todos os organismos vivos.

A implementação da informação genética nas células vivas (ou seja, a síntese de uma proteína codificada por um gene) é realizada por meio de dois processos matriciais: a transcrição (ou seja, a síntese do mRNA em um molde de DNA) e a tradução do código genético em uma sequência de aminoácidos (síntese de uma cadeia polipeptídica no mRNA). Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, além do sinal de parada, que significa o fim da sequência da proteína. Um conjunto de três nucleotídeos é chamado de tripleto. As abreviações aceitas correspondentes a aminoácidos e códons são mostradas na figura.

Propriedades

  1. Tripletidade- uma unidade significativa do código é uma combinação de três nucleotídeos (tripleto ou códon).
  2. Continuidade- não há sinais de pontuação entre os trigêmeos, ou seja, as informações são lidas continuamente.
  3. não sobreposto- o mesmo nucleotídeo não pode fazer parte simultaneamente de dois ou mais trigêmeos (não observado para alguns genes sobrepostos de vírus, mitocôndrias e bactérias que codificam várias proteínas frameshift).
  4. Sem ambigüidade (especificidade)- um determinado códon corresponde a apenas um aminoácido (porém, o códon UGA em Euplotes crassus códigos para dois aminoácidos - cisteína e selenocisteína)
  5. Degeneração (redundância) Vários códons podem corresponder ao mesmo aminoácido.
  6. Versatilidade- o código genético funciona da mesma forma nos organismos Niveis diferentes complexidade - de vírus a humanos (os métodos de engenharia genética são baseados nisso; há várias exceções, mostradas na tabela na seção "Variações do código genético padrão" abaixo).
  7. Imunidade a ruídos- as mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas conservador; As mutações por substituição de nucleotídeos que levam a uma mudança na classe do aminoácido codificado são chamadas radical.

Biossíntese de proteínas e suas etapas

Biossíntese de proteínas- um processo complexo de vários estágios de síntese de uma cadeia polipeptídica a partir de resíduos de aminoácidos, ocorrendo nos ribossomos de células de organismos vivos com a participação de moléculas de mRNA e tRNA.

A biossíntese de proteínas pode ser dividida em etapas de transcrição, processamento e tradução. Durante a transcrição, a informação genética codificada nas moléculas de DNA é lida e essa informação é escrita nas moléculas de mRNA. Durante uma série de etapas sucessivas de processamento, alguns fragmentos desnecessários nas etapas subsequentes são removidos do mRNA e as sequências de nucleotídeos são editadas. Depois que o código é transportado do núcleo para os ribossomos, a síntese real das moléculas de proteína ocorre pela ligação de resíduos de aminoácidos individuais à crescente cadeia polipeptídica.

Entre a transcrição e a tradução, a molécula de mRNA sofre uma série de mudanças sucessivas que garantem a maturação de um molde funcional para a síntese da cadeia polipeptídica. Uma tampa é anexada à extremidade 5' e uma cauda poli-A é anexada à extremidade 3', o que aumenta a vida útil do mRNA. Com o advento do processamento em uma célula eucariótica, tornou-se possível combinar éxons gênicos para obter uma maior variedade de proteínas codificadas por uma única sequência de nucleotídeos de DNA - splicing alternativo.

A tradução consiste na síntese de uma cadeia polipeptídica de acordo com a informação codificada no RNA mensageiro. A sequência de aminoácidos é arranjada usando transporte RNA (tRNA), que formam complexos com aminoácidos - aminoacil-tRNA. Cada aminoácido tem seu próprio tRNA, que possui um anticódon correspondente que “combina” com o códon do mRNA. Durante a tradução, o ribossomo se move ao longo do mRNA, à medida que a cadeia polipeptídica se acumula. A energia para a síntese de proteínas é fornecida pelo ATP.

A molécula de proteína acabada é então separada do ribossomo e transportada para o lugar certo na célula. Algumas proteínas requerem modificação pós-traducional adicional para atingir seu estado ativo.

Anteriormente, enfatizamos que os nucleotídeos possuem uma característica importante para a formação da vida na Terra - na presença de uma cadeia polinucleotídica em uma solução, o processo de formação de uma segunda cadeia (paralela) ocorre espontaneamente com base no composto complementar de nucleotídeos relacionados . O mesmo número de nucleotídeos em ambas as cadeias e sua relação química é condição indispensável para a realização de tais reações. No entanto, durante a síntese de proteínas, quando as informações do mRNA são implementadas na estrutura da proteína, não há como observar o princípio da complementaridade. Isso se deve ao fato de que no mRNA e na proteína sintetizada não apenas o número de monômeros é diferente, mas, o que é especialmente importante, não há semelhança estrutural entre eles (nucleotídeos de um lado, aminoácidos do outro). . É claro que neste caso há a necessidade de criar um novo princípio para a tradução exata da informação de um polinucleotídeo em uma estrutura polipeptídica. Na evolução, tal princípio foi criado e o código genético foi colocado em sua base.

O código genético é um sistema de registro de informações hereditárias em moléculas de ácido nucléico, baseado em certa alternância de sequências de nucleotídeos no DNA ou no RNA que formam códons correspondentes aos aminoácidos de uma proteína.

O código genético tem várias propriedades.

    Tripletidade.

    Degenerescência ou redundância.

    Sem ambigüidade.

    Polaridade.

    Não sobreposto.

    Compacidade.

    Versatilidade.

Deve-se notar que alguns autores também oferecem outras propriedades do código relacionadas a características químicas nucleotídeos incluídos no código ou com a frequência de ocorrência de aminoácidos individuais em proteínas corporais, etc. No entanto, essas propriedades decorrem do exposto, portanto, as consideraremos lá.

uma. Tripletidade. O código genético, como muitos sistemas complexamente organizados, tem a menor unidade estrutural e a menor unidade funcional. Um trigêmeo é a menor unidade estrutural do código genético. É composto por três nucleotídeos. Um códon é a menor unidade funcional do código genético. Como regra, os trigêmeos de mRNA são chamados de códons. No código genético, um códon desempenha várias funções. Primeiro, sua principal função é codificar um aminoácido. Em segundo lugar, um códon pode não codificar um aminoácido, mas neste caso tem uma função diferente (veja abaixo). Como pode ser visto na definição, um trigêmeo é um conceito que caracteriza elementar unidade estrutural código genético (três nucleotídeos). códon caracteriza unidade semântica elementar genoma - três nucleotídeos determinam a ligação à cadeia polipeptídica de um aminoácido.

A unidade estrutural elementar foi primeiro decifrada teoricamente e depois sua existência foi confirmada experimentalmente. De fato, 20 aminoácidos não podem ser codificados por um ou dois nucleotídeos. os últimos são apenas 4. Três de quatro nucleotídeos dão 4 3 = 64 variantes, que cobrem mais do que o número de aminoácidos presentes em organismos vivos (ver Tabela 1).

As combinações de nucleotídeos apresentadas na Tabela 64 possuem duas características. Primeiro, das 64 variantes de trigêmeos, apenas 61 são códons e codificam algum aminoácido, são chamados códons de sentido. Três trigêmeos não codificam

Tabela 1.

Códons de RNA mensageiro e seus aminoácidos correspondentes

Fundamentos dos códons

Absurdo

Absurdo

Absurdo

Conheceu

Haste

os aminoácidos a são sinais de parada que marcam o fim da tradução. Existem três desses trigêmeos UAA, UAG, UGA, eles também são chamados de "sem sentido" (códons sem sentido). Como resultado de uma mutação, que está associada à substituição de um nucleotídeo em um trio por outro, um códon sem sentido pode surgir de um códon de sentido. Este tipo de mutação é chamado mutação sem sentido. Se tal sinal de parada for formado dentro do gene (em sua parte informativa), então durante a síntese de proteínas neste local o processo será constantemente interrompido - apenas a primeira (antes do sinal de parada) parte da proteína será sintetizada. Uma pessoa com essa patologia sentirá falta de proteína e apresentará sintomas associados a essa falta. Por exemplo, esse tipo de mutação foi encontrado no gene que codifica a cadeia beta da hemoglobina. Uma cadeia de hemoglobina inativa encurtada é sintetizada, a qual é rapidamente destruída. Como resultado, uma molécula de hemoglobina desprovida de uma cadeia beta é formada. É claro que é improvável que tal molécula cumpra totalmente suas funções. Existe uma doença grave que se desenvolve de acordo com o tipo de anemia hemolítica (talassemia beta-zero, da palavra grega "Talas" - o Mar Mediterrâneo, onde esta doença foi descoberta pela primeira vez).

O mecanismo de ação dos códons de parada é diferente do mecanismo de ação dos códons de sentido. Isso decorre do fato de que, para todos os códons que codificam aminoácidos, foram encontrados os tRNAs correspondentes. Não foram encontrados tRNAs para códons sem sentido. Portanto, o tRNA não participa do processo de interrupção da síntese de proteínas.

códonAGO (às vezes GUG em bactérias) não apenas codifica o aminoácido metionina e valina, mas também éiniciador de transmissão .

b. Degenerescência ou redundância.

61 dos 64 trigêmeos codificam 20 aminoácidos. Tal excesso de três vezes do número de trigêmeos sobre o número de aminoácidos sugere que duas opções de codificação podem ser usadas na transferência de informações. Em primeiro lugar, nem todos os 64 códons podem estar envolvidos na codificação de 20 aminoácidos, mas apenas 20 e, em segundo lugar, os aminoácidos podem ser codificados por vários códons. Estudos mostraram que a natureza usou a última opção.

Sua preferência é clara. Se apenas 20 das 64 variantes de tripleto estivessem envolvidas na codificação de aminoácidos, então 44 tripletos (de 64) permaneceriam não codificantes, ou seja, sem sentido (códons sem sentido). Anteriormente, apontamos como é perigoso para a vida de uma célula a transformação de um trigêmeo codificador como resultado de uma mutação em um códon sem sentido - isso interrompe significativamente a operação normal da RNA polimerase, levando ao desenvolvimento de doenças. Existem atualmente três códons sem sentido em nosso genoma, e agora imagine o que aconteceria se o número de códons sem sentido aumentasse cerca de 15 vezes. É claro que em tal situação a transição de códons normais para códons sem sentido será imensamente maior.

Um código no qual um aminoácido é codificado por vários trigêmeos é chamado degenerado ou redundante. Quase todo aminoácido tem vários códons. Assim, o aminoácido leucina pode ser codificado por seis trigêmeos - UUA, UUG, CUU, CUC, CUA, CUG. A valina é codificada por quatro trigêmeos, a fenilalanina por dois e apenas triptofano e metionina codificado por um códon. A propriedade que está associada ao registo da mesma informação com caracteres diferentes chama-se degeneração.

O número de códons atribuídos a um aminoácido está bem correlacionado com a frequência de ocorrência do aminoácido nas proteínas.

E isso provavelmente não é acidental. Quanto maior a frequência de ocorrência de um aminoácido em uma proteína, mais frequentemente o códon desse aminoácido está presente no genoma, maior a probabilidade de seu dano por fatores mutagênicos. Portanto, é claro que um códon mutado tem maior probabilidade de codificar o mesmo aminoácido se for altamente degenerado. A partir dessas posições, a degeneração do código genético é um mecanismo que protege o genoma humano de danos.

Deve-se notar que o termo degenerescência também é usado em genética molecular em outro sentido. Como a maior parte da informação no códon recai sobre os dois primeiros nucleotídeos, a base na terceira posição do códon acaba sendo de pouca importância. Este fenômeno é chamado de “degenerescência da terceira base”. Último recurso minimiza o efeito das mutações. Por exemplo, sabe-se que a principal função dos glóbulos vermelhos é o transporte de oxigênio dos pulmões para os tecidos e dióxido de carbono dos tecidos para os pulmões. Essa função é realizada pelo pigmento respiratório - hemoglobina, que preenche todo o citoplasma do eritrócito. Consiste em uma parte da proteína - globina, que é codificada pelo gene correspondente. Além da proteína, a hemoglobina contém heme, que contém ferro. Mutações nos genes da globina levam ao aparecimento de diferentes variantes de hemoglobinas. Na maioria das vezes, as mutações estão associadas a substituição de um nucleotídeo por outro e o aparecimento de um novo códon no gene, que pode codificar um novo aminoácido na cadeia polipeptídica da hemoglobina. Em um trigêmeo, como resultado de uma mutação, qualquer nucleotídeo pode ser substituído - o primeiro, o segundo ou o terceiro. Várias centenas de mutações são conhecidas por afetar a integridade dos genes da globina. Aproximar 400 dos quais estão associados à substituição de nucleotídeos únicos no gene e à substituição de aminoácidos correspondente no polipeptídeo. Destes, apenas 100 substituições levam à instabilidade da hemoglobina e vários tipos doenças que variam de leve a muito grave. 300 (aproximadamente 64%) mutações de substituição não afetam a função da hemoglobina e não levam à patologia. Uma das razões para isso é a “degeneração da terceira base” mencionada acima, quando a substituição do terceiro nucleotídeo no tripleto que codifica serina, leucina, prolina, arginina e alguns outros aminoácidos leva ao aparecimento de um códon sinônimo codificando o mesmo aminoácido. Fenotipicamente, tal mutação não se manifestará. Em contraste, qualquer substituição do primeiro ou segundo nucleotídeo em um trigêmeo em 100% dos casos leva ao aparecimento de uma nova variante de hemoglobina. Mas mesmo neste caso, pode não haver distúrbios fenotípicos graves. A razão para isso é a substituição de um aminoácido na hemoglobina por outro semelhante ao primeiro em termos de propriedades físico-químicas. Por exemplo, se um aminoácido com propriedades hidrofílicas for substituído por outro aminoácido, mas com as mesmas propriedades.

A hemoglobina consiste em um grupo de ferro porfirina de heme (moléculas de oxigênio e dióxido de carbono estão ligadas a ele) e uma proteína - globina. A hemoglobina adulta (HbA) contém dois- correntes e dois-correntes. Molécula-cadeia contém 141 resíduos de aminoácidos,- corrente - 146,- e-cadeias diferem em muitos resíduos de aminoácidos. A sequência de aminoácidos de cada cadeia de globina é codificada por seu próprio gene. A codificação do gene- a cadeia está localizada no braço curto do cromossomo 16,-gene - no braço curto do cromossomo 11. Mudança na codificação do gene- a cadeia de hemoglobina do primeiro ou segundo nucleotídeo quase sempre leva ao aparecimento de novos aminoácidos na proteína, interrupção das funções da hemoglobina e sérias consequências para o paciente. Por exemplo, substituir “C” em um dos trigêmeos CAU (histidina) por “U” levará ao aparecimento de um novo trigêmeo UAU que codifica outro aminoácido - tirosina. Fenotipicamente, isso se manifestará em uma doença grave. substituição semelhante na posição 63A cadeia do polipeptídeo histidina à tirosina desestabilizará a hemoglobina. A doença methemoglobinemiya desenvolve-se. Alteração, por mutação, do ácido glutâmico para valina na 6ª posiçãocadeia é a causa de uma doença grave - a anemia falciforme. Não vamos continuar a triste lista. Observamos apenas que, ao substituir os dois primeiros nucleotídeos, pode aparecer um aminoácido de acordo com propriedades físicas e químicas semelhante ao anterior. Assim, a substituição do 2º nucleotídeo em um dos tripletos que codificam o ácido glutâmico (GAA) em-chain em “Y” leva ao aparecimento de um novo tripleto (GUA) que codifica a valina, e a substituição do primeiro nucleotídeo por “A” forma um tripleto AAA que codifica o aminoácido lisina. O ácido glutâmico e a lisina são semelhantes em propriedades físico-químicas - ambos são hidrofílicos. Valina é um aminoácido hidrofóbico. Portanto, a substituição do ácido glutâmico hidrofílico por valina hidrofóbica altera significativamente as propriedades da hemoglobina, o que acaba levando ao desenvolvimento de anemia falciforme, enquanto a substituição do ácido glutâmico hidrofílico por lisina hidrofílica altera em menor grau a função da hemoglobina - pacientes desenvolve forma leve anemia. Como resultado da substituição da terceira base, o novo trio pode codificar os mesmos aminoácidos do anterior. Por exemplo, se o uracil foi substituído por citosina no trigêmeo CAH e surgiu um trigêmeo CAC, praticamente nenhuma alteração fenotípica em uma pessoa será detectada. Isso é compreensível, porque Ambos os trigêmeos codificam o mesmo aminoácido, a histidina.

Em conclusão, é apropriado enfatizar que a degeneração do código genético e a degeneração da terceira base de uma posição biológica geral são mecanismos protetores que são incorporados na evolução na estrutura única de DNA e RNA.

dentro. Sem ambigüidade.

Cada tripleto (exceto os sem sentido) codifica apenas um aminoácido. Assim, na direção do códon - aminoácido, o código genético é inequívoco, na direção do aminoácido - códon - é ambíguo (degenerado).

inequívoco

códon aminoácido

degenerar

E, neste caso, a necessidade de não ambiguidade no código genético é óbvia. Em outra variante, durante a tradução de um mesmo códon, diferentes aminoácidos seriam inseridos na cadeia da proteína e, como resultado, seriam formadas proteínas com diferentes estruturas primárias e diferentes funções. O metabolismo da célula mudaria para o modo de operação "um gene - vários polipeptídeos". É claro que em tal situação a função reguladora dos genes seria completamente perdida.

g. Polaridade

A leitura de informações do DNA e do mRNA ocorre apenas em uma direção. Polaridade tem importância para definir estruturas de ordem superior (secundárias, terciárias, etc.). Anteriormente, falamos sobre o fato de que estruturas de ordem inferior determinam estruturas de ordem superior. A estrutura terciária e as estruturas de ordem superior nas proteínas são formadas imediatamente assim que a cadeia de RNA sintetizada se afasta da molécula de DNA ou a cadeia polipeptídica se afasta do ribossomo. Enquanto a extremidade livre do RNA ou polipeptídeo adquire uma estrutura terciária, a outra extremidade da cadeia ainda continua a ser sintetizada no DNA (se o RNA for transcrito) ou ribossomo (se o polipeptídeo for transcrito).

Portanto, o processo unidirecional de leitura de informações (na síntese de RNA e proteína) é essencial não apenas para determinar a sequência de nucleotídeos ou aminoácidos na substância sintetizada, mas para a determinação rígida de secundário, terciário, etc. estruturas.

e. Não sobreposição.

O código pode ou não se sobrepor. Na maioria dos organismos, o código não é sobreposto. Um código sobreposto foi encontrado em alguns fagos.

A essência de um código não sobreposto é que o nucleotídeo de um códon não pode ser o nucleotídeo de outro códon ao mesmo tempo. Se o código estivesse sobreposto, então a sequência de sete nucleotídeos (GCUGCUG) poderia codificar não dois aminoácidos (alanina-alanina) (Fig. 33, A) como no caso de um código não sobreposto, mas três (se um nucleotídeo é comum) (Fig. 33, B) ou cinco (se dois nucleotídeos forem comuns) (ver Fig. 33, C). Nos dois últimos casos, uma mutação de qualquer nucleotídeo levaria a uma violação na sequência de dois, três, etc. aminoácidos.

No entanto, descobriu-se que uma mutação de um nucleotídeo sempre interrompe a inclusão de um aminoácido em um polipeptídeo. Este é um argumento significativo a favor do fato de que o código não é sobreposto.

Vamos explicar isso na Figura 34. As linhas em negrito mostram trigêmeos que codificam aminoácidos no caso de códigos não sobrepostos e sobrepostos. Experimentos mostraram inequivocamente que o código genético não é sobreposto. Sem entrar nos detalhes do experimento, notamos que se substituirmos o terceiro nucleotídeo na sequência de nucleotídeos (ver Fig. 34)No (marcado com um asterisco) para algum outro então:

1. Com código não sobreposto, a proteína controlada por esta sequência teria a substituição de um (primeiro) aminoácido (marcado com asteriscos).

2. Com um código sobreposto na opção A, ocorreria uma substituição em dois (primeiro e segundo) aminoácidos (marcados com asteriscos). Na opção B, a substituição afetaria três aminoácidos (marcados com asteriscos).

No entanto, numerosos experimentos mostraram que quando um nucleotídeo no DNA é quebrado, a proteína sempre afeta apenas um aminoácido, o que é típico de um código não sobreposto.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

HCC HCC HCC UHC CUG HCC CUG UGC HCU CUG

*** *** *** *** *** ***

Alanine - Alanine Ala - Cys - Lei Ala - Lei - Lei - Ala - Lei

A B C

código não sobreposto código sobreposto

Arroz. 34. Esquema explicando a presença de um código não sobreposto no genoma (explicação no texto).

A não sobreposição do código genético está associada a outra propriedade - a leitura da informação começa a partir de um determinado ponto - o sinal de iniciação. Tal sinal de iniciação no mRNA é o códon que codifica a metionina AUG.

Deve-se notar que uma pessoa ainda tem um pequeno número de genes que se desviam de regra geral e sobreposição.

e. Compacidade.

Não há sinais de pontuação entre os códons. Em outras palavras, os trigêmeos não são separados uns dos outros, por exemplo, por um nucleotídeo sem sentido. A ausência de "sinais de pontuação" no código genético foi comprovada em experimentos.

e. Versatilidade.

O código é o mesmo para todos os organismos que vivem na Terra. A prova direta da universalidade do código genético foi obtida comparando sequências de DNA com sequências de proteínas correspondentes. Descobriu-se que os mesmos conjuntos de valores de código são usados ​​em todos os genomas bacterianos e eucarióticos. Há exceções, mas não muitas.

As primeiras exceções à universalidade do código genético foram encontradas nas mitocôndrias de algumas espécies animais. Isso dizia respeito ao códon terminador UGA, cuja leitura é igual ao códon UGG que codifica o aminoácido triptofano. Outros desvios mais raros da universalidade também foram encontrados.

MZ. O código genético é um sistema de registro de informações hereditárias em moléculas de ácido nucléico, baseado em certa alternância de sequências de nucleotídeos no DNA ou no RNA que formam códons,

correspondente aos aminoácidos da proteína.O código genético tem várias propriedades.