Ácidos Nucleicos e a Genética Molecular - Química | Tuco-Tuco
Aula de Química (Química Aplicada: Biomoléculas e Indústria): Ácidos Nucleicos e a Genética Molecular. Estudo da química dos ácidos nucleicos e sua relação com a codificação genética. Estude gratuitamente para vestibular e ENEM no Tuco-Tuco.
Ácidos Nucleicos e a Genética Molecular
Os ácidos nucleicos — ácido desoxirribonucleico (DNA) e ácido ribonucleico (RNA) — são as macromoléculas responsáveis pelo armazenamento, transmissão e execução da informação genética em todos os organismos vivos conhecidos. Eles constituem a base molecular da hereditariedade e da síntese proteica, estabelecendo a ponte química entre o genótipo e o fenótipo. Compreender a estrutura, a replicação e a expressão dos ácidos nucleicos é essencial para decifrar os mecanismos que regem a vida e suas disfunções, bem como para dominar os fundamentos da biotecnologia moderna.
Nucleotídeos: As Unidades Monoméricas
Os ácidos nucleicos são polímeros lineares de nucleotídeos. Cada nucleotídeo é composto por três subunidades covalentemente ligadas:
Uma base nitrogenada: molécula heterocíclica contendo nitrogênio, derivada de purina ou pirimidina.
Uma pentose: um açúcar de cinco carbonos (ribose no RNA, desoxirribose no DNA).
Um grupo fosfato: um, dois ou três grupos fosfato ligados ao carbono 5' da pentose.
Bases Nitrogenadas: Purinas e Pirimidinas
As bases nitrogenadas são os elementos que conferem a identidade e a capacidade de pareamento específico aos nucleotídeos. São classificadas em dois grupos estruturais:
Purinas: possuem um sistema de dois anéis fundidos (um anel de pirimidina fundido a um anel de imidazol). As principais purinas encontradas nos ácidos nucleicos são a adenina (A) e a guanina (G). Ambas estão presentes tanto no DNA quanto no RNA.
Pirimidinas: possuem um único anel de seis membros. As pirimidinas comuns são a citosina (C) (presente em DNA e RNA), a timina (T) (exclusiva do DNA) e a uracila (U) (exclusiva do RNA, onde substitui a timina).
As bases nitrogenadas são moléculas planares, relativamente hidrofóbicas, e podem existir em diferentes formas tautoméricas. As formas predominantes em pH fisiológico são as formas ceto (lactama) e amino, que são as responsáveis pelo padrão de ligações de hidrogênio no pareamento Watson-Crick.
Pentoses: Ribose e Desoxirribose
A pentose dos nucleotídeos é uma aldopentose na forma cíclica $\beta$-furanose. No RNA, o açúcar é a $\beta$-D-ribose. No DNA, é a $\beta$-D-2'-desoxirribose, que difere da ribose pela ausência de um átomo de oxigênio no carbono 2' (daí o nome desoxi). Essa diferença tem profundas consequências químicas e biológicas: a presença do grupo $2'-OH$ no RNA torna-o quimicamente muito mais lábil e suscetível à hidrólise alcalina do que o DNA, além de permitir uma maior diversidade de estruturas tridimensionais e funções catalíticas (ribozimas).
A ligação entre a base nitrogenada e a pentose ocorre por meio de uma ligação N-glicosídica entre o nitrogênio 1 das pirimidinas (ou nitrogênio 9 das purinas) e o carbono 1' da pentose, com eliminação de uma molécula de água. A unidade formada pela base e pelo açúcar é denominada nucleosídeo. A adição de um ou mais grupos fosfato ao carbono 5' do nucleosídeo forma o nucleotídeo.
Os nucleotídeos não são apenas os blocos de construção dos ácidos nucleicos; eles também desempenham papéis cruciais no metabolismo energético (ATP, GTP), na sinalização intracelular (AMP cíclico, GMP cíclico) e como componentes de coenzimas (NAD$^+$, FAD, Coenzima A).
Estrutura do DNA: A Dupla Hélice
A elucidação da estrutura tridimensional do DNA por James Watson e Francis Crick em 1953, com base nos dados de difração de raios X de Rosalind Franklin e Maurice Wilkins e nas regras de equivalência de bases de Erwin Chargaff, representou um marco na história da ciência. O modelo proposto — a dupla hélice — explica elegantemente a capacidade do DNA de armazenar e replicar informação genética.
Características Fundamentais da Dupla Hélice
O DNA é composto por duas cadeias polinucleotídicas que se enrolam em torno de um eixo central comum, formando uma hélice dextrogira (sentido horário).
As duas cadeias são antiparalelas: uma cadeia corre no sentido $5' \rightarrow 3'$, e a cadeia complementar corre no sentido $3' \rightarrow 5'$.
O esqueleto açúcar-fosfato, hidrofílico e carregado negativamente (devido aos grupos fosfato), está posicionado na parte externa da hélice, interagindo com o solvente aquoso.
As bases nitrogenadas, planares e hidrofóbicas, projetam-se para o interior da hélice, empilhando-se umas sobre as outras perpendicularmente ao eixo da hélice. As interações de empilhamento (stacking interactions), que envolvem forças de van der Waals e interações hidrofóbicas, são a principal força estabilizadora da estrutura helicoidal.
As bases das duas fitas formam pares específicos por meio de ligações de hidrogênio: Adenina (A) sempre pareia com Timina (T), por meio de duas ligações de hidrogênio; Guanina (G) sempre pareia com Citosina (C), por meio de três ligações de hidrogênio. Essa complementaridade estrita é a base molecular da replicação e da transcrição.
A hélice apresenta duas fendas de dimensões desiguais: o sulco maior e o sulco menor. Essas fendas são importantes sítios de reconhecimento para proteínas que interagem com o DNA (fatores de transcrição, enzimas de restrição), pois expõem as bordas das bases nitrogenadas, permitindo o reconhecimento de sequências específicas sem a necessidade de desnaturar a dupla hélice.
A forma canônica descrita por Watson e Crick é conhecida como B-DNA, predominante em condições fisiológicas de alta umidade. Em condições de menor umidade ou em sequências específicas, o DNA pode assumir outras conformações, como a A-DNA (hélice mais curta e larga) e a Z-DNA (hélice sinistrogira, com esqueleto em zigue-zague).
Estrutura e Diversidade do RNA
Ao contrário do DNA, que existe primariamente como uma dupla hélice longa e estável, o RNA é tipicamente uma molécula de fita simples. No entanto, essa fita simples pode dobrar-se sobre si mesma e formar estruturas secundárias e terciárias complexas, por meio do pareamento intramolecular de bases complementares em regiões específicas da mesma molécula. Essas estruturas incluem grampos (hairpins), alças internas e pseudonós.
Existem três classes principais de RNA, todas transcritas a partir do DNA e essenciais para o fluxo da informação genética:
RNA mensageiro (mRNA): Atua como intermediário que transporta a informação genética do DNA (gene) para os ribossomos, onde a sequência de nucleotídeos é traduzida na sequência de aminoácidos de uma proteína. Em eucariotos, o mRNA sofre extenso processamento pós-transcricional, incluindo a adição de um cap 5' e de uma cauda poli-A 3', e a remoção de sequências não codificantes (íntrons) por splicing.
RNA transportador (tRNA): Pequenas moléculas ($\sim 73$ a $93$ nucleotídeos) que atuam como adaptadores moleculares durante a tradução. Cada tRNA possui um anticódon — uma trinca de nucleotídeos complementar a um códon específico do mRNA — e carrega, covalentemente ligado à sua extremidade 3', o aminoácido correspondente àquele códon. A estrutura secundária dos tRNAs é geralmente representada como uma "folha de trevo", e sua estrutura terciária assemelha-se a um "L" invertido.
RNA ribossômico (rRNA): Constitui o principal componente estrutural e funcional dos ribossomos, as maquinarias moleculares que catalisam a síntese proteica. O rRNA não é apenas um arcabouço passivo; ele desempenha papel catalítico ativo na formação das ligações peptídicas (atividade peptidil-transferase), caracterizando o ribossomo como uma ribozima.
Além dessas três classes clássicas, uma vasta gama de RNAs não codificantes tem sido descoberta, desempenhando papéis regulatórios essenciais na expressão gênica, como os microRNAs (miRNAs), pequenos RNAs interferentes (siRNAs) e longos RNAs não codificantes (lncRNAs).
Replicação do DNA: A Duplicação Fiel da Informação Genética
A replicação do DNA é o processo pelo qual uma molécula de DNA parental é copiada para gerar duas moléculas-filhas idênticas. O mecanismo é semiconservativo, conforme demonstrado pelo clássico experimento de Meselson e Stahl: cada uma das duas moléculas-filhas de DNA é composta por uma fita parental (original) e uma fita recém-sintetizada.
Mecanismo Bioquímico da Replicação
A replicação é catalisada por um complexo multienzimático denominado DNA polimerase. As DNA polimerases compartilham algumas características fundamentais:
Necessitam de um molde: a fita parental de DNA serve como guia para a incorporação dos nucleotídeos complementares.
*Necessitam de um iniciador (primer): a DNA polimerase não pode iniciar a síntese de novo; ela apenas alonga uma cadeia preexistente. O iniciador é um pequeno fragmento de RNA (com um grupo $3'-OH$ livre) sintetizado por uma enzima denominada primase.
Sintetizam sempre no sentido $5' \rightarrow 3'$: o nucleotídeo entrante (na forma de desoxinucleosídeo trifosfato, dNTP) é adicionado ao grupo $3'-OH$ livre da extremidade da cadeia em crescimento. O ataque nucleofílico do $3'-OH$ ao fosfato $\alpha$ do dNTP resulta na formação de uma nova ligação fosfodiéster e na liberação de pirofosfato ($PP_i$), uma reação energeticamente favorável.
Devido à natureza antiparalela da dupla hélice e à síntese unidirecional da DNA polimerase, a replicação ocorre de maneira contínua na fita líder (leading strand), cujo molde é lido no sentido $3' \rightarrow 5'$, e de maneira descontínua na fita tardia (lagging strand). Na fita tardia, a síntese ocorre em pequenos fragmentos, denominados fragmentos de Okazaki, cada um iniciado por um primer de RNA. Posteriormente, os primers de RNA são removidos e substituídos por DNA pela DNA polimerase I (em procariotos), e os fragmentos são covalentemente unidos pela enzima DNA ligase.
A fidelidade da replicação é extraordinariamente alta (cerca de um erro a cada 0^9$ a 0^{10}$ nucleotídeos copiados), devido à precisão do pareamento de bases e à atividade revisora (proofreading) $3' \rightarrow 5'$ exonuclease da DNA polimerase, que remove nucleotídeos incorretamente incorporados.
Transcrição: Do DNA ao RNA
A transcrição é o processo pelo qual a informação contida em um gene (segmento específico de DNA) é copiada na forma de uma molécula de RNA. A enzima responsável é a RNA polimerase, que, diferentemente da DNA polimerase, pode iniciar a síntese de novo, sem a necessidade de um iniciador. A RNA polimerase também sintetiza no sentido $5' \rightarrow 3'$, utilizando ribonucleosídeos trifosfatos (NTPs) como substrato.
O processo de transcrição pode ser dividido em três etapas principais:
Iniciação: A RNA polimerase reconhece e se liga a uma sequência específica no DNA, denominada promotor, localizada à montante (upstream) do gene. Em eucariotos, a ligação da RNA polimerase ao promotor é auxiliada por um conjunto de proteínas denominadas fatores de transcrição. Após a ligação, a RNA polimerase desenrola localmente a dupla hélice de DNA, formando uma "bolha de transcrição", e inicia a síntese da cadeia de RNA.
Alongamento: A RNA polimerase move-se ao longo da fita molde de DNA, desenrolando a hélice à sua frente e reenrolando-a atrás de si. Os ribonucleotídeos complementares são adicionados à extremidade $3'-OH$ da cadeia de RNA em crescimento. A região do DNA que está sendo transcrita ativamente é conhecida como bolha de transcrição.
Terminação: A transcrição prossegue até que a RNA polimerase encontre um sinal de terminação no DNA. Em procariotos, os sinais de terminação podem formar estruturas de grampo no RNA nascente que desestabilizam o complexo de transcrição. Em eucariotos, a terminação da transcrição pela RNA polimerase II está acoplada à clivagem do RNA nascente e à adição da cauda poli-A.
Apenas uma das duas fitas do DNA serve como molde para a transcrição de um determinado gene. Essa fita é chamada de fita molde (ou fita antisenso). A fita complementar, que não é transcrita, possui a mesma sequência do RNA (com T no lugar de U) e é chamada de fita codificante (ou fita senso).
Tradução: Do RNA à Proteína
A tradução é o processo pelo qual a sequência de nucleotídeos de um mRNA é decodificada para especificar a sequência de aminoácidos de uma proteína. Esse processo ocorre nos ribossomos e envolve a participação crucial dos tRNAs. A correspondência entre a sequência de nucleotídeos e a de aminoácidos é ditada pelo código genético.
O Código Genético
O código genético é o conjunto de regras que define como uma sequência de nucleotídeos é traduzida em uma sequência de aminoácidos. As unidades do código são trincas de nucleotídeos consecutivos no mRNA, denominadas códons. Existem $4^3 = 64$ códons possíveis, que especificam os 20 aminoácidos padrão e os sinais de parada da tradução. As principais características do código genético são:
É degenerado (ou redundante): a maioria dos aminoácidos é especificada por mais de um códon. Por exemplo, o aminoácido leucina é codificado por seis códons diferentes.
É específico: cada códon especifica apenas um único aminoácido.
É universal: com raras exceções (como em mitocôndrias e em alguns protozoários), o código genético é o mesmo para todos os organismos, uma evidência poderosa da origem comum da vida.
Não é ambíguo e não tem sobreposição: os códons são lidos sequencialmente, sem compartilhar bases.
Possui códons de iniciação e terminação: o códon AUG (que codifica a metionina) atua como o principal sinal de iniciação. Os códons UAA, UAG e UGA são códons de parada (stop codons), que não codificam aminoácidos e sinalizam o término da síntese proteica.
Etapas da Tradução
Iniciação: O ribossomo (composto pelas subunidades maior e menor) se associa ao mRNA. Um tRNA iniciador, carregando o aminoácido metionina (em eucariotos) ou N-formilmetionina (em procariotos), reconhece o códon de iniciação AUG. O complexo de iniciação é montado, posicionando o primeiro tRNA no sítio P (peptidil) do ribossomo.
Alongamento: O ciclo de alongamento consiste em três etapas repetitivas:
- Entrada: Um novo tRNA, carregando o aminoácido correspondente ao próximo códon do mRNA, entra no sítio A (aminoacil) do ribossomo.
- Formação da ligação peptídica: A atividade peptidil-transferase do rRNA (na subunidade maior) catalisa a formação de uma ligação peptídica entre o grupo amino do aminoácido no sítio A e o grupo carboxila da cadeia polipeptídica em crescimento, que está ligada ao tRNA no sítio P. A cadeia crescente é, assim, transferida para o tRNA no sítio A.
- Translocação: O ribossomo move-se exatamente um códon ao longo do mRNA no sentido $5' \rightarrow 3'$. O tRNA desacilado (agora sem aminoácido) move-se do sítio P para o sítio E (saída, exit) e é liberado. O tRNA que carrega a cadeia polipeptídica move-se do sítio A para o sítio P, deixando o sítio A vazio e pronto para receber o próximo tRNA.
Terminação: O ciclo de alongamento se repete até que um códon de parada (UAA, UAG ou UGA) seja posicionado no sítio A. Como não existem tRNAs que reconheçam esses códons, proteínas denominadas fatores de liberação se ligam ao sítio A. Isso induz a atividade peptidil-transferase a transferir a cadeia polipeptídica para uma molécula de água (hidrólise), em vez de para um aminoácido, liberando a proteína recém-sintetizada do tRNA. O ribossomo então se dissocia em suas subunidades.
O Dogma Central da Biologia Molecular
A sequência de eventos descrita — DNA $\rightarrow$ RNA $\rightarrow$ Proteína — constitui o Dogma Central da Biologia Molecular, formulado por Francis Crick. Ele estabelece o fluxo unidirecional da informação genética: a informação pode ser transferida de ácido nucleico para ácido nucleico (replicação do DNA, transcrição) e de ácido nucleico para proteína (tradução). Uma vez que a informação tenha passado para uma proteína, ela não pode fluir de volta para o ácido nucleico. A descoberta da transcrição reversa (RNA $\rightarrow$ DNA, catalisada pela transcriptase reversa em retrovírus) adicionou um novo sentido de fluxo entre os ácidos nucleicos, mas não viola o dogma central, pois a restrição fundamental de que a informação não retrocede a partir das proteínas permanece absoluta.
Regulação da Expressão Gênica
Nem todos os genes são expressos em todas as células ou em todos os momentos. A regulação da expressão gênica permite que as células respondam a sinais ambientais, diferenciem-se em tipos celulares especializados e mantenham a homeostase. A regulação pode ocorrer em múltiplos níveis:
Controle transcricional: é o nível mais comum e eficiente. Proteínas reguladoras (fatores de transcrição) ligam-se a sequências específicas do DNA (promotores, enhancers, silencers) e ativam ou reprimem a iniciação da transcrição pela RNA polimerase. O operon lac em E. coli é um modelo clássico de regulação transcricional em procariotos.
Controle pós-transcricional: inclui o splicing alternativo (que permite que um único gene produza múltiplas isoformas proteicas), a edição do RNA, o controle do transporte do mRNA do núcleo para o citoplasma e a regulação da estabilidade do mRNA.
Controle traducional: regula a taxa de iniciação da tradução, frequentemente modulada por proteínas que se ligam ao mRNA ou por pequenos RNAs reguladores (como os microRNAs).
Controle pós-traducional: envolve modificações covalentes (fosforilação, acetilação, glicosilação) que alteram a atividade, a localização ou a estabilidade das proteínas.
Mutação e Variação Genética
A fidelidade da replicação e da reparação do DNA não é absoluta. Alterações permanentes na sequência de nucleotídeos do DNA são denominadas mutações. As mutações podem ser classificadas de acordo com sua natureza molecular:
Substituições de base: uma base é trocada por outra. Podem ser transições (purina $\rightarrow$ purina, ou pirimidina $\rightarrow$ pirimidina) ou transversões (purina $\leftrightarrow$ pirimidina).
Inserções e Deleções (indels): adição ou remoção de um ou mais pares de bases. Quando o número de bases inseridas ou deletadas não é um múltiplo de três, ocorre uma mutação de mudança de fase de leitura (frameshift), que altera completamente a sequência de aminoácidos a partir do ponto da mutação e geralmente resulta em uma proteína não funcional.
As mutações podem ter consequências fenotípicas variadas:
Silenciosa: o códon alterado ainda codifica o mesmo aminoácido (devido à degeneração do código genético). Não há alteração na proteína.
Missense: o códon alterado codifica um aminoácido diferente. O efeito na função proteica pode ser sutil ou drástico (ex.: anemia falciforme, causada pela substituição de um único aminoácido na hemoglobina).
Sem sentido (nonsense): o códon alterado torna-se um códon de parada, resultando na terminação prematura da tradução e em uma proteína truncada, geralmente não funcional.
As mutações são a fonte primária de variabilidade genética*, fornecendo o substrato sobre o qual a seleção natural atua no processo evolutivo. A compreensão dos mecanismos moleculares de replicação, transcrição e tradução é, portanto, a base para decifrar a diversidade da vida, as doenças genéticas e o desenvolvimento de terapias avançadas, como a terapia gênica e a edição de genomas (CRISPR-Cas).
Exercícios:
As bases nitrogenadas encontradas no DNA são:
A transcrição é o processo de síntese de:
Em biologia molecular, a tradução é o processo de síntese de:
Um laboratório realiza a extração de DNA e RNA de amostras humanas para análise genética. Durante o processo, um pesquisador encontra uma molécula composta por uma cadeia simples de nucleotídeos, contendo ribose e uracila. Com base nas informações da aula, que tipo de ácido nucleico está sendo analisado e qual é a função principal desse tipo de molécula na célula?
Complete a frase: Os monômeros que constituem os ácidos nucleicos são denominados nucleotídeos, sendo cada um composto por um grupo fosfato, uma base nitrogenada e um ____
Complete a frase: A estabilidade estrutural do DNA em relação ao RNA decorre, fundamentalmente, da presença da ____ em seus nucleotídeos
Complete a frase: Bases nitrogenadas de anel duplo, como a adenina e a guanina, que desempenham papéis centrais no pareamento de informações, são tecnicamente classificadas como ____
Complete a frase: No emparelhamento de bases do DNA, a citosina estabelece uma associação termodinamicamente forte com a ____ através de três pontes de hidrogênio
Complete a frase: A conformação espacial em que duas fitas antiparalelas de polinucleotídeos se enrolam em torno de um eixo comum é universalmente conhecida como ____
Complete a frase: O ácido ribonucleico (RNA) distingue-se quimicamente do DNA por ser geralmente de fita simples e por utilizar a base nitrogenada ____ em substituição à timina
Complete a frase: Durante a replicação do material genético, a enzima responsável pelo rompimento das pontes de hidrogênio e pela separação das fitas parentais é a ____
Complete a frase: O início da transcrição de um gene é mediado pelo reconhecimento de um sítio regulador específico no DNA denominado ____
Complete a frase: No processo de síntese proteica, a molécula que transporta as instruções genéticas do núcleo para o citoplasma em células eucarióticas é o ____
Complete a frase: A finalização da tradução de uma cadeia polipeptídica ocorre quando o ribossomo atinge um sinal de terminação específico no mRNA conhecido como ____
Complete a frase: As purinas, moléculas heterocíclicas que compõem o código genético e apresentam um sistema de dois anéis fundidos, são representadas pela _____.
Complete a frase: A maior labilidade química do RNA em meios alcalinos, quando comparado à estabilidade do DNA, é atribuída fundamentalmente à presença do grupo _____ no carbono $2^\prime$ de sua pentose.
Complete a frase: Enquanto as ligações de hidrogênio conferem a especificidade lateral, a principal força termodinâmica que garante a estabilidade vertical da dupla hélice decorre do _____.
Complete a frase: Em organismos eucariotos, o processo de maturação do RNA mensageiro que consiste na remoção de sequências não codificantes e união de sequências codificantes é o _____.
Complete a frase: A replicação descontínua da fita tardia do DNA, causada pela unidirecionalidade da polimerase, resulta na formação de curtos segmentos de polinucleotídeos denominados _____.
Complete a frase: Diferentemente da DNA polimerase, a enzima RNA polimerase possui a autonomia catalítica de iniciar a síntese de uma nova fita sem a necessidade prévia de um _____.
Complete a frase: A união entre aminoácidos no ribossomo é catalisada pela atividade enzimática do próprio RNA ribossômico da subunidade maior, o que define o ribossomo como uma _____.
Complete a frase: A característica do código genético que permite que um mesmo aminoácido seja codificado por vários códons distintos é tecnicamente conhecida como _____.
Complete a frase: Mutações decorrentes da inserção ou deleção de um número de nucleotídeos que não seja múltiplo de três resultam em um erro crítico denominado _____.
Complete a frase: O estágio de regulação gênica que controla o acesso da RNA polimerase ao promotor para determinar se um gene será ou não copiado em RNA é o controle _____.
Durante uma investigação criminal, uma amostra de DNA foi analisada. Sabe-se que, em um fragmento dessa molécula, há 20% de adenina (A). Considerando a complementaridade das bases nitrogenadas e a estrutura da dupla hélice, qual é a porcentagem de citosina (C) nesse fragmento?