Ficha Informativa: Sequenciação de RNA e Análise de Dados

O Que Faz a Sequenciação de RNA?

A sequenciação de RNA, ou RNA-Seq, é uma técnica poderosa de biologia molecular que fornece insights abrangentes sobre o transcriptoma de um organismo.

Por exemplo, o gene3 pode mostrar uma atividade elevada em células normais, enquanto o gene2 exibe uma expressão elevada em células mutantes. Entretanto, o gene1 apresenta níveis de expressão consistentes em ambos os tipos de células. A tecnologia de sequenciação de RNA de alto rendimento mede a abundância de transcritos de vários genes dentro das células, revelando quais genes estão ativamente transcritos.

O artigo O que é Sequenciação de RNA (RNA-Seq)? pode ser útil para aprender sobre RNA-seq.

O Que São Reads, Comprimento de Read, Profundidade de Read e Número de Reads?

Reads, também conhecidos como sequências downstream, são sequências de bases nucleotídicas obtidas a partir de fragmentos de ácidos nucleicos de uma amostra analisados por um sequenciador, representadas como cadeias como "ATCAGATA.....".

As reads de RNA-Seq são sequências obtidas de moléculas de RNA em uma amostra, tipicamente geradas através de técnicas de sequenciação de RNA. Essas reads representam fragmentos de moléculas de RNA e são cruciais para entender a expressão gênica, o splicing alternativo e outros processos relacionados ao RNA. Semelhante às reads de sequenciação genômica, as reads de RNA-Seq também consistem em bases nucleotídicas, e sua análise fornece insights valiosos sobre o transcriptoma de um organismo sob condições ou tratamentos específicos.

O comprimento de read denota o número de bases em cada read. Por exemplo, quando dizemos que uma read tem 50 pares de bases (pb) de comprimento, isso significa que consiste em 50 bases medidas em uma única sequência.

A profundidade de read refere-se à quantidade de reads adquiridas através da sequenciação de uma amostra. Muitas vezes é confundida com a cobertura de sequenciação do genoma, que se refere à extensão das regiões genômicas sequenciadas, e a profundidade de sequenciação, representando a frequência de sequenciação de um único nucleotídeo ou a profundidade média entre todos os nucleotídeos sequenciados.

O número de reads reflete o volume de dados gerados através da sequenciação, muitas vezes expresso como entradas. No contexto de aplicações como Sequenciação Metagenómica de Próxima Geração (mNGS), o número de reads serve como uma métrica crucial para detectar microorganismos patogénicos específicos, ajudando na sua caracterização e quantificação.

Os serviços de sequenciação de RNA de alto rendimento e construção de bibliotecas da CD Genomics permitem uma análise aprofundada de transcriptomas. A CD Genomics fornece um serviço robusto de pesquisa de transcriptoma em amostras de alta qualidade.

Principais Etapas da RNA-Seq (Baseado no Protocolo Illumina)

Etapa 1: Extração de RNA

O RNA da amostra de interesse é extraído.

Etapa 2: Fragmentação do RNA

Moléculas de RNA, tipicamente com milhares de bases de comprimento, são fragmentadas em pedaços menores. Esta fragmentação é necessária porque o comprimento de read do sequenciador é limitado (geralmente 200 a 300 pb), permitindo a sequenciação.

Etapa 3: Transcrição Reversa

O RNA fragmentado é transcrito reversamente em DNA complementar (cDNA). O DNA de dupla fita é mais estável que o RNA e é mais fácil de amplificar e manipular.

Etapa 4: Adição de Adaptadores de Sequenciação

Adaptadores de sequenciação são adicionados às extremidades do DNA de dupla fita. Estes adaptadores contêm sequências que são complementares àquelas no chip do sequenciador, permitindo que o sequenciador reconheça e sequencie os fragmentos de DNA de forma eficiente. Amostras diferentes podem usar sequências de adaptadores distintas, permitindo a multiplexação de amostras em uma única corrida de sequenciação. É importante notar que a eficiência da adição de adaptadores pode variar, levando a alguns fragmentos de DNA não serem reconhecidos pelo sequenciador.

Etapa 5: Amplificação por PCR

A amplificação por PCR é realizada usando primers projetados com base nas sequências de adaptadores adicionadas. Esta etapa de amplificação amplifica seletivamente fragmentos de DNA que contêm as sequências de adaptadores.

Etapa 6: Controle de Qualidade

A concentração e o comprimento da biblioteca construída são determinados para garantir um desempenho de sequenciação ótimo. Bibliotecas com concentração e comprimento apropriados são selecionadas para prosseguir com a sequenciação.

Etapa 7: Sequenciação

A biblioteca construída é submetida à sequenciação usando a plataforma de sequenciação escolhida.

Pré-processamento de Dados de Sequenciação de RNA

Após a sequenciação, o conjunto de dados geralmente compreende aproximadamente 400 milhões de reads de RNA-seq, cada uma consistindo de quatro linhas. Antes da análise, é essencial pré-processar esses dados.

1. Pré-processamento de Dados: Filtragem de Reads de RNA-seq de Baixa Qualidade

Reads de RNA-seq de baixa qualidade, caracterizadas por reconhecimento de bases de baixa qualidade ou interferência composta, devem ser filtradas. Em condições normais, um fragmento de RNA-seq compreende duas junções de sequenciação e um fragmento de DNA. No entanto, sob condições anormais, um fragmento de RNA-seq pode consistir apenas em duas junções de sequenciação.

2. Alinhamento de Reads de RNA-seq de Alta Qualidade ao Genoma

A extensa sequência de bases do genoma exige sua fragmentação em numerosas sequências curtas de bases, que são indexadas e suas localizações cromossômicas registradas. Da mesma forma, as reads de RNA-seq são fragmentadas em pequenos segmentos. Esses fragmentos de read são então alinhados com os fragmentos correspondentes do genoma. Ao corresponder os pequenos fragmentos de reads de RNA-seq com os do genoma, a localização cromossômica de cada fragmento de read pode ser inferida.

3. Contagem de Reads por Gene

Uma vez determinada a localização cromossômica de cada read de RNA-seq, torna-se possível verificar se uma read cai dentro de um gene específico. Por exemplo, ao conhecer as coordenadas de genes como Xkr4 (Cromossomo 1, posição: 3204563-3661579) e Rp1 (Cromossomo 1, posição: 4280927-4399322), a contagem de reads localizadas nessas coordenadas pode ser contabilizada, resultando em contagens de reads para genes. Este processo permite a construção de uma matriz de contagem de reads.

4. Normalização de Dados de Sequenciação

Como diferentes amostras podem ser comparadas com números variados de reads no genoma, podem surgir discrepâncias nas contagens de reads. Por exemplo, a Amostra 1 pode ter 635 reads totais, enquanto a Amostra 2 tem 1270, quase o dobro da Amostra 1. No entanto, isso não indica o dobro da transcrição gênica na Amostra 2. Em vez disso, significa que há menos reads de baixa qualidade na Amostra 2, que são interpretadas pelo sequenciador como mais fluorescentes. Para comparar com precisão as contagens de reads e refletir as diferenças na transcrição gênica, os dados de contagem de reads para cada gene precisam ser ajustados. Métodos simples incluem dividir o valor de contagem de reads para cada gene pelo total de contagem de reads da amostra. Alternativamente, métodos de normalização mais complexos, como RPKM, FPKM, TPM, etc., também podem ser empregados.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo