What types of genetic variants can be detected?

Genetic variants can be broadly classified into sequence variants, such as SNPs and small InDels, and structural variants, including large deletions, duplications, inversions, and translocations. Copy number variations (CNVs) are a subtype of SVs and can also be detected.

How do long-read sequencing technologies benefit Variant Calling?

Long-read sequencing technologies, like PacBio SMRT sequencing and Oxford Nanopore sequencing , provide advantages such as detecting variants in complex genomic regions that are challenging for short-read methods. They offer high precision, avoid PCR bias, and enable the resolution of variant phasing.

What is the typical workflow for Variant Calling at CD Genomics?

The workflow includes data processing and quality control, mapping reads to the reference genome, performing variant calling, annotating variants, and visualizing the results. This ensures comprehensive and accurate detection of genetic variants.

Chamadas de Variantes

O que é Chamada de Variantes

A variação genética é um tipo de variação que pode ser herdada pela prole, causada por alterações no material genético de um organismo. É esta variação que faz com que os organismos apresentem diversidade genética em diferentes níveis. A diversidade genética é a base material para a sobrevivência e desenvolvimento da sociedade humana e das plantas. Existem muitos tipos de variação genética, desde inversões cromossómicas visíveis ao microscópio até mutações de nucleótido único. Com o desenvolvimento da genómica, a informação sobre variação genética tornou-se mais abrangente e incluiu SNPmutações InDel, SV, CNV e de transposões, et al.

A chamada de variantes refere-se ao uso de sequenciação de alto rendimento tecnologia para sequenciar e analisar as diferenças no genoma completo de um indivíduo ou população de uma espécie, para obter uma grande quantidade de informações sobre variação genética, como Polimorfismo de Nucleotídeo Único (SNP)Locais de inserção e deleção (InDel) e locais de variação estrutural (SV), variação no número de cópias (CNV) e outras informações. A chamada de variantes pode fornecer a base de dados mais básica e abrangente para o mapeamento funcional fino de genes subsequente e analisar rapidamente, com precisão e eficiência, as diferenças entre genomas, analisar cada base do genoma completo e obter os marcadores moleculares mais extensos.

Métodos para Detetar Variantes Estruturais

A deteção de variantes estruturais (SVs) é um aspecto essencial da investigação genómica. Várias metodologias foram desenvolvidas para realizar esta tarefa, cada uma com as suas forças e aplicações específicas:

Método Read-Pair (RP)

O método Read-Pair envolve a análise de leituras de sequenciamento de extremidades emparelhadas para examinar as suas relações espaciais. Variantes estruturais são inferidas a partir de anomalias nos tamanhos de inserção esperados ou a partir de inconsistências na orientação das leituras emparelhadas. Desvios das distâncias ou orientações antecipadas sugerem a presença de variantes estruturais.

Método de Leitura Dividida (SR)

O método Split-Read foca em instâncias onde um segmento de uma leitura se mapeia ao genoma de referência enquanto o seu contraparte não. Esta técnica é particularmente hábil em identificar inserções, deleções e outras alterações estruturais complexas dentro do genoma. O método destaca-se em localizar pontos de ruptura precisos de SVs.

Método de Profundidade de Leitura (RD)

O método Read-Depth avalia a profundidade das leituras de sequenciamento mapeadas a regiões genómicas específicas para descobrir CNVs. Flutuações na profundidade das leituras podem significar aumentos ou diminuições no número de cópias genómicas, revelando assim CNVs. Este método é vantajoso para detectar duplicações ou deleções em larga escala.

Método de Montagem (AS)

O método de montagem utiliza tecnologias de sequenciação de terceira geração, como PacBio SMRT ou Oxford Nanopore, em conjunto com abordagens de montagem de novo para identificar variantes estruturais extensas e intrincadas. Esta metodologia facilita a caracterização de alterações genómicas de longo alcance e complexas diretamente a partir de dados de sequenciação brutos, oferecendo uma visão abrangente das variantes estruturais.

Vantagens e Características da Chamada de Variantes

Abundância: Análise aprofundada de todos os aspectos da variação genética, incluindo SNP, InDel, SV, SNV, gene novo, entre outros.
Flexibilidade: com ou sem referência é adequado.
Precisão: diferentes métodos de sequenciação podem ser aplicados com base em diferentes materiais.

Aplicações da Chamada de Variantes

Pesquisa de Doenças: A descoberta de variantes genéticas associadas a doenças lança luz sobre as suas bases genéticas e ajuda a identificar potenciais biomarcadores e alvos de tratamento.
Medicina Personalizada: Os insights genéticos permitem planos de tratamento personalizados e uma melhor utilização de medicamentos ao identificar variantes que influenciam o metabolismo dos fármacos.
Investigação Agrícola: A identificação de variantes genéticas ligadas a características desejáveis ajuda no desenvolvimento de novas variedades e no aumento da produtividade na reprodução de plantas e animais.

Fluxo de Trabalho de Chamada de Variantes

The Workflow of Variant Calling.

Especificações do Serviço

	Requisitos de Amostra Amostra de ADN: ~0,5 μg (concentração ≥ 10 ng/μl; OD260/280=1,8~2,0) Nota: Os montantes de amostra são indicados apenas para referência. Para informações detalhadas, por favor contacte-nos com os seus pedidos personalizados.
Clique	Estratégia de Sequenciamento 10X/detecção para SNP e pequenas InDel; 20X/detecção para SV; 30X/detecção para CNV. GBS: 10~20W Etiquetas; média de 8 X/Etiqueta Plataforma Illumina Hiseq, plataforma de sequenciação de leitura longa MGI DNBSEQ-T7/DNBSEQ-G400 Análise de métricas de qualidade de sequenciação
	Análise Bioinformática Fornecemos múltiplas análises de bioinformática personalizadas: QC de dados brutos Alinhamento ou montagem de referência Informação sobre variantes Análise personalizada Nota: Os dados recomendados e os conteúdos de análise apresentados são apenas para referência. Para informações detalhadas, por favor contacte-nos com os seus pedidos personalizados.

Pipeline de tecnologia de sequenciação

Baseado em montagem do genoma completo
Baseado em reessequenciamento do genoma completo
Baseado em sequenciação genómica de representação reduzida

The Data Analysis Pipeline of Variant Calling.

Entregáveis

Os dados de sequenciação originais
Resultados experimentais
Relatório de análise de dados

Referências

Jansen S, Aigner B, Pausch H, et al. Avaliação da variação genómica numa população de gado através do re-sequenciamento de animais-chave com cobertura baixa a média. BMC Genómica, 2013, 14(1): 1.
Zheng L Y, Guo X S, He B, et al. Padrões genómicos de variação genética em sorgo doce e de grão (Sorghum bicolor). Biologia do Genoma, 2011, 12(11):287-302.
Alkan C, Coe BP, Eichler EE. Descoberta e genotipagem de variações estruturais do genoma. Nature Reviews GeneticsMaio de 2011;12(5):363-76.

Resultados da Demonstração

Os resultados parciais estão mostrados abaixo:

The Variant Calling Results Display Figure.

Perguntas Frequentes sobre Chamadas de Variantes

1. Que tipos de variantes genéticas podem ser detectadas?

As variantes genéticas podem ser amplamente classificadas em variantes de sequência, como SNPs e pequenas InDels, e variantes estruturais, incluindo grandes deleções, duplicações, inversões e translocações. As variações no número de cópias (CNVs) são um subtipo de SVs e também podem ser detectadas.

2. Como é que as tecnologias de sequenciação de longas leituras beneficiam a Chamada de Variantes?

Sequenciação de leitura longa tecnologias, como Sequenciação SMRT da PacBio e Oxford Sequenciação por nanopore, oferecem vantagens como a deteção de variantes em regiões genómicas complexas que são desafiadoras para métodos de leitura curta. Oferecem alta precisão, evitam viés de PCR e permitem a resolução da fase das variantes.

3. Qual é o fluxo de trabalho típico para a Chamada de Variantes na CD Genomics?

O fluxo de trabalho inclui processamento de dados e controlo de qualidade, mapeamento de leituras ao genoma de referência, realização de chamada de variantes, anotação de variantes e visualização dos resultados. Isto assegura a deteção abrangente e precisa de variantes genéticas.

Estudos de Caso de Chamada de Variantes

Montagem do genoma do pak choi não cabeçudo e comparação com os genomas do repolho chinês cabeçudo e da mostarda amarela de óleo.

Jornal: Jornal de Biotecnologia Vegetal
Fator de impacto: 10,1
Publicado: 07 de dezembro de 2020

Fundo

As culturas de Brassica incluem espécies diploides e espécies amfidiploides. O genoma do pak choi, intimamente relacionado com o sarson amarelo e o repolho chinês de cabeçote, foi montado utilizando Sequenciação de moléculas únicas PacBio e tecnologias Hi-C. Esta montagem identificou numerosas variantes genéticas, incluindo SNPs, indels e genes específicos de espécies, aumentando a nossa compreensão da diversidade das culturas de Brassica e da genética de características.

Materiais e Métodos

Preparação de Amostras

Materiais vegetais
Amostras de folhas
Extração de DNA

Sequenciação

Sequenciação do genoma
Sequenciação SMRT da PacBio
RNA-seq

Análise de Dados

De novo assembleia
Montagem e avaliação de cromossomas
Análises do transcriptoma
Repetir anotação
Predição de genes
anotação funcional
Análise de variação estrutural
Análise comparativa do genoma

Resultados

Numa publicação online de 2020 sobre "Couve"^[1]Uma análise comparativa das variações entre três tipos de couve, incluindo Variações de Presença/Ausência (PAVs) entre genes, Variantes Estruturais (SV) dentro do genoma e Polimorfismos de Nucleotídeo Único (SNPs), revelou insights significativos. Especificamente, foram observadas diferenças em SV dentro dos genes de forma das folhas (por exemplo, KAN da família de fatores de transcrição GARP) e os papéis inibitórios de genes relacionados à floração (por exemplo, MAF4, SVP) entre os três tipos morfológicos (como ilustrado na Figura 1, à esquerda). Estas descobertas têm uma importância crucial na compreensão dos mecanismos moleculares que governam a morfogénese dos órgãos e a floração, bem como nas melhorias genéticas, na couve e em culturas vegetais relacionadas.

Figure 1: Distribution of Presence–Absence Variants (PAV) and Specific Structural Variants (SVs) in the Cabbage Genome. (Li et al., 2020) Figura 1: PAV e SVs Específicos no Genoma do Repolho^[1]

Outros casos:

A Influência de Variantes Estruturais (SVs) na Estrutura Génica e na Expressão Génica

Para validar a aplicabilidade da análise SV e explorar a sua utilidade em estudos evolutivos populacionais, uma publicação online de 2020 sobre "Tomate".^[2] realizaram uma investigação. Os investigadores obtiveram uma árvore evolutiva sistemática baseada em mais de 800 materiais com SNPs a partir de dados de sequenciação de leitura curta (Figura 2A). Subsequentemente, selecionaram um conjunto representativo de 100 materiais de 7 linhagens e recolheram dados de sequenciação de leitura longa para construir um diagrama em árvore baseado em dados de SV (Figura 2B).

Os resultados indicaram que os materiais selecionados estavam distribuídos dentro dos seus grupos taxonómicos conhecidos, alinhando-se com a classificação baseada em SNP. Isto demonstra a adequação dos SVs para a análise genética de populações.

Figure 2: Phylogenetic Tree of Tomato. (Alonge et al., 2020) Figura 2: Árvore Evolutiva Sistemática do Tomate^[2]

Numa publicação online de 2020 sobre "Arroz"^[3]Os investigadores construíram diagramas de estrutura populacional com base em dados de SNP (Figura 3A) e dados de SV (Figura 3B). A análise de SNP revelou uma divisão ampla da população em aproximadamente seis grupos, com uma clara distinção entre as variedades de arroz japonica e indica. Curiosamente, a análise de SV produziu resultados altamente consistentes, apoiando ainda mais a diferenciação observada na análise de SNP.

Figure 3: Genetic Composition of Rice. (Yixuan et al., 2020) Figura 3: Estrutura Genética do Arroz^[3]

Espectro de Frequência de Mutação da População SV

Para investigar os impactos significativos de variantes deletérias, a publicação de 2020 sobre arroz^[3] espectros de frequência calculados para locais não codificantes em diferentes grupos (Figura 4-A, B, C). Cada SFS inclui cinco tipos de SV (DUP, DEL, TRA, MEI e INV) e dois tipos de SNP (Sin, Nsin) e revela três características notáveis:

Existem diferenças significativas entre vários grupos populacionais, consistentes com o aumento da deriva genética durante os gargalos de domesticação e mudanças nos sistemas de acasalamento.

A proporção de SVs fixos é inferior à de SNPs sinónimos fixos e SNPs não sinónimos. Os SVs têm uma frequência mais baixa no genoma e são mais propensos a serem eliminados após mutação, indicando uma maior probabilidade de dano associado aos SVs.

Os eventos INV exibem o SFS mais extremo, com mais de 90% dos eventos INV identificados em três ou menos indivíduos em cada grupo, implicando que os eventos INV podem estar sob forte seleção durante o processo evolutivo.

Os investigadores realizaram uma análise estatística das localizações de SVs e SNPs nos cromossomas, e os resultados dos testes indicam uma correlação significativa entre a diversidade de SVs e SNPs em janelas cromossómicas (Figura 4-D). Isto sugere que os SVs fornecem informação genética populacional que é fundamentalmente consistente com os SNPs.

Figure 4: Spectrum of Structural Variant (SV) Frequencies. (Yixuan et al., 2020) Figura 4: Espectros de Frequência SV^[3]

Análise de Desequilíbrio de Ligação com SVs

No estudo do [arroz]^[3]O LD (Desequilíbrio de Ligação) foi calculado para três grupos populacionais distintos utilizando dados de SNP, SV e SNP+SV. Devido aos seus efeitos potencialmente prejudiciais, os SVs frequentemente apresentam frequências populacionais mais baixas em comparação com os SNPs e podem experimentar uma degradação de LD mais rápida ao longo de distâncias físicas (Figura 5). Os dados de SNP mostraram que, dentro de aproximadamente 100 kb, o r² para SNPs japonica manteve-se em torno de 0,2, enquanto para indica, foi aproximadamente 0,1. Na mesma distância física, o r² para rufipogon foi inferior a 0,05. No entanto, os valores de r² para SVs foram inferiores aos dos SNPs em todos os grupos populacionais, com valores superiores a 0,1 apenas dentro de distâncias muito curtas (<15 kb).

Figure 5: Analysis of Linkage Disequilibrium. (Yixuan et al., 2020) Figura 5: Análise de Desequilíbrio de Ligação^[3]

Estudo de Domesticação de Populações

Na pesquisa realizada sobre o arroz^[3]Uma avaliação das disparidades genómicas entre polimorfismos de nucleótido único (SNPs) e variantes estruturais (SVs) revelou uma distinção notável. O estudo observou que a estimativa média de FST para SNPs era significativamente mais alta em comparação com SVs. Esta descoberta indica que as SVs apresentam, em geral, frequências populacionais mais baixas quando contrastadas com SNPs.

Ao integrar estes dados com genes de domesticação e melhoria bem estabelecidos, a investigação reafirmou o substancial enriquecimento destes genes dentro dos intervalos FST de 1% e 10%. Consequentemente, isso forneceu informações valiosas sobre genes funcionais associados a processos fisiológicos, características morfológicas e qualidade alimentar (Figura 3).

Figure 6: Characteristics of Structural Variants (SVs) Related to Domestication. (Yixuan et al., 2020) Figura 6: Características SV Associadas à Domesticação^[3]

Análise de Associação de Genoma Inteiro

Na publicação de 2020 sobre [canola]^[4]Foi realizado um GWAS (Estudo de Associação em Larga Escala do Genoma) utilizando os PAVs identificados de oito variedades de colza. Esta análise revelou relações causais entre os PAVs e características como o comprimento da síliqua, o peso das sementes e o tempo de floração. Curiosamente, estas descobertas significativas foram negligenciadas nos resultados do SNP-GWAS (Figura 7).

Da mesma forma, na publicação de 2021 sobre [pêssego]^[5]Foram observados SVs candidatos associados a características como a maturação precoce dos frutos, a cor do pericarpo em torno do caroço, a forma do fruto e a formação de forma achatada (Figura 8).

Figure 7: GWAS Analysis Results for Presence–Absence Variants (PAV) in Canola. (Song et al., 2020) Figura 7: Resultados da Análise PAV_GWAS de Canola^[4]

Figure 8: GWAS Analysis Results for Structural Variants (SVs) in Peach. (Jiantao et al., 2021) Figura 8: Resultados da Análise SV_GWAS do Pêssego^[5]

Referências

Li P, Su T, Zhao X, et al. Montagem do genoma do pak choi não cabeçudo e comparação com os genomas do repolho chinês cabeçudo e da mostarda amarela oleaginosa. Jornal de Biotecnologia Vegetal, 2020.
Alonge M, Wang X, Benoit M, et al. Impactos Maior da Variação Estrutural Generalizada na Expressão Génica e Melhoria de Culturas em Tomate. Célula, 2020.
Yixuan K, Yi L, Tuomas T, et al. Genómica Evolutiva da Variação Estrutural na Domesticação do Arroz Asiático (Oryza sativa). Biologia Molecular e Evolução, 2020.
Song J, Guan Z, Hu J, et al. Oito Genomas de Alta Qualidade Revelam a Arquitetura do Pan-genoma e a Diferenciação de Ecótipos de Brassica napus. Plantas da Natureza, 2020.
Jiantao G, Yaoguang X, Yang Y, et al. Análises de variação da estrutura do genoma do pêssego revelam dinâmicas populacionais e uma inversão causal de 1,67 Mb para a forma do fruto. Biologia Genómica, 2021.

Publicações Relacionadas

Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:

Colecção de dados genéticos em estudos baseados em etnias entre Aymaras, Quechuas e Mestizos: os desafios do estudo sobre a Genética do Alzheimer na População Peruana (GAPP)

Revista: Alzheimer e Demência

Ano: 2022

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça o conteúdo que deseja traduzir.

Avaliação de Biomarcadores Plasmáticos para a Classificação A/T/N da Doença de Alzheimer entre Adultos de Etnia Hispânica Caribenha

Jornal: JAMA Network Open

Ano: 2023

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei prazer em ajudar com a tradução.

Aumento da Produção de Esporos Fúngicos Patogénicos e Transportados pelo Ar após Exposição de uma Micobiota do Solo a Poluentes Hidrocarbonetos Aromáticos Clorados

Revista: Microbiology Spectrum

Ano: 2023

Desculpe, não posso acessar links ou conteúdos externos. No entanto, posso ajudar com traduções ou responder a perguntas específicas. Como posso ajudar?

Uma Variante de Splicing no Gene SLC16A8 Leva a um Défice de Transporte de Lactato em Células Epiteliais Pigmentares da Retina Derivadas de Células iPS Humanas

Revista: Células

Ano: 2021

Desculpe, mas não posso acessar ou traduzir conteúdo de links externos. Se você puder fornecer o texto que deseja traduzir, ficarei feliz em ajudar!

Ver mais artigos publicados pelos nossos clientes.