O que é Sequenciamento Skim?
A sequenciação skim, também conhecida como sequenciação de genoma completo de baixa cobertura, é uma aplicação de sequenciação de próxima geração (NGS) onde cada amostra é sequenciada com uma cobertura superficial (normalmente variando de 0,01x a 1x). Ao contrário dos métodos que sequenciam apenas uma fração do genoma (como GBS ou RAD-seq), as leituras da sequenciação skim estão distribuídas aleatoriamente por todo o genoma. Quando combinados com pipelines de imputação e análise sofisticados, estes dados de baixa cobertura podem ser utilizados para identificar variantes, genotipar indivíduos e caracterizar estruturas genómicas com alta precisão.
Desenvolvido originalmente para superar as limitações de custo e escalabilidade do sequenciamento profundo para grandes populações, aproveita o custo cada vez menor do sequenciamento para fornecer uma visão "genoma-largura" que é ao mesmo tempo abrangente e económica. Para além de alvos de alta abundância, como os plastomas, estes dados também podem ser utilizados para identificar genes nucleares de baixa cópia, expandindo significativamente o alcance das suas aplicações.
Por que escolher o sequenciamento Skim?
Para as empresas agrícolas, instituições de investigação e programas de conservação, a sequenciação superficial representa o equilíbrio ideal entre a riqueza de dados, o rendimento e o orçamento.
Comparação de Abordagens de Genotipagem:
| Recurso | Sequenciação Skim | Genotipagem por Sequenciação (GBS) | Microarranjos SNP |
|---|---|---|---|
| Cobertura do Genoma | Genoma completo, amostragem aleatória | Representação reduzida (locais específicos) | Posições pré-definidas e fixas |
| Descoberta de Marcadores | Ilimitado, em todo o genoma | Limitado a locais de restrição | Não é possível (sistema fechado) |
| Custo por Amostra | Muito Baixo (em escala) | Baixo | Moderado a Alto |
| Escalabilidade | Extremamente Alto (1000s de amostras) | Alto | Alto |
| Melhor Para | Criação em grande escala, descoberta de novos traços, análise de variantes estruturais | Estudos direcionados, espécies com orçamentos reduzidos | Triagem rotineira com conjuntos de marcadores conhecidos e estáveis |
O principal motor para a adoção é custoA sequenciação em skim reduz o principal estrangulamento do custo e do tempo de construção de bibliotecas através de protocolos de baixo volume e altamente multiplexados. Além disso, fornece dados à prova de futuroAo contrário dos arrays, os dados de sequência bruta podem ser reanalisados à medida que surgem novas questões genéticas ou que os genomas de referência melhoram, protegendo o seu investimento.
Aplicações do Serviço de Sequenciamento Skim na Genómica Agrícola
O nosso serviço é especificamente concebido para capacitar a agricultura:
- Seleção Genómica e Aceleração da ReproduçãoGenotipar rapidamente grandes populações de reprodução (por exemplo, milhares de linhagens) para prever o desempenho de características complexas e selecionar progenitores superiores, encurtando significativamente os ciclos de reprodução.
- Mapeamento Genético de Alta ResoluçãoPotenciar estudos de associação genómica em todo o genoma (GWAS) e mapeamento de locus de características quantitativas (QTL) com marcadores densos e abrangentes para identificar genes que controlam o rendimento, a resistência a doenças, a tolerância à seca e características de qualidade.
- Introdução e Acompanhamento de RetrocruzamentosIdentificar e caracterizar precisamente segmentos genómicos desejáveis (por exemplo, de parentes selvagens) em linhas de melhoramento. Monitorizar o progresso do retrocruzamento para manter a genética essencial enquanto se adicionam novas características.
- Análise Estrutural e CitogenéticaDetetar anomalias cromossómicas, estimar a variação do número de cópias (dosagem) e identificar translocações ou aneuploidia—crítico para culturas poliploides como o trigo e para a saúde do gado.
- Diversidade Genética e Caracterização de RecursosPerfilar eficientemente colecções de germoplasma, variedades heirloom e parentes selvagens para avaliar a diversidade genética, identificar alelos únicos e informar estratégias de conservação.
Fluxo de Trabalho do Serviço de Sequenciamento Skim
O nosso fluxo de trabalho simplificado, de ponta a ponta, garante fiabilidade, qualidade e rápida execução.

Análise Bioinformática de Sequenciamento de Skim
Transformamos dados de sequenciação bruta em insights biológicos acionáveis. Os nossos pacotes standard e avançados incluem:
Processamento de Dados Padrão:
- Desmultiplexagem e aparo de adaptadores.
- Controlo de qualidade (FastQC, MultiQC).
- Alinhamento ao genoma de referência (BWA-MEM).
- Chamadas de variantes brutas (GATK).
- Entrega de ficheiros FASTQ, BAM e VCF iniciais.
Módulos de Análise Avançada:
- Imputação de GenótiposUtiliza informações de haplótipos a nível populacional para prever com precisão genótipos em falta, aumentando efetivamente a resolução e a utilidade de dados de baixa cobertura.
- Genética PopulacionalAnálise da diversidade genética, estrutura populacional e relações filogenéticas utilizando ferramentas como PLINK e ADMIXTURE.
- Estudo de Associação Genómica (GWAS)Identificação de marcadores estatisticamente associados a características de interesse.
- Deteção de Variantes EstruturaisIdentificação de variantes de número de cópias (CNVs), inversões e translocações utilizando análises de profundidade de leitura e leituras divididas.
- Aplicações Sem MontagemPara amostras metagenómicas ou não caracterizadas, oferecemos ferramentas como o Skmer, que calcula distâncias genómicas para identificação sem precisar de um genoma de referência.
Para análises bioinformáticas personalizadas ou necessidades de pesquisa específicas, entre em contacto com os nossos especialistas para obter conselhos e apoio profissional adaptados aos requisitos do seu projeto.

Requisitos de Amostra para Sequenciação Skim
Para garantir o sucesso do projeto, recomendamos o seguinte:
| Tipo de Amostra | Quantidade Mínima | Métricas de Qualidade |
|---|---|---|
| DNA genómico | 100 ng (para preparação da biblioteca) | A260/A280: 1,8-2,0; A260/A230 >2,0. Intacto em gel (alto peso molecular). |
| Tecido Vegetal | Tecido foliar jovem (100-200 mg) | Fresco, congelado (em N₂ líquido) ou preservado em um tampão fiável (por exemplo, CTAB, gel de sílica). |
| Tecido Animal | 25 mg (por exemplo, corte na orelha, sangue, sémen) | Congelado fresco ou preservado em etanol. Evite a contaminação cruzada. |
Por que escolher a CD Genomics para sequenciação Skim?
Não somos apenas um prestador de serviços; somos um parceiro na sua descoberta científica.
- Especialização e Tecnologia ComprovadasO nosso protocolo baseia-se em métodos publicados e revistos por pares, desenvolvidos para genotipagem de plantas e animais em larga escala. Implementamos pipelines de imputação de última geração comprovados em trabalhos contratados pelo governo.
- Escalabilidade para Projetos de Grande EscalaQuer esteja a processar 100 ou 10.000 amostras, o nosso fluxo de trabalho de multiplexação otimizado oferece precisão consistente sem ultrapassar o seu orçamento. Estamos totalmente equipados para apoiar os extensos ensaios essenciais para a investigação agrícola moderna.
- Suporte e Personalização de Ponta a PontaDesde o design experimental até à interpretação final, a nossa equipa de cientistas com doutoramento oferece apoio contínuo. Personalizamos análises para diversas espécies — desde culturas de sequeiro e gado até espécies especiais e comunidades microbianas.
- Segurança de Dados e ConformidadeAdherimos a rigorosos acordos de confidencialidade de dados. O nosso pipeline de bioinformática pode integrar-se opcionalmente com ferramentas de triagem de biossegurança (por exemplo, NCBI BLAST, SecureDNA) para analisar sequências em relação a patógenos de preocupação, garantindo uma condução responsável da investigação.

Referências:
- Adhikari L., et al. Uma abordagem de sequenciação em larga escala para genotipagem, estimativa de dose e identificação de translocações. Sci Rep 12(1), 17583 (2022).
- Kumar P., et al. Sequenciação por skim: uma tecnologia NGS avançada para a melhoria de culturas. J Genet 100, 38 (2021).
- Sarmashghi S., et al. Skmer: identificação de amostras sem montagem e sem alinhamento utilizando esboços genómicos. Genome Biol 20, 34 (2019).
- Berger B.A., et al. As profundidades inesperadas dos dados de varredura do genoma: Um estudo de caso examinando os genes de simetria floral da Goodeniaceae. Appl Plant Sci 5(10), 1700042 (2017).
Perguntas Frequentes
1. Qual é a cobertura mínima que posso utilizar e qual é a precisão?
Para espécies bem caracterizadas com bons genomas de referência e dados populacionais para imputação, a cobertura pode ser tão baixa quanto 0,1x a 0,5x pode gerar chamadas de genótipo altamente precisas (por exemplo, para GWAS e seleção genómica). Para a deteção de variantes estruturais ou trabalho com espécies novas, pode ser recomendado um cobertura de 1x ou superior. Os nossos bioinformáticos aconselharão sobre a cobertura ideal para os seus objetivos.
2. O meu organismo não tem um genoma de referência perfeito. Posso ainda assim usar sequenciação skim?
Absolutamente. Para a genética dentro de uma população, um genoma de rascunho ou um genoma de um parente próximo é frequentemente suficiente para o alinhamento e a chamada de variantes. Além disso, métodos sem montagem O Skmer pode ser utilizado para identificação de amostras e análise de diversidade sem qualquer genoma de referência.
3. Como é que o sequenciamento parcial se compara ao sequenciamento do genoma completo (WGS) para o meu programa de melhoramento?
A sequenciação por skim é essencialmente WGS de baixa coberturaA principal diferença é o custo por amostra. Pelo preço de sequenciação profunda (30x) de um indivíduo, pode-se realizar sequenciação superficial em centenas. Se os seus objetivos principais são genotipagem, seleção e mapeamento—e não descobrir cada variante rara em um indivíduo— a sequenciação superficial oferece muito mais poder e retorno sobre o investimento para a reprodução.
4. Consegue lidar com amostras do campo, como folhas armazenadas em RNA-later ou gel de sílica?
Sim. Temos uma vasta experiência no processamento de diversos tipos de amostras. Embora o DNA fresco e de alta qualidade seja o ideal, oferecemos consultoria sobre os melhores métodos de preservação para as suas condições de campo e podemos realizar serviços de extração, se necessário.
Estudo de Caso
A diversidade limitada de haplótipos subjacente à arquitetura de traços poligénicos ao longo de 70 anos de melhoramento do trigo.
DiárioBiologia Genómica
Fator de Impacto17,9 (2022)
Publicado: 2021
DOIDesculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e eu ficarei feliz em ajudar com a tradução.
À Primeira Vista
- Organismo: Trigo de Pão HexaploideTrigo comum), ~17 Gb genoma.
- População: NIAB Diverse MAGIC (500+ Linhas Inbred Recombinantes).
- Método: Sequenciação Skim (WGS de baixa cobertura) a ~0,3x de cobertura.
- Resultado: 1,1 milhões de SNPs de alta qualidade imputados com >99% de precisão.
- Conclusão Principal: O sequenciamento por skim proporcionou uma taxa de chamada 3 vezes superior à genotipagem direta e permitiu um mapeamento de alta resolução de traços poligénicos.
O Desafio: Genotipagem de um Poliploide Complexo
Investigadores do NIAB e da UCL procuraram analisar a arquitetura genética das mudanças fenotípicas históricas no trigo. Criaram uma população de Intercruzamento de Múltiplos Pais de Geração Avançada (MAGIC) derivada de 16 variedades históricas de trigo do Reino Unido lançadas entre 1935 e 2004.
Os Obstáculos:
- Tamanho do GenomaO genoma do trigo é massivo (17 Gb) e hexaploide, tornando o sequenciamento profundo proibitivamente caro para centenas de linhagens.
- Limitações de ArrayAs matrizes SNP tradicionais muitas vezes sofrem de viés de ascensão (detectando apenas variantes comuns) e enfrentam dificuldades com a complexidade poliploide.
- EscalaO estudo exigiu genotipagem de mais de 500 linhas recombinantes endogâmicas (RILs) para mapear características de forma eficaz.
A Solução: Sequenciação de Skim + Imputação
Em vez de utilizar sequenciação profunda cara ou arrays restritivos, a equipa utilizou Sequenciação Superficial. Eles sequenciaram os 550 RILs a uma profundidade média de apenas 0,304x.
Para recuperar dados de genótipo de alta qualidade a partir destes dados brutos escassos, aplicaram imputação utilizando o software STITCH. Este processo aproveitou os blocos de haplótipos herdados dos fundadores para preencher as lacunas.
A Metodologia
- FundadoresAs 16 linhagens fundadoras foram sequenciadas de forma mais profunda utilizando captura de promotores-gene para criar uma referência de haplótipos.
- ProleOs mais de 500 RILs foram sequenciados com baixa cobertura (~0,3x).
- ImputaçãoOs genótipos foram inferidos com base na probabilidade de portar haplótipos fundadores específicos.
Validação: Precisão Comparável a Arrays de "Padrão Ouro"
O estudo validou os dados de Sequenciamento Skim contra um subconjunto de marcadores do array SNP Axiom 35k. Os resultados confirmaram que o sequenciamento de baixa cobertura é altamente fiável.
| Métrico | Resultado |
|---|---|
| Precisão da Imputação | 99,1% de concordância com os genótipos do array. |
| Rendimento SNP | 1,13 milhões de SNPs de alta qualidade (vs. ~20 mil na matriz). |
| Taxa de Chamada Eficaz | 99,6% (aumentou 3 vezes em relação aos dados de leitura bruta). |
Perspectiva CríticaA análise de downsampling mostrou que os genótipos podiam ser inferidos com precisão a partir de uma cobertura tão baixa quanto 0,076x por amostra. Além disso, a precisão da imputação permaneceu alta (>98%) mesmo sem usar os fundadores como painel de referência, demonstrando a robustez do método.
Aplicação: Mapeamento de Precisão e Predição Genómica
Os dados de alta densidade gerados através da Sequenciação Skim permitiram aos investigadores dissecarem características agronómicas complexas com precisão.
Mapeamento de QTL de Alta Resolução
A equipa mapeou 136 associações significativas em todo o genoma em 47 características.
- Identificaram 42 loci genéticos distintos que controlam características como rendimento, resistência a doenças e altura.
- A maioria das características foi encontrada a ser altamente poligénica, controlada por uma mistura fina de haplótipos.
2. Descobrir Compromissos
Os dados revelaram uma extensa pleiotropia (genes únicos a afetar múltiplas características). Especificamente, analisaram a troca negativa entre o Rendimento de Grão (RG) e o Teor de Proteína no Grão (TPG).
- Usando os dados genotípicos densos, identificaram que a presença de espigas (barbas na espiga de trigo) está associada a uma desvio positivo na relação entre rendimento e proteína.
- Esta visão fornece um objetivo claro para os criadores melhorarem simultaneamente o rendimento e a proteína.
3. Predição Genómica
Usando modelos LASSO nos dados Skim Seq, os investigadores alcançaram uma elevada precisão de previsão para linhas fora da amostra.
- A precisão da previsão foi em média de 0,43, utilizando aproximadamente 155 SNPs por fenótipo.
- O estudo concluiu que os ganhos genéticos futuros exigiriam a seleção de dezenas de alelos poligénicos de pequeno efeito, facilitada por este tipo de dados genómicos.
