How many individuals per bulk do I need?

A common starting point is ~20–50 per bulk in many plant QTL-seq designs, but noisy traits and smaller effect sizes typically benefit most from increasing bulk size and improving phenotyping. (Takagi et al., 2013; doi:10.1111/tpj.12105)

Do I need to sequence the parents?

Not strictly, but parental data often improves allele-direction interpretation and candidate ranking, especially when multiple resistance sources may exist.

What’s the most common reason QTL-seq underperforms?

Phenotype noise and weak extreme separation. If bulks are not truly extreme, increased sequencing rarely rescues a flat signal.

How do I choose window size for smoothing Δ(SNP-index)?

Window size trades resolution vs stability. If peaks shift dramatically with window settings, the data may be underpowered or uneven in SNP density/coverage; consider depth increases, stronger filters, or alternate statistics.

Δ(SNP-index) vs G′—which should I report?

Many studies treat them as complementary: Δ(SNP-index) is intuitive for directionality, while G′ provides a statistics-based inference framework. (Mansfeld & Grumet, 2018; doi:10.3835/plantgenome2018.01.0006)

How do I keep candidate prioritization from sounding subjective?

Use a transparent rubric (variant impact + bulk consistency + annotation + optional expression support) and show the weighting.

Can I integrate RNA-seq evidence if I already have data?

Yes—use expression as supporting evidence to rank candidates within the mapped interval (RUO mechanism support), not as a substitute for mapping.

What if I get two strong peaks?

Confirm each peak using RUO genotyping confirmation in an independent population or panel, then refine with recombinants and targeted genotyping.

How do I move from interval to breeder-friendly markers?

Marker development and marker-assisted selection (MAS) studies in tomato illustrate how stable QTL regions can be converted into robust genotyping assays for screening breeding and research materials (RUO).

Estudo de Caso: Identificação da Resistência ao Murcha Bacteriano em Tomate através de QTL-seq

Contexto e objetivo (definição do problema)

Murcha bacteriana, causada por membros de um Ralstonia solanacearum complexo de espécies, é uma doença de solo de alto impacto que pode rapidamente colapsar plantações de tomate em ambientes permissivos. Em programas de melhoramento e laboratórios orientados por mecanismos, um gargalo recorrente é que "resistente vs suscetível" muitas vezes se comporta como uma característica quantitativa: podem existir loci fortes, mas loci menores, o ambiente e o ruído de fenotipagem podem obscurecer os sinais.

Para um investigador principal focado em mecanismos, o verdadeiro desafio geralmente não é "encontrar" a locus," mas produzir um intervalo defensável e uma cadeia de evidências que pode suportar um conjunto de figuras de alta qualidade, uma estratégia de marcadores e uma lista restrita de candidatos que os revisores considerarão plausíveis para acompanhamento.

Contexto do traço e valor da pesquisa

A resistência é valiosa porque pode:

habilitar a produção estável em campos infestados,
reduzir a necessidade de gestão intensiva, e
fornecer marcadores genéticos para a construção de germoplasma resiliente.

Ao mesmo tempo, a resistência pode ser dependente da estirpe e da condiçãoe múltiplos loci de resistência foram descritos em tomate, incluindo regiões ligadas a fontes derivadas do Havai. (Wang et al., 2013; doi:10.1007/s10681-012-0830-x)

Objetivo e critérios de sucesso

ObjetivoUtilize QTL-seq (BSA-Seq) para identificar uma ou mais regiões genómicas associadas à resistência ao murcha bacteriano e produzir:

1. pico(s) claro(s) num perfil genómico de Δ(SNP-index),

2. um intervalo acionável com limites racionais,

3. a lista reduzida de genes candidatos apoiado por evidências estruturadas, e

4. marcadores adequados para confirmação de genotipagem RUO em populações e painéis independentes.

Para evitar a "perseguição de picos", defina estes portões. antes observando o gráfico genómico global:

Portas de bulk/fenótipo

Bulk resistente enriquecido para resistência extrema; bulk suscetível enriquecido para suscetibilidade extrema.
Ambiguidade mínima (evitar fenótipos intermédios a menos que sejam modelados explicitamente)
Regra de seleção extrema clara registada (por exemplo, top/bottom 10–15%)

Sequenciação e mapeamento de portas

Cobertura suficiente para a estimativa estável da frequência alélica em todo o genoma.
Viés de referência mínimo; sem desertos de cobertura óbvios a impulsionar picos aparentes.

Portas de variantes/estatísticas

Densidade de SNPs de alta confiança suficiente após filtragem
Pico suportado por sinal sustentado através de janelas adjacentes (não um único pico)
A banda de confiança (ou limiar empírico) separa o pico do ruído de fundo.

Figure 1. Study overview Figura 1. Visão geral do estudo
Uma visão geral anonimizada do QTL-seq para resistência ao murchamento bacteriano do tomate: extremos fenotípicos → bulks equilibrados → sequenciação → filtragem de variantes e Δ(SNP-index) em janelas → intervalo de pico → classificação de candidatos e notas de marcadores para confirmação de genotipagem RUO. Esta figura enfatiza a "cadeia de entregáveis" desde o design do experimento até os resultados prontos para revisão.

Desenho do estudo (o que foi feito)

Esta secção está escrita como o que fazes + o que deves registar assim o estudo permanece defensável para os revisores e reutilizável para futuras mapeações detalhadas.

Estratégia de população e fenotipagem

Escolha populacionalUma população segregante onde o traço apresenta um contraste significativo (por exemplo, F₂, retrocruzamento ou RILs). O QTL-seq foi originalmente concebido com desenhos onde ~20–50 indivíduos por carga extrema é um ponto de partida prático em muitos ambientes de plantas. (Takagi et al., 2013; doi:10.1111/tpj.12105)

A fenotipagem é o verdadeiro limitador de poder. Para uma característica de doença transmitida pelo solo:

Padronizar a preparação do inóculo e os momentos de avaliação.
Utilize uma rubrica de avaliação clara e repetível (uma escala ordinal é aceitável se for consistente).
Registar covariáveis que podem explicar o ruído (temperatura, substrato, idade da planta, lote).

Regra de seleção extrema (definida antes dos genótipos):

Resistência extrema: 10–15% inferior da distribuição de severidade
Susceptível extremo: 10–15% superior
Se a distribuição for rasa ou enviesada, aumentar o tamanho da população em vez de relaxar extremos.

Se o seu objetivo a longo prazo é o mecanismo, mantenha os subcomponentes do fenótipo (por exemplo, tempo de início vs gravidade final) como metadados; diferentes loci podem corresponder a diferentes componentes.

Para um resumo sobre o índice SNP e Δ(índice SNP), consulte o nosso guia de abordagem QTL-seq: Abordagem QTL-seq: Aceleração da Descoberta de Características de Culturas através do BSA-Seq

Para manter a análise e relatórios a jusante consistentes, alinhe o seu design a um padrão. fluxo de trabalho de análise de segregação em massa (BSA) precoce (nomeação de amostras, definições em massa e campos de metadados).

Construção em massa (N por bulk e estratégia de balanceamento)

Tamanho a granel: Começar com ~20–50 indivíduos por lote (ou mais se o traço for ruidoso). (Takagi et al., 2013; doi:10.1111/tpj.12105)

Estratégia de equilíbrio

Equalizar a entrada de DNA por indivíduo para evitar "indivíduos dominantes."
Combinar lotes em covariáveis não relacionadas quando viável (distribuição em bandeja/lote).
Evite artefactos de parentesco (não sobre-amostre involuntariamente um grupo familiar, a menos que seja intencional).

Manipulação de ADN

Utilize um método de extração consistente para todos os indivíduos.
Quantificar com precisão (métodos fluorométricos preferidos).
Pool equimolarmente e registe os cálculos.

Quando os lotes estiverem prontos, sequenciação do genoma completo é comumente utilizado para QTL-seq.

Plano de sequenciação (agnóstico à plataforma) e pontos de controlo de QC

Um plano independente da plataforma é definido por:

comprimento de leitura suficiente para um mapeamento robusto ao referência do tomate,
cobertura suficiente para estabilizar as estimativas de frequência alélica,
duplicação e contaminação controladas para evitar profundidade distorcida.

Planeamento de cobertura (orientação prática)

Boa referência + densidade de SNP adequada: uma profundidade moderada pode funcionar bem.
Referência fragmentada, altas repetições ou captura desigual: planeie uma maior profundidade para reter SNPs utilizáveis após filtragem.

Pontos de controlo de QC que deve registar

Qualidade da leitura bruta (qualidade por base, conteúdo de adaptadores)
Taxa de mapeamento e leituras corretamente pareadas
Distribuição de profundidade (uniformidade ao longo do genoma)
Taxa de duplicação (proxy de complexidade da biblioteca)
Contagens de SNP pós-filtragem e ausência de dados

Muitos grupos agrupam o laboratório + relatórios de QC sob um entregável NGS para garantir uma documentação consistente.

Bioinformática e estatística (resultados chave)

É aqui que um PI focado em mecanismos pode ganhar a confiança dos revisores: apresentando os resultados como portões de QC mais lógica estatística, não apenas "executámos um pipeline."

Lista de verificação mínima de relatórios (para revisores)

Pode copiar/colar este bloco em Métodos ou Materiais Suplementares.

Bulk N e regra de seleção extrema (limites percentis; definição de fenótipo)
Tipo de população (F₂/BC/RIL) e genoma de referência versão/construção
Métricas de sequenciação: leituras totais, % de mapeamento, % de duplicação, cobertura (média/mediana e % do genoma acima do limiar)
Limiares de filtragem de variantes: profundidade mínima por bulk, limites de qualidade de mapeamento/base, limite máximo de profundidade, filtros de ausência
Configurações de suavização de janelastamanho da janela e passo (ou método de suavização), e justificação
Regra do limite do picocomo foram escolhidas as fronteiras dos intervalos (retorno base + janelas consecutivas)
Rubrica de pontuação para candidatos: critérios e ponderação (impacto da variante, consistência, anotação, evidência de expressão opcional)
Pacote de Reproduzibilidade: VCF, tabela de estatísticas de janelas, scripts/parâmetros de plotagem

Resumo de QC + mapeamento (o que foi verificado e porquê)

ObjetivoConfirme que ambos os lotes são comparáveis e que os artefatos de mapeamento/cobertura não se disfarçarão como picos de QTL.

Portões de QC (limiares de início recomendados)

Leituras brutas≥80–90% das bases a Q30+ (dependente da plataforma)
Ajuste do adaptadorconteúdo do adaptador residual perto de zero
Taxa de mapeamento: frequentemente ≥90% para uma boa referência de tomate; investigar se é muito mais baixo
Leituras devidamente emparelhadas: alta fração esperada para pares de extremidades
Taxa de duplicação: idealmente baixo a moderado; uma duplicação inesperadamente alta sugere baixa complexidade da biblioteca
Uniformidade de coberturaevitar "desertos de cobertura" que diferem sistematicamente entre os volumes

O que uma tabela de mapeamento amigável para revisores inclui

leituras totais por bulk, % a passar o filtro
mapeamento %, devidamente emparelhado %
profundidade média e mediana, % do genoma ≥10× (ou o seu limiar escolhido)
taxa de duplicação
inserir resumo de tamanho (para dados de PE)

Uma secção de QC limpa e pronta para revisão geralmente resulta de um modelo de relatório de análise alinhado a análise de dados genómicos que preserva parâmetros e métricas intermédias.

Chamadas de variantes + filtragem (estabilização do índice SNP)

Por que a filtragem não é opcionalΔ(SNP-index) depende de estimativas de frequência alélica. Baixa profundidade, baixa qualidade, mapeamento múltiplo e viés de fita podem aumentar o ruído e criar "picos fantasmas."

Fluxo de trabalho típico

1. Alinhar leituras ao referência

2. Marcar duplicados (ou, no mínimo, quantificar)

3. Chamar SNPs em conjunto através de bulks

4. Aplicar filtragem rigorosa:

profundidade mínima por bulk por local (frequentemente ≥8–10 leituras)
limite máximo de profundidade (para evitar repetições/artifícios de número de cópia)
qualidade mínima da base e qualidade de mapeamento
remover locais com anomalias severas de equilíbrio alélico
opcionalmente remover indels para manter um modelo de índice SNP limpo

Índice SNP (conceitual)

Índice SNP: fração de leituras que suportam o alelo alternativo em um local em um lote.
Δ(índice SNP): diferença entre os grupos ao longo do genoma (definir a direção de forma consistente)

Para manter o registo do parâmetro auditável, documente o chamada de variantes configuração (versões de software, filtros exatos, contagens de retenção de SNP).

Adicione um link adicional de recurso interno de QC/filtros onde a sua matriz de conteúdo o exigir:
[MATRIZ_LINK_NECESSÁRIO: artigo interno sobre melhores práticas de filtragem de QC/variantes]

Gráfico do índice SNP e lógica de seleção de intervalos candidatos

Saída principalUm perfil Δ(SNP-index) em todo o genoma, tipicamente suavizado em janelas deslizantes.

Duas formulações amplamente utilizadas para NGS-BSA/QTL-seq são:

método Δ(índice SNP) (frequentemente emparelhado com confiança baseada em simulação ou empírica)
G′ / método da estatística G suavizada (inferência baseada em estatísticas)

O QTLseqr implementa ambas as abordagens e muitos grupos utilizam-nas como verificações complementares. (Mansfeld & Grumet, 2018; doi:10.3835/plantgenome2018.01.0006)
Um tratamento estatístico fundamental das fontes de variância do NGS-BSA também está disponível. (Magwene et al., 2011; doi:10.1371/journal.pcbi.1002255)

Como selecionámos um intervalo (limites defensáveis)

1. Identificar a região principal onde Δ(SNP-index) excede a banda de confiança (ou limiar empírico).

2. Expanda os limites até que o sinal retorne à linha de base e permaneça estável ao longo de várias janelas adjacentes.

3. Inspecione a cobertura local e a mapeabilidade; trate regiões com baixa cobertura/ricas em repetições com cautela.

4. Opcionalmente, confirme com uma estatística alternativa (por exemplo, G′) para garantir que a mesma região emerge.

Figure 2. Window-smoothed Δ(SNP-index) peak with confidence band Figura 2. Pico Δ(SNP-index) suavizado por janela com banda de confiança (colocar após esta subseção)
Exemplo Δ(SNP-index) ao longo da posição do cromossoma após suavização por janela deslizante (a largura do janela/passo definido nos Métodos). A faixa sombreada representa uma banda de confiança derivada de simulação ou um limiar empírico de genoma completo, utilizado para separar o sinal sustentado do ruído de fundo. O intervalo candidato é definido por janelas consecutivas acima do limiar mais uma regra de limite (retorno à linha de base), em vez de um máximo de ponto único.

Priorização de genes candidatos (anotação + plausibilidade + evidência estruturada)

Uma vez definido o intervalo, o passo de intervalo-para-candidato pode ser subjetivo ("isto parece um gene de resistência") ou à prova de revisão (cadeia de evidências estruturada). Para um investigador principal focado em mecanismos, uma rubrica transparente é geralmente a diferença.

Componentes de evidência

Impacto da variantevariantes de alto/médio impacto previstas (stop-gain, splice-site, missense prejudiciais)
Consistência a granela direção da frequência alélica corresponde ao enriquecimento esperado ao longo do intervalo
Anotação funcionaldomínios/caminhos relacionados com a defesa plausíveis (mantidos de forma geral)
Evidência de expressão (opcional)se já tiver RNA-seq, use a expressão como evidência de apoio priorizar candidatos (contexto mecanicista RUO)

Se planeia incorporar a expressão como suporte ortogonal, emparelhe o intervalo com Análise do transcriptoma por RNA-seq como um complemento estruturado (não como um substituto para mapeamento).

Interpretação dos resultados (do pico à ação)

Esta secção traduz saídas em passos seguintes acionáveis—classificação de candidatos e planeamento de avaliadores—tornando a incerteza explícita.

Tamanho do intervalo do candidato e justificação dos limites

Um intervalo de QTL-seq é um estimação limitada pela resolução moldado por:

densidade de recombinação na sua população,
tamanho do efeito QTL,
tamanho em massa e pureza do fenótipo,
profundidade de sequenciamento e densidade de SNP,
artefatos de cobertura/mapeamento.

Como descrever o tamanho do intervalo em um manuscrito

Forneça coordenadas de intervalo (construção de referência), posição do pico e largura.
Relatar o número de genes/modelos de genes dentro do intervalo.
Explique a lógica de limites (por exemplo, "platô acima da banda de confiança ao longo de X Mb; limites escolhidos ao retornar ao nível basal em Y janelas consecutivas").
Cite evidência de QC que suporte a estabilidade (uniformidade de cobertura, densidade de SNP).

Se o intervalo permanecer grande (centenas de genes), trate-o como uma orientação para a próxima fase: adicione recombinantes e genotipagem para refinar.

Para apertar uma região após a primeira passagem, direcionado mapeamento fino de SNPs pode converter um intervalo amplo em segmentos candidatos definidos por recombinação.

Do intervalo à lista de candidatos (mantido geral, defensável por revisores)

Na investigação sobre a resistência ao murchamento bacteriano do tomate, os loci estáveis são frequentemente seguidos pelo desenvolvimento de marcadores e etapas de confirmação independente, razão pela qual a ponte "pico-para-marcador" é importante. (Yeon et al., 2022; doi:10.3390/plants11172223)

Abordagem de pré-seleção (exemplo de rubrica)
Construímos uma tabela de candidatos com colunas:

ID de Gene Anonimizado
Variação(ões) + impacto previsto
Direcionalidade da frequência alélica em massa
Nota de anotação (domínio/caminho)
Nota de expressão opcional (se disponível)
Pontuação de prioridade (ponderação explícita)

Se trouxer suporte a expressões, padronize as saídas através de análise de dados transcriptómicos assim, a classificação dos candidatos permanece transparente e reproduzível.

Figure 3. Example candidate prioritization table with explicit weighting Figura 3. Exemplo de tabela de priorização de candidatos com ponderação explícita
Exemplo anonimizado apenas. Uma tabela de candidatos com quatro linhas ilustra como um rubric de pontuação transparente pode combinar (i) impacto da variante (e.g., stop-gain vs missense), (ii) consistência a granel através da região do pico, (iii) opcional dicas de expressão, e (iv) notas de percurso/domínio numa pontuação de prioridade ponderadaO objetivo é mostrar a cadeia de evidências que os revisores esperam—mesmo quando os identificadores genéticos finais diferem de projeto para projeto.

Plano de acompanhamento

Um plano amigável para revisores separa confirmação genética de seguimento mecanicista.

A) Confirmação de genotipagem RUO (rápida, escalável)

Proponha um pequeno conjunto de marcadores na região do pico.
Ecrã:
a população original (verificação de sanidade),
uma população segregante independente (transferibilidade),
painéis/materiais mais amplos (generalização sob RUO).
Use recombinantes para restringir a região.

B) Acompanhamento mecanicista (focado no PI, publicável)

Selecione um pequeno número de candidatos para ensaios mais aprofundados.
Colete provas de apoio:
mudanças nas expressões relevantes para a condição,
consistência a nível de percurso com mecanismos de defesa conhecidos,
associação de haplótipos em painéis mais amplos (se disponíveis).

C) Pacote de Reproduzibilidade

Fornecer detalhes do pipeline versionado, parâmetros e saídas intermédias (VCF, estatísticas de janela, gráficos, tabela de candidatos, notas de marcadores).

Resumo da decisão: por que esta abordagem venceu (tempo e ROI do projeto)

Para uma comparação detalhada de cronograma/ROI, consulte a ligação. mapeamento vs QTL-seq.

Tempo poupado em comparação com o mapeamento de ligação clássico

Comparado com os fluxos de trabalho clássicos de mapeamento de ligação que requerem desenvolvimento iterativo de marcadores e várias rondas de genotipagem, o QTL-seq desloca o esforço para:

um lote de sequenciação de alto rendimento (duas amostras, às vezes mais os pais),
uma única passagem de análise integrada,
geração rápida de variantes densas que alimentam o mapeamento fino e o planeamento de marcadores.

A estrutura original do QTL-seq enfatizava a velocidade ao re-sequenciar extremos agrupados em vez de genotipar muitos marcadores em todos os indivíduos. (Takagi et al., 2013; doi:10.1111/tpj.12105)

Redução de mão de obra e decisão mais rápida de seguir ou não seguir.

Para um laboratório orientado por mecanismos, a questão de ir/não ir é frequentemente: Temos um local credível que justifique um investimento mecanicista? O QTL-seq acelera essa decisão ao produzir:

um rastreio genómico com picos claros (ou um resultado honesto de "sem pico"),
um intervalo com limites racionais e suporte QC,
uma lista curta estruturada,
notas de marcadores orientadas para a confirmação de genotipagem RUO.

Roteiro para os próximos passos (se os resultados forem fortes, moderados ou confusos)

Se os resultados forem fortes (um único pico principal)

Prossiga para a confirmação de genotipagem RUO e aperfeiçoamento baseado em recombinantes.
Iniciar acompanhamento mecanicista dos principais candidatos.

Se os resultados forem moderados (vários picos)

Verifique a pureza do fenótipo e os efeitos de lote.
Considere repetir com extremos mais apertados ou volumes maiores.
Verifique com uma estatística alternativa (Δ(SNP-index) vs G′).

Se os resultados forem confusos (sem pico claro)

Trate-o como feedback de design:
fenótipo demasiado ruidoso ou extremos demasiado fracos,
densidade de SNP insuficiente ou problemas de mapeamento,
desiquilíbrio de massa (viés de agrupamento de DNA).
Redesign: aumentar o tamanho da população, refinar o fenotipagem, ajustar a profundidade.

Para suporte à reanálise e reprodutibilidade, integre um padrão. serviços de bioinformática fluxo de trabalho e manter os registos de parâmetros consistentes entre iterações.

Quando usar QTL-seq (e quando não usar)

Use QTL-seq quando

Você tem uma população segregante e pode fenotipar de forma confiável.
Os extremos são suficientemente claros para formar massas de alta pureza.
Suspeita-se que pelo menos um locus tenha um efeito moderado a grande.
Você precisa de uma varredura rápida e densa para justificar o mapeamento fino a montante.

Considere alternativas ou uma estratégia em duas fases quando

O traço é altamente poligénico com separação fenotípica superficial.
A fenotipagem é dominada pelo ambiente/lote com replicação limitada.
O genoma de referência está demasiado fragmentado/repetitivo para um mapeamento confiável.
Precisas de estimativas de tamanho de efeito em muitos loci (GWAS ou mapeamento completo podem ser melhores).

Ferramenta de decisão de uma tela (mini-tabela + árvore de decisão)

Mini-tabela: escolha a abordagem correta (RUO)

A sua situação	ajuste QTL-seq	Resultados RUO esperados	Riscos primários	Mitigação
Extremos claros, provável locus maior	Alto	Interval de pico, rubrica de candidato, notas do avaliador para confirmação de RUO.	Viés de referência, repetições locais	Limites de profundidade rigorosos + verificações de cobertura
Extremos moderados, tamanhos de efeito mistos	Médio	Múltiplos picos ou intervalos mais amplos	Ruído fenotípico → falsos negativos	Aumentar N, apertar extremos, replicar fenotipagem.
Altamente poligénico, separação fraca	Baixo	Perfil plano/ruidoso	Mudanças de frequência alélica subpotentes	Considere GWAS, populações maiores, mapeamento em múltiplas etapas.
Referência fragmentada / repetições	Médio–Baixo	Lacunas, picos instáveis	Artefactos de mapeamento	Repetições de máscara, ajustar o limite de profundidade máxima, considerar referência melhorada.

Árvore de decisão simples

1. Consegue definir extremos com confiança?

Não → melhorar o fenotipagem ou aumentar o tamanho da população.
Sim → vá para (2).

2. A densidade de SNP + qualidade de mapeamento é adequada em todo o genoma?

Não → ajustar sequenciação/filtros/estratégia de referência.
Sim → vá para (3).

3. Você observa picos sustentados acima do limiar de confiança?

Não → rever a pureza do fenótipo, profundidade e filtros; considerar estatísticas alternativas.
Sim → definir limites de intervalo + construir rubrica de candidatos + preparar notas para o avaliador para confirmação de genotipagem RUO.

QC e resolução de problemas (limiares acionáveis + sintoma→causa→solução)

Tabela de porta QC (métrico → esperado → do que o protege)

métrica de QC	Expectativa prática (ponto de partida típico)	Se falhar, consequência comum.
Pureza fenotípica em massa	Extremos claramente separados; intermediários mínimos.	Picos achatam; falsos negativos
equilíbrio de pooling de DNA	Entrada equimolar por indivíduo	Distorção artificial da frequência alélica
Taxa de mapeamento	Frequentemente ≥90% com boa referência	SNPs em falta; viés de referência
Emparelhamento adequado	Alta fração para bibliotecas de PE	Profundidade irregular; artefatos estruturais
Taxa de duplicação	Baixo a moderado; investigar se é alto.	Profundidade efetiva reduzida; índice SNP ruidoso
Profundidade por site (após filtragem)	Comumente ≥8–10 por bulk por SNP	Pico espinhoso Δ(índice SNP); picos instáveis
Densidade de SNP após filtros	Densidade genómica suficiente em todo o genoma	Escaneamento subpotenciado; lacunas

Tabela de resolução de problemas (sintoma → causa provável → solução)

Sintoma	Causa provável	Corrigir (mais rápido primeiro)
Sem pico em lado nenhum	Separação de fenótipos demasiado fraca; bulks não são extremos.	Reavaliar; apertar extremos; aumentar o tamanho da população.
Muitos pequenos picos	Efeitos de lote; pontuação inconsistente	Padronizar condições; replicar bloco de fenotipagem
Pico agudo único numa janela	Região de baixa profundidade/repetição; filtragem fraca	Aumentar a profundidade mínima; limitar a profundidade máxima; excluir repetições; verificar cobertura.
Mudanças de pico com tamanho da janela	Densidade de SNP subpotenciada ou desigual	Aumentar a profundidade ou o tamanho do volume; confirmar com G′
Lista de candidatos enorme	Resolução limitada pela recombinação	Adicionar recombinantes; genotipagem direcionada; mapeamento fino.

Para requisitos de submissão e estrutura de metadados, siga o diretrizes de submissão de amostras.

Lista de verificação de entregáveis (o que deve esperar)

Um pacote completo de QTL-seq para investigação RUO geralmente inclui:

Tabelas de resumo de QC para ambos os lotes (bruto + mapeado)
Conjunto de SNP filtrado (VCF) + relatório de filtragem
Tabela de estatísticas da janela + parâmetros de plotagem
Gráficos Δ(SNP-index) em todo o genoma (e gráficos de estatísticas alternativas opcionais)
Coordenadas do intervalo de pico + justificação explícita da fronteira
Tabela de candidatos com colunas de evidência + rubrica de pontuação
Notas do painel de marcadores para confirmação de genotipagem RUO (coordenadas, alelos, notas de design do ensaio)
Pacote de Reproduzibilidade (versões de software, limiares, scripts)

Perguntas Frequentes

Quantos indivíduos por lote preciso?

Um ponto de partida comum é ~20–50 por bulk em muitos desenhos de QTL-seq de plantas, mas características ruidosas e tamanhos de efeito menores geralmente beneficiam mais do aumento do tamanho do bulk e da melhoria da fenotipagem. (Takagi et al., 2013; doi:10.1111/tpj.12105)

Preciso sequenciar os pais?

Não de forma estrita, mas os dados parentais frequentemente melhoram a interpretação da direção do alelo e a classificação de candidatos, especialmente quando podem existir múltiplas fontes de resistência.

Qual é a razão mais comum pela qual o QTL-seq não atinge o desempenho esperado?

Ruído fenotípico e separação extrema fraca. Se os grupos não forem verdadeiramente extremos, o aumento da sequenciação raramente recupera um sinal plano.

Como escolho o tamanho da janela para suavizar Δ(SNP-index)?

O tamanho da janela trade-off entre resolução e estabilidade. Se os picos mudarem dramaticamente com as configurações da janela, os dados podem estar subdimensionados ou desiguais em densidade/cobertura de SNP; considere aumentos de profundidade, filtros mais rigorosos ou estatísticas alternativas.

Δ(índice SNP) vs G′—qual devo reportar?

Muitos estudos tratam-nos como complementares: Δ(SNP-index) é intuitivo para a direcionalidade, enquanto G′ fornece uma estrutura de inferência baseada em estatísticas. (Mansfeld & Grumet, 2018; doi:10.3835/plantgenome2018.01.0006)

Como posso evitar que a priorização de candidatos soe subjetiva?

Utilize uma rubrica transparente (impacto da variante + consistência em massa + anotação + suporte opcional à expressão) e mostre o peso.

Posso integrar evidências de RNA-seq se já tiver dados?

Sim—use a expressão como evidência de apoio classificar candidatos dentro do intervalo mapeado (apoio ao mecanismo RUO), não como um substituto para o mapeamento.

E se eu tiver dois picos fortes?

Confirme cada pico utilizando a confirmação de genotipagem RUO numa população ou painel independente, e depois refine com recombinantes e genotipagem direcionada.

Como faço para passar de marcadores de intervalo para marcadores amigáveis para criadores?

O desenvolvimento de marcadores e os estudos de seleção assistida por marcadores (MAS) em tomate ilustram como regiões QTL estáveis podem ser convertidas em ensaios de genotipagem robustos para triagem de materiais de melhoramento e de investigação (RUO).

Referências (formato unificado) — com links DOI

Takagi H, Abe A, Yoshida K, et al. QTL-seq: mapeamento rápido de loci de características quantitativas em arroz através do re-sequenciamento do genoma completo de DNA de duas populações agrupadas. The Plant Journal. 2013. doi: 10.1111/tpj.12105
Mansfeld BN, Grumet R. QTLseqr: Um Pacote R para Análise de Segregantes em Lote com Sequenciação de Próxima Geração. O Genoma da Planta. 2018. doi: 10.3835/plantgenome2018.01.0006
Zhang J, Panthee DR. PyBSASeq: um algoritmo simples e eficaz para análise de segregantes agrupados com dados de sequenciação do genoma completo. BMC Bioinformática. 2020. doi: 10.1186/s12859-020-3435-8
Magwene PM, Willis JH, Kelly JK. A estatística da análise de segregação em massa usando sequenciação de nova geração. PLoS Biologia Computacional. 2011. doi: 10.1371/journal.pcbi.1002255
Michelmore RW, Paran I, Kesseli RV. Identificação de marcadores ligados a genes de resistência a doenças através da análise de segregantes agrupados: um método rápido para detectar marcadores em regiões genómicas específicas utilizando populações segregantes. Atas da Academia Nacional de Ciências dos Estados Unidos da América. 1991. doi: 10.1073/pnas.88.21.9828
Siddique MI, Silverman E, Louws F, Panthee DR. Mapeamento de loci de características quantitativas para resistência ao murchamento bacteriano e altura da planta em tomates. Plantas. 2024. doi: 10.3390/plants13060876
Wang JF, Ho FI, Truong HTH, et al. Identificação de QTLs principais associados à resistência estável da cultivar de tomate 'Hawaii 7996' a Ralstonia solanacearum. Euphytica. 2013. doi: 10.1007/s10681-012-0830-x
Yeon J, Le NT, Sim SC. Avaliação da resistência independente da temperatura contra a murcha bacteriana utilizando QTL principais em tomate cultivado.Solanum lycopersicum L.). Plantas. 2022. doi: 10.3390/plants11172223

Serviços Relacionados

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.