A Base de Dados GWAS Mais Abrangente

Estudos de associação em todo o genoma Os Estudos de Associação Genómica (GWAS) revelam a base genética de traços e doenças complexas ao analisar associações entre variações genómicas e características fenotípicas. As bases de dados GWAS servem como recursos essenciais, integrando dados genéticos e fenotípicos para apoiar análises genómicas em larga escala. Este artigo resume as características, tipos de dados e requisitos de acesso das bases de dados GWAS mais utilizadas, como o GWAS Catalog, OpenGWAS e UK Biobank. Também fornece orientações detalhadas sobre métodos de download e utilização de dados, permitindo que os investigadores utilizem eficientemente estes recursos para avançar na investigação genética.

O que é uma base de dados GWAS?

Uma base de dados GWAS serve como um repositório para dados genéticos e fenotípicos recolhidos de vários estudos, permitindo que os investigadores acedam a conjuntos de dados abrangentes para análise. Estas bases de dados incluem tipicamente dados de genótipo (por exemplo, SNPs, inserções) e dados fenotípicos (características observáveis), facilitando análises em grande escala que aumentam o poder de detetar associações genéticas.

Os dados de GWAS de que frequentemente falamos referem-se geralmente ao resumo de GWAS, que regista a informação dos locais de SNP um a um, incluindo locais, valores de P e outras informações.

GWAS summary table.Figura 1. Dados resumidos de GWAS.

Lista de Bases de Dados GWAS

Os seguintes são alguns bancos de dados de GWAS comumente utilizados:

Catálogo GWAS

Mantida pelo Instituto Europeu de Bioinformática (EMBL-EBI), esta base de dados compila e organiza resultados de estudos de associação genoma-largura (GWAS) realizados em todo o mundo. Oferece dados abrangentes sobre associações gene-fenótipo, incluindo as localizações de variantes genéticas, fenótipos associados, tamanhos de efeito e significância estatística. A base de dados é totalmente de acesso livre, permitindo que os utilizadores pesquisem e descarreguem dados livremente.

OpenGWAS

A base de dados, mantida pela Unidade de Epidemiologia Integrativa do MRC na Universidade de Bristol, oferece amplas opções de download de dados e acesso à API, incluindo alguns resultados de GWAS não publicados. Os investigadores que utilizam este recurso devem verificar regularmente se há atualizações para aceder aos dados mais recentes, rever cuidadosamente os termos de uso e os requisitos de citação, e prestar atenção às informações de controlo de qualidade e às fontes populacionais dos dados.

GIANT (Investigação Genética de Traços Antropométricos)

Um projeto colaborativo internacional focado no estudo dos fatores genéticos que influenciam o tamanho e a forma do corpo humano, como altura, índice de massa corporal (IMC) e níveis de obesidade.

Biobanco do Reino Unido

Uma base de dados em grande escala de amostras biológicas e informações de saúde comumente utilizada em pesquisas de GWAS. Fornece dados genéticos e fenotípicos extensivos adequados para análises de randomização mendeliana relacionadas a vários resultados de saúde e doenças. O acesso aos dados requer uma candidatura, revisão ética e pagamento.

EGA (Arquivo Europeu de Genoma-Fenoma)

Uma base de dados especificamente concebida para armazenar e distribuir dados genéticos e fenotípicos relacionados com a investigação biomédica. Enfatiza a privacidade e a segurança dos dados, especialmente para informações genéticas humanas sensíveis. O EGA contém dados de GWAS, projetos de sequenciação e outros estudos genéticos em larga escala ligados a doenças e características fenotípicas normais. O acesso aos dados do EGA envolve um processo rigoroso, exigindo que os investigadores submetam um pedido detalhando o propósito de uso, que deve ser aprovado antes que o acesso aos dados seja concedido.

dbGaP (Base de Dados de Genótipos e Fenótipos)

Gerido pelo Centro Nacional de Informação Biotecnológica (NCBI), esta base de dados arquiva, organiza e dissemina dados de investigação que exploram a interação entre genótipos e fenótipos. Os dados geralmente provêm de GWAS, projetos de sequenciação médica, estudos de diagnóstico molecular e outros campos de investigação genética e clínica. O acesso requer um processo de candidatura detalhado, incluindo a submissão de um plano de investigação, finalidade de uso e, muitas vezes, aprovação de um Conselho de Revisão Institucional (IRB) ou comitê de ética. Os investigadores aprovados obtêm acesso a conjuntos de dados específicos para os seus projetos.

FinnGen

Uma base de dados genética finlandesa que contém dados genéticos extensivos da população finlandesa. Devido à alta homogeneidade genética da população, é particularmente valiosa para identificar a base genética de doenças complexas. Os dados estão disponíveis publicamente para fins de investigação, mas o acesso pode exigir a adesão a políticas específicas ou acordos de colaboração.

IEU (Unidade de Estimativa de Variáveis Instrumentais em Epidemiologia)

Esta base de dados e plataforma de recursos fornecem variáveis instrumentais (tipicamente polimorfismos de nucleotídeo único, SNPs) e apoio metodológico para análises de randomização mendeliana. Muitos dos recursos metodológicos e alguns dados de variáveis instrumentais estão disponíveis gratuitamente.

Consórcio de Genómica Psiquiátrica (PGC)

Um consórcio focado em investigação genética relacionada a distúrbios psiquiátricos. Fornece dados de GWAS que são críticos para o estudo dos mecanismos causais subjacentes a problemas de saúde mental.

CKD Gen

Uma base de dados especializada no estudo genético da doença renal crónica e características relacionadas, como a taxa de filtração glomerular estimada (eGFR). Apoia análises de randomização mendeliana na investigação da doença renal.

GEFOS (Fatores Genéticos para a Osteoporose)

Uma aliança focada na genética da osteoporose, fornecendo dados de GWAS relacionados à saúde óssea e à osteoporose.

GLGC (Consórcio Global de Genética dos Lipídios)

Oferece dados genéticos relacionados com os níveis de lípidos no sangue, servindo como um recurso valioso para estudos de randomização mendeliana em cardiologia e áreas relacionadas.

SSGAC (Consórcio de Associação Genética em Ciências Sociais)

Foca na investigação genética em áreas das ciências sociais, como o estatuto socioeconómico e a realização educativa.

Os dados gerados por consórcios (por exemplo, PGC, CKD Gen, GEFOS, GLGC, SSGAC) ou projetos são frequentemente partilhados livremente com a comunidade de investigação através de publicações científicas ou bases de dados públicas uma vez publicados.

Como Baixar Dados de GWAS

Pesquisar artigos no PubMed

Pesquisa de LiteraturaComece por pesquisar no PubMed utilizando palavras-chave como "GWAS," "estudo de associação genómica em larga escala," juntamente com o nome da doença ou traço específico de interesse. Isso ajudará a identificar artigos de pesquisa relevantes.

Revisão ResumidaA revisão dos resumos pode fornecer uma avaliação inicial da relevância dos estudos e da aplicabilidade dos dados.

Dados de Identificação Fontes: Muitos estudos de GWAS mencionam os conjuntos de dados que utilizaram ou especificam as bases de dados públicas onde os dados estão armazenados, como o Catálogo de GWAS, EGA (Arquivo Europeu de Genoma e Fenótipos) ou dbGaP (Base de Dados de Genótipos e Fenótipos).

Aceder a Bases de Dados e Recursos de GWASSeguindo as orientações na literatura, aceda diretamente a bases de dados como o GWAS Catalog. Estas bases de dados frequentemente oferecem opções de download de dados, que podem exigir registo de conta e aceitação de termos específicos de utilização.

Descarregar na base de dados OpenGWAS

Após entrar no site oficial, a interface é a seguinte: faça uma pesquisa na barra de pesquisa, escreva o nome de uma doença ou traço, por exemplo "gordura".

OpenGWAS database home page.Figura 2. Página inicial da base de dados OpenGWAS.

Os resultados da pesquisa são algumas informações básicas, principalmente olhando para o ID, porque podemos usar este ID para analisar diretamente o pacote TwoSampleMR, sendo que a primeira letra do ID indica a qual base de dados pertence.

OpenGWAS database search page.Figura 3. Página de pesquisa da base de dados OpenGWAS.

Clique nos dados na caixa vermelha, entre para obter uma descrição detalhada dos dados. Se você ver que este conjunto de dados tem uma bandeira de Download VCF, esses dados são geralmente descarregáveis. De um modo geral, se não houver tal bandeira, isso indica que os dados podem não estar abertos ou não podem ser descarregados, mas isso não é absoluto.

OpenGWAS database download page.Figura 4. Página de download da base de dados OpenGWAS.

Descarregar na base de dados do Catálogo GWAS

Esta é uma base de dados comumente utilizada, mas esta base de dados frequentemente apresenta alguns dados incompletos, por isso precisamos ter atenção ao pesquisar. Vá para o próximo ecrã a partir das estatísticas resumidas.

GWAS Catalog database home page.Figura 5. Página inicial da base de dados GWAS Catalog.

Vá para a próxima tela de pesquisa a partir dos estudos disponíveis.

GWAS Catalog database summary statistics page.Figura 6. Página de estatísticas resumidas da base de dados GWAS Catalog.

A opção Traits permite aos utilizadores pesquisar e localizar os dados necessários. Ao aceder a ficheiros transferíveis via FTP Download, é importante verificar o tamanho do ficheiro; ficheiros com cerca de 400 MB ou maiores normalmente contêm conjuntos de dados completos, enquanto ficheiros menores podem não ter loci SNP suficientes para a análise GWAS. Além disso, alguns conjuntos de dados com IDs que começam por GCST também podem ser encontrados na base de dados openGWAS.

GWAS Catalog database search page.Figura 7. Página de pesquisa da base de dados GWAS Catalog.

Em conclusão, as bases de dados GWAS desempenham um papel fundamental na promoção da investigação genética, fornecendo recursos essenciais que facilitam a exploração dos fatores genéticos subjacentes a características e doenças complexas. Com uma ampla gama de bases de dados acessíveis ao público e especializadas, como o Catálogo GWAS, OpenGWAS e UK Biobank, os investigadores podem aceder de forma eficiente a grandes quantidades de dados genéticos e fenotípicos.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo