您的位置:

gnomad数据库详细阐述

一、gnomAD数据库

gnomAD(全称为Genome Aggregation Database)是一个基于全基因组测序数据的大型人类遗传变异数据库,目前由Broad Institute开发维护。gnomAD从多个基因组学计划中整合了280,000个人类的全基因组测序数据,并采用高通量与精确的测序技术进行测序,每个人的样本均通过了严格的质量控制。gnomAD数据库的目的是改进人类遗传变异数据的规模和质量,从而帮助研究人类基因组和相关疾病。

gnomAD中收集了来自全球不同人群的全基因组测序数据,包括欧洲、东亚、非洲、南亚和美洲等人群。数据库中大量的人类全基因组数据使研究人员能够更全面地进行基因和基因组的研究,包括识别罕见变异和功能重要的变异等。

gnomAD数据库支持所有人免费使用,并提供了详细的调用API allowing进行数据详细的查询和分析,研究人员可以轻松地在gnomAD数据库中查找感兴趣的基因、突变和人群分布等信息。

二、gnomad数据库使用指南

使用gnomAD数据库最重要的一点是理解数据库的结构和以及如何使用API进行查询和分析。在使用gnomAD数据库之前,研究人员需要理解下列概念:

Variant (变异): 染色体上的其中一个碱基序列发生突变时发生的结果,引起了DNA序列上的改变。例如单核苷酸变异 SNVs,小插入/删除突变 Indels,结构变异 SVs(大插入或删除,复制,倒位以及替换)。

Site (位点): 在染色体上的一个特定位置,特定的序列会发生变异。位点通常被描述为 chromosomes:pos。

Allele (等位基因): 在一个位点上可以存在多个类型的变异,每种变异都被称作一个等位基因。例如,一个位点上可能会存在突变、多态性和遗传变异等多种等位基因。

gnomAD数据库提供了非常完整的API allowing,包括从Genome Browser Search API,Exome Browser Search API,Variant Details API,Variant Search API,Coverage Info API,Frequencies API,Population Frequencies API等多个层面进行浏览和查询。研究人员可以根据自己的需求,选择合适的API进行数据的获取和分析。

三、gnomad数据库官网

gnomAD数据库官网提供了大量重要的信息和工具,方便用户进行数据查询和分析。在gnomAD数据库官网中,用户可以浏览全球各人群的基因组测序数据,查看代表性人群中突变的频率,并可以根据每个变异和样本进行过滤查询。此外,gnomAD数据库官网还提供了一些常规的查询工具,例如“基因”、“位点”和“变异类型”等,支持用户可视化查询人类全基因组测序数据。

用户使用gnomAD数据库官网时需要注册账户,每个注册用户可以查询1000次数据。如果需要查询次数更多,需要从gnomAD数据库申请额外的许可。

四、gnomad数据库使用

1. 使用API进行突变的查询

import requests
import json
url = "https://gnomad.broadinstitute.org/api/variant"
parameters = {
    "dataset":"gnomad_r3",
    "reference_genome":"GRCh38",
    "variant":"1-55516888-A-C"
}
headers = {'accept': 'application/json'}
r = requests.get(url, headers=headers, params = parameters)
print(json.dumps(r.json(), indent = 4, sort_keys=True))

上述代码是使用 Python 进行 gnomad数据库查询的示例。首先,我们定义了查询突变的 URL,并指定了查询的数据集和参考基因组。然后,我们使用 Python 的请求库构建了一个 GET 请求,向 gnomAD数据库API发送了一个突变查询。最终,我们使用了 JSON 模块的 dumps() 函数将结果呈现为格式化的 JSON 格式。

2. 使用 Bioconductor 包进行查询

library(gnomad)
snp <- fetch_gnomad("1-55516888-A-C", which_genome = "GRCh38")

gnomAD 提供了 Biocoductor 包,用于在 R 语言中对数据进行交互操作。用户可以使用 fetch_gnomed() 函数轻松地实现对 gnomAD 的查询。例如上述代码就实现了对位于1-55516888-A-C的 SNV 进行查询。fetch_gnomed() 函数会返回一个数据框,其中包含有突变的详细信息。

五、gnomad数据库未收录

尽管 gnomad数据库包含了大量的全基因组测序数据,仍有少量的人群或序列类型没有纳入该数据库。在这种情况下,用户可以考虑查询其他全基因组数据库,例如1000 Genomes Project和Exome Aggregation Consortium数据库。用户也可以使用互联网上其他公共基因组测序数据的资源进行数据分析研究。

六、gnomAD数据库怎么用

使用 gnomAD 数据库需要具备一定的生物信息学和编程的基础。因此,对于非专业的用户,建议借助一些生物信息学的工具,例如UCSC Genome Browser, IGV browser, Variant Effect Predictor, VEP plugin for Ensembl website等,并参考相关基因组测序分析和生物信息学的学习资料,以更好地使用 gnomAD 数据库进行数据的查询和分析。

七、gnomAD数据库是正常人群数据库吗

gnomAD 数据库所收集的数据是来自于正常人群的全基因组测序数据,主要为了研究人类基因组的正常变异和基因表达。该数据库包含了来自不同人群的全基因组数据,并且经过了非常严格的质量控制,从中不包含明显的人为数据。因此,gnomAD 数据库是一个非常可靠的正常人群数据库,可以被广泛的应用于人类基因组学的研究。

八、geodatabase数据库选取

gnomAD 数据库只能用于正常人群基因组的研究,如果需要研究与某种疾病有关的人类基因组变异,应选取合适的人群和患者数据库。例如,对于癌症研究,可以通过使用 TCGA (The Cancer Genome Atlas) 和ccle(Cancer Cell Line Encyclopedia)等癌症病人样本数据库。为了得到更准确的结果,建议同时使用多个数据库进行研究。

结论

gnomAD是一个包含了来自全球各种不同人群的高质量全基因组测序数据的庞大数据库。gnomAD 数据库提供了丰富的API allowing和可视化工具,帮助研究人员进行基因组数据的查询和分析,为研究人员提供了关于人类基因组正常变异和基因表达的重要信息。虽然 gnomAD 数据库不能用于研究疾病相关的人类基因组变异,但在正常人群基因组的研究中,gnomAD 数据库是一个非常可靠和重要的资源。