您的位置:

Biodbnet——多维度生物信息查询平台

Biodbnet(http://biodbnet.abcc.ncifcrf.gov/db/db2db.php)是美国国家癌症研究所(NCI)提供的生物信息查询平台,以生物数据库之间的互联为基础,可以方便地查询、匹配、转换和整合生物学信息。

一、基本介绍

Biodbnet基于web,以分布式、可重用、可维护的Web服务组建即时查询系统。这个数据库整合了许多的Nucleic acids/Protein databases、Pathways and interactions databases、Disease databases、Drug databases等;并且这些各自独立的数据库的数据,整个的数据就可以互通了。

这意味着,Biodbnet不单单是一个数据库,它连接了数百个其他的生物数据库,使各种生物信息在不同的数据库间分享,不同的信息和数据也可以相互转化,方便了科学家查询和利用生物信息数据。

目前,Biodbnet共提供了丰富的数据库连接,包括:ENSEMBL,NCBI,UCSC,MirBase,miR2Disease,hmdd,THe Human Protein Atlas,DrugBank,PathwayCommons,成百上千支撑数据门户等。

二、数据检索

Biodbnet的一个独特之处在于,它不仅仅是单一数据库,而是一系列数据库的整合。在Biodbnet, 您可以选择最多五个数据库进行基本查询,您可以进一步指定商标(IDs)用于精确的匹配,您还可以在选定的ID之间进行转换和匹配。

要开始查询,您可以开始选择数据库。对于此列表的每个数据库,可以选择指定单个ID,一组ID,以及可以允许使用通配符的模式匹配。下面是一个简单的例子,以说明如何在Biodbnet中查询:


http://biodbnet.abcc.ncifcrf.gov/db/db2db.php

如上所述,您可以指定五个数据库,并指定将要查询的数据赖。下面是查询菜单选项:


1. Click on “Add or Remove Database Selections” to specify the databases you want to use for your query. There are 24 organisms and over 20 databases to choose from!
2. Enter with your input list in the Input section. If you have any saved lists, you can select them from the drop-down menu.
3. In the Advanced Options section, you can select the options you want to be applied to your query. In many cases, these options allow you to preserve only the information you want from the queried databases.
4. Click on the “Submit” button to process your query. 

三、数据输入和输出格式

在Biodbnet中,您可以输入和输出各种格式数据并选择预先定义的格式。支持的输入和输出格式包括:


Input formats:
      1. NCBI Gene ID
      2. NCBI Refseq ID
      3. NCBI GI number
      4. Ensembl Gene ID
      5. Ensembl Transcript ID
      6. Ensembl Protein ID
      7. Entrez Gene ID
      8. HUGO gene symbol
      9. UniProt accession number
Output formats: 
      1. NCBI Gene ID 
      2. Ensembl Gene ID 
      3. Entrez Gene ID 
      4. RefSeq Transcript ID
      5. RefSeq Protein ID 
      6. HUGO gene symbol 
      7. UniSA number 
      8. UniGene ID 
      9. KEGG Pathway 
      10. Gene Ontology ID 
      11. MEDLINE/PubMed ID 
      12. UniProt ID 
      13. EMBL/GenBank ID 
      14. miRBase ID 
      15. hmdd ID 
      16. PathwayCommons ID 
      17. SMILES 
      18. PubChem Compound ID 
      19. DrugBank ID

四、示例代码

以下是最基本的查询,并采用了模式匹配,将NCBI Gene ID转换为Ensembl Gene ID:


http://biodbnet.abcc.ncifcrf.gov/ db /db2db.php?input=1017&from=ncbigene&to=ensemblgene&format=row&base=geneproto&species=Hsapiens&genomever=hg38

下面是一个更复杂的示例,它将NCBI Refseq ID转换为NCBI Gene ID,并将它们映射到KEGG 人类信号通路(hsa),并输出HUGO Gene Symbol:


http://biodbnet.abcc.ncifcrf.gov/db/db2db.php?input=NM_002046&from=refseqn&to=ncbigene&output=hugo&base=geneproto&targetpathview=hsa&format=row

通过这篇文章的讨论,您应该对Biodbnet的使用方式和功能有了一个比较深入的了解。有了这个数据库,我们可以在各种数据库之间进行转换和共享,并找到我们需要的生物信息。相信在未来的科学研究工作中,它将成为一个非常有用的工具。