美国国家生物技术信息中心

NCBI的logo

国家生物技术资讯中心National Center for Biotechnology Information,简称NCBI)是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分)。NCBI位于美国马里兰州贝塞斯达,建立于1988年。

NCBI设置有与生物技术和生物医学相关的一系列资料库,是生物资讯学工具和服务的重要资源。 主要资料库包括DNA序列GenBank,和生物医学文献书目资料库PubMed。 其他资料库包括NCBI表观基因组资料库。 所有这些资料库都可以通过Entrez搜寻引擎在线获取。

许多受尊敬的研究者在NCBI工作,如比较基因组学领域的一位多产的科学家Eugene Koonin和BLAST序列资料库搜索算法的作者Stephen Altschul。

NCBI在研究资料库r3data.org的注册表中列出[1]

GenBank

NCBI自1992年开始负责维护DNA序列资料库GenBank。GenBank资料库每日都会实时更新并和另外两家资料库(欧洲的EMBL与日本的DDBJ)交换数据,以确保三家资料库的序列数据的一致性[2]。自1992开始,NCBI陆续将其它资料库与GenBank整合起来,包括Gene在线人类孟德尔遗传资料库、 分子模型资料库(一个蛋白质三维结构资料库)、dbSNP(一个单核苷酸多态性资料库)、Reference Sequence Collection(一个人类基因组图谱)以及分类学浏览方式和美国国家癌症研究所提供的癌症基因组剖析计划数据。NCBI也对每一个物种都设立了一个分类编号(taxonomy ID number)。

NCBI提供的一些在线软体可供FTP或WWW浏览,比如BLAST序列相似性比对程序,可在15秒内完成与GenBank资料库的序列比较。

NCBI书架

NCBI书架是一个集合了可以自由获取、下载的线上精选生物医学书籍资料库。截至2011年4月,书架有845本书籍,涵盖广泛的主题包括分子生物学生物化学细胞生物学遗传学,和微生物学。从分子和细胞从角度分析的疾病状态、研究方法,和病毒学。一些书是以前出版的图书的在线版本,而其他如Coffee Break(书)是由NCBI的工作人员编写和编辑。书架是同行评审Entrez PubMed库的期刊摘要的补充,因为它能提供前沿领域的已确立的的观点,并整理许多不同的零散的研究报告。

基本本地比对搜索工具(BLAST)

BLAST是用于计算生物序列之间的序列相似性的算法,例如DNA的核苷酸序列和蛋白质的胺基酸序列[3]BLAST是查找与同一生物体内或不同生物体中的查询序列相似的序列的有力工具。 它搜索NCBI资料库和服务器上的查询序列,并将结果以选定的格式发布回该人员的浏览器。BLAST的输入序列大部分采用FASTA或Genbank格式,而输出可以以各种格式(如HTML,XML格式和纯文本)传送。 HTML是NCBI网页的默认输出格式。 NCBI-BLAST的结果以图形格式显示,找到所有命中结果,具有具有得分相关数据的命中结果的序列标识符的表格,以及感兴趣序列的比对以及用于这些的类似BLAST得分的命中结果[4]

Entrez

Entrez全球查询跨资料库搜索系统在NCBI中用于所有主要资料库,如核苷酸和蛋白质序列,蛋白质结构,PubMed,分类学,完整基因组,OMIM等[5]。Entrez是既具有生物医学研究来源的数据的索引和检索系统。NCBI于1991年分发了第一版Entrez,由蛋白质资料库(PDB)GenBank的核苷酸序列,SWISS-PROT,翻译的GenBank,PIR,PRF和PDB的蛋白质序列组成,PubMed的相关摘要和引文。 Entrez专门设计用于将来自不同来源,资料库和格式的数据集成到统一的资讯模型和检索系统中,可以有效地检索相关的参考文献,序列和结构[6]

参见

参考文献

  1. ^ re3data.org. service.re3data.org. [2021-03-07]. 
  2. ^ Mizrachi, Ilene. Chapter 1 GenBank: The Nucleotide Sequence Database. GenBank: The Nucleotide Sequence Database. National Center for Biotechnology Information (US). 2007-08-22 (英语). 
  3. ^ Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. Basic local alignment search tool. Journal of Molecular Biology. 1990-10-05, 215 (3): 403–410. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. 
  4. ^ Madden T. (2002). The NCBI handbook, 2nd edition, Chapter 16, The BLAST Sequence Analysis Tool
  5. ^ Sayers, Eric W.; Agarwala, Richa; Bolton, Evan E.; Brister, J. Rodney; Canese, Kathi; Clark, Karen; Connor, Ryan; Fiorini, Nicolas; Funk, Kathryn. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 01 08, 2019, 47 (D1): D23–D28. ISSN 1362-4962. PMC 6323993可免费查阅. PMID 30395293. doi:10.1093/nar/gky1069. 
  6. ^ Ostell J. (2002). The NCBI handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System

外部连结

#