生物信息学chapter2
时间:2025-04-30
时间:2025-04-30
生物信息学
李轶杰
jayxj@http://www.77cn.com.cn
新疆生物资源基因工程重点实验室
新疆大学生命科学与技术学院分子生物学实验室
第二章
生物信息学数据库
第一节引言
生物分子数据库应满足5个方面的主要需求
(1)时间性
(2)注释(3)支撑数据(4)数据质量(5)集成性
生物分子数据库
一级数据库
数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释例如:Genbank、PIR
二级数据库
对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。真核生物启动子序列库EPD和蛋白质一般结构或功能模体(motif)数据库PROSITE。
一个数据库记录(entry)一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释(annotation)。 注释中包含的信息与相应的序列数据同样重要和有应用价值。
不同的数据库的注释质量差异很大,因为一个数据库往往要在数据的完整性和注释工作量之间寻找一个平衡点。
一些数据库提供的序列数据很广,但这必影响序列的注释;相反,一些数据库数据面较窄,但它提供了非常全面的注释。数据库记录的注释工作是一个动态过程,新的发现不断被补充进去。
在所有的生物信息数据库中总会有一小部分的记录(包括原始序列数据和注释)是不正确的,这是一个无法避免的事实。
2015-6-19
全球生物数据库概览核酸研究2015年有1552个数据库
数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。
核酸序列数据库主要有GenBank, EMBL, DDBJ等.
蛋白质序列数据库有SWISS-PROT, PIR, OWL, NRL3D, TrEMBL等,
蛋白质片段数据库有PROSITE, BLOCKS, PRINTS等,三维结构数据库有PDB, NDB, BioMagResBank, CCSD等,
蛋白质结构有关的数据库还有SCOP, CATH, FSSP, 3D-ALI, DSSP等,
与基因组有关的数据库还有ESTdb, OMIM, GDB, GSDB等,
结构域数据库Pfarm,CDD
文献数据库有Pubmed, Medline, Uncover等。
第二节初级数据库
1.三大基因(综合)数据库
2015-6-19
Genbank数据库
Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。
NCBI的网址是:。
2015-6-19
2015-6-19
2015-6-19
上一篇:学校党支部书记2010年工作总结