1.生物数据库分类
(1)核酸数据库(2)蛋白质数据库(3)专用数据库
核酸数据库分为一级核酸数据库和二级核酸数据库
蛋白质数据库分为一级蛋白质数据库和二级蛋白质数据库
一级蛋白质数据库又分为蛋白质序列数据库和蛋白质结构数据库
2.文献数据库PubMed
3.序列
序列就是一个字符串
蛋白质序列:由20个不同的字母(氨基酸)排列组合而成。
核酸序列:由4个不同的字母(碱基)排列组合而成。(DNA序列,RNA序列)
(1)FASTA格式:
第一行:大于号加名称或其他注释
第二行以后:每行60个字母(也有80个,不一定)
示例:
(2)序列一致度(identity)与相似度(similarity)
一致度:如果两个序列(蛋白质或核酸))长度相同,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,氨基酸或碱基)的数目占总长度的百分数。
相似度:如果两个序列(蛋白质或核酸)长度相同,那么它们的相似度定义为他们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。
(3)比较两个长度不同的序列的方法
1.打点法
2.序列比对法
4.蛋白质结构(4级)
一级结构:氨基酸序列
二级结构:周期性的结构构象
三级结构:整条多肽链的三维空间结构
四级结构:多个亚基形成的复合体结构