一、Needleman-Wunsch算法

    Needleman-Wunsch 算法是一种全局联配算法,它从整体上分析两个序列的关系,即考虑序列总长的整体比较,用类似于使整体相似(global similarity)最大化的方式,对序列进行联配。两个不等长序列的联配分析必须考虑在一个序列中一些碱基的删......查看详细>>

标签:生物信息

二、Smith-Waterman算法

    Smith-Waterman 算法是在Needleman-Wunsch 算法基础上发展而来的,它是一种局部联配算法。由于亲缘关系较远的蛋白质序列可能只有一些相互独立的保守片段,所以进行局部相似性分析有时可能比整体相似性分析更合理。Smith 和Waterman(1981)提......查看详细>>

标签:生物信息

一、BLAST算法

    BLAST 算法同样是利用动态规划算法,与Smith-Waterman 算法类似,其不同之处是引入了所谓“字”或“字符串”(word 或K-tuple,K-mer 等)的检索技术。所有序列其实都是由若干字符串组成,例如我们以3个碱基长度的字符串为例,下列DNA 序列包括......查看详细>>

标签:生物信息

二、利用BLAST进行数据库序列搜索

    采用BLAST 的基本算法目前形成了若干不同的工具,分别用于特定序列数据库和特定目的的序列搜索。以NCBI 提供的在线序列数据库搜索工具BLAST(2014年12月)为例(图1-3.4),BLASTN 是对核苷酸递交序列库搜索核苷酸序列数据库,BLASTP 是在蛋白......查看详细>>

标签:生物信息

三、序列相似性的统计推断

    BLAST 搜索返回的结果中,提供了递交序列与数据库中序列比对结果的得分(score)和一个统计测验结果(E-value)。到目前为止,对局部联配的统计学问题已基本搞清楚,特别是那些不含空位的局部联配更是如此。我们不妨首先考虑不含空位的......查看详细>>

标签:生物信息

习题

    1.目前计分矩阵主要有哪些? 比较它们的异同。2.请利用动态规划Needleman-Wunsch 算法对下列两条蛋白质序列进行全局联配,获得最优联配结果:  P1=AGWGAHEA  P2=PAWHEAEAG计分系统:计分矩阵BLOSUM50,空位罚8分。表1-3.7 BLOSUM50(部分)3.数据库......查看详细>>

标签:生物信息

一、多序列联配概念

    许多生物学研究都涉及多条序列甚至几十上百条序列的比较,因此多序列联配是生物信息学的一个重要课题。通过多序列联配结果,我们可以确定这些序列的亲缘关系,通过序列保守性判断功能域或功能位点等。多序列联配同样包括全......查看详细>>

标签:生物信息

二、多序列全局联配算法

    多序列全局联配算法目前主要是以Clustal 算法为代表的渐进式全局联配方法。渐进式全局联配算法是20世纪80年代发展起来的(Waterman 和Perlwitz,1984; Feng 和Doolittle,1987),其中以软件工具Clustal 算法最为成功。下面就重点介绍Clustal 算法。......查看详细>>

标签:生物信息

三、多序列局部联配算法

    具有相同功能的基因往往在序列上存在局部相似性或保守性,这些保守性与相应功能和选择压等有关(详见下节)。图1-4.3列举了一个多序列局部保守性。生物信息学的一个重要任务是找到这些保守序列。图1-4.3 多序列局部保守性举例......查看详细>>

标签:生物信息

一、功能域概念

    蛋白质功能域(domain)的概念最早由Wetlaufer(1973)在研究蛋白质结构时提出。蛋白质功能域一般是指一条蛋白质序列中一段保守的区域,该区域能够独立行使功能、进化等。在蛋白质结构中,功能域是指一个蛋白质结构的一部分,它能形成一......查看详细>>

标签:生物信息
科普知识