登陆COG网站,选择初始版本(initialversion),把由EST序列所得对应基因产物进行COG蛋白同源簇分析(见图6.26、6.27)。在“COGnitor”中输入EST所对应的基因产物的氨基酸序列(见图6.27)。然后点击“comparetoCOGs”。得到同源簇结果(见图6.22、6.23、...[继续阅读]
海量资源,尽在掌握
登陆COG网站,选择初始版本(initialversion),把由EST序列所得对应基因产物进行COG蛋白同源簇分析(见图6.26、6.27)。在“COGnitor”中输入EST所对应的基因产物的氨基酸序列(见图6.27)。然后点击“comparetoCOGs”。得到同源簇结果(见图6.22、6.23、...[继续阅读]
结构域是蛋白序列的功能、结构和进化单元,由50-300个氨基酸组成,有独特的空间构象。结构域的基本类型有:全平行α结构域、反平行β结构域、α+β结构域、α/β结构域以及其他折叠类型(如富含金属或二硫键结构域)。一条蛋白序列可...[继续阅读]
1.http://www.nlm.nih.gov/bsd/pubmed_tutorial/m1001.html2.http://www.ncbi.nlm.nih.gov/entrez/journals/noprov/loftext_full_noprov.html3.http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary.html4.http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=unigene5.http://ww...[继续阅读]
1.CynthiaG,PerJambeck.DevelopingBioinformaticsComputerSkills.OReilly&Associates2.WelshM,KaufmanL.RunningLinux.OReilly&Associates3.PeekJ,TodinoG,StrangJ.LearningtheUnixOperationSystem.OReilly&Associates4.王建桥等译.Linux24小时教程.北京:机械工业出版社,20025.胡松年,薛...[继续阅读]
PromoterScan(http://bimas.dcrt.nih.gov:80/molbio/proscan)是常用的真核生物启动子预测工具,由DanPrestridge于1995年开发(见图7.20),它能够基于转录因子结合位点分布密度预测转录调控区,及其转录起始位点、核心启动子和其他转录因子结合位点。Pr...[继续阅读]
4.3.1.1错拼错拼指的是本不该拼接在一起的EST拼接到了一起。造成错拼的原因主要有:(1)3′端EST序列的polyA的尾巴存在,使本不相关的EST序列拼接在一起;(2)镶嵌克隆read的存在,连接了两条(或多条)本不相关的EST;(3)基因家族中序列相似性...[继续阅读]
网上运行InterProScan每次最多只能提交一条核苷酸序列或者10条氨基酸序列,当需要对大量的数据作处理时,可以在本地Linux系统下进行。EBI提供了相应的软件和数据库的FTP下载,下载网址为:ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan/将下载的...[继续阅读]
TigrAssembler是用于将大批量的霰弹DNA片断组装成一致性序列的工具,它是由TIGR(TheInstituteofGenomeResearch)中心研发而成,已成功组装了HaemophilusinfluenzaeandMycoplasmagenitalium等全基因组序列。TigrAssembler工作步骤如下:(1)对所有的数据进行快速初步...[继续阅读]
蛋白质大分子的一级序列和二级结构反映了蛋白质的一维结构,而超二级结构(supersecondarystructure)、结构域(domain)、三级(tertiarystructure)和四级结构(quateruarystructure)则反映了蛋白质的三维结构。不同蛋白质序列经折叠可产生类似的三维构...[继续阅读]
对于上述EST聚类所出现的问题,一般可以通过以下几种方法来进行检查和处理:(1)调整拼接参数,如对于错拼中的polyA的情况,可以将比对参数调得更加严格一些,从而区分开这些polyA的连接;而对于EST末端质量较低而造成的漏拼,则需要将参...[继续阅读]