1.3.4 聚类和拼接

    聚类和拼接的目的就是将来自同一个基因的具有重叠部分(over-lapping)的EST整合至单一的簇(cluster)中。通过聚类和拼接,可产生较长的一致性序列(consensussequence),便于进行注释;降低数据的冗余,纠正测序错误,用于检测选择性剪切(alterna......查看详细>>

标签:基因表达序列标签(EST)数据分析

1.3.5 基因注释及功能分类

    基因注释即利用BLAST等序列联配工具,通过将聚类和拼接所产生的一致性序列与已知的非冗余蛋白质数据库(nr)、非冗余核酸数据库(nt)、蛋白质功能结构域(domain)和基序(motif)等二级数据库进行同源比对,从而赋予这些一致性序列一定的......查看详细>>

标签:基因表达序列标签(EST)数据分析

1.3.6 后续分析

    从大规模EST测序分析数据可以发现大量新基因,除此以外其产生的序列和功能信息,还可用于进行比较基因组学分析、基因表达谱分析和选择性剪切分析等。EST测序分析以其快速、低廉、直观的优势,成为连接结构基因组学和功能基因......查看详细>>

标签:基因表达序列标签(EST)数据分析

1.4 参考文献

    1.AdamsM,VenterJCetal.ChromosomalDistributionof320GenesfromaBraincDNALibrary.NatureGenetics,1993,4(4):381~3862.AdamsM,JennyM,Kelleyetal.ComplementaryDNASequencing:ExpressedSequenceTagsandHumanGenomeProject.Science,1991,252(5013):1651~1656......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.1 简 介

    大多数人已经习惯在个人计算机上工作,对窗口界面、字处理程序甚至一些数据分析软件包非常熟悉。但是随着基因组学研究的快速发展,EST数据的爆炸性增长,常用的个人电脑已不能满足处理基因组大量数据和进行核苷酸及氨基酸复......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.2.1 个人电脑(PC机)

    EST数据分析计算中最常用的是简单的序列比对,对于少量且简单的运算,个人电脑在性能上不会输给昂贵的服务器太多。EST数据分析所需计算机的基本配置:●处理器:486及以上CPU●内存:256MB以上●硬盘:20G以上当处理数据较多或所做分析......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.2.2 PC Cluster(集群)

    Cluster技术是近10年来兴起的一项高性能计算技术,可用于科学研究系统的搭建,因此在EST数据分析中被广泛采用。Cluster系统由一组独立/完整的计算机互联组成,是一种并行系统或分布式系统,提供完整的计算资源。在体系结构上具备高......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.2.3 小型服务器

    优良的服务器应具有高可靠性和高稳定性,易于管理和维护,尽量少出故障或死机。承担连续不断的工作,尤其是在大规模EST数据分析过程中,许多程序都在服务器上运行,一旦服务器发生故障,将会造成大量数据丢失,产生不可估量的损失......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.2.4 大型机(mainframe)

    和微型机有所区别,大型机通常是指安装在带框铁盒子里的大型计算机系统。如system/360开始的一系列的IBM计算机,Amdahl,HitachiDataSystems(HDS)制造的兼容系统等。大型机在结构上通过开发处理器中各个层次的并行性和软硬件协同来提高性......查看详细>>

标签:基因表达序列标签(EST)数据分析

2.3.1 Unix

    操作系统为它们的程序运行、打开文件、读文件、分配存储区等提供服务。对于多用户计算机系统而言,Unix是一个功能强大的操作系统。它已经存在了30年之久,近年来,Unix不断优化:增强了计算机之间的网络功能;初始化多个异步工作......查看详细>>

标签:基因表达序列标签(EST)数据分析
科普知识