蛋白质组学

蛋白质组学(英语:proteomics,又译作蛋白质体学),是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。这个概念最早是在1994年,由Marc Wikins首先提出的新名词。 蛋白质组(Proteome)一词,源于蛋白质(protein)与 基因组(genome)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组学本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。

  研究介绍

  蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些"疾病特异性的蛋白质分子",它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。确实,那些世界范围内销路最好的药物本身是蛋白质或其作用靶点为某种蛋白质分子。因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。蛋白质组学的研究是生命科学进入后基因时代的特征。

  基本策略

  蛋白质组(Proteome)的概念最先由MarcWilkins提出,指由一个基因组(genome),或一个细胞、组织表达的所有蛋白质(Protein).蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变.在转录时,一个基因可以多种mRNA形式剪接,并且,同一蛋白可能以许多形式进行翻译后的修饰.故一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目.蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域.蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制.作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸.多肽图谱依靠双向电泳(Two-dimensionalgelelectrophoresis,2-DE)和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等.

  研究基础

  90年代初期开始实施的人类基因组计划,在经过各国科学家近10年的努力下,已经取得了巨大的成就。不仅完成了十余种模式生物(从大肠杆菌、酿酒酵母到线虫)基因组全序列的测定工作,还在2003年提前完成人类所有基因的全序列测定。那么,知道了人类的全部遗传密码即基因组序列,就可以任意控制人的生老病死吗?其实并不是这么简单。基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力根据,但实际上大部分疾病并不是因为基因改变所造成。并且,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。关于这些方面的问题,基因组学是无法回答的。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。

  目前,在蛋白质功能方面的研究是极其缺乏的。大部分通过基因组测序而新发现的基因编码的蛋白质的功能都是未知的,而对那些已知功能的蛋白而言,它们的功能也大多是通过同源基因功能类推等方法推测出来的。有人预测,人类基因组编码的蛋白至少有一半是功能未知的。因此,在未来的几年内,随着至少30种生物的基因组测序工作的完成,人们研究的重点必将转到蛋白质功能方面,而蛋白质组的研究正可以完成这样的目标。在蛋白质组的具体应用方面,蛋白质在疾病中的重要作用使得蛋白质组学在人类疾病的研究中有着极为重要的价值。

  基因组(genome)包含的遗传信息经转录产生mRNA,一个细胞在特定生理或病理状态下表达的所有种类的mRNA称为转录子组(transcriptome)。很显然,不同细胞在不同生理或病理状态下转录子组包含的mRNA的种类不尽相同。mRNA经翻译产生蛋白质,一个细胞在特定生理或病理状态下表达的所有种类的蛋白质称为蛋白质组(proteome)。同理,不同细胞在不同生理或病理状态下所表达的蛋白质的种类也不尽相同。蛋白质是基因功能的实施者,因此对蛋白质结构,定位和蛋白质-蛋白质相互作用的研究将为阐明生命现象的本质提供直接的基础。

  生命科学是实验科学,因此生命科学的发展极大地依赖于实验技术的发展。以DNA序列分析技术为核心的基因组研究技术推动了基因组研究的日新月异,而以基因芯片技术为代表的基因表达研究技术为科学家了解基因表达规律立下汗马功劳。在蛋白质组研究中,二维电泳和质谱技术的黄金组合又为科学家掌握蛋白质表达规律再铸辉煌。蛋白质组学(proteomics)就是指研究蛋白质组的技术及这些研究得到的结果。

  蛋白质组学的研究试图比较细胞在不同生理或病理条件下蛋白质表达的异同,对相关蛋白质进行分类和鉴定。更重要的是蛋白质组学的研究要分析蛋白质间相互作用和蛋白质的功能。

  研究内容

  蛋白质研究

  1.蛋白质鉴定:可以利用一维电泳和二维电泳并结合Western等技术,利用蛋白质芯片和抗体芯片及免疫共沉淀等技术对蛋白质进行鉴定研究。

  2.翻译后修饰:很多mRNA表达产生的蛋白质要经历翻译后修饰如磷酸化,糖基化,酶原激活等。翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。

  3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。Clontech的荧光蛋白表达系统就是研究蛋白质在细胞内定位的一个很好的工具。

  4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。

  在基础医学和疾病机理研究中,了解人不同发育、生长期和不同生理、病理条件下及不同细胞类型的基因表达的特点具有特别重要的意义。这些研究可能找到直接与特定生理或病理状态相关的分子,进一步为设计作用于特定靶分子的药物奠定基础。

  细胞亚细胞

  不同发育、生长期和不同生理、病理条件下不同的细胞类型的基因表达是不一致的,因此对蛋白质表达的研究应该精确到细胞甚至亚细胞水平。可以利用免疫组织化学技术达到这个目的,但该技术的致命缺点是通量低。激光捕获显微切割LCM(LaserCaptureMicrodissection)技术可以精确地从组织切片中取出研究者感兴趣的细胞类型,因此LCM技术实际上是一种原位技术。取出的细胞用于蛋白质样品的制备,结合抗体芯片或二维电泳-质谱的技术路线,可以对蛋白质的表达进行原位的高通量的研究。很多研究采用匀浆组织制备蛋白质样品的技术路线,其研究结论值得怀疑,因为组织匀浆后不同细胞类型的蛋白质混杂在一起,最后得到的研究数据根本无法解释蛋白质在每类细胞中的表达情况。虽然培养细胞可以得到单一类型细胞,但体外培养的细胞很难模拟体内细胞的环境,因此这样研究得出的结论也很难用于解释在体实际情况。因此在研究中首先应该将不同细胞类型分离,分离出来的不同类型细胞可以用于基因表达研究,包括mRNA和蛋白质的表达。

  LCM技术获得的细胞可以用于蛋白质样品的制备。可以根据需要制备总蛋白,或膜蛋白,或核蛋白等,也可以富集糖蛋白,或通过去除白蛋白来减少蛋白质类型的复杂程度。相关试剂盒均有厂商提供。

  二维电泳

  蛋白质样品中的不同类型的蛋白质可以通过二维电泳进行分离。二维电泳可以将不同种类的蛋白质按照等电点和分子量差异进行高分辨率的分离。成功的二维电泳可以将2000到3000种蛋白质进行分离。电泳后对胶进行高灵敏度的染色如银染和荧光染色。如果是比较两种样品之间蛋白质表达的异同,可以在同样条件下分别制备二者的蛋白质样品,然后在同样条件下进行二维电泳,染色后比较两块胶。也可以将二者的蛋白质样品分别用不同的荧光染料标记,然后两种蛋白质样品在一块胶上进行二维电泳的分离,最后通过荧光扫描技术分析结果。

  胶染色后可以利用凝胶图像分析系统成像,然后通过分析软件对蛋白质点进行定量分析,并且对感兴趣的蛋白质点进行定位。通过专门的蛋白质点切割系统,可以将蛋白质点所在的胶区域进行精确切割。接着对胶中蛋白质进行酶切消化,酶切后的消化物经脱盐/浓缩处理后就可以通过点样系统将蛋白质点样到特定的材料的表面(MALDI-TOF)。最后这些蛋白质就可以在质谱系统中进行分析,从而得到蛋白质的定性数据;这些数据可以用于构建数据库或和已有的数据库进行比较分析。

  LCM-二维电泳-质谱的技术路线是典型的一条蛋白质组学研究的技术路线,除此以外,LCM-抗体芯片也是一条重要的蛋白质组学研究的技术路线。即通过LCM技术获得感兴趣的细胞类型,制备细胞蛋白质样品,蛋白质经荧光染料标记后和抗体芯片杂交,从而可以比较两种样品蛋白质表达的异同。Clontech最近开发了一张抗体芯片,可以对378种膜蛋白和胞浆蛋白进行分析。该芯片同时配合了抗体芯片的全部操作过程的重要试剂,包括蛋白质制备试剂,蛋白质的荧光染料标记试剂,标记体系的纯化试剂,杂交试剂等。

  对于蛋白质相互作用的研究,酵母双杂交和噬菌体展示技术无疑是很好的研究方法。Clontech开发的酵母双杂交系统和NEB公司开发的噬菌体展示技术可供研究者选用。

  关于蛋白质组的研究,也可以将蛋白质组的部分或全部种类的蛋白质制作成蛋白质芯片,这样的蛋白质芯片可以用于蛋白质相互作用研究,蛋白表达研究和小分子蛋白结合研究。Science,Vol.293,Issue5537,2101-2105,September14,2001发表了一篇关于酵母蛋白质组芯片的论文。该文主要研究内容为:将酵母的5800个ORF表达成蛋白质并进行纯化点样制作芯片,然后用该芯片筛选钙调素和磷脂分子的相互作用分子。

  最后有必要指出的是,传统的蛋白质研究注重研究单一蛋白质,而蛋白质组学注重研究参与特定生理或病理状态的所有的蛋白质种类及其与周围环境(分子)的关系。因此蛋白质组学的研究通常是高通量的。适应这个要求,蛋白质组学相关研究工具通常都是高度自动化的系统,通量高而速度快,配合相应分析软件和数据库,研究者可以在最短的时间内处理最多的数据

  研究意义背景

  研究意义

  随着人类基因组计划的实施和推进,生命科学研究已进入了后基因组时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组中所采用的策略,如基因芯片、基因表达序列分析(Serialanalysisofgeneexpression,SAGE)等,都是从细胞中mRNA的角度来考虑的,其前提是细胞中mRNA的水平反映了蛋白质表达的水平。但事实并不完全如此,从DNAmRNA蛋白质,存在三个层次的调控,即转录水平调控(Transcriptionalcontrol),翻译水平调控(Translationalcontrol),翻译后水平调控(Post-translationalcontrol)。从mRNA角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。更重要的是,蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等则几乎无法从mRNA水平来判断。毋庸置疑,蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制。蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。虽然蛋白质的可变性和多样性等特殊性质导致了蛋白质研究技术远远比核酸技术要复杂和困难得多,但正是这些特性参与和影响着整个生命过程。传统的对单个蛋白质进行研究的方式已无法满足后基因组时代的要求。这是因为:(1)生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。(2)多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。(3)在执行生理功能时蛋白质的表现是多样的、动态的,并不象基因组那样基本固定不变。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。因此在上世纪90年代中期,国际上产生了一门新兴学科-蛋白质组学(Proteomics),它是以细胞内全部蛋白质的存在及其活动方式为研究对象。可以说蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是后基因组时代生命科学研究的核心内容之一。

  研究背景

  虽然第一次提出蛋白质组概念是在1994年,但相关研究可以追溯到上世纪90年代中期甚至更早,尤其是80年代初,在基因组计划提出之前,就有人提出过类似的蛋白质组计划,当时称为HumanProteinIndex计划,旨在分析细胞内的所有蛋白质。但由于种种原因,这一计划被搁浅。90年代初期,各种技术已比较成熟,在这样的背景下,经过各国科学家的讨论,才提出蛋白质组这一概念。

  国际上蛋白质组研究进展十分迅速,不论基础理论还是技术方法,都在不断进步和完善。相当多种细胞的蛋白质组数据库已经建立,相应的国际互联网站也层出不穷。1996年,澳大利亚建立了世界上第一个蛋白质组研究中心:AustraliaProteomeAnalysisFacility(APAF)。丹麦、加拿大、日本也先后成立了蛋白质组研究中心。在美国,各大药厂和公司在巨大财力的支持下,也纷纷加入蛋白质组的研究阵容。去年在瑞士成立的GeneProt公司,是由以蛋白质组数据库“SWISSPROT”著称的蛋白质组研究人员成立的,以应用蛋白质组技术开发新药物靶标为目的,建立了配备有上百台质谱仪的高通量技术平台。而当年提出HumanProteinIndex的美国科学家NormsnG.Anderson也成立了类似的蛋白质组学公司,继续其多年未实现的梦想。2001年4月,在美国成立了国际人类蛋白质组研究组织(HumanProteomeOrganization,HUPO),随后欧洲、亚太地区都成立了区域性蛋白质组研究组织,试图通过合作的方式,融合各方面的力量,完成人类蛋白质组计划(HumanProteomeProject)。

  研究技术

  可以说,蛋白质组学的发展既是技术所推动的也是受技术限制的。蛋白质组学研究成功与否,很大程度上取决于其技术方法水平的高低。蛋白质研究技术远比基因技术复杂和困难。不仅氨基酸残基种类远多于核苷酸残基(20/4),而且蛋白质有着复杂的翻译后修饰,如磷酸化和糖基化等,给分离和分析蛋白质带来很多困难。此外,通过表达载体进行蛋白质的体外扩增和纯化也并非易事,从而难以制备大量的蛋白质。蛋白质组学的兴起对技术有了新的需求和挑战。蛋白质组的研究实质上是在细胞水平上对蛋白质进行大规模的平行分离和分析,往往要同时处理成千上万种蛋白质。因此,发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。当前在国际蛋白质组研究技术平台的技术基础和发展趋势有以下几个方面:

  样品制备

  通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析。也可以进行样品预分级,即采用各种方法将细胞或组织中的全体蛋白质分成几部分,分别进行蛋白质组研究。样品预分级的主要方法包括根据蛋白质溶解性和蛋白质在细胞中不同的细胞器定位进行分级,如专门分离出细胞核、线粒体或高尔基体等细胞器的蛋白质成分。样品预分级不仅可以提高低丰度蛋白质的上样量和检测,还可以针对某一细胞器的蛋白质组进行研究。

  对临床组织样本进行研究,寻找疾病标记,是蛋白质组研究的重要方向之一。但临床样本都是各种细胞或组织混杂,而且状态不一。如肿瘤组织中,发生癌变的往往是上皮类细胞,而这类细胞在肿瘤中总是与血管、基质细胞等混杂。所以,常规采用的癌和癌旁组织或肿瘤与正常组织进行差异比较,实际上是多种细胞甚至组织蛋白质组混合物的比较。而蛋白质组研究需要的通常是单一的细胞类型。最近在组织水平上的蛋白质组样品制备方面也有新的进展,如采用激光捕获微解剖(LaserCaptureMicrodissection,LCM)方法分离癌变上皮类细胞。

  分离和分析

  利用蛋白质的等电点和分子量通过双向凝胶电泳的方法将各种蛋白质区分开来是一种很有效的手段。它在蛋白质组分离技术中起到了关键作用。如何提高双向凝胶电泳的分离容量、灵敏度和分辨率以及对蛋白质差异表达的准确检测是目前双向凝胶电泳技术发展的关键问题。国外的主要趋势有第一维电泳采用窄pH梯度胶分离以及开发与双向凝胶电泳相结合的高灵敏度蛋白质染色技术,如新型的荧光染色技术。

  质谱技术是目前蛋白质组研究中发展最快,也最具活力和潜力的技术。它通过测定蛋白质的质量来判别蛋白质的种类。当前蛋白质组研究的核心技术就是双向凝胶电泳-质谱技术,即通过双向凝胶电泳将蛋白质分离,然后利用质谱对蛋白质逐一进行鉴定。对于蛋白质鉴定而言,高通量、高灵敏度和高精度是三个关键指标。一般的质谱技术难以将三者合一,而最近发展的质谱技术可以同时达到以上三个要求,从而实现对蛋白质准确和大规模的鉴定。

  蛋白质组研究

  做过双向凝胶电泳的人一定会抱怨它的繁琐、不稳定和低灵敏度等缺点。发展可替代或补充双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的目标。目前,二维色谱(2D-LC)、二维毛细管电泳(2D-CE)、液相色谱-毛细管电泳(LC-CE)等新型分离技术都有补充和取代双向凝胶电泳之势。另一种策略则是以质谱技术为核心,开发质谱鸟枪法(Shot-gun)、毛细管电泳-质谱联用(CE-MS)等新策略直接鉴定全蛋白质组混合酶解产物。随着对大规模蛋白质相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也被科学家所关注。此外,蛋白质芯片的发展也十分迅速,并已经在临床诊断中得到应用。

       蛋白质组数据库是蛋白质组研究水平的标志和基础。瑞士的SWISS-PROT拥有目前世界上最大,种类最多的蛋白质组数据库。丹麦、英国、美国等也都建立了各具特色的蛋白质组数据库。生物信息学的发展已给蛋白质组研究提供了更方便有效的计算机分析软件;特别值得注意的是蛋白质质谱鉴定软件和算法发展迅速,如SWISS-PROT、Rockefeller大学、UCSF等都有自主的搜索软件和数据管理系统。最近发展的质谱数据直接搜寻基因组数据库使得质谱数据可直接进行基因注释、判断复杂的拼接方式。随着基因组学的迅速推进,会给蛋白质组研究提供更多更全的数据库。另外,对肽序列标记的从头测序软件也十分引人注目。

  蛋白质组学

  蛋白质组学技术的发展已经成为现代生物技术快速发展的重要支撑,并将引领生物技术取得关键性的突破。为帮助生命科学领域的工作者全面掌握蛋白质组学的技术与方法、实验难点与关键点、研究前沿与热点,本技术平台将为客户提供蛋白组学技术服务,包括双向凝胶电泳、等电聚焦、生物质谱分析及非凝胶技术。

  双向凝胶电泳

  双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。由于双向电泳技术在蛋白质组与医学研究中所处的重要位置,它可用于蛋白质转录及转录后修饰研究,蛋白质组的比较和蛋白质间的相互作用,细胞分化凋亡研究,致病机制及耐药机制的研究,疗效监测,新药开发,癌症研究,蛋白纯度检查,小量蛋白纯化,新替代疫苗的研制等许多方面。近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。

  等电聚焦

  等电聚焦(isoelectricfocusing,IEF)是60年代中期问世的一种利用有pH梯度的介质分离等电点不同的蛋白质的电泳技术。等电聚焦凝胶电泳依据蛋白质分子的静电荷或等电点进行分离,等电聚焦中,蛋白质分子在含有载体两性电解质形成的一个连续而稳定的线性pH梯度中电泳。载体两性电解质是脂肪族多氨基多羧酸,在电场中形成正极为酸性,负极为碱性的连续的pH梯度。蛋白质分子在偏离其等电点的pH条件下带有电荷,因此可以在电场中移动;当蛋白质迁移至其等电点位置时,其静电荷数为零,在电场中不再移动,据此将蛋白质分离。

  生物质谱

  生物质谱技术是蛋白质组学研究中最重要的鉴定技术,其基本原理是样品分子离子化后,根据不同离子之间的荷质比(M/E)的差异来分离并确定分子量。对于经过双向电泳分离的目标蛋白质用胰蛋白酶酶解(水解Lys或Arg的-C端形成的肽键)成肽段,对这些肽段用质谱进行鉴定与分析。目前常用的质谱包括两种:基质辅助激光解吸电离-飞行时间质谱(MALDI-TOF-MS)和电喷雾质谱(ESI-MS)。

  飞行时间质谱

  MALDI的电离方式是Karas和Hillenkamp于1988年提出。MALDI的基本原理是将分析物分散在基质分子(尼古丁酸及其同系物)中并形成晶体,当用激光(337nm的氮激光)照射晶体时,基质分子吸收激光能量,样品解吸附,基质-样品之间发生电荷转移使样品分子电离。它从固相标本中产生离子,并在飞行管中测定其分子量,MALDI-TOF-MS一般用于肽质量指纹图谱,非常快速(每次分析只需3~5min),灵敏(达到fmol水平),可以精确测量肽段质量,但是如果在分析前不修饰肽段,MALDI-TOF-MS不能给出肽片段的序列。

  电喷雾质谱

  ESI-MS是利用高电场使质谱进样端的毛细管柱流出的液滴带电,在N2气流的作用下,液滴溶剂蒸发,表面积缩小,表面电荷密度不断增加,直至产生的库仑力与液滴表面张力达到雷利极限,液滴爆裂为带电的子液滴,这一过程不断重复使最终的液滴非常细小呈喷雾状,这时液滴表面的电场非常强大,使分析物离子化并以带单电荷或多电荷的离子形式进入质量分析器。ESI-MS从液相中产生离子,一般说来,肽段的混合物经过液相色谱分离后,经过偶联的与在线连接的离子阱质谱分析,给出肽片段的精确的氨基酸序列,但是分析时间一般较长。

  目前,许多实验室两种质谱方法连用,获得有意义的蛋白质的肽段序列,设计探针或引物来获得有意义的基因。随着蛋白质组研究的深入,又有多种新型质谱仪出现,主要是在上述质谱仪的基础上进行改进与重新组合。

  发展回顾

  核酸与蛋白质是构成生物体的主要大分子。随着人类基因组等大量生物体全基因组序列的破译和功能基因组研究的展开,生命科学家越来越关注如何用基因组研究的模式开展蛋白质组学的研究。正因如此,《Nature》、《Science》在2001年2月公布人类基因组草图的同时,分别发表了“Andnowfortheproteome”和“Proteomicsingenomeland”的述评与展望,将蛋白质组学的地位提到前所未有的高度,认为蛋白质组学将成为新世纪最大战略资源---人类基因争夺战的战略制高点之一。蛋白质组学虽然问世时间很短,但已经在研究细胞的增殖、分化、异常转化、肿瘤形成等方面进行了有力的探索,涉及到白血病、乳腺癌、结肠癌、膀胱癌、前列腺癌、肺癌、肾癌和神经母细胞瘤等,鉴定了一批肿瘤相关蛋白,为肿瘤的早期诊断、药靶的发现、疗效判断和预后提供了重要依据。

  鉴于蛋白质组学发展前景的重要性和技术的先进性,西方各主要发达国家纷纷投巨资全面启动蛋白质组的研究。如美国国立卫生研究院,美国能源部、欧共体等均启动了不同生物蛋白质组的研究并取得明显进展,一批高质量的研究论文相继在国际著名学术刊物发表。由于蛋白质组学研究比基因组学研究更接近实用,有着巨大的市场前景,企业与制药公司也纷纷斥巨资开展蛋白质组研究。独立完成人类基因组测序的Celera公司已宣布投资上亿美元于此领域;日内瓦蛋白质组公司与布鲁克质谱仪制造公司联合成立了国际上最大的蛋白质组研究中心。为了促进国家与地区性的蛋白质组的发展、合作与交流,成立了国际人类蛋白质组组织(HUPO),在法国召开了首届国际蛋白质组大会,并迅即在北美、欧洲、韩国、日本成立了相应的分支机构。蛋白质组学已成为西方各主要发达国家、各跨国制药集团竞相投入的“热点”。

  主要进展

  启动研究

  在国家支持下,中国科学院生物化学研究所、军事医学科学院、复旦大学与北京师范大学等单位迅速启动了蛋白质组研究,建立并组合了二维电泳蛋白质组分离技术、图象分析技术和蛋白质鉴定的质谱技术;先后举办了三次全国性的蛋白质组学术研讨会,并在国际上较早提出了功能蛋白质组学的研究战略。我国蛋白质的色谱/电泳二维分离,二维芯片电泳分离,质谱在线鉴定等方面均取得了重要进展,并得到了国际同行的认同,具有一定优势。其中由军事医学科学院牵头的“人类肝脏蛋白质组计划”成为世界“人类蛋白质组计划”的重要组成部分之一。

  重要成就

  虽然我国蛋白质组学研究启动不久,我国科学家已经在重大疾病如肝癌、维甲酸诱导白血病细胞凋亡启动模型及维甲酸定向诱导胚胎干细胞向神经系统分化的模型等比较蛋白质组研究以及一些重要生理和病理体系的蛋白质组成分研究方面获得了重要成就。在胚胎干细胞诱导向神经干细胞方向分化前后分离出了19个与定向诱导神经分化相关的蛋白;在HL-60细胞凋亡研究中初步筛选到21个凋亡相关蛋白。已进行了肝癌细胞系及正常肝细胞蛋白质组的比较分析研究,发现了两者间不同的蛋白表达群;自行建立了肝癌高/低转移细胞系,进行了原位食管癌/转移食管癌间的比较蛋白质组研究,初步发现了一批与肿瘤转移相关的蛋白质群。通过蛋白质芯片技术对肺癌病人和正常人血清中的蛋白质谱的对比分析,找到了15个差异蛋白并利用BiomarkerPattern分析软件建立了肺癌诊断分类树模型。初步盲筛结果表明,这15个分子标志可能成为临床诊断肺癌的新指标,有重要应用价值。在大规模人胎肝蛋白表达谱方面初步鉴定出500个高丰度蛋白,150个磷酸化相关蛋白等等。这些研究证明了我国的蛋白质组学技术平台已能支撑一定规模的研究,为我国在该研究领域争得了一席之地,也为未来的发展奠定了良好的基础。

  目前,由军事医学科学院牵头的973计划项目和由上海生命科学院牵头的863计划项目集中了国内十余家优势单位,针对严重影响我国人民健康的重大疾病和重要生命科学问题开展“重大疾病的比较蛋白质组研究”和“重要生理、病理体系的功能蛋白质组研究”。力争在3~5年内建立国际领先水平的蛋白质组学研究通用技术平台,发现一批有重要生命科学价值或与重大疾病相关的蛋白质,为探索基因转录,翻译调控的规律、获得重大疾病预警、诊断标志物和新药研究的靶标作出贡献。

  目前,国内已有若干蛋白质组学研究中心或重点实验室相继成立,如复旦大学蛋白质研究中心,军事医学科学院蛋白质组中心,高等院校蛋白质组学研究院,中国科学院蛋白质组学重点实验室和中国医学科学院蛋白质组学研究中心等。其中高校蛋白质组研究院是由国内多所高校、临床单位和国内外有关公司联合建立的研究机构,是我国高校大规模打破学校界限,与国内外多方面力量联手,进军蛋白组组学研究领域所采取的新举措。统一协调有关国内研究的中国人类蛋白质组组织(ChineseHUPO)和蛋白质组专业委员会等也在筹备中。

  发展趋势

  基础研究方面

  近两年来蛋白质组研究技术已被应用到各种生命科学领域,如细胞生物学、神经生物学等。在研究对象上,覆盖了原核微生物、真核微生物、植物和动物等范围,涉及到各种重要的生物学现象,如信号转导、细胞分化、蛋白质折叠等等。在未来的发展中,蛋白质组学的研究领域将更加广泛。

  应用研究方面

  蛋白质组学将成为寻找疾病分子标记和药物靶标最有效的方法之一。在对癌症、早老性痴呆等人类重大疾病的临床诊断和治疗方面蛋白质组技术也有十分诱人的前景,目前国际上许多大型药物公司正投入大量的人力和物力进行蛋白质组学方面的应用性研究。

  技术发展方面

  蛋白质组学的研究方法将出现多种技术并存,各有优势和局限的特点,而难以象基因组研究一样形成比较一致的方法。除了发展新方法外,更强调各种方法间的整合和互补,以适应不同蛋白质的不同特征。另外,蛋白质组学与其它学科的交叉也将日益显著和重要,这种交叉是新技术新方法的活水之源,特别是,蛋白质组学与其它大规模科学如基因组学,生物信息学等领域的交叉,构成组学(omics)生物技术研究方法,所呈现出的系统生物学(SystemBiology)研究模式,将成为未来生命科学最令人激动的新前沿。