当前位置:文档之家› 环境蛋白质组学及生物信息学研究进展

环境蛋白质组学及生物信息学研究进展

环境蛋白质组学及生物信息学研究进展
环境蛋白质组学及生物信息学研究进展

环境蛋白质组学及生物信息学研究进展

吴兵 潘文杨 张徐祥 孙石磊 赵大勇 程树培*

(南京大学 环境学院,南京,210093)

E-mail(wubingnju@https://www.doczj.com/doc/eb16016733.html,)

摘 要:本文综述污染物分子毒性,及其环境蛋白质组学与生物信息学的理论知识和技术平台。涉及蛋白质组学在分子生态毒理学和环境健康学等领域的研究与应用和高通量、高速度、高灵敏的生物信息检测技术;本综述对于提高环境质量,导向人体健康和环境健康的科学研究与安全预警,具有重要意义。

关键词:环境蛋白质组学 生物信息学 分子毒性 环境健康

自人类基因组计划(HGP)完成之后,生命科学已进入了后基因组时代,即利用基因序列预测表达的蛋白及其结构和功能[1-3]。众所周知,基因在表达蛋白质的过程中,受到多种因素的影响。一种基因可以表达出多种蛋白质,从而产生不同的功能与效应,所以仅仅根据基因的序列,不能确定生命活动的规律。此外,基因所表达的蛋白质,自身还存在修饰加工、转运定位、结构形成、代谢转化等过程以及蛋白质与蛋白质的相互作用过程;蛋白质与其它生物大分子之间的相互作用过程等等;这些均无法从基因水平的研究中获得[3-5]。因此,研究细胞内全部蛋白质的组成及其活动规律的蛋白质组学(proteomics)也就应运而生,并在此基础上形成了以研究环境污染物分子毒性与蛋白质组学之间规律为目的的环境蛋白质组学(environmental proteomics)。

环境蛋白组学,是蛋白组学和环境科学交叉融合的边缘领域。它的突出的目标功能是了解并确证危险污染物对人体或对其它生命体所产生的分子毒性,发现和界定污染物对生物机体蛋白的作用位点和作用方式,为维护人体健康与环境健康,提供控制标准与预警规范。中国于2001年5月23日签约《POPs斯德哥尔摩公约》,参与控制与消除持久性有机污染物(persistent organic pollutants, POPs)的国际合作。POPs在1mg/L-1的浓度时,即可对人体产生致癌、生殖、免疫、神经等4类主要的分子毒性威胁,实验证实这些毒性与环境基因组学有关(environmental genomics),而大量的直接的证据则需要从环境蛋白组学进行探索研究。

1 环境蛋白质组学与污染物分子毒性

1.1 环境蛋白组学与污染物分子毒性

澳大利亚Wilkins和Willams等于1994年就提出了蛋白组(proteome)的概论。蛋白组是指由一个细胞或一个组织或一个机体的基因组所表达的全部蛋白质及其活动规律[6-7]。针对一个细胞或一个组织或一个机体而言,只有一套基因组。而这一套基因组,随着条件与过程的变化,可以表达出多套的蛋白组。我们把研究蛋白组总和的科学称为蛋白组学。蛋白组学当前的任务是研究高度活跃动态的蛋白质组,是应用分离和识别大规模蛋白组的技术,研究蛋白质的科学[5,8-10,11,12]。

环境蛋白组学,是应用蛋白组学的理论与技术,研究与解决环境问题的边缘交叉领域。从暴露于污染环境的机体或细胞的蛋白质整体活动角度,揭示和阐明污染物对生命活动的影响。环境蛋白组学的研究内容主要包括两部分:

(1)研究暴露于污染环境中生命体的蛋白质表达模式,包括识别和量化表达的各种蛋白质,以及蛋白质的细胞内外定位与修饰结果等。

(2)研究暴露于污染环境中生命体的蛋白质功能模式,包括蛋白质之间的相互作用与

- 1 -

反应过程,及其之间形成的网络关系与生物效应等。

蛋白质组学的研究方法,已经广泛应用于环境污染物的分子毒性检测 [13-14],不仅可以高通量的发现污染物引发的蛋白质表达变化,阐明污染物中毒机理,而且还可以筛选特异性蛋白作为毒性预警和安全评价的生物标志物,有力推动分子毒理学的发展。

1.2 环境基因组学与污染物分子毒性

基因组(genome)是指一个生命体全部基因的总称,具有普遍性和均一性,在不同时期的不同细胞、组织和器官中,基因组基本稳定不变。研究基因组总和的科学称为基因组学。环境基因组学研究污染物对生命体基因组的影响。它的产生和发展对环境生态分子毒理学的发展有着重大的变革作用,推动了环境生态毒理学研究从组织、细胞水平向分子水平的发展,开创了环境生态分子毒理学的新时代。它的主要功能是通过检测某种特殊环境因子对生命个体具体基因的影响,阐述引起各种分子毒性作用的遗传机制,阐明个体对不同环境因素的易感机制,预测具体生命个体可能受到环境的不利影响, 提供针对性的预防措施与技术途径[15-17]。

基因组内的各个基因表达的环境条件不同,其表达的模式也会不同,使所表达的蛋白组具有多样性和可变性[5,8]。随着人类进入后基因组时代,基因组和蛋白质组研究变得更加密切,但基因组学的研究是蛋白质组学研究的基础和前提。因此在利用环境蛋白质组学研究污染物分子毒性的过程中,环境基因组学的研究是必要的也是必须的,两者在污染物分子毒性研究和评估中共同起着重要的作用

1.3环境生物信息学与污染物分子毒性

生物信息学是随着人类基因组计划而发展起来的,是生物学与计算机科学及应用科学的交叉学科,并在各个领域都得到了广泛的应用[18-21]。环境生物信息学就是利用生物信息学的原理和方法来研究环境生物学的相关问题,它主要是通过污染物暴露下生物大分子信息的获得、加工、存储、分类、检索与分析,综合运用数学、计算机科学和生物学的各种工具进行研究,以达到理解生物大分子信息的生物学意义。随着各种数据库的建立和软件的开发,环境生物信息学也在不断的发展,并在污染物分子毒性评估和降解中展现出重要的作用。

环境生物信息学的产生和发展对环境毒理学具有巨大的推动作用。传统的化合物分子毒性研究中存在一定的局限性,即需要大量的资金、人力、物力,实验动物消耗大,实验周期长等。我们利用化合物和受试分子的结构和理化性质,同时应用毒物动力学和毒物效应学的信息和数据,可显著改善传统的分子毒性实验和评估中的不肯定性,缩短分子毒性测定的时间和消耗。

2环境蛋白质组学检测技术方法

环境蛋白质组学的发展依赖于蛋白质组学的三大支撑技术:双向凝胶电泳技术(two-dimensional gel electrophoresis,2DE)、质谱技术(mass spectrometry, MS)和生物信息学技术[12]。这些技术可以在细胞水平上对蛋白质进行大规模的平行分离和分析,可同时处理成千上万种蛋白质,具有高通量、高灵敏度、高准确性等特点。下面对三种主流技术和刚出现的新技术做了详细的介绍。

2.1 双相凝胶电泳技术(2DE)

- 2 -

双向电泳技术出现于1975年,随着近年来蛋白质组学的蓬勃发展,得到了很大的改进和发展[22-23],已经成为复杂蛋白质组分检测和分析的一种强有力的生化技术,并在生物研究的各个方面得到广泛的应用[24]。双向电泳的基本原理是:第一项基于蛋白质等电点不同在pH梯度胶内等电聚焦(Isoelectric focusing, IEF);第二项根据分子量大小不同进行SDS-PAEG 分离,把复杂蛋白质混合物中的蛋白质在二维平面上分开。双向凝胶电泳技术具有高通量、重复性好、敏感性高等优点。目前最常用的双向电泳方法为IPG-DALT双向电泳技术,它利用固定pH介质来形成固定pH梯度(immobilized pH gradient, IPG),具有pH梯度稳定,上样量大,重复性好,分辨率高等优点[22]。

2.1.1蛋白质样品的预处理

双向电泳样品预处理包括样品中的蛋白质充分溶解、变性和还原,以便完全打破蛋白质间的相互作用和去除非蛋白质组分[22,25-26]。抓好样品的预处理是获得高灵敏度、高分辨率、高重复性电泳图谱的技术关键之一。

制备样品一般要经过破碎和裂解过程。破碎的方法有多种,最常用的破碎方法有冻融法和玻璃珠破碎法。细胞破碎应在低温中进行,并减少破碎过程中热量的产生。样品裂解的效果取决于裂解、破碎、沉淀、溶解的过程以及去污剂的选择和各种溶液的选择。通常的等电聚焦样品裂解液包括8M尿素、4%CHAPS、2%载体两性电解质和1%DDT。此外所需去除所制备的样品中的杂质,常使用的是TCA-丙酮沉淀法。最近关于双向电泳样品制备改进的报道很多[27],Babu等[28]报道了使用DHPC作为去污剂来溶解完整的细胞膜用于双向电泳,试验结果显示,DHPC作为去污剂溶解膜蛋白的效果很好,并推测DHPC可能有利于复杂细胞器的蛋白质组图谱的建立。Chinnasamy等[29]测试了12种溶解缓冲液在溶解提取自成熟的小麦种子中的酸性和碱性蛋白质的效率,最终找到了两种缓冲液在分别提取酸性和碱性蛋白质上有很好的效果。

2.1.2双向电泳过程

对于未知样品一般先用宽pH范围的等点聚焦大致确定蛋白的等点位置,再缩小pH范围到分辨要求。固定化pH胶条在使用前要进行泡胀。等电聚焦要调节的聚焦参数包括时间,温度和电压等。等点聚焦开始时所需要的电压很低,因为低电压有利于样品进入凝胶,并且能减少蛋白的聚合相互作用、去除过量的盐粒子。然后逐步分级升高电压,直到达到预制的电压并维持几个小时,具体的时间由样品量、凝胶特性决定,而聚焦时的温度应稍高于通常的温度,如15-20℃,以防止尿素结晶。

经过等电聚焦的凝胶条在经过平衡后才可以进行第二向电泳,。一般的步骤是先在第一步平衡缓冲液(含DTT和SDS)中平衡10min,再在第二步平衡缓冲液(含碘乙酰胺和SDS)中平衡10min。平衡的目的是使蛋白质分子与SDS和还原剂充分相互作用,解聚蛋白质分子,并于SDS结合形成带负电的蛋白质-SDS复合物,以确保第二向的迁移。

SDS-电泳分为水平和垂直两种,对于水平电泳,只要将IPG凝胶条面朝下直接贴在SDS 凝胶的浓缩胶的胶面上,要避免气泡的陷入。如果是垂直电泳,要用琼脂糖将凝胶条密封在浓缩胶上,同样要避免气泡的产生。为了蛋白质分子质量的测定,在SDS凝胶的一端加分子质量标准。电流维持于15~30mA/胶,起始时用的低电流或低电压,待样品在完全走出IPG胶条

- 3 -

后,再加大电流(或电压),待指示剂达到底部边缘时即可停止电泳。

2.1.3染色及凝胶图谱处理

考马斯亮蓝染色、银染、荧光标记和放射性自显影等方法均可用于双向电泳的检测。考马斯亮蓝染色操作比较简单、重复性好,虽灵敏度较低,但与质谱检测的兼容性很好,定量比较准确,比较适合蛋白质的定量分析。银染是最敏感的非放射性显影方式,可检测到ng 级别的蛋白,比较适合目标蛋白是低丰度的蛋白,但与质谱分析兼容性较差。荧光标记和放射性自显影时非常灵敏的检测方法,可检测到200fg,且和后续测定的兼容性较好,但对实验仪器和条件要求交高。

染色后的凝胶中斑点复杂,需要借助计算机的进行处理。首先利用图像扫描将蛋白质图谱转换为图像文件再进行分析,扫描时应选择合适的分辨率,扫描图像和凝胶大小最好是1:1。扫描后的图像可通过凝胶图像分析软件进行斑点检测、背景消除、斑点匹配和数据库构建和分析等处理以得到所需要的信息。

双向电泳技术作为蛋白质组学的核心技术之一,近几年随着蛋白质组学的发展已经有了很大的改进,在医学、生物学等各个领域都得到了广泛的应用。Kobi D等[30]构建了一种酿酒酵母的蛋白质双向电泳图谱,并比较了不同子代和条件下电泳图谱中蛋白质点的不同。Mori等[31]利用双向电泳建立了荧光标记的克隆癌细胞蛋白的电泳数据库,并验证了数据库的有效性。但双向电泳技术也存在自身的缺陷,比如此种技术很难分离低丰度蛋白质、对偏碱性、疏水性和高分子量的蛋白质样品分离困难、银染或考马斯亮蓝染色不能提供严格的定量信息等等[32]。

2.2 生物质谱技术

质谱法是通过将样品分子转化为运动的气态离子并按荷质比大小进行分离并记录其信息的分析方法,根据所得的质谱图提供的信息可以进行多种物质的定性、定量及结构分析。生物质谱技术能清楚地鉴定蛋白质并能准确地测定肽和蛋白质的相对分子量、氨基酸序列及翻译后的修饰,是目前蛋白质组研究中常用的蛋白质鉴定方法[33-34]。蛋白质的鉴定包括肽质量指纹图谱鉴定和运用串联质谱分析肽序列。

2.2.1 肽质量指纹图谱鉴定蛋白质技术

肽质量指纹图谱(peptide mass fingerprinting, PMF) 鉴定蛋白质是目前蛋白质组研究中常用的鉴定方法,是指蛋白质被酶切位点专一的蛋白酶水解后得到的肽片断图谱[35]。肽质量指纹图谱测定中最常用的质谱技术是基质辅助激光解析电离飞行时间质谱(MALDI-TOF- MS)[36],它是用一定波长的激光打在样品上,使样品离子化,然后在电场力作用下飞行,通过检测离子的飞行时间计算出其荷质比。MALDI-TOF- MS作为一种常用技术其技术改进研究也较多。反射型的MALDI-TOF-MS 与延迟抽提技术(DE) 结合, 在多肽的常规分析中质量准确度可高达几个ppm。

2.2.2 肽片断序列分析鉴定蛋白质

串联质谱可以获得肽段序列信息。通常是将肽段母离子送入质谱仪的碰撞室中,经高流速惰性气体碰撞解离,肽链中的肽键断裂成N-端离子序列和C-端碎片序列,根据肽片段的断裂规律即可推断出肽段的氨基酸序列,进一步可鉴定一种蛋白质[37]。串联质谱技术所得到

- 4 -

的肽序列图谱相对较复杂,从图谱中很难直接读出完整的序列,可通过肽序列标签技术或直接用串联质谱技术进行检索,可得到完整的序列。Powell MJ[18]利用串联质谱技术测定海水中可溶性蛋白质,并建立了肽序列标签,这种实验方法为研究海水中可溶性有机物的来源和产生机制提供了新的视角。

生物质谱技术在蛋白质组学研究中有很多的优点,如对普通的缓冲液成分相对耐受、快速、灵活等等,因此,生物质谱技术作已成为目前蛋白质组研究技术中最具活力和潜力的技术[38],得到了飞速的发展。但质谱技术只能分离气体状态的带电分子,而且一次只能分析带正电或带负电的分析物,且很难区分两种同源性很高的蛋白质。

2.3 环境生物信息学分析

环境生物信息学的分析是基于已经大量存在的数据库和分析软件,它们的存在为大量分析生物学的数据成为可能。环境生物信息学在环境蛋白质组学中的应用主要有三个方面:①蛋白质结构的预测,包括二级和三级结构,从方法上看有演绎法和归纳法两种途径。这是生物信息学在蛋白质组学应用中最重要的课题之一,②蛋白质分子空间结构的比对,发现他们间的相似性或不相似性,从而确定污染物对蛋白质所产生的影响和作用机理。③根据生物大分子的结构和功能,为污染物与有机分子的作用方式和程度提供一定的依据。现在,环境生物信息学方法已经成为环境蛋白质组学乃至整个环境科学研究中不可缺少的手段,并得到越来越广泛的应用。

2.4环境蛋白质间相互作用研究技术

2.4.1蛋白质芯片

蛋白质芯片(protein chip)是一种体外检测蛋白质间相互作用的体系,它指在硅物质如玻璃等固相支持物表面高密度排列的荧光标记的探针蛋白质阵,通过各种相互作用可特异地捕获样品中的靶蛋白,然后通过检测器对靶蛋白进行定性或定量分析[39]。目前应用最多的固相载体是载玻片,膜载体主要有硝酸纤维素膜、醋酸纤维素膜、尼龙膜等。现用得蛋白质芯片技术可分为两种,即点阵芯片和微流芯片[40]。点阵芯片主要用于蛋白质-蛋白质相互作用、抗原-抗体专一结合以及从混合物中纯化蛋白的研究。微流芯片可实现少量蛋白质混合物的分离。蛋白质芯片的优点就在于其高通量、微量化和自动化,并且只要求极少量的样品就能进行蛋白质分析。现在,蛋白质芯片受到越来越多的蛋白质组学研究者的重视,关于这方面的文献报道很多[41-44]。但是蛋白质芯片只能检测具有与标记蛋白能特异结合的蛋白质,使用的范围受到了限制。

2.4.2 酵母双杂交系统

酵母双杂交系统(yeast two-hybrid system)是作为发现和研究或细胞体内蛋白质与蛋白质之间的相互作用而建立的技术平台[45]。该系统是在酵母中进行的,当靶蛋白和诱饵蛋白特异结合后,与诱饵蛋白结合的已知基因的启动子能启动报告基因在酵母细胞内的表达,通过检测该基因表达产物就可以判别诱饵蛋白和靶蛋白之间是否存在相互作用。酵母双杂交系统不仅可用于验证两个已知蛋白间的相互作用、找寻相互作用的结构域,是一种经济、稳定的高通量检测方法。Waihout等[46]利用酵母双杂交系统研究线虫生殖器的发育过程,确定了100多个蛋白间的相互作用。Uetz等[47]利用酵母双杂交系统对酵母的6000多种蛋白之间的相互作

- 5 -

用进行了大规模的研究。但是,酵母双杂交系统也存在一定的缺陷:一些蛋白(如膜蛋白)的表达不够完整;存在假阳性、假阴性的现象。

2.4.3噬菌体展示技术

噬菌体展示技术(phage display techniques, PDT)是兴起不久的一种技术[48]。它是以改造的噬菌体为载体,在编码噬菌体外壳蛋白基因上连接一单克隆抗体的基因序列,使外源多肽或蛋白质表达并展示于噬菌体表面,再通过亲和富集法筛选表达有特异肽或蛋白质的噬菌体,最终获得具有特异结合性质的多肽/蛋白质的一种重要的分子生物学技术。这种技术可以直接得到基因或所需的具有特异性结合能力的蛋白质。Dennis等[49]利用此种技术从噬菌体肽库中筛选到能非竞争地抑制凝血关键调节因子FVⅡa活性的肽段。但噬菌体展示技术也有自身的缺陷:菌体编码蛋白过程可能会受到菌体本身表达蛋白的影响而使检测的相互作用与实际不符;且噬菌体展示文库一旦建成,很难再进行有效的体外突变和重组。

3、环境蛋白质组学研究现状

蛋白质组学研究技术和方法的不断进步为其他学科的发展提供了理论基础和技术平台,但环境蛋白质组学仍处于起步阶段,还存在着一定的空白。不过它的出现为环境生物学特别是环境毒理学的发展提供了新的方法和途径,逐渐的展现出良好的发展前景。

环境内分泌干扰物是环境科学研究的热点问题之一,这类物质能够引起生物体各种生殖系统的病变,如雄性个体精子数目减少,雌雄个体比例失调等。利用蛋白质组学可从分子水平了解生殖系统的健康状况和疾病的发生机制。目前环境蛋白质组学的研究已经在生殖分子毒性的机理和评估中得到应用。Bradley等[50]将蛋白质组学技术运用于检测3种内分泌干扰物影响下鳟鱼体内的蛋白质表达特征(PES)的变化,他们对处于污水排放出的鳟鱼的蛋白质组进行了双向电泳,并通过计算机软件分离出对应于三种内分泌干扰物的特殊蛋白质位点,这些位点的蛋白通过质谱技术分析确认。研究结果显示了PES在诊断生物体应答不利环境因素方面的能力,并指出蛋白质组学的技术在环境监测中有巨大的潜力。Shrader等[51]利用蛋白质组学技术研究了暴露在17β-雌二醇和4-壬基苯酚中斑马鱼的胚胎胞浆的蛋白质组的各种变化。首先对预处理的样品进行双向电泳,然后对电泳的图谱用计算机软件处理和分析,结果发现:大约各有30%的特殊蛋白质分别对应于暴露于17β-雌二醇和4-壬基苯酚的情况,有33%的蛋白质点在对照样和两种内分泌物中都存在,当两者的浓度都为1ppm时,两种物质暴露情况下有28%的蛋白质点相同,而在暴露量为0.1ppm时相同的蛋白质点却只有7%,这种情况也说明了斑马鱼对两种内分泌物质的代谢途径是不同的。

环境蛋白质组学的另一个研究的重要课题是,确定在外源污染物暴露的情况下,生物机体内蛋白质组的变化,进一步确定与污染物对应的特殊蛋白质的表达,为生物标志物的建立和特殊的污染物降解路径研究提供一定的依据。Shanmuganathan等[52]等研究了金属铜引起的酵母氧化应激作用,发现金属铜可使细胞内蛋白羰基化水平明显提高,且主要的靶蛋白为糖酵解相关酶以及热休克蛋白,这种改变能使细胞迅速地应对铜引起的氧化损伤。

Shepard JL等[53]利用毒理学和蛋白质组学的分析方法分离了贻贝肌肉中与铜、氯化三联苯、低盐具有特异性联系的表达蛋白,受试动物的组织匀浆处理后通过双向电泳进行分离。电泳图谱通过扫描仪扫描后利用专门的图像分析软件进行处理,最后得到了与三种外源化学

- 6 -

物质对应的特征表达蛋白,通过这个试验可以显示与环境因子变化相对应的特异性的蛋白质表达在外源化合物的毒性监测、毒性机理的研究中都有这很好的应用前景。

Labra M等[54]对不同浓度重铬酸钾处理的蜡质种玉米苗的蛋白质组变化作了研究。在重铬酸钾的浓度为100-300ppm到1500ppm之间时对蜡质种玉米苗的生长和种子的发芽都有明显的影响,在这个浓度范围内对重铬酸钾的吸收与媒介中浓度有关,这种浓度通过毛细管电泳测得,与之对应的蛋白质分析则采用双向电泳和质谱技术,通过双向电泳测定各种蛋白质表达的不同,并通过质谱技术分析特殊的蛋白质点。结果显示重金属可以诱导与氧化过程的相关的蛋白的产生,并且在糖代谢过程中的一些蛋白也被诱导出现。这些对更好的理解植物对重金属胁迫作用的自我保护和耐受能力方面有很好的帮助。

廖国建等[55]测定了铬(Ⅵ)处理后粟酒裂殖酵母在蛋白质组水平的变化。试验采用双向电泳和MALDI-TOF-MS质谱技术。研究了结果表明, 铬(Ⅵ)处理会导致细胞差异表达, 利用质谱对4个改变明显斑点进行分析发现电压依赖型阴离子通道和锌结合醌氧化还原酶表达量降低,而S2-腺苷甲硫氨酸合成酶和肌动蛋白表达量上升,说明铬( Ⅵ) 可能通过氧化胁迫应答、离子通道、氨基酸生物合成等发挥生物毒理作用。

4.相关的网址与信息库

下面介绍几种常用的蛋白质组学领域的数据库:

SWISS-PROT/TrEMBL,其网址是:http://www.expasy.ch/sport/或https://www.doczj.com/doc/eb16016733.html,/ swissport。SWISS-PROT是一个准确的、注释的数据库。具有高度的注释,包括蛋白质功能描述、结构域结构、翻译后的修饰、变异等,冗余度低,与其他数据库整合性好,TrEMBL 是 SWISS- PROT的补充,含有所有的EMBL核苷酸的翻译产物,但没有整合进SWISS-PROT。一般说,任何蛋白质序列数据的搜寻和比较都应当从SWISS-PROT开始。

PDB,其网址是:https://www.doczj.com/doc/eb16016733.html,/pdb/。蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X 光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。

Protein Information Resource (PIR),其网址是:https://www.doczj.com/doc/eb16016733.html,/。PIR是公共领域中最广泛的熟练注释的蛋白质序列数据库。它包含250000条以上非冗余的蛋白质序列,被分成家族和超家族,其结构域和基序也被测定。PIR的主要目的是提供按同源性和分类学组织的综合的非冗余的数据库。

Predictome, 其网址是:http:// https://www.doczj.com/doc/eb16016733.html,/。Predictome是一个预测蛋白质间功能关系的数据库,这些蛋白质间的关系是基于将三种计算机预测方法(染色体相邻法、细胞发育普法、结构域融合法)应用在44个基因组上以大规模试验方法扫描蛋白质间相互作用得到的。

SCOP,网址是:https://www.doczj.com/doc/eb16016733.html, /scop/。蛋白质结构分类(SCOP)数据库

- 7 -

详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL 序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。。 SWISS-2DPAGE,网址是http://www.expasy.ch/ ch2d/ch2d-top.html。SWISS- 2DPAGE是一个注释的二维聚丙烯酰胺凝胶电泳数据库,包含了人组织样本,大肠杆菌、酿酒酵母等电泳参考图。

数据库是生物信息学的主要内容。除上述几种常用数据库外,国际上还有很多关于二维凝胶电泳和蛋白质鉴定的数据库,这些数据库的建立成为生物信息学和蛋白质组学研究的重要基础。现在生物信息学的应用已经成为蛋白质组学研究中不可缺少的一项重要手段。5.展望

环境蛋白质组学自身的优点使其在污染物毒性评估和污染环境的处理方面具有巨大的潜力,对环境科学的发展有巨大的潜在推动作用。目前,关于环境蛋白质组学的研究在国内外都取得了一定的进展,但仍然处于起步阶段,存在许多问题有待于结果。今后环境蛋白质组学研究的方向应包括:

⑴适应于环境样品或环境监测的蛋白质组学试验方法的建立。蛋白质组学作为目前生命科学研究的热点,其基本理论基础和技术平台已经建立,但环境试验的目的和样品处理的不同要求对已有的技术平台进行改进,建立适应于不同环境试验的蛋白质组学技术。

⑵与环境相关的蛋白质数据库的建立。环境蛋白质组学的快速发展必然产生大量数据,建立相应的检索和查询数据库是蛋白质组穴学发展的重要基础。

⑶寻找适合于环境蛋白质组学监测的模式物种。不同的物种对同一污染物的反应是不同的,所以在评价不同污染物的分子毒性时应尽量选用相同的物种,对污染物敏感的模式物种的选择将是环境蛋白质组学研究发展的重要课题之一。

参考文献

[1] Francis S Collins.Shattuck lecture--medical and societal consequences of the human genome project[J]. The New England Journal of Medicine, 1999,341(1):28-37

[2] Blackstock W, Mann M. A boundless future for proteomics? Trends in Biotechnology[J]. 2001, 19 (10): S1-S2

[3] Venter JC, Adams MD, Myers EW et al. The sequence of thehuman genome[J]. Science,2001, 291:1304-1351.

[4]Richard J. Simpson, Donna S. Dorow. Cancer proteomics: from signaling networks to tumor markers[J]. Trends in Biotechnology, 2001,19 (10): S40-S47

[5] Holger F Hebestreit. Proteomics: an holistic analysis of nature’s proteins[J]. Current Opinion in Pharmacology, 2001, 1:513–520

[6]Anderson NL, Anderson NG. Proteome and proteomics: New technologies, new concepts, and new words[J]. Electrophoresis, 1998,19 (11): 1853-1861

[7] Kellner R. Proteomics.Concepts and perspectives[J]. Fresenius Journal of Analytical Chemistry, 2000,366 (6-7):517-524

[8] Gygi SP, Rochon Y, Franza BR. Correlation between protein and mRNA abundance in yeast[J]. Molecular and Cellular Biology, 1999,19(3):1720–1730

[9] Wasinger VC, Cordwell SJ et al. Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium[J]. Electrophoresis, 1995 ,16 (7) :109021094.

[10]Ruth A.Vanbogelen, Erin E.Schiller et al. Diagnosis of cellular states of microbial organisms using proteomics[J]. Electrophoresis, 1999,20:2149-2159

[11] Soren Naaby-Hansen, Michael D.Waterfield et al. Proteomics–post-genomic cartography to understand gene function[J]. Trends in Pharmacological Sciences, 2001,22 (7) :376-384

- 8 -

[12]Wang JH, Hewick RM. Proteomics in drug discovery[J]. Drug Discovery Today, 1999,4(3): 129- 33

[13]Bandara LR, Kennedy S. Toxicoproteomics-a new preclinical tool[J]. Drug Discovery Today, 2002 ,7 (7): 411-418

[14] Spence P. Toxicoproteomics: learning to walk before it can run[J]. Drug Discovery Today, 2002,7 (11): 597-597

[15] Waters M, Boorman G, Bushel P, et al. Systems toxicology and the Chemical Effects in Biological Systems (CEBS) knowledge base[J]. Environmental Health Perspectives, 2003,111(6): 811-824

[16]Waters MD, Fostel JM. Toxicogenomics and systems toxicology: Aims and prospects[J]. Nature Reviews Genetics, 2004,5 (12): 936-948

[17] Thomas RS, Rank DR, Penn SG, et al. Application of genomics to toxicology research[J]. Environmental Health Perspectives, 2002,110: 919-923

[18] Powell MJ, Sutton JN, Del Castillo CE et al. Marine proteomics: generation of sequence tags for dissolved proteins in seawater using tandem mass spectrometry[J] . Marine Chemistry, 2005,95 (3-4): 183-198

[19]Raghothama C, Harsha HC, Prasad CK, et al.Bioinformatics and proteomics approaches for aging research[J]. Biogerontology, 2005,6(4): 227-232

[20] Vihinen M. Bioinformatics in proteomics[J]. Biomolecular Engineering, 2001,18 (5): 241-248

[21] Roos DS. Computational biology-Bioinformatics-Trying to swim in a sea of data[J]. Science, 2001,291 (5507): 1260

[22]Cristea IM, Gaskell SJ, Whetton AD. Proteomics techniques and their application to hematology[J]. Blood, 2004,103(10):3624-3634

[23] Schramm A, Apostolov O, Sitek B, et al. Proteomics: Techniques and applications in cancer research[J] . Klinische Padiatrie, 2003,215(6):293-297

[24]Gorg A, Weiss W, Dunn MJ. Current two-dimensional electrophoresis technology for proteomics[J]. Proteomics, 2004,4 (12):3665-3685

[25] Herbert B. Advances in protein solubilization for two-dimensional electrophoresis[J]. Electrophoresis, 1999;20(4-5):660– 663.

[26] Gorg A, Obermaier C, Boguth G, et al. The current state of two-dimensional electrophoresis with immobilized pH gradients[J]. Electrophoresis, 2000,21 (6):1037–1053.

[27] Molloy MP. Two-Dimensional Electrophoresis of Membrane Proteins Using Immobilized pH Gradients[J]. Analytical Biochemistry, 2000, 280 (1):1–10

[28] Gopal J. Babu, Wheeler D, Alzate O, et al.Solubilization of membrane proteins for two-dimensional gel electrophoresis: identification of sarcoplasmic reticulum membrane proteins[J]. Analytical Biochemistry, 2004 ,325(1):121–125

[29] Chinnasamy G, Rampitsch C. Efficient solubilization buffers for two-dimensional gel electrophoresis of acidic and basic proteins extracted from wheat seeds[J]. Biochimica et Biophysica Acta-Proteins and proteomics, 2006,1764 (4): 641-644

[30] Kobi D, Zugmeyer S, Potier S, et al. Two-dimensional protein map of an "ale"-brewing yeast strain: proteome dynamics during fermentation[J]. FEMS Yeast Research, 2004,5 (3): 213-230

[31] Mori Y, Kondo T, Yamada T, et al. Two-dimensional electrophoresis database of fluorescence-labeled proteins of colon cancer cells[J]. Journal of Chromatography B – Analytical Technologies in the Biomedical and Life Sciences, 2005,823 (2): 82-97

[32] Patton WF, Schulenberg B, Steinberg TH. Two-dimensional gel electrophoresis; better than a poke in the ICAT? [J] Current Opinion In Biotechnology,2002,13 (4): 321-328

[33]Nyman TA. The role of mass spectrometry in proteome studies[J]. Biomolecular Engineering, 2001,18 (5): 221-227

[34]Sinclair B. Laser Desorption Mass Spectrometers for Multisample Analysis[J]. The Scientist, 1999,13(12):12-18

[35] Wilkns MR, Sanchez J C, Williams KL et al. Current challenges vector maps in proteome projects[J]. Electrophoresis, 1996,179 (5):830- 838.

[36] Medzihradszky KF, Campbell JM, Baldwin MA, et al. The characteristics of peptide collision-induced dissociation using a high-performance MALDI-TOF/TOF tandem mass spectrometer[J]. Analytical Chemistry, 2000,72 (3): 552-558

[37] Tonella L et al. Protein identification with N and C-terminal sequence tags in proteome projects[J]. Journal of Molecular Biology, 1998,278 (3): 599-608

[38] Dos Remedios CG, Liew CC, Allen PD, et al. Genomics, proteomics and bioinformatics of human heart failure[J]. Journal of Muscle Research and Cell Motility, 2003,24 (4-6): 251-260

[39] Drewes G, Bouwmeester T. Global approaches to protein-protein interactions[J]. Current Opinion in Cell Biology, 2003,15(2): 199-205

[40] Figeys D, Pinto D. Proteomics on a chip: Promising developments[J]. Electrophoresis, 2001,22 (2): 208-216

[41]Valafar F. Pattern recognition techniques in microarray data analysis - A survey[J]. Annals of the New York Academy of Science, 2002,980:41-64

[42] Danesi R, De Braud F, Fogli S, et al. Pharmacogenetics of anticancer drug sensitivity in non-small cell lung

- 9 -

cancer[J]. Pharmacological Reviews, 2003,55 (1): 57-103

[43] Forde CE, Gonzales AD, Smessaert JM, et al. A rapid method to capture and screen for transcription factors by SELDI mass spectrometry[J].Biochemical and Biophysical Research Communication, 2002,290 (4): 1328-1335 [44] Thulasiraman V, McCutchen-Maloney SL, Motin VL, et al. Detection and identification of virulence factors in Yersinia pestis using SELDI ProteinChip (R) system[J]. Biotechniques, 2001,30 (2): 428-432

[45] Fields S, Song O-K. A novel genetic system to detect protein-protein interactions[J]. Nature, 1989,340:245~256

[46] Walhout AJM, Sordella R, Lu XW et al. Protein interaction mapping in C-elegans using proteins involved in vulval development[J]. Science, 2000,287 (5450): 116-122

[47]Uetz P, Giot L, Cagney G et al. A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae[J]. Nature, 2000,403 (6770): 623-627

[48] Smith G P. Filamentous fusion phage: novel expression vectors that display cloned antigens on virion surface[J]. Science, 1985,228:1315-1317

[49] Dennis MS, Eigenbrot C, Skelton NJ, et al. Peptide exosite inhibitors of factor VIIa as anticoagulants[J]. Nature, 2000,404 (6777): 465-470

[50] Bradley BP, Shrader EA, Kimmel DG, et al. Protein expression signatures: an application of proteomics[J]. Marine Environmental Research, 2002,54 (3-5): 373-377

[51] Shrader EA, Henry TR, Greeley MS, et al. Proteomics in zebrafish exposed to endocrine disrupting chemicals[J]. Ecotoxicology, 2003,12 (6): 485-488

[52] Shanmuganathan A, Avery SV, Willetts SA, et al. Copper-induced oxidative stress in Saccharomyces cerevisiae targets enzymes of the glycolytic pathway[J]. FEBS Letters, 2004,556 (1-3): 253-259

[53] Shepard JL, Olsson B, Tedengren M, et al. Protein expression signatures identified in Mytilus edulis exposed to PCBs, copper and salinity stress[J]. Marine Environmental Research, 2000,50 (1-5): 337-340

[54] Labra M, Gianazza E, Waitt R, et al. Zea mays L. protein changes in response to potassium dichromate treatments[J]. Chemosphere, 2006,62 (8): 1234-1244

[55] 廖国建, 陈洪斌, 何颖等. 应用蛋白质组学技术研究铬( Ⅵ) 对粟酒裂殖酵母的分子毒性影响[J].环境

科学学报,2005 ,25(12) :1693 - 1697

Research progress in Environmental Proteomics and

Bioinformatics

Bing WU WenYang PAN XuXiang ZHANG ShiLei SUN DaYong ZHAO

ShuPei CHENG

(the School of Environment , Nanjing University , Nanjing 210093)

Abstract

The article provides an overview of pollutant molecular toxicity, as well as the theoretical knowledge and technology platform of environmental proteomics and bioinformatics, It refers to the research and utilization of environmental proteomics in ecotoxicology and environmental health and also introduces the bioinformatics technologies with high flux, high speed and high sensitivity. The summarization is of great importance in improving environment quality and leading scientific research and security alarm in human health and environment health.

Key words environmental proteomics, bioinformatics, molecular toxicity, environmental health

作者简介:吴兵(1983-),男,2005级硕士研究生,从事环境生物信息学研究

- 10 -

蛋白质组学的应用研究进展

蛋白质组学的应用研究进展 蛋白质组学的应用研究进展 尹稳1 伏旭2 李平1 (1. 兰州大学第二医院,兰州 730030 ;2. 兰州大学第二医院急救中心,兰州730030) 摘要:蛋白质组学(Proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织或体液中的所有蛋白质组成 及其功能的新兴学科。虽然基因决定蛋白质的水平,但是基因表达的水平并不能代表细胞内活性蛋白的水平,蛋白质组学分析是对蛋白质翻译和修饰水平等研究的一种补充,是全面了解基因组表达的一种必不可少的手段。蛋白质组学相关技术的发展极大地推动了蛋白质组学的研究进展,使其在各研究领域得到了广泛的应用。对蛋白质组学相关技术及其在各领域的应用进行了综述,最后对蛋白质组学的发展趋势和应用前景作出展望。 关键词:蛋白质组学双向凝胶电泳 质谱 生物信息学 应用现状 Application Research Progress of Proteomics (1. Lanzhou University Second Hospital,Lanzhou 730030 ;2. Department of Emergency,Lanzhou University Second Hospital,Lanzhou 730030) Abstract: Proteomics is an emerging discipline for studying proteins composition and function in a type of cell, tissue or body fluids in a large-scale, high-throughput and systematic level. While genes determine the level of protein, but the level of gene expression can not represent the intracellular reactive protein levels. Proteomic analysis is a complement to the study of translation and modification and also an indispensable tool for a comprehensive understanding of genome expression. The development of proteomic technologies has greatly promoted the progress of proteomic research, and it has been widely used in various research fields.This paper revieweded the proteomic technologies and the applications in various fields are also briefly reviewed. Finally, some future issues are presented.

蛋白质组学生物信息学分析介绍

生物信息学分析FAQ CHAPTER ONE ABOUT GENE ONTOLOGY ANNOTATION (3) 什么是GO? (3) GO和KEGG注释之前,为什么要先进行序列比对(BLAST)? (3) GO注释的意义? (3) GO和GOslim的区别 (4) 为什么有些蛋白没有GO注释信息? (4) 为什么GO Level 2的统计饼图里蛋白数目和差异蛋白总数不一致? (4) 什么是差异蛋白的功能富集分析&WHY? (4) GO注释结果文件解析 (5) Sheet TopBlastHits (5) Sheet protein2GO/protein2GOslim (5) Sheet BP/MF/CC (6) Sheet Level2_BP/Level2_MF/Level2_CC (6) CHAPTER TWO ABOUT KEGG PATHWAY ANNOTATION (7) WHY KEGG pathway annotation? (7) KEGG通路注释的方法&流程? (7) KEGG通路注释的意义? (7) 为什么有些蛋白没有KEGG通路注释信息? (8) 什么是差异蛋白的通路富集分析&WHY? (8) KEGG注释结果文件解析 (8) Sheet query2map (8) Sheet map2query (9) Sheet TopMapStat (9) CHAPTER THREE ABOUT FEATURE SELECTION & CLUSTERING (10) WHY Feature Selection? (10)

聚类分析(Clustering) (10) 聚类结果文件解析 (10) CHAPTER FOUR ABOUT PROTEIN-PROTEIN INTERACTION NETWORK (12) 蛋白质相互作用网络分析的意义 (12) 蛋白质相互作用 VS生物学通路? (12) 蛋白质相互作用网络分析结果文件解析 (12)

蛋白质组学研究方法选择及比较

蛋白质组学研究方法选择及比较 目前研究蛋白组学的主要方法有蛋白质芯片及质谱法,本文将从多方面对两种研究方法进行了解与比较; 蛋白质芯片(Protein Array) 将大量不同的蛋白质有序地排列、固定于固相载体表面,形成微阵列。利用蛋白质分子间特异性结合的原理,实现对生物蛋白质分子精准、快速、高通量的检测。 主要类型: ●夹心法芯片(Sandwich-based Array) ●标记法芯片(Label-based Array) ●定量芯片(Quantitative Array) ●半定量芯片(Semi-Quantitative Array) 质谱(Mass Spectrometry) 用电场和磁场将运动的离子按它们的质荷比分离后进行检测,测出离子准确质量并确定离子的化合物组成,即通过对样品离子质荷比的分析而实现对样品进行定性和定量的一种方法。 主要类型:

●二维电泳+质谱(2D/Mass Spectrometry, MS) ●表面增强激光解吸电离飞行时间质谱(Surface-enhanced laser desorption/ionization- time of flight, SELDI) ●同位素标记相对和绝对定量(Isobaric tags for relative and absolute quantitation, iTRAQ) Protein Array or Mass Spectrometry? 如何选择合适的研究方法?以下将从六个方面进行比较与推荐: 1.筛查蛋白组学表达差异 建议选择:RayBiotech(1000个因子的芯片)+质谱 a)不同的方法学有不同的特点:对于质谱,可以筛查到未知的蛋白,但是对于分子量大、 低丰度的蛋白质,质谱的灵敏度和准确性有一定的限制。 b)不同的方法能筛查到的目标不同:根据Proteome Analysis of Human Aqueous Humor 一文中报道,质谱筛查到的差异蛋白集中在小分子与代谢物。而用RayBiotech芯片筛查到的结果,多是集中在细胞因子、趋化、血管、生长等等。 c)质谱筛查到355个蛋白,而RayBiotech抗体芯片也筛查到328个蛋白,且用定量芯片 验证25个蛋白有差异,这些蛋白是质谱找不到的。目前RayBiotech夹心法抗体芯片已经可以检测到1000个蛋白,采用双抗夹心法,尤其是对于低丰度蛋白,有很好的灵敏度和特异性,很多的低丰度蛋白是抗体芯片可以检测出来,而质谱检测不到的,且样品不经过变性和前处理,保持天然状态的样品直接检测,对于蛋白的检测准确度高。 d)质谱的重复性一直是质谱工作者纠结的问题,不同操作者的结果,不同样品处理条件, 峰值的偏移等影响因素都会产生大的影响;RayBiotech的夹心法芯片重复性高。

蛋白质组学的应用研究进展_尹稳

?综述与专论? 2014年第1期 生物技术通报 BIOTECHNOLOGY BULLETIN 随着基因组计划的完成,生命科学研究开始进入以基因组学、蛋白质组学、营养组学、代谢组学等“组学”为研究标志的后基因组时代。蛋白质组(proteome)一词最早是由澳大利亚科学家Wilkins 和Williams 于1994年提出[1],1995年7月最早见诸于Electrophoresis 杂志[2],意指一个细胞或组织中由基因组表达的全部蛋白质。蛋白质组学(proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织、体液中的所有蛋白质组成、功能及其蛋白之间的相互作用的学科。 虽然基因决定蛋白质的水平,mRNA 只包含了转录水平的调控,其表达水平并不能代表细胞内活 收稿日期:2013-09-05基金项目:甘肃省科技计划基金资助项目(0708NKCA129),兰州大学第二医院医学研究基金项目(YJ2010-08)作者简介:尹稳,女,硕士,研究方向:蛋白质组学;E -mail :yinwen0508@https://www.doczj.com/doc/eb16016733.html, 通讯作者:伏旭,男,硕士,研究方向:生物化学与分子生物学;E -mail :fuxu0910@https://www.doczj.com/doc/eb16016733.html, 蛋白质组学的应用研究进展 尹稳1 伏旭2 李平1 (1.兰州大学第二医院,兰州 730030;2.兰州大学第二医院急救中心,兰州 730030) 摘 要: 蛋白质组学(Proteomics)是一门大规模、高通量、系统化的研究某一类型细胞、组织或体液中的所有蛋白质组成及其功能的新兴学科。虽然基因决定蛋白质的水平,但是基因表达的水平并不能代表细胞内活性蛋白的水平,蛋白质组学分析是对蛋白质翻译和修饰水平等研究的一种补充,是全面了解基因组表达的一种必不可少的手段。蛋白质组学相关技术的发展极大地推动了蛋白质组学的研究进展,使其在各研究领域得到了广泛的应用。对蛋白质组学相关技术及其在各领域的应用进行了综述,最后对蛋白质组学的发展趋势和应用前景作出展望。 关键词: 蛋白质组学 双向凝胶电泳 质谱 生物信息学 应用现状 Application Research Progress of Proteomics Yin Wen 1 Fu Xu 2 Li Ping 1 (1. Lanzhou University Second Hospital ,Lanzhou 730030;2. Department of Emergency ,Lanzhou University Second Hospital ,Lanzhou 730030) Abstract: Proteomics is an emerging discipline for studying proteins composition and function in a type of cell, tissue or body fluids in a large -scale, high -throughput and systematic level. While genes determine the level of protein, but the level of gene expression can not represent the intracellular reactive protein levels. Proteomic analysis is a complement to the study of translation and modification and also an indispensable tool for a comprehensive understanding of genome expression. The development of proteomic technologies has greatly promoted the progress of proteomic research, and it has been widely used in various research fields.This paper revieweded the proteomic technologies and the applications in various fields are also briefly reviewed. Finally, some future issues are presented. Key words: Proteomics Two -dimensional gel electrophoresis Mass spectrometry Bio -informactics Application status 性蛋白的水平[3],且转录水平的分析不能反应翻译后对蛋白质的功能和活性起至关重要作用的蛋白修饰过程[4],如酰基化、泛素化、磷酸化或糖基化等。而蛋白质组学除了能够提供定量的数据以外,还能提供包括蛋白定位和修饰的定性信息。只有通过对生命过程中蛋白质功能和蛋白质之间的相互作用以及特殊条件下的变化机制进行研究,才能对生命的复杂活动具有深入而又全面的认识。近年来,蛋白质组学技术取得了长足的发展,随着新技术的不断涌现,其应用范围也不断扩大。本文对蛋白质组学相关技术及其在各研究领域的应用进行了简要的归纳和评述,并对蛋白质组学的发展趋势和应用前景

生物信息学现状与展望

研究生课程考试卷 学号、姓名: j20112001 苗天锦 年级、专业:2011生物化学与分子生物学 培养层次:硕士 课程名称:生物信息学 授课学时学分: 32学时 2学分 考试成绩: 授课或主讲教师签字:

生物信息学现状与展望 摘要:生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因组时代",本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。 关键词:生物信息学;生物信息学背景;发展前景 一、生物信息学概述 1.生物信息学发展历史 随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展, 被誉为“解读生命天书的慧眼”【1】。 研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA 的三维结构(双螺旋)。Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA 聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。Meselson与Stahl (1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础【2】。自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。 2.生物信息学研究方向 2.1 序列比对

国内外生物信息学发展状况

国内外生物信息学发展状况 1.国外生物信息发展状况 国外非常重视生物信息学的发展各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物 信息学部门的数量也与日俱增。美国早在1988年在国会的支持 下就成立了国家生物技术信息中心(NCBI),其目的是进行计 算分子生物学的基础研究,构建和散布分子生物学数据库;欧 洲于1993年3月就着手建立欧洲生物信息学研究所(EBI), 日本也于1995年4月组建了信息生物学中心(CIB)。目前, 绝大部分的核酸和蛋白质数据库由美国、欧洲和日本的3家数 据库系统产生,他们共同组成了 DDBJ/EMBL/Gen Bank国际核 酸序列数据库,每天交换数据,同步更新。以西欧各国为主的 欧洲分子生物学网络组织(EuropeanMolecular Biology Network, EMB Net)是目前国际最大的分子生物信息研究、开 发和服务机构,通过计算机网络使英、德法、瑞士等国生物信 息资源实现共享。在共享网络资源的同时,他们又分别建有自 己的生物信息学机构、二级或更高级的具有各自特色的专业数 据库以及自己的分析技术,服务于本国生物(医学)研究和开 发,有些服务也开放于全世界。 从专业出版业来看,1970年,出现了《Computer Methods and Programs in Biomedicine》这本期刊;到1985年4月, 就有了第一种生物信息学专业期刊《Computer Application

in the Biosciences》。现在,我们可以看到的专业期刊已经很多了。 2 国内生物信息学发展状况 我国生物信息学研究近年来发展较快,相继成立了北京大学生物信息学中心、华大基因组信息学研究中心、中国科学院上海生命科学院生物信息中心,部分高校已经或准备开设生物信息学专业。2002年国家自然科学基金委在生物化学、生物物理学与生物医学工程学学科设立了生物信息学项目,并列入生命科学部优先资助的研究项目。国家 863计划特别设立了生物信息技术主题,从国家需求的层面上推动我国生物信息技术的大力发展[3]。 但是由于起步较晚及诸多原因,我国的生物信息学发展水平远远落后于国外。在PubMed收录的以关键词“Bioinformatics”检索到的历年发表的文章数,可以看出大量的研究文献出现在21世纪以后。其中我国共有138篇占全部5548篇的2.5%,而美国则发表2160篇占全部的39%之多(统计数据截至2004年2月15日)。我国学者在生物信息学领域发表的有高影响力的论文只有不到美国学者发表数量的6%,差距相当大[4]。在生物信息学领域,一些著名院士和教授在各自领域取得了一定成绩,显露出蓬勃发展的势头,有的在国际上还占有一席之地。如北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST

比较蛋白质组学研究中的稳定同位素标记技术

进展评述 比较蛋白质组学研究中的稳定同位素标记技术 刘新1,2 应万涛1,2 钱小红1,23 (1军事医学科学院放射与辐射医学研究所 北京 100850;2北京蛋白质组研究中心 北京 102206) 摘 要 比较蛋白质组学是指在蛋白质组学水平上研究正常和病理情况下细胞或组织中蛋白质表达变化,以期发现具有重要功能的生物标识物,为疾病的早期诊断提供依据。近年来它正成为蛋白质组学研究的热点和发展趋势。比较蛋白质组学的研究方法和策略有多种,本文就最近几年来稳定同位素标记技术(体内代谢标记技术和体外化学标记技术)在比较蛋白质组学研究中的进展进行综述。 关键词 比较蛋白质组学 稳定同位素标记 体内代谢标记 体外化学标记 Application of Stable Isotope Labeling in Comparative Proteomics Liu X in1,2,Y ing Wantao1,2,Qian X iaohong1,23 (1Beijing Institute of Radiation Medicine,Beijing100850; 2Beijing Proteome Research Center,Beijing102206) Abstract C omparative proteomics is the research of protein expression changing between normal and pathological cell or tissue on the proteome level.P otential biomarkers w ould be discovered from the research by comparative proteomics, which will be helpful to the diagnosis and therapy of diseases.In the recent years,it has been becoming the hot spot of the proteomics research and many strategies used in comparative proteomics have been developed.During those approaches,the strategies based on stable is otopic labeling coupled with mass spectrometry have been extensively used and lots of success ful applications have been reported.In contrast to the traditional radioactive is otope labeling method,stable is otope labeling technique was not radioactive and the operation is simple.Metabolic labeling in viv o and chemical labeling in vitro are tw o parts of stable is otope labeling technique,which both have various advantages and disadvantages.This paper reviewed the progress of stable is otope labeling technique in comparative proteomics. K ey w ords C omparative proteomics,S table is otope labeling,Metabolic labeling in viv o,Chemical labeling in vitro 随着人类基因组精确图谱的公布,基因组功能的阐明已经成为生命科学研究中一项极重要的任务[1]。蛋白质是基因的最终产物同时也是基因功能的最终执行体,因而人类基因的表达及其功能有待于在蛋白水平上揭示。蛋白质组学的研究目的是分离和鉴定组织或细胞中的所有蛋白质。生物体在生长发育过程中,基因组是相对稳定的,而蛋白表达是高度动态变化的,并且具有严格调控的时间和空间特异性[2]。为了研究生物体在不同状态下表达的所有蛋白质的动态变化,比较蛋白质组学应运而生,即在蛋白组学水平上,研究在正常生理和病理状态,或受到不同的外部环境刺激下,或在突变等因素影响下,蛋白质表达的变化情况,以期发现生物体内关键的调控分子及与疾病相关的蛋白质标志物,最终为疾病的防诊治、新型疫苗的研发等提供理论依据。 为了研究蛋白质表达的动态变化,基因表达检测技术,如微阵列法[3]、DNA(脱氧核糖核酸)芯片法[4]等曾被广泛使用。这些方法虽然能够实现对mRNA(信使核糖核酸)进行定性和定量分析,但 刘新 男,27岁,博士生,现从事比较蛋白质组学研究。 3联系人,E2mail:qianxh1@https://www.doczj.com/doc/eb16016733.html, 国家自然科学基金(20505019、20505018)、国家重点基础研究发展规划项目(2004C B518707)和北京市科技计划重大项目(H030230280190)资助项目 2006207220收稿,2006209221接受

质谱技术在蛋白质组学研究中的应用

第35卷 第1期2011年1月 南京林业大学学报(自然科学版) Journa l o fN anji n g Forestry Un i v ersity (Natural Sc ience Ed ition) V o.l 35,N o .1Jan .,2011 htt p ://www.n l dxb .com [do :i 10.3969/.j issn .1000-2006.2011.01.024] 收稿日期:2009-12-31 修回日期:2010-10-26 基金项目:国家自然科学基金项目(31000287);江苏省高校自然科学基础研究项目(10KJ B220002) 作者简介:甄艳(1976)),副教授,博士。*施季森(通信作者),教授。E-m ai:l js h @i n jfu .edu .cn 。 引文格式:甄艳,施季森.质谱技术在蛋白质组学研究中的应用[J].南京林业大学学报:自然科学版,2011,35(1):103-108. 质谱技术在蛋白质组学研究中的应用 甄 艳,施季森 * (南京林业大学,林木遗传与生物技术省部共建教育部重点实验室,江苏 南京 210037) 摘要:随着蛋白质组学研究的迅速发展,质谱技术已成为应用于蛋白质组学研究中的强有力工具和核心技术。质谱技术的先进性在于为蛋白质组学研究提供的通量和分子信息。笔者重点概述了基于质谱路线的蛋白质组学研究,介绍了基于质谱的定量蛋白质组学﹑翻译后修饰蛋白质组学、定向蛋白质组学、功能蛋白质组学以及基于串联质谱技术的蛋白质组学数据解析的研究 进展。 关键词:质谱;蛋白质组学;定量蛋白质组学;翻译后修饰;定向蛋白质组学;功能蛋白质组学中图分类号:Q81 文献标志码:A 文章编号:1000-2006(2011)01-0103-06 Application of m ass spectro m etry i n proteo m ics studies Z HEN Yan ,SH I Jisen * (K ey Labo ra t o ry o f F orest G eneti cs and B i o techno l ogy M i n istry o f Educati on , N an ji ng Forestry U n i versity ,N an ji ng 210037,Chi na) Abstrac t :W ith the rap i d develop m ent o f pro teo m i cs ,m ass spec trom etry i s m aturi ng to be a po w erfu l too l and core tech -nology fo r proteo m ics st udies dur i ng the recen t years .The super i or ity o fm ass spectrom etry lies i n providi ng the through -pu t and the m olecu lar infor m ati on ,w hich no other techno logy can be m a tched i n proteom ics .In th i s rev ie w,w e m ade a g lance on the outli ne o fm ass spectrome try -based proteo m ics .A nd then w e addressed on t he advances o f data ana l y si s o f m ass spec trom etry -based proteom ics ,quantitati ve m ass spectro m etry -based pro teom i cs ,post -translati onal m odificati ons based m ass spectrom etry ,targeted proteo m ics and functiona l proteo m ics based -mass spectrome try .K ey word s :m ass spectrome try;proteo m ics ; quantitative pro teom i cs ; post -trans l ation m odifica ti on ; targ eted pro - teo m i cs ;f uncti ona l proteom ics 蛋白质组学(Pr o teo m ics)是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的学科。 目前蛋白质组学的研究主要有两条路线:一是基于双向电泳的蛋白质组学;二是基于质谱的蛋白质组学,其中基于双向电泳的蛋白质组学研究路线最终也离不开质谱技术的应用。自20世纪80年代末,两种质谱软电离方式即电喷雾电离(electro spray ion izati o n,ESI )和基质辅助激光解析离子化(m a -tri x assisted laser desorpti o n i o nization ,MALD I)的发明和发展解决了极性大、热不稳定蛋白质和多肽分 析的离子化和分子质量大的测定问题[1] ,蛋白质组学研究中常用的质谱分析仪包括离子阱(ion trap ,I T),飞行时间(ti m e of fli g h,t TOF),串联飞行时间(TOF -TOF),四级杆/飞行时间(quadr upo le /TOF hybrids),离子阱/轨道阱(I T /orbitrap hybri d )和离子阱/傅里叶变换串联质谱分析仪(I T /Four i e r transfor m ioncyclotron resonance m ass spectro m eters hybr i d s ,I T /FT M S),这些质谱仪具有不同的灵敏度、分辨率、质量精确度和产生不同质量的M S /M S 谱[2] 。质谱作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备及数据分析的信息学工具被广泛地应用。因此,有学者指出质谱技术 已在蛋白质组学研究中处于核心地位[3] 。目前在通量及所包含的分子信息内容上,基于质谱的蛋白质组学技术在细胞生物学研究中可以鉴定和量化

浅谈生物信息学在生物方面的应用

浅谈生物信息学在生物方面的应用 生物信息学(bioinformaLics)是以核酸和蛋白质等生物大分子数据库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算机科学为主要手段,对浩如烟海的原始数据和原始资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、搜索、比较、分析,从中获得基因的编码、凋控、遗传、突变等知识;研究核酸和蛋白质等生物大分子的结构、功能及其相互关系;研究它们在生物体内的物质代谢、能量转移、信息传导等生命活动中的作用机制。 从生物信息学研究的具体内容上看,生物信息学可以用于序列分类、相似性搜索、DNA 序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已成为变态反应研究工作的重要组成部分。针对核酸序列的分析就是在核酸序列中寻找过敏原基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。针对蛋白质序列的分析,可以预测出蛋白质的许多物理特性,包括等电点分子量、酶切特性、疏水性、电荷分布等以及蛋白质二级结构预测,三维结构预测等。 生物信息学中的主要方法有:序列比对,结构比对,蛋白质结构的预测,构造分子进化树,聚类等。基因芯片是基因表达谱数据的重要来源。目前生物信息学在基因芯片中的应用主要体现在三个方面。 1、确定芯片检测目标。利用生物信息学方法,查询生物分子信息数据库,取得相应的序列数据,通过序列比对,找出特征序列,作为芯片设计的参照序列。 2、芯片设计。主要包括两个方面,即探针的设计和探针在芯片上的布局,必须根据具体的芯片功能、芯片制备技术采用不同的设计方法。 3、实验数据管理与分析。对基因芯片杂交图像处理,给出实验结果,并运用生物信息学方法对实验进行可靠性分析,得到基因序列变异结果或基因表达分析结果。尽可能将实验结果及分析结果存放在数据库中,将基因芯片数据与公共数据库进行链接,利用数据挖掘方法,揭示各种数据之间的关系。 生物信息学在人类基因组计划中也具有重要的作用。 大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。特别是拼接和填补序列间隙更需要把实验设计和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。 人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。比如啤酒酵母完整基因组(约1300万bp)所包含6千多个基因,大约60%是通过信息分析得到的。 当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。”这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新Spps 的研究。在我国开展中华民族SNPs研究也是至重要的。总之,生物信息学不仅将赋予人们各种基础研究的重要成果,也会带来巨大的经济效益和社会效益。在未来的几年中DNA 序列数据将以意想不到的速度增长,这更离不开利用生物信息学进行各类数据的分析和解释,研制有效利用和管理数据新工具。生物信息学在功能基因组学同样具有重要的应用目前应用最多的是同源序列比较、模式识别以及蛋白结构预测。所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列。利用数据库搜索找出未知核酸或蛋白的同源序列,是序列分析的基础[lol。如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基

质谱技术在蛋白质组学研究中的应用_甄艳

第35卷 第1期2011年1月 南京林业大学学报(自然科学版) J o u r n a l o f N a n j i n g F o r e s t r y U n i v e r s i t y (N a t u r a l S c i e n c e E d i t i o n ) V o l .35,N o .1 J a n .,2011 h t t p ://w w w .n l d x b .c o m [d o i :10.3969/j .i s s n .1000-2006.2011.01.024]  收稿日期:2009-12-31 修回日期:2010-10-26  基金项目:国家自然科学基金项目(31000287);江苏省高校自然科学基础研究项目(10K J B 220002) 作者简介:甄艳(1976—),副教授,博士。*施季森(通信作者),教授。E -m a i l :j s h i @n j f u .e d u .c n 。  引文格式:甄艳,施季森.质谱技术在蛋白质组学研究中的应用[J ].南京林业大学学报:自然科学版,2011,35(1):103-108. 质谱技术在蛋白质组学研究中的应用 甄 艳,施季森 * (南京林业大学,林木遗传与生物技术省部共建教育部重点实验室,江苏 南京 210037) 摘要:随着蛋白质组学研究的迅速发展,质谱技术已成为应用于蛋白质组学研究中的强有力工具和核心技术。质谱技术的先进性在于为蛋白质组学研究提供的通量和分子信息。笔者重点概述了基于质谱路线的蛋白质组学研究,介绍了基于质谱的定量蛋白质组学﹑翻译后修饰蛋白质组学、定向蛋白质组学、功能蛋白质组学以及基于串联质谱技术的蛋白质组学数据解析的研究 进展。 关键词:质谱;蛋白质组学;定量蛋白质组学;翻译后修饰;定向蛋白质组学;功能蛋白质组学中图分类号:Q 81 文献标志码:A 文章编号:1000-2006(2011)01-0103-06 A p p l i c a t i o n o f m a s s s p e c t r o m e t r y i n p r o t e o m i c s s t u d i e s Z H E NY a n ,S H I J i s e n * (K e y L a b o r a t o r y o f F o r e s t G e n e t i c s a n d B i o t e c h n o l o g y M i n i s t r y o f E d u c a t i o n , N a n j i n g F o r e s t r y U n i v e r s i t y ,N a n j i n g 210037,C h i n a ) A b s t r a c t :W i t ht h e r a p i d d e v e l o p m e n t o f p r o t e o m i c s ,m a s s s p e c t r o m e t r y i s m a t u r i n g t o b e a p o w e r f u l t o o l a n dc o r e t e c h -n o l o g y f o r p r o t e o m i c s s t u d i e s d u r i n g t h e r e c e n t y e a r s .T h e s u p e r i o r i t y o f m a s s s p e c t r o m e t r y l i e s i n p r o v i d i n g t h e t h r o u g h -p u t a n d t h e m o l e c u l a r i n f o r m a t i o n ,w h i c hn o o t h e r t e c h n o l o g y c a n b e m a t c h e di np r o t e o m i c s .I nt h i s r e v i e w ,w e m a d e a g l a n c e o n t h e o u t l i n e o f m a s s s p e c t r o m e t r y -b a s e d p r o t e o m i c s .A n dt h e nw e a d d r e s s e d o n t h e a d v a n c e s o f d a t a a n a l y s i s o f m a s s s p e c t r o m e t r y -b a s e dp r o t e o m i c s ,q u a n t i t a t i v em a s ss p e c t r o m e t r y -b a s e dp r o t e o m i c s ,p o s t -t r a n s l a t i o n a l m o d i f i c a t i o n s b a s e d m a s s s p e c t r o m e t r y ,t a r g e t e d p r o t e o m i c s a n df u n c t i o n a l p r o t e o m i c s b a s e d -m a s s s p e c t r o m e t r y . K e yw o r d s :m a s ss p e c t r o m e t r y ;p r o t e o m i c s ;q u a n t i t a t i v ep r o t e o m i c s ;p o s t -t r a n s l a t i o n m o d i f i c a t i o n ;t a r g e t e d p r o -t e o m i c s ;f u n c t i o n a l p r o t e o m i c s 蛋白质组学(P r o t e o m i c s )是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的学科。目前蛋白质组学的研究主要有两条路线:一是基于双向电泳的蛋白质组学;二是基于质谱的蛋白质组学,其中基于双向电泳的蛋白质组学研究路线最终也离不开质谱技术的应用。自20世纪80年代末,两种质谱软电离方式即电喷雾电离(e l e c t r o s p r a y i o n i z a t i o n ,E S I )和基质辅助激光解析离子化(m a -t r i x a s s i s t e d l a s e r d e s o r p t i o n i o n i z a t i o n ,M A L D I )的发明和发展解决了极性大、热不稳定蛋白质和多肽分 析的离子化和分子质量大的测定问题[1] ,蛋白质组学研究中常用的质谱分析仪包括离子阱(i o n t r a p ,I T ),飞行时间(t i m e o f f l i g h t ,T O F ),串联飞行时间(T O F -T O F ),四级杆/飞行时间(q u a d r u p o l e /T O F h y b r i d s ),离子阱/轨道阱(I T /o r b i t r a ph y b r i d ) 和离子阱/傅里叶变换串联质谱分析仪(I T /F o u r i e r t r a n s f o r m i o n c y c l o t r o nr e s o n a n c em a s s s p e c t r o m e t e r s h y b r i d s ,I T /F T M S ),这些质谱仪具有不同的灵敏度、分辨率、质量精确度和产生不同质量的M S /M S 谱[2] 。质谱作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备及数据分析的信息学工具被广泛地应用。因此,有学者指出质谱技术 已在蛋白质组学研究中处于核心地位[3] 。目前在通量及所包含的分子信息内容上,基于质谱的蛋白质组学技术在细胞生物学研究中可以鉴定和量化

相关主题
相关文档 最新文档