当前位置:文档之家› 新一代测序技术用于miRNAs检测

新一代测序技术用于miRNAs检测

新一代测序技术用于miRNAs检测
新一代测序技术用于miRNAs检测

MicroRNA高通量检测方法及应用进展

汤海明1,陈红1*,张静1,任景怡1,许宁2

1.北京大学人民医院心内科. 北京 100044;

2.瑞典卡罗林斯卡医学院医学系. 斯德哥尔摩 17176

摘要:MiRNAs是一类在进化上高度保守的非编码小分子单链RNA(~22nt),在基因转录后调控中发挥

至关重要的作用。目前可用的两种高通量miRNA检测方法包括传统的微阵列芯片技术以及近年来飞速发展

的新一代测序技术。微阵列芯片技术具有通量高、廉价、重复性好等优点,应用最为广泛。近年来发展的

新一代测序技术采用全基因组测序方法,在探索新miRNA上具有巨大优势。除此之外,新一代测序技术在

miRNA互补链、miRNA单核苷酸多态性、miRNA异构体检测及miRNA靶基因检测方面具有新的应用。随

着高通量miRNA检测技术的发展,人类对于miRNA在各种生理病理过程中的表达和作用将会有更进一步的

认识。

关键词: microRNAs(miRNAs)高通量检测;微阵列芯片;新一代测序技术

Advancement in High Throughput Approaches for Mi-croRNA Detection and Their Applications

TANG Hai-Ming1,CHEN-Hong1,ZHANG Jing1, REN Jing-Yi1,XU Ning2

1. Department of Cardiology, Peking University People’s Hospital, Beijing 100044, China;

2. Department of Medicine, Karolinska Institute, Stockholm 17176, Sweden

Abstract: MiRNAs are a class of ~22nt long non-coding RNAs. They are evolutionarily conserved and play

essential roles in the regulation of post-transcriptional gene expression. This review discusses the two main high

throughput profiling approaches: microarray and next generation sequencing (NGS). Microarray is widely used for

it is high throughput, cheap and reliable. Next generation sequencing has been developed in recent years. And it

has a big advantage in detecting new miRNAs. NGS can be applied into the detection of miRNA*, single nucleo-

tide polymorphism (SNP ) and isomer. Moreover, it has new applications in targeting miRNAs to their specific

mRNAs. These high throughput approaches for microRNA detection will greatly promote the our exploration of

miRNAs.

Key words:high throughput detection of microRNAs (miRNAs); microarray;next generation sequencing

_____________________

收稿日期:2011-00-00;修回日期:2011-00-00 基金项目:中华医学会临床医学科研专项基金(编号:0901*******)

作者简介:汤海明(1989—),男,博士研究生,研究方向:microRNA在动脉粥样硬化

疾病中的作用。Tel:010-********;E-mail:ningzhithm@https://www.doczj.com/doc/d99067940.html,

* 通讯作者:陈红(1960—),女,教授,博士,研究方向:动脉粥样硬化的发病机制。Tel:

010-********;E-mail:chenhong0418@https://www.doczj.com/doc/d99067940.html,

MicroRNAs是一类在进化上高度保守的非编码小分子单链RNA(~22nt),在基因表达调控中发挥至关重要的作用。1993年,Lee等[1]在秀丽隐杆线虫(Caenorhabditis elegans)中发现了一个可时序调控胚胎后期发育的基因lin-4。2000年Reinhart等[2]发现了具有转录后调节功能的小分子RNA let-7。至2001年,研究者在线虫(C. elegans)、果蝇(D. mela-nogaster)和人体中发现了近百个这样的小RNA分子[3],国际上统一将这类小RNA 正式命名为microRNA(miRNA),其研究也成为新的热点。随着新一代测序技术的发展,miRNA发现的过程大大提速,截至2011年miRbase已收录140个物种的15000条miRNAs基因位点和17000条不同的miRNAs序列[4]。每一个miRNA可以调控多个靶基因,反之,1个靶基因也可以同时被多个miRNAs调节。因此,据保守估计,约60-70%的人类蛋白编码基因受到s的调控[5]。越来越多的证据表明,miRNAs参与很多重要的生理和病理过程,例如发育、器官形成、凋亡、细胞增殖、肿瘤发生等。

由于miRNA在转录后基因调节中发挥的巨大作用,使用高通量miRNA检测方法可以快速获取特定样品的miRNA表达谱,对于探索特定生理及病理过程中发挥作用的miRNA及其作用机制十分必要。目前可用于高通量分析miRNAs表达谱的方法主要有两种,即传统的微阵列芯片技术以及近年来飞速发展的新一代测序技术。微阵列芯片技术基于捕获序列与样品中miRNA的结合,具有通量高、廉价、重复性好等优点,是目前应用最为广泛的miRNA高通量检测方法。但由于miRNA序列短、表达水平低,同源miRNA( 如let-7家族) 序列相似度高、miRNA前体干扰检测等原因,微阵列芯片技术常面临捕获探针与miRNA 杂交的效率低、错误杂交率高等问题。近年来发展的新一代测序技术采用全基因组测序方法,避免了微阵列芯片固有的缺陷,大大增加了新miRNA的检出速度[4]。并且除了获取已知miRNA的表达谱之外,新一代测序技术在miRNA互补链[6]、miRNA单核苷酸多态性[7]、miRNA 异构体[8]检测及miRNA靶基因检测[9]方面具有新的应用。由于高通量检测特定miRNAs的表达谱在人类疾病研究中具有重要的意义,本文就两种miRNAs高通量检测技术的特点以及在人类疾病研究中的应用作一综述。

1 微阵列芯片(microarray)

微阵列芯片是目前获取miRNA表达谱最常用的高通量检测方法。在一块特殊的玻璃片或硅芯片上,打印核酸探针,经过特异性修饰的探针与miRNA分子杂交,通过荧光或电流等方式检测不同位置上信号的强度,以获得不同miRNA的表达水平。不同的微阵列平台的差异主要在于探针的设计、探针与微阵列的结合方式、miRNA的标记技术以及信号的检测方法。

1.1探针设计

微阵列芯片中的探针包括两个部分,连接序列和捕获序列。连接序列通常是poly(dT)或是poly(dA),通过5’末端氨基基团与微阵列相结合。因为miRNA 捕获序列越靠近微阵列表面,其与miRNA 的结合力越弱,连接序列保证了探针的捕获序列与阵列表面有足够的空间,从而增加了结合序列与miRNA的结合能力[10]。捕获序列由RNA或DNA分子构成,与靶miRNA的分子序列互补,可以是合成的寡肽,也可是cDNA文库片断。理想的捕获序列应当有高度的特异性和结合力。有数据显示,当探针富含腺苷酸和胸腺嘧啶时,捕获序列的结合力显著减弱[11]。因此通过在捕获序列中引入核酸类似物LNA很好地解决了这个问题[12]。LNA是RNA的类似物,它通过引入O2’,C4’-亚甲基桥,改变并锁定了呋喃糖环的构向。LNA可被引入DNA或RNA捕获序列的任意位置,显著增加捕获序列与靶miRNA的结合力。由于微阵列芯片中使用的探针数量多(人、小鼠、大鼠总计探针数量可达1112条),

它们各自的解链温度(melting tempera-ture)差异可达30℃,杂交条件难以选择[13]。LNA可增加捕获序列的解链温度,减少不同捕获序列解链温度之间的差异,大大提高了微阵列芯片的特异性和敏感性。

1.2 MiRNA的标记

根据标记miRNA时是否需要扩增miRNA,可将所有的标记方法分为直接标记方法和非直接标记方法。由于直接标记方法易于实施,且无逆转录和PCR扩增带来的二次误差,因此其在研究中应用较广泛。最常用的直接标记方法是T4连接酶法[14],T4连接酶与经Dicer剪切前体miRNA所形成的成熟miRNA3’端羟基特异结合,并连接上荧光标记的二核苷酸(如pCU-Cy3),所以能够避免RNA降解产物和其他RNA的干扰。直接标记方法还包括标记miRNA鸟嘌呤残基[15]、使用polyA 聚合酶标记3’端羟基[16]、使用生物素标记的8个核苷酸长的随机引物、通过逆转录反应直接标记总RNA[17]、RAKE法[18]和化学修饰法[19]等。非直接标记方法对于低丰度的miRNA检测极具优势,其原理基于对miRNA的扩增。来源于miRNA的靶分子可在通过PCR的方法进行标记。其特点是捕获探针并不与miRNA靶分子结合,而是与miRNA的反转录或RT-PCR产物结合[20][21]。

1.3 数据的获取及分析

加入标记的RNA样本,与miRNA芯片进行杂交,清洗之后进行数据获取和分析工作。每个样品需进行三次杂交,严格控制杂交及清洗条件,以获得最大的特异性、敏感性和重复性[22]。miRNA微阵列的数据分析包括:1.数据提取,扫描干燥的微阵列芯片,通过特定的软件,如Feature Extraction Software(Agilent Techonolo-gies), Lux Scan(Capital Bio), Gene-Pix(Axon Instruments) [22],提取原始数据;

2.修正及标化,对所得原始数据进行必要的背景值修正和根据内标(internal control)和外标(external control)进行标准化处理;

3.数据分析及制图,使用SAM(Significant Analysis of Microarray)等软件从统计学的角度,鉴定表达水平具有差异的miRNAs,进一步采用聚类分析软件Cluster及heatmap[23]以更直观地表示出多个样品中miRNA的变化情况;

4.数据验证,最后使用RT-PCR,Northern印记方法进行微阵列数据的验证,以保证微阵列芯片数据的准确性和可重复性。

2 新一代测序技术

美国ABI公司于1987年推出的基于Sanger法的第一代测序技术,在人类基因组图谱的绘制中发挥了重要的作用。自2005年发展起来的新一代测序平台取得了突破性的进展,使得测序效率大大增加,并且极大地降低了测序成本。运用新一代测序技术可以从基因组水平、转录组水平、蛋白质组水平等多个角度进行遗传物质的全面解码。对于包括miRNA在内的小RNA,新一代高通量测序平台能够迅速对样品中的小RNA分子测序并定量,发现新miRNA,获得全面的miRNA表达谱。与芯片技术相比,新一代测序检测单核苷酸多态性[7]、miRNA异构体[8]等遗传变异具有明显优势。结合染色质免疫共沉淀和RNA 末端平行分析法,新一代测序技术可以快速检测出miRNA的靶mRNA[9],这是一个极为吸引人的研究领域。

2.1 原理和步骤

新一代测序最常使用的3种平台是Illumina的基因组分析仪[24],Roche454基因组测序仪[25]以及 AB Life Technologies的SOLiD系统[26]。新一代测序平台的基本步骤主要包括:1. 构建 DNA模板文库,从总RNA中分离纯化出20-30nt的小RNA后,使用T4连接酶分别在miRNA的5’端和3’端连上接头序列,进行RT-PCR 得到70-80bp的DNA片段;2. 将所得单链模板

文库,固定在平面或是微球的表面;3.通过桥式 PCR、微乳滴 PCR或原位成簇对数据进行扩增;4.采集并记录PCR循环中的光学事件;5.对产生的阵列图像进行时序分析,获得 DNA片段的序列

2.2新一代测序技术各平台比较

2.2.1 Illumina基因组分析仪

使用桥式PCR进行扩增。单链 DNA 两端加上非对称的接头,并固定在芯片表面形成寡核苷酸桥。芯片置于流通池内,其中有8个独立的道,每条道上都可固定数百万PCR产生的扩增产物簇。向扩增产物中加入测序引物,不同荧光基团标记的4种核苷酸和DNA聚合酶开始测序。封闭3’端使每次反应只能加入一个核苷酸。在采集荧光图像,获取新加入的核苷酸信息之后,3’端被打开,进行下一循环。该循环可进行50次,获取50碱基长度的DNA序列[24]。

2.2.2Roche454基因组测序仪

利用微乳滴 PCR进行扩增。将水溶液与油混合,形成油包水结构的微乳滴。每个乳滴就是只包含一个微球及PCR试剂的微反应器。 PCR在每一微球上单独进行,PCR的扩增产物也与微球结合。富集微球,并将其转移到微孔板上,进行焦磷酸测序。三磷酸核苷与 DNA链结合释放焦磷酸,再通过ATP硫酰化酶和荧光素酶的一系列级联反应释放光信号。加入一种核苷酸,记录每一微孔之中光信号有无释放,从而确定该核苷酸是否与当前位点互补。焦磷酸测序读长可达400-500碱基[25]。

2.2.3 AB Life Technologies的SOLiD系统

SOLiD系统也采用微球和微乳滴的方法。在PCR扩增完成后,微球被结合到反应板上,采用连接法测序。连接反应的底物是8碱基长的探针,探针的5’端标记有荧光,3’端1~2位碱基对与5’端荧光信号的颜色对应。1次SOLiD测序共有五轮,每轮测序又由多个连接反应组成。第1轮的第1次连接反应将掺入1条探针,测序仪记录下反映该条探针3’端1~2位碱基信息的荧光信号,随后除去6~8位碱基及荧光基团,获得1~2位的颜色信息。以此类推,第2次连接反应得到6~7位的颜色信息,第3次连接反应得到11~12位颜色信息。多次连接后,开始第2轮测序。由于第2轮测序的引物比第1轮前移1位,这轮测序将得到0~1位、5~6位、10~11位的颜色信息,5轮测序过后,就可得到所有位置的颜色信息,并推断出相应的碱基序列[26]。

三个测序平台的详细比较见表1。

2MiRNA高通量检测技术应用

使用miRNA微阵列芯片和新一代测序技术都能迅速高效地获取特定样品中的miRNA及特定miRNA表达水平,即miRNA 表达谱。miRNA高通量检测技术可用于检测胚胎干细胞、造血干细胞、神经元、脂肪细胞在发育过程的miRNA的表达谱变化及其靶基因,有助于我们明确各细胞的发育机制。对于乙型肝炎病毒、艾滋病毒、巨细胞病毒等病毒的研究主要集中在发现病毒合成的miRNA以及参与病毒宿主反应的宿主miRNAs[27][28]。miRNA高通量检测技术已经被成功运用于临床医学领域,如肿瘤、心血管疾病、糖尿病、肾脏疾病、神经系统疾病、病毒感染、自身免疫病等疾病,以获取疾病相关的特异性miRNA表达谱[5]。这些miRNA在疾病的发生发展转归中发挥着重要的调控作用,同时也是潜在的疾病标志物和治疗靶点。

表1新一代测序技术各平台比较

平台 技术 数据量

(GB) 平均读长

(bp)

优点 缺点

Illumina基因组分析仪[24]合成测序法 30 50 1. 所需样品量少

2. 数据误差小

3. 流程简单

错误率随读长增加累积

Roche454基因组测序仪[25]

并行焦磷酸合成

测序

0.5 400 序列读长最长,多

用于新物种基因组和

转录组测序

1.相同碱基( homopo-

lymer)的连续掺入产生误差

2. 试剂价格相对较高。

AB Life Technologies的SOLiD系统[26]

基于磁珠的并行

克隆连接DNA测序

50 35 1. 准确度最高

2. 适用于小片段

RNA研究

序列读长相对较短

注:GB千兆字节, bp 碱基对

2.1微阵列芯片和新一代测序技术用

于miRNA表达谱检测

微阵列芯片和新一代测序技术都能够有效地对RNA样品的miRNA表达谱进行检测。Weng L等运用Agilent微阵列芯片和Illumina基因组分析仪分析了肾透明细胞癌的miRNA表达谱。微阵列芯片包含723个探针,共检出了453个miRNA,Illumina基因测序技术检出了598个miRNAs(占所有已知miRNA的68.3%)。两种方法检出的miRNA的表达水平高度一致(r=0.78-0.83)[xxix]。miRNA微阵列芯片基于样品中miRNA与芯片上探针的结合,因此只能检测序列已知的或人为预测的miRNA。新一代测序技术可以对样品进行RNA转录组(transcriptome)检测,包括全套RNA物质,包括mRNA, rRNA,tRNA,和非编码RNA[xxx],在探寻新的miRNA方面具有很大的优势。例如,当Jima DD等对正常和恶性B细胞进行RNA转录组测序时,发现了331个已知的miRNAs和286个新miRNAs,其中包括6个新miRNAs簇(miRNAs cluster)[xxxi]。

3.2 新一代测序技术在miRNA研究领域的其他应用

除了检测新的miRNA以外,新一代测序技术在miRNA互补链、miRNA基因的单核苷酸多态性和miRNA异构体检测及miRNA靶基因检测方面具有新的应用。

3.2.1 新一代测序技术应用于miRNA互补链、miRNA单核苷酸多态性和miRNA异构体检测

miRNA的前体(Pre-miRNA)通过RNA酶Dicer剪切产生一个miRNA二聚体,由miRNA链和miRNA互补链组成。miRNA 链进入蛋白功能复合体,成为成熟的miRNA,发挥转录后基因调控作用,而它的互补链在多数情况下会很快降解,很难检测到。但对于一小部分miRNA而言,它们的互补链并不会被完全降解,它们会进入另一个蛋白功能复合体,成为成熟的miRNA行使功能。这些由互补链形成miRNA在命名时,会在右上角标记一个星

号以便区分[xxxii]。之前人们一直认为miRNA*没有实际作用。新一代测序使得全面检测miRNA*得到可能。例如,Kuchenbauer F等运用测序技术发现mir-223*高水平与急性髓性白血病(AML)病人的高存活率相关[xxxiii]。

单核苷酸多态性(Single nucleotide polymorphism, SNP)即基因组序列的单碱基改变,是最为常见的遗传变异。通过新一代测序技术,研究者们发现SNP可出现于miRNA的编码基因[7][xxxiv],参与miRNA 合成的酶蛋白的编码基因[xxxv]及miRNA的靶基因[xxxvi],影响miRNA的表达及功能。在很多疾病中,遗传学研究鉴定了很多SNP与疾病的发生和预后高度相关,但其背后的病理机制却是未知的。结合SNP与疾病相关性的数据与miRNA SNP 的数据将有助于我们认识miRNA在疾病的发生发展中所扮演的角色。例如,Clague等发现位于DICER1基因的SNP(rs3742330)可显著增加粘膜白斑或红斑病人发生口腔粘膜癌前病变的几率[xxxvii]。其可能的机制为 SNP(rs3742330)影响DICER1 mRNA的稳定性,从而减少DICER1 基因的表达。

isomiR即miRNA异构体,是指miRNA基因经过剪接修饰后形成多个序列不同的成熟miRNAs,例如miRNA的3’末端转录后水平的非模板性的尿苷或腺苷添加[8]。新一代测序技术是全基因组测序,可以鉴别单核苷酸变异,对于拷贝数量较少、与标准探针相比存在核苷酸序列差异的miRNA序列来说是最佳的检测方法。新一代测序技术广泛应用于miRNA遗传变异的研究,将加深我们对miRNA生物合成和调控通路的理解。

3.2.2 新一代测序技术应用于miRNA的靶mRNA检测

应用新一代测序技术检测miRNA靶mRNA的主要检测方法主要包括基于Argonaute蛋白的交联免疫共沉淀测序技术(High-throughput sequencing of RNA isolated by crosslinking immunoprecipita-tion, HITS-CLIP)以及基于降解组(degradome)测序的RNA末端平行分析法(Parallel Analysis of RNA Ends, PARE)。

交联免疫共沉淀测序技术可用于与RNA结合蛋白相互作用的RNA的测序。首先,交联(crosslinking)RNA和与之结合的蛋白之间,使用该特定蛋白特异的抗体免疫沉淀RNA和蛋白的复合体,之后提取其中的RNA,进行高通量测序并使用生物信息学方法对相关RNA进行分析。 Ar-gonaute蛋白是miRNA蛋白功能复合体(RNA-induced silencing complex,RISC)的核心催化组分。因为Argonaute蛋白同时与miRNA和靶mRNA结合,所以使用Argonaute蛋白的抗体进行免疫沉淀,可同时获取miRNA及其靶mRNA。基于Argonaute的HITS-CLIP 测序已经被成功应用于获取miRNA和靶mRNA相互作用的图谱[9][xxxviii]。

RNA末端平行分析法(Parallel Analy-sis of RNA Ends, PARE) 通过检测RNA降解组(degradome)而鉴定miRNA的靶mRNA [9][xxxix][xl]。经miRNA机制剪切产生的mRNA片段含有5’端单磷酸基团和3’ 端polyA尾巴。提取并分离含有3’端poly A尾巴的RNA,加入包含基质金属蛋白酶12(MMP-12)结合位点的5’端RNA接头,与5’单磷酸化的mRNA片段特异结合。在进行反转录、PCR扩增后,使用MMP-12对RNA接头的特定结合位点进行剪切,获得同等大小的片断。分离该片段并与3’端双链DNA接头连接,进行PCR扩增。最后,对纯化的扩增产物进行高通量测序,产生的数据与cDNA文库进行比对,使用生物信息学方法进行分析。

与传统的生物信息学预测方法相比,这两种基于测序的方法具有假阳性率低、组织特异、定量(与miRNA的丰度无关,与实际上发挥功能的miRNA数量相关)等巨大优势,在快速确定miRNA靶mRNA方面有很大的应用。Yang JH等建立了基于

CLIP 测序和PARE试验结果的数据库starBase,使我们能够更全面的了解miRNA 与靶mRNA相互作用的复杂网络[xxxviii]。

3总结

MiRNAs是一类在进化上高度保守的非编码小分子单链RNA(~22nt),在基因转录后调控中发挥至关重要的作用。越来越多的证据表明,miRNAs参与很多重要的生理和病理过程,例如发育、器官形成、调亡、细胞增殖、肿瘤发生等。高通量miRNA检测方法可以快速获取特定样品的miRNA表达谱,对于探索特定生理及病理过程中发挥作用的miRNA及其作用机制十分必要。目前可用的两种高通量miRNA检测方法包括传统的微阵列芯片技术以及近年来飞速发展的新一代测序技术。微阵列芯片技术基于捕获序列与样品中miRNA的结合,具有通量高、廉价、重复性好等优点,应用最为广泛。近年来发展的新一代测序技术采用全基因组测序方法,在探索新miRNA上具有巨大优势[4]。除此之外,新一代测序技术在miRNA互补链[6]、miRNA单核苷酸多态性[7]、miRNA 异构体[8]检测及miRNA靶基因检测[9]方面具有新的应用。随着高通量miRNA检测技术的发展,人类对于miRNA在各种生理病理过程中的表达和作用将会有更进一步的认识。

参考文献(References):

[1]Lee RC, Feinbaum RL, Ambros V. The C.

elegans heterochronic gene lin-4 encodes

small RNAs with antisense complementarity

to lin-14. Cell. 1993;75(5):843-854.

[2]Reinhart BJ, Slack FJ, Basson M, Pasquinelli

AE, Bettinger JC, Rougvie AE, Horvitz HR,

Ruvkun G. The 21-nucleotide let-7 RNA re-

gulates developmental timing in Caenorhabdi-

tis elegans. Nature. 2000;403(6772):901-906.

[3]Lagos-Quintana M, Rauhut R, Lendeckel W,

Tuschl T. Identification of novel genes coding

for small expressed RNAs. Science.

2001;294(5543):853-858.

[4]Kozomara A, Griffiths-Jones S. miRBase:

integrating microRNA annotation and

deep-sequencing data. Nucleic Acids Res.

2011;39(Database issue):D152-D157.

[5]van Rooij E. The art of microRNA research.

Circ Res. 2011;108(2):219-234.

[6]Kuchenbauer F, Mah SM, Heuser M,

McPherson A, Ruschmann J, Rouhi A, Berg T,

Bullinger L, Argiropoulos B, Morin RD, Lai

D, Starczynowski DT, Karsan A, Eaves CJ,

Watahiki A, Wang Y, Aparicio SA, Ganser A,

Krauter J, Dohner H, Dohner K, Marra MA,

Camargo FD, Palmqvist L, Buske C, Humph-

ries RK. Comprehensive analysis of mamma-

lian miRNA* species and their role in myeloid

cells. Blood. 2011.

[7]Duan RH, Pak CH, Jin P. Single nucleotide

polymorphism associated with mature

miR-125a alters the processing of pri-miRNA.

Hum Mol Genet, 2007, 16(9): 1124–1131.

[8]Fernandez-Valverde SL, Taft RJ, Mattick JS.

Dynamic isomiR regulation in Drosophila de-

velopment. Rna. 2010;16(10):1881-1888.

[9]Thomson DW, Bracken CP, Goodall GJ. Ex-

perimental strategies for microRNA target

identification. Nucleic Acids Res. 2011

[10]Ranade AR, Weiss GJ. Methods for micro-

RNA microarray profiling. Methods Mol Biol.

2011;700:145-152.

[11]Lockhart DJ, Dong H, Byrne MC, Follettie

MT, Gallo MV, Chee MS, Mittmann M,

Wang C, Kobayashi M, Horton H, Brown EL.

Expression monitoring by hybridization to

high-density oligonucleotide arrays. Nat Bio-

technol. 1996;14(13):1675-1680.

[12]Castoldi M, Schmidt S, Benes V, Noerholm M,

Kulozik AE, Hentze MW, Muckenthaler MU.

A sensitive array for microRNA expression

profiling (miChip) based on locked nucleic

acids (LNA). Rna. 2006;12(5):913-920.

[13]Perera RJ. A microarray-based method to

profile global microRNA expression in human

and mouse. Methods Mol Biol.

2007;382:137-148.

[14]Thomson JM, Parker J, Perou CM, Hammond

SM. A custom microarray platform for analy-

sis of microRNA gene expression. Nat Me-

thods. 2004;1(1):47-53.

[15]Babak T, Zhang W, Morris Q, Blencowe BJ,

Hughes TR. Probing microRNAs with micro-

arrays: tissue specificity and functional infe-

rence. Rna. 2004;10(11):1813-1819.

[16]Shingara J, Keiger K, Shelton J, Laosin-

chai-Wolf W, Powers P, Conrad R, Brown D,

Labourier E. An optimized isolation and labe-

ling platform for accurate microRNA expres-

sion profiling. Rna. 2005;11(9):1461-1470. [17]Liang RQ, Li W, Li Y, Tan CY, Li JX, Jin YX,

Ruan KC. An oligonucleotide microarray for

microRNA expression analysis based on labe-

ling RNA with quantum dot and nanogold

probe. Nucleic Acids Res. 2005;33(2):e17.

[18]Nelson PT, Baldwin DA, Scearce LM, Ober-

holtzer JC, Tobias JW, Mourelatos Z. Micro-

array-based, high-throughput gene expression

profiling of microRNAs. Nat Methods.

2004;1(2):155-161.

[19]Beuvink I, Kolb FA, Budach W, Garnier A,

Lange J, Natt F, Dengler U, Hall J, Filipowicz

W, Weiler J. A novel microarray approach

reveals new tissue-specific signatures of

known and predicted mammalian microRNAs.

Nucleic Acids Res. 2007;35(7):e52.

[20]Calin GA, Liu CG, Sevignani C, Ferracin M,

Felli N, Dumitru CD, Shimizu M, Cimmino A,

Zupo S, Dono M, Dell’Aquila ML, Alder H,

Rassenti L, Kipps TJ, Bullrich F, Negrini M,

Croce CM. MicroRNA profiling reveals dis-

tinct signatures in B cell chronic lymphocytic

leukemias. Proc Natl Acad Sci U S A.

2004;101(32):11755-11760.

[21]Miska EA, Alvarez-Saavedra E, Townsend M,

Yoshii A, Sestan N, Rakic P, Constan-

tine-Paton M, Horvitz HR. Microarray analy-

sis of microRNA expression in the developing

mammalian brain. Genome Biol.

2004;5(9):R68. [22]Lu C, Souret F. High-throughput approaches

for miRNA expression analysis. Methods Mol

Biol. 2010;592:107-125.

[23]Hua YJ, Tu K, Tang ZY, Li YX, Xiao HS.

Comparison of normalization methods with

microRNA microarray. Genomics.

2008;92(2):122-128.

[24]Bentley DR, Balasubramanian S, Swerdlow

HP, Smith GP, Milton J, Brown CG, Hall KP,

Evers DJ, Barnes CL, Bignell HR, Boutell JM,

Bryant J, Carter RJ, Keira CR, Cox AJ, Ellis

DJ, Flatbush MR, Gormley NA, Humphray SJ,

Irving LJ, Karbelashvili MS, Kirk SM, Li H,

Liu X, Maisinger KS, Murray LJ, Obradovic

B, Ost T, Parkinson ML, Pratt MR, Rasolon-

jatovo IM, Reed MT, Rigatti R, Rodighiero C,

Ross MT, Sabot A, Sankar SV, Scally A,

Schroth GP, Smith ME, Smith VP, Spiridou A,

Torrance PE, Tzonev SS, Vermaas EH, Wal-

ter K, Wu X, Zhang L, Alam MD, Anastasi C,

Aniebo IC, Bailey DM, Bancarz IR, Banerjee

S, Barbour SG, Baybayan PA, Benoit VA,

Benson KF, Bevis C, Black PJ, Boodhun A,

Brennan JS, Bridgham JA, Brown RC, Brown

AA, Buermann DH, Bundu AA, Burrows JC,

Carter NP, Castillo N, Chiara ECM, Chang S,

Neil CR, Crake NR, Dada OO, Diakoumakos

KD, Dominguez-Fernandez B, Earnshaw DJ,

Egbujor UC, Elmore DW, Etchin SS, Ewan

MR, Fedurco M, Fraser LJ, Fuentes FK, Scott

FW, George D, Gietzen KJ, Goddard CP,

Golda GS, Granieri PA, Green DE, Gustafson

DL, Hansen NF, Harnish K, Haudenschild CD,

Heyer NI, Hims MM, Ho JT, Horgan AM,

Hoschler K, Hurwitz S, Ivanov DV, Johnson

MQ, James T, Huw JT, Kang GD, Kerelska

TH, Kersey AD, Khrebtukova I, Kindwall AP,

Kingsbury Z, Kokko-Gonzales PI, Kumar A,

Laurent MA, Lawley CT, Lee SE, Lee X, Liao

AK, Loch JA, Lok M, Luo S, Mammen RM,

Martin JW, McCauley PG, McNitt P, Mehta P,

Moon KW, Mullens JW, Newington T, Ning

Z, Ling NB, Novo SM, O’Neill MJ, Osborne

MA, Osnowski A, Ostadan O, Paraschos LL,

Pickering L, Pike AC, Pike AC, Chris PD,

Pliskin DP, Podhasky J, Quijano VJ, Raczy C,

Rae VH, Rawlings SR, Chiva RA, Roe PM,

Rogers J, Rogert BM, Romanov N, Romieu A,

Roth RK, Rourke NJ, Ruediger ST, Rusman E,

Sanches-Kuiper RM, Schenker MR, Seoane

JM, Shaw RJ, Shiver MK, Short SW, Sizto

NL, Sluis JP, Smith MA, Ernest SSJ, Spence

EJ, Stevens K, Sutton N, Szajkowski L, Tre-

gidgo CL, Turcatti G, Vandevondele S, Ver-

hovsky Y, Virk SM, Wakelin S, Walcott GC,

Wang J, Worsley GJ, Yan J, Yau L, Zuerlein

M, Rogers J, Mullikin JC, Hurles ME,

McCooke NJ, West JS, Oaks FL, Lundberg

PL, Klenerman D, Durbin R, Smith AJ. Ac-

curate whole human genome sequencing using

reversible terminator chemistry. Nature.

2008;456(7218):53-59.

[25]Margulies M, Egholm M, Altman WE, Attiya

S, Bader JS, Bemben LA, Berka J, Braverman

MS, Chen YJ, Chen Z, Dewell SB, Du L,

Fierro JM, Gomes XV, Godwin BC, He W,

Helgesen S, Ho CH, Irzyk GP, Jando SC,

Alenquer ML, Jarvie TP, Jirage KB, Kim JB,

Knight JR, Lanza JR, Leamon JH, Lefkowitz

SM, Lei M, Li J, Lohman KL, Lu H, Makhi-

jani VB, McDade KE, McKenna MP, Myers

EW, Nickerson E, Nobile JR, Plant R, Puc BP,

Ronan MT, Roth GT, Sarkis GJ, Simons JF,

Simpson JW, Srinivasan M, Tartaro KR, To-

masz A, Vogt KA, Volkmer GA, Wang SH,

Wang Y, Weiner MP, Yu P, Begley RF,

Rothberg JM. Genome sequencing in micro-

fabricated high-density picolitre reactors. Na-

ture. 2005;437(7057):376-380.

[26]Smith DR, Quinlan AR, Peckham HE, Ma-

kowsky K, Tao W, Woolf B, Shen L, Dona-

hue WF, Tusneem N, Stromberg MP, Stewart

DA, Zhang L, Ranade SS, Warner JB, Lee CC,

Coleman BE, Zhang Z, McLaughlin SF, Ma-

lek JA, Sorenson JM, Blanchard AP, Chap-

man J, Hillman D, Chen F, Rokhsar DS,

McKernan KJ, Jeffries TW, Marth GT, Rich-

ardson PM. Rapid whole-genome mutational

profiling using next-generation sequencing

technologies. Genome Res.

2008;18(10):1638-1642.

[27]Noorbakhsh F, Ramachandran R, Barsby N,

Ellestad KK, LeBlanc A, Dickie P, Baker G,

Hollenberg MD, Cohen EA, Power C. Mi-

croRNA profiling reveals new aspects of HIV

neurodegeneration: caspase-6 regulates as-

trocyte survival. Faseb J.

2010;24(6):1799-1812.

[28]Wu FL, Jin WB, Li JH, Guo AG. Targets for

human encoded microRNAs in HBV genes.

Virus Genes. 2011;42(2):157-161.

[29]Weng L, Wu X, Gao H, Mu B, Li X, Wang JH,

Guo C, Jin JM, Chen Z, Covarrubias M, Yuan

YC, Weiss LM, Wu H. MicroRNA profiling

of clear cell renal cell carcinoma by

whole-genome small RNA deep sequencing of

paired frozen and formalin-fixed, paraf-

fin-embedded tissue specimens. J Pathol.

2010;222(1):41-51.

[30]Mortazavi A, Williams BA, McCue K,

Schaeffer L, Wold B. Mapping and quantify-

ing mammalian transcriptomes by RNA-Seq.

Nat Methods. 2008;5(7):621-628.

[31]Jima DD, Zhang J, Jacobs C, Richards KL,

Dunphy CH, Choi WW, Yan AW, Srivastava

G, Czader MB, Rizzieri DA, Lagoo AS, Lugar

PL, Mann KP, Flowers CR, Bernal-Mizrachi

L, Naresh KN, Evens AM, Gordon LI, Luftig

M, Friedman DR, Weinberg JB, Thompson

MA, Gill JI, Liu Q, How T, Grubor V, Gao Y,

Patel A, Wu H, Zhu J, Blobe GC, Lipsky PE,

Chadburn A, Dave SS. Deep sequencing of

the small RNA transcriptome of normal and

malignant human B cells identifies hundreds

of novel microRNAs. Blood.

2010;116(23):e118-e127.

[32]Buchan JR, Parker R. Molecular biology. The

two faces of miRNA. Science.

2007;318(5858):1877-1878.

[33]Kuchenbauer F, Mah SM, Heuser M,

McPherson A, Ruschmann J, Rouhi A, Berg T,

Bullinger L, Argiropoulos B, Morin RD, Lai

D, Starczynowski DT, Karsan A, Eaves CJ,

Watahiki A, Wang Y, Aparicio SA, Ganser A,

Krauter J, Dohner H, Dohner K, Marra MA,

Camargo FD, Palmqvist L, Buske C, Humph-

ries RK. Comprehensive analysis of mamma-

lian miRNA* species and their role in myeloid

cells. Blood. 2011.

[34]Jazdzewski K, Murray EL, Franssila K, Jarzab

B, Schoenberg DR, de la Chapelle A. Com-

mon SNP in pre-miR-146a decreases mature

miR expression and predisposes to papillary

thyroid carcinoma. Proc Natl Acad Sci USA,

2008, 05(20): 7269–7274.

[35]Clague J, Lippman SM, Yang H, Hildebrandt

MA, Ye Y, Lee JJ, Wu X. Genetic variation in

MicroRNA genes and risk oforal premalignant

lesions. Mol Carcinog, 2010, 49(2): 183–189. [36]S?trom P, Biesinger J, Li SM, Smith D,

Thomas LF, Majzoub K, Rivas GE, Alluin J,

Rossi JJ, Krontiris TG, Weitzel J, Daly MB,

Benson AB, Kirkwood JM, O'Dwyer PJ, Sut-

phen R, Stewart JA, Johnson D, Larson GP. A

risk variant in an miR-125b binding site in

BMPR1B is associated with breastcancer pa-

thogenesis. Cancer Res, 2009, 69(18):

7459–7465.

[37]Clague J, Lippman SM, Yang H, Hildebrandt

MA, Ye Y, LeeJ J, Wu X. Genetic variation in

MicroRNA genes and risk of oral premalig-

nant lesions. Mol Carcinog, 2010,

49(2):183–189.

[38]Yang JH, Li JH, Shao P, Zhou H, Chen YQ,

Qu LH. starBase: a database for exploring mi-

croRNA-mRNA interaction maps from Argo-

naute CLIP-Seq and Degradome-Seq data.

Nucleic Acids Res. 2011;39(Database is-

sue):D202-D209.

[39]Burroughs AM, Ando Y, de Hoon MJ, Toma-

ru Y, Nishibu T, Ukekawa R, Funakoshi T,

Kurokawa T, Suzuki H, Hayashizaki Y, Daub

CO. A comprehensive survey of 3’ animal

miRNA modification events and a possible

role for 3’ adenylation in modulating miRNA

targeting effectiveness. Genome Res.

2010;20(10):1398-1410.

[40]Leung AK, Young AG, Bhutkar A, Zheng GX,

Bosson AD, Nielsen CB, Sharp PA. Ge-

nome-wide identification of Ago2 binding

sites from mouse embryonic stem cells with

and without mature microRNAs. Nat Struct

Mol Biol. 2011;18(2):237-244. Leung AK,

Young AG, Bhutkar A, Zheng GX, Bosson

AD, Nielsen CB, Sharp PA. Genome-wide

identification of Ago2 binding sites from

mouse embryonic stem cells with and without

mature microRNAs. Nat Struct Mol Biol.

2011;18(2):237-244.

新一代测序技术的发展及应用前景

2010年第10期杨晓玲等:新一代测序技术的发展及应用前景 等交叉学科的迅猛发展。 1.1第二代测序——高通量低成本齐头并进以高通量低成本为主要特征的第二代测序,不再需要大肠杆菌进行体内扩增,而是直接通过聚合酶或者连接酶进行体外合成测序¨】。根据其原理又可分为两类:聚合酶合成测序和连接酶合成测序。1.1.1聚合酶合成测序法Roche公司推出的454技术开辟了高通量测序的先河。该技术通量可达Sangcr测序的几百倍,而成本却只有几十分之一,因此一经推出,便受到了国际上基因组学专家的广泛关注。454采用焦磷酸合成测序法HJ,避免了传统测序进行荧光标记以及跑胶等繁琐步骤,同时利用乳胶系统对DNA分子进行扩增,实现了大规模并行测序。截止到2010年4月,已有700多篇文献是采用了454测序技术(http://454.com/publications.and—resources/publications.asp),对该技术是一个极大的肯定。 Illumina公司推出的Solexa遗传分析仪是合成技术的进一步发展与延伸。该技术借助高密度的DNA单分子阵列,使得测序成本和效率均有了较大改善。同时Solexa公司提出的可逆终止子”1也是该技术获得认可的原因之一。与454相比。Solexa拥有更高的通量,更低的成本。虽然片段长度较短仍是主要的技术瓶颈,但是对于已有基因组的物种来说,Solexa理所当然成为第二代测序技术的首选。2008年以来,利用该技术开展的研究大幅度上升,报道文献达400多篇(http://www.illumina.com/systems/genome—analyzer_iix.ilmn)o 1.1.2连接酶合成测序法2007年ABI公司在Church小组拍1研究成果的基础上推出了SOLID测序仪。该技术的创新之处在于双碱基编码…的应用,即每个碱基被阅读两次,因此大大减少了测序带来的错误率,同时可以方便的区分SNP和测序错误。在测序过程中,仪器自动加入4种荧光标记的寡核苷酸探针,探针与引物发生连接反应,通过激发末端的荧光标记识别结合上的碱基类型。目前SOLID3.0测序通量可达20G,而测序片段仅有35—50bp,这使得该技术与Solexa相比,应用范围还不够广泛。ABI公司正加快研发进度,争取在片段长度方面做出重大突破。 DanaherMotion公司推出Polonator¨1测序仪同样也是基于Church小组的研究成果,但是该设备的成本要低很多,同时用户在使用时可以根据自己的研究目的设置不同的测序条件。而CompleteGe—nomics公司推出的DNA纳米阵列与组合探针锚定连接测序法"1则具有更高的容错能力,试剂的消耗也进一步减少,目前已顺利完成3个个体基因组的测序工作。 1.2第三代测序——单分子长片段有望实现第二代测序技术虽然在各方面都有了较大的突破,但是仍然建立在PCR扩增的基础上。为了避免PCR扩增带来的偏差,科学家目前正在研制对DNA单个分子直接测序的第三代测序仪。最具代表性的包括Heliscope单分子测序仪,单分子实时合成测序法,纳米孔测序技术等。 Helicos技术仍然是基于合成测序原理¨…,它采用了一种新的荧光类似物和灵敏的监测系统,能够直接记录到单个碱基的荧光,从而克服了其他方法须同时测数千个相同基因片段以增加信号亮度的缺陷。PacificBioscienees公司研发的单分子实时合成测序法充分利用了DNA聚合酶的特性,可以形象的描述为通过显微镜实时观测DNA聚合酶,并记录DNA合成的整个过程。纳米孔测序技术[11’121则是利用不同碱基在通过纳米小孔时引起的静电感应稍有不同,或者不同碱基通过小孔的能力各有差异,来加以区分不同的碱基信号。 2应用与实践 Kahvejian在2008年的一篇综述中提到¨“:“如果你可以随心所欲地测序,你会开展哪些研究?”。人类基因组计划的完成和近年来高通量测序的兴起,使越来越多的科研工作者认识到,我们对于生物界的认识才刚刚起步。基因图谱的绘制并不意味着所有遗传密码的破解,癌症基因组的开展也没有解决所有的医学难题。DNA变异的模式和进化机制,基因调控网络的结构和相互作用方式,复杂性状及疾病的分子遗传基础等,仍是困扰生物学家和医学家的难题,而高通量测序的广泛应用,也许可以让我们知道的更多。 2.1DNA水平的应用 2.1.1全基因组测序新一代测序技术极大地推

纳米孔测序是极具前景的下一代测序技术

纳米孔测序是极具前景的下一代测序技术 Nanopore Sequencing 2019 - Patent Landscape Analysis 随着各种技术的新产品推出,哪些公司将在知识产权方面引领纳米孔测序? 纳米孔测序是极具前景的下一代测序技术 据麦姆斯咨询介绍,纳米孔测序是新一代测序(NGS)技术之一,被认为能够彻底革新DNA分析。随着时间地推移,目前已经开发出了不同形式的纳米孔测序技术,包括蛋白质纳米孔、固态纳米孔和复合纳米孔。该技术可以高速生成超长读数,减少样品制备时间以及将读数重组成原始序列所需要的数据处理时间。 这项新技术可以开发一个需要遗传指纹来快速识别癌症类型和病原体的全新客户群。根据DataBridge的数据,全球下一代测序市场将快速增长,市场规模预计将从2017年的48.3亿美元增长到2024年的163.5亿美元,2018~2024年期间的复合年增长率(CAGR)预计为19.2%。 目前,Oxford Nanopore Technologies是唯一一家将基于纳米孔的测序仪推向市场的公司。不过,还有其它几家公司正在开发自己的相关技术,Oxford Nanopore Technologies公司可能很快将不再是纳米孔测序仪的唯一供应商。例如,Two Pore Guys公司宣布将在2019年春季发布其产品套件。 随着新产品在未来的相继推出,了解纳米孔测序市场相关参与者的知识产权(IP)状况和策略,同时发现专利新申请人及其所带来的威胁至关重要。为此,著名市场研究机构Yole 子公司Knowmade深入调研了基于纳米孔的测序技术(蛋白质、固态和复合)及其应用(肿瘤学、植物遗传学等)中涉及的知识产权主要参与者。本报告可以帮助读者发现业务风险和机遇,预测新兴应用,支持战略决策以加强市场地位。 纳米孔测序全球专利申请趋势 对专利申请趋势的分析表明,从2008年到2013年,纳米孔测序相关的专利申请获得了重要增长。这一增长源自于学术研究团队(哈佛大学和加州大学)对纳米孔测序概念的验证。

基因测序技术的优缺点及应用

基因测序技术的优缺点及应用 随着人类基因组计划的完成,人类对自身遗传信息的了解和掌握有了前所未有的进步。与此同时,分子水平的基因检测技术平台不断发展和完善,使得基因检测技术得到了迅猛发展,基因检测效率不断提高。从最初第一代以 Sanger 测序为代表的直接检测技术和以连锁分析为代表的间接测序技术,到 2005 年,以Illumina 公司的 Solexa技术和 ABI 公司的 SOLiD 技术为标志的新一代测序 (next-generation sequencing,NGS) 的相继出现,测序效率明显提升,时间明显缩短,费用明显降低,基因检测手段有了革命性的变化。其技术正向着大规模、工业化的方向发展,极大地提高了基因检测的检出率,并扩展了疾病在基因水平的研究范围。2009 年 3 月,约翰霍普金斯大学的研究人员在《Science》杂志上发表了通过 NGS外显子测序技术,发现了一个新的遗传性胰腺癌的致病基因PALB2,标志着 NGS 测序技术成功应用于致病基因的鉴定研究。同年,《Nature》发表了采用 NGS 技术发现罕见弗里曼谢尔登综合征MYH3 致病基因突变和《Nat Genet》发表了遗传疾病米勒综合征致病基因。此后,通过 NGS 技术,与遗传相关的致病基因不断被发现,NGS 技术已成为里程碑式的进步。2010 年,《Science》杂志将这一技术评选为当年“十大科学进展”。 近两年,基因检测成为临床诊断和科学研究的热点,得到了突飞猛进和日新月异的发展,越来越多的临床和科研成果不断涌现出来。同时,基因检测已经从单一的遗传疾病专业范畴扩展到复杂疾病和个体化应用更加广阔的领域,其临床检测范围包括高危疾病的新生儿筛查、遗传疾病的诊断和基因携带的检测以及基因药物检测用于指导个体化用药剂量、选择和药物反应等诸多方面的研究。目前,基因检测在临床诊断和医学研究的应用正越来越受到医生的普遍重视和引起研究人员的极大的兴趣。 本文介绍了几种 DNA 水平基因检测常见的方法,比较其优缺点和在临床诊断和科学研究中的应用,对指导研究生和临床医生课外学习,推进临床科研工作和提升科研教学水平有着指导意义。 1、第一代测序 1.1 Sanger 测序采用的是直接测序法。1977年,Frederick Sanger 等发明了双脱氧链末端终止法,这一技术随后成为最为常用的基因测序技术。2001 年,Allan Maxam 和 Walter Gibert 发明了 Sanger 测序法,并在此后的 10 年里成为基因检测的金标准。其基本原理即双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP) 缺乏PCR 延伸所需的 3'-OH,因此每当 DNA 链加入分子 ddNTP,延伸便终止。每一次 DNA 测序是由 4个独立的反应组成,将模板、引物和 4 种含有不同的放射性同位素标记的核苷酸的ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的 DNA 片段存在于反应体系中,具有单个碱基差别的 DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取DNA 双链的碱基序列。 人类基因组的测序正是基于该技术完成的。Sanger 测序这种直接测序方法具有高度的准确性和简单、快捷等特点。目前,依然对于一些临床上小样本遗传疾病基因的鉴定具有很高的实用价值。例如,临床上采用 Sanger 直接测序 FGFR 2 基因证实单基因 Apert 综合征和直接测序 TCOF1 基因可以检出多达 90% 的

新一代测序法简介

新一代测序法简介 新一代测序方法是一种直接测序法,它既可以分析基因和DNA的组成(定性分析),也可以测定同一类型基因在表达过程中产生的数量(定量分析),以及不同类型基因或DNA 之间的差别所在(交叉对比分析)。自2004年,454测序技术发展以来,已经出现的测序产品超过六种之多。这些产品的技术特点见下表: 产家名称产品技术特点优缺点 化学反应测序方法误读率样品准备高通量程度 Roche (454 Life Science) 焦磷酸标记的链 反应 焦磷酸基 标记 <1% 较复杂,需PCR 中等 Illumina(Solexa)四色可逆终止码合成法1%—3% 较复杂,需PCR 中—高ABI(SOLID) 双色可逆终止码合成法1%—5% 较复杂,需PCR 中—高Helicos Bioscience 单色可逆终止码合成法2%—8% 简单,无需PCR 高—超高Intelligent Biosystm 四色可逆终止码合成法1%—5% 较复杂,需PCR 中—高 Pacific Bioscience 四色焦磷酸基标 记焦磷酸基 标记 3%—8% 简单,无需PCR 高 VisiGen 焦磷酸基标记 FRET 焦磷酸基 标记 3%—8% 简单,无需PCR 高 在这些技术中,从所分析的样本在测序前是否需要扩增,大致可以分为两类,即克隆扩增型和单分子测序型。两种类型在测序技术上区别并不大,但对结果的影响却有不小的差别。主要体现在两个方面:(1)单分子测序更能反应细胞或组织内分子的真实情况,尤其是在需要定量分析的情况下。而克隆扩增型中的PCR反应使得样品中DNA分子的扩增机会并不完全均等,这会对基因表达的定量分析造成影响;(2)单分子测序具有通量更高的优势。克隆扩增使得同一类型的分子数目急剧上升,在提高同类型分在在固相表面出现的几率同时,也降低了不同类型分子出现的机会。 面重点介绍Pacific Biosciences公司推出的Single Molecule Real Time (SMRT?) DNA Sequencing(单分子实时DNA测序)。 首先,在这一测序技术中有主要有两个关键的技术: 一、荧光标记的脱氧核苷酸避免了碱基的空间位阻效应。显微镜现在也无法实现实时看到“单分子”,但是它可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA 链的时候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样; 二、纳米微孔(Zero-mode waveguide (ZMW))。因为在显微镜实时记录DNA链上的荧光的时候,DNA链周围的众多的荧光标记的脱氧核苷酸形成了非常强大的荧光背景,这种强大的荧光背景使单分子的荧光探测成为不可能。Pacific Biosciences公司发明了一种直径只有10nm的纳米孔,单分子的DNA聚合酶被固定在这个孔内。在这么小的孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学

下一代测序技术

下一代测序技术 摘要:DNA测序技术对生物学的发展有着最根本的意义。Sanger法测序经过了30年的应用和发展,而在过去三年中,以454, solexa, SOLiD为代表的高通量测序平台已经大幅度降低了测序成本,提高了测序速度,成为基因组测序市场的主流。在此基础上,各种下一代测序技术正在快速研发,将使基因组测序和重测序的通量和成本更加平民化,为基因组学、遗传学、生物医学和健康科学等领域的发展创造更加广阔的前景。本文将对所有新的测序技术的原理、优势和应用进行总结和展望。 1977年Maxim、Gilbert发明的化学降解法测序技术和Sanger发明的双脱氧末端终止法测序技术不仅为他们赢得了诺贝尔奖,也使得从DNA序列层面研究分子遗传学成为可能。特别是后者,从最开始的凝胶电泳到越来越高通量的毛细管电泳,从开始的手工操作到越来越多自动测序仪的出现,各种改进的Sanger 测序技术统治了DNA测序领域三十年,至今仍在长片段测序,大片段文库测序方面有广泛的应用。人类基因组计划(HGP)的完成就是靠Sanger测序法。 在耗费了庞大成本的人类基因组计划宣布完成之后,越来越多的物种基因组测序工作对测序成本和通量提出了更高的要求,新一代测序技术(也被称为第二代测序技术)开始登上历史舞台。2005年454 life science公司率先推出了焦磷酸测序技术,使测序成本较Sanger法降低了100倍,速度快了(提高)100倍,人类基因组测序逐步进入了100,000美元时代。如今,454 FLX测序仪(Roche Applied Science)、基于“边合成边测序”的Solexa测序仪(Illumina Inc.)和使用“边连接边测序”的SOLiD测序仪(Applied Biosystems)已经成为基因组测序市场的主流机型。除此之外,2008年一年内又有HeliScope单分子测序仪(Helicos)和Polonator(Dover/Harvard)两种测序机型商品化。 在NHGRI(美国人类基因组研究中心)的支持和推动下,未来几年内测序成本将在目前基础上再下降100倍,最终使个人基因组测序成本降至1000美元,人类将革命性的进入个人基因组时代。高通量和低成本的测序技术将进入到普通实验室,基因组测序的简单化将使分子生物学飞跃发展,个人基因组测序产业化也将对健康医学等领域产生革命性的影响。本文将首先对目前已经商品化的新一代测序技术(454、Solexa、SOLiD、HeliScope)做一介绍和比较,再对正在研发中的各种下一代测序方法(第三代测序技术)的原理和应用做一详细的介绍和展望。 1. Roche 454测序技术 2005年454生命科学公司在《自然》杂志发表论文,介绍了一种区别于传统Sanger法的全新高通量测序方法,将测序成本降低了100倍以上,开创了第二代测序技术的先河,454测序仪也成为最先商品化的第二代测序仪。正是在此基础上,其它如Solexa、SOLiD等第二代测序仪才相继问世。454测序技术的原理在于首先使用乳液PCR(emulsion PCR)技术(图一a)扩增已经连接上接头的基因组文库片段,扩增子结合在28 μm的磁珠表面,将乳液破坏后用变性剂处理磁珠,再将含有扩增子的磁珠富集到芯片表面,用测序引物进行测序。在测序过程中,454使用了一种“焦磷酸测序技术”(Pyrosequencing),即在合成DNA 互补链的过程中,每加入一种单核苷酸(dNTP),如与模板链配对结合,就会释放出一个焦磷酸,与底物腺苷-5’-磷酸硫酸(APS)在A TP硫酸化酶作用下合成A TP,与荧光素(Luciferin)一起在荧光素酶(Luciferase)的作用下,会发出一个光信号,由芯片背后连接的电荷耦合装置(CCD,Charge Coupled Device)捕捉。454测序技术合成DNA链使用的是普通单核苷酸,没有任何标记,合成中也没有切割基团等生化反应,因此读长可以达到300-400bp。但没有阻断(block)和去阻断(de-block)过程也意味着对连续重复单核苷酸的阅读只能根据信号强度来判断,容易对其中插入和缺失碱基阅读错误。454测序技术相比较其他第二代测序技术如Solexa和SOLiD, 在读长上有着巨大的优势,但是目前成本要略高。总体而言,高读长使得454技术比较利于De Novo拼接和测序。

新一代DNA测序技术总览

作者:尹银亮、陈会平、毛良伟译来源:生物谷 原文刊登于《分析化学》综述Analytical Chemistry 原文标题:Landscape of Next-Generation Sequencing Technologies 索引信息:https://www.doczj.com/doc/d99067940.html,/10.1021/ac2010857 | Anal. Chem. 2011, 83, 4327–4341 原文作者:Thomas P. Niedringhaus, Denitsa Milanova, Matthew B. Kerby, Michael P. Snyder,and Annelise E. Barro 译者资料: 尹银亮,香港华大基因研发中心有限公司email:stevenyinbio@https://www.doczj.com/doc/d99067940.html, 陈会平,毛良伟,武汉华大基因科技有限公司 【内容】 第二代测序 第二代测序成本 第三代测序技术 单分子测序法 边连接边测序法 边合成边测序法 纳米孔测序技术 蛋白质纳米孔测序法 固态纳米孔测序法 长距离阅读DNA的扩展方法 总结性评论 DNA测序正处在技术上天翻地覆剧变的阵痛之中,其突出特点是,测序通量(测序数据量)的大幅增长,原始数据中每个碱基的测序成本急剧下跌,并伴随着以巨资购买仪器以引进新技术的需求。以前看似高不可攀的奢侈性研究活动(如个人基因组测序,宏基因组学研究,以及对大量重要物种的测序),在短短几年之间,正以急速的步伐而变得越来越切实可行了。本篇综述将集中讨论在第三,第四代测序方法背后的故事:它们所面临的挑战;各种方法的局限性;以及它们带给我们的充满诱惑的前景。 第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 在1977年,桑格测定了第一个基因组序列,是噬菌 体X174的,全长5375个碱基。其测序方法和历史过程以前已做过详细回顾。 后来的四色荧光桑格测序法(每一种荧光代表四种碱基中的一种)被用在自动毛细管电泳测序系统中,此系统由应用生物系统有限公司(Applied Biosystems Inc.)推上市场,后来该公司被整合入生命技术公司(Life Technologies)和贝克曼.考尔特公司(Beckman Coulter inc.)(见表1)。发表于2001年的第一个人类基因组

下一代测序工作流程自动化

下一代测序(NGS)彻底改变了基因组学研究领域,使全基因组测序比以往任何时候都更有效率。然而,典型的NGS工作流程是鲜有革新的,因为它面临许多手动操作步骤和来自成本、通量以及结果变异性的诸多挑战。传统的样品制备和数据分析方法非常耗时,并更易出错。 针对这些挑战,自动化技术为此提供了相应的解决方案,并通过减少样品间变异提高了最终数据的精准度。然而,为您的NGS工作流程选择适合的自动化设备是一个复杂的过程。为了给您的实验室配备最佳的自动化整合系统,首先要对以下的四个因素进行评估,然后再作出决定: ? 自动化将如何影响您的实验流程? ? 您可选的自动化方案有哪些? ? 需要多少培训? ? 您的自动化解决方案是否需要扩展,以满足未来的需求?

Ilumina文库构建杂交选择和靶向捕获簇扩增和测序Ilumina文库构建杂交选择和靶向捕获簇扩增和测序

图3,高通量PCR纯化自动化工作流程 您是否在纯化时使用真空泵和离心过滤?图3描述了一个中高通 进一步加速:靶标富集技术 量的自动化工作流程图。 基于磁珠技术的靶标富集方法,比如SureSelect靶标富集 试剂盒和SureSelect人全外显子试剂盒,能使您仅对感兴 趣的基因片段测序,提高了几个数量级的实验效率。这些操 作很容易实现和高度扩展,凸显出Bravo自动化液体处理 平台的速度和精度的优势。

如果您的实验室需要更高的通量,您可考虑增加一个更全面的自动化系统。安捷伦BenchCel 微孔板工作站是一个灵活的、可扩展的、通量可媲美大型系统的紧凑桌面式平台。由市面上最灵活和调度高效的安捷伦VWorks 软件控制,BenchCel 工作站可用于复杂的和简单的应用流程,比起传统的手动操作方法能提供更长的无人值守时间和更大的通量。 对于超高通量、高生产率的实验室,您可能需要放弃桌面型系统。安捷伦独立的BioCel 自动化系统基于一个易于定位的直驱机械臂(DDR)。这种高度灵活的系统能与安捷伦其它自动化模块,或第三方设备组合形成定制系统,以满足您实验室的需要。 自动化方案的选择 想一想您实验室的整个工作流程。有各种不同的自动化解决方案——从垂直移液工作站到BenchCel 工作站再到BioCel 系统,可以满足不同的通量需求。自动化将提高实验数据的准确性和一致性——您是否需要一个完全无人值守的自动化解决方案?安捷伦拥有一系列的自动化设备可供选择,以适应不同实验室的需要。安捷伦的Bravo 自动液体处理平台具有宽量程的高精度移液性能、兼容不同类型微孔板的灵活性以及独特的开放式设计,易于整合到其他的自动化工作流程中。结合Bravo 自动化液体处理平台可以大大减少样品制备和检查下一代测序文库质量所花费的时间,并通过减少样本间变异提高了数据质量。 图4. 桌面型选择: A .Bravo 自动化液体处理平台 B .BenchCel 微孔板操作工作站独立的高通量系统:C. BioCel 系统 A B C

下一代DNA测序技术研究进展综述

深度DNA测序技术在基因组测序中的研究策略和进展 摘要:回顾了经典DNA测序技术原理,重点阐述了深度测序技术在基因组测序中的研究策略,并结合目前比较常见的二代测序仪来分析比较相互之间的特点和优势,最后,对即将到来的三代测序法的研究进展给予了简单的介绍。 关键词:深度DNA测序基因组测序仪 DNA测序技术的发展过程漫长而艰辛,然而,我们现在获取的大部分DNA序列信息还是依靠基于Sanger在1977年建立的“DNA双脱氧链末端终止测序法”的DNA测序技术获得的。另外就是Maxam和Gilbert建立的“化学降解测序法”。在过去的七年当中,DNA测序技术的发展至少受到来自四个方面的影响:首先是人类基因组计划的出现,这项计划的实施过程中,科学家们面临了巨大的经费问题,因为传统的Sanger测序法无论怎么优化,都无法大幅度降低测序的成本,这很大程度促进了人们对在测序过程中如何降低成本的技术方面的研究。第二,人类以及其他主要模式生物参考序列数据库的建立使得短片段阅读(short-read)成为可能,这极大的促进了短片段测序技术的发展。第三,新型分子生物学技术的不断涌现导致了越来越多的诸如RNA表达染色体构象等生物现象的出现,这就需要有高通量DNA测序手段去解释这些问题,这也极大的促进了新型测序技术的发展。第四,其他学科领域的技术的发展,例如计算机技术,数据存储及分析技术,聚合酶工程技术等,极大地支持了DNA测序技术的应用。本文主要是对目前新一代DNA测序(也叫深度测序)技术(Next-generation DNA sequencing technologies)的研究策略及目前国际DNA测序最新进展做一简要的综述。 1.Sanger测序法 先来回顾一下经典的DNA测序法,从上世纪九十年代早期开始,几乎所有的DNA测序都是利用半自动化的毛细管电泳Sanger测序技术完成的(图1-a)。后来出现了高通量测序法,这种方法首先要对DNA预处理,获取大量的待测序模板即质粒或PCR产物。然后在测序一种发生测序生化反应,这个过程会产生大量长短不一(因为终止位点不一样),末端被荧光标记的延伸产物。再用分辨率高的毛细管凝胶电泳分离这些延伸产物,通过对延伸产物末端四种不同荧光颜色的区分,利用计算机软件自动“读

下一代测序技术的内容概览

下一代测序技术的内容概览 高通量DNA测序技术(下一代测序技术NGS)在过去的15年里已经有了快速的发展,新的方法也在继续实现商业化。随着技术的发展,对基础和应用科学中的相关应用范围也在增加。这篇综述的目的是提供一个对NGS方法论的概述以及相关的应用。每个简要的讨论之后都跟有制造商和基于网页的可视化。关键词搜索,例如用Google,可能也会提供有帮助的网页链接和信息。 方法的建立 DNA测序方法的建立是Sanger双脱氧合成法以及Maxam-Gilbert的化学裂解法。Maxam-Gilbert化学裂解法是基于DNA的化学修饰然后在邻近修饰过的核苷酸附件的位点进一步裂解DNA骨架。Sanger测序采用了特殊的链终止核苷酸(双脱氧核苷酸),它缺少一个 3‘OH连接位点。因此,不能够在DNA聚合酶的作用下合成磷酸二酯键,结果是正在伸长的DNA链在该位置终止了。双脱氧核苷酸是具有放射性的或者具有荧光标记的,便于分别在测序凝胶或者自动测序仪器上识别。尽管原始的Maxam-Gilbert方法的化学特性已经被进行修饰来帮助消除有毒性的反应物,但是Sanger测序通过合成双脱氧核苷酸的方法已经变成了一种测序的标准。 Sanger测序法在1977年被创建,并且在UNIT7.4中被详尽的描述了。尽管通过当前NGS 标准测序相对较慢,但是在Sanger末端终止法的改进,自动化,以及商业化这些方面已经使它能够在当前的多种应用范围中成为最适当的测序方法。特别的,超薄的凝胶板电泳已经被多通道毛细血管电泳代替了,逐渐还出现了自动填充可循环的毛细血管以及电动样品加样,这对提高Sanger测序过程的速度与便利性有很大的贡献。在Sanger测序中已经出现的最显著的创新点有:(1)荧光染色的发展,(2)采用末端循环测序降低所要求的输入DNA的质量并且用耐热聚合酶高效准确的将终止物染色与正在伸长的DNA链结合起来,(3)解释和分析序列软件的发展。在自动化的Sanger测序项目中的主导者是Applied Biosystem(AB)。当前商业化的AB测序仪全部使用的是荧光染色和毛细管电泳(CE)。用于DNA测序或者片段分析协议的机器的容量在发生改变,4组毛细血管(SeqStudio Genetic Analyzer),8到24组毛细管(3500 Series Genetic Analyzer),以及48到96组(3700 Series Genetic Analyzer)。所以的这些测序仪产生了600-1000个碱基的正确的序列。尽管多年以来,不同种类基于Sanger测序的测序仪器已经被引进,包括来自Licor,Amersham,MilliGen,Perkin Elmer 和Dupont,所以的这些除了AB仪器都已经被停产了。 Sanger测序技术在一些应用中任然非常有用,而这些应用中高通量测序是不被要求的。一些DNA测序的核心设备和以测序来获利的公司提供了Sanger测序服务。对于个体测序反应对公共的用法是在一个特殊的模板上用特殊的DNA引物,例如去检验质粒的构建和PCR 产物。既然来自大量的商家的用于DNA纯化的分子生物试剂盒和试剂以及相对较高质量的合成产物都是可用的,这就使得甚至是相对较大的Sanger测序项目都能够在合理的时间框架和成本范围内完成。 除了检测DNA的序列AB仪器上的毛细管电泳(CE)还被应用到测量酶对基于荧光标记的DNA底物的选择活性,列如,可以分析DNA片段的大小。毛细管电泳同样能够用来同时分析一个单反应中的多个底物,产物或者反应介质,通过不同的荧光标记。CE被用在DNA 聚合酶和DNA连接酶动力学,以及包括冈崎片段和核糖核苷酸的删除修复的偶联酶通路的研究中。AB CE在在糖生物学中也是很有用的,可以用来分析荧光标记的多糖。 第二代测序方法 术语“下一代”隐含着DNA测序技术发展的下一步,同时也表明将会产生一个以下一代命名的新技术。我们更喜欢用下一代,第三代等这些术语,因为我们意识到上述的自动化的

新一代测序技术研究内容

新一代测序技术研究内容 新一代测序技术不仅仅是生命科学基础研究的重要工具,它即将发展为一个新型的巨大产业群,彻底改变生命科学相关产业和医学的发展模式,并给人类社会带来不可估量的巨大影响。 该技术主要包括基因组学、转录组学、表观组学三个方面的研究。 (1)基因组学 基因组学,或称基因体学,是研究生物基因组和如何利用基因的一门学问。该学科提供基因组信息以及相关数据系统利用,试图解决生物、医学和工业领域的重大问题。此外,基因组学能为一些疾病提供新的诊断和治疗方法,有助于医生获得更多的治疗信息并进行个性化医疗。同时,基因组学还被用于食品与农业部门。 在新一代测序技术中,基因组学方面主要包括以下八个方面的测序研究: ①全基因组从头测序 从头测序即de novo测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;并为后续的基因挖掘、功能验证提供DNA序

列信息。 ②全基因组重测序 随着测序成本降低和已知基因组序列物种增多,全基因组重测序已经成为动植物育种、群体进化、药物研发、疾病研究和临床诊断中最为迅速而有效的方法之一。全基因组重测序是对基因组序列已知物种的个体进行基因组测序,并在个体或群体水平进行差异性分析的测序方法。在全基因组水平上扫描并检测与生物体重要性状相关的突变位点,具有重大的科研价值和产业价值。 ③外显子测序 外显子测序是指利用序列捕获技术将探针能覆盖到的全基因组外显子区域DNA捕捉并富集后再进行高通量测序的基因组分析方法。该方法能够获得指定外显子捕获平台探针设计区域及侧翼200bp序列的遗传信息,极大地提高了人类基因组中外显子区域的研究效率,显著降低了研究成本。目前主要用于识别和研究与疾病、种群进化相关的编码区及UTR区域内的结构变异。 ④目标区域测序 目标区域测序是指利用特制的探针对客户感兴趣的蛋白编码区域DNA或某段特定序列进行捕获,富集后进行高通量测序的基因组分析方法。该方法能够获得指定目标区域的遗传信息,极大地提高了基因组中特定目标区域的研究效率,显著降低了研究成本。通过目标区域测序,可以对候选位点或候选基因进行验证,也可以进一步找到候选区域或候选基因内的易感位点,适用于候选基因关联分析等研究。

新一代高通量测序技术SOLiD简介

新一代高通量测序技术SOLiD简介 目前市场上有四种高通量测序仪,分别是Solexa,454 (GS-FLX),SOLiD和Polonator。根据测序原理,它们可以被分为两大类:使用合成法测序(Sequencing by Synthesis)的Solexa和454,及使用连接法测序(Sequencing by Ligation)的Polonator和SOLiD。这些高通量测序仪的共同点是不需要大肠杆菌系统进行DNA模板扩增,且测序所得序列较短:其中的454序列最长,为200~300个碱基,其余三种序列都只有几十个碱基。测序原理及序列长度的差异决定了各种高通量测序仪具有不同的应用领域。这就要求我们在熟悉各种高通量测序仪内在技术特点的基础上进行选择。 基因组所引进的SOLiD (Sequencing by Oligonucleotide Ligation and Detection)是ABI(Applied Biosystems)公司生产的高通量测序仪。目前这台SOLiD运行稳定,SOLiD实验及数据分析小组也可以为大家提供专业的技术服务。所以接下来的关键是如何把SOLiD测序仪应用到符合其技术特点的科研项目中。本短文将简单介绍SOLiD测序流程,双碱基编码原理及数据分析原理,以帮助大家了解SOLiD测序仪的技术特点和应用范围。 1.SOLiD关键技术及其原理 SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。 1.1. SOLiD文库构建 使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。简单地说,制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD 接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。 1.2:油包水PCR 我们知道,文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面(SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。 油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR 反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。A BI公司提供的SOLiD 实验手册已经把小水滴体积及水相中DNA模板和磁珠的个数比等重要参数进行了技术优化和流程固定,尽可能提高“优质小水滴”(水滴中只含一个DNA模板一个P1磁珠)的数量,为后续SOLiD 测序提供只含有一种DNA模板扩增产物的高质量P1磁珠。

新一代测序技术组装拼接软件velvet使用简介

新一代测序技术组装拼接软件velvet使用简介 目前用于新一代的测序的主要仪器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它们都能高通量的测序,产生大量的测序结果,接下来就要对序列进行拼接,用于拼接的软件也有很多,比如velvet、soap、abyss、maq等,454的还有专门的newbler。平时用velvet比较多,就简单介绍一下。 velvet对短序列的拼接效果比较好,所以多用于对Illumina等产生的短序列片段进行组装拼接。下面以Illumina的GAII产生的结果为例进行说明。 一、单端测序 单端测序可以直接对fastq格式的原始文件进行处理,首先是用velveth 命令建立hash表子集 输入./velveth会出来使用帮助: Usage: ./velveth directory hash_length {[-file_format][-read_type] filename} [options] directory : directory name for output files hash_length : odd integer (if even, it will be decremented) <= 75 (if above, will be reduced) filename : path to sequence file or – for standard input File format options: -fasta -fastq -fasta.gz -fastq.gz -eland

一代至四代测序技术详细讲解

一、我们将如何应对海量的基因信息 新一代测序技术带给人们大量遗传信息的同时,却成为限制其广泛应用的一个障碍。 1980年,英国生物化学家Frederick Sanger与美国生物化学家Walter Gilbert建立了DNA测序技术并获得诺贝尔化学奖,至今已有近三十年了。在这三十年,DNA测序技术取得了令人瞩目的进展。目前已进入市场的循环阵列测序平台采用的是与Sanger生物化学测序方法完全不同的原理。在过去几年,应用极为广泛的毛细管电泳测序法采用的则是多线并行阵列格式,它运用尖端的荧光成像技术进行碱基识别。上述各类新技术为生物学研究领域开辟了新的视角,也使实验研究达到一个新的水平。学界对开发这类新技术的兴趣持续高涨,与此同时,人们却发现这些技术存在一定的不足——大量信息数据的产生限制了技术更加广泛的应用,并降低了其市场价值。 过去,研究人员使用Applied Biosystems(ABI)公司的3730XL毛细管电泳测序仪进行基因分析,每年至多能完成六千万碱基的测序量。随着测序技术日新月异的发展,这种情况已经成为历史。在2005年刚刚开始进行新一代测序技术开发时,Roche公司和454公司联合开发的焦磷酸测序仪的分析速度就已经达到了上述提及的ABI仪器速度的50倍之上。也就是从那时起,因基因数据过多而产生的问题凸显了出来,而且这个问题随着其他制造商开发出更多更快的测序仪而愈加严重。举个例子,ABI的新一代测序平台SOLiD(supported oligonucleotide ligation and detection)单次运行,便可以分析6Gb的碱基序列;而Roche/454测序仪单次运行可以将上述结果转换成12-15个千兆字节(gigabytes)的数据信息;Illumina Genome Analyzer(GAII)测序系统仅在两个小时的运行时间里,就得到10兆兆字节(terabytes)的信息。尽管对于像Applied Biosystems这样的制造商而言,可以为用户提供高达11.25TB的存储量,但对于多数实验室所具有的信息管理系统来说,规模如此庞大的数据信息,就好像是迎面而来的洪水,让人感到难以控制。 过量信息所带来的一个副作用在于,用户无法将初始图像数据进行分类存档,而必须交给相关公司,利用软件对数据进行读取,然后才能对数据进行保存。对于大多数研究人员来说,像这样在每次实验后对原始数据进行处理的方式既繁琐又不经济。与花费上万美元对每一段序列进行备份分析相比,对每一次测序结果进行重新测定显然是一个更简单、更便宜的选择。测序仪制造商称,对原始数据再次进行分析并不能得到更多新的信息。但是,对于454测序仪而言,用户至少可以通过更新的软件从原始数据得到质量更高的序列,从而提高碱基识别分辨率,减少误差。 除数据处理问题之外,研究人员还需要拥有一个足够强大的计算机平台,以便将来自多个测序技术的短小基因片段进行组合,形成基因组外显子。目前问题在于,测序仪生产商仅仅提供用于某些特定基因信息分析的软件,如靶标重测序、基因表达分析、染色质免疫沉淀反应或基因组从头测序等,而并未提供任何其它类型的下游生物学信息分析软件。研究界越来越熟悉这些测序平台对循证生物学的巨大潜力,这也就产生了新的研究问题以及全新类型的试验方法,而这单凭依赖目前的生物学信息是无法满足的。 从这个角度看,SOLiD软件研发公司(https://www.doczj.com/doc/d99067940.html,/gf/)于今年七月刚刚兼并了两个新的软件公司,这一举动无疑朝正确的方向迈进了一步。该公司在开放源码许可证下开发软件分析工具,目的就是为了给生物信息学领域提供支持,并为其开发新的算法。 对用户而言,如果能够将数据格式与不同测序平台获得的结果进行比较所得的统计数字进行标准化,无疑具有重大的意义。特别是由于目前以测序平台为核心的市场竞争激烈,因此每个生产商都努力提供最好的数据结果。

高通量测序:第二代测序技术详细介绍

在过去几年里,新一代DNA 测序技术平台在那些大型测序实验室中迅猛发展,各种新技术犹如雨后春笋般涌现。之所以将它们称之为新一代测序技术(next-generation sequencing),是相对于传统Sanger 测序而言的。Sanger 测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是相当慢。十三年,一个人类基因组,这显然不是理想的速度,我们需要更高通量的测序平台。此时,新一代测序技术应运而生,它们利用大量并行处理的能力读取多个短DNA 片段,然后拼接成一幅完整的图画。 Sanger 测序大家都比较了解,是先将基因组DNA 片断化,然后克隆到质粒载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质粒DNA。每个循环测序反应产生以ddNTP 终止的,荧光标记的产物梯度,在测序仪的96或384 毛细管中进行高分辨率的电泳分离。当不同分子量的荧光标记片断通过检测器时,四通道发射光谱就构成了测序轨迹。 在新一代测序技术中,片断化的基因组DNA 两侧连上接头,随后运用不同的步骤来产生几百万个空间固定的PCR 克隆阵列(polony)。每个克隆由单个文库片段的多个拷贝组成。之后进行引物杂交和酶延伸反应。由于所有的克隆都是系在同一平面上,这些反应就能够大规模平行进行。同样地,每个延伸所掺入的荧光标记的成像检测也能同时进行,来获取测序数据。酶拷问和成像的持续反复构成了相邻的测序阅读片段。

Solexa高通量测序原理

--采用大规模并行合成测序法(SBS,Sequencing-By-Synthesis)和可逆性末端终结技术(ReversibleTerminatorChemistry) --可减少因二级结构造成的一段区域的缺失。 --具有高精确度、高通量、高灵敏度和低成本等突出优势 --可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究 ----将接头连接到片段上,经PCR扩增后制成Library。 ----随后在含有接头(单链引物)的芯片(flowcell)上将已加入接头的DNA片段变成单链后通过与单链引物互补配对绑定在芯片上,另一端和附近的另外一个引物互补也被固定,形成“桥” ----经30伦扩增反应,形成单克隆DNA簇 ----边合成边测序(Sequencing By Synthesis)的原理,加入改造过的DNA 聚合酶和带有4 种荧光标记的dNTP。这些dNTP是“可逆终止子”,其3’羟 基末端带有可化学切割的基团,使得每个循环只能掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA 片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。 Roche 454 测序技术 “一个片段= 一个磁珠= 一条读长(One fragment =One bead = One read)”1)样品输入并片段化:GS FLX 系统支持各种不同来源的样品,包括基因组DNA、PCR 产物、BAC、cDNA、小分子RNA 等等。大的样品例如基因组DNA 或者BAC 等被打断成300-800 bp 的片段;对于小分子的非编码RNA 或者PCR 扩增产物,这一步则不需要。短的PCR 产物则可以直接跳到步骤3)。 2)文库制备:借助一系列标准的分子生物学技术,将A 和B 接头(3’和5’端具有特异性)连接到DNA 片段上。接头也将用于后续的纯化,扩增和测序步

相关主题
文本预览
相关文档 最新文档