您好,欢迎来到划驼旅游。
搜索
您的当前位置:首页转录组与RNA_Seq技术_张春兰

转录组与RNA_Seq技术_张春兰

来源:划驼旅游
生物孩术通报#技术与方法#BIOTECHNOLOGYBULLETIN2012年第12期转录组与RNA一eSq技术张春兰-,/秦孜娟,王桂芝/纪志宾2王建民/(.潍坊学院生物与农业一1程学院,潍坊261061;2山东农业大学动物科技学院,泰安271018)摘要:转录组是特定细胞或组织在特定时间或状态下转录出来的所有RNA的集合\"通过对转录组的研究可以揭示生物体的基因表达!研究结构变异及发现新基因等\"转录组分析的研究方法!研究平台发生着日新月异的变化,同时生物信息学分析的内容也在逐渐完善\"RNA一Seq作为一种新的转录组研究手段,利用新一代测序技术能够更为快速!准确地为人们提供更多的生物体转录信息\"主要比较近年来转录组研究的几种方法和几种RNA一Seq的研究平台,并着重介绍RNA一Seq的原理!用途!步骤和生物信息学分析等及在相关领域的应用等内容,为相关的研究和应用提供参考\"关键词:转录组RNA一Seq新一代测序技术TranscriPtomeandRNA一SeqTechnologyzhangehunlan-0Qinzijuan,wangGuizhi,JiZhibin,wangJianmin,(.召101卿\"耐Agnculture加titut\"fo俄扣鳍Un,rsi妙,热扣鳍261061;认nimalSeie二e加tituteofshanod鳍A卯eulturalUn动ersir了,Taian271018)Abstraet:Thetranseriptome15theeompletesetoftranseriptsforeeriaintypeofeellsortissuesinaspeeificdeveloPmentlastageorphysiolo乡ealeondition.Transe行ptomeanalysiseanrevealtheorganism-5geneexpressinglevel,strueturalvairation,diseove耳ofnew罗nes.TheerseacrhmethodsandplatofrmsoftranseriPtomeaerunde嗯oingrapidehanges.Andbioinofrmatiesanalysis15alsoimprovedgrdaualy.RNA#Seqasanewreseacrhmethod,iteanbemorequieklyandaf(f2drmoreaeeuratetranseriptome.5informationwhileusingtheNext一generationSequeneing(NGS)teehnolo幻.Thisartieleeomparesseveralmainmethodsandplatformsoftranseriptomeinreeentyears,andreviewtheprineiple,puroPse,steps,bioioofmraties.analysisandapplieationsinrelatedfieldsofRNA一Seq.Thiswillbea任2drusefulrefereneeforrelatedresean{h.Kevwords:Transe五ptomeRNA一seqNext一generationSequeneing(NGS)teehnolo群在人类基因组项目后,转录组学!蛋白组学和常指所有mRNA的总和川\"本文以下的说明以狭义代谢组学等组学不断涌现,生命科学的研究已经跨RNA一Seq为主\"人后基因组时代\"其中,转录组学作为一个率先发与基因组不同,转录组更具有时间性和空间性\"展起来的学科是研究细胞表型和功能的一个重要手例如,人体大部分细胞具有一模一样的基因,而即段,是研究基因表达!基因结构和功能的一个新型使同一细胞在不同的生长时期及生长环境下,其基的研究方向\"因表达情况也是不完全相同的\"所以,除了异常的所谓转录组广义上是指生物体细胞或组织在特mRNA降解现象(如转录衰减)以外,转录组反映定状态下所转录出来的所有RNA的总和\"RNA包的是特定条件下活跃表达的基因\"括编码蛋白质的RNA(即mRNA)和非编码蛋白质1研究转录组的基本方法的RNA(ncRNA,如rRNA!tRNA!mieroRNA等)目前研究转录组的方法主要有:(l)基于杂交而mRNA似乎更引人关注,所以狭义上的转录组通技术,如CDNA芯片和寡聚核昔酸芯片;(2)基于收稿日期:2012一60一40基金项目:山东省农业良种工程重大课题(2011186)作者简介:张春兰,女,博士研究生,研究方向:动物遗传育种与繁殖;E一mali:lanchunzhang@126.com通迅作者:王建民,男,博士生导师,研究方向:羊品种资源保护;E一mali:wan自m@sdau卫du.cn峨物杖术通推Btotechn口勿群B/leha2012年第12期测序技术,如早先基于Sange:测序的SAGE(SerialAnalysisofGeneExpression)和MpSS(Massivelypara-代测序技术\"新一代测序技术较sange:测序技术通量更高!运行时间更短!测序片段更长\"现在通常将基于第二代测序技术的转录组测序分析称为RNA-eq\"3种主要的转录组研究方法的比较,见表1\"S其中RNA一Seq具有以下优势:(l)通量高\"运llelSignaturesequeneing)!全长\"DNA文库和EST文库的测序分析\"现在对CDNA!EST等的测序工作已升级为第二表1技术原理三种转录组研究方法的比较[22芯片杂交SAGE/MPSScDNA尼ST/sanger测序RNA一Seq高通量测序信号分辨率通量荧光模拟信号数个一100饰高数字化信号单碱基低数字化信号单碱基高背景噪声分析成本起始RNA用量同时映射转录区域和基因表达高高多是低高多有限的基因表达低低少是能够区分不同的亚型能够区别等位基因表达有限有限是是是是用第二代测序平台可得到几个到几百亿个碱基序列,可以达到覆盖整个基因组或转录组的要求;(2)灵敏度高\"可以检测细胞中少至几个拷贝的稀有转录区域[.,4JO2RNA一Seq测序平台angSer等于20世纪70年代发明的双脱氧测序本;(3)分辨率高\"RNA一Seq的分辨率能达到单个碱基,准确度好,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题;(4)不受性\"可以对任意物种进行全转录组分析,法在过去的30多年中一直在DNA测序领域占据着主要地位\"虽然技术在不断改进,但要进行大规模测序其价格还是比较昂贵\"同时传统方法测序的速度慢,获取的信息量小,远远满足不了目前研究的需要\"而RNA一Seq测序平台突破传统测序技术,为无需预先设计特异性探针,能够直接对任何物种进行转录组分析\"同时能够检测未知基因,发现新的基因组和基因的测序研究提供了有效手段\"表2为近年来发展的几种主要测序平台比较\"转录本,并准确地识别可变剪切位点及SNP!UTR表2平台测序原理IlluminaISolexaCAlx几种主要测序平台的比较1.2ABUS()LIDSOUD3HelieosHeliseo伴Roheel4CSFLX可逆染料终结合成测序1oo一2焦磷酸合成测序5oo一60299连续测序50一229994单分子合成测序35一l平均读长(bp)每Mb费用($)准确率(%)主要错误类型运行时间(d))98一9997一99一8替换4插人!缺失0.35替换7缺失8优点缺点性价比高;目前应用最广泛读长短读长最长;运行速度快准确率最高读长短;运行时间长产量高;文库制备简单,不需要DNA扩增或连接失误率高费用最高现在lllumina公司生产Miseq!Hiseq2000测序平台在国内也广泛被应用,现将其各种测序平台比较,见表3\"其中MISeq因其售价便宜!占地面积小!测序速度快而被称为个人型测序系统,实现了2012年第12月泪张春兰等:转录组与RNA一Seq技术表3Iuumina公司JL种测序平台的比较1/]HISeqZ以洲2以X)GbHISeq10以>35洲2Gb平台最大产量单个读取末端配对读取袅nomeAnalyzonx95GbHISeanSQ150GbMISeq>1Gb共3.2亿个4(洲刃万个/通道共6一4亿个8侧洲2亿个/通道2x150bP共30亿个1.87亿个/通道共60亿个3.74亿个/通道2xl0)(bP共巧亿个1.87亿个/通道共30亿个3.74亿个/通道2xl图bP共75亿个9粼洲2万个/通道共巧亿个188亿个/通道2xl()饰X共340万个34D万个/通道共680万个680万个/通道2x150bP读长许多普通实验室的测序梦想,让新一代测序触手可及\"而Hiseq系列测序系统由于其一次测序数据量大,通道多,更适合于多个样品同时测序\".....................................AAAAAA3RNA一Seq的主要用途RNA一seq技术能够在单核昔酸水平对特定物种的整体转录活动进行检测,从而全面快速地获得该物种在某一状态下的几乎所有转录本信息\"由于转录组测序可以得到全部RNA转录本的丰度信息,加之准确度又高,使得它具有十分广泛的应用领域\"主要应用于:(l)检测新的转录本17,.2,包括未知转录本和稀有转录本;(2)基因转录水平研究,如基因表达量!不同样本间差异表达19,.\"2;(3)非编码区域功能研究,如mieroRNA仁02!非编码长RNA(IneRNA)[0]!RNA编辑[0]:(4)转录本结构变异研究,如可变剪接仁4,0了.!基因融合[.-,-,];(5)开发SNps和ssn等[,8,,,2\"........................{反转录合成双链cD-街熬狱撼魏A八冉人李韶Trr>,形奥终鑫脚{D一序接头连-........T一热A....llll.........A粉一姗然议T.....{TAPCR扩增测序文库月-~~-杯~A111......渊涕T.....1呻一一争{一一一卜深度测序4RNA一eq的原理及基本步骤S提取样本总RNA后,根据所测RNA种类进行............T..........户.一~)户寨一份A......瓣安T1...11...分离纯化\"再进而片段化为所用测序平台所需的长度(或反转录后片段化),反转录后连接测序接头\"接着利用PCR扩增达到一定丰度上机测序,直到获得足够的序列\"所得序列通过与参考基因组比对或从头组装(denovoassembling)形成全基因组范围的转录谱\"试验流程,如图1所示\"{图像识别~一一一一一争mRNA序列信息零酬奎黎翁越韶撇彝移啥奏舞琴炙孤舞黎姿烤澎翻媒参港蒙撼图1RNA一eq试验流程5.15生物信息学分析及在相关领域的应用由测序仪产生的图像信息经过hasecailng处理有参考基因组的比对分析及应用选择已经公布的相同或相近物种的基因组和基因信息为参考,将所测数据mapPing至参考基因组的数据中,进行比对分析\"5.1.1基因的结构优化分析通过read,在基因组上的分布!末端配对信息以及现有基因注释结果,对基因结构进行延伸优化!5,3,边界鉴定及UTRs区l域鉴定\"ehen等1.o]利用Illumina测序平台对白色转换成碱基序列\"对原始测序数据进行初步处理(去除污染序列)后,然后将低质量:eads去掉(如果一个reads中存在5个以上不能识别的碱基则认为其为低质量的reads)\"对于mRNA的生物信息学分析接下来如下有两种处理办法\"生物技术通报刀toteehnolo舒刀ule点nl2012年第12期杜洛克与二花脸杂交F:代猪的肝脏!背最长肌和腹脂进行RNA一Seq分析,对所得587一8巧个基因的5-末端延伸至少50bp长,对所得10一1375个基因的3.端延伸至少50帅,并且对其中411一672个基因的两端都作了延伸处理\"zhang等[川水稻的8种不同组织利用IluminaGA测序平台进行RNA一seq分析,对所得注释基因的5.端进行了UTR分析,预测mRNA起始密码子上游的开放阅读框架约需ro-0b5P长的序列\"5.1.2预测新基因现有数据库中对转录本的注释可能还不全面,通过reads的分布以及基因注释集合,在基因组上发现新基因\"J纯er等!.2比较了绵羊的正常组和骨延迟愈合组的基因表达谱,与绵羊基因组比对后发现了12431个新的转录本\"Huang等[-2比较了不同发育时期牛胚胎的转录本,与牛基因组比较后发现了1785个新的转录本\"5.1.3差异表达基因分析比较不同样品间表达差异的基因,给出在每个样品中上调或下调基因\"李新建1.\"8比较了荣昌猪和长白猪的转录本,筛选出196个差异表达显著的基因\"55.1.4基因功能注释将所测reads与数据库中已注释功能的基因相比对进行GO(Geneontolo留,基因的分子功能!生物学过程和细胞组件)和KEG以kyotoeneyelopedi\"\"fgenesandgenomes,基因和基因产物!基因编码产物!新陈代谢途径等)分析\"Huang等1吕2对不同发育期牛胚胎利用IluminaGAn测序平台进行RNA一seq分析,对所得差异基因进行了Go富集性分析\"Ajal等[02采用4测序平台对牛角癌组织和正常角组织转录本分析,并对909345个转录本进行了GO和KEGG分析\"5.1.5可变剪切分析可变剪接使一个基因产生多个mRNA转录本,不同mRNA可能翻译成不同蛋白\"通过末端配对及接合序列的对比,结合已有的基因注释鉴定可变剪切形式\"sergei等[/2对拟南芥的RNA一Seq分析发现至少有约42%含有内含子的基因进行了可变剪切\"wang等1-,8利用seqsaw软件分析了人已有数据库中的基因,分析了基因发生可变剪切时会出现的信号\"5.1.6基因融合分析如果末端配对的reads的两条来自于不同的基因,并且有足够的reads支持两条基因的连接,则这两个基因将作为基因融合的候选\"目前基因融合现象多见于肿瘤或癌症组织,ehdstopher等[.6丁对43个人前列腺癌组织的转录本进行高通量测序分析,发现了新的基因融合现象\"e\"等上R72-对14个中国汉族人的原发性前列腺癌和他们的正常组织进行RNA一seq分析,揭示前列腺癌中存在多个基因融合现象\"5.1.7sNPs及ssR分析通过比对转录本和参考基因组间的序列,寻找潜在的sNPs或ssRs\"Montgo-me砂等[.8]对HapMap中60个欧洲后代进行了转录组测序分析,开发了901个人基因组上的的\"SNP(编码sNp)\"e巨nova,等[0]对荷斯坦奶牛乳样品进行转录组分析,开发了33045个具有多态性的CSNPs\".25无参考基因组组装分析及应用当无参考基因组时,以GenBank中已公布的有关数据为参考,将测序数据经过软件拼接从头组装获得contigs(重叠群)和unigenes(拼接的非冗余基因)\"5.2.1组装情况分析将测序所得短reads利用组装软件从头组装\"首先将具有一定长度重叠的reads连成更长的片段,称之称为conts\"然后将rieads比对回contig,通过末端配对来确定来自同一转录本的不同\"ntos,,以及这些\"intos,之间的距离,未知序i列用N补充,将这些contss连在一起得到sicafelfd\"进一步利用末端配对对Scaf(2fld做补洞处理,最后得到含N最少,两端不能再延长的序列,称之为uignene\"如果同一物种做了多个样品测序,则不同样品组装得到的unigene可通过序列聚类软件做进一步序列拼接和去冗余处理,得到尽可能长的非冗余unlgeneo.25.2unigene功能注释与数据库中已注释功能的基因比对进行Go和KEGG功能注释\"王斌[02对米曲霉菌的转录组分析,利用InterProscan工具对所得基因数据进行了GO分析,并利用BlastZGO软件对基因进行了KEGG分析\"J纯er等1.2利用I一luminaGAn测序平台对绵羊骨愈合延迟和正常组的腿骨进行了RNA一Seq分析,从头组装reads产生了13987个unigenes,对表达有显著差异的转录本进行了聚类和GO分析\"20一2年第12期张春兰等:转录组与RNA一Seq技术生物信息学分析软件的再开发\"测序虽然得到了大量的数据,但基于有限的生物信息学分析软件,经常导致人们所对要分析的东西不能得到很好的结果,造成测序数据的浪费\"(3)读长更长,通量更高\"读长越长,越需要更少的:eads去拼接形成一个基因,因而错误率越低\"或者更长的读长意味着可以在一次测序过程中完成一个基因甚至几个基因的测定\"目前虽然发展起来的4FLX测序平台测序长度能达到700hp以上,但测序费用的昂贵使得许多5.2.3sNPs及ssR分析通过RNA一Seq,可以开发品种的sNP和SSR,从而为品种先育及疾病诊断提供支持\"Blanc\"等1.-2利用4测序平台对两个品种西葫芦进行从头组装转录组分析,开发出9043个eSNps和1935个潜在的ssRs\"zhang等[0]利用I一umin\"HiseqZ\"以2测序平台对3种不同油含量的花生种子进行RNA一Seq,从头组装后得到59077个unigenes,共开发了3919个SSRs,并对其中160个SRS的多态性进行了实验室证实\".25.4基因差异表达分析比较不同样品间表达差异的基因,给出在每个样品中上调或下调基因\"rauleonnier等[.2比较了禁食4sh与正常饮食的奶山羊间脂肪组织间的基因表达,两组分别有456和199个表达不同的基因\"为了揭示松鼠冬眠中基因的变化,Hampt\"\"等[.6]运用4测序平台对全年6个时间点松鼠的心肌!骨骼肌和脂肪组织进行RNA-eq分析,组装后比较发现了多个不同时间点不同S组织间差异表达的基因\"5.2.5Go和/GG分析Ni\"等[02利用4测序平台对一只长白猪的肌肉和卵巢进行RNA一Seq分析,对所测序列进行了组装,并对565个显著表达的转录本进行了Go和KEcG分析\"Blane\"等[242对西葫芦的60%以上的unigenes进行功能注释和GO分析\"科研工作者望而却步\"综上所述,虽然RNA一seq技术还面临着种种困难,相信随着相关学科的进一步发展和测序成本的进一步降低,RNA一seq必将为基因的研究提供强有力的手段,并在转录组学研究领域占据主导地位\"也相信随着测序技术的不断进步,人们能够对转录组开展更为深人的测序工作,能够发现更多!更可靠!更有用的转录本\"参考文献[l]eostaV,Angelinie,DeFeisl,eieeodieolaA.UneoveringtheeomplexityoftranseriptomeswithRNA一Seq.JBiomedBioteehnol,2010:853916[28Wangz,GersteinM,SnyderM.RNA一Seq:arevolution脚toolfortranseriptomies.NatRevGenet,25x刃,10(1):57一63.=38梁烨,陈双燕,刘公社.新一代测序技术在植物转录组研究中的应用.遗传,2021,33(12):1317一1326.6RNA一eq面临的挑战与展望s随着高通量测序技术的发展,以基因组学为代[4]WilhelmBT,MargueratS,WattS,etal.Dynamierepertoireofaeuka卿otietranscriPtomesurveyedatsinglenueleotideresolution#表的生命科学得到了前所未有的繁荣和飞速发展\"作为一个刚刚起步的新技术,RNA一seq已以惊人的速度应用于各种生物组织中\"虽然RNA一Seq已经显示出其他分析技术无可比拟的优势,如能为物种提供单碱基分辨率的转录组注释!提供全基因组范围的/数字化0基因表达谱!成本比芯片和sanger测序低等,但是还存在一些缺陷\"RNA一seq技术在如下几个方面还有待于进一步完善:(l)测序技术的改进和测序费用的降低\"目前虽然利用不同的测序原理发展了多种技术,如4测序平台为焦磷酸合成测序,mumina测序平台为可逆染料终结合成测序,但测序过程中还存在一定的错误率,使得开发出来的SNP!SR和可变剪切的假阳性率较高\"(2)Nature,20)8,453(7199):1239一1243.(752祁云霞,刘永斌,荣威恒.转录组研究新技术:RNA一seq及其应用.遗传,2011,33(11):1191一1202.168http://~illumina.eom.e可eomp娜.asp仁7]J妙rM,ottCE,Grunh昭enJ,etal.Compositetrnseraiptomeasse-mblyofRNA一Seqdatainasheepmodelfordelayedbonehealing-BMCGenomies,2011,12:158.[88HuangW,HasanKhatib.Compaisonorftrnse石ptomielaandseapesfhoovineemb叮05usingRNA一Seq.BMCCenomies,2010,11:711,http:刀www.biomedeentraleoljn1471一21八1/711.[9]FauleonnierY,ChilliadrprifoY,TothatiMB,玩rouxC.ThetrnseraiptomiemodifiedbyfeeddeprivationinlactatingDGeomieslesofadiPosetissuesaergoats.ComparativeBioehemist可andPhysiolo群Patr56生物杖术通推Biotechnolo盯B/lehaProteomies,20一l,6(2):139一149.2012年第12期ovinemilktrbanseriptomeusingRNA一Seqteehnolo盯.Mamme-G[102李新建.猪脂肪沉积关键基因筛选及TCTP基因功能研究1D1.杨凌:西北农林科技大学,2011.nome,2010,21(11一12):592一598-[208ehenCY,AiHs,RenJ,etal.Aglobalviewofpo二inetnarinthreeLissuesfomafrull一sibPairwithse石ptome仁118DaiC,zhangYM,zhangQ,\"taJ.AmieroRNA\"at目09\"f,wineumbiliealveinendothelialeellsidentifiedbydeepsequeneing-extremephenotypesin脚-no-wl卜andfatde卯sitionbypaired一endRNAsequeneing.BMCGeA幼eulturlaSeieneesinChina,2011,10(9):1467一1474.RM,etal.Identi6eationoflongnon一Proteinmies,2011,12(l):448.[12]Li竹,WangSY,Wu[218zhangGJ,euoew,HuxD,etal.DeepRNAsequeneingatsinglebase一pairresolutionrevealshigheomplexityoftherieeeodingRNAsinehiekenskeletalmuseleusingnextgenerationsequeneing.Genomies,2012,99(5):292一298.transcriPtome.晓nomeRes,2010,20(5):6一6.[132pengzy,ChengYB,TanBC,etal.ComprehensiveanalysisofRNA一SeqdatarevealsextensiveRNAeditinginahumanratnserip-[22]TripathiAK,Ko行ngapG,JakhesaarofhornsJ,et习.Aprelimin呵sketeheaneertranseriptomeinIndianzebucattle.Gene,2012,tome.NatureBioteehnolo盯,2012,30(3):253一262.493:124一131.[142riliehkinsA,P五estHD,GivanSA,etal.Genome一widemappingofalternativesplieinginArabid叩515乙alianha.GenomeResearch,=238王斌.米曲霉RIB40转录组学研究=D].广州:华南理工大学,2010.2010,20(l):45一58.[248BlaneaJ,C疵zaesJ,Roige,etarl.Tanserriptomeehacartedzation[258wangLK,WangXW,Wangx,etal.observationsonnovelsplicejunetionsfID.mRNAsequeneingdata.BioehemBiophysResComm-andhighthroughputSSRsandSNPsdi,eove详inCucurbita尸叩\"(Cueurbitaceae).BMCGenomies,2011,12:104.un,2011,409(2):299一303-[252zhangJA,Liangs,nuanJL,etal.Denovoassemblyandehaearterisationof一hetanserriptomeduringseeddevelopment,and[268M曲ereA,Kumar一sinhae,eaoxH,etal.Transe/ptomeSequen-eingtodeteetgenefosionsineaneer.Nature,2仪为,457一101.7234):generationof罗ntie一SsRmarkersinpeanut(Archiash,\"goeaL.).BMCGenomies,2012,13:9).([17]RenSC,pengzy,MaoJH,etal.RNA一SeqanalysisofprostateeaneerintheChinese即p己ationident讯esreeurentgenefrusions,=262HamptonM,MelvinRe,KendallAH,etal.Deepsequeneingtherranserivtomerevealsseasonaladaptivemeehanismsinaeaneer一assoeiatedlongnoneodingRNAsandaberrantalternativehibernatingmammal.p肠5ONE,2011,6(10):e27021.spliein罗.CellRes,2012,22(5):806一821.[272NieQH,FangMx,Jiaxz,\"tal.Analysis\"fmusel\"\"nd\"va斗transeriptomeofSusserofa:assembly,annotationandmarker[18]Mont即me尽SB,Samme山M,eurierez一rAreelusM,\"t日.Trnse0-atomegenetiesusingseeondgenerPationsequeneinginaCaueasiandiseove可.DNARes,2011,18(5):343一351.卯pulation.Nature,2010,4(72):773一777-[19]C么novasA,RineonG,Islas一TrejoA,etal.sNpdiseove叮inthe(责任编辑狄艳红)

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo6.com 版权所有 湘ICP备2023023988号-11

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务