一种基于高通量测序的病原微生物多重扩增试剂盒和方法
技术领域
本发明涉及物种鉴定技术,特别是一种基于高通量测序的病原微生物多重扩增试剂盒和方法。
背景技术
随着全球贸易的飞速发展和国际交流日益增加,出入境检验检疫工作迎来了前所未有的挑战,目前口岸工作面临业务量大,人员不足,鉴定专家缺乏等诸多难题。如何在确保检验检疫质量的同时,又能缩短检验检疫周期,加快通关速度,成为一大难题,因此必须提供新的检疫鉴定技术。
DNA条形码技术是利用一段或者几段标准的、易扩增的、种间差异大于种内差异的DNA片段来进行物种鉴定的新技术,最早由加拿大学者Hebert提出。与传统的分类鉴定技术相比,DNA条形码技术具有操作简单,不受个体发育阶段和形态特征的限制等优点,使不具备物种分类鉴定知识的人也可以通过该技术对物种进行鉴定。该技术一经提出便迅速成为分子分类学及分子鉴定技术的核心方法,在生物物种鉴定方面发挥了重要作用。但传统的DNA条形码技术通常一次只能鉴定出一种或者少数几种物种,不能一次性快速分析出数百万基因序列、鉴定上千种物种。而多数情况下,待测样品通常是多种不同物种的混合物,特别是病原微生物,因此同时对混合样品多物种进行鉴定的需求越来越大。
高通量测序技术可以同时获得样本中每个物种的DNA序列,具有测序通量高、速度快、成本低等优点,近年来被广泛应用生物安全、医药卫生等各个领域。在应用高通量测序技术进行物种鉴定过程中,首先需要采用通用引物对待测样品的遗传物质进行扩增,通用引物的质量(通用性、灵敏度等)决定了其能够将待测样品中存在的物种种类挖掘出来的程度,决定了后续测序结果和分析结果,因此为了促进高通量测序技术在物种鉴定中的高质量应用,有必要开发与之相配套的技术。
发明内容
基于上述领域的需求,本发明提供一种基于高通量测序的微生物物种鉴定试剂盒和方法,技术方案如下:
1.一种基于高通量测序的微生物物种鉴定试剂盒,其特征在于,包含细菌通用引物:
3221F:ACGGHCCARACTCCTACGGAA;
796R:CTACCMGGGTATCTAATCCKG。
2.一种基于高通量测序的微生物物种鉴定试剂盒,其特征在于,包含细菌通用引物:
3222F:ACGGHCCARACTCCTACGGRA;
796R:CTACCMGGGTATCTAATCCKG。
3.一种基于高通量测序的微生物物种鉴定试剂盒,其特征在于,包含细菌通用引物:
3221F:ACGGHCCARACTCCTACGGAA;
3222F:ACGGHCCARACTCCTACGGRA;
796R:CTACCMGGGTATCTAATCCKG。
4.根据任一前述的微生物物种鉴定试剂盒,其特征在于,还包含至少一对真菌通用引物。在前述本发明设计的细菌通用引物的基础上,本发明的试剂盒中还可以加入真菌通用引物,加入的真菌通用引物可以是本领域已知的。
5.根据前述的微生物物种鉴定试剂盒,其特征在于,所述真菌通用引物为
ITS1F:CTYGGTVATTTAGAGGAAGTAA,
ITS4:TCCTCCGCTTATTGATATGC。
6.一种微生物物种鉴定方法,其特征在于,包含以下步骤:
(1)提取核酸:
对初步判断疑似含有真菌或细菌的材料,提取DNA;
对初步判断疑似含有病毒的材料,提取RNA;
对初步判断微生物种类多样或种类不清楚的材料,提取RNA和DNA;
(2)对提取的RNA进行siRNA测序得到siRNA测序数据;
对提取的DNA,在同一个反应管中,加入任一前述的试剂盒中的所有通用引物进行PCR多重扩增;
(3)对扩增产物进行测序以构建文库数据;比如Illumina Miseq双端测序;对提取的RNA进行siRNA测序得到siRNA测序数据;
(4)对文库数据和siRNA测序数据进行处理和分析,得出鉴定结果,指出待测样品中所含物种在门、纲、目、科、属和种的水平上的分类数量,及其中所含的主要物种种类。
7.根据前述的微生物物种鉴定方法,其特征在于:所述PCR多重扩增采用的体系如下:
2×PCR缓冲液12.5μl;10μmol/L引物各1μl;模板DNA 1μl;无菌水定容至25μl;
所述PCR多重扩增采用的反应条件如下:
94℃、5min;94℃、30s,55℃、30s,72℃、30s,35个循环;72℃、10min。
8.根据权利要求6或7所述的微生物物种鉴定方法,其特征在于,
其中对文库数据进行处理指去过滤接头、剔除低质量序列、嵌合体序列和过短序列,获得用于后续分析的有效序列的集合;以及对所述有效序列的集合进行归类操作即OTU聚类分析得到用于分析的数据;
其中采用CutAdapt软件过滤接头;
用CD-hit,Uclust、BLAST、mothur、usearch或prefix/suffix进行OTU聚类分析;
对于siRNA测序数据的预处理,包括对所述siRNA测序数据进行组装得到病毒重叠群和类病毒基因组群,获得用于后续分析的预处理数据。
9.根据前述的微生物物种鉴定方法,其特征在于,
其中分析是指将所述预处理数据与已知物种参考序列数据库进行BLAST比对,得出待测样品中所含物种所涉及到的门、纲、目、科、属及种分类水平上的分类数量,及其中主要的物种种类;
其中所述已知物种参考序列数据库包含BOLD、NT、UNITE、RDP、Sliva或GreenGene、NT、NR中的一个或多个。
10.根据前述的微生物物种鉴定方法,其特征在于,其中对文库数据进行处理和分析采用物种鉴定系统完成,
所述物种鉴定系统包含可远程访问的服务器;所述服务器包含数据预处理模块和物种鉴定模块;
其中物种鉴定模块配置了真核生物鉴定单元、原核生物鉴定单元、病毒类病毒鉴定单元;其中真核生物鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包含BOLD、NT;原核生物鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包括BOLD、NT、UNITE、RDP、Sliva或GreenGene;病毒类病毒鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包括NT、NR;
所述数据处理预模块用于根据用户数据分析启动指令调取核酸序列数据处理工具对用户提供的测序数据进行预处理得到经预处理数据;
对于来自PCR扩增子的测序数据的预处理,包括
去接头、剔除低质量序列、嵌合体序列和过短序列,获得用于后续分析的有效序列的集合;以及对所述有效序列的集合进行归类操作即OTU聚类分析得到所述经预处理数据,包含代表样品中所含物种的代表性测序序列;
对于来自siRNA的测序数据的预处理,包括对所述siRNA测序数据进行组装得到病毒重叠群和类病毒基因组群,得到所述经预处理数据,包含样品所含病毒类病毒种类的代表性测序数据;
对经预处理数据进行物种鉴定:将全部所述经预处理数据与物种鉴定模块中的真核生物鉴定单元、原核生物鉴定单元、病毒类病毒鉴定单元进行匹配,并在不同鉴定单元中将匹配到该单元的若干代表性测序序列与本地存储或在线关联的已知物种参考序列数据库同时进行BLAST比对,得出所述鉴定结果。
本发明为基于高通量测序进行物种鉴定开发了扩增效率理想的细菌通用引物及其与真菌通用引物的组合,并在此基础开发了多重检测方法。基于这些通用引物组合对待测样品进行单管多重扩增,能够保证尽可能多的扩增出目标物种,同时又要保证所扩增的片段有足够的变异能够区分不同物种,为后续高通量测序及后续进行物种分析的基础。
本发明的试剂盒和方法中,在物品中待鉴定物种类群明确的情况下,采用已知针对不同类群的核酸提取技术提取即可;在检验检疫物品中待鉴定物种类群未知的情况下,采用商业化的DNA和RNA共提取试剂盒对核酸进行同时提取。其中用到的测序技术、数据处理和分析可以基于已知技术完成,在数据处理和分析中,可以采用申请人前期研发出的物种鉴定系统直接一步得出鉴定结果。
附图说明
图1.本发明设计细菌通用引物所尝试的位点示意图
图2.本发明中对细菌通用引物的PCR扩增产物凝胶检测图
图3.对比不同通用引物扩增同一样品所得产物的测序结果的稀释性曲线图,
其中横坐标代表随机抽取的测序数据量;纵坐标表示观测到的物种数量(Sobs),显示在相同测序数量的情况下,本发明提供的细菌通用引物3222F/796R和3221F/796R相比已知通用引物341F_806R的扩增结果能得出更多物种种类,而3222F/796R更优于3221F/796R。
图4.分析本发明提供的细菌通用引物的扩增产物在属分类水平上的物种鉴定结果
图5.分析本发明提供的细菌通用引物的扩增产物在种的分类水平上的物种鉴定结果
图6.本发明优选实施方案中采用的物种鉴定系统示意图。
具体实施方式
结合附图说明本发明的方法和系统的一些示例性实施方案,不用限制本发明的保护范围。
实施例1.本发明中采用的引物
表1.委托合成
细菌引物设计或选取:在植物病原细菌16S rRNA基因不同区域上设计引物,评估引物的通用性,选择能够最大程度将样品中物种序列扩增出来的引物。
经过设计和筛选发现,3221F/796R和3222F/796R比已知通用引物341F/806R具有更好的通用性。
实施例2.细菌通用引物比较
实验材料:本研究所用的实验材料来源于实验室培养的烟草叶片、黄瓜叶片,田间采集的黄瓜叶片、柑橘叶片、玉米叶片、辣椒果实、番茄植株。
实验步骤如下:
1.样品处理
取混合植物样品100mg,加入液氮充分研磨。
2.提取核酸
将研磨好的粉末迅速转移到预先装有700μL 65℃预热缓冲液GP1的离心管中(实验前在预热的GP1中加入巯基乙醇,使其终浓度为0.1%),迅速颠倒混匀后,将离心管放在65℃水浴20min,水浴过程中颠倒离心管以混合样品数次。
加入700μL氯仿,充分混匀,12,000rpm离心5min。
小心地将上一步所得上层水相转入一个新的离心管中,加入700μL缓冲液GP2,充分混匀。
将混匀的液体转入吸附柱CB3中,12,000rpm离心30s,弃掉废液。
向吸附柱CB3中加入500μL缓冲液GD(使用前应检查是否加入无水乙醇),12,000rpm离心30s,弃废液,将吸附柱CB3放入收集管中。
向吸附柱CB3中加入700μL漂洗液PW(使用前应检查是否加入无水乙醇),12,000rpm离心30s,弃废液,将吸附柱CB3放入收集管中。
向吸附柱CB3中加入500μL漂洗液PW,12,000rpm离心30s,弃废液,将吸附柱CB3放入收集管中。
将吸附柱CB3放回收集管中,12,000rpm离心2min,弃废液。将吸附柱CB3置于室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液。
将吸附柱CB3转入一个干净的EP管中,向吸附柱的中间部位悬空滴加50μL ddH2O,室温放置5min,12,000rpm离心2min,EP管中收集到的即为提取出的DNA溶液。
3.PCR扩增
分别采用表1引物1,引物2,引物3进行PCR扩增。
PCR反应体系:2×PCR缓冲液12.5μl;引物(10μmol/L)各1μl;模板DNA1μl;无菌水定容至25μl。
PCR反应条件:94℃、5min;94℃、30s,55℃、30s,72℃、30s,35个循环;72℃、10min。
PCR反应经琼脂糖凝胶电泳检测,如图2所示,泳道3、4、5分别对应引物1、2、3。
将扩增出的PCR产物送至上海美吉生物医药科技有限公司进行Illumina Miseq测序。
下机数据为Raw Data,经数据过滤后,得到Clean Data,数据过滤具体步骤为:①按窗口去低质量数据;②去除含接头的reads;③去除含N的reads;④去除低复杂度reads。
得到Clean Read后,利用其overlap关系将双末端测序得到的成对reads组装成一条序列,使用软件FLASH2(Fast Length Adjustment of Short reads,v1.2.11)来进行Raeds拼接,从而得到Tags。将没有overlap关系的reads去除,并对Tags进行去引物处理,最终得到Clean Tags。序列拼接条件为:①最小匹配长度设置为15bp;②重叠区域错配率不超过0.1。
对所述有效序列的集合进行归类操作即OTU聚类分析得到所述经预处理数据;将预处理数据与已知物种参考序列数据库进行比对得到Alpha多样性结果。
测序分析结果如下:
(1)Alpha多样性分析
Simpson:用来估算样本中微生物多样性的指数之一,在生态学中常用来定量描述一个区域的生物多样性。Simpson指数值越大,说明群落多样性越低。
Shannon:用来估算样本中微生物多样性的指数之一。它与Simpson多样性指数类似,常用于反映群落alpha多样性。Shannon值越大,说明群落多样性越高。
Coverage:是指各样本文库的覆盖率,其数值越高,则样本中序列被测出的概率越高,而没有被测出的概率越低。该指数反映本次测序结果是否代表了样本中微生物的真实情况。
ace和chao:用来估计样本中OTU的个数。
(2)稀释曲线分析
利用R语言工具制作曲线图。
分析结果稀释性曲线图如图3所示,横坐标代表随机抽取的测序数据量;纵坐标,观测到的物种数量(Sobs)
稀释曲线(Rarefaction curve)主要利用各样本在不同测序深度时的微生物Alpha多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。
它可以用来比较测序数据量不同的样本中物种的丰富度、均一性或多样性,也可以用来说明样本的测序数据量是否合理。稀释曲线采用对序列进行随机抽样的方法,以抽到的序列数与它们对应的物种(如OTU)数目或多样性指数,构建Rarefaction curve。若多样性指数为sobs(表征实际观测到的物种数目),当曲线趋向平坦时,说明测序数据量合理,更多的数据量只会产生少量新的物种(如OTU),反之则表明继续测序还可能产生较多新的物种(如OTU)。若是其他多样性指数(如Shannon-Wiener曲线),曲线趋向平坦时,说明测序数据量足够大,可以反映样本中绝大多数的微生物多样性信息。
随着测序深度的增加,趋末端向平坦时,说明测序数据量合理,更多的数据量只会产生少量新的OTU。位于上方的样本物种的丰富度要高于位于下方的样本。本发明的结果中,如图3中,3222F_796R样本的丰富度是最高的,341F_806R样本的丰富度最低
(3)物种Venn图分析
对测序结果进行物种Venn图分析。
Venn图可用于统计多组或多个样本中所共有和独有的物种(如OTU)数目,可以比较直观的表现环境样本的物种(如OTU)组成相似性及重叠情况。通常情况下,分析时选用相似水平为97%的OTU或其他分类学水平的样本表。
R语言(version 3.3.1)工具统计和作图。
结果如图4和图5所示,利用引物3222F/796R扩增效率最好,用该引物能够挖掘到的测序深度最好,得到的物种信息更丰富。
实施例3.常见大田作物携带病原微生物鉴定
实验材料:采集自北京市密云圣水头村田间菜地的花瓜叶片、番茄叶片、辣椒叶片、茄子叶片。。
实验步骤如下:
DNA和RNA共提取
(1)称取2g植物种子在液氮中研磨至粉末状,将植物种子粉末转入1.5mL离心管中,为保证后续核酸提取质量,每个1.5mL离心管中植物样品粉末≤100mg。随后向每个1.5mL离心管中加入500μL CPL缓冲液(使用前,每1mL CPL缓冲液加入20μL 2-巯基乙醇混合,混合液可在室温条件下保存1个月。),55℃水浴10min。
(2)加入500μL氯仿,震荡30s,13,000×g离心5min。
(3)转移350μL上清液至新离心管中,并向其中加入350μL PR缓冲液,震荡混匀,将混合液转移至DNA吸附柱(DNA吸附柱放入2mL收集管中),10,000×g离心1min,将DNA吸附柱放置室温或4℃待后续用于DNA提取,洗脱液用于后续RNA提取。
DNA提取
(4)将(3)所得DNA吸附柱放入新的2mL离心管中,向DNA吸附柱中加入500μL DNA洗涤缓冲液,10,000×g离心1min,弃掉滤液。
(5)向DNA吸附柱中加入500μL DNA洗涤缓冲液,14,000×g离心2min,弃掉滤液。可适当延长离心时间以保证DNA吸附柱彻底干燥。
(6)将DNA吸附柱放入新的1.5mL离心管中,向吸附膜中间悬空滴加50~100μL TE缓冲液,室温放置2min,10,000×g离心2min,DNA被洗脱到离心管中,分装,做好标记,-80℃保存备用。
RNA提取
(7)向(3)所得的洗脱液中加入0.5倍洗脱液体积的无水乙醇,轻轻混匀。
(8)将700μL(7)所得液体转移至RNA吸附柱(RNA吸附柱放入2mL收集管中),10,000×g离心1min,弃掉滤液。
(9)将剩余(7)所得液体转移至RNA吸附柱,10,000×g离心1min,弃掉滤液。
(10)向RNA吸附柱中加入500μL RWC洗涤缓冲液,10,000×g离心1min,弃掉滤液。
(11)向RNA吸附柱中加入500μL RNA洗涤缓冲液II(使用前按说明要求加入相应量的无水乙醇),10,000×g离心1min,弃掉滤液。
(12)向RNA吸附柱中加入500μL RNA洗涤缓冲液II,10,000×g离心2min,弃掉滤液。可适当延长离心时间以保证RNA吸附柱彻底干燥。
(13)将RNA吸附柱放入新的1.5mL离心管中,向吸附膜中间悬空滴加40~70μLDEPC(焦碳酸二乙酯)洗脱缓冲液,室温放置2min,14,000×g离心1min,RNA被洗脱到离心管中。
(14)为提高RNA浓度,可重新吸取离心得到的RNA,再加入RNA吸附柱中,室温放置2min,14,000×g离心1min。
(15)RNA被洗脱到离心管中,分装,做好标记,-80℃保存备用。
3.PCR扩增
采用实施例1中3222F-796R,以及ITS1F-ITS4
PCR扩增体系(25μL)
扩增总体系25μL,分别为Mix 12.5μL、引物(10μmol/L)各1μL、模板DNA 2μL、ddH2O6.5μL。
多重扩增条件为94℃3min,35个循环94℃30s、55℃30s、72℃30s,72℃5min。
PCR产物检测和纯化,参见SN/T 4278中“PCR产物的检测”执行操作。
PCR产物浓度测定:使用DNA浓度测定仪对PCR产物浓度和质量进行检测,以DNA溶解溶液做参比,分别测定样品溶液在260nm、280nm、230nm、270nm处的吸收值,计算A260/A280,A260/A230,A260/A270的比值,同时满足以下条件的DNA样品可视为质量高的基因组DNA:A260/A280为1.8~1.9,A260/A230>2.0,A260/A270为1.1~1.3。利用A260=1相当于50μg/mL的双链DNA计算DNA浓度,要求PCR产物的DNA总量≥2μg,浓度≥50ng/μL。
4.高通量测序
将上述所得PCR产物和RNA送交上海美吉生物医药科技有限公司进行高通量测序(Illumina miseq测序)。
5.将测序数据提交本发明的物种鉴定系统(如图6所示)进行以下处理:
对测序数据进行预处理得到经预处理数据
对于来自PCR扩增子的测序数据的预处理,包括
去接头、剔除低质量序列、嵌合体序列和过短序列,获得用于后续分析的有效序列的集合;以及对所述有效序列的集合进行归类操作即OTU聚类分析得到所述经预处理数据;
对经预处理数据进行物种鉴定:将全部所述经预处理数据与物种鉴定模块中的真核生物鉴定单元、原核生物鉴定单元、病毒类病毒鉴定单元进行匹配,并在不同鉴定单元中将匹配到该单元的经预处理数据与本地存储或在线关联的已知物种参考序列数据库进行BLAST比对,得出物种鉴定结果。
设置在97%相似度下进行聚类。
鉴定结果如下:
共检测到了30个属63个种的植物病原真菌,15个属64个种的植物病原细菌,3种植物病毒。
说明本发明的试剂盒和方法可以同时鉴定出若干种细菌、真菌、病毒等病原微生物,所用通用引物具有良好的通用性和特异性。