用于adtkd基因突变检测的引物、试剂盒及分析方法
技术领域
本发明属于生物医药
技术领域
,尤其是涉及用于ADTKD基因突变检测的引物、试剂盒及分析方法。背景技术
常染色体显性遗传性肾小管间质性肾病(autosomaldominanttubulointerstitial kidney disease,ADTKD)是一类具有遗传倾向和家族聚集性的间质性肾病。这类肾病患者最终进入终末期肾病(简称ESRD),给个人、家庭和社会带来了沉重的负担。
2015年改善全球肾病预后组织(简称KDIGO)对常染色体显性小管间质性肾病的重新命名、临床表现、肾脏病理、诊断及治疗等达成共识。目前已发现5个ADTKD致病基因(UMOD,MUC1,HNF1B,REN,SEC61A1)并对应其基因分型。由于ADTKD患者的B超显示并无典型特征,因此给临床诊断带来很大困扰。基因突变检测成为明确诊断ADTKD及其亚型的唯一方法。
目前以疑诊患者的家族史、组织病理学特点和基因突变检测作为ADTKD疑诊和确诊的依据。疑诊依据:(1)患者有典型间质性肾损害的临床表现,同时可以提供明确的常染色体显性遗传模式的家族史(至少两代直系亲属中有肾病史);(2)损害及糖尿病等。确诊依据:(1)至少涉及1个家族成员的家族史符合ADTKD的临床表现和组织病理特点;(2)患者经基因测序发现以上五个基因之一存在突变,或至少1个家族成员有基因突变。
对ADTKD疑诊患者进行基因检测主要有五方面原因:(1)疑似ADTKD的患者需要确诊;(2)肾功能正常的家族成员有捐肾意愿;(3)有ADTKD风险的健康人;(4)成人接受胚胎植入前遗传学诊断,优生优育;(5)不同基因突变导致的ADTKD早期干预原则和疾病治疗原则不尽相同,推荐对于HNFIB和REN突变的儿童进行早期干预以改善其预后,应转诊给儿童肾脏病专家治疗。而UMOD和MUCI突变携带者则以定期临床随访为主,不推荐给予早期干预。如果ADTKD患者已出现肾功能损害,则需依据慢性肾脏病治疗指南进行治疗。别嘌呤醇或非布司他可以降低UMOD突变导致的高尿酸血症并缓解痛风症状。进入ESRD的患者可考虑行血液透析、腹膜透析或肾脏移植等替代治疗。
目前认为ADTKD的发生主要与5个基因突变有关,它们分别为UMOD,MUC1,HNF1B,REN和SEC61A1。其中,ADTKD-UMOD的患病率37.1%,为ADTKD最常见的亚型;ADTKD-MUC1的患病率21%,为ADTKD第二大常见亚型;其余3个基因突变类型较为罕见。
UMOD基因定位于人染色体16p12,由11个外显子组成,编码尿调节素。它由640个氨基酸组成,富含(48个)半胱氨酸残基,且半胱氨酸在维持蛋白的正常三维结构及功能上非常重要。它编码尿调节蛋白,在袢升支粗段(简称TAL)上皮细胞中特异性表达,可以增强TAL上皮细胞的屏障作用,增加肾脏外髓质钾通道的表达,同时激活Na+-K+-2Cl-转运体。UMOD基因发生突变后,TAL上皮细胞Na+-K+-2Cl-转运体的功能受到抑制,增加近曲小管对尿酸的重吸收,这可能是部分UMOD突变患者合并高尿酸血症的机制。此外,有研究表明UMOD突变产生的结构或功能异常的尿调节蛋白在细胞内质网中堆积,会造成肾小管上皮细胞损伤、释放各种炎性介质、诱发免疫反应并引起炎性细胞浸润。近期研究发现UMOD突变患者肾组织中TAL上皮细胞顶端纤毛上尿调节蛋白表达降低,提示UMOD突变可能与纤毛功能异常有关。目前已知位于小管上皮细胞顶端膜的纤毛参与多条重要的细胞内信号转导通路,且纤毛功能异常是常染色体显性多囊肾病(简称ADPKD)主要发病机制之一。因此也可看出ADTKD与ADPKD在发病机制上可能存在紧密联系。
MUC1基因定位于人染色体1q22,含有7个外显子,其第2个外显子含有许多串联重复序列(简称VNTRs)。其编码产物MUC1黏蛋白是典型的I型跨膜型黏蛋白,由多肽骨架和O-糖苷键连接的糖基侧链构成。MUC1基因在正常情况下可表达于多种组织,在肾脏中广泛分布于远端肾小管,具有维持肾小管腔的重要作用。MUC1的VNTRs结构域,如果一个胞嘧啶脱氧核苷酸插入该结构域会导致基因发生移码,产生新的肽链,这种肽链不能折叠成具有正常功能的蛋白质,并在小管上皮细胞中堆积,最终导致肾小管功能障碍及坏死。多项研究发现,MUC1基因2号外显子串联重复序列区域,常发生4种类型的基因突变28dupA、26_27insG、23delinsAT、27dupC,其中以27dupC(占比约90%)为主要突变类型,导致ADTKD。
HNF1B基因定位于人染色体17q12,含有9个外显子,编码肝细胞核因子1β(hepatocyte nuclear factor 1β,HNF1β)。HNF1β为含有同源结构域的转录因子超家族中的一员,在胰腺、肾脏、肠道、肝脏、生殖道等多种器官起着重要的组织特异性调控基因表达的作用,同时也参与了这些器官的胚胎发育。HNF1B基因杂合突变可致胰腺、肾脏、生殖道、肝脏、肠道等异常,其临床表现可以是孤立性的或多系统受累,且同一家系受累患者临床表型严重性存在巨大差异。HNF1B突变是先天性肾脏形态异常的主要发病机制之一,该基因突变导致肾损害严重程度差异很大,重者可出现严重的囊性肾病,轻者则可长期保持肾功能正常。儿童型HNF1B突变肾脏损害十分显著,而胰岛损害较轻甚至并未累及。杂合型的HNF1B突变则与青年型“肾囊肿及糖尿病综合征”关系密切。
REN基因定位于人染色体1q32,含有10个外显子,编码前肾素原,它可进一步被水解后形成肾素。肾素本身作为一种蛋白酶,可将血管紧张素原分解形成血管紧张素Ⅰ发挥其重要的生理作用。其突变基因编码的异常肾素在细胞间聚集会诱发细胞凋亡,而突变REN是如何诱发肾小管间质纤维化仍不明确。
SEC61A1基因定位于人染色体3q21,含有12个外显子,其编码的蛋白属于SECY/SEC61-α家族,在分泌多肽和膜多肽插入内质网中起着关键作用。这种蛋白被发现与膜结合核糖体紧密相关,SEC61A1的突变导致了常染色体显性遗传综合征,蛋白质跨内质网膜转运缺陷是其形成ADTKD的致病机制。
目前,二代基因测序中的人外显子测序技术(简称WES)是ADTKD临床诊断的重要方式。但是只能解决UMOD,HNF1B,REN,SEC61A1这四个基因的突变检测,无法解决MUC1基因的突变检测。
CN112760371A公开了一种检测MUC1基因突变的引物、试剂盒及分析方法,用三代单分子测序解决了MUC1基因的突变检测问题。但是分开检测五个致病基因中MUC1的突变,不涉及UMOD,HNF1B,REN,SEC61A1的检测,给临床疑诊患者带来更长的等待时间和更多的医疗花费。
US20210169827A1涉及用于诊断和治疗或预防蛋白质病的组合物和方法,特别是与MUC1相关的肾脏疾病(ADTKD-MUC1或MKD),视网膜色素变性(例如,由于视紫红质突变),由Umod突变(ADTKD-Umod)引起的常染色体优势小管-间质性肾病,该专利公开的也仅仅涉及五个致病基因中UMOD,MUC1的检测,并没有涉及基因HNF1B,REN,SEC61A1的同时检测。
因此,目前缺少一次检测所有ADTKD相关基因突变的基因诊断和基因分型方法。
发明内容
本发明着力解决的问题是获取五个基因(UMOD,MUC1,HNF1B,REN和SEC61A1)可能的外显子突变区域,采用单分子实时测序技术对可能的突变区域进行测序。
本发明技术方案包括:PCR引物设计、替换的磁珠、酶和适用的体系,降低检测成本。着力解决的分析问题包含:利用单分子实时测序技术产生的数据建立分析方法,对测序结果进行矫正和突变解析,给出准确的ADTKD基因诊断和基因分型判别。
为了解决现有技术中存在的问题,提高实验方法和分析方法的适用性,降低检测成本,本发明通过一系列试剂的优化筛选,实现了不同样本、不同机型等的基因突变检测。本发明的目标是提供一种用于ADTKD的基因诊断和基因分型方法,包括PCR引物、文库构建试剂盒、16个样品混样上机测序标签接头序列和长片段测序突变分析方法。
ADTKD的基因诊断和基因分型试剂盒,包含PCR引物、聚合酶和反应体系、反应条件的建立,还包括纯化磁珠、建库接头、建库酶和反应体系的建立。
PCR体系的建立,包含引物设计,标签设计,聚合酶和反应体系、反应条件的建立。14对引物设计,涵盖UMOD,MUC1,HNF1B,REN,SEC61A1基因中目前文献报导的所有影响编码蛋白的突变位点,包含UMOD的125种已报导突变,MUC1的4种已报导突变,HNF1B的77种已报导突变,REN的4种已报导突变,SEC61A1的2种已报导突变,合计212个。同时,利用这种方法也可以检测到这些区域目前未报导的新的影响蛋白编码的突变类型。16对标签设计,可供16个样品同时进行ADTKD基因突变检测。
本发明的目的可以通过以下技术方案来实现:
本发明首先提供用于ADTKD基因突变检测的引物,包括14对引物,14对引物序列如下:
M1:ATGTTCTCAGCCCGGTCCTC
M2:CTGTGTGAGGGCAGAGGTTTTT
M3:AACTTGCATCATCTCCTTTGGC
M4:GACTAGACTGTTTTCAGCACCCC
M5:ATGAACGGTGGAGGCTTGAC
M6:CATGGCACAGGTAACACTTGGA
M7:CTCATTCCGTCTTCAGCGTTTA
M8:GCTTCTTAGTTTTCCCCCACC
M9:TACATGGTTTGGCTTCTCTGC
M10:CCACCACCTCTGCTCTACCA
M11:AGAGGCCAGTCAGGGACAAA
M12:GCACCTAGGGGATGCTAAGGT
M13:CTCAACACCTCCCAAGCACAG
M14:AAGGTGCATACACAGGCAAAGA
M15:TAGTCTCAACCCCCAAATCCTC
M16:CTCCCATAAGCCACTCTCTCCT
M17:CAGCTGCTGTTTCTCTTTCCAG
M18:AGGCCCAACCTTTGCTTACC
M19:TCCTGAAGATGGGAAGTCCTCT
M20:GTCTCTCGCTCTAAGCAGCAAAC
M21:AAGGTTAGGTGAAGTTTGGCTG
M22:AAGTTCCCCTGATTGTTTTGG
M23:CTGTGCCCACTTTATTTGTGTTAG
M24:TCTTATTTGTTGTGTTTACCCCAGA
M25:TGTGTACTGGAGATGTGGAAAAAGT
M26:AGGTAAGAGGACAATGGAGCAA
M27:GGAGAAAAGGAGACTTCGGCTACCCAG
M28:GCCGTTGTGCACCAGAGTAGAAGCTGA
本发明设计的14对引物中,M1-M6,M23-M24对应UMOD基因,M7-M10对应SEC61A1基因,M11-M12对应REN基因,M13-M22,M25-26对应HNF1B基因,M27-M28对应MUC1基因。
本发明设计的14对引物涵盖了UMOD,MUC1,HNF1B,REN,SEC61A1基因中目前文献报导的所有影响编码蛋白的突变位点,包含UMOD的125种已报导突变,MUC1的4种已报导突变,HNF1B的77种已报导突变,REN的4种已报导突变,SEC61A1的2种已报导突变,合计212个。同时,利用本发明的14对引物也可以检测到这些区域目前未报导的新的影响蛋白编码的突变类型。
本发明还提供用于ADTKD基因突变检测的试剂盒,包括:本发明第一方面所涉及的用于ADTKD基因突变检测的引物。
在本发明的一些实施方式中,用于ADTKD基因突变检测的试剂盒还包括样品上机测序标签接头,所述样品上机测序标签接头选择以下中的一种或几种。
使用时,做几个样品就需要加入几个标签接头,本发明提供了16种标签接头,所以,可以一次同时进行16个样品的检测。
在本发明的一些实施方式中,用于ADTKD基因突变检测的试剂盒还包括纯化用磁珠、DNA修复酶、DNA末端补平酶、DNA连接酶、DNA外切酶;
以上所涉及的纯化用磁珠、DNA修复酶、DNA末端补平酶、DNA连接酶、DNA外切酶等都是生物技术中常用的原料,可以从商业途径购买获得。
在本发明的一个实施方式中,所述DNA扩增酶选择Takara公司的DNA polymerase;
所述纯化用磁珠选自Beckman公司的AMPure XP Beads。
其中,所述纯化用磁珠的制备方法为:
1)重悬AMpure XP beads,取出500ul,16000rpm离心1min,放在磁力架上取出上清到新管中保存。
2)在磁珠上加入1ml水,重悬,16000rpm离心1min,放在磁力架上取出上清丢弃;重复4-5次。
3)取1ml 10mM Tris-HCl(pH8.5)加入到beads中,混匀重悬,16000rpm离心1min,放在磁力架上取出上清丢弃。
4)将第一步中保存的上清加入到beads中,重悬。此为处理好的beads,可放于4℃保存备用。
所述DNA修复酶选择NEB Next FFPE DNA Repair Mix。
所述DNA末端补平酶选择NEB Next end repair enzyme mix。
所述DNA连接酶选自Thermofisher公司的T4 DNA ligase,5U/ul。
所述DNA外切酶选自Exonuclease VII(NEB),Exonuclease III(NEB)。
在本发明的一个实施方式中,用于ADTKD基因突变检测的试剂盒还包括使用说明书,在所述使用说明书上记载:
PCR反应体系的建立:
基因组DNA模板:100ng
5×Reaction Buffer:5μl,
dNTP(2.5mM each):2μl,
DNA Polymerase:0.5μl,
引物F(10μM引物,HPLC级别)0.5μl,
引物R(10μM引物,HPLC级别)0.5μl,
补ddH2O至总体积25μl。
其中,引物F、引物R分别指对应于检测UMOD,HNF1B,REN,SEC61A1四个基因突变使用的引物,检测UMOD基因突变时,引物F、引物R选自M1-M6,M23-M24;检测HNF1B基因突变时,引物F、引物R选自M13-M22,M25-26;检测REN基因突变时,引物F、引物R选自M11-M12;检测SEC61A1基因突变时,引物F、引物R选自M7-M10。
以上引物F、引物R用量为10μM引物是指每个引物需要10μM。
在本发明的一个实施方式中,由于有13对对应于检测UMOD,HNF1B,REN,SEC61A1四个基因突变使用的引物,所以,实际使用时,具体有13个PCR反应体系,不过这些不同的反应体系除了引物不同以外,其他相同。
在本发明的一个实施方式中,由于有13个PCR反应体系,还对13个PCR产物进行混合,得到混合体系。
通过首次实验等比例混合最终PCR相应reads数统计进行混样优化,实现多个靶向目标条带等比例(等比例是指数据产出的reads数一致)测序数据输出。混合比例如下:
以上13个扩增区域是指13对引物对应的扩增区域。其中,M1-M6,M23-M24对应UMOD基因,M7-M10对应SEC61A1基因,M11-M12对应REN基因,M13-M22,M25-26对应HNF1B基因。
在本发明的一个实施方式中,用于ADTKD基因突变检测的试剂盒还包括使用说明书,在所述使用说明书上记载:
PCR反应热循环条件建立:
98℃,5min;
98℃,10s,68℃,2min 30sec;30个循环;
68℃,5min;
4℃,∞。
在本发明的一个实施方式中,用于ADTKD基因突变检测的试剂盒还包括使用说明书,在所述使用说明书上记载:
MUC1基因PCR反应体系的建立:PCR反应混合物体系为:每个反应混合物体系50μl,包含200ng的基因组DNA模板,5×Reaction Buffer 10μl,dNTP(2.5mM each)4μl,DNAPolymerase 1μl,引物F(10μM引物,HPLC级别)1μl,引物R(10μM引物,HPLC级别)1μl,补ddH2O至总体积50μl。其中,引物F、引物R选自M27-28,M27-M28对应MUC1基因。
MUC1基因PCR反应体系的建立时,可以同时扩增8管。
MUC1基因PCR反应热循环条件建立:PCR反应热循环条件为:105℃热盖预热,98℃保温5min,然后进入30个循环(采用两步法热循环条件):变性温度98℃保温10s(第1至第30个循环),接着进入退火和延伸温度:74℃保温4min(第1至第5个循环)/72℃保温4min(第6至第10个循环)/70℃保温4min(第11至第15个循环)/68℃保温4min(第16至第30个循环)。最后的延伸温度68℃保温10min,随后保温在4℃。
在本发明的一个实施方式中,用于ADTKD基因突变检测的试剂盒还包括使用说明书,在所述使用说明书上记载:
纯化体系的建立:配置1.0%~1.2%琼脂糖凝胶,检测PCR产物条带是否正确;使用0.8X磁珠纯化;使用Qubit 4.0检测浓度,产物备用。
本发明的一个实施方案中,包含建库体系的建立,依次进行接头序列的制备、连接体系的制备、酶切体系的制备,磁珠的预处理和纯化体系的建立。
连接体系的制备:准备6μl的T4 DNA ligase(Thermofisher),4μl的10X T4DNAligase buffer(Thermofisher),1ul的制备好的接头,PCR产物,以及ddH2O,总体系体积为40μl;设置体系反应条件22℃,≥10h(热盖25℃)。
酶切体系的制备:准备0.5μl Exonuclease VII,0.5μl Exonuclease III;设置体系反应条件37℃,1h。
磁珠的预处理:AMpure XP磁珠(Beckman)用等体积的ddH2O漂洗4-5次后,用原保存液保存备用。
纯化体系的建立:配置1.0%~1.2%琼脂糖凝胶,检测PCR产物条带是否正确;使用0.8X磁珠纯化;使用Qubit 4.0检测浓度,产物备用。
适用的仪器机型:本发明的一个实施方案中,所述方法通过Sequel和Sequel2/2e机型实现。ADTKD致病基因的突变检测效果一致,不存在机型间的差异性。
本发明的重难点在于适当分析方法的建立,以便给出临床准确的ADTKD基因诊断和基因分型判别。针对三代基因测序数据产出模式和错误类型,有针对性地进行校正和分析。
本发明还提供用于ADTKD基因突变检测的方法,其中,UMOD,HNF1B,REN,SEC61A1这四个基因的分析方法一致,包含分析步骤如下:
步骤1:数据进行单分子孔内校正,对结果进行优选和过滤。优选方式设定最小的预测准确率为90%,从而过滤掉低于准确率低于0.9的原始数据。
步骤2:过滤后进行不同数据的拆分,对结果进行优选和过滤。过滤掉拆分准确率低于0.95的原始数据。
步骤3:与参考基因组进行序列比对。
步骤4:用卷积神经网络进行DNA序列变异位点检测,针对SNP和small InDel进行检测。DeepVariant是Google公司研发的针对全基因组测序变异位点检测的新算法,这个算法不同于一般的统计软件,而是利用了卷积神经网络识别变异位点。效果十分理想,超过了现有算法,很灵活。Deepvariant可以运用到包括二代和三代数据测序中。输入包含参考基因组,比对过的待分析序列,待分析区域,输出包含vcf和gvcf等变异文件。整个过程运行时间约为5分钟到10分钟。
步骤5:基因组注释,采用annovar软件。对步骤4中产生的vcf文件进行注释,以hg19作为参考基因组,选择refGene,cytoband等9个数据库。注释完成后产生csv文件,包含突变相关注释信息,以及和不同数据库比较得出的显著程度。
本发明还提供用于ADTKD基因突变检测的方法,其中,MUC1基因突变的分析方法,步骤如下:
步骤1:数据进行单分子孔内校正,对结果进行优选和过滤。优选方式设定最小的预测准确率为90%,从而过滤掉低于准确率低于0.9的原始数据。
步骤2:过滤后进行不同数据的拆分,对结果进行优选和过滤。优选设定最小的标签拆分分值为55,过滤掉拆分准确率低于0.75的原始数据。
步骤3:基于多重序列比对进行数据聚类和统计分析,优选聚类结果。拆分后保留的数据进行多重序列比对,相似数据进行聚类。优选99.99%以上高准确率的聚类结果。
步骤4:用原始数据进行碱基位再校正,获得聚类结果的各碱基位准确率,对结果进行优选。优选99.99%以上高准确率的聚类结果。
步骤5:结合PCR实验数据,对碱基位再校正的聚类结果进行优选,从而获得准确的突变判别。优选符合PCR产物长度的聚类结果,过滤PCR副产物结果。
与二代外显子捕获WES相比,本发明中的方法靶向五个基因的基因区段,测序长度在1.6kbp到3kbp之间,无需将基因达成300bp左右的短片段,直接获得靶向全长序列,同时通过循环一致序列分析,对于突变和indel的检测准确度更高。尤其对于MUC1基因,该方法克服了WES无法准确拼接比对该基因重复区域的缺点,能够获得准确的循环一致序列,直观鉴定重复区域个数和突变位点,解决了WES无法检测该基因突变的难题。
本发明的有益效果在于:
(1)本发明提供了ADTKD的五个致病基因(UMOD,MUC1,HNF1B,REN和SEC61A1)突变检测的实验方法和分析方法。以往使用的WES方法只能解决其中四个基因(UMOD,HNF1B,REN和SEC61A1)的突变检测,漏检ADTKD第二大常见亚型MUC1的基因突变,经常导致很多临床漏诊的发生。本发明不仅提供了基于目前ADTKD疾病专家共识的五个基因突变的一次性检测,以及准确的基因分型和突变位点信息,而且节约了患者的检测成本,减少了ADTKD疑诊患者检测等待时间。
(2)本发明解决了ADTKD疑诊患者的疾病筛查和诊断难题,对ADTKD临床疑诊患者的疾病诊断以及家族成员的基因突变筛查和治疗干预,具有十分重要的意义。本发明对于ADTKD疑似患者的确诊和指导治疗,对于有捐肾意愿的肾功能正常家族成员的术前评估,对于具有ADTKD风险的健康人群进行早期筛查,以及对于成人接受胚胎植入前进行遗传学诊断和优生优育都具有重要意义。
(3)本发明包含有效的PCR扩增体系、有效的建库体系,PCR体系和建库体系的配合使用,降低了五个基因突变检测的实验成本,并且适用机型广泛,包括Sequel和Sequel2/2e机型均可适用。
(4)本发明包含优化的检测体系,所需的全血用量约200ul,可提取的血细胞DNA产量平均约为4-10ug,足以满足ADTKD五个致病基因的突变检测。全血用量少、检测准确度、检测灵敏度高。
(5)本发明提供了优化的校正和分析方法,可获得准确的ADTKD五个致病基因的突变判读,准确率可达99.99%,解决了三代单分子实时测序原始数据准确率不高对于基因突变判别不精确的问题,为临床提供了更为可靠的结论。
附图说明
图1-5为实施例中14个PCR产物电泳结果图(样本0、样本1、样本2、样本3、样本4、样本5、样本6)。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例1
本实施例提供一种用于ADTKD的基因诊断和基因分型方法,涵盖UMOD,MUC1,HNF1B,REN,SEC61A1五个基因目前文献报导的所有影响编码蛋白的突变位点的区域突变诊断,包含14对PCR扩增引物、文库构建试剂盒、16个样品混样上机测序标签接头序列和长片段测序序列突变分析方法。
本实施例中,所述DNA扩增酶选择Takara公司的DNA polymerase;
所述纯化用磁珠选自Beckman公司的AMPure XP Beads。
其中,所述纯化用磁珠的制备方法为:
1)重悬AMpure XP beads,取出500ul,16000rpm离心1min,放在磁力架上取出上清到新管中保存。
2)在磁珠上加入1ml水,重悬,16000rpm离心1min,放在磁力架上取出上清丢弃;重复4-5次。
3)取1ml 10mM Tris-HCl(pH8.5)加入到beads中,混匀重悬,16000rpm离心1min,放在磁力架上取出上清丢弃。
4)将第一步中保存的上清加入到beads中,重悬。此为处理好的beads,可放于4℃保存备用。
所述DNA修复酶选择NEB Next FFPE DNA Repair Mix。
所述DNA末端补平酶选择NEBNext end repair enzyme mix。
所述DNA连接酶选自thermofisher公司的T4 DNA ligase,5U/ul。
所述DNA外切酶选自Exonuclease VII(NEB),Exonuclease III(NEB)。
其中,14对PCR扩增引物M1-M28为:
本发明设计的14对引物中,M1-M6,M23-M24对应UMOD基因,M7-M10对应SEC61A1基因,M11-M12对应REN基因,M13-M22,M25-26对应HNF1B基因,M27-M28对应MUC1基因。
本发明提供用于ADTKD基因突变检测的试剂盒,除了包括上述引物外,还包括样品上机测序标签接头,所述样品上机测序标签接头选择以下中的一种或几种。
使用时,做几个样品就需要加入几个标签接头,本发明提供了16种标签接头,所以,可以一次同时进行16个样品的检测。
实施例2
基于实施例1中提供的检测ADTKD的基因诊断和基因分型的试剂盒,本实施例建立扩增体系。
具体而言,该试剂盒中检测MUC1基因突变使用时,PCR反应混合物体系为:每个反应混合物体系50μl,包含200ng的基因组DNA模板,5×Reaction Buffer 10μl,dNTP(2.5mMeach)4μl,DNA Polymerase 1μl,引物F(10μM引物,HPLC级别)1μl,引物R(10μM引物,HPLC级别)1μl,补ddH2O至总体积50μl。引物F、引物R选自M27-28,M27-M28对应MUC1基因。
MUC1基因PCR反应体系的建立时,可以同时扩增8管。
PCR反应热循环条件为:105℃热盖预热,98℃保温5min,然后进入30个循环(采用两步法热循环条件):变性温度98℃保温10s(第1至第30个循环),接着进入退火和延伸温度:74℃保温4min(第1至第5个循环)/72℃保温4min(第6至第10个循环)/70℃保温4min(第11至第15个循环)/68℃保温4min(第16至第30个循环)。最后的延伸温度68℃保温10min,随后保温在4℃。
即,扩增反应条件如下:
98℃,5min;
98℃,10s,74℃,4min;5个循环;
98℃,10s,72℃,4min;5个循环;
98℃,10s,70℃,4min;5个循环;
98℃,10s,68℃,4min;5个循环;
68℃,10min;
4℃,∞。
具体而言,该试剂盒中检测UMOD,HNF1B,REN,SEC61A1四个基因突变时,PCR反应体系为:
基因组DNA模板:100ng
5×Reaction Buffer:5μl,
dNTP(2.5mM each):2μl,
DNA Polymerase:0.5μl,
引物F(10μM引物,HPLC级别)0.5μl,
引物R(10μM引物,HPLC级别)0.5μl,
补ddH2O至总体积25μl。
其中,引物F、引物R分别指对应于检测UMOD,HNF1B,REN,SEC61A1四个基因突变使用的引物,检测UMOD基因突变时,引物F、引物R选自M1-M6,M23-M24;检测HNF1B基因突变时,引物F、引物R选自M13-M22,M25-26;检测REN基因突变时,引物F、引物R选自M11-M12;检测SEC61A1基因突变时,引物F、引物R选自M7-M10。
以上引物F、引物R用量为10μM引物是指每个引物需要10μM。
由于有13对对应于检测UMOD,HNF1B,REN,SEC61A1四个基因突变使用的引物,所以,实际使用时,具体有13个PCR反应体系,不过这些不同的反应体系除了引物不同以外,其他相同,使用时各自扩增一管。
PCR反应热循环条件为:105℃热盖预热,98℃保温5min,然后进入30个循环(采用两步法热循环条件):变性温度98℃保温10s(第1至第30个循环),接着进入退火和延伸温度68℃保温2min 30sec。最后的延伸温度68℃保温5min,随后保温在4℃。
即,扩增反应条件如下:
98℃,5min;
98℃,10s,68℃,2min 30sec;30个循环;
68℃,5min;
4℃,∞。
扩增产物用1.0%-1.2%的琼脂糖凝胶电泳检测扩增产物的片段大小。
纯化体系的建立:配置1.0%~1.2%琼脂糖凝胶,检测PCR产物条带是否正确;使用0.8X磁珠纯化(磁珠采用实施例4设计的纯化用磁珠);使用Qubit 4.0检测浓度,产物备用。
实施例3
由于PCR反应的扩增效率不同,要想获得测序丰度一致的结果,需要优化PCR产物的混合比例。本实施例提供如何获得每个PCR产物的混样体积。
本实施例提供13个PCR产物获得测序丰度一致的混样方式。通过调整13个PCR产物混样的比例,调整扩增效率以及建库过程中回收效率等的影响。通过等体积混合上样,最终产生测序reads数的比例调整混样比例,实现多个靶向目标条带等比例测序数据输出。
13个扩增区域是指13对引物对应的扩增区域。其中,M1-M6,M23-M24对应UMOD基因,M7-M10对应SEC61A1基因,M11-M12对应REN基因,M13-M22,M25-26对应HNF1B基因。
具体混合方式见下表:
通过该比例混合后,上机测序,临床样品测序丰度基本一致,见下表:
靶向序列名称
样本3-reads数
样本4-reads数
样本5-reads数
扩增区域1
6937
8354
9661
扩增区域2
6365
7896
7686
扩增区域3
5869
5469
5732
扩增区域4
6093
7985
7617
扩增区域5
7551
9937
8463
扩增区域6
6533
8958
8449
扩增区域7
6057
7370
5280
扩增区域8
8141
8559
8062
扩增区域9
4815
7111
6227
扩增区域10
7536
9326
8461
扩增区域11
6535
8696
8095
扩增区域12
6175
8218
6861
扩增区域13
5263
7159
5736
实施例4
纯化用磁珠、接头序列制备和酶反应体系的设计。为了降低建库成本,采用市售的磁珠和酶进行反应体系优化,之后完成文库构建。本实施例进行纯化用磁珠、接头序列和酶反应体系的设计,包含纯化用磁珠的制备方法、接头序列的设计和制备方法、修复酶反应体系、连接酶反应体系、酶切酶反应体系以及合适的反应条件设计。
纯化用磁珠制备:
1)重悬AMpure XP beads,取出500ul,16000rpm离心1min,放在磁力架上取出上清到新管中保存。
2)再磁珠上加入1ml水,重悬,16000rpm离心1min,放在磁力架上取出上清丢弃;重复4-5次。
3)取1ml 10mM Tris-HCl(pH8.5)加入到beads中,混匀重悬,16000rpm离心1min,放在磁力架上取出上清丢弃。
4)将第一步中保存的上清加入到beads中,重悬。此为处理好的beads,可放于4℃保存备用。
接头序列制备:
1)三代测序特有的接头序列,用10mM Tris-HCl(pH7.5)溶液,将引物溶解至170μM,准备200mM Tris-HCl(pH7.5)溶液和2M NaCl溶液,将其1:1混合为母液。
2)吸取10μl引物、10μl母液,加水80μl将引物稀释至17μM;95℃,5min。运行完成后迅速取出,20~25℃室温静置12h以上;-20℃保存备用。
修复酶反应体系:
1)DNA样本53.5ul,FFPE DNA修复体系(10X)6.5ul,NEB Next FFPE DNA修复酶2ul;20℃,15min。
2)修复后的DNA样本62ul,FFPE DNA末端补平修复体系(10X)3.5ul,NEBNext FFPE末端补平酶5ul;ddH2O 29.5ul;20℃,30min。
3)0.8X磁珠纯化。
连接酶反应体系:
1)末端补平修复后的DNA样本23ul,接头序列(17uM)1ul,10X T4 DNA连接酶体系2ul,T4 DNA连接酶(5U/ul)6ul;22℃,过夜连接。
2)65℃,10min,失活。
酶切酶反应体系:
1)接头连接后的DNA样本40ul,DNA外切酶Exonuclease VII 0.5ul,DNA外切酶Exonuclease III 0.5ul;37℃,1h。
2)0.8X磁珠纯化。
实施例5
本实施例提供5个基因突变检测结果判读的方法。
本实施例中MUC1突变检测结果判读是依据自行开发的数据分析方法,该方法适用于长片段PCR扩增产物经三代单分子实时测序产出的数据(PacBio SMRT数据)。根据数据特点,校正和分析系统包含数据校正模块、数据拆分模块、聚类分析模块、碱基位再校正模块和突变判别模块。该方法可以获得99.99%的突变判别准确率。并且结合实验结果尽心MUC1突变检测结果判读。
数据校正模块的具体实施过程如下:对各个有效数据坐标孔进行孔内subreads校正,过滤掉准确率低于0.9的原始数据。经过单孔数据校正,每个坐标孔获得较高准确率的单一数据read,舍弃数据质量不够高的孔。
数据拆分模块的具体实施过程如下:以引物和样本标签为数据拆分依据,设定最小的数据拆分分值为55,过滤掉拆分准确率低于0.75的原始数据。经过数据拆分步骤,同批次检测的不同样本数据获得较高准确率的拆分,舍弃无法进行较高准确率的数据。
聚类分析模块的具体实施过程如下:对每个样本拆分后保留的数据进行多重序列比对,实施对不同的PCR产物的数据聚类和统计分析。优选99.99%以上高准确率的聚类结果。保留下来的高质量数据全部聚类可以保留优势的和非优势的PCR扩增产物。然后对聚类结果进行统计分析,给出覆盖率和读长。
碱基位再校正模块的具体实施过程如下:通过孔位信息,获得每个聚类结果对应的原始数据孔位。用不少于3000个subreads的原始数据对聚类结果的各个碱基位进行再校正,获得聚类结果的各碱基位准确率,优选99.99%以上高准确率的聚类结果。严格执行的聚类标准以及碱基位再校正结果可以实现高准确率的单一碱基突变的检测分析。偶有碱基位质量不佳的情况,也可以准确发现。
突变判别模块的具体实施过程如下:结合PCR实验数据,对碱基位再校正的聚类结果进行优选,从而获得准确的突变判别。优选符合PCR产物长度的聚类结果,过滤PCR副产物结果。
对碱基位再校正的聚类结果进行优选,从而获得准确的突变判别。优选符合PCR产物长度的聚类结果,过滤PCR副产物结果。结合PCR实验数据,对碱基位再校正的聚类结果进行优选,从而获得准确的突变判别。优选符合PCR产物长度的聚类结果,过滤PCR副产物结果。
本实施例所述的另外4种突变检测结果判读是依据自行开发的数据分析方法,与人类参考基因组hg19进行比对,用卷积神经网络进行DNA序列变异位点检测,针对SNP和small InDel进行检测,并使用Annovar软件进行基因组注释。
实施例6:临床样本检测结果
本实施例选用7例临床疑诊样本(样本0、样本1、样本2、样本3、样本4、样本5、样本6),采集临床疑诊病理的全血,提取白细胞DNA进行实验。
本实施例选用7例临床疑诊样本DNA进行实验,具体而言:
该试剂盒中检测MUC1基因突变使用时,PCR反应混合物体系为:每个反应混合物体系50μl,包含200ng的基因组DNA模板,5×Reaction Buffer 10μl,dNTP(2.5mM each)4μl,DNA Polymerase 1μl,引物F(10μM引物,HPLC级别)1μl,引物R(10μM引物,HPLC级别)1μl,补ddH2O至总体积50μl。同时扩增8管。
PCR反应热循环条件为:105℃热盖预热,98℃保温5min,然后进入30个循环(采用两步法热循环条件):变性温度98℃保温10s(第1至第30个循环),接着进入退火和延伸温度:74℃保温4min(第1至第5个循环)/72℃保温4min(第6至第10个循环)/70℃保温4min(第11至第15个循环)/68℃保温4min(第16至第30个循环)。最后的延伸温度68℃保温10min,随后保温在4℃。
即,扩增反应条件如下:
98℃,5min;
98℃,10s,74℃,4min;5个循环;
98℃,10s,72℃,4min;5个循环;
98℃,10s,70℃,4min;5个循环;
98℃,10s,68℃,4min;5个循环;
68℃,10min;
4℃,∞。
该试剂盒中检测UMOD,HNF1B,REN,SEC61A1四个基因突变使用时,PCR反应体系为:每个反应混合物体系25μl,包含100ng的基因组DNA模板,5×Reaction Buffer 5μl,dNTP(2.5mM each)2μl,DNA Polymerase 0.5μl,引物F(10μM引物,HPLC级别)0.5μl,引物R(10μM引物,HPLC级别)0.5μl,补ddH2O至总体积25μl。各自扩增1管。
PCR反应热循环条件为:105℃热盖预热,98℃保温5min,然后进入30个循环(采用两步法热循环条件):变性温度98℃保温10s(第1至第30个循环),接着进入退火和延伸温度68℃保温2min 30sec。最后的延伸温度68℃保温5min,随后保温在4℃。
即,扩增反应条件如下:
98℃,5min;
98℃,10s,68℃,2min 30sec;30个循环;
68℃,5min;
4℃,∞。
扩增产物用1.0%-1.2%的琼脂糖凝胶电泳检测扩增产物的片段大小。如图1-5所示。
PCR产物纯化,混样:
MUC1 PCR产物和13个针对于UMOD,HNF1B,REN,SEC61A1四个基因突变检测的PCR产物按比例3:1混合后,经0.8X磁珠纯化,进行浓度测定,结果见表。
然后进入建库流程,依次进行修复酶反应、连接酶反应和外切酶反应,进行浓度测定,获得文库备用:
修复酶反应体系:
1)DNA样本53.5ul,FFPE DNA修复体系(10X)6.5ul,NEB Next FFPE DNA修复酶2ul;20℃,15min。
2)修复后的DNA样本62ul,FFPE DNA末端补平修复体系(10X)3.5ul,NEBNext FFPE末端补平酶5ul;ddH2O 29.5ul;20℃,30min。
3)0.8X磁珠纯化,并进行浓度测定,结果见表。
连接酶反应体系:
1)末端补平修复后的DNA样本23ul,接头序列(17uM)1ul,10X T4 DNA连接酶体系2ul,T4 DNA连接酶(5U/ul)6ul;22℃,过夜连接。
2)65℃,10min,失活。
外切酶反应体系:
1)接头连接后的DNA样本40ul,DNA外切酶Exonuclease VII 0.5ul,DNA外切酶Exonuclease III 0.5ul;37℃,1h。
2)0.8X磁珠纯化,并进行浓度测定,结果见表。此时即为获得的文库。
使用PacBio SMRT标准体系进行上机实验,获得数据后进入数据校正和分析流程:首先对数据进行单分子孔内校正,过滤掉低于准确率低于0.9的原始数据。接着进行不同数据的拆分,过滤掉拆分准确率低于0.75的原始数据。然后进行数据聚类,优选99.99%以上高准确率的聚类结果。最后用原始数据进行碱基位再校正,优选99.99%以上高准确率的聚类结果。
MUC1通过对聚类结果进行人工独立分析,对其突变位点进行准确确认。其它13个PCR序列位点,与人类参考基因组hg19进行比对,用卷积神经网络进行DNA序列变异位点检测,针对SNP和small InDel进行检测,使用Annovar软件进行基因组注释。
同时,对这7例疑似样本进行二代外显子捕获测序,进行突变检测分析。MUC1由于注释不完善,且高度重复,二代测序呈现出无法准确鉴定序列的现象,其它13个PCR靶向序列获得的突变结果与PacBio SMRT测序分析结果进行对比,发现ADTKD相关基因突变检测结果高度统一。
具体突变检测结果见下表:
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。