一组食管癌甲基化预后标志物及其应用
技术领域
本发明涉及生物
技术领域
,具体涉及一组食管癌甲基化预后标志物及其应用。背景技术
食管癌原发于食管黏膜上皮,是世界范围内常见的消化系统恶性肿瘤,其死亡率位居恶性肿瘤死亡率的第六位,发病率位居第八(Liang et al.,2017;Siegel et al.,2016)。食管癌包括鳞状细胞癌和腺癌两种主要的组织亚型(Rustgi and El-Serag,2014),大约80%的食管癌病例都出现在不发达国家,而这些病例中的60%都发生在中国(Ferlayet al.,2010)。近年来,食管腺癌(Esophageal adenocarcinoma,EAC)主要分布在西方国家,其发病率迅速上升,而食管鳞状细胞癌(Esophageal squamous cell carcinoma,ESCC)则主要发生在东亚和非洲地区的一些国家(Brown et al.,2008;Zeng et al.,2016)。食管鳞癌占全球食管癌总病例数的80%左右(Kamangar et al.,2006),主要发生在中国,其中每年约有35万人死于这种恶性肿瘤(Wang et al.,2014)。与许多其他肿瘤一样,食管鳞癌的早期诊断对于患者预后有很大的改善。由于缺乏有效的早期诊断方法,大部分食管鳞癌患者确诊时就已处于疾病晚期,甚至超过一半的患者在疾病确诊时就已发生远处转移,导致患者五年生存率不足30%(Besharat et al.,2008;Enzinger and Mayer,2003)。目前食管鳞癌的发病机制仍未被完全阐明,这是影响其治疗的主要瓶颈。
肿瘤是多种因素参与、经多阶段变化累积的十分复杂的病变过程,涉及基因组改变、表观遗传改变、转录组改变以及信号通路紊乱等多层次的复杂调控。此前,已有多项全基因组或外显子组测序研究全面地概括了食管鳞癌中基因组水平的改变,同时表观遗传方面的研究也显示了多个分子水平的变化,例如DNA甲基化、组蛋白乙酰化和RNA编辑等。另外,流行病学研究提示可能与某些环境因素以及烟酒等生活方式有关(Islami et al.,2011;Morita et al.,2010;Toh et al.,2010;Zhang et al.,2012)。表观遗传改变又极易受到环境因素影响而改变遗传物质,可谓集合了环境与遗传双重因素的影响。近年来表观遗传改变在恶性肿瘤发生发展中的作用越来越受到重视,与其他肿瘤一致,食管鳞癌基因组中包含异常的局部高甲基化区域和广泛的低甲基化区域,这些表观基因组的畸变共同导致食管鳞癌的发生和发展,例如抑癌基因的表观遗传沉默、超级增强子激活和RNA编辑(Linet al.,2018)。
随着检测技术的发展,肿瘤中DNA甲基化的改变被认为是开发有效的诊断和预后生物标志物的潜在靶标。因此,目前已有大量基于DNA甲基化的生物标志物方面的研究报道,包括肺癌、结直肠癌和胃癌等多种肿瘤的诊断预测(Okugawa et al.,2015;Tahara andArisawa,2015;Walter et al.,2014),并且一些甲基化标志物已被商业化。
发明内容
为提供更准确高效的预测食管癌患者预后的标志物,发明人收集了91例患者的医疗记录和样本,对癌组织和癌旁组织进行甲基化测序分析后,通过单因素cox回归和多因素cox回归分析,构建了预后模型,并且使用网络数据库的数据对模型进行了验证,本发明所提供的甲基化预后标志物及其构成的预测模型对临床诊断具有极大的实用价值。
第一方面,本发明提供了一组食管癌甲基化预后标志物的组合,所述组合包括以下甲基化位点的2个、3个、4个:cg02370667、cg23378365、cg06090867、cg03244277。
具体地,所述cg02370667是16号染色体上的第84029511位,该位点所在的基因是NECAB2,其在甲基化位点分类中属于CpG岛。
所述cg23378365是5号染色体上的第156696351位,该位点所在的基因是CYFIP2,其在甲基化位点分类中属于S_Shelf(CpG岛下游2-4kbp)。
所述cg06090867是1号染色体上的第20511782位,该位点所在的基因是UBXN10,其在甲基化位点分类中属于N_Shore(CpG岛上游0-2kbp)。
所述cg03244277是4号染色体上的第75310450位,该位点所在的基因是AREG,其在甲基化位点分类中属于N_Shore(CpG岛上游0-2kbp)。
具体地,所述cg02370667在患者中的甲基化程度高,患者预后更差
所述cg23378365在患者中的甲基化程度高,患者预后更差
所述cg06090867在患者中的甲基化程度高,患者预后更差
所述cg03244277在患者中的甲基化程度高,患者预后更差。
优选地,所述食管癌包括但不限于食管鳞癌、食管腺癌、食管淋巴瘤、食管平滑肌肉瘤和食管转移性癌。
优选地,所述食管癌是食管鳞癌。
优选地,所述组合还可以包括其他甲基化位点。
优选地,所述其他位点包括位于结构基因和/或非结构基因上的位点。
优选地,所述非结构基因包括顺式作用元件和/或反式作用元件。
优选地,所述食管癌甲基化预后标志物的组合还可以与其他食管癌预后标志物连用。
优选地,所述预后的指标包括客观缓解率(Objective Response Rate,ORR)、总体存活率(Overall survival rate,Overall survival,OS)、无进展生存期(pro gression-free survival,PFS)、疾病进展时间(time to progress,TTP)、无病生存期(Disease-freesurvival,DFS)、治疗失败时间(time to treatment failure,TT F)、应答率(RR)、完全应答(CR)、部分应答(PR)。
优选地,所述预后的指标是总体存活率(Overall survival rate,Overallsurvival,OS)。
优选地,所述预后的指标是100月以内的总体存活率。优选地,60个月以内的总体存活率。更优选地,50个月以内的总体存活率。
优选地,所述预后的指标是也可以是1~5年以内的总体存活率。具体地,所述1~5年是1年、2年、3年、4年、5年。
另一方面本发明提供了一种可以预测食管癌预后的试剂盒,所述试剂盒中包括检测前述组合中至少一种标志物的甲基化检测试剂。
优选地,所述甲基化检测试剂包括以下任意一种或多种甲基化检测方法所使用的试剂,所述甲基化检测方法包括:全基因组重亚硫酸盐测序(WGBS)、焦磷酸测序(Pyrosequencing)、亚硫酸氢盐测序、甲基化特异性聚合酶链式反应(甲基化特异性PCR,Methylation-Specific PCR,MS-PCR)、亚硫酸氢盐特异性聚合酶链式反应、甲基化敏感限制性内切酶-PCR/Southern法、结合重亚硫酸盐的限制性内切酶法(Combined BisulfiteRestriction Analysis,COBRA)、数字聚合酶链式反应、限制性界标基因组扫描、CpG岛微阵列、单核苷酸引物延伸SNUPE、甲基化图谱分析(Methylation Profiling)、甲基化芯片中一种或多种方法所使用的试剂。
优选地,所述试剂盒中还包括处理样品的试剂。
优选地,所述处理可以包括提取DNA的步骤、使胞嘧啶转化为尿嘧啶的步骤。
优选地,所述使胞嘧啶转化为尿嘧啶的步骤所使用的试剂最常见的是亚硫酸氢盐试剂。
优选地,所述亚硫酸氢盐试剂包括亚硫酸氢盐缓冲液和保护缓冲液。
优选地,所述亚硫酸氢盐选自重亚硫酸钠、亚硫酸钠、亚硫酸氢钠、亚硫酸氢铵和亚硫酸铵中的一种或多种。经过亚硫酸氢盐试剂处理的DNA,其未经过甲基化的胞嘧啶核苷酸将转化为尿嘧啶,而甲基化的胞嘧啶及其他碱基维持不变,因此可以区分例如CpG二核苷酸序列中的甲基化和未甲基化胞苷。
优选地,所述提取DNA的提取试剂可以包括裂解缓冲液、结合缓冲液、清洗缓冲液和洗脱缓冲液。
优选地,所述裂解缓冲液包括蛋白变性剂、去垢剂、pH缓冲剂和核酸酶抑制剂组成。
优选地,所述结合缓冲液包括蛋白变性剂和pH缓冲剂组成。
优选地,所述去垢剂包括但不限于Tween20、IGEPAL CA-630、Triton X-100、NP-40和SDS。
优选地,所述pH缓冲剂包括Tris、硼酸、磷酸盐、MES和HEPES中的一种或多种。
优选地,所述核酸酶抑制剂包括EDTA、EGTA和DEPC中的一种或多种。
优选地,所述样品包括:血液、食管上皮细胞、组织、尿液、唾液、精液、乳汁、脑脊髓液、泪液、痰、粘液、淋巴、胞液、腹水、羊水。
优选地,所述血液包括血浆、血清或全血。
优选地,所述样品是组织。
优选地,所述试剂盒中还可以包括临床指标检测所需要的仪器和/或试剂。
优选地,所述临床指标检测包括基础化验,如血常规、肝肾功、血糖、电解质。
另一方面本发明提供了检测前述组合中至少一种甲基化预后标志物的甲基化检测试剂、前述一种可以预测食管癌预后的试剂盒在预测食管癌预后中的用途。
另一方面本发明提供了一种预测食管癌预后的方法,所述方法包括检测前述组合中至少一种甲基化预后标志物在受试者中的甲基化程度的步骤。
优选地,所述受试者是诊断为患有食管癌的患者,所述方法可以将受试者分层成高风险/低风险,代表患者的预后状况。
本文中使用的术语”受试者”是指任何动物(例如,哺乳动物),包括但不限于人、非人灵长类动物、啮齿类动物等,其将成为特定治疗的接受者。通常,术语“受试者”和“患者”在涉及人受试者时在本文中可互换地使用。
优选地,所述受试者是人。
优选地,所述方法包括定性地、定量地、或半定量的方法。
附图说明
图1是本发明的模型和每个甲基化位点在收集的患者样本和TCGA数据集中进行生存分析的结果,A是使用本发明模型对收集的患者样本进行的分析,B是使用本发明模型对数据库的分析,C是使用cg02370667对收集的患者样本进行的分析,D是使用cg23378365对收集的患者样本进行的分析,E是使用cg06090867对收集的患者样本进行的分析,F是使用cg03244277对收集的患者样本进行的分析。
图2是使用患者信息验证本发明模型的ROC曲线图。
图3是使用数据库信息验证本发明模型的ROC曲线图。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
实施例1、收集数据并构建预后模型
研究对象
2010年至2014年期间,我们共收集了来自中国医学科学院肿瘤医院和浙江省肿瘤医院的91例食管鳞癌患者。所有研究对象的籍贯、民族、性别、诊断年龄、饮酒情况、吸烟情况、肿瘤发生部位和临床分期等人口学特征和临床资料均获自各患者的医疗记录。本研究入组患者均已知情同意,中国医学科学院肿瘤医院和浙江省肿瘤医院伦理审查委员已批准相关研究。
我们以第七版AJCC为标准进行ESCC患者临床分期判读,按照下列标准定义患者的吸烟和饮酒状态:将每天吸烟<1支且持续时间<1年的人判为为不吸烟者,反之为吸烟者;将每周饮酒次数≥2且饮酒时间≥1年者判为饮酒,反之定为非饮酒者。我们通过以下方式完成患者生存情况随访:研究对象入院记录、家属提供的确认信息和患者户籍所在地相关部门提供的确认信息,我们进行患者随访的末次时间为2018年11月,总共时长达5年。
我们以临床病理诊断报告为标准,进行患者病理类型的判断。在手术前,研究入组患者都没有进行化疗药物或放射治疗。研究对象经食管癌切除术后,我们选取每个患者的癌组织和癌旁组织(距离肿瘤部位边缘5cm以外)进行后续的研究工作。我们按照严格的流程进行样本的入组筛选,本课题最终选入患者的基本临床资料分布情况见表1。
表1食管鳞癌患者临床病理资料分布
*上段:20–25厘米;中段:25–30厘米;下段:30–40厘米。
#根据食管癌AJCC第七版进行肿瘤TNM分期的评定。
肿瘤细胞含量鉴定
首先,我们获得入组患者-80℃冷冻保存的癌和癌旁组织;接着,我们使用冷冻包埋剂对未解冻的组织及时进行处理,待包埋剂固定后进行冰冻切片;然后,按照本实验室常规流程进行H&E(hematoxylin-eosin staining,H&E)染色,并使用中性树胶对完成染色的切片进行封片;最后,我们选择两名以上的病理学专家来判断癌细胞含量,以满足以下两条规则:(1)癌组织中癌细胞含量≥70%,(2)癌旁组织中不含癌细胞。
甲基化测序及分析
提取DNA,通过NanoDrop 2000检测、Qubit检测、跑电泳等方式确认DNA可以满足后续DNA甲基化检测的质量要求。对DNA样品进行亚硫酸盐转化后,使用Illumina 450K甲基化芯片(Illumina Human Methylation 450K BeadChip)进行甲基化测序。
Illumina 450K甲基化芯片共包含485,512个甲基化位点,覆盖了99%的编码基因,还包括其他的基因组位置:(1)96%的CpG岛;(2)CpG岛以外的位点;(3)存在于干细胞中的非CpG位点;(4)正常组织与多种肿瘤组织中存在差异的位点;(5)FANTOM 4启动子;(6)DNA酶超敏位点;(7)miRNA启动子区。450K芯片的检测准确性已经得到了两个研究机构的独立验证(Bibikova et al.,2011;Sandoval et al.,2011)。
数据分析
选择Wilcoxon rank-sum检验对癌和癌旁样本的DNA甲基化水平进行配对样本的统计检验,鉴别了35,577个差异甲基化位点(FDR值<0.05,△β>0.2)。为了全面探究DNA甲基化标志物在食管鳞癌预后预测的效能,我们构建了一个严格的统计流程基于上述差异甲基化位点进行预后标志物的鉴别:
(1)基于单因素cox回归筛选与患者生存显著相关的甲基化位点(P<0.05);
(2)基于多因素cox回归进一步筛选出4个与患者生存显著相关的甲基化位点(校正年龄、性别、吸烟、饮酒、TNM分期)(P<0.05),所筛选到的甲基化位点的详细信息如下表2所示,系数、P值、风险比、置信区间的信息如表3所示,
表2.多因素cox回归筛选的甲基化位点信息
表3.系数、P值、风险比、置信区间的信息
Markers
coefficients
P_value
HR
95%CI下限
95%CI上限
cg06090867
0.56500274
0.03749288
1.75945261
1.03323766
2.99609046
cg03244277
0.81793722
0.00279055
2.26582113
1.32545928
3.87333315
cg23378365
0.58735626
0.03652733
1.79922543
1.03749569
3.12021745
cg02370667
0.78070752
0.00526101
2.18301624
1.26160139
3.77738956
(3)我们以每个位点的甲基化水平与各自风险比(HR)自然对数的乘积之和(具体公式为:cg02370667*0.7807075+cg23378365*0.5873563+cg06090867*0.5650027+cg03244277*0.8179372)作为预测评分对患者进行预后分层;
(4)在我们和TCGA数据集(下载网址:http://gdac.broadinstitute.org/,共包含95个食管鳞癌和14个癌旁样本的450K甲基化芯片数据)中计算预后评分并进行生存分析,对患者样本中的分析结果如图1A,对数据库的分析结果如图1B。
并且,以收集的患者数据中,对每个甲基化位点单独进行生存分析,探索每个甲基化位点单独作为预后标志物的可能性,cg02370667的结果如图1C,cg23378365的结果如图1D,cg06090867的结果如图1E,cg03244277的结果如图1F。
(5)再次验证本发明的模型在1年、3年和5年时预测的准确性;使用患者信息验证的ROC曲线如图2所示,使用数据库信息验证的ROC曲线如图3所示,说明本发明提供的模型可以预测食管癌患者的预后。