与谷子黄色素含量相关的分子标记及其应用
技术领域
本发明涉及生物
技术领域
,尤其是涉及与谷子黄色素含量相关的分子标记及其应用。背景技术
谷子(Setaria italica(L.)Beauv)是起源于我国的古老粮食作物,具有耐旱、耐贫瘠、适应性广等特征,在我国北方地区广泛种植。谷子去皮后俗称小米,其营养价值丰富,含有人体必需的微量元素和多种必需氨基酸,蛋白质、脂肪以及维生素的含量也很高。谷子的品质主要包括外观品质,营养品质和蒸煮品质等,其中外观品质和营养品质是消费者评价小米好坏最直接也是最首要选择的指标。在外观品质中,小米黄色的色泽深浅是最主要的关注因素,而色泽深浅主要是小米的类胡萝卜素等黄色素含量决定的。
黄色素是谷子籽粒中的天然色素,其主要成分为类胡萝卜素。类胡萝卜素是维生素A的前体,维生素A对人体健康有诸多好处,不仅具有保护视觉与上皮细胞的作用,而且可以提高人体免疫力,预防多种癌症,同时对口腔溃疡、皮肤病等都有很好的预防和治疗效果。小米中类胡萝卜素的主要成分为叶黄素和玉米黄质。小米黄色素的含量与其表观色泽显著相关,黄色素含量高则小米的黄度高,黄色的小米更加受到消费者的青睐,如市场上广受欢迎的晋谷21和中谷2等,都是黄色素含量高色泽鲜艳的品种。
谷子是我国起源的北方旱地主要农作物,在其历史悠久的栽培过程中,积累了多种类型的黄色素含量的谷子品种。在育种过程中选择黄色素含量高的品种,增加维生素A的浓度,同时提高小米的外观品质,一直是谷子育种家的追求。过去的谷子品质育种多是在品种间杂交后代的早代进行产量性状的单株选择,在株系稳定后的高代才进行米质鉴定。杂交后代的早代是单株选择,单株很难进行米质鉴定。即便是高代材料形成了系行,能够收获一定数量的籽粒进行米色品质鉴定,操作的工作量也是很大的。如果能建立简便快速的分子标记选择法,将极大促进谷子米色的品质育种,快速提高米质育种的工作效率和水平,服务谷子优质品种的产业化生产。
发明内容
本发明所要解决的一个技术问题是如何区分或辅助区分谷子黄色素含量。
为了解决上述技术问题,本发明提供了如下应用、方法。
本发明提供了检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质在区分或辅助区分谷子黄色素含量中的应用;所述SNP Ppsy11697位点是谷子基因组中的一个SNP位点,其核苷酸种类为G或T,为psy1基因的启动子第1697位核苷酸。
本发明还提供了检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质在制备区分或辅助区分谷子黄色素含量产品中的应用;所述SNP Ppsy11697位点是谷子基因组中的一个SNP位点,其核苷酸种类为G或T,为psy1基因的启动子第1697位核苷酸。
本发明还提供了检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质在谷子育种中的应用或在制备谷子育种产品中的应用;所述SNP Ppsy11697位点是谷子基因组中的一个SNP位点,其核苷酸种类为G或T,为psy1基因的启动子第1697位核苷酸。
本发明还提供了区分或辅助区分谷子黄色素含量的方法,包括检测待测谷子的基因型,根据所述待测谷子的基因型区分或辅助区分谷子的黄色素含量;所述基因型为谷子基因组中SNP Ppsy11697位点的基因型,所述SNP Ppsy11697位点是谷子基因组中的一个SNP位点,其核苷酸种类为G或T,为psy1基因的启动子第1697位核苷酸。
本发明所要解决的另一个技术问题是如何进行谷子育种。
为了解决上述技术问题,本发明提供了如下应用、方法。
本发明提供了上述区分或辅助区分谷子黄色素含量的方法在谷子育种中的应用。
本发明还提供了谷子育种的方法,包括检测谷子基因组中上述的SNP Ppsy11697位点的多态性,选择谷子基因组中所述SNP Ppsy11697位点的核苷酸为T的纯合型谷子作为亲本进行育种。
含有检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质的产品也属于本发明的保护范围,所述产品为C1)-C3)中任一种产品:
C1)检测与谷子黄色素含量相关的单核苷酸多态性或基因型的产品;
C2)区分或辅助区分谷子黄色素含量的产品;
C3)用于谷子育种的产品。
上述的应用、上述的方法或上述的产品中,所述谷子育种为培育米色为黄色的谷子或选育米色为黄色的谷子。
上述的应用、上述的方法或上述的产品中,所述检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质为如下D1)、D2)或D3):
D1)所述检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质含有扩增包括所述SNP Ppsy11697位点在内的谷子基因组DNA片段的PCR引物,例如,所述PCR引物包括如序列1第22-47位所示的单链DNA和如序列2第22-46位所示的单链DNA;
D2)所述检测谷子基因组中SNP Ppsy11697位点的多态性或基因型的物质为含有所述PCR引物的PCR试剂;
D3)含有D1)所述PCR引物或D2)所述PCR试剂的试剂盒。
可选地,所述PCR引物为由序列表中序列1所示的单链DNA、序列表中序列2所示的单链DNA和由序列表中序列3所示的单链DNA组成的引物组。
上述应用、方法和产品中,所述PCR引物可被标记物标记也可不被标记物标记。所述标记物指可用于提供可检测的效果且可以连接至核酸的任何原子或分子。标记物包括但不限于染料;放射性标记,诸如32p;结合部分,诸如生物素(biotin);半抗原,诸如地高辛(DIG);发光、发磷光或发荧光部分;和单独的荧光染料或与可以通过荧光共振能量转移(FRET)抑制或移动发射光谱的部分组合的荧光染料。标记可以提供可通过荧光、放射性、比色、重量测定、X射线衍射或吸收、磁性、酶活性等检测的信号。标记可以是带电荷的部分(正电荷或负电荷)或可选地,可以是电荷中性的。标记可以包括核酸或蛋白序列或由其组合,只要包含标记的序列是可检测的。在一些实施方案中,核酸在没有标记的情况下直接检测(例如,直接读取序列)。
本发明通过对谷子黄色素合成关键基因psy1的启动子区进行变异单倍型和黄色素含量的分析,设计了一个能有效区分高黄色素含量和低黄色素含量的标记(SNPPpsy11697位点),利用这个标记可以对谷子黄色素含量在育种的早代进行选择,达到通过标记选择进行高的黄色素含量单株、株系和品种选择的目的,避免了育种早代选择的盲目性,显著提高了黄色素含量的谷子品质育种效率。在实际应用中,为了提高准确率,可将检测SNPPpsy11697位点的多态性和基因型的物质与其他物质联合在一起制备区分谷子黄色素含量的产品。
附图说明
图1为psy1基因启动子单倍型变异位点图,其中,1769-1818bp处,*1代表的序列为TGGTGCAAGGCTTAGGCCTCCTGCGCCAATGCAAGTTAAGTGGTTTGAT,*2代表的序列为GTGCAGCTAGGCTCCTGCGCCAATGCAAGTAAGTGTTTGA,2106-2134bp处IN1的序列为ACGTGCCAAAAGGAAATTCAGCGTATATC,-代表序列缺失。
图2为psy1基因启动子三种主要单倍型变异位点图,其中,2106-2134bp处IN1的序列为ACGTGCCAAAAGGAAATTCAGCGTATATC,-代表序列缺失。
图3为psy1基因启动子区主要单倍型的黄色素含量箱式图。
图4为实施例295份材料KASP标记检测结果,其中,每个圆点各对应一份检测材料,G∶G表示检测材料为纯合基因型G∶G,T∶T表示纯合基因型T∶T,G∶T表示杂合基因型G∶T,?表示无信号或信号较弱,NTC表示空白对照。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
采用EXCEL统计软件对数据进行处理,实验结果以平均值±标准偏差表示,采用双尾t测验检验。
下述psy1基因的启动子序列如序列4所示。
实施例1、黄色素含量测定及其关联SNP标记的发现
选取了来自各个地域具有代表性的100份谷子材料,对这些材料的黄色素含量进行测定(100份谷子材料记载于Jia G,Huang X,Zhi H,et al.A haplotype map ofgenomic variations and genome-wide association studies of agronomic traits infoxtail millet(Setaria italica)[J].Nature Genetics,2013,45(8):957.)(表4),同时扩增这些不同黄色素含量品种psyl基因启动子序列,进行测序分析。
黄色素含量测定方法参考AACC方法。包括采用β-胡萝卜素标准品制作标准β-胡萝卜素曲线,然后用砻谷机把谷子籽粒脱壳,超离心磨粉碎,称取2.000g粉末放入约30mL具塞的离心管内,加入10.0mL水饱和正丁醇,盖紧塞子,混旋器上混合,使样品充分湿润。把离心管放在往复振荡机上振荡提取1h,然后静置10min。4000r/min离心约10min至液体清亮为止。以水饱和正丁醇作对照,在440nm测定离心后上清吸光度,计算黄色素含量。
对psy1基因起始密码子上游2800bp进行了扩增,共测序得到74个品种的启动子序列。以参考基因组豫谷1号启动子序列(序列4)作为参考,用DNAman软件进行序列比对,启动子的序列变异类型如图1所示,共存在78处变异位点,其中包括SNP位点76处,indel位点2处,具有丰富的变异。
启动子区存在的78处变异位点,共组合成13种单倍型(如图1),其中有三种单倍型所含有的材料数比较多,为主要单倍型,分别为hap2(25份材料),hap4(26份材料)和Hap5(9份材料)。其余单倍型中所含有的材料数量较少,为稀有单倍型。除去稀有变异位点,启动子区三种主要单倍型的序列共存在42处变异位点,包括SNP位点41处,indel位点1处。变异位点如图2。
对这42处变异位点的分析发现,在1697bp处存在一个SNP位点,在不同材料中存在G/T两种碱基类型。将该SNP位点命名为Ppsy11697(4号染色体第40048578 bp位置),其是psy1基因启动子上的一个多态性SNP位点,psy1基因启动子在谷子品种豫谷1号(参考基因组https://phytozome.jgi.doe.gov/pz/portal.html)4号染色体上的物理位置为40046882 bp-40049681bp,Ppsy11697位点的核苷酸种类为T或G,其侧翼序列如序列表4所示,Ppsy11697位点位于序列4的第1697位。序列4中,k为t或g。
根据此位点将所有测序材料分为两类,分别命名为hap-G单倍型(即Ppsy11697位点的核苷酸为G)和hap-T单倍型(即Ppsy11697位点的核苷酸为T)。将此位点的变异和相应品种的黄色素含量数据做关联分析,关联分析具体为:根据所有测序材料的单倍型分型结果,将各个单倍型中的材料进行汇总分组,利用EXCEL表格对各个单倍型分出的材料的表型数据做双尾t测验,检测单倍型和目标性状相关性是否达到显著水平。
结果显示这两种单倍型之间黄色素含量存在着极显著差异,结果如表1所示。在此位点处碱基为T的材料黄色素平均含量为22.74mg/kg,属于高黄色素含量类型,在此位点处碱基为G的材料黄色素平均数为14.85mg/kg,黄色素含量较低。
表1 启动子区1697bp处SNP关联黄色素差异显著性分析
注:**代表P<0.01
在该位点处三种主要单倍型碱基分别为:hap2和hap5为碱基G,hap4为碱基T,三种单倍型中所含材料的黄色素含量做箱式图如图3所示。从图3看出,hap4黄色素含量最高,hap2黄色素含量中等,hap5黄色素含量最低,尤其是hap5中所含有的材料全部为黄色素含量很低的材料,hap4类单倍型是高黄色素含量高的优异单倍型。因此1697bp处的G/T变异将黄色素含量最高的hap4与其他两种类型区分开,此位点可能具有重要的作用。三种主要单倍型黄色素含量如表2,关联黄色素数据差异显著性分析如上述关联分析方法所述,结果如表3所示。
表2 三种主要单倍型黄色素含量
表3 启动子区主要单倍型关联黄色素差异显著性分析
注:**代表P<0.01
表4 启动子区不同单倍型材料号及黄色素含量
实施例2谷子黄色素含量KASP标记的开发
1.引物设计
根据谷子psy1基因测序单倍型分析结果,Ppsy11697位点对于区分小米中黄色素的含量具有明显的区别意义。在此位点处碱基为T的材料黄色素含量较高,碱基为G的材料黄色素含量较低,根据此位点差异设计KASP标记,将目标SNP序列信息设计带有荧光标记的引物。引物序列如表5所示。
表5 KASP引物序列信息
注:FAM和VIC分别代表5’端带有FAM荧光标签序列(下划线为直线的碱基)的引物和5’端带有VIC荧光标签序列(下划线为波浪线的碱基)的引物,COM代表通用引物。
引物FAM和引物COM扩增该SNP位点为T的片段,用酶标仪或荧光定量PCR仪可读取到FAM基团的荧光信号;
引物VIC和引物COM扩增该SNP位点为G的片段,用酶标仪或荧光定量PCR仪可读取到VIC基团的荧光信号。
2.测定黄色素含量
检测材料为95份谷子材料(如表6所示,谷子材料记载于Jia G,Huang X,Zhi H,etal.A haplotype map of genomic variations and genome-wide association studiesof agronomic traits in foxtail millet(Setaria italica)[J].Nature Genetics,2013,45(8):957.)。黄色素含量测定方法与实施例1相同。测定结果如表6所示。
3.检测SNP位点
检测材料为95份谷子材料(如表6所示)。提取检测材料的基因组DNA,加ddH2O溶解作为DNA模板。
空白对照为ddH2O替代DNA模板,其余条件一致。
引物混合物包括46μl ddH2O,30μl引物COM(100μM),12μl引物FAM(100μM)和12μl引物VIC(100μM)。
PCR体系包括10-20ng/μl DNA模板,3μl 1×KASP master mixture(厂家LGC(Laboratory of the Government Chemist)货号:KBS-1016-012)和0.056μl引物混合物。
PCR程序:94℃ 15min;94℃ 20s,67-61℃(touchdown-0.6℃每循环)25s,10循环;94℃ 10s,55℃ 60s,26循环。
利用酶标仪或荧光定量PCR仪对PCR反应产物进行荧光数据读取,用在线软件SNPdecoder(http://www.snpway.com/snpdecoder01/)进行荧光信号处理,若显示只有VIC基团的荧光信号,则所述检测材料SNP位点Ppsy11697的基因型为G∶G(即谷子基因组中SNP位点Ppsy11697为G的纯合型,以下简称Ppsy11697基因型G∶G);若显示只有与FAM基团的荧光信号,则所述待测谷子SNP位点Ppsy11697的基因型为T∶T(即谷子基因组中SNP位点Ppsy11697为T的纯合型,以下简称Ppsy11697基因型T∶T);若显示既有与FAM基团的荧光信号又有VIC基团的荧光信号,则所述待测谷子SNP位点Ppsy11697的基因型为G:T(即谷子基因组中SNP位点Ppsy11697为G和T的杂合型,以下简称Ppsy11697基因型G∶T)。
95材料的分型结果如图4和表6所示,图4左上方为Ppsy11697基因型G∶G的品种,右下方为Ppsy11697基因型T∶T的品种,其中56份在该处碱基为G,28份材料为T,5份为杂合材料,6份信号弱。
表6 各材料的基因型及黄色素含量
注:?表示无信号或信号较弱。
关联两种类型的黄色素数据做差异显著性分析,具体分析方法与实施例1的关联分析相同。结果如表7所示。
表7 基因型关联黄色素差异显著性分析
结果显示这两种基因型之间黄色素含量存在着极显著差异,基因型T∶T的材料黄色素属于高黄色素含量类型,基因型G∶G的材料黄色素含量较低,两者存在明显差异。而基因型G∶T与前述两种基因型均无明显差异。说明该标记具有很高的实用性和应用效率。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国农业科学院作物科学研究所
<120> 与谷子黄色素含量相关的分子标记及其应用
<130> 210486
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gaaggtgacc aagttcatgc tacaactttc agtccatgac agagaat 47
<210> 2
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gaaggtcgga gtcaacggat tcaactttca gtccatgaca gagaag 46
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gaggggttcg tagtggtatc agtta 25
<210> 4
<211> 2821
<212> DNA
<213> 谷子(Setaria italica)
<400> 4
agttaaccag gcagtatccg ccactcactt ttttttggtt cttcaccctt cttatacggt 60
ctatctgttt gatcaaccac ttttgaaccg ggaagacagt gaggtgatag attggttgtg 120
aagttaatac gcttttgact agtgtctctc ttcctgcaag ggatagcatt ttccccttcc 180
atcccgatag gcgtcctcca attttgtata agagtggttg aaagtctact cttctaaggg 240
tacatgtatg taaagggagg tccaagtact ttcctgggaa cgaggatacc tttccgggga 300
aatctgctag tgcttcggct acaatttctg gtgtgcatcg aattggaaag atttccatct 360
tgatcatgtt aaccctcagt cccgagcagt ccccaaatag ttgcaacagc tgtttaattc 420
tttgaagttc cgttctgttg ggatttgtaa aaattgttgc atcatcggca tacaaggagc 480
agcgcatttt tctgcccttg tcaagatcgg ctggataatg ttctgtgccg ccgctagttc 540
catgattcgg tgcagcgggt caattgtgat gataaaaagc attagggaca gggggtcgcc 600
ttgtctcatc cctcaggcgt gcttgaattt tttttcctgg acttccattg agtaggactc 660
gtgaggatgc agtggctaaa agcattaata tccaatctct ccatttctga ccaaagccta 720
atgcttgcaa agtctctaat aggaacgcca agctcaatga gtcaaaggct tttgagatgt 780
ccagtttaat gaaaaatgcg ctcttgttag ctttgtgcag tgtcttgatt acactatgga 840
catacgcaaa gtttgtcgtg gatacatctt tttttgatga aggcgctctg gcagctggag 900
atgaggtcat ttaattttgg cgccaaccgg tcggctagga tttttgtgat tattttgcaa 960
ggctgtttat gagactgatg ggcctaaagt cagcaatcct caccgtgtcg tctgttttgg 1020
ggattaggat gatgttggcc tcgtttatta gttctaggcg gcgcattcat aaggagtgga 1080
atgcctgtag tgcgtcagtg agatctgctc ctattatgtg ccagcatttc ttgtagaata 1140
atcctatgaa tccatcggtc ccagtgcttt ctcggtcagc atgttcatga ctactcgttt 1200
gacctcatcc tgctcgaatg gactttctag gtccgataga tcttgagcct ggtatcccag 1260
gtggctccaa tttagaccct gtactcggtt ttgtggcgtg cccagtagct ccacaaagtg 1320
cttgtatatt atttcctcct cctgctagtg gtcgctagtt tgtccttgcg ctgcagtcag 1380
tgtagggatg tggagctttc gttttctact gtttgcatgt agcatgaaaa gctttgtgca 1440
agatgttaca gcttttttat gacatttgga atggaaatgc aacttgacat ttttggaaac 1500
tcatgctgca cggagcgtac aaaagcacta gaaagtttgg cggggtgggc cggccattta 1560
caaaatctgc ccttggtagt tgggcttgaa cttgcggccc atccaaatac tgttgctact 1620
gccctgtgta cccgcgttgt gctgttgggc cacgcccatc tgaatactcg ggtccagctt 1680
gctgggccag tacaackttc agtccatgac agagaatgta aaaacactcc taacatttgc 1740
taactgatac cactacgaac ccctcaaaga cacactcctg cagcggcttg gtgcaaggct 1800
taggcctcct gcgccaatgc aagttaagtg gtttgattca tcagatgtaa aactgggatt 1860
atttttaccc tacacgtgta ggtcagatta tacaaatagt tagaaaccag gcagtatgta 1920
agatagctag atgtatagtg atatatgatc agtaagagca aactgcacat taaactatcc 1980
tcttaggtaa caccatcaat ataatccgac gtctacccaa gagaagagtg gagacaaatt 2040
attcttagaa catataatat agtgtaacaa tgcatgcatg tggacgcgac gatgatatta 2100
agccatcagg taagaaccag agtacctgaa ttgcatgcca tgtcagcgtc cacgtcggac 2160
aggagcagcc agggtgaatc cggagctttc caggtgtcac cactcagcgg cctcccaagt 2220
aggtgataag cttatctatc cgttgccggc tggctggccc tcgtccactc cacgtctgtt 2280
tctttcttct ctgtcgtccc tgagacttga gagtccagag catcaggtac tagcagcatg 2340
tccaatgcaa ggctatgatc cagccacaca ttgcttgatg gctatttgat tgatgattac 2400
ctgcacatgt agcatatgcc aacaatgcaa gcaggatacc gtaccgtgaa atgcatgaaa 2460
tccctcctgt tccatgaaaa aaaaagtgca tgaaatcccg gtaggagagg agagcagtag 2520
gagaggagac caacgataag aggtgagtgg cctgagctgt ttgcgtctgg atgtcctcca 2580
gcgcactccc ttccctcctt cccatggagc cttttgctcg tgtgtctgct aactgaaagt 2640
gtgtgactgt atgcaggtgc ccgtggcaga tagtgcggcg gccaccaccc agcgtgcgtc 2700
ttttttttct tcttccttgc agtcatccac ccatcccaga ctctctgatg agcatacctt 2760
gcagtaggag ctctgctgat tggccccgtc cgtcttgcag ataacaacag gcgacagaca 2820
c 2821