一种编辑水稻巨胚基因ge培育巨胚粳稻品种的方法
技术领域
本发明涉及植物转基因技术及作物遗传育种领域,具体涉及一种编辑水稻巨胚基因GE培育巨胚粳稻品种的方法;特别涉及一种利用CRISPR-Cas9多靶点技术编辑水稻GE基因获得多种GE等位基因型突变体,产生多种种胚比野生型大的巨胚材料,培育多个无转基因片段插入的巨胚粳稻品种的育种方法。
背景技术
水稻是我国重要的粮食作物,是我国50%以上人口的主食,近年来,随着人民生活水平的提高,人们对水稻营养品质有了更高的追求。功能稻米是指除了具有一般稻米的营养成分外,还富含某些生理活性物质,是对于调节人体生理代谢和满足高血压高血糖等特殊消费群体等需求的专用和保健性水稻。γ-氨基丁酸、维生素E、膳食纤维、必需氨基酸、酚类、肌醇、谷维素和N-去氢神经酰胺等多种功能性生理活性物质均富集于胚中。
巨胚水稻是一种胚变大的水稻品种,属于功能稻的一种。巨胚米的胚重一般是正常米胚重的2~3倍,有的胚重甚至更大,使得巨胚糙米中富含γ-氨基丁酸、维生素E和必需氨基酸等,并显著高于普通胚水稻糙米。由于巨胚米的胚增大而使其营养价值极大提高,具有独特和潜在的经济利用价值。巨胚水稻中富含的γ-氨基丁酸(Gamma-amino butyricacid),又称γ-氨酪酸,简称GABA,是一种天然存在的非蛋白组成性的功能性氨基酸,具有重要的医药价值。GABA在植物组织中存在,同时在哺乳动物和人类的中枢神经系统中也存在,是中枢神经系统中很重要的抑制性神经递质,参与人体内多项代谢及生理活动,具有降低血压、抗衰老、活化肝肾、促进乙醇代谢和改善脑细胞代谢等功效,在一定程度上,还能够改善更年期女性失眠、焦虑及抑郁等症状,被誉为“大脑的天然镇静剂”。近年来更有研究显示,GABA能够改善糖尿病症状。另外巨胚水稻中富含的维生素E是一种重要的抗氧化剂,在人体中能有效发挥抗氧化能力,并清除人体自由基、延缓衰老,对高血脂症的预防和治疗也具有明显疗效。
普通水稻籽粒中的GABA含量较低,获得巨胚水稻品种可以显著增加籽粒中的GABA含量。最开始由日本学者利用化学诱变剂MNU(Methyl-nitrosourea)处理水稻金南凤品种合子细胞而率先获得巨胚突变体;随后,韩国学者也应用MNU化学诱变剂处理水稻受精卵,从变异群体中选育出巨胚水稻;我国科研人员主要利用日本的巨胚种质,其次还有采用Co60-γ射线照射等诱变技术,通过自交和杂交育成巨胚稻品系。已发现水稻中的巨胚性状由隐性单基因控制,已克隆到的控制水稻籽粒胚大小的巨胚基因GE(Giant embryo),即Os07g0603700,编码细胞色素P450家族中的一种蛋白,该蛋白被定名为CYP78A13。目前主要通过对该基因进行诱变和杂交选育技术来获得巨胚水稻,然而,这些育种方法所需的成本高、劳动强度大且育种周期长,所获得的巨胚稻种胚大小分布有限。CRISPR(Clusteredregularly interspaced short palindromic repeats)-Cas9基因组编辑技术已成熟应用在各种生物体内进行基因组编辑,也被大量用于创造定向水稻基因突变材料,进行快速有效的水稻遗传改良。
发明内容
为了克服现有传统育种和诱变育种技术的缺点与不足,本发明的首要目的在于提供一种编辑水稻巨胚基因GE培育巨胚粳稻品种的方法。该方法具体是一种利用CRISPR-Cas9多靶点技术编辑水稻巨胚基因GE获得多种ge基因型突变体,产生多种种胚比野生型大的巨胚材料,培育多个无转基因片段插入的巨胚粳稻品种的育种方法。
通过CRISPR-Cas9多靶点系统对控制水稻胚大小的GE巨胚基因进行定点编辑,并进行粳稻遗传转化获得巨胚转基因植株,对后代进行转基因插入片段的检测,可以缩短育种周期快速获得多种无转基因片段插入的大小种胚的粳稻品种,不同大小胚重的水稻品种可以满足提取不同含量的GABA,以满足不同消费群体的需求。
本发明的另一目的在于提供一种水稻巨胚基因ge突变体。
本发明的再一目的在于提供上述水稻巨胚基因ge突变体的应用。
本发明的目的通过下述技术方案实现:
一种编辑水稻巨胚基因GE培育巨胚粳稻品种的方法,包括如下步骤:利用CRISPR-Cas9多靶点技术编辑水稻巨胚基因GE获得多种ge基因型突变体,产生多种种胚比野生型大的巨胚材料,培育多个无转基因片段插入的巨胚粳稻品种的育种方法,不同种胚大小品种含有不同含量的GABA可以满足不同消费群体的需求。所述水稻巨胚基因GE,其核苷酸序列如SEQ ID NO:1所示,其氨基酸序列如SEQ ID NO:2所示。
具体包含如下步骤:
1)粳稻中花11为野生型小胚品种,参考粳稻中花11水稻基因组序列,在粳稻中花11巨胚基因GE的第一外显子中选择3个sgRNA靶序列;所述sgRNA靶序列为:GE1:5′-GCGGTGATGTCGCTCTCCGT-3′,GE2:5′-GAGGGAGATCCTCGTCAGCC-3′,GE3:5′-GGCGACATCTCGATCCAGGA-3′;
2)根据靶序列,并参照同源重组载体构建的方法,合成载体构建的引物序列;
3)参照Xie等(Xie Kabin, Minkenberg Bastian, and Yang Yinong, BoostingCRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processingsystem, PNAS, 2015)CRISPR-Cas9多靶点编辑技术,构建GE基因的3个靶点的敲除重组载体CRISPR-3GE;其中,敲除重组载体CRISPR-3GE的出发载体为pRGEB32;
4)采用农杆菌介导的遗传转化方法,将CRISPR-3GE敲除重组载体转入小胚常规粳稻中花11中,获得转基因水稻T0代植株;
5)对转基因植株进行阳性突变检测,对T0代每株取叶片提取DNA进行抗潮霉素基因HPT(Hygromycin B phosphotransferase)检测阳性转化植株,并对阳性转化植株靶序列设计引物,对HPT阳性转化植株进行PCR扩增并测序分析突变情况,筛选GE基因碱基突变导致氨基酸变异的ge基因型突变株,和碱基缺失或插入非3的整倍数导致读码框移码的ge基因型突变株,获得T0代纯合突变单株,并分析靶序列的CRISPR-Cas9多靶点技术突变效率。检测HPT基因的引物碱基序列如下:HPT-F:5′-TACTTCTACACAGCCATCGG-3′,HPT-R:5′-AATGTCCTGACGGACAATGG-3′;参照GE基因的靶序列的物理位置,在包含靶序列处设计GE基因的一对特异性引物,进行阳性突变材料的检测,引物碱基序列如下:GE-g-F:5′-ATGGCGCTCTCCTCCATGGC-3′,GE-g-R:5′-GGCCCTAGCCACGGCCTTGC-3′。
6)筛选无转基因片段插入的基因型稳定纯合的巨胚突变材料。对上述T0代纯合突变单株进行T1代种植,并利用抗潮霉素基因HPT、pGTR载体上的gRNA-tRNA序列和Cas9蛋白序列的引物对T1纯合单株基因组DNA进行转基因片段的检测,以Actin基因作为内参,检测提取纯合巨胚突变材料DNA的正确性和完整性,同时对无转基因片段插入的转基因材料的靶序列重新扩增PCR并测序靶位点突变情况,获得基因型稳定纯合的无转基因片段插入的巨胚突变材料。
检测gRNA-tRNA序列、Cas9片段和Actin基因的引物序列如下:
gt-F:5′-GTTTTAGAGCTAGAAATAGC-3′,
gt-R:5′-TGCACCAGCCGGGAATCGAA-3′;
Cas9-F:5′-GAGAATGCTGGCCTCTGCC-3′,
Cas9-R:5′-GCTCTCTGATGGGCTTATCCCG-3′,
Actin-F:5′-TGCTATGTACGTCGCCATCCAG-3′,
Actin-R:5′-AATGAGTAACCACGCTCCGTCA-3′。
7)种植无转基因片段插入的基因型稳定纯合巨胚突变材料T2代,进行种胚大小的表型考察,并统计种胚大小,获得3株种胚大小不同的基因型和表型稳定的无转基因片段插入的纯合突变株。
8)对3株种胚大小不同的基因型和表型稳定的无转基因片段插入的纯合突变株进行GABA含量的测定。
本发明利用CRISPR-Cas9多靶点技术编辑水稻GE基因获得多种不同大小种胚的水稻品种及其应用,通过3个靶点的敲除载体CRISPR-3GE并遗传转化中花11,获得中花11中GE基因不同程度的缺失突变,产生不同大小胚的突变材料,同时不同种胚大小的突变株含有不同GABA含量,以满足不同需求的应用。
一种巨胚基因GE突变体66-5,其编码区的核苷酸序列如SEQ ID NO:3所示,其氨基酸序列如SEQ ID NO:4所示。可以利用所述巨胚基因GE突变体66-5所具有的种胚显著增大的功能,可培育巨胚粳稻品种。
一种巨胚基因GE突变体66-2,其编码区的核苷酸序列如SEQ ID NO:5所示,其氨基酸序列如SEQ ID NO:6所示。可以利用所述巨胚基因GE突变体66-2所具有的种胚显著增大的功能,可培育巨胚粳稻品种。
一种巨胚基因GE突变体63-1,其编码区的核苷酸序列如SEQ ID NO:7所示,其氨基酸序列如SEQ ID NO:8所示。可以利用所述巨胚基因GE突变体63-1所具有的种胚显著增大的功能,可培育巨胚粳稻品种。
本发明相对于现有技术具有如下的优点及效果:
1、本发明利用水稻GE基因可以控制水稻胚的大小的特点,及CRISPR-Cas9多靶点技术对基因组的靶向编辑,在GE基因上设计3个靶点序列则可以定点突变GE基因,并在后代分离中获得了不含有转基因片段插入的突变体,与传统诱变和杂交等方法进行巨胚品种的选育相比,利用该方法可以快速定向获得无转基因片段插入的粳稻品种,缩短了育种周期,提供了一种高效的育种方式。
2、本发明通过CRISPR-Cas9多靶点技术敲除GE基因,同时定向编辑3个位点产生不同的突变,获得了此CRISPR-Cas9多靶点技术传统编辑水稻巨胚基因GE的高突变效率的靶位点,同时也获得了3个不同大小种胚的ge基因型种质材料,可供不同GABA含量需求的生产应用。
附图说明
图1是实施例中3个突变体66-5、66-2和63-1的测序结果;其中WT为野生型材料;
图2是实施例中对T1代转基因材料插入片段的检测结果;其中1-8分别为不同的T1代转基因材料,第1和第2孔道分别为63-1的T1代中含有和不含有HPT、gRNA-tRNA序列和Cas9片段的家系;第3、第4和第5孔道分别为66-5的T1代中不含有、含有和不含有HPT、gRNA-tRNA序列和Cas9片段的家系;第6、第7和第8孔道分别为66-2的T1代中不含有、含有和含有HPT、gRNA-tRNA序列和Cas9片段的家系,CG为重组载体CRISPR-3GE,WT为野生型对照;
图3是实施例中野生型和突变株材料的种子形态;其中(1)为野生型,(2)突变株63-1,(3)为突变株66-5,(4)为突变株66-2,比例尺=1000μm;
图4是实施例中野生型和突变株的籽粒粒重表型;每种表型的统计数量为n=6;
图5是实施例中野生型和突变株的籽粒体积表型;每种表型的统计数量为n=6;
图6是实施例中野生型和突变株中糙米含有的GABA含量;每种表型的统计数量为n=6。
注:以上所有说明书附图的误差线均为标准差,**表示突变株和野生型表型之间有显著差异,P<0.01。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
下列实施例中未注明具体实验条件的试验方法,通常按照常规实验条件或按照制造厂所建议的实验条件。所使用的材料、试剂等,如无特殊说明,为从商业途径得到的试剂和材料。
实施例1
本发明通过构建水稻GE基因的CRISPR-Cas9多靶点载体CRISPR-3GE,通过农杆菌介导的遗传转化方法,将载体CRISPR-3GE导入到粳稻中花11中,获得转基因水稻,设计引物对转基因材料的GE基因进行PCR扩增并测序,筛选出GE基因碱基突变导致氨基酸变异的突变株,和碱基缺失或插入非3的整倍数导致读码框移码的突变株,对纯合ge基因型无转基因片段插入突变株进行种胚大小的考察,并种植突变株获得后代巨胚表型稳定的巨胚粳稻,并对3种胚大小的粳稻糙米GABA含量进行测量,获得可供不同GABA含量需求进行生产应用的巨胚粳稻品种。具体包括如下步骤:
1、sgRNA靶点引物的设计和合成
(1)为了获得多个不同片段缺失或插入等突变型的突变材料,选择GE基因第一个外显子上的3个靶位点进行基因编辑,选择GE基因第一个外显子上的3个20bp序列作为3个sgRNA靶位点,GE1:5′-GCGGTGATGTCGCTCTCCGT-3′,GE2:5′-GAGGGAGATCCTCGTCAGCC-3′,GE3:5′-GGCGACATCTCGATCCAGGA-3′,对应在粳稻中花11参考基因组上的物理位置分别为+277...+296bp、+339...+358bp、+655...+674bp(起始密码子ATG中A为+1bp,如SEQ ID NO:1)。
(2)参照Xie等(Xie Kabin, Minkenberg Bastian, and Yang Yinong, BoostingCRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processingsystem, PNAS, 2015)CRISPR-Cas9多靶点编辑技术,并选择通过同源重组的方式进行下一步载体的构建,在sgRNA靶序列的两端分别加上载体序列接头,上述3个sgRNA靶序列人工合成正反向引物序列分别为:
GE1-F:5′-TAGGTCTCCGTCGCTCTCCGTGTTTTAGAGCTAGAA-3′,
GE1-R:5′-CGGGTCTCACGACATCACCGCTGCACCAGCCGGGAA-3′;
GE2-F:5′-TAGGTCTCCTCCTCGTCAGCCGTTTTAGAGCTAGAA-3′,
GE2-R:5′-CGGGTCTCAAGGATCTCCCTCTGCACCAGCCGGGAA-3′;
GE3-F:5′-TAGGTCTCCCTCGATCCAGGAGTTTTAGAGCTAGAA-3′,
GE3-R:5′-CGGGTCTCACGAGATGTCGCCTGCACCAGCCGGGAA-3′。
(3)载体构建两侧引物分别是L5AD5-F和L3AD5-R,引物序列如下:
L5AD5-F:5′-CGGGTCTCAGGCAGGATGGGCAGTCTGGGCAACAAAGCACCAGTGG-3′,
L3AD5-R:5′-TAGGTCTCCAAACGGATGAGCGACAGCAAACAAAAAAAAAAGCACCGACTCG-3′。引物合成交给引物合成公司完成。
2、3个靶位点相连
(1)敲除片段扩增
50µL的PCR扩增体系:pGTR(BioVector-063143) 0.1ng,5×Phusion HF buffer10µL,dNTPs (10mM) 1µL,10µM正/反向引物各2.5µL,聚合酶Phusion (2U/µL, NEB) 0.5µL,加ddH2O至PCR反应体系为50µL。PCR反应程序:98℃,2min;98℃,10sec,50℃,20sec,72℃,20sec,35个循环;72℃,2.5min;4℃,10sec。敲除片段1:L5AD5-GE1,PCR正/反向引物分别为L5AD5-F和GE1-R;敲除片段2:GE1-GE2,PCR正/反向引物分别为GE1-F和GE2-R;敲除片段3:GE2-GE3,PCR正/反向引物分别为GE2-F和GE3-R;敲除片段4:GE3-L3AD5,PCR正/反向引物分别为GE3-F和L3AD5-R。所有PCR扩增产物大小在150-200bp左右。
(2)敲除片段纯化回收
取5µL PCR产物用1%的琼脂糖电泳检测PCR产物阳性条带,将剩下阳性PCR产物用DNA回收试剂盒进行回收。
(3)敲除片段相连
20µL连接反应体系:4个PCR产物,25-50ng;2xT7 DNA ligase Buffer (NEB),10µL;牛血清白蛋白(1mg/mL)2µL;限制性内切酶Bsa I(10 U/µL, NEB),0.5µL;连接酶T7 DNALigase (3000 U/µL, NEB),0.5µL。连接反应:37℃,5min,20℃,10min,35个循环;20℃,1h。
(4)敲除片段连接产物进行PCR扩增
将上述步骤中4个PCR产物连接产物加180µL ddH2O稀释后,吸取1µL进行PCR扩增。50µL的PCR扩增体系:稀释过的连接产物1µL,10×PCR buffer(Mg2+ plus) 5µL,dNTPs(10mM) 1µL,10µM正向引物S5AD5-F(序列:5′-CGGGTCTCAGGCAGGATGGGCAGTCTGGGCA-3′)和反向引物S3AD5-R(序列:5′-TAGGTCTCCAAACGGATGAGCGACAGCAAAC-3′)各1µL,聚合酶rTaq(5U/µL, TaKaRa) 0.5µL,加ddH2O至PCR反应体系为50µL。PCR反应程序:95℃,2min;95℃,10sec,55℃,30sec,72℃,1min,35个循环;72℃,10min;4℃,10sec。
(5)PCR产物回收
取5µL PCR产物用1%的琼脂糖电泳检测PCR产物阳性条带,将剩下阳性PCR产物用DNA回收试剂盒进行回收。
3、敲除载体CRISPR-3GE构建
(1)酶切PCR产物和终载体
将上步骤中的PCR产物用FokI限制性内切酶进行酶切,酶切体系为:上一步回收产物加ddH2O至44µL,加入酶切buffer 5µL,FokI 1µL,37℃下酶切1h。同时用BsaI限制性内切酶酶切载体pRGEB32,酶切体系为:pRGEB32 1μg,Buffer 5µL,BsaI 1µL,ddH2O补至50µL,37℃下酶切60min。其中,载体pRGEB32为常规市售质粒。
(2)酶切产物回收
取5µL 酶切产物用1%的琼脂糖电泳检测PCR产物阳性条带,将剩下阳性酶切产物用DNA回收试剂盒进行回收。
(3)靶位点序列与终载体连接
10µL连接反应体系:酶切PCR产物,6µL;已酶切的终载体2µL,10x T4 DNA ligaseBuffer(NEB),1µL;连接酶T4 DNA Ligase(2000 U/µL,NEB),1µL。连接反应:16℃,过夜连接。
(4)将连接产物用热激法转化入大肠杆菌JM109感受态细胞,并培养挑取单克隆并测序获得阳性克隆
将10µL连接产物加入到100µL已解冻的大肠杆菌JM109感受态细胞中,用移液枪轻轻吸打混匀,冰上放置30min,42℃水浴45s,快速转移到冰上放置2min,加入700µL无抗生素的LB培养基,37℃摇床上200rpm摇培1h,5000rpm离心1min,留100µL上清液,其余弃掉,悬浮大肠杆菌并涂布于含有卡那霉素抗生素的LB培养基平板上,倒置于37℃培养箱中培养18h。挑取单克隆培养并进行菌落PCR验证,挑选阳性菌落送公司测序,测序引物为C-GE:5′-AGTACCACCTCGGCTATCCACA-3′,选择测序正确的阳性克隆于下一步实验。其中,大肠杆菌JM109感受态细胞为常规市售产品。
(5)碱裂解法小量提取大肠杆菌质粒DNA
将含有阳性克隆的大肠杆菌在37℃下培养16h扩繁,用1.5mL离心管12000rpm离心1min。弃上清,重复收集菌液3次,吸除干净上清液,加入300µL溶液I(50mL PH8.0 1M Tris-HCl,20mL 0.5M EDTA,920mL ddH2O),剧烈震荡,加入新配置的溶液II(0.4M NaOH和2%SDS等体积配置)300µL,缓慢上下翻转离心管数次,混合均匀,室温放置2min,加入预冷的溶液III(129.69g 乙酸钾,加入600mL ddH2O,100mL冰乙酸,用乙酸调PH为4.8,用ddH2O定容至1L)300µL,缓慢上下翻转离心管数次,混合均匀,冰浴10min,12000rpm离心15min,吸取上清液900µL,加入600µL异丙醇,室温放置5min,12000rpm离心15min,弃上清,用500µL的70%乙醇洗涤两次,低速离心2min,倒掉上清,12000rpm离心1min,吸干上清,风干10min后,加入40µL的TE缓冲液(1mL PH8.0 1M Tris-HCl,0.2 mL PH8.0 0.5M EDTA)溶解质粒,获得质粒CRISPR-3GE,4℃保存放置备用。
4、遗传转化并获得巨胚粳稻
(1)将5µL阳性克隆质粒CRISPR-3GE加入到农杆菌EHA105感受态细胞中,冰上放置30min,在液氮中速冻1min,立即放入37℃水浴或者金属浴5min,加1mL液体LB培养基于28℃,200rpm培养2h,5000rpm离心1min,将菌液均匀涂布于含有卡那霉素抗生素的LB培养基平板上,28℃培养2d。挑取单克隆菌落进行PCR扩增并测序,将测序正确的阳性克隆摇菌培养并涂皿培养2d。其中,农杆菌EHA105感受态细胞为常规市售产品。
(2)CRISPR-3GE导入到粳稻中花11中的遗传转化。选取粳稻中花11活力好的愈伤组织用于农杆菌的遗传转化实验。(预培养)从继代愈伤组织中,挑去淡黄色,颗粒状,干燥,活力强的愈伤组织转入预培养基(每250ml培养基中加入300μL乙酰丁香酮,5mL 40%葡萄糖)中,置于NB培养基上27℃暗培养3d。(侵染与共培养)将含有阳性克隆质粒CRISPR-3GE的农杆菌菌株在含有卡那霉素抗生素的平皿上划线,活化;将划线培养的农杆菌刮入250mL1/2 N6悬浮培养基中,加入100μL乙酰丁香酮,2mL 50%葡萄糖,28℃,200rpm摇床培养30min,直至有点浑浊(OD600≈0.4);将农杆菌菌液倒入含有愈伤组织的250ml无菌三角瓶中,浸泡30min,倒去菌液,干燥愈伤,将充分干燥的愈伤用勺子均匀的铺到共培养基(250mLN6培养基中加入300μL乙酰丁香酮,5mL 50%葡萄糖)上,19℃暗培养3d。(洗菌并筛选S1)将共培养后的愈伤组织转移至水洗杯中,倒入灭菌蒸馏水至完全侵没愈伤组织,盖上盖子振荡20~30s,倒掉灭菌蒸馏水。如此重复2~3次。加入灭菌蒸馏水至完全侵没愈伤组织,盖上盖子较剧烈振荡20~30s,静置10min。然后进行观察,如果水洗杯内的水是澄清的说明农杆菌已经洗干净了,否则需要继续水洗。最后倒掉灭菌蒸馏水,加入含500mg/L羧苄青霉素的灭菌蒸馏水,200rpm摇晃30min。倒去水,干燥愈伤,将充分干燥的愈伤用勺子均匀的铺到筛选培养基S1(250mL N6培养基中加入400μL羧苄青霉素,250μL潮霉素,5mL 50%葡萄糖)上,19℃暗培养20d。(筛选S2)从S1培养基上挑选干燥的,没有农杆菌污染的愈伤转皿,稀疏地摆放在S2培养基(250mL N6培养基中加入300μL羧苄青霉素,250μL潮霉素,5mL 50%葡萄糖)上,暗培养20d,观察是否长出新鲜嫩黄的抗性愈伤,如果还没有抗性愈伤继续转皿做S3。筛选培养基加入的羧苄青霉素减少到200μL。一般粳稻筛选两次即S2就能长出抗性愈伤。(分化、生根和炼苗)挑取淡黄色,致密,干燥,贴着培养基的抗性愈伤小块至分化培养基中,光培养40d,分化出幼苗(约5~10cm高)后,将分化出的苗子接入生根管内进行生根培养,光培养室培养15~20d,等根生长充分后,揭开生根管封口膜,加入一定量自来水,光培养进行炼苗4~7d,获得T0代转基因苗。
(3)转基因苗种植和突变体的鉴定
将T0代转基因苗移栽到大田或准备好的面包盒,移栽成活后获得了34株转基因苗,对每株取叶片提取DNA进行潮霉素基因检测阳性转化植株,潮霉素HPT基因检测PCR引物碱基序列如下,HPT-F:5′-TACTTCTACACAGCCATCGG-3′,HPT-R:5′-AATGTCCTGACGGACAATGG-3′。鉴定出的HPT转基因阳性植株再以靶位点设计引物测序鉴定突变情况,靶位点测序鉴定PCR引物GE-g-F:5′-ATGGCGCTCTCCTCCATGGC-3′,GE-g-R:5′-GGCCCTAGCCACGGCCTTGC-3′。
(4)分析T0代转基因材料靶位点阳性突变情况。利用潮霉素HPT基因检测和测序结果分析T0代34株转基因材料靶位点突变情况,根据水稻巨胚基因GE突变成ge纯合突变体,和野生型对照种胚表型才变成巨胚,发现有10株单位点纯合突变株,18株为单位点杂合突变株(突变位点全部在第2靶点处),6株为阴性无突变单株。分析10株纯合突变株发现在第2靶点+355处插入一个脱氧核苷酸T发生移码突变,并引起蛋白质翻译在第328个氨基酸处提前终止,有4株突变株66-5、67-3、67-4和68-6;在第2靶点+355处缺失一个脱氧核苷酸A,发生移码突变,并引起蛋白质翻译在第126个氨基酸处提前终止,有5株突变株66-2、67-1、70-2、70-5和71-1;在第3靶点+661处脱氧核苷酸由A突变成C,相应密码子由ATC(氨基酸Ile)转变为CTC(氨基酸Leu),有一株突变株63-1。其中3株巨胚纯合突变株66-5、66-2和63-1的基因型测序结果见图1。由测序结果可知,(1)此CRISPR-Cas9多靶点编辑技术对巨胚基因的第2和第3靶位点都能够实现定点突变,而第1靶位点没有产生突变材料;(2)在T0代就可以获得大量的单位点纯合突变材料,但没有实现大片段的缺失或者插入导致的突变,都是单位点的突变,其中第2靶位点的突变效率非常高,34株转基因材料中有27株突变材料的突变位点全部发生在第2靶点处,突变效率达到79.41%;而第3靶点的突变效率较低为2.94%,第1靶点则突变效率为0。3个靶位点在此CRISPR-Cas9多靶点编辑系统中的突变效率可以为其他CRISPR-Cas9编辑系统编辑水稻巨胚基因GE提供参考。
(5)无转基因插入片段的检测。种植上述转基因阳性纯合突变株T1代,并对转基因重组载体上的片段进行转基因插入片段的检测。提取T1代转基因植株DNA片段,设计抗潮霉素基因HPT(HPT-F/R),pGTR载体上的gRNA-tRNA序列(gt-F/R)和Cas9蛋白序列(Cas9-F/R)的引物序列,以Actin基因(Actin-F/R)作为内参对纯合巨胚突变材料DNA的正确性和完整性进行检测,同时对T1代无转基因片段插入的阳性转基因材料的3个靶位点重新扩增PCR并测序靶位点突变情况。利用上述引物对T1代转基因植株DNA进行PCR扩增,并用1%琼脂糖凝胶跑电泳进行检测,其中在3株巨胚纯合突变株66-5、66-2和63-1的T1代分离植株中都获得了无转基因片段插入的突变体(图2),并对无转基因片段插入的突变体进行靶位点测序结果分析基因型稳定的突变株,获得了基因型稳定纯合的无转基因片段插入的巨胚突变材料。
gt-F:5′-GTTTTAGAGCTAGAAATAGC-3′,
gt-R:5′-TGCACCAGCCGGGAATCGAA-3′;
Cas9-F:5′-GAGAATGCTGGCCTCTGCC-3′,
Cas9-R:5′-GCTCTCTGATGGGCTTATCCCG-3′,
Actin-F:5′-TGCTATGTACGTCGCCATCCAG-3′,
Actin-R:5′-AATGAGTAACCACGCTCCGTCA-3′。
其中,pGTR载体上的gRNA-tRNA序列如SEQ ID NO:9所示。
(6)巨胚ge基因型突变株糙米及其种胚的重量和体积的考察。种植无转基因片段插入的基因型稳定纯合巨胚突变材料66-5、66-2和63-1的T2代,收割并晾晒,在室温干燥条件下保藏3个月后,每个巨胚突变材料选择6个家系进行表型考察,同时发现3个巨胚突变材料呈现出种胚不一样的大小(图3)。先用小型糙米机去掉稻谷颖壳,每个材料挑选正常发育的糙米,用电子天平测量糙米的千粒重。每个家系挑选100粒发育正常的纯合巨胚突变材料,用电子天平测量重量并记录糙米的重量,再用镊子小心将胚拨离,用刀片刮干净糙米和胚的接合部,再用电子天平测量重量并记录胚乳的重量,种胚的重量则为糙米和去胚糙米重量的差值,以均值计算出糙米千粒重、胚乳千粒重和种胚千粒重,种胚千粒重除以糙米千粒重得出胚/糙米重量比。分析统计数据,66-5、66-2和63-1的胚千粒重、糙米千粒重、胚乳千粒重和胚/糙米重量比分别与野生型WT的表型相比,都呈现出极显著性差异,其中以66-2家系的种胚重量和胚/糙米重量比最高(图4),63-1、66-5和66-2的胚千粒重与WT相比分别增加了95.38%,130.77%,169.23%;63-1、66-5和66-2的糙米千粒重与WT相比分别降低了11.18%,35.18%,34.81%;63-1、66-5和66-2的胚乳千粒重与WT相比分别降低了14.89%,40.95%,41.91%;63-1、66-5和66-2的胚/糙米重量比与WT相比分别增加了119.98%,256.00%,313.00%。同样用上述方法筛选糙米和去胚糙米,将5mL移液管的吸嘴密封后,加入一定量的工业酒精读取其初体积,加入100粒糙米后读取终体积,用两次体积读数的差值即可以计算出每粒糙米的平均体积,同样加入100粒去胚糙米后读取终体积,用两次体积读数的差值即可以计算出每粒去胚糙米的平均体积,种胚的体积则为糙米和去胚糙米体积的差值,以均值计算出百粒糙米体积、百粒胚乳体积和百粒种胚体积,种胚体积除以糙米体积得出胚/糙米体积比。分析体积相关数据发现,63-1、66-5和66-2的表型百粒胚体积和胚/糙米体积比在突变株和WT之间比较,都呈现出极显著差异,并有递增变化的趋势;百粒胚乳体积3个突变株家系都与WT有极显著差异,但是没有递增或递减的趋势;百粒糙米体积,突变株家系和WT之间都没有差异(图5),其中,63-1、66-5和66-2的百粒胚体积与WT相比分别增加了160.87%,284.78%,332.39%;63-1、66-5和66-2的百粒糙米体积与WT相比分别降低了1.38%,1.84%,2.30%;63-1、66-5和66-2的百粒胚乳体积与WT相比分别降低了6.57%,11.01%,13.01%;63-1、66-5和66-2的胚/糙米体积比与WT相比分别增加了164.51%,292.00%,342.58%。
(7)对胚大小不同的基因型和表型稳定的无转基因片段插入的纯合突变株进行GABA含量的测定。将上述步骤中种植的无转基因片段插入的基因型稳定纯合巨胚突变材料63-1、66-5和66-2的T2代,收割并晾晒,在室温干燥条件下保藏3个月后,用小型糙米机去掉稻谷颖壳,用样品冷冻研磨仪将糙米磨成可以过80目筛的粉末后,迅速放入液氮内,在分析天平上快速称取0.050±0.001g的粉末至2mL离心管中,加入50%甲醇溶液0.75mL,低温水浴超声15min,4℃ 12000g离心5min,取上清液,真空浓缩干燥后,用MSTFA进行硅烷化衍生化处理,取1µL用于GC-MS质谱检测GABA含量,送样至广东省农业科学研究院农业生物基因研究中心进行绝对定量检测。统计数据发现,随着胚体积的增大,GABA含量也在逐渐增加,63-1、66-5和66-2的糙米GABA含量分别为0.0155mg/g、0.0416 mg/g和0.0434 mg/g,与WT的GABA含量(0.0056 mg/g)相比分别增加了176.79%,642.86%,675.00%(图6)。
由此可见,通过本发明提供的方法,粳稻中花11通过CRISPR-Cas9多靶点敲除后,可以产生多个不同种胚大小的水稻品种,每一种不一样种胚大小的ge基因型突变株其糙米含有的GABA含量也有差异,并且随着胚的增大GABA含量也同时增加。通过本发明提供的方法获得的基因型和表型稳定的无转基因片段插入的纯合突变株,不同种胚大小的巨胚粳稻品种可以作为不同GABA含量需求来进行生产应用,本发明可为不同GABA含量需求的生产应用提供一种高效的基因敲除方法和培育多个巨胚粳稻品种的方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
序列表
<110> 广东省农业科学院水稻研究所
<120> 一种编辑水稻巨胚基因GE培育巨胚粳稻品种的方法
<160> 33
<170> SIPOSequenceListing 1.0
<211> 1578
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 粳稻中花11巨胚基因GE的CDS序列
<400> 1
atggcgctct cctccatggc cgcggcgcaa gagagctccc tcctcctctt cctcctcccg 60
acgtcggccg cctccgtgtt cccgccgctc atctccgtgg tcgtcctcgc cgcgctcctc 120
ctgtggctct cgccgggtgg ccccgcgtgg gcgctgtccc gttgccgtgg cacgccgccg 180
ccgccgggcg tggcgggggg cgcggccagc gcgctgtccg gccctgccgc gcaccgcgtg 240
ctcgccggga tttcgcgcgc cgtcgagggc ggcgcggcgg tgatgtcgct ctccgtcggc 300
ctcacccgcc tcgtcgtggc gagccggccg gagacggcga gggagatcct cgtcagcccg 360
gcgttcggcg accgccccgt gaaggacgcg gcgaggcagc tgctgttcca ccgcgccatg 420
gggttcgccc cgtcgggcga cgcgcactgg cgcgggctcc gccgcgcctc cgcggcgcac 480
ctcttcggcc cgcgccgcgt ggccgggtcc gcgcccgagc gcgaggccat cggcgcccgc 540
atagtcggcg acgtcgcctc cctcatgtcc cgccgcggcg aggtccccct ccgccgcgtc 600
cttcacgccg cgtcgctcgg ccacgtcatg gcgaccgtct tcggcaagcg gcacggcgac 660
atctcgatcc aggacggcga gctcctggag gagatggtca ccgaagggta cgacctcctc 720
ggcaagttca actgggccga ccacctgcca ttgctcaggt ggctcgacct ccagggcatc 780
cgccgccggt gcaacaggct agtccagaag gtggaggtgt tcgtcggaaa gatcatacag 840
gagcacaagg cgaagcgagc tgccggaggc gtcgccgtcg ccgacggcgt cttgggcgac 900
ttcgtcgacg tcctcctcga cctccaggga gaggagaaga tgtcagactc cgacatgatc 960
gctgttcttt gggagatgat ctttagaggg acggacacgg tggcgatctt gatggagtgg 1020
gtgatggcga ggatggtgat gcacccggag atccaggcga aggcgcaggc ggaggtggac 1080
gccgccgtgg ggggacgccg cggccgcgtc gccgacggcg acgtggcgag cctcccctac 1140
atccagtcca tcgtgaagga gacgctgcgc atgcacccgc cgggcccgct cctgtcgtgg 1200
gcgcgcctcg ccgtgcacga cgcgcgcgtc ggtggccacg ccgtccccgc cgggacgacg 1260
gcgatggtga acatgtgggc gatcgcccac gacgccgccg tctggccgga gccggatgcg 1320
ttccgcccgg agcgcttctc ggagggggag gacgtcggcg tgctcggcgg cgacctccgc 1380
ctcgcgccgt tcggcgccgg ccgccgcgtc tgccctggca ggatgctggc gctcgccacc 1440
gcccacctct ggctcgccca gctgctgcac gccttcgact ggtcccccac cgccgccggc 1500
gtcgacctgt ccgagcgcct cggcatgtcg ctggagatgg cggcgccgct cgtgtgcaag 1560
gccgtggcta gggcctga 1578
<211> 525
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 粳稻中花11巨胚基因GE编码的氨基酸序列
<400> 2
Met Ala Leu Ser Ser Met Ala Ala Ala Gln Glu Ser Ser Leu Leu Leu
1 5 10 15
Phe Leu Leu Pro Thr Ser Ala Ala Ser Val Phe Pro Pro Leu Ile Ser
20 25 30
Val Val Val Leu Ala Ala Leu Leu Leu Trp Leu Ser Pro Gly Gly Pro
35 40 45
Ala Trp Ala Leu Ser Arg Cys Arg Gly Thr Pro Pro Pro Pro Gly Val
50 55 60
Ala Gly Gly Ala Ala Ser Ala Leu Ser Gly Pro Ala Ala His Arg Val
65 70 75 80
Leu Ala Gly Ile Ser Arg Ala Val Glu Gly Gly Ala Ala Val Met Ser
85 90 95
Leu Ser Val Gly Leu Thr Arg Leu Val Val Ala Ser Arg Pro Glu Thr
100 105 110
Ala Arg Glu Ile Leu Val Ser Pro Ala Phe Gly Asp Arg Pro Val Lys
115 120 125
Asp Ala Ala Arg Gln Leu Leu Phe His Arg Ala Met Gly Phe Ala Pro
130 135 140
Ser Gly Asp Ala His Trp Arg Gly Leu Arg Arg Ala Ser Ala Ala His
145 150 155 160
Leu Phe Gly Pro Arg Arg Val Ala Gly Ser Ala Pro Glu Arg Glu Ala
165 170 175
Ile Gly Ala Arg Ile Val Gly Asp Val Ala Ser Leu Met Ser Arg Arg
180 185 190
Gly Glu Val Pro Leu Arg Arg Val Leu His Ala Ala Ser Leu Gly His
195 200 205
Val Met Ala Thr Val Phe Gly Lys Arg His Gly Asp Ile Ser Ile Gln
210 215 220
Asp Gly Glu Leu Leu Glu Glu Met Val Thr Glu Gly Tyr Asp Leu Leu
225 230 235 240
Gly Lys Phe Asn Trp Ala Asp His Leu Pro Leu Leu Arg Trp Leu Asp
245 250 255
Leu Gln Gly Ile Arg Arg Arg Cys Asn Arg Leu Val Gln Lys Val Glu
260 265 270
Val Phe Val Gly Lys Ile Ile Gln Glu His Lys Ala Lys Arg Ala Ala
275 280 285
Gly Gly Val Ala Val Ala Asp Gly Val Leu Gly Asp Phe Val Asp Val
290 295 300
Leu Leu Asp Leu Gln Gly Glu Glu Lys Met Ser Asp Ser Asp Met Ile
305 310 315 320
Ala Val Leu Trp Glu Met Ile Phe Arg Gly Thr Asp Thr Val Ala Ile
325 330 335
Leu Met Glu Trp Val Met Ala Arg Met Val Met His Pro Glu Ile Gln
340 345 350
Ala Lys Ala Gln Ala Glu Val Asp Ala Ala Val Gly Gly Arg Arg Gly
355 360 365
Arg Val Ala Asp Gly Asp Val Ala Ser Leu Pro Tyr Ile Gln Ser Ile
370 375 380
Val Lys Glu Thr Leu Arg Met His Pro Pro Gly Pro Leu Leu Ser Trp
385 390 395 400
Ala Arg Leu Ala Val His Asp Ala Arg Val Gly Gly His Ala Val Pro
405 410 415
Ala Gly Thr Thr Ala Met Val Asn Met Trp Ala Ile Ala His Asp Ala
420 425 430
Ala Val Trp Pro Glu Pro Asp Ala Phe Arg Pro Glu Arg Phe Ser Glu
435 440 445
Gly Glu Asp Val Gly Val Leu Gly Gly Asp Leu Arg Leu Ala Pro Phe
450 455 460
Gly Ala Gly Arg Arg Val Cys Pro Gly Arg Met Leu Ala Leu Ala Thr
465 470 475 480
Ala His Leu Trp Leu Ala Gln Leu Leu His Ala Phe Asp Trp Ser Pro
485 490 495
Thr Ala Ala Gly Val Asp Leu Ser Glu Arg Leu Gly Met Ser Leu Glu
500 505 510
Met Ala Ala Pro Leu Val Cys Lys Ala Val Ala Arg Ala
515 520 525
<211> 987
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体66-5的CDS序列
<400> 3
atggcgctct cctccatggc cgcggcgcaa gagagctccc tcctcctctt cctcctcccg 60
acgtcggccg cctccgtgtt cccgccgctc atctccgtgg tcgtcctcgc cgcgctcctc 120
ctgtggctct cgccgggtgg ccccgcgtgg gcgctgtccc gttgccgtgg cacgccgccg 180
ccgccgggcg tggcgggggg cgcggccagc gcgctgtccg gccctgccgc gcaccgcgtg 240
ctcgccggga tttcgcgcgc cgtcgagggc ggcgcggcgg tgatgtcgct ctccgtcggc 300
ctcacccgcc tcgtcgtggc gagccggccg gagacggcga gggagatcct cgtcatgccc 360
ggcgttcggc gaccgccccg tgaaggacgc ggcgaggcag ctgctgttcc accgcgccat 420
ggggttcgcc ccgtcgggcg acgcgcactg gcgcgggctc cgccgcgcct ccgcggcgca 480
cctcttcggc ccgcgccgcg tggccgggtc cgcgcccgag cgcgaggcca tcggcgcccg 540
catagtcggc gacgtcgcct ccctcatgtc ccgccgcggc gaggtccccc tccgccgcgt 600
ccttcacgcc gcgtcgctcg gccacgtcat ggcgaccgtc ttcggcaagc ggcacggcga 660
catctcgatc caggacggcg agctcctgga ggagatggtc accgaagggt acgacctcct 720
cggcaagttc aactgggccg accacctgcc attgctcagg tggctcgacc tccagggcat 780
ccgccgccgg tgcaacaggc tagtccagaa ggtggaggtg ttcgtcggaa agatcataca 840
ggagcacaag gcgaagcgag ctgccggagg cgtcgccgtc gccgacggcg tcttgggcga 900
cttcgtcgac gtcctcctcg acctccaggg agaggagaag atgtcagact ccgacatgat 960
cgctgttctt tgggagatga tctttag 987
<211> 328
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体66-5编码的氨基酸序列
<400> 4
Met Ala Leu Ser Ser Met Ala Ala Ala Gln Glu Ser Ser Leu Leu Leu
1 5 10 15
Phe Leu Leu Pro Thr Ser Ala Ala Ser Val Phe Pro Pro Leu Ile Ser
20 25 30
Val Val Val Leu Ala Ala Leu Leu Leu Trp Leu Ser Pro Gly Gly Pro
35 40 45
Ala Trp Ala Leu Ser Arg Cys Arg Gly Thr Pro Pro Pro Pro Gly Val
50 55 60
Ala Gly Gly Ala Ala Ser Ala Leu Ser Gly Pro Ala Ala His Arg Val
65 70 75 80
Leu Ala Gly Ile Ser Arg Ala Val Glu Gly Gly Ala Ala Val Met Ser
85 90 95
Leu Ser Val Gly Leu Thr Arg Leu Val Val Ala Ser Arg Pro Glu Thr
100 105 110
Ala Arg Glu Ile Leu Val Met Pro Gly Val Arg Arg Pro Pro Arg Glu
115 120 125
Gly Arg Gly Glu Ala Ala Ala Val Pro Pro Arg His Gly Val Arg Pro
130 135 140
Val Gly Arg Arg Ala Leu Ala Arg Ala Pro Pro Arg Leu Arg Gly Ala
145 150 155 160
Pro Leu Arg Pro Ala Pro Arg Gly Arg Val Arg Ala Arg Ala Arg Gly
165 170 175
His Arg Arg Pro His Ser Arg Arg Arg Arg Leu Pro His Val Pro Pro
180 185 190
Arg Arg Gly Pro Pro Pro Pro Arg Pro Ser Arg Arg Val Ala Arg Pro
195 200 205
Arg His Gly Asp Arg Leu Arg Gln Ala Ala Arg Arg His Leu Asp Pro
210 215 220
Gly Arg Arg Ala Pro Gly Gly Asp Gly His Arg Arg Val Arg Pro Pro
225 230 235 240
Arg Gln Val Gln Leu Gly Arg Pro Pro Ala Ile Ala Gln Val Ala Arg
245 250 255
Pro Pro Gly His Pro Pro Pro Val Gln Gln Ala Ser Pro Glu Gly Gly
260 265 270
Gly Val Arg Arg Lys Asp His Thr Gly Ala Gln Gly Glu Ala Ser Cys
275 280 285
Arg Arg Arg Arg Arg Arg Arg Arg Arg Leu Gly Arg Leu Arg Arg Arg
290 295 300
Pro Pro Arg Pro Pro Gly Arg Gly Glu Asp Val Arg Leu Arg His Asp
305 310 315 320
Arg Cys Ser Leu Gly Asp Asp Leu
325
<211> 381
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体66-2的CDS序列
<400> 5
atggcgctct cctccatggc cgcggcgcaa gagagctccc tcctcctctt cctcctcccg 60
acgtcggccg cctccgtgtt cccgccgctc atctccgtgg tcgtcctcgc cgcgctcctc 120
ctgtggctct cgccgggtgg ccccgcgtgg gcgctgtccc gttgccgtgg cacgccgccg 180
ccgccgggcg tggcgggggg cgcggccagc gcgctgtccg gccctgccgc gcaccgcgtg 240
ctcgccggga tttcgcgcgc cgtcgagggc ggcgcggcgg tgatgtcgct ctccgtcggc 300
ctcacccgcc tcgtcgtggc gagccggccg gagacggcga gggagatcct cgtcgcccgg 360
cgttcggcga ccgccccgtg a 381
<211> 126
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体66-2编码的氨基酸序列
<400> 6
Met Ala Leu Ser Ser Met Ala Ala Ala Gln Glu Ser Ser Leu Leu Leu
1 5 10 15
Phe Leu Leu Pro Thr Ser Ala Ala Ser Val Phe Pro Pro Leu Ile Ser
20 25 30
Val Val Val Leu Ala Ala Leu Leu Leu Trp Leu Ser Pro Gly Gly Pro
35 40 45
Ala Trp Ala Leu Ser Arg Cys Arg Gly Thr Pro Pro Pro Pro Gly Val
50 55 60
Ala Gly Gly Ala Ala Ser Ala Leu Ser Gly Pro Ala Ala His Arg Val
65 70 75 80
Leu Ala Gly Ile Ser Arg Ala Val Glu Gly Gly Ala Ala Val Met Ser
85 90 95
Leu Ser Val Gly Leu Thr Arg Leu Val Val Ala Ser Arg Pro Glu Thr
100 105 110
Ala Arg Glu Ile Leu Val Ala Arg Arg Ser Ala Thr Ala Pro
115 120 125
<211> 1578
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体63-1的CDS序列
<400> 7
atggcgctct cctccatggc cgcggcgcaa gagagctccc tcctcctctt cctcctcccg 60
acgtcggccg cctccgtgtt cccgccgctc atctccgtgg tcgtcctcgc cgcgctcctc 120
ctgtggctct cgccgggtgg ccccgcgtgg gcgctgtccc gttgccgtgg cacgccgccg 180
ccgccgggcg tggcgggggg cgcggccagc gcgctgtccg gccctgccgc gcaccgcgtg 240
ctcgccggga tttcgcgcgc cgtcgagggc ggcgcggcgg tgatgtcgct ctccgtcggc 300
ctcacccgcc tcgtcgtggc gagccggccg gagacggcga gggagatcct cgtcagcccg 360
gcgttcggcg accgccccgt gaaggacgcg gcgaggcagc tgctgttcca ccgcgccatg 420
gggttcgccc cgtcgggcga cgcgcactgg cgcgggctcc gccgcgcctc cgcggcgcac 480
ctcttcggcc cgcgccgcgt ggccgggtcc gcgcccgagc gcgaggccat cggcgcccgc 540
atagtcggcg acgtcgcctc cctcatgtcc cgccgcggcg aggtccccct ccgccgcgtc 600
cttcacgccg cgtcgctcgg ccacgtcatg gcgaccgtct tcggcaagcg gcacggcgac 660
ctctcgatcc aggacggcga gctcctggag gagatggtca ccgaagggta cgacctcctc 720
ggcaagttca actgggccga ccacctgcca ttgctcaggt ggctcgacct ccagggcatc 780
cgccgccggt gcaacaggct agtccagaag gtggaggtgt tcgtcggaaa gatcatacag 840
gagcacaagg cgaagcgagc tgccggaggc gtcgccgtcg ccgacggcgt cttgggcgac 900
ttcgtcgacg tcctcctcga cctccaggga gaggagaaga tgtcagactc cgacatgatc 960
gctgttcttt gggagatgat ctttagaggg acggacacgg tggcgatctt gatggagtgg 1020
gtgatggcga ggatggtgat gcacccggag atccaggcga aggcgcaggc ggaggtggac 1080
gccgccgtgg ggggacgccg cggccgcgtc gccgacggcg acgtggcgag cctcccctac 1140
atccagtcca tcgtgaagga gacgctgcgc atgcacccgc cgggcccgct cctgtcgtgg 1200
gcgcgcctcg ccgtgcacga cgcgcgcgtc ggtggccacg ccgtccccgc cgggacgacg 1260
gcgatggtga acatgtgggc gatcgcccac gacgccgccg tctggccgga gccggatgcg 1320
ttccgcccgg agcgcttctc ggagggggag gacgtcggcg tgctcggcgg cgacctccgc 1380
ctcgcgccgt tcggcgccgg ccgccgcgtc tgccctggca ggatgctggc gctcgccacc 1440
gcccacctct ggctcgccca gctgctgcac gccttcgact ggtcccccac cgccgccggc 1500
gtcgacctgt ccgagcgcct cggcatgtcg ctggagatgg cggcgccgct cgtgtgcaag 1560
gccgtggcta gggcctga 1578
<211> 525
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 巨胚基因GE突变体63-1编码的氨基酸序列
<400> 8
Met Ala Leu Ser Ser Met Ala Ala Ala Gln Glu Ser Ser Leu Leu Leu
1 5 10 15
Phe Leu Leu Pro Thr Ser Ala Ala Ser Val Phe Pro Pro Leu Ile Ser
20 25 30
Val Val Val Leu Ala Ala Leu Leu Leu Trp Leu Ser Pro Gly Gly Pro
35 40 45
Ala Trp Ala Leu Ser Arg Cys Arg Gly Thr Pro Pro Pro Pro Gly Val
50 55 60
Ala Gly Gly Ala Ala Ser Ala Leu Ser Gly Pro Ala Ala His Arg Val
65 70 75 80
Leu Ala Gly Ile Ser Arg Ala Val Glu Gly Gly Ala Ala Val Met Ser
85 90 95
Leu Ser Val Gly Leu Thr Arg Leu Val Val Ala Ser Arg Pro Glu Thr
100 105 110
Ala Arg Glu Ile Leu Val Ser Pro Ala Phe Gly Asp Arg Pro Val Lys
115 120 125
Asp Ala Ala Arg Gln Leu Leu Phe His Arg Ala Met Gly Phe Ala Pro
130 135 140
Ser Gly Asp Ala His Trp Arg Gly Leu Arg Arg Ala Ser Ala Ala His
145 150 155 160
Leu Phe Gly Pro Arg Arg Val Ala Gly Ser Ala Pro Glu Arg Glu Ala
165 170 175
Ile Gly Ala Arg Ile Val Gly Asp Val Ala Ser Leu Met Ser Arg Arg
180 185 190
Gly Glu Val Pro Leu Arg Arg Val Leu His Ala Ala Ser Leu Gly His
195 200 205
Val Met Ala Thr Val Phe Gly Lys Arg His Gly Asp Leu Ser Ile Gln
210 215 220
Asp Gly Glu Leu Leu Glu Glu Met Val Thr Glu Gly Tyr Asp Leu Leu
225 230 235 240
Gly Lys Phe Asn Trp Ala Asp His Leu Pro Leu Leu Arg Trp Leu Asp
245 250 255
Leu Gln Gly Ile Arg Arg Arg Cys Asn Arg Leu Val Gln Lys Val Glu
260 265 270
Val Phe Val Gly Lys Ile Ile Gln Glu His Lys Ala Lys Arg Ala Ala
275 280 285
Gly Gly Val Ala Val Ala Asp Gly Val Leu Gly Asp Phe Val Asp Val
290 295 300
Leu Leu Asp Leu Gln Gly Glu Glu Lys Met Ser Asp Ser Asp Met Ile
305 310 315 320
Ala Val Leu Trp Glu Met Ile Phe Arg Gly Thr Asp Thr Val Ala Ile
325 330 335
Leu Met Glu Trp Val Met Ala Arg Met Val Met His Pro Glu Ile Gln
340 345 350
Ala Lys Ala Gln Ala Glu Val Asp Ala Ala Val Gly Gly Arg Arg Gly
355 360 365
Arg Val Ala Asp Gly Asp Val Ala Ser Leu Pro Tyr Ile Gln Ser Ile
370 375 380
Val Lys Glu Thr Leu Arg Met His Pro Pro Gly Pro Leu Leu Ser Trp
385 390 395 400
Ala Arg Leu Ala Val His Asp Ala Arg Val Gly Gly His Ala Val Pro
405 410 415
Ala Gly Thr Thr Ala Met Val Asn Met Trp Ala Ile Ala His Asp Ala
420 425 430
Ala Val Trp Pro Glu Pro Asp Ala Phe Arg Pro Glu Arg Phe Ser Glu
435 440 445
Gly Glu Asp Val Gly Val Leu Gly Gly Asp Leu Arg Leu Ala Pro Phe
450 455 460
Gly Ala Gly Arg Arg Val Cys Pro Gly Arg Met Leu Ala Leu Ala Thr
465 470 475 480
Ala His Leu Trp Leu Ala Gln Leu Leu His Ala Phe Asp Trp Ser Pro
485 490 495
Thr Ala Ala Gly Val Asp Leu Ser Glu Arg Leu Gly Met Ser Leu Glu
500 505 510
Met Ala Ala Pro Leu Val Cys Lys Ala Val Ala Arg Ala
515 520 525
<211> 153
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pGTR载体上的gRNA-tRNA序列
<400> 9
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgcaaca aagcaccagt ggtctagtgg tagaatagta ccctgccacg 120
gtacagaccc gggttcgatt cccggctggt gca 153
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE1
<400> 10
gcggtgatgt cgctctccgt 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE2
<400> 11
gagggagatc ctcgtcagcc 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE3
<400> 12
ggcgacatct cgatccagga 20
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE1-F
<400> 13
taggtctccg tcgctctccg tgttttagag ctagaa 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE1-R
<400> 14
cgggtctcac gacatcaccg ctgcaccagc cgggaa 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE2-F
<400> 15
taggtctcct cctcgtcagc cgttttagag ctagaa 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE2-R
<400> 16
cgggtctcaa ggatctccct ctgcaccagc cgggaa 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE3-F
<400> 17
taggtctccc tcgatccagg agttttagag ctagaa 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE3-R
<400> 18
cgggtctcac gagatgtcgc ctgcaccagc cgggaa 36
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> L5AD5-F
<400> 19
cgggtctcag gcaggatggg cagtctgggc aacaaagcac cagtgg 46
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> L3AD5-R
<400> 20
taggtctcca aacggatgag cgacagcaaa caaaaaaaaa agcaccgact cg 52
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S5AD5-F
<400> 21
cgggtctcag gcaggatggg cagtctgggc a 31
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> S3AD5-R
<400> 22
taggtctcca aacggatgag cgacagcaaa c 31
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> C-GE
<400> 23
agtaccacct cggctatcca ca 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HPT-F
<400> 24
tacttctaca cagccatcgg 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HPT-R
<400> 25
aatgtcctga cggacaatgg 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE-g-F
<400> 26
atggcgctct cctccatggc 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GE-g-R
<400> 27
ggccctagcc acggccttgc 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gt-F
<400> 28
gttttagagc tagaaatagc 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gt-R
<400> 29
tgcaccagcc gggaatcgaa 20
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9-F
<400> 30
gagaatgctg gcctctgcc 19
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas9-R
<400> 31
gctctctgat gggcttatcc cg 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Actin-F
<400> 32
tgctatgtac gtcgccatcc ag 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Actin-R
<400> 33
aatgagtaac cacgctccgt ca 22