一组用于酿酒酵母多拷贝整合的质粒工具包
技术领域
本发明涉及一组用于酿酒酵母多拷贝整合的质粒工具包,属于基因和代谢工程领域。
背景技术
酿酒酵母作为真核生物的模式菌株,常用于导入异源途径,合成高附加值产物。这些途径一般涉及到数个到数十个基因,而在酿酒酵母中多个基因共表达需要整合多次,效率低下,整合位点和筛选标签无法满足后续整合操作。因此,亟需一种高效、高拷贝且稳定的插入位点,将需要过表达的基因整合到这些位点,实现异源基因的高效表达。
在酿酒酵母基因组中存在多种长末端重复序列(Long terminal repeats,LTR),其中一类LTR为转座子,酵母中的转座子被命名为Ty转座子(Ty retrotransposons)。根据Ty转座子序列的匹配度可以分为五种类型,Ty1Cons、Ty2Cons、Ty3Cons、Ty4Cons和Ty5Cons,并且转座子之间序列匹配度也较低,五种Ty转座子在基因组上的拷贝数在20-50左右,且在基因组上分布均匀,很少发生同源重组,结构稳定,因此这些Ty位点是理想的外源基因插入位点(Maury,J.;Germann,S.M.;Baallal Jacobsen,S.A.,et al.,EasyCloneMulti:A Set of Vectors for Simultaneous and Multiple GenomicIntegrations in Saccharomyces cerevisiae[J].PloS One 2016,11(3),e0150394.)。然而目前基于Ty位点的整合型表达存在多种缺陷,如筛选标签不足、获得的转化子拷贝数偏低;整合型表达框使用相同的启动子、相同的启动子和终止子等表达元件,增加了同源重组概率;不同Ty位点之间协同整合能力未知等,限制了此类整合位点的应用。
为了进一步完善Ty整合方案,在此研究中,构建了一个高拷贝整合质粒工具包。在此高拷贝整合包中,首先扩大了筛选标签种类,包括5种营养缺陷型标签:尿嘧啶缺陷型标签(KlURA3)、亮氨酸缺陷型标签(KlLEU2)、组氨酸缺陷型标签(SpHIS5)、色氨酸缺陷型标签(ScTRP1)和蛋氨酸缺陷型标签(ScMET15);5种抗生素筛选标签:诺尔丝菌素抗性标签(Nourseothricin resistance,natMX)、潮霉素抗性标签(Hygromycin resistance,hphMX)、双丙氨膦抗性标签(Bialaphos resistance,patMX)(Goldstein A L,McCusker JH.Three new dominant drug resistance cassettes for gene disruption inSaccharomyces cerevisiae[J].Yeast(Chichester,England)1999,15(14),1541-53.)、遗传霉素抗性标签(Geneticin resistance,KanMX)(Wach A,Brachat A,Pohlmann R,etal.New heterologous modules for classical or PCR-based gene disruptions inSaccharomyces cerevisiae[J].Yeast(Chichester,England)1994,10(13),1793-808.)和博来霉素抗性标签(Phleomycin resistance,bleMX)(Gueldener U,Heinisch J,KoehlerG J,et al.A second set of loxP marker cassettes for Cre-mediated multiplegene knockouts in budding yeast[J].Nucleic Acids Res 2002,30(6),e23.)。同时,在构建筛选基因表达框时,使用弱启动子表达相关筛选基因,并在筛选基因C端添加降解标签(Degradation signal;deg)(Gilon T,Chomsky O,Kulka R G.Degradation signals forubiquitin system proteolysis in Saccharomyces cerevisiae[J].EMBO J 1998,17(10),2759-66.),在转录水平和蛋白质水平降低基因的表达水平,强化筛选压力,以提高外源基因的整合拷贝数。最后,为了降低外源基因发生同源重组的概率,所有启动子、终止子等元件全部不相同。将构建获得的表达包与报告基因绿色荧光蛋白EGFP连接,分别转化到酿酒酵母菌株中,通过检测获得的转化子数量和转化子绿色荧光蛋白的强度分布确定对应标签和位点的整合难易程度和整合拷贝数的分布情况。
在获得了高拷贝整合工具并验证其整合性能后,使用不同的筛选标签,在酿酒酵母基因组不同Ty位点上整合了黄杉素合成途径基因,用于验证多拷贝整合的性能。
发明内容
酿酒酵母包括模式菌株S288c及其衍生菌株。使用该组质粒可以经过一次转化,在酿酒酵母基因组实现多拷贝整合,并且整合位点相互独立,稳定性好,可用于基因的过量表达。
本发明提供了酿酒酵母多拷贝整合基因表达框,所述表达框由弱启动子序列和带有降解标签deg的筛选基因序列及终止子组成;所述弱启动子包括PADE6、PLEU2、PURA3、PPMA1、PZWF1、PARO7、PPYC1、PADE3、PYEF3、PERG1,所述筛选基因包括ScTRP1、KlLEU2、KlURA3、ScMET15、SpHIS5、natMX、hphMX、kanMX、patMX、bleMX。
在一种实施方式中,所述终止子为TTDH3,核苷酸序列为SEQ ID NO.43。
在一种实施方式中,所述弱启动子PADE6、PLEU2、PURA3、PPMA1、PZWF1、PARO7、PPYC1、PADE3、PYEF3、PERG1,的核苷酸分别如SEQ ID NO.1~10所示;所述筛选基因带有降解标签,所述降解标签为deg,核苷酸序列如SEQ ID NO.46所示;筛选基因与降解标签共同组成的核苷酸序列分别如SEQ ID NO.11~20所示。
在一种实施方式中,所述弱启动子公开于文献Promoter-library-based pathwayoptimization for efficient(2S)-naringenin production from p-coumaric acid inSaccharomyces cerevisiae(公开于2020年)。
本发明提供了酿酒酵母多拷贝整合质粒,所述酿酒酵母多拷贝整合质粒由所述的基因表达框和预整合表达框组成;所述预整合表达框由Ty转座子的上下游同源臂序列、终止子序列及绿色荧光蛋白表达框组成。
在一种实施方式中,所述Ty转座子序列包括Ty1Cons、Ty2Cons、Ty3Cons、Ty4Cons和Ty5Cons;所述终止子包括TRFC5-TPOL30、TSEC13-TPNP1、TMTD1-TRPF2、TLEU2-TNFS1、TDSF1-THXT13、TTIM21-TGSC2、TRRP12-TTAF3、TRNA14-TBUB2、TADH1、和TCYC1。
在一种实施方式中,所述酿酒酵母多拷贝整合质粒按照上游同源臂、绿色荧光蛋白表达框、终止子序列、基因表达框、下游同源臂的顺序连接。
在一种实施方式中,Ty1Con1的上下游同源臂分别如SEQ ID NO.21和SEQ IDNO.22所示;Ty1Cons2的上下游同源臂分别如SEQ ID NO.23和SEQ ID NO.24所示;Ty2的上下游同源臂分别如SEQ ID NO.25和SEQ ID NO.26所示;Ty3的上下游同源臂分别如SEQ IDNO.27和SEQ ID NO.28所示;Ty4的上下游同源臂分别如SEQ ID NO.29和SEQ ID NO.30所示;所有的Ty元件的上下游序列已经公开于文献Maury,J.;Germann,S.M.;BaallalJacobsen,S.A.,et al.,EasyCloneMulti:A Set of Vectors for Simultaneous andMultiple Genomic Integrations in Saccharomyces cerevisiae[J].PloS One 2016,11(3),e0150394.(公开于2016年)
在一种实施方式中,所述终止子TRFC5-TPOL30、TSEC13-TPNP1、TMTD1-TRPF2、TLEU2-TNFS1、TDSF1-THXT13、TTIM21-TGSC2、TRRP12-TTAF3、TRNA14-TBUB2、TADH1、和TCYC1的序列分别如SEQ ID NO.31~40所示;所述终止子序列公开于文献Promoter-library-based pathway optimizationfor efficient(2S)-naringenin production from p-coumaric acid in Saccharomycescerevisiae(公开于2020年)。
在一种实施方式中,所述绿色荧光蛋白表达框包括一个启动子PGAL7,启动子PGAL7的上游包含一个终止子序列TGAL10,带有终止子TGAL10的启动子PGAL7的核苷酸序列为SEQ IDNO.41,绿色荧光蛋白的核苷酸序列为SEQ ID NO.42。
在一种实施方式中,所述筛选基因优选为KlLEU2、KlURA3、SpHIS5、hphMX、natMX。
本发明提供了表达目的蛋白的菌株,所述菌株通过所述酿酒酵母多拷贝整合质粒表达目的蛋白。
在一种实施方式中,将目的蛋白插入绿色荧光表达框上游。
本发明提供了一种生产黄杉素的菌株,所述菌株通过所述酿酒酵母多拷贝整合质粒表达生产黄杉素的相关的基因,所述基因通过如下三个模块进行表达:
模块一:过表达从酪氨酸或苯丙氨酸到对香豆酸合成的相关基因:
从酪氨酸到对香豆酸基因包括ARO4fbr、ARO7fbr、FjTAL、EcaroL;
从苯丙氨酸到对香豆酸基因包括ARO4fbr、ARO7fbr、FjTAL、EcaroL、SmPAL、SmC4H;
模块二:过表达从对香豆酸到柚皮素生产相关基因,所述基因包括Pc4CL、PhCHS和MsCHI;
模块三:柚皮素到黄杉素合成的相关基因,所述基因包括SmF3′H、SmCPR和SmF3H。
在一种实施方式中,所述菌株还表达了丙二酰辅酶A途径相关基因ScACC1S659A ,S1157A、SeACS2S641P和SpHIS5。
在一种实施方式中,以C800为出发菌株,所述菌株公开于公布号为CN111424020A的专利文件中。
本发明提供了一种生产黄杉素的方法,所述方法是以所述生产黄杉素的菌株,以葡萄糖或乙醇为底物,从头合成黄杉素。
在一种实施方式中,将所述菌株培养得到OD600为20~30的种子液,将种子液按1~5mL/100mL的比例接种至YPD培养基中,在30~35℃,200~250rpm培养,发酵72h,并在第12h、24h、36h和48h时分别添加95%的乙醇或葡萄糖。
在一种实施方式中,所述95%的乙醇添加量为0.5%(0.5mL/100mL),所述葡萄糖的浓度为500g/L,添加量为0.5%(0.5mL/100mL)。
在一种实施方式中,温度控制为30±0.1℃。
在一种实施方式中,将所述菌株培养得到OD600为20~30的种子液,将种子液按1~5mL/100mL的比例接种至YPD培养基中,在30~35℃,500~600rpm、通气速率1~3vvn培养,当反应体系中葡萄糖浓度降低至0g/L时,以5.0mL/L流速补充流加培养基,并控制pH为5.5±0.1,发酵72h。
本发明提供了所述酿酒酵母多拷贝整合基因表达框、或所述酿酒酵母多拷贝整合质粒在生产目的蛋白中的应用。
本发提供了所述菌株在生产黄杉素中的应用。
在本发明的一种实施方式中,所述微生物细胞为酿酒酵母菌株C800(CEN.PK2-1D,MATα;ura3-52;leu2-3,112;trp1-289;his3Δ1;MAL2-8C;SUC2;gal80::KanMX),所述菌株C800公开于公布号为CN111424020A的专利文件中。。
本发明提供一种产黄杉素重组菌及其生产方法,所述方法是选择上述多拷贝载体,在3个不同Ty位点上整合多个拷贝的黄杉素合成基因,利用所述重组菌进行发酵生产黄杉素。
本发明的有益效果:本发明构建和验证的多拷贝整合质粒工具包,可以通过一次转化在酿酒酵母基因组上实现多个外源基因的多拷贝、稳定的、整合型表达。并且可以通过选择不同的筛选标签在不同的Ty位点,实现多批次、多基因、稳定的、整合型表达外源基因,实现了外源基因的高效表达。
附图说明
图1为多拷贝质粒工具包的基因型示意图(A:10个用于多拷贝整合的筛选基因表达框组合示意图;B:5个预整合表达框示意图;C-G:50个用于酿酒酵母多拷贝整合的质粒工具包的基因型示意图,此图中所有元件位置和顺序都为实际质粒图谱中的位置和顺序。
图2为一次转化后可以获得的转化子数量分布(横坐标为筛选标签,纵坐标为一次转化获得的转化子数量。不同的形状代表不同的Ty整合位点)。
图3为多拷贝重组菌株的荧光强度分布情况(将表达包中的50种组合表达框整合到酿酒酵母基因组上获得转化子,随机挑选10-30株转化子,检测荧光强度分布,并绘制箱图,箱图旁同时绘制每个转化子的荧光强度分布情况。图A:Blank为菌株C800在YNB培养基中荧光强度分布,C887的基因组上仅有一个EGFP拷贝。图B-图H:筛选标签依次为ScTRP1deg、KlURA3deg、ScMET15deg、hphMXdeg、KanMXdeg、patMXdeg和bledeg时,在Ty1Cons1、Ty1Cons2、Ty2Cons、Ty3Cons和Ty4Cons整合时,转化子荧光强度的分布情况。图H:依次为筛选标签为KlLUE2deg时在Ty1Cons1位点;筛选标签为SpHIS5deg时在Ty1Cons1、Ty1Cons2位点;筛选标签为natMXdeg时在Ty3Cons、Ty1Cons2位点整合时,获得的转化子荧光强度分布情况。其他未列出的组合未获得转化子)。
图4为在酿酒酵母中合成黄杉素的途径示意图(黄杉素合成途径分为三个模块;模块一:对香豆酸合成途径(需过表达ARO4/ARO7/TAL或者ARO4/ARO7/PAL/C4H);模块二:柚皮素合成途径(需过表达4CL/CHS/CHI);模块三:黄杉素合成途径(需过表达F3′H/CPR/F3H))。
图5为单Ty位点和双Ty位点整合途径基因时表达效果。
图6为三Ty位点整合途径基因时表达效果图;图A横坐标括号中的数字为荧光强度。
图7为不同位点整合基因的拷贝数。
图8为5-L发酵罐中从头合成黄杉素产量图。
具体实施方式
YNB培养基:0.72g/L酵母氮源基础培养基、20g/L葡萄糖。
YPD培养基:10g/L酵母粉、20g/L蛋白胨、20g/L葡萄糖。
根据需求在YNB培养基中添加终浓度为50mg/L亮氨酸、50mg/L色氨酸、50mg/L组氨酸或50mg/L尿嘧啶。
各种抗生素以母液形式添加到不烫手的培养基中,其中诺尔丝菌素母液浓度为100mg/L,工作浓度为100μg/L;潮霉素母液浓度为300mg/L,工作浓度为300μg/L;草铵膦母液浓度为800mg/L,工作浓度为800μg/L(若使用双丙氨膦,则母液浓度为200mg/L,工作浓度为200μg/L);遗传霉素母液浓度为200mg/L,工作浓度为200μg/L;博来霉素母液浓度为100mg/L,工作浓度为100μg/L。使用氨基酸缺陷型筛选标签和草铵膦抗生素筛选标签的转化子涂布在YNB平板上,使用其他四种抗生素的筛选标签的转化子涂布在YPD平板上。
固体培养基中添加20g/L的琼脂粉。
流加培养基的成分:葡萄糖400g/L,KH2PO4 18g/L,MgSO4·7H2O 10.24g/L,K2SO47g/L,Na2SO4 0.56g/L,金属盐母液20mL·L-1,维生素母液24mL·L-1,根据需要添加各种氨基酸1g/L。金属盐母液:ZnSO4·7H2O 5.75g/L,MnCl2·4H2O 0.32g/L,CoCl2·6H2O 0.47g/L,NaMoO4·2H2O 0.48g/L,CaCl2·2H2O 2.9g/L,FeSO4·7H2O 2.8g/L,80mL的0.5M EDTA(pH8.0)。维生素母液:生物素(Biotin)0.05g/L,泛酸钙(Calcium pantothenate)1g/L,烟酸(Nicotinic acid)1g/L,myo-肌醇(myo-Inositol)25g/L,盐酸硫胺素(Thiamine HCl)1g/L,盐酸吡哆醛(Pyridoxal HCl)1g/L,p-氨基苯甲酸(p-Aminobenzoic acid)0.02g/L
酿酒酵母CEN.PK2-1D(MATα;ura3-52;leu2-3,112;trp1-289;his3Δ1;MAL2-8C;SUC2)用于基因的表达。
E.coli JM109用于分子克隆。
质粒pcfB2989、pcfB2988、pcfB2797、pcfB2990、pcfB2796和pcfB2803(Addgeneplasmid#63636、#63638、#63639、#63645、#63641、#63646)由Irina Borodina&JeromeMaury惠赠(Maury J,Germann S M,Baallal Jacobsen S A,et al.EasyCloneMulti:A setof vectors for simultaneous and multiple genomic integrations inSaccharomyces cerevisiae[J].PloS One 2016,11(3),e0150394.)。
质粒pMDT-SmPAL和pMDT-SmC4H为水飞蓟来源的苯丙氨酸解氨酶(Phenylalanineammonia lyase,PAL)和肉桂酸羟化酶(Cinnamic acid hydroxylase,C4H),经过tBLASTN从水飞蓟转录组鉴定和逆转录获得,分别对应Contig 5930和Contig265(Lv Y,Gao S,Xu S,et al.Spatial organization of silybin biosynthesis in milk thistle[Silybummarianum(L.)Gaertn][J].Plant J 2017,92(6),995-1004.),对应的基因DNA序列在表1中,核苷酸序列依次为SEQ ID NO.44和SEQ ID NO.45。
对香豆酸、柚皮素、圣草酚和黄杉素标品购自Sigma-Aldrich(St.Louis,MO)。
诺尔丝菌(Nourseothricin sulfate,CAS:96736-11-7)素购自索莱宝(Solarbio,N9210)。
潮霉素(Hygromycin B Solution,CAS:3128-04-9)购自生工生物工程(上海)股份有限公司(B540725)。
草铵膦(Ammonium glufosinate,CAS:77182-82-2)购自Ark Pharm(AGZ938)。
遗传霉素(G418 Sulfate,CAS:108321-42-2),购自生工生物工程(上海)股份有限公司(A100859)。
博来霉素(Bleomycin,CAS:11006-33-0)购自生工生物工程(上海)股份有限公司(A620212)。
检测方法:取发酵液100μL,与900μL甲醇混合,涡旋震荡混匀30s后13500rpm离心5min,上清液过滤后备用。使用岛津高效液相检测。色谱柱:ZORBAX SB-C18(4.6mm×150mm,岛津)。流动相A:100%乙腈,流动相B:100%水,所有流动相中添加1‰(V/V)三氟乙酸后过滤,超声去气泡备用。流动相流速:1mL/min,柱温:30℃,进样量:10μL,检测波长:290nm。液相程序:0~10min,10~40%流动相A;10~15min,40~60%流动相A;15~18min,60~10%流动相A,根据不同物质的出峰时间不同来区分各种物质。
实施例1:构建多拷贝的质粒表达工具包
本发明中使用吉布森组装技术(Gibson assembly)作为组装手段,所有序列的组装都是无缝克隆。通过PCR扩增对应的核苷酸序列,序列之间包含约20-30bp的同源臂,经过吉布森组装即可获得所有的质粒表达工具包。
(1)多拷贝整合的筛选基因表达框组合的构建
选取10个用于多拷贝整合的筛选基因表达框组合(Marker genes,如表2和图1中pT0~pT9所示),包括10个弱启动子序列、10个带有降解标签deg的筛选基因序列,及终止子TTDH3,核苷酸序列为SEQ ID NO.43。
10个弱启动子分别为PADE6、PLEU2、PURA3、PPMA1、PZWF1、PARO7、PPYC1、PADE3、PYEF3、PERG1,对应的核苷酸序列依次为SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ IDNO.5、SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9和SEQ ID NO.10(Gao,S.;Zhou,H.;Zhou,J.,et al.,Promoter-library-based pathway optimization forefficient(2S)-naringenin production from p-coumaric acid in Saccharomycescerevisiae[J].J Agric Food Chem 2020,68(25),6884-6891.)。
10个带有降解标签deg的筛选基因分别为ScTRP1-deg、KlLEU2-deg、KlURA3-deg、ScMET15-deg、SpHIS5-deg、natMX-deg、hphMX-deg、kanMX-deg、patMX-deg、bleMX-deg,对应的核苷酸序列依次为SEQ ID NO.11、SEQ ID NO.12、SEQ ID NO.13、SEQ ID NO.14、SEQ IDNO.15、SEQ ID NO.16、SEQ ID NO.17、SEQ ID NO.18、SEQ ID NO.19和SEQ ID NO.20。
(2)预整合表达框的构建
根据酿酒酵母的整合位点,构建5个预整合表达框,包括5组Ty序列的上下游同源臂序列、8个双向终止子序列、2个单向终止子序列以及一个绿色荧光蛋白表达框。
5组Ty序列依次为Ty1Cons1、Ty1Cons2、Ty2、Ty3和Ty4,Ty1Con1上游/下游同源臂、Ty1Con2上游/下游同源臂、Ty2上游/下游同源臂、Ty3上游/下游同源臂、Ty4上游/下游同源臂,5组上下游同源臂对应的核苷酸序列依次为SEQ ID NO.21/SEQ ID NO.22、SEQ IDNO.23/SEQ ID NO.24、SEQ ID NO.25/SEQ ID NO.26、SEQ ID NO.27/SEQ ID NO.28和SEQID NO.29/SEQ ID NO.30。
8个双向终止子依次为TRFC5-TPOL30、TSEC13-TPNP1、TMTD1-TRPF2、TLEU2-TNFS1、TDSF1-THXT13、TTIM21-TGSC2、TRRP12-TTAF3、TRNA14-TBUB2,2个单向终止子依次为TADH1、和TCYC1,双向终止子对应的核苷酸序列依次为SEQ ID NO.31、SEQ ID NO.32、SEQ ID NO.33、SEQ ID NO.34、SEQ IDNO.35、SEQ ID NO.36、SEQ ID NO.37、SEQ ID NO.38,单向终止子对应的序列依次为SEQ IDNO.39和SEQ ID NO.40。
绿色荧光蛋白的表达框包括一个启动子PGAL7,启动子PGAL7的上游包含一个终止子序列TGAL10,绿色荧光蛋白为EGFP,带有终止子TGAL10的启动子PGAL7的核苷酸序列为SEQ IDNO.41,绿色荧光蛋白EGFP的核苷酸序列为SEQ ID NO.42。本发明中还用到一个终止子序列TTDH3,核苷酸序列为SEQ ID NO.43。本发明中使用了两个水飞蓟来源的基因SmPAL和SmC4H,核苷酸序列依次为SEQ ID NO.44和SEQ ID NO.45。
构建50个用于酿酒酵母多拷贝整合的质粒工具包:将上述10个筛选基因表达框(Marker genes)依次分别插入到5个预整合表达框中的两个双终止子中间(使用Gibson组装技术,没有多余碱基插入,均为无痕插入),即获得一组包含50个质粒的酿酒酵母多拷贝整合工具包。其中Ty1Cons1预整合表达框与10个筛选基因组合,依次获得pcT111、pcT112、pcT113、pcT114、pcT115、pcT116、pcT117、pcT118、pcT119和pcT110共计10个质粒。其中Ty1Cons2预整合表达框与10个筛选基因组合,依次获得pcT121、pcT122、pcT123、pcT124、pcT125、pcT126、pcT127、pcT128、pcT129和pcT120共计10个质粒。Ty2预整合表达框与10个筛选基因组合,依次获得pcT21、pcT22、pcT23、pcT24、pcT25、pcT26、pcT27、pcT28、pcT29和pcT20共计10个质粒。Ty3预整合表达框与10个筛选基因组合,依次获得pcT31、pcT32、pcT33、pcT34、pcT35、pcT36、pcT37、pcT38、pcT39和pcT30共计10个质粒。其中Ty4预整合表达框与10个筛选基因组合,依次获得pcT41、pcT42、pcT43、pcT44、pcT45、pcT46、pcT47、pcT48、pcT49和pcT40共计10个质粒。
10个用于多拷贝整合的筛选基因表达框组合、5个预整合表达框和50个用于酿酒酵母多拷贝整合的质粒工具包中,所有基因、启动子、终止子等元件的实际位置如图1所示。
基因ScACC1S659A,S1157A、SeACSS641P、SmF3′HD284N、SmCPRI453V、ARO4fbr、ARO7fbr、FjTAL、EcaroL、SmF3H,依次对应的核苷酸序列为SEQ ID NO.47~SEQ ID NO.55。提到的其他启动子PGAL1和PGAL10依次对应的核苷酸序列为SEQ ID NO.56和SEQ ID NO.57。
本发明中所有核苷酸序列见表1。质粒和菌株的基因型见表2。所有关键引物序列见表3。
表1所有的核苷酸序列
表2质粒和菌株的基因型
表3关键引物序列
实施例2:多拷贝整合质粒工具整合能力验证
使用引物Ty11-inte-up/down分别扩增质粒pcT110~pcT119,使用引物Ty12-inte-up/down分别扩增质粒pcT120~pcT129,使用引物质粒Ty2-inte-up/down分别扩增pcT20~pcT29、使用引物质粒Ty3-inte-up/down分别扩增质粒pcT30~pcT39,使用引物Ty4-inte-up/down分别扩增质粒pcT40~pcT49,分别得到载体的整合表达框部分。将PCR产物回收纯化后通过酿酒酵母高效转化方法(具体转化方式参见Gietz,R.D.;Schiestl,R.H.,High-efficiency yeast transformation using the LiAc/SS carrier DNA/PEGmethod[J].Nat Protoc 2007,2(1),31-4.)整合到酿酒酵母菌株中。
当筛选标签为TRP1、LEU2、URA3、HIS5、natMX、hphMX、patMX、bleMX时,转化到菌株C800中。当筛选标签为MET15时,选择菌株C815。
当筛选标签为KanMX时,选择菌株C850。将转化后的菌体涂布在相应的筛选平板上(筛选基因为TRP1时涂布于含YNB-TRP-平板,筛选基因为LEU2时涂布于含YNB-LEU-平板,筛选基因为URA3时涂布于含YNB-URA-平板,筛选基因为HIS5时涂布于含YNB-HIS-平板,筛选基因为MET15时涂布于含YNB-MET-平板,筛选基因为natMX时涂布于含诺尔斯菌素的YPD平板,筛选基因为hphMX时涂布于含潮霉素的YPD平板,筛选基因为KanMX时涂布于含遗传霉素的YPD平板,筛选基因为patMX时涂布于含草铵膦的YPD平板,筛选基因为bleMX时涂布于含博来霉素的YPD平板),30℃,培养3-5d至获得单菌落。对获得的单菌落进行计数,同时接种单菌落进行培养,检测荧光强度。根据获得的转化子数目和转化子荧光强度分布确定工具包中每个组合的整合效率。经过一次转化后,每个组合可以获得的转化子数量分布见图2。每个组合获得的多拷贝重组菌株的荧光强度分布范围见图3。
由图2可知,Ty表达包中大部分质粒经过一次转化后可以获得100-500左右的转化子,但是pcT122、pcT22、pcT32、pcT42;pcT25、pcT35、pcT45以及pcT116、pcT26、pcT46经过多次转化未获得转化子,而以ScMET15deg为筛选标签的pcT114、pcT124、pcT24、pcT34和pcT44获得超过1万个转化子,然而转化子几乎没有荧光(图3),可见ScMET15deg并不适合用于此处高拷贝整合。
由图3可知,其中空白菌株和仅有一个EGFP拷贝的菌株C887的荧光强度值约为8000和25000(图3A)。使用ScMET15deg、KanMXdeg、patMXdeg、BleMXdeg作为筛选标签时,获得的转化子荧光强度较弱,绝大部分仅有一个拷贝(图3D、图3F、图3G、图3H),使用ScTRR1deg作为筛选标签时,绝大部分的转化子荧光强度较弱(图3B)。而使用KlURA3deg、KlLEU2deg、SpHIS5deg、natMXdeg、hphMXdeg几乎都具有较高概率获得强荧光信号的转化子(图3C、图3E、图3I),荧光强度的平均值为对照的7.9-16.5倍之间,最强的一株荧光强度达到对照组的48.2倍。因而这些多拷贝整合质粒可以用来提升酿酒酵母中的拷贝数。
实施例3:多拷贝整合质粒工具包的应用
黄杉素的合成过程涉及到多个基因的引入和过表达,因此用来验证多拷贝整合质粒工具包的性能。黄杉素的合成途径如图4所示,其中模块一为葡萄糖到对香豆酸,模块二为从对香豆酸到柚皮素,模块三为从柚皮素到黄杉素。挑取实施例2中拷贝数显著增加的多拷贝整合质粒工具包应用于生产黄杉素或相关中间产物中。
1、单Ty位点整合重组菌的构建
使用引物Ty4-inte-up/Ty4-inte-down分别扩增pcfB4-47LL和pcfB4-P05m4,将PCR产物通过酿酒酵母高效转化,分别整合到酿酒酵母菌株C800的Ty4位点,分别获得菌株C8011和C805。菌株C8011整合了模块一中对香豆酸合成的相关基因,可以从头合成对香豆酸,菌株C805整合了模块三中柚皮素到黄杉素合成的相关基因,可以从柚皮素合成黄杉素。
2、双Ty位点整合重组菌的构建
使用引物Ty3-inte-up/Ty3-inte-down扩增质粒pcfB3-P03,获得的PCR产物纯化精制后经过酿酒酵母高效转化整合到菌株C8011基因组Ty3位点,获得菌株C824。使用引物Ty4-inte-up/Ty4-inte-down扩增质粒pcfB4-P05m4,获得的PCR产物纯化精制后经过酿酒酵母高效转化整合到菌株C803基因组Ty4位点,获得菌株C857。菌株C824整合了模块一和模块二中从葡萄糖到柚皮素合成的相关基因,可以从头合成柚皮素,菌株C857整合了模块二和模块三中从对香豆酸到黄杉素合成的相关基因,可以从对香豆酸合成黄杉素。
使用引物Pf-gal80/Pf-gal80D扩增pT820,将PCR产物回收后,通过酿酒酵母高效转化方法分别转化到菌株C803和菌株C857中,分别获得菌株C823和菌株C877。菌株C823和菌株C877分别在出发菌株C803和C857基础上强化了丙二酰辅酶A途径。
3、三Ty位点整合重组菌的构建
在菌株C877的基础上整合模块一相关的基因,根据以酪氨酸或者苯丙氨酸为前体,分别获得菌株C900和菌株C901:使用引物Ty2-inte-up/Ty2-inte-down扩增pcT21-LL和pcT21-LHL,PCR产物回收后经过酿酒酵母高效转化法转化到菌株C877中的Ty2位点,分别获得菌株C900和C901。菌株C900和菌株C901都可以从头合成黄杉素,其中菌株C900以酪氨酸为前体,经过TAL途径获得对香豆酸进而合成黄杉素,而菌株C901以苯丙氨酸为前体,经过PAL/C4H/CPR途径获得对香豆酸进而获得黄杉素。
4、重组菌株中黄杉素合成相关基因的RNA表达水平(不同Ty位点整合拷贝数检测及稳定向验证)
(1)拷贝数检测
菌株培养:挑取上述构建得到的菌株C900和菌株C901单菌落接种在含有5mL YNB培养基的250mL摇瓶中,30℃,220rpm培养24小时,获得种子培养基。将种子培养物按照起始OD600=0.1转接到50mL YNB液体培养基的250mL摇瓶中。30℃,220rpm培养6-8小时至对数早期。将发酵液以13500rpm离心3min。去上清收集酵母细胞。
RT-PCR过程:使用RNAprep pure Plant Kit试剂盒(TIANGEN,Beijing,China))提取酵母总RNA。以总RNA为模板,使用PrimeScript RT试剂盒除去DNA后逆转录获得cDNA。使用SYBR Premix Ex Taq(Tli RNAseH Plus)试剂盒,以cDNA为模板进行RT-PCR进行RT-PCR。用于均一化的内参基因ACT1通过引物对ACT1-F/ACT1-R进行RT-PCR。RT-PCR在LightCycler480II仪器上进行。所有结果均根据内参基因ACT1进行了均一化。基因的表达强度根据2-ΔΔCt法(Livak K J,Schmittgen T D.Analysis of relative gene expression datausing real-time quantitative PCR and the 2-ΔΔCT method[J].Methods 2001,25(4),402-8.)进行计算。分别使用引物qEGFP-F/R、qCHS-F/R和qF3H-F/R,对模块一、二和三的基因整合拷贝数进行定量。
经过RT-PCR验证,菌株C900中模块一、模块二和模块三基因分别整合在Ty2位点、Ty3位点和Ty4位点,拷贝数依次为4、5和7,而菌株C901中在Ty2位点、Ty3位点和Ty4位点的拷贝数依次为8、5和7(图7)。
(2)稳定性验证
将菌株C900和C901接种至含有20mL液体YPD培养基的250mL摇瓶中,30℃,220rpm培养,每培养12h按照1%(mL/100mL)接种至含有新鲜20mL液体YPD培养基的250mL摇瓶中,如此进行传代,经过30天,总计传代60代后,将传代后得到的两个菌株以及其相应的出发菌株分别接种至含有20mL液体YPD培养基的250mL摇瓶中,30℃,220rpm培养14-16h后,按照1mL/100mL的接种比例接种到含有20mL YPD培养基的250mL摇瓶中,30℃,220rpm培养,发酵72h,并在第12h、24h、36h和48h时分别添加0.5%(0.5mL/100mL)的95%乙醇,结束后测定黄杉素的产量。结果显示,出发菌株C900和C901的黄杉素产量分别为50.93mg/L和33.83mg/L,菌株C900和C901传代后的菌株产黄杉素的产量分别为52.34mg/L和33.48mg/L,显然,传代后的菌株生产黄杉素的能力并未发生显著改变,由此证明基于Ty转座子的三位点整合菌株的稳定性良好。
5、重组菌发酵生产黄杉素
(1)利用构建得到的菌株C8011、菌株C803、菌株C805和菌株C824、菌株C857和菌株C877:分别挑取单菌落接种到20mL YPD培养基的250mL摇瓶中,控制摇床在30℃,220rpm,培养14-16h至菌株OD600到25左右获得种子液,此时菌株处在对数中期。按照1mL/100mL的接种比例接种到含有20mL YPD培养基的250mL摇瓶中,30℃,220rpm培养,根据需求,在第12h、24h、36h和48h时分别添加0.5%(0.5mL/100mL)的500g/L葡萄糖溶液或者0.5%(0.5mL/100mL)的95%乙醇。发酵结束后取样,检测终产物及中间产物含量。
菌株C8011整合了模块一的相关基因,在250mL摇瓶中发酵72h可以从葡萄糖开始合成544.01mg/L的对香豆酸(图5A)。菌株C803整合了模块二的相关基因,在250mL摇瓶中发酵72h可以从1000mg/L对香豆酸合成623.60mg/L的柚皮素(图5B)。菌株C805整合了模块三的相关基因,在250mL中发酵72h可以从1000mg/L的柚皮素合成603.90mg/L的黄杉素,同时积累392.30mg/L的圣草酚,柚皮素剩余83.80mg/L(图5A)。基于Ty转座子的单位点整合可以获得具有稳定基因表型的组成型菌株。
菌株C824是在菌株C8011基础上整合了模块二的相关基因,可以从葡萄糖为底物合成柚皮素,在250mL摇瓶中经过72h发酵合成264.05mg/L的柚皮素(图5A)。菌株C857是在菌株C803基础上整合了模块二的相关基因,可以从对香豆酸为底物合成黄杉素,在250mL摇瓶中经过72h发酵可以从1000mg/L的对香豆酸合成346.43mg/L的黄杉素,同时中间产物柚皮素和圣草酚的积累量为66.32mg/L和142.66mg/L,而底物对香豆酸还剩余76.52mg/L(图5C)。基于Ty转座子的双位点整合依然可以获得稳定性良好的组成型菌株。
(2)菌株C900和C901都可以从葡萄糖开始合成黄杉素(C900以酪氨酸为前体,C901以苯丙氨酸为前体),为了验证黄杉素合成能力与模块一基因拷贝数之间的关系,从C900和C901转化子库中各选择了10株荧光强度不同的菌株,使用48深孔板进行发酵验证,结果证明荧光强度越高,黄杉素及其他黄酮相关化合物的积累量就越高(图6A,横坐标括号中的数字为荧光强度)。其中以苯丙氨酸为前体的菌株C901获得了最高的黄杉素积累量20.66mg/L,同时对香豆酸、柚皮素和圣草酚的积累量分别为56.67、31.24和19.01mg/L。而以酪氨酸为前体的菌株C900获得的最高黄杉素积累量为19.77mg/L,同时对香豆酸、柚皮素和圣草酚的积累量分别为31.42、23.67和15.56mg/L。
分别挑取C900和C901单菌落接种到20mL YPD培养基的250mL摇瓶中,控制摇床在30℃,220rpm,培养14-16h至菌株OD600到25左右获得种子液,此时菌株处在对数中期。将种子液按照1mL/100mL的接种比例接种到含有20mL YPD培养基的250mL摇瓶中,30℃,220rpm培养,发酵72h,并在第12h、24h、36h和48h时分别添加0.5%(0.5mL/100mL)的95%乙醇。将获得的黄杉素积累量最高的转化子命名为C900和C901。然后在摇瓶水平进行复筛验证,并在第12h、24h、36h和48h时分别以0.5%(0.5mL/100mL)的比例添加500g/L的葡萄糖溶液或者以0.5%(0.5mL/100mL)的比例添加95%的乙醇,检测最佳发酵碳源。在第72h时,菌株C900使用葡萄糖/乙醇作为碳源进行发酵积累的对香豆酸、柚皮素、圣草酚和黄杉素量分别为11.88/8.78、13.35/10.85、22.72/13.40和50.93/33.83mg/L;菌株C901使用葡萄糖/乙醇作为碳源进行发酵积累的对香豆酸、柚皮素、圣草酚和黄杉素量分别为15.97/13.27、24.40/20.72、45.43/24.56和70.54/49.47mg/L(图6B)。
(3)菌株C901在5L发酵罐中发酵:种子培养基同上,按照1%转接到含有2.5L的YPD培养基的5L发酵罐中。温度控制为30±0.1℃,转速600rpm,通气速率3vvn。自葡萄糖浓度降低到0g/L时打开补料泵,流加培养基的速度设定为5.0mL/L,同时控制pH为5.5±0.1,至72h发酵结束,在发酵过程中每隔12h测定发酵液中的各种物质的浓度。结果如图8所示在72h内可以从头合成135.83mg/L的黄杉素,同时积累对香豆酸、柚皮素和圣草酚的量为40.37、10.32和41.10mg/L。
虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。
SEQUENCE LISTING
<110> 江南大学
<120> 一组用于酿酒酵母多拷贝整合的质粒工具包
<130> BAA210539A
<160> 57
<170> PatentIn version 3.3
<210> 1
<211> 508
<212> DNA
<213> 人工序列
<400> 1
ctgaacgtat cgagactcgg ttgtgtcgtt atgctagcaa tgtcctcaca ggctccattc 60
cttctttcgc tctattggat atcatcacag ctattctccc tggtgcaaaa tatcatatta 120
aattggattt atccttacca acgatggtga agctgacgca tagataggat atgtaattct 180
acatcagctt gtaaataaac aaaaatgact ttcaatatcc ttcaaccgtt cctgactctt 240
tcctgctgac ccgtttttcc aaatttctcg tcgaacttga aattgaaaaa aaaaaaaaaa 300
aattgaatga ggactcatta aacagatgat gccgtaataa atgcaatata tcttgctatt 360
taactctttc tttctttgaa aaccttgaca tacgtattta aataattggc tgtccctgcc 420
tcgaagtata tttctcttct acttttatct tagcgatatc cctaagagtt taatcctccc 480
aggtccataa caaaagaagt caagttca 508
<210> 2
<211> 1031
<212> DNA
<213> 人工序列
<400> 2
gagctcgctg tgaagatccc agcaaaggct tacaaagtgt tatctctttt gagacttgtt 60
gagttgaaca ctggtgtttt catcaaactt accaaggacg tgtacccatt gttgaaactt 120
gtatcaccat atattgttat cggacaacct tcacttgcat ctatccgttc tttaatccaa 180
aagagatcta gaataatgtg gcaaaggcca gaagataaag aaccaaaaga gataatcttg 240
aatgacaaca atatcgttga agagaaatta ggtgatgaag gtgtcatttg tatcgaggat 300
atcatccatg agatttcgac gttgggcgaa aatttctcga aatgtacttt cttcctatta 360
ccattcaaat tgaacagaga agtcagtgga ttcggtgcca tctcccgttt gaataaactg 420
aaaatgcgcg aacaaaacaa ggagactcgt caaatttcaa acgctgccac ggctccagtt 480
atccaagtag atatcgactc aatgatttcc aagttgaatt gattaactat aaaaggaaaa 540
tatctgtaca atagacatcg ggctcccatt ggccctaccc acatatgtag aaatacatta 600
ctctattcac tactgcattt agttatgttt aacatttgat atagcagact accgccaggc 660
acaatatatt ccccttccct cttgccattc gctgtacttg tggtggattc caattcagcg 720
cagtcacgtg ctagtaatca ccgcattttt ttcttttcct ttcaggctaa aaccggttcc 780
gggcctgatc cctgcactca ttttctaacg gaaaaccttc agaagcataa ctacccattc 840
cagtttagag tcatgacagg ttcaacatca gatgcttcat atacttttat atattgaatt 900
atataaatat atctatgtac tctaagtaag tacatctgct ttaacgcatt cctacatttg 960
cttcgattta tttttattgt tgatacctat ttgaagaagt aaaaagtatc ccacactaca 1020
cagattatac c 1031
<210> 3
<211> 493
<212> DNA
<213> 人工序列
<400> 3
ttttatttag gttctatcga ggagaaaaag cgacaagaag agatagacca tggataaact 60
gattatgttc taaacactcc tcagaagctc atcgaactgt catcctgcgt gaagattaaa 120
atccaactta gaaatttcga gcttacggag acaatcatat gggagaagca attggaagat 180
agaaaaaagg tactcggtac ataaatatat gtgattctgg gtagaagatc ggtctgcatt 240
ggatggtggt aacgcatttt tttacacaca ttacttgcct cgagcatcaa atggtggtta 300
ttcgtggatc tatatcacgt gatttgctta agaattgtcg ttcatggtga cacttttagc 360
tttgacatga ttaagctcat ctcaattgat gttatctaaa gtcatttcaa ctatctaaga 420
tgtggttgtg attgggccat tttgtgaaag ccagtacgcc agcgtcaata cactcccgtc 480
aattagttgc acc 493
<210> 4
<211> 545
<212> DNA
<213> 人工序列
<400> 4
ccctcgttca cagaaagtct gaagaagcta tagtagaact atgagctttt tttgtttctg 60
ttttcctttt tttttttttt acctctgtgg aaattgttac tctcacactc tttagttcgt 120
ttgtttgttt tgtttattcc aattatgacc ggtgacgaaa cgtggtcgat ggtgggtacc 180
gcttatgctc ccctccatta gtttcgatta tataaaaagg ccaaatattg tattattttc 240
aaatgtccta tcattatcgt ctaacatcta atttctctta aattttttct ctttctttcc 300
tataacacca atagtgaaaa tctttttttc ttctatatct acaaaaactt tttttttcta 360
tcaacctcgt tgataaattt tttctttaac aatcgttaat aattaattaa ttggaaaata 420
accatttttt ctctctttta tacacacatt caaaagaaag aaaaaaaata taccccagct 480
agttaaagaa aatcattgaa aagaataaga agataagaaa gatttaatta tcaaacaata 540
tcaat 545
<210> 5
<211> 600
<212> DNA
<213> 人工序列
<400> 5
gccgtcgaaa aggatctcgt ctctgttggg agcacctggt aagtaaggtg tagttttgca 60
cccgtgtaca taagcgtgaa atcaccacaa actgtgtgta tcaagtacat agtgacattt 120
aaataatagc aagaacaaca ataatagtag cgctactgga agcaccacgt aatagtggaa 180
aagaactgga aaaaccgcta taagatgcat actccggcgg tcttacgcgg agatacaagc 240
ttccaacggt gctaaaagcc cggtttcggc tcggccggag gaggaagaga gacgaaaaaa 300
aaaaaaatga ctaaaaaaaa aatggaatat tattaatgtg ggatttttgg ctcaaggtgt 360
ggtggcccct tttctaaggg tggcgaattc ttcaatgtac ggaaaactcg ccaaggctat 420
cccatatata agcaaactgt gggttcatct atataccgac acataacacc taaagtggct 480
tcctcctgcc cctctctccc ttttctccac tcacccctcc ttctccccct tccccctctc 540
caattggctg tatagacaga aagagtaaat ccaatagaat agaaaaccac ataaggcaag 600
<210> 6
<211> 520
<212> DNA
<213> 人工序列
<400> 6
tggattacat ttgattcagt catacacgaa ttatggtctt gatactgaca aattttccag 60
attgaggcgg ttcttatggt ttagaacttg gggactttac aagtcgaaag aggatttaga 120
tagagaagcc aagatcaatg aagaaatgat acgcaaactg aaagcagcta aatgaaatca 180
cctattgcgc cgctcgcgga atacaattac taaattttat atatattctt taaaaatgca 240
tctatacatt cgtttttcca cgtataccaa attcgaaaaa agttgttaaa ccatcgtttt 300
cacgtttttt aatttttttt tggttctctt tttttttttt tttcaatatc aacttttttt 360
caaacttcgt gttgcatttc ctttatcgta aattttcaat ggatctctat aatcttcgaa 420
gttcgaagaa aagaagaaaa aaagtattga aaagttgaaa catcgattcc gttttgctaa 480
caaatagcac tcagcatcct gcataaaatt ggtataagat 520
<210> 7
<211> 520
<212> DNA
<213> 人工序列
<400> 7
cgtatccaag ccgaaacggc gctcgcctca tccccacggg aataaggcag ccgacaaaag 60
aaaaacgacc gaaaaggaac cagaaagaaa aaagagggtg ggcgcgccgc ggacgtgtaa 120
aaagatatgc atccagcttc tatatcgctt taactttacc gttttgggca tcgggaacgt 180
atgtaacatt gatctcctct tgggaacggt gagtgcaacg aatgcgatat agcaccgacc 240
atgtgggcaa attcgtaata aattcggggt gagggggatt caagacaagc aaccttgtta 300
gtcagctcaa acagcgattt aacggttgag taacacatca aaacaccgtt cgaggtcaag 360
cctggcgtgt ttaacaagtt cttgatatca tatataaatg taataagaag tttggtaata 420
ttcaattcga agtgttcagt cttttacttc tcttgtttta tagaagaaaa aacatcaaga 480
aacatcttta acatacacaa acacatacta tcagaataca 520
<210> 8
<211> 500
<212> DNA
<213> 人工序列
<400> 8
acgtgagcta aagcacagat tgttggaaaa gcaagcggac ggccgcggag cgctgaacgt 60
gattttccat tgtatgttat cgcagcagcg cggaccgtct gcagcgatgc tgctgcttcg 120
gtcgcttgac acggcggaac tttctcgctg tcgtctatgg gtgttgcgtg gggggttctc 180
gcgctggcaa tccgtatacg gtgacgacga gagcgttacg gcgggttacc tacccgatct 240
gtggcgttga caggtttaca caatcgcacg tgatcatata tttgccatga ctcctcccag 300
tgacaatttt gttctttttt cctctttatc gctttcgtac tatggtcagt cattcattca 360
ttatatacgc gctctccata acccgtaact ttttattata tatagactcg tttacaatac 420
aacgatagcg ataccattca attgaagttg tgagaccagg taacgagacg aacacaactt 480
tacaagtcaa ataagaaatc 500
<210> 9
<211> 720
<212> DNA
<213> 人工序列
<400> 9
aataagcgcc actatcaggg aatagcaact ttcccttctg tttcaatctt tttacctatt 60
cctttttaaa agatatatat acattaaact ccttctacaa gtatatattt tatacatatc 120
tacagggcgt atatatacat aacattttaa gataagcaag tgaatgttga ttcccgtttc 180
ttagtcaaca cttctttcta ttttacccgg tcgttaccct attaaaaaaa caacttacaa 240
tcattgttcg ccccttccat acttactgcc actcgcaaaa gggcccaacc agggcaatta 300
cgtatcaaaa aatcatgaca ggctgggtaa taaatattcg tgaagaaaga agaaattaaa 360
aaaagaaacg aagaagcaaa aaaaagaaaa gactccgttt aatcactttc aaccgcggtt 420
tatccggccc cacccatgca taaccctaaa ttattagatc acttagcacg tgaaaaagaa 480
acgtttttaa tgtttttttt ttttttttct ttttcttttt ttgcgttggt gaaaattttt 540
tcgcttcctc gagtataatt atctcatctc atctttcata taagataaga agttttataa 600
aaaccttttg catcaaaatt ttgtagaata tctctttttc ttacgctctc tttctttcct 660
taattgtttt ctaaagaacc gtgtattttt ctagttcgaa tccatcgata acattaaaag 720
<210> 10
<211> 723
<212> DNA
<213> 人工序列
<400> 10
atgtcggtga taaactttac aggaagtagt ggacccttgg tgaaggtctg cggattacag 60
agtacagagg cggcagagtg tgctctagat agtgatgccg acctactagg aataatatgc 120
gttcccaaca ggaagaggac aatagacccc gtgatagcta ggaagataag ttcactagtc 180
aaagcctaca agaacagttc aggaacaccc aagtacctag taggagtttt taggaaccag 240
cccaaggaag acgtactagc gctagtgaat gattatggaa tagatatagt tcaattacat 300
ggcgatgagt catggcaaga atatcaggag ttcttaggac ttcccgtcat aaagcggttg 360
gtatttccca aggattgtaa tatcctcctt tccgccgcaa gtcaaaagcc ccactcattc 420
atacccctct tcgacagtga ggccggagga acaggagagc ttctagactg gaacagtata 480
tcggattggg taggacgaca agagagtccc gagagtcttc atttcatgct agctggagga 540
ctaacacccg agaacgtcgg agatgcccta cgactaaatg gagtaatagg agtagacgtt 600
agtggagggg tagagacaaa tggagtgaag gacagtaata aaatagctaa tttcgtaaaa 660
aatgcaaaga aggcttgtaa aaattggttc tcttctttgt ctcatttcgt tattcatttg 720
taa 723
<210> 11
<211> 723
<212> DNA
<213> 人工序列
<400> 11
atgtcggtga taaactttac aggaagtagt ggacccttgg tgaaggtctg cggattacag 60
agtacagagg cggcagagtg tgctctagat agtgatgccg acctactagg aataatatgc 120
gttcccaaca ggaagaggac aatagacccc gtgatagcta ggaagataag ttcactagtc 180
aaagcctaca agaacagttc aggaacaccc aagtacctag taggagtttt taggaaccag 240
cccaaggaag acgtactagc gctagtgaat gattatggaa tagatatagt tcaattacat 300
ggcgatgagt catggcaaga atatcaggag ttcttaggac ttcccgtcat aaagcggttg 360
gtatttccca aggattgtaa tatcctcctt tccgccgcaa gtcaaaagcc ccactcattc 420
atacccctct tcgacagtga ggccggagga acaggagagc ttctagactg gaacagtata 480
tcggattggg taggacgaca agagagtccc gagagtcttc atttcatgct agctggagga 540
ctaacacccg agaacgtcgg agatgcccta cgactaaatg gagtaatagg agtagacgtt 600
agtggagggg tagagacaaa tggagtgaag gacagtaata aaatagctaa tttcgtaaaa 660
aatgcaaaga aggcttgtaa aaattggttc tcttctttgt ctcatttcgt tattcatttg 720
taa 723
<210> 12
<211> 1136
<212> DNA
<213> 人工序列
<400> 12
atgtctaaga atatcgttgt cctaccgggt gatcacgtcg gtaaagaagt tactgacgaa 60
gctattaagg tcttgaatgc cattgctgaa gtccgtccag aaattaagtt caatttccaa 120
catcacttga tcgggggtgc tgccatcgat gccactggca ctcctttacc agatgaagct 180
ctagaagcct ctaagaaagc cgatgctgtc ttactaggtg ctgttggtgg tccaaaatgg 240
ggtacgggcg cagttagacc agaacaaggt ctattgaaga tcagaaagga attgggtcta 300
tacgccaact taagaccatg taactttgct tctgattctt tactagatct ttctcctttg 360
aagcctgaat atgcaaaggg taccgatttc gtcgtcgtta gagaattggt tggtggtatc 420
tactttggtg aaagaaaaga agatgaaggt gacggagttg cttgggactc tgagaaatac 480
agtgttcctg aagttcaaag aattacaaga atggctgctt tcttggcatt gcaacaaaac 540
ccaccattac caatctggtc acttgacaag gctaacgtgc ttgcctcttc cagattgtgg 600
agaaagactg ttgaagaaac catcaagact gagttcccac aattaactgt tcagcaccaa 660
ttgatcgact ctgctgctat gattttggtt aaatcaccaa ctaagctaaa cggtgttgtt 720
attaccaaca acatgtttgg tgatattatc tccgatgaag cctctgttat tccaggttct 780
ttgggtttat taccttctgc atctctagct tccctacctg acactaacaa ggcattcggt 840
ttgtacgaac catgtcatgg ttctgcccca gatttaccag caaacaaggt taacccaatt 900
gctaccatct tatctgcagc tatgatgttg aagttatcct tggatttggt tgaagaaggt 960
agggctcttg aagaagctgt tagaaatgtc ttggatgcag gtgtcagaac cggtgacctt 1020
ggtggttcta actctaccac tgaggttggc gatgctatcg ccaaggctgt caaggaaatc 1080
ttggcgcttg taaaaattgg ttctcttctt tgtctcattt cgttattcat ttgtaa 1136
<210> 13
<211> 852
<212> DNA
<213> 人工序列
<400> 13
atgtccacaa aatcatatac cagtagagct gagactcatg caagtccggt tgcatcgaaa 60
cttttacgtt taatggatga aaagaaaacc aatttgtgtg cttctcttga cgttcgttcg 120
actgatgagc tattgaaact tgttgaaacg ttgggtccat acatttgcct tttgaaaaca 180
cacgttgata tcttggatga tttcagttat gagggtactg tcgttccatt gaaagcattg 240
gcagagaaat acaagttctt gatatttgag gacagaaaat tcgccgatat cggtaacaca 300
gtcaaattac aatatacatc gggcgtttac cgtatcgcag aatggtctga tatcaccaac 360
gcccacgggg ttactggtgc tggtattgtt gctggcttga aacaaggtgc gcaagaggtc 420
accaaagaac caaggggatt attgatgctt gctgaattat cttccaaggg ttctctagca 480
cacggtgaat atactaaggg taccgttgat attgcaaaga gtgataaaga tttcgttatt 540
gggttcattg ctcagaacga tatgggagga agagaagaag ggtttgattg gctaatcatg 600
accccaggtg taggtttaga cgacaaaggc gatgcattgg gtcagcagta cagaaccgtc 660
gacgaagttg taagtggtgg atcagatatc atcattgttg gcagaggact tttcgccaag 720
ggtagagatc ctaaggttga aggtgaaaga tacagaaatg ctggatggga agcgtaccaa 780
aagagaatca gcgctcccca tgcttgtaaa aattggttct cttctttgtc tcatttcgtt 840
attcatttgt aa 852
<210> 14
<211> 1383
<212> DNA
<213> 人工序列
<400> 14
atgccatctc atttcgatac tgttcaacta cacgccggcc aagagaaccc tggtgacaat 60
gctcacagat ccagagctgt accaatttac gccaccactt cttatgtttt cgaaaactct 120
aagcatggtt cgcaattgtt tggtctagaa gttccaggtt acgtctattc ccgtttccaa 180
aacccaacca gtaatgtttt ggaagaaaga attgctgctt tagaaggtgg tgctgctgct 240
ttggctgttt cctccggtca agccgctcaa acccttgcca tccaaggttt ggcacacact 300
ggtgacaaca tcgtttccac ttcttactta tacggtggta cttataacca gttcaaaatc 360
tcgttcaaaa gatttggtat cgaggctaga tttgttgaag gtgacaatcc agaagaattc 420
gaaaaggtct ttgatgaaag aaccaaggct gtttatttgg aaaccattgg taatccaaag 480
tacaatgttc cggattttga aaaaattgtt gcaattgctc acaaacacgg tattccagtt 540
gtcgttgaca acacatttgg tgccggtggt tacttctgtc agccaattaa atacggtgct 600
gatattgtaa cacattctgc taccaaatgg attggtggtc atggtactac tatcggtggt 660
attattgttg actctggtaa gttcccatgg aaggactacc cagaaaagtt ccctcaattc 720
tctcaacctg ccgaaggata tcacggtact atctacaatg aagcctacgg taacttggca 780
tacatcgttc atgttagaac tgaactatta agagatttgg gtccattgat gaacccattt 840
gcctctttct tgctactaca aggtgttgaa acattatctt tgagagctga aagacacggt 900
gaaaatgcat tgaagttagc caaatggtta gaacaatccc catacgtatc ttgggtttca 960
taccctggtt tagcatctca ttctcatcat gaaaatgcta agaagtatct atctaacggt 1020
ttcggtggtg tcttatcttt cggtgtaaaa gacttaccaa atgccgacaa ggaaactgac 1080
ccattcaaac tttctggtgc tcaagttgtt gacaatttaa agcttgcctc taacttggcc 1140
aatgttggtg atgccaagac cttagtcatt gctccatact tcactaccca caaacaatta 1200
aatgacaaag aaaagttggc atctggtgtt accaaggact taattcgtgt ctctgttggt 1260
atcgaattta ttgatgacat tattgcagac ttccagcaat cttttgaaac tgttttcgct 1320
ggccaaaaac cagcttgtaa aaattggttc tcttctttgt ctcatttcgt tattcatttg 1380
taa 1383
<210> 15
<211> 747
<212> DNA
<213> 人工序列
<400> 15
atggcagaac cagcccaaaa aaagcaaaaa caaactgttc aggagcgcaa ggcgtttatc 60
tcccgtatca ctaatgaaac taaaattcaa atcgctattt cgctgaatgg tggttatatt 120
caaataaaag attcgattct tcctgcaaag aaggatgacg atgtagcttc ccaagctact 180
cagtcacagg tcatcgatat tcacacaggt gttggctttt tggatcatat gatccatgcg 240
ttggcaaaac actctggttg gtctcttatt gttgaatgta ttggtgacct gcacattgac 300
gatcaccata ctaccgaaga ttgcggtatc gcattagggc aagcgttcaa agaagcaatg 360
ggtgctgtcc gtggtgtaaa aagattcggt actgggttcg caccattgga tgaggcgcta 420
tcacgtgccg tagtcgattt atctagtaga ccatttgctg taatcgacct tggattgaag 480
agagagatga ttggtgattt atccactgaa atgattccac actttttgga aagtttcgcg 540
gaggcggcca gaattacttt gcatgttgat tgtctgagag gtttcaacga tcaccacaga 600
agtgagagtg cgttcaaggc tttggctgtt gccataagag aagctatttc tagcaatggc 660
accaatgacg ttccctcaac caaaggtgtt ttgatggctt gtaaaaattg gttctcttct 720
ttgtctcatt tcgttattca tttgtaa 747
<210> 16
<211> 621
<212> DNA
<213> 人工序列
<400> 16
atgggtacca ctcttgacga cacggcttac cggtaccgca ccagtgtccc gggggacgcc 60
gaggccatcg aggcactgga tgggtccttc accaccgaca ccgtcttccg cgtcaccgcc 120
accggggacg gcttcaccct gcgggaggtg ccggtggacc cgcccctgac caaggtgttc 180
cccgacgacg aatcggacga cgaatcggac gacggggagg acggcgaccc ggactcccgg 240
acgttcgtcg cgtacgggga cgacggcgac ctggcgggct tcgtggtcgt ctcgtactcc 300
ggctggaacc gccggctgac cgtcgaggac atcgaggtcg ccccggagca ccgggggcac 360
ggggtcgggc gcgcgttgat ggggctcgcg acggagttcg cccgcgagcg gggcgccggg 420
cacctctggc tggaggtcac caacgtcaac gcaccggcga tccacgcgta ccggcggatg 480
gggttcaccc tctgcggcct ggacaccgcc ctgtacgacg gcaccgcctc ggacggcgag 540
caggcgctct acatgagcat gccctgcccc gcttgtaaaa attggttctc ttctttgtct 600
catttcgtta ttcatttgta a 621
<210> 17
<211> 1077
<212> DNA
<213> 人工序列
<400> 17
atgggtaaaa agcctgaact caccgcgacg tctgtcgaga agtttctgat cgaaaagttc 60
gacagcgtct ccgacctgat gcagctctcg gagggcgaag aatctcgtgc tttcagcttc 120
gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct gcgccgatgg tttctacaaa 180
gatcgttatg tttatcggca ctttgcatcg gccgcgctcc cgattccgga agtgcttgac 240
attggggaat tcagcgagag cctgacctat tgcatctccc gccgtgcaca gggtgtcacg 300
ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc agccggtcgc ggaggccatg 360
gatgcgatcg ctgcggccga tcttagccag acgagcgggt tcggcccatt cggaccgcaa 420
ggaatcggtc aatacactac atggcgtgat ttcatatgcg cgattgctga tccccatgtg 480
tatcactggc aaactgtgat ggacgacacc gtcagtgcgt ccgtcgcgca ggctctcgat 540
gagctgatgc tttgggccga ggactgcccc gaagtccggc acctcgtgca cgcggatttc 600
ggctccaaca atgtcctgac ggacaatggc cgcataacag cggtcattga ctggagcgag 660
gcgatgttcg gggattccca atacgaggtc gccaacatct tcttctggag gccgtggttg 720
gcttgtatgg agcagcagac gcgctacttc gagcggaggc atccggagct tgcaggatcg 780
ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc aactctatca gagcttggtt 840
gacggcaatt tcgatgatgc agcttgggcg cagggtcgat gcgacgcaat cgtccgatcc 900
ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa gcgcggccgt ctggaccgat 960
ggctgtgtag aagtactcgc cgatagtgga aaccgacgcc ccagcactcg tccgagggca 1020
aaggaagctt gtaaaaattg gttctcttct ttgtctcatt tcgttattca tttgtaa 1077
<210> 18
<211> 858
<212> DNA
<213> 人工序列
<400> 18
atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat ggatgctgat 60
ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 120
ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 180
aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 240
accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 300
ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 360
gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 420
agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat 480
gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 540
cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 600
aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 660
gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 720
ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 780
tttcatttga tgctcgatga gtttttcgct tgtaaaaatt ggttctcttc tttgtctcat 840
ttcgttattc atttgtaa 858
<210> 19
<211> 603
<212> DNA
<213> 人工序列
<400> 19
atgggtagcc cagaacgacg cccggtcgag atccgtcccg ccaccgccgc cgacatggcg 60
gcggtctgcg acatcgtcaa tcactacatc gagacgagca cggtcaactt ccgtacggag 120
ccgcagactc cgcaggagtg gatcgacgac ctggagcgcc tccaggaccg ctacccctgg 180
ctcgtcgccg aggtggaggg cgtcgtcgcc ggcatcgcct acgccggccc ctggaaggcc 240
cgcaacgcct acgactggac cgtcgagtcg acggtgtacg tctcccaccg gcaccagcgg 300
ctcggactgg gctccaccct ctacacccac ctgctgaagt ccatggaggc ccagggcttc 360
aagagcgtgg tcgccgtcat cggactgccc aacgacccga gcgtgcgcct gcacgaggcg 420
ctcggataca ccgcgcgcgg gacgctgcgg gcagccggct acaagcacgg gggctggcac 480
gacgtggggt tctggcagcg cgacttcgag ctgccggccc cgccccgccc cgtccggccc 540
gtcacacaga tcgcttgtaa aaattggttc tcttctttgt ctcatttcgt tattcatttg 600
taa 603
<210> 20
<211> 429
<212> DNA
<213> 人工序列
<400> 20
atggccgacc aagcgacgcc caacctgcca tcacgagatt tcgatcccac cgccgccttc 60
tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc 120
ggggatctca agctggagtt cttcgcccac cccgggctcg atcccctcgc gagttggttc 180
agctgctgcc tgaggctgga cgacctcgcg gagttctacc ggcagtgcaa atccgtcggc 240
atccaggaaa ccagcagcgg ctatccgcgc atccatgccc ccgaactgca ggagtgggga 300
ggcacgatgg ccgctttggt cgacccggac gggacgctcc tgcgcctgat acagaacgaa 360
ttgcttgcag gcatctcagc ttgtaaaaat tggttctctt ctttgtctca tttcgttatt 420
catttgtaa 429
<210> 21
<211> 211
<212> DNA
<213> 人工序列
<400> 21
tccgcgctga gggtttaatg gcgcgccgcg gccgcccgcg gtgttggaat aaaaatccac 60
tatcgtctat caactaatag ttatattatc aatatattat catatacggt gttaagatga 120
tgacataagt tatgagaagc tgtcatcgaa gttagaggaa gctgaagtgc aaggattgat 180
aatgtaatag gatcaatgaa tataaacata t 211
<210> 22
<211> 213
<212> DNA
<213> 人工序列
<400> 22
aaaacggaat gaggaataat cgtaatatta gtatgtagaa atatagattc cattttgagg 60
attcctatat cctcgaggag aacttctagt gtatattctg tatacctaat attatagcct 120
ttatcaacaa tggaatccca acaattatct aattacccac aaatttctca agatctgcgg 180
ccgcactcag acctgaagtg aagttcctat act 213
<210> 23
<211> 208
<212> DNA
<213> 人工序列
<400> 23
ccgcgctgag ggtttaatgg cgcgccgcgg ccgcccgcgg tgttggaata aaaatcaact 60
atcatctact aactagtatt tacgttacta gtatattatc atatacggtg ttagaagatg 120
acgcaaatga tgagaaatag tcatctaaat tagtggaagc tgaaacgcaa ggattgataa 180
tgtaatagga tcaatgaata ttaacata 208
<210> 24
<211> 211
<212> DNA
<213> 人工序列
<400> 24
taaaacggaa tgatgaataa tatttataga attgtgtaga attgcagatt cccttttatg 60
gattcctaaa tcctcgagga gaacttctag tatattctgt atacctaata ttatagcctt 120
tatcaacaat ggaatcccaa caattatctc aaaattcaca tatttctcaa gatctgcggc 180
cgcactcaga cctgaagtga agttcctata c 211
<210> 25
<211> 209
<212> DNA
<213> 人工序列
<400> 25
gtgtccgcgc tgagggttta atggcgcgcc gcggccgccc gcggtgttgg aataaaaatc 60
aactatcatc tactaactag tatttacgtt actagtatat tatcatatac ggtgttagaa 120
gatgacgcaa atgatgagaa atagtcatct aaattagtgg aagctgaaac gcaaggattg 180
ataatgtaat aggatcaatg aatattaac 209
<210> 26
<211> 205
<212> DNA
<213> 人工序列
<400> 26
atataaaatg atgataataa tatttataga attgtgtaga attgcagatt cccttttatg 60
gattcctaaa tcctgaggag aacttctagt atattctaca tacctaatat tattgcctta 120
ttaaaaatgg aatcccaaca attacatcaa aatccacatt ctcagatctg cggccgcact 180
cagacctgaa gtgaagttcc tatac 205
<210> 27
<211> 212
<212> DNA
<213> 人工序列
<400> 27
gtccgcgctg agggtttaat ggcgcgccgc ggccgcccgc ggtgttgtat ctcaaaatga 60
gatatgtcag tatgacaata cgtcatcctg aacgttcata aaacacatat gaaacaacct 120
tataacaaaa cgaacaacat gagacaaaac ccgtccttcc ctagctgaac tacccaaaag 180
tataaatgcc tgaacaatta gtttagatcc ga 212
<210> 28
<211> 213
<212> DNA
<213> 人工序列
<400> 28
gattccgcgc ttccaccact tagtatgatt catattttat ataatatata agataagtaa 60
cattccgtga attaatctga taaactgttt tgacaactgg ttacttccct aagactgttt 120
atattaggat tgtcaagaca ctccggtatt actcgagccc gtaatacaac aagatctgcg 180
gccgcactca gacctgaagt gaagttccta tac 213
<210> 29
<211> 298
<212> DNA
<213> 人工序列
<400> 29
gaacttctga agtggggatt taaatgcggc cgcgctgagg gtttaatggc gcgccgcggc 60
cgcccgcggt gttggaacga gagtaattaa tagtgacatg agttgctatg gtaacaatct 120
aatgcttaca tcgtatatta atgtacaact cgtatacgtt taagtgtgat tgcgcctatt 180
gcagaaggaa tgttaaacga gaagctcaga caatactgaa gctgtgttaa agacctatta 240
gttgaacatg ttatgctagc attaagtcct cagcgagctc gcatggaatg cgtgcgat 298
<210> 30
<211> 401
<212> DNA
<213> 人工序列
<400> 30
taggtgatat cagatccact agtggcctat gcacccaatt cgccctatag tgagtcgtat 60
tacgcgcgct cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 120
cctacaggac tagtgctgag gcattaattg atcaggtagg tacatatatg aggaatatga 180
gtcgtcacat caatgtatag taactaccgg aatcactatt atattggtca tgattaatat 240
gaccaatcgg cgtgtgtttt atatacctct cttatttagt ataagaagat cagtactcac 300
ttcttcatta atactaattt ttaacctcta attatcaaca agatctgcgg ccgcggccgc 360
aaatttaaat aaaatgaagt gaagttccta tactttctag a 401
<210> 31
<211> 343
<212> DNA
<213> 人工序列
<400> 31
caagtgtttt tgacgaaaga ttatcacttg gaaacaaagc aatattccat ttggaagggt 60
tcatagcaaa agttatgtgc tgtctagatt aatgtaagat atgtcataaa tactgtataa 120
gtcacacaaa aagctgatat ttaacgcatc ttagtcttta ttttctttgt tatttatttt 180
catttaaaac aaactttact gttttttttt tgtttattat ttttagtata caactatata 240
gataatttac atttattctt cgtcattaaa tttaggagcc aagaaaaact gtaggaaccc 300
actcttcaaa tcaaattgga ataaagcagg agcttcgctg gag 343
<210> 32
<211> 352
<212> DNA
<213> 人工序列
<400> 32
agagtatcaa gaatttaaaa tgaaacatct caaaagaaaa aagaatgcaa atgagtctat 60
cgacgaattt gaagggaaat aaacgcataa tgtacagtaa cgtataacaa ttaaagattt 120
gtggaagttt tcaaaaactt ttcaactttt ttctttgttt tttttttgca acttcttata 180
ttaatattgt catagatatt tcttatacaa aaacaagcga acaaaaataa tcgacgtata 240
tacaatagat atataagact gtttttcttc aatagaacag gcgaaattat tctaccggcc 300
gaaggtacat cttcccgcta tgtaataaat agaggtattt aagttataac aa 352
<210> 33
<211> 356
<212> DNA
<213> 人工序列
<400> 33
agcttctctt tacgttccaa tgactggtaa agttaccatt gcaatgttgt tgagaaacat 60
gttacgttta gtaaggaacg tagaactgtc taaagaaaaa tagaacattt gtggctgttc 120
aaataagcat aggtaaaaca gaatacataa aaataaggga aaaaaagaaa gatcatttgt 180
aatgtactta ctacatacat atagaattct cctctcttag attatcatat aatatacaaa 240
gtttatgggt cttatttctt ctgtctttta gcagagggct caatatcagt ggcactgacg 300
aactcttctt cgtattcttg tccatcatcc gaatacgacg cttcatcttc gtagtc 356
<210> 34
<211> 358
<212> DNA
<213> 人工序列
<400> 34
aaagattctc tttttttatg atatttgtac ataaacttta taaatgaaat tcataataga 60
aacgacacga aattacaaaa tggaatatgt tcatagggta gacgaaacta tatacgcaat 120
ctacatacat ttatcaagaa ggagaaaaag gaggatgtaa aggaatacag gtaagcaaat 180
tgatactaat ggctcaacgt gataaggaaa aagaattgca ctttaacatt aatattgaca 240
aggaggaggg caccacacaa aaagttaggt gtaacagaaa atcatgaaac tatgattcct 300
aatttatata ttggaggatt ttctctaaaa aaaaaaaaat acaacaaata aaaaacac 358
<210> 35
<211> 439
<212> DNA
<213> 人工序列
<400> 35
ttttaaaggt gaactgatct acgcgccctc gatagtaatg actaaatatc ttgggtagag 60
tatatataat gtcgtatttt tgtatattgt tttatttaga caaatagtaa cgtgttatgt 120
tccttcaatc gcatctttca tgatctttaa tcgatcgtca aatggatcca tttagagttt 180
ctcatcacca tccccatatc atttcactcc accccgcttt acgtaaaaaa aaaaaaaaaa 240
attgaataaa tgactaagaa ttagacacaa ttttgtctta atgaatgctt tttacttatg 300
acacatgcca gtttgtacat atgttgatct tcatagctcc gataatcttc ataaattcgt 360
gacaaattaa aattacacat tattatgtaa actataatat acaatgttgc ctatcaagac 420
aaacatatgc actctatga 439
<210> 36
<211> 400
<212> DNA
<213> 人工序列
<400> 36
cactcatacg ccatccttaa agacctggtc tacgatcaaa tgattttttt agtttacaat 60
ctatttttgt ttctaagcaa gtttatcacg caaatacata agtatatttt tactttctat 120
tcttcctagt ttatatttat ttcattgtaa ctttcttaga agctcggtcc tctcgctata 180
tagtaggatc tgcaacatat ttggatgtgg gtgggcgttc tccttctttt ttagatgtaa 240
ggtccaacac gtataacagg tgatacacat agaaagacac gtggaaataa cagtcattta 300
cgaatattta aaacctgagc aactccgtca aatttgatct taatcttttc tggggcccca 360
tctaattccc agaaagccct tcgaattaga aaccggatgc 400
<210> 37
<211> 331
<212> DNA
<213> 人工序列
<400> 37
ggtaacaaga ttggcaaaca taataagaaa ggtccaaagt tcaaatctag aaaaaaatta 60
tagaagattg aaactgagca atatggctaa ttacacacct ggagaaaaaa tcagatatgt 120
atatataaga atattataat actgtatatt aaaaatgatt aaaataaaga aaaaaatgaa 180
tcgggcgttt aattgcttat tatcttgaag aagcgaaagt acactatata gtaataatgt 240
gaggttaatt aaatatggat gagataatga cgaaagaaaa tgcagaaatg tcgttttaaa 300
agtaaccccc ataatctagt gaggttcgac g 331
<210> 38
<211> 301
<212> DNA
<213> 人工序列
<400> 38
gttaacatta cgttaataaa taggtatata tgaatattta taccaacaca tctattataa 60
taggcgaacc tctgtatgta attaagtaaa aaaaaaacga tgtgacagga tagttaaggt 120
gcctcgtaca taaataaaaa cggaaatagt taattctttc aaaaatatgg caatagccaa 180
actcattcag aaggtacagg aaacactctg tttctgtgcg tttatataac catgcttata 240
aaagaaagat tgaacaaaat atacatgaat ttatgaacgg taatcaccgt taattgttac 300
a 301
<210> 39
<211> 205
<212> DNA
<213> 人工序列
<400> 39
cattccgttg gtagatacgt tgttgacact tctaaataag cgaatttctt atgatttatg 60
atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta aagtgactct 120
taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt caggttgctt 180
tctcaggtat agcatgaggt cgctc 205
<210> 40
<211> 190
<212> DNA
<213> 人工序列
<400> 40
atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc ctatttattt 60
ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc ttttttttct 120
gtacagacgc gtgtacgcat gtaacattat actgaaaacc ttgcttgaga aggttttggg 180
acgctcgaag 190
<210> 41
<211> 725
<212> DNA
<213> 人工序列
<400> 41
tttgccagct tactatcctt cttgaaaata tgcactctat atcttttagt tcttaattgc 60
aacacataga tttgctgtat aacgaatttt atgctatttt ttaaatttgg agttcagtga 120
taaaagtgtc acagcgaatt tcctcacatg tagggaccga attgtttaca agttctctgt 180
accaccatgg agacatcaaa aattgaaaat ctatggaaag atatggacgg tagcaacaag 240
aatatagcac gagccgcgga gttcatttcg ttacttttga tatcactcac aactattgcg 300
aagcgcttca gtgaaaaaat cataaggaaa agttgtaaat attattggta gtattcgttt 360
ggtaaagtag agggggtaat ttttcccctt tattttgttc atacattctt aaattgcttt 420
gcctctcctt ttggaaagct atacttcgga gcactgttga gcgaaggctc attagatata 480
ttttctgtca ttttccttaa cccaaaaata agggaaaggg tccaaaaagc gctcggacaa 540
ctgttgaccg tgatccgaag gactggctat acagtgttca caaaatagcc aagctgaaaa 600
taatgtgtag ctatgttcag ttagtttggc tagcaaagat ataaaagcag gtcggaaata 660
tttatgggca ttattatgca gagcatcaac atgataaaaa aaaacagttg aatattccct 720
caaaa 725
<210> 42
<211> 717
<212> DNA
<213> 人工序列
<400> 42
atgggtaagg gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120
aaacttaccc ttaaatttat ttgcactact ggaaagcttc ctgttccttg gccaacactt 180
gtcactactc ttacttatgg tgttcaatgc ttttcaagat acccagatca tatgaagcgg 240
cacgacttct tcaagagcgc catgcctgag ggatacgtgc aggagaggac catcttcttc 300
aaggacgacg ggaactacaa gacacgtgct gaagtcaagt ttgagggaga caccctcgtc 360
aacagaatcg agcttaaggg aatcgatttc aaggaggacg gaaacatcct cggccacaag 420
ttggaataca actacaactc ccacaacgta tacatcatgg cagacaaaca aaagaatgga 480
atcaaagtta acttcaaaat tagacacaac attgaagatg gaagcgttca actagcagac 540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600
ctgtccacac aatctgccct ttcgaaagat cccaacgaaa agagagacca catggtcctt 660
cttgagtttg taacagctgc tgggattaca catggcatgg atgaactata caaataa 717
<210> 43
<211> 580
<212> DNA
<213> 人工序列
<400> 43
gtgaatttac tttaaatctt gcatttaaat aaattttctt tttatagctt tatgacttag 60
tttcaattta tatactattt taatgacatt ttcgattcat tgattgaaag ctttgtgttt 120
tttcttgatg cgctattgca ttgttcttgt ctttttcgcc acatgtaata tctgtagtag 180
atacctgata cattgtggat gctgagtgaa attttagtta ataatggagg cgctcttaat 240
aattttgggg atattggctt ttttttttaa agtttacaaa tgaatttttt ccgccaggat 300
aacgattctg aagttactct tagcgttcct atcggtacag ccatcaaatc atgcctataa 360
atcatgccta tatttgcgtg cagtcagtat catctacatg aaaaaaactc ccgcaatttc 420
ttatagaata cgttgaaaat taaatgtacg cgccaagata agataacata tatctagatg 480
cagtaatata cacagattcc cgcggacgtg ggaaggaaaa aattagataa caaaatctga 540
gtgatatgga aattccgctg tatagctcat atctttccct 580
<210> 44
<211> 2157
<212> DNA
<213> 人工序列
<400> 44
atggatcaat ataccaatgg acattccact agtaagatga atcatgatga tcatagtagt 60
ttatgccaga ctactacgac ggacccattg aattggggtg tggctgcggc ggcgttaagc 120
ggcagccacc tcaacgaggt gaagaagatg gtggaggagt atcggaatcc ggtggtgagg 180
ttgggtggcg aaacgctgac tattggtcag gtagcagcgg tcgccaccac tagggacgtt 240
caggttgagt tatcggaatc ttctcgtgcc ggagttacag ccagcagcga ttgggtgatg 300
gatagcatga aaagaggagg agacacctat ggtgtcacca ccggtttcgg tgccacctct 360
caccggagaa caaaggaagg tggtgctctt caacaagagc tcattagatt cttgaacgcc 420
ggaatcttcg gtaccggaac ggaatccgac catacgctgc cgcaatccac cacaagagcc 480
gccatgttgg tcagaatcaa caccctcctc caaggctact ccggcatccg attcgaaatc 540
ttagaagcca tcactaaatt tctcaaccac aacatcaccc catgcctacc cttacgtggc 600
actatcacag cctccggtga cctggtccca ctctcctaca ttgccggaat cttgaccggt 660
cgtcacaatt ccaaggccgt cggccccacc ggagaattac tcgatgccgc caaatctttc 720
gatcgtgccg gtatcgatac tggatttttc gagctacaac cgaaagaagg acttgcgtta 780
gtgaacggga ccgccgtggg gtccggtatg gcttcggtgg ttctttttga agctaatatc 840
ctagcggttt tatcggaggt tttatcggcc atttttgcgg aagttatgca aggaaaacct 900
gagtttacgg atcatctgac ccataaactc aagcatcacc ccggccagat tgaggccgcg 960
gcgatcatgg agcacattct tgatggtagc tcctacgtaa aagaagcaca aaagatgcac 1020
gaaatggatc cgcttcaaaa accaaagcaa gatcgttacg ctcttcgtac gtcaccgcaa 1080
tggctcggtc cgcttatcga ggtgatacgt acatcgacga aatcgatcga gagagagatt 1140
aattcggtta atgataaccc tttaattgat gtttctcgaa ataaggcact tcatggaggg 1200
aattttcagg gtaccccaat aggagtctcg atggataata cccgattagc cgttgcatcc 1260
atcgggaagc ttttgtttgc gcagttttcc gagcttgtga atgattttta taacaatggg 1320
cttccatcca atctttctgg aagccgtaat ccaagtttgg attacggctt caaaggagca 1380
gagattgcga tggcatccta ctgctcggaa cttcagttcc tcgcaaaccc tgtaacgagt 1440
cacgttcaaa gcgcagagca acataaccag gatgtgaact cattagggtt gatttcttca 1500
aggaaaacgg ccgaagcagt tgagatttta aaactcatgt catccactta cttagtggca 1560
ctatgccaag cagtcgactt gaggcactta gaagaaaacc tcaagtcgac tgtcaagaac 1620
gttgttagcc aggtggccaa gaaagtcttg accaccggcc acaatggcca gcttcaccca 1680
tctcgctttt gcgaaaagga tttgctcaaa gtggtcgacc gtgagcacat cttttcgtac 1740
atcgatgacc cgtgtagtgc aacttaccct ctaatgcaaa aattacgaca agttatagtc 1800
gatcacgcgc tcgcaaacgg tgaggccgaa atggactcga gtacgtcaat cttccaaaag 1860
atcggggctt tcgagcaaga actcgaaacc cttttgccaa aagaagtcga aagcactcgg 1920
gtcgatcacg aaggtggaaa gttagcgatt tttaacagaa tcgaagaatg tcgatcatac 1980
ccgttgtata agtttgtaag gatggaactc ggaaccggct atttgaccgg cgagaagacg 2040
gtttcaccgg gagaggagtt tgagaaggtg ttctcggcga tatgtgccgg aaaattgatg 2100
gatccattgt tggattgttt gaagatgtgg gacggaaagc cacttccaat ttcataa 2157
<210> 45
<211> 1518
<212> DNA
<213> 人工序列
<400> 45
atggatcttc tccttttgga gaaagctctt gtagggctct tcgtagccat tttaggagcg 60
atcttcatat ctaagttacg tggaaagcgt ttcaagctcc cgccgggacc aattccggta 120
ccgattttcg gaaactggct tcaagtcggc gatgatctca accaccggaa cttaacagat 180
ctagccaaga agttcggcca gatcttcctt ctccgtatgg gccaacggaa cctcgtcgtc 240
gtatcatcgc cggatctcgc caaggaagtc ctccacacac aaggcgtgga gttcggatct 300
cgaactagaa acgtcgtgtt cgacattttc acagggaaag gacaagatat ggtgtttacg 360
gtttacggcg agcactggcg gaagatgcgg aggatcatga cggttccgtt tttcaccaat 420
aaagttgttc agcagtacag gttcggatgg gaggcggagg cggcggcggt ggtggaggat 480
gtgaagaaga atccggcagc agcgacggaa gggattgtga tcaggagacg gttacagctg 540
atgatgtata acaatatgtt cagaattatg tttgatagaa ggttcgagag tgaggacgat 600
cctttgttct tgaagctcaa ggcgttgaat ggggagagga gtcgattggc acagagcttc 660
gattacaact atggcgattt catcccaatt ttgaggccgt ttttgaaagg ttatttgaag 720
atgtgcaaag aagtcaaaga gaagaggttg cagctattca aggattactt cgttgatgaa 780
aggaagaaga tgggaagcat aaaaaccatg gacaacaacc aaatcaaatg tgcaattgat 840
catatacttg aagctcagga caaaggagag atcaacgagg acaatgtcct ttacatcgtt 900
gagaatatca atgttgccgc aatcgaaacc accctctggt ccatcgaatg gggaatcgcg 960
gaactcgtga accaccctga aatccaatcg aaactgagac acgaactcga caccaaactc 1020
ggacccggag tccaagtcac cgaaccagac atccaaaagc ttccatacct ccaagccgtg 1080
gttaaggaga ctctccgcct tcggatggct atcccgctcc tggtcccaca catgaacctc 1140
cacgacgcca agcttaacgg ctacgacatt ccagccgaaa gcaagatctt ggtcaacgcc 1200
tggtggctag ccaacaaccc cgaacaatgg aagaaacccg atgaattccg acccgaaaga 1260
ttcttcgaag aagaaagcca cgtggaggct aacggaaatg atttccgtta cttgccgttt 1320
ggagtcggga gaaggagttg tcccgggatt atccttgcgt taccgatctt ggggataacg 1380
atcgggcgat tggtgcagaa tttcgagcta ttgccgccac cggggatgtc gaagatcgat 1440
gtgaaggaga aaggtggaca gtttagtttg catattttga atcattccac cgttgttgct 1500
aaaccaagat cattgtga 1518
<210> 46
<211> 48
<212> DNA
<213> 人工序列
<400> 46
gcttgtaaaa attggttctc ttctttgtct catttcgtta ttcatttg 48
<210> 47
<211> 6702
<212> DNA
<213> 人工序列
<400> 47
atgagcgaag aaagcttatt cgagtcttct ccacagaaga tggagtacga aattacaaac 60
tactcagaaa gacatacaga acttccaggt catttcattg gcctcaatac agtagataaa 120
ctagaggagt ccccgttaag ggactttgtt aagagtcacg gtggtcacac ggtcatatcc 180
aagatcctga tagcaaataa tggtattgcc gccgtgaaag aaattagatc cgtcagaaaa 240
tgggcatacg agacgttcgg cgatgacaga accgtccaat tcgtcgccat ggccacccca 300
gaagatctgg aggccaacgc agaatatatc cgtatggccg atcaatacat tgaagtgcca 360
ggtggtacta ataataacaa ctacgctaac gtagacttga tcgtagacat cgccgaaaga 420
gcagacgtag acgccgtatg ggctggctgg ggtcacgcct ccgagaatcc actattgcct 480
gaaaaattgt cccagtctaa gaggaaagtc atctttattg ggcctccagg taacgccatg 540
aggtctttag gtgataaaat ctcctctacc attgtcgctc aaagtgctaa agtcccatgt 600
attccatggt ctggtaccgg tgttgacacc gttcacgtgg acgagaaaac cggtctggtc 660
tctgtcgacg atgacatcta tcaaaagggt tgttgtacct ctcctgaaga tggtttacaa 720
aaggccaagc gtattggttt tcctgtcatg attaaggcat ccgaaggtgg tggtggtaaa 780
ggtatcagac aagttgaacg tgaagaagat ttcatcgctt tataccacca ggcagccaac 840
gaaattccag gctcccccat tttcatcatg aagttggccg gtagagcgcg tcacttggaa 900
gttcaactgc tagcagatca gtacggtaca aatatttcct tgttcggtag agactgttcc 960
gttcagagac gtcatcaaaa aattatcgaa gaagcaccag ttacaattgc caaggctgaa 1020
acatttcacg agatggaaaa ggctgccgtc agactgggga aactagtcgg ttatgtctct 1080
gccggtaccg tggagtatct atattctcat gatgatggaa aattctactt tttagaattg 1140
aacccaagat tacaagtcga gcatccaaca acggaaatgg tctccggtgt taacttacct 1200
gcagctcaat tacaaatcgc tatgggtatc cctatgcata gaataagtga cattagaact 1260
ttatatggta tgaatcctca ttctgcctca gaaatcgatt tcgaattcaa aactcaagat 1320
gccaccaaga aacaaagaag acctattcca aagggtcatt gtaccgcttg tcgtatcaca 1380
tcagaagatc caaacgatgg attcaagcca tcgggtggta ctttgcatga actaaacttc 1440
cgttcttcct ctaatgtttg gggttacttc tccgtgggta acaatggtaa tattcactcc 1500
ttttcggact ctcagttcgg ccatattttt gcttttggtg aaaatagaca agcttccagg 1560
aaacacatgg ttgttgccct gaaggaattg tccattaggg gtgatttcag aactactgtg 1620
gaatacttga tcaaactttt ggaaactgaa gatttcgagg ataacactat taccaccggt 1680
tggttggacg atttgattac tcataaaatg accgctgaaa agcctgatcc aactcttgcc 1740
gtcatttgcg gtgccgctac aaaggctttc ttagcatctg aagaagcccg ccacaagtat 1800
atcgaatcct tacaaaaggg acaagttcta tctaaagacc tactgcaaac tatgttccct 1860
gtagatttta tccatgaggg taaaagatac aagttcaccg tagctaaatc cggtaatgac 1920
cgttacacat tatttatcaa tggttctaaa tgtgatatca tactgcgtca actagctgat 1980
ggtggtcttt tgattgccat aggcggtaaa tcgcatacca tctattggaa agaagaagtt 2040
gctgctacaa gattatccgt tgactctatg actactttgt tggaagttga aaacgatcca 2100
acccagttgc gtactccatc ccctggtaaa ttggttaaat tcttggtgga aaatggtgaa 2160
cacattatca agggccaacc atatgcagaa attgaagtta tgaaaatgca aatgcctttg 2220
gtttctcaag aaaatggtat cgtccagtta ttaaagcaac ctggttctac cattgttgca 2280
ggtgatatca tggctattat gactcttgac gatccatcca aggtcaagca cgctctacca 2340
tttgaaggta tgctgccaga ttttggttct ccagttatcg aaggaaccaa acctgcctat 2400
aaattcaagt cattagtgtc tactttggaa aacattttga agggttatga caaccaagtt 2460
attatgaacg cttccttgca acaattgata gaggttttga gaaatccaaa actgccttac 2520
tcagaatgga aactacacat ctctgcttta cattcaagat tgcctgctaa gctagatgaa 2580
caaatggaag agttagttgc acgttctttg agacgtggtg ctgttttccc agctagacaa 2640
ttaagtaaat tgattgatat ggccgtgaag aatcctgaat acaaccccga caaattgctg 2700
ggcgccgtcg tggaaccatt ggcggatatt gctcataagt actctaacgg gttagaagcc 2760
catgaacatt ctatatttgt ccatttcttg gaagaatatt acgaagttga aaagttattc 2820
aatggtccaa atgttcgtga ggaaaatatc attctgaaat tgcgtgatga aaaccctaaa 2880
gatctagata aagttgcgct aactgttttg tctcattcga aagtttcagc gaagaataac 2940
ctgatcctag ctatcttgaa acattatcaa ccattgtgca agttatcttc taaagtttct 3000
gccattttct ctactcctct acaacatatt gttgaactag aatctaaggc taccgctaag 3060
gtcgctctac aagcaagaga aattttgatt caaggcgctt taccttcggt caaggaaaga 3120
actgaacaaa ttgaacatat cttaaaatcc tctgttgtga aggttgccta tggctcatcc 3180
aatccaaagc gctctgaacc agatttgaat atcttgaagg acttgatcga ttctaattac 3240
gttgtgttcg atgttttact tcaattccta acccatcaag acccagttgt gactgctgca 3300
gctgctcaag tctatattcg tcgtgcttat cgtgcttaca ccataggaga tattagagtt 3360
cacgaaggtg tcacagttcc aattgttgaa tggaaattcc aactaccttc agctgcgttc 3420
tccacctttc caactgttaa atctaaaatg ggtatgaaca gggctgttgc tgtttcagat 3480
ttgtcatatg ttgcaaacag tcagtcatct ccgttaagag aaggtatttt gatggctgtg 3540
gatcatttag atgatgttga tgaaattttg tcacaaagtt tggaagttat tcctcgtcac 3600
caatcttctt ctaacggacc tgctcctgat cgttctggta gctccgcatc gttgagtaat 3660
gttgctaatg tttgtgttgc ttctacagaa ggtttcgaat ctgaagagga aattttggta 3720
aggttgagag aaattttgga tttgaataag caggaattaa tcaatgcttc tatccgtcgt 3780
atcacattta tgttcggttt taaagatggg tcttatccaa agtattatac ttttaacggt 3840
ccaaattata acgaaaatga aacaattcgt cacattgagc cggctttggc cttccaactg 3900
gaattaggaa gattgtccaa cttcaacatt aaaccaattt tcactgataa tagaaacatc 3960
catgtctacg aagctgttag taagacttct ccattggata agagattctt tacaagaggt 4020
attattagaa cgggtcatat ccgtgatgac atttctattc aagaatatct gacttctgaa 4080
gctaacagat tgatgagtga tatattggat aatttagaag tcaccgacac ttcaaattct 4140
gatttgaatc atatcttcat caacttcatt gcggtgtttg atatctctcc agaagatgtc 4200
gaagccgcct tcggtggttt cttagaaaga tttggtaaga gattgttgag attgcgtgtt 4260
tcttctgccg aaattagaat catcatcaaa gatcctcaaa caggtgcccc agtaccattg 4320
cgtgccttga tcaataacgt ttctggttat gttatcaaaa cagaaatgta caccgaagtc 4380
aagaacgcaa aaggtgaatg ggtatttaag tctttgggta aacctggatc catgcattta 4440
agacctattg ctactcctta ccctgttaag gaatggttgc aaccaaaacg ttataaggca 4500
cacttgatgg gtaccacata tgtctatgac ttcccagaat tattccgcca agcatcgtca 4560
tcccaatgga aaaatttctc tgcagatgtt aagttaacag atgatttctt tatttccaac 4620
gagttgattg aagatgaaaa cggcgaatta actgaggtgg aaagagaacc tggtgccaac 4680
gctattggta tggttgcctt taagattact gtaaagactc ctgaatatcc aagaggccgt 4740
caatttgttg ttgttgctaa cgatatcaca ttcaagatcg gttcctttgg tccacaagaa 4800
gacgaattct tcaataaggt tactgaatat gctagaaagc gtggtatccc aagaatttac 4860
ttggctgcaa actcaggtgc cagaattggt atggctgaag agattgttcc actatttcaa 4920
gttgcatgga atgatgctgc caatccggac aagggcttcc aatacttata cttaacaagt 4980
gaaggtatgg aaactttaaa gaaatttgac aaagaaaatt ctgttctcac tgaacgtact 5040
gttataaacg gtgaagaaag atttgtcatc aagacaatta ttggttctga agatgggtta 5100
ggtgtcgaat gtctacgtgg atctggttta attgctggtg caacgtcaag ggcttaccac 5160
gatatcttca ctatcacctt agtcacttgt agatccgtcg gtatcggtgc ttatttggtt 5220
cgtttgggtc aaagagctat tcaggtcgaa ggccagccaa ttattttaac tggtgctcct 5280
gcaatcaaca aaatgctggg tagagaagtt tatacttcta acttacaatt gggtggtact 5340
caaatcatgt ataacaacgg tgtttcacat ttgactgctg ttgacgattt agctggtgta 5400
gagaagattg ttgaatggat gtcttatgtt ccagccaagc gtaatatgcc agttcctatc 5460
ttggaaacta aagacacatg ggatagacca gttgatttca ctccaactaa tgatgaaact 5520
tacgatgtaa gatggatgat tgaaggtcgt gagactgaaa gtggatttga atatggtttg 5580
tttgataaag ggtctttctt tgaaactttg tcaggatggg ccaaaggtgt tgtcgttggt 5640
agagcccgtc ttggtggtat tccactgggt gttattggtg ttgaaacaag aactgtcgag 5700
aacttgattc ctgctgatcc agctaatcca aatagtgctg aaacattaat tcaagaacct 5760
ggtcaagttt ggcatccaaa ctccgccttc aagactgctc aagctatcaa tgactttaac 5820
aacggtgaac aattgccaat gatgattttg gccaactgga gaggtttctc tggtggtcaa 5880
cgtgatatgt tcaacgaagt cttgaagtat ggttcgttta ttgttgacgc attggtggat 5940
tacaaacaac caattattat ctatatccca cctaccggtg aactaagagg tggttcatgg 6000
gttgttgtcg atccaactat caacgctgac caaatggaaa tgtatgccga cgtcaacgct 6060
agagctggtg ttttggaacc acaaggtatg gttggtatca agttccgtag agaaaaattg 6120
ctggacacca tgaacagatt ggatgacaag tacagagaat tgagatctca attatccaac 6180
aagagtttgg ctccagaagt acatcagcaa atatccaagc aattagctga tcgtgagaga 6240
gaactattgc caatttacgg acaaatcagt cttcaatttg ctgatttgca cgataggtct 6300
tcacgtatgg tggccaaggg tgttatttct aaggaactgg aatggaccga ggcacgtcgt 6360
ttcttcttct ggagattgag aagaagattg aacgaagaat atttgattaa aaggttgagc 6420
catcaggtag gcgaagcatc aagattagaa aagatcgcaa gaattagatc gtggtaccct 6480
gcttcagtgg accatgaaga tgataggcaa gtcgcaacat ggattgaaga aaactacaaa 6540
actttggacg ataaactaaa gggtttgaaa ttagagtcat tcgctcaaga cttagctaaa 6600
aagatcagaa gcgaccatga caatgctatt gatggattat ctgaagttat caagatgtta 6660
tctaccgatg ataaagaaaa attgttgaag actttgaaat aa 6702
<210> 48
<211> 1959
<212> DNA
<213> 人工序列
<400> 48
atgtcacaaa ctcataaaca tgctattcca gcaaacatcg ctgatagatg tttgattaat 60
ccagaacaat acgaaactaa gtacaagcaa tctattaatg atccagatac attttggggt 120
gaacaaggta aaattttgga ttggatcact ccataccaaa aggttaaaaa tacatcattt 180
gctcctggta atgtttctat taaatggtac gaagatggta ctttgaattt ggctgcaaac 240
tgtttggata gacatttgca agaaaatggt gacagaacag caattatttg ggaaggtgac 300
gatgcttcac aatctaagca tatctcttac agagaattac atagagatgc atgtagattc 360
gctaacactt tgttagattt gggtattaag aaaggtgacg ttgttgctat ctatatgcca 420
atggttccag aagctgcagt tgcaatgtta gcttgtgcaa gaattggtgc tgttcattca 480
gttatttttg gtggtttttc tccagaagct gttgcaggta gaatcatcga ttcttcatct 540
agattggtta ttacagcaga tgaaggtgtt agagctggta gatcaatccc attgaagaaa 600
aatgttgatg atgctttgaa aaatccaaac gttacttcag ttgaacatgt tatcgttttg 660
aaaagaacag gttctgatat tgattggcaa gaagatagag atttgtggtg gagagatttg 720
attgaaaaag cttctccaga acatcaacca gaagcaatga acgctgaaga tccattgttt 780
attttgtaca cttcaggttc tacaggtaaa ccaaaaggtg ttttacatac tacaggtggt 840
tatttggttt acgctgcaac tacttttaaa tacgttttcg attaccatcc aggtgacatc 900
tattggtgta ctgctgatgt tggttgggtt acaggtcatt catatttgtt atacggtcca 960
ttagcatgtg gtgctactac attgatgttt gaaggtgttc caaattggcc aactccagct 1020
agaatgtgtc aagttgttga taagcatcaa gttaacatct tgtacactgc accaacagct 1080
attagagcat tgatggctga aggtgacaaa gcaattgaag gtacagatag atcatctttg 1140
agaattttag gttctgttgg tgaaccaatt aatccagaag cttgggaatg gtactggaag 1200
aaaattggta aagaaaagtg tccagttgtt gatacttggt ggcaaactga aacaggtggt 1260
tttatgatta caccattgcc aggtgctatt gaattaaaag caggttcagc tactagacca 1320
tttttcggtg ttcaaccagc attagttgat aatgaaggtc atccacaaga aggtgctact 1380
gagggtaatt tggttattac agattcttgg ccaggtcaag caagaacatt gtttggtgac 1440
catgaaagat ttgaacaaac ttacttctca acttttaaaa acatgtactt ttctggtgac 1500
ggtgctagaa gagatgaaga tggttattac tggatcactg gtagagttga tgatgttttg 1560
aacgtttcag gtcatagatt gggtacagca gaaattgaat ctgcattggt tgctcatcca 1620
aaaattgcag aagctgcagt tgttggtatt ccacatgcta ttaaaggtca agcaatctat 1680
gcttacgtta ctttaaatca tggtgaagaa ccatcaccag aattgtatgc agaagttaga 1740
aactgggtta gaaaggaaat tggtccattg gctacaccag atgttttaca ttggactgat 1800
tcattgccaa agacaagatc aggtaaaatc atgagaagaa tcttgagaaa gattgctgca 1860
ggtgacactt caaatttggg tgacacttct acattggctg atccaggtgt tgttgaaaaa 1920
ccattggaag aaaaacaagc tattgcaatg ccatcttaa 1959
<210> 49
<211> 1557
<212> DNA
<213> 人工序列
<400> 49
atgactatcc tacccctgct actctacgcc tccataactg gtttactaat ctatgtattg 60
cttaacctac gcaccacccc tcgttctaac cacctcccac tcccacccgg cccaacccca 120
tggccaatca tcggaaactt acctcatctt ggaagaatac cgcaccatgc gctggcggcc 180
atggctacaa agtacggccc gttgatgcat ctccggctcg gcgtcgttga cgtggtggtg 240
gcggcgtctg cgtcggtggc ggcacagttt ttgaaggttc atgacgccaa tttcgcgagt 300
aggccgccga actccggcgc gaaacacatc gcgtataatt atcaggatct ggtgtttgca 360
ccttatggtc agaaatggcg gatgcttagg aagatttgct ccgtgcatct gttctctaac 420
aaagcactcg atgatttccg tcacgttcgt caggaggagg tggcgattct ggtgcgcgct 480
ttggccggag ccggtcgatc tacggcggcg gcgttaggtc aactacttaa cgtttgcacc 540
acaaacgcgt tggcacgagt gatgttaggt cggagagtgt tcgtggacgg aagtgaaggc 600
aatcgagacg cggatgaatt caaggatatg gtggttgaag tgatggtatt ggccggagaa 660
ttcaacatcg gcgacttcat tccggcgctt gattggctgg atctgcaaag cgtgacgaag 720
aagatgaaga aactccatct ccgattcgat tcgtttctta acaaaatcct ggaagaccat 780
agaaatggag gtgacgtcac ttcgggtaac gtggatttgc tgagcacgtt gatttcgctc 840
aaggatgacg ccaatgggga gggcgggaag ctttcagata tcgaaatcaa agctttgctt 900
ctgaatttat tcactgcggg aacagacaca tcatctagta cggtggaatg ggcaatggct 960
gaactcattc gccatccgca attattgaag caagcccaag aagaattgga cactgttgtt 1020
ggtaaagacc ggcttgtatc cgaattggac ctgagtagac taacattcct cgaagccatt 1080
gtgaaggaaa ccttcaggct ccacccatcg accccactct ctttgccacg gattgcatca 1140
gagagctgtg aagtcgatgg gtattacatt cctaagggaa ccacacttct tgttaacgtg 1200
tgggccattg cccgagaccc aaaaatgtgg accgacccgc ttgaattccg acccacccgg 1260
ttcttgccgg gaggtgaaaa gccgaatgct aatgtaaagg gaaatgattt tgaaataata 1320
ccgtttgggg ctggtcgaag gatttgtgcg ggtatgagcc tagggttacg gatggttcag 1380
ttgctcactg cgactctggt tcatgccttt gattggaaat tggctaacgg gttagaccca 1440
gagaagctca atatggaaga agcttatggg ttgacccttc aaagggctgc acccttgatg 1500
gtgcacccaa ccccacggtt agctccccat ttgtatgaaa gcagtcaagg tttataa 1557
<210> 50
<211> 2133
<212> DNA
<213> 人工序列
<400> 50
atgcaatcgg actcgtctct ggaaacgtcg tcgtttgatt tgattaccgc agctcttaag 60
gagaaagtta ttgatacagc aaacgcatct gatagcggag attcaacgat gcctccggct 120
ttggcgatga ttttggaaaa ccgtgagctg tttatgatgc tgactacaac agtggctctt 180
ttgcttggat ttattgtcgt ttcgttctgg aagagatctt ctgagaagaa gtcggctaag 240
gatttggagc taccgaagat cgttgtgcct aagagacagc aggaacagga ggttgatgac 300
ggtaagaaga aggttacgat tctttttgga acgcagaccg gaacggcgga aggtttcgct 360
aaggcactgt tggaagaagc taaagcgcga tatgaaaagg cgacctttaa agtagtcgat 420
ttggatgatt atgctgttga tgatgatgag tacgaagaga aactaaagaa ggagtcattt 480
gctttcttct tcttggctac atatggagat ggtgagccaa ctgataatgc tgccagattt 540
tataaatggt ttacagaggg aggtgagaaa ggagtttggc ttgaaaagct tcaatatgga 600
gtatttggcc ttggcaatag acaatacgag catttcaaca agattgcaaa agaggttgac 660
gatggtctcg cagagcaggg tgcaaagcgc cttgttccag ttggccttgg agatgatgat 720
caatccattg aagatgattt tactgcatgg aaagagttag tgtggcctga gttggatgaa 780
ttgcttcgtg acgaggatga caaaggcgtt gctactccct acacagctgc tattccagaa 840
taccgagttg tgtttcatga gaaacatgat acatctgctg aagatcaaat tcagacaaat 900
ggtcatgctg ttcatgatgc tcaacatcca tgcagatcca atgtggctgt taaaaaggag 960
ctccataccc ctgaatctga tcgctcttgc acgcatctgg aatttgacat ctcacacact 1020
ggactatcat acgaaactgg ggaccatgtt ggtgtctact gtgagaactt aagtgaagtt 1080
gtggaggagg ctgagaggtt aataggttta ccatcggata cttatttctc agttcacacg 1140
gataacgaag atggaacacc acttggtgga gcttccttac tacctccttt ccctccatgc 1200
actttaagaa aagcattggc taattacgca gatgtattga cttctcccaa aaagtcggcc 1260
ttgattgctc tagctgctca tgcttctgat cctactgaag ctgaacgact aaaatttctt 1320
gcatctcctg ctgggaagga tgaatattct caatgggtta ttgcaagcca aagaagcctg 1380
cttgaggtca tggaagcttt cccatcggct aagcctccac ttggggtttt ctttgcagct 1440
attgctccac gcttacagcc tcgatactac tctatttctt cctccccgaa gatggcacct 1500
agcaggattc atgttacttg tgcattagtt tatgagaaaa cacctgcagg ccgtctccat 1560
aaaggaatct gttcaacctg gatgaagaat gctgtgccta tgacggaaag tcaggattgc 1620
agctgggcac ctattttcgt tagaacgtct aacttcagac ttcccactga tccaaaagtt 1680
cctgttatca tgattggccc tggaaccgga ttggctccgt tcagaggttt tcttcaagaa 1740
agattagctc tgaaggaagc cggaactgaa ctgggatcat ccattttatt cttcggatgt 1800
agaaatcgca aagtggattt catatatgag aatgaactga aagactttgt tgagaatggt 1860
gctgtttccg agcttattgt tgccttctcc cgtgaaggcc ccaataagga atatgtgcaa 1920
cataaaatga gcgatagggc ttcggatcta tggaacttgc tttcggaggg agcatattta 1980
tacgtttgtg gtgatgccaa aggcatggct aaagatgtac accggaccct tcacacaatt 2040
gtgcaagaac agggatctct agactcgtca aaggcagagc tgtatgtgaa gaatctacaa 2100
atgtcaggaa gatacctccg tgatgtttgg tag 2133
<210> 51
<211> 1113
<212> DNA
<213> 人工序列
<400> 51
atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60
gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120
atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180
attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240
ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300
gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360
ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420
gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480
gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540
accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600
aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660
tctcaccatt tcatgggtgt tactttgcat ggtgttgctg ctatcaccac tactaagggt 720
aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780
tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840
tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900
gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960
gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020
actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080
gtcagacaaa gaagagaagt taacaagaaa tag 1113
<210> 52
<211> 771
<212> DNA
<213> 人工序列
<400> 52
atggatttca caaaaccaga aactgtttta aatctacaaa atattagaga tgaattagtt 60
agaatggagg attcgatcat cttcaaattt attgagaggt cgcatttcgc cacatgtcct 120
tcagtttatg aggcaaacca tccaggttta gaaattccga attttaaagg atctttcttg 180
gattgggctc tttcaaatct tgaaattgcg cattctcgca tcagaagatt cgaatcacct 240
gatgaaactc ccttctttcc tgacaagatt cagaaatcat tcttaccgag cattaactac 300
ccacaaattt tggcgcctta tgccccagaa gttaattaca atgataaaat aaaaaaagtt 360
tatattgaaa agattatacc attaatttcg aaaagagatg gtgatgataa gaataacttc 420
agttctgttg ccactagaga tatagaatgt ttgcaaagct tgagtaggag aatccacttt 480
ggcaagtttg ttgctgaagc caagttccaa tcggatatcc cgctatacac aaagctgatc 540
aaaagtaaag atgtcgaggg gataatgaag aatatcacca attctgccgt tgaagaaaag 600
attctagaaa gattaactaa gaaggctgaa gtctatggtg tggaccctac caacgagtca 660
ggtgaaagaa ggattactcc agaatatttg gtaaaaattt ataaggaaat tgttatacct 720
atcactaagg aagttgaggt ggaatacttg ctaagaaggt tggaagagta a 771
<210> 53
<211> 1521
<212> DNA
<213> 人工序列
<400> 53
atgaacacca ttaatgaata cttgagttta gaagaattcg aagcaataat cttcggtaac 60
caaaaagtaa ctatctctga tgttgtcgta aacagagtta acgaaagttt taacttctta 120
aaggaatttt ctggtaataa ggttatatat ggtgtaaaca ctggtttcgg tccaatggct 180
caatacagaa tcaaggaatc tgatcaaatc caattgcaat acaatttgat aagaagtcat 240
tcttcaggta ctggtaaacc attatctcct gtttgtgcta aggctgcaat cttggcaaga 300
ttgaacacat tgtctttagg caactcaggt gttcacccat ctgttattaa tttgatgtct 360
gaattgataa acaaagacat cactcctttg atattcgaac atggtggtgt tggtgcatct 420
ggtgacttgg tccaattgtc ccacttggcc ttagtattga taggtgaagg tgaagttttc 480
tataaaggtg aaagaagacc aacacctgaa gtcttcgaaa tcgaaggttt aaagcctata 540
caagtagaaa tcagagaagg tttagctttg attaatggta cttctgtcat gacaggtata 600
ggtgttgtca acgtatacca tgctaagaaa ttgttggatt ggtcattgaa gtccagttgt 660
gccattaatg aattggttca agcatatgat gaccatttct ctgcagaatt gaaccaaacc 720
aagagacaca agggtcaaca agaaatcgca ttgaagatga gacaaaattt gtccgatagt 780
acattgatca gaaagagaga agaccactta tactcaggtg aaaacaccga agaaattttc 840
aaagaaaagg ttcaagaata ctactccttg agatgcgtcc cacaaatctt gggtcctgta 900
ttggaaacta ttaataacgt tgcctcaatc ttggaagatg aattcaattc cgctaacgat 960
aacccaatca tcgacgttaa aaatcaacat gtttatcacg gtggtaactt ccatggtgac 1020
tacatttctt tagaaatgga caaattgaag atagttatca caaaattgac catgttggct 1080
gaaagacaat tgaactactt gttgaactca aagattaacg aattgttgcc acctttcgtt 1140
aatttgggta cattgggttt taacttcggt atgcaaggtg ttcaattcac cgccacttca 1200
actacagctg aatcccaaat gttgagtaac ccaatgtacg ttcattccat ccctaacaac 1260
aacgataacc aagacatcgt ctctatgggt accaactcag ccgtcattac ttccaaagta 1320
atagaaaacg cattcgaagt tttggccatc gaaatgatca caattgtcca agctatcgat 1380
tacttgggtc aaaaggacaa gatctcttct gtttctaaga aatggtacga tgaaataaga 1440
aacataatcc caacctttaa ggaagaccaa gttatgtacc ctttcgtaca aaaggttaag 1500
gatcatttga ttaacaatta a 1521
<210> 54
<211> 525
<212> DNA
<213> 人工序列
<400> 54
atgacacaac ctctttttct gatcgggcct cggggctgtg gtaaaacaac ggtcggaatg 60
gcccttgccg attcgcttaa ccgtcggttt gtcgataccg atcagtggtt gcaatcacag 120
ctcaatatga cggtcgcgga gatcgtcgaa agggaagagt gggcgggatt tcgcgccaga 180
gaaacggcgg cgctggaagc ggtaactgcg ccatccaccg ttatcgctac aggcggcggc 240
attattctga cggaatttaa tcgtcacttc atgcaaaata acgggatcgt ggtttatttg 300
tgtgcgccag tatcagtcct ggttaaccga ctgcaagctg caccggaaga agatttacgg 360
ccaaccttaa cgggaaaacc gctgagcgaa gaagttcagg aagtgctgga agaacgcgat 420
gcgctatatc gcgaagttgc gcatattatc atcgacgcaa caaacgaacc cagccaggtg 480
atttctgaaa ttcgcagcgc cctggcacag acgatcaatt gttga 525
<210> 55
<211> 1035
<212> DNA
<213> 人工序列
<400> 55
atgcttgaaa acaggttcgt tcgcgatgaa gacgagcgtc caaaagtggc gtacaataat 60
tttagcaacg agattccggt gatctcactt gaaggtatcg acgatactag tagtagggcg 120
gagatttgcg agaagatcgt taaggcttgt gaagattggg gggtttttca ggtggtggat 180
cacgggatcg ataatagatt gttgacggag atgacgaggc tcgccacgga gttcttcatg 240
atgccgccgg aggagaaact ccgatttgat atgagtggcg ggaaaaaagg cggtttcatt 300
gtttccagcc atcttcaagg agaaacggtg caagattgga gggagattgt aaccttcttc 360
tcgtacccaa caaaagcaag agactactct aggtggcccg ataagcccaa agagtggagg 420
gcagttactg aggaatatag caaggtgtta atgggcctgg cctgcaagct actagaggta 480
ttgtctgagg caatgggcct tgagaaagag gccttgacca aagcttgtgt agatatggac 540
caaaaggtgg tggtcaatta ctatccaaaa tgccctcatc ccgacctcac gttgggcctg 600
aaacgacata cggatccggg aacaatcacg ttgttgcttc aggaccaagt tggtgggctt 660
caggcgactc gtgatggtgg tcaaagttgg atcacagttc agccgattga aggtgctttt 720
gtggttaatc ttggtgatca tggacattat ttgagcaacg ggaggttcaa gaacgcagac 780
caccaagccg tggtgaactc aaacacgagc cgactctcca tagctacgtt tcaaaaccct 840
gcaccggatg cgattgtata cccgctgaaa gtgaatgagg gagataaatc gataatggaa 900
gaagctataa ctttcatgga gatgtacaag aagaagatgg gtcgagacct tgagttggct 960
cggcttaaga agctagccaa ggacaagcaa caagatttgg agaaagagaa gccaatcgag 1020
aatatatttg cttag 1035
<210> 56
<211> 668
<212> DNA
<213> 人工序列
<400> 56
ttatattgaa ttttcaaaaa ttcttacttt ttttttggat ggacgcaaag aagtttaata 60
atcatattac atggcattac caccatatac atatccatat ctaatcttac ttatatgttg 120
tggaaatgta aagagcccca ttatcttagc ctaaaaaaac cttctctttg gaactttcag 180
taatacgctt aactgctcat tgctatattg aagtacggat tagaagccgc cgagcgggcg 240
acagccctcc gacggaagac tctcctccgt gcgtcctcgt cttcaccggt cgcgttcctg 300
aaacgcagat gtgcctcgcg ccgcactgct ccgaacaata aagattctac aatactagct 360
tttatggtta tgaagaggaa aaattggcag taacctggcc ccacaaacct tcaaattaac 420
gaatcaaatt aacaaccata ggatgataat gcgattagtt ttttagcctt atttctgggg 480
taattaatca gcgaagcgat gatttttgat ctattaacag atatataaat ggaaaagctg 540
cataaccact ttaactaata ctttcaacat tttcagtttg tattacttct tattcaaatg 600
tcataaaagt atcaacaaaa aattgttaat atacctctat actttaacgt caaggagaaa 660
aaactata 668
<210> 57
<211> 668
<212> DNA
<213> 人工序列
<400> 57
tatagttttt tctccttgac gttaaagtat agaggtatat taacaatttt ttgttgatac 60
ttttatgaca tttgaataag aagtaataca aactgaaaat gttgaaagta ttagttaaag 120
tggttatgca gcttttccat ttatatatct gttaatagat caaaaatcat cgcttcgctg 180
attaattacc ccagaaataa ggctaaaaaa ctaatcgcat tatcatccta tggttgttaa 240
tttgattcgt taatttgaag gtttgtgggg ccaggttact gccaattttt cctcttcata 300
accataaaag ctagtattgt agaatcttta ttgttcggag cagtgcggcg cgaggcacat 360
ctgcgtttca ggaacgcgac cggtgaagac gaggacgcac ggaggagagt cttccgtcgg 420
agggctgtcg cccgctcggc ggcttctaat ccgtacttca atatagcaat gagcagttaa 480
gcgtattact gaaagttcca aagagaaggt ttttttaggc taagataatg gggctcttta 540
catttccaca acatataagt aagattagat atggatatgt atatggtggt aatgccatgt 600
aatatgatta ttaaacttct ttgcgtccat ccaaaaaaaa agtaagaatt tttgaaaatt 660
caatataa 668