一类5-12-5三环二倍半萜骨架化合物及其制备
技术领域
本发明属于基因工程
技术领域
,具体涉及一种具体涉及一种从Cytosporaschulzeri12565中克隆得到的5-12-5三环二倍半萜骨架化合物Schultriene合成基因CcCS及其应用。背景技术
萜类化合物是所有异戊二烯聚合物及其衍生物的总称。作为小分子天然产物中种类最为丰富的一类,萜类化合物在医疗、食品和化妆品行业发挥着重要作用[1]。二倍半萜是以GFPP为前体催化合成的一类萜类化合物,仅占萜类化合物的极小部分(不足2%),二倍半萜通常具有复杂的环化结构,具有较高成药潜力[2]。如:从胡麻斑病菌Bipolaris oryzae中分离得到的ophiobolinA除具有细胞毒和抗疟疾活性外,还具有钙调蛋白及抗脑胶质瘤活性[3-5]。而由双功能萜合酶(BFTSs)催化合成的二倍半萜往往以其新颖的催化机制受到人们的青睐。
二倍半萜的传统化学合成面临着合成步骤繁琐、催化特异性较差及新骨架获取能力有限等问题,而产量低、成本高的技术现状又使得新颖骨架的二倍半萜化合物难以从自然界中直接获取。基因组技术和生物信息学的快速发展使人们意识到微生物也具有可观的萜类化合物合成潜力。通过微生物全基因组分析与基因组挖掘策略联用,可从微生物中挖掘到众多具有全新催化机制的双功能萜合酶,结合高效萜类生物合成基因簇异源表达系统,可获得大量新骨架萜类产物,成为发现新药先导化合物的重要方法。
Cytospora schulzeri隶属于子囊菌门(Ascomycota)、粪壳菌纲(Sordariomycetes)、间座壳目(Diaporthales)、黑腐皮壳科(Valsaceae)壳囊孢属(Cytospora),可导致苹果树腐烂[6]。迄今为止还没有从Cytospora schulzeri中分离获二倍半萜活性天然产物的的报道。挖掘Cytospora schulzeri的次级代谢生物合成基因簇有助于丰富天然产物化合物库,为新药发现提供宝贵的先导化合物。
发明内容
本发明依托上述研究进行,提供了一类5-12-5三环二倍半萜骨架化合物、其合成酶、合成酶的编码基因、以及化合物的异源表达方法。
本发明的思路如下:在挖掘菌株C.schulzeri12565代谢产物二倍半萜类化合物的生物合成过程中,通过对基因基因功能分析,得知CcCS基因与萜类合成相关,说明CcCS基因参与了5-12-5三环二倍半萜骨架化合物的生物合成。进一步通过异源表达CcCS基因获取CcCS蛋白进行体外酶促反应,验证了CcCS基因是一种5-12-5三环二倍半萜骨架化合物Schultriene的合成基因。
本发明的首要目的在于提供5-12-5三环二倍半萜骨架化合物的结构;第二目的在于提供合成该化合物的酶及基因;第三目的在于提供异源表达5-12-5三环二倍半萜骨架化合物的方法。
为了实现上述目的,本发明所采用的技术方案如下:
本发明的第一方面,提供5-12-5三环二倍半萜骨架化合物Schultriene,其分子式为C25H40,结构式如下所示:
本发明的第二方面,提供了上述5-12-5三环二倍半萜骨架化合物的合成酶CcCS,该合成酶的氨基酸序列如SEQ ID NO.3所示,其N端和C端分别负责萜类环化和异戊烯基转移功能。
进一步,该合成酶含有两个保守结构域:萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDACE和NDYWSWPRE,E-IPPS结构域也含有两个具有相似功能的特征性保守基序DDIED和DDYMN。
本发明的第二方面,提供了编码上述合成酶的基因,从CS12565菌株(C.schulzeri12565)基因组中克隆得到,其多核苷酸序列如SEQ ID NO.1所示。该CS12565菌株保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为CGMCCNo.21944。该基因含有3个内含子,其cDNA大小为2280bp,序列如SEQ ID NO.2所示。
本发明的第三方面,提供了一种5-12-5三环二倍半萜骨架化合物重组表达载体,该重组表达载体为运载有上述合成酶或基因的真核或原核表达载体,如大肠杆菌、酵母系统以及丝状真菌。
本发明的第四方面,提供了一种5-12-5三环二倍半萜骨架化合物重组表达宿主细胞,含有如上所述的重组表达载体,实现化合物异源表达。
本发明的第五方面,提供上述合成酶或基因在合成萜类化合物中的应用,具体为在合成5-12-5三环二倍半萜骨架化合物中的应用。
本发明的第六方面,提供了一种异源表达5-12-5三环二倍半萜骨架化合物的方法,其特征在于,包括如下步骤:
A、CcCS基因异源表达载体的构建
通过PCR技术,以C.schulzeri12565基因组为模板扩增得到含有CcCS的基因序列,扩增所用到的引物序列分别如SEQ ID NO.4和SEQ ID NO.5所示;
扩增所用到的引物序列:
CcCS-F:cgGAATTCGAGCTCGATGCTTGAAGCAAACGAGCT;
CcCS-R:tactacaGATCCCCGGTCAAACTCGCAAGGTTTCCACCAG。
将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-CcCS表达质粒,并将该连接产物转化到大肠杆菌DH10B中,筛选阳性转化子,培养后提取质粒PCR验证,获取pUARA2-CcCS质粒,
B、原生质体转化
培养米曲霉Aspergillus oryzae NSAR1并收集原生质体,与pUARA2-CcCS质粒混匀,培养后将长出的转化子进行PCR验证,阳性转化子即为CcCS异源表达菌株AO-CcCS,
C、异源表达菌株AO-CcCS培养及产物分离
接种异源表达菌株AO-CcCS经pUARA2质粒筛选液体培养基筛选后,进行发酵培养,对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转至已称重样品瓶中,称量样品并记录重量。
本发明的有益效果如下:
本发明发现了合成5-12-5三环二倍半萜骨架化合物Schultriene的CcCS基因,其编码的CcCS蛋白能够辅助Schultriene类化合物母核合成。本发明为5-12-5三环二倍半萜化合物的生物合成提供了新的资源,为该类化合物合成提供一种选择。
本发明发现的CcCS基因催化产生新的二倍半萜骨架化合物,为丰富天然产物化合物库、发现新抗生素提供了宝贵的先导化合物资源。
附图说明
图1为本发明化合物Schultriene的HR-EI-MS谱图。
图2为本发明化合物Schultriene溶于Benzene-d6中的1H-NMR谱图。
图3为本发明化合物Schultriene溶于Benzene-d6中的13C-NMR谱图。
图4为本发明化合物Schultriene溶于Benzene-d6中13C-DEPT 135谱。
图5为本发明化合物Schultriene溶于Benzene-d6中的1H-1H COSY谱。
图6为本发明化合物Schultriene溶于Benzene-d6中的HSQC谱图。
图7为本发明化合物Schultriene溶于Benzene-d6中的HMBC谱图。
图8为本发明化合物Schultriene溶于Benzene-d6中的NOESY谱图。
图9为Cytospora schulzeri 12565中CsSS基因编码的蛋白与已报道的蛋白的氨基酸序列比对结果图。
菌种保藏信息:CS12565(Cytospora schulzeri 12565)保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏地址为北京市朝阳区北辰西路1号院3号,保藏日期为2021年04月02号,保藏编号为CGMCC No.21944。
具体实施方式
下面结合本发明的附图和实施例对本发明的实施作详细说明,以下实施例是在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体操作过程,但本发明的保护范围不限于下述的实施例。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
本发明所提供的5-12-5三环二倍半萜骨架化合物Schultriene合成基因,是从Cytospora schulzeri 12565中克隆得到,命名为CcCS基因,其基因序列如SEQ ID NO.1所示。CcCS基因含有3个内含子,其cDNA大小为2280bp,序列如SEQ ID NO.2所示。CcCS基因编码的蛋白,命名为CcCS蛋白,其氨基酸序列如SEQ ID NO.3所示。
CcCS蛋白属于嵌合型萜类合成酶,其N端和C端分别负责萜类环化和异戊烯基转移功能。CcCS蛋白含有两个保守结构域,其中萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDACE和NDYWSWPRE,E-IPPS结构域也含有两个具有相似功能的特征性保守基序DDIED和DDYMN(图9)。
实施例1:一种5-12-5三环二倍半萜骨架化合物Schultriene合成基因的异源表达及结构鉴定
利用异源表达的方法,将Cytospora schulzeri 12565菌体中的CcCS基因通过构建表达质粒转入宿主米曲霉中,检测异源表达菌株产物生产情况。所用到培养基配方如表1。
表1实施例所用到培养基配方
1.CcCS基因源表达载体的构建
(1)通过PCR技术,以C.schulzeri12565基因组为模板扩增得到含有CcCS的基因序列。扩增所用到的引物序列:
CcCS-F:cgGAATTCGAGCTCGATGCTTGAAGCAAACGAGCT(SEQ ID NO.4);
CcCS-R:tactacaGATCCCCGGTCAAACTCGCAAGGTTTCCACCAG(SEQ ID NO.5)。
(2)将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-CcCS表达质粒,该载体CcCS两侧与pUARA2载体具有一致的同源序列。
(3)连接产物转化到大肠杆菌DH10B中,通过氨苄青霉素筛选阳性转化子。液体培养阳性转化子,提取质粒PCR验证,获取pUARA2-CcCS质粒。
2.原生质体的转化
(1)将米曲霉Aspergillus oryzae NSAR1涂于PDA平板,30℃培养7d。
(2)收集孢子于10mL 0.1%Tween-80(一般需要收集1个平板的抱子),用血球计数板计数。接种约107个孢子于50mL DPY中,30℃、220rpm培养2-3d。
(3)称量100mg Yatalase,加入solution 0溶解,20ml用0.22μm滤膜过滤灭菌,加入到50ml离心管中。
(4)收集菌体。将培养好的100ml菌丝体倒入到P250玻璃过滤器中,去除培养基,用灭菌水清洗(或0.8M NaCl)3~5次,用灭菌药勺将水分挤干去除,然后将压干的菌体加入到Yatalase溶液中。30℃,200rpm震荡培养1-2小时,至球状菌丝体消失上清明显秽浊状为止。
(5)用Miracloth滤布过滤消化好的菌液,收集原生质体,转到新50ml离心管中,4℃,800g,5min离心。
(6)去除上清液,加入20ml,0.8M NaCl再悬浮清洗,4℃,800g,5min离心(清洗两次)。去除上清液,加10ml,0.8M NaCl。用细菌计数器在显微镜下数原生质体的数目。原生质体数目=总计数/80×400ml×104×稀释倍数。
(7)将原生质体浓度调成2×108cell/ml。(sol 2/sol 3=4/1),依据菌体生长情况可收获0.5ml-2ml原生质体不等。
(8)取200μl的原生质体溶液移至新的50ml的离心管中,加入10μg表达质粒pUARA2-CcCS,轻轻地混匀。在冰上静置20min。期间将灭菌好的Top agar,在50℃水浴中保温。
(9)往(8)的混悬液中加入1ml的sol 3,用枪头轻轻的混匀。在室温下静置20min。加入10ml的sol 2,轻轻混匀。
(10)4℃,800g,10min离心,除去上清,加入1ml的sol 2,用移液枪轻轻地混悬,加入200μl到pUARA2质粒筛选固体培养基的中央(x3板)。在培养皿的周围迅速加入5ml 50℃保温的top agar,快速混匀。平板表面充分干燥后,用parafilm缠好,盖朝下,进行30℃培养3-7天。
(11)每平板挑2-3个克隆,共8个。将长出的转化子进行PCR验证,阳性转化子即为CcCS异源表达菌株AO-CcCS。
3、异源表达菌株AO-CcCS表达产物的检测
(1)接种异源表达菌株AO-CcCS于pUARA2质粒筛选液体培养基,30℃培养3d。
(2)8000rpm离心10min收发酵菌体,加入100ml等体积80%丙酮后超声破碎20min后,8000rpm离心10min,取上清。
(3)用2倍体积的乙酸乙酯萃取1次,用旋转蒸发仪旋干后用15mL甲醇(色谱级)溶解。
(4)取1mL甲醇溶液,经0.22μm滤膜过滤后置于色谱瓶中,即为GC-MS和LC-MS样品。
(5)将样品进行GC-MS检测:采用Agilent-HP-5MS色谱柱,起始温度60℃,以15℃/min的速度升至310℃,再以5℃/min的速度升至310℃,保持13min。GC-MS方法参数如下:Sample模块:进样前后洗针次数5次,样品洗针次数2次,粘度补偿时间0.2s,进样模式为normal。GC模块:柱温50℃,进样温度270℃,进样模式为不分流(splitness),载气为氦气,流速控制模式为线性,总流速10mL/min,柱温控制程序如表3.5。MS模块:MS离子源温度230℃,界面温度270℃,溶剂切除时间2.5min采集时间3min-60min,采集模式为全扫描,eventtime设置为0.3s,扫描速度为2000,扫描核质比为40-600Da。
(7)将样品进行LC-MS检测:采用Cholester色谱柱,流动相A相-0.1%甲酸水,B相-乙腈,流速为1mL/min,30min内流动相乙腈的比例由5%上升到100%,然后维持6min,之后10s内流动相乙腈的比例降至5%,然后维持4min 50s。
4、异源表达重组菌株AO-CcCS二倍半萜骨架产物分离纯化及鉴定
AO-CcCS共发酵10L,得到约2g粗提物。对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化。采用干法上柱,石油醚等度洗脱,每10mL流出液收集一管,共收集得到18个流份,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转至已称重样品瓶中,称量样品并记录重量。HPLC分析各流份组分,精确定位目标流份。优化制备条件,选用Cholester半制备色谱柱制备目标化合物,流动相:A相-0.1%甲酸水;B相-乙腈,流速为4mL/min,95%乙腈甲酸等度,初始进样10μL,在保证峰型不变的基础上,逐渐加大进样量至80μL,目标二倍半萜化合物峰会在20min左右出现,在峰出现的时候将流出溶液接到锥形瓶中即可。对制备到的化合物TLC及HPLC进行纯度检验。
分离的二倍半萜骨架化合物的NMR测试采用Bruker 600MHz(1H 600MHz;13C150MHz)。二倍半萜骨架化合物的溶剂为Benzene-d6,NMR谱仪器分辨率为600MHz,先进行1HNMR和13C NMR的测定,将其与数据库中的数据做对比,若为新结构,则再补全HSQC,COSY,HMBC谱图解谱确定具体结构。
5、鉴定二倍半萜骨架化合物Schultriene。
将上述得到的二倍半萜骨架化合物Schultriene进行鉴定:
(1)外观:为透明油脂状。
(2)溶解性:易溶于甲醇,难溶于水。
(3)核磁共振谱:图1为本发明化合物Schultriene溶于Benzene-d6中的1H-NMR谱图。图2为本发明化合物Schultriene溶于Benzene-d6中的13C-NMR谱图。图3为本发明化合物Schultriene溶于Benzene-d6中13C-DEPT 135谱。图4为本发明化合物Schultriene溶于Benzene-d6中的1H-1H COSY谱。图5为本发明化合物Schultriene溶于Benzene-d6中的HSQC谱图。图6为本发明化合物Schultriene溶于Benzene-d6中的HMBC谱图。图7为本发明化合物Schultriene溶于Benzene-d6中的NOESY谱图。对本发明化合物Schultriene的核磁共振谱进行了研究并对1D和2D谱各信号进行了归属,见表2。并最终确定结构如下:
表2化合物fusaoxyspene A的1D和2D谱各峰归属
本发明背景技术中所涉及的参考文献如下:
[1]Guan,Z.et al.Metabolic engineering of Bacillus subtilis forterpenoid production.Applied Microbiology andbiotechnology 99,9395-9406(2015).
[2]Chang,M.C.&Keasling,J.D.Production of isoprenoid pharmaceuticalsby engineered microbes.Nature chemical biology 2,674-681(2006).
[3]Leung,P.C.,Taylor,W.A.,Wang,J.H.&Tipton,C.L.Role of calmodulininhibition in the mode ofaction ofophiobolinA.Plant physiology 77,303-308(1985).
[4]Nozoe,S.et al.The structure of ophiobolin,a C25 terpenoid having anovel skeleton.Journal ofthe American Chemical Society 87,4968-4970(1965).
[5]Peters,C.&Mayer,A.Ca 2+/calmodulin signals the completionofdocking and triggers a late step ofvacuole fusion.Nature 396,575-580(1998).
[6]Jiang,N.,Yang,Q.,Fan,X.-L.&Tian,C.-M.Identification of sixCytospora species on Chinese chestnut in China.MycoKeys 62,1(2020).
以上已对本发明创造的较佳实施例进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明创造精神的前提下还可作出种种的等同的变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
序列表
<110> 华东理工大学
<120> 一类5-12-5三环二倍半萜骨架化合物及其制备
<130> 权利要求书、说明书
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2483
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 1
atgcttgaag caaacgagct ctacccctat tcagttgctg ttgaccgaga tgaggtagta 60
cagtctggtg ctttgacatc tctccctgtg aggatacatc gatataacca ccttgccgac 120
gctggggcgc tgtgtttgac caacgactgg cgttgtacca tgaaagatgg acaagaccga 180
aagtccaatg gctcgccatg tgttgtaggg aattggggaa gttttatttg gccggagagg 240
taagtctaga tagttgtgaa aatgggacag cgctcatact acaatcgaca cggagatgta 300
cttcagtgca cgggtggcta actacagcgc tggtagtcga ccagaaagac ttgggctcct 360
ctgctacctg ttagatgcag gttgttttca cgatggtatg taagaacact caccctcgtg 420
agtagacagc cgctgacagc tttggataga tgcttgtgag gagatgccca tcgccgcagc 480
tcaccaagaa cacttggact tggacgcagc tatggacgtt gaggaccggc gagagttgag 540
tagtgattca cggtccttgc ggacaaaaca actcatctcc aacgctgttc ttgaatgcat 600
caaggtcgac agagtgggcg ctatgcgtat gctggaagcc tacagaaaga aatggctgcg 660
tattatggag acatacaaca ccgaggagat caacactgtt gaagactatt tccttgcacg 720
agcaaacaat gggggaatgg ggtaagtaga gcttccacca tttcacgtgg acatgaactg 780
acgatggccc cagagcgtac tacgccatgc ttgagttctc tctgggcatt ttggtcaccg 840
acgaggaata cgagatgatg gctgaaccca ttgcacatgt ggaacggtgc atgcttctta 900
ccaacgatta ctggagctgg ccacgtgaac gcaagcaagc cgagtaccag gaggctggaa 960
aggtcttcaa catcgtgtgg ttcctgaaga aaattgagct ctgcaccgaa gaagaggcag 1020
tgtcaaaagt ccgtgatatg gttcatgcag aagagcggaa ctggactgct gccaaaactc 1080
gcctgtacag tcagttcggt aacctgcggc aggacttggt caagttcttg gagaatttgc 1140
acacggcact ggcgggcaac gactattgga gttcgcagtg ttaccgccac aatgactggg 1200
agcacatccc agatcttcct ggcgaggacg caccaaaact tcacgaactt gccaccctag 1260
gtcgacgatt attgctggac gaagatctac cgcccggggc ttcgacctat ggacaggata 1320
cggatgcgga cagcgcgagg ttcactgaat gcaagccatc cgtgggtacc gtctctggtg 1380
atgaaactca gtcactcccg ggcaggagca cgtccggcga agaatcggct tctgggtaca 1440
tgtactccat ctcatcagcc agtgccccac caagtccttc caaagagcac caatcctcat 1500
atccgagcat cccctaccag tcgtctgcgc acgtcgcggg tgatcttgac tctccagtct 1560
tgagggaacc gatcaagtac atcaggaaca tgccgtccaa gaaccttcga acacaactga 1620
tcgactgctt caacatctgg ctaaatgcct ctgggcctgc gatttcggtc atcaaagaag 1680
tcattgactg cctgcaccat tcctcactga tcctggatga catcgaggac ggttcacatc 1740
tacgacgcgg gtttccagcc actcatgtcg tctacggaac atgtcaggcc gtcaacagcg 1800
ccacgtttct ctacgtccaa gcagtggaga gcgtccacgc cgccgcccgg aacaaccccg 1860
agatgatgga cgtctttttg aaacacctga ggcagctgtt caacggccaa agctgggacc 1920
tgtactggac gtaccaccgc caatgcccta ccgaggagca atacctggac atggtagatc 1980
agaaaactgg cgccatgttg caattgttag tgggcttgat gcagacggcg cagccgcagc 2040
atccagggaa ggttggcggc gttgtccata gtgaggtcct cttcaggttc acacagttgt 2100
ttggccgatt cttccaggtc cgtgacgact atatgaacct cacgtcgaca gactacgctc 2160
ggcagaaggg ctttgctgag gacctcgacg agcagaagtt ctcgtacatg atagtacaca 2220
tgtaccagag ataccccgag gcgaaggaca aggtcgaggg tgtcttcagg gcgatgcaac 2280
agggtggcat ctcacaggtt gcagctgaca cgagcaagag gtacatcttg tccatccttg 2340
acgagacagg ctcaaccgca gctaccaagg cactgctatt aaagtggcat gacgagatta 2400
cggaggagat tggggctttg gagaggcatt ttggggttga taatgcctta cttcgcttgc 2460
tggtggaaac cttgcgagtt tga 2483
<210> 2
<211> 2280
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 2
atgcttgaag caaacgagct ctacccctat tcagttgctg ttgaccgaga tgaggtagta 60
cagtctggtg ctttgacatc tctccctgtg aggatacatc gatataacca ccttgccgac 120
gctggggcgc tgtgtttgac caacgactgg cgttgtacca tgaaagatgg acaagaccga 180
aagtccaatg gctcgccatg tgttgtaggg aattggggaa gttttatttg gccggagagt 240
cgaccagaaa gacttgggct cctctgctac ctgttagatg caggttgttt tcacgatgat 300
gcttgtgagg agatgcccat cgccgcagct caccaagaac acttggactt ggacgcagct 360
atggacgttg aggaccggcg agagttgagt agtgattcac ggtccttgcg gacaaaacaa 420
ctcatctcca acgctgttct tgaatgcatc aaggtcgaca gagtgggcgc tatgcgtatg 480
ctggaagcct acagaaagaa atggctgcgt attatggaga catacaacac cgaggagatc 540
aacactgttg aagactattt ccttgcacga gcaaacaatg ggggaatggg agcgtactac 600
gccatgcttg agttctctct gggcattttg gtcaccgacg aggaatacga gatgatggct 660
gaacccattg cacatgtgga acggtgcatg cttcttacca acgattactg gagctggcca 720
cgtgaacgca agcaagccga gtaccaggag gctggaaagg tcttcaacat cgtgtggttc 780
ctgaagaaaa ttgagctctg caccgaagaa gaggcagtgt caaaagtccg tgatatggtt 840
catgcagaag agcggaactg gactgctgcc aaaactcgcc tgtacagtca gttcggtaac 900
ctgcggcagg acttggtcaa gttcttggag aatttgcaca cggcactggc gggcaacgac 960
tattggagtt cgcagtgtta ccgccacaat gactgggagc acatcccaga tcttcctggc 1020
gaggacgcac caaaacttca cgaacttgcc accctaggtc gacgattatt gctggacgaa 1080
gatctaccgc ccggggcttc gacctatgga caggatacgg atgcggacag cgcgaggttc 1140
actgaatgca agccatccgt gggtaccgtc tctggtgatg aaactcagtc actcccgggc 1200
aggagcacgt ccggcgaaga atcggcttct gggtacatgt actccatctc atcagccagt 1260
gccccaccaa gtccttccaa agagcaccaa tcctcatatc cgagcatccc ctaccagtcg 1320
tctgcgcacg tcgcgggtga tcttgactct ccagtcttga gggaaccgat caagtacatc 1380
aggaacatgc cgtccaagaa ccttcgaaca caactgatcg actgcttcaa catctggcta 1440
aatgcctctg ggcctgcgat ttcggtcatc aaagaagtca ttgactgcct gcaccattcc 1500
tcactgatcc tggatgacat cgaggacggt tcacatctac gacgcgggtt tccagccact 1560
catgtcgtct acggaacatg tcaggccgtc aacagcgcca cgtttctcta cgtccaagca 1620
gtggagagcg tccacgccgc cgcccggaac aaccccgaga tgatggacgt ctttttgaaa 1680
cacctgaggc agctgttcaa cggccaaagc tgggacctgt actggacgta ccaccgccaa 1740
tgccctaccg aggagcaata cctggacatg gtagatcaga aaactggcgc catgttgcaa 1800
ttgttagtgg gcttgatgca gacggcgcag ccgcagcatc cagggaaggt tggcggcgtt 1860
gtccatagtg aggtcctctt caggttcaca cagttgtttg gccgattctt ccaggtccgt 1920
gacgactata tgaacctcac gtcgacagac tacgctcggc agaagggctt tgctgaggac 1980
ctcgacgagc agaagttctc gtacatgata gtacacatgt accagagata ccccgaggcg 2040
aaggacaagg tcgagggtgt cttcagggcg atgcaacagg gtggcatctc acaggttgca 2100
gctgacacga gcaagaggta catcttgtcc atccttgacg agacaggctc aaccgcagct 2160
accaaggcac tgctattaaa gtggcatgac gagattacgg aggagattgg ggctttggag 2220
aggcattttg gggttgataa tgccttactt cgcttgctgg tggaaacctt gcgagtttga 2280
<210> 3
<211> 759
<212> PRT
<213> 人工序列(Artificial sequence )
<400> 3
Met Leu Glu Ala Asn Glu Leu Tyr Pro Tyr Ser Val Ala Val Asp Arg
1 5 10 15
Asp Glu Val Val Gln Ser Gly Ala Leu Thr Ser Leu Pro Val Arg Ile
20 25 30
His Arg Tyr Asn His Leu Ala Asp Ala Gly Ala Leu Cys Leu Thr Asn
35 40 45
Asp Trp Arg Cys Thr Met Lys Asp Gly Gln Asp Arg Lys Ser Asn Gly
50 55 60
Ser Pro Cys Val Val Gly Asn Trp Gly Ser Phe Ile Trp Pro Glu Ser
65 70 75 80
Arg Pro Glu Arg Leu Gly Leu Leu Cys Tyr Leu Leu Asp Ala Gly Cys
85 90 95
Phe His Asp Asp Ala Cys Glu Glu Met Pro Ile Ala Ala Ala His Gln
100 105 110
Glu His Leu Asp Leu Asp Ala Ala Met Asp Val Glu Asp Arg Arg Glu
115 120 125
Leu Ser Ser Asp Ser Arg Ser Leu Arg Thr Lys Gln Leu Ile Ser Asn
130 135 140
Ala Val Leu Glu Cys Ile Lys Val Asp Arg Val Gly Ala Met Arg Met
145 150 155 160
Leu Glu Ala Tyr Arg Lys Lys Trp Leu Arg Ile Met Glu Thr Tyr Asn
165 170 175
Thr Glu Glu Ile Asn Thr Val Glu Asp Tyr Phe Leu Ala Arg Ala Asn
180 185 190
Asn Gly Gly Met Gly Ala Tyr Tyr Ala Met Leu Glu Phe Ser Leu Gly
195 200 205
Ile Leu Val Thr Asp Glu Glu Tyr Glu Met Met Ala Glu Pro Ile Ala
210 215 220
His Val Glu Arg Cys Met Leu Leu Thr Asn Asp Tyr Trp Ser Trp Pro
225 230 235 240
Arg Glu Arg Lys Gln Ala Glu Tyr Gln Glu Ala Gly Lys Val Phe Asn
245 250 255
Ile Val Trp Phe Leu Lys Lys Ile Glu Leu Cys Thr Glu Glu Glu Ala
260 265 270
Val Ser Lys Val Arg Asp Met Val His Ala Glu Glu Arg Asn Trp Thr
275 280 285
Ala Ala Lys Thr Arg Leu Tyr Ser Gln Phe Gly Asn Leu Arg Gln Asp
290 295 300
Leu Val Lys Phe Leu Glu Asn Leu His Thr Ala Leu Ala Gly Asn Asp
305 310 315 320
Tyr Trp Ser Ser Gln Cys Tyr Arg His Asn Asp Trp Glu His Ile Pro
325 330 335
Asp Leu Pro Gly Glu Asp Ala Pro Lys Leu His Glu Leu Ala Thr Leu
340 345 350
Gly Arg Arg Leu Leu Leu Asp Glu Asp Leu Pro Pro Gly Ala Ser Thr
355 360 365
Tyr Gly Gln Asp Thr Asp Ala Asp Ser Ala Arg Phe Thr Glu Cys Lys
370 375 380
Pro Ser Val Gly Thr Val Ser Gly Asp Glu Thr Gln Ser Leu Pro Gly
385 390 395 400
Arg Ser Thr Ser Gly Glu Glu Ser Ala Ser Gly Tyr Met Tyr Ser Ile
405 410 415
Ser Ser Ala Ser Ala Pro Pro Ser Pro Ser Lys Glu His Gln Ser Ser
420 425 430
Tyr Pro Ser Ile Pro Tyr Gln Ser Ser Ala His Val Ala Gly Asp Leu
435 440 445
Asp Ser Pro Val Leu Arg Glu Pro Ile Lys Tyr Ile Arg Asn Met Pro
450 455 460
Ser Lys Asn Leu Arg Thr Gln Leu Ile Asp Cys Phe Asn Ile Trp Leu
465 470 475 480
Asn Ala Ser Gly Pro Ala Ile Ser Val Ile Lys Glu Val Ile Asp Cys
485 490 495
Leu His His Ser Ser Leu Ile Leu Asp Asp Ile Glu Asp Gly Ser His
500 505 510
Leu Arg Arg Gly Phe Pro Ala Thr His Val Val Tyr Gly Thr Cys Gln
515 520 525
Ala Val Asn Ser Ala Thr Phe Leu Tyr Val Gln Ala Val Glu Ser Val
530 535 540
His Ala Ala Ala Arg Asn Asn Pro Glu Met Met Asp Val Phe Leu Lys
545 550 555 560
His Leu Arg Gln Leu Phe Asn Gly Gln Ser Trp Asp Leu Tyr Trp Thr
565 570 575
Tyr His Arg Gln Cys Pro Thr Glu Glu Gln Tyr Leu Asp Met Val Asp
580 585 590
Gln Lys Thr Gly Ala Met Leu Gln Leu Leu Val Gly Leu Met Gln Thr
595 600 605
Ala Gln Pro Gln His Pro Gly Lys Val Gly Gly Val Val His Ser Glu
610 615 620
Val Leu Phe Arg Phe Thr Gln Leu Phe Gly Arg Phe Phe Gln Val Arg
625 630 635 640
Asp Asp Tyr Met Asn Leu Thr Ser Thr Asp Tyr Ala Arg Gln Lys Gly
645 650 655
Phe Ala Glu Asp Leu Asp Glu Gln Lys Phe Ser Tyr Met Ile Val His
660 665 670
Met Tyr Gln Arg Tyr Pro Glu Ala Lys Asp Lys Val Glu Gly Val Phe
675 680 685
Arg Ala Met Gln Gln Gly Gly Ile Ser Gln Val Ala Ala Asp Thr Ser
690 695 700
Lys Arg Tyr Ile Leu Ser Ile Leu Asp Glu Thr Gly Ser Thr Ala Ala
705 710 715 720
Thr Lys Ala Leu Leu Leu Lys Trp His Asp Glu Ile Thr Glu Glu Ile
725 730 735
Gly Ala Leu Glu Arg His Phe Gly Val Asp Asn Ala Leu Leu Arg Leu
740 745 750
Leu Val Glu Thr Leu Arg Val
755
<210> 4
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 4
cggaattcga gctcgatgct tgaagcaaac gagct 35
<210> 5
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence )
<400> 5
tactacagat ccccggtcaa actcgcaagg tttccaccag 40
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:环丙基溴的一种新合成方法