一类5-12-5三环二倍半萜骨架化合物及其制备

文档序号:2359 发布日期:2021-09-17 浏览:63次 英文

一类5-12-5三环二倍半萜骨架化合物及其制备

技术领域

本发明属于基因工程

技术领域

,具体涉及一种具体涉及一种从Cytosporaschulzeri12565中克隆得到的5-12-5三环二倍半萜骨架化合物Schultriene合成基因CcCS及其应用。

背景技术

萜类化合物是所有异戊二烯聚合物及其衍生物的总称。作为小分子天然产物中种类最为丰富的一类,萜类化合物在医疗、食品和化妆品行业发挥着重要作用[1]。二倍半萜是以GFPP为前体催化合成的一类萜类化合物,仅占萜类化合物的极小部分(不足2%),二倍半萜通常具有复杂的环化结构,具有较高成药潜力[2]。如:从胡麻斑病菌Bipolaris oryzae中分离得到的ophiobolinA除具有细胞毒和抗疟疾活性外,还具有钙调蛋白及抗脑胶质瘤活性[3-5]。而由双功能萜合酶(BFTSs)催化合成的二倍半萜往往以其新颖的催化机制受到人们的青睐。

二倍半萜的传统化学合成面临着合成步骤繁琐、催化特异性较差及新骨架获取能力有限等问题,而产量低、成本高的技术现状又使得新颖骨架的二倍半萜化合物难以从自然界中直接获取。基因组技术和生物信息学的快速发展使人们意识到微生物也具有可观的萜类化合物合成潜力。通过微生物全基因组分析与基因组挖掘策略联用,可从微生物中挖掘到众多具有全新催化机制的双功能萜合酶,结合高效萜类生物合成基因簇异源表达系统,可获得大量新骨架萜类产物,成为发现新药先导化合物的重要方法。

Cytospora schulzeri隶属于子囊菌门(Ascomycota)、粪壳菌纲(Sordariomycetes)、间座壳目(Diaporthales)、黑腐皮壳科(Valsaceae)壳囊孢属(Cytospora),可导致苹果树腐烂[6]。迄今为止还没有从Cytospora schulzeri中分离获二倍半萜活性天然产物的的报道。挖掘Cytospora schulzeri的次级代谢生物合成基因簇有助于丰富天然产物化合物库,为新药发现提供宝贵的先导化合物。

发明内容

本发明依托上述研究进行,提供了一类5-12-5三环二倍半萜骨架化合物、其合成酶、合成酶的编码基因、以及化合物的异源表达方法。

本发明的思路如下:在挖掘菌株C.schulzeri12565代谢产物二倍半萜类化合物的生物合成过程中,通过对基因基因功能分析,得知CcCS基因与萜类合成相关,说明CcCS基因参与了5-12-5三环二倍半萜骨架化合物的生物合成。进一步通过异源表达CcCS基因获取CcCS蛋白进行体外酶促反应,验证了CcCS基因是一种5-12-5三环二倍半萜骨架化合物Schultriene的合成基因。

本发明的首要目的在于提供5-12-5三环二倍半萜骨架化合物的结构;第二目的在于提供合成该化合物的酶及基因;第三目的在于提供异源表达5-12-5三环二倍半萜骨架化合物的方法。

为了实现上述目的,本发明所采用的技术方案如下:

本发明的第一方面,提供5-12-5三环二倍半萜骨架化合物Schultriene,其分子式为C25H40,结构式如下所示:

本发明的第二方面,提供了上述5-12-5三环二倍半萜骨架化合物的合成酶CcCS,该合成酶的氨基酸序列如SEQ ID NO.3所示,其N端和C端分别负责萜类环化和异戊烯基转移功能。

进一步,该合成酶含有两个保守结构域:萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDACE和NDYWSWPRE,E-IPPS结构域也含有两个具有相似功能的特征性保守基序DDIED和DDYMN。

本发明的第二方面,提供了编码上述合成酶的基因,从CS12565菌株(C.schulzeri12565)基因组中克隆得到,其多核苷酸序列如SEQ ID NO.1所示。该CS12565菌株保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏编号为CGMCCNo.21944。该基因含有3个内含子,其cDNA大小为2280bp,序列如SEQ ID NO.2所示。

本发明的第三方面,提供了一种5-12-5三环二倍半萜骨架化合物重组表达载体,该重组表达载体为运载有上述合成酶或基因的真核或原核表达载体,如大肠杆菌、酵母系统以及丝状真菌。

本发明的第四方面,提供了一种5-12-5三环二倍半萜骨架化合物重组表达宿主细胞,含有如上所述的重组表达载体,实现化合物异源表达。

本发明的第五方面,提供上述合成酶或基因在合成萜类化合物中的应用,具体为在合成5-12-5三环二倍半萜骨架化合物中的应用。

本发明的第六方面,提供了一种异源表达5-12-5三环二倍半萜骨架化合物的方法,其特征在于,包括如下步骤:

A、CcCS基因异源表达载体的构建

通过PCR技术,以C.schulzeri12565基因组为模板扩增得到含有CcCS的基因序列,扩增所用到的引物序列分别如SEQ ID NO.4和SEQ ID NO.5所示;

扩增所用到的引物序列:

CcCS-F:cgGAATTCGAGCTCGATGCTTGAAGCAAACGAGCT;

CcCS-R:tactacaGATCCCCGGTCAAACTCGCAAGGTTTCCACCAG。

将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-CcCS表达质粒,并将该连接产物转化到大肠杆菌DH10B中,筛选阳性转化子,培养后提取质粒PCR验证,获取pUARA2-CcCS质粒,

B、原生质体转化

培养米曲霉Aspergillus oryzae NSAR1并收集原生质体,与pUARA2-CcCS质粒混匀,培养后将长出的转化子进行PCR验证,阳性转化子即为CcCS异源表达菌株AO-CcCS,

C、异源表达菌株AO-CcCS培养及产物分离

接种异源表达菌株AO-CcCS经pUARA2质粒筛选液体培养基筛选后,进行发酵培养,对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转至已称重样品瓶中,称量样品并记录重量。

本发明的有益效果如下:

本发明发现了合成5-12-5三环二倍半萜骨架化合物Schultriene的CcCS基因,其编码的CcCS蛋白能够辅助Schultriene类化合物母核合成。本发明为5-12-5三环二倍半萜化合物的生物合成提供了新的资源,为该类化合物合成提供一种选择。

本发明发现的CcCS基因催化产生新的二倍半萜骨架化合物,为丰富天然产物化合物库、发现新抗生素提供了宝贵的先导化合物资源。

附图说明

图1为本发明化合物Schultriene的HR-EI-MS谱图。

图2为本发明化合物Schultriene溶于Benzene-d6中的1H-NMR谱图。

图3为本发明化合物Schultriene溶于Benzene-d6中的13C-NMR谱图。

图4为本发明化合物Schultriene溶于Benzene-d613C-DEPT 135谱。

图5为本发明化合物Schultriene溶于Benzene-d6中的1H-1H COSY谱。

图6为本发明化合物Schultriene溶于Benzene-d6中的HSQC谱图。

图7为本发明化合物Schultriene溶于Benzene-d6中的HMBC谱图。

图8为本发明化合物Schultriene溶于Benzene-d6中的NOESY谱图。

图9为Cytospora schulzeri 12565中CsSS基因编码的蛋白与已报道的蛋白的氨基酸序列比对结果图。

菌种保藏信息:CS12565(Cytospora schulzeri 12565)保藏于中国微生物菌种保藏管理委员会普通微生物中心,保藏地址为北京市朝阳区北辰西路1号院3号,保藏日期为2021年04月02号,保藏编号为CGMCC No.21944。

具体实施方式

下面结合本发明的附图和实施例对本发明的实施作详细说明,以下实施例是在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体操作过程,但本发明的保护范围不限于下述的实施例。

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

本发明所提供的5-12-5三环二倍半萜骨架化合物Schultriene合成基因,是从Cytospora schulzeri 12565中克隆得到,命名为CcCS基因,其基因序列如SEQ ID NO.1所示。CcCS基因含有3个内含子,其cDNA大小为2280bp,序列如SEQ ID NO.2所示。CcCS基因编码的蛋白,命名为CcCS蛋白,其氨基酸序列如SEQ ID NO.3所示。

CcCS蛋白属于嵌合型萜类合成酶,其N端和C端分别负责萜类环化和异戊烯基转移功能。CcCS蛋白含有两个保守结构域,其中萜类环化酶结构域含有两个用来识别Mg2+和底物的特征性保守基序DDACE和NDYWSWPRE,E-IPPS结构域也含有两个具有相似功能的特征性保守基序DDIED和DDYMN(图9)。

实施例1:一种5-12-5三环二倍半萜骨架化合物Schultriene合成基因的异源表达及结构鉴定

利用异源表达的方法,将Cytospora schulzeri 12565菌体中的CcCS基因通过构建表达质粒转入宿主米曲霉中,检测异源表达菌株产物生产情况。所用到培养基配方如表1。

表1实施例所用到培养基配方

1.CcCS基因源表达载体的构建

(1)通过PCR技术,以C.schulzeri12565基因组为模板扩增得到含有CcCS的基因序列。扩增所用到的引物序列:

CcCS-F:cgGAATTCGAGCTCGATGCTTGAAGCAAACGAGCT(SEQ ID NO.4);

CcCS-R:tactacaGATCCCCGGTCAAACTCGCAAGGTTTCCACCAG(SEQ ID NO.5)。

(2)将扩增得到的片段通过同源重组与pUARA2载体连接,构建pUARA2-CcCS表达质粒,该载体CcCS两侧与pUARA2载体具有一致的同源序列。

(3)连接产物转化到大肠杆菌DH10B中,通过氨苄青霉素筛选阳性转化子。液体培养阳性转化子,提取质粒PCR验证,获取pUARA2-CcCS质粒。

2.原生质体的转化

(1)将米曲霉Aspergillus oryzae NSAR1涂于PDA平板,30℃培养7d。

(2)收集孢子于10mL 0.1%Tween-80(一般需要收集1个平板的抱子),用血球计数板计数。接种约107个孢子于50mL DPY中,30℃、220rpm培养2-3d。

(3)称量100mg Yatalase,加入solution 0溶解,20ml用0.22μm滤膜过滤灭菌,加入到50ml离心管中。

(4)收集菌体。将培养好的100ml菌丝体倒入到P250玻璃过滤器中,去除培养基,用灭菌水清洗(或0.8M NaCl)3~5次,用灭菌药勺将水分挤干去除,然后将压干的菌体加入到Yatalase溶液中。30℃,200rpm震荡培养1-2小时,至球状菌丝体消失上清明显秽浊状为止。

(5)用Miracloth滤布过滤消化好的菌液,收集原生质体,转到新50ml离心管中,4℃,800g,5min离心。

(6)去除上清液,加入20ml,0.8M NaCl再悬浮清洗,4℃,800g,5min离心(清洗两次)。去除上清液,加10ml,0.8M NaCl。用细菌计数器在显微镜下数原生质体的数目。原生质体数目=总计数/80×400ml×104×稀释倍数。

(7)将原生质体浓度调成2×108cell/ml。(sol 2/sol 3=4/1),依据菌体生长情况可收获0.5ml-2ml原生质体不等。

(8)取200μl的原生质体溶液移至新的50ml的离心管中,加入10μg表达质粒pUARA2-CcCS,轻轻地混匀。在冰上静置20min。期间将灭菌好的Top agar,在50℃水浴中保温。

(9)往(8)的混悬液中加入1ml的sol 3,用枪头轻轻的混匀。在室温下静置20min。加入10ml的sol 2,轻轻混匀。

(10)4℃,800g,10min离心,除去上清,加入1ml的sol 2,用移液枪轻轻地混悬,加入200μl到pUARA2质粒筛选固体培养基的中央(x3板)。在培养皿的周围迅速加入5ml 50℃保温的top agar,快速混匀。平板表面充分干燥后,用parafilm缠好,盖朝下,进行30℃培养3-7天。

(11)每平板挑2-3个克隆,共8个。将长出的转化子进行PCR验证,阳性转化子即为CcCS异源表达菌株AO-CcCS。

3、异源表达菌株AO-CcCS表达产物的检测

(1)接种异源表达菌株AO-CcCS于pUARA2质粒筛选液体培养基,30℃培养3d。

(2)8000rpm离心10min收发酵菌体,加入100ml等体积80%丙酮后超声破碎20min后,8000rpm离心10min,取上清。

(3)用2倍体积的乙酸乙酯萃取1次,用旋转蒸发仪旋干后用15mL甲醇(色谱级)溶解。

(4)取1mL甲醇溶液,经0.22μm滤膜过滤后置于色谱瓶中,即为GC-MS和LC-MS样品。

(5)将样品进行GC-MS检测:采用Agilent-HP-5MS色谱柱,起始温度60℃,以15℃/min的速度升至310℃,再以5℃/min的速度升至310℃,保持13min。GC-MS方法参数如下:Sample模块:进样前后洗针次数5次,样品洗针次数2次,粘度补偿时间0.2s,进样模式为normal。GC模块:柱温50℃,进样温度270℃,进样模式为不分流(splitness),载气为氦气,流速控制模式为线性,总流速10mL/min,柱温控制程序如表3.5。MS模块:MS离子源温度230℃,界面温度270℃,溶剂切除时间2.5min采集时间3min-60min,采集模式为全扫描,eventtime设置为0.3s,扫描速度为2000,扫描核质比为40-600Da。

(7)将样品进行LC-MS检测:采用Cholester色谱柱,流动相A相-0.1%甲酸水,B相-乙腈,流速为1mL/min,30min内流动相乙腈的比例由5%上升到100%,然后维持6min,之后10s内流动相乙腈的比例降至5%,然后维持4min 50s。

4、异源表达重组菌株AO-CcCS二倍半萜骨架产物分离纯化及鉴定

AO-CcCS共发酵10L,得到约2g粗提物。对得到的发酵粗提物首先采用正向硅胶柱层析方法进行分离纯化。采用干法上柱,石油醚等度洗脱,每10mL流出液收集一管,共收集得到18个流份,TLC快速检测各流份,合并斑点相同流份,减压浓缩旋蒸至干并转至已称重样品瓶中,称量样品并记录重量。HPLC分析各流份组分,精确定位目标流份。优化制备条件,选用Cholester半制备色谱柱制备目标化合物,流动相:A相-0.1%甲酸水;B相-乙腈,流速为4mL/min,95%乙腈甲酸等度,初始进样10μL,在保证峰型不变的基础上,逐渐加大进样量至80μL,目标二倍半萜化合物峰会在20min左右出现,在峰出现的时候将流出溶液接到锥形瓶中即可。对制备到的化合物TLC及HPLC进行纯度检验。

分离的二倍半萜骨架化合物的NMR测试采用Bruker 600MHz(1H 600MHz;13C150MHz)。二倍半萜骨架化合物的溶剂为Benzene-d6,NMR谱仪器分辨率为600MHz,先进行1HNMR和13C NMR的测定,将其与数据库中的数据做对比,若为新结构,则再补全HSQC,COSY,HMBC谱图解谱确定具体结构。

5、鉴定二倍半萜骨架化合物Schultriene。

将上述得到的二倍半萜骨架化合物Schultriene进行鉴定:

(1)外观:为透明油脂状。

(2)溶解性:易溶于甲醇,难溶于水。

(3)核磁共振谱:图1为本发明化合物Schultriene溶于Benzene-d6中的1H-NMR谱图。图2为本发明化合物Schultriene溶于Benzene-d6中的13C-NMR谱图。图3为本发明化合物Schultriene溶于Benzene-d613C-DEPT 135谱。图4为本发明化合物Schultriene溶于Benzene-d6中的1H-1H COSY谱。图5为本发明化合物Schultriene溶于Benzene-d6中的HSQC谱图。图6为本发明化合物Schultriene溶于Benzene-d6中的HMBC谱图。图7为本发明化合物Schultriene溶于Benzene-d6中的NOESY谱图。对本发明化合物Schultriene的核磁共振谱进行了研究并对1D和2D谱各信号进行了归属,见表2。并最终确定结构如下:

表2化合物fusaoxyspene A的1D和2D谱各峰归属

本发明背景技术中所涉及的参考文献如下:

[1]Guan,Z.et al.Metabolic engineering of Bacillus subtilis forterpenoid production.Applied Microbiology andbiotechnology 99,9395-9406(2015).

[2]Chang,M.C.&Keasling,J.D.Production of isoprenoid pharmaceuticalsby engineered microbes.Nature chemical biology 2,674-681(2006).

[3]Leung,P.C.,Taylor,W.A.,Wang,J.H.&Tipton,C.L.Role of calmodulininhibition in the mode ofaction ofophiobolinA.Plant physiology 77,303-308(1985).

[4]Nozoe,S.et al.The structure of ophiobolin,a C25 terpenoid having anovel skeleton.Journal ofthe American Chemical Society 87,4968-4970(1965).

[5]Peters,C.&Mayer,A.Ca 2+/calmodulin signals the completionofdocking and triggers a late step ofvacuole fusion.Nature 396,575-580(1998).

[6]Jiang,N.,Yang,Q.,Fan,X.-L.&Tian,C.-M.Identification of sixCytospora species on Chinese chestnut in China.MycoKeys 62,1(2020).

以上已对本发明创造的较佳实施例进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明创造精神的前提下还可作出种种的等同的变型或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

序列表

<110> 华东理工大学

<120> 一类5-12-5三环二倍半萜骨架化合物及其制备

<130> 权利要求书、说明书

<160> 5

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2483

<212> DNA

<213> 人工序列(Artificial sequence )

<400> 1

atgcttgaag caaacgagct ctacccctat tcagttgctg ttgaccgaga tgaggtagta 60

cagtctggtg ctttgacatc tctccctgtg aggatacatc gatataacca ccttgccgac 120

gctggggcgc tgtgtttgac caacgactgg cgttgtacca tgaaagatgg acaagaccga 180

aagtccaatg gctcgccatg tgttgtaggg aattggggaa gttttatttg gccggagagg 240

taagtctaga tagttgtgaa aatgggacag cgctcatact acaatcgaca cggagatgta 300

cttcagtgca cgggtggcta actacagcgc tggtagtcga ccagaaagac ttgggctcct 360

ctgctacctg ttagatgcag gttgttttca cgatggtatg taagaacact caccctcgtg 420

agtagacagc cgctgacagc tttggataga tgcttgtgag gagatgccca tcgccgcagc 480

tcaccaagaa cacttggact tggacgcagc tatggacgtt gaggaccggc gagagttgag 540

tagtgattca cggtccttgc ggacaaaaca actcatctcc aacgctgttc ttgaatgcat 600

caaggtcgac agagtgggcg ctatgcgtat gctggaagcc tacagaaaga aatggctgcg 660

tattatggag acatacaaca ccgaggagat caacactgtt gaagactatt tccttgcacg 720

agcaaacaat gggggaatgg ggtaagtaga gcttccacca tttcacgtgg acatgaactg 780

acgatggccc cagagcgtac tacgccatgc ttgagttctc tctgggcatt ttggtcaccg 840

acgaggaata cgagatgatg gctgaaccca ttgcacatgt ggaacggtgc atgcttctta 900

ccaacgatta ctggagctgg ccacgtgaac gcaagcaagc cgagtaccag gaggctggaa 960

aggtcttcaa catcgtgtgg ttcctgaaga aaattgagct ctgcaccgaa gaagaggcag 1020

tgtcaaaagt ccgtgatatg gttcatgcag aagagcggaa ctggactgct gccaaaactc 1080

gcctgtacag tcagttcggt aacctgcggc aggacttggt caagttcttg gagaatttgc 1140

acacggcact ggcgggcaac gactattgga gttcgcagtg ttaccgccac aatgactggg 1200

agcacatccc agatcttcct ggcgaggacg caccaaaact tcacgaactt gccaccctag 1260

gtcgacgatt attgctggac gaagatctac cgcccggggc ttcgacctat ggacaggata 1320

cggatgcgga cagcgcgagg ttcactgaat gcaagccatc cgtgggtacc gtctctggtg 1380

atgaaactca gtcactcccg ggcaggagca cgtccggcga agaatcggct tctgggtaca 1440

tgtactccat ctcatcagcc agtgccccac caagtccttc caaagagcac caatcctcat 1500

atccgagcat cccctaccag tcgtctgcgc acgtcgcggg tgatcttgac tctccagtct 1560

tgagggaacc gatcaagtac atcaggaaca tgccgtccaa gaaccttcga acacaactga 1620

tcgactgctt caacatctgg ctaaatgcct ctgggcctgc gatttcggtc atcaaagaag 1680

tcattgactg cctgcaccat tcctcactga tcctggatga catcgaggac ggttcacatc 1740

tacgacgcgg gtttccagcc actcatgtcg tctacggaac atgtcaggcc gtcaacagcg 1800

ccacgtttct ctacgtccaa gcagtggaga gcgtccacgc cgccgcccgg aacaaccccg 1860

agatgatgga cgtctttttg aaacacctga ggcagctgtt caacggccaa agctgggacc 1920

tgtactggac gtaccaccgc caatgcccta ccgaggagca atacctggac atggtagatc 1980

agaaaactgg cgccatgttg caattgttag tgggcttgat gcagacggcg cagccgcagc 2040

atccagggaa ggttggcggc gttgtccata gtgaggtcct cttcaggttc acacagttgt 2100

ttggccgatt cttccaggtc cgtgacgact atatgaacct cacgtcgaca gactacgctc 2160

ggcagaaggg ctttgctgag gacctcgacg agcagaagtt ctcgtacatg atagtacaca 2220

tgtaccagag ataccccgag gcgaaggaca aggtcgaggg tgtcttcagg gcgatgcaac 2280

agggtggcat ctcacaggtt gcagctgaca cgagcaagag gtacatcttg tccatccttg 2340

acgagacagg ctcaaccgca gctaccaagg cactgctatt aaagtggcat gacgagatta 2400

cggaggagat tggggctttg gagaggcatt ttggggttga taatgcctta cttcgcttgc 2460

tggtggaaac cttgcgagtt tga 2483

<210> 2

<211> 2280

<212> DNA

<213> 人工序列(Artificial sequence )

<400> 2

atgcttgaag caaacgagct ctacccctat tcagttgctg ttgaccgaga tgaggtagta 60

cagtctggtg ctttgacatc tctccctgtg aggatacatc gatataacca ccttgccgac 120

gctggggcgc tgtgtttgac caacgactgg cgttgtacca tgaaagatgg acaagaccga 180

aagtccaatg gctcgccatg tgttgtaggg aattggggaa gttttatttg gccggagagt 240

cgaccagaaa gacttgggct cctctgctac ctgttagatg caggttgttt tcacgatgat 300

gcttgtgagg agatgcccat cgccgcagct caccaagaac acttggactt ggacgcagct 360

atggacgttg aggaccggcg agagttgagt agtgattcac ggtccttgcg gacaaaacaa 420

ctcatctcca acgctgttct tgaatgcatc aaggtcgaca gagtgggcgc tatgcgtatg 480

ctggaagcct acagaaagaa atggctgcgt attatggaga catacaacac cgaggagatc 540

aacactgttg aagactattt ccttgcacga gcaaacaatg ggggaatggg agcgtactac 600

gccatgcttg agttctctct gggcattttg gtcaccgacg aggaatacga gatgatggct 660

gaacccattg cacatgtgga acggtgcatg cttcttacca acgattactg gagctggcca 720

cgtgaacgca agcaagccga gtaccaggag gctggaaagg tcttcaacat cgtgtggttc 780

ctgaagaaaa ttgagctctg caccgaagaa gaggcagtgt caaaagtccg tgatatggtt 840

catgcagaag agcggaactg gactgctgcc aaaactcgcc tgtacagtca gttcggtaac 900

ctgcggcagg acttggtcaa gttcttggag aatttgcaca cggcactggc gggcaacgac 960

tattggagtt cgcagtgtta ccgccacaat gactgggagc acatcccaga tcttcctggc 1020

gaggacgcac caaaacttca cgaacttgcc accctaggtc gacgattatt gctggacgaa 1080

gatctaccgc ccggggcttc gacctatgga caggatacgg atgcggacag cgcgaggttc 1140

actgaatgca agccatccgt gggtaccgtc tctggtgatg aaactcagtc actcccgggc 1200

aggagcacgt ccggcgaaga atcggcttct gggtacatgt actccatctc atcagccagt 1260

gccccaccaa gtccttccaa agagcaccaa tcctcatatc cgagcatccc ctaccagtcg 1320

tctgcgcacg tcgcgggtga tcttgactct ccagtcttga gggaaccgat caagtacatc 1380

aggaacatgc cgtccaagaa ccttcgaaca caactgatcg actgcttcaa catctggcta 1440

aatgcctctg ggcctgcgat ttcggtcatc aaagaagtca ttgactgcct gcaccattcc 1500

tcactgatcc tggatgacat cgaggacggt tcacatctac gacgcgggtt tccagccact 1560

catgtcgtct acggaacatg tcaggccgtc aacagcgcca cgtttctcta cgtccaagca 1620

gtggagagcg tccacgccgc cgcccggaac aaccccgaga tgatggacgt ctttttgaaa 1680

cacctgaggc agctgttcaa cggccaaagc tgggacctgt actggacgta ccaccgccaa 1740

tgccctaccg aggagcaata cctggacatg gtagatcaga aaactggcgc catgttgcaa 1800

ttgttagtgg gcttgatgca gacggcgcag ccgcagcatc cagggaaggt tggcggcgtt 1860

gtccatagtg aggtcctctt caggttcaca cagttgtttg gccgattctt ccaggtccgt 1920

gacgactata tgaacctcac gtcgacagac tacgctcggc agaagggctt tgctgaggac 1980

ctcgacgagc agaagttctc gtacatgata gtacacatgt accagagata ccccgaggcg 2040

aaggacaagg tcgagggtgt cttcagggcg atgcaacagg gtggcatctc acaggttgca 2100

gctgacacga gcaagaggta catcttgtcc atccttgacg agacaggctc aaccgcagct 2160

accaaggcac tgctattaaa gtggcatgac gagattacgg aggagattgg ggctttggag 2220

aggcattttg gggttgataa tgccttactt cgcttgctgg tggaaacctt gcgagtttga 2280

<210> 3

<211> 759

<212> PRT

<213> 人工序列(Artificial sequence )

<400> 3

Met Leu Glu Ala Asn Glu Leu Tyr Pro Tyr Ser Val Ala Val Asp Arg

1 5 10 15

Asp Glu Val Val Gln Ser Gly Ala Leu Thr Ser Leu Pro Val Arg Ile

20 25 30

His Arg Tyr Asn His Leu Ala Asp Ala Gly Ala Leu Cys Leu Thr Asn

35 40 45

Asp Trp Arg Cys Thr Met Lys Asp Gly Gln Asp Arg Lys Ser Asn Gly

50 55 60

Ser Pro Cys Val Val Gly Asn Trp Gly Ser Phe Ile Trp Pro Glu Ser

65 70 75 80

Arg Pro Glu Arg Leu Gly Leu Leu Cys Tyr Leu Leu Asp Ala Gly Cys

85 90 95

Phe His Asp Asp Ala Cys Glu Glu Met Pro Ile Ala Ala Ala His Gln

100 105 110

Glu His Leu Asp Leu Asp Ala Ala Met Asp Val Glu Asp Arg Arg Glu

115 120 125

Leu Ser Ser Asp Ser Arg Ser Leu Arg Thr Lys Gln Leu Ile Ser Asn

130 135 140

Ala Val Leu Glu Cys Ile Lys Val Asp Arg Val Gly Ala Met Arg Met

145 150 155 160

Leu Glu Ala Tyr Arg Lys Lys Trp Leu Arg Ile Met Glu Thr Tyr Asn

165 170 175

Thr Glu Glu Ile Asn Thr Val Glu Asp Tyr Phe Leu Ala Arg Ala Asn

180 185 190

Asn Gly Gly Met Gly Ala Tyr Tyr Ala Met Leu Glu Phe Ser Leu Gly

195 200 205

Ile Leu Val Thr Asp Glu Glu Tyr Glu Met Met Ala Glu Pro Ile Ala

210 215 220

His Val Glu Arg Cys Met Leu Leu Thr Asn Asp Tyr Trp Ser Trp Pro

225 230 235 240

Arg Glu Arg Lys Gln Ala Glu Tyr Gln Glu Ala Gly Lys Val Phe Asn

245 250 255

Ile Val Trp Phe Leu Lys Lys Ile Glu Leu Cys Thr Glu Glu Glu Ala

260 265 270

Val Ser Lys Val Arg Asp Met Val His Ala Glu Glu Arg Asn Trp Thr

275 280 285

Ala Ala Lys Thr Arg Leu Tyr Ser Gln Phe Gly Asn Leu Arg Gln Asp

290 295 300

Leu Val Lys Phe Leu Glu Asn Leu His Thr Ala Leu Ala Gly Asn Asp

305 310 315 320

Tyr Trp Ser Ser Gln Cys Tyr Arg His Asn Asp Trp Glu His Ile Pro

325 330 335

Asp Leu Pro Gly Glu Asp Ala Pro Lys Leu His Glu Leu Ala Thr Leu

340 345 350

Gly Arg Arg Leu Leu Leu Asp Glu Asp Leu Pro Pro Gly Ala Ser Thr

355 360 365

Tyr Gly Gln Asp Thr Asp Ala Asp Ser Ala Arg Phe Thr Glu Cys Lys

370 375 380

Pro Ser Val Gly Thr Val Ser Gly Asp Glu Thr Gln Ser Leu Pro Gly

385 390 395 400

Arg Ser Thr Ser Gly Glu Glu Ser Ala Ser Gly Tyr Met Tyr Ser Ile

405 410 415

Ser Ser Ala Ser Ala Pro Pro Ser Pro Ser Lys Glu His Gln Ser Ser

420 425 430

Tyr Pro Ser Ile Pro Tyr Gln Ser Ser Ala His Val Ala Gly Asp Leu

435 440 445

Asp Ser Pro Val Leu Arg Glu Pro Ile Lys Tyr Ile Arg Asn Met Pro

450 455 460

Ser Lys Asn Leu Arg Thr Gln Leu Ile Asp Cys Phe Asn Ile Trp Leu

465 470 475 480

Asn Ala Ser Gly Pro Ala Ile Ser Val Ile Lys Glu Val Ile Asp Cys

485 490 495

Leu His His Ser Ser Leu Ile Leu Asp Asp Ile Glu Asp Gly Ser His

500 505 510

Leu Arg Arg Gly Phe Pro Ala Thr His Val Val Tyr Gly Thr Cys Gln

515 520 525

Ala Val Asn Ser Ala Thr Phe Leu Tyr Val Gln Ala Val Glu Ser Val

530 535 540

His Ala Ala Ala Arg Asn Asn Pro Glu Met Met Asp Val Phe Leu Lys

545 550 555 560

His Leu Arg Gln Leu Phe Asn Gly Gln Ser Trp Asp Leu Tyr Trp Thr

565 570 575

Tyr His Arg Gln Cys Pro Thr Glu Glu Gln Tyr Leu Asp Met Val Asp

580 585 590

Gln Lys Thr Gly Ala Met Leu Gln Leu Leu Val Gly Leu Met Gln Thr

595 600 605

Ala Gln Pro Gln His Pro Gly Lys Val Gly Gly Val Val His Ser Glu

610 615 620

Val Leu Phe Arg Phe Thr Gln Leu Phe Gly Arg Phe Phe Gln Val Arg

625 630 635 640

Asp Asp Tyr Met Asn Leu Thr Ser Thr Asp Tyr Ala Arg Gln Lys Gly

645 650 655

Phe Ala Glu Asp Leu Asp Glu Gln Lys Phe Ser Tyr Met Ile Val His

660 665 670

Met Tyr Gln Arg Tyr Pro Glu Ala Lys Asp Lys Val Glu Gly Val Phe

675 680 685

Arg Ala Met Gln Gln Gly Gly Ile Ser Gln Val Ala Ala Asp Thr Ser

690 695 700

Lys Arg Tyr Ile Leu Ser Ile Leu Asp Glu Thr Gly Ser Thr Ala Ala

705 710 715 720

Thr Lys Ala Leu Leu Leu Lys Trp His Asp Glu Ile Thr Glu Glu Ile

725 730 735

Gly Ala Leu Glu Arg His Phe Gly Val Asp Asn Ala Leu Leu Arg Leu

740 745 750

Leu Val Glu Thr Leu Arg Val

755

<210> 4

<211> 35

<212> DNA

<213> 人工序列(Artificial sequence )

<400> 4

cggaattcga gctcgatgct tgaagcaaac gagct 35

<210> 5

<211> 40

<212> DNA

<213> 人工序列(Artificial sequence )

<400> 5

tactacagat ccccggtcaa actcgcaagg tttccaccag 40

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:环丙基溴的一种新合成方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!