聚合酶组合物和制造与使用其的方法
本申请是申请号为201580075723.0的专利申请的分案申请。
相关申请的交叉参考
本申请要求2014年12月16日提交的美国临时申请第62/092,756号的益处。本申请以全文引用的方式并入。
序列表
本申请含有序列表,所述序列表已经以ASCII格式以电子方式提交并且以全文引用的方式并入本文中。创建于2015年12月11日的所述ASCII拷贝名称为LT00925PCT_SL.txt并且大小为247,676个字节。
技术领域
本发明大体上涉及具有改进的特性的突变性聚合酶,例如突变型Taq聚合酶,以及编码所述聚合酶的核酸,和使用所述聚合酶的方法和套组。
背景技术
酶催化生物反应的能力对生命来说是基本的。一系列生物应用使用酶来体外合成各种生物分子。一种尤其适用的类别的酶为聚合酶,其可以催化生物分子(例如核苷酸或氨基酸)聚合成生物聚合物(例如核酸或肽)。举例来说,可以使核苷酸尤其以模板依赖性方式聚合成核酸的聚合酶适用于重组DNA技术和核酸检测和核酸测序应用中。许多核酸测序方法在由聚合酶催化的体外模板依赖性核酸合成期间监测核苷酸并入。单分子测序(SMS)和双端测序(PES)典型地包括用于模板依赖性核酸合成的聚合酶。聚合酶也适用于产生核酸库,如在乳液PCR或桥式PCR期间产生的核酸库。使用此类聚合酶产生的核酸库可以用于多种下游工艺中,如基因分型;核苷酸多态性(SNP)分析;拷贝数变异分析;表观遗传分析;基因表达分析;杂交阵列;基因突变分析,包括(但不限于)疾病病况的检测、预后和/或诊断;罕见或低频等位基因突变的检测和分析;以及核酸测序,包括(但不限于)从头测序或目标重测序。
适用于核酸扩增、合成和/或检测的聚合酶的所期望品质是与参考聚合酶相比改进核苷酸并入。改进的核苷酸并入可以通过减少对所需目标分子进行测序所必需的核酸模板数目来使得如核酸库制备和/或DNA测序的工艺更具成本效益。在另一方面,与参考聚合酶相比改进的核苷酸并入也可以减少测定所需目标分子序列所需的测序读数的数目。另外,改进的核苷酸并入(与参考聚合酶相比)也可以改进信号均匀性,从而使得所需目标分子碱基测定中的精确度增加。在又另一方面,经过修饰的聚合酶与参考聚合酶相比改进的核苷酸并入可以增加所需目标分子的读取长度,并且因此减少所述经过修饰的聚合酶拖延或从所需目标分子解离的可能性。在又另一方面,具有与参考聚合酶相比改进的模板化或克隆扩增效率的经过修饰的聚合酶,并且因此可以改进目标分子的下游测序,所述目标分子习惯上被视为“困难”目标分子,如具有高GC或AT含量的目标分子。由此,本发明的一个方面是提供一种在核酸扩增中改进GC和AT偏差性的方法、系统、设备和物质组合物,所述改进使用GC或AT含量偏差性减小的经过修饰的聚合酶来进行。
核酸库制备或DNA测序中所用的酶的另一个所期望品质是热稳定性。展现热稳定性的DNA聚合酶已经彻底改变分子生物学和临床诊断学的许多方面,这是因为聚合酶链反应(PCR)的发展,所述聚合酶链反应使用热变性、引物粘接和酶引物延伸的循环来使DNA模板扩增。在初始PCR实验中所用的原型热稳定DNA聚合酶是Taq DNA聚合酶,其原先是从嗜热性真杆菌水生栖热菌(Thermus aquaticus)中分离的。
存在三个主要的DNA聚合酶家族,被称为家族A、B和C。将聚合酶分类到这三个家族中的一个中是基于给定聚合酶与大肠杆菌(E.coli)DNA聚合酶I(家族A)、II(家族B)或III(家族C)的结构类似性。举例来说,家族A DNA聚合酶包括(但不限于)克列诺(Klenow)DNA聚合酶、水生栖热菌DNA聚合酶I(Taq聚合酶)和噬菌体T7 DNA聚合酶;以前称为α-家族聚合酶的家族B DNA聚合酶(Braithwaite和Ito,1991,《核酸研究(Nuc.Acids Res.)》19:4045)包括(但不限于)人类α、δ和εDNA聚合酶,T4、RB69和噬菌体DNA聚合酶,和激烈火球菌(Pyrococcus furiosus)DNA聚合酶(Pfu聚合酶);并且家族C DNA聚合酶包括(但不限于)枯草杆菌(Bacillus subtilis)DNA聚合酶III和大肠杆菌DNA聚合酶IIIα和ε次单元(分别作为dnaE和dnaQ基因的产物列出,Braithwaite和Ito,1993,《核酸研究(Nucleic AcidsRes.)》21:787)。跨古细菌、细菌、病毒和真核生物体广谱的每一家族的DNA聚合酶蛋白质序列比对呈现在Braithwaite和Ito(1993,同前文献)中,其以全文引用的方式并入本文中。
当进行聚合酶依赖性核酸合成或扩增时,其可以适用于修饰聚合酶(例如经由突变或化学修饰)以改变其催化特性。在一些情况下,其可以适用于修饰聚合酶以增强其催化特性。在一些实施例中,其可以适用于经由定点氨基酸取代或缺失来增强聚合酶的催化特性。在一些实施例中,其可以适用于经由聚合酶的一个、多个或每一个氨基酸的位点饱和突变诱发来增强聚合酶的催化特性。在一些实施例中,可以进行聚合酶的修饰以增强经过修饰的聚合酶的催化特性,如读取长度、精确度和/或持续合成能力(processivity)。
聚合酶在涉及核酸合成或检测的各种生物学分析中的性能可能受到所述聚合酶对核苷酸底物、盐浓度或热稳定条件的行为限制。举例来说,聚合酶活性分析可能因以下非所期望行为而变得复杂:如给定聚合酶从模板解离;结合和/或并入不正确(例如非沃森-克里克(Watson-Crick)碱基配对)的核苷酸;或释放正确(例如沃森-克里克碱基配对)的核苷酸而非并入的倾向。另外,聚合酶活性分析可能因目标分子无法充分变性的非所期望行为而变得复杂:如在富含AT和GC的区中或目标分子的过早弱化。如本文所展现,改进的核酸扩增所期望的聚合酶特性可以经由对所选聚合酶的合适的选择、工程化和/或修饰来实现。举例来说,可以进行此类修饰以有利地改变聚合酶与模板结合的亲和力、持续合成能力、核苷酸并入的精确度、链偏差性和覆盖度。聚合酶内的此类改变也可以增加由利用此类经过修饰的聚合酶改进的扩增工作流直接获得或在其下游获得的序列信息量和/或测序信息品质。
在所属领域中仍需要改进的聚合酶组合物(以及相关方法、系统、设备和套组),所述聚合酶组合物展现改变的特性,例如增加的持续合成能力、增加的读取长度(包括无误差读取长度)、增加的精确度和/或对DNA模板的亲和力、增加的覆盖度、降低的链偏差性和/或减少的系统误差。此类聚合酶组合物(以及相关方法、系统、设备和套组)可以适用于涉及聚合酶依赖性核酸合成的多种分析中,包括核酸测序和/或核酸库产生,所述核酸库如通过桥式PCR或克隆扩增制备的核酸库。
发明内容
本发明在某些实施例中提供一种包括经过分离的多肽的组合物以及编码所述多肽的经过分离的核酸和载体,所述多肽具有至少50、75、100、150、175、200、250、300、350、400、500、600、700或800个连续氨基酸残基,所述氨基酸残基与以下序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%和99%一致性:SEQ ID NO:1或SEQ ID NO:34,或其生物活性片段,其中所述多肽展现聚合酶活性。在示例性实施例中,经过分离的多肽相对于SEQ ID NO:1和/或SEQ ID NO:34的参考聚合酶展现在一种或多种选自热稳定性和/或测序特性的特性中的改进,所述测序特性选自读取长度、精确度、链偏差性、系统误差和总测序通量。在某些实施例中,经过分离的多肽包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。在某些实施例中,测序特性通过在核酸测序反应的样品制备期间,在某些说明性实施例中在125mM KCl或125mM NaCl存在下,在乳液PCR模板扩增反应中使用经过分离的多肽来加以测定。在某些实施例中,如本文所例示,测序特性使用下一代(即大规模并行、高通量)测序工作流,如离子激流(Ion Torrent)(加利福尼亚州卡尔斯巴德的生命技术公司(Life Technologies,Carlsbad,CA))测序工作流来加以分析。在某些方面,在本文所提供的方法实施例中所用的经过分离的多肽以及经过修饰的聚合酶具有在95℃、96℃或97℃下持续2分钟、4分钟和在说明性实例中6分钟时改进的热稳定性,所述改进是与SEQ ID NO:1在95℃下持续相同时间段和温度时的热稳定性相比。在说明性实例中,热稳定性可以通过以下来加以测试:将所测试聚合酶和对照聚合酶在包括高温(例如95℃、96℃或97℃)的相同条件下在包括例如15mM Tris(pH 7.5)、100mMKCl、30%海藻糖(Trahalose)、0.1%NP40和50mM聚合酶的培育缓冲液中培育持续2分钟、4分钟和在说明性实例中6分钟。在于高温下培育之后,可以任选地将溶液放置在冰上,并且接着转移到酶反应混合物中,所述酶反应混合物包括15mM Tris(pH 7.5)、100mM KCl、8mMMgCl2、150nm寡聚物(Oligo)221和5nM来自热处理步骤的聚合酶反应混合物(10μl).寡聚物221是附接有荧光染料的发夹寡聚物(TTTTTTTGCAGGTGACAGGTTTTTCCTGTCACCXGC(SEQ IDNO:50),其中X是荧光素-dT残基)。在添加dATP后,寡聚物221延伸,引起荧光释放。因此,作为非限制性实例,热稳定性可以使用实例10中所提供的方法来加以测试,如在本文图14)中所概述。在某些说明性实施例中,经过分离的多肽具有在95℃下持续6分钟时改进的热稳定性,所述改进是与SEQ ID NO:1在95℃下持续6分钟时的热稳定性相比。在这些方面的某些说明性实施例中,热稳定的经过分离的多肽或其生物活性片段包括G418C或E397V。在又另外实施例中,除G418C以外或在特定方面中除E397V突变以外,经过分离的肽还进一步包括选自由E745T、L763F和E805I组成的群组的一个或多个氨基酸取代,其中编号是相对于SEQID NO:1。在某些方面,组合物包括用于热启动活化机制的试剂,如寡核苷酸和/或适体。在其它方面,对经过分离的多肽进行化学修饰以提供热启动机制。
在本发明的一个实施例中,由组合物中经过分离的多肽或其生物活性片段展现的一种或多种特性包括选自以下的至少两种、三种、四种、五种、六种或所有测序工作流特性:增加的AQ20平均读取长度读数、降低的链偏差性、增加的碱基覆盖度、增加的精确度、增加的测序通量(Mb)和增加的覆盖均匀性,其都相对于具有以下序列的参考聚合酶:SEQ IDNO:34和/或SEQ ID NO:1。在一些实施例中,经过分离的多肽或其生物活性片段,其中一个突变是E397V,另一个突变是P6N、E745T和/或L763F。在可以包括或可以不包括E397V的另一个实施例中,所述突变包括L763F和/或E805I、P6N和/或E295F、或E745T和/或E794C。
在本发明的另一个实施例中,当对由GC含量为65%的模板构成的库进行乳液PCR模板扩增反应时展现,或通过进行所述扩增反应来分析或测试组合物的一种或多种特性。在某些实施例中,参考聚合酶是SEQ ID NO:34,并且在某些特定说明性实施例中,参考聚合酶是SEQ ID NO:1。
在本发明组合物的一个实施例中,经过分离的多肽或其生物活性片段相对于具有SEQ ID NO:1序列的参考聚合酶包括选自A77E、A97V、K240I、L287T或K292C的突变,并且在此实施例的示例性方面,一种或多种特性包括使用高通量核酸测序反应分析的测序特性,其中所述多肽或其生物活性片段用以对由GC含量为65%的模板构成的库进行乳液PCR模板扩增反应。
在另一个实施例中,组合物的经过分离的多肽包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。应理解,在本发明的说明性实施例,包括有包括本文所提供经过分离的多肽或经过修饰的聚合酶的组合物和方法实施例中,可以分析所述经过分离的多肽或经过修饰的聚合酶以确定其是否具有某些特性、活性或特征,所述分析使用乳液PCR反应以使模板扩增作为测序工作流的一部分,例如在固体支撑物上使模板扩增,在一些说明性实施例中在固体支撑物上使模板克隆地扩增。接着测定经过扩增的模板的至少一部分的核酸序列。如本文所例示,说明性实施例中的此序列测定使用高通量测序平台,如离子激流PGM来进行。将此序列测定的结果与使用参考聚合酶,如Taq聚合酶(SEQ ID NO:1)或经过修饰的Taq聚合酶SEQ ID NO:34进行的类似实验的结果相比,所述参考聚合酶用于在高通量测序反应中的乳液PCR模板扩增步骤。在一个方面,用于经过分离的多肽或突变型聚合酶的测试包括对所测试聚合酶和参考聚合酶使用乳液PCR使核酸分子库扩增到核酸捕获支撑物(如Ion SphereTM粒子)上。在此实施例中,经过扩增的核酸分子可以接着加载到PGMTM 314测序芯片中,其可以接着加载到离子激流PGMTM测序系统中并加以测序。可以接着比较所测试聚合酶与参考聚合酶的测序结果。
在另一个实施例中,本文提供一种用于使核酸扩增的方法(以及相关套组、设备、系统和组合物),其包括使所述核酸与经过修饰的聚合酶或其生物活性片段在适合于使所述核酸扩增的条件下接触,和使所述核酸扩增,其中所述经过修饰的聚合酶或其生物活性片段与SEQ ID NO:1或SEQ ID NO:34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,展现聚合酶活性并且相对于SEQ ID NO:1和/或SEQ ID NO:34参考聚合酶展现在一种或多种选自热稳定性和/或测序特性的特性中的改进,所述测序特性选自读取长度、精确度、链偏差性、系统误差和总测序通量,并且其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。在某些特定实施例中,测序特性使用乳液PCR模板扩增反应来加以分析,在尤其说明性实施例中,所述扩增反应在核酸测序反应的样品制备期间包括125mM KCl或125mM NaCl。在某些实施例中,分析经过修饰的聚合酶的测序特性的测序反应是下一代(即大规模并行、高通量)测序工作流(例如,在离子激流系统(Ion Torrent System)、IlluminaHiSeq或True Seq或X-10系统中所用的工作流)的一部分。在一些实施例中,测序工作流使用基于ISFET的传感器。在某些实施例中,如本文所例示,测序特性使用离子激流(加利福尼亚州卡尔斯巴德的生命技术公司)测序工作流和系统来加以分析。在某些方面,在所述方法中所用的经过修饰的聚合酶具有在95℃下持续6分钟时改进的热稳定性,所述改进是与SEQID NO:1在95℃下持续6分钟时的热稳定性相比。在这些方面的某些说明性实施例中,在所述方法中所用的热稳定的经过修饰的聚合酶或其生物活性片段包括G418C或E397V。在又另外实施例中,除G418C以外或在特定方面中除E397V突变以外,经过分离的肽还进一步包括选自由E745T、L763F和E805I组成的群组的一个或多个氨基酸取代,其中编号是相对于SEQID NO:1。在某些方面,如PCR领域中已知的,所述方法包括热启动。在本发明中包括热启动的这些方法中,进行所述方法的组合物可以包括用于所述热启动的试剂,如寡核苷酸和/或适体,或可以对经过修饰的聚合酶进行化学修饰以提供热启动机制。
在本发明的一个实施例中,由在所述方法中所用的经过修饰的聚合酶或其生物活性片段展现的一种或多种特性包括选自以下的至少两种、三种、四种、五种、六种或所有测序工作流特性:增加的AQ20平均读取长度读数、降低的链偏差性、增加的碱基覆盖度、增加的精确度、增加的测序通量(Mb)和增加的覆盖均匀性,其都相对于具有以下序列的参考聚合酶:SEQ ID NO:34和/或SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段,其中一个突变是E397V,另一个突变是P6N、E745T和/或L763F。在可以包括或可以不包括E397V的另一个实施例中,所述突变包括L763F和/或E805I、P6N和/或E295F、或E745T和/或E794C。
在本发明的另一个实施例中,当对由GC含量为65%的模板构成的库进行乳液PCR模板扩增反应时展现,或可以通过进行所述扩增反应来确定组合物的一种或多种特性。为清楚起见,此类步骤不是本发明方法的一部分,而相反地是用于判定经过修饰的聚合酶是否符合在所述方法中所用的经过修饰的聚合酶的基准。在某些实施例中,用于聚合酶基准测试的参考聚合酶是SEQ ID NO:34,并且在某些特定说明性实施例中,参考聚合酶是SEQID NO:1。
在本发明方法的一个实施例中,在所述方法中所用的经过修饰的聚合酶或其生物活性片段相对于具有SEQ ID NO:1序列的参考聚合酶包括选自以下的突变:A77E、A97V、K240I、L287T或K292C。在此实施例的示例性方面,在所述方法中所用的经过修饰的多肽的一种或多种特性包括使用下一代(即大规模并行、高通量)核酸测序反应分析的测序特性,其中所述经过修饰的聚合酶或其生物活性片段的此类特性使用对由GC含量为65%的模板构成的库进行的乳液PCR模板扩增反应来加以测试。
在某些实施例中,在所述方法中所用的聚合酶包含SEQ ID NO:1或SEQ ID NO:34的50、75、100、150、175、200、250、300、350、400、500、600、700或800个连续氨基酸残基,并且与以下序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%一致性:SEQ ID NO:1或SEQ ID NO:34,或其生物活性片段,在某些实施例中,在所述方法中所用的经过修饰的聚合酶包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在用于使核酸扩增的方法的一些实施例中,适合于进行扩增的条件是适合于进行以下反应的条件:聚合酶链反应、等温扩增反应、重组酶聚合酶扩增反应、邻位连接扩增、滚环扩增、链置换扩增或乳液聚合酶链反应。因此,在这些实施例中,用于使核酸扩增的方法是上文所列用于扩增的方法中的一种。
在又另一个实施例中,用于使核酸扩增的方法包括在溶液中或在固体支撑物上使核酸克隆地扩增。在所述方法的另一个实施例中包括测定核酸的至少一部分的核酸序列。在一些实施例中,核酸序列可以使用任何下一代(即大规模并行、高通量)测序平台(例如离子激流系统、Illumina HiSeq或True Seq或X-10系统)来加以测定。在一些实施例中,核酸序列可以使用任何基于ISFET的测序系统来加以测定。
在所述方法的另一个实施例中,核酸包含至少65%GC含量或至少65%AT含量。
本发明的另一个实施例是一种用于进行核酸聚合反应的方法,其包括使经过修饰的聚合酶或其生物活性片段在适合于聚合反应的条件下在一种或多种核苷酸三磷酸酯存在下与核酸模板接触,其中所述经过修饰的聚合酶或其生物活性片段与SEQ ID NO:1或SEQID NO:34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,展现聚合酶活性并且相对于SEQ ID NO:1和/或SEQ ID NO:34参考聚合酶展现在一种或多种选自热稳定性和/或测序特性的特性中的改进,所述测序特性选自读取长度、精确度、链偏差性、系统误差和总测序通量,并且其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。为了分析本发明方法的经过修饰的聚合酶的测序特性,可以使用乳液PCR模板扩增反应,并且在特定实施例中,在样品制备(后接核酸测序反应)时,使用包括125mM KCl或125mM NaCl的条件。为清楚起见,上文所叙述的乳液PCR模板扩增反应和核酸序列反应不是本发明此实施例的方法的步骤。相反地,其是可以用于判定聚合酶是否是在本发明所叙述方法实施例中所用的经过修饰的聚合酶的方法的一部分。
在某些实施例中,分析经过修饰的聚合酶的测序特性的测序工作流是下一代(即大规模并行、高通量)测序工作流(例如,在离子激流系统、Illumina HiSeq或True Seq或X-10系统中所用的工作流)。在一些实施例中,测序工作流使用基于ISFET的测序系统工作流。在某些实施例中,如本文所例示,测序特性使用离子激流(加利福尼亚州卡尔斯巴德的生命技术公司)测序工作流和系统来加以分析。在某些方面,在所述方法中所用的经过修饰的聚合酶具有在95℃下持续6分钟时改进的热稳定性,所述改进是与SEQ ID NO:1在95℃下持续6分钟时的热稳定性相比。在这些方面的某些说明性实施例中,在所述方法中所用的热稳定的经过修饰的聚合酶或其生物活性片段包括G418C或E397V。在又另外实施例中,除G418C以外或在特定方面中除E397V突变以外,经过分离的肽还进一步包括选自由E745T、L763F和E805I组成的群组的一个或多个氨基酸取代,其中编号是相对于SEQ ID NO:1。在某些方面,如PCR领域中已知的,所述方法包括热启动。在本发明中包括热启动的这些方法中,进行所述方法的组合物可以包括用于所述热启动的试剂,如寡核苷酸和/或适体,或可以对经过修饰的聚合酶进行化学修饰以提供热启动机制。
在本发明的一个实施例中,由在所述方法中所用的经过修饰的聚合酶或其生物活性片段展现的一种或多种特性包括选自以下的至少两种、三种、四种、五种、六种或所有测序工作流特性:增加的AQ20平均读取长度读数、降低的链偏差性、增加的碱基覆盖度、增加的精确度、增加的测序通量(Mb)和增加的覆盖均匀性,其都相对于具有以下序列的参考聚合酶:SEQ ID NO:34和/或SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段,其中一个突变是E397V,另一个突变是P6N、E745T和/或L763F。在可以包括或可以不包括E397V的另一个实施例中,所述突变包括L763F和/或E805I、P6N和/或E295F、或E745T和/或E794C。
在本发明的另一个实施例中,当对由GC含量为65%的模板构成的库进行乳液PCR模板扩增反应时展现,或可以通过进行所述扩增反应来确定组合物的一种或多种特性。为清楚起见,此类步骤不是本发明方法的一部分,而相反地是用于判定经过修饰的聚合酶是否符合在所述方法中所用的经过修饰的聚合酶的基准。在某些实施例中,用于聚合酶基准测试的参考聚合酶是SEQ ID NO:34,并且在某些特定说明性实施例中,参考聚合酶是SEQID NO:1。
在本发明方法的一个实施例中,在所述方法中所用的经过修饰的聚合酶或其生物活性片段相对于具有SEQ ID NO:1序列的参考聚合酶包括选自以下的突变:A77E、A97V、K240I、L287T或K292C。在此实施例的示例性方面,在所述方法中所用的经过修饰的多肽的一种或多种特性包括使用下一代(高通量)核酸测序反应分析的测序特性,其中所述经过修饰的聚合酶或其生物活性片段的此类特性使用对由GC含量为65%的模板构成的库进行的乳液PCR模板扩增反应来加以测试。
在某些实施例中,在所述方法中所用的聚合酶包含SEQ ID NO:1或SEQ ID NO:34的50、75、100、150、175、200、250、300、350、400、500、600、700或800个连续氨基酸残基,并且与以下序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%一致性:SEQ ID NO:1或SEQ ID NO:34,或其生物活性片段,在某些实施例中,在所述方法中所用的经过修饰的聚合酶包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在本发明的又另一个实施例中,本文提供一种用于从核酸模板获得序列信息的方法,其包括:提供反应混合物,所述反应混合物包括与测序引物杂交并与经过修饰的聚合酶或其生物活性片段结合的所述核酸模板;使所述模板核酸与至少一种类型的核苷酸三磷酸酯接触,其中所述接触包括将来自至少一种类型的核苷酸的一个或多个核苷酸并入到所述测序引物的3'端,并且产生延伸引物产物;检测所述延伸引物产物在所述反应混合物中的存在,从而判定是否已经发生核苷酸并入;以及鉴别由至少一种类型的核苷酸三磷酸酯并入的一种或多种核苷酸中的至少一种,其中所述经过修饰的聚合酶或其生物活性片段与SEQ ID NO:1或SEQ ID NO:34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,展现聚合酶活性并且相对于SEQ ID NO:1和/或SEQ ID NO:34参考聚合酶展现在一种或多种选自热稳定性和/或测序工作流特性的特性中的改进,所述测序特性选自读取长度、精确度、链偏差性、系统误差和总测序通量,并且其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。经过修饰的聚合酶或其生物活性片段的测序工作流特性可以使用乳液PCR模板扩增反应来加以分析,举例来说,所述扩增反应在核酸测序反应的样品制备期间包括125mM KCl或125mM NaCl。在某些实施例中,所述方法是下一代测序方法。在一些实施例中,所述方法使用ISFET检测系统。
在某些方面,在所述方法中所用的经过修饰的聚合酶具有在95℃下持续6分钟时改进的热稳定性,所述改进是与SEQ ID NO:1在95℃下持续6分钟时的热稳定性相比。在这些方面的某些说明性实施例中,在所述方法中所用的热稳定的经过修饰的聚合酶或其生物活性片段包括G418C或E397V。在又另外实施例中,除G418C以外或在特定方面中除E397V突变以外,经过分离的肽还进一步包括选自由E745T、L763F和E805I组成的群组的一个或多个氨基酸取代,其中编号是相对于SEQ ID NO:1。
在本发明的一个实施例中,由在所述方法中所用的经过修饰的聚合酶或其生物活性片段展现的一种或多种特性包括选自以下的至少两种、三种、四种、五种、六种或所有测序工作流特性:增加的AQ20平均读取长度读数、降低的链偏差性、增加的碱基覆盖度、增加的精确度、增加的测序通量(Mb)和增加的覆盖均匀性,其都相对于具有以下序列的参考聚合酶:SEQ ID NO:34和/或SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段,其中一个突变是E397V,另一个突变是P6N、E745T和/或L763F。在可以包括或可以不包括E397V的另一个实施例中,所述突变包括L763F和/或E805I、P6N和/或E295F、或E745T和/或E794C。
在本发明方法的一个实施例中,在所述方法中所用的经过修饰的聚合酶或其生物活性片段相对于具有SEQ ID NO:1序列的参考聚合酶包括选自以下的突变:A77E、A97V、K240I、L287T或K292C。在此实施例的示例性方面,在所述方法中所用的经过修饰的多肽的一种或多种特性包括使用下一代(高通量)核酸测序反应分析的测序特性,其中所述经过修饰的聚合酶或其生物活性片段的此类特性使用对由GC含量为65%的模板构成的库进行的乳液PCR模板扩增反应来加以测试。
在某些实施例中,在所述方法中所用的聚合酶包含SEQ ID NO:1或SEQ ID NO:34的50、75、100、150、175、200、250、300、350、400、500、600、700或800个连续氨基酸残基,并且与以下序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%和99%一致性:SEQ ID NO:1或SEQ ID NO:34,或其生物活性片段,在某些实施例中,在所述方法中所用的经过修饰的聚合酶包括SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在所述方法的另外方面中,重复接触、检测和鉴别步骤超过一次,从而鉴别多个连续核苷酸并入,其中并入核苷酸中的至少一个。在某些方面,是可逆终止核苷酸。
在另一个实施例中,本文提供一种具有两个或更多个容器的套组,其中一个容器包括用于进行核酸聚合反应的组分,并且另一个容器包含经过修饰的聚合酶或其生物活性片段,所述经过修饰的聚合酶或其生物活性片段与SEQ ID NO:1或SEQ ID NO:34具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,展现聚合酶活性并且相对于SEQ ID NO:1和/或Seq ID NO:34参考聚合酶展现在一种或多种选自热稳定性和/或测序工作流特性的特性中的改进,所述测序特性选自读取长度、精确度、链偏差性、系统误差和总测序通量,并且其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。特性可以使用乳液PCR模板扩增反应来加以测量,在某些说明性实施例中,所述扩增反应在核酸测序反应(如高通量或下一代序列反应)的样品制备期间在125mM KCl或125mM,存在下进行。
在本发明的另外实施例中,套组包括核苷酸三磷酸酯、MgCl2和/或用于核酸聚合反应的缓冲液。套组可以进一步包括用于热启动机制的试剂。在又另一个实施例中,套组包括用于形成乳液的组分。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰,并且其中所述经过修饰的聚合酶或其生物活性片段具有与参考聚合酶相比改进的精确度、覆盖度和/或持续合成能力;以及使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰,并且其中所述经过修饰的聚合酶或其生物活性片段具有相对于参考聚合酶增加的热稳定性;以及使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。在一些实施例中,所述方法包括在高离子强度溶液存在下使用经过修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,高离子强度溶液可以包括超过100mM KCl的溶液。在一些实施例中,高离子强度溶液包括至少120mM KCl的溶液。在一些实施例中,高离子强度溶液包括125mM到200mM KCl的溶液。
在一些实施例中,所述方法可以进一步包括使至少一种核苷酸中的一种以模板依赖性方式聚合。在一些实施例中,聚合在热循环条件下进行。在一些实施例中,所述方法可以进一步包括在接触之前、期间或之后使引物与核酸模板杂交,并且其中所述聚合包括使用经过修饰的聚合酶或其生物活性片段使至少一种核苷酸中的一种聚合到所述引物的末端上。在一些实施例中,聚合在能够检测到至少一种核苷酸通过经过修饰的聚合酶或其生物活性片段而聚合的传感器附近进行。在一些实施例中,所述方法可以进一步包括使用传感器来检测指示至少一种核苷酸通过经过修饰的聚合酶或其生物活性片段而聚合的信号。在一些实施例中,传感器是ISFET。在一些实施例中,传感器可以包括聚合反应内的可检测标记或可检测试剂。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ IDNO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ IDNO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ IDNO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ IDNO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ IDNO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQID NO:3或SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ IDNO:2、SEQ ID NO:3或SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ IDNO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ IDNO:3或SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,本发明大体上涉及用于进行核酸扩增的方法(以及相关套组、设备、系统和组合物),其包含或其组成为产生具有经过修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰并且具有相对于参考聚合酶改进的热稳定性;以及使所述扩增反应混合物经受扩增条件,其中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合到所述引物的末端上。在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少99%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及用于进行核酸扩增的方法(以及相关套组、设备、系统和组合物),其包含或其组成为产生具有经过修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰并且具有相对于参考聚合酶改进的精确度;以及使所述扩增反应混合物经受扩增条件,其中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合到所述引物的末端上。在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,所述方法进一步包括测定通过经过修饰的聚合酶聚合的一种或多种核苷酸的一致性。在一些实施例中,所述方法进一步包括测定通过经过修饰的聚合酶聚合的核苷酸的编号。在一些实施例中,鉴别出通过经过修饰的聚合酶聚合的一种或多种核苷酸的至少50%。在一些实施例中,鉴别出基本上所有通过经过修饰的聚合酶聚合的一种或多种核苷酸。在一些实施例中,聚合在高离子强度溶液存在下发生。在一些实施例中,高离子强度溶液包含125mM到200mM盐。在一些实施例中,聚合在至少120mM盐的离子强度溶液存在下发生。在一些实施例中,高离子强度溶液包含KCl和/或NaCl。
在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少99%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段进一步包含聚合酶DNA结合域的至少25个连续氨基酸。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含聚合酶DNA结合域的至少50个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域的至少100个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域的至少100个连续氨基酸残基,同时还与以下序列具有至少90%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域中与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述方法(以及相关套组、系统、设备和组合物)包括具有高离子强度溶液的扩增条件。在一个实施例中,高离子强度溶液是具有至少120mM KCl的溶液。在一些实施例中,高离子强度溶液包括125mM到200mM KCl的溶液。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),所述方法包含或其组成为将经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板混合,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰(所述参考聚合酶如SEQ ID NO:1或SEQ ID NO:34;和在混合物中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。在一些实施例中,经过修饰的聚合酶或其生物活性片段具有增加的精确度,如通过在高离子强度溶液存在下测量增加的精确度所确定。在一些实施例中,高离子强度溶液是指具有至少120mM KCl的用于进行核苷酸聚合的反应混合物。在一些实施例中,高离子强度溶液包括125mM到200mM KCl的溶液。
在一些实施例中,所述方法(以及相关套组、设备、系统和组合物)包含经过修饰的聚合酶或其生物活性片段,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。
在一些实施例中,本发明大体上涉及用于检测核苷酸并入的方法(以及相关套组、系统、设备和组合物),所述方法包含或其组成为使用经过修饰的聚合酶或其生物活性片段、核酸模板和一种或多种核苷酸三磷酸酯来进行核苷酸并入反应,所述经过修饰的聚合酶或其生物活性片段与以下序列具有至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;产生所述核苷酸并入;以及检测所述核苷酸并入。检测核苷酸并入可以经由任何适当手段进行,如PAGE、荧光、dPCR量化、核苷酸副产物产生(例如氢离子或焦磷酸根检测;合适的核苷酸副产物检测系统包括(但不限于)下一代测序平台,如Rain Dance、Roche 454和离子激流系统))或核苷酸延伸产物检测(例如延伸产物的光学检测或经过标记的核苷酸延伸产物的检测)。在一些实施例中,所述用于检测核苷酸并入的方法(以及相关套组、系统、设备和组合物)包括或其组成为使用经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少95%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。在一些实施例中,所述检测核苷酸并入的方法包括或其组成为使用经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少98%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述检测核苷酸并入的方法包括或其组成为通过经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少99%一致性:SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33。在一些实施例中,所述方法进一步包含测定核苷酸并入中一种或多种核苷酸的一致性。在一些实施例中,核苷酸并入的副产物是氢离子。在一些实施例中,核苷酸并入的副产物是焦磷酸根。在一些实施例中,核苷酸并入的副产物是经过标记的核苷酸延伸产物。在一些实施例中,检测核苷酸并入的方法包括在乳液PCR或桥式PCR条件下产生核苷酸并入。
在一些实施例中,本发明大体上涉及用于检测核苷酸聚合反应期间离子浓度变化的方法(以及相关套组、系统、设备和组合物),其包含或其组成为在待于第一核苷酸聚合反应期间并入的一种或多种核苷酸存在下对核酸模板或核酸库进行第一核苷酸聚合反应,其中所述第一核苷酸聚合反应包括与以下序列具有至少80%一致性的经过修饰的聚合酶或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和进行第二核苷酸聚合反应,其中所述第二核苷酸聚合反应检测第二核苷酸聚合反应时程期间至少一种类型的离子浓度变化并且提供指示至少一种类型离子的离子浓度变化的信号。在一些实施例中,离子是氢离子。在一些实施例中,离子是焦磷酸根离子。在一些实施例中,指示离子浓度变化的信号是聚合反应中氢离子产生的相对增加。在一些实施例中,至少一种类型的离子浓度变化的检测使用ISFET来加以监测。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少90%一致性的聚合酶的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少95%一致性的聚合酶的至少200个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少98%一致性的聚合酶的至少250个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少99%一致性的聚合酶:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及用于使核酸扩增的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使核酸与包含与以下序列的至少80%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,扩增使用聚合酶链反应、乳液聚合酶链反应、等温扩增反应、重组酶聚合酶扩增反应、邻位连接扩增、滚环扩增或链置换扩增来进行。在一些实施例中,扩增包括在溶液中使核酸克隆地扩增。在一些实施例中,扩增包括在固体支撑物上使核酸克隆地扩增,所述固体支撑物如核酸珠粒、流动池、核酸阵列或存在于固体支撑物表面上的孔。在一些实施例中,扩增使用包含热稳定DNA聚合酶的聚合酶或生物活性片段来进行。在一些实施例中,聚合酶或生物活性片段包含具有与参考聚合酶相比改进的热稳定性的DNA聚合酶,所述参考聚合酶如SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,聚合酶或生物活性片段包含具有与参考聚合酶相比改进的精确度的DNA聚合酶,所述参考聚合酶如SEQID NO:1或SEQ ID NO:34。
在一些实施例中,所述用于使核酸扩增的方法(以及相关套组、系统、设备和组合物)包含使核酸与包含以下序列的至少90%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,聚合酶或生物活性片段包含具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的DNA聚合酶:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少95%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少98%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少99%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,平均读取长度通过以下来加以确定:跨所有读数来分析使用本文所提供的经过修饰的聚合酶中的一种或多种而获得的经过扩增的核酸的读取长度,以确立平均读取长度,和将所述平均读取长度与使用参考聚合酶而获得的平均读取长度相比较。
在一些实施例中,本发明大体上涉及用于使核酸扩增的方法,其包含或其组成为使核酸与包含与以下序列的至少80%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,扩增通过具有与参考样品相比改进的模板化效率的聚合酶或生物活性片段来进行,所述参考样品如SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,用于使核酸扩增的方法包含在乳液PCR条件下使核酸扩增。在一些实施例中,用于使核酸扩增的方法包含在桥式PCR条件下使核酸扩增。在一些实施例中,桥式PCR条件包括使经过扩增的核酸中的一种或多种与固体支撑物杂交。在一些实施例中,经过杂化的一种或多种经过扩增的核酸可以用作用于进一步扩增的模板。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含衍生自水生栖热菌DNA聚合酶(Taq)的聚合酶SEQ ID NO:1是水生栖热菌(Taq)DNA聚合酶的全长野生型核酸序列。在一些实施例中,Taq DNA聚合酶可以在本文所描述的方法、套组、设备、系统和组合物中用作参考聚合酶。
在一些实施例中,本发明大体上涉及用于合成核酸的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使用经过修饰的聚合酶或其生物活性片段将至少一种核苷酸并入到引物的末端上,所述经过修饰的聚合酶或其生物活性片段与以下序列具有至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。任选地,所述方法进一步包含检测至少一种核苷酸向引物末端上的并入。在一些实施例中,所述方法进一步包括测定并入到引物末端上的至少一种核苷酸中的至少一种的一致性。在一些实施例中,所述方法可以包括测定并入到引物末端上的所有核苷酸的一致性。在一些实施例中,所述方法包括以模板依赖性方式合成核酸。在一些实施例中,所述方法可以包括在溶液中、在固体支撑物上或在乳液(如emPCR)中合成核酸。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少97%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少99%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为SEQ ID NO:2。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少97%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少99%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为SEQ ID NO:3。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:3,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:3,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:3,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:3,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为SEQ ID NO:4。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:4,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:4,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少95%一致性:SEQ ID NO:4,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少98%一致性:SEQ ID NO:4,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18,SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:5,并且具有选自由以下组成的群组的一个或多个氨基酸突变:A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:6,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:7,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:8,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:9,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:10,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:11,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:12,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:13,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:14,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:15,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:16,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:17,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:18,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:19,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:20,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:21,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:22,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:23,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:24,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:25,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:26,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:27,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:28,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:29,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:30,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:31,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:32,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:33,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C和E805I。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少80%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少90%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少95%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少98%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少99%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸序列的组合物,所述核酸序列包含或其组成为编码与以下序列具有至少90%一致性的多肽的核酸序列:SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸序列的组合物,所述核酸序列包含或其组成为编码与以下序列具有至少90%一致性的多肽的核酸序列:SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33,并且进一步包含选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种包含经过分离的核序列的载体,所述核序列编码选自由以下组成的群组的多肽或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。在一些实施例中,包含编码多肽或其生物活性片段的经过分离的核酸序列的载体包括DNA聚合酶。在一些实施例中,DNA聚合酶是水生栖热菌(Taq)聚合酶。在一些实施例中,DNA聚合酶是热稳定的DNA聚合酶。在一些实施例中,DNA聚合酶衍生自热稳定的水生栖热菌(Taq)聚合酶。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少80%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少95%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少98%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸的组合物,所述核酸与以下序列具有至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是特异性针对于以下氨基酸残基:SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸的组合物,所述核酸与以下序列具有至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基:SEQ ID NO:1。
在一些实施例中,组合物包含与以下序列的至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是特异性针对于以下氨基酸残基:SEQ ID NO:1。
在一些实施例中,组合物包含与以下序列的至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基:SEQ ID NO:1。
在一些实施例中,组合物包含或其组成为SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,组合物包含与以下序列的至少85%、90%、95%、98%或99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基:SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的套组,所述多肽与以下序列具有至少80%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述套组包含与以下序列具有至少90%、95%、96%、97%、98%或99%一致性的经过分离的多肽:SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33。
在一些实施例中,所述套组包含选自由以下组成的群组的经过分离的多肽:SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33。
在一些实施例中,所述套组包含经过分离的多肽,所述多肽包含或其组成为与以下序列具有至少90%一致性的至少250个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,所述套组包含经过分离的多肽,所述多肽包含或其组成为与以下序列具有至少95%一致性的至少450个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,所述套组包含经过分离的多肽,所述多肽包含或其组成为与以下序列具有至少98%一致性的至少650个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述套组进一步包含dNTP,一种或多种缓冲液和/或MgCl。
在一些实施例中,本发明大体上涉及具有DNA聚合酶活性并且与以下序列具有至少80%一致性的聚合酶或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33,其中具有DNA聚合酶活性的聚合酶或生物活性片段包括至少一个与以下序列相比的氨基酸取代:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,至少一个与以下序列相比的氨基酸取代:SEQ ID NO:1或SEQ IDNO:34,可以向聚合酶或其生物活性片段赋予有益特性。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34相比)包括改进的热稳定性、改进的读取长度、改进的模板化效率、在高离子强度溶液中改进的性能或改进的精确度。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34相比)包括富含GC和AT的核酸的链偏差性降低。一般应理解,向聚合酶或生物学片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34的特性相比)可以通过在相同条件下评定和/或测量此类特性(例如,将SEQ ID NO:1的特性针对聚合酶或其生物活性片段在相同条件下相比较)来加以确定。举例来说,DNA聚合酶的精确度可以关于获自核苷酸聚合反应的最长完美读数来加以测量(典型地关于正确地包括于读数中的核苷酸数目来加以测量)。在一些实施例中,核苷酸聚合反应可以使用乳液PCR、桥式PCR或热启动PCR条件来进行。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性中的一种或多种可以通过评定测序精确度来加以确定。在一些实施例中,测序精确度可以使用任何下一代测序平台(例如离子激流系统、Illumina HiSeq或True Seq或X-10系统)来加以测定。在一些实施例中,测序精确度可以使用任何基于ISFET的测序系统来加以测定。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为以下序列中保留聚合酶活性的片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,聚合酶活性(在本文中也称为聚合酶特性或聚合酶特征)选自引物延伸活性、链置换活性、校正活性、切口起始聚合酶活性、逆转录酶活性精确度、平均读取长度、热稳定性、持续合成能力、链偏差性或核苷酸聚合活性。在一些实施例中,聚合酶活性选自一种或多种基于测序的度量值,其是选自原始读取精确度、平均读取长度、热稳定性或持续合成能力。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为以下序列中具有聚合酶活性的生物活性片段:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,所述聚合酶活性选自在相同条件下与以下序列的聚合酶活性相比改进的读取长度、改进的精确度或改进的热稳定性:SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,在高离子强度溶液存在下测定聚合酶活性。在一些实施例中,高离子强度溶液是至少120mMKcl。在一些实施例中,高离子强度溶液是125mM KCl到200mM KCl。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:A97、K240、L287和K292,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:A97V、K240I、L287T和K292C,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397V氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含L763氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含L763F氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805I氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E745氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E745T氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397V氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含L763氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含L763F氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805I氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E745氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E745T氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:1同源的重组聚合酶或其生物活性片段,其与以下序列具有至少90%一致性:SEQ ID NO:1,其中所述重组聚合酶包含相对于SEQ ID NO:1的突变或突变组合,其选自P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I或L828A。在一些实施例中,与SEQ ID NO:1同源的重组聚合酶或其生物活性片段包括来自除水生栖热菌(Taq)以外物种的热稳定DNA聚合酶。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:34同源的重组聚合酶或其生物活性片段,其与以下序列具有至少90%一致性:SEQ ID NO:34,其中所述重组聚合酶包含相对于SEQ ID NO:34的突变或突变组合,其选自P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I或L828A。在一些实施例中,与SEQ ID NO:34同源的重组聚合酶或其生物活性片段包括来自除水生栖热菌(Taq)以外物种的热稳定DNA聚合酶。在一些实施例中,与SEQ ID NO:1或SEQ ID NO:34同源的重组聚合酶包括选自由以下组成的群组的热稳定聚合酶:Klentaq-235DNA聚合酶、Klentaq-278DNA聚合酶、斯托菲尔(Stoffel)片段、Klentaq-291DNA聚合酶、激烈火球菌DNA聚合酶、火球菌GB-D DNA聚合酶、黄栖热菌(Thermus flavus)DNA聚合酶、嗜热栖热菌(Thermus thermophilus)DNA聚合酶、海滨热球菌(Thermococcus literalis)DNA聚合酶和其组合。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:34同源的重组聚合酶或其生物活性片段,其与以下序列具有至少80%一致性:SEQ ID NO:34或其生物活性片段,并且其中所述重组聚合酶包含E397突变。在一些实施例中,与SEQ ID NO:34同源的重组聚合酶包含与缺乏相对应突变的参考聚合酶相比增加持续合成能力、增加精确度、增加平均读取长度或改进热稳定性的突变。在一些实施例中,增加的持续合成能力、增加的精确度、增加的平均读取长度或改进的热稳定性使用ISFET来加以测量。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是个人基因组机器或质子测序仪(加利福尼亚州的生命技术公司)。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:34同源的重组聚合酶或其生物活性片段,其与以下序列具有至少80%一致性:SEQ ID NO:34或其生物活性片段,并且其中所述重组聚合酶包含相对于SEQ ID NO:34的突变或突变组合,其选自E397V,并且其中所述聚合酶进一步包括以下中一个或多个处的突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:34同源的重组聚合酶或其生物活性片段,其与以下序列具有至少80%一致性:SEQ ID NO:34或其生物活性片段,并且其中所述重组聚合酶包含相对于SEQ ID NO:34的突变或突变组合,其选自E397V、L763F、E805I和E745T,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种组合物,其包含与SEQ ID NO:34同源的重组聚合酶或其生物活性片段,其与以下序列具有至少80%一致性:SEQ ID NO:34或其生物活性片段,并且其中所述重组聚合酶包含相对于SEQ ID NO:34的突变或突变组合,其选自E397V、L763F、E805I和E745T,并且其中所述聚合酶进一步包括以下中一个或多个处的突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、E713W、V737A、E790G、E794C和L828A,其中编号是相对于SEQ ID NO:34。
在一些实施例中,与SEQ ID NO:1或SEQ ID NO:34同源的重组聚合酶或其生物活性片段包含与参考聚合酶相比增加的精确度,所述参考聚合酶缺乏相对于SEQ ID NO:1或SEQ ID NO:34的突变或突变组合;或包含与参考聚合酶相比增加的读取长度,所述参考聚合酶缺乏相对于SEQ ID NO:1或SEQ ID NO:34的突变或突变组合;或包含与参考聚合酶相比增加的总测序通量,所述参考聚合酶缺乏相对于与SEQ ID NO:1或SEQ ID NO:34同源的重组聚合酶的突变或突变组合;或包含与参考聚合酶相比降低的链偏差性,所述参考聚合酶缺乏相对于SEQ ID NO:1或SEQ ID NO 34的突变或突变组合。在一些实施例中,增加的精确度、增加的读取长度、增加的测序通量或降低的链偏差性使用ISFET来加以测量。在一些实施例中,ISFET耦合到基于半导体的测序平台。在一些实施例中,基于半导体的测序平台是可购自生命技术公司(CA)的个人基因组机器或质子测序仪。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含GC的基因组的测序覆盖度,其中所述富含GC的基因组富含GC的程度达到至少60%、65%、70%、75%、80%、85%或更大。在一些实施例中,富含GC的基因组来源于或获自富含GC的生物体,例如细菌基因组,如红球菌属(Rhodococcus)等。在一些实施例中,聚合酶或其生物活性片段改进富含GC的基因组的测序,以使得在核酸测序后,数据包括每千兆字节(gigabyte)核酸测序数据少于100个核酸间隙。在一些实施例中,与以下序列具有至少80%一致性的聚合酶或其生物活性片段:SEQ IDNO:1或SEQ ID NO:34,进一步包括相对于SEQ ID NO:1或SEQ ID No:34。在一些实施例中,相对于SEQ ID NO:1或SEQ ID No:34的一个或多个氨基酸取代选自由以下组成的群组:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805或L828,其中编号是相对于SEQ ID NO:1。对所属领域的一般技术人员将显而易见的是,测定GC含量的任何适当方法都被视为足够的。举例来说,GC含量可以通过使用分光光度法测定DNA双螺旋的熔融温度来加以测量。当分开双链DNA以形成两个单链时,DNA在260nm处的吸收显著地增加。测定GC含量的其它合适方法包括使用单GC计算器来计算预期熔融温度或在大量样品时使用流式细胞测量术测定GC比率。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含GC的基因组的测序覆盖度,其中所述富含GC的基因组富含GC的程度达到至少60%、65%、70%、75%、80%、85%或更大。在一些实施例中,聚合酶或其生物活性片段改进富含GC的基因组的测序,以使得在核酸测序后,数据包括每千兆字节核酸测序数据少于50个核酸间隙。在一些实施例中,与以下序列具有至少80%一致性的聚合酶或其生物活性片段:SEQ ID NO:1或SEQ ID NO:34,进一步包括相对于SEQ ID NO:1或SEQ ID No:34。在一些实施例中,相对于SEQ ID NO:1或SEQ ID No:34的一个或多个氨基酸取代选自由以下组成的群组:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805或L828,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含GC的基因组的测序覆盖度,其中所述富含GC的基因组富含GC的程度达到至少60%、65%、70%、75%、80%、85%或更大。在一些实施例中,聚合酶或其生物活性片段改进富含GC的基因组的测序,以使得在核酸测序后,数据包括每千兆字节核酸测序数据少于20个核酸间隙。在一些实施例中,与以下序列具有至少80%一致性的聚合酶或其生物活性片段:SEQ ID NO:1或SEQ ID NO:34,进一步包括相对于SEQ ID NO:1或SEQ ID No:34。在一些实施例中,相对于SEQ ID NO:1或SEQ ID No:34的一个或多个氨基酸取代选自由以下组成的群组:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805或L828,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含AT的基因组的测序覆盖度,其中所述富含AT的基因组富含AT的程度达到至少60%、65%、70%、75%、80%或更大。在一些实施例中,聚合酶或其生物活性片段改进富含AT的基因组的测序,以使得在核酸测序后,数据包括每千兆字节核酸测序数据少于100个核酸间隙。在一些实施例中,与以下序列具有至少80%一致性的聚合酶或其生物活性片段:SEQ ID NO:1或SEQ ID NO:34,进一步包括相对于SEQID NO:1或SEQ ID No:34。在一些实施例中,相对于SEQ ID NO:1或SEQ ID No:34的一个或多个氨基酸取代选自由以下组成的群组:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805或L828,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含AT的基因组的测序覆盖度,其中所述富含AT的基因组富含AT的程度达到至少60%、70%、75%或80%。在一些实施例中,聚合酶或其生物活性片段改进富含AT的基因组的测序,以使得在核酸测序后,数据包括每千兆字节核酸测序数据少于50个核酸间隙。
在一些实施例中,本发明大体上涉及一种包含聚合酶或其生物活性片段的组合物,所述聚合酶或其生物活性片段与以下序列具有至少80%一致性:SEQ ID NO:1或SEQ IDNO:34,其中所述聚合酶或其生物活性片段改进富含AT的基因组的测序覆盖度,其中所述富含AT的基因组富含AT的程度达到至少60%、70%、75%或80%。在一些实施例中,聚合酶或其生物活性片段改进富含AT的基因组的测序,以使得在核酸测序后,数据包括每千兆字节核酸测序数据少于20个核酸间隙。
在一些实施例中,本发明大体上涉及一种用于进行核酸扩增的方法,其包含或其组成为使经过修饰的聚合酶在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶包括相对于SEQ ID NO:1或SEQ ID NO:34的一个或多个氨基酸取代并且具有相对于SEQ ID NO:1或SEQ ID NO:34增加的精确度;和使用所述经过修饰的聚合酶来使所述一种或多种核苷酸中的至少一种聚合。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少80%一致性的至少150个连续氨基酸残基:SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种用于由核酸模板获得序列信息的方法,其包含提供反应混合物,所述反应混合物包括与测序引物杂交并与经过修饰的聚合酶结合的所述核酸模板;使所述模板核酸与至少一种类型的核苷酸三磷酸酯接触,其中所述接触包括将来自至少一种类型的核苷酸的一个或多个核苷酸并入到所述测序引物的3'端,并且产生延伸引物产物;检测所述延伸引物产物在所述反应混合物中的存在,从而判定是否已经发生核苷酸并入;以及鉴别由至少一种类型的核苷酸并入的一种或多种核苷酸中的至少一种。在一些实施例中,所述方法包括一种经过修饰的聚合酶,其包含与以下序列具有至少80%一致性的经过分离的多肽:SEQ ID NO:1和/或SEQ ID NO:34,其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805或L828,其中编号是相对于SEQ ID NO:1。在一些实施例中,所述方法可以包括经过修饰的聚合酶,其包含与以下序列具有至少80%一致性的经过分离的多肽:SEQ ID NO:1和/或SEQ ID NO:34,其中所述经过修饰的聚合酶包括选自由以下组成的群组的一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I或L828A,其中编号是相对于SEQ ID NO:1。在一些实施例中,所述方法可以包括重复超过一次的接触、检测和鉴别步骤,从而鉴别多个依序核苷酸并入。在一些实施例中,所述方法可以包括并入一种或多种可逆终止子和/或核苷酸类似物。在一些实施例中,所述方法可以包括并入至少一种dNTP(如dATP、dTTP、dGTP或dCTP)。
附图说明
并入到说明书中并且形成说明书的一部分的随附图式说明一个或多个示例性实施例并且用以解释各个示例性实施例的原理。图式仅是示例性和解释性的,并且不应解释为以任何方式限制或约束。
图1A-1E所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的测序通量和平均读取长度数据。
图2A1、2A2、2B1、2B2的表和图表提供使用根据本发明的示例性经过修饰的聚合酶来获得的示例性核酸测序数据。
图3A-3B的表提供与参考聚合酶(SEQ ID NO:34)相比的使用根据本发明的示例性经过修饰的聚合酶来获得的示例性核酸测序数据。
图4的表提供使用根据本发明的示例性经过修饰的聚合酶(SEQ ID NO:2)来获得的关于GC含量的示例性核酸测序数据。
图5A-5B的表和图表提供与参考聚合酶(SEQ ID NO:34)相比的使用根据本发明的示例性经过修饰的聚合酶来获得的示例性核酸测序数据。
图6的表提供与参考聚合酶(SEQ ID NO:34)相比的使用根据本发明的示例性经过修饰的聚合酶来获得的示例性核酸测序数据。
图7所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的示例性热稳定性数据。
图8所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的示例性热稳定性数据。
图9所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的示例性热稳定性数据。
图10所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的示例性热稳定性数据。
图11所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶来获得的95℃下的示例性热稳定性数据。
图12所显示的图形提供使用根据本发明的示例性经过修饰的聚合酶在96℃下获得的示例性热稳定性数据。
图13所显示的图形提供在无海藻糖存在下使用根据本发明的示例性经过修饰的聚合酶在95℃下获得的示例性热稳定性数据。
图14的示意图概述根据本发明进行的示例性热稳定活性分析。
具体实施方式
除非另外定义,否则本文所使用的所有技术和科学术语都具有与本发明所属领域的一般技术人员通常所理解相同的含义。本文(上文和下文)中所提及的所有专利、专利申请、公开的申请、论文和其它公开都以全文引用的方式并入。如果在本文中明确地或隐含地阐述的定义和/或描述与以引用的方式并入本文中的专利、专利申请、公开的申请和其它公开中所阐述的任何定义相反或以其它方式不一致,那么本文中所阐述的定义和/或描述优先于以引用的方式并入的定义。
除非另外指示,否则本发明的实践将采用在所属领域技术内的分子生物学、微生物学以及重组DNA技术的常规技术。在文献中全面解释了此类技术。参见例如Sambrook,J.和Russell,D.W.,2001,《分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)》,第三版;Ausubel,F.M.等人编,2002,《分子生物学短方案(Short Protocols InMolecular Biology)》,第五版。
应注意,并非在一般描述或实例中所描述的所有活动都是需要的,一部分特定活动可能是不需要的,并且可以进行除所描述活动之外的一种或多种其它活动。再者,活动所列的次序未必是活动被执行的次序。
在一些情况下,已参考特定实施例描述了一些概念。然而,所属领域的一般技术人员应了解,可以在不脱离如下文权利要求书中所阐述的本发明范围的情况下进行各种修改和变化。因此,说明书和图式应该以说明性而不是限制性意义来看待,并且所有此类修改意图包括在本发明范围内。
如本文所使用,术语“包含(comprising)”(和包含的任何形式或变化形式,如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(和具有的任何形式或变化形式,如“具有(have)”和“具有(has)”)、“包括(including)”(和包括的任何形式或变化形式,如“包括(includes)”和“包括(include)”)或“含有(containing)”(和含有的任何形式或变化形式,如“含有(contains)”和“含有(contain)”)是包括性或开放性的并且并不排除额外的、未列出的添加剂、组分、整体、要素或方法步骤。举例来说,包括一列特征的工艺、方法、物品或装置不一定仅限于那些特征,但可以包括没有明确列出或此类工艺、方法、物品或装置所固有的其它特征。
除非有明确的相反陈述,否则“或”是指包括性的或,而非排它性的或。举例来说,通过以下中的任一个来满足条件A或B:A是真(或存在)且B是假(或不存在),A是假(或不存在)且B是真(或存在),以及A和B两者都是真(或存在)。
已关于特定实施例描述了益处、其它优势和问题解决方案。然而,此类益处、优势、问题解决方案以及可以使任何益处、优势或解决方案出现或变得更显著的任何特征不应解释为任何或所有权利要求关键的、必需的或基本的特征。
在阅读本说明书之后,熟练的技术人员应了解,也可以在单一实施例中组合提供为了清楚起见在单独实施例的情形下于本文所描述的某些特征。相反地,也可以单独地或以任何次组合形式提供为了简洁起见在单个实施例的情形下所描述的各种特征。此外,提及范围中所陈述的值包括在那个范围内的每一个值。
另外,如“一(a/an)”或“所述(the)”的冠词的使用用于描述本文所描述的要素和组分。这样做仅是为方便起见和给出本发明范围的一般性意义。除非显而易见指的是其它情况,否则此描述应理解为包括一个或至少一个,并且单数也包括复数。因此,除非其在上下文中的使用另外指示,否则本文所使用的术语“一(a/an)”和“所述(the)”以及类似指示物应解释为涵盖单数和复数。因此,当在权利要求或说明书中使用时,包括与术语“包含”结合使用时,使用字“一(a/an)”或“所述”可以意味着“一个”,但其也与“一个或多个”、“至少一个”以及“一个或超过一个”的含义一致。
如本文所使用,术语“聚合酶”和其变化形式包含可以催化核苷酸(包括其类似物)聚合成核酸链的任何酶。典型地但未必,此类核苷酸聚合可以模板依赖性方式发生。此类聚合酶可以包括(但不限于)天然存在的聚合酶和其任何次单元和截短、突变型聚合酶、变异型聚合酶、重组、融合或以其它方式工程化的聚合酶、经过化学修饰的聚合酶、合成分子或组件以及其保留催化此类聚合的能力的任何类似物、同源物、衍生物或片段。任选地,聚合酶可以是包含一个或多个突变的突变型聚合酶,所述突变涉及用其它氨基酸替换一个或多个氨基酸、由聚合酶插入或缺失一个或多个氨基酸、或连接两个或更多个聚合酶的部分,包括连接两个或更多个来自不同聚合酶物种或家族的部分。典型地,聚合酶包含可以发生核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些示例性聚合酶包括(但不限于)DNA聚合酶(如Phi-29 DNA聚合酶、Taq聚合酶、逆转录酶以及大肠杆菌DNA聚合酶)和RNA聚合酶。如本文所使用,术语“聚合酶”和其变化形式也指包含至少两个彼此连接的部分的融合蛋白,其中第一部分包含可以催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包含第二多肽的第二部分。在一些实施例中,第二多肽可以包括报导子酶或增强持续合成能力的域。
如本文所使用,术语“连接(link)”、“连接(linked)”、“连接(linkage)”和其变化形式包含任何类型的融合、键结、粘附或缔合,其具有足够的稳定性以耐受在相关特定生物应用中的使用。此类连接可以包含例如共价、离子、氢、偶极-偶极、亲水性、疏水性或亲和性键结、涉及范德华力(van der Waals force)的键或缔合、机械粘合等。任选地,此类连接可以在不同分子的组合之间发生,包括(但不限于):在纳米粒子与蛋白质之间;在蛋白质与标记之间;在连接子与官能化纳米粒子之间;在连接子与蛋白质之间;在核苷酸与标记之间等。连接的一些实例可以见于例如Hermanson,G.,《生物结合技术(BioconjugateTechniques)》,第二版(2008);Aslam,M.,Dent,A.,《生物结合:用于生物医学科学的蛋白质偶合技术(Bioconjugation:Protein Coupling Techniques for the BiomedicalSciences)》,伦敦(London):Macmillan(1998);Aslam,M.,Dent,A.,《生物结合:用于生物医学科学的蛋白质偶合技术,伦敦:Macmillan(1998)。
如本文参考多肽或蛋白质(例如聚合酶)所使用的术语“修饰”或“经过修饰的”和其变化形式包含蛋白质的结构、生物和/或化学特性的任何变化。在一些实施例中,修饰可以包括蛋白质的氨基酸序列变化。举例来说,修饰可以任选地包括一个或多个氨基酸突变,包括(但不限于)氨基酸添加、缺失和取代(包括保守和非保守取代两种)。
如本文参考氨基酸序列的任何变化所使用的术语“保守”和其变化形式是指其中一个或多个氨基酸被另一个具有高度类似特性的氨基酸取代的氨基酸突变。举例来说,包含非极性或脂肪族侧链的一种或多种氨基酸(例如甘氨酸、丙氨酸、缬氨酸、亮氨酸或异亮氨酸)可以彼此取代。类似地,包含极性不带电侧链的一种或多种氨基酸(例如丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰胺或谷氨酰胺)可以彼此取代。类似地,包含芳香族侧链的一种或多种氨基酸(例如苯丙氨酸、酪氨酸或色氨酸)可以彼此取代。类似地,包含带正电侧链的一种或多种氨基酸(例如赖氨酸、精氨酸或组氨酸)可以彼此取代。类似地,包含带负电侧链的一种或多种氨基酸(例如天冬氨酸或谷氨酸)可以彼此取代。在一些实施例中,经过修饰的聚合酶或其生物活性片段是包含这些保守氨基酸取代中的一种或多种的变异体或其任何组合。在一些实施例中,对亮氨酸的保守取代包括:丙氨酸、异亮氨酸、缬氨酸、苯丙氨酸、色氨酸、甲硫氨酸以及半胱氨酸。在其它实施例中,对天冬酰胺的保守取代包括:精氨酸、赖氨酸、天冬氨酸酯、谷氨酸酯以及谷氨酰胺。
在本发明通篇中,包括例如氨基酸取代的各种氨基酸突变使用氨基酸单字母密码来加以提及,并且指示参考氨基酸序列内残基的位置。在氨基酸取代的情况下,取代基的一致性也使用氨基酸单字母密码来加以指示。举例来说提及假想氨基酸取代“E397V,其中编号是相对于SEQ ID NO:1的氨基酸序列”指示以下氨基酸取代,其中缬氨酸(V)残基取代在以下氨基酸序列的氨基酸位置397处通常存在的谷氨酸(E):SEQ ID NO:1。本文所公开的氨基酸序列中的一些以甲硫氨酸残基(“M”)开始,所述残基典型地在编码需要在细菌宿主细胞中表达的肽的核酸序列的开始处引入。然而,应理解,本发明也涵盖从第二氨基酸残基开始的所有此类氨基酸序列,而不包括第一甲硫氨酸残基。
如本文所使用,当在两种或更多种核酸或多肽序列的情形下使用时,术语“一致”或“一致性百分比”以及其变化形式是指,当经过比较和比对以得到最大对应性时,如使用以下序列比较算法中的任何一个或多个所测量,相同或氨基酸残基或核苷酸的指定百分比相同的两种或更多种序列(或子序列,如生物活性片段):尼德曼-翁施(Needleman-Wunsch)(参见例如Needleman,Saul B.;和Wunsch,Christian D.(1970).“一种可适用于探索两种蛋白质氨基酸序列类似性的一般方法(A general method applicable to the searchfor similarities in the amino acid sequence of two proteins)”《分子生物学杂志(Journal of Molecular Biology)》48(3):443-53);史密斯-沃特曼(Smith-Waterman)(参见例如Smith,Temple F.;和Waterman,Michael S.,“常见分子子序列的鉴别(Identification of Common Molecular Subsequences)”(1981)《分子生物学杂志》147:195-197);或BLAST(基本局部比对搜索工具(Basic Local Alignment Search Tool);参见例如Altschul SF,Gish W,Miller W,Myers EW,Lipman DJ,“基本局部比对搜索工具(Basic local alignment search tool)”(1990)《分子生物学杂志(J Mol Biol)》215(3):403-410)。
如本文所使用,当在两种或更多种核酸或多肽序列的情形下使用时,术语“一致”或“一致性”以及其变化形式是指,当经过比较和比对以得到最大对应性时,如使用序列比较算法或通过目视检查所测量,具有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%核苷酸或氨基酸残基一致性的两种或更多种序列或子序列(如生物活性片段)。基本上一致的序列典型地被认为是“同源的”,无论实际来源于何种家系。
当蛋白质和/或蛋白质子序列(如生物活性片段)天然或人工地衍生自共同的祖先蛋白质或蛋白质序列时,蛋白质和/或蛋白质子序列(如生物活性片段)是“同源的”。类似地,当核酸和/或核酸序列天然地或人工地衍生自共同的祖先核酸或核酸序列时,核酸和/或核酸序列是同源的。一般从两个或更多个核酸或蛋白质(或其生物活性片段或序列)之间的序列类似性推断同源性。适用于确立同源性的序列之间的精确类似性百分比随在争论中的核酸和蛋白质变化而变化,但25、50、100、150或更多个核酸或氨基酸残基中少到25%的序列类似性常规用于确立同源性。更高水平的序列类似性,例如50%、60%、70%、80%、85%、90%、95%、98%或99%也可以用于确立同源性。
用于测定序列类似性百分比的方法(例如使用默认参数的BLASTP和BLASTN)描述于本文中并且一般是可获得的。对于序列比较和同源性测定,典型地一个序列充当与测试序列进行比较的参考序列。一般来说,当使用序列比较算法时,将测试和参考序列输入到计算机中,必要时指定子序列座标,并且指定序列算法程序参数。接着,序列比较算法基于所指定的程序参数来计算测试序列相对于参考序列的序列一致性百分比。用于比较的最佳序列比对可以例如通过以下来进行:局部同源算法,来自Smith&Waterman,《应用数学进展(Adv.Appl.Math.)2:482(1981);同源性比对算法,来自Needleman&Wunsch《分子生物学杂志(J.Mol.Biol.)48:443(1970);探索类似性方法,来自Pearson&Lipman,《美国国家科学院院刊(Proc.Nat'l.Acad.Sci.USA)85:2444(1988);通过这些算法的计算机化实施方案(威斯康星遗传学软件套装(Wisconsin Genetics Software Package)中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,Wis.);或目视检查(一般参见《最新分子生物学实验方法汇编(Current Protocols in MolecularBiology)》,Ausubel等人编,现有方案(Current Protocols),格林出版联合公司(GreenePublishing Associates,Inc.)与约翰·威利父子公司(John Wiley&Sons,Inc.)合资企业,2004年补充)。
适合于确定序列一致性百分比和序列类似性(同源性)的算法的一个实例是BLAST算法,其描述于Altschul等人,《分子生物学杂志》215:403-410(1990)。用于进行BLAST分析的软件通过国家生物技术信息中心(National Center for Biotechnology Information)公开可获得。此算法涉及通过识别查询序列中长度为“W”的短字来首先识别高评分序列对(HSP),所述短字当与数据库序列中相同长度的字比对时匹配或满足某些正值阈值分数“T”。“T”称为邻域字分数阈值(Altschul等人,同前文献)。这些初始邻域字命中点充当开始检索以找到含有其的更长HSP的种子。接着,字命中点沿各序列在两个方向上延伸,只要累积比对分数可以增加即可。对于核苷酸序列来说,累积分数使用参数“M”(一对匹配残基的奖励分数;始终>0)和“N”(失配残基的罚分;始终<0)来加以计算。对于氨基酸序列,使用计分矩阵计算累积分数。当累积比对分数从其达到的最大值降低量X;累积分数因一次或多次负分残基比对的累积而变成0或低于0;或到达任一序列的末端时,中断字命中点在各方向上的延伸。BLAST算法参数“W”、“T”和“X”确定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字长(W)11、预期(E)10、截止值100、M=5、N=-4以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)3、预期(E)10以及BLOSUM62计分矩阵作为默认值(参见Henikoff&Henikoff(1989)《美国国家科学院院刊》89:10915)。
除计算序列一致性百分比以外,BLAST算法还进行两个序列之间的类似性统计分析(参见例如Karlin&Altschul,《美国国家科学院院刊》90:5873-5787(1993))。由BLAST算法提供的一种类似性度量是最小和概率(P(N)),其提供对两个核苷酸或氨基酸序列之间将偶然发生匹配的概率的指示。举例来说,如果测试核酸与参考核酸比较的最小和概率小于约0.1、小于约0.01或小于约0.001,那么认为核酸与参考序列类似。
如本文所使用,当参考给定聚合酶使用时,术语“引物延伸活性”和其变化形式包含涉及催化核苷酸并入到延伸核酸分子的末端3'OH端上的给定聚合酶的任何体内或体外酶活性特征。典型地但未必,此类核苷酸并入以模板依赖性方式发生。在一些实施例中,给定聚合酶的引物延伸活性可以定量为在一组具体反应条件下每单位时间(秒)通过单位量聚合酶(以摩尔计)并入的核苷酸的总数目(如通过例如辐射测量或其它合适分析所测量)。
如本文所使用,当参考给定聚合酶使用术语“热稳定性”和其变化形式时,其包含涉及催化核苷酸在适度高温下并入而不损失涉及催化核苷酸并入的特性的给定聚合酶的任何体内或体外酶活性特征。典型地但未必,此类核苷酸并入以模板依赖性方式发生。在一些实施例中,给定聚合酶的热稳定性可以定量为在给定温度(℃或℉)下每单位时间(分钟)通过单位量聚合酶(以摩尔计)并入的核苷酸的总数目(如通过例如辐射测量或其它合适分析所测量)。在一些实施例中,给定聚合酶的热稳定性可以通过在于95℃下培育40分钟之后通过单位量的聚合酶(以摩尔计)测量聚合活性来加以定量。在一个实施例中,给定聚合酶的热稳定性可以通过基于聚合酶的半衰期测量聚合活性来加以定量。举例来说,Taq的半衰期在92.5℃下大于2小时;在95℃下为40分钟,并且在97.5℃下为9分钟(Lawyer等人,(1993)《PCR方法应用(PCR Methods Appl.)》,2(4)275-87。本文所描述的实例中的一些比较参考聚合酶与经过修饰的聚合酶进行核苷酸聚合的相对量(例如使用SEQ ID NO:1的核苷酸聚合与使用SEQ ID NO:2的核苷酸聚合相比)。在这些实例中,在相同条件下评定参考聚合酶和经过修饰的聚合酶(或其生物活性片段)的核苷酸聚合特性,所述条件包括高温,如95℃、96℃、或97℃持续各种时间,如2分钟、4分钟、6分钟或8分钟(参见例如实例10,图11-14),随后使用所述聚合酶进行PCR反应。
热稳定聚合酶一般在约70℃下效果最佳(对于水生栖热菌(Taq),其是74℃,并且Taq展现在70℃下插入大致2800个核苷酸/分钟,在55℃下1400核苷酸/分钟,在37℃下90个核苷酸/分钟并且在22℃下约15个核苷酸/分钟)。来自激烈火球菌(Pfu)、沃氏火球菌(Pyrococcus woesei,Pwo)、海栖热孢菌(Thermatoga maritima,Tma)和海滨热球菌(Thermococcus Litoralis,Tli或Vent)的聚合酶也涵盖于本发明范围内。这些聚合酶展现比水生栖热菌(Taq)基本上更高温度的稳定性。
如本文所使用,当参考给定聚合酶使用时,术语“精确度”和其变化形式包含获自核苷酸聚合反应的最长完美读数(典型地关于正确地包括于读数中的核苷酸数目来加以测量)。因此,如本文所使用,当参考给定聚合酶时,平均读取精确度是指获自核苷酸聚合反应的“平均”完美读数。
如本文所使用,当参考给定聚合酶使用时,术语“DNA结合活性”和其变化形式包含以基于识别的方式涉及聚合酶与DNA序列相互作用的给定聚合酶的任何体内或体外酶活性特征。典型地但未必,此类相互作用包括聚合酶结合,并且更尤其聚合酶的DNA结合域与所识别DNA序列的结合。在一些实施例中,识别包括聚合酶与序列特异性或非序列特异性DNA序列的结合。在一些实施例中,给定聚合酶的DNA结合活性可以定量为聚合酶识别并且结合到所识别DNA序列的亲和力。举例来说,当在一组具体反应条件下形成蛋白质-DNA复合物时,可以使用各向异性信号变化(或其它合适的分析)来监测并且测定DNA结合活性。
如本文所使用,当参考给定生物分子使用时,术语“生物活性片段”和其变化形式是指具有生物分子自身特有的体内或体外活性的生物分子的任何片段、衍生物、同源物或类似物。举例来说,聚合酶可以由各种生物活性表征,例如DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、切口起始聚合酶活性、3'-5'核酸外切酶(校正)活性、热稳定性、精确度、持续合成能力等。在一些实施例中,聚合酶的“生物活性片段”是可以催化核苷酸(包括其同源物和类似物)聚合成核酸链的聚合酶的任何片段、衍生物、同源物或类似物。在一些实施例中,聚合酶的生物活性片段、衍生物、同源物或类似物具有任何相关体内或体外分析中聚合酶10%、20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%或98%或更大的生物活性,所述分析如DNA结合分析、核苷酸聚合分析(其可以是模板依赖性或模板非依赖性的)、引物延伸分析、链置换分析、逆转录酶分析、校正分析、精确度分析、热稳定性分析等。
在一些实施例中,通过在限定的反应条件下测量片段的体外引物延伸活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外聚合活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外热稳定性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外精确度来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外持续合成能力来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外链置换活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外读取长度活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外链偏差活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量片段的体外校正活性来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量如由聚合酶片段进行的体外分析的输出(如测序通量或平均读取长度)来分析聚合酶片段的生物活性。在一些实施例中,通过在限定的反应条件下测量体外核苷酸聚合反应的输出(如聚合酶片段在核苷酸聚合反应中并有正确沃森-克里克核苷酸的原始精确度)来分析聚合酶片段的生物活性。在一些实施例中,聚合酶的生物活性片段可以包括测量本文中所概述的聚合酶生物活性中的任何一种或多种的生物活性。
在一些实施例中,生物活性片段可以包括经过修饰的聚合酶的DNA结合域的任何部分或催化域的任何部分。在一些实施例中,生物活性片段可以任选地包括DNA结合域或催化域的任何25、50、75、100、150或更多个氨基酸残基。在一些实施例中,经过修饰的聚合酶的生物活性片段可以包括与由本发明所涵盖的聚合酶中的任何一种或多种具有至少80%、85%、90%、95%、98%或99%一致性的催化域或DNA结合域的至少25个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶的生物活性片段可以包括与以下序列中的任何一种或多种具有至少80%、85%、90%、95%、98%或99%一致性的催化域或DNA结合域的至少25个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32和SEQ ID NO:33。
生物活性片段可以任选地在体内存在,如由转录后加工产生或由交替剪接的RNA的转译产生或替代性地可以经由工程化、总合成或其它合适的操作产生的片段。生物活性片段包括在天然或内源细胞中表达的片段以及在表达系统中,如在细菌、酵母、昆虫或哺乳动物细胞中制得的那些片段。
在一些实施例中,本发明大体上不仅涉及本文所公开的特定聚合酶,还涉及涵盖于本发明范围内的此类聚合酶的任何生物活性片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括展现体外引物延伸活性的任何片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括展现体外DNA结合活性的任何片段。在一些实施例中,本发明的任何聚合酶的生物活性片段包括保留体外聚合酶活性的任何片段。聚合酶活性可以通过所属领域中已知的任何方法来加以测定。举例来说,聚合酶活性的测定可以基于使引物在模板上延伸的活性。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶,其相对于缺乏一个或多个氨基酸突变(如缺失、取代或添加)的参考聚合酶具有所述一个或多个氨基酸突变,并且其中所述经过修饰的聚合酶保留体外聚合酶活性或展现体外引物延伸活性。在一些实施例中,经过修饰的聚合酶包括此类聚合酶中保留体外持续合成能力或展现体外热稳定活性的任何生物活性片段。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶,其相对于缺乏一个或多个氨基酸突变(如缺失、取代或添加)的参考聚合酶具有所述一个或多个氨基酸突变,并且其中所述经过修饰的聚合酶保留体外校正活性。判定聚合酶是否展现核酸外切酶活性或展现降低的核酸外切酶活性可以通过标准方法容易地加以确定。举例来说,可以合成聚核苷酸以使得可检测比例的核苷酸被放射性标记。这些聚核苷酸可以在适当的缓冲液中在待测试多肽存在下培育。在培育之后,聚核苷酸沉淀并且由于上清液中的游离核苷酸,核酸外切酶活性可以放射性计数形式加以检测。如熟练的技术人员应了解,基于上述生物活性中的任一个或其组合,取决于相关应用,适当的聚合酶或生物活性片段可以选自本文所描述的那些。
如本文所使用,术语“核苷酸”和其变化形式包含可以与聚合酶选择性结合或可以通过聚合酶聚合的任何化合物。典型地但未必,核苷酸与聚合酶的选择性结合后接核苷酸通过聚合酶聚合成核酸链;然而偶尔,核苷酸可以从聚合酶解离而不变成并入到核酸链中,这是在本文中被称为“非生产性”事件的事件。此类核苷酸不仅包括天然存在的核苷酸而且包括可以与聚合酶选择性结合或可以通过聚合酶聚合的任何类似物(无关于其结构)。虽然天然存在的核苷酸典型地包含碱基、糖和磷酸酯部分,但本发明的核苷酸可以包括不具有此类部分中的任一个、一些或全部的化合物。在一些实施例中,核苷酸可以任选地包括包含三个、四个、五个、六个、七个、八个、九个、十个或更多个磷原子的磷原子链。在一些实施例中,磷链可以附接到糖环的任何碳,如5'碳。磷链可以用介入的O或S连接到糖。在一个实施例中,链中的一个或多个磷原子可以是具有P和O的磷酸酯基的一部分。在另一个实施例中,链中的磷原子可以用介入的O、NH、S、亚甲基、被取代的亚甲基、亚乙基、被取代的亚乙基、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一些实施例中,链中的磷原子可以具备具有O、BH3或S的侧基。在磷链中,具有除O以外的侧基的磷原子可以是被取代的磷酸酯基。核苷酸类似物的一些实例描述于Xu,美国专利第7,405,281号中。在一些实施例中,核苷酸包含标记(例如报导子部分)并且在本文中被称为“经过标记的核苷酸”;经过标记的核苷酸的标记在本文中被称为“核苷酸标记”。在一些实施例中,标记可以呈附接到末端磷酸酯基(即,距糖最远端的磷酸酯基或取代磷酸酯基)上的荧光染料形式。可以用于所公开的方法和组合物中的核苷酸的一些实例包括(但不限于)核糖核苷酸、脱氧核糖核苷酸、经过修饰的核糖核苷酸、经过修饰的脱氧核糖核苷酸、核糖核苷酸聚磷酸酯、脱氧核糖核苷酸聚磷酸酯、经过修饰的核糖核苷酸聚磷酸酯、经过修饰的脱氧核糖核苷酸聚磷酸酯、肽核苷酸、金属核苷酸、膦酸酯核苷和经过修饰的磷酸酯-糖主链核苷酸,前述化合物的类似物、衍生物或变化形式等。在一些实施例中,核苷酸可以包含非氧部分(如硫基或硼烷部分)代替氧部分,所述氧部分桥接核苷酸的α磷酸酯与糖、或核苷酸的α与β磷酸酯、或核苷酸的β与γ磷酸酯,或位于核苷酸的任何其它两种磷酸酯之间,或其任何组合。
如本文所使用,术语“核苷酸并入”和其变化形式包含使一个或多个核苷酸聚合以形成核酸链,所述核酸链包括至少两个典型地但未必经由磷酸二酯键彼此连接的核苷酸,但在特定核苷酸类似物的情况下替代性连接可以是可能的。
如本文所使用,术语“持续合成能力”和其变化形式包含聚合酶保持结合到单一引物/模板杂交体的能力。如本文所使用,当参考给定聚合酶使用时,术语持续合成能力包含聚合酶在单个循环中附接到核酸3'端(例如DNA链的3'-OH基团)上的核苷酸数目。此数目表示聚合酶的聚合比率和解离常数(Kd)。在一些实施例中,可以通过在聚合酶从引物/模板杂交体解离之前聚合酶并入到核酸(如测序引物)中的核苷酸数目来测量持续合成能力。在一些实施例中,聚合酶具有至少100个核苷酸的持续合成能力,但在其它实施例中,其具有至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸或更多个的持续合成能力。所属领域的一般技术人员应理解,聚合酶的持续合成能力越高,在解离之前可以并入的核苷酸越多,并且因此可以获得的序列(读取长度)越长。换句话说,具有较低持续合成能力的聚合酶将典型地提供与具有较高持续合成能力的聚合酶相比更短的平均读取长度。在一个实施例中,含有一个或多个氨基酸突变的本发明聚合酶可以具有与缺乏所述一个或多个氨基酸突变的聚合酶相比改进的持续合成能力。
在一个示例性分析中,给定聚合酶的持续合成能力可以通过以下来加以测量:在核苷酸并入条件下用引物:模板双螺旋体培育聚合酶,和使用任何合适的方法,例如经由凝胶电泳分解(resolve)所得引物延伸产物。引物可以任选地包括标记以增强引物延伸产物的可检测性。核苷酸并入反应混合物典型地包括大量过量的未标记的竞争模板,从而确保几乎所有延伸产物经由单一模板结合作用产生。在此类分解之后,平均量的全长延伸产物可以使用任何合适的手段,包括全长延伸产物的荧光或辐射测量的检测来加以定量。为了比较两种或更多种不同酶(例如参考和经过修饰的聚合酶)的持续合成能力,可以在平行和单独反应中采用各种酶,之后可以分解和测量所得全长引物延伸产物,并且比较此类测量值。
在其它示例性实施例中,给定聚合酶的持续合成能力可以使用所属领域中已知的任何合适的分析来加以测量,包括(但不限于)在以下中所描述的分析:Von Hippel,P.H.,Faireld,F.R.和Dolejsi,M.K.,关于聚合酶的持续合成能力(On the processivityofpolymerases),《纽约科学学会年报(Ann.NY Acad.Sci.)》,726:118-131(1994);Bambara,R.A.,Uyemura,D.和Choi,T.,关于大肠杆菌DNA聚合酶I的持续合成机制.持续合成能力的量化的评估(On the processive mechanism of Escherichia coli DNApolymerase I.Quantitative assessment of processivity),《生物化学杂志(J.Biol.Chem.)》,253:413-423(1978);Das,S.K.和Fujimura,R.K.,DNA聚合酶的持续合成.使用简单程序的比较研究(Processiveness of DNApolymerases.A comparativestudy using a simple procedure),《生物化学杂志》,254:1227-1232(1979);Nasir,M.S.和Jolley,M.E.,荧光偏振:用于免疫分析与药物发现的分析工具(Fluorescencepolarization:An Analytical Tool for Immunoassay and Drug Discovery),《组合化学和高通量筛检(Combinational Chemistry and High Throughput Screening)》,2:177-190(1999);Mestas,S.P.,Sholders,A.J.和Peersen,O.B.,用于核酸聚合酶伸长活性的基于荧光偏振的筛检分析(A Fluorescence Polarization Based Screening Assay forNucleic Acid Polymerase Elongation Activity),《分析生物化学(Anal.Biochem.),365:194-200(2007);Nikiforov,T.T.,基于用单个荧光团标记的DNA底物的荧光聚合酶、核酸内切酶和连接酶分析(Fluorogenic polymerase,endonuclease,and ligase assaysbased on DNA substrates labeled with a single fluorophore),《分析生物化学(Analytical Biochemistry)》412:229-236;以及Yan Wang,Dennis E.Prosen,Li Mei,John C.Sullivan,Michael Finney和Peter B.Vander Horn,《核酸研究(Nucleic AcidsResearch)》,32(3):1197-1207(2004)。
如本文所使用,术语“读取长度”或“读取-长度”和其变化形式是指在从模板核酸链解离之前通过聚合酶以模板依赖性方式聚合(或并入到现有核酸链中)的核苷酸数目。在一些实施例中,在五次并入之后从模板核酸链解离的聚合酶将典型地提供具有5个核苷酸的读取长度的序列,而在500个核苷酸并入之后从模板核酸链解离的聚合酶将典型地提供具有约500个核苷酸的读取长度的序列。虽然给定聚合酶的实际或绝对持续合成能力(或聚合酶所产生的聚合产物的实际读取长度)可能因反应而不同(或甚至在单一反应混合物内不同,其中聚合酶产生具有不同读取长度的不同产物),但聚合酶可以通过在一组限定的反应条件下观察到的平均持续合成能力(或聚合产物的平均读取长度)来表征。“无误差读取长度”包含在无误差(即,无失配和/或与一组确立并可预测的碱基配对规则无偏差)的情况下相继并且连续地并入到新合成的核酸链中的核苷酸的数目。
如本文所使用,术语“系统误差”或“SE”和其变化形式是指在含有限定长度均聚物的序列基元中存在的误差的百分比,其中系统缺失以指定最小频率出现在核酸链上,并且其中测序覆盖度以指定最小频率出现。举例来说,在一些实施例中,系统误差可以测量为含有长度为1-6的均聚物的序列基元中的误差的百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率出现在链上。在一些实施例中,系统误差估算为含有长度为1-6的均聚物的序列基元中的随机误差的百分比,其中当覆盖度(测序操作的覆盖度)等于或大于20×时,系统缺失以大于15%的频率出现在链上;此类实施例是本文所公开的若干工作实例的焦点。在一些实施例中,与不含有一个或多个氨基酸修饰的参考聚合酶(例如野生型Taq聚合酶)相比,当使用如本文所公开的经过修饰的聚合酶时,系统误差百分比降低。虽然给定聚合酶的实际系统误差可能因反应而不同(或甚至在单一反应混合物内不同),但聚合酶可以通过在一组限定的反应条件下观察到的系统误差百分比来表征。在一些实施例中,与不具有一个或多个氨基酸修饰的相对应参考聚合酶相比,本申请的经过修饰的聚合酶具有降低的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于3%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于1%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.9%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.8%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.7%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.6%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.5%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.4%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.3%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.2%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.1%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.09%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.08%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.05%的系统误差百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶含有小于0.04%的系统误差百分比。
如本文所使用,术语“链偏差性”是指测序操作中的目标碱基百分比,其中来自一条链(例如正链)的读数(基因分型)与从另一条(例如负)链推断的读数(基因分型)不同。给定目标碱基的覆盖度可以通过对在比对中相对于目标碱基定位的读取碱基的数目进行计数来加以计算。平均覆盖度可以通过跨越目标中的每个碱基取此值的平均值来计算。接着,特定碱基的相对覆盖度计算为这些值的比率。1的相对覆盖度指示特定碱基以预期平均比率覆盖。大于1的相对覆盖度指示高于预期覆盖度并且小于1指示低于预期覆盖度。一般来说,不明确的定位的概率随着读数变得更小或更不精确而提高。对于从重复或低复杂性区域的基因组(包括具有极端(高)GC含量的一些区域)导出的读数,不明确的定位的可能性也更高。在一些实施例中,与不含有相对应一个或多个氨基酸修饰的参考聚合酶(例如野生型Taq聚合酶)相比,当使用如本文所公开的经过修饰的聚合酶时,链偏差性的百分比降低或减小。在一些实施例中,本申请的经过修饰的聚合酶具有与相对应的未经修饰的聚合酶相比减少(降低)的链偏差性。虽然给定聚合酶的实际链偏差性可能因反应不同而不同(或甚至在单一反应混合物内不同),但聚合酶可以通过在一组限定的反应条件下观察到的不具有链偏差的目标碱基百分比来表征。
在一些实施例中,如本文所公开的经过修饰的聚合酶包含高于25%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约30%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约40%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约45%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约50%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约60%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约70%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约75%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约80%的无链偏差的目标碱基百分比。在一些实施例中,如本文所公开的经过修饰的聚合酶包含约85%的无链偏差的目标碱基百分比。相反地,在一些实施例中,如本文所公开的经过修饰的聚合酶可以包括约15%的具有链偏差的目标碱基百分比。在另一个实施例中,如本文所公开的经过修饰的聚合酶可以包括约20%、25%、30%、35%、40%、45%或50%的具有链偏差的目标碱基百分比。
术语“信噪比”或“SNR”是指信号功率与噪声功率的比率。一般来说,SNR是一种测量与背景噪声水平相比的所需信号的方法。在一些实施例中,“信噪比”可以指在测序操作期间获得的信号功率与相同测序操作的背景噪声相比的比率。在一些实施例中,本申请公开提供提高信噪比的手段的方法、套组、设备以及组合物。在一些实施例中,本发明大体上涉及一种用于进行核酸测序的方法,其包含使经过修饰的聚合酶在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶包括相对于参考聚合酶的一个或多个氨基酸修饰(例如取代)并且具有相对于不具有所述一个或多个氨基酸修饰的参考聚合酶增加的信噪比;和使用所述经过修饰的聚合酶来使所述一种或多种核苷酸中的至少一种聚合。
在一些实施例中,本发明大体上涉及包含经过修饰的聚合酶的组合物、方法、系统、设备和套组,所述经过修饰的聚合酶的特征在于与其未经修饰的对应物(例如参考聚合酶)相比增加的持续合成能力、增加的读取长度(包括无误差读取长度)、增加的总测序通量、改进的热稳定性和/或增加的精确度;以及涉及用于制造和使用此类经过修饰的聚合酶的方法,其用于广泛范围的生物和化学反应中,如核苷酸聚合、引物延伸、核酸库产生和核酸测序反应。
在一些实施例中,本发明大体上涉及包含经过修饰的聚合酶的组合物、方法、系统、设备和套组,所述经过修饰的聚合酶的特征在于与其未经修饰的对应物(例如参考聚合酶)相比降低的链偏差性和/或减小的系统误差;以及涉及用于制造和使用此类经过修饰的聚合酶的方法,其用于广泛范围的生物和化学反应中,如核苷酸聚合、引物延伸、核酸库产生和核酸测序反应。
在一些实施例中,涵盖于本发明范围内的经过修饰的聚合酶包括相对于缺乏相同突变的相对应对应物的一个或多个氨基酸突变(例如氨基酸取代、添加或缺失)。在一些实施例中,如本文所使用的术语“精确度”可以通过测定与不正确核苷酸在聚合期间的并入速率相比正确核苷酸在聚合期间的并入速率来加以测量。在一些实施例中,与标准(低离子强度溶液)盐条件相比,不正确核苷酸的并入速率在升高的盐条件(例如高离子强度溶液)下可以是大于0.3、0.4、0.5、0.6、0.7秒或更大。虽然不希望受任何特定理论束缚,但申请人已经发现,在聚合期间升高的盐的存在使不正确核苷酸并入的速率减慢,从而产生不正确核苷酸的较慢并入常数。在一些实施例中,本发明的经过修饰的聚合酶具有与缺乏相对应突变的参考聚合酶相比增强的精确度;任选地,经过修饰的聚合酶或其生物学片段在高离子强度溶液存在下具有(与缺乏相对应氨基酸突变的参考聚合酶相比)增强的精确度。一般来说,如本文所使用,标准离子强度溶液是指具有少于120mM盐的离子溶液。在另一个实施例中,如本文所使用的标准离子强度溶液是指具有少于100mM盐的离子溶液。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶,其在高离子强度溶液存在下保留聚合酶活性和/或引物延伸活性。在一些实施例中,高离子强度溶液可以是至少120mM盐浓度。在一些实施例中,高离子强度溶液是125mM到200mM盐浓度。在一些实施例中,盐可以包括钾盐和/或钠盐,如KCl和/或NaCl。对熟练的技术人员将显而易见的是,可以使用各种其它合适的盐代替KCl和/或NaCl或与其组合。在一些实施例中,离子强度溶液可以进一步包括硫酸盐。
在一些实施例中,经过修饰的聚合酶可以在高离子强度溶液存在下对核酸分子进行扩增和/或测序。在一些实施例中,在相同条件下,与缺乏相对应突变(或同源突变)中的一个或多个的参考聚合酶相比,经过修饰的聚合酶能够在高离子强度溶液存在下对核酸分子进行扩增(和/或测序)达到更大程度(例如由“精确度”所测量)。在一些实施例中,在标准离子强度条件(即,低离子强度与高离子强度溶液相比)下,与缺乏相对应突变(或同源突变)中的一个或多个的参考聚合酶相比,经过修饰的聚合酶能够在高离子强度溶液存在下对核酸分子进行扩增(和/或测序)达到更大容量(例如由“精确度”所测量)。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶或其生物活性片段,其与相同条件下的参考聚合酶相比,可以在高离子强度条件存在下进行核苷酸聚合或核苷酸并入。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶或其生物活性片段,其在高离子强度条件存在下具有与相同条件下的参考聚合酶相比增加的精确度或增加的持续合成能力。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶或其生物活性片段,其与相同条件下的参考聚合酶相比,可以在高离子强度盐条件存在下在核苷酸聚合期间检测离子浓度的变化。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶或其生物活性片段,其可以在高离子强度溶液存在下对核酸分子进行扩增或测序。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶或其生物活性片段,其具有与相同条件下的参考聚合酶相比增加的精确度。
在一些实施例中,本发明大体上涉及包含在核苷酸聚合反应中使用此经过修饰的聚合酶的方法、组合物、系统以及套组,所述反应包括其中序列信息获自核酸分子的核苷酸聚合反应。在一些实施例中,本发明大体上涉及包含在克隆扩增反应中使用此类经过修饰的聚合酶的方法、组合物、系统以及套组,所述反应包括核酸库合成。在一些实施例中,本发明涉及用于在基于离子的核酸测序反应中使用此类经过修饰的聚合酶的方法,其中序列信息使用基于离子的测序系统获自模板核酸。在一些实施例中,本发明大体上涉及使用电子传感器的大规模阵列,例如场效应晶体管(“FET”)进行多种无标记DNA测序反应(例如基于离子的测序反应)的组合物、方法、系统、套组以及设备。
在一些实施例中,本发明大体上涉及包含经过修饰的聚合酶的组合物(以及使用此类组合物的相关方法、系统、套组和设备),所述经过修饰的聚合酶包括相对于参考聚合酶的至少一个氨基酸修饰(例如氨基酸取代、添加、缺失或化学修饰)(其中所述参考聚合酶不包括所述至少一个氨基酸修饰),其中所述经过修饰的聚合酶的特征任选地在于以下特性中的任何一个或多个相对于参考聚合酶的变化(例如增加或减少):热稳定性、读取长度、精确度、链偏差性、系统误差、总测序通量、在盐(即,离子强度)中的性能以及持续合成能力。
如本文所使用,当参考给定聚合酶使用时,术语“Q17”或“Q20”和其变化形式是指聚合酶性能的某些方面,尤其给定聚合酶反应中,例如基于聚合酶的合成测序反应中的精确度。举例来说,在特定测序反应中,可以经由预测算法或经由与已知参考基因组的实际比对来计算精确度度量值。预测的质量分数(“Q”分数)可以从查看输入信号的固有特性的算法导出,并且关于测序“读数”中所包括的给定单一碱基是否将比对获得极其精确的估算值。在一些实施例中,此类预测的质量分数可以适用于在下游比对之前过滤并且去除较低质量读数。在一些实施例中,精确度可以关于以对数尺度测量精确度的Phred样Q分数报导以使得:Q10=90%,Q17=98%,Q20=99%,Q30=99.9%,Q40=99.99%,并且Q50=99.999%。Phred质量分数(“Q”)定义为与碱基判读误差概率(“P”)对数相关的特性。通常针对计算“Q”给出的式是Q=10×log10(1/误差率)。在一些实施例中,可以过滤获自给定聚合酶反应的数据以仅仅测量聚合酶读数,其测量“N”个核苷酸或更长核苷酸并且具有超过一定阈值的Q分数,例如Q10、Q17、Q100(在本文中被称作“NQ17”分数)。举例来说,100Q20分数可以指示获自给定反应的读数数目,其长度是至少100个核苷酸并且Q分数是Q20(99%)或更大。类似地,200Q20分数可以指示长度是至少200个核苷酸并且Q分数是Q20(99%)或更大的读数数目。
在一些实施例中,也可以基于使用参考基因组序列的恰当比对计算精确度,在本文中被称作“原始”精确度。与测量作为与多个读数结果的共同序列的误差率的共同精确度相反,这是涉及测量与单一读数相关的“真实”每个碱基误差的单向精确度。原始精确度测量值可以关于“AQ”分数(针对比对质量)来加以报导。在一些实施例中,可以过滤获自给定聚合酶反应的数据以仅仅测量聚合酶读数,其测量“N”个核苷酸或更长核苷酸,具有超过一定阈值的AQ分数,例如AQ10、AQ17、AQ100(在本文中被称作“NAQ17”分数)。举例来说,100AQ20分数可以指示获自给定聚合酶反应的读数数目,其长度是至少100个核苷酸并且AQ分数是AQ20(99%)或更大。类似地,200AQ20分数可以指示长度是至少200个核苷酸并且AQ分数是AQ20(99%)或更大的读数数目。
在一些实施例中,聚合酶的精确度(包括例如给定测序反应中的精确度)可以关于获自聚合酶反应的长度大于100、200、300、400、500、750、1000、5000、10000、100000个核苷酸的“完美”(即,零误差)读数的总数来加以测量。
在一些实施例中,聚合酶的精确度可以关于获自聚合酶反应的最长完美读数来加以测量(典型地关于包括于读数中的核苷酸数目来加以测量)。
在一些实施例中,聚合酶的精确度可以关于在给定测序反应中所获得的测序通量的增加倍数来加以测量。举例来说,在一些实施例中,由本发明范围所涵盖的示例性经过修饰的聚合酶与参考聚合酶(或未经修饰的天然存在的聚合酶)相比增加的精确度可以是2倍、5倍、10倍、20倍、50倍、75倍、100倍、150倍、200倍、400倍、500倍或更大精确度。
在一些实施例中,聚合酶的精确度可以关于在给定聚合反应中所获得的模板化效率增加百分比来加以测量。举例来说,在一些实施例中,涵盖于本发明范围内的示例性经过修饰的聚合酶与相同聚合条件下的参考聚合酶相比增加的精确度可以是10%、15%、20%、25%、30%、35%、40%、45%、50%或更大精确度。
精确度度量值的一些示例性非限制性描述可以见于:Ewing B,Hillier L,WendlMC,Green P.(1998):使用phred的自动化测序仪追踪的碱基判读(Base-calling ofautomated sequencer traces using phred).I.精确度评定(I.Accuracy assessment).《基因组研究(Genome Res.)》8(3):175-185;Ewing B,Green P.(1998):使用phred的自动化测序仪追踪的碱基判读.II.误差概率(II.Error probabilities).《基因组研究》8(3):186-194;Dear S,Staden R(1992):来自DNA测序仪器的数据的标准文件格式(A standardfile format for data from DNA sequencing instruments).《DNA序列(DNASequence)》,3,107-110;Bonfield JK,Staden R(1995):将碱基判读精确度的数值估算值应用于DNA测序方案(The application of numerical estimates of base callingaccuracy to DNA sequencing projects).《核酸研究(Nucleic Acids Res.)》1995年4月25日;23(8):1406-10,其以全文引用的方式并入本文中。
在一些实施例中,给定组聚合酶(包括本文所描述的参考或经过修饰的聚合酶中的任一种)的精确度可以在基于离子的测序反应中加以测量;此类精确度可以任选地彼此比较以判定给定氨基酸突变是否相对于参考和/或未经修饰的聚合酶而提高或降低测序精确度。在一些实施例中,一种或多种聚合酶的精确度可以使用由离子激流技术(加利福尼亚州的生命技术公司)供应的任何基于离子的测序设备,包括例如离子激流PGMTM或ProtonTM测序仪,任选地使用由离子激流系统提供的测序方案和试剂来加以测量。使用基于离子的测序系统进行精确度计算的一些实例描述于标题为以下的离子激流应用注释中:“离子激流:Ion Personal Genome MachineTM性能概述,2011春性能”(加利福尼亚州南旧金山(South San Francisco,California)的生命技术公司),其以全文引用的方式并入本文中。在一些实施例中,根据本发明制备的一种或多种经过修饰的聚合酶的精确度可以使用任何适当的方法和/或任何适当的下一代测序平台(如Roche 454GS或Illumina HiSeq、MiSeq或HiSeq X Ten平台)来加以测定。
如本文所使用,当参考给定聚合酶使用时,术语“解离速率常数”和“解离时间常数”是指在一组限定的反应条件下聚合酶从核酸模板解离的时间常数(“koff”)。用于测量聚合酶的解离时间常数的一些示例性分析进一步描述于下文中。在一些实施例中,解离时间常数可以时间倒数,例如sec-1或min-1为单位加以测量。
在一些实施例中,本发明大体上涉及以下方法(以及相关套组、系统、设备和组合物),其用于使用包括相对于参考聚合酶(其缺乏至少一个氨基酸修饰)的至少一个氨基酸修饰的经过分离的经过修饰的聚合酶,并且用于相对于在相同条件下使用参考聚合酶所获得引物延伸产物的平均读取长度,使得使用所述经过修饰的聚合酶的引物延伸反应中引物延伸产物的平均读取长度增加。在一些实施例中,相对于使用缺乏一个或多个氨基酸修饰的相对应聚合酶所获得引物延伸产物的平均无误差读取长度,经过分离的经过修饰的聚合酶使得使用所述经过修饰的聚合酶的引物延伸反应中引物延伸产物的平均无误差读取长度增加。在一些实施例中,与相同条件下的缺乏至少一个氨基酸修饰的参考聚合酶的平均无误差读取长度相比,经过分离的具有至少一个氨基酸修饰的聚合酶相对于参考聚合酶使得平均无误差读取长度增加至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%或更大。任选地,经过修饰的聚合酶包括相对于未经修饰的聚合酶的一个或多个氨基酸取代。在一些实施例中,相对于缺乏两个或更多个氨基酸取代的参考聚合酶,经过修饰的聚合酶包括所述两个或更多个氨基酸取代。在一些实施例中,引物延伸反应是基于离子的测序反应。在一些实施例中,引物延伸反应是基于emPCR的扩增反应。在一些实施例中,引物延伸反应是桥式PCR扩增反应。在一些实施例中,引物延伸反应包括引物延伸反应中的标记,如可逆终止子。
在一些实施例中,参考聚合酶是天然存在的或野生型聚合酶。在一些实施例中,参考聚合酶是天然存在的热稳定DNA聚合酶。在一些实施例中,参考聚合酶是全长野生型TaqDNA聚合酶。在一些实施例中,参考聚合酶是经过截短但氨基酸未经修饰的Taq DNA聚合酶(如Klentaq-235DNA聚合酶)。在其它实施例中,参考聚合酶包括与经过修饰的聚合酶不同的天然存在的聚合酶的衍生、截短、突变体或变异体形式。举例来说,与经过修饰的聚合酶相比,参考聚合酶可以省略一个或多个氨基酸突变(例如,一个或多个取代、缺失或添加)。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法,其包含:使经过修饰的聚合酶在一种或多种核苷酸存在下与核酸模板接触;和使用所述经过修饰的聚合酶使所述一种或多种核苷酸中的至少一种聚合。聚合任选地进一步包括使至少一种核苷酸以模板依赖性方式聚合。在一些实施例中,相对于不包括一个或多个氨基酸取代的参考聚合酶,经过修饰的聚合酶包括一个或多个氨基酸取代。
在一些实施例中,所述方法进一步包括在接触之前、期间或之后使引物与模板杂交。聚合可以包括使用经过修饰的聚合酶使至少一种核苷酸聚合到引物的一端上。
在一些实施例中,聚合在能够检测到至少一种核苷酸通过经过修饰的聚合酶而聚合的传感器附近进行。
在一些实施例中,所述方法进一步包括使用传感器来检测指示一种或多种核苷酸中的至少一种通过经过修饰的聚合酶而聚合的信号。
在一些实施例中,经过修饰的聚合酶、参考聚合酶或其两者是DNA聚合酶。DNA聚合酶可以包括(但不限于)细菌DNA聚合酶、原核DNA聚合酶、真核DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶或噬菌体DNA聚合酶。
在一些实施例中,DNA聚合酶选自由以下组成的群组:A家族DNA聚合酶、B家族DNA聚合酶、混合型聚合酶、未分类的DNA聚合酶和RT家族聚合酶以及其变异体和衍生物。
在一些实施例中,DNA聚合酶是A家族DNA聚合酶,其选自由以下组成的群组:Pol I型DNA聚合酶,如大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶的克列诺片段、Bst DNA聚合酶、Taq DNA聚合酶、Platinum Taq DNA聚合酶系列、Omni Klen Taq DNA聚合酶系列、Klen TaqDNA聚合酶系列、T7 DNA聚合酶以及Tth DNA聚合酶。在一些实施例中,DNA聚合酶是Bst DNA聚合酶。在其它实施例中,DNA聚合酶是大肠杆菌DNA聚合酶I。在一些实施例中,DNA聚合酶是大肠杆菌DNA聚合酶的克列诺片段。在一些实施例中,聚合酶是Taq DNA聚合酶。在一些实施例中,聚合酶是T7 DNA聚合酶。
在其它实施例中,DNA聚合酶是B家族DNA聚合酶,其选自由以下组成的群组:Bst聚合酶、Tli聚合酶、Pfu聚合酶、Pfu turbo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Sac聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、Pho聚合酶、ES4聚合酶、VENT聚合酶、DEEPVENT聚合酶、TherminatorTM聚合酶、噬菌体Phi29聚合酶以及噬菌体B103聚合酶。在一些实施例中,聚合酶是KOD聚合酶。在一些实施例中,聚合酶是TherminatorTM聚合酶。在一些实施例中,聚合酶是噬菌体Phi29DNA聚合酶。在一些实施例中,聚合酶是噬菌体B103聚合酶,包括例如以全文引用的方式并入本文中的美国专利公开第20110014612号中所公开的变异体。
在其它实施例中,DNA聚合酶是混合型聚合酶,其选自由以下组成的群组:EX-Taq聚合酶、LA-Taq聚合酶、扩展聚合酶系列以及Hi-Fi聚合酶。在又其它实施例中,DNA聚合酶是未分类的DNA聚合酶,其选自由以下组成的群组:Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶以及Tfi聚合酶。
在其它实施例中,DNA聚合酶是逆转录酶(RT)聚合酶,其选自由以下组成的群组:HIV逆转录酶、M-MLV逆转录酶以及AMV逆转录酶。在一些实施例中,聚合酶是具有DNA聚合酶活性和/或引物延伸活性的HIV逆转录酶或其片段。
合适的细菌DNA聚合酶包括(但不限于)大肠杆菌DNA聚合酶I、II和III、IV和V;大肠杆菌DNA聚合酶的克列诺片段;粪堆梭菌(Clostridium stercorarium,Cst)DNA聚合酶、热纤维梭菌(Clostridium thermocellum,Cth)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus,Bst)DNA聚合酶以及硫磺矿硫化叶菌(Sulfolobus solfataricus,Sso)DNA聚合酶。
合适的真核DNA聚合酶包括(但不限于)DNA聚合酶α、δ、ε、η、ζ、γ、β、σ、λ、μ、ι和κ以及Rev1聚合酶(末端脱氧胞苷酸转移酶)和末端脱氧核苷酸转移酶(TdT)。
合适的病毒和/或噬菌体DNA聚合酶包括(但不限于)T4 DNA聚合酶、T5 DNA聚合酶、T7 DNA聚合酶、Phi-15 DNA聚合酶、Phi-29 DNA聚合酶(参见例如美国专利第5,198,543号;还不同地称作Φ29聚合酶、phi29聚合酶、phi 29聚合酶、Phi 29聚合酶以及Phi29聚合酶);Φ15聚合酶(在本文中也被称作Phi-15聚合酶);Φ21聚合酶(Phi-21聚合酶);PZA聚合酶;PZE聚合酶;PRD1聚合酶;Nf聚合酶;M2Y聚合酶;SF5聚合酶;f1 DNA聚合酶;Cp-1聚合酶;Cp-5聚合酶;Cp-7聚合酶;PR4聚合酶;PR5聚合酶;PR722聚合酶;L17聚合酶;M13 DNA聚合酶;RB69DNA聚合酶;G1聚合酶;GA-1聚合酶;BS32聚合酶;B103聚合酶;获自任何phi-29样噬菌体的聚合酶或其衍生物等。参见例如1993年2月11日提交的美国专利第5,576204号;2007年8月23日公开的美国专利申请第2007/0196846号。
合适的古细菌DNA聚合酶包括(但不限于)热稳定和/或嗜热性DNA聚合酶,如从以下分离的DNA聚合酶:水生栖热菌(Thermus aquaticus,Taq)DNA聚合酶、丝状栖热菌(Thermus filiformis,Tfi)DNA聚合酶、兹氏热球菌(Thermococcus zilligi,Tzi)DNA聚合酶、嗜热栖热菌(Thermus thermophilus,Tth)DNA聚合酶、黄栖热菌(Thermus flavus,Tfl)DNA聚合酶、沃氏火球菌(Pyrococcus woesei,Pwo)DNA聚合酶、激烈火球菌(Pyrococcusfuriosus,Pfu)DNA聚合酶以及Turbo PfuDNA聚合酶、海滨热球菌(Thermococcuslitoralis,Tli)DNA聚合酶或Vent DNA聚合酶、火球菌属物种GB-D聚合酶(“Deep Vent”DNA聚合酶,New England Biolabs)、海栖热孢菌(Thermotoga maritima,Tma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶、鹿儿岛火球菌(Pyrococcus Kodakaraensis,KOD)DNA聚合酶、Pfx DNA聚合酶、热球菌属物种JDF-3(JDF-3)DNA聚合酶、高氏热球菌(Thermococcusgorgonarius,Tgo)DNA聚合酶、嗜酸热球菌(Thermococcus acidophilium)DNA聚合酶;嗜酸热硫化叶菌DNA聚合酶;热球菌属物种9°N-7DNA聚合酶;热球菌属物种NA1;隐蔽热网菌(Pyrodictium occultum)DNA聚合酶;沃氏甲烷球菌(Methanococcus voltae)DNA聚合酶;热自养甲烷杆菌(Methanococcus thermoautotrophicum)DNA聚合酶;詹氏甲烷球菌(Methanococcus jannaschii)DNA聚合酶;除硫球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.Tok Pol);深海火球菌(Pyrococcus abyssi)DNA聚合酶;堀越火球菌(Pyrococcushorikoshii)DNA聚合酶;海岛火球菌(Pyrococcus islandicum)DNA聚合酶;福氏热球菌(Thermococcus fumicolans)DNA聚合酶;敏捷气热菌(Aeropyrum pernix)DNA聚合酶;异二聚体DNA聚合酶DP1/DP2等。
在一些实施例中,经过修饰的聚合酶是RNA聚合酶。合适的RNA聚合酶包括(但不限于)T3、T5、T7和SP6 RNA聚合酶。
在一些实施例中,聚合酶是逆转录酶(RT)。合适的逆转录酶包括(但不限于)来自HIV、HTLV-I、HTLV-II、FeLV、FIV、SIV、AMV、MMTV和MoMuLV的逆转录酶以及市售的“上标”逆转录酶(加利福尼亚州的生命技术公司)和端粒酶。
在一些实施例中,经过修饰的聚合酶衍生自已知的DNA聚合酶。基于氨基酸序列比较和三维结构分析两者,已经将DNA聚合酶分为七种不同家族。DNA聚合酶I(pol I)或A型聚合酶家族包括修复型聚合酶大肠杆菌DNA pol I、水生栖热菌pol I以及嗜热脂肪芽孢杆菌pol I、来自一些噬菌体(T3、T5和T7)的复制型DNA聚合酶和真核线粒体DNA聚合酶。DNA聚合酶α(polα)或B型聚合酶家族包括所有真核复制DNA聚合酶以及古细菌DNA聚合酶、病毒DNA聚合酶、在各种真菌和植物的线粒体质粒中编码的DNA聚合酶以及来自噬菌体T4和RB69的聚合酶。家族C聚合酶是初级细菌染色体复制型酶。这些有时被视为家族Y的子组,其含有真核聚合酶polβ以及其它真核聚合酶,如polσ、polλ、polμ以及末端脱氧核苷酸转移酶(TdT)。家族D聚合酶都可见于古细菌的广古菌子域中并且被认为是复制型聚合酶。家族Y聚合酶由于其经由受损DNA复制的能力而被称为跨损伤合成(TLS)聚合酶。其也称为易错聚合酶,因为其在未受损模板上具有较低保真度。此家族包括Polη、Polζ、Polι(iota)、Polκ(kappa)和Rev1以及来自大肠杆菌的Pol IV和Pol V。最终,逆转录酶家族包括来自逆转录病毒的逆转录酶和真核聚合酶,通常限于端粒酶。这些聚合酶使用RNA模板来合成DNA链,并且也称为RNA依赖型DNA聚合酶。
在一些实施例中,经过修饰的聚合酶或其生物活性片段可以使用所属领域的技术人员已知的任何合适的方法或分析来加以制备。在一些实施例中,进行蛋白质工程以获得经过修饰的聚合酶或其生物活性片段的任何合适的方法都涵盖于本发明范围内。举例来说,定点突变诱发是可以用于在DNA构筑体内引入一个或多个已知或随机突变的技术。一个或多个氨基酸突变的引入可以例如相对于标准或参考聚合酶或经由核酸测序来验证。在验证后,含有氨基酸突变中的一个或多个的构筑体可以转化成细菌细胞并且表达。
典型地,在培养基中接种含有突变表达构筑体的菌落,对其进行诱导并且使其生长到所需光密度,随后采集(通常经由离心)并纯化上清液。对熟练的技术人员将立即显而易见的是,上清液可以通过任何合适的手段来加以纯化。典型地,选择用于分析型或制备型蛋白质纯化的柱。在一些实施例中,使用所述方法制备的经过修饰的聚合酶或其生物活性片段可以(但不限于)主要根据制造商的说明书在肝素柱上纯化。
在纯化后,经过修饰的聚合酶或其生物活性片段可以使用任何合适的方法来对各种聚合酶活性、特性或特征加以评定。在一些实施例中,所评定的聚合酶活性、特性或特征将取决于相关应用。举例来说,用于对长度为约300到约600bp的核酸分子进行扩增或测序的聚合酶的特性可以相对于缺乏一个或多个氨基酸修饰(例如取代、缺失或添加)的参考聚合酶来加以分析,所述特性如增加的持续合成能力和/或增加的读取长度。在另一个实例中,需要对长度为约100bp的核酸分子进行深度靶向重测序的应用可以包括聚合酶特性,如增加的原始精确度、增加的总测序通量、降低的链偏差性或减小的系统误差。在一些实施例中,所评定的一种或多种聚合酶特性可以与在高离子强度溶液(如至少120mM盐)存在下的聚合酶性能或聚合酶活性相关。
在一些实施例中,可以评定根据本文所公开的方法制备的经过修饰的聚合酶或其生物活性片段的DNA结合活性、核苷酸聚合活性、引物延伸活性、链置换活性、逆转录酶活性、3'-5'核酸外切酶(校正)活性等。
在一些实施例中,可以评定根据所述方法制备的经过修饰的聚合酶或其生物活性片段与相同条件下的参考聚合酶相比增加的精确度、增加的持续合成能力、增加的平均读取长度、增加的最小读取长度、增加的总测序通量、降低的链偏差性、减小的系统误差、{4增加的AQ20、增加的200Q17值或进行核苷酸聚合的能力。在一些实施例中,可以评定经过修饰的聚合酶或其生物活性片段在高离子强度溶液(例如具有至少120mM盐,如NaCl和/或KCl的盐溶液)存在下的任一聚合酶活性。
在一些实施例中,经过修饰的聚合酶或其生物活性片段的特征任选地在于以下特性中的任何一个或多个的变化(例如增加或减少)(常常相对于缺乏相对应一个或多个氨基酸突变的聚合酶):解离时间常数、聚合酶从给定核酸模板解离的速率、聚合酶对给定核酸模板的结合亲和力,以及与核酸测序反应相关联的特性,如平均读取长度、最小读取长度、精确度、完美读数总数、总测序通量、链偏差性、系统误差、测序反应通量的增加倍数、盐性能(即,离子强度)、AQ20、平均无误差读取长度、误差率、100Q17值、200Q17值、Q分数、原始读取精确度和持续合成能力。应理解,在本发明的说明性实施例中,经过修饰的聚合酶在乳液PCR反应中用以使模板扩增作为测序工作流的一部分,例如在固体支撑物上使模板扩增,并且在一些说明性实施例中,在固体支撑物上使模板克隆地扩增。用于制造乳液并进行乳液PCR的方法是所属领域中已知的。用于制造乳液的化合物(如生物相容性油和乳液稳定剂)是市售的(例如密苏里州圣路易斯的西格马公司(Sigma,St.Louis MO);新泽西州(NewJersey)的Uniqema)。接着测定经过扩增的模板的至少一部分的核酸序列。对于乳液PCR模板扩增步骤,将此序列测定的结果与用参考聚合酶进行的类似实验的结果相比,所述参考聚合酶如Taq聚合酶(SEQ ID NO:1)或SEQ ID:34的经过修饰的Taq聚合酶。本文所提供的实例展现此类比较测试的具体实例的性能。可以基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(IonTemplate Preparation Kit)(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(Ion Template Reagents Kit)(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(Ion Template Solutions Kit)(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了可以代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶,并且可以将所测试聚合酶的结果与用参考聚合酶产生的那些结果相比。接着将经过扩增的核酸分子加载到PGMTM 314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。
在一些实施例中,可以单独地相对于类似聚合酶的所属领域中的已知值来评定经过修饰的聚合酶或其生物活性片段。在一些实施例中,可以在类似或相同条件下相对于已知或参考聚合酶评定根据本文所公开的方法制备的经过修饰的聚合酶或其生物活性片段。在一些实施例中,条件可以包括在高离子强度溶液存在下对核酸分子进行扩增或测序。
在一些实施例中,本发明大体上涉及用于产生多种经过修饰的聚合酶或生物活性片段的方法。在一些实施例中,本发明大体上涉及使用高通量或自动化系统产生多种经过修饰的聚合酶或生物活性片段的方法。在一些实施例中,所述方法包含将多种经过修饰的聚合酶或生物活性片段与一系列蛋白质纯化所需试剂混合并且从混合物中提取经过纯化的聚合酶或生物活性片段。在一个实例中,可以在96孔或384孔培养板中制备多种随机或定点突变诱发反应物。任选地,96孔或384孔培养板的内含物可以经受初始筛检以鉴别聚合酶突变型构筑体。可以将每一个别孔的内含物(或来自初始筛检的每一孔的内含物)递送到一连串烧瓶、试管或振荡器中以便接种和诱导。在所需光密度下时,可以对烧瓶、试管或振荡器进行离心并且回收上清液。每一上清液可以经受蛋白质纯化,例如经由全自动柱纯化(例如参见Camper和Viola,《分析生物化学》,2009,第176-181页)。可以评定经过纯化的经过修饰的聚合酶或生物活性片段的聚合酶活性中的一个或组合,如DNA结合、引物延伸、链置换、逆转录酶活性等。据设想,熟练的技术人员可以使用所述方法(或在本发明的范围内的所述方法的变化形式)来鉴别多种经过修饰的聚合酶或生物活性片段。在一些方面,所述方法可以用于鉴别具有与相同条件下的参考聚合酶相比增强的精确度的多种经过修饰的聚合酶或生物活性片段。在一些实施例中,所述方法可以用于鉴别在高离子强度溶液存在下具有增强的精确度的多种经过修饰的聚合酶或其生物活性片段。在一些方面,所述方法可以用于鉴别具有与相同条件下的参考聚合酶相比增强的读取长度的多种经过修饰的聚合酶或生物活性片段。在一些实施例中,所述方法可以用于鉴别在高离子强度溶液存在下具有增强的读取长度的多种经过修饰的聚合酶或其生物活性片段。在一些方面,所述方法可以用于鉴别具有与相同条件下的参考聚合酶相比增强的热稳定性的多种经过修饰的聚合酶或生物活性片段。在一些实施例中,所述方法可以用于鉴别在高离子强度溶液存在下具有增强的热稳定性的多种经过修饰的聚合酶或其生物活性片段。在一些方面,所述方法可以用于鉴别具有与相同条件下的参考聚合酶相比降低的链偏差性和/或减小的系统误差的多种经过修饰的聚合酶或生物活性片段。在一些实施例中,所述方法可以用于鉴别在高离子强度溶液存在下具有降低的链偏差性和/或减小的系统误差的多种经过修饰的聚合酶或其生物活性片段。在一些实施例中,高离子强度溶液可以包括KCl和/或NaCl盐。在一些实施例中,高离子强度溶液可以是至少120mM盐。在一些实施例中,高离子强度溶液可以是125mM到200mM盐。在一些实施例中,高离子强度溶液可以是约130mM、150mM、200mM、225mM、250mM、275mM、300mM、350mM、400mM、450mM、500mM或更大盐浓度。在一些实施例中,高离子强度溶液可以是约125mM到约400mM盐。在一些实施例中,高离子强度溶液可以是约150mM到约275mM盐。在一些实施例中,高离子强度溶液可以是约200mM到约250mM盐。对熟练的技术人员将显而易见的是,可以使用各种其它合适的盐代替KCl和/或NaCl或与其组合。在一些实施例中,离子强度溶液可以进一步包括硫酸盐。
如熟练的技术人员将立即显而易见的,本发明概述用以产生经过修饰的聚合酶或生物活性片段库的示例性自动化和高通量方法。本发明还概述用以评定此类经过修饰的聚合酶或生物活性片段的聚合酶活性的方法。本发明还涵盖,熟练的技术人员可以容易地产生构筑体的突变诱发库,其中可以使相关聚合酶内的每个氨基酸突变。在一些实施例中,可以制备突变诱发库,其中聚合酶内的每一氨基酸残基都通过每种可能的氨基酸组合来加以突变。在一些实施例中,可以制备突变诱发库,其中聚合酶内的每一氨基酸都突变,并且其中可能的氨基酸突变的组合限于保守或非保守氨基酸取代。在两个实例中,可以产生突变诱发库,其含有可以经由用于纯化或用于初始筛检的自动化或高通量系统来应用的大量突变型构筑体。在一些实施例中,可以使用基于ISFET的测序聚合酶筛检,使用下一代(即高通量)平台(例如离子激流系统个人基因组机器和基于离子的ISFET测序芯片(加利福尼亚州的生命技术公司公司))来评定代表突变诱发库的96库或384库构筑体的培养板。在一个实例中,聚合酶筛检可以包括一种或多种代表突变诱发库的96或384培养板;其中培养板的每一孔都由与同一培养板上至少一个孔中的参考聚合酶(缺乏至少一个或多个氨基酸突变)相比含有至少一个或更多个氨基酸突变的不同构筑体(经过修饰的聚合酶)组成。在一些实施例中,参考聚合酶充当96或384培养板内的对照样品以评定同一培养板各孔内的每一经过修饰的聚合酶的聚合酶活性。在一些实施例中,培养板内的构筑体库和参考聚合酶可以进一步包括用于培养板内每一经过修饰的聚合酶的独特条码。因此,如果培养板内的每一孔都含有参考聚合酶或经过修饰的聚合酶构筑体,那么96孔培养板可以含有96个条码。在纯化后,可以评定蛋白质的突变诱发库的聚合酶活性中的一个或组合,如DNA结合、引物延伸、链置换、逆转录酶、切口起始聚合酶活性、原始精确度、增加的总测序通量、降低的链偏差性、降低的系统误差、增加的读取长度、增加的持续合成能力增加的热稳定性等。在一些实施例中,模板库可以进一步包括已知在所提出的扩增条件下表现良好的模板库,以使得良好表现的模板库可以充当基线或对照读数。
任选地,可以进一步评定经过纯化的经过修饰的聚合酶或其生物活性片段的其它特性,如在高盐存在下对核酸分子进行扩增或测序的能力。一般不认为待突变的聚合酶的来源或起源是关键的。举例来说,所述方法中可以使用真核、原核、古细菌、细菌、噬菌体或病毒聚合酶。在一些实施例中,聚合酶可以是DNA或RNA聚合酶。在一些实施例中,DNA聚合酶可以包括家族A或家族B聚合酶。在一些实施例中,DNA聚合酶可以包括热稳定的DNA聚合酶。考虑到蛋白质工程化和酶学(enzymatics)的领域,本文所提供的示例性方法应视为说明性的,并且不应以任何方式解释为限制性的。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括位于经过修饰的聚合酶的催化域内部的一个或多个氨基酸突变。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括催化域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括催化域中包含至少25、50、75、100、150或更多个连续氨基酸残基的任何部分。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括催化域的至少25个连续氨基酸残基并且可以任选地包括催化域外部的C端或N端处的一个或多个氨基酸残基。在一些实施例中,经过修饰的聚合酶或生物活性片段可以包括催化域中与任何一个或多个非催化域氨基酸残基偶合的任何25、50、75、100、150或更多个连续氨基酸残基。
在一些实施例中,经过修饰的聚合酶(或其生物活性片段)包括位于经过修饰的聚合酶的催化域内部的一个或多个氨基酸突变,并且其中所述聚合酶与以下序列中的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少25或50个连续氨基酸残基,并且与以下序列中的任一个具有至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少75个连续氨基酸残基,并且与以下序列中的任一个具有至少85%一致性:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少25或50个连续氨基酸残基,并且与以下序列中的任一个具有至少90%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少95%一致性:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少25或50个连续氨基酸残基,并且与以下序列中的任一个具有至少98%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括催化域的至少25或50个连续氨基酸残基,并且与以下序列中的任一个具有至少99%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括位于聚合酶的DNA结合域内部的一个或多个氨基酸突变。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括经过修饰的聚合酶的DNA结合域的至少25、50、75、100、150或更多个氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括DNA结合域中包含至少25、50、75、100、150或更多个连续氨基酸残基的任何部分。在一些实施例中,经过修饰的聚合酶或其生物活性片段可以包括结合域的至少25个连续氨基酸残基并且可以任选地包括结合域外部的C端或N端处的一个或多个氨基酸残基。在一些实施例中,经过修饰的聚合酶或生物活性片段可以包括结合域中与任何一个或多个非结合域氨基酸残基偶合的任何25、50、75、100、150或更多个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶(或其生物活性片段)包括位于经过修饰的聚合酶的DNA结合域内部的一个或多个氨基酸突变,并且其中所述聚合酶与以下序列中的任一个具有至少80%、85%、90%、95%、96%、97%、98%、99%或更大一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少85%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少90%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少95%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少25个连续氨基酸残基,并且与以下序列中的任一个具有至少98%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。在一些实施例中,经过修饰的聚合酶或其生物活性片段包括DNA结合域的至少50歌连续氨基酸残基,并且与以下序列中的任一个具有至少80%、85%、90%、95%、98%或99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括位于聚合酶的催化域(在本文中也被称作DNA结合裂隙)外部的一个或多个氨基酸突变。A家族DNA聚合酶、B家族DNA聚合酶和逆转录酶以及RNA依赖性RNA聚合酶的催化域是众所周知的;所有都共用共同的总结构和催化机制。所有这些聚合酶的催化域具有与右手相比的形状并且由“手掌”、“拇指”以及“手指”结构域组成。手掌域典型地含有用于磷酰基转移反应的催化位点。拇指被认为起安置双螺旋体DNA和持续合成能力和易位的作用。手指与引入的核苷酸以及其配对的模板碱基相互作用。手掌域在A、B和RT家族中是同源的,但手指和拇指的布置不同。不同聚合酶家族的拇指域公用共同的特征,含有平行或反平行的α-螺旋,其中至少一种α-螺旋与引物-模板复合物的小沟相互作用。手指域也保存安置在引物-模板复合物的平头末端处的α-螺旋。此螺旋线含有高度保守性侧链(B基元)。
已针对A家族聚合酶鉴别出三个保守性基元A、B和C。A和C基元在B家族聚合酶和RT聚合酶两者中典型地具有保守性。(Delarue等人,《蛋白质工程(Protein Engineering)》3:461-467(1990))。
在一些实施例中,对于A家族聚合酶,A基元包含共同序列:
a.
在一些实施例中,对于A家族聚合酶,B基元包含共同序列:
a.
在一些实施例中,对于A家族聚合酶,C基元包含共同序列:
a.
在一些实施例中,聚合酶任选地包含任何A家族聚合酶或其生物活性片段、突变体、变异体或截短,其中连接部分连接到A家族聚合酶或其生物活性片段、突变体、变异体或截短中位于A、B或C基元外部的任何氨基酸残基。在一些实施例中,连接部分连接到A家族聚合酶或生物活性片段中位于A基元、B基元或C基元外部的任何氨基酸残基。
A和C基元典型地形成手掌域的一部分,并且每一基元典型地含有严格保守性天冬氨酸残基,其参与所有DNA聚合酶共同的催化机制。DNA合成可以通过将磷酰基从引入的核苷酸转移到DNA的3'OH,释放聚磷酸酯部分并且形成新的DNA磷酸二酯键来加以介导。此反应典型地通过涉及两种金属离子(通常Mg2+)和两种保守性天冬氨酸残基的机制来加以催化。
在一些实施例中,A家族DNA聚合酶的基元A中的保守性谷氨酸残基在正确核苷酸并入中起重要作用,B家族成员中相对应的保守性酪氨酸也同样(Minnick等人,《美国国家科学院院刊》99:1194-1199(2002);Parsell等人,《核酸研究》35:3076-3086(2002)。基元A的保守性Leu处的突变影响复制保真度(Venkatesan等人,《生物化学杂志》281:4486-4494(2006))。
在一些实施例中,B基元含有保守性赖氨酸、酪氨酸和甘氨酸残基。已经显示,大肠杆菌pol I的B基元结合核苷酸底物并且含有已经显示于活性位点中的保守性酪氨酸。
在一些实施例中,对于B家族聚合酶,A基元包含共同序列:
在一些实施例中,对于B家族聚合酶,B基元包含共同序列:
在一些实施例中,对于B家族聚合酶,C基元包含共同序列:
a.
粗体的残基指示不变的残基。
在一些实施例中,经过修饰的聚合酶任选地包含任何B家族聚合酶或其生物活性片段、突变体、变异体或截短断,其中连接部分连接到B家族聚合酶或其生物活性片段、突变体、变异体或截短中位于A、B或C基元外部的任何氨基酸残基。在一些实施例中,连接部分连接到B家族聚合酶或生物活性片段中位于A基元、B基元或C基元外部的任何氨基酸残基。
在一些实施例中,B家族聚合酶含有六个保守性基元,其中区域I和II对应于A家族的A和C基元。区域III参与核苷酸结合并且在功能上与基元B同源。区域I、II和III在来自手掌(I)、手指(II)和拇指(III)的碱基的活性位点的中心处汇聚以产生连续保守性表面。在这些区域内,一组高度保守性残基形成分别由暴露的芳香族残基、带负电残基以及带正电残基组成的三个化学上不同的群集。举例来说,在噬菌体RB69的复制聚合酶中,这三个集群对应于以下氨基酸残基:Y416、Y567和Y391(暴露的芳香族残基),D621、D623、D411、D684和E686(带负电残基),以及K560、R482和K486(带正电残基)。参见Wang等人,《细胞(Cell)》89:1087-1099(1997)。这三个群集典型地涵盖其中引物末端和引入的核苷酸预期结合的区域。在一些实施例中,经过修饰的聚合酶任选地包含任何B家族聚合酶或其生物活性片段、突变体、变异体或截短,其中连接部分连接到B家族聚合酶或其生物活性片段、突变体、变异体或截短中位于这些保守性氨基酸群集或基元中的一个或多个外部的任何氨基酸残基。在一些实施例中,连接部分连接到B家族聚合酶或其生物活性片段、突变体、变异体或截短中位于这些保守性氨基酸群集或基元中的任一个外部的任何氨基酸残基。
RT聚合酶含有四个保守性序列基元(Poch等人,《欧洲分子生物学杂志(EMBO J.)》12:3867-3874(1989)),其中基元A和C含有保守性催化性天冬氨酸酯。对于逆转录酶功能来说,还需要基元B的完整性。
基元A的共同序列是DXXXXF/Y(SEQ ID NO:41)
基元B的共同序列是FXGXXXS/A(SEQ ID NO:42)
基元C的共同序列是
基元D的共同序列是GXXXXXXXK(SEQ ID NO:44)。
YXDD基元(基元C)(这些基元中最高度保守性的)中的突变可以消除聚合酶活性并且改变持续合成能力和保真度(Sharma等人,《抗病毒化学和化学疗法(AntiviralChemistry and Chemotherapy)》16:169-182(2005))。另外,基元D(RT聚合酶独有的回路)中的保守性赖氨酸残基是对核苷酸结合至关重要的不变残基(Canard等人,《生物化学杂志》274:35768-35776(1999))。
在一些实施例中,经过修饰的聚合酶任选地包含任何RT聚合酶或其生物活性片段、突变体、变异体或截短,其中连接部分连接到RT聚合酶或其生物活性片段、突变体、变异体或截短中位于A、B、C和D基元中的一个或多个外部的任何氨基酸残基。在一些实施例中,连接部分连接到RT聚合酶或其生物活性片段、突变体、变异体或截短中位于这些基元中的任一个外部的任何氨基酸残基。
在一些实施例中,经过修饰的聚合酶包括位于除保守性或不变残基外的任何位置处的一种或多种修饰(包括氨基酸取代、缺失、添加或化学修饰)。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少80%一致性的至少25、50、75或100个连续氨基酸残基:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少85%一致性的至少50、75、100、150、175、200个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少85%一致性的至少225、250、275、300、325、350、375、400个连续氨基酸残基:SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少90%一致性的至少50、75、100、150、200、250、300、350、400、450、500或更多个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少95%一致性的至少100、200、300、400、500、600、700或更多个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少99%一致性的至少200个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与以下序列中的任一个具有至少99%一致性的至少400个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。
在一些实施例中,除聚合酶域以外,经过修饰的聚合酶可以包括一个或多个额外功能域,包括介导新合成DNA链的校正的3'->5'(反)核酸外切酶活性或介导在DNA修复期间切口平移的5'->3'(正)核酸外切酶活性或FLAP核酸内切酶活性所需的域。在一些实施例中,经过修饰的聚合酶具有链置换活性,并且可以通过使核苷酸聚合到双链核酸模板内切口的3'端中而同时置换位于切口下游的核酸来催化核酸合成。所属领域的技术人员应了解,如由本发明所涵盖的经过修饰的聚合酶任选地也具有这些活性中的任何一种或多种。
A和B家族DNA聚合酶的3'到5'核酸外切酶校正域都含有三个保守性基元,称为ExoI、Exo II和Exo III,其中的每一个都含有对于金属结合和核酸外切酶功能来说必需的不变天冬氨酸残基。这些保守性天冬氨酸残基的改变产生保留聚合酶活性但核酸外切酶活性不足的蛋白质(Hall等人,《普通病毒学杂志(J.Gen.Virol.)》76:2999-3008(1995))。也已经鉴别影响核酸外切酶活性的5'到3'核酸外切酶域中的保守性基元和氨基酸改变(美国专利第5,466,591号)。
A家族酶的代表性实例是大肠杆菌Pol I或大肠杆菌Pol I的克列诺片段、Bst DNA聚合酶、Taq DNA聚合酶、T7 DNA聚合酶和Tth DNA聚合酶。A家族酶还包括Platinum TaqDNA聚合酶系列。
在一些实施例中,A家族酶的特征在于高DNA延长率,但可能因为不具有3'-5'核酸外切酶活性而具有较差保真度,。在一些实施例中,B家族酶由于其3'-5'核酸外切酶活性可以具有高保真度,但可能实现低DNA延长率。
其它类型的聚合酶包括例如Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶、Tfi聚合酶等。RT聚合酶包括HIV逆转录酶、莫洛尼小鼠白血病病毒(Moloney Murine Leukemia Virus,M-MLV)逆转录酶、禽成髓细胞瘤病毒(AvianMyeloblastosis Virus,AMV)逆转录酶或劳斯氏肉瘤病毒(Rous Sarcoma Virus,RSV)逆转录酶。也可使用其变异体、经过修饰的产物以及衍生物。类似地,Taq、Platinum Taq、Tth、Tli、Pfu、Pfutubo、Pyrobest、Pwo和KOD、VENT、DEEPVENT、EX-Taq、LA-Taq、TherminatorTM、扩展系列和Platinum Taq Hi-Fi都是市售的。所属领域的一般技术人员可以容易地从特定细菌中分离其它酶。
一种示例性聚合酶大肠杆菌DNA聚合酶I(“Pol I”)具有三种酶活性:5'到3'DNA聚合酶活性;介导校正的3'到5'核酸外切酶活性;以及介导在DNA修复期间的切口平移的5'到3'核酸外切酶活性。克列诺片段是当通过枯草杆菌蛋白酶对大肠杆菌Pol I进行蛋白水解裂解时产生的较大蛋白质片段。其保留聚合酶和校正核酸外切酶活性,但缺乏5'到3'核酸外切酶活性。也可获得已经过突变以去除校正核酸外切酶活性的克列诺外(exo-Klenow)片段。克列诺片段的结构显示,与DNA相互作用的高度保守性残基包括N675、N678、K635、R631、E611、T609、R835、D827、S562以及N579(Beese等人,《科学(Science)》260:352-355(1993))。
大肠杆菌DNA聚合酶I(pol I)的克列诺片段中的Arg682对于模板依赖性核苷酸结合功能至关重要,并且似乎维持DNA聚合酶的高持续合成能力(Pandey等人,《欧洲生物化学杂志(European Journal of Biochemistry)》,214:59-65(1993))。
在一些实施例中,经过修饰的聚合酶可以衍生自Taq DNA聚合酶,其是衍生自嗜热性细菌水生栖热菌的A家族DNA聚合酶。已知其最佳用于聚合酶链反应中。Taq聚合酶缺乏校正活性,并且因此具有相对低的复制保真度(Kim等人,《自然(Nature)》376:612-616(2002)。
在一些实施例中,聚合酶可以衍生自细菌噬菌体T7的T7 DNA聚合酶,其是由病毒T7基因5蛋白质(80k Da)与大肠杆菌硫氧还蛋白(12k Da)的1:1复合物组成的A家族DNA聚合酶。其缺乏5'->3'核酸外切酶域,但3'->5'核酸外切酶活性是大肠杆菌克列诺片段活性的大致1000倍。核酸外切酶活性似乎对此酶的高保真度负责并且防止链置换合成。此聚合酶典型地展现高水平的持续合成能力。
在一些实施例中,聚合酶可以衍生自KOD DNA聚合酶,其是衍生自鹿儿岛热球菌(Thermococcus kodakaraensis)的B家族DNA聚合酶。KOD聚合酶是具有高保真度和持续合成能力的热稳定DNA聚合酶。
在一些实施例中,聚合酶可以衍生自TherminatorTMTMDNA聚合酶,其也是B家族DNA聚合酶。TherminatorTM是来自热球菌属物种9oN-7的DNA聚合酶的A485L点突变(Ichida等人,《核酸研究》33:5214-5222(2005))。TherminatorTM聚合酶具有增强的并入经过修饰的底物的能力,所述底物如双脱氧核苷酸、核糖核苷酸以及无环核苷酸。
在一些实施例中,聚合酶可以衍生自Phi29聚合酶或Phi29型聚合酶,例如衍生自细菌噬菌体B103的聚合酶。Phi29和B103 DNA聚合酶是来自相关细菌噬菌体的B家族聚合酶。除A、B和C基元以外,DNA聚合酶的Phi29家族含有额外保守性基元,区域Y中的KXY(Blanco等人,《生物化学杂志》268:16763-16770(1993)。影响聚合酶活性和核苷酸结合亲和力的Phi29和B103聚合酶的突变描述于美国专利公开第20110014612号和其优先文献美国临时申请第61/307,356号、第61/299,917号、第61/299,919号、第61/293,616号、第61/293,618号、第61/289,388号、第61/263,974号、第61/245,457号、第61/242,771号、第61/184,770号以及第61/164,324号中,所述专利以全文引用的方式并入本文中。
在一些实施例中,聚合酶衍生自来自1型人类免疫缺陷病毒(HIV-1)的逆转录酶,其是由一个66kDa次单元和一个51kDa次单元组成的杂二聚体。p66次单元含有聚合酶和RNA酶H域两者;p66的蛋白水解裂解去除RNA酶H域以产生p51次单元(Wang等人,PNAS 91:7242-7246(1994))。HIV-1逆转录酶的结构显示RNA模板的2'-OH基团与逆转录酶之间的多种相互作用。p66拇指中的螺旋I的残基Ser280和Arg284参与RNA-RT相互作用,如同p66手掌中的模板夹的残基Glu89和Gln91一样。p51次单元也在RNA-DNA双螺旋体与RT之间的相互作用方面发挥作用,其中p51次单元的残基Lys395、Glu396、Lys22以及Lys390也与DNA:RNA双螺旋体相互作用(Kohlstaedt等人,《科学》256:1783-1790(1992)和Safarianos等人,《欧洲分子生物学杂志(The EMBO Journal)》20:1449-1461(2001))。
在一些实施例中,聚合酶衍生自嗜热脂肪芽孢杆菌的Bst DNA聚合酶或其任何生物活性片段。Bst聚合酶可以是家族A DNA聚合酶。天然存在的Bst DNA聚合酶的大片段等效于大肠杆菌Pol I的克列诺片段,保留聚合酶和校正核酸外切酶活性,同时缺乏5'到3'核酸外切酶活性。在一些实施例中,衍生自Bst DNA聚合酶的聚合酶可能缺乏3'到5'核酸外切酶活性。如本文所使用,术语“Bst DNA聚合酶”可以指全长蛋白质或Bst大片段。
在一些实施例中,经过修饰的聚合酶的组成为或其包含经过分离的聚合酶变异体,其具有或包含与野生型全长或野生型大片段Bst DNA聚合酶的氨基酸序列至少80%一致的氨基酸序列。在一些实施例中,经过修饰的聚合酶是经过分离的Bst DNA聚合酶变异体,其包含氨基酸序列与野生型Bst或大片段Bst DNA聚合酶的氨基酸序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的变异体。在一些实施例中,经过修饰的Bst聚合酶包括相对于Bst聚合酶(其对应于参考聚合酶)(例如野生型Bst DNA聚合酶)的一个或多个氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。
在一些实施例中,经过修饰的聚合酶的组成为或其包含经过分离的Bst DNA聚合酶变异体,其具有或包含野生型全长Bst DNA聚合酶氨基酸序列并进一步包含以下氨基酸取代中的一个或多个:His46Arg(H46R)、Glu446Gln(E446Q)和His572Arg(H572R),其中编号是相对于Bst DNA聚合酶的野生型氨基酸序列。
在一些实施例中,经过修饰的聚合酶的组成为或其包含经过分离的聚合酶变异体,其具有或包含与野生型全长Bst DNA聚合酶的氨基酸序列至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列并进一步包含以下氨基酸取代中的每一个中的一个或多个:His46Arg(H46R)、Glu446Gln(E446Q)和His572Arg(H572R),其中编号是相对于Bst DNA聚合酶的野生型全长氨基酸序列。在一些实施例中,经过修饰的聚合酶包括相对于参考聚合酶(例如缺乏一个或多个氨基酸修饰的聚合酶)的一个或多个氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ IDNO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列的至少90%一致性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ IDNO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少100个连续氨基酸残基:SEQ ID NO:1,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:1,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶的组成为或包含经过分离的聚合酶变异体,其具有或包含与以下氨基酸序列至少80%一致的氨基酸序列:SEQ ID NO:2。在一些实施例中,聚合酶是Taq DNA聚合酶的变异体,其包含与以下序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列:SEQ ID NO:2。在一些实施例中,参考聚合酶是由以下氨基酸序列组成的Taq DNA聚合酶:SEQ ID NO:2,并且经过修饰的聚合酶包括相对于参考聚合酶的一个或多个氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经过修饰的聚合酶或参考和经过修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:2。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:2,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:2,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶可以包括具有或包含以下氨基酸序列的氨基酸序列或其任何生物活性片段:SEQ ID NO:3。在一些实施例中,经过修饰的聚合酶可以包括具有或包含与以下氨基酸序列至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列的聚合酶的任何生物活性片段的氨基酸序列:SEQ ID NO:3。在一些实施例中,参考聚合酶是由以下氨基酸序列组成的Taq DNA聚合酶:SEQ ID NO:3,并且经过修饰的聚合酶包括相对于参考聚合酶的一个或多个氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经过修饰的聚合酶或参考和经过修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:3。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:3,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:3,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶的组成为或包含经过分离的聚合酶变异体,其具有或包含与以下氨基酸序列至少80%一致的氨基酸序列:SEQ ID NO:4。在一些实施例中,聚合酶是Taq DNA聚合酶的变异体,其包含与以下序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列:SEQ ID NO:4。在一些实施例中,参考聚合酶是由以下氨基酸序列组成的Taq DNA聚合酶:SEQ ID NO:4,并且经过修饰的聚合酶包括相对于参考聚合酶的一个或多个氨基酸修饰(例如氨基酸取代、缺失、添加或化学修饰)。在一些实施例中,参考聚合酶、经过修饰的聚合酶或参考和经过修饰的聚合酶两者包括在位置1处的甲硫氨酸残基的缺失或取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:4。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的热稳定性:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少90%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少95%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少98%一致性的至少100个连续氨基酸残基:SEQ ID NO:4,并且其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为与以下序列具有至少99%一致性的至少150个连续氨基酸残基:SEQ ID NO:4,其中经过修饰的聚合酶或其生物活性片段具有与以下序列相比改进的精确度:SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶,其包括经过分离的Taq DNA聚合酶变异体,所述变异体包含选自由以下组成的群组的氨基酸序列:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种经过修饰的聚合酶,其包括经过分离的Taq DNA聚合酶变异体,所述变异体包含选自由以下组成的群组的氨基酸序列:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33,并且进一步包括一个或多个非天然存在的氨基酸取代。任选地,经过修饰的聚合酶包括相对于以下氨基酸序列的一个、两个、三个、四个、五个或更多个氨基酸取代:SEQ ID NO:1或34。
在一些实施例中,参考聚合酶可以包括具有或包含以下氨基酸序列的Taq DNA聚合酶:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;其中所述经过修饰的聚合酶包含参考聚合酶的变异体,所述经过修饰的聚合酶从而进一步包括相对于所述参考聚合酶的一个、两个、三个、四个、五个或更多个氨基酸取代。在一些实施例中,经过修饰的聚合酶包含或其组成为与参考聚合酶的氨基酸序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致但典型地相对于氨基酸序列小于100%一致的氨基酸序列。在一些实施例中,相对于参考聚合酶的一个、两个、三个、四个、五个或更多个氨基酸取代可以包括至少一个保守氨基酸取代。
在一些实施例中,具有相对于参考聚合酶改进的热稳定性和/或改进的精确度的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段进一步包含聚合酶DNA结合域的至少25个连续氨基酸。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含聚合酶DNA结合域的至少50个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域的至少100个连续氨基酸残基。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域的至少100个连续氨基酸残基,同时还与以下序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包含或其组成为聚合酶DNA结合域的至少200个连续氨基酸残基,同时还与以下序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的组合物,所述多肽与以下序列具有至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸的组合物,所述核酸与以下序列具有至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是特异性针对于以下氨基酸残基的编号:SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸的组合物,所述核酸与以下序列具有至少80%一致性:SEQ ID NO:1,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基的编号:SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:1,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:2,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:3,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:4,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:5,并且具有选自由以下组成的群组的一个或多个氨基酸突变:A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:6,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:7,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:8,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:9,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:10,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:11,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:12,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:13,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:14,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:15,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:16,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:17,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:18,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:19,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:20,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:21,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:22,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:23,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:24,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:25,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:26,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:27,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:28,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:29,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:30,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:31,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E805I和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:32,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C和L828A。
在一些实施例中,本发明大体上涉及一种经过分离和纯化的多肽,其包含或其组成为与以下序列的至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性:SEQ ID NO:33,并且具有选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C和E805I。
在一些实施例中,组合物包含与以下序列的至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是特异性针对于以下氨基酸残基的编号:SEQ ID NO:1。在一些实施例中,氨基酸取代包含保守氨基酸取代。
在一些实施例中,组合物包含与以下序列的至少80%一致性:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基的编号:SEQ IDNO:1。
在一些实施例中,组合物包含与以下序列的至少85%、至少90%、至少95%、至少98%或至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33,并且进一步包含选自由以下组成的群组的至少一个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是特异性针对于以下氨基酸残基的编号:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶可以包括选自由以下组成的群组的任何一个或多个氨基酸取代:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶具有相对于参考聚合酶改进的精确度和/或改进的热稳定性。在不受任何特定操作理论限制的情况下,可以观察到在一些实施例中,上述取代中的一种或多种可以改变,例如增加或降低经过修饰的聚合酶相对于参考(例如未经修饰的)聚合酶的精确度或热稳定性。在一些实施例中,可以基于离子的测序反应中所产生信号的增加的形式观察到精确度和/或热稳定性的此类增加。
在一些实施例中,参考聚合酶、经过修饰的聚合酶或参考和经过修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种经过分离的核酸序列,其包含或其组成为编码与以下序列具有至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的核酸序列的组合物,所述核酸序列包含或其组成为编码与以下序列具有至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%一致性的多肽的核酸序列:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33,并且进一步包含选自由以下组成的群组的一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A。
在一些实施例中,本发明大体上涉及一种包含经过分离的核序列的载体,所述核序列编码选自由以下组成的群组的多肽或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33。在一些实施例中,包含编码多肽或其生物活性片段的经过分离的核酸序列的载体包括DNA聚合酶。在一些实施例中,DNA聚合酶是水生栖热菌(Taq)聚合酶。在一些实施例中,DNA聚合酶是热稳定的DNA聚合酶。在一些实施例中,DNA聚合酶衍生自热稳定的水生栖热菌(Taq)聚合酶。
在一些实施例中,本发明大体上涉及一种包含编码多肽或其生物活性片段的经过分离的核酸序列的载体,所述多肽或其生物活性片段包含Taq DNA聚合酶的同源物,其中所述Taq DNA聚合酶的同源物包括对应于以下序列中的任一个中所存在的氨基酸取代的至少一个氨基酸取代:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及一种包含经过分离的多肽的套组,所述多肽与以下序列具有至少80%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,套组包含与以下序列具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%一致性的经过分离的多肽:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,所述套组包含经过分离的多肽,其包含或其组成为与以下序列具有至少90%一致性的至少250、至少300、至少350、至少400、至少450、至少500、至少550、至少600或至少650个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述套组进一步包括一种或多种合适的缓冲液、MgCl和dNTP。
在一些实施例中,本发明大体上涉及一种用于使一种或多种核酸扩增的系统(以及相关设备、套组、方法和组合物)。在一些实施例中,所述系统可以包含与以下氨基酸序列相比具有至少一个突变(例如取代、插入、缺失、融合等)的DNA聚合酶:SEQ ID NO:1或SEQID NO:34;包含待扩增的核酸分子的固体支撑物;核苷酸的混合物(例如dNTP、ddNTP等);以及使核酸分子在固体支撑物上扩增的条件。在一些实施例中,扩增可以包括克隆扩增或桥式PCR扩增。在一些实施例中,扩增可以包括邻位连接扩增、滚环扩增、PCR扩增、等温扩增、重组酶聚合酶扩增、链置换扩增、乳液PCR扩增、等。在说明性实施例中,DNA聚合酶是包括以下突变中的任一种的经过修饰的聚合酶:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。
在一些实施例中,本发明大体上涉及具有DNA聚合酶活性并且与以下序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%一致性的聚合酶或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33,其中具有DNA聚合酶活性的聚合酶或生物活性片段包括至少一个与以下序列相比的氨基酸取代:SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,聚合酶或其生物活性片段包括至少两个、三个、四个、五个或更多个与以下序列相比的氨基酸取代:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,至少一个与以下序列相比的氨基酸取代:SEQ ID NO:1或SEQ IDNO:34,可以向聚合酶或其生物活性片段赋予有益特性。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34相比)包括改进的热稳定性、改进的读取长度、改进的模板化效率、在高离子强度溶液中改进的性能或改进的精确度。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34相比)包括富含GC和AT的核酸的链偏差性降低。所属领域的一般技术人员一般应理解,向聚合酶或生物学片段赋予的有益特性(与SEQ ID NO:1或SEQ ID NO:34的特性相比)可以通过在相同条件下通过任何适当手段评定和/或测量此类有益特性(例如,将SEQ ID NO:1的特性针对聚合酶或其生物活性片段在相同条件下相比较)来加以确定。举例来说,DNA聚合酶的精确度可以关于获自核苷酸聚合反应的最长完美读数来加以测量(典型地关于正确地包括于读数中的核苷酸数目来加以测量)。在一些实施例中,核苷酸聚合反应可以使用乳液PCR、桥式PCR或热启动PCR条件来进行。在一些实施例中,向聚合酶或其生物活性片段赋予的有益特性中的一种或多种可以通过评定测序精确度来加以确定。在一些实施例中,测序精确度可以使用任何下一代(即大规模并行、高通量)测序平台(例如离子激流系统、Illumina HiSeq或True Seq或X-10系统)来加以测定。在一些实施例中,测序精确度可以使用任何基于ISFET的测序系统来加以测定。然而,将显而易见的是,可以使用测定改进的热稳定性和/或改进的精确度的其它适当方法,并且其涵盖于本发明范围内。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为以下序列中保留聚合酶活性的生物活性片段:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33。在一些实施例中,聚合酶活性、特征或特性选自引物延伸活性、链置换活性、校正活性、切口起始聚合酶活性、逆转录酶活性、精确度、平均读取长度、热稳定性、持续合成能力、链偏差性或核苷酸聚合活性。在一些实施例中,聚合酶活性、特征或特性选自一种或多种基于测序的度量值,其是选自原始读取精确度、平均读取长度、热稳定性或持续合成能力。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为以下序列中具有聚合酶活性的生物活性片段:SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQID NO:33,所述聚合酶活性选自在相同条件下与以下序列的聚合酶活性相比改进的读取长度、改进的精确度或改进的热稳定性:SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,在高离子强度溶液存在下测定聚合酶活性。在一些实施例中,高离子强度溶液是至少120mMKcl。在一些实施例中,高离子强度溶液是125mM KCl到200mM KCl。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397V氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含L763氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含L763F氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805I氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E745氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E745T氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397V氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含L763氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含L763F氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805I氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E745氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E745T氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397、E745和L763氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E397V、E745T和L763F氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397、E745和L763氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E397V、E745T和L763F氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805和L763氨基酸取代,其中编号是相对于SEQ ID NO:1。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:1,并且进一步包含E805I和L763F氨基酸取代,其中编号是相对于SEQ ID NO:1。
在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805和L763氨基酸取代,其中编号是相对于SEQ ID NO:34。在一些实施例中,本发明大体上涉及一种基本上纯化的聚合酶,其氨基酸序列包含或其氨基酸序列组成为与以下序列的至少90%一致性:SEQ ID NO:34,并且进一步包含E805I和L763F氨基酸取代,其中编号是相对于SEQ ID NO:34。
在一些实施例中,参考聚合酶具有或包含以下氨基酸序列:SEQ ID NO:2、SEQ IDNO:3或SEQ ID NO:4,并且经过修饰的聚合酶具有或包含参考聚合酶的氨基酸序列,进一步包括一个或多个与参考聚合酶相比的氨基酸突变。在一些实施例中,氨基酸突变包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)取代指定位置处的现有氨基酸残基。在一些实施例中,氨基酸取代是保守取代;替代性地,氨基酸取代可以是非保守取代。在一些实施例中,参考聚合酶、经过修饰的聚合酶或参考和经过修饰的聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶展现选自由以下组成的群组的任何一个或多个参数相对于参考聚合酶的变化:平均读取长度、精确度、总测序通量、链偏差性、系统误差降低、在高离子强度溶液中的聚合酶性能增强、持续合成能力改进、在PCR中的性能改进、在乳液PCR中的性能。任选地,通过在基于离子的测序反应中比较参考聚合酶与经过修饰的聚合酶的性能来观察任何一个或多个参数的变化。
在不受任何特定操作理论限制的情况下,可以观察到在一些实施例中,包括所公开氨基酸取代中的一个或多个的经过修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如增加)的持续合成能力或相对于未经修饰的聚合酶改变(例如降低)的链偏差性。在一些实施例中,经过修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如增加)的精确度。在一些实施例中,经过修饰的聚合酶展现相对于参考聚合酶改变(例如增加)的平均无误差读取长度或改变(例如增加)的100Q17或200Q17观察值。在一些实施例中,经过修饰的聚合酶具有聚合酶活性。在一些实施例中,经过修饰的聚合酶或生物活性片段可以具有体内或体外引物延伸活性。
在一些实施例中,经过修饰的聚合酶中的一个或多个突变可以包括至少一个氨基酸取代。至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处发生:P6、A77、A97、L193、K240、R266、E267、L287、P291、K292、E295、E397、G418、L490、A502、S543、D578、R593、L678、S699、E713、V737、E745、L763、E790、E794、E805和L828,其中编号是相对于以下氨基酸残基:SEQ ID NO:1。在一些实施例中,经过修饰的聚合酶包括在选自此群组的位置处发生的至少两个、三个、四个、五个或更多个氨基酸取代。在一些实施例中,至少一个氨基酸取代可以任选地在选自由以下组成的群组的任何一个或多个位置处发生:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是相对于以下氨基酸序列:SEQ IDNO:1。在一些实施例中,经过修饰的聚合酶包括在选自此群组的位置处发生的至少两个、三个、四个、五个或更多个氨基酸取代。
在不受任何特定操作理论限制的情况下,可以观察到在一些实施例中,包括此类氨基酸取代中的任一个的经过修饰的聚合酶展现相对于未经修饰的聚合酶改变(例如增加或降低)的热稳定性或相对于相对应未经修饰的聚合酶或相对于参考聚合酶改变(例如增加或降低)的精确度。对所属领域的一般技术人员将显而易见的是,经过修饰的聚合酶的一些氨基酸残基可以是高度保守性氨基酸残基。预期所属领域的一般技术人员可以通过众所周知的手段来构筑、表达和测定给定聚合酶中的哪个氨基酸残基(若存在)具有高度保守性(例如,参见美国专利第5,436,149号;美国专利第6,395,524号;美国专利第6,982,144号;美国专利第7,312,059号和美国专利第8,420,325号,其全部以全文并入本文中)。
在一些实施例中,经过修饰的聚合酶可以包括Taq DNA聚合酶。在一些实施例中,聚合酶可以包括以Platinum Taq高保真度DNA聚合酶(加利福尼亚州的生命技术公司)形式市售的Taq DNA聚合酶,其包括一个或多个与参考聚合酶相比的氨基酸突变。在一些实施例中,经过修饰的聚合酶可以包括具有或包含以下氨基酸序列的Taq DNA聚合酶:SEQ ID NO:1,所述氨基酸序列是野生型Taq DNA聚合酶的氨基酸序列。
在一些实施例中,经过修饰的聚合酶包括保留可检测水平的聚合酶活性的TaqDNA聚合酶的突变体或变异体形式。为了保留Taq DNA聚合酶的聚合酶活性,将对非高度保守性的氨基酸残基进行任何取代、缺失或化学修饰,所述氨基酸残基如聚合酶活性所需的不变天冬氨酸残基。在一些实施例中,经过修饰的聚合酶可以包括Taq DNA聚合酶、热启动Taq DNA聚合酶、化学热启动Taq DNA聚合酶、Platinium Taq DNA聚合酶等。
在一些实施例中,经过修饰的聚合酶可以包括具有或包含与以下氨基酸序列至少90%一致的氨基酸序列的经过分离的聚合酶变异体:SEQ ID NO:2。在一些实施例中,聚合酶是包含以下氨基酸序列的Taq DNA聚合酶变异体:SEQ ID NO:4,其中所述变异体包含与以下序列至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致的氨基酸序列:SEQ ID NO:2。
在一些实施例中,经过修饰的聚合酶包括具有氨基酸突变E397V的Taq DNA聚合酶突变体或变异体形式,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的Taq DNA聚合酶可以包括氨基酸突变L763F,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的Taq DNA聚合酶可以包括氨基酸突变E805I,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的Taq DNA聚合酶可以包括氨基酸突变E745T,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的Taq DNA聚合酶可以包括氨基酸突变A97V,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的Taq DNA聚合酶可以包括氨基酸突变E295F,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,经过修饰的TaqDNA聚合酶可以包括氨基酸突变P6N,其中编号是相对于以下氨基酸序列:SEQ ID NO:1。在一些实施例中,包括上文突变中的一个或多个的经过修饰的聚合酶展现相对于相对应的参考聚合酶改变(例如增加或降低)的精确度(所述参考聚合酶例如未经修饰的聚合酶SEQ IDNO:1)。在一些实施例中,经过修饰的Taq聚合酶具有相对于参考聚合酶改变(例如增加或降低)的热稳定性(所述参考聚合酶例如未经修饰的聚合酶SEQ ID NO:1)。在一些实施例中,经过修饰的Taq聚合酶展现相对于参考聚合酶改变(例如增加或减少)的读取长度,或改变(例如增加或降低)的链偏差性,或改变(例如增加或降低)的持续合成能力,或改变的系统误差(例如增加或减小),或改变(例如增加或减小)的100Q17或200Q17观察值,或改变(例如增加或减小)的AQ17或AQ20值。
在一些实施例中,经过修饰的Taq聚合酶展现以下参数中的任何一个或多个相对于参考聚合酶的变化:平均读取长度、在高离子强度溶液中的性能、持续合成能力改进、模板化效率改进、热稳定性改进、在乳液PCR中的性能改进、在富含GC或AT的序列中的链偏差性降低或系统误差减小。在一个实施例中,通过在相同条件下比较参考聚合酶与经过修饰的聚合酶的性能来观察一个或多个参数的变化。任选地,一个或多个参数的变化可以使用基于离子的测序反应来加以观察。
在一些实施例中,经过修饰的聚合酶可以包括用任何其它氨基酸残基(包括天然存在和非天然的氨基酸残基)对指定位置处的现有氨基酸残基进行的至少一个氨基酸取代。在一些实施例中,氨基酸取代是保守取代;替代性地,氨基酸取代可以是非保守取代。在一些实施例中,参考聚合酶、经过修饰的Taq聚合酶或参考和经过修饰的Taq聚合酶两者可以进一步包括在位置1处的甲硫氨酸残基缺失或在位置1处的甲硫氨酸残基被任何其它氨基酸残基取代,其中编号是相对于以下氨基酸序列:SEQ ID NO:1
如熟练的技术人员将容易地了解,本发明的范围不仅涵盖本文所公开的特定氨基酸和/或核苷酸序列,还涵盖例如编码具有本文所描述的功能特性的基因和/或肽的多种相关序列。举例来说,本发明的范围和精神涵盖编码本文所公开的各种聚合酶的保守变异体的任何核苷酸和氨基酸序列。对熟练的技术人员也将立即显而易见的是,本文中氨基酸序列所公开的经过修饰的聚合酶可以在无过度实验的情况下转换成相对应的核苷酸序列,例如使用许多可自由获得的序列转换应用(例如“计算机操作(in-silco)”)。
预期所属领域的技术人员在已经鉴别出向经过修饰的聚合酶赋予有益特性(如与参考聚合酶相比改进的热稳定性、改进的精确度、改进的持续合成能力、改进的读取长度)的本文所公开的一个或多个氨基酸取代的情况下,可以在无过度实验的情况下转移到不同聚合酶物种或聚合酶家族。因此,在聚合酶中鉴别出提供改变的催化或动力学特性的氨基酸突变后,可以使用所属领域的一般技术人员已知的方法(如氨基酸或核苷酸序列比对)来筛检氨基酸突变,以确定所述氨基酸突变是否可以容易地转移到不同聚合酶,如不同物种中。在一些实施例中,可转移(或同源)氨基酸突变可以包括增强特性的氨基酸突变,所述特性如增加的读取长度、增加的原始精确度、降低的链偏差性、减小的系统误差、增加的总测序通量、增加的无误差读取长度、增加的持续合成能力、增加的AQ值等。在一些实施例中,可转移(或同源)氨基酸突变可以包括将一个或多个氨基酸突变转移到DNA聚合酶家族(如DNA聚合酶家族A或DNA聚合酶家族B)内或其之间的另一个聚合酶中。在一些实施例中,可转移(或同源)氨基酸突变可以包括将一个或多个氨基酸突变转移到DNA聚合酶家族内或其之间的一个或多个聚合酶中,如跨细菌、病毒、古细菌、真核或噬菌体的DNA聚合酶。
在一些实施例中,根据本发明的经过修饰的聚合酶可以包括具有一个或多个与本文所公开的氨基酸突变中的一个或多个同源的氨基酸突变(如取代、插入或缺失)的聚合酶(同源物)。举例来说,本发明以其范围包括以下经过修饰的聚合酶,所述经过修饰的聚合酶具有与在以下序列中所提供氨基酸突变中的任一个同源的一个或多个氨基酸突变:SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32和SEQ ID NO:33。在一些实施例中,根据本发明的经过修饰的聚合酶可以包括以下任何聚合酶:所述聚合酶具有与本文对Taq DNA聚合酶所提供的一个或多个氨基酸突变同源的一个或多个氨基酸突变(例如对应于一个或多个以下氨基酸突变的一个或多个同源氨基酸突变:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33)。一种用于判定聚合酶是否是本文所公开的一种或多种经过修饰的聚合酶的同源物的方法包括针对“测试”聚合酶比较经过修饰的聚合酶的氨基酸或核酸序列比对。举例来说,美国国家生物技术信息中心(NCBI)提供允许用户判定氨基酸序列是否以另一种生物体中的同源物形式存在的多种电子数据库(例如,“同源基因(HomoloGene)”和“蛋白质集群(Protein Clusters)”)。
在一些实施例中,根据本发明的经过修饰的聚合酶或聚合酶生物活性片段可以包括具有与Taq DNA聚合酶一个或多个氨基酸突变同源的一个或多个氨基酸突变的聚合酶,所述氨基酸突变包括选自由以下组成的群组的任何一个或多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中所述编号是相对于以下氨基酸序列:SEQ ID NO:1。
在一些实施例中,经过修饰的聚合酶或其生物活性片段包括与选自由以下组成的群组的任何两个、三个、四个、五个或更多个氨基酸取代同源的两个、三个、四个、五个或更多个氨基酸突变:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A,其中编号是相对于以下氨基酸序列:SEQID NO:1。
在一些实施例中,具有与本文对Taq DNA聚合酶所公开的氨基酸突变同源的一个或多个氨基酸突变的经过修饰的聚合酶或聚合酶任何生物活性片段可以任选地包括至少一个被设计成用半胱氨酸残基代替非半胱氨酸氨基酸残基的氨基酸取代。一般技术人员将容易地能够基于核苷酸序列与相对应蛋白质序列之间的已知对应性来确定编码本发明氨基酸序列中的任一个的核苷酸序列。
在一些实施例中,经过修饰的聚合酶或聚合酶任何生物活性片段可以包括一个或多个生物素部分。如本文所使用,术语“生物素”和“生物素部分”以及其变化形式包含生物素(顺-六氢-2-氧代-1H-噻吩并[3,4]咪唑-4-戊酸)以及其任何衍生物和类似物,包括生物素类化合物。此类化合物包括例如生物素-e-N-赖氨酸、生物胞素酰肼、2-亚氨基生物素的氨基或硫氢基衍生物和生物素基-ε-氨基己酸-N-羟基琥珀酰亚胺酯、磺酸基琥珀酰亚胺亚氨基生物素、生物素溴乙酰基酰肼、对重氮苯甲酰基生物胞素、3-(N-马来酰亚氨基丙酰基)生物胞素等,以及可以特异性结合到抗生物素蛋白部分的任何生物素变异体。如本文所使用,术语“抗生物素蛋白”和“抗生物素蛋白部分”以及其变化形式包含天然卵白糖蛋白抗生物素蛋白以及可以特异性结合到生物素部分的抗生物素蛋白的任何衍生物、类似物以及其它非天然形式。在一些实施例中,抗生物素蛋白部分可以包含抗生物素蛋白的脱糖基化形式、由所选链霉菌属(例如阿维丁链霉菌(Streptomyces avidinii))病毒株产生的细菌抗生蛋白链菌素到截短抗生蛋白链菌素以及到重组抗生物素蛋白和抗生蛋白链菌素以及天然、脱糖基化和重组抗生物素蛋白的衍生物和天然、重组和截短抗生蛋白链菌素的衍生物,例如N-酰基抗生物素蛋白(例如N-乙酰基、N-苯二甲酰基以及N-丁二酰基抗生物素蛋白)以及市售产品以及Neutralite包括天然和重组抗生物素蛋白和抗生蛋白链菌素以及衍生分子(例如非糖基化抗生物素蛋白、N-酰基抗生物素蛋白以及截短抗生蛋白链菌素)的抗生物素蛋白类型分子的所有形式都涵盖在术语“抗生物素蛋白”和“抗生物素蛋白部分”内。典型地但未必,抗生物素蛋白以四聚蛋白质形式存在,其中四种四聚体中的每一种能够结合至少一个生物素部分。如本文所使用,术语“生物素-抗生物素蛋白键”和其变化形式是指在生物素部分与抗生物素蛋白部分之间形成的特异性连接。典型地,生物素部分可以高亲和力结合到抗生物素蛋白部分,其解离常数Kd典型地为大约10-14到10-15mol/L。典型地,此类结合经由非共价相互作用发生
在一些实施例中,经过修饰的聚合酶或聚合酶任何生物活性片段可以包括相对于未经修饰或参考聚合酶的一个或多个经过修饰或被取代的氨基酸,并且可以进一步包括连接到所述一个或多个经过修饰或被取代的氨基酸中的至少一个的生物素部分。生物素部分可以使用任何合适的连接方法连接到经过修饰的聚合酶。在一些实施例中,经过修饰的聚合酶包括一个或多个半胱氨酸替换取代,并且连接部分包括连接到一个或多个半胱氨酸替换取代中的至少一个的生物素部分。在一些实施例中,经过修饰的聚合酶可以经过化学修饰以可逆地失活,以使得其用热量加以活化(参见例如U.S.5,677,152,Birch等人)。在这些实施例中,经过修饰的聚合酶较适合于热启动扩增方法,如热启动PCR方法。
在一些实施例中,经过修饰的聚合酶是生物素化的聚合酶。如本文所使用,术语“生物素化”和其变化形式是指生物素与其它部分的任何共价或非共价加合物,所述其它部分如生物分子,例如蛋白质、核酸(包括DNA、RNA、DNA/RNA嵌合分子、核酸类似物以及肽核酸);蛋白质(包括酶、肽以及抗体);碳水化合物;脂质等。
在一些实施例中,本发明还大体上涉及包含经过修饰的聚合酶的组合物(以及相关方法、套组、系统和设备),所述经过修饰的聚合酶包括相对于参考聚合酶的至少一个氨基酸修饰,其中所述经过修饰的聚合酶具有相对于参考聚合酶改进的持续合成能力、改进的热稳定性和/或改进的精确度。
在一些实施例中,本发明大体上涉及一种用于将至少一种核苷酸并入到引物中的方法,其包含:使包括模板核酸的核酸复合物在一种或多种核苷酸存在下与引物和经过修饰的聚合酶接触,以及使用所述经经过修饰的聚合酶以模板依赖性方式将所述一种或多种核苷酸中的至少一种并入到所述引物中。
用于核苷酸并入的方法在所属领域中是众所周知的,并且典型地包含使用聚合酶反应混合物,其中使聚合酶与模板核酸在核苷酸并入条件下接触。当核苷酸并入反应包含使核苷酸聚合到引物末端上时,所述过程典型地称为“引物延伸”。典型地但未必,此类核苷酸并入以模板依赖性方式发生。引物延伸和其它核苷酸并入分析典型地通过在核苷酸并入条件下使模板核酸在核苷酸存在下在水溶液中与聚合酶接触来进行。在一些实施例中,核苷酸并入反应可以包括引物,其可以任选地与模板杂交以形成引物-模板双螺旋体。典型的核苷酸并入条件在模板、聚合酶、核苷酸以及任选地引物在合适的水性调配物中彼此混合,从而形成核苷酸并入反应混合物(或引物延伸混合物)后实现。水性调配物可以任选地包括二价阳离子和/或盐,尤其Mg++和/或Ca++离子。水性调配物可以任选地包括二价阴离子和/或盐,尤其SO4 2-。典型的核苷酸并入条件已经包括时间、温度、pH、试剂、缓冲液、试剂、盐、辅因子、核苷酸、靶DNA、引物DNA、酶(如核酸依赖性聚合酶)、量和/或反应中组分的比率等众所周知的参数。试剂或缓冲液可以包括单价离子源,如KCl、乙酸钾、乙酸铵、谷氨酸钾、NH4Cl或硫酸铵。试剂或缓冲液可以包括二价离子源,如Mg2+和/或Mn2+、MgCl2或乙酸镁。在一些实施例中,试剂或缓冲液可以包括洗涤剂来源,如Triton和/或Tween。大多数聚合酶在约5.0到约9.5的pH范围,更典型地在约pH 7与约pH 9之间,有时在约pH 6到约pH 8之间,并且有时在pH 7与8之间展现一定水平的核苷酸并入活性。在一些实施例中,核苷酸聚合缓冲液可以包括螯合剂,如EDTA和/或EGTA等。尽管在一些实施例中,核苷酸并入反应可以包括缓冲剂,如Tris、麦黄酮(Tricine)、HEPES、MOPS、ACES或MES,其可以提供约5.0到约9.5的pH范围,可以任选地在进行需要检测离子副产物的基于离子的反应时减少或省去此类缓冲剂。在一些实施例中,核苷酸并入反应可以包括海藻糖。进行核酸合成的方法是众所周知的,并且在所属领域中得到充分实践并且传授广泛范围的核酸合成技术的参考文献是可容易获得的。关于进行核酸合成(包括例如模板依赖性核苷酸并入以及引物延伸方法)的一些示例性传授内容可以见于例如Kim等人,《自然》376:612-616(2002);Ichida等人,《核酸研究》33:5214-5222(2005);Pandey等人,《欧洲生物化学杂志》,214:59-65(1993);Blanco等人,《生物化学杂志》268:16763-16770(1993);美国专利申请第12/002781号,现以美国专利公开第2009/0026082号公开;美国专利申请第12/474897号,现以美国专利公开第2010/0137143号公开;和美国专利申请第12/492844号,现以美国专利公开第2010/0282617号公开;美国专利申请第12/748359号,现以美国专利公开第20110014612号公开。考虑到在所属领域中引物延伸和其它核苷酸并入反应的大量传授内容,使用本发明的经过修饰的聚合酶来进行核苷酸并入的合适的反应条件对熟练的技术人员将是立即显而易见的。在一些实施例中,方法(以及相关套组、设备、系统和组合物)可以包括并入一种或多种核苷酸类似物和/或可逆终止子。
在一些实施例中,本发明大体上涉及适用于使用以下聚合酶进行核苷酸聚合反应的试剂(例如缓冲液组合物)和套组,所述聚合酶包括此处所描述的示例性经过修饰的聚合酶中的任一种。核苷酸聚合反应可以包括(但不限于)核苷酸并入反应(包括模板依赖性和模板非依赖性核苷酸并入反应)以及引物延伸反应。在一些实施例中,缓冲液组合物可以包括以下中的任何一种或多种:单价金属盐、二价金属盐、二价阴离子以及洗涤剂。举例来说,缓冲液组合物可以包括钾盐或钠盐。在一些实施例中,缓冲液组合物可以包括锰盐或镁盐。在一些实施例中,缓冲液组合物可以包括硫酸盐,如硫酸钾和/或硫酸镁。在一些实施例中,缓冲液组合物可以包括洗涤剂。在一些实施例中,缓冲液组合物可以包括选自由Triton和Tween组成的群组的洗涤剂。在一些实施例中,缓冲液可以包括用于热启动扩增步骤的试剂,如寡核苷酸或适体。
在一些实施例中,缓冲液组合物可以包括至少一种钾盐、至少一种锰盐以及Triton X-100(Pierce Biochemicals)。盐可以任选地包括氯化物盐或硫酸盐。在一些实施例中,缓冲液组合物可以包括约7.3到约8.0的pH。在一些实施例中,缓冲液组合物可以包括约7.4到约7.9的pH。在一些实施例中,缓冲液组合物包括浓度在5-250mM、50-225mM、125-200mM之间的钾盐(取决于二价)
在一些实施例中,缓冲液组合物包括浓度在1mM与20mM之间的镁或锰盐。在一些实施例中,缓冲液组合物包括浓度在6-15mM之间的镁或锰盐。
在一些实施例中,缓冲液组合物包括浓度在1mM与100mM之间的硫酸盐。在一些实施例中,缓冲液组合物包括浓度在5-50mM之间的硫酸盐。
在一些实施例中,缓冲液组合物包括浓度在0.001%到1%之间的洗涤剂(例如Triton X-100或Tween-20)。在一些实施例中,缓冲液组合物包括浓度在0.0025%到0.0125%之间的洗涤剂(例如Triton X-100或Tween-20)。
在一些实施例中,所公开的经过修饰的聚合酶组合物(以及相关方法、系统、设备和套组)可以用于从核酸分子获得序列信息。从核酸分子获得序列信息的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。使用所公开经过修饰的聚合酶的合适的测序方法包括(但不限于):桑格测序(Sanger sequencing)、基于连接的测序(也称为杂交测序)和合成测序。基于模板核酸的序列,合成测序方法典型地涉及模板依赖性核酸合成(例如使用与模板核酸或自引发模板杂交的引物,如所属领域的一般技术人员将了解)。也就是说,新合成核酸链的序列典型地与模板核酸序列互补,并且因此知道核苷酸并入到合成链中的次序和一致性可以提供关于模板核酸链序列的信息。当通过经过修饰的聚合酶使核苷酸以模板依赖性方式聚合时,使用本发明经过修饰的聚合酶的合成测序将典型地涉及检测核苷酸并入的次序和一致性。在一些实施例中,合成测序可以包括光学单分子测序(例如,在无经过标记的核苷酸存在下测序)。或者,使用经过标记的核苷酸的合成测序的一些示例性方法包括单分子测序(参见例如美国专利第7,329,492号和U.S.7,033,764),其典型地涉及使用经过标记的核苷酸来检测核苷酸并入。在一些实施例中,所公开的聚合酶组合物(以及相关方法、套组、系统和设备)可以用于获得序列信息。在一些实施例中,所公开的经过修饰的聚合酶可以用于获得用于以下的序列信息:全基因组测序、扩增子测序、靶向重测序、单分子测序、多重和/或条码化测序或配对端测序应用等。
在一些实施例中,所公开的经过修饰的聚合酶组合物以及相关方法、系统、设备和套组可以用于使核酸分子扩增。在一些实施例中,核酸分子可以使用经过修饰的聚合酶通过任何适当方法来加以扩增。在一些实施例中,核酸分子可以例如通过焦磷酸测序、基于离子的ISFET测序、PCR、乳液PCR或桥式聚合酶链反应来加以扩增。
在一些实施例中,所公开的经过修饰的聚合酶组合物(以及相关方法、系统、设备和套组)可以用于产生核酸库。在一些实施例中,所公开的经过修饰的聚合酶组合物可以用于产生用于多种下游工艺的核酸库。用于产生核酸库的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。取决于聚合,合适的方法包括(但不限于)使用乳液PCR、桥式PCR、PCR、qPCR、RT-PCR、巢式贴片PCR以及核酸扩增的其它形式产生的核酸库。在一些实施例中,所述方法可以包括模板依赖性核酸扩增。在一些实施例中,所述方法可以包括引物:模板双螺旋体或核酸模板,根据所述引物:模板双螺旋体或核酸模板,经过修饰的聚合酶可以进行核苷酸并入。在一些实施例中,核酸可以包括具有二级结构的单链核酸,所述二级结构如发夹或茎环,其可以提供在聚合期间经过修饰的聚合酶可以并入核苷酸的单链突出端。在一些实施例中,使用根据本发明的经过修饰的聚合酶中的一种或多种产生核酸库的方法可以包括产生长度为50、100、200、300、400、500、600、700、800或更多个碱基对的核酸库。在一些实施例中,经过修饰的聚合酶可以进行核苷酸并入的核酸模板可以附接、连接或结合到支撑物,如固体支撑物。在一些实施例中,支撑物可以包括平面支撑物,如载玻片或流动池。在一些实施例中,支撑物可以包括粒子,如核酸测序珠粒(例如Ion SphereTM粒子(加利福尼亚州的生命技术公司)。
在一些实施例中,本发明大体上涉及一种用于产生核酸库的方法,其包含使核酸模板与经过修饰的聚合酶和一种或多种dNTP在聚合条件下接触;从而将一种或多种dNTP并入到核酸模板中以产生所述核酸库。在一些实施例中,所述方法可以进一步包括在高离子强度溶液存在下产生核酸库或对核酸库进行测序。在一些实施例中,本发明大体上涉及在高离子强度溶液存在下保留聚合酶活性的经过修饰的聚合酶。在一些实施例中,高离子强度溶液可以是至少120mM盐。在一些实施例中,高离子强度溶液可以是125mM到200mM盐。在一些实施例中,所述盐可以包括钾盐和/或钠盐。在一些实施例中,所述盐可以包括NaCl和/或KCl。在一些实施例中,高离子强度溶液可以进一步包括硫酸盐。在一些实施例中,在相同条件下与缺乏相对应氨基酸突变中的一个或多个的参考聚合酶相比,经过修饰的聚合酶能够在高离子强度溶液存在下对核酸分子进行扩增(和/或测序)达到更大容量(例如由精确度所测量)。在一些实施例中,在相同条件下与缺乏所述氨基酸突变中的一个或多个的参考聚合酶相比,经过修饰的聚合酶能够在高离子强度溶液存在下对核酸分子进行扩增(和/或测序)达到更大容量(例如由热稳定性所测量)。在一些实施例中,在相同条件下与缺乏所述氨基酸突变中的一个或多个的参考聚合酶相比,经过修饰的聚合酶能够在高离子强度溶液存在下对核酸分子进行扩增(和/或测序)达到更大容量(例如由持续合成能力所测量)。
任选地,所述方法进一步包括在聚合条件下重复添加一种或多种dNTP以将多种dNTP并入到核酸模板中以产生核酸库。
在一些实施例中,所述方法可以进一步包括在聚合期间检测核苷酸并入副产物。在一些实施例中,核苷酸并入副产物可以包括氢和/或磷酸根离子。
在一些实施例中,所述方法进一步包括测定核酸库中并入的dNTP的一致性。在一些实施例中,所述方法进一步包括测定核酸库中并入的核苷酸的数目。在一些实施例中,检测可以进一步包括对核酸库进行测序。
在一些实施例中,所公开的经过修饰的聚合酶组合物(以及相关方法、系统、设备和套组)可以用于经由核苷酸并入事件期间副产物形成的产生来检测核苷酸并入。检测核苷酸并入副产物的许多方法是所属领域中已知的,并且将容易了解,所有此类方法都在本发明的范围内。核苷酸副产物检测的合适的方法包括(但不限于)检测氢离子、无机磷酸根、无机焦磷酸根等。若干这些副产物检测方法典型地涉及模板依赖性核苷酸并入。
在一些实施例中,本发明的经过修饰的聚合酶可以用于进行无标记核酸测序,并且尤其基于离子的核酸测序。无标记核酸测序的概念(包括基于离子的核酸测序)包括以全文引用的方式并入的以下参考文献:Rothberg等人,美国专利公开第2009/0026082号、第2009/0127589号、第2010/0301398号、第2010/0300895号、第2010/0300559号、第2010/0197507号和第2010/0137143号,其以全文引用的方式并入本文中。简单来说,在此类核酸测序应用中,通过检测聚合酶催化的核酸合成反应的天然副产物的存在来确定核苷酸并入,所述副产物包括氢离子、聚磷酸根、PPi以及Pi(例如在焦磷酸酶存在下)。
在基于离子的核酸测序的典型实施例中,通过检测由聚合酶催化的核酸合成反应(包括例如引物延伸反应)产生的氢离子的存在和/或浓度来检测核苷酸并入。在一个实施例中,对可操作地结合到引物和聚合酶并且位于反应腔室(如上文所引用的Rothberg等人中所公开的微孔)内的模板进行将聚合酶催化的核苷酸添加到引物(“添加步骤”)中后接洗涤(“洗涤步骤”)的重复循环。在一些实施例中,此类模板可以克隆群体形式附接到固体支撑物,如微粒、核酸测序珠粒等,并且将所述克隆群体加载到反应腔室。如本文所使用,“可操作地结合”意味着引物粘接到模板以使得引物可以通过聚合酶延伸并且聚合酶结合到此类引物-模板双螺旋体或与其极为接近以使得每当供应足够核苷酸时,发生引物延伸。
在循环的每一添加步骤中,聚合酶通过以模板依赖性方式并入添加的核苷酸来使引物延伸,以使得核苷酸仅在模板中的下一个碱基是所添加的核苷酸的补体时才并入。如果存在一个互补碱基,那么存在一次并入,如果存在两个互补碱基,那么存在两次并入,如果存在三个互补碱基,那么存在三次并入,以此类推。对每一此类并入,释放有氢离子,并且模板释放氢离子群体共同地改变反应腔室的局部pH。在一些实施例中,氢离子的产生与模板中的连续互补碱基数目(以及具有参与延伸反应的引物和聚合酶的模板分子的总数)成正比(例如单调相关)。因此,当模板中存在许多连续一致互补碱基(即,均聚物区域)时,所产生的氢离子的数目以及因此局部pH变化的幅值与连续一致互补碱基的数目成正比。如果模板中的下一个碱基不与所添加的核苷酸互补,那么不会发生并入并且不会释放氢离子。
在一些实施例中,在添加核苷酸的每一步骤之后,进行洗涤步骤,其中使用在预定pH下的无缓冲洗涤溶液来去除前述步骤的核苷酸以防止随后循环中的误并入(不完全延伸)。在一些实施例中,在添加核苷酸的每一步骤之后,可以进行额外步骤,其中用核苷酸破坏剂(如腺苷三磷酸双磷酸酶)处理反应腔室以消除残留在腔室中的任何残余核苷酸,从而使后续循环中假延伸的机率减到最小。在一些实施例中,可以包括处理作为洗涤步骤自身的一部分。
在一个示例性实施例中,将不同种类(或“类型”)的核苷酸依次添加到反应腔室中,以使得每种反应物一次一个地暴露于不同核苷酸类型中。举例来说,核苷酸类型可以按以下顺序添加:dATP、dCTP、dGTP、dTTP、dATP、dCTP、dGTP、dTTP等;其中每次暴露后接洗涤步骤。取决于所需序列信息长度,循环可以重复50次、100次、200次、300次、400次、500次、750次或更多次。在一些实施例中,取决于所需测序信息,可以改变将各种核苷酸依次施加到反应腔室中(即,流循环)所花费的时间。举例来说,当对长核酸分子进行测序时,流循环可以在一些情况下减少以减少对整个核酸分子进行测序所需的总时间。在一些实施例中,可以增加流循环,例如当对短核酸或扩增子进行测序时。在一些实施例中,流循环可以是约0.5秒到约3秒。在一些实施例中,流循环可以是约1秒到约1.5秒。
在一个实施例中,本发明大体上涉及一种检测核苷酸并入的方法,其包括:使用经过修饰的聚合酶来进行核苷酸并入并且产生所述核苷酸并入的一种或多种副产物;和检测所述核苷酸并入的所述一种或多种副产物中的至少一种的存在,从而检测所述核苷酸并入。
在一些实施例中,所述方法可以进一步包括重复进行和检测步骤至少一次。在一些实施例中,在其它方面类似或相同的反应条件下,经过修饰的聚合酶展现相对于参考聚合酶增加的读取长度和/或持续合成能力。
在一些实施例中,检测测序副产物的存在包括使反应混合物与能够感测所述测序副产物存在的传感器接触。所述传感器可以包括场效应晶体管,例如chemFET或ISFET。在一些实施例中,核苷酸并入的测序副产物可以包括氢离子、染料连接部分、聚磷酸根、焦磷酸根或磷酸根部分,并且检测测序副产物的存在包括使用ISFET来检测所述测序副产物。在一些实施例中,检测步骤包括使用ISFET来检测氢离子。
在一些实施例中,经过修饰的聚合酶包括连接到桥接部分的聚合酶。桥接部分任选地经由经过修饰的聚合酶内的一个或多个附接位点连接到聚合酶。在一些实施例中,桥接部分经由连接部分连接到聚合酶。连接部分可以连接到聚合酶的一个或多个附接位点中的至少一个。在一些实施例中,经过修饰的聚合酶的聚合酶包括单一附接位点,并且桥接部分经由单一连接位点直接或经由连接部分连接到聚合酶。在一些实施例中,单一附接位点可以连接到生物素部分,并且桥接部分可以包括抗生物素蛋白部分。在一些实施例中,桥接部分经由至少一个生物素-抗生物素蛋白键连接到聚合酶。在一些实施例中,在其它方面类似或相同的反应条件下,经过修饰的聚合酶展现相对于参考聚合酶增加的读取长度和/或持续合成能力和/或读取精确度、增加的总通量、降低的链偏差性、减小的系统误差。
在一些实施例中,本发明大体上涉及一种检测核苷酸聚合反应期间离子浓度变化的方法,其包括:使用经过修饰的聚合酶来进行核苷酸聚合反应,所述经过修饰的聚合酶包括连接到桥接部分的聚合酶,其中至少一种类型的离子的浓度在核苷酸聚合反应时程期间变化;和检测指示至少一种类型的离子的浓度变化的信号。
在一些实施例中,本发明大体上涉及一种检测核苷酸聚合反应期间离子浓度变化的方法,其包括:使用经过修饰的聚合酶来进行核苷酸聚合反应,所述经过修饰的聚合酶包括连接到桥接部分的聚合酶,其中至少一种类型的离子的浓度在核苷酸聚合反应时程期间变化;和检测指示至少一种类型的离子的浓度变化的信号。
在一些实施例中,所述方法可以进一步包括重复进行和检测步骤至少一次。在一些实施例中,检测至少一种类型的离子的浓度变化包括使用能够感测副产物的存在的传感器。所述传感器可以包括场效应晶体管,例如chemFET或ISFET。在一些实施例中,至少离子类型包括氢离子、聚磷酸根、焦磷酸根或磷酸根部分,并且检测至少一种类型的离子的浓度变化包括使用ISFET来检测所述至少一种类型的离子。在一些实施例中,至少一种类型的离子包括氢离子,并且检测至少一种类型的离子的存在包括使用ISFET来检测氢离子。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰,并且其中所述经过修饰的聚合酶或其生物活性片段具有与参考聚合酶相比改进的精确度、覆盖度和/或持续合成能力;以及使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板接触,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰,并且其中所述经过修饰的聚合酶或其生物活性片段具有相对于参考聚合酶增加的热稳定性;以及使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。在一些实施例中,所述方法包括在高离子强度溶液存在下使用经过修饰的聚合酶或其生物活性片段使一种或多种核苷酸中的至少一种聚合。在一些实施例中,高离子强度溶液可以包括超过100mM KCl的溶液。在一些实施例中,高离子强度溶液包括至少120mM KCl的溶液。在一些实施例中,高离子强度溶液包括125mM到200mM KCl的溶液。
在一些实施例中,所述方法可以进一步包括使至少一种核苷酸中的一种以模板依赖性方式聚合。在一些实施例中,聚合在热循环条件下进行。在一些实施例中,所述方法可以进一步包括在接触之前、期间或之后使引物与核酸模板杂交,并且其中所述聚合包括使用经过修饰的聚合酶或其生物活性片段使至少一种核苷酸中的一种聚合到所述引物的末端上。在一些实施例中,聚合在能够检测到至少一种核苷酸通过经过修饰的聚合酶或其生物活性片段而聚合的传感器附近进行。在一些实施例中,所述方法可以进一步包括使用传感器来检测指示至少一种核苷酸通过经过修饰的聚合酶或其生物活性片段而聚合的信号。在一些实施例中,传感器是ISFET。在一些实施例中,传感器可以包括聚合反应内的可检测标记或可检测试剂。
在一些实施例中,本发明大体上涉及用于进行核酸扩增的方法(以及相关套组、设备、系统和组合物),其包含或其组成为产生具有经过修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,所述经过修饰的聚合酶典型地与SEQ ID NO:1或SEQ ID NO:34具有70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰并且具有相对于参考聚合酶改进的热稳定性;以及使所述扩增反应混合物经受扩增条件,其中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合到所述引物的末端上。在一些实施例中,具有相对于参考聚合酶改进的热稳定性的经过修饰的聚合酶或其生物活性片段(所述参考聚合酶例如,SEQ IDNO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及用于进行核酸扩增的方法(以及相关套组、设备、系统和组合物),其包含或其组成为产生具有经过修饰的聚合酶或其生物活性片段、引物、核酸模板以及一种或多种核苷酸的扩增反应混合物,所述经过修饰的聚合酶典型地与SEQ ID NO:1或SEQ ID NO:34具有70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列一致性,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰并且具有相对于参考聚合酶改进的精确度;以及使所述扩增反应混合物经受扩增条件,其中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合到所述引物的末端上。在一些实施例中,具有相对于参考聚合酶改进的精确度的经过修饰的聚合酶或生物活性片段(所述参考聚合酶例如,SEQ ID NO:1或SEQ ID NO:34)包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在说明性实施例中,所述方法是乳液PCR方法。由此,应理解,向乳液油组合物中添加扩增反应混合物,随后使核酸模板暴露于扩增条件中。添加可能进行数秒时段而非全部一次性,并且可以在搅拌乳液油组合物的同时发生。可以接着搅拌包括乳液油和扩增反应混合物的溶液例如持续30秒到30分钟,1分钟到20分钟,2分钟到10分钟或例如5分钟,随后暴露于扩增条件中。扩增可以在于搅拌后将反应混合物分配到PCR相容位置(其可以接着加载到热循环仪上)中之后发生。在某些实施例中,乳液PCR在包括120到200mM盐,如120mM到150mM KCl的反应混合物中进行。
在一些实施例中,所述方法进一步包括测定通过经过修饰的聚合酶聚合的一种或多种核苷酸的一致性。在一些实施例中,所述方法进一步包括测定通过经过修饰的聚合酶聚合的核苷酸的编号。在一些实施例中,鉴别出通过经过修饰的聚合酶聚合的一种或多种核苷酸的至少50%。在一些实施例中,鉴别出基本上所有通过经过修饰的聚合酶聚合的一种或多种核苷酸。在一些实施例中,聚合在高离子强度溶液存在下发生。在一些实施例中,高离子强度溶液包含125mM到200mM盐。在一些实施例中,聚合在至少120mM盐的离子强度溶液存在下发生。在一些实施例中,高离子强度溶液包含KCl和/或NaCl。
在一些实施例中,本发明大体上涉及用于进行核苷酸聚合反应的方法(以及相关套组、系统、设备和组合物),所述方法包含或其组成为将经过修饰的聚合酶或其生物活性片段在一种或多种核苷酸存在下与核酸模板混合,其中所述经过修饰的聚合酶或其生物活性片段包括相对于参考聚合酶的一个或多个氨基酸修饰(所述参考聚合酶如SEQ ID NO:1或SEQ ID NO:34;和在混合物中使用所述经过修饰的聚合酶或其生物活性片段使所述一种或多种核苷酸中的至少一种聚合。在一些实施例中,经过修饰的聚合酶或其生物活性片段具有增加的精确度,如通过在高离子强度溶液存在下测量增加的精确度所确定。在一些实施例中,高离子强度溶液是指具有至少120mM KCl的用于进行核苷酸聚合的反应混合物。在一些实施例中,高离子强度溶液包括125mM到200mM KCl的溶液。
在一些实施例中,所述方法(以及相关套组、设备、系统和组合物)包含经过修饰的聚合酶或其生物活性片段,其包含或其组成为与以下序列的至少80%一致性:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及用于检测核苷酸并入的方法(以及相关套组、系统、设备和组合物),所述方法包含或其组成为使用经过修饰的聚合酶或其生物活性片段、核酸模板和一种或多种核苷酸三磷酸酯来进行核苷酸并入反应,所述经过修饰的聚合酶或其生物活性片段与以下序列具有至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;产生所述核苷酸并入;以及检测所述核苷酸并入。检测核苷酸并入可以经由任何适当手段进行,如PAGE、荧光、dPCR量化、核苷酸副产物产生(例如氢离子或焦磷酸根检测;合适的核苷酸副产物检测系统包括(但不限于)下一代(即大规模并行、高通量)测序平台,如Rain Dance、Roche 454和离子激流系统))或核苷酸延伸产物检测(例如延伸产物的光学检测或经过标记的核苷酸延伸产物的检测)。在一些实施例中,所述用于检测核苷酸并入的方法(以及相关套组、系统、设备和组合物)包括或其组成为使用经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少95%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述检测核苷酸并入的方法包括或其组成为使用经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少98%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述检测核苷酸并入的方法包括或其组成为通过经过修饰的聚合酶或其生物活性片段来检测核苷酸并入,所述经过修饰的聚合酶或其生物活性片段包括与以下序列的至少99%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,所述方法进一步包含测定核苷酸并入中一种或多种核苷酸的一致性。在一些实施例中,核苷酸并入的副产物是氢离子。在一些实施例中,核苷酸并入的副产物是焦磷酸根。在一些实施例中,核苷酸并入的副产物是经过标记的核苷酸延伸产物。在一些实施例中,检测核苷酸并入的方法包括在乳液PCR或桥式PCR条件下产生核苷酸并入。
在一些实施例中,本发明大体上涉及用于检测核苷酸聚合反应期间离子浓度变化的方法(以及相关套组、系统、设备和组合物),其包含或其组成为在待于第一核苷酸聚合反应期间并入的一种或多种核苷酸存在下对核酸模板或核酸库进行第一核苷酸聚合反应,其中所述第一核苷酸聚合反应包括与以下序列具有至少80%一致性的经过修饰的聚合酶或其生物活性片段:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和进行第二核苷酸聚合反应,其中所述第二核苷酸聚合反应检测第二核苷酸聚合反应时程期间至少一种类型的离子浓度变化并且提供指示至少一种类型离子的离子浓度变化的信号。在一些实施例中,离子是氢离子。在一些实施例中,离子是焦磷酸根离子。在一些实施例中,指示离子浓度变化的信号是聚合反应中氢离子产生的相对增加。在一些实施例中,至少一种类型的离子浓度变化的检测使用ISFET来加以监测。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少90%一致性的聚合酶的至少150个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少95%一致性的聚合酶的至少200个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少98%一致性的聚合酶的至少250个连续氨基酸残基:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。在一些实施例中,来自第一核苷酸聚合反应的经过修饰的聚合酶或生物活性片段包含或其组成为与以下序列具有至少99%一致性的聚合酶:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33。
在一些实施例中,本发明大体上涉及用于使核酸扩增的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使核酸与包含与以下序列的至少80%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,扩增使用聚合酶链反应、乳液聚合酶链反应、等温扩增反应、重组酶聚合酶扩增反应、邻位连接扩增、滚环扩增或链置换扩增来进行。在一些实施例中,扩增包括在溶液中使核酸克隆地扩增。在一些实施例中,扩增包括在固体支撑物上使核酸克隆地扩增,所述固体支撑物如核酸珠粒、流动池、核酸阵列或存在于固体支撑物表面上的孔。在一些实施例中,扩增使用包含热稳定DNA聚合酶的聚合酶或生物活性片段来进行。在一些实施例中,聚合酶或生物活性片段包含具有与参考聚合酶相比改进的热稳定性的DNA聚合酶,所述参考聚合酶如SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,聚合酶或生物活性片段包含具有与参考聚合酶相比改进的精确度的DNA聚合酶,所述参考聚合酶如SEQID NO:1或SEQ ID NO:34。
在一些实施例中,所述用于使核酸扩增的方法(以及相关套组、系统、设备和组合物)包含使核酸与包含以下序列的至少90%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,聚合酶或生物活性片段包含具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的DNA聚合酶:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少95%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少98%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,用于使核酸扩增的方法包含使核酸与包含与以下序列的至少99%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,所述方法包括具有与使用由以下序列编码的DNA聚合酶在相同扩增条件下获得的平均读取长度相比改进的平均读取长度的聚合酶或生物活性片段:SEQ ID NO:1或SEQ ID NO:34。
在一些实施例中,平均读取长度通过以下来加以确定:跨所有读数来分析使用本文所提供的经过修饰的聚合酶中的一种或多种而获得的经过扩增的核酸的读取长度,以确立平均读取长度,和将所述平均读取长度与使用参考聚合酶而获得的平均读取长度相比较。
在一些实施例中,本发明大体上涉及用于使核酸扩增的方法,其包含或其组成为使核酸与包含与以下序列的至少80%一致性的聚合酶或其生物活性片段在适合于核酸扩增的条件下接触:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32或SEQ ID NO:33;和使所述核酸扩增。在一些实施例中,扩增通过具有与参考样品相比改进的模板化效率的聚合酶或生物活性片段来进行,所述参考样品如SEQ ID NO:1或SEQ ID NO:34。在一些实施例中,用于使核酸扩增的方法包含在乳液PCR条件下使核酸扩增。在一些实施例中,用于使核酸扩增的方法包含在桥式PCR条件下使核酸扩增。在一些实施例中,桥式PCR条件包括使经过扩增的核酸中的一种或多种与固体支撑物杂交。在一些实施例中,经过杂化的一种或多种经过扩增的核酸可以用作用于进一步扩增的模板。在一些实施例中,经过修饰的聚合酶或其生物活性片段包含衍生自水生栖热菌DNA聚合酶(Taq)的聚合酶SEQ ID NO:1是水生栖热菌(Taq)DNA聚合酶的全长野生型核酸序列。在一些实施例中,Taq DNA聚合酶可以在本文所描述的方法、套组、设备、系统和组合物中用作参考聚合酶。
在一些实施例中,本发明大体上涉及用于合成核酸的方法(以及相关套组、系统、设备和组合物),其包含或其组成为使用经过修饰的聚合酶或其生物活性片段将至少一种核苷酸并入到引物的末端上,所述经过修饰的聚合酶或其生物活性片段与以下序列具有至少90%一致性:SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32或SEQ ID NO:33。任选地,所述方法进一步包含检测至少一种核苷酸向引物末端上的并入。在一些实施例中,所述方法进一步包括测定并入到引物末端上的至少一种核苷酸中的至少一种的一致性。在一些实施例中,所述方法可以包括测定并入到引物末端上的所有核苷酸的一致性。在一些实施例中,所述方法包括以模板依赖性方式合成核酸。在一些实施例中,所述方法可以包括在溶液中、在固体支撑物上或在乳液(如emPCR)中合成核酸。
在一些实施例中,本文提供包括至少两个容器(如试管)的套组,所述容器各自含有一种或多种如本文所提供的反应混合物或反应混合物组分,如核苷酸三磷酸酯和/或有效用于核酸聚合、扩增和/或测序反应的缓冲液。所述容器中的至少一个包括本发明的经过修饰的聚合酶或其生物活性片段,并且一个或多个其它试管可以包括例如适合于本文所提供的一种方法的核苷酸和/或缓冲液。在一些实施例中,套组可以是虚拟套组,其中多种单独试剂在一起列出、销售和/或出售,如在列出可以一起购买的不同试剂的网页或智能手机应用上。
在一些实施例中,适用于进行核酸聚合反应的套组包括缓冲液、至少一种类型的核苷酸三磷酸酯以及本发明的经过修饰的聚合酶或其生物活性片段。
在一些实施例中,适用于进行核酸聚合反应的套组包括缓冲液、至少一种类型的核苷酸三磷酸酯、任选地盐(如氯化钠或氯化钾和任选地MgCl2),以及包含本发明的经过修饰的聚合酶或其生物活性片段的第二试管。包含聚合酶的试管可以包括稳定剂和其它组分,如丙三醇和洗涤剂,如例如Tween-20或NP-40。在一些说明性实施例中,套组可以包括第三容器,其含有任选地含有用于进行本文所提供的方法的引物的固体支撑物,如珠粒。在某一实施例中,所述套组可以进一步包括以下试管,其包括适用于形成用于乳液PCR的乳液的油并且任选地包括乳液稳定剂。举例来说并且并不打算进行限制,此类试管可以包括生物相容性矿物油、Allox 4912和Span 80,
在一些实施例中,套组的一个试管包括缓冲液组合物,其包括以下中的任何一种或多种:单价金属盐、二价金属盐、二价阴离子和洗涤剂。举例来说,缓冲液组合物可以包括钾盐或钠盐。举例来说,缓冲液组合物可以包括钾盐或钠盐。举例来说,缓冲液组合物可以包括50到200mM盐、50到100mM盐、120到200mM盐,如120到150mM KCl。在一些实施例中,缓冲液组合物可以包括锰盐或镁盐。在一些实施例中,缓冲液组合物可以包括硫酸盐,如硫酸钾和/或硫酸镁。在一些实施例中,缓冲液组合物可以包括洗涤剂。在一些实施例中,缓冲液组合物可以包括洗涤剂,如Triton和/或Tween。
在一些实施例中,所述套组包括具有缓冲液组合物的试管,所述缓冲液组合物包括至少一种钾盐、至少一种锰盐和Triton X-100(Pierce Biochemicals)。盐可以任选地包括氯化物盐或硫酸盐。在一些实施例中,缓冲液组合物可以包括约7.3到约8.0的pH。在一些实施例中,缓冲液组合物可以包括约7.4到约7.9的pH。在一些实施例中,缓冲液组合物包括浓度在5-250mM、50-225mM、125-200mM之间的钾盐(取决于二价)
在一些实施例中,包括于套组试管中的缓冲液组合物包括浓度在1mM与20mM之间的镁盐或锰盐。在一些实施例中,缓冲液组合物包括浓度在6-15mM之间的镁或锰盐。在一些实施例中,缓冲液组合物包括浓度在1mM与100mM之间的硫酸盐。在一些实施例中,缓冲液组合物包括浓度在5-50mM之间的硫酸盐。在一些实施例中,套组的缓冲液组合物包括浓度在0.001%到1%之间的洗涤剂(例如Triton X-100或Tween-20)。在一些实施例中,缓冲液组合物包括浓度在0.0025%到0.0125%之间的洗涤剂(例如Triton X-100或Tween-20)。
在一些实施例中,所述套组进一步包括核酸捕获珠粒。这些套组可以包括具有乳液油(如矿物油)的试管。
以下非限制性实例仅借助于说明示例性实施例提供,并且决不限制本发明的范围和精神。此外,应理解,本文中所公开或要求的任何本发明涵盖本文所描述的任何一个或多个特征的所有变型、组合以及排列。任何一个或多个特征可以明确地从权利要求排除,即使特定排除未明确阐述于本文中。还应理解,除非所属领域的一般技术人员将以其它方式理解,否则根据本文所公开的特定方法或所属领域中已知的其它方法,公开用于方法中的试剂意图与涉及使用所述试剂的所述方法同义(并且提供支持)。另外,除非所属领域的一般技术人员将以其它方式理解,否则在说明书和/或权利要求公开一种方法的情况下,本文所公开的试剂中的任何一种或多种可以用于所述方法中。
实例
实例1:示例性经过修饰的聚合酶的产生和纯化
经由定点突变诱发将氨基酸突变引入到具有以下氨基酸序列的示例性参考聚合酶中:SEQ ID NO:1。在此实例中,野生型全长Taq DNA聚合酶(长度为832个氨基酸)用作参考聚合酶,由其经由定点饱和突变诱发来引入示例性突变。
此处,SEQ ID NO:1中位于甲硫氨酸(在SEQ ID NO:1的氨基酸位置1处)之后的831个氨基酸残基在沿聚合酶的每一氨基酸残基处被每一可能的氨基酸取代。将编码这些经过修饰的聚合酶的重组表达构筑体转化到细菌中。将含有表达构筑体的菌落接种到BRM培养基中,生长到OD=0.600,并且通过添加IPTG达到1mM的最终浓度来进行诱导。接着在37℃下使细胞另外生长3小时。
在6000rpm下离心经过诱导的细胞10分钟,丢弃上清液,并且使细胞再悬浮于再悬浮缓冲液(10mM Tris,pH 7.5,100mM NaCl)中。在60的设定(幅值)下超声处理再悬浮的细胞一分钟,并且接着放置在冰上1分钟。以此方式重复超声处理总共5次。在65℃下培育样品10分钟。将样品在9000rpm下离心30分钟。回收上清液并且在肝素柱上进一步纯化。
与以下序列相比评定经过纯化的聚合酶的表达和/或聚合酶活性:SEQ ID NO:1。沿WT Taq DNA聚合酶整个长度被取代的氨基酸残基的数目是831。在沿聚合酶的每一氨基酸残基处观察到的的氨基酸变异体的平均数目是每氨基酸残基17.8个变异体。使用此方法实现的聚合酶克隆体(各自由与SEQ ID NO:1相比的单一氨基酸取代组成)的总数是14,833。特征远优于对使用SEQ ID NO:1在标准乳液PCR条件下的聚合酶性能所观察到的特征的克隆体数目是332个克隆体。这些优越的特征或特性包括热稳定性,和/或在125mM KCl或NaCL中的聚合酶活性,和/或当在测序反应中所分析核酸的模板乳液PCR扩增步骤中使用突变型聚合酶时,与测序反应相关联的以下特征或特性中的至少一个:读取长度、精确度、链偏差性、系统误差和总测序通量。评定二级特征的克隆体的数目是31个克隆体,其中每一克隆体都由与以下序列相比的单一氨基酸取代组成:SEQ ID NO:1。如本文所提供,示例性经过修饰的聚合酶SEQ ID NO:5到SEQ ID NO:33是由与以下序列相比的单一氨基酸取代组成的经过修饰的聚合酶:SEQ ID NO:1。
实例2:示例性双重、三重和四重修饰的聚合酶的产生和纯化
经由定点突变诱发将双重、三重和四重氨基酸取代引入到具有以下氨基酸序列的示例性参考聚合酶中:SEQ ID NO:1。在此实例中,野生型全长Taq DNA聚合酶(SEQ ID NO:1)用作参考聚合酶,由其引入双重、三重和四重氨基酸突变。
此处,根据实例1制备经过修饰的聚合酶。评定二级特征的31个克隆中的若干个用作根据实例1中所阐述的方法将多个单一氨基酸取代组合到参考聚合酶中的基础。
简单来说,来自实例1的相关克隆体评定为聚合酶性能优于相同emPCR条件下的WTTaq DNA聚合酶。接着经由定点突变诱发将所选择的个别氨基酸取代引入到参考聚合酶(SEQ ID NO:1)中以产生多种不同双重、三重和四重氨基酸取代聚合酶。将编码这些经过修饰的聚合酶的重组表达构筑体转化到细菌中。将含有表达构筑体的菌落接种到BRM培养基中,生长到OD=0.600,并且通过添加IPTG达到1mM的最终浓度来进行诱导。接着在37℃下使细胞另外生长3小时。
在6000rpm下离心经过诱导的细胞10分钟,丢弃上清液,并且使细胞再悬浮于再悬浮缓冲液(10mM Tris,pH 7.5,100mM NaCl)中。在60的设定(幅值)下超声处理再悬浮的细胞一分钟,并且接着放置在冰上1分钟。以此方式重复超声处理总共5次。在65℃下培育样品10分钟。将样品在9000rpm下离心30分钟。回收上清液并且在肝素柱上进一步纯化。
与以下序列相比评定经过纯化的双重、三重和四重聚合酶的表达和/或聚合酶活性:SEQ ID NO:1。如本文所提供,SEQ ID NO:3和SEQ ID NO:4分别表示示例性双重和三重氨基酸取代聚合酶,其具有在乳液PCR条件下优于WT Taq DNA聚合酶(SEQ ID NO:1)的PCR性能。这些优越的特征或特性包括热稳定性,和/或在125mM KCl或NaCL中的聚合酶活性,和/或当在测序反应中所分析核酸的模板乳液PCR扩增步骤中使用突变型聚合酶时,与测序反应相关联的以下特征或特性中的至少一个:读取长度、精确度、链偏差性、系统误差和总测序通量。相信这些改进至少部分地是持续合成能力增加的结果。
SEQ ID NO:3由双重氨基酸取代聚合酶(L763F+E805I)组成,其中编号是相对于WTTaq DNA聚合酶(SEQ ID NO:1)。
SEQ ID NO:4由三重氨基酸取代聚合酶(E397V+E745T+L763F)组成,其中编号是相对于WT Taq DNA聚合酶(SEQ ID NO:1)。
实例3:在乳液PCR中比较经过修饰的聚合酶和参考聚合酶的性能
基本上如实例1中所描述,对包含包括氨基酸取代E397V(其中编号是相对于SEQID NO:1氨基酸序列)的突变型Taq DNA聚合酶(SEQ ID NO:2)的经过修饰经过分离的聚合酶进行纯化。接着评估经过修饰的聚合酶(SEQ ID NO:2)和参考聚合酶(SEQ ID NO:1)(对照反应)两者在相同条件下的基于乳液的PCR反应中的性能。
待在乳液PCR条件下扩增的核酸分子库包括已知在标准emPCR条件下尤其难以扩增的扩增子。核酸分子库包括有包括较高或极高GC含量(>60%GC)的55个扩增子;具有较高或极高AT含量(>60%AT)的42个扩增子;包括不同长度的均聚物(HP)区域(例如2HP-9HP)的299歌扩增子;在标准emPCR条件下过早减弱的95个扩增子;具有320bp插入物长度的20个扩增子;以及具有420bp插入物长度的20个扩增子。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对核酸分子库进行衔接子接合和尺寸选择。接着基本上根据IonXpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)(以全文引用的方式并入本文中)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。接着将经过扩增的核酸分子加载到PGMTM314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
分析使用参考聚合酶或经过修饰的聚合酶得到的测序数据以测量AQ20平均读取长度(MRL)、链偏差性、碱基覆盖度、精确度、测序通量(Mb)以及覆盖度均匀性。
使用PGMTM测序系统供应的标准软件,测量和比较使用参考聚合酶或经过修饰的聚合酶用于emPCR的测序反应数据。包括氨基酸取代E397V的示例性经过修饰的聚合酶(SEQID NO:2)提供相对于参考聚合酶(SEQ ID NO:1)(数据未示出)显著地增加的AQ20 MRL读数、降低的链偏差性、增加的碱基覆盖度、增加的精确度、增加的测序通量(Mb)以及增加的覆盖度均匀性。
对应于此实例中所提供经过修饰的聚合酶的氨基酸序列是SEQ ID NO:2。对所属领域的一般技术人员将立即显而易见的是,本发明所公开或提出的经过修饰的聚合酶中的任何一种或多种都可以容易地转化(例如逆向转译)成编码所述经过修饰的聚合酶的相对应核酸序列。对熟练的技术人员也将显而易见的是,由于密码子的简并性质,每一多肽的核酸序列是可变的。举例来说,编码亮氨酸存在六个密码子(CTT、CTC、CTA、CTG、TTA和TTG)。因此,在此密码子的位置1处的碱基可以是C或T,此密码子的位置2始终是T,并且在位置3处的碱基可以是T、C、A或G。因此,本发明所公开或提出的任何经过修饰的聚合酶都可以转译成简并密码子核酸序列中的任何一个或多个。
实例4:评估经过修饰的聚合酶在高离子强度乳液PCR中的性能
根据实例1制备由单一氨基酸取代组成的多种经过修饰的聚合酶。接着评估经过修饰的DNA聚合酶在乳液PCR中的性能以基本上根据实例3产生核酸库。待在乳液PCR条件下扩增的核酸分子库包括已知在标准emPCR条件(参见实例3)下尤其难以扩增的扩增子。
在此实例中,进行盐滴定实验以测定经过修饰的聚合酶在高离子强度条件下的功能性。盐滴定包括在75mM盐、100mM盐和高离子强度溶液(125mM盐)下评估。在此实例中,高离子强度条件包括125mM KCl。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对核酸分子库进行衔接子接合和尺寸选择。接着基本上根据IonXpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的核酸分子加载到PGMTM314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
图1A-1E描绘根据实例1制备并且在emPCR条件下在各种盐浓度下评估的由单一氨基酸取代组成的若干种经过修饰的聚合酶的示例性结果。在每一盐浓度下的第一条形(从左到右阅读)表示对每一经过修饰的聚合酶所获得的测序通量。在每一盐浓度下的第二条形(从左到右阅读)表示对每一经过修饰的聚合酶所获得的平均读取长度(MRL)。在每一盐浓度下的最后一个条形(从左到右阅读)表示关键信号(其是展现emPCR是否发生的对照物)。一般来说,对于所呈现的五种经过修饰的聚合酶中的每一种,与emPCR反应期间的75mMKCl相比,测序通量水平在包括125mM KCl的反应条件中增加。
实例5:评估双重氨基酸取代突变型聚合酶在乳液PCR中的性能
将根据实例2制备的包含Taq DNA聚合酶双重氨基酸取代(E397V+E745T,其中编号是相对于SEQ ID NO:1的氨基酸残基)的经过修饰的聚合酶在乳液PCR(emPCR)反应中的性能与具有单一氨基酸取代的Taq DNA聚合酶(SEQ ID NO:34)相比以产生核酸库。
核酸库由沼泽红假单胞菌(Rhodopseudomonas palustris)(其是GC含量为65.05%的5,459,213个碱基对环形染色体(参见Larimer等人,《自然·生物技术(NatureBiotechnology)》,2004,第22卷,第1期,第55-61页)产生,并且在高离子强度条件(125mM盐;此处,125mM KCl)下加以评估。
将使用经过修饰的聚合酶获自emPCR步骤的库在下游应用于使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对沼泽红假单胞菌库进行衔接子接合和尺寸选择(此处,插入物是420bp插入物)。接着基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的库加载到PGMTM 314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
分析在高离子强度emPCR期间使用经过修饰的聚合酶所获得的所得测序数据以测量AQ20碱基的数目、精确度以及420bp插入物的平均完美读取长度。如此实例中所概述进行的示例性测序操作的数据显示于图2A1-2B2中。如可见,获自双重氨基酸取代聚合酶(E397V+E745T)的来自125mM KCl emPCR条件的测序数据具有与单一氨基酸取代聚合酶(SEQ IDNO:34)相比改进的AQ20读数(386bp对比359bp)、改进的读取精确度(99.8%对比99.6%)和改进的完美读取长度(331bp对比290bp)。由于已经在emPCR工艺期间在高离子强度条件下产生大量核酸库,故两种经过修饰的DNA聚合酶都能够产生大量测序数据。然而,双重氨基酸取代聚合酶胜过相同条件下的单一氨基酸聚合酶取代(SEQ ID NO:34)。
实例6:氨基酸取代Taq聚合酶突变体在乳液PCR中的性能
将根据实例1制备的由不同单一氨基酸取代组成的多种经过修饰的聚合酶在乳液PCR反应中的性能与也由单一氨基酸取代组成的Taq DNA聚合酶突变体(SEQ ID NO:34)相比以产生核酸库。核酸库由沼泽红假单胞菌产生,并且在各种离子强度条件(例如75mm到150mM KCl)下加以评估。
将使用经过修饰的聚合酶获自emPCR的库在下游应用于使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对沼泽红假单胞菌库进行衔接子接合和尺寸选择(此处,插入物是420bp插入物)。接着基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的库加载到PGMTM 314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
分析在emPCR期间使用经过修饰的聚合酶所获得的所得示例性测序数据以测量AQ20总碱基计数的数目、AQ17平均值、AQ20平均值、覆盖度均匀性、链偏差性、总碱基覆盖度、系统测序误差(SSE)以及其它基准。如此实例中所概述进行的测序操作的数据显示于图3A-3B中。如可见,获自单一氨基酸取代聚合酶中的若干种的测序数据具有与单一氨基酸取代聚合酶(SEQ ID NO:34)相比改进的AQ20总碱基计数、改进的AQ20读数、降低的链偏差性和减小的SSE。举例来说,所述单一氨基酸取代聚合酶(E397V、E794C或R593G)各自胜过相同条件下的单一氨基酸聚合酶取代(SEQ ID NO:34)。
实例7:评估突变型聚合酶的热稳定性(GC覆盖度)
将包含对具有SEQ ID NO:2氨基酸序列的Taq DNA聚合酶的单一氨基酸取代(E397V)的经过修饰的聚合酶在乳液PCR反应中的性能与Taq DNA聚合酶的不同单一氨基酸取代(SEQ ID NO:34)相比以产生核酸库。核酸库由含有超过65%GC含量的沼泽红假单胞菌产生。评估每一突变型聚合酶在emPCR期间在高离子强度溶液(例如125mM KCl)下起作用的能力。
将使用经过修饰的Taq DNA聚合酶获自emPCR步骤的库在下游应用于使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对沼泽红假单胞菌库进行衔接子接合和尺寸选择(此处,插入物是420bp插入物)。接着基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的库加载到PGMTM 314测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
如此实例中所概述的使用经过修饰的Taq DNA聚合酶所获得的所得示例性测序数据显示于图4。在图4中,“Taqlr1”是指SEQ ID NO:34(D732R);而提及“Hit#1”是指氨基酸取代“E397V”(SEQ ID NO:2)。Taqlr1或Taq-LR1聚合酶经过工程化以具有比野生型Taq聚合酶更高的模板亲和力。此增加的模板亲和力已经允许对更长的库进行模板化,推测其由改进的保真度和持续合成能力引起。如由数据显而易见的,单一氨基酸取代聚合酶“E397V”的读取长度、测序通量和覆盖度均匀性胜过相同emPCR条件下的Taq-LR1(SEQ ID NO:34)。
另外,在emPCR期间扩增的核酸库是来自具有至少65%GC含量的细菌物种的库。在所属领域中众所周知的是,具有高GC含量的核酸分子的核酸扩增通常比非富含GC的目标困难(McDowell等人,《核酸研究》,1998;26:3340-3347)。在所属领域中还众所周知的是,GC含量预测熔融温度。因此,高GC含量基因组将具有比较低GC含量基因组更高的熔融温度。此处,“E397V”修饰的聚合酶与以下序列相比提供对高GC含量核酸库的明显更大的扩增:SEQID NO:34。基于此实例中的整体测序数据,确定经过修饰的聚合酶(SEQ ID NO:2)引起每千兆字节测序数据的基因组覆盖度少于5个间隙;而SEQ ID NO:34提供每千兆字节测序数据的基因组覆盖度为至少99个间隙。
精确并如实地对富含GC的生物体和富含GC的区域的含量进行测序的能力适用于多种领域,包括细菌研究,其中若干细菌物种具有大于65%GC含量(例如,一些链霉菌和分枝杆菌物种)。产生每千兆字节测序数据的基因组覆盖度为99或更多个间隙的聚合酶比产生每千兆字节测序数据的基因组覆盖度少于20、10或5个间隙的基因组图谱的聚合酶更不适用于DNA测序、检测方法等。为了使用户使用前一聚合酶来完成所述基因组,用户将需要使用“修整反应”来进行基因组的额外扩增,所述“修整反应”包含设计和购买一对引物以用于每千兆字节测序数据的每一间隙。在得到成功设计后,每千兆字节测序数据99或更多个引物对反应必须经历足够扩增以覆盖跨越全基因组存在的间隙。然而,在使用后一聚合酶(例如,SEQ ID NO:2)的情况下,用户可以在单个emPCR反应中确立大多数沼泽红假单胞菌基因组。用户仅在必要时需要制备每千兆字节测序数据5个引物对来完成基因组。
在不受理论限制的情况下,如本文所定义的GC含量覆盖度改进的经过修饰的聚合酶也可以对应于热稳定性改进的经过修饰的聚合酶(参见实例10)。在emPCR期间,必须使核酸库变性以便进行扩增步骤。如果核酸库的GC含量较高,则很可能核酸库将不大可能变性,或所存在的任何引物都将正确地粘接到模板链上,并且因此,经过修饰的聚合酶不大可能引发引物聚合。发现经过修饰的聚合酶“E397V”具有与SEQ ID NO:1相比更高的在96℃下的热稳定性(参见实例10)。经过修饰的聚合酶“E397V”还展现与96℃下的相同反应相比,在97℃下更高的覆盖度均匀性和更长的读取长度(参见图4。)因此,经过修饰的聚合酶“E397V”具有与相同emPCR条件下的SEQ ID NO:1相比更大的热稳定性。
实例8:评估双重氨基酸取代突变体在乳液PCR中的聚合酶性能
在此实例中,根据实例2制备各自具有双重氨基酸取代(E397V+E745T;P6N+E295F;P6N+E397V或E745T+E794C)的四种聚合酶,并且将其在高离子强度条件下的emPCR反应中的性能与具有单一氨基酸取代的Taq DNA聚合酶(SEQ ID NO:34)相比。
使用大肠杆菌500bp插入物来制备核酸库。将获自emPCR反应的核酸库在下游应用于使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对模板DNA进行纯化、衔接子接合和尺寸选择。接着基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的库加载到PGMTM 318测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
分析使用经过修饰的聚合酶在高离子强度emPCR(125mM KCl)下所获得的所得测序数据以测量长度为5bp、6bp或7bp的均聚物(HP)的AQ20碱基数目、原始读取精确度和真精确度。如此实例中所概述进行的示例性测序操作的数据显示于图5A-5B中。如可见,在所有观察到的度量值中,来自由双重氨基酸取代组成的所有四种聚合酶的测序数据都胜过单一氨基酸取代聚合酶(SEQ ID NO:34)。
实例9:评估双重和三重氨基酸取代聚合酶突变体在乳液PCR中的性能
在此实例中,根据实例1或实例2制备各自具有一个或多个氨基酸取代的三种聚合酶,并且将其在高离子强度条件(例如125mM KCl)下的emPCR反应中的性能与具有单一氨基酸取代的Taq DNA聚合酶(SEQ ID NO:34)相比。
使用大肠杆菌500bp插入物来制备核酸库。将获自emPCR反应的核酸库在下游应用于使用离子激流PGMTM测序系统(离子激流系统,部件号4462917)的基于离子的测序反应中。
简单来说,如离子片段库套组用户指南(离子激流系统,部件号4466464;公开部件号4467320Rev B)中所描述对模板DNA进行纯化、衔接子接合和尺寸选择。接着基本上根据Ion XpressTM模板套组v 2.0用户指南(离子激流系统,部件号4469004A)中所提供的方案并且使用离子模板制备套组(离子激流系统/生命技术公司,部件号4466461)、离子模板试剂套组(离子激流系统/生命技术公司,部件号4466462)和离子模板溶液套组(离子激流系统/生命技术公司,部件号4466463)中所提供的试剂来使核酸分子库扩增到Ion SphereTM粒子(离子激流系统,部件号602-1075-01)上,除了代替套组中所提供的聚合酶使用所测试聚合酶或参考聚合酶。
接着将经过扩增的库加载到PGMTM 318测序芯片中。将芯片加载到离子激流PGMTM测序系统(离子激流系统/生命技术公司,部件号4462917)中并且基本上根据离子测序套组v2.0用户指南(离子激流系统/生命技术公司,部件号4469714Rev A)中所提供的方案并且使用离子测序套组v2.0(离子激流系统/生命技术公司,部件号4466456)和离子芯片套组(离子激流系统/生命技术公司,部件号4462923)中所提供的试剂进行测序。离子激流系统是生命技术公司(加利福尼亚州卡尔斯巴德)的子公司。
分析使用经过修饰的聚合酶在高离子强度emPCR下所获得的所得测序数据以测量AQ20碱基数目、原始精确度、系统测序误差(SSE)和总测序通量(AQ20碱基)以及其它度量值。如此实例中所概述进行的示例性测序操作的数据显示于图6中。如可见,基于所有观察到的度量值,来自突变型聚合酶“E397V”的测序数据胜过单一氨基酸取代聚合酶(SEQ IDNO:34)。“E397V”修饰的聚合酶也胜过相同emPCR条件下的双重和三重氨基酸取代聚合酶两者。
实例10:比较经过修饰的聚合酶与参考聚合酶的热稳定性能
在此实例中,根据实例1或实例2制备含有一个或多个氨基酸取代的各种经过修饰的聚合酶。根据实例1制备由氨基酸残基397处的单一氨基酸取代组成的经过修饰的聚合酶“E397V”,其是相对于SEQ ID NO:1氨基酸残基的编号。根据实例1制备由单一氨基酸取代组成的经过修饰的聚合酶“SEQ ID NO:34”,所述单一氨基酸取代是与SEQ ID NO:1相比。
经过修饰的聚合酶“E794C+E805I”由相对于SEQ ID NO:1氨基酸编号的双重氨基酸取代组成,并且根据实例2加以制备。另外,经过修饰的聚合酶“E397V+E745T”由相对于SEQ ID NO:1氨基酸编号的双重氨基酸取代组成,并且根据实例2加以制备。
将上文所描述的聚合酶各自如下制备为用于热稳定性测试的PCR条带以用于在95℃下热循环:15mM Tris pH 7.5、100mM KCl、30%海藻糖、0.1%NP40(洗涤剂)和50nM聚合酶(参见图14)。
将PCR条带在热处理的各个时间点培育(无加热对照物=0分钟;2分钟;4分钟;6分钟或8分钟)。在完成95℃或96℃下的热处理之后,将反应混合物放置在冰上。接着将反应混合物转移到用于聚合酶活性分析的培养板。
此处,如下准备聚合酶活性分析:组合15mM Tris pH 7.5、100mM KCl、8mM MgCl2、150nm寡聚物221和5nM来自热处理步骤的聚合酶反应混合物(10μl)。寡聚物221是附接有荧光染料的发夹寡聚物(TTTTTTTGCAGGTGACAGGTTTTTCCTGTCACCXGC(SEQ ID NO:50),其中X是荧光素-dT残基)。在添加dATP后,寡聚物221延伸,引起荧光释放(参见Nikiforov,《分析生物化学》,(2011)229-236,以全文引用的方式并入本文中)。
为了起始聚合酶活性分析,向每一反应物中添加20μM dATP。在每一时间点(0、2、4、6和8分钟)测量每一经过热处理的聚合酶的荧光变化,并且绘图(参见图7-10)。此处,在一定时间段内使用490nm激发波长测量525nm处的荧光信号。
也如此实例中所概述评定根据实例1或实例2制备的多种其它单一或双重氨基酸取代聚合酶的热稳定性。
图11提供对多种单一或双重氨基酸突变型聚合酶所获得的示例性热稳定性数据,其是与SEQ ID NO:34(TAQ LR1)在95℃下在海藻糖存在下相比。突变型聚合酶“E397V”和突变型聚合酶“G418C”在测试条件下在95℃下展现最大热稳定性。应注意,图11-14中的氨基酸残基编号表示按以下方式突变的残基:P6N、A77E、A97V、L193V、K240I、R266Q、E267T、L287T、P291T、K292C、E295F或E295N、E397V、G418C、L490Q、A502S、S543V、D578E、R593G、L678F或L678T、S699W、E713W、V737A、E745T、L763F、E790G、E794C、E805I和L828A由斜线分离的两个数字表示在所标注的残基处具有上文突变的双重突变体。
图12提供对相同单一或双重氨基酸突变型聚合酶所获得的示例性热稳定性数据,其是与WT Taq DNA聚合酶(SEQ ID NO:1)(TAQ WT)和SEQ ID NO:34(TAQ LR1)在96℃下在海藻糖存在下相比。突变型聚合酶“E397”和突变型聚合酶“G418C”在测试条件下在96℃下展现最大热稳定性。
图13提供对相同单一或双重氨基酸突变型聚合酶所获得的示例性热稳定性数据,其是与WT Taq DNA聚合酶(TAQ WT)在95℃下在无海藻糖存在下(在热处理步骤期间)相比。此处,突变型聚合酶“E397V”和突变型聚合酶“G418C”展现在95℃下在无海藻糖存在下优于测试条件下的WT Taq(SEQ ID NO:1)的热稳定性。
对所属领域的一般技术人员将显而易见的是,提供前述热稳定性分析作为示例性热稳定性分析,而不意味着以任何方式限制或限定。由此,本文所提供的热稳定性分析的其它变化形式或其它形式的热稳定性分析或其它评定残余聚合酶活性的手段都涵盖于本发明的范围内。
序列表
<110>生命技术公司
<120> 聚合酶组合物和制造与使用其的方法
<130> LT00925PCT
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 832
<212> PRT
<213> 水生栖热菌
<220>
<221> misc_feature
<223> 野生型Taq聚合酶
<400> 1
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 2
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:Taq突变体E397V(Hit #1)
<400> 2
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Val Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 3
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:(L763F + E805I)
<400> 3
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Phe Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Ile Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 4
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:(E397V + E745T + L763F)
<400> 4
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Val Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Thr Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Phe Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 5
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:P6N
<400> 5
Met Arg Gly Met Leu Asn Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 6
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:A77E
<400> 6
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Glu Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 7
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:A97V
<400> 7
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Val Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 8
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L193V
<400> 8
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Val Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 9
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:K240I
<400> 9
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Ile
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 10
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:R266Q
<400> 10
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Gln Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 11
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E267T
<400> 11
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Thr Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 12
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L287T
<400> 12
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Thr Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 13
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:P291T
<400> 13
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Thr Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 14
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:K292C
<400> 14
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Cys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 15
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E295F
<400> 15
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Phe Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 16
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E295N
<400> 16
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Asn Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 17
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:G418C
<400> 17
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Cys Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 18
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L490Q
<400> 18
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Gln Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 19
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:A502S
<400> 19
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ser Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 20
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:S543V
<400> 20
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Val Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 21
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:D578E
<400> 21
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Glu Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 22
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:R593G
<400> 22
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Gly Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 23
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L678F
<400> 23
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Phe Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 24
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L678T
<400> 24
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Thr Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 25
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:S699W
<400> 25
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Trp Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 26
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E713W
<400> 26
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Trp Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 27
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:V737A
<400> 27
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Ala Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 28
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E745T
<400> 28
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Thr Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 29
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L763F
<400> 29
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Phe Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 30
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E790G
<400> 30
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Gly Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 31
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E794C
<400> 31
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Cys Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 32
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:E805I
<400> 32
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Ile Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 33
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:L828A
<400> 33
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Ala Ser Ala Lys Glu
820 825 830
<210> 34
<211> 832
<212> PRT
<213> 人工序列
<220>
<223> 合成:(参考聚合酶)-(Taq-LR1)D732R
<400> 34
Met Arg Gly Met Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu
1 5 10 15
Val Asp Gly His His Leu Ala Tyr Arg Thr Phe His Ala Leu Lys Gly
20 25 30
Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala
35 40 45
Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Asp Ala Val Ile Val
50 55 60
Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Gly Gly
65 70 75 80
Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln Leu
85 90 95
Ala Leu Ile Lys Glu Leu Val Asp Leu Leu Gly Leu Ala Arg Leu Glu
100 105 110
Val Pro Gly Tyr Glu Ala Asp Asp Val Leu Ala Ser Leu Ala Lys Lys
115 120 125
Ala Glu Lys Glu Gly Tyr Glu Val Arg Ile Leu Thr Ala Asp Lys Asp
130 135 140
Leu Tyr Gln Leu Leu Ser Asp Arg Ile His Val Leu His Pro Glu Gly
145 150 155 160
Tyr Leu Ile Thr Pro Ala Trp Leu Trp Glu Lys Tyr Gly Leu Arg Pro
165 170 175
Asp Gln Trp Ala Asp Tyr Arg Ala Leu Thr Gly Asp Glu Ser Asp Asn
180 185 190
Leu Pro Gly Val Lys Gly Ile Gly Glu Lys Thr Ala Arg Lys Leu Leu
195 200 205
Glu Glu Trp Gly Ser Leu Glu Ala Leu Leu Lys Asn Leu Asp Arg Leu
210 215 220
Lys Pro Ala Ile Arg Glu Lys Ile Leu Ala His Met Asp Asp Leu Lys
225 230 235 240
Leu Ser Trp Asp Leu Ala Lys Val Arg Thr Asp Leu Pro Leu Glu Val
245 250 255
Asp Phe Ala Lys Arg Arg Glu Pro Asp Arg Glu Arg Leu Arg Ala Phe
260 265 270
Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly Leu Leu
275 280 285
Glu Ser Pro Lys Ala Leu Glu Glu Ala Pro Trp Pro Pro Pro Glu Gly
290 295 300
Ala Phe Val Gly Phe Val Leu Ser Arg Lys Glu Pro Met Trp Ala Asp
305 310 315 320
Leu Leu Ala Leu Ala Ala Ala Arg Gly Gly Arg Val His Arg Ala Pro
325 330 335
Glu Pro Tyr Lys Ala Leu Arg Asp Leu Lys Glu Ala Arg Gly Leu Leu
340 345 350
Ala Lys Asp Leu Ser Val Leu Ala Leu Arg Glu Gly Leu Gly Leu Pro
355 360 365
Pro Gly Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro Ser Asn
370 375 380
Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp Thr Glu
385 390 395 400
Glu Ala Gly Glu Arg Ala Ala Leu Ser Glu Arg Leu Phe Ala Asn Leu
405 410 415
Trp Gly Arg Leu Glu Gly Glu Glu Arg Leu Leu Trp Leu Tyr Arg Glu
420 425 430
Val Glu Arg Pro Leu Ser Ala Val Leu Ala His Met Glu Ala Thr Gly
435 440 445
Val Arg Leu Asp Val Ala Tyr Leu Arg Ala Leu Ser Leu Glu Val Ala
450 455 460
Glu Glu Ile Ala Arg Leu Glu Ala Glu Val Phe Arg Leu Ala Gly His
465 470 475 480
Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu Phe Asp
485 490 495
Glu Leu Gly Leu Pro Ala Ile Gly Lys Thr Glu Lys Thr Gly Lys Arg
500 505 510
Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His Pro Ile
515 520 525
Val Glu Lys Ile Leu Gln Tyr Arg Glu Leu Thr Lys Leu Lys Ser Thr
530 535 540
Tyr Ile Asp Pro Leu Pro Asp Leu Ile His Pro Arg Thr Gly Arg Leu
545 550 555 560
His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu Ser Ser
565 570 575
Ser Asp Pro Asn Leu Gln Asn Ile Pro Val Arg Thr Pro Leu Gly Gln
580 585 590
Arg Ile Arg Arg Ala Phe Ile Ala Glu Glu Gly Trp Leu Leu Val Ala
595 600 605
Leu Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala His Leu Ser Gly
610 615 620
Asp Glu Asn Leu Ile Arg Val Phe Gln Glu Gly Arg Asp Ile His Thr
625 630 635 640
Glu Thr Ala Ser Trp Met Phe Gly Val Pro Arg Glu Ala Val Asp Pro
645 650 655
Leu Met Arg Arg Ala Ala Lys Thr Ile Asn Phe Gly Val Leu Tyr Gly
660 665 670
Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala Ile Pro Tyr Glu Glu
675 680 685
Ala Gln Ala Phe Ile Glu Arg Tyr Phe Gln Ser Phe Pro Lys Val Arg
690 695 700
Ala Trp Ile Glu Lys Thr Leu Glu Glu Gly Arg Arg Arg Gly Tyr Val
705 710 715 720
Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Arg Leu Glu Ala Arg
725 730 735
Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn Met Pro
740 745 750
Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val Lys Leu
755 760 765
Phe Pro Arg Leu Glu Glu Met Gly Ala Arg Met Leu Leu Gln Val His
770 775 780
Asp Glu Leu Val Leu Glu Ala Pro Lys Glu Arg Ala Glu Ala Val Ala
785 790 795 800
Arg Leu Ala Lys Glu Val Met Glu Gly Val Tyr Pro Leu Ala Val Pro
805 810 815
Leu Glu Val Glu Val Gly Ile Gly Glu Asp Trp Leu Ser Ala Lys Glu
820 825 830
<210> 35
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (4)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<400> 35
Asp Xaa Ser Xaa Xaa Glu
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<400> 36
Lys Xaa Xaa Xaa Xaa Xaa Xaa Tyr Gly
1 5
<210> 37
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 37
Val His Asp Glu
1
<210> 38
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<400> 38
Asp Xaa Xaa Ser Leu Tyr Pro Ser
1 5
<210> 39
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<400> 39
Lys Xaa Xaa Xaa Asn Ser Xaa Tyr Gly
1 5
<210> 40
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 40
Tyr Gly Asp Thr Asp Ser
1 5
<210> 41
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa是Phe或Tyr
<400> 41
Asp Xaa Xaa Xaa Xaa Xaa
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (4)..(6)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa是Ser或Ala
<400> 42
Phe Xaa Gly Xaa Xaa Xaa Xaa
1 5
<210> 43
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<400> 43
Tyr Xaa Asp Asp
1
<210> 44
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<220>
<221> misc_feature
<222> (2)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<400> 44
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys
1 5
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种融合蛋白、碱基编辑工具及其应用