4000-520-616
欢迎来到免疫在线!(蚂蚁淘生物旗下平台)  请登录 |  免费注册 |  询价篮
主营:原厂直采,平行进口,授权代理(蚂蚁淘为您服务)
咨询热线电话
4000-520-616
当前位置: 首页 > 新闻动态 >
新闻详情
增加宿主细胞重组多肽产量的方法
来自 : www.xjishu.com/zhuanli/01/0382 发布时间:2021-03-24
专利名称:增加宿主细胞重组多肽产量的方法
技术领域:
本发明涉及通过破坏ME集团(M16家族)的金属蛋白酶的合成或活性来提高细胞中多肽产量的方法。本发明尤其涉及提高自宿主细胞的重组多肽分泌的方法,提高例如但不限于酵母和细菌细胞中重组多肽分泌的方法。
背景技术:
缩胆囊素(CCK)为肠和脑组织中表达的脊椎动物神经内分泌肽激素。生物活性CCK肽的成熟依赖于翻译后的酪氨酸硫酸盐化作用、内肽酶切割、外切蛋白酶修剪和羧基端酰胺化。N-端内切蛋白酶加工过程已经鉴定出CCK-83、-58、-39、-33、-22、-8和-5。大多数CCK肽在单一的精氨酸残基处切割后得到合成,然而CCK-22需要单一的赖氨酸残基之后的加工。
许多重组多肽已经在酵母中以融合蛋白的形式,表达为酿酒酵母α-因子前原肽(prepropeptide)以通过分泌途径指导分泌。特征最清楚的酵母蛋白酶为丝氨酸内切蛋白酶Kex2p(Fuller等,1989),其参与α-交配信息素和杀伤毒素的成熟过程(Julius等,1984)。另一个酵母蛋白酶为属于糖基磷脂酰肌醇(GPI)-锚定的天冬氨酰蛋白酶yapsin家族的Yps1p,其在kex2突变体中过量表达能拯救交配缺陷(Egel-Mitani等,1990)。外源蛋白质的表达表明Yps1p和Yps2p含有内切蛋白酶活性。
宿主细胞用于重组多肽的表达大大简化了大量商业价值多肽的生产,否则其只能通过从天然来源纯化而获得。目前可获得的表达系统有多种选择,可从中选择以生产任一特定的多肽,包括真细菌和真核宿主。选择适当的表达系统中一个重要因素为宿主细胞产生充足多肽产量的能力。然而,常常遇到的问题是特定宿主细胞或培养基中产生的高水平蛋白水解酶。因此,需要提高宿主细胞中重组多肽产量的其他方法。
金属蛋白酶为四种主要蛋白酶类型中最为多样的一种,目前已经鉴定出30多个家族。在这些酶中,二价阳离子通常为锌活化水分子。锌金属蛋白酶可基于锌结合位点而分为例如Zincins和Inverzincins(Hooper,N.M.1994)。金属离子通过通常数量为3个的氨基酸配基固定。已知的金属配基为组氨酸、谷氨酸、天冬氨酸或赖氨酸和至少一个其他残基,其起到催化所需的亲电作用。已知的金属蛋白酶中大约一半含有HEXXH基元,晶体学研究表明其形成部分金属结合位点。
研究表明活性依赖于二价阳离子的许多蛋白酶属于一个家族,即肽酶M16家族。这包括胰岛素酶、线粒体加工蛋白酶、pitrilysin、nardilysin和许多细菌蛋白质。这些蛋白质共有不多序列相似性的区域,但其中最值得注意的为N-端部分。这一区域包括保守的组氨酸,其后为两个残基,然后为一个谷氨酸和另一个组氨酸。已经表明pitrilysin中的此HXXEH基元参与了酶活性(Becker等,1992);两个组氨酸结合锌,谷氨酸为催化活性必需的。X可为任一氨基酸。此家族中的无活性成员丢失这些活性位点残基中的一到三个残基。
以前在例如US 5,861,280(WO98/12300)中建议提供这样的产生蛋白质的宿主细胞和方法,其在丝状真菌宿主细胞中通过表达水平显著降低的遗传修饰来表达水平显著降低的含有HEXXH基元的金属蛋白酶。
其他人还提供了蛋白酶缺乏的丝状真菌,其特征在于丝状真菌含有造成该丝状真菌金属蛋白酶活性降低的DNA位点选择性破坏,并提供了从丝状真菌中获得的编码具有金属蛋白酶活性蛋白质的经分离DNA序列(WO97/46689)。另外,所述金属蛋白酶含有HEXXH基元。
然而,这样的金属蛋白酶还尚未描述,其可通过遗传修饰降低以在非丝状真菌宿主细胞和含有非HEXXH基元的其他细胞中表达水平显著降低的所述金属蛋白酶。
发明概述研究重组宿主细胞中多种蛋白酶在加工proCCK过程中所起的作用的同时,本发明者惊奇地注意到CYM1的缺失/破坏能提高重组多肽的产量和分泌。另一方面,本发明者发现Cym1p属于金属蛋白酶家族,其活性下调可提高宿主细胞生产的重组多肽水平。
因此,本发明首先在一方面提供了包含编码重组多肽的核酸序列的宿主细胞,其中包含SEQ ID NO1所述序列的天然存在金属蛋白酶的产量通过遗传操作被减少或抑制。
宿主细胞可以为任何天然状态下拥有金属蛋白酶的细胞。因此宿主细胞可为真核或原核细胞。优选的真核细胞例子包括但不限于哺乳动物细胞、植物细胞和真菌细胞。在优选的实施方案中,宿主细胞为酵母细胞。更优选地,酵母细胞选自但不限于酵母属(Saccharomyces sp.)的某些种例如酿酒酵母(Saccharomyces cerevisiae)、奇异酵母(Saccharomycesparadoxus)、Saccharomyces.mikatae、贝酵母(Saccharomyces bayanus)、Saccharomyces castellii和克鲁弗酵母(Saccharomyces kluyveri)、裂殖酵母属的某些种(Schizosaccharomyces sp.)例如粟酒裂殖酵母(Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉逊酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、甲醇毕赤酵母(Pichia methanolica)、克鲁弗毕赤酵母(Pichia kluyveri)、Yarrowia lipolytica、产朊假丝酵母(Candida utilis)、可可假丝酵母(Candidacacaoi)和发酵地霉(Geotrichum fermentans)。
金属蛋白酶属于水解酶,其中对肽键的亲核攻击由水分子介导。这是天冬氨酸蛋白酶共有的特征,但在金属蛋白酶中通常为锌有时为钴或锰的二价阳离子活化水分子。金属离子通常通过数量为3个的氨基酸配基固定,金属蛋白酶中已知的金属配基为组氨酸、谷氨酸、天冬氨酸或赖氨酸残基。
金属蛋白酶可依照催化所需的金属离子分成两个主要的组,在文献中金属蛋白酶分成至少8个不同的集团MA、MB、MC、MD、ME、MF、MG和MH。由此表明这组蛋白酶的复杂多样性。这种分类基于配基结合的不同共有序列,并且这样每一个家族具有不同的生物底物和/或功能。
根据本发明下调的金属蛋白酶为蛋白酶pitrilysin亚家族(ME)的一员,其特征在于包含HXXEH(SEQ ID NO1)序列,其中X为任一氨基酸。目前有180多个成员为Swissprot的ME集团。这样最优选的实施方案中金属蛋白酶包含SEQ ID NO1提供的序列。另一个实施方案中,金属蛋白酶包含SEQ ID NO2提供的序列。甚至更优选的,金属蛋白酶包含SEQ IDNO3提供的序列。此外,金属蛋白酶优选地包含SEQ ID NO1和第二个组氨酸残基C-端70-80位氨基酸之间的谷氨酸残基。此外,金属蛋白酶优选地包含选自SEQ ID NO1、SEQ ID NO2和SEQ ID NO3的序列以及选自以下的序列i)由SEQ ID NO4到15组成的组中的任何一个序列和ii)与SEQ ID NO4到15任何一个至少80%相同的序列。
金属蛋白酶更优选地包含SEQ ID NO1或SEQ ID NO2或SEQ IDNO3以及选自下组中的序列i)SEQ ID NO4或5的任何一个序列和ii)与SEQ ID NO4或5任何一个至少80%相同的序列。
金属蛋白酶优选地包含与SEQ ID NO4或15中的任何一个序列至少85%相同的序列,例如至少90%相同,例如至少95%相同,例如至少99%相同。
在尤其优选的实施方案中,金属蛋白酶包含SEQ ID NO4提供的序列,或者与其至少80%相同的序列,例如至少90%,例如至少95%,例如至少99%相同的序列。
宿主细胞可通过任何本领域已知的方法进行遗传操作,只要与未进行遗传操作的亲本宿主细胞相比金属蛋白酶得到降低或抑制。此类遗传操作宿主细胞的方法包括但不限于基因敲除、基因破坏、随机或定点诱变、引入显性失活的金属蛋白酶、使用dsRNA的RNA干扰(RNAi)、催化核酸(例如核酶和DNA酶)和反义核酸。遗传操作优选地直接作用于编码金属蛋白酶的基因、基因转录的mRNA或产生改变金属蛋白酶活性的蛋白质,例如与金属蛋白酶竞争结合于底物但例如不具有催化活性的显性失活突变体。然而,可对宿主细胞进行遗传操作,从而使其间接影响金属蛋白酶的产量或活性。例如,遗传操作可靶向于参与转录金属蛋白酶基因编码的mRNA的转录因子,这样至少降低所操作的宿主细胞产生的金属蛋白酶水平。
此外,宿主细胞可进一步遗传操作以使其缺少至少一个其他天然存在的宿主细胞金属蛋白酶,或者至少一个其他天然存在的宿主细胞金属蛋白酶具有降低的活性。蛋白酶可为其酶活性的抑制能增加宿主细胞重组多肽产量的任何酶。蛋白酶可为内肽酶、氨肽酶或羧肽酶。优选的蛋白酶包括丝氨酸蛋白酶、天冬氨酸蛋白酶、半胱氨酸蛋白酶和其他金属蛋白酶。
在一个实施方案中,宿主细胞为酵母细胞,其他天然存在的蛋白酶为任何以下蛋白酶基因编码的至少一个蛋白酶,所述蛋白酶基因选自KEX2、YPS1(以前已知的YAP3),YPS2(以前已知的MKC7)、YPS3、YPS6、YPS7、BAR1、STE13、KEX1、PRC1、PEP4(也称为PRA1)、APE1、APE2、APE3和CPS1。宿主细胞优选地为酵母细胞并且KEX2的产生得到破坏。除了在此特别描述的金属蛋白酶之外,其他非酵母宿主细胞中相似的天然存在蛋白酶也可破坏和/或遗传操作以获得进一步的产量提高。
重组多肽可为宿主细胞中能产生的任一目的多肽。重组多肽可包含天然存在的序列或人为干涉产生的序列(例如天然存在蛋白质的突变体或截短,或至少两个不同多肽的融合)。重组多肽一般具有商业价值,例如在疾病治疗中具有商业价值。
重组多肽可为任意大小。重组多肽一般地大小范围为约30个氨基酸到约4,500个氨基酸。在一个实施方案中,重组多肽长度在约30个到约200个氨基酸之间。
至少在一些产生重组多肽的宿主细胞表达系统中,需要指导重组多肽从宿主细胞中分泌。这样在优选的实施方案中,核酸包含编码指导重组多肽从宿主细胞分泌的信号序列。信号序列优选地为N-端疏水信号序列。此类N-端疏水信号序列为本领域已知,并包括例如但不限于来源于真菌淀粉葡糖苷酶(AG)基因的前导序列,例如来源于曲霉菌某些种(Aspergillussp.)的galA(包括18和24氨基酸形式);酵母属某些种(Saccharomycessp.)和克鲁维酵母某些种(Kluyveromyces sp)酵母的α-因子基因;裂殖酵母某些种(Schizosaccharomyces sp.)的P-因子和芽孢杆菌属某些种(Bacillus sp.)α-淀粉酶基因。在一个实施方案中,重组多肽以N-端疏水信号序列和编码与信号序列不同来源的重组多肽的第二多肽序列的融合形式表达。
编码重组多肽的核酸可使用本领域任何已知的技术提供给宿主细胞。在一个实施方案中,核酸使用例如基于同源重组的技术插入宿主细胞的基因组。在另一个实施方案中,核酸在保留于染色体外的表达构建体中转染或转化入宿主细胞。例如,表达构建体可以为质粒或病毒。此外,载体优选地包含选择性标记,其可用于有选择地繁殖包含载体的宿主细胞。此类选择性标记和其用途也为本领域已知。
第二方面,本发明提供了产生重组多肽的方法,方法包括在适当的条件下培养根据第二方面的宿主细胞以产生重组多肽,以及收获重组多肽。
因为金属蛋白酶的蛋白水解作用降低或抑制,本发明第二方面的方法提高了宿主细胞产生的重组多肽的稳定性。
在优选的实施方案中,重组多肽从宿主细胞中分泌。此外,分泌的蛋白质优选地在包含宿主细胞的培养物的指数生长阶段收获。
所收获的重组多肽的量优选地高于使用亲本宿主细胞的情况。更优选地,所收获的重组多肽的量比使用亲本宿主细胞的情况高50%。
第三方面,本发明提供了在碱性残基处切割多肽的方法,方法包括在二价阳离子存在的条件下使多肽与包含选自下组序列的金属蛋白酶接触i)SEQ ID NO4到15中的任何一个序列;ii)与SEQ ID NO4到15任何一个至少80%相同的序列。
在尤其优选的实施方案中,金属蛋白酶包含如SEQ ID NO4提供的序列,或与其至少80%相同的序列,例如至少90%,例如至少95%和例如99%相同。
金属蛋白酶优选地在选自Lys、Arg、ArgArg、LysLys、ArgLys和LysArg的氨基酸或氨基酸序列的C-端侧切割多肽,因此,多肽优选地包含Lys、Arg、ArgArg、LysLys、ArgLys或LysArg。其他序列要求也为切割所必需,然而这些可通过常规实验容易地确定。
二价阳离子优选地选自Zn2+,Co2+和Mn2+。
第三方面的方法可在产生金属蛋白酶的重组宿主细胞体内进行,或在适当的反应条件下体外进行。鉴于本公布,熟练的技术人员可以容易地进行第三方面的方法。在此提供了用特定的金属蛋白酶切割多肽的体外系统的实例。在这种情况下,将多肽与在0.1M NaH2PO4(pH4.5)并存在1mMMn2+和1mM苯丁抑制素的酵母细胞粗提取物中提供的金属蛋白酶接触。在另一个实例中,金属蛋白酶可以带有适当“标记”的融合蛋白形式重组产生,例如能简化融合蛋白纯化的His-标记。此类“标记”优选地在金属蛋白酶暴露于底物多肽之前去掉(例如通过酶促切割)。
第四方面,本发明提供了鉴定抑制包含SEQ ID NO1所述序列的金属蛋白酶活性的试剂的方法,方法包括下列步骤a)在二价阳离子和适当底物存在的条件下将金属蛋白酶与试剂孵育;b)确定金属蛋白酶对底物的活性;c)将步骤b)中获得的活性与未与所述试剂孵育的对照样品的活性比较;d)选择抑制金属蛋白酶活性的试剂。
底物可为被金属蛋白酶和检测到的切割事件切割的任一多肽。在此公开的一个实施例使用CCK作为底物,其中切割事件通过CCK-22的产生检测。可以容易地开发相似的鉴定法用于其他底物。
第四方面优选的实施方案中,金属蛋白酶包含如SEQ ID NO4提供的序列,或包含与其至少80%相同的序列,例如至少90%,例如至少95%和例如99%相同的序列。
第五方面,本发明提供了产生重组多肽的方法,方法包括在适当的条件下培养包含编码重组多肽的核酸序列的宿主细胞以产生重组多肽。以及收获重组多肽,其中所述的培养包括金属蛋白酶抑制剂的存在,所述金属蛋白酶包含SEQ ID NO1提供的序列。
抑制剂优选地根据第四方面的方法鉴定。
本发明一个方面优选的特征和特性显然可以应用于本发明其他方面。
整篇说明书中,单词“包含”或例如其复数或动名词的变化形式应理解为指包括成分、整数或步骤、或成分、整数或步骤的组,但不排除任一其他成分、整数或步骤、或成分、整数或步骤的组。
本发明以下列非限制性的图和实施例形式描述。
附图简述
图1.缩胆囊素表达构建体。显示了PreproMfα1p-proCCK融合蛋白质在融合位点附近和原始切割位点的氨基酸序列。下面显示了分泌的CCK主要形式的N-端和C-端氨基酸残基。
图2.CCK-22在细胞中和培养基中的成熟过程作为细胞生长的函数。表达preproMfα1p-proCCK融合蛋白的BJ2168。使用Ab89009通过RIA测量CCK-22免疫反应性,并在胰蛋白酶切割后用Ab89009测量总CCK含量。空心圆代表分泌的CCK-22级分而CCK-22胞内级分以实心三角形表示。细胞生长通过OD600(空心方框)测量。数据代表两个独立实验的平均值。
图3.BJ2168中分泌的正常CCK和K→A突变CCK的层析分析。pRS426 preproMfα1p-proCCK和pRS426 preproMfα1p-proCCK(K→A)转化的酵母培养基用于G-50凝胶层析并用对甘氨酸延伸CCK特异性的Ab7270(A和C)和CCK-22 N-端特异性的Ab89009(B和D)测量CCK免疫反应性。
图4.包括抑制剂和激活剂的体外蛋白酶鉴定法。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。A,不同抑制剂的影响。B,蛋白酶活性用1mM EDTA抑制的提取物中通过加入1.2mM二价金属离子再活化蛋白酶。数据代表三个独立实验的平均值±SD。
图5.使用Zn2+和Mn2+的蛋白酶再活化。用LJY123细胞提取物进行体外蛋白酶测定,其中活性用1mM EDTA(实心方框)抑制并通过加入1.2mM Mn2+(空心圆)或1.2mM Zn2+(实心圆)再活化。活性测定为孵育30、60和120分钟后的成熟CCK-22级分。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。数据代表平均值±SD(n=3)。
图6.yapsin家族成员引起的胞外CCK-22成熟过程。完整细胞加工胞外CCK的能力如“实验方法”所述分析BY4705和同基因yps1、yps1 yps3和yps1 yps2 yps3菌株。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。数据代表平均值±SD(n=4)。统计使用实验方法所述的非成对t检验进行。(***=P<0.001,**=P<0.01和*=P<0.05)。
图7.Cym1p过量表达之后的蛋白水解增加。用pRS425空质粒(A)和含有CYM1的pRS425(B)转化的BJ2168的细胞提取物进行体外蛋白酶测定。使用Ab89009(实心方框和圆)随时间测量CCK-22免疫反应性并在胰蛋白酶处理之后用Ab89009测量成熟的CCK-22和N-端延伸的CCK-22总量(空心方框和圆)。数据代表三个独立实验的平均值±SD。
图8.KEX2和CYM1缺失对proCCK分泌和CCK-22成熟过程的影响。在指数期收获proCCK表达构建体转化的酵母细胞并收集培养基。胰蛋白酶处理之后用Ab89009测量总CCK的胞内量(A)和胞外量(B)。胞内CCK-22级分(C)和分泌的CCK-22级分(D)计算为将胰蛋白酶切割前使用Ab89009的免疫反应性除以在(A)和(B)测量的CCK总量。kex2、cym1和kex2 cym1菌株是BJ2168的同基因。数据以平均值±SD(n=4)给出。统计使用非成对t检验进行(***=P<0.001,**=P<0.01和*=P<0.05)。括号中的星号为kex2和kex2 cym1菌株间的比较。
图9.CCK的胞内降解依赖于Cymp1对CCK-22的切割。在BJ2168和与BJ2168同基因的CYM1受破坏菌株中表达野生型CCK、preproMfα1p-proCCK和CCK突变体preproMfα1p-proCCK(K→A)。指数生长过程中沉淀细胞并在胰蛋白酶和羧肽酶B处理后用对Gly-延伸CCK的特异性抗体Ab7270测量CCK总量(带阴影的框)。成熟Gly-延伸CCK的量(取决于移位到分泌途径、Kex2p和羧肽酶活性)测定为胰蛋白酶切割和羧肽酶B处理之前使用Ab7270的免疫反应性。数据以平均值±SD(n=3)给出。
图10.天冬胺酰蛋白酶参与了CCK-22的成熟过程。在BY4705和同基因yapsin缺失菌YPS1、YPS2和YPS3株中表达野生型proCCK。在指数生长过程中测量合成的CCK-22的胞内级分(A)和胞外级分(B)。成熟CCK-22级分计算为将胰蛋白酶切割前使用Ab89009的免疫反应性除以在CCK-22的总量。数据以平均值±SD(n=3)表示。统计如实验方法所述使用非成对t检验进行。(***=P<0.001,**=P<0.01和*=P<0.05)。
图11.Cym1p对Lys和Arg残基C端的加工。CYM1缺失将分泌的CCK数量提高到野生型CCK和Lys61→Arg61突变体的两倍多。在BJ2168和BJ2168同基因的CYM1破坏体中表达野生型CCK、preproMfα1p-proCCK和CCK突变体preproMfα1p-proCCK(Lys61→Arg61)。指数期收获酵母细胞并收集培养基。胰蛋白酶处理后用Ab89009测量总CCK的胞内数量(A)和胞外数量(B)。数据以平均值±SD(n=3)给出。
图12.通过质谱鉴定分泌的proCCK片段。CCK-数字指C-端酰胺化CCK。除了*表示平均值外分子量以单一同位素值给出。菌株A,液泡蛋白酶缺陷菌株(BJ2168);菌株B,KEX1 KEX2破坏的同基因菌株(LJY22)。
图13.产生C-端延伸CCK(A)和GLP2(B)的模型。这些融合肽的表达应在sec61突变体中进行或者应去掉α-交配因子的前序列(pre-sequence)以避免移位到内质网。显示了融合位点附近的氨基酸序列。下划线为Gly-延伸CCK-22和GLP1的N-端和C-端氨基酸。
图14.A.preproMfα1p-proBNP表达构建体。
B.preproMfα1p-KREAEA-BNP-32表达构建体。
C.preproMfα1p-KR-BNP-32表达构建体。
图15.A.preproMfα1p-proBNP表达构建体转化BJ2168、LJY430(cym1突变体)、LJY431(yps1突变体)和LJY432(cym1yps1双突变体)。对到达稳定期的细胞使用proBNP N-端特异的抗体Ab98192分析培养基。cym1、yps1和cym1yps1菌株为BJ2168同基因。数据以平均值±SD(n=3)给出。统计如实验方法所述使用非成对t检验进行。(***=P<0.001,**=P<O.01和*=P<0.05)。括号中的星号为野生型菌株BJ2168和cym1、BJ2168和yps1、yps1和yps1cym1之间的比较。
(ns,=不显著)。
B.分析cym1突变体中分泌的proCCK片段。含10皮摩尔proBNP的培养基用于Akta纯化系统的Superdex 200柱。使用proBNP N-端特异的抗体98192测量所收集级分中的proBNP含量。
序列表说明SEQ ID NO1-pitrilysin蛋白酶的共有序列。
SEQ ID NO2-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO3-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO4-酿酒酵母Cym1p(Swissprot登录号P32898)。
SEQ ID NO5-粟酒裂殖酵母C119.7(Swissprot登录号O42908)。
SEQ ID NO6-产气荚膜梭菌(Clostridium perfringens)HypA蛋白质(Swissprot登录号Q46205)。
SEQ ID NO7-布氏疏螺旋体(Borrelia burgdorferi)蛋白质BB0228(Swissprot登录号O51246)。
SEQ ID NO8-秀丽隐杆线虫(Caenorhabditis elegans)C05D11.1蛋白质(Swissprot登录号P48053)。
SEQ ID NO9-大肠杆菌(E.coli)蛋白酶III(Swissprot登录号P05458)。
SEQ ID NO10-大鼠NRD转换酶(Swissprot登录号P47245)。
SEQ ID NO11-人胰岛素崩解酶(Swissprot登录号P14735)。
SEQ ID NO12-拟南芥(Arabidopsis thaliana)CPE(Genbank登录号T03302)。
SEQ ID NO13-人金属蛋白酶I部分序列(GenBank登录号AAH01150),人金属蛋白酶I全长序列(Swissprot登录号O95204)。
SEQ ID NO14-枯草芽孢杆菌(Bacillus subtilis)锌蛋白酶ymxG(GenBank登录号Q04805)。
SEQ ID NO15-结核分枝杆菌(Mycobacterium tuberculosis)锌蛋白酶Rv2782c(GenBank登录号O33324)。
SEQ ID NO 16至42-寡核苷酸。
SEQ ID NO 43至52-
图12提供的序列。
SEQ ID NO 53至55-
图1提供的序列。
SEQ ID NO 56至65-寡核苷酸。
SEQ ID NO66-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO67-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO68-至少为一些pitrilysin蛋白酶的共有序列。
发明详述本发明提供了对表达多肽有用的宿主细胞,所述细胞经遗传操作以至少产生与亲本细胞相比降低水平的特定金属蛋白酶。这样宿主细胞能由于金属蛋白酶的蛋白水解作用得到降低或抑制从而以较高量表达目的蛋白质,这也提高了目的蛋白质的稳定性。
通过本发明的方法,金属蛋白酶的蛋白水解作用得到降低或抑制,因此改善了所获产物的稳定性。
这样本发明的一个实施方案涉及对表达目的蛋白质有用的宿主细胞,其中所述的细胞经遗传修饰以在相同条件下表达与相应未修饰细胞相比显著降低水平的包含HXXEH基元(SEQ ID NO1)的金属蛋白酶。
需要根据本发明下调的金属蛋白酶不共有许多序列相似性区域,最值得注意的在N-端部分。这个区域包括保守的组氨酸,其后两个残基为一个谷氨酸和另一个组氨酸。pitrilysin中表明此HXXEH基元参与酶促活性。两个组氨酸结合锌,谷氨酸为催化活性所必需。此家族的非活性成员丢失这些活性位点残基中的1到3个残基。
根据本发明下调的金属蛋白酶家族目前分类为ME集团M16家族的成员。此家族通常分为4个亚家族包含pitrilysin的M16A包含线粒体加工肽酶-β亚基(酿酒酵母)的M16B包含eupitrilysin(人(Homo sapiens))的M16C包含痘苗病毒型金属内肽酶(痘苗病毒)的M44这些蛋白质的序列比对表明存在几个序列相似。这些序列相似高度保守并可用于区分此家族成员与非成员。
在这些序列相似中,几个独立的氨基酸高度保守并易于在距离HXXEH基元的特定位点处识别。
这样本发明的一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端70至80个氨基酸之间的谷氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第一个组氨酸残基N-端3个氨基酸的甘氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端5个氨基酸的甘氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端8个氨基酸的赖氨酸残基。
本发明的一个实施方案也涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端9个氨基酸的酪氨酸残基。
此外,本发明涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端10个氨基酸的脯氨酸残基。
序列相似中有几个氨基酸区域也高度保守并易于识别。这样在目前优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQID NO 2的共有序列。
在另一个目前优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQ ID NO 3的共有序列。
在目前最优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端20和30个氨基酸之间的NAXTXXXXT基元。
在目前另一个实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQ ID NO 66-68的共有序列。本发明的一个实施方案涉及对表达目的蛋白质有用的宿主细胞,其中所述的细胞经遗传操作以表达与亲本细胞相比降低水平的金属蛋白酶,其与SEQ ID NO4-15的任何一个至少80%相同。
本篇中,术语“目的蛋白质”涉及大量天然存在的极复杂底物中的任何一个,例如但不限于由通过肽键连接的氨基酸残基组成的蛋白质、酶和/或抗体。本发明优选实施方案的目的就是提供此类为宿主细胞自身产物的天然蛋白质和/或异源蛋白质、融和蛋白、重组蛋白质、真核蛋白质、原核蛋白质、溶酶体蛋白质、液泡蛋白质、前体蛋白、酶原蛋白质、前原蛋白和分泌蛋白质。
所要求权利的方法的优选实施方案由于目的蛋白质的较高产量很有利,这样,与在相同条件下培养的相应未修饰细胞中产量相比,如在此描述的经修饰宿主细胞中生产的任何目的蛋白质的量增加都在本发明的范围之内。
熟练技术人员可以评价在此所述修饰的宿主细胞中目的蛋白质提高的产量并与相应未修饰细胞的产量比较的鉴定法,通过在相同条件下培养两种不同宿主细胞并通过使用目的蛋白质特异抗体的放射免疫测定法测量产生的目的蛋白质的量。本说明书的实施例中更详细地描述了一个这样的鉴定法。
本发明的一个实施方案涉及这样的宿主细胞,其中在相同条件下培养时,目的蛋白质总量与相应未修饰的细胞相比增加至少5%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少10%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少20%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少50%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少100%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少200%,甚至在相同条件下培养时与相应未修饰的细胞相比增加至少1000%。
本文中,术语“宿主细胞”涉及能产生目的蛋白质的任何细胞。这样在优选的实施方案中,宿主为原核细胞。在另一个优选的实施方案中,宿主细胞为真核细胞,例如但不限于丝状真菌细胞和非丝状真菌细胞。非局限性的例子为酵母菌株,尤其是酿酒酵母菌株。
在此描述的涉及本发明方法的所有特征也适用于涉及宿主细胞的实施方案,并且反之亦然。
本申请中描述的方法涉及宿主细胞中目的蛋白质的产量,其中所述的宿主细胞经遗传修饰,当在相同条件下培养时,这包括a)将编码目的蛋白质的核酸序列导入宿主细胞;b)在适当的生长培养基中培养步骤(a)的宿主细胞以产生目的蛋白质;c)分离目的蛋白质,与亲本细胞相比,其表达显著降低水平的与SEQ ID NO4至少80%相同的金属蛋白酶。
本发明的一个实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中的宿主细胞通过选自基因敲除、基因破坏、随机或定点诱变、引入显性失活的金属蛋白酶、使用dsRNA的RNA干涉、催化核酸(如核酶和DNA酶)、反义核酸或其组合的方法遗传修饰。
在目前最优选的实施方案中,宿主细胞基本上不含任何金属蛋白酶活性。
本发明一个优选的实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为真核蛋白质,其选自胰岛素、生长激素、胰高血糖素、促生长素抑制素、干扰素、促肾上腺皮质激素、血管紧张素原、心房肽、强啡肽、内啡肽、甘丙肽、胃分泌素、胃分泌素释放肽、神经肽Y片段、胰抑制素、胰多肽、促胰液素、血管活性肠肽、生长激素释放因子、促黑激素、神经降压素、肾上腺肽、甲状旁腺激素及相关肽、生长激素抑制素及相关肽、脑钠肽、降钙素、促肾上腺皮质激素释放因子(CRF)、受可卡因和安非他明调节的转录产物(CART)、胸腺素、硬骨鱼紧张肽、胰高血糖素及胰高血糖素样肽(GLP-1和GLP-2)、生长激素抑制素、干扰素、血管内皮细胞生长因子(VEGF)、血小板衍生生长因子(PDGF)、因子VII、因子VIII、因子V、因子IX,白细胞介素、尿激酶、促红细胞生成素(EPO)、凝乳酶、组织纤维蛋白溶酶原激活剂、正辅因子2谷氨酰胺/富含Q的相关蛋白(Positive cofactor 2 glutamine/Q-rich-associated protein,PCAP)、肽酪氨酸酪氨酸(PYY)、血液生长素、增食因子、β-新内啡肽-强啡肽前体、CCK或血清白蛋白。
本发明另一个实施方案涉及在宿主细胞中生产目的蛋白质的方法,其中目的蛋白质为选自淀粉分解酶、α-淀粉酶、β-淀粉酶、糖淀粉酶、α-半乳糖苷酶、溶细胞酶、脂肪分解酶、木聚糖水解酶、蛋白水解酶、氧化还原酶、过氧化物酶、漆酶、果胶酶、或角质酶的真菌来源蛋白质。
本发明另一个优选实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为选自淀粉分解酶、α-淀粉酶、β-淀粉酶、糖淀粉酶、β-半乳糖苷酶、 溶细胞酶、脂肪分解酶、木聚糖水解酶、蛋白水解酶、氧化还原酶、过氧化物酶、漆酶、果胶酶、或角质酶的细菌蛋白质。
本发明特别的实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为前体,即酶原、杂合蛋白、以前序列或原前序列(preprosequence)获得的或未成熟形式蛋白质。
普通分子生物学除非特别说明,本发明使用的重组DNA技术为本领域技术人员所熟知的常规方法。此类技术在整篇的下列来源中描述和解释并在此引用作为参考,例如J.Perbal,A Practicai Guide to Molecular Cloning,John Wileyand Sons(1984),J.Sambrook等,Molecular CloningA LaboratoryManual,Cold Spring Harbour Laboratory Press(1989),T.A.Brown(编辑),Essential Molecular BiologyA Practical Approach,卷1和2,IRLPress(1991),D.M.Glover和B.D.Hames(编辑),DNA CloningA PracticalApproach,卷1-4,IRL Press(1995和1996),F.M.Ausubel等(编辑),Current Protocols in Molecular Biology,Greene Pub.Associates和Wiley-Interscience(1988,包括至今所有更新),Methods in Enzymology.Vol 194.Guide to Yeast Genetics and Molecular Biology.(1991)EdGunthrie and Fink Academic Press,Methods in Microbiology Vol.26.Yeast Gene Analysis.(1998)Brown和Tuite编辑.Academic Press,Miller,J.H.(1992)A Short Course in Bacterial Genetics(Manual,L.编辑),ColdSpring Harbor Laboratory,Cold Spring Harbor,NY,Johnston,J.R.(1994)Molecular Genetics of Yeast(A Practical Approach)Oxford UniversityPress,Oxford,以及Molecular Genetics of YeastA Practical Approach,Ed.J.R.Johnston编辑,IRL Press(1994)。
多肽同源性百分比通过缺口创建罚分=5和缺口延伸罚分=0.3的GAP(Needleman和Wunsch,1970)分析(GCG程序)确定。所查询序列长度至少为15个氨基酸,GAP分析比对两序列至少15个氨基酸的区域。更优选地所查询序列长度至少为50个氨基酸,GAP分析比对两序列至少50个氨基酸的区域。甚至更优选地,所查询序列长度至少为100个氨基酸,GAP分析比对两序列至少100个氨基酸的区域。更优选地,所查询序列长度至少为250个氨基酸,GAP分析比对两序列至少250个氨基酸的区域。甚至更优选地,所查询序列长度至少为500个氨基酸,GAP分析比对两序列至少500个氨基酸的区域。
金属蛋白酶pitrilysin亚家族金属蛋白酶pitrilysin亚家族的特征在于存在HXXEH基元(SEQ IDNO1)。Rawlings和Barrett(1995)提供了这个亚家族的综述。此家族成员包括但不限于酿酒酵母Cym1p(SEQ ID NO4)(Swissprot登录号P32898)、粟酒裂殖酵母C119.7(SEQ ID NO5)(Swissprot登录号O42908)、产气荚膜梭菌(Clostridium perfringens)HypA蛋白质(SEQ IDNO6)(Swissprot登录号Q46205)、布氏疏螺旋体蛋白质BB0228(SEQ IDNO7)(Swissprot登录号O51246)、秀丽隐杆线虫C05D11.1蛋白质(SEQID NO8)(Swissprot登录号P48053)、大肠杆菌蛋白酶III(也称为pitrilysin)(SEQ ID NO9)(Swissprot登录号P05458)、大鼠NRD转化酶(SEQ ID NO10)(Swissprot登录号P47245)、人胰岛溶素(SEQ ID NO11)(Swissprot登录号P14735)、拟南芥CPE(SEQ ID NO12)(Genbank登录号T03302)、人金属蛋白酶I(部分)(SEQ ID NO13)(GenBank登录号AAH01150)(全长序列Swissprot登录号O95204)、枯草芽孢杆菌(Bacillus subtilis)锌蛋白酶ymxG(SEQ ID NO14)(GenBank登录号Q04805)和结核分歧杆菌(Mycobacterium tuberculosis)锌蛋白酶Rv2782c(SEQ ID NO15)(GenBank登录号O33324)。对大肠杆菌金属蛋白酶III(SEQ ID NO9),表明SEQ ID NO1中的组氨酸残基和谷氨酸-169参与二价阳离子的结合同时与组氨酸残基相邻的谷氨酸残基为催化残基。
编码pitrilysin金属蛋白酶的基因可通过杂交编码全部或部分金属蛋白酶的核酸序列的筛选方法很容易地鉴定,例如使用合成寡核苷酸探针,其可基于cDNA序列,如根据常规技术制备的编码SEQ ID NO4到15的金属蛋白酶中的任何一个的核苷酸序列。
遗传操作本发明经遗传操作以产生降低水平的特定金属蛋白酶的宿主细胞可使用本领域技术人员已知的常规重组DNA技术来修饰。引起金属蛋白酶产生的基因序列可以失活或全部消除。
在特定的实施方案中,本发明的宿主细胞在金属蛋白酶基因的编码或调节区域进行遗传操作。已知并有用的技术包括但不限于基因敲除、基因破坏、随机或定点诱变、引入显性失活金属蛋白酶、使用dsRNA的RNA干涉、催化核酸(例如核酶和DNA酶)和反义核酸或其组合。
诱变使用适当的物理或化学诱变剂进行。适于此目的的物理或化学诱变剂的例子包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、蚁酸和核苷类似物。当使用此类诱变剂时,一般通过在适于诱变发生的条件下在所选诱变剂中孵育待诱变细胞,并选择显著降低金属蛋白酶产量的突变细胞进行诱变。
遗传操作也可通过引入、替代或去除金属蛋白酶编码序列或其转录或翻译所需的调节元件中一个或多个核苷酸来完成。例如可插入或去除核苷酸以造成终止密码子的引入,起始密码子的去除或开放阅读框的变化。结构序列或调节元件的修饰或失活可根据本领域已知的方法通过定点诱变或PCR产生诱变而完成。
失活或降低宿主细胞金属蛋白酶产量的便利方法基于基因间断原则。此方法包括使用与待破坏内源基因或基因片段对应的DNA序列。DNA序列为在体外突变成缺陷基因并转化宿主细胞。缺陷基因通过同源重组替代内源基因或基因片段。可能需要编码用于重组体选择的标记的缺陷基因或基因片段,其中编码金属蛋白酶的基因已经得到修饰或破坏。
在此使用的术语“反义”指与特定核酸序列互补的核苷酸序列。反义分子可通过任何方法生产,其包括通过将目的基因与允许互补链合成的病毒启动子反向连接来合成。一旦导入宿主细胞,其经转录链与细胞产生的编码金属蛋白酶的天然序列结合形成双链体。这些双链体阻止进一步的转录或者进一步的翻译。突变表型可以这种方式产生。
术语“催化核酸”指特异识别特定底物并催化此底物化学修饰的DNA分子、含DNA的分子(也是本领域已知的“脱氧核酶)、RNA或者含RNA的分子(也是本领域已知的“核酶”)。催化核酸中的核酸碱基可以为碱基A、C、G、T和U,也可为其衍生物。这些碱基的衍生物为本领域所熟知。
催化核酸一般地含有特异识别目的核酸的反义序列和切割性酶促活性的核酸,在此也称为“催化结构域”。本发明中尤其有用的核酶类型为锤头状核酶(Haseloff和Gerlach,1988)和发卡状核酶(Shippy等,1999)。
对本发明方法有用的核酶和编码核酶的DNA可使用本领域熟知的方法化学合成。核酶也可以从可操作地与RNA聚合酶启动子连接的DNA分子(一旦转录产生RNA分子)制备,其中所述启动子例如T7RNA聚合酶或SP6RNA聚合酶的启动子。当载体还含有可操作地与DNA分子连接的RNA聚合酶启动子时,可通过与RNA聚合酶和核苷酸孵育体外产生核酶。在独立的实施方案中,DNA可插入表达盒或转录盒。合成之后,RNA分子可通过与具有稳定核酶并使其抵抗RNA酶能力的DNA分子连接来修饰。作为一种选择,核酶可修饰成用于脂质体递送系统中的硫代磷酸(phosphothio)类似物。这种修饰也使核酶具有抵抗核酸内切酶的活性。
dsRNA(RNAi)对特异抑制特定蛋白质产生尤其有用。此技术依赖于含有与目的基因的mRNA基本上一致序列的dsRNA分子的存在,在这种情况下所述mRNA编码金属蛋白酶。dsRNA可方便地在重组载体或宿主细胞中的一个开放阅读框中产生,其中有义与反义序列与无关序列相邻,其能使有义与反义序列杂交以形成dsRNA分子,而无关序列形成环状结构。用于遗传操作的适当dsRNA分子的设计和产生为本领域技术人员能力范围之内所熟知的,尤其见Waterhouse等(1998),Elbashir等(2001),WO99/32619,WO99/53050,WO99/49029和WO01/34815。
本发明的宿主细胞由于遗传操作表达显著降低水平的金属蛋白酶。在优选的实施方案中宿主细胞表达的金属蛋白酶水平降低大于约25%,例如大于约30%,例如大于约35%,例如大于约40%,例如大于约45%,例如大于约50%,例如大于约55%,例如大于约60%,例如大于约65%,例如大于约70%,例如大于约75%,例如大于约80%,例如大于约85%,例如大于约90%,例如大于约95%,例如大于约98%和例如大于约99%。
在目前最优选的实施方案中,宿主细胞表达的产物基本不具有任何所述的金属蛋白酶活性。
在本文中,术语“基本不具有”指这样的宿主,其中所述宿主细胞表达的金属蛋白酶降低到所述金属蛋白酶的功能对目的蛋白质产生没有生物学上使所述蛋白质显著降低的影响。
目的蛋白质术语“多肽”、“蛋白质”和“肽”在此可替换地使用并且在本文中涉及大量天然存在的极复杂物质中的任何一个,例如但不限于由肽键连接的氨基酸残基组成的酶或抗体,其含有碳元素、氢元素、氮元素、氧元素,通常含有硫元素并且偶尔含有其他元素例如但不限于磷或铁;为所有活细胞的必需成分;在植物中自原材料天然合成但在动物中以单个氨基酸同化;虽然对许多所述物质已得到结晶但天然状态下其为酸性、碱性并通常为胶体,且可被酸、碱、蛋白水解酶和腐败细菌水解成多肽、简单肽并最终水解成α-氨基酸。
正如在此定义的,“重组多肽”为宿主细胞的非天然蛋白质,或天然蛋白质中已进行修饰以改变天然序列,或对天然蛋白质表达需要的天然调节序列例如启动子、核酶结合位点等等的操作或者其他通过重组DNA技术对宿主细胞的操作,造成表达得到量上的改变的天然蛋白质。
由于所述金属蛋白酶活性的消失或降低,宿主细胞表达的至少一部分多肽可能为前体蛋白质,例如酶原、杂合蛋白质、以前序列或原前序列或未成熟形式获得的蛋白质。
在更特定的实施方案中,重组多肽为真核来源如胰岛素、促肾上腺皮质激素、血管紧张素原、心房钠尿肽、强啡肽、内啡肽、甘丙肽、胃分泌素、胃分泌素释放肽、神经肽Y片段、胰抑制素、胰多肽、促胰液素、血管活性肠肽、生长激素释放因子、促黑激素、神经降压素、肾上腺肽、甲状旁腺激素及相关肽、生长激素抑制素及相关肽、脑钠肽、降钙素、促肾上腺皮质激素释放因子(CRF)、受可卡因和安非他明调节的转录产物(CART)、胸腺素、硬骨鱼紧张肽、胰高血糖素及胰高血糖素样肽(GLP-1和GLP-2)、生长激素抑制素、干扰素、血管内皮细胞生长因子(VEGF)、血小板衍生生长因子(PDGF)、因子VII、因子VIII、因子V、因子IX、白细胞介素、尿激酶、促红细胞生成素(EPO)、凝乳酶、组织纤维蛋白溶酶原激活剂、CCK或血清白蛋白。
特别要提到“胰高血糖素及胰高血糖素样肽”,在此使用的此术语指人或其他动物来源的和重组或半合成来源的多肽,其包括胰高血糖素家族全部成员,例如GRPP(胰高血糖素样肽相关多肽)、胰高血糖素、GLP-1(胰高血糖素样肽1)和GLP-2(胰高血糖素样肽2),其包括截短和/或N-端延伸的形式例如GLP-1(7-36)并包括类似物GLP-1(7-35)R36A GLP-2 F22Y、GLP-2 A19T+34Y.GLP2 A2G和GLP-2 A19T,以及其他具有1到3个氨基酸改变、添加和/或缺失的类似物。
宿主细胞及由其表达的重组多肽本发明使用的宿主细胞可为原核或真核宿主细胞。本发明使用的真核宿主细胞可为例如真菌、哺乳动物、植物或昆虫细胞。宿主细胞优选地为酵母细胞。
为产生目的多肽,本发明的宿主细胞包含编码重组多肽的核酸序列和指导目的产物表达的调节序列例如包含如转录、翻译和终止必需的核苷酸序列的区域。本发明宿主细胞的遗传设计可由本领域技术人员使用转化或转染宿主细胞的常规重组DNA技术完成。
宿主细胞优选地通过本领域已知的导入例如质粒或病毒载体中的、包含编码重组多肽的核酸的适当表达盒方法来修饰。
表达盒可通过多种技术引入宿主细胞,包括但不限于作为自主复制质粒或整合入染色体。表达盒可含有调节序列,例如转录控制序列、翻译控制序列、复制起点和与重组细胞相容以及控制编码重组多肽的核酸表达的其他调节序列。本发明的重组核酸分子尤其包括转录控制序列。转录控制序列为控制转录起始、延伸和终止的序列。尤其重要的转录控制序列为控制转录起始的序列,例如启动子、增强子、操纵子和阻遏子序列。适当的转录控制序列包括至少可在本发明的一种重组细胞中发挥功能的任何转录控制序列。多种这样的转录控制序列为本领域技术人员已知。优选的转录控制序列包括在细菌、酵母、节肢动物和哺乳动物细胞中发挥功能的序列,例如但不限于tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、λ噬菌体、T7噬菌体、T7lac、T3噬菌体、SP6噬菌体、SP01噬菌体、金属硫蛋白、α-交配因子、毕赤酵母醇氧化酶、甲病毒亚基因组启动子(例如辛德毕斯病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾(HeliothisZea)昆虫病毒、痘苗病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(如中早期启动子)、猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复、劳斯肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列和能在原核或真核细胞中控制基因表达的其他序列。本发明的转录控制序列最优选地为天然存在的酵母相关控制序列。酿酒酵母适当的启动子包括MFα1启动子、半乳糖诱导型启动子例如GAL1、GAL7和GAL10启动子、包括TPI1和PGK1启动子、TRP1启动子、CYCI启动子、CUP1启动子、PHOS启动子、ADH1启动子和HSP启动子的糖酵解酶启动子。毕赤酵母属中适当的启动子为AOXI(甲醇利用)启动子。
本发明的重组多肽也可含有(a)分泌信号,使表达的多肽从产生所述多肽的细胞分泌和/或(b)引起融合蛋白表达的融合序列。适当的信号片段的例子包括能指导融合蛋白分泌的任何信号片段。优选的信号片段包括但不限于组织纤溶酶原激活剂(t-PA)、干扰素、白细胞介素、生长激素、组织相容性和病毒包膜糖蛋白信号片段、来源于真菌淀粉葡糖苷酶(AG)基因例如galA的前导序列(例如来源于曲霉属某些种(Aspergillus sp.)的18个和24个氨基酸形式)、来源于酵母如芽殖酵母某些种和克鲁维酵母某些种的α-因子基因、裂殖酵母某些种的P-因子和芽孢杆菌某些种的α-淀粉酶基因以及天然信号序列。
克隆载体也可包含选择性标记,例如其产物弥补宿主细胞缺陷的基因或给予抗生素抗性的基因例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的基因。
分别用于连接本发明的DNA构建体、启动子、终止子和其他元件以及将其插入含有复制必需信息的适当克隆载体的方法为本领域技术人员熟知。
可使用重组DNA技术通过如操作宿主细胞中核酸分子的拷贝数量、操作转录核酸分子的效率、操作得到的转录物的翻译效率和操作翻译后修饰的效率提高经转化核酸分子的表达。对本发明方法有用的增加核酸分子表达的重组技术包括但不限于可操纵地将核酸分子与高拷贝数质粒连接、将核酸分子整合入一条或多条宿主细胞染色体、在质粒中加入载体稳定序列、替代或修饰转录控制信号(如启动子、操纵子和增强子)、替代或修饰翻译控制信号(如核糖体结合位点、SD序列)、修饰核酸分子使其与宿主细胞密码子使用对应和去掉使转录物不稳定的序列。本发明表达的重组多肽的活性可通过片段化、修饰或衍生化编码此类蛋白质的多聚核苷酸分子来提高。
产生重组多肽的方法已经用编码重组多肽的核酸转染或转化的宿主细胞在本领域技术人员查阅在此公开的资料已知的适当条件下培养充足的时间以允许多肽的产生,并且优选地允许多肽的分泌,然后收获目的产物。
此外,由于金属蛋白酶活性降低,宿主细胞表达的重组多肽可以前体蛋白质形式获得,即酶原、杂合蛋白质、以前序列或原前序列或未成熟形式获得的蛋白质用于培养的肉汤或培养基为适于提到的宿主细胞生长的任何常规培养基,并可根据现有技术的原理合成。培养基优选地含有碳源和氮源以及其他无机盐。适当的培养基如基本培养基或复合培养基可获自供应商或可根据出版的方法制备。
谈及酵母宿主细胞,在二倍体酵母培养中产生异源多肽经常是有利的,因为可能的遗传缺陷可在单倍体酵母培养如生产规模的连续发酵中为表型形式表达,还因为其产量更高。Molecular Genetics of YeastA PracticalApproach,Ed.J.R.Johnston,IRL Press(1994)中描述了在酵母宿主细胞中产生重组多肽,其在此引用作为参考。
培养之后,蛋白质通过从培养肉汤中分离和纯化蛋白质的常规方法收获。众所周知的纯化方法包括通过离心或过滤从培养基中分离细胞、通过盐如硫酸铵方法沉淀蛋白质成分和层析方法如离子交换层析、凝胶过滤层析、亲和层析等。
本发明通过显示CCK和proBNP总量与未修饰宿主细胞相比分别增加约60%和100%作为例证。所述实例由此表明本发明的宿主细胞能增加多种蛋白质的产量此外,实施例公开其他蛋白酶的额外破坏提高目的蛋白质的产量,例如KEX2和CYM1的破坏造成CCK生产中产量上的加性效应(几乎100%)。
此外,熟练的技术人员应理解一些所述基元中的特殊氨基酸,尤其是组氨酸、谷氨酸、天冬氨酸或赖氨酸通过作为金属配基起作用而为金属蛋白酶功能所必需。
此外,应认识到本发明的金属蛋白酶在本文中作为pitrilysin家族、胰岛素降解酶家族、胰岛素酶家族、inverzincin家族和ME集团M16亚家族成员广泛地做过解释。
因此,应理解与任何这些注释的不同家族相关的上述任何特征和/或方面同样可应用于文中所述的金属蛋白酶,其均包括HXXEH基元。
然而,请注意单独的pitrilysin(其后不接家族)是指大肠杆菌金属蛋白酶ME集团的特定成员。
实施例材料和方法酵母菌株和生长条件使用的酵母菌株列于表I中。菌株构建使用两步基因破坏技术(Rothstein,1991)或(Brachmann等,1998)基于PCR的方法进行。培养基购自Difco,氨基酸和其他添加成分购自Sigma-Aldrich。酵母细胞30℃下在YPD(1%酵母提取物,2%蛋白胨和2%葡萄糖)或在基于酵母氮碱的具有硫酸铵、丁二酸、NaOH和适当氨基酸的合成完全培养基(SC)中生长。使用改良的所述醋酸锂方法(Gietz等,1995)用线性DNA或质粒进行转化。由于CCK-22生物合成的连续性,对异源表达的CCK的分析是在生长至对数期的酵母中进行的,其与来自稳定期酵母的结果相反(图2)。从细胞提取物和5A600单位细胞/毫升合成的完全培养基中分析proCCK加工。细胞生长通过600nM吸光度跟踪。
表I.本研究中使用的酿酒酵母菌株。假定的金属蛋白酶无效突变体通过基因型的ORF命名,(*)代表线粒体蛋白酶。

DNA提取和扩增酵母基因组DNA按所述(Philippsen等,1991)分离。聚合酶链式反应(PCR)使用Pwo聚合酶或基于Taq、Pwo和Pfu聚合酶(扩展长距离PCR试剂盒,XL-PCR)的混合酶,均为Roche生产。所有PCR产品通过琼脂糖凝胶电泳观察,PCR产物或者用凝胶提取试剂盒(Qiagen)从凝胶中纯化或者通过PCR纯化旋转柱(GENOMED)从反应混合物中纯化。基于PCR的一步基因破坏使用50ng pRS400系列质粒(Brachmann等,1998)作为模板进行。使用具有20个质粒核苷酸和50个与目的基因相邻的核苷酸的寡核苷酸进行标记的扩增(表2)。所有其他DNA操作根据标准方法进行(Sambrook等,1989)。
质粒构建proCCK的表达在pRS426[2μURA3](Brachmann等,1998)中使用磷酸甘油酸激酶启动子(PGK1p)和终止子(PGK1t)进行。PGK1启动子使用100ng酵母基因组DNA作为模板用PGK1p5′HindIII和PGK1p3′MCS扩增(表2)并随后克隆到pGEM-11(Promega)的HindIII和SacI限制性酶位点中。终止子用PGK1t5′BglII和PGK1t3′SacI扩增(表2)并连接到在SacI和EcoRI限制性酶位点处含有启动子的质粒。然后此构建体pGEM-11PGK1pMCSPGK1t含有PGK1-启动子、带有限制性酶位点EcoRI、BamHI、XbaI和BglII的多克隆位点(MCS)然后为PGK1终止子。preproMfα1p-proCCK融合物(Rourke等,1997)(
图1)亚克隆到pGEM-11PGK1pMCSPGK1t的EcoRI和XbaI位点处,最后全长基因克隆到pRS423和pRS426中以分别完成酵母CCK表达构建体pRS423preproMfα1p-proCCK和pRS426 preproMfα1p-proCCK。多拷贝质粒上CYM1的表达通过扩增CYM1的开放阅读框(ORF)以及额外的5’端926bp和3’端703bp构建。扩增使用100ng酵母基因组DNA和寡核苷酸CYM15’ApaI和CYMl3’XhoI(表2)通过XL-PCR进行。PCR产物在旋转柱上纯化并随后克隆入pRS425的ApaI和XhoI限制性酶位点中。
表2.所用的寡核苷酸
认为对蛋白水解proCCK释放CCK-22很关键的Lys61残基通过定点诱变用丙氨酸替换(Horton等。1993)。替换通过使用Pwo聚合酶(BoehringerMannheim)的PCR进行,其中两个产物用寡核苷酸组PGK1p5’HindIII/CCK-22K→A(反义)和CCK-22K→A(有义)/PGK1t3’SacI(表2)和每个反应50ng pRS426 preproMfα1p-proCCK作为模板扩增。两产物进行琼脂糖凝胶电泳,切出每一产物的约1mm2在第三次PCR反应中直接作为模板使用。在这次反应中,编码融合蛋白的全长cDNA使用PGK1p5’HindII和PGK1T3’SacI扩增(表2)。PCR产物亚克隆到pCR-Blunt II(Invitrogen)中并用CCK特异引物CCK-22seq.测序。最后,PGK1ppreproMfα1p-proCCK(K→A)PGK1t产物克隆到pRS426的HindIII和SacI位点中构建表达质粒proCCK(K→A)。用精氨酸替代赖氨酸如上所述通过用CCK-22K→R(反义)和CCK-22K→R(有义)替换CCK特异引物构建proCCK(K→R)载体进行。
菌株构建部分KEX2破坏的构建通过使用100ng酵母基因组DNA作为模板和寡核苷酸KEX2 5’SacI和KEX2 3’XbaI(表2)的XL-PCR扩增全长KEX2基因ORF每一位点的1000bp在BJ2168中进行。PCR产物在旋转柱上纯化并克隆到pCR-BluntII中(Invitrogen)。TRP1的扩增通过使用TRP15’NdeI和TRP1 3’AvrII(表2)在ORF5’端925bp引入NdeI位点和终止子3’端212bp引入AvrII位点进行XL-PCR。纯化PCR产物并亚克隆到去除KEX2 2018bp和启动子170bp的KEX2中的NdeI和AvrII位点处。Kex2∷TRP1构建体使用限制性酶NotI和SpeI从pCR-Blunt II切下并随后转化BJ2168。在SC-Trp平板上选择转化体,然后通过使用覆盖全部标记加上KEX2每一位点的额外1200bp的kex2 DC5’和kex2 DC3’(表2)寡核苷酸进行菌落PCR筛选,以检测正确的整合。kex2 kex1菌株的构建通过使用LEU2标记的两步基因破坏技术(Rothstein,1991)进行。LEU2的扩增通过使用50ng pRS405作为模板以及kex15’GD400和kex13’GD400(表2)的XL-PCR进行。PCR产物用PCR纯化旋转柱纯化(GENPMED)并随后转化LJY23。在SC-Leu平板上选择转化体,正确的整合通过使用kex15′DC以及kex13’DC(表2)的基于PCR的菌落筛选来检测。
BJ2168背景下的Δcym1∷LEU2(LJY430)菌株通过上述用于Δkex1菌株的一步基因破坏技术构建,其使用寡核苷酸CYM15′GD400和CYM13′GD400(表2)用于基因破坏,使用cym15′DC和cym13′DC(表2)用于破坏控制。通过此方法建立的所有无效突变体用针对与5′和3′UTR相邻的50碱基并带有与含有多种标记的pRS400系列载体特异的3’端设计的寡核苷酸制备(Brachmann等,1998)。在适当的琼脂板上选择转化体然后通过使用覆盖全部标记加上每一位点的额外200bp的寡核苷酸进行菌落PCR筛选,以检测正确的整合。表2只显示了不位于上述位置的寡核苷酸。
使用PCR破坏技术(Brachmann等,1998)和以pRS405[LEU2]作为模板在BJ2168中进行STE24、AXL1、PRD1和YIL108w的基因缺失。
含有APE1、-2和-3基因缺失的LJY123用PCR破坏技术从Y14953衍生(Brachmann等,1998)。APE2最初用LYS2(pRS317[cen;LYS2])代替,其中PCR产物在转化之前从琼脂糖凝胶中纯化并且APE3用LEU2标记(pRS405[LEU2])代替。
yps1yps2yps3三联突变体(LJY15)在BY4705中使用PCR破坏技术构建(Brachmann等,1998)。YPS1的ORF最初通过插入TRP1基因座(pRS404)来删除,以产生LJY13。然后此菌株用作宿主,通过插入LEU2标记(pRS405)删除YPS3,最后通过插入pRS406[URA3]扩增的URA3标记删除YPS2,从而构建LJY15(表I)。
CCK和CYM1的表达人proCCK以酵母α-交配因子前原前导序列和proCCK之间的融合蛋白形式表达(preproMfα1p-proCCK)。融合构建体在多拷贝质粒上表达,具有自磷酸甘油酸激酶启动子进行的组成型基因转录。“ProCCK表达”指使用pRS426 preproMfα1p-proCCK的表达,其用于除了BY4705和从pRS423 preproMfα1p-proCCK表达proCCK的同基因yapsins缺失菌株之外的所有酵母菌株中。CYM1表达通过自身启动子驱动。所用的质粒构建体和寡核苷酸列于表2。
酶促处理使用1mg/ml胰蛋白酶(Worthington Biochemical Corporation)在50mM磷酸钠缓冲液(pH7.5)中室温30分钟进行胰蛋白酶处理并通过浸入沸水10分钟终止处理。在0.1mM磷酸钠缓冲液(pH7.5)中室温30分钟进行4μg/ml终浓度的羧肽酶B(Boehringer Mannheim)处理。反应通过浸入沸水10分钟终止。
凝胶层析生长到晚对数期的酵母转化体于15000g离心收集细胞,4℃下将500μl培养基直接加样至Sephadex G-50特级(Pharmacia)柱(1×100cm)。样品用VBA缓冲液(20mM巴比妥缓冲液,0.11%牛血清白蛋白和0.6mM硫柳汞)以3.5ml/小时的流速洗脱并每17分钟收集级分。通过包括125I-白蛋白(V0)和22NaCl(Vt)进行校准。Ve处洗脱的峰的洗脱常数Kd按Kd=(Ve-V0)/(VtV0)计算。
放射免疫测定法两种不同的抗血清用于确定加工的缩胆囊素量。Ab89009(Paloheimo等,1994)对CCK-22的N-端特异,Ab7270(Hilsted等,1986)对甘氨酸-延伸的CCK特异。加工成CCK-22的CCK级分通过将Ab89009测量的免疫反应性除以样品用胰蛋白酶处理后用相同抗体测量的数量来计算而测量N-端延伸的CCK-22总量。
酵母提取物和蛋白酶测定法生长到对数期的酵母细胞10个A600单位通过3000g离心5分钟沉淀,用25mlH2O洗一次并转入2ml Eppendorf管中。加入等量酸洗过的玻璃珠(Sigma-Aldrich)然后加入包括多种抑制因子(150μM苯丁酸抑制素,30μM E-64,10μM亮抑酶肽,1μM胃酶抑制剂A,1mM苯甲基磺酰氟(PMSF)、1mM EDTA和1mM 1,10-邻二氮杂菲或每2.5ml 0.1MNaH2PO4(Boehringer Mannheim)含或不含EDTA的1片完全抑制剂)的0.1M NaH2PO4(pH4.5)200μl。细胞通过3×20秒涡旋破碎然后提取物通过15000g离心10分钟澄清。所有步骤在4℃进行。蛋白酶分析使用20pmol合成酰胺化CCK-33(Peninsula Laboratorie Europe,Merseyside,England)或Ac-CCK-33-甘氨酸(Cambridge Research Biochemicals,Stockton,England)作为底物、20μl酵母提取物、多种抑制因子和激活剂以总体积30μl进行。混合物在30℃孵育1小时,通过加入500μl VBA缓冲液终止反应然后立即浸入沸水浴10分钟。
使用金属蛋白酶缺陷菌株进行蛋白酶分析分析如上所述进行,但加入1mM苯丁酸抑制素和1mM Mn2+以减少N-端降解。
使用完整酵母细胞进行蛋白酶分析沉淀对数生长细胞的5个A600单位,在5mlH2O中洗一次并在SC培养基(pH6.0)中洗一次,然后细胞重悬于25μl SC培养基中。蛋白酶分析通过加入20pmol合成Ac-CCK-33-甘氨酸作为底物30℃轻摇孵育混合物1小时进行。通过加入500μlVBA终止反应,通过离心去除细胞然后上清浸入沸水10分钟。
通过MALDI-TOF分析分泌的CCKCCK转化的酵母细胞的50个A600单位加入25ml新鲜培养基中,然后孵育3小时。15000g离心10分钟去除细胞,500μl培养基通过使用ZipTipC18柱(Millipore)反向浓缩和除盐。肽用10ul 50%乙腈洗脱。纯化的多肽在使用时间滞后调焦(延时提取)的反射模式操作的基质辅助激光吸附/离子化飞行时间质谱仪(Biflex,Bruker-Franzen,Bremen,Germany)中分析。0.5μl样品与0.5μl基质溶液(溶于乙腈/甲醇的α-氰-4-羟基肉桂酸,Hewlett Packard)混合用于分析。然后将0.5μl混合物加入探测器并在导入质谱仪之前允许其干燥。
统计学分析使用非成对students t-检验分析表达proCCK的野生型酵母和野生型菌株同基因突变体的proCCK表达的变化或成熟CCK-22级分的变化是否是统计学上显著的而进行统计学计算。所计算的yapsin突变体间CCK-22加工的P-值为将BY4705与每一突变体进行的比较,而括号分别代表BY4705 yps1和BY4705 yps1 yps3,以及BY4 705 yps1 yps3和BY4705yps1 yps2 yps3之间的比较。
在酿酒酵母中表达proBNP-yps1突变体的构建preproBNP的克隆使用Quickprep Micro mRNA纯化试剂盒(Amersham PharmaciaBiotech)从500mg人心脏活组织中分离信使RNA。第一链cDNA从2μgmRNA在含有2.5μl 10×第一链缓冲液(Promega)、2.5μl 100mM DTT、2.5μl 10mM dNTP、2.5μl焦磷酸钠、10pmol Oligo(dT)18、10个单位反转录酶AMV(Promega),并补充H2O到25μl的反应中制备。加热信使RNA和Oligo(dT)18到70℃5分钟,cDNA合成之前将其冰上冷却5分钟。42℃60分钟进行第一链cDNA合成。
使用Pwo聚合酶(Roche),1μl第一链cDNA,5μl包括MgCl2的10×Pwo缓冲液(Roche),5μl 2.5mM dNTP,每一引物30pmol(BNP5’EcoRI和BNP3’XbaI)扩增编码preproBNP的cDNA。编码preproBNP的PCR产物克隆到pBluescriptII(Stratagene)中。所有后续PCR反应如上所述进行。
编码α-交配因子前原序列和proBNP的cDNA的融合使用突出端延伸PCR进行,其中建立两个PCR反应。一个使用50ng pRS426preproMfα1p-proCCK作为模板,MFα15’EcoRI和MF1BNP(AS)作为引物;另一个使用50ng克隆到pBluescript中的preproBNP并且引物为MF1BNP(S)和BNP3’XbaI。第三个PCR反应中两初始PCR中每一PCR产物约50ng使用凝胶提取试剂盒(Qiagen)从琼脂糖凝胶中纯化并用作两个寡核苷酸MFα15’EcoRI和BNP3’XbaI的模板。preproMfα1p-proBNP编码构建体亚克隆到pCR-BluntII(Invitrogen)中,并在亚克隆到pGEM-11PGK1pMCSPGK1t的EcoRI和XbaI位点之前用载体特异的寡核苷酸测序。最后将完整基因克隆到pRS426中完成酵母proBNP表达构建体pRS426preproMfα1p-proBNP。
另外,构建两个其他构建体,其中已去除了proBNP片段(1-76)。这些构建体与preproMfα1p-proBNP的构建相似但仅合成BNP-32。第一个构建体中,Kex2p切割位点和preproMfα1p的间隔肽不变(KREAEA)(
图14B),而另一个构建体中去除间隔肽(
图14C)。野生型酵母和同基因CYM1破坏体的BNP-32表达分析使用Electra-Box Diagnostica ApS的Shionoria-BNP系统通过RIA分析。此鉴定法为BNP-32特异的。
proCCK,proBNP和Cym1p的表达人proCCK以酵母α-交配因子前原前导序列和proCCK的融合蛋白形式表达(preproMfα1p-proCCK)。融合构建体在多拷贝质粒中表达,自磷酸甘油酸激酶启动子起始进行组成型基因转录。“ProCCK表达”指使用pRS426 preproMfα1p-proCCK的表达,其用于除BY4705和proCCK从pRS423 preproMfα1p-proCCK表达的同基因yapsins缺失菌株外的所有酵母菌株中。人proBNP也以酵母α-交配因子前原前导序列和proBNP(preproMfα1p-proBNP)的融合蛋白形式表达(
图14A)。CYM1在自身启动子驱动下表达。质粒构建体和所用的寡核苷酸列于表2。
BNP放射免疫测定98192抗体对proBNP N-端特异( 等,2002)。
层析FPLC层析在kta净化装置(Amersham Pharmacia Biotech)的Superdex 200柱上进行。50mM磷酸钠缓冲液中包括100mM NaCl和6M胍。
菌株构建BJ2168背景中的Δyps1∷TRP1(LJY440)和Δcym1∷LEU2 Δyps1∷TRP1(LJY431)菌株如上所述使用用于基因破坏的寡核苷酸YPS15′GD400和YPS13′GD400(表2)通过一步基因破坏技术构建。PCR产物转化入BJ2168和LJY430。通过使用yps15′DC和yps13′DC(表2)的PCR分析确认破坏盒的正确整合。
鉴定巴斯德毕赤酵母或甲醇毕赤酵母中编码Cym1直向同源的基因从巴斯德毕赤酵母和甲醇毕赤酵母中鉴定编码酿酒酵母Cym1p直向同源物的未知基因使用下面提到的相同系列的简并引物以类似方式进行。巴斯德毕赤酵母和甲醇毕赤酵母在下文中以毕赤酵母形式提及。
通过比对克鲁弗酵母和粟酒裂殖酵母的直向同源Cym1蛋白质和酿酒酵母的Cym1p鉴定出许多相同的氨基酸序列。从这些序列可合成与所有三个物种CYM1的互补DNA链结合的简并寡聚核苷酸(表3),并且也和毕赤酵母的CYM基因结合。基因组序列的扩增最初通过使用高质量基因组DNA作为模板,Pichia-CYM1-Ia和Pichia-CYM1-Ib和Pwo聚合酶(Roche)进行。扩增的预期为525bp大小的序列克隆到pBlunt或类似载体中并用载体特异引物测序。如果最初扩增未出现带,使用第一次PCR反应1μl作为模板用两个嵌套引物Pichia-CYM1-IIa和Pichia-CYM1-IIb进行第二轮PCR循环。预期产物约为270bp然后克隆到pBlunt中并用M13正向和M13反向引物测序。从获得的序列可合成序列特异性引物、两个嵌套正义特异性引物和两个嵌套反义特异性引物。使用正义引物之一可能使用高质量基因组DNA作为模板获得带有Pichia-CYM1-IIIb的PCR产物。克隆并测序此~2100bp产物。如果未产生~2100bp的带,就必需如ClontechMarathon cDNA Amplification Kit操作手册(BD(Becton,Dickinson andCompany))中所述从毕赤酵母中分离mRNA,产生双链cDNA并在末端连上接头。使用两个序列特异性正义引物可能获得mRNA 3’端约2600bp序列并且使用序列特异性反义引物扩增包括编码假定活性部位HXXEH基元序列的5’端。通过从5’和3’非翻译区合成序列特异性寡核苷酸,可克隆编码毕赤酵母Cym1直向同源物的全长cDNA。
表3
X-次黄嘌呤核苷,简并寡核苷酸按照国际生物化学协会设计(http//www.chem.qmul.ac.uk/iubmb/misc/naseq.html)。
巴斯德毕赤酵母或甲醇毕赤酵母中Cym1直向同源物的基因破坏将编码毕赤酵母Cym1直向同源物的序列克隆到像pBluescript-II的载体的HindIII和Sac I中或类似的载体中,条件是其不存在于ORF中。将ORF插入HindIII和Sac I位点中去掉了载体多克隆位点中的大多数,这使得易于发现只存在于ORF中的限制性酶位点。克隆ORF中的KanMX盒,优选地这样毕赤酵母CYM1的1000bp存在于KanMX盒的一侧而产生毕赤酵母CYM1破坏盒。然后此构建体使用毕赤酵母CYM1基因5’端和3’端特异性引物通过PCR扩增。将PCR产物转化毕赤酵母菌株然后在含100μg/ml遗传霉素(G-418)的YPD平板上选择转化体。使用与KanMX盒5’端和3’端结合的毕赤酵母序列特异性CYM1引物通过菌落PCR确认在毕赤酵母基因组中正确的整合。从PCR产物的大小能分辩整合事件是否正确。
在巴斯德毕赤酵母中表达处源蛋白质和肽为表达肽可使用Invitrogen的表达构建体pPICα(诱导型表达)或者pGAPZα(组成型表达)。这两个载体都使用酿酒酵母α-交配因子的前原序列通过分泌途径指导融合肽。α-交配因子的前原序列在高尔基体中去掉然后目的肽释放于培养基中。如果表达蛋白质,当异源表达的蛋白质为胞质定位并可从完整细胞中分离时,可使用没有α-交配因子前原序列的两个上面所提及载体(pPICZ和pGAPZ)。
在甲醇毕赤酵母中表达外源蛋白质和肽在甲醇毕赤酵母中表达蛋白质和肽以如巴斯德毕赤酵母中类似的方式进行,其中质粒可使用用于蛋白质胞内表达和分泌到培养基的质粒。胞内表达的蛋白质可克隆到pMET(Invitrogen)中而分泌蛋白质克隆到pMETα(Invitrogen)中。pMETα含有如用于在巴斯德毕赤酵母表达的酿酒酵母α-交配因子的前原序列。此系统中通过甲醇诱导表达。
结果生长条件对CCK-22加工的影响从表达proCCK的BJ2168中测量CCK-22的胞内和胞外级分。无论细胞处于指数生长期还是到达稳定期,胞内级分都保持不变(图2)。但分泌的CCK-22的相对量在细胞到达稳定期时明显改变。在指数生长期CCK-22级分为23%,但在稳定期(270分钟后)此级分增加到37%(图2)。所以在此所述的实验中仅使用指数生长的细胞。
赖氨酸残基在CCK-22释放中的意义为评价赖氨酸残基在蛋白水解中的作用,将用两个表达构建体proCCK和proCCK(K→A)转化的BJ2168转化体生长到晚指数期并收集培养基。对每一菌株的培养基进行凝胶层析并用Ab7270测量收集的级分中Gly-延伸CCK含量。野生型培养基中的CCK在Kd=0.8和1.1的两个主峰中洗脱下来(图3A),这与以前建立的CCK-22-Gly和CCK-8-Gly(Cantor等,1987;Rourke等,1997)的洗脱位置一致,而proCCK(K→A)产生CCK-8-Gly和在Kd=0.6洗脱下来的较大形式(图3C)。野生型构建体中在Kd=0.7和0.8洗脱下来的两个峰(图3B)分别与C端延伸的CCK-22和CCK-22-Gly对应(Rourke等,1997),而在这些位置处未观察到proCCK(K→A)构建体的CCK-22免疫反应性(图3D)。然而在Kd=0.55观察到免疫反应性小峰,其可能由于Ab89009与较大未加工片段的轻微交叉反应性(Paloheimo等,1994)。为研究精氨酸取代赖氨酸的影响,用proCCK(K→R)转化BJ2168。在胰蛋白酶切割之前和之后分析转化体的培养基。加工成CCK-22的proCCK级分与在野生型CCK中观察到的类似。
通过质谱分析分泌的CCK肽收集自proCCK转化的BJ2168培养基通过质谱分析(
图12)。获得的片段与加工的CCK-39、CCK-22和CCK-8相对应。Lys61的N-端鉴定出了两个肽(Tyr45-Val60,1805.0 Da和Tyr45-Lys61,1932.2 Da)。表明前者可能为后者的羧肽酶降解产物。为说明这个问题并尝试鉴定C-端延伸的CCKs,本发明者产生了这样的破坏菌株,其中编码负责加工成CCK-8的丝氨酸蛋白酶的KEX2和KEX1编码的羧肽酶都发生了突变。将proCCK转化入此kex2 kex1菌株(LJY22)并随后分析分泌的肽之后,本发明者仅发现了与Tyr45-Lys61对应的峰。使用KEX1和KEX2单基因破坏表达proCCK过程中看到了同样的模式,即仅有与Tyr45-Lys61对应的峰(数据未显示)。这样Tyr45-Val60肯定为与来源于Lys61后切割的CCK-22一致的降解产物。其他的片段通过在与CCK-61(未在哺乳动物中鉴定出)、CCK-58、C-端延伸的CCK-39和C-端延伸的CCK-22(
图12)加工相应的kex2 kex1菌株中表达发现,而与我们前面工作一致的是未鉴定出与CCK-8相应的肽,这表明Kex2p参与了此加工过程(Rourke等,1997)。
Kex2p参与了CCK-22的生物合成以前对kex2菌株分泌的CCK肽的分析和质谱获得的结果表明在Lys61处切割释放CCK-22可在没有Kex2p的参与下发生。然而kex2菌株显示出CCK-22浓度降低。ProCCK在液泡蛋白酶缺陷菌株和同基因kex2菌株(BJ2168和LJY23)中表达并且测量指数生长细胞中加工的胞内和胞外CCK-22级分。BJ2168中约28%的胞内CCK内容物在Lys61之后得到加工,而kex2菌株中仅6%得到加工。对分泌的CCK肽分析表明从表达proCCK的BJ2168中收集的培养基含有约20%的CCK-22,而kex2突变体中,数量减少到5%。这些结果表明Kex2p参与了生成CCK-22的加工过程。然而还有其他蛋白酶能进行Lys61切割。
Lys61切割的体外鉴定法为研究除Kex2p外能在proCCK单一Lys61之后进行内肽酶切割的其它蛋白酶本质,使用酿酒酵母粗制品且以合成CCK-33作为底物建立了体外鉴定法。
使用液泡蛋白酶缺陷菌株BJ2168的提取物,存在普遍的N-端降解并且可测量的CCK回收少于无酵母提取物对照的10%。因为鉴定法依赖于抗体结合的CCK-22完整N端,本发明者建立了其中一些已知酿酒酵母氨肽酶缺失的菌株。Y14953菌株(ape1)用作亲代菌株,其也缺失了APE2和APE3基因。使用此LJY123菌株制备细胞提取物,与用BJ2168观察到的回收相比有2-3倍增加的免疫反应性。
加工成CCK-22依赖于金属离子蛋白酶切割合成的人CCK-33产生CCK-22的本质通过包括多种不同抑制因子用LJY123提取物来分析。结果表明仅金属螯合剂的加入抑制CCK-33蛋白水解成CCK-22(图4A)。
活性最初被1mM EDTA的加入抑制之后,体外检测蛋白酶的金属依赖性。通过加入0.2mM过量的不同二价阳离子检测活性重建导致的CCK-22成熟。与已知金属蛋白酶只能由Zn2+、Co2+合Mn2+活化的性质一致,Zn2+、Co2+合Mn2+的加入能重建蛋白酶活性而Ca2+、Cu2+或Mg2+的加入没有影响(图4B)。使用渐增的Zn2+浓度再活化表明为一个双相模式,其中Zn2+在5mM浓度以上执行抑制作用(数据未显示)。
1mM EDTA最初抑制之后使用LJY123细胞提取物分析Zn2+和Mn2+再活化的金属蛋白酶的CCK-切割时间进程。通过加入1.2mM Zn2+或Mn2+然后孵育30、60和120分钟进行再活化。在此鉴定法和下面体外蛋白酶鉴定法中发明者使用N-端乙酰化的CCK-33-Gly(Ac-CCK-33-Gly)作为底物,其引起非常缓慢的非特异性降解。使用Ab89009测量胰蛋白酶切割前后的CCK-22免疫反应性表明30和60分钟时Zn2+和Mn2+没有活化能力的区别,然而120分钟后测量到使用Mn2+作为活化剂与Zn2+相比CCK-22免疫反应性增加了10%以上(图5)。免疫反应性的增加可能由于在此加入Mn2+之后抑制了降解,也可能由于表4中使用的酵母细胞提取物。
表4.酿酒酵母金属蛋白酶。搜索在Swiss-Prot序列检索系统(SRS)http//www.expasy.ch/中进行。蛋白酶分析使用金属蛋白酶缺陷菌株提取物的两个独立分析(A和B)中进行。用Ab89009测量CCK-22量并在胰蛋白酶切割之后用Ab89009测量CCK总量。假定的金属蛋白酶用*标记。
胞外yapsin活性为研究蛋白酶活性为分泌的还是与质膜胞外联系,在培养基中用完整酵母细胞分析了蛋白酶活性。使用指数生长的LJY123细胞30℃孵育1小时后未发生CCK-33的降解,这与以前的观察一致(Rourke等,1997)。在与完整酵母细胞孵育过程中,可测量暴露CCK-22 N-端的切割(图6),然而这种蛋白酶活性不能被所研究的抑制剂消除(数据未显示)。通过使用包含YPS1、YPS2和YPS3基因破坏(表I)的完整细胞,加工的CCK-22级分通过缺失三个天冬氨酰蛋白酶的任一个从而与野生型细胞相比减少(图6)。这些数据表明三个蛋白酶都具有胞外蛋白酶活性,其能在proCCK中Lys61处切割。初步结果表明YPS7基因破坏与YPS1缺失相比,前者降低胞外Lys61加工的量(未发表结果)。
在金属蛋白酶缺陷菌株中表达proCCK基于前面所述酿酒酵母中金属蛋白酶的内肽酶活性(Adames等,1995;Schmidt等,2000),AXL1(LJY201)和STE24(LJY202)基因缺失菌株最初在BJ2168中制备。ProCCK在这些菌株中的表达表明与野生型相比Lys61之后的蛋白水解未改变并决定检测余下的金属蛋白酶缺陷菌株LJY123、LJY203、LJY204和通过Euroscarf获得的金属蛋白酶缺陷菌株(表I)分泌CCK-22的能力(不包括线粒体肽酶)。产生CCK的金属蛋白酶缺陷菌株中CCK-22免疫反应性未显著改变(数据未显示),并且通过此方法未鉴定出将异源表达的proCCK加工成CCK-22的蛋白酶。
CYM1编码能释放CCK-22游离N-端的蛋白酶制备每一可育金属蛋白酶缺陷菌株的细胞提取物并在体外蛋白酶鉴定法中检测以研究是否有可测量的蛋白水解的减少。在此鉴定法中,加入Ac-CCK-33-Gly之前使用1mM Mn2+和1mM苯丁抑制素,因为发现加入这些氨肽酶抑制剂时回收为80-90%而不加入这些氨肽酶抑制剂时回收为30%(数据未显示)。CYM1的缺失几乎消除了蛋白酶活性,而其他金属蛋白酶缺陷菌株均未表明CCK-22生物合成的显著变化(表4)。
多拷贝质粒上表达CYM1在体外增加成熟CCK-22级分为确定在体外合成的CCK-22的数量是否与Cym1p的数量相关,将Cym1p在多拷贝质粒上表达并随着时间分析合成的CCK-22级分。pRS425CYM1转化的BJ2168细胞提取物和pRS425空载体转化的对照用于含1mM Mn2+的体外蛋白酶鉴定法中,其中反应在15、30、45和60分钟后终止。CCK-22免疫反应性用Ab89009测量,余下的CCK-33在胰蛋白酶切割之后用相同的抗体测量(图7)。多拷贝质粒上CYM1的表达提高CCK-22产生速度数倍。然而,发明者还观察到CCK-33和CCK-22降解的增加(图7B)。当在pH6.0和pH7.5下进行相同实验时,降解有非常明显的增加并且30分钟孵育之后在pH6.0中检测不到CCK免疫反应性(数据未显示)。这些结果表明CCK-22体外成熟过程中的赖氨酸特异性切割依赖于Cym1p的量。
cym1突变体菌株中proCCK的表达提高CCK的分泌为说明CYM1在CCK-22体内合成中的作用,在液泡蛋白酶缺陷菌株BJ2168和同基因kex2菌株中制备CYM1基因缺失。CYM1的缺失造成细胞中proCCK总量增加约40%(图8A)同时CCK-22不依赖于KEX2破坏有类似的减少(图8C)。同样cym1菌株中总CCK分泌量增加60%以上(图8B),但与胞内CCK-22级分减少不同,CCK-22胞外级分与液泡蛋白酶缺陷菌株和同基因kex2菌株相比有所增加(图8D)。
与cym1菌株中野生型CCK累积相比,CCKK→A突变体的表达引起胞内CCK的累积CYM1的基因破坏造成CCK胞内浓度增加(图8A)的观察提出这样一个问题,Cym1p的蛋白水解活性是否在移位到内质网之前引起CCK-22的降解。因此本发明者在表达CCK的菌株中检测了胞内CCK含量,其中通过使用Lys61→Ala61突变体消除了CCK-22的成熟。胰蛋白酶和羧肽酶B处理之后使用Ab7270分析此CCK突变体在液泡蛋白酶缺陷菌株BJ2168和同基因cym1菌株中的转化体并且与野生型CCK表达相比此构建体的胞内CCK免疫反应性有所增加(图9)。分别在BJ2168和CYM1破坏菌株中表达时,突变体CCK(K→A)和野生型CCK转化体造成胞内proCCK浓度的增加。胞内proCCK的增加并非附加表明Cym1p的蛋白水解活性在移位到内质网之前引起CCK-22的降解。
在天冬氨酰蛋白酶缺陷菌株中表达proCCK在无效突变体YPS1、-2和-3中分析proCCK的Lys61-特异性切割,其中测量指数生长的野生型酵母细胞BY4705和用proCCK转化LJY13、-14和-15的同基因天冬氨酰蛋白酶缺陷菌株中CCK-22的胞内和胞外数量。BY4705的胞内和胞外CCK免疫反应性比液泡蛋白酶缺陷菌株BJ2168相比低10倍多(数据未显示)。CCK-22胞内级分从野生型细胞中约28%显著减少到yps1菌株中的17%,而通过YPS2和YPS3基因破坏未测量到额外的减少(
图10A)。然而CCK-22胞外级分确实表明Yps1p、Yps2p和Yps3p都参与了CCK-22的生物合成并且三联突变体降低CCK-22到野生型酵母的2/3(
图10B)。
CYM1破坏引起分泌的野生型CCK和CCKK→R突变体总量增加两倍为说明Cym1p是否切割单一精氨酸残基的C-端,在液泡蛋白酶缺陷菌株BJ2168和同基因cym1菌株中表达CCK(K→R)突变体。比较胞内和胞外CCK浓度与这些菌株中表达的野生型CCK浓度。突变CCK(K→R)总量与野生型CCK相比在胞内和胞外都有增加(
图11)。在cym1菌株中表达时,野生型CCK和Lys61→Arg61突变体都表明胞外CCK可测量数量增加两倍(
图11B)。
在肽合成中利用Cym1p活性本发明的另一方面为使用Cym1p活性产生数量增加的胞质Cym1p活性,其中Cym1p从其自身启动子表达或从强组成型启动子例如PGK1、ADH1或TPI1或诱导型GAL1启动子表达。如前面提到的,当在2μ质粒上CYM1从其自身启动子转录时CCK-22的合成显著增加(图7)。转录可从含有启动子、CYM1和终止子的质粒进行或者通过异源重组取代CYM1为内源启动子在基因组中引入目的启动子进行。
活性可用于细胞内以产生不需经分泌途径的翻译后修饰的肽,例如二硫键形成、N-和O-糖基化或外切蛋白酶活性。
野生型细胞中CCK-22的生物合成与CYM1破坏同基因菌株的比较表明了Cym1p胞质活性在胞内肽合成中的作用,其表明CCK-22数量的显著增加(图8C)。目的肽的合成以避免移位到内质网(ER)的方式进行。这可通过从蛋白质中去掉导致翻译后进入内质网的疏水氨基端信号序列进行或在温度敏感分泌突变体如sec61中的表达来进行,当温度提高到37℃时其能消除分泌肽移位到内质网中。
然后目的前肽或原前肽(prepropeptide)可为胞质定位并为Cym1p的潜在底物。肽从其前体的释放通过引入proCCK中观察到的切割位点通过Cym1p活性进行,其造成内肽酶解加工C-端Lys61(Ser-Ile-Val-Lys61↓)后Gly-延伸CCK-22的释放(
图13A)。如果目的肽为GLP1,合成可以与Cym1p切割位点融合的形式进行,其为部分proCCK(
图13B)。然后目的肽将在胞质中累积并可从裂解之后的沉淀细胞中纯化。
ProBNP在cym1突变体菌株中的表达提高proBNP的分泌为说明CYM1在proBNP体外生物合成中的作用,在液泡缺陷菌株BJ2168和三个蛋白酶缺陷同基因菌株Δcym1∷LEU2(LJY430)、Δyps1∷TRP1(LJY440)和Δcym1∷LEU2 Δyps1∷TRP1(LJY431)中表达proBNP。CYM1的缺失造成分泌的proBNP总量增加约100%,而proBNP的分泌不依赖于编码天冬氨酰蛋白酶Yps1p的基因破坏并因此与野生型菌株相似(
图15A)。预期Cym1和Yps1的破坏都与cym1突变体中的分泌量相似(
图15A)。
proBNP从cym1突变体中分泌的分析为分析酿酒酵母中表达的proBNP,cym1突变体的培养基用于FPLC层析并使用抗体98192通过RIA分析。从34-39级分洗脱的峰与完整proBNP对应,而53-62级分中洗脱的峰很可能是proBNP 1-76片段的proBNP加工形式(
图15B)。1-76片段和BNP-32从proBNP的释放是由于单一精氨酸残基之后的切割并可能由于Kex2或Yps1的活性。
讨论分泌的多肽随生长条件而改变,当培养到达稳定期时CCK-22级分增加,而胞内加工级分在胁迫条件下保持不变。胞外切割成CCK-22随着细胞进入稳定期而增加表明能将proCCK加工成CCK-22的胞外内切蛋白酶为分泌的或在细胞膜上表达。已知天冬氨酰蛋白酶Yps1p和Yps2p表现细胞表面活性(Komano等,1998)。此外,以前表明异源肽在yps1菌株中的表达通过抑制单碱性残基C-端的蛋白水解提高对像白蛋白、胰高血糖素、GLP1、GLP2和CART的蛋白质和肽的回收(Egel-Mitani等,2000;Kerry-Williams等,1998)。这样最近的研究((Egel-Mitani等,2000;Kerry-Williams等,1998)和本发明者的研究)表明了在指数生长期收集分泌肽以避免额外胞外加工的重要性。
液泡蛋白酶缺陷菌株中表达的ProCCK在proCCK的Lys61处表现30%的胞内加工。而胞外Lys61-加工级分减少到完整酵母细胞中观察到级分的2/3,其显示了分泌前CCK-22的胞内降解。有限营养来源下胞外蛋白水解的增加可能由于如观察到的稳定期YPS1转录上调的有限营养来源下胞外蛋白酶转录的激活或上调(Gasch等,2000)。Yapsins中Yps1p、Yps2p和Yps3p具有部分细胞表面活性,但是甚至在三联突变体中仍保留了一些胞外活性仍。
本研究中发明者显示了KEX2的缺失引起胞内和胞外Lys61切割都降低5倍。表达proCCK的kex2菌株不仅改变了proCCK中的Lys61切割还改变了CCK的胞内存留时间,因为与野生型酵母相比CCK肽的胞内浓度降低了60%以上而胞外CCK浓度增加了几乎60%。此外kex1 kex2双突变体和kex2突变体中分泌的CCK肽分析表明Tyr45-Val60降解产物消失。这样表明通过高尔基体外侧网络提高的分泌速度在kex2菌株中消除了通过Kex1p去掉Lys61。这些结果和proCCK快速分泌的观察暗示了Kex2p造成的胞内存留引起了野生型酵母中通过yas1p和可能某种程度上通过Kex2p的CCK-22合成的增加。
在体外蛋白酶鉴定法中使用酿酒酵母粗提取物研究了引起CCK-22胞内成熟的蛋白酶类型,以分析合成的人CCK-33在不同抑制剂存在条件下加工成CCK-22的过程。通过在蛋白酶活性的提取过程中不包括去垢剂避免了Kex2p和GPI-锚定的yapsins活性(Azaryan等,1993;Fuller等,1989;Komano等,1999)。在受检测的抑制剂中,只有EDTA和1,10邻二氮杂菲抑制蛋白水解并且活性可通过加入二价阳离子Zn2+、Co2+和Mn2+恢复。这表明金属蛋白酶参与了CCK-22的成熟过程。
候选金属蛋白酶都不含有指导蛋白质到内质网的明显信号肽。因此本发明者研究了线粒体蛋白酶之外的每一种金属蛋白酶缺陷菌株。proCCK在每一菌株中的表达造成与野生型酵母中看到的相似不变的CCK-22成熟过程。然而,通过使用体外蛋白酶鉴定法,本发明者鉴定出Cym1p为进行CCK-33赖氨酸后切割的内肽酶。Cym1p可切割proCCK中的Lys61通过过量表达研究验证,其表明酶活性增加数倍。
cym1菌株中CCK-22胞内合成减少同时总proCCK浓度增加。相反地,胞外CCK-22级分与总的CCK平行增加的野生型酵母相比增加。这些发现与像大多数胰岛素降解酶一样的Cym1p活性的胞质定位一致(Bai等,1996)并表明其在移位到内质网之前作用于preproMfα1p-proCCK构建体。这样proCCK的移位前降解通过CYM1破坏减少并且总产量增加。
在cym1Δ突变体中proBNP以与preproMfα1p序列的融合肽形式表达显示出胞外proBNP含量与野生型菌株相比增加了两倍。层析分析分泌的proBNP揭示了存在两种主要形式。一种为完整proBNP,而另一种为proBNP1-76片段,这样也合成了生物活性的BNP-32,但是在本鉴定法中未检测到。proBNP1-76片段的释放很可能依赖于Kex2p活性,然而这在本鉴定法中未检测,因为proBNP的释放依赖于Kex2p和Kex1p两者。
所有以上讨论的出版物在此全部引用。
本领域技术人员理解如详细实施方案中显示的,对本发明所做的大量改变和/或变化并不偏离广泛描述的本发明的核心或范围。因此本实施方案在所有方面应理解为的说明性的而并非限制性的。
参考文献Adames,N.,Blunde11,K.,Ashby,M.N.和Boone,C.(1995).Science270464-67.
Azaryan,A.V.,Wong,M.,Friedman,T.C.,Cawley,N.X.,stivariz,F.E.,Chen,H.C.和Loh,Y.P.(1993).J.Biol.Chem.6811968-75.
Bai,J.P.,Hong,H.J.,Rothenberger,D.A.,Wong,W.D.和Buls,J.G.(1996).J.Pharm.Pharmacol.481180-84.
Becker,A.B和Roth,R.A.(1992)PNAS 893835-3839.
Brachmann,C.B.,Davies,A.,Cost,G.J.,Caputo,E.,Li,J.,Hieter,P.和B0eke,J.D.(1998).Yeast 14115-132.
Cantor,P.和Rehfeld,J.F.(1987).Clin.Chim.Acta 168153-58.
Egel-Mitani,M.,Andersen,A.S.,Diers,I.,Hach,M.,Thim,L.,Hastrup,S.和Vad,K.(2000).Enzyme Microb.Technol.26671-77.
Egel-Mitani,M.,Flygenring,H.P.和Hansen,M.T.(1990).Yeast6127-137.
Elbashir,S.M.,Harborth,J.,Lendeckel,W.,Yalcin,A.,Weber,K.和Tuschl,T.(2001).Nature 411,494-98.
Fuller,R.S.,Brake,A.和Thorner,J.(1989).Proc.Natl.Acad.Sci.USA.861434-38.
Gasch,A.P.,Spellman,P.T.,Kao,C.M.,Carmel-Harel,O.,Eisen,M.B.,Storz,G.,Botstein,D.和Brown,P.O.(2000).Mol. Biol. Cell114241-57.
Gietz,R.D.,Schiestl,R.H.,Willems,A.R.和Woods,R.A.(1995).Yeast 11355-60.
JP,Kastrup J,Pedersen F和Rehfeld JF.(2002)使用不依赖于前体加工的分析法定量pro-B-型尿钠肽及其在人血浆中的产物,ClinChem.Jul;48(7)1035-42)。
Haseloff,J.和Gerlach,W.L.(1988).Nature,334585-91.
Hilsted,L.和Rehfeld,J.F.(1986).Anal.Biochem.152119-26.
Hooper N.M.(1994)FEBS Letters 3541-6.
Horton,R.M.,Ho,S.N.,Pullen,J.K.,Hunt,H.D.,Cai,Z.和Pease,L.R.(1993).Methods Enzymol.217270-79.
Jones,E.W.(1991).Methods Enzymol.194428-53.
Julius,D.,Schekman,R.和Thorner,J.(1984).Cell 36309-18.
Kerry-Williams,S.M.,Gilbert,S.C.,Evans,L.R.和Balance,D.J.(1998).Yeast 14161-69.
Komano,H.,Rockwell,N.,Wang,G.T.,Krafft,G.A.和Fuller,R.S.(1999).J.Biol.Chem.27424431-37.
Komano,H.,Seeger,M.,Gandy,S.,Wang,G.T.,Krafft,G.A.和Fuller,R.S.(1998).J.Biol.Chem.27331648-51.
Needleman,S.B.和Wunsch,C.D.(1970).J.Mol.Biol.48443-53.
Paloheimo,L.I.和Rehfeld,J.F.(1994).Clin.Chim.Acta 22949-65.
Philippsen,P.,Stotz,A.和Scherf,C.(1991).Methods Enzymol.194169-82.
Rawlings,N.D.和Barrett,A.J.(1995).Meth.Enzymol.248183-228.
Rothstein,R.(1991).Methods Enzymol.194281-301.
Rourke,I.J.,Johnsen,A.H.,Din,N.,Petersen,J.G.L.和Rehfeld,J.F.(1997).J.Bio1.Chem.2729720-27.
Sambrook,J.,Fritsch,E.F.和Maniatis,T.(1989).Molecular CloningA Laboratory Manual,第二版,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY.
Schmidt,W.K.,Tam,A.和Michaelis,S.(2000).J.Biol.Chem.2756227-33.
Shippy,R.,Lockner,R.,Farnsworth,M.和Hampel,A.(1999).Mol.Biotech.12117-29.
Waterhouse,P.M.,Graham,M.W.和Wang,M.-B.(1998).Proc NatlAcad Sci USA,9513959-64.
序列表 110 CYM1P有限公司 120 增加宿主细胞重组多肽产量的方法 130 P32077PC01 150 DK/PA 2002 01391 151 2002-09-20 160 68 170 用于Windows版本4.0的FastSEQ 210 1 211 5 212 PRT 213 人工序列 220
223 Pitrilysin共有序列 220
221 MISC_FEATURE 222 (2)..(2) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (3)..(3) 223 X=任一氨基酸 400 1His Xaa Xaa Glu His1 5 210 2 211 46 212 PRT 213 人工序列 220
223 Pitrilysin共有序列 220
221 MISC_FEATURE 222 (2)..(2) 223 X=任一氨基酸
220
221 MISC_FEATURE 222 (3)..(3) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (5)..(5) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (6)..(6) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (9)..(9) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (10)..(10) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (11)..(11) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (12)..(12) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (14)..(14) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (15)..(15) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (16)..(16) 223 X=任一氨基酸
220
221 MISC_FEATURE 222 (17)..(17) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (18)..(18) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (19)..(19) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (20)..(20) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (21)..(21) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (22)..(22) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (23)..(23) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (24)..(24) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (25)..(25) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (26)..(26) 223 X=任一氨基酸
220
221 MISC_FEATURE 222 (27)..(27) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (28)..(28) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (29)..(29) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (30)..(30) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (31)..(31) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (32)..(32) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (33)..(33) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (34)..(34) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (35)..(35) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (36)..(36) 223 X=任一氨基酸或不存在
220
221 MISC_FEATURE 222 (37)..(37) 223 X=任一氨基酸或不存在 220
221 MISC_FEATURE 222 (40)..(40) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (42)..(42) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (43)..(43) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (44)..(44) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (45)..(45) 223 X=任一氨基酸 400 2Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr35 40 45 210 3 211 46 212 PRT 213 人工序列 220
223 Pitrilysin共有序列
220
221 MISC_FEATURE 222 (2)..(2) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (3)..(3) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (5)..(5) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (6)..(6) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (9)..(9) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (10)..(10) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (11)..(11) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (12)..(12) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (14)..(14) 223 X=S or T 220
221 MISC_FEATURE 222 (15)..(15) 223 X=任一氨基酸
220
221 MISC_FEATURE 222 (19)..(19) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (20)..(20) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (21)..(21) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (22)..(22) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (23)..(23) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (24)..(24) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (25)..(25) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (26)..(26) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (27)..(27) 223 X=任一氨基酸或不存在 220
221 MISC_FEATURE 222 (28)..(28) 223 X=任一氨基酸或不存在
220
221 MISC_FEATURE 222 (30)..(30) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (31)..(31) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (32)..(32) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (33)..(33) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (34)..(34) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (35)..(35) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (36)..(36) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (37)..(37) 223 X=任一氨基酸或不存在 220
221 MISC_FEATURE 222 (40)..(40) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (42)..(42) 223 X=任一氨基酸
220
221 MISC_FEATURE 222 (43)..(43) 223 X=任一氨基酸 220
221 MISC_FEATURE 222 (44)..(44) 223 X=D or E 220
221 MISC_FEATURE 222 (45)..(45) 223 X=任一氨基酸 400 3Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Lys1 5 10 15Tyr Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr35 40 45 210 4 211 989 212 PRT 213 酿酒酵母(Saccharomyces cerevisiae) 400 4Met Leu Arg Phe Gln Arg Phe Ala Ser Ser Tyr Ala Gln Ala Gln Ala1 5 10 15Val Arg Lys Tyr Pro Val Gly Gly Ile Phe His Gly Tyr Glu Val Arg20 25 30Arg Ile Leu Pro Val Pro Glu Leu Arg Leu Thr Ala Val Asp Leu Val35 40 45His Ser Gln Thr Gly Ala Glu His Leu His Ile Asp Arg Asp Asp Lys50 55 60Asn Asn Val Phe Ser Ile Ala Phe Lys Thr Asn Pro Pro Asp Ser Thr65 70 75 80
Gly Val Pro His Ile Leu Glu His Thr Thr Leu Cys Gly Ser Val Lys85 90 95Tyr Pro Val Arg Asp Pro Phe Phe Lys Met Leu Asn Lys Ser Leu Ala100 105 110Asn Phe Met Asn Ala Met Thr Gly Pro Asp Tyr Thr Phe Phe Pro Phe115 120 125Ser Thr Thr Asn Pro Gln Asp Phe Ala Asn Leu Arg Gly Val Tyr Leu130 135 140Asp Ser Thr Leu Asn Pro Leu Leu Lys Gln Glu Asp Phe Asp Gln Glu145 150 155 160Gly Trp Arg Leu Glu His Lys Asn Ile Thr Asp pro Glu Ser Asn Ile165 170 175Val Phe Lys Gly Val Val Tyr Asn Glu Met Lys Gly Gln Ile Ser Asn180 185 190Ala Asn Tyr Tyr Phe Trp Ser Lys Phe Gln Gln Ser Ile Tyr Pro Ser195 200 205Leu Asn Asn Ser Gly G1y Asp Pro Met Lys Ile Thr Asp Leu Arg Tyr210 215 220Gly Asp Leu Leu Asp Phe His His Lys Asn Tyr His Pro Ser Asn Ala225 230 235 240Lys Thr Phe Thr Tyr Gly Asn Leu Pro Leu Val Asp Thr Leu Lys Gln245 250 255Leu Asn Glu Gln Phe Ser Gly Tyr Gly Lys Arg Ala Arg Lys Asp Lys260 265 270Leu Leu Met Pro Ile Asp Leu Lys Lys Asp Ile Asp Val Lys Leu Leu275 280 285Gly Gln Ile Asp Thr Met Leu Pro Pro Glu Lys Gln Thr Lys Ala Ser290 295 300Met Thr Trp Ile Cys Gly Ala Pro Gln Asp Thr Tyr Asp Thr Phe Leu305 310 315 320
Leu Lys Val Leu Gly Asn Leu Leu Met Asp Gly His Ser Ser Val Met325 330 335Tyr Gln Lys Leu Ile Glu Ser Gly Ile Gly Leu Glu Phe Ser Val Asn340 345 350Ser Gly Val Glu Pro Thr Thr Ala Val Asn Leu Leu Thr Val Gly Ile355 360 365Gln Gly Val Ser Asp Ile Glu Ile Phe Lys Asp Thr Val Asn Asn Ile370 375 380Phe Gln Asn Leu Leu Glu Thr Glu His Pro Phe Asp Arg Lys Arg Ile385 390 395 400Asp Ala Ile Ile Glu Gln Leu Glu Leu Ser Lys Lys Asp Gln Lys Ala405 410 415Asp Phe Gly Leu Gln Leu Leu Tyr Ser Ile Leu Pro Gly Trp Thr Asn420 425 430Lys Ile Asp Pro Phe Glu Ser Leu Leu Phe Glu Asp Val Leu Gln Arg435 440 445Phe Arg Gly Asp Leu Glu Thr Lys Gly Asp Thr Leu Phe Gln Asp Leu450 455 460Ile Arg Lys Tyr Ile Val His Lys Pro Cys Phe Thr Phe Ser Ile Gln465 470 475 480Gly Ser Glu Glu Phe Ser Lys Ser Leu Asp Asp Glu Glu Gln Thr Arg485 490 495Leu Arg Glu Lys Ile Thr Ala Leu Asp Glu Gln Asp Lys Lys Asn Ile500 505 510Phe Lys Arg Gly Ile Leu Leu Gln Glu Lys Gln Asn Glu Lys Glu Asp515 520 525Leu Ser Cys Leu Pro Thr Leu Gln Ile Lys Asp Ile Pro Arg Ala Gly530 535 540Asp Lys Tyr Ser Ile Glu Gln Lys Asn Asn Thr Met Ser Arg Ile Thr545 550 555 560
Asp Thr Asn Gly Ile Thr Tyr Val Arg Gly Lys Arg Leu Leu Asn Asp565 570 575Ile Ile Pro Phe Glu Leu Phe Pro Tyr Leu Pro Leu Phe Ala Glu Ser580 585 590Leu Thr Asn Leu Gly Thr Thr Thr Glu Ser Phe Ser Glu Ile Glu Asp595 600 605Gln Ile Lys Leu His Thr Gly Gly Ile Ser Thr His Val Glu Val Thr610 615 620Ser Asp Pro Asn Thr Thr Glu Pro Arg Leu Ile Phe Gly Phe Asp Gly625 630 635 640Trp Ser Leu Asn Ser Lys Thr Asp His Ile Phe Glu Phe Trp Ser Lys645 650 655Ile Leu Leu Glu Thr Asp Phe His Lys Asn Ser Asp Lys Leu Lys Val660 665 670Leu Ile Arg Leu Leu Ala Ser Ser Asn Thr Ser Ser Val Ala Asp Ala675 680 685Gly His Ala Phe Ala Arg Gly Tyr Ser Ala Ala His Tyr Arg Ser Ser690 695 700Gly Ala Ile Asn Glu Thr Leu Asn Gly Ile Glu Gln Leu Gln Phe Ile705 710 715 720Asn Arg Leu His Ser Leu Leu Asp Asn Glu Glu Thr Phe Gln Arg Glu725 730 735Val Val Asp Lys Leu Thr Glu Leu Gln Lys Tyr Ile Val Asp Thr Asn740 745 750Asr Met Asn Phe Phe Ile Thr Ser Asp Ser Asp Val Gln Ala Lys Thr755 760 765Val Glu Ser Gln Ile Ser Lys Phe Met Glu Arg Leu Pro His Gly Ser770 775 780Cys Leu Pro Asn Gly Pro Lys Thr Ser Asp Tyr Pro Leu Ile Gly Ser785 790 795 800Lys Cys Lys His Thr Leu Ile Lys Phe Pro Phe Gln Val His Tyr Thr
805 810 815Ser Gln Ala Leu Leu Gly Val Pro Tyr Thr His Lys Asp Gly Ser Ala820 825 830Leu Gln Val Met Ser Asn Met Leu Thr Phe Lys His Leu His Arg Glu835 840 845Val Arg Glu Lys Gly Gly Ala Tyr Gly Gly Gly Ala Ser Tyr Ser Ala850 855 860Leu Ala Gly Ile Phe Ser Phe Tyr Ser Tyr Arg Asp Pro Gln Pro Leu865 870 875 880Lys Ser Leu Glu Thr Phe Lys Asn Ser Gly Arg Tyr Ile Leu Asn Asp885 890 895Ala Lys Trp Gly Val Thr Asp Leu Asp Glu Ala Lys Leu Thr Ile Phe900 905 910Gln Gln Val Asp Ala Pro Lys Ser Pro Lys Gly Glu Gly Val Thr Tyr915 920 925Phe Met Ser Gly Val Thr Asp Asp Met Lys Gln Ala Arg Arg Glu Gln930 935 940Leu Leu Asp Val Ser Leu Leu Asp Val His Arg Val Ala Glu Lys Tyr945 950 955 960Leu Leu Asn Lys Glu Gly Val Ser Thr Val Ile Gly Pro Gly Ile Glu965 970 975Gly Lys Thr Val Ser Pro Asn Trp Glu Val Lys Glu Leu980 985 210 5 211 882 212 PRT 213 粟酒裂殖酵母(Schizosaccharomyces pombe) 400 5Met Asn Tyr Ala Lys Leu Ser Ile Ala Phe Ser Lys Lys Thr Ile Lys1 5 10 15Thr His Asn Cys Arg Leu Phe Gln Arg Trp Leu His Val Gly Asp Lys20 25 30
Val His Asp Phe Arg Val Val Asp Thr Lys Lys Val Pro Glu Leu Gln35 40 45Leu Asn Tyr Thr Arg Leu Lys His Glu Pro Thr Asn Ala Asp Met Ile50 55 60His Leu Asp Arg Glu Asp Pro Asn Ser Val Phe Ser Ile Gly Phe Gln65 70 75 80Thr Pro Ala Glu Asn Asp Glu Gly Ile Pro His Ile Leu Glu His Thr85 90 95Thr Leu Cys Gly Ser Asn Lys Tyr Pro Val Arg Asp Pro Phe Phe Lys100 105 110Met Leu Asn Arg Ser Leu Ala Thr Phe Met Asn Ala Phe Thr Ala Ser115 120 125Asp Phe Thr Phe Tyr Pro Phe Ala Thr Val Asn Thr Thr Asp Tyr Lys130 135 140Asn Leu Arg Asp Val Tyr Leu Asp Ala Thr Leu Phe Pro Lys Leu Arg145 150 155 160Lys Leu Asp Phe Leu Gln Glu Gly Trp Arg Phe Glu His Ala Asp Val165 170 175Asn Asp Lys Lys Ser Pro Ile Ile Phe Asn Gly Val Val Tyr Asn Glu180 185 l90Met Lys Gly Gln Val Ser Asp Ser Ser Tyr Ile Phe Tyr Met Leu Phe195 200 205Gln Gln His Leu Phe Gln Gly Thr Ala Tyr Gly Phe Asn Ser Gly Gly2l0 215 220Asp Pro Leu Ala Ile Pro Asp Leu Lys Tyr Glu Glu Leu Val Lys Phe225 230 235 240His Arg Ser His Tyr His pro Ser Asn Ala Lys Ile Leu Ser Tyr Gly245 250 255Ser Phe Pro Leu Glu Asp Asn Leu Ser Ala Leu Ser Glu Thr Phe Arg260 265 270Pro Phe Ser Lys Arg Glu Leu Asn Leu Pro Asn Thr Phe Leu Lys Glu
275 280 285Phe Asp Gln Glu Lys Arg Val Val Glu Tyr Gly Pro Leu Asp Pro Val290 295 300Met Ala Pro Gly Arg Gln Val Lys Thr Ser Ile Ser Phe Leu Ala Asn305 310 315 320Asp Thr Ser Asn Val Tyr Glu Thr Phe Ala Leu Lys Val Leu Ser Lys325 330 335Leu Cys Phe Asp Gly Phe Ser Ser Pro Phe Tyr Lys Ala Leu Ile Glu340 345 350Ser Gly Leu Gly Thr Asp Phe Ala Pro Asn Ser Gly Tyr Asp Ser Thr355 360 365Thr Lys Arg Gly Ile Phe Ser Val Gly Leu Glu Gly Ala Ser Glu Glu370 375 380Ser Leu Ala Lys Ile Glu Asn Leu Val Tyr Ser Ile Phe Asn Asp Leu385 390 395 400Ala Leu Lys Gly Phe Glu Asn Glu Lys Leu Glu Ala Ile Leu His Gln405 410 415Met Glu Ile Ser Leu Lys His Lys Ser Ala His Phe Gly Ile Gly Leu420 425 430Ala Gln Ser Leu Pro Phe Asn Trp Phe Asn Gly Ala Asp Pro Ala Asp435 440 445Trp Leu Ser Phe Asn Lys Gln Ile Glu Trp Leu Lys Gln Lys Asn Ser450 455 460Asp Gly Lys Leu Phe Gln Lys Leu Ile Lys Lys Tyr Ile Leu Glu Asn465 470 475 480Lys Ser Arg Phe Val Phe Thr Met Leu Pro Ser Ser Thr Phe Pro Gln485 490 495Arg Leu Gln Glu Ala Glu Ala Lys Lys Leu Gln Glu Arg Thr Ser Lys500 505 510Leu Thr Asp Glu Asp Ile Ala Glu Ile Glu Lys Thr Ser Val Lys Leu515 520 525
Leu Glu Ala Gln Ser Thr Pro Ala Asp Thr Ser Cys Leu Pro Thr Leu530 535 540Ser Val Ser Asp Ile Pro Glu Thr Ile Asp Glu Thr Lys Leu Lys Phe545 550 555 560Leu Asp Ile Ala Gly Met Lys Ala Gln Trp Tyr Asp Leu Ala Ala Gly565 570 575Leu Thr Tyr Ile Arg Leu Leu Leu Pro Leu Lys Asn Phe Pro Glu Ser580 585 590Leu Ile Pro Tyr Leu Pro Val Tyr Cys Asp Ala Cys Leu Asn Leu Gly595 600 605Thr His Ser Glu Ser Ile Gly Asp Leu Glu His Gln Ile Arg Arg Tyr610 615 620Thr Gly Gly Ile Ser Ile Ser Pro Ser Ala Val Thr Asn Asn Ser Asp625 630 635 640Val Ser Lys Tyr Glu Leu Gly Ile Ala Ile Ser Gly Tyr Ala Leu Asp645 650 655Lys Asn Val Gly Lys Leu Val Glu Leu Ile Asn Lys Ala Phe Trp Asn660 665 670Thr Asn Leu Ser Asn Thr Asp Lys Leu Ala Ile Met Leu Lys Thr Ser675 680 685Val Ser Gly Ile Thr Asp Gly Ile Ala Glu Lys Gly His Ser Phe Ala690 695 700Lys Val Ser Ser Ala Ser Gly Leu Thr Glu Lys Thr Ser Ile Thr Glu705 710 715 720Gln Leu Gly Gly Leu Thr Gln Val Lys Leu Leu Ser Gln Leu Ser Arg725 730 735Glu Glu Ser Phe Gly Pro Leu Val Glu Lys Leu Thr Ala Ile Arg Glu740 745 750Ile Leu Arg Gly Thr Ser Gly Phe Lys Ala Ala Ile Asn Ala Ser Pro755 760 765
Thr Gln His Glu Val Val Glu Lys Ala Leu Gln Lys Phe Met Lys Ser770 775 780Arg Gly Val Asn Gln Gln Thr Gln Thr Lys Ser Thr Ser Lys Glu Arg785 790 795 800Asn Gly Ile Asn Ser Ile Lys Thr Tyr His Glu Leu Pro Phe Gln Thr805 810 815Tyr Phe Ala Ala Lys Ser Cys Leu Gly Val Pro Tyr Thr His Pro Asp820 825 830Gly Ala Pro Leu Gln Ile Leu Ser Ser Leu Leu Thr His Lys Tyr Leu835 840 845His Gly Glu Ile Arg Glu Lys Gly Gly Ala Tyr Gly Ala Gly Leu Ser850 855 860Tyr Ser Gly Ile Asp Gly Val Leu Ser Phe Phe Thr Tyr Arg Asp Ser865 870 875 880Asp Pro 210 6 211 973 212 PRT 213 产气荚膜梭菌(Clostridium perfringens) 400 6Met Asn Phe Lys Glu Asn Asn Ile Tyr Ser Gly Phe Lys Leu Leu Asn1 5 10 15Ile Glu Asn Leu Asn Glu Ile Gly Gly Val Gly Leu Arg Phe Glu His20 25 30Glu Lys Thr Lys Ala Lys Leu Ile Lys Ile Leu Ser Glu Asp Asp Asn35 40 45Lys Cys Phe Ala Ile Gly Phe Arg Thr Pro Pro Glu Asn Ser Thr Gly50 55 60Val Pro His Ile Leu Glu His Ser Val Leu Cys Gly Ser Arg Lys Phe65 70 75 80
Asn Thr Lys Glu Pro Phe Val Glu Leu Leu Lys Gly Ser Leu Asn Thr85 90 95Phe Leu Asn Ala Met Thr Tyr Pro Asp Lys Thr Ile Tyr Pro Val Ala100 105 110Ser Arg Asn Glu Lys Asp Phe Met Asn Leu Met Asp Val Tyr Leu Asp115 120 125Ala Val Leu Tyr Pro Asn Ile Tyr Lys His Lys Glu Ile Phe Met Gln130 135 140Glu Gly Trp His Tyr Tyr Ile Glu Asn Lys Glu Asp Glu Leu Lys Tyr145 150 155 160Asn Gly Val Val Tyr Asn Glu Met Lys Gly Ala Tyr Ser Ser Pro Asp165 170 175Ser Ile Leu Tyr Arg Lys Ile Pro Gln Thr Ile Tyr Pro Asp Thr Cys180 185 190Tyr Ala Leu Ser Ser Gly Gly Asp Pro Asp Glu Ile Pro Asn Leu Thr195 200 205Tyr Glu Glu Phe Val Glu Phe His Lys Lys Tyr Tyr His Pro Ser Asn210 215 220Ser Tyr Ile Phe Leu Tyr Gly Asn Gly Asp Thr Glu Lys Glu Leu Glu225 230 235 240Phe Ile Asn Glu Glu Tyr Leu Lys Asn Phe Glu Tyr Lys Glu Ile Asp245 250 255Ser Glu Ile Lys Glu Gln Lys Ser Phe Glu Ser Met Lys Glu Glu Ser260 265 270Phe Thr Tyr Gly Ile Ala Glu Ser Glu Asp Leu Asn His Lys Ser Tyr275 280 285Tyr Ser Leu Asn Phe Val Ile Gly Asp Ala Thr Asp Gly Glu Lys Gly290 295 300Leu Ala Phe Asp Val Leu Ala Tyr Leu Leu Thr Arg Ser Thr Ala Ala305 310 315 320Pro Leu Lys Lys Ala Leu Ile Asp Ala Gly Ile Gly Lys Ala Val Ser
325 330 335Gly Asp Phe Asp Asn Ser Thr Lys Gln Ser Ala Phe Thr Val Leu Val340 345 350Lys Asn Ala Glu Leu Asn Lys Glu Glu Glu Phe Lys Lys Val Val Met355 360 365Asp Thr Leu Lys Asp Leu Val Glu Asn Gly Ile Asp Lys Glu Leu Ile370 375 380Glu Ala Ser Ile Asn Arg Val Glu Phe Glu Leu Arg Glu Gly Asp Tyr385 390 395 400Gly Ser Tyr Pro Asn Gly Leu Ile Tyr Tyr Leu Lys Val Met Asp Ser405 410 415Trp Leu Tyr Asp Gly Asp Pro Tyr Val His Leu Glu Tyr Glu Lys Asn420 425 430Leu Glu Lys Ile Lys Ser Ala Leu Thr Ser Asn Tyr Phe Glu Asp Leu435 440 445Ile Glu Arg Tyr Met Ile Asn Asn Thr His Ser Ser Leu Val Ser Leu450 455 460His Pro Glu Lys Gly Ile Asn Glu Lys Lys Ser Ala Glu Leu Lys Lys465 470 475 480Lys Leu Glu Glu Ile Lys Asn Ser Phe Asp Glu Lys Thr Leu Asn Glu485 490 495Ile Ile Asp Asn Cys Lys Lys Leu Lys Glu Arg Gln Ser Thr Pro Asp500 505 510Lys Lys Glu Asp Leu Glu Ser Ile Pro Met Leu Ser Leu Glu Asp Ile515 520 525Asp Lys Glu Ala Thr Lys Ile Pro Thr Glu Glu Lys Glu Ile Asp Gly530 535 540Ile Thr Thr Leu His His Asp Phe His Thr Asn Lys Ile Asp Tyr Val545 550 555 560Asn Phe Phe Phe Asn Thr Asn Ser Val Pro Glu Asp Leu Ile Pro Tyr565 570 575
Val Gly Leu Leu Cys Asp Ile Leu Gly Lys Cys Gly Thr Glu Asn Tyr580 585 590Asp Tyr Ser Lys Leu Ser Asn Ala Ile Asn Ile Ser Thr Gly Gly Ile595 600 605Ser Phe Gly Ala Ile Thr Phe Ala Asn Leu Lys Lys Asn Asn Glu Phe610 615 620Arg Pro Tyr Leu Glu Ile Ser Tyr Lys Ala Leu Ser Ser Lys Thr Asn625 630 635 640Lys Ala Ile Glu Leu Val Asp Glu Ile Val Asn His Thr Asp Leu Asp645 650 655Asp Met Asp Arg Ile Met Gln Ile Ile Arg Glu Lys Arg Ala Arg Leu660 665 670Glu Gly Ala Ile Phe Asp Ser Gly His Arg Ile Ala Met Lys Lys Val675 680 685Leu Ser Tyr Ser Thr Asn Arg Gly Ala Tyr Asp Glu Lys Ile Ser Gly690 695 700Leu Asp Tyr Tyr Asp Phe Leu Val Asn Ile Glu Lys Glu Asp Lys Lys705 710 715 720Ser Thr Ile Ser Asp Ser Leu Lys Lys Val Arg Asp Leu Ile Phe Asn725 730 735Lys Gly Asn Met Leu Ile Ser Tyr Ser Gly Lys Glu Glu Glu Tyr Glu740 745 750Asn Phe Lys Glu Lys Val Lys Tyr Leu Ile Ser Lys Thr Asn Asn Asn755 760 765Asp Phe Glu Lys Glu Glu Tyr Asn Phe Glu Leu Gly Lys Lys Asn Glu770 775 780Gly Leu Leu Thr Gln Gly Asn Val Gln Tyr Val Ala Lys Gly Gly Asn785 790 795 800Tyr Lys Thr His Gly Tyr Lys Tyr Ser Gly Ala Leu Ser Leu Leu Glu805 810 815
Ser Ile Leu Gly Phe Asp Tyr Leu Trp Asn Ala Val Arg Val Lys Gly820 825 830Gly Ala Tyr Gly Val Phe Ser Asn Phe Arg Arg Asp Gly Gly Ala Tyr835 840 845Ile Val Ser Tyr Arg Asp Pro Asn Ile Lys Ser Thr Leu Glu Ala Tyr850 855 860Asp Asn Ile Pro Lys Tyr Leu Asn Asp Phe Glu Ala Asp Glu Arg Glu865 870 875 880Met Thr Lys Tyr Ile Ile Gly Thr Ile Arg Lys Tyr Asp Gln Pro Ile885 890 895Ser Asn Gly Ile Lys Gly Asp Ile Ala Val Ser Tyr Tyr Leu Ser Asn900 905 910Phe Thr Tyr Glu Asp Leu Gln Lys Glu Arg Glu Glu Ile Ile Asn Ala915 920 925Asp Val Glu Lys Ile Lys Ser Phe Ala Pro Met Ile Lys Asp Leu Met930 935 940Lys Glu Asp Tyr Ile Cys Val Leu Gly Asn Glu Glu Lys Ile Lys Glu945 950 955 960Asn Lys Asp Leu Phe Asn Asn Ile Lys Ser Val Ile Lys965 970 210 7 211 971 212 PRT 213 布氏疏螺旋体(Borrelia burgdorferi) 400 7Met Lys Lys Lys Lys Ile Phe Lys Leu Ile Ser Lys Thr Tyr Leu Glu1 5 10 15Glu His Asp Ala Glu Gly Tyr Tyr Phe Lys His Glu Ser Gly Leu Glu20 25 30Val Phe His Leu Lys Ser Asp Ser Phe Lys Glu Asn Ala Phe Cys Ile35 40 45
Ala Phe Lys Thr Ile Pro Ser Asn Asn Thr Gly Val Ala His Val Leu50 55 60Glu His Thr Ile Phe Cys Gly Ser Ser Lys Tyr Lys Ile Lys Asp Pro65 70 75 80Phe Leu Tyr Leu Leu Lys Gly Ser Leu Asn Thr Phe Leu Asn Ala Met85 90 95Thr Phe Pro Asp Lys Thr Ile Tyr Pro Ala Ala Ser Thr Ile Glu Lys100 105 110Asp Tyr Phe Asn Leu Phe Asn Ile Tyr Ala Asp Ser Ile Phe Asn Pro115 120 125Leu Leu Lys Lys Glu Ser Phe Met Gln Glu Gly Tyr Asn Ile Asn Pro130 135 140Lys Asp Phe Lys Val Ser Gly Ile Val Phe Asn Glu Met Lys Gly Ser145 150 155 160Tyr Ser Asn Lys Asn Ser Leu Ile Asn Glu Ile Val Ser Ser Ser Leu165 170 175Phe Glu Glu Gly Ala Tyr Lys Tyr Asp Ser Gly Gly Ile Pro Thr Asn180 185 190Ile Ile Asp Leu Thr Tyr Glu Ser Phe Leu Asp Phe Tyr Lys Lys Tyr195 200 205Tyr Thr Leu Glu Asn Cys Lys Ile Phe Leu Cys Gly Asn Thr Gln Thr210 215 220Glu Lys Asn Leu Asn Phe Ile Glu Lys Tyr Ile Ile Arg Pro Tyr Lys225 230 235 240Lys Glu Lys Ser Asn Val Asn Ile Asn Ile Glu Asn Val Lys Arg Trp245 250 255Glu Lys Gly Lys Lys Leu Thr Tyr Lys Ile Pro Lys Glu Asn Asp Asn260 265 270Ser Leu Gly Val Tyr Thr Ile Asn Trp Leu Cys Thr Glu Ile Asn Asn275 280 285Ile Glu Asp Ser Ile Gly Leu Glu Ile Leu Ser Glu Ile Leu Leu Asp
290 295 300Asp Ser Cys Ser Phe Thr Ile Asn Ile Leu Lys Ser Gly Ile Gly Glu305 310 315 320Asp Ile Ala His Ile Ser Gly Ile Asn Thr Asp Leu Lys Glu Ser Ile325 330 335Phe Ser Phe Gly Leu Gln Asn Val Val Glu Asn Lys Glu Lys Glu Phe340 345 350Lys Asn Leu Val Phe Ser Glu Leu Lys Asn Leu Val Lys Asn Lys Ile355 360 365Pro Lys Glu Leu Ile Lys Gly Ile Leu Phe Gly Tyr Glu Phe Ala Leu370 375 380Lys Glu Glu Lys Gly Gln Asn Phe Pro Ile Ala Leu Met Ile Lys Ser385 390 395 400Phe Lys Gly Trp Leu Asn Gly Leu His Pro Ile Lys Thr Leu Gln Thr405 410 415Ser Tyr Tyr Ile Asn Glu Ile Thr Asn Lys Leu Glu Lys Gly Ile Tyr420 425 430Tyr Phe Glu Asn Leu Ile Glu Lys Tyr Leu Ile Phe Asn Asn His Tyr435 440 445Thr Leu Ile Ser Phe Ile Pro Ser His Asp Thr Glu Lys Glu Met Glu450 455 460Glu Glu Ile Glu Lys Lys Leu Met Ala Arg Glu Ile Glu Ile Lys Gln465 470 475 480Asn Pro Glu Glu Phe Leu Gln Phe Lys Lys Asp Tyr Asn Gln Phe Lys485 490 495Lys Tyr Gln Asn Lys Lys Asp Ser Lys Ala Asp Ile Ala Lys Leu Pro500 505 510Leu Leu Lys Ile Glu Asp Leu Pro Lys Gln Ile Glu Lys Ser Leu Asp515 520 525Leu Asn Glu Ile Lys Glu Leu Asn Leu His Ser Phe Lys Phe Lys Ser530 535 540
Asn Asn Ile Phe Asn Val Asn Leu Phe Phe Lys Leu Asp Phe Leu Glu545 550 555 560Lys Glu Asp Tyr Ile Tyr Leu Ser Leu Phe Lys Arg Ala Leu Gln Asp565 570 575Leu Ser Thr Lys Asn Tyr Ser Tyr Ile Asn Ile Asn Asn Lys Ile Gln580 585 590Asn Thr Leu Gly Gln Ile Asn Ile Ser Glu Ser Tyr Asp Glu Asp Ile595 600 605Asp Gly Asn Ile Leu Asn Ser Phe Asn Ile Ser Phe Lys Ser Phe Asn610 615 620Asn Lys Val Lys Glu Ser Phe Glu Leu Ile Lys Glu Ile Leu Ile Asn625 630 635 640Ile Asn Phe His Asp Tyr Glu Arg Leu Lys Glu Ile Thr Leu Ser Leu645 650 655Lys Asn Asp Phe Lys Ser Leu Leu Ile Pro Lys Gly His Leu Leu Ala660 665 670Met Leu Arg Ser Lys Ser Lys Leu Lys Leu Asn Glu Tyr Leu Lys Glu675 680 685Leu Gln Asn Gly Ile Thr Gly Arg Glu phe Trp Gln Lys Ala Lys Thr690 695 700Asp Thr Glu Ser Leu Lys Glu Ile Ala Asn Lys Leu Asp Asn Leu Lys705 710 715 720Asn Lys Ile Ile Leu Lys Asn Asn Leu Ser Ala Leu Ile Met Gly Asn725 730 735Thr Asp Asp Ile Leu Lys Asn Leu Glu Asn Glu Phe Phe Asn Leu Lys740 745 750Glu Ser Leu Glu Glu Ser Asn His Tyr Asn Gly Leu Leu Asn Leu Asp755 760 765Ala Asn Ser Lys Ala Leu Arg Glu Ile Ile Ile Ile Gln Ser Lys Val770 775 780
Ala Phe Asn Ala Ile Cys Phe Pro Ser Tyr Lys Ile Asn Asp Glu Asn785 790 795 800Tyr Pro Lys Ala Asn Phe Leu Glu His Val Leu Arg Ser Gly Ile Phe805 810 815Trp Glu Lys Ile Arg Val Met Gly Gly Ala Tyr Gly Ala Ser Ala Ser820 825 830Ile Ala Asn Gly Ile Phe Ser Phe Ala Ser Tyr Arg Asp Pro Asn Phe835 840 845Thr Lys Thr Tyr Gln Ala Phe Glu Lys Ser Leu Glu Glu Leu Ala Asn850 855 860Asn Lys Met Thr Asp Asp Glu Ile Tyr Thr Tyr Leu Ile Gly Leu Ile865 870 875 880Gly Thr Asn Ile Tyr Val Lys Thr Lys Ala Thr Glu Ala Leu Gln Ser885890 895Tyr Arg Arg Lys Met Leu Asn Ile Ser Asp Ser Leu Arg Gln Asp Ile900 905 910Arg Asn Ala Tyr Phe Thr Ile Thr Pro Gln Asp Ile Lys Glu Ile Ser915 920 925Thr Lys Ile Leu Thr Gln Ile Arg Gln His Asn Ser Ile Ala Ser Leu930 935 940Val Asn Asn Gln Ile Tyr Glu Glu Glu Lys Asn Asn Leu Glu Lys Leu945 950 955 960Ile Gly Lys Glu Tyr Ser Leu Lys Lys Ile Tyr965 970 210 8 211 995 212 PRT 213 秀丽隐杆线虫(caenorhabditis elegans) 400 8Met Ser Ala Ser Lys Leu Trp Ser Cys Thr Glu Thr Val Leu Asn Gly1 5 10 15Gly Ile Lys Leu Phe Leu Tyr Ser Ser Lys Asn Thr Lys Leu Arg Val
20 25 30Ala Ile Gly Glu Val Pro Gly Pro Met Val His Gly Ala Val Ser Phe35 40 45Val Thr Glu Ala Asp Ser Asp Asp Gly Leu Pro His Thr Leu Glu His50 55 60Leu Val Phe Met Gly Ser Lys Lys Tyr Pro Phe Lys Gly Val Leu Asp65 70 75 80Val Ile Ala Asn Arg Cys Leu Ala Asp Gly Thr Asn Ala Trp Thr Asp85 90 95Thr Asp His Thr Ala Tyr Thr Leu Ser Thr Val Gly Ser Asp Gly Phe100 105 110Leu Lys Val LeuPro Val Tyr Ile Asn His Leu Leu Thr Pro Met Leu115120 125Thr Ala Ser Gln Phe Ala Thr Glu Val His His Ile Thr Gly Glu Gly130 135 140Asn Asp Ala Gly Val Val Tyr Ser Glu Met Gln Asp His Glu Ser Glu145 150 155 160Met Glu Ser Ile Met Asp Arg Lys Thr Lys Glu Val Ile Tyr Pro Pro165 170 175Phe Asn Pro Tyr Ala Val Asp Thr Gly Gly Arg Leu Lys Asn Leu Arg180 185 190Glu Ser Cys Thr Leu Glu Lys Val Arg Asp Tyr His Lys Lys Phe Tyr195 200 205His Leu Ser Asn Met Val Val Thr Val Cys Gly Met Val Asp His Asp210 215 220Gln Val Leu Glu Ile Met Asn Asn Val Glu Asn Glu His Met Ser Thr225 230 235 240Val Pro Asp His Phe Pro Lys pro Phe Ser Phe Ala Leu Ser Asp Ile245 250 255Lys Glu Ser Thr Val His Arg Val Glu Cys Pro Thr Asp Asp Ala Ser
260 265 270Arg Gly Ala Val Glu Val Ala Trp Phe Ala His Ser Pro Ser Asp Leu275 280 285Glu Thr His Ser Ser Leu His Val Leu Phe Asp Tyr Leu Ser Asn Thr290 295 300Ser Val Ala Pro Leu Gln Lys Asp Phe Ile Leu Leu Glu Asp Pro Leu305 310 315 320Ala Ser Ser Val Ser Phe His Ile Ala Glu Gly Val Arg Cys Asp Leu325 330 335Arg Leu Asn Phe Ala Gly Val Pro Val Glu Lys Leu Asp Glu Cys Ala340 345 350Pro Lys Phe Phe Asp Lys Thr Val Arg Glu His Leu Glu Glu Ala Asn355 360 365Phe Asp Met Glu Arg Met Gly Tyr Leu Ile Asp Gln Thr Ile Leu Asn370 375 380Glu Leu Val Lys Leu Glu Thr Asn Ala Pro Lys Asp Ile Met Ser His385 390 395 400Ile Ile Gly His Gln Leu Phe Asp Asn Glu Asp Glu Glu Leu Phe Lys405 410 415Lys Arg Thr Asn Glu Ile Asp Phe Leu Lys Lys Leu Lys Ser Glu Pro420 425 430Ala Ser Tyr Trp Val Gln Leu Val Asn Lys Tyr Phe Thr Ala Pro Ser435 440 445Ala Thr Val Ile Gly Val Pro Asn Glu Glu Leu Val Asp Lys Ile Ala450 455 460Glu Glu Glu Glu Lys Arg Ile Ala Ala Gln Cys Glu Lys Leu Gly Lys465 470 475 480Lys Gly Leu Glu Glu Ala Gly Lys Ser Leu Glu Ala Ala Ile Leu Glu485 490 495Asn Thr Ala Asn His Pro Ser Ala Glu Leu Leu Asp Gln Leu Ile Val500 505 510
Lys Asp Leu Glu Ala Phe Asp Arg Phe Pro Val Gln Ser Leu Thr Ser515 520 525Asn Ser Pro Ser Leu Thr Pro Gln Gln Ser Thr Phe Leu Ala Gln Phe530 535 540Pro Phe His Ala Asn Leu His Asn Cys Pro Thr Lys Phe Val Glu Ile545 550 555 560Phe Phe Leu Leu Asp Ser Ser Asn Leu Ser Ile Glu Asp Arg Ser Tyr565 570 575Leu Phe Leu Tyr Thr Asp Leu Leu Phe Glu Ser Pro Ala Met Ile Asp580 585 590Gly Val Leu Thr Ser Ala Asp Asp Val Ala Lys His Phe Thr Lys Asp595 600 605Leu Ile Asp His Ser Ile Gln Val Gly Val Ser Gly Leu Tyr Asp Arg610 615 620Phe Val Asn Leu Arg Ile Lys Val Gly Ala Asp Lys Tyr Pro Leu Leu625 630 635 640Ala Lys Trp Ala Gln Ile Phe Thr Gln Gly Val Val Phe Asp Pro Ser645 650 655Arg Ile His Gln Cys Ala Gln Lys Leu Ala Gly Glu Ala Arg Asp Arg660 665 670Lys Arg Asp Gly Cys Thr Val Ala Ser Thr Ala Val Ala Ser Met Val675 680 685Tyr Gly Lys Asn Thr Asn Cys Ile Leu Phe Asp Glu Leu Val Leu Glu690 695 700Lys Leu His Glu Lys Ile Ser Lys Asp Val Met Lys Asn Pro Glu Ala705 710 715 720Val Leu Glu Lys Leu Glu Gln Val Arg Ser Ala Leu Phe Ser Asn Gly725 730 735Val Asn Ala His Phe Val Ala Asp Val Asp Ser Ile Asp Pro Lys Met740 745 750
Leu Ser Ser Asp Leu Trp Thr Trp Val Gln Ala Asp Pro Arg Phe Gly755 760 765Pro Gly His Gln Phe Ser Ala Glu Ala Gly Glu Asn Val Ser Leu Glu770 775 780Leu Gly Lys Glu Leu Leu Ile Gly Val Gly Gly Ser Glu Ser Ser Phe785 790 795 800Ile Tyr Gln Thr Ser Phe Leu Asp Ala Asn Trp Asn Ser Glu Glu Leu805 810 815Ile Pro Ala Met Ile Phe Gly Gln Tyr Leu Ser Gln Cys Glu Gly Pro820 825 830Leu Trp Arg Ala Ile Arg Gly Asp Gly Leu Ala Tyr Gly Ala Asn Val835 840 845Phe Val Lys Pro Asp Arg Lys Gln Ile Thr Leu Ser Leu Tyr Arg Cys850 855 860Ala Gln Pro Ala Val Ala Tyr Glu Arg Thr Arg Asp Ile Ile Arg Lys865 870 875 880Ile Val Glu Ser Gly Glu Ile Ser Lys Ala Glu Phe Glu Gly Ala Lys885 890 895Arg Ser Thr Val Phe Glu Met Met Lys Arg Glu Gly Thr Val Ser Gly900 905 910Ala Ala Lys Ile Ser Ile Leu Asn Asn Phe Arg Gln Thr Pro His Pro915 920 925Phe Asn Ile Asp Leu Cys Arg Arg Ile Trp Asn Leu Thr Ser Glu Glu930 935 940Met Val Lys Ile Gly Gly Pro Pro Leu Ala Arg Leu Phe Asp Glu Lys945 950 955 960Cys Phe Val Arg Ser Ile Ala Val His Pro Ser Lys Leu Asn Glu Met965 970 975Lys Lys Ala Phe Pro Gly Ser Ser Lys Ile Lys Ile Ser Asp Leu Gln980 985 990
Phe Ala Cys995 210 9 211 962 212 PRT 213 大肠杆菌(Escherichia coli) 400 9Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu1 5 10 15Trp Ala Pro Leu Ser Gln Ala Glu Thr Gly Trp Gln Pro Ile Gln Glu20 25 30Thr Ile Arg Lys Ser Asp Lys Asp Asn Arg Gln Tyr Gln Ala Ile Arg35 40 45Leu Asp Asn Gly Met Val Val Leu Leu Val Ser Asp Pro Gln Ala Val50 55 60Lys Ser Leu Ser Ala Leu Val Val Pro Val Gly Ser Leu Glu Asp Pro65 70 75 80Glu Ala Tyr Gln Gly Leu Ala His Tyr Leu Glu His Met Ser Leu Met85 90 95Gly Ser Lys Lys Tyr Pro Gln Ala Asp Ser Leu Ala Glu Tyr Leu Lys100 105 110Met His Gly Gly Ser His Asn Ala Ser Thr Ala Pro Tyr Arg Thr Ala115 120 125Phe Tyr Leu Glu Val Glu Asn Asp Ala Leu Pro Gly Ala Val Asp Arg130 135 140Leu Ala Asp Ala Ile Ala Glu Pro Leu Leu Asp Lys Lys Tyr Ala Glu145 150 155 160Arg Glu Arg Asn Ala Val Asn Ala Glu Leu Thr Met Ala Arg Thr Arg165 170 175Asp Gly Met Arg Met Ala Gln Val Ser Ala Glu Thr Ile Asn Pro Ala180 185 190His Pro Gly Ser Lys Phe Ser Gly Gly Asn Leu Glu Thr Leu Ser Asp
l95 200 205Lys Pro Gly Asn Pro Val Gln Gln Ala Leu Lys Asp Phe His Glu Lys210 215 220Tyr Tyr Ser Ala Asn Leu Met Lys Ala Val Ile Tyr Ser Asn Lys Pro225 230 235 240Leu Pro Glu Leu Ala Lys Met Ala Ala Asp Thr Phe Gly Arg Val Pro245 250 255Asn Lys Glu Ser Lys Lys Pro Glu Ile Thr Val Pro Val Val Thr Asp260 265 270Ala Gln Lys Gly Ile Ile Ile His Tyr Val Pro Ala Leu Pro Arg Lys275 280 285VaL Leu Arg Val Glu Phe Arg Ile Asp Asn Asn Ser Ala Lys Phe Arg290 295 300Ser Lys Thr Asp Glu Leu Ile Thr Tyr Leu Ile Gly Asn Arg Ser Pro305 310 315 320G1y Thr Leu Ser Asp Trp Leu Gln Lys Gln Gly Leu VaL Glu Gly Ile325 330 335Ser Ala Asn Ser Asp Pro Ile Val Asn Gly Asn Ser Gly Val Leu Ala340 345 350Ile Ser Ala Ser Leu Thr Asp Lys GLy Leu Ala Asn Arg Asp GLn Val355 360 365Val Ala Ala Ile Phe Ser Tyr Leu Asn Leu Leu Arg Glu Lys Gly Ile370 375 380Asp Lys Gln Tyr Phe Asp Glu Leu Ala Asn Val Leu Asp Ile Asp Phe385 390 395 400Arg Tyr Pro Ser Ile Thr Arg Asp Met Asp Tyr Val Glu Trp Leu Ala405 410 415Asp Thr Met Ile Arg Val Pro Val Glu His Thr Leu Asp Ala Val Asn420 425 430Ile Ala Asp Arg Tyr Asp Ala Lys Ala Val Lys Glu Arg Leu Ala Met435 440 445
Met Thr Pro Gln Asn Ala Arg Ile Trp Tyr Ile Ser Pro Lys Glu Pro450 455 460His Asn Lys Thr Ala Tyr Phe Val Asp Ala Pro Tyr Gln Val Asp Lys465 470 475 480Ile Ser Ala Gln Thr Phe Ala Asp Trp Gln Lys Lys Ala Ala Asp Ile485 490 495Ala Leu Ser Leu Pro Glu Leu Asn Pro Tyr Ile Pro Asp Asp Phe Ser500 505 510Leu Ile Lys Ser Glu Lys Lys Tyr Asp His Pro Glu Leu Ile Val Asp515 520 525Glu Ser Asn Leu Arg Val Val Tyr Ala Pro Ser Arg Tyr Phe Ala Ser530 535 540Glu Pro Lys Ala Asp Val Ser Leu Ile Leu Arg Asn Pro Lys Ala Met545 550 555 560Asp Ser Ala Arg Asn Gln Val Met Phe Ala Leu Asn Asp Tyr Leu Ala565 570 575Gly Leu Ala Leu Asp Gln Leu Ser Asn Gln Ala Ser Val Gly Gly Ile580 585 590Ser Phe Ser Thr Asn Ala Asn Asn Gly Leu Met Val Asn Ala Asn Gly595 600 605Tyr Thr Gln Arg Leu Pro Gln Leu Phe Gln Ala Leu Leu Glu Gly Tyr610 615 620Phe Ser Tyr Thr Ala Thr Glu Asp Gln Leu Glu Gln Ala Lys Ser Trp625 630 635 640Tyr Asn Gln Met Met Asp Ser Ala Glu Lys Gly Lys Ala Phe Glu Gln645 650 655Ala Ile Met Pro Ala Gln Met Leu Ser Gln Val Pro Tyr Phe Ser Arg660 665 670Asp Glu Arg Arg Lys Ile Leu Pro Ser Ile Thr Leu Lys Glu Val Leu675 680 685
Ala Tyr Arg Asp Ala Leu Lys Ser Gly Ala Arg Pro Glu Phe Met Val690 695 700Ile Gly Asn Met Thr Glu Ala Gln Ala Thr Thr Leu Ala Arg Asp Val705 710 715 720Gln Lys Gln Leu Gly Ala Asp Gly Ser Glu Trp Cys Arg Asn Lys Asp725 730 735Val Val Val Asp Lys Lys Gln Ser Val Ile Phe Glu Lys Ala Gly Asn740 745 750Ser Thr Asp Ser Ala Leu Ala Ala Val Phe Val Pro Thr Gly Tyr Asp755 760 765Glu Tyr Thr Ser Ser Ala Tyr Ser Ser Leu Leu Gly Gln Ile Val Gln770 775 780Pro Trp Phe Tyr Asn Gln Leu Arg Thr Glu Glu Gln Leu Gly Tyr Ala785 790 795 800Val Phe Ala Phe Pro Met Ser Val Gly Arg Gln Trp Gly Met Gly Phe805 810 815Leu Leu Gln Ser Asn Asp Lys Gln Pro Ser Phe Leu Trp Glu Arg Tyr820 825 830Lys Ala Phe Phe Pro Thr Ala Glu Ala Lys Leu Arg Ala Met Lys Pro835 840 845Asp Glu Phe Ala Gln Ile Gln Gln Ala Val Ile Thr Gln Met Leu Gln850 855 860Ala Pro Gln Thr Leu Gly Glu Glu Ala Ser Lys Leu Ser Lys Asp Phe865 870 875 880Asp Arg Gly Asn Met Arg Phe Asp Ser Arg Asp Lys Ile Val Ala Gln885 890 895Ile Lys Leu Leu Thr Pro Gln Lys Leu Ala Asp Phe Phe His Gln Ala900 905 910Val Val Glu Pro Gln Gly Met Ala Ile Leu Ser Gln Ile Ser Gly Ser915 920 925
Gln Asn Gly Lys Ala Glu Tyr Val His Pro Glu Gly Trp Lys Val Trp930 935 940Glu Asn Val Ser Ala Leu Gln Gln Thr Met Pro Leu Met Ser Glu Lys945 950 955 960Asn Glu 210 10 211 1161 212 PRT 213 人(Homo sapiens) 400 10Met Leu Arg Arg Val Ala Val Ala Ala Val Phe Ala Thr Gly Arg Lys1 5 10 15Leu Arg Cys Glu Ala Gly Arg Asp Val Thr Ala Val Gly Arg Ile Glu20 25 30Ala Arg Gly Leu Cys Glu Glu Ser Ala Lys Pro Phe Pro Thr Leu Thr35 40 45Met Pro Gly Arg Asn Lys Ala Lys Ser Thr Cys Ser Cys Pro Asp Leu50 55 60Gln Pro Asn Gly Gln Asp Leu Gly Glu Ser Gly Arg Val Ala Arg Leu65 70 75 80Gly Ala Asp Glu Ser Glu Glu Glu Gly Arg Ser Leu Ser Asn Val Gly85 90 95Asp Pro Glu Ile Ile Lys Ser Pro Ser Asp Pro Lys Gln Tyr Arg Tyr100 105 110Ile Lys Leu Gln Asn Gly Leu Gln Ala Leu Leu Ile Ser Asp Leu Ser115 120 125Asn Val Glu Gly Lys Thr Gly Asn Ala Thr Asp Glu Glu Glu Glu Glu130 135 140Glu Glu Glu Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu Glu Asp145 150 155 160Asp Asp Asp Asp Asp Asp Glu Asp Ser Gly Ala Glu Ile Gln Asp Asp165 170 175
Asp Glu Glu Gly Phe Asp Asp Glu Glu Glu Phe Asp Asp Asp Glu His180 185 190Asp Asp Asp Asp Leu Asp Asn Glu Glu Asn Glu Leu Glu Glu Leu Glu195 200 205Glu Arg Val Glu Ala Arg Lys Lys Thr Thr Glu Lys Gln Ser Ala Ala210 215 220Ala Leu Cys Val Gly Val Gly Ser Phe Ala Asp Pro Asp Asp Leu Pro225 230 235 240Gly Leu Ala His Phe Leu Glu His Met Val Phe Met Gly Ser Leu Lys245 250 255Tyr Pro Asp Glu Asn Gly Phe Asp Ala Phe Leu Lys Lys His Gly Gly260265 270Ser Asp Asn Ala Ser Thr Asp Cys Glu Arg Thr Val Phe Gln Phe Asp275 280 285Val Gln Arg Lys Tyr Phe Lys Glu Ala Leu Asp Arg Trp Ala Gln Phe290 295 300Phe Ile His Pro Leu Met Ile Arg Asp Ala Ile Asp Arg Glu Val Glu305 310 315 320Ala Val Asp Ser Glu Tyr Gln Leu Ala Arg Pro Ser Asp Ala Asn Arg325 330 335Lys Glu Met Leu Phe Gly Ser Leu Ala Arg Pro Gly His Pro Met Gly340 345 350Lys Phe Phe Trp Gly Asn Ala Glu Thr Leu Lys His Glu Pro Lys Lys355 360 365Asn Asn Ile Asp Thr His Ala Arg Leu Arg Glu Phe Trp Met Arg Tyr370 375 380Tyr Ser Ala His Tyr Met Thr Leu Val Val Gln Ser Lys Glu Thr Leu385 390 395 400Asp Thr Leu Glu Lys Trp Val Thr Glu Ile Phe Ser Gln Ile Pro Asn405 410 415
Asn Gly Leu Pro Lys Pro Asn Phe Ser His Leu Thr Asp Pro Phe Asp420 425 430Thr Pro Ala Phe Asn Lys Leu Tyr Arg Val Val Pro Ile Arg Lys Ile435 440 445His Ala Leu Thr Ile Thr Trp Ala Leu Pro Pro Gln Gln Gln His Tyr450 455 460Arg Val Lys Pro Leu His Tyr Ile Ser Trp Leu Val Gly His Glu Gly465 470 475 480Lys Gly Ser Ile Leu Ser Tyr Leu Arg Lys Lys Cys Trp Ala Leu Ala485 490 495Leu Phe Gly Gly Ash Gly Glu Thr Gly Phe Glu Gln Asn Ser Thr Tyr500 505 510Ser Val Phe Ser Ile Ser Ile Thr Leu Thr Asp Glu Gly Tyr Glu His515 520 525Phe Tyr Glu Val Ala His Thr Val Phe Gln Tyr Leu Lys Met Leu Gln530 535 540Lys Leu Gly Pro Glu Lys Arg Val Phe Glu Glu Ile Gln Lys Ile Glu545 550 555 560Asp Asn Glu Phe His Tyr Gln Glu Gln Thr Asp Pro Val Glu Tyr Val565 570 575Glu Asn Met Cys Glu Asn Met Gln Leu Tyr Pro Arg Gln Asp Phe Leu580 585 590Thr Gly Asp Gln Leu Leu Phe Glu Tyr Lys Pro Glu Val Ile Ala Glu595 600 605Ala Leu Asn Gln Leu Val Pro Gln Lys Ala Asn Leu Val Leu Leu Ser610 615 620Gly Ala Asn Glu Gly Arg Cys Asp Leu Lys Glu Lys Trp Phe Gly Thr625 630 635 640Gln Tyr Ser Ile Glu Asp Ile Glu Asn Ser Trp Thr Glu Leu Trp Lys645 650 655
Ser Asn Phe Asp Leu Asn Ser Asp Leu His Leu Pro Ala Glu Asn Lys660 665 670Tyr Ile Ala Thr Asp Phe Thr Leu Lys Ala Phe Asp Cys Pro Glu Thr675 680 685Glu Tyr Pro Ala Lys Ile Val Asn Thr Pro Gln Gly Cys Leu Trp Tyr690 695 700Lys Lys Asp Asn Lys Phe Lys Ile Pro Lys Ala Tyr Ile Arg Phe His705 710 715 720Leu Ile Ser Pro Leu Ile Gln Lys Ser Ala Ala Asn Val Val Leu Phe725 730 735Asp Ile Phe Val Asn Ile Leu Thr His Asn Leu Ala Glu Pro Ala Tyr740 745 750Glu Ala Asp Val Ala Gln Leu Glu Tyr Lys Leu Val Ala Gly Glu His755 760 765Gly Leu Ile Ile Arg Val Lys Gly Phe Asn His Lys Leu Pro Leu Leu770 775 780Phe Gln Leu Ile Ile Asp Tyr Leu Thr Glu Phe Ser Ser Thr Pro Ala785 790 795 800Val Phe Thr Met Ile Thr Glu Gln Leu Lys Lys Thr Tyr Phe Asn Ile805 810 815Leu Ile Lys Pro Glu Thr Leu Ala Lys Asp Val Arg Leu Leu Ile Leu820 825 830Glu Tyr Ser Arg Trp Ser Met Ile Asp Lys Tyr Arg Ala Leu Met Asp835 840 845Gly Leu Ser Leu Glu Ser Leu Leu Asn Phe Val Lys Asp Phe Lys Ser850 855 860Gln Leu Phe Val Glu Gly Leu Val Gln Gly Asn Val Thr Ser Thr Glu865 870 875 880Ser Met Asp Phe Leu Arg Tyr Val Val Asp Lys Leu Asn Phe Val Pro885 890 895Leu Glu Arg Glu Met Pro Val Gln Phe Gln Val Val Glu Leu Pro Ser
900 905 910Gly His His Leu Cys Lys Val Arg Ala Leu Asn Lys Gly Asp Ala Asn915 920 925Ser Glu Val Thr Val Tyr Tyr Gln Ser Gly Thr Arg Ser Leu Arg Glu930 935 940Tyr Thr Leu Met Glu Leu Leu Val Met His Met Glu Glu Pro Cys Phe945 950 955 960Asp Phe Leu Arg Thr Lys Gln Thr Leu Gly Tyr His Val Tyr Pro Thr965 970 975Cys Arg Asn Thr Ser Gly Ile Leu Gly Phe Ser Val Thr Val Gly Thr980 985 990Gln Ala Thr Lys Tyr Asn Ser Glu Thr Val Asp Lys Lys Ile Glu Glu995 1000 1005Phe Leu Ser Ser Phe Glu Glu Lys Ile Glu Asn Leu Thr Glu Asp1010 1015 1020Ala Phe Asn Thr Gln Val Thr Ala Leu Ile Lys Leu Lys Glu Cys1025 1030 1035Glu Asp Thr His Leu Gly Glu Glu Val Asp Arg Asn Trp Asn Glu1040 1045 1050Val Val Thr Gln Gln Tyr Leu Phe Asp Arg Leu Ala His Glu Ile1055 1060 1065Glu Ala Leu Lys Ser Phe Ser Lys Ser Asp Leu Val Ser Trp Phe1070 1075 1080Lys Ala His Arg Gly Pro Gly Ser Lys Met Leu Ser Val His Val1085 1090 1095Val Gly Tyr Gly Lys Tyr Glu Leu Glu Glu Asp Gly Ala Pro Val1100 1105 1110Cys Glu Asp Pro Asn Ser Arg Glu Gly Met Gln Leu Ile Tyr Leu1115 1120 1125Pro Pro Ser Pro Leu Leu Ala Glu Ser Thr Thr Pro Ile Thr Asp1130 1135 1140
Ile Arg Ala Phe Thr Ala Thr Leu Ser Leu Phe Pro Tyr His Lys1145 1150 1155Ile Val Lys1160 210 11 211 1019 212 PRT 213 人 400 11Met Arg Tyr Arg Leu Ala Trp Leu Leu His Pro Ala Leu Pro Ser Thr1 5 10 15Phe Arg Ser Val Leu Gly Ala Arg Leu Pro Pro Pro Glu Arg Leu Cys20 25 30Gly Phe Gln Lys Lys Thr Tyr Ser Lys Met Asn Asn Pro Ala Ile Lys35 40 45Arg Ile Gly Asn His Ile Thr Lys Ser Pro Glu Asp Lys Arg Glu Tyr50 55 60Arg Gly Leu Glu Leu Ala Asn Gly Ile Lys Val Leu Leu Met Ser Asp65 70 75 80Pro Thr Thr Asp Lys Ser Ser Ala Ala Leu Asp Val His Ile Gly Ser85 90 95Leu Ser Asp Pro Pro Asn Ile Ala Gly Leu Ser His Phe Cys Glu His100 105 110Met Leu Phe Leu Gly Thr Lys Lys Tyr Pro Lys Glu Asn Glu Tyr Ser115 120 125Gln Phe Leu Ser Glu His Ala Gly Ser Ser Asn Ala Phe Thr Ser Gly130 135 140Glu His Thr Asn Tyr Tyr Phe Asp Val Ser His Glu His Leu Glu Gly145 150 155 160Ala Leu Asp Arg Phe Ala Gln Phe Phe Leu Cys Pro Leu Phe Asp Glu165 170 175
Ser Cys Lys Asp Arg Glu Val Asn Ala Val Asp Ser Glu His Glu Lys180 185 190Asn Val Met Asn Asp Ala Trp Arg Leu phe Gln Leu Glu Lys Ala Thr195 200 205Gly Asn Pro Lys His Pro Phe Ser Lys Phe Gly Thr Gly Asn Lys Tyr210 215 220Thr Leu Glu Thr Arg Pro Asn Gln Glu Gly Ile Asp Val Arg Gln Glu225 230 235 240Leu Leu Lys Phe His Ser Ala Tyr Tyr Ser Ser Asn Leu Met Ala Val245 250 255Cys Val Leu Gly Arg Glu Ser Leu Asp Asp Leu Thr Asn Leu Val Val260 265 270Lys Leu Phe Ser Glu Val Glu Asn Lys Asn Val Pro Leu Pro Glu Phe275 280 285Pro Glu His Pro Phe Gln Glu Glu His Leu Lys Gln Leu Tyr Lys Ile290 295 300Val Pro Ile Lys Asp Ile Arg Asn Leu Tyr Val Thr Phe Pro Ile Pro305 310 315 320Asp Leu Gln Lys Tyr Tyr Lys Ser Asn Pro Gly His Tyr Leu Gly His325 330 335Leu Ile Gly His Glu Gly Pro Gly Ser Leu Leu Ser Glu Leu Lys Ser340 345 350Lys Gly Trp Val Asn Thr Leu Val Gly Gly Gln Lys Glu Gly Ala Arg355 360 365Gly Phe Met Phe Phe Ile Ile Asn Val Asp Leu Thr Glu Glu Gly Leu370 375 380Leu His Val Glu Asp Ile Ile Leu His Met Phe Gln Tyr Ile Gln Lys385 390 395 400Leu Arg Ala Glu Gly Pro Gln Glu Trp Val Phe Gln Glu Cys Lys Asp405 410 415Leu Asn Ala Val Ala Phe Arg Phe Lys Asp Lys Glu Arg Pro Arg Gly
420 425 430Tyr Thr Ser Lys Ile Ala Gly Ile Leu His Tyr Tyr Pro Leu Glu Glu435 440 445Val Leu Thr Ala Glu Tyr Leu Leu Glu Glu Phe Arg Pro Asp Leu Ile450 455 460Glu Met Val Leu Asp Lys Leu Arg Pro Glu Asn Val Arg Val Ala Ile465 470 475 480Val Ser Lys Ser Phe Glu Gly Lys Thr Asp Arg Thr Glu Glu Trp Tyr485 490 495Gly Thr Gln Tyr Lys Gln Glu Ala Ile Pro Asp Glu Val Ile Lys Lys500 505 510Trp Gln Asn Ala Asp Leu Asn Gly Lys Phe Lys Leu Pro Thr Lys Asn515 520 525Glu Phe Ile Pro Thr Asn Phe Glu Ile Leu Pro Leu Glu Lys Glu Ala530 535 540Thr Pro Tyr Pro Ala Leu Ile Lys Asp Thr Val Met Ser Lys Leu Trp545 550 555 560Phe Lys Gln Asp Asp Lys Lys Lys Lys Pro Lys Ala Cys Leu Asn Phe565 570 575Glu Phe Phe Ser Pro Phe Ala Tyr Val Asp Pro Leu His Cys Asn Met580 585 590Ala Tyr Leu Tyr Leu Glu Leu Leu Lys Asp Ser Leu Asn Glu Tyr Ala595 600 605Tyr Ala Ala Glu Leu Ala Gly Leu Ser Tyr Asp Leu Gln Asn Thr Ile610 615 620Tyr Gly Met Tyr Leu Ser Val Lys Gly Tyr Asn Asp Lys Gln Pro Ile625 630 635 640Leu Leu Lys Lys Ile Ile Glu Lys Met Ala Thr phe Glu Ile Asp Glu645 650 655Lys Arg Phe Glu Ile Ile Lys Glu Ala Tyr Met Arg Ser Leu Asn Asn660 665 670
Phe Arg Ala Glu Gln Pro His Gln His Ala Met Tyr Tyr Leu Arg Leu675 680 685Leu Met Thr Glu Val Ala Trp Thr Lys Asp Glu Leu Lys Glu Ala Leu690 695 700Asp Asp Val Thr Leu Pro Arg Leu Lys Ala Phe Ile Pro Gln Leu Leu705 710 715 720Ser Arg Leu His Ile Glu Ala Leu Leu His Gly Asn Ile Thr Lys Gln725 730 735Ala Ala Leu Gly Ile Met Gln Met Val Glu Asp Thr Leu Ile Glu His740 745 750Ala His Thr Lys Pro Leu Leu Pro Ser Gln Leu Val Arg Tyr Arg Glu755 760 765Val Gln Leu Pro Asp Arg Gly Trp Phe Val Tyr Gln Gln Arg Asn Glu770 775 780Val His Asn Asn Cys Gly Ile Glu Ile Tyr Tyr Gln Thr Asp Met Gln785 790 795 800Ser Thr Ser Glu Asn Met Phe Leu Glu Leu Phe Cys Gln Ile Ile Ser805 810 815Glu Pro Cys Phe Asn Thr Leu Arg Thr Lys Glu Gln Leu Gly Tyr Ile820 825 830Val Phe Ser Gly Pro Arg Arg Ala Asn Gly Ile Gln Ser Leu Arg Phe835 840 845Ile Ile Gln Ser Glu Lys Pro Pro His Tyr Leu Glu Ser Arg Val Glu850 855 860Ala Phe Leu Ile Thr Met Glu Lys Ser Ile Glu Asp Met Thr Glu Glu865 870 875 880Ala Phe Gln Lys His Ile Gln Ala Leu Ala Ile Arg Arg Leu Asp Lys885 890 895Pro Lys Lys Leu Ser Ala Glu Cys Ala Lys Tyr Trp Gly Glu Ile Ile900 905 910
Ser Gln Gln Tyr Asn Phe Asp Arg Asp Asn Thr Glu Val Ala Tyr Leu915 920 925Lys Thr Leu Thr Lys Glu Asp Ile Ile Lys Phe Tyr Lys Glu Met Leu930 935 940Ala Val Asp Ala Pro Arg Arg His Lys Val Ser Val His Val Leu Ala945 950 955 960Arg Glu Met Asp Ser Cys Pro Val Val Gly Glu Phe Pro Cys Gln Asn965 970 975Asp Ile Asn Leu Ser Gln Ala Pro Ala Leu Pro Gln Pro Glu Val Ile980 985 990Gln Asn Met Thr Glu Phe Lys Arg Gly Leu Pro Leu Phe Pro Leu Val995 1000 1005Lys Pro His Ile Asn Phe Met Ala Ala Lys Leu1010 1015 210 12 211 1265 212 PRT 213 拟南芥(Arabidopsis thaliana) 400 12Met Ala Ser Ser Ser Ser Ser Ile Phe Thr Gly Val Lys Phe Ser Pro1 5 10 15Ile Leu Ala Pro Phe Asn Ser Gly Asp Ser Arg Arg Ser Arg Tyr Leu20 25 30Lys Asp Ser Arg Asn Lys Val Arg Phe Asn Pro Ser Ser Pro Arg Leu35 40 45Thr Pro His Arg Val Arg Val Glu Ala Pro Ser Leu Ile Pro Tyr Asn50 55 60Gly Leu Trp Ala Ala Gln Pro Asn Ser His Lys Gly Arg Leu Lys Arg65 70 75 80Asn Ile Val Ser Gly Lys Glu Ala Thr Gly Ile Ser Leu Ser Gln Gly85 90 95
Arg Asn Phe Cys Leu Thr Cys Lys Arg Asn Gln Ala Gly Ile Arg Arg100 105 110Ala Leu Pro Ser Ala Phe Val Asp Arg Thr Ala Phe Ser Leu Ser Arg115 120 125Ser Ser Leu Thr Ser Ser Leu Arg Lys His Ser Gln Ile Val Asn Ala130 135 140Thr Leu Gly Pr0 Asp Glu Pro His Ala Ala Gly Thr Ala Trp Pro Asp145 150 155 160Gly Ile Val Ala Glu Arg Gln Asp Leu Asp Leu Leu Pro Pro Glu Ile165 170 175Asp Ser A1a Glu Leu Glu Ala Phe Leu Gly Cys Glu Leu Pro Ser His180 185 190Pro Lys Leu His Arg Gly Gln Leu Lys Asn Gly Leu Arg Tyr Leu Ile195 200 205Leu Pro Asn Lys Val Pro Pro Asn Arg Phe Glu Ala His Met Glu Val210 215 220His Val Gly Ser Ile Asp Glu Glu Glu Asp Glu Gln Gly Ile A1a His225 230 235 240Met Ile Glu His Val Ala Phe Leu Gly Ser Lys Lys Arg Glu Lys Leu245 250 255Leu Gly Thr Gly Ala Arg Ser Asn Ala Tyr Thr Asp Phe His His Thr260 265 270Val Phe His Ile His Ser Pro Thr His Thr Lys Asp Ser Glu Asp Asp275 280 285Leu Phe Pro Ser Val Leu Asp Ala Leu Asn Glu Ile Ala Phe His Pro290 295 300Lys Phe Leu Ser Ser Arg Val Glu Lys Glu Arg Arg Ala Ile Leu Ser305 310 315 320Glu Leu Gln Met Met Asn Thr Ile Glu Tyr Arg Val Asp Cys Gln Leu325 330 335
Leu Gln His Leu His Ser Glu Asn Lys Leu Gly Arg Arg Phe Pro Ile340 345 350Gly Leu Glu Glu Gln Ile Lys Lys Trp Asp Val Asp Lys Ile Arg Lys355 360 365Phe His Glu Arg Trp Tyr Phe Pro Ala Asn Ala Thr Leu Tyr Ile Val370 375 380Gly Asp Ile Asp Asn Ile Pro Arg Ile Val His Asn Ile Glu Ala Val385 390 395 400Phe Gly Lys Asn Gly Leu Asp Asn Glu Ser Thr Pro Ser Ser Pro Ser405 410 415Pro Gly Ala Phe Gly Ala Met Ala Asn Phe Leu Val Pro Lys Leu Pro420 425 430Ala Gly Leu Gly Gly Thr Phe Ser Asn Glu Lys Thr Asn Thr Ala Asp435 440 445Gln Ser Lys Met Ile Lys Arg Glu Arg His Ala Ile Arg Pro Pro Val450 455 460Glu His Asn Trp Ser Leu Pro Gly Thr Ser Val Asp Leu Lys Pro Pro465 470 475 480Gln Ile Phe Lys His Glu Leu Leu Gln Asn Phe Ala Ile Asn Met Phe485 490 495Cys Lys Ile Pro Val Ser Lys Val Gln Thr Phe Gly Asp Leu Arg Asn500 505 510Val Leu Met Lys Arg Ile Phe Leu Ser Ala Leu His Phe Arg Ile Asn515 520 525Thr Arg Tyr Lys Ser Ser Asn Pro Pro Phe Thr Ser Val Glu Leu Asp530 535 540His Ser Asp Ser Gly Arg Glu Gly Cys Thr Val Thr Thr Leu Thr Val545 550 555 560Thr Ala Glu Pro Gln Asn Trp Gln Asn Ala Val Lys Val Ala Val Gln565 570 575Glu Val Arg Arg Leu Lys Glu Phe Gly Val Thr Arg Gly Glu Leu Thr
580 585 590Arg Tyr Met Asp Ala Leu Leu Lys Asp Ser Glu His Leu Ala Ala Met595 600 605Ile Asp Asn Val Ser Ser Val Asp Asn Leu Asp Phe Ile Met Glu Ser610 615 620Asp Ala Leu Ser His Thr Val Met Asp Gln Thr Gln Gly His Glu Thr625 630 635 640Leu Val Ala Val Ala Gly Thr Val Thr Leu Glu Glu Val Asn Thr Val645 650 655Gly Ala Lys Val Leu Glu Phe Ile Ser Asp Phe Gly Arg Pro Thr Ala660 665 670Leu Leu Pro Ala Ala Ile Val Ala Cys Val Pro Thr Lys Val His Val675 680 685Asp Gly Val Gly Glu Ser Asp Phe Asn Ile Ser Pro Asp Glu Ile Ile690 695 700Glu Ser Val Lys Ser Gly Leu Leu Ala Pro Ile Glu Ala Glu Pro Glu705 710 715 720Leu Glu Val Pro Lys Glu Leu Ile Ser Gln Ser Gln Leu Lys Glu Leu725 730 735Thr Leu Gln Arg Asn Pro Cys Phe Val Pro Ile Pro Gly Ser Gly Leu740 745 750Thr Lys Leu His Asp Lys Glu Thr Gly Ile Thr Gln Leu Arg Leu Ser755 760 765Asn Gly Ile Ala Val Asn Tyr Lys Lys Ser Thr Thr Glu Ser Arg Ala770 775 780Gly Val Met Arg Leu Ile Val Gly Gly Gly Arg Ala Ala Glu Thr Ser785 790 795 800Asp Ser Lys Gly Ala Val Val Val Gly Val Arg Thr Leu Ser Glu Gly805 810 815Gly Arg Val Gly Asp Phe Ser Arg Glu Gln Val Glu Leu Phe Cys Val820 825 830
Asn His Leu Ile Asn Cys Ser Leu Glu Ser Thr Glu Glu Phe Ile Ala835 840 845Met Glu Pphe Arg Phe Thr Leu Arg Asp Asn Gly Met Gln Ala Ala Phe850 855 860Gln Leu Leu His Met Val Leu Glu Arg Ser Val Trp Leu Glu Asp Ala865 870 875 880Phe Asp Arg Ala Arg Gln Leu Tyr Leu Ser Tyr Phe Arg Ser Ile Pro885 890 895Lys Ser Leu Glu Arg Ala Thr Ala His Lys Leu Met Ile Ala Met Leu900 905 910Asn Gly Asp Glu Arg Phe Val Glu Pro Thr Pro Lys Ser Leu Gln Ser915 920 925Leu Asn Leu Glu Ser Val Lys Asp Ala Val Met Ser His Phe Val Gly930 935 940Asp Asn Met Glu Val Ser Ile Val Gly Asp Phe Ser Glu Glu Glu Ile945 950 955 960Glu Arg Cys Ile Leu Asp Tyr Leu Gly Thr Val Lys Ala Ser His Asp965 970 975Ser Ala Lys Pro Pro Gly Ser Glu Pro Ile Leu Phe Arg Gln Pro Thr980 985 990Ala Gly Leu Gln Phe Gln Gln Val Phe Leu Lys Asp Thr Asp Glu Arg995 1000 1005Ala Cys Ala Tyr Ile Ala Gly Pro Ala Pro Asn Arg Trp Gly Phe1010 1015 1020Thr Val Asp Gly Asp Asp Leu Phe Gln Ser Val Ser Lys Leu Pro1025 1030 1035Val Ala His Asp Gly Leu Leu Lys Ser Glu Glu Gln Leu Leu Glu1040 1045 1050Gly Gly Asp Arg Glu Leu Gln Lys Lys Leu Arg Ala His Pro Leu1055 1060 1065
Phe Phe Gly Val Thr Met Gly Leu Leu Ala Glu Ile Ile Asn Ser1070 1075 1080Arg Leu Phe Thr Thr Val Arg Asp Ser Leu Gly Leu Thr Tyr Asp1085 1090 1095Val Ser Phe Glu Leu Asn Leu Phe Asp Arg Leu Lys Leu Gly Trp1100 1105 1110Tyr Val Ile Ser Val Thr Ser Thr Pro Gly Lys Val Tyr Lys Ala1115 1120 1125Val Asp Ala Cys Lys Asn Val Leu Arg Gly Leu His Ser Asn Gln1130 1135 1140Ile Ala Pro Arg Glu Leu Asp Arg Ala Lys Arg Thr Leu Leu Met1145 1150 1155Arg His Glu Ala Glu Leu Lys Ser Asn Ala Tyr Trp Leu Asn Leu1160 1165 1170Leu Ala His Leu Gln Ala Ser Ser Val Gln Arg Lys Glu Leu Ser1175 1180 1185Cys Ile Lys Glu Leu Val Ser Leu Tyr Glu Ala Ala Ser Ile Glu1190 1195 1200Asp Ile Tyr Leu Ala Tyr Asn Gln Leu Arg Val Asp Glu Asp Ser1205 1210 1215Leu Tyr Ser Cys Ile Gly Ile Ala Gly Ala Gln Ala Gly Glu Glu1220 1225 1230Ile Thr Val Leu Ser Glu Glu Glu Glu Pro Glu Asp Val Phe Ser1235 1240 1245Gly Val Val Pro Val Gly Arg Gly Ser Ser Met Thr Thr Arg Pro1250 1255 1260Thr Thr1265 210 13 211 534 212 PRT 213 人
400 13Met Arg Pro Asp Asp Lys Tyr His Glu Lys Gln Ala Gln Val Glu Ala1 5 10 15Thr Lys Leu Lys Gln Lys Val Glu Ala Leu Ser pro Gly Asp Arg Gln20 25 30Gln Ile Tyr Glu Lys Gly Leu Glu Leu Arg Ser Gln Gln Ser Lys Pro35 40 45Gln Asp Ala Ser Cys Leu Pro Ala Leu Lys Val Ser Asp Ile Glu Pro50 55 60Thr Ile Pro Val Thr Glu Leu Asp Val Val Leu Thr Ala Gly Asp Ile65 70 75 80Pro Val Gln Tyr Cys Ala Gln Pro Thr Asn Gly Met Val Tyr Phe Arg85 90 95Ala Phe Ser Ser Leu Asn Thr Leu Pro Glu Glu Leu Arg Pro Tyr Val100 105 110Pro Leu Phe Cys Ser Val Leu Thr Lys Leu Gly Cys Gly Leu Leu Asp115 120 125Tyr Arg Glu Gln Ala Gln Gln Ile Glu Leu Lys Thr Gly Gly Met Ser130 135 140Ala Ser Pro His Val Leu Pro Asp Asp Ser His Met Asp Thr Tyr Glu145 150 155 160Gln Gly Val Leu Phe Ser Ser Leu Cys Leu Asp Arg Asn Leu Pro Asp165 170 175Met Met Gln Leu Trp Ser Glu Ile Phe Asn Asn Pro Cys Phe Glu Glu180 185 190Glu Glu His Phe Lys Val Leu Val Lys Met Thr Ala Gln Glu Leu Ala195 200 205Asn Gly Ile Pro Asp Ser Gly His Leu Tyr Ala Ser Ile Arg Ala Gly210 215 220Arg Thr Leu Thr Pro Ala Gly Asp Leu Gln Glu Thr Phe Ser Gly Met
225 230 235 240Asp Gln Val Arg Leu Met Lys Arg Ile Ala Glu Met Thr Asp Ile Lys245 250 255Pro Ile Leu Arg Lys Leu Pro Arg Ile Lys Lys His Leu Leu Asn Gly260 265 270Asp Asn Met Arg Cys Ser Val Asn Ala Thr Pro Gln Gln Met Pro Gln275 280 285Thr Glu Lys Ala Val Glu Asp Phe Leu Arg Ser Ile Gly Arg Ser Lys290 295 300Lys Glu Arg Arg Pro Val Arg Pro His Thr Val Glu Lys Pro Val Pro305 310 315 320Ser Ser Ser Gly Gly Asp Ala His Val Pro His Gly Ser Gln Val Ile325 330 335Arg Lys Leu Val Met Glu Pro Thr Phe Lys Pro Trp Gln Met Lys Thr340 345 350His Phe Leu Met Pro Phe Pro Val Asn Tyr Val Gly Glu Cys Ile Arg355 360 365Thr Val Pro Tyr Thr Asp Pro Asp His Ala Ser Leu Lys Ile Leu Ala370 375 380Arg Leu Met Thr Ala Lys Phe Leu His Thr Glu Ile Arg Glu Lys Gly385 390 395 400Gly Ala Tyr Gly Gly Gly Ala Lys Leu Ser His Asn Gly Ile Phe Thr405 410 415Leu Tyr Ser Tyr Arg Asp Pro Asn Thr Ile Glu Thr Leu Gln Ser Phe420 425 430Gly Lys Ala Val Asp Trp Ala Lys Ser Gly Lys Phe Thr Gln Gln Asp435 440 445Ile Asp Glu Ala Lys Leu Ser Val Phe Ser Thr Val Asp Ala Pro Val450 455 460Ala Pro Ser Asp Lys Gly Met Asp His Phe Leu Tyr Gly Leu Ser Asp465 470 475 480
Glu Met Lys Gln Ala His Arg Glu Gln Leu Phe Ala Val Ser His Asp485 490 495Lys Leu Leu Ala Val Ser Asp Arg Tyr Leu Gly Thr Gly Lys Ser Thr500 505 510His Gly Leu Ala Ile Leu Gly Pro Glu Asn Pro Lys Ile Ala Lys Asp515 520 525Pro Ser Trp Ile Ile Arg530 210 14 211 409 212 PRT 213 枯草芽孢杆菌(Bacillus subtilis) 400 14Met Ile Lys Arg Tyr Thr Cys Pro Asn Gly Val Arg Ile Val Leu Glul 5 10 15Asn Asn Pro Thr Val Arg Ser Val Ala Ile Gly Val Trp Ile Gly Thr20 25 30Gly Ser Arg His Glu Thr Pro Glu Ile Asn Gly Ile Ser His Phe Leu35 40 45Glu His Met Phe Phe Lys Gly Thr Ser Thr Lys Ser Ala Arg Glu Ile50 55 60Ala Glu Ser Phe Asp Arg Ile Gly Gly Gln Val Asn Ala Phe Thr Ser65 70 75 80Lys Glu Tyr Thr Cys Tyr Tyr Ala Lys Val Leu Asp Glu His Ala Asn85 90 95Tyr Ala Leu Asp Val Leu Ala Asp Met Phe Phe His Ser Thr Phe Asp100 105 110Glu Asn Glu Leu Lys Lys Glu Lys Asn Val Val Tyr Glu Glu Ile Lys115 120 125Met Tyr Glu Asp Ala Pro Asp Asp Ile Val His Asp Leu Leu Ser Lys
130 135 140Ala Thr Tyr Gly Asn His Ser Leu Gly Tyr Pro Ile Leu Gly Thr Glu145 150 155 160Glu Thr Leu Ala Ser Phe Asn Gly Asp Ser Leu Arg Gln Tyr Met His165 170 175Asp Tyr Tyr Thr Pro Asp Arg Val Val Ile Ser Val Ala Gly Asn Ile180 185 190Ser Asp Ser Phe Ile Lys Asp Val Glu Lys Trp Phe Gly Ser Tyr Glu195 200 205Ala Lys Gly Lys Ala Thr Gly Leu Glu Lys Pro Glu Phe His Thr Glu210 215 220Lys Leu Thr Arg Lys Lys Glu Thr Glu Gln Ala His Leu Cys Leu Gly225 230 235 240Phe Lys G1y Leu Glu Val Gly His Glu Arg Ile Tyr Asp Leu Ile Val245 250 255Leu Asn Asn Val Leu Gly Gly Ser Met Ser Ser Arg Leu Phe Gln Asp260 265 270Val Arg Glu Asp Lys Gly Leu Ala Tyr Ser Val Tyr Ser Tyr His Ser275 280 285Ser Tyr Glu Asp Ser Gly Met Leu Thr Ile Tyr Gly Gly Thr Gly Ala290 295 300Asn Gln Leu Gln Gln Leu Ser Glu Thr Ile Gln Glu Thr Leu Ala Thr305 310 315 320Leu Lys Arg Asp Gly Ile Thr Ser Lys Glu Leu Glu Asn Ser Lys Glu325 330 335Gln Met Lys Gly Ser Leu Met Leu Ser Leu Glu Ser Thr Asn Ser Lys340 345 350Met Ser Arg Asn Gly Lys Asn Glu Leu Leu Leu Gly Lys His Lys Thr355 360 365Leu Asp Glu Ile Ile Asn Glu Leu Asn Ala Val Asn Leu Glu Arg Val
370 375 380Asn Gly Leu Ala Arg Gln Leu Phe Thr Glu Asp Tyr Ala Leu Ala Leu385 390 395 400Ile Ser Pro Ser Gly Asn Met Pro Ser405 210 15 211 438 212 PRT 213 结核分枝杆菌(Mycobacterium tuberculosis) 400 15Met Pro Arg Arg Ser Pro Ala Asp Pro Ala Ala Ala Leu Ala Pro Arg1 5 10 15Arg Thr Thr Leu Pro Gly Gly Leu Arg Val Val Thr Glu Phe Leu Pro20 25 30Ala Val His Ser Ala Ser Val Gly Val Trp Val Gly Val Gly Ser Arg35 40 45Asp Glu Gly Ala Thr Val Ala Gly Ala Ala His Phe Leu Glu His Leu50 55 60Leu Phe Lys Ser Thr Pro Thr Arg Ser Ala Val Asp Ile Ala Gln Ala65 70 75 80Met Asp Ala Val Gly Gly Glu Leu Asn Ala Phe Thr Ala Lys Glu His85 90 95Thr Cys Tyr Tyr Ala His Val Leu Gly Ser Asp Leu Pro Leu Ala Val100 105 110Asp Leu Val Ala Asp Val Val Leu Asn Gly Arg Cys Ala Ala Asp Asp115 120 125Val Glu Val Glu Arg Asp Val Val Leu Glu Glu Ile Ala Met Arg Asp130 135 140Asp Asp Pro Glu Asp Ala Leu Ala Asp Met Phe Leu Ala Ala Leu Phe145 150 155 160Gly Asp His Pro Val Gly Arg Pro Val Ile Gly Ser Ala Gln Ser Val165 170 175
Ser Val Met Thr Arg Ala Gln Leu Gln Ser Phe His Leu Arg Arg Tyr180 185 190Thr Pro Glu Arg Met Val Val Ala Ala Ala Gly Asn Val Asp His Asp195 200 205Gly Leu Val Ala Leu Val Arg Glu His Phe Gly Ser Arg Leu Val Arg210 215 220Gly Arg Arg Pro Val Ala Pro Arg Lys Gly Thr Gly Arg Val Asn Gly225 230 235 240Ser Pro Arg Leu Thr Leu Val Ser Arg Asp Ala Glu Gln Thr His Val245 250 255Ser Leu Gly Ile Arg Thr Pro Gly Arg Gly Trp Glu His Arg Trp Ala260 265 270Leu Ser Val Leu His Thr Ala Leu Gly Gly Gly Leu Ser Ser Arg Leu275 280 285Phe Gln Glu Val Arg Glu Thr Arg Gly Leu Ala Tyr Ser Val Tyr Ser290 295 300Ala Leu Asp Leu Phe Ala Asp Ser Gly Ala Leu Ser Val Tyr Ala Ala305 310 315 320Cys Leu Pro Glu Arg Phe Ala Asp Val Met Arg Val Thr Ala Asp Val325 330 335Leu Glu Ser Val Ala Arg Asp Gly Ile Thr Glu Ala Glu Cys Gly Ile340 345 350Ala Lys Gly Ser Leu Arg Gly Gly Leu Val Leu Gly Leu Glu Asp Ser355 360 365Ser Ser Arg Met Ser Arg Leu Gly Arg Ser Glu Leu Asn Tyr Gly Lys370 375 380His Arg Ser Ile Glu His Thr Leu Arg Gln Ile Glu Gln Val Thr Val385 390 395 400Glu Glu Val Asr Ala Val Ala Arg His Leu Leu Ser Arg Arg Tyr Gly405 410 415
Ala Ala Val Leu Gly Pro His Gly Ser Lys Arg Ser Leu Pro Gln Gln420 425 430Leu Arg Ala Met Val Gly435 210 16 211 34 212 DNA 213 人工序列 220
223 寡核苷酸 400 16aatagaagct tgtcgactga tctatccaaa actg 34 210 17 211 66 212 DNA 213 人工序列 220
223 寡核苷酸 400 17aaaagagctc ggccagatct tctagaggat ccaagaattc tgttttatat ttgttgtaaa 60aagtag 66 210 18 211 37 212 DNA 213 人工序列 220
223 寡核苷酸 400 18ttttgaattc caagatctcc catgtctcta ctggtgg 37 210 19 211 41 212 DNA 213 人工序列 220
223 寡核苷酸
400 19ccccgagctc gtcgaccctt ctcgaaagct ttaacgaacg c 41 210 20 211 43 212 DNA 213 人工序列 220
223 寡核苷酸 400 20ttttgaattc aaagaatgag atttccttca atttttactg cag43 210 21 211 37 212 DNA 213 人工序列 220
223 寡核苷酸 400 2ltttttctaga ctaggagggg tactcatact cctcggc 37 210 22 211 33 212 DNA 213 人工序列 220
223 寡核苷酸 400 22cgaatgtcca tcgttgcgaa cctgcagaac ctg 33 210 23 211 33 212 DNA 213 人工序列 220
223 寡核苷酸 400 23caggttctgc aggttcctaa cgatggacat tcg 33 210 24 211 33 212 DNA 213 人工序列 220
223 寡核苷酸 400 24cgaatgtcca tcgttaggaa cctgcagaac ctg 33
210 25 211 33 212 DNA 213 人工序列 220
223 寡核苷酸 400 25caggttctgc aggttcctaa cgatggacat tcg 33 210 26 211 18 212 DNA 213 人工序列 220
223 寡核苷酸 400 26tcgcagagaa cggatggc18 210 27 211 36 212 DNA 213 人工序列 220
223 寡核苷酸 400 27ttttgggccc ttcatggtga tacggtatct cttggc36 210 28 211 37 212 DNA 213 人工序列 220
223 寡核苷酸 400 28ttttctcgag aaggtggaac atactgccct gggatgg 37 210 29 211 38 212 DNA 213 人工序列 220
223 寡核苷酸 400 29
ttttgagctc gtttaggaaa cgtccttggc ggagatgc 38 210 30 211 40 212 DNA 213 人工序列 220
223 寡核苷酸 400 30tttttctaga cactgcgaat ccatggtata aaccaaaacc40 210 31 211 24 212 DNA 213 人工序列 220
223 寡核苷酸 400 31gtcgttgttc atggacatac ctcc 24 210 32 211 26 212 DNA 213 人工序列 220
223 寡核苷酸 400 32tacaaatgtt cttctgccat ttctgg 26 210 33 211 32 212 DNA 213 人工序列 220
223 寡核苷酸 400 33ggttcatatg cgccggagct cctcgacagc ag32 210 34 211 37 212 DNA 213 人工序列 220
223 寡核苷酸 400 34
ggttcctagg atccgcaagt ttgattccat tgcggtg 37 210 35 211 70 212 DNA 213 人工序列 220
223 寡核苷酸 400 35ttaaagagta ccttggctat agaataccgt agagataaag acctgaatag agattgtact 60gagagtgcac 70 210 36 211 70 212 DNA 213 人工序列 220
223 寡核苷酸 400 36aggtattata actatttttc tgtatttttt atatattttt atttgccaag ctgtgcggta 60tttcacaccg 70 210 37 211 23 212 DNA 213 人工序列 220
223 寡核苷酸 400 37ctttggttaa agagtacctt ggc 23 210 38 211 23 212 DNA 213 人工序列 220
223 寡核苷酸 400 38tactacgaaa agcgtgtgcg agg 23 210 39 211 71 212 DNA 213 人工序列
220
223 寡核苷酸 400 39tagaaggcta ctcaaaagaa taaagttact ataaaatata ctgcggtata tagattgtac 60tgagagtgca c 71 210 40 211 70 212 DNA 213 人工序列 220
223 寡核苷酸 400 40gatcggcaag aaactttgaa gcagtatatt tacaggatta aattatatat ctgtgcggta 60tttcacaccg 70 210 41 211 22 212 DNA 213 人工序列 220
223 寡核苷酸 400 41cggaggggct ctatgataaa gg 22 210 42 211 23 212 DNA 213 人工序列 220
223 寡核苷酸 400 42gagtaactag ggcttctctt ccc 23 210 43 211 85 212 PRT 213 人 400 43Ser Gly Leu Gln Arg Ala Glu Glu Ala Pro Arg Arg Gln Leu Arg Val
1 5 10 15Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu Gly Ala Leu Leu20 25 30Ala Arg Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser35 40 45Ile Val Lys Asr Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp50 55 60Arg Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu65 70 75 80Tyr Glu Tyr Pro Ser85 210 44 211 22 212 PRT 2l3 人 400 44Gln Leu Arg Val Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu1 5 10 15Gly Ala Leu Leu Ala Arg20 210 45 211 19 212 PRT 213 人 400 45Val Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu Gly Ala Leu1 5 10 15Leu Ala Arg 210 46 211 51 212 PRT 213 人
400 46Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val1 5 10 15Lys Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp20 25 30Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr Glu35 40 45Tyr Pro Ser50 210 47 211 17 212 PRT 213 人 400 47Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val1 5 10 15Lys 210 48 211 16 212 PRT 213 人 400 48Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val1 5 10 15 210 49 211 13 212 PRT 213 人 400 49Asn Leu Gln Asr Leu Asp Pro Ser His Arg Ile Ser Asp1 5 10 210 50 211 23 212 PRT 213 人
400 50Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp Tyr1 5 10 15Met Gly Trp Met Asp Phe Gly20 210 51 211 34 212 PRT 213 人 400 51Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp Tyr1 5 10 15Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr Glu Tyr20 25 30Pro Ser 210 52 211 20 212 PRT 213 人 400 52Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr1 5 10 15Glu Tyr Pro Ser20 210 53 211 12 212 PRT 213 人工序列 220
223 Portion of fusion protein 400 53Lys Arg Glu Ala Glu Ala Ser Gly Leu Gln Arg Ala1 5 10 210 54 211 9 212 PRT 213 人
400 54Arg Met Ser Ile Val Lys Asn Leu Gln1 5 210 55 211 13 212 PRT 213 人 400 55Asp Arg Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg1 5 10 210 56 211 48 212 DNA 213 人工序列 220
223 寡核苷酸MFa1BNP(S) 400 56ggataaaaga gaggctgaag ctcacccgct gggcagcccc ggttcagc 48 210 57 211 48 212 DNA 213 人工序列 220
223 MF1aBNP(AS) 400 57gctgaaccgg ggctgcccag cgggtgagct tcagcctctc ttttatcc 48 210 58 211 34 212 DNA 213 人工序列 220
223 寡核苷酸BNP5′EcoRI 400 58ttttgaattc atggatcccc agacagcacc ttcc 34 210 59 211 33 212 DNA 213 人工序列
220
223 寡核苷酸BNP3′Xbal 400 59tttttctaga ttaatgccgc ctcagcactt tgc 33 210 60 211 48 212 DNA 213 人工序列 220
223 寡核苷酸MF1BNP(S) 400 60ggataaaaga gaggctgaag ctcacccgct gggcagcccc ggttcagc 48 210 61 211 48 212 DNA 213 人工序列 220
223 寡核苷酸MF1BNP(AS) 400 61gctgaaccgg ggctgcccag cgggtgagct tcagcctctc ttttatcc 48 210 62 211 69 212 DNA 213 人工序列 220
223 寡核苷酸YPS15′GD400 400 62aaaaagataa ggtgaacacc aagcatatag tataatatta cctaccacat gattgtactg 60agagtgcac 69 210 63 211 70 212 DNA 213 人工序列 220
223 寡核苷酸YPS13′GD400 400 63aactccaact ggcttggaga tgtgaatgtc taaactttgt gcaacggttt ctgtgcggta 60tttcacaccg 70 210 64 211 20
212 DNA 213 人工序列 220
223 寡核苷酸YPS15′DC 400 64tcgtttcact gatgtgtccg 20 210 65 211 21 212 DNA 213 人工序列 220
223 寡核苷酸YPS15′DC 400 65gattataggc catatcccag g21 210 66 211 13 212 PRT 213 人工序列 220
223 Pitrilysin共有序列 221 变体 222 (1)...(13) 223 Xaa=任一氨基酸 221 变体 222 (1)...(13) 223 Xaa=任一氨基酸 221 变体 222 (1)...(13) 223 Xaa=任一氨基酸 221 未确定 222 (0)...(0) 400 66Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly1 5 10 210 67 211 44 212 PRT 213 人工序列 220
223 Pitrilysin共有序列
221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (34)...(34) 223 Xaa=任一氨基酸或不存在 221 变体 222 (35)...(35) 223 Xaa=任一氨基酸或不存在 400 67Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa1 5 10 15Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr35 40 210 68 211 44 212 PRT 213 人工序列 220
223 Pitrilysin共有序列 221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (1)...(44) 223 Xaa=任一氨基酸 221 变体 222 (34)...(34) 223 Xaa=任一氨基酸或不存在 221 变体
222 (35)...(35) 223 Xaa=任一氨基酸或不存在 400 68Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Lys1 5 10 15Tyr Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa Xaa Xaa20 25 30Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr35 40
权利要求
1.用于在宿主细胞中产生目的蛋白质的方法,其中所述宿主细胞已经遗传修饰,从而与相应的未经修饰细胞相比,在相同条件下培养时表达显著降低水平的包含HXXEH基元(SEQ ID NO 1)的金属蛋白酶,所述方法包括a)向宿主细胞中导入编码目的蛋白质的核酸序列;b)在适当的生长培养基中培养步骤(a)的宿主细胞,以产生目的蛋白质;以及c)分离目的蛋白质。
2.根据权利要求1的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端70和80个氨基酸之间的谷氨酸残基。
3.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第一个组氨酸残基N-端3个氨基酸的甘氨酸残基。
4.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端5个氨基酸的甘氨酸残基。
5.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端8个氨基酸的赖氨酸残基。
6.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端9个氨基酸的酪氨酸残基。
7.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端10个氨基酸的脯氨酸残基。
8.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含共有序列SEQ ID NO 2。
9.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含共有序列SEQ ID NO 3。
10.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还在HXXEH基元第二个组氨酸残基C-端20和30个氨基酸之间包含NAXTXXXXT基元。
11.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶选自i)由SEQ ID NO 4到15组成的组中的任何一个序列;以及ii)与SEQ ID NO 4到15中任一序列至少80%相同的序列。
12.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶与SEQ ID NO4至少80%相同。
13.根据前述权利要求中任意一项所述的方法,其中目的蛋白质的总量与相应的未经修饰细胞相比在相同条件下培养时至少增加5%。
14.根据前述权利要求中任意一项所述的方法,其中目的蛋白质的总量与相应的未经修饰细胞相比在相同条件下培养时至少增加50%。
15.根据前述权利要求中任意一项所述的方法,其中宿主细胞为原核细胞。
16.根据权利要求1-14中任意一项所述的方法,其中宿主细胞为真核细胞。
17.根据权利要求16的方法,其中宿主细胞为非丝状真菌细胞。
18.根据权利要求16的方法,其中宿主细胞为丝状真菌细胞。
19.根据权利要求17的方法,其中宿主细胞为酵母属菌株。
20.根据权利要求19的方法,其中宿主细胞为酿酒酵母。
21.用于表达目的蛋白质的宿主细胞,其中所述细胞已经遗传修饰,从而与相应的未经修饰细胞相比,当在相同条件下培养时表达显著降低水平的包含HXXEH基元(SEQ ID NO 1)的金属蛋白酶。
22.根据权利要求21的宿主细胞,其中金属蛋白酶还包含共有序列SEQ ID NO 3。
全文摘要
本发明提供了包含编码重组多肽的核酸序列的宿主细胞,其中天然存在的包含序列HXXEH的金属蛋白酶的产生通过遗传操作得到降低或抑制。本发明还涉及通过破坏金属蛋白酶的合成或活性而提高细胞产生多肽的方法。本发明尤其涉及提高自宿主细胞例如但不限于酵母和细菌细胞分泌重组多肽的方法。金属蛋白酶为蛋白酶pitrilysin亚家族的成员,其特征在于包含序列HXXEH,其中X为任一氨基酸。
文档编号C07K14/58GK1701119SQ03825284
公开日2005年11月23日 申请日期2003年9月19日 优先权日2002年9月20日
发明者L·荣松, J·F·雷费尔德, A·H·约翰森 申请人:Cym1P有限公司

本文链接: http://clontechlaboratorie.immuno-online.com/view-690630.html

发布于 : 2021-03-24 阅读(0)