Противоопухолевые соединения

Изобретение относится к соединению общей формулы I или его стереоизомеру, в котором R1 выбран из водорода и незамещенного C1-C6 алкила; R2 и R3, каждый независимо, выбран из водорода и –C(=O)Ra; R4 выбран из водорода и -C(=O)Ra; Ra представляет собой незамещенный C1-C6 алкил. Изобретение также относится к способу получения соединения формулы I посредством культивирования штамма РНМ005 морских бактерий дикого типа в соответствующих условиях, а также к фармацевтической композиции на его основе. Технический результат – получены новые соединения и фармацевтическая композиция на их основе, которые могут найти применение в медицине для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы. 5 н. и 11 з.п. ф-лы, 10 ил., 2 табл., 8 пр.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к прямому или непрямому получению противоопухолевых соединений из бактерий и к новым противоопухолевым соединениям, содержащим их фармацевтическим композициям и их применению в качестве противоопухолевых средств.

УРОВЕНЬ ТЕХНИКИ

В 1949 году Ueta сообщил о выделении токсического соединения из жука Paederus fuscipes (Kyushu Igaku Zasshi, 1949, 249). Четыре года спустя вещество с идентичными физическими свойствами из того же вида жуков было также описано Pavan и Bo (Physiol. Comp. Oecol. 1953, 3, 307). Структура этого токсичного соединения, названного педерином, была впервые предложена в 1965 году Cardani и его коллегами (Tetrahedron Lett. 1965, 2537), но она была исправлена в 1968 Furusaki и его коллегами на основе кристаллической структуры производного. (Tetrahedron Lett. 1968, 6301). Структура педерина представляет собой:

Педерин

Кроме того, группа Cardani сообщила о выделении двух дополнительных соединений из Paederus fuscipes, которые были названы псевдопедерин и педерон. Педерон был описан два года спустя (Tetrahedron Lett. 1967, 41, 4023).

Педерин является мощным цитотоксическим и везикантным средством. Brega и соавторы (J. Cell Biol. 1968, 485-496) протестировали педерин против ряда клеточных линий, таких как EUE, E6D, HeLa, KB, Hep, AS, MEF, CE, BHK, Z1 и M1, и сообщили, что концентрации порядка 3 нМ достаточны для индукции клеточной гибели в течение четырех дней во всех анализируемых клеточных линиях. Кроме того, педерин вызывает немедленное нарушение синтеза белка и ДНК.

Цитотоксичность псевдопедерина также была описана Soldati и сотрудниками (Experientia 1966, 3, 176-178). Псевдопедерин имеет токсичность ниже педерина и активен в дозах в 10 раз выше.

В европейском патенте EP0289203 описано выделение и противоопухолевая и противовирусная активность Микаламида А, соединения, выделенного из губок Mycale sp., собранных в Новой Зеландии.

Микаламид А

Его изобретатели, группа Munro, затем сообщили о выделении Микаламида B, близко родственного соединения с противоопухолевой и противовирусной активностью, выделенного из того же источника (J. Org. Chem. 1990, 55, 223).

Микаламид В

Затем они выделили два дополнительных микаламида, Микаламид C и D, из губок Stylinos (J. Nat. Prod. 2000, 63, 704). Микаламиды A, B, C и D имеют значения IC50 против линии клеток мышиного лейкоза P-388, равные 3,0, 0,7, 95,0 и 35 нг/мл, соответственно.

Было также показано, что микаламиды являются мощными иммуносупрессивными агентами, сравнимыми по эффективности in vitro с клиническим средством циклоспорин А.

В US4801606 описано выделение Оннамида A из образцов Theonella sp, собранных у берегов Японии. Оннамид А представляет собой противоопухолевое соединение со значением IC50 против мышиной линии клеток P388, равным 1 нг/мл. Он также обладает противовирусной активностью.

Оннамид А

Семейство оннамида состоит из нескольких представителей. У трех из них, Оннамидов D-F, отсутствует диоксолановое кольцо Оннамида A. Оннамиды D и E были выделены из губок Theonella Matsunaga и его коллегами (Tetrahedron, 1992, 48, 8369), и Оннамид F собран группой Capon из губки Trachycladus laevispirulifer (J. Nat. Prod. 2001, 64, 640).

Оннамид E не проявлял цитотоксической активности в отношении клеточной линии P388 при концентрации 0,4 мкг/мл, а Оннамид F описан как мощный нематоцид.

Экспериментальное доказательство бактериального биосинтеза педерина было впервые предоставлено Kellner, который сообщил, что свойство производить педерин может быть передано непроизводящей линии Paederus spp путем скармливания яиц педерин-позитивных самок (Chemoecology, 2001, 11, 127). Напротив, яйца, обработанные антибиотиками, не вызывали такого эффекта. Этот результат указал на существование продуцирующей педерин бактерии, которая способна колонизировать непродуцирующие варианты (J. Insect. Physiol., 2001, 47, 475).

Piel и коллеги выделили генный крастер для поликетидного синтеза (PKS) педерина (Proc. Natl. Acad. Sci. U.S.A., 2002, 99, 14002 и WO2003044186) и оннамидов (Proc. Natl. Acad. Sci. U.S.A., 2004, 101, 16222). В этой работе было показано активное участие бактериальных симбионтов в качестве истинных источников этих соединений, что дает объяснение тому, что структурно подобные соединения выделены из разрозненных организмов. Описание участия симбионтов дано Piel, J., Curr. Med. Chem. 2006, 13, 39.

Другое близкородственное соединение, диафорин, было выделено Nakabachi и коллегами из насекомого Diaphorina citri (Current Biology 2013, 23(15), 1478-1484). Это соединение также является цитотоксическим и имеет значение IC50, равное приблизительно 1 мкМ и приблизительно против клеток B104 и HeLa, соответственно. Его присутствие в экстрактах Diaphorina citri было спрогнозировано в той же публикации при анализе системы поликетидсинтазы (PKS) Candidatus Profftella armatura, защитного бактериального симбионта, связанного с Diaphorina citri.

Диафорин

С другой стороны, в патентной заявке WO2013016120 описан полный синтез педерина и его аналогов формулы:

,

где по меньшей мере один из R1 или R2 включает линкер, который включает реакционно активную функциональную группу, которая может связываться с мишеневой группой. Это полный синтез основан на многокомпонентной конструкции на основе ациламинала.

Подробные исследования фармакологических свойств педеринов, микаламидов и оннамидов были затруднены нехваткой этих соединений из природных источников. Например, для выделения достаточного количества материала для выяснения структуры педерина требовалось приблизительно 100 кг Paederus fuscipes. Хотя системы PKS педеринов и оннамидов были описаны, получить эти соединения биотехнологическими методами пока не удавалось. Поэтому единственным способом получения этих интересующих соединений на практике на данный момент является полный синтез. Сообщалось о целом ряде случаев синтеза педерина и микаламидов. Они были недавно рассмотрены Witezak и соавторами (Mini Rev. Med. Chem. 2012, 12(14), 1520-1532) и Floreancig и Mosey (Nat. Prod. Rep. 2012, 29, 980).

Эти варианты синтеза привели к путям, которые являются в достаточной степени короткими для получения достаточного количества материала для биологических испытаний, и дают аналоги, которые могли быть эффективными для разработки связей структура-активность для этих соединений. Тем не менее, остается необходимость в более коротком пути получения этих соединений и их новых противоопухолевых аналогов.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В первом аспекте настоящее изобретение относится к соединению общей формулы I или его фармацевтически приемлемой соли, таутомеру или стереоизомеру

I,

где:

R1, R2, и R3, каждый, независимо, выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, –C(=O)Ra, –C(=O)ORb и –(C=O)NRcRd;

R4 выбран из водорода, -C(=O)Ra, -C(=O)ORb и –C(=O)NRcRd;

Ra выбран из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

Rb выбран из замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

Rc и Rd независимо выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

при условии, что R1 и R2 одновременно не представляют собой метил.

Во втором аспекте настоящее изобретение относится к фармацевтическим композициям, содержащим соединение формулы I, или его фармацевтически приемлемую соль, таутомер или стереоизомер вместе с фармацевтически приемлемым носителем или разбавителем.

В третьем аспекте настоящее изобретение относится к соединениям формулы I или их фармацевтически приемлемым солям, таутомерам или стереоизомерам для применения в качестве лекарственного средства, в частности, в качестве лекарственного средства для лечения злокачественного новообразования.

В четвертом аспекте настоящее изобретение относится к фармацевтическим композициям, содержащим соединение формулы I, для применения в качестве лекарственного средства, в частности, в качестве лекарственного средства для лечения злокачественного новообразования.

В пятом аспекте настоящее изобретение относится также к применению соединения формулы I или его фармацевтически приемлемой соли, таутомера или стереоизомера для лечения злокачественного новообразования, или при получении лекарственного средства, предпочтительно, для лечения злокачественного новообразования. Другими аспектами данного изобретения являются способы лечения и соединения для применения в этих способах. Таким образом, в настоящем изобретении, кроме того, предложен способ лечения пациента, а именно - человека, страдающего злокачественным новообразованием, который включает введение указанному страдающему лицу, нуждающемуся в этом, терапевтически эффективного количества соединения, определенного выше.

В шестом аспекте настоящее изобретение относится к способу получения соединение формулы II или его фармацевтически приемлемой соли, таутомера или стереоизомера

,

где

R1, R2, и R3, каждый, независимо, выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, –C(=O)Ra, -C(=O)ORb и -(C=O)NRcRd;

R4 выбран из водорода, -C(=O)Ra, -C(=O)ORb и –C(=O)NRcRd;

Ra выбран из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

Rb выбран из замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

Rc и Rd независимо выбраны из водорода, замещенного или незамещенного C1-C12 алкила, замещенного или незамещенного C2-C12 алкенила, замещенного или незамещенного C2-C12 алкинила, арила и гетероциклила;

где способ включает стадии:

культивирование штамма PHM005 морских бактерий дикого типа или их мутантов в соответствующих условиях для продуцирования соединений 1 и/или 2 формулы:

;

- выделение соединения 1 или 2; и, при необходимости,

- получение производных соединение 1 или 2.

В шестом аспекте настоящее изобретение относится к штамму PHM005. Свободноживущие морские альфа-протеобактерии, производители соединений 1 и 2, были депонированы для патентных целей в коллекции CECT с кодом CECT-9225.

В восьмом аспекте в настоящем изобретении предложена выделенная последовательность нуклеиновой кислоты, содержащая биосинтетический генный кластер Lab или являющаяся комплементарной к последовательности, содержащей Lab биосинтетический генный кластер. Этот генный кластер представляет собой первый пример генов культивируемой бактерии, кодирующих биосинтез педерин-подобных и оннамид-подобных соединений.

В девятом аспекте в настоящем изобретении предложены фрагменты нуклеиновых кислот, выбранные из группы, включающей гены lab706, lab707, lab708, lab709, lab710, lab711, lab712, lab713, lab714, lab715, lab716, lab717, lab718, lab719, lab720, lab721, lab722, lab723, lab724, lab725 и/или lab726, как показано на фигуре 3.

В десятом аспекте изобретение относится к модульной ферментативной системе, кодируемой последовательностью нуклеиновой кислоты, описанной выше. Модульная ферментативная система предпочтительно обладает функциональной активностью в биосинтезе педерин-подобных и оннамид-подобных соединений и/или фрагмента поликетида и/или фрагмента нерибосомного пептида.

В одиннадцатом аспекте настоящее изобретение относится к вектору, содержащему нуклеиновую кислоту, по существу состоящую из биосинтетического генного кластера Lab, полученного из Labrenzia sp. и, в частности, из штамма PHM005, или вектору, содержащему последовательность нуклеиновой кислоты, описанную выше.

В двенадцатом аспекте настоящее изобретение относится к рекомбинантной клетке-хозяину или к трансгенному организму, содержащему указанную нуклеиновую кислоту или содержащему указанный вектор.

В тринадцатом аспекте настоящее изобретение относится к способу получения педерин-подобных или оннамид-подобных соединений с использованием мутанта PHM005 или рекомбинантной клетки-хозяина или трансгенного организма, описанных выше, включающему стадии:

- Культивирование мутанта PHM005 или рекомбинантной клетки-хозяина или трансгенного организма в условиях экспрессии биосинтетического генного кластера Lab; и

- Выделение продуцированных педерин-подобных и/или оннамид-подобных соединений.

Другие аспекты настоящего изобретения относятся к применению нуклеиновой кислоты, определенной выше, при получении модифицированного биосинтетического генного кластера Lab, к применению нуклеиновой кислоты, определенной выше, при получении педерин-подобного или оннамид-подобного соединения и к способам улучшенного продуцирования педерин-подобных и оннамид-подобных соединений бактериями, включающим стадии a) культивирования штамма PHM005 в присутствии o-мутагенного агента в течение периода времени, достаточного для мутагенеза, и b) отбор указанных мутантов путем изменения фенотипа, что приводит к увеличению продуцирования педерин-подобных или оннамид-подобных соединений. Мутагенный агент может представлять собой химический агент, такой как даунорубицин и нитрозогуанидин; физический агент, такой как гамма-излучение или ультрафиолетовое излучение; или биологический агент, такой как, например, транспозон. Примеры модификаций включают в себя нокаут адаптации генов, чтобы избежать метилирования и гидроксилирования.

КРАТКОЕ ОПИСАНИЕ ФИГУР И ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Фигура 1. Электронная микроскопия (негативное окрашивание) Labrenzia sp. PHM005. Клетки в фазе среднего экспоненциального роста адсорбировали в течение 2 минут на сетках с углеродным коллодием с ячейками 400 меш, негативно окрашивали 2% уранилацетатом, регистрировали с помощью электронного просвечивающего микроскопа Jeol JEM 1011, работающего при 100 кВ, и фотографировали с помощью камеры CCD Gatan Erlangshen ES1000W.

Фигура 2. Соседнее дерево, основанное на последовательностях генов 16S рРНК, которое показывает связь между PHM005 и типовыми штаммами близкородственных видов родов Labrenzia и Stappia. Филогенетическое дерево было создано с помощью коэффициента подобия на основе парного выравнивания и UPGMA для кластерного анализа с использованием BioNumerics V7.5 (Applied Maths). Были идентифицированы филогенетические соседи и попарное сходство последовательностей генов 16S рДНК, рассчитанное путем сравнения с базой данных SILVA LTPs123.

Фигура 3. Карта биосинтетического генного кластера Lab. Полный остров генного кластера Lab: 69 Kb.

Фигура 4. 1H ЯМР спектр соединения 1 в CDCl3.

Фигура 5. 13C ЯМР спектр соединения 1 в CDCl3.

Фигура 6. gCOSY спектр соединения 1 в CDCl3.

Фигура 7. TOCSY спектр соединения 1 в CDCl3.

Фигура 8. gHSQC спектр соединения 1 в CDCl3.

Фигура 9. LR-HSQMBC спектр соединения 1 в CDCl3.

Фигура 10. ROESY спектр соединения 1 в CDCl3.

Последовательности, упомянутые в этой заявке, перечислены в прилагаемом списке последовательностей. Эти последовательности кратко изложены следующим образом:

SEQ ID №: 1 последовательность (1355 bp) гена 16S рРНК Labrenzia sp. PHM005

SEQ ID №: 2 последовательность нуклеиновой кислоты биосинтетического генного кластера Lab .

SEQ ID №: 3 последовательность структуры белка Lab706 предполагаемого ацильного белка-носителя.

SEQ ID №: 4 последовательность структуры белка Lab707 предполагаемого HMGS.

SEQ ID №: 5 последовательность структуры белка Lab708 PKS.

SEQ ID №: 6 последовательность структуры белка Lab709 ТрансAT PKS.

SEQ ID №: 7 последовательность структуры белка Lab710 предполагаемого ацильного белка-носителя.

SEQ ID №: 8 последовательность структуры белка Lab711 предполагаемой FAD оксигеназы.

SEQ ID №: 9 последовательность структуры белка Lab712 предполагаемой O-метилтрансферазы.

SEQ ID №: 10 последовательность структуры белка Lab713 предполагаемого цитохрома P450.

SEQ ID №: 11 последовательность структуры белка Lab714 предполагаемой малонил-CoA-ACP трансацилазы или FMT оксидоредуктазы.

SEQ ID №: 12 последовательность структуры белка Lab715 предполагаемой малонил-CoA-ACP трансацилазы или ацилтрансферазы.

SEQ ID №: 13 последовательность структуры белка Lab716 малонил-CoA-ACP трансацилазы.

SEQ ID №: 14 последовательность структуры белка Lab717 Enoyl-CoA гидратазы.

SEQ ID №: 15 последовательность структуры белка Lab718 бета-кетоацил-синтазы.

SEQ ID №: 16 последовательность структуры белка Lab719 ТрансAT PKS/NRPS.

SEQ ID №: 17 последовательность структуры белка Lab720 предполагаемой FAD монооксигеназа.

SEQ ID №: 18 последовательность структуры белка Lab721, части ТрансAT PKS.

SEQ ID №: 19 последовательность структуры белка Lab722, части ТрансAT PKS.

SEQ ID №: 20 последовательность структуры белка Lab723, части PKS.

SEQ ID №: 21 последовательность структуры белка Lab724, части ТрансAT PKS/NRPS.

SEQ ID №: 22 последовательность структуры белка Lab725, части PKS.

SEQ ID №: 23 последовательность структуры белка Lab726 предполагаемой O-метилтрансферазы.

ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к соединениям общей формулы I, определенным выше.

В соединениях, определенных формулами Маркуша в данном описании, группы могут быть выбраны в соответствии со следующими инструкциями:

Алкильные группы могут быть разветвленными или неразветвленными и, предпочтительно, имеют от 1 до примерно 12 атомов углерода. Еще один предпочтительный класс алкильных групп имеет от 1 до примерно 6 атомов углерода. Еще более предпочтительными являются алкильные группы, имеющие 1, 2, 3 или 4 атома углерода. Метил, этил, н-пропил, изопропил и бутил, включая н-бутил, трет-бутил, втор-бутил и изобутил, являются особенно предпочтительными алкильными группами в соединениях по настоящему изобретению. Используемый в настоящем документе термин алкил, если не указано иное, относится как к циклическим, так и к нециклическим группам, хотя циклические группы будут содержать по меньшей мере три углеродных кольцевых члена.

Алкенильные и алкинильные группы в соединениях по настоящему изобретению могут быть разветвленными или неразветвленными, иметь одну или несколько ненасыщенных связей и от 2 до примерно 12 атомов углерода. Еще один предпочтительный класс алкенильных и алкинильных групп имеет от 2 до примерно 6 атомов углерода. Еще более предпочтительными являются алкенильные и алкинильные группы, имеющие 2, 3 или 4 атома углерода. Используемые в настоящем документе термины алкенил и алкинил относятся как к циклическим, так и к нециклическим группам, хотя циклические группы будут содержать по меньшей мере три атома углерода кольца.

Подходящие арильные группы в соединениях по настоящему изобретению включают соединения с одним или несколькими кольцами, включая соединения с несколькими кольцами, которые содержат отдельные и/или конденсированные арильные группы. Типичные арильные группы содержат от 1 до 3 отдельных или конденсированных колец и от 6 до примерно 18 атомов углерода в кольце. Предпочтительно, арильные группы содержат от 6 до около 14 атомов углерода кольца. Особенно предпочтительные арильные группы включают замещенный или незамещенный фенил, замещенный или незамещенный нафтил, замещенный или незамещенный бифенил, замещенный или незамещенный фенантрил и замещенный или незамещенный антрил. Наиболее предпочтительной арильной группой является замещенный или незамещенный фенил.

Подходящие гетероциклические группы включают гетероароматические и гетероалициклические группы, содержащие от 1 до 3 отдельных и/или конденсированных колец и от 5 до примерно 18 атомов кольца. Предпочтительно, гетероароматические и гетероалициклические группы содержат от 5 до около 10 кольцевых атомов, более предпочтительно 5, 6 или 7 кольцевых атомов. Подходящие гетероароматические группы в соединениях по настоящему изобретению содержат один, два или три гетероатома, выбранных из атомов N, O или S, и включают, например, кумаринил, включая 8-кумаринил, хинолил, включая 8-хинолил, изохинолил, пиридил, пиразинил, пиразолил, пиримидинил, фурил, пирролил, тиенил, тиазолил, изотиазолил, триазолил, тетразолил, изоксазолил, оксазолил, имидазолил, индолил, изоиндолил, индазолил, индолизинил, фталазинил, птеридинил, пуринил, оксадиазолил, тиадиазолил, фуразанил, пиридазинил, триазинил, циннолинил, бензимидазолил, бензофуранил, бензофуразанил, бензотиофенил, бензотиазолил, бензоксазолил, хиназолинил, нафтиридинил и фуропиридил. Подходящие гетероалициклические группы в соединениях по настоящему изобретению содержат один, два или три гетероатома, выбранных из атомов N, O или S, и включают, например, пирролидинил, тетрагидрофуранил, тетрагидротиенил, тетрагидротиопиранил, пиперидил, морфолинил, тиоморфолинил, тиоксанинил, пиперазинил, азетидинил, оксетанил, тиетанил, гомопиперидил, оксепанил, тиепанил, оксазепинил, диазепинил, тиазепинил, 1,2,3,6-тетрагидропиридил, 2-пирролинил, 3-пирролинил, индолинил, 2H-пиранил, 4H-пиранил, 4H-пиранил, диоксанил, 1,3-диоксоланил, пиразолинил, дитианил, дитиоланил, дигидропиранил, дигидротиенил, дигидрофуранил, пиразолидинил, имидазолинил, имидазолидинил, 3-азабицикло[3.1.0]гексил, 3-азабицикло[4.1.0]гептил, 3H-индолил и хинолизинил.

Указанные выше группы могут быть замещены в одном или нескольких доступных положениях одной или несколькими подходящими группами, такими как OR’, =O, SR’, SOR’, SO2R’, OSO2R’, NO2, NHR’, NR’R’, =N-R’, N(R’)COR’, N(COR’)2, N(R’)SO2R, N(R’)C(=NR’)N(R’)R’, CN, галоген, COR’ COOR’, OCOR’, OCOOR’, OCONHR’, OCON(R’)R’, CON(R’)R’, CON(R’)OR’, CON(R’)SO2R’, PO(OR’)2, PO(OR’)R’, PO(OR’)(N(R’)R’), защищенный OH, замещенный или незамещенный C1-C12 алкил, замещенный или незамещенный C2-C12 алкенил, замещенный или незамещенный C2-C12 алкинил, замещенный или незамещенный арил и замещенная или незамещенная гетероциклильная группа, где каждая из групп R’ независимо выбрана из группы, включающей водород, OH, NO2, NH2, SH, CN, галоген, COH, CO-алкил, COOH, замещенный или незамещенный C1-C12 алкил, замещенный или незамещенный C2-C12 алкенил, замещенный или незамещенный C2-C12 алкинил, замещенный или незамещенный арил и замещенная или незамещенная гетероциклильная группа. Когда такие группы сами замещены, заместители могут быть выбраны из приведенного выше перечня.

Подходящие галогеновые группы или заместители в соединениях по настоящему изобретению включают F, Cl, Br и I.

Подходящие защитные группы для ОН, включая защитные группы для 1,2-диолов, хорошо известны специалисту в данной области. Общий обзор защитных групп в органической химии представлен Wuts, PGM and Greene TW in Protecting Groups in Organic Synthesis 4th Ed. Wiley-Interscience, и Kocienski PJ в обзоре Protecting Groups, 3rd Ed. Georg Thieme Verlag. Эти ссылки предоставляют разделы по защитным группам для ОН. Все эти ссылки включены в качестве ссылки во всей своей полноте.

В рамках настоящего изобретения защитная группа OH определена как фрагмент, связанный с O, в результате защиты группы ОН посредством образования подходящей защищенной группы OH. Примеры таких защищенных ОН включают простые эфиры, простые силиловые эфиры, сложные эфиры, сульфонаты, сульфенаты и сульфинаты, карбонаты и карбаматы. В случае простых эфиров защитная группа для ОН может быть выбрана из метила, метоксиметила, метиламетила, (фенилдиметилсилил)метоксиметила, бензилоксиметила, п-метоксибензилоксиметила, [(3,4-диметоксибензил)окси]метила, п-нитробензилоксиметила, о-нитробензилоксиметила, [(R)-1-(2-нитрофенил)этокси]метила, (4-метоксифенокси)метила, гваяколметила, [(п-фенилфенил)-окси]метила, трет-бутоксиметила, 4-пентенилоксиметила, силоксиметила, 2-метоксиэтоксиметила, 2-цианоэтоксиметила, бис(2-хлорэтокси)метила, 2,2,2-трихлорэтоксиметила, 2-(триметилсилил)-этоксиметила, метоксиметила, O-бис(2-ацетоксиэтокси)метила, тетрагидропиранила, фтористого тетрагидропиранила, 3-атетрагидропиранила, тетрагидротиопиранила, 1-метоксиа, 4-метокситетрагидропиранила, 4-метокситетрагидротиопиранила, 4-метокситетрагидротиопиранил S,S-диоксида, 1-[(2-хлор-4-метил)фенил]-4-метоксипиперидин-4-ила, 1-(2-фторфенил)-4-метоксипиперидин-4-ила, 1-(4-хлорфенил)-4-метоксипиперидин-4-ила, 1,4-диоксан-2-ила, тетрагидрофуранила, тетрагидротиофуранила, 2,3,3a,4,5,6,7,7a-октагидро-7,8,8-триметил-4,7-метанобензофуран-2-ила, 1-этоксиэтила, 1-(2-хлорэтокси)этила, 2-гидроксиэтила, 2-бромэтила, 1-[2-(триметилсилил)этокси]этила, 1-метил-1-метоксиэтила, 1-метил-1-бензилоксиэтила, 1-метил-1-бензилокси-2-фторэтила, 1-метил-1-феноксиэтила, 2,2,2-трихлорэтила, 1,1-дианизил-2,2,2-трихлорэтила, 1,1,1,3,3,3-гексафтор-2-фенилизопропила, 1-(2-цианоэтокси)этила, 2-триметилсилилэтила, 2-(бензилтио)этила, 2-(фенилселенил)этила, трет-бутила, циклогексила, 1-метил-1’-циклопропилметила, аллила, пренила, циннамила, 2-феналлила, пропаргила, п-хлорфенила, п-метоксифенила, п-нитрофенила, 2,4-динитрофенила, 2,3,5,6-тетрафтор-4-(трифторметил)фенила, бензила, п-метоксибензила, 3,4-диметоксибензила, 2,6-диметоксибензила, о-нитробензила, п-нитробензила, пентадиенилнитробензила, пентадиенилнитропиперонила, галогенбензила, 2,6-дихлорбензила, 2,4-дихлорбензила, 2,6-дифторбензила, п-цианобензила, фтористого бензила, 4-фтористогоалкоксибензила, триметилсилилксилила, п-фенилбензила, 2-фенил-2-пропила, п-ациламинобензила, п-азидобензила, 4-азидо-3-хлорбензила, 2-трифторметилбензила, 4-трифторметилбензила, п-(метилсульфинил)бензила, п-силетанилбензила, 4-ацетоксибензила, 4-(2-триметилсилил)этоксиметоксибензила, 2-нафтилметила, 2-пиколила, 4-пиколила, 3-метил-2-пиколил N-оксида, 2-хинолинилметила, 6-метокси-2-(4-метилфенил-4-хинолинметила, 1-пиренилметила, дифенилметила, 4-метоксидифенилметила, 4-фенилдифенилметила, п,п’-динитробензгидрила, 5-дибензосуберила, трифенилметила, трис(4-трет-бутилфенил)метила, α-нафтилдифенилметила, п-метоксифенилдифенилметила, ди(п-метоксифенил)фенилметила, три(п-метоксифенил)метила, 4-(4’-бромфенацилокси)фенилдифенилметила, 4,4’,4’’-трис(4,5-дихлорфталимидофенил)метила, 4,4’4’’-трис(левулиноилоксифенил)метила, 4,4’,4’’-трис(бензоилоксифенил)метила, 4,4’-диметокси-3’’-[N-(имидазолилметил)]тритила, 4,4’-диметокси-3’’-[N-(имидазолилэтил)карбамоил]тритила, бис(4-метоксифенил)-1’-пиренилметила, 4-(17-тетрабензо[a,c,g,i]флуоренилметил)-4,4’’-диметокситритила, 9-антрила, 9-(9-фенил)ксантенила, 9-фенилтиоксантила, 9-(9-фенил-10-оксо)антрила, 1,3-бензодитиолан-2-ил и 4,5-бис(этоксикарбонил)-[1,3]-диоксолан-2-ила, бензизотиазолил S,S-диоксида. В случае сложных силиловых эфиров защитная группа для OH может быть выбрана из триметилсилила, триэтилсилила, триизопропилсилила, диметилизопропилсилила, диэтилизопропилсилила, диметилгексилсилила, 2-норборнилдиметилсилила, трет-бутилдиметилсилила, трет-бутилдифенилсилила, трибензилсилила, три-п-ксилилсилила, трифенилсилила, дифенилметилсилила, ди-трет-бутилметилсилила, бис-(трет-бутил)-1-пиренилметоксисилила, трис(триметилсилил)силила, (2-гидроксистирил)диметилсилила, (2-гидроксистирил)диизопропилсилила, трет-бутилметоксифенилсилила, трет-бутоксидифенилсилила, 1,1,3,3-тетраизопропил-3-[2-(трифенилметокси)этокси]дисилоксан-1-ила и фтористого силила В случае сложных эфиров защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует сложный эфир, который может быть выбран из формиата, бензоилформиата, ацетата, хлорацетата, дихлорацетата, трихлорацетата, трихлорацетамидата, трифторацетата, метоксиацетата, трифенилметоксиацетата, феноксиацетата, п-хлорфеноксиацетата, фенилацетата, дифенилацетата, 3-фенилпропионата, пропаноил с цепью бисфтористого типа, 4-пентеноата, 4-оксопентаноата, 4,4-(этилендитио)пентаноата, 5-[3-бис(4-метоксифенил)гидроксиметилфенокси]левулината, пивалоата, 1-адамантоата, кротоната, 4-метоксикротоната, бензоата, п-фенилбензоата, 2,4,6-триметилбензоата, 4-бромбензоата, 2,5-дифторбензоата, п-нитробензоата, пиколината, никотината, 2-(азидометил)бензоата, 4-азидобутирата, (2-азидометил)фенилацетата, 2-{[тритилтио)окси]метил}бензоата, 2-{[(4-метокситритилтио)окси]метил}бензоата, 2-{[метил(тритилтио)амино]метил}бензоата, 2-{{[(4-метокситритил)тио]метиламино]-метил}бензоата, 2-(аллилокси)фенилацетата, 2-(пренилоксиметил)бензоата, 6-(левулинилоксиметил)-3-метокси-2-нитробензоата, 6-(левулинилоксиметил)-3-метокси-4-нитробензоата, 4-бензилоксибутирата, 4-триалкилсилилоксибутирата, 4-ацетокси-2,2-диметилбутирата, 2,2-диметил-4-пентеноата, 2-йодбензоата, 4-нитро-4-метилпентаноата, о-(дибромметил)бензоата, 2-формилбензолсульфоната, 4-(метилтиометокси)бутирата, 2-(метилтиометоксиметил)бензоата, 2-(хлорацетоксиметил)бензоата, 2-[(2-хлорацетокси)этил]бензоата, 2-[2-бензилокси)этил]бензоата, 2-[2-(4-метоксибензилокси)этил]бензоата, 2,6-дихлор-4-метилфеноксиацетата, 2,6-дихлор-4-(1,1,3,3-тетраметилбутил)феноксиацетата, 2,4-бис(1,1-диметилпропил)феноксиацетата, хлордифенилацетата, изобутирата, моносукциноата, (E)-2-метил-2-бутеноата, о-(метоксикарбонил)бензоата, α-нафтоата, нитрата, алкил N,N,N’,N’-тетраметилфосфородиамидата и 2-хлорбензоата. В случае сульфонатов, сульфенатов и сульфинатов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует сульфонат, сульфенат или сульфинат, который может быть выбран из сульфата, аллилсульфоната, метансульфоната, бензилсульфоната, тозилата, 2-[(4-нитрофенил)этил]сульфоната, 2-трифторметилбензолсульфоната, 4-монометокситритилсульфената, алкил 2,4-динитрофенилсульфената, 2,2,5,5-тетраметилпирролидин-3-он-1-сульфината и диметилфосфинотиолила. В случае карбонатов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует карбоната, который может быть выбран из метил карбоната, метоксиметил карбоната, 9-флуоренилметил карбоната, этил карбоната, бромэтил карбоната, 2-(метилтиометокси)этил карбоната, 2,2,2-трихлорэтил карбоната, 1,1-диметил-2,2,2-трихлорэтил карбоната, 2-(триметилсилил)этил карбоната, 2-[диметил(2-нафтилметил)силил]этил карбоната, 2-(фенилсульфонил)этил карбоната, 2-(трифенилфосфонио)этил карбоната, цис-[4-[[(метокситритил)сульфенил]окси]-тетрагидрофуран-3-ил]окси карбоната, изобутил карбоната, трет-бутил карбоната, винил карбоната, аллил карбоната, циннамил карбоната, пропаргил карбоната, п-хлорфенил карбоната, п-нитрофенил карбоната, 4-этокси-1-нафтил карбоната, 6-бром-7-гидроксикумарин-4-илметил карбоната, бензил карбоната, о-нитробензил карбоната, п-нитробензил карбоната, п-метоксибензил карбоната, 3,4-диметоксибензил карбоната, антрахинон-2-илметил карбоната, 2-данзилэтил карбоната, 2-(4-нитрофенил)этил карбоната, 2-(2,4-динитрофенил)этил карбоната, 2-(2-нитрофенил)пропил карбоната, алкил 2-(3,4-метилендиокси-6-нитрофенил)пропил карбоната, 2-циано-1-фенилэтил карбоната, 2-(2-пиридиламино-1-фенилэтил карбоната, 2-[N-метил-N-(2-пиридил)]амино-1-фенилэтил карбоната, фенацил карбоната, 3’,5’-диметоксибензоил карбоната, метил дитиокарбоната и S-бензил тиокарбоната. И в случае карбаматов защитная группа для OH вместе с атомом кислорода незащищенного OH, к которому она присоединена, образует карбамат, который может быть выбран из диметилтиокарбамата, N-фенилкарбамата и N-метил-N-(o-нитрофенил)карбамата.

В пределах объема настоящего изобретения защитная группа 1,2-диола определяется как присоединенный к O фрагмент, образующийся в результате одновременной защиты 1,2-диола посредством образования защищенного 1,2-диола. Примеры таких защищенных 1,2-диолов включают циклические ацетали и кетали, циклические сложные ортоэфиры, силильные производные, диалкилсилиленовые производные, циклические карбонаты, циклические боронаты. Примеры циклических ацеталей и кеталей включают метилен ацеталь, этилиден ацеталь, трет-бутилметилиден ацеталь, 1-трет-бутилэтилиден кеталь, 1-фенилэтилиден кеталь, 2-(метоксикарбонил)этилиден (Mocdene) ацеталь, или 2-(трет-бутилкарбонил)этилиден (Bocdene) ацеталь, фенилсульфонилэтилиден ацеталь, 2,2,2-трихлорэтилиден ацеталь, 3-(бензилокси)пропил ацеталь, акролеин ацеталь, ацетонид (изопропилиден кеталь), циклопентилиден кеталь, циклогексилиден кеталь, циклогептилиден кеталь, бензилиден ацеталь, п-метоксибензилиден ацеталь, 1-(4-метоксифенил)этилиден кеталь, 2,4-диметоксибензилиден ацеталь, 3,4-диметоксибензилиден ацеталь, п-ацетоксибензилиден ацеталь, 4-(трет-бутилдиметилсилилокси)бензилиден ацеталь, 2-нитробензилиден ацеталь, 4-нитробензилиден ацеталь, мезитилен ацеталь, 6-бром-7-гидроксикумарин-2-илметилиден ацеталь, 1-нaфтальдегид ацеталь, 2-нaфтальдегид ацеталь, 9-антрацен ацеталь, бензофенон кеталь, ди-(п-анизил)метилиден ацеталь, ксантен-9-илиден кеталь, 2,7-диметилксантен-9-илиден кеталь, дифенилметилен кеталь, камфор кеталь и ментон кеталь. Примеры циклических сложных ортоэфиров включают метоксиметилен ацеталь, этоксиметилен ацеталь, 2-оксациклопентилиден сложный ортоэфир, диметоксиметилен сложный ортоэфир, 1-метоксиэтилиден сложный ортоэфир, 1-этоксиэтилиден сложный ортоэфир, фталид сложный ортоэфир, 1,2-диметоксиэтилиден сложный ортоэфир, α-метоксибензилиден сложный ортоэфир, 1-(N,N-диметиламино)этилиден производное, α-(N,N-диметиламино)бензилиден производное, бутан 2-3-бисацеталь (BBA), циклогексан-1,2-диацеталь (CDA) и диспирокетали. Примеры силил производных включают ди-трет-бутилсилиленовую группу (DTBS(OR)2), 1-(циклогексил)-1-(метил)силилен (Cy)(Me)Si(OR)2, ди-изопропилсилилен (изо-пропил)2Si(OR)2, дициклогексиласилилен (Cy)2Si(OR)2, 1,3-(1,1,3,3-тетраизопропилдисилоксанилиден) производное (TIPDS(OR)2), 1,1,3,3-тетра-трет-бутоксидисилоксанилиден производное (TBDS(OR)2), метилен-бис-(диизопропилсиланосанилиден) (MDPS(OR)2) и 1,1,4,4-тетрафенил-1,4-дисиланилиден (SIBA(OR)2). Примеры циклических боронатов включают метил боронат, этил боронат, фенил боронат и о-ацетамидофенил боронат.

Упоминание этих групп не следует интерпретировать как ограничение объема изобретения, поскольку они были упомянуты как простая иллюстрация защитных групп для ОН, но специалисту в данной области техники могут быть известны дополнительные группы, имеющие указанную функцию, и их следует понимать как охватываемые настоящим изобретением.

Термин «фармацевтически приемлемая соль» относится к любой фармацевтически приемлемой соли, которая при введении пациенту способна предоставить (прямо или косвенно) соединение, описанное в настоящем документе. Однако следует понимать, что не фармацевтически приемлемые соли также входят в объем изобретения, поскольку они могут быть использованы при получении фармацевтически приемлемых солей. Получение солей может быть осуществлено способами, известными в данной области.

Например, фармацевтически приемлемые соли соединений, представленные в настоящем документе, синтезируют обычными химическими способами из исходного соединения, которое содержит основной или кислотный фрагмент. Обычно такие соли получают, например, путем взаимодействия кислотных или основных форм этих соединений со стехиометрическим количеством подходящего основания или кислоты в воде или в органическом растворителе или в смеси обоих. Как правило, предпочтительными являются неводные среды, такие как эфир, этилацетат, этанол, 2-пропанол или ацетонитрил. Примеры солей присоединения кислот включают соли присоединения минеральных кислот, такие как, например, гидрохлорид, гидробромид, гидройодид, сульфат, нитрат, фосфат, и соли присоединения органических кислот, такие как, например, ацетат, трифторацетат, малеат, фумарат, цитрат, оксалат, сукцинат, тартрат, малат, манделат, метансульфонат и п-толуолсульфонат. Примеры солей присоединения оснований включают соли с неорганическими основаниями, такие как, например, соли натрия, калия, кальция и аммония, и соли с органическими основаниями, такие как, например, соли с этилендиамином, этаноламином, N,N-диалкиленэтаноламином, триэтаноламином и основными аминокислотами.

Соединения по изобретению могут быть в кристаллической или аморфной форме либо в виде свободных соединений, либо в виде сольватов (например, гидратов, алкоголятов, в частности, метанолатов), и предполагается, что любая из этих форм входит в объем настоящего изобретения. Способы сольватации обычно известны в данной области техники. Соединения по изобретению могут быть представлены в виде различных полиморфных форм, и предполагается, что изобретение охватывает все такие формы.

Предполагается, что любое соединение, упомянутое в настоящем документе, представляет такое конкретное соединение, а также определенные варианты или формы. В частности, упомянутые в настоящем документе соединения могут иметь асимметрические центры и поэтому существуют в различных энантиомерных или диастереомерных формах. Таким образом, любое данное соединение, упомянутое в данном документе, предназначено для представления любых рацематов, одной или нескольких энантиомерных форм, одной или нескольких диастереомерных форм и их смесей. Также возможна стереоизомерия или геометрическая изомерия относительно двойной связи, поэтому в некоторых случаях молекула может существовать в виде (E)-изомера или (Z)-изомера (транс- и цис-изомеры). Если молекула содержит несколько двойных связей, каждая двойная связь будет иметь свою собственную стереоизомерию, которая может быть такой же или отличаться от стереоизомерии других двойных связей молекулы. Кроме того, упомянутые в настоящем документе соединения могут существовать в виде атропоизомеров. Все стереоизомеры, включая энантиомеры, диастереоизомеры, геометрические изомеры и атропоизомеры соединений, упомянутые в настоящем документе, а также их смеси рассматриваются в рамках объема настоящего изобретения.

Кроме того, любое упомянутое в настоящем документе соединение может существовать в виде таутомеров. В частности, термин таутомеры относится к одному из двух или более структурных изомеров соединения, которые существуют в равновесии и легко преобразуются из одной изомерной формы в другую. Обычными таутомерными парами являются амин-имин, амид-имидная кислота, кето-енол, лактам-лактим и т.д.

Если не указано иное, соединения по изобретению также должны включать изотопно-меченые формы, то есть соединения, которые отличаются только наличием одного или нескольких изотопно-обогащенных атомов. Например, соединения, имеющие настоящие структуры, за исключением замены, по меньшей мере, одного атома водорода дейтерием или тритием, или замены, по меньшей мере, одного атома углерода на 13C- или 14C-обогащенный углерод, или замены, по меньшей мере, одного атом азота на 15N-обогащенный азот входят в объем данного изобретения.

Чтобы сократить описание, некоторые количественные выражения, приведенные в данном документе, не квалифицированы термином «примерно». Понятно, что независимо от того, используется ли термин «примерно» явно или нет, каждая величина, приведенная в настоящем документе, предназначена для обозначения фактического заданного значения, а также для ссылки на приближение к такому заданному значению, которое могло бы быть разумно выведено специалистом в данной области на основе обычных навыков, включая эквиваленты и приближения ввиду экспериментальных и/или измерительных условий для такого заданного значения.

Более конкретно, предпочтительными соединениями формулы I являются такие, которые также имеют общую формулу III или их фармацевтически приемлемые соли, таутомеры и стереоизомеры

III,

где R1, R2, R3 и R4 определены выше в общей формуле I.

В соединениях общей формулы I и III особенно предпочтительный R1 выбран из водорода и замещенного или незамещенного C1-C12 алкила. Более предпочтительно, R1 выбран из водорода и замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, R1 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R1 представляет собой водород и метил.

В соединениях общей формулы I и III особенно предпочтительный R2 выбран из водорода и –C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительный Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R2 представляет собой водород и ацетил.

В соединениях общей формулы I и III особенно предпочтительные R3 и R4 независимо выбраны из водорода и -C(=O)Ra, где Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C12 алкила. Более предпочтительно, Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, Ra в каждом случае независимо выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительно, R3 и R4 независимо выбраны из водорода и ацетила.

В дополнительных предпочтительных вариантах осуществления изобретения описанные выше предпочтения для различных заместителей объединены. Настоящее изобретение относится также к таким комбинациям предпочтительных замещений в общих формулах I и III, указанных выше.

В одном варианте осуществления изобретения R1 выбран из замещенного или незамещенного C1-C6 алкила и R2 представляет собой водород.

В другом варианте осуществления изобретения R1 выбран из замещенного или незамещенного C1-C6 алкила и R2 представляет собой –C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил.

В следующем варианте осуществления изобретения оба R1 и R2 представляют собой водород.

В настоящем описании и определениях, когда имеется несколько групп Ra, Rb, Rc, Rd или R’, присутствующих в соединениях по изобретению, и если это не указано явно, следует понимать, что каждая из них может независимо отличаться в рамках данного определения, то есть не обязательно представляют одну и ту же группу одновременно в данном соединении по изобретению.

Особенно предпочтительными соединениями по данному изобретению являются следующие:

,,

или их фармацевтически приемлемые соли, таутомеры или стереоизомеры.

Наиболее предпочтительными соединениями по данному изобретению являются следующие:

, ,

или их фармацевтически приемлемые соли, таутомеры или стереоизомеры.

Соединения 1 и 2 были выделены из Labrenzia sp., названным штаммом PHM005. Эта альфа-протеобактерия была выделена из образца морского осадка, собранного в Индийском океане. Оценка клеток методом просвечивающей электронной микроскопии (фигура 1) позволила идентифицировать подвижные палочки (шириной 0,6-0,8 мкм и длиной 1,6-2,1 мкм) с однополярными вставленными жгутиками. Культура этого штамма была депонирована в CECT (« de Cultivos Tipo») при университете в Валенсии, Испания, под регистрационным номером CECT-9225. Депозит был внесен в соответствии с положениями Будапештского договора.

Бактерии явно зависят от морской соли, поскольку для их роста требуется более 2,5% NaCl, а оптимальная концентрация морской соли для производства 1 составляет 36 г/л, аналогично условиям океана. Колонии на морском агаре 2216 (DIFCO) бежевые, почти прозрачные, гладкие и с целым краем. Через три недели колонии становятся темно-коричневыми, возможно, из-за эффекта бактериохлорофилла а и продукции каротиноидов, как описано для Labrenzia alexandrii DFL-11T (Biebl и коллеги, Evol, Microbiol, 2007, 57, 1095-1107).

Для выделения микроорганизма-продуцента все манипуляции проводили в асептических условиях. PHM005 выделяли из замороженного образца осадка, нанесенного непосредственно на чашки Петри с морской солевой средой следующего состава (г/л): морские соли (Tropic Marin® PRO-REEF, 27; агар, 16; с добавлением циклогексамида 0,2 мг/мл. Плашки инкубировали при температуре 28°C в течение трех недель при атмосферном давлении. После этого периода колонию слегка коричневого цвета пикетировали и переносили в ту же морскую соляную среду для подтверждения чистоты и начала таксономических и ферментационных исследований.

Таксономическую оценку PHM005 проводили по частичной последовательности 16S рРНК в соответствии со стандартными процедурами. PHM005 выращивали в морском бульоне (DIFCO 1196) в течение 72 часов. Клетки выделяли и лизировали путем кипячения с 4% NP40 в течение 10 минут. Остатки клеток отбрасывали центрифугированием. 16S рРНК амплифицировали полимеразной цепной реакцией с использованием бактериальных праймеров F1 и R5, описанных Cook и Myers (International Journal of Systematics and Evolutionary Microbiology, 2003, 53, 1907-1915). Полученная почти полноразмерная последовательность гена 16S рРНК показана в SEQ №: 1.

Филогенетическое дерево было сформировано методом парного выравнивания на основе коэффициента подобия и UPGMA для кластерного анализа с использованием BioNumerics V7.5. Филогенетические соседи были идентифицированы, и попарно рассчитано сходство последовательности генов 16S рРНК по сравнению с базой данных SILVA LTPs123. Филогенетическое дерево показано на фигуре.2.

PHM005 продуцирует соединения 1 и 2 при культивировании в контролируемых условиях в подходящей среде. Этот штамм явно нуждается в морской соли для роста. Этот штамм предпочтительно выращивали в обычной водной питательной среде. Культуру необходимо поддерживать в аэробных условиях и получение соединений 1 и 2 должно начинаться через 3 дня роста при контроле температуры в интервале 26-28°C. Было установлено, что обычные ферментационные резервуары хорошо подходят для проведения культивирования этого организма. Добавление питательных веществ и контроль рН, а также добавление пеногасителей на различных стадиях ферментации может потребоваться для увеличения производства и предотвращения вспенивания.

Соединения по настоящему изобретению могут быть получены, начиная с колонии или замороженной чистой культуры штамма PHM005 для получения достаточного количества биомассы. Эта стадия может повторяться несколько раз по мере необходимости, и собранный материал используется в качестве инокулята для посева в одной или нескольких ферментационных колбах или емкостях с соответствующей питательной средой. Эти колбы или емкости можно использовать для создания инокулята или для стадии продуцирования, в зависимости от необходимого объема бульона. Иногда среда для продукции может отличаться от тех, которые используются для инокуляции.

Соединения по настоящему изобретению могут быть выделены из ферментационного бульона преимущественно из клеток и из супернатанта штамма PHM005 путем экстракции подходящей смесью растворителей или абсорбции в адекватных смолах.

Отделение и очистка соединения по настоящему изобретению от неочищенного активного экстракта могут быть выполнены с использованием соответствующей комбинации обычных хроматографических методов.

Кроме того, соединения по изобретению могут быть получены путем модификации соединений, уже полученных из природного источника, или путем дальнейшей модификации соединений, уже модифицированных с помощью различных химических реакций. Таким образом, гидроксильные группы могут быть ацилированы стандартными методами связывания или ацилирования, например, с использованием ацетилхлорида или уксусного ангидрида в пиридине или тому подобное. Формиатные группы могут быть получены взаимодействием соответствующего алкоксида с ангидридом муравьиной и уксусной кислот. Карбаматы могут быть получены нагреванием гидроксильных предшественников с изоцианатами. Карбонаты могут быть получены с использованием соответствующего ангидрида и активатора, такого как Mg(ClO4)2 или Zn(OAc)2, гидроксильные группы также могут быть преобразованы в алкоксигруппы путем алкилирования с использованием йодида или сульфоната алкилбромида или в амино низшие алкоксигруппы с использованием, например, защищенного 2-бромэтиламина. При необходимости, соответствующие защитные группы могут быть использованы на заместителях для сохранности реакционноактивных групп и для всего избирательного преобразования функциональных гидроксильных групп. Способы и реагенты, необходимые для получения этих производных, известны квалифицированному специалисту и могут быть найдены в общих учебниках, таких как March's Advanced Organic Chemistry 7th Edition 2013, Wiley Interscience.

Важной особенностью вышеописанных соединений формулы I и III является их биоактивность и, в частности, их цитотоксическая активность в отношении опухолевых клеток. Таким образом, в настоящем изобретении предложены фармацевтические композиции соединений общей формулы I и III или их фармацевтически приемлемых солей, таутомеров или стереоизомеров, обладающих цитотоксической активностью, и их применение в качестве противоопухолевых агентов. Настоящее изобретение относится также к фармацевтическим композициям, содержащим соединение общей формулы I и III или его фармацевтически приемлемые соли, таутомеры или стереоизомеры с фармацевтически приемлемым носителем или разбавителем.

Примеры фармацевтических композиций включают твердую (таблетки, пилюли, капсулы, гранулы, порошок для флаконов и тому подобное) или жидкую (растворы, суспензии или эмульсии) композицию для перорального, местного или парентерального введения.

Введение соединений или композиций по настоящему изобретению может осуществляться любым подходящим способом, таким как внутривенная инфузия, пероральными препаратами, а также внутрибрюшинное и внутривенное введение. Предпочтительно, время инфузии составляет до 24 часов, более предпочтительно, 1-12 часов, наиболее предпочтительно, 1-6 часов. Особенно желательны короткая продолжительность инфузии, что позволяет проводить лечение без пребывания в стационаре в ночное время. Однако инфузия может длиться от 12 до 24 часов или даже дольше, если это необходимо. Инфузию можно проводить с подходящими интервалами, скажем, от 1 до 4 недель. Фармацевтические композиции, содержащие соединения по изобретению, могут быть доставлены путем инкапсуляции липосомы или наносферы, в препаратах с замедленным высвобождением или другими стандартными средствами доставки.

Корректная доза соединений будет изменяться в зависимости от конкретного состава, способа применения, а также конкретного состояния, хозяина и обрабатываемой опухоли. Другие факторы, такие как возраст, масса тела, пол, диета, время введения, скорость экскреции, состояние хозяина, комбинации лекарственных средств, чувствительность реакции и тяжесть заболевания должны быть приняты во внимание. Введение может осуществляться непрерывно или периодически в пределах максимально переносимой дозы.

Используемые в настоящем документе термины «лечение» и «лечить» включают эрадикацию, удаление, модификацию или контроль опухоли или первичных, регионарных или метастатических злокачественных клеток или тканей и минимизацию задержки распространения злокачественного новообразования.

Соединения по изобретению обладают противоопухолевой активностью в отношении некоторых типов рака, которые включают, но не ограничиваются ими, рак легких, рак толстой кишки, рак молочной железы и рак поджелудочной железы.

Таким образом, в альтернативных вариантах осуществления настоящего изобретения фармацевтическая композиция, содержащая соединение формулы I и III, определенных выше, предназначена для лечения рака легких, рака толстой кишки, рака молочной железы или рака поджелудочной железы.

В шестом аспекте настоящее изобретение относится к способу получения соединений формулы II. Предпочтительными способами согласно этому аспекту изобретения являются те, которые дают соединение, имеющее также формулу IV

IV

или его фармацевтически приемлемую соль, таутомер или стереоизомер;

где R1, R2, R3 и R4 определены выше в общей формуле II.

В способах синтеза соединений формулы II и IV особенно предпочтительный R1 выбран из водорода, замещенного или незамещенного C1-C12 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительно, R1 выбран из водорода, замещенного или незамещенного C1-C6 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно, R1 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила, изобутила и -C(=O)Ra где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительный R1 выбран из водорода и метила.

В способах синтеза соединений формулы II и IV особенно предпочтительный R2 выбран из водорода, замещенного или незамещенного C1-C12 алкила и -C(=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C12 алкил. Более предпочтительно, R2 выбран из водорода, замещенного или незамещенного C1-C6 алкила и -(C=O)Ra, где Ra представляет собой замещенный или незамещенный C1-C6 алкил. Еще более предпочтительно, R2 выбран из водорода, метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила, изобутила и -C(=O)Ra, где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутил и изобутила. Наиболее предпочтительный R2 представляет собой водород, метил и ацетил.

В способах синтеза соединений формулы II и IV особенно предпочтительные R3 и R4 независимо выбраны из водорода и -C(=O)Ra, где Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C12 алкила. Более предпочтительно, Ra в каждом случае независимо выбран из замещенного или незамещенного C1-C6 алкила. Еще более предпочтительно, Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила. Наиболее предпочтительные R3 и R4 независимо выбраны из водорода и ацетил.

В способах синтеза соединений формулы II и IV особенно предпочтительные соединения 1 и 2 имеют, соответственно, следующую относительную стереохимию:

, .

В дополнительных предпочтительных вариантах осуществления изобретения описанные выше предпочтения для различных заместителей объединены. Настоящее изобретение относится также к таким комбинациям предпочтительных замещений в способах синтеза соединений формул II и IV, указанных выше.

В более предпочтительном варианте осуществления изобретения этого аспекта данного изобретения соединение формулы II или IV представляет собой педерин.

В еще более предпочтительном варианте осуществления изобретения педерин получают из соединения 1’ следующим образом:

- защищая все гидрокси группы в соединении 1’ защитной группой для -OH, которую можно избирательно удалить у защищенной первичной группы OH в присутствии защищенной вторичной группы OH. Примеры такой защитной группы включают триметилсилил, триэтилсилил, триизопропилсилил и трет-бутилдиметилсилил. Наиболее предпочтительной защитной группой на этой стадии является трет-бутилдиметилсилил;

- избирательно удаляя защитную группу у первичной группы OH;

- метилируя полученную первичную гидрокси группу подходящим метилирующим агентом; и

- удаляя другие защитные группы для OH.

В другом более предпочтительном варианте осуществления изобретения педерин получают из соединения 2’ следующим образом:

- защищая 1,2-диоловую группа подходящей защитной группой для 1,2-диолов. Примеры подходящих защитных групп для 1,2-диолов включают, но этим не ограничиваются, такие группы, которые после реакции с соответствующим 1,2-диолом образуют Mocdene ацеталь, Bocdene ацеталь, акролеин ацеталь, бензилиден ацеталь, (трет-бутилдиметилсилилокси)бензилиден ацеталь, мезитилен ацеталь, метоксиметилен ацеталь, этоксиметилен ацеталь, циклические карбонаты, метилборонат и этил боронат. Более предпочтительными защитными группами на этой стадии являются такие, которые образуют Mocdene ацеталь, Bocdene ацеталь, бензилиден ацеталь и циклические карбонаты, которые являются наиболее предпочтительной защитной группой, образующей бензилиден ацеталь;

- защищая другие гидрокси группы защитной группой для -OH, которые являются ортогональными с 1,2-диоловой защитной группой с предыдущей стадии. Примерами защитных групп для OH, подходящими на этой стадии, являются триметилсилил, триэтилсилил, триизопропилсилил трет-бутилдиметилсилил и ацетил. Наиболее предпочтительный защитной группой на этой стадии является трет-бутилдиметилсилил и ацетил;

- удаляя 1,2-диоловую защитную группу;

- метилируя полученный 1,2-диол подходящим метилирующим агентом; и

- удаляя другие защитные группы для OH.

Примеры подходящих метилирующих агентов включают метил йодид, метил бромид, диметилсульфат и метил трифлат.

Выделенная нуклеиновая кислота в соответствии с восьмым аспектом изобретения является, предпочтительно, полученной из Labrenzia sp., и, в частности, из штамма PHM005.

Полноразмерная последовательность генома этой бактерии выявила биосинтетический генный кластер, отвечающий за синтез педерина и оннамида. Биоинформационный анализ использовался для прогнозирования функции генов в кластере.

Этот генный кластер, названный генным кластером Lab, представляет собой транс-AT гибридный генный кластер поликетидсинтаза/нерибосомная синтетаза (PKS/NRPS) размером 69 т.п.н. Он был установлен на основании геномного майнинга из всей последовательности генома штамма PHM005, состоящего из 20 ORF, гомологичных описанному для педерина генному кластеру. Он содержит гены, кодирующие ферменты для биосинтеза педерин-подобных и оннамид-подобных соединений.

В предпочтительном варианте осуществления выделенная нуклеиновая кислота, предпочтительно, содержит фрагменты нуклеиновой кислоты, образующие отдельные единицы и/или модули биосинтетического генного кластера Lab, как это показано более подробно на фигуре 3. Как показано на фигуре 3, генный кластер Lab содержит блоки lab706-lab726.

В особо предпочтительном варианте осуществления выделенная нуклеиновая кислота согласно восьмому аспекту настоящего изобретения содержит:

нуклеотидную последовательность с SEQ ID №: 2; или

нуклеотидную последовательность, которая комплементарна SEQ ID №: 2; или

нуклеотидную последовательность, которая гибридизуется в жестких условиях с SEQ ID №: 2; или комплементарной ей; или

нуклеотидную последовательность, которая по меньшей мере на 80% идентична SEQ ID №: 2; или комплементарной ей.

Особенно предпочтительными фрагментами нуклеиновых кислот согласно девятому аспекту настоящего изобретения являются фрагменты нуклеиновых кислот, по существу содержащие по меньшей мере один из генов lab708, lab709, lab710, lab721, lab722, lab723, lab724 и lab725. Кроме того предпочтительными являются фрагменты нуклеиновых кислот, содержащие одну или более нуклеотидных последовательностей кодирующих белковые последовательности с SEQ ID №: 3-23. Также предпочтительными частями являются соответствующие части нуклеотидной последовательности SEQ ID №: 2.

В другом предпочтительном варианте осуществления особенно предпочтительными фрагментами являются те, которые по существу состоят из lab719 и/или lab720. Также предпочтительным является фрагмент нуклеиновой кислоты, содержащий нуклеотидную последовательность, кодирующую последовательность белка с SEQ ID №: 16 и/или SEQ ID №: 17. Также предпочтительными частями являются соответствующие части нуклеотидной последовательности SEQ ID №: 2.

Аннотация всего генома PHM005 выявляет круговую хромосому длиной 6167 bp, 5651 кодирующую последовательность (CDS), 53 тРНК и 10 рРНК. 55% G+С.

Изучение всего генома в уникальном контиге с использованием программного обеспечения для прогнозирования/идентификации вторичных метаболитов как antiSMASH V 3.0 (Weber и сотрудники, Nucleic Acid Research, 2015 doi: 10.1093/nar/gkv437) обнаружило 102 т.п.н высокомолекулярный гибридный генный кластер PKS/NRPS. Среди 317 проанализированных ORF 20 генов (69 КБ) показали гомологию c последовательностями педерина (ped) и оннамида (onn) на основе BLASTp против симбионтной бактерии Paedeus fascipens (GenBank AH013687.2) и симбионтной бактерии Theonella swinhoei (GenBank AY688304.1), как показано более подробно в таблице 1.

Таблица 1. Гомологи генов lab в отношении генов ped (педерин) и onn (оннамид).

Ген lab Защит. размер (aas) Предполагаемая функция в Labrenzia sp. PHM005 Симбионтная бактерия Paedeus fuscipens
(AH013687.2)
Симбионтная бактерия Theonella swinhoei
(AY688304.1)
Ген % H/Q* Ген % H/Q
706 80 Поликетидный биосинтез ацильного белка-носителя (ACP) pedN 47/87 - Нет гомологии
707 425 Поликетидный биосинтез 3-гидрокси-3 метилглутарил AACP синтазы (HMGS) pedP 61/99 onnA 60/99
708 1165 Поликетидная синтаза (GNAT-ACP-KS-DHt) pedI 42/93 onnB 39/98
709 3219 ТрансAT PKS (KR-cMT-ACP-KS-ТрансAT-ECH-ACPb-ACPb-KS-KR) pedI 49/94 onnB
onnI
41/73
45/73
710 97 Фосфопантетеин связанный сайт (ACP) pedI 46/90 onnI 34/73
711 373 Монооксигеназа (OX) pedJ 60/98 onnC 58/98
712 318 Метилтрансфераза (oMT) pedA 47/97 onnG
onnD
51/99
46/97
713 414 Цитохром Р450 Нет гомологии Нет гомологии
714 447 Малонил-СоА-ACP трансацилаза (или оксидоректаза) pedB 56/98 Нет гомологии
715 337 Малонил-CoA-ACP трансацилаза pedC 38/94 Нет гомологии
716 375 Малонил-CoA-ACP трансацилаза pedD 51/95 Нет гомологии
717 253 Эноилтрансфераза pedL 43/91 Нет гомологии
718 411 Бета-кетокацил-синтаза pedM 30/81 Нет гомологии
719 2254 Смешанный трансАТ PKS/NRPS (ACP-KS-трансAT-DH-KR-ACP-KS-DH-DH-ACP-KS-трансAT-KR-ACP-KS-трансAT-C-A-PCP-TE) pedH 42/99 onnI 35/84
720 437 Оксидоредуктаза (Ox) pedG 73/94 Нет гомологии
721 1986 ТрансAT-PKS (PS-KR-ACP-KS-ТрансAT-KR-KS-ТрансAT) pedF 40/99 onnI 30/82
722 1949 ТрансAT поликетидсинтаза (ТрансAT-KR-cMT-ACPb-KS-ТрансАТ-DH) pedF 44/97 onnI
onnB
36/86
34/85
723 875 Поликетидная синтаза (KR-ACP-KS) pedF 49/93 onnB
onnI
52/96
45/95
724 1986 Смешанный PKS/NRPS (DHt-ACP-C-A(gly)-PCP-KS-ТрансAT) pedF 42/99 onnI 38/96
725 377 Поликетидсинтаза (КS) pedF 48/99 onnI
onnB
46/92
41/88
726 278 Метилтрансфераза (МТ) pedE 51/98 onnH 43/99

(*) H: Гомология в %. Q: Запрос покрыт в %.

Предполагаемый генный кластер Lab содержит фрагменты нуклеиновых кислот размером 69 т.п.н., образующих отдельные единицы и/или модули, аналогичные описанным для биосинтетических генных кластеров педерина, как показано более подробно на фигуре 3.

ТрансАТ-гибридный генный кластер PKS/NRPS Lab в основном состоит из одного PKS (состоящий из ORF lab708, lab709 и lab710) и двух смешанных систем PKS/NRPS (lab721, lab722, lab723, lab724, lab725 и lab719), фланкированных оксигеназами, оксидоредуктазами и метилазами в закрытой аналогичной архитектуре, описанной J. Piel для генов ped. Предсказанные функции и состав аминокислот каждого ORF подробно описаны в таблице 1.

ТрансAT-PKS lab708, lab709, lab710 (4481 аминокислот) состоит из модулей GNAT-ACP-KS-DHt-KR-cMT-ACP-KS-трансAT-ECH-ACP-ACP-KS-KR-ACP), сходных с описанными для pedI с гомологией 42-49%. Этот биосинтетический генный кластер может быть ответственным за биосинтез шестичленного кольца, несущего экзометиленовую группу структуры педерина. Где домены представляют собой GNAT: Gcn5-связанная-N-ацетилтрасфераза; ACP: белок-носитель ацила; KS: кетосинтаза; DHt дегидратаза; КR: кеторедуктаза; cMT: метилтрансфераза; ECH еноил-Коа-гидратаза о кротоназа; ТрансАТ: транс-ацилтрасфераза).

Гибридный транс-AT PKS/NRPS, образованный lab721, lab722, lab723, lab724, lab725 (5,385 а.к.), состоит из 6 кетосинтаз и 1 NRPS с явным аденилированием глицина. (PS-KR-ACP-KS-ТрансАТ-KR-KS-ТрансАТ-трансАТ-KR-CMT-ACP-KS-ТрансАТ-DH-KR-ACP-KS-DHt-ACP-CA (gly)-PCP-KS-ТрансАТ-KS). С 40-49% гомологией с pedF, но по сути те же функции и архитектурой модулей. Где домены C: нерибосомная пептидная конденсация; A: нерибосомный пептид аденилирования; PCP: белок-тиолат и пептид-носитель.

В соответствии с предпочтительным вариантом осуществления девятого аспекта, авторы идентифицировали систему lab719 PKS/NRPS, связанную с биосинтезом любого оннамид-подобного соединения из генного кластера Lab. Это предполагаемое новое соединение не было идентифицировано в ферментационном бульоне PHM005. Возможно, что продукт гена lab720, оксидоредуктаза, будет предотвращать образование оннамид-подобного соединения путем расщепления структуры педерина перед добавлением к первому домену ACP в lab719 или после того, как после его биосинтеза произойдет окончательный окислительный процесс. Это же опасение обсуждалось J. Piel в WO 03/044186 A2. Генетическая модификация гена lab719 (гомологичен pedG) решит эту неопределенность.

Этот «молчащий» гибридный ген трансAT PKS/NRPS, представленный lab719 (2,254 а.к.), состоит из 4 KS и 1 NRPS с неопределенным доменом аденилирования, возможно, для включения arg (как в случае оннамида), но asp, asn, glu и gln могут быть другими возможными альтернативами, как предложено по алгоритму NRPSPredictor2 SVM. Состав этой ORF представляет собой (ACP-KS-ТрансAT-DH-KR-ACP-KS-DH-DH-DH-ACP-KS-ТрансAT-KR-ACP-KS-ТрансAT-C-A-PCP-TE). Где TE: Тиоэстеразный домен.

Единственная ORF в области lab без гомологии последовательностей с островками ped, onn или nsp (носперин) представляет собой lab713, предполагающая наличие цитохрома P450, возможно, играющая роль в оксигенации поликетидов, как описано J. Piel в случае островков ped (J. Bacteriol. 2004. 186 (5), 1280-1286) со сходными по назначению генными функциями.

Особенно предпочтительная модульная ферментативная система согласно десятому аспекту настоящего изобретения включает последовательность структуры белка с любой из последовательностей от SEQ ID №:3 до SEQ ID №:23 или последовательность структуры белка, которая по меньшей мере на 80% идентична этим последовательностям.

Особенно предпочтительными клетками-хозяевами согласно двенадцатому аспекту настоящего изобретения являются бактериальные клетки. Более предпочтительными клетками-хозяевами являются Pseudomonas, Acinetobacter, Bacillus, Streptomyces и E. coli.

Модификация биосинтетического генного кластера Lab по изобретению может быть использована для получения модифицированного биосинтетического генного кластера Lab или для получения педерин-подобных или оннамид-подобных соединений.

В предпочтительном варианте осуществления согласно тринадцатому аспекту настоящего изобретения экспрессируется продукт lab719.

ПРИМЕРЫ

Общий способ идентификации структуры. Оптическое вращение определяли с помощью поляриметра Jasco P-1020. Спектры ЯМР получали на спектрометре Varian «Unity 500» при 500/125 МГц (1H/13C) и на спектрометре Varian «Unity 400» при 400/100 МГц (1H/13C). Химические сдвиги регистрировали в м.д., используя остаточный пик растворителя для CDCl3 (δ 7,26 м.д. для 1H и 77,0 м.д. для 13C) в качестве внутреннего стандарта. (+)ESIMS фиксировали с использованием спектрометра серии Agilent 1100 LC/MSD. Масс-спектроскопию высокого разрешения (МРС) проводили с использованием системы Agilent 6230 TOF LC/MS и метода ESI-MS.

Пример 1: Выделение бактерий

Продуцирующие педерин бактерии, Labrenzia sp., PHM005, выделяли из образца осадка, собранного на глубине 18 м из высокоэпифитной и неопознанной среды обитания коралловых губок у побережья Кении в 2005 году. Приблизительно 5 граммов морского гравийного материала собирали в пробирку Falcon объемом 50 мл, содержащую стерильную искусственную морскую воду (ASW), и выдерживали при 5°C в течение 5 дней перед обработкой. В лаборатории образец сразу гомогенизировали и 100 мкл разведение ASW 1:100 распределяли непосредственно на чашки Петри со средой морской соли, состоящей из 27 г/л морской соли (Tropic Marin® PRO-REEF), 16 г/л агара и 0,2 мг/мл циклогексимида. После инкубации в течение трех недель при 28°C колонию слегка коричневого цвета отбирали и переносили в ту же среду морской соли для подтверждения чистоты и получения биомассы для молекулярной характеристики с одной колонией, инокулированной на жидком морском бульоне для дальнейшего сохранения на 20% глицерине при -80°C в качестве банка клеток.

Пример 2: Электронная микроскопия.

Клетки в середине экспоненциальной фазы роста адсорбировали на 400-меш сетках с углеродным коллодионным покрытием в течение 2 мин, отрицательно окрашивали 2% уранилацетатом, снимали на просвечивающем электронном микроскопе Jeol JEM 1011, работающем при 100 кВ, и фотографировали с помощью CCD-камеры Gatan Erlangshen ES1000W.

Пример 3: описание 16S рРНК.

Для выделения ДНК штамм выращивали в морском бульоне (DIFCO 1196) в течение 72 часов. Клетки выделяли и лизировали путем кипячения с 4% NP40 в течение 10 минут. Остатки клеток отбрасывали центрифугированием. Ген 16S рДНК амплифицировали методом полимеразной цепной реакции с использованием бактериальных праймеров F1 и R5. Филогенетическое дерево (фигура 2) получали методом парного выравнивания на основе коэффициента подобия и UPGMA для кластерного анализа с использованием BioNumerics V7.5 (Applied Maths). Филогенетические соседи были идентифицированы, и попарно рассчитывали сходство последовательности генов 16S рДНК по сравнению с базой данных SILVA LTPs123.

Пример 4: Культивирование и экстракция.

Штамм явно нуждается в морской соли для роста. После культивирования цельные бульоны лиофилизировали и экстрагировали смесью органических растворителей и 0,5 мл образца сырого экстракта, сушили и скринировали на цитотоксическую активность. Наилучшая цитотоксическая активность была достигнута в среде 16B/d при 120 ч. Это среда состояла из 17,5 г/л пивных дрожжей (Sensient, G2025), 76 г/л маннита, 7 г/л (NH4)2SO4, 13 г/л CaCO3, 0,09 г/л FeCl3 и 36 г/л морской соли (Tropic Marin® PRO-REEF). Масштабный объем получали в 50 л среды 16B/d в 200×2 л колбах Эрленмейера каждой с рабочим объемом 250 мл. Колбы для продукции инокулировали 2% бактерий, выращенных в течение 72 ч в морском бульоне (DIFCO 1196) из другого высокомасштабного предварительного инокулята. Масштабный объем инкубировали в течение 120 ч при 28°C на вращательном шейкере при 220 об/мин с эксцентриситетом 5 см. Затем культуру центрифугировали при 6000 об/мин в течение 20 минут с получением 45 л водного супернатанта, который дважды экстрагировали EtOAc, и органическую фазу высушивали с получением сырого экстракта (1,8 г).

Пример 5: Выделение соединения 1.

Экстракт наносили на систему VFC (вакуумная флэш-хроматография) с силикагелем, используя ступенчатое градиентное элюирование смесями н-гексан-EtOAc и EtOAc-MeOH с получением одиннадцати фракций. Активные фракции элюировали EtOAc и EtOAc-MeOH 9:1 (550,0 мг) и подвергали препаративной обращенно-фазовой ВЭЖХ с использованием колонки Symmetry C18 (19×150 мм, 7 мкм) и линейного градиента H2O/CH3CN от 5% до 35% CH3CN в течение 30 мин при скорости потока 13,5 мл/мин с получением очень активной пиковой фракции (77,0 мг) со временем удерживания 24,5 мин, содержащей соединение 1 согласно данным хроматографии ВЭЖХ-МС. Эту фракцию дополнительно очищали полупрепаративной ВЭЖХ на колонке XBridge C18 (10×250 мм, 5 мкм) и изократическим элюированием H2O/CH3CN (78:22) в потоке 4 мл/мин с получением 24,5 мг чистого соединения 1 со временем удерживания 25,0 мин в этих условиях ВЭЖХ.

(1): бесцветное масло; [α]D20+82,4 (c=0,49; CHCl3) и [α]D20+81,3 (c=0,36; MeOH); 1H ЯМР (CDCl3) δ 3,99 (1H, дкв, J=6,6, 2,7 Гц, H-2), 2,25 (1H, дкв, J=7,1, 2,7 Гц, H-3), 2,43 (1H, д, J=14,1 Гц, H-5a), 2,36 (1H, дт, J=14,1, 2,3 Гц, H-5b), 4,31 (1H, s, H-7), 7,18 (1H, д, J=9,8 Гц, NH), 5,37 (1H, дд, J=9,8, 7,8 Гц, H-10), 3,83 (1H, дт, J=7,8, 2,7 Гц, H-11), 2,04 (1H, дт, J=13,5, 3,6 Гц, H-12a), 1,75 (1H, м, H-12b), 3,64 (1H, м, H-13), 3,31 (1H, м, H-15), 1,75 (1H, м, H-16a), 1,57 (1H, дд, J=14,3, 9,7 Гц, H-16b), 3,36 (1H, м, H-17), 3,65 (1H, м, H-18a), 3,48 (1H, м, H-18b), 1,19 (3H, д, J=6,6 Гц, H-19), 1,01 (3H, д, J=7,1 Гц, H-20), 4,85 (1H, т, J=2,3 Гц, H-21a), 4,73 (1H, т, J=2,3 Гц, H-21b), 0,95 (3H, с, C-22), 0,88 (3H, с, C-23), 3,32 (3H, с, MeO-6), 3,38 (3H, с, MeO-10), 3,32 (3H, с, MeO-17); 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 145,7 (с, C-4), 34,1 (т, C-5), 99,7 (с, C-6), 73,1 (д, C-7), 171,9 (с, C-8), 79,4 (д, C-10), 72,6 (д, C-11), 29,6 (т, C-12), 71,8 (д, C-13), 38,4 (с, C-14), 75,4 (д, C-15), 29,2 (т, C-16), 79,0 (д, C-17), 63,8 (т, C-18), 17,9 (кв, C-19), 12,0 (кв, C-20), 110,5 (т, C-21), 23,1 (с, C-22), 13,5 (с, C-23), 49,1 (кв, MeO-6), 56,4 (кв, MeO-10), 56,6 (кв, MeO-17); (+)-ESIMS m/z 512,3 [M+Na]+; (+)-HRES-TOFMS m/z 512,2873 [M+Na]+ (рассчит. для C24H43NO9Na, 512,2830).

Относительная стереохимия соединения 1 была определена как

на основании данных ROESY data и анализа констант связи. Оптическое вращение соединения 1 ([α]D20+82,4, c=0,49; CHCl3 и [α]D20+81,3, c=0,36; MeOH) показало тот же сигнал, что и у педерина ([α]D20+86,8, c=1,00; CHCl3). Абсолютная стереохимия педерина была определена с помощью рентгеноструктурного исследования (Simpson, J. S. et. al. J. Nat. Prod. 2000, 63, 704-706) и стереоселективного синтеза (Matsuda, F., et. al. Tetrahedron 1988, 44, 7063-7080). Поэтому авторы настоящего изобретения предположительно полагают, что абсолютная конфигурация соединения 1 была такой же, как у педерина и других аналогичных соединений, о которых сообщалось (Wan, S. et. al. J. Am. Chem. Soc. 2011, 133, 16668-16679).

Пример 6. Выделение соединения 2.

Соединение 2 выделяли из цельного бульонного сырого экстракта (9,5 г) ферментационного бульона (15 л) штамма PHM005 морского происхождения. Экстракт наносили на систему VFC (вакуумная флэш-хроматография) с силикагелем, используя ступенчатое градиентное элюирование смесями н-гексан-EtOAc и EtOAc-MeOH с получением семи фракций. Активную фракцию, содержащую соединение 2, элюировали EtOAc-MeOH 4:1 (659,0 мг) и подвергали полупрепаративной обращенно-фазовой ВЭЖХ, снабженной колонкой Symmetry C18 (7,8×150 мм, 5 мкм), используя линейный градиент H2O/CH3CN от 5% до 60% CH3CN за 25 мин при скорости потока 3,0 мл/мин, с получением очень активной временной фракции в интервале 25-30 мин (28,0 мг), содержащей соединение 2, согласно данным хроматографии ВЭЖХ-МС. Эту фракцию опять очищали с помощью полупрепаративной ВЭЖХ на колонке Symmetry C18 (7,8×150 мм, 5 мкм), используя линейный градиент H2O/CH3CN от 20% до 30% CH3CN в течение 20 минут при скорости потока 2,5 мл/мин с получением 2,6 мг чистого соединения 2 со временем удерживания 11,5 мин при этих условиях ВЭЖХ.

2: бесцветное масло; [α]D20+64,5 (c=0,16; CHCl3); 1H ЯМР (CDCl3) δ 3,97 (1H, дкв, J=6,6, 2,6 Гц, H-2), 2,25 (1H, дкв, J=7,1, 2,6 Гц, H-3), 2,50 (1H, дт, J=14,2, 1,45 Гц, H-5a), 2,45 (1H, д, J=14,1 Гц, H-5b), 4,32 (1H, с, H-7), 7,17 (1H, д, J=9,9 Гц, NH), 5,44 (1H, дд, J=9,9, 7,5 Гц, H-10), 3,95 (1H, м, H-11), 2,05 (1H, дт, J=13,5, 4,0 Гц, H-12a), 1,75 (1H, м, H-12b), 3,66 (1H, м, H-13), 3,58 (1H, м, H-15), 1,80 (1H, м, H-16a), 1,55 (1H, м, H-16b), 3,80 (1H, м, H-17), 3,57 (1H, м, H-18), 3,44 (1H, дд, J=11,5, 6,5 Гц, H-18), 1,19 (3H, д, J=6,6 Гц, H-19), 1,01 (3H, д, J=7,1 Гц, H-20), 4,85 (1H, т, J=1,45 Гц, H-21a), 4,75 (1H, т, J=1,45 Гц, H-21b), 0,96 (3H, с, C22), 0,89 (3H, с, C-23), 3,34 (3H, с, MeO-6), 3,41 (3H, с, MeO-10); 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 146,1 (с, C-4), 34,2 (т, C-5), 99,6 (с, C-6), 74,5 (д, C-7), 171,9 (с, C-8), 79,3 (д, C-10), 72,2 (д, C-11), 29,8 (т, C-12), 71,6 (д, C-13), 38,4 (с, C-14), 80,9 (д, C-15), 31,4 (т, C-16), 72,8 (д, C-17), 66,6 (т, C-18), 17,8 (кв, C-19), 11,9 (кв, C-20), 110,2 (т, C-21), 23,4 (с, C-22), 14,3 (с, C-23), 49,6 (кв, MeO-6), 56,3 (кв, MeO-10); (+)-ESIMS m/z 498,4 [M+Na]+; (+)-HRES-TOFMS m/z 498,2713 [M+Na]+ (рассчит. для C23H41NO9Na, 498,2674).

Относительная стереохимия соединения 2 была определена как

на основании анализа констант связи. Оптическое вращение соединения 2 ([α]D20+64,5, c=0,16; CHCl3) показало тот же сигнал, что и у педерина ([α]D20+86,8, c=1,00; CHCl3). Поэтому авторы настоящего изобретения предположительно полагают, что абсолютная конфигурация соединения 2 была такой же, как у педерина и других аналогичных соединений, о которых сообщалось (Wan, S. et. al. J. Am. Chem. Soc. 2011, 133, 16668-16679).

Пример 7. Синтез соединения 3

К раствору 1 (2,5 мг, 5,1 мкмоль) в сухом DCM (2 мл) в атмосфере азота добавляли пиридин (10 мкл, 124 мкмоль), DMAP (каталитическое количество) и Ac2O (2,9 мкл, 31 ммоль). Реакционную смесь оставляли стоять при комнатной температуре в течение ночи. Смесь концентрировали в вакууме и очищали с помощью колоночной флэш-хроматографии на силикагеле (н-гексан/EtOAc 1:1) с получением 3 (3 мг, 95%) в виде твердого вещества белого цвета.

3: 1H ЯМР (CDCl3) δ 3,96 (1H, дкв, J=6,6, 2,6 Гц, H-2), 2,24 (1H, дкв, J=7,0, 2,6 Гц, H-3), 2,62 (1H, дт, J=14,5, 2,2 Гц, H-5a), 2,37 (1H, д, J=14,5 Гц, H-5b), 5,25 (1H, с, H-7), 6,62 (1H, д, J=9,6 Гц, NH), 5,27 (1H, дд, J=9,6, 4,1Гц, H-10), 3,91(1H, дт, J=6,3, 4,6, Гц, H-11), 2,02 (1H, м, H-12a), 1,66 (1H, м, H-12b), 4,91 (1H, дд, J=4,7, 4,1Гц, H-13), 3,55 (1H, м, H-15), 2,02 (1H, м, H-16a), 1,67 (1H, м, H-16b), 3,60 (1H, дд, J=11,3, 2,2 Гц, H-17), 4,32 (1H, дд, J=12,1, 2,6 Гц, H-18a), 4,12 (1H, м, H-18b), 1,15 (3H, д, J=6,6 Гц, H-19), 0,97 (3H, д, J=7,0 Гц, H-20), 4,86 (1H, т, J=2,0 Гц, H-2a), 4,76 (1H, т, J=2,0 Гц, H-21b), 0,97 (3H, с, C22), 0,89 (3H, с, C-23), 3,21 (3H, с, MeO-6), 3,39 (3H, с, MeO-10), 3,38 (3H, с, MeO-17), 2,20 (3H, с, OCOMe-7), 2,08 (3H, с, OCOMe-13), 2,10 (3H, с, OCOMe-18) ; 13C ЯМР (CDCl3) δ 69,6 (д, C-2), 41,3 (д, C-3), 145,5 (с, C-4), 33,8 (т, C-5), 99,1 (с, C-6), 72,1 (д, C-7), 167,4 (с, C-8), 81,8 (д, C-10), 70,0 (д, C-11), 26,7 (т, C-12), 74,2 (д, C-13), 36,7 (с, C-14), 76,5 (д, C-15), 29,3 (т, C-16), 76,4 (д, C-17), 64,0 (т, C-18), 17,9 (кв, C-19), 12,0 (кв, C-20), 110,4 (т, C-21), 24,7 (с, C-22), 17,2 (с, C-23), 48,4 (кв, MeO-6), 56,3 (кв, MeO-10), 57,0 (кв, MeO-17), 20,7 (кв, OCOMe-7), 169,8 (с, OCOMe-7), 21,2 (кв, OCOMe-13), 170,3 (с, OCOMe-13), 20,9 (кв, OCOMe-18), 170,0 (с, OCOMe-18); (+)-ESIMS m/z 638,3 [M+Na]+.

Относительная стереохимия соединения 3 была установлена как

по аналогии с его предшественником, соединением 1.

Пример 8. Биоанализ in vitro для определения противоопухолевой активности

Целью этого анализа является оценка in vitro цитостатической (способность задерживать или останавливать рост опухолевых клеток) или цитотоксической (способность убивать опухолевые клетки) активности тестируемых образцов.

КЛЕТОЧНЫЕ ЛИНИИ

Название № ATCC Вид Ткань Описание
A549 CCL-185 человек легкое карцинома легких (NSCLC)
HT29 HTB-38 человек прямая кишка колоректальная аденокарцинома
MDA-MB-231 HTB-26 человек молочная железа аденокарцинома молочной железы
PSN1 CRM-CRL-3211 человек поджелудочная железа аденокарцинома поджелудочной железы

ОЦЕНКА ЦИТОТОКСИЧЕСКОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ КОЛОРИМЕТРИЧЕСКОГО АНАЛИЗА SBR

Колориметрический анализ с использованием реакции с сульфородамином B (SRB) был адаптирован для количественного измерения роста и жизнеспособности клеток (следуя методике, описанной Skehan et al. J. Natl. Cancer Inst. 1990, 82, 1107-1112).

В этом виде анализа используют 96-луночные микропланшеты для клеточных культур, соответствующие стандартам Американского национального института стандартов и Общества по лабораторной автоматизации и скринингу (ANSI SLAS 1-2004 (R2012) 10/12/2011). Все клеточные линии, использованные в этом исследовании, были получены из Американской коллекции типовых культур (ATCC) и происходили от различных типов рака человека.

Клетки содержали в модифицированной по Дульбекко среде Игла (DMEM) с добавлением 10% фетальной бычьей сыворотки (FBS), 2 мМ L-глютамина, 100 ед/мл пенициллина и 100 ед/мл стрептомицина при 37°С, 5% СО2 и влажности 98%. Для экспериментов клетки собирали из субконфлюентных культур с использованием трипсинизации и ресуспендировали в свежей среде перед подсчетом и посевом.

Клетки высевали в 96-луночные планшеты для микротитрования, по 5000 клеток на лунку в аликвотах по 150 мкл, и оставляли прикрепляться к поверхности планшета в течение 18 часов (в течение ночи) в среде без лекарственных средств. После этого один контрольный (необработанный) планшет каждой клеточной линии фиксировали (как описано ниже) и использовали как эталонное значение нулевого времени. Затем плашки для культивирования обрабатывали тестируемыми соединениями (аликвоты по 50 мкл 4Х маточных растворов в полной культуральной среде плюс 4% ДМСО) с использованием 10/5 серийных разведений (концентрации в диапазоне от 10 до 0,003 мкг/мл) и трехкратных культур (1% конечной концентрации в ДМСО). После 72-часовой обработки противоопухолевый эффект измеряли с использованием метода SRB: вкратце, клетки дважды промывали PBS, фиксировали в течение 15 минут в 1%-ном растворе глутаральдегида при комнатной температуре, дважды промывали в PBS и окрашивали 0,4% раствором SRB в течение 30 мин при комнатной температуре. Затем клетки несколько раз промывали 1% раствором уксусной кислоты и сушили на воздухе при комнатной температуре. Затем SRB экстрагировали 10 мМ основным раствором тризма и измеряли оптическую плотность в автоматическом спектрофотометрическом ридере для планшетов при 490 нм. Влияние на рост и выживаемость клеток оценивали с использованием алгоритма NCI (Boyd MR and Paull KD. Drug Dev. Res. 1995, 34, 91-104).

Значения, полученные в трехкратных культурах, были сопоставлены с четырех-параметрической логистической кривой с помощью нелинейного регрессионного анализа. Три контрольных параметра были рассчитаны (в соответствии с алгоритмом NCI) путем автоматической интерполяции кривых, полученных при таком подборе: GI50 концентрация соединения, которая вызывает 50% ингибирование роста клеток по сравнению с контрольными культурами; TGI=общее ингибирование роста клеток (цитостатический эффект) по сравнению с контрольными культурами, а LC50=концентрация соединения, которая дает 50%-ный чистый цитотоксический эффект уничтожения клеток.

Таблица 2 иллюстрирует данные о биологической активности соединений по настоящему изобретению.

Биологическая активность (M)
Соединение Клеточная линия
A549 HT29 MDA-MB-231 PSN-1
1 GI50 2,04E-09 2,86E-09 2,66E-09 2,66E-09
TGI 7,97E-09 8,99E-09 5,31E-09 5,72E-09
LC50 3,68E-08 >2,04E-07 1,08E-08 1,94E-08
2 GI50 7,15E-09 8,83E-09 8,20E-09 8,62E-09
TGI 2,52E-08 4,42E-08 1,56E-08 1,91E-08
LC50 1,22E-07 >2,10E-06 3,15E-08 7,78E-08
3 GI50 1,15E-07 1,62E-07 3,09E-07 1,62E-07
TGI 8,77E-07 9,26E-07 2,44E-06 6,66E-07
LC50 8,61E-06 >1,62E-05 >1,62E-05 3,90E-06

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> PHARMA MAR SA

<120> ПРОТИВООПУХОЛЕВЫЕ СОЕДИНЕНИЯ

<130> P14452PC00

<150> EP17382140.6

<151> 2017-03-17

<160> 23

<170> BiSSAP 1.3.6

<210> 1

<211> 1355

<212> РНК

<213> Labrenzia sp. PHM005

<400> 1

atctcttcgg agatagtggc agacgggtga gtaacgcgtg ggaatatacc tttcggtacg 60

gaacaacagt tggaaacgac tgctaatacc gtatacgccc tatgggggaa agatttatcg 120

ccgagggatt agcccgcgtt agattagcta gttggtgagg taatggctca ccaaggcgac 180

gatctatagc tggtctgaga ggatgatcag ccacactggg actgagacac ggcccagact 240

cctacgggag gcagcagtgg ggaatattgg acaatggggg caaccctgat ccagccatgc 300

cgcgtgagtg atgaaggccc tagggttgta aagctctttc agcgaggagg ataatgacgt 360

tactcgcaga agaagccccg gctaacttcg tgccagcagc cgcggtaata cgaagggggc 420

tagcgttgtt cggaatcact gggcgtaaag cgcacgtagg cggactttta agtcaggggt 480

gaaatcccag agctcaactc tggaactgcc tttgatactg gaagtcttga gtccgagaga 540

ggtgagtgga actccgagtg tagaggtgaa attcgtagat attcggaaga acaccagtgg 600

cgaaggcggc tcactggctc ggtactgacg ctgaggtgcg aaagcgtggg gagcaaacag 660

gattagatac cctggtagtc cacgccgtaa acgatggaag ctagttgtca ggcagcatgc 720

tgtttggtga cgcagctaac gcattaagct tcccgcctgg ggagtacggt cgcaagatta 780

aaactcaaag gaattgacgg gggcccgcac aagcggtgga gcatgtggtt taattcgaag 840

caacgcgcag aaccttacca gcccttgaca tttggtgcta cattcggaga cggatggttc 900

ccttcgggga cgccaggaca ggtgctgcat ggctgtcgtc agctcgtgtc gtgagatgtt 960

gggttaagtc ccgcaacgag cgcaaccctc gcccttagtt gccatcattt agttgggcac 1020

tctaggggga ctgccggtga taagccgaga ggaaggtggg gatgacgtca agtcctcatg 1080

gcccttacgg gctgggctac acacgtgcta caatggcggt gacagtgggc agcgaactcg 1140

cgagagggag ctaatctcca aaagccgtct cagttcggat tgttctctgc aactcgagag 1200

catgaagttg gaatcgctag taatcgcgta acagcatgac gcggtgaata cgttcccggg 1260

ccttgtacac accgcccgtc acaccatggg agttgggttt acccgaaggc agtgcgctaa 1320

ccgtaagggg gcagctgacc acggtaggct cagcg 1355

<210> 2

<211> 68996

<212> ДНК

<213> Искусственная

<220>

<223> Последовательность нуклеиновой кислоты биосинтетического

генного кластера Lab

<400> 2

ttagactttg gatgctgcca atatttcggc cagatcccgt aaagtcaccg ccttggcaaa 60

actcatcaaa gggatggcaa tgcccatatc ttccatcgac agggtgatga catccatccg 120

atccaccgaa tttgccccga ggtcgaccag gattgactcc ggttggatca tatccggctc 180

gagttcaggc aacacctctt gcacattgcg tttcacagtc tcaaacggat cagtttgact 240

catgatgttg cgtccctggg gttgttcttg gcgcaattga aatcagcgga tacgctgtgt 300

gttctacacg gatgcaggga gagtgtcacg aatgaacacc gcagggattg aagcagttgg 360

tgtttatggc ggcagtgttt acctggatgt ctctgaactg gcgcaatacc gcggcatgga 420

tcttcagcgt ttcgagaacc tcctcatccg ccagaaatca gcggcattgc catatgaaga 480

cgcggtgtcg cttggagtta atgccgccaa acccgtgatc gatgcattgt cgcaggccga 540

acgcgatcag atcgaactgc tgattacatg taccgaatcc ggtctggatt ttggcaaatc 600

gctgagcact tatatccatc actatttggg attaagccgc aactgccggc tctttgaaat 660

caaacaggcc tgctattccg gaaccgcggg ctatcagatg gcactgaact tcatattgtc 720

gcagacctca ccaggtgcga aagctttggt tgttgcgacc gacttatccc gggtcttggt 780

ggacgagacc agtgacgaac tgaccatgga ttgggagtat tttgaaccca gtggcggggc 840

tggcgcggtt gcgcttttgg taagcgacca gccgcgcata tttcagtccg acatcggcgc 900

caatggcaca tattgttttg aagtcatgga tacctgcagg ccaatgccag attctgaagc 960

cggggactca gacctgtcgc tcctgtccta cctcgattgt tgtgagcaga gctttgctgc 1020

ttatcgtgca cgtgtcgaag gtgtttccta ccaagacagc ttcaactatc tggcctttca 1080

cacgcccttt ggcggaatgg tgaaaggcgc tcatcggcac atgatgcgcc ggcttttgcg 1140

cagtcgtcct gatgagatcg acgtggattt cgaaactcga gtggctcccg gattgcgcct 1200

gtgccagagg atcggaaaca tcatgggggc gactgttctg ttgtcactga caggagccgt 1260

gctttatggc gattaccgga cgccccagcg gatcggttgc ttttcctatg gctctggctg 1320

tgcctcggag ttttacagcg gagtttctac tgctgacggg cagcggcggt tacaggacgc 1380

gccgattcaa aaagcgctgg acctgaggca taaacttacc atgccgcaat acgaggcatt 1440

gcttgaaggt tgcaaggctg ttcccttcgg cacgcgcaac caccaaccag atcttgatca 1500

ggttccggac atgaaatcct gcattgccga tcaaagcgcc cagctcggat atcagcggct 1560

cttcctgaaa gaaatcaaaa acttccatcg cgaatacgat gtactttgag ttgtgttgtc 1620

tcctctgctc cgataggctt acccaaggat acttttaaga gcgcttgtct gcgatactgg 1680

acgttcccat cgcagcaggc gatgtgcgag ggaaaatgcc attcacgcat ttcggcaaat 1740

cctaccgaag ctctgaggtg ttgctgtgac tggctgccag agcaaaagag ccgggctctc 1800

gccgttggcc cttttgttga atgctgcagg ccgcgggctt tttcctgccg cgggcgtaac 1860

atttcgaccg gactgccggg ccgaagatct tgaagccagt ctcgaacctg ccgacttcaa 1920

cattcgacca gccgcggtcg acgacattga tacgctccat atgctggaga cagtctgttg 1980

gccgaaggag ctacagacgc cgacaaaaac cttggccagt cgggtggcaa tcgacccgaa 2040

tggacaactg gtcctcacct tggacggctc cccatgcgga gtgatatact cccagcggat 2100

caactccgtc gaggctctga cctcttcgga tatggacaag gttgacagcc tgcgggatcc 2160

ttcaggttca attctgcatt tcctggcaat caacattctc ccaagcgtgc aagaccgtgg 2220

cctgggcgat gcgctccttg aattcatcct gcactacgcc gcacttgctc ccggcatcaa 2280

gtctgccgct gccgttacac tttgccgtga cttcacggga cgaaccctat ccgatctgaa 2340

tgagtattta cgccggaaga caccgctggg cacagtggca gacccggtac tgcgttttca 2400

tgaacttcac ggtggtcgta ttcaacaccc ggtaccaaac tatcgggccc gcgacacccg 2460

caatctgggc gccggagtgc ttgtaaccta cgatctgaac aagcgccgca gatctcatgc 2520

tcctcaaccg cggcaaaaaa ttgcgcggac ggacatcgcc aaccgcgtca attccgcaat 2580

tcgttccgcg ttgggctcaa gcagcgatca gttcgaaaaa gacacgccac tgatctctat 2640

gggtttggat tcagcggcga tattgggatt ggcggactgt ctgcaagccg agtgcggtag 2700

cacactgact gccgcacagc ttttcaaaca caacaccgcg gaaaaaatta tcgcttttct 2760

gcacaacgaa ctgccgtcct ccggtttgtc aaagcctacg ctgctaccgg cgcaaacgag 2820

ttgccccgca gatggcggtt cagaccaaag cgttgccatc atcggcgtct ctttgcgcat 2880

gcctggcggg atcgaaactc ctcaagcact ttgggaactt cttgacctag gcggcaccgt 2940

catcactcca gtcccttctg atcgctggtc ctggccggat ggctttcggc cgcagggagc 3000

cgcctatggt ggcttcttgc aggatcctgc ccgatttgac gccgcattct tccgcatttc 3060

accacacgaa gccgaagcca tggatcctca gcaaaggata ttgctggaat tggcctggca 3120

cggtctggag gacgcgggcc tttccgcgac caagttggct ggctcttcca ccggcgtgtt 3180

tgtcggtgcc agcggatcag attatcaacg cgccatggac gctgcgggag tgccggttca 3240

accgcatcac agcaccggcg cagccttgtc ggtgatagca aaccggctct catatgcgct 3300

ggatttcaca gggccaagcc tggttgttga caccgcctgt tccagttcac tggtcgcagt 3360

gcatcaggct gtggcagcgc ttcaagagcg gacttgcggc ctggcattgg cggcagggat 3420

caatctgatc ctgcatccgg caacatcgca ggcttatcaa tcggcgggca tgctgtcacc 3480

atccgggtta tgccgaagtt tcggttctgg ggccgatggt tatgtccgca gcgaaggtgc 3540

tgttctttta gtccttaagc ctttggctca agccctggcc gaaggctgcc gggtgcacgc 3600

ggtaatccgc ggaagcgcct gtaatcatgg tggcatgacc agtgggttga cggtcccgag 3660

tccggacaag caaacggagc tcttgtccgc agcctggcat aatgcggata taaaacccgc 3720

tgaccttgat tatcttgaag cccatgggac cggcaccaaa cttggtgatc caatcgagat 3780

agagggcatg aaaacggcgc tggctgagtt cgatgatagt cagccgaacc cccctgaaca 3840

acacgcttgc ttgacgggtt cggtcaagtc gaatttgggt catctagaag ctgcagcggg 3900

gctggctggg ctgtgcaaag taatgttggc gttacgccat gaacggctgc ctgcttcgct 3960

gaatgcatcc ccacaaaatc cggaaatctc gctgaacggc tccaatctgg ccatcgctga 4020

caccgctcga gattggccaa aaggaaaccg gcccagaatc tccggcgtca gcagttttgg 4080

gtctggcggt acaaatgctc atattgttgt agccgaaccg ccggatgccc cggatggcgt 4140

catcgatacg ggaccgcaac tttttgtcct ttccgcaaac acgcccgaac ggctgatggc 4200

gttggcggta cattggcaag agtggttgaa gaagcagccg cacgatctga acatccctgc 4260

cctttgtcat gccagccgcc accggcgtgc cgccttgcct gcgcgctttg cgacaaaagt 4320

ctcttcacgg gcagacctgg aaaaagcgct tcaccaagcc gctcagaaaa atcccgcatc 4380

tagtcaggcc aaacccaagt ttctggaaca tctgaaagga gacgctggac aagccttctt 4440

gcaggccttg gcaaaagagg gggacctgtc cgccctggca gatctctggt gtgccggggt 4500

tccggttgat tggtcactga ttgattcgac gcccccagaa cagccggtgc cctggattga 4560

tttgccattg tatccattcg ataaaactcg cttctgggct ttgggaaaag caccggctgt 4620

tccgcaggat cgggctgcgg caactgcaga actgtacgct ccggtctggc aagaactggc 4680

cgcgagcaaa acgcagatgc cagagccaga cttgctgtct gggccgtttg cacttaaagc 4740

cgcgcagctt ttaaagctcg atccatcgga aagccggaac tcagaaacaa acgccatagg 4800

cgagaacatg cacgttctct ggagcagtgc cccgcggccc agcgattccg gtgaaacatt 4860

agaggaattc cgggagtttc aggacttcgt tgccggcttg cctcgccagt tgtcgcgttt 4920

gcggctaacc gtggtgactt ggaacggaca ggccgtgtac ggcaacgagc cggttgatgc 4980

cgaggccgcc gcgatctcgg cgtttacgca tgtcttggcc caggaaaaac ccgaatggga 5040

catacgcacg tttgacttgg actcgtgtga cccgccctca tggtccagtc tcgctgagag 5100

caatgaaacg aggtctgctg tccgggccgg taaagcctat ggtttgcggc tggccatggc 5160

cgacccactt ccggataccg gccaatcgca cctgcgcgaa gacggtgttt acgttgtcat 5220

cggcggggcg ggggcattgg cacgacctgg agtgaagcgg ttctaaacaa cgtccaggcg 5280

caagttattt ggataggccg ccgtccacat aatgcggcga ttacggcaca tatcgaccgg 5340

ctgaccaggc tgggcccacc tccgatctac attcaggcgg acgccacgaa ccccgacgcc 5400

cttgaaaggg ctttgcaaga aattctgaag cgttggggac gaatagatgg cgtgattcat 5460

gcgatcacag gcccatccga ccagcccatc ttggacagtg agccggaaaa tctaacccgt 5520

gtcatggcag ccaaaaccca tggtttgatc caaaccgccc acacgtttgc cgccttggac 5580

ctggatttct ttttagtctt ttcatcgatt atttcgctgg aacagcccgg cggtttcgga 5640

ggttacgcgg ccagctgcgc attcgcggat gctttcgttc gcggactgga ctcccagaca 5700

ccttaccctg tccggtgctt aaactggggg cattgggatg tcggtgtcgc ccgcaatctg 5760

cctgaggcga caaagatacg gctggacaac gccggagttg tcccgatcac ggctcaggac 5820

gcgttgaagc attgcgatac ggcactgaat gctccgctgc ctcaactggc aatattgaaa 5880

tggaatgatc ctgcccggca tcccctggtc gacagccagg ttcatatgcg cctttcgcgg 5940

aaggcaccgg cgcgcagtct cccggctgca acaaatgaat tgaacacacg gctgcaggaa 6000

atcgagcggc acggactttt tgcccatccg gagttggagg cggcattgcc cggcgcaata 6060

gccgcggaac ttgaccgcca tggcctgcgg acatccttgc ctgacacggc tccgtggtat 6120

ctgcgccgat ggcacaaggc gacgaaacgg ctccttgcgc aagggaacac cggcgagaac 6180

tgggatgcga ccgcacgccg tctgcgcgcg gatgcggatc tggctcctgc gatcaatttg 6240

gtgacggcct gcctggcacg actgcacgaa gtcctgacag gtcagacacc ggccactgat 6300

gtcctgtttc ccggtgcatc tctcgatctg ctagagccgg tttatcgcgg cactgcttcc 6360

gcggatctgc tcaacgatgt tttggccgat acattggctg aaacgctccg agcagacctg 6420

agggaccagc ctgagaacac atccttacgg gtccttgaga tcggcgcggg aacaggcggc 6480

acgaccgcgc gggttctgcc ctgcttgtcc gagcttgctg gacagattga gacctatgat 6540

tacacagatc tgtcacgtgc atttttgcag catgcccaac aggcttttgc cccaagtgca 6600

cccttcctga aatcactcag atttgacgtt gaaaaaagcc cggaaagtca aggcctgcaa 6660

cccggcagct acgatgccgt tctggcaaca aatgtgctcc atgccacgcc ggacatccgc 6720

cagacattgc gccatacaca cgctttgctc aaacctggcg gggtgttgct tctcaatgag 6780

attgtgaccc cgtcagtctt tgctcatgca acctttgggc tgttggaagg atggtggaag 6840

tcatgcgatc cgggcctccg ccatcctgac acgccccttc tatcagccga gagttgggaa 6900

aaactgctgc tggcaaacgg ctttaccgct gttgaaatgc ttttgaacag cagcactgcg 6960

cttggtcaac aagtctttgc tgcccgcagc gacggctgtt tcgagtaccg gaaggcagag 7020

attgacacaa cccgcagaca acctgagacg ctcgagccgc gcatcctcaa gaacacggtc 7080

agcgagttgc cattggagga cctggaaaat ccgcaagctg cggctgcaag gcttttaaca 7140

gaaatcgtcg ctagcgcctt acagattaca gaagaccagc tggatccatg gacacctttg 7200

ggcgactacg gattggattc gatcctgaat gcccaggtca ccgcaagatt gcgggagctg 7260

gttccagatc tcgataccac cttcctctac caataccaga ccatcgcaga tctctcgcaa 7320

gcacttgttc aaaaacatcc agaagcgttt gagcagatcg gccacaccac ttgcggagaa 7380

gcggacgtgg catcgccttc gacagtatcc gccagcaaaa gaaccgcggg gaacgaacag 7440

caggacattg ctattgtcgg catgagtttc cgttttccaa aggctgatac acctgaggaa 7500

ttctggaccc tcttgtcaca agggcaaagt gcagtgacgg aaattcctcc cgatcgctgg 7560

caactggacg gtttttatga atctgatcca gacaaggccg tagacggctg gaaaagctac 7620

agcaaatggg gtgcatttct ggagcgggtg acagccttcg acccgctctt tttcgggatc 7680

aacccaaaag aagccgctgc catcgacccg caggaacgcc tgtttctgca gaccgcatgg 7740

gcggcactgg aagatgctgg atttccgcgc cagcgcctgg cagatgaact ggcacggagt 7800

gtcggtgtgt ttgtcggtat cacgcgaacc ggatttgacc tttttggccc cgatttgtgg 7860

caggcaggtc aaaaggtcta tccgcacact tccttcagtt cagctgctaa ccgcctgtcc 7920

tggttcctgg atgccgatgg ccccagcatg ccggtcgata caatgtgttc gtcttccctc 7980

acagcgctcc atcaggcctg tgccagcctc aagacgggcg aatgcagact ggcgattgca 8040

ggcggagtaa acctctttct gcatccgaca agttacatcg ggctctcggc gatgcgcatg 8100

ttgtctccag atggacgctg cagcagtttc ggtgccggag gaaacggatt tgttcctggt 8160

gaaggcgtag ctgccctggt gcttcggcct ctggccgagg cccaagccgc gggcgatcag 8220

gttattggtg tgatccgagg cagcgcagtc aatcatggcg ggcgcacaaa tggtttcacc 8280

gttcccaatc cccgcgccca gagcagtctg gtgcgtgagg cgatgtcccg tgcagggctt 8340

gagcctggac agatcagcta tcttgaggcg catggcacag gcaccgaaat gggggacccg 8400

atcgaaataa ccgggttgac cgaagcattt gccgggcggg agcaaggttt ggcgccgtgc 8460

gccatcggct cgatcaagac caacattgga catcttgagg caactgccgg attggctggc 8520

gtgatcaagg tgctgttgca gatgcgccat cgccagatcg ttccgagcct gcacagcagc 8580

tctctcaatc caaagattga ttttgagcat gcgccatttc gcgtcgcgca ggacctcact 8640

ccatggtccc cagctaaagg gcgccggata gccggagttt catcatttgg cgccggcgga 8700

acaaatgcgc acgtcatcct tgaagaagcg ccggacatac ctgaaaaaag tgcaactgat 8760

cccgcgccaa acgaaccgat cgcgcttgtc ctttctgctc atgacgaacc gcgtttacgg 8820

gcctatgcag cgcggctcgc caagttcttg acttccccca acgcccctcc cctggcactg 8880

gccgctcaaa gcctgcaact gggacgagag ccgatgcgcc atcgcatggc tgctgtcgtg 8940

tccgataagg ctcaggccgt ggcagtcttg caagccgtcg ccgagaaccg gccgttgcct 9000

gacaaaacct tcttgcggga tacacgcagg tacaaggggc aatgtccttc ttcggtggaa 9060

agtgaagacc ttggtgaact gacagatgca tggagcaaag gcagcaaaat cgattgggct 9120

aagctccacc aacgccgcca aaccgtatca ctgcctacct acccatttga tgaaaaacct 9180

tactggttcg ccgacaccgc gcctgttggg ggacccatgg acgtcccctc ctctgaagac 9240

gcttttaggg aattaaaacc ggcttctcgg ccttcaccgg tccggcggac actgccaagg 9300

ctggatactg caccggcaca gtttgagccg catcgccgca gccaaaagct tcggctgtct 9360

tctctgaacc cagcgagtga aacaccgcct gctgaaatcg aattggacat caacggcatc 9420

ggcagagttc gcctagagcc tgccagcccg ccgccaaacc tttcaaccgg aaacgccatg 9480

aaggttctgg tggtcgaggg gcttcagcat tggaacggag accggttggg gctgctgcat 9540

gagctcgacc aactctcgca accagtaatc ctgacagtgt ccgcgagttc gttacccccg 9600

atcccggata cgcttcttac cgctccagcc tttgagcagg cacaggaaat ggcaaacgcc 9660

accgcacgct gtccggctgc cacgctggcc accttaaaaa accatattcg caatcaacct 9720

agctggccgg atatcgcagg gattccggcg gaatggatgg ccggcagcgg atggccggtt 9780

tcgtcgcccg agccggcacc ttctggcggc gctattccgc ttcaatccga agtcgtccaa 9840

ttgcacgaca tggggggcgg tgtcgcgcaa atcacaatgg ccgagcgcga tgcgcaaaac 9900

acctttacgc ccgcttttgt cactggagtt ctggaagcgt tcgacaaggt cgagtcctct 9960

gccgccttca aggttgtcgt tttgacaggc tatgaagcct attttgcttg cggtggtacg 10020

cgcgaagggc tcctggcgat ccagaatgga caagcccgct ttaccgatga gcaaagctac 10080

gcccgtccgc tgcgctgtcc gattcctgtt attgcggcca tgcaggggca cggtatcggt 10140

gctggctggg ccatggggct ttactgcgat ttggcgattt acagcgagga aagctgctat 10200

caaagcccct atatgcttta tggcttcacc cctggagcgg gtgcaacaac ccttttcccc 10260

gcgcggttgg ggcggcaact tgccaatgaa atactattca ctgctcagtc attcccaggc 10320

cacatcctgg cacagaaggg attgactgca ccggttctac cgcgtgaaga ggttttaccc 10380

caggctcatg cattggctcg aagcattgcg caaaacccgc gcgagacgct gatggcccgc 10440

aaatccacgc agacagccga atttctccac atgttgccca ggctgtttga agcggaactg 10500

gctctacatg aaagcacctt tgtagggaat tctgacgttc tggagcagat aagtgagcat 10560

tttgccgaca aacagatgac ccaaaagcct ggcgcatccc agaaagaggc gcggaacacg 10620

tccgcgctca agacgcaact gcgcatgatg cttgcagagg aactggacat ccctcctgac 10680

cggatagacg acgacacgcc tttcgtggat ctcggtttgg agtccattgc agctgtcatc 10740

tgggttcgga aaatcggcga agagctcgga gcccagatcg gagcaaccag tgtctatagc 10800

caccccaacc tggcagcatt tacagaactg gtagctgaga aaggtggcca gctggccgag 10860

gcggtcaaca agaccacagc acccccttcc gagcccccaa aagccgccat ccctgccgat 10920

ccggaagagc gccttttgcc gtcagacagc tctgatcttt ttgtctggct gcaggcatct 10980

ttggaaacag agctctccat cccatccggg acgcttgatc ctgatcgccc gttcgtggaa 11040

ctcgggctcg attcggtgac tgcagtcacc tggatacgcc aggtcaatga cgccctgggc 11100

accaaagaaa ctgggaccgt ggtctatcac cacaccaacc tgactgaatt ggcggcctat 11160

ctggcgggca ttgccggcaa aacacctact accaggacca cttccttacc atacaagctg 11220

gaggcaccag tacgatccgc cttgcctcgg ctggaaaatc tagcgccttt ccaagatgaa 11280

agacccggaa ttgcgattgt cggtatggcg ggccgttttc ccgaagcgcc caacgtgtcc 11340

agcttctggc agaatgtcct ggctggccgg gattgtgtct atgagattcc cgccacacgc 11400

tggtcaatcg acgcctacta tgatccggac cgccaggctc caggcaaaac cgtttgccgc 11460

agaatgggtg cgattgaaga catcgacgca ttcgactctc tgttttttgg catttcgcca 11520

gctgaagccg agctgatgga cccgcaacag agactgttcc tggaaaccgc ctgggaagcg 11580

atagaggatg cgggacacgc gccgtctacc ttagccggga cacgatgcgg tctgttcgtc 11640

ggcactgaaa acggagacta tgcccggatt gccggtgatg ccaaacctga agcattggcg 11700

ctgaccgggc gctccgtggc gatgctcccg gcgcgtgccg cctatgcatt ggatctacag 11760

ggcccctgcc ttgccattga cacagcttgt tcggcgtctc tcgtggcaat tgcccaagcc 11820

tgtgccagtc ttcacgaccg tcactgcgat agcgcgctcg ctggcggtgt aaatgttctg 11880

accggtccgg aaatccatgt cgcgatgagc catgccggca tgctgtcccc aagcggcaaa 11940

tgcaacagct ttgacagccg cgcggatggt tttgtgcccg gagaaggcgt tggcgcgctc 12000

cttttaaaac ggttggagga tgcacaggcc aacggcgacg atgtttacgc ggttatccgg 12060

ggctgggggg tcaatcagga cgggcggacg aatggtatca ctgctcccaa ccccgcagcg 12120

caaactcgtt tacaaacaga gctttaccac cggttccata tcgatccggc tcggatcggc 12180

atggttgagg cgcatggaac cggcacggct cttggcgatc cgatcgaagt tgaagcactc 12240

aagcgaagtt ttgctcagtt cactgaccgc aagaattatt gcgcgctcgg gtctgtcaaa 12300

agcaacatcg gtcacttggc cacagccgca ggggtcgccg gcgcaatcaa ggcaacacta 12360

gcgttaaagc accgcaagat cccagccagc attcatcatg atcagctgaa cccgcatatc 12420

gacctcaaag acgcgccttt ttatgttccg cggactgcag cggattggac agctggtccg 12480

gacgctccac agtatgcggc agtgagttcc ttcggataca gcggaactaa tgcacatttg 12540

gttctggaag cggcaccggc aagacctgtt ccggttacgc agacccaagc agtgattgtt 12600

ccggtttcag cccgttcatt ggaatgctta accgaagccg tgacacgatt gtccacctat 12660

ctgggaaccg gtgccggaca gactgtcccc ttggcagatc ttgctctcac ctatcagact 12720

ggccgggata cctttgacca gcgtgtagcg ttccttgccg acagccacga cagcctccga 12780

gcaggccttg aacagttctt aaacgagcct gagcatgctg gcggtgtcgt ctactcaaat 12840

gacatgccac cgacacttcg tgataccgcc acggcctgga tcgaaggcaa gacaatcgcg 12900

tggcctgtgg tagctggagc aagccggcgg cacgggtgtc cgacctatcc gtttgccaag 12960

gagcgccatt gggtttccga tgcgcccgtg gaattgccgg aagctgcacc cataccctcc 13020

aaagagacgc ccctccaacc ggaagccgaa gacacagctg ttgatcccga ttggcgtgaa 13080

cgcttaaaac agcgttttgc ccgaccaatt acactgttgt ctgacgatcc gaagtggatc 13140

gggtccatgg catccctgct gtccgcgctt ggcgctgctc cgggcggacc gggacagccg 13200

gacctgcgca tcaaatccaa tctgcgtgag gcggagggga gcgttttctg cgacacacat 13260

ctcggaacac ggttgcctgg aaacgaacaa gtggatttgt taatcctgac agaacttcct 13320

tcggacccgg gcctgattcc acagcatgcg ctgattgtta gcgacgataa ccgggatgat 13380

atcgaatccc actgccagcg attgatccag gaatggctcc gattggagcc ggacggctca 13440

aaagataccc tgcacgtaca attccgaaac gggcgccgtt tagtagcggc gaagcctcta 13500

gatccggctg acggtgcttg catcttgcga aagacatggc agcgcacgcc tttggctgac 13560

cagaaaaccg ctccatcaga caaaaacgtc tgcttgatcg gccgtggccc caaattcgag 13620

gcgctggctt ctggtcttga ggcccacttt cagtcagtca ctttacggga cactccgccg 13680

gaaggggcga tggcggcgtg ggatgtgttt atcgacgccg ccgctctgac tgaagtgaga 13740

gacaacgatc cggacgaccc tgaccgcaga cactggatcc aatccctcat gcgtgagggc 13800

cgggacctga acttgctgca cttgacgtgt gatgtgatac cgttccgcag tgtttcccgc 13860

aatctggccg gggcgcggca agccgggttg gtcaagaacc tgcgcgccga ataccggttt 13920

gcagagtccc ggtggctcga tctggatatg gcgcaggtcg cagatacagc tggcctggcg 13980

aaactcattg cggccgaatg tgcgtcagcc ggaccggtct ccgaggtttg ttatcgcggc 14040

ggcgcgcggt ttgcgccggt acttgaggca cctgagccgg tcgcatcacc gtccgttcac 14100

ctgaacgcgg aaggactgta tctcataagc ggtggcaccc gcggcgtcgg tttgactttg 14160

gcgcaggacc tggcagccca gggagcccga catctggcgc tgattggtga aacgcctttg 14220

ccgccgatgc aggactggcc cagtctgatc gccgcggctg acacgcctgc tgaaatccgc 14280

agtcaattga gcatcttgca ggcattgtca gatcaattgg aaactctgga aatcttgcat 14340

gcctgcgtca gcgatgcggc caaagtgtct gcatggctct caagtctccg caaacgcggc 14400

ctgccgctca gcggcgtgat ccatgcagcc gggcgctatt ctgaggtaga cccacccggt 14460

tttgccgcca agtctgccga tcacatgcgc gccgtactca cagccaaggc agatgggctg 14520

gagaccctcc atagtcttac gaaaaacgac ccgctttctt ttcttcttgt gctgacttca 14580

ataaccggct tggttccaca cttcgcacga ggcgccctgg attacgccat ggccaatgct 14640

tatgcggatc tttttgctgc caaagcccat gaactggatg gtggacgcac ccggtcgaca 14700

attctcagtg actggacgca aagtggtgcg ttctgccgtg tcagaccaga gaaagccaag 14760

tcggtccaaa agaatttcga tcaaattgga ttaaagacct tgagtgatgc tgaaggctgc 14820

gcccttatcc ggcgggcgct gtctcccact gcggagaccg gcacaatctt gggtctgatc 14880

gcggaagacc ggtttgctgc tgcccgcccg ggcctgctgc tggccggaac gttaaacgat 14940

gaggccttgg acatgaatac ccagcttgca cgctgggaaa aaatccgctc ccgcggggat 15000

cttgtaacca ttgaagacgt cacatctgta atcggcctgg aacagatccg tgaattgccc 15060

ccgcgcaaat gcttcgcctc caccggatca tgcttggccc cactgaagta gttcctcccg 15120

aagctgagga tgagtctctg ccggacatga tcgccgggat tgtctgcaac gtgcttaaac 15180

tcaaggagat cgaccacaat acgccgttac agaactacgg cctcgattcc atctcgggca 15240

tgatactgag cactcggctg gaaatagctt tagacatgac ggtcgatccg cgcacattaa 15300

tcgatcatcc aagcatcgcc gccttatcag cctatatcca aaaagcacgg gaagcggcat 15360

gagccagagc atagaggaac ttttaggagt cgatacctta ccgaagccgt ccaggcggca 15420

aaacatgcga tttagctgcc tgttcttttc cgatgtgcgc acagacatct catatgccga 15480

gaagtaccgg tttcttggtg atgtcacccg gttcgccgat caaacgggtt tcgaagcggt 15540

ttatttcccg gaacgccatt tccacgaatt cggttcggtc tttgccaatc ccgcaatcgc 15600

cgcagcgcat ctcattcccc aaacacaaaa catccgcttt cgtaccgctg gtgtcaccat 15660

cccgctacac catccagcgg agattgtgga atggtgggcg atgaacgatg ttctatcggg 15720

cggacgggtg gatcttggct ttggctcagg ttgggccaag ggagatttca tctatgctcc 15780

agaaaacttt gaagatcgcc gcaaaatctg cagcgacggc atagagacaa tcaaacgttt 15840

gtggcggggc gagacgctcg cctttcccgg acccgggggc gatgttgtcg acatcaccgt 15900

ctacccccgt ccaatccagt ccgatctggc ggtctggttg ctgataactc agaacgaaga 15960

cgccttcatc cacgccggaa agatgggcta caacgtgttc actatgctct atgggaccaa 16020

cctggagaac ttgtcccaaa agatcgcctt gtatcgcaag gctcggcagg aggcgggcca 16080

tgatccggtc agcggcagag taaccctcac gcttcatacc ctgctgctcg acaccatgga 16140

ctcagttctg gcagccatcg aagtcccatt ccgccagtac atccaaagca gcctgaacgc 16200

ccacgtgaac gccggtgcgg tcacaggcgc ctcagcagat ctgagtgacg ccgaccgtgc 16260

caaagtgctg gattatgcct atcagcgcta tgtcaggaca ggtgcattat tcggcacgcc 16320

cgatactgca aaagatatgg tcgacgaggt tatcgccgct gatgtcgatg aaatcgcctg 16380

cttgatggat tttggtgccg actatgacat tgtcaggcac ggctttacac atttggcaca 16440

attggctcaa cattacagtt cacctctgtt gacaccgtag taccgacggc cgagcacaca 16500

tttttctttc aagggccgtt tcaagatcac catcacaatt ttagcaggaa atccaatatg 16560

gctagcgaac tcaaggatct gcgacagcgg ttggttgacc ggctttcggc tacggtagag 16620

cagaagattt cgtcaatcgg atacgtgccc gaagatttgg tccgcattgc gggctccggc 16680

gtgccagcag aacccagtca tgatgaagtc tataaagccc cggaggactt gaaagaggcc 16740

atcaacgaac actacgattt ctcgttttat gctcgcgaga cgatctgggc cgatatgctt 16800

gctggcacgc attttcgaaa tattggctat tgggatgcaa atactgaatc tctggatcag 16860

gccggccgca atttgcagga tcaactcctg gcactattgc ctcaaaaaac cggacggatc 16920

cttgacgtag cctgcgggat gggcgcctct acaaaacggc ttctggacac ttaccggccc 16980

gaagatgtgt gggccatcaa catctctgcc aaacaaatcg aaaccacctc tcaaaacgct 17040

ccaggctgca atgcacaagt catgagcgca acggagatga cttttgaaga caattttttt 17100

gatgctgtcg aatgcatcga agccgctttt catttcgaca cgcggcgcaa gtttctggaa 17160

gacaccctgc gcattctgaa gccgggaggc cgcttggtca tgtccgatgt tctgatgact 17220

tcaggggctc ggctggagca atatccggtg ttccccaacc cggaaaacca cattgccacc 17280

atcgaagatt acaagtctgt cttggaagaa atcggatacg aaaacatcac aatatctgat 17340

gagcggaaca atatttggaa atcgcatttc atggccacaa ccaaccggat tcacgaagga 17400

tttctagcac ggaagtataa tatcgttgag gtcacagaca tgatctggac gtattacgag 17460

ttggatgcaa ttaccggccc ttgcccgatc ctgggcgcat ctaaacctcg ctaaatgttt 17520

agtacttcgg atgcctatcg ctaggtagga taaaggtact ttggttcaaa cagagactga 17580

caagcatctt tatcgcttga gcgttacgat taagctctca aggctgcgcg cattggttcc 17640

catgtttaac caccttggcg gttcttgcag ctcaatgtca gcaaaggcag aaagcaggca 17700

ctgaaatgcc aaacgccctt ccattcgggc caaaggggct cctaaacaaa aatgtgcgcc 17760

cccgccaaag gtatgatgcg cattgcctgt gcgtgtaata tcaaaccggt gagggtcctt 17820

gaagcgagcc ggatcacgat tggtggcacg aagcaatcca atcaccggcg ccccttgcgg 17880

aattttcaca ccaccgatct cgcacgattg tgcggcaacg cgcagcagga aattacctcc 17940

cgggtcatag cgcaaggttt catccgctgc attgcgcgcc agatccggct gcgctcgcag 18000

ccgctccatt tcttttgggt gttccaacag taactttagc ccgatcccga tgagggtcac 18060

ggtcgtctcg tgtccggcaa tcaacagagc aacgagattt gtcagtgtct cctcttcgtc 18120

cagcgtgccg ttgtccaggc cctgtaatgc cagccgcatg aggctgcctt cagttccagt 18180

gctgctgacg gacaattgct ctctcagata ggatttaaat gccgtcagtg cctccagtcc 18240

gtcggacttc tgctggtcgg ttaacatcag atcgccaatc tggatcaact tcttagacca 18300

atcgctcact gtatctgcca tgtcccgcgg aatatcgaaa aggcggcaga gcacattcaa 18360

aggcatgggc tgtgcgtagg catcaatcag attaaccggg cgtccgtcac tcggtaaggc 18420

agcaatcagc ctttcagttt cctcacgcac catcccttcg agttgagcta cagcctgggc 18480

tctgaaagcg ggttcgtaaa caccccgcat tcgagcgtgg tctatcccgt ccacattgat 18540

catttgcggc tggaataagg aaaaaagacg gaaggctacc ggatcccgct cccgaaagcc 18600

gggatcggaa tgccagcctc ccttccagtt gcgcgaatcc cggccgatag ccttatttcg 18660

catcgcctcc gagaattccg catgaccaag aataaaataa cacccgctcg ccgggtcgaa 18720

atggatggga ttttccgcac gcaacacatc caggcggtca tgtggatcgg ccaggaagtc 18780

agggtccgcc agcatcgtcc accagtccgt atctgtttcc tccggtacgc tcatcgccga 18840

tctccctttc ctcggccgct tatgatagcg ccgtcccggt ctgccgaagc gcattaaatt 18900

gcgctcccag ataagaagcc gtttgatcca tgagatgcaa ccctatgtaa tcgacatgac 18960

ggttctgcca cttttccaga tccgtgccgg ctacataggt gttgaaagct cctaaggccg 19020

ggccgcagta gacctgccag tccgtttttt gaccagtttc cccggccaga gccaaacgca 19080

ttgaatgaat gaaataccaa cggaagatca atgccatctt gacctttgga ttgcgttccg 19140

cacgttcaat ttcctcaggt gcagctttgt cgtagaacga tcgggtttcg gcatacacgt 19200

cttcgaagga gcggcgaaaa tacttgtctt caatctcttt gcggatcgca actggcagcg 19260

cttcgaggcc tggatgggcg cgccaaagat cgtacagctt gttggcacgt gcggggaaga 19320

gcagtccttt cttcaagact tgcactttgg cacccagttc aaacatatcg ccggccggag 19380

cataagccgt gtcttgaacc ccagtgcgct gcaatacttc tttaaccgcc tcactggtgc 19440

cagcctcagg cgtacattga ttgatcgatc cagtggcaat gtaatccgcc cccagaagaa 19500

aggctgttgc cgcagcttgc ggcgtcccta ttccgccggc tgagccgacg cggctaggtt 19560

gggcaaaact gtgctgagcc tgctgagcgt cacgcagagc gatcatcgct ggcaaaagcg 19620

cacttgtaac cccacggtcg gtatgcccgc cggaatctgc ttcaaccgtc aagtcagaag 19680

caaccggaat gcccggagca agggaggctt cttcttcagt gatgagacct tgggacagca 19740

gtcgctggat caattccggc gtcgcaggcg caaggaatgc ggaggcaaca ccaggatgtg 19800

acactttggc aaacacccgg tttggcacat ctagcgcccc atcccgcagt ttcgccccct 19860

ttagacggta tttcaccaac gcttcggtta cctccatgaa ggccgaagct tcgattacac 19920

ggatgcccag ttgcaggagc cgatccacca taagcatttc gcgtctgggg tggagtggat 19980

cggccaggac gttgacgcca aacaccgagc caggcggaac cgtctccttg atcctgcgga 20040

tttggaccgc agcgtcctct atcggtactc ctcccgaccc atatattgcc aagagccggg 20100

cctgtgccat acggatcacc aaatctgccg aggcaatccc ctttaccatg gcaccggcca 20160

tataggcgtg gctcacccca tagtcatccc gaaaagcggc cgagcccaaa tgaccggccg 20220

cgatcatcca accgcctcgc caagatggtt tttcaaggcg ctcaggtttt gcgtatcagc 20280

cccaaaaggg gtcatgaccg caaaactgcg cgcacgcaaa tcatcgccca acccgtaaag 20340

gcacgcggtg cgcaagtttc cagccgggcc gcaatcgata taggtggcct tcgggtattg 20400

agcattcagc gccagcaagg tttcatgcag gcggatcggt ccgcgcacaa ccttccacca 20460

atcccgctcg accggatcaa atggccgtcc tgtgccatcc gatgcaccaa tcacaggtat 20520

ctgtgccgcg ccccagctaa acgcgcgcag tgcagccctg aaggaggttt cgatcgcctc 20580

aatcccggag ccgtgaaaag cataccggac cggcaagcgg tgatgggaga tatcgcgggc 20640

tcgcagatca tcggcaatgt cattaatgcc gtttgtgggc ccggtgataa cgaaacaacg 20700

atcaaatacg acaccagcca gctctgaaga gccacgacga taaatcggat cagcttcaaa 20760

ttgagctaaa tcatcgagca ccatcaacat agcgcccggt tccgctttcg actgaattgt 20820

ccaggcctgg cgcagcaacg ctggcaaaac ctcctctggg gatatcgccc cggaaacagc 20880

cgcggcgaca tattcgccca aactgacacc gagcagcaga ttcggtttcg gcagtccttc 20940

ggcaatcaga gtttcagcca gcgccacctg aaccatgaac agcgccggat gcgtgtcggt 21000

caactgatcg aatgtgtccc caacatgggc gaaatcatca taaagaacgt ctgtgaccgg 21060

atggtcaaga taaggctgta gtgcttcctc catccgcaac atactggcgc gaaaaacggg 21120

atgcgcatca tacaagcccc tgcccatctg gaagtactga gccccctgcc cagcaaacat 21180

ccagatcacc ggatcgggcg ccaaatcggt cggccatgga tgggagaaag cgttcacagt 21240

ggcgagtccg ttgaatgact taaacaatac tgtaaggtat tggtgagtgg tttgaaatac 21300

gcgctatcat attaatagac ataggttcga gatgaaggcg tttttattcc ccgggcaagg 21360

gtcccagcac atcggaatgg gcgaaggcct gtttgagcgc tattctgaaa tgactgaggc 21420

cgcagatacg gtcttgggtt attccattgc cgatctctgt ctgcgggatc ccgacaagca 21480

gttgacgcaa accgaattta cccaacctgc tttgtttgtg gttaacgcca tgatggcgcg 21540

cgcgcagcaa gacgacagcg gagcaccaga tatcgccgcc ggccacagtg tgggcgaata 21600

caatgccttg catcaggctg gtgtggtcaa cttcgaagac ggtttgagat tggttcaaaa 21660

acgcggtgcc ttgatgagca cggcgcccaa gggcggaatg gcggcagtca tcgggctcac 21720

accggatcgc attgcgacgg tcttgcagga taacggcttt gcgtcgatcg atgtggccaa 21780

cttgaactcc gacaagcaaa cgatcatttc cggcctcatt gaggacattt cagcggtaga 21840

accgtttttt tccgatgctg gagcgatgta tattccactg aatgtctcgg gcgcgtttca 21900

ttcccgctac atggctcctg tccaggagga atttgaagca tttctaggcg agttccgttt 21960

tgaagcgccc ggcatccccg tgattgccaa tgtggatgcc cgaccttatc aagatggctg 22020

cactgctcaa atgttggcgc aacaactgac ctccccagtg cgatggcaag aaagtatcgg 22080

gtacatgttg aatttgggtg tgggacattt ttttgaaacg gggcccggca atgtgcttag 22140

caagctggtc gcgggtatcc gtaaacagca tgtggtgaca cccgtggaaa cggagcttcc 22200

gccccaggcc ggcagccctc cggtgctgca ggaggaaacg caggcacagg aagcaaaaac 22260

acctgtccaa atcgtcgaag actggaacac acagcattct gcgggtatcg atgtccaggt 22320

aaatggctat gacggcgtaa tgaaaactcg cagcgaagcc atccttcttt tcggccatcg 22380

accagcagtc tacatggaag gctattcagg ctattttgca ctgtccgatg tgaccccgat 22440

agaggcccag ttgtcctaat caggtgcgga atagcgaata aatcccgaac gattttcgct 22500

cacacctcgc tcggattctt gagtttcaac tggctctaga gttcccaagg gaatttctgt 22560

tctgtggcat aacgttgcaa attggcgcga atgctcgaat cgccaaacag ggaccggttt 22620

tcagcgatcg ccttgtccct actttgacca agtgacttgt cgaggtccgc gcgataggct 22680

ttgaaacgtc gtattgcttg cgggtccagc cgttcaatac ggcgtatgtg ttgtgccaga 22740

ccaagttcga tttccggtaa gatggaatcc accaaatgaa gggacaacgc ctgctctgca 22800

ttgatggatt gggtgcttaa agtcaaatag gacgctgcgt gagctccaat ccgccgcgtc 22860

agaaatggca ggacgcaagc tggatgcagc ccaaacagca gctcgggcaa agtgaaccgg 22920

gcatcgggcc ctgcgaggac catgtcactt gcggccacaa agccgatacc ccctgccgtt 22980

gcctggcctt caacgacgct gagagaaaca aacggtccga gtgccagccg ctcccaaaga 23040

tgataaagcc tttcggggtc caccggatct ccgccgccga aatccgcccc ggtgcaaaac 23100

accgtttgag agccgcgcag gattatcgcg gtgcatccgg cttcctcggc ccggtccagc 23160

gctgcatgag catcctccac caatgcctct gtgatggtgt taccgctctc aggccgatca 23220

aaccataatg ttgaactgcg gccattttgg gtgatggaca gtggcgacaa catccctatt 23280

ccctagtcag aactcaaaac cgtggcgaga ttaaatcctc caaaccctga ggacaggcac 23340

atggcagagt taaaccgtcc ggactcgggg ttatctagca catagttcaa atccgggagc 23400

gtcggctgga ccagtccatg aatcggcgcg atttgacctg cctccatctg caggaaagcc 23460

agggcaattt ccacggcacc agctgccgcc actccatgcc cgagtgcgga ttttggagcc 23520

gtgacatgaa cagaattgag taactgggcc accaaagcct gggcttctgc agcatcgcct 23580

ctcggcgtcc cggtggcatg ggctgaaatg aaatcgagag aactaggggg aataccggca 23640

tcagtcaaag ctgcggtgat ggcctcttgc agcgcatttt gtgacggttc aggcccgcgc 23700

gtctgggcct ggacgcggcc caggcccgat atacgcccat aggactgcgg gcccagatca 23760

ctccttgcca aaaccaaggc agcggcactt tcaccaaaca agaaaccggt accggctgca 23820

tcgaaagggc ggcagcgcgg ctctggcata agatcaccgc tttcatctga aagatgcgga 23880

cccatggctc ccaaattgcg aagcgcctgc aattccaacc aggacatatc ctgcaatggc 23940

ccgataacca ggcagatatc aagctcaccg gagcgaatgg cggcagctgc cagatgaact 24000

gccagcgcac cactggccga agccccgcca acgctcatga tcgggccatc caataccagt 24060

tcctcactga tcaaggcggc gacatccgta tccagaaaac tgtgccccag ccgcggcggc 24120

gcaaggttcg gcgaggtatt aagaagtttg ttgcggatca attccatttc gcgtgactgc 24180

aaattgctgc cgccaaggat cacacccgtg cggccggaga gccggtgttc tccggggtct 24240

ccaaagcccg catcctgcca ggcttctgcg gccaccgctg cgcagacctg cccagtcaag 24300

ccagtggtcc gggacgcccg ccgcgacaac acctgaggga cactgtctgg cagctcgatg 24360

ccaatgaaag ggggattccc ggcgacttgg cgcccttccc tttcaagtgg tcgaaacagg 24420

tttttgccag taagcacccc ctgcagcgcg ctggacttgc caaatccata cccgcaagcc 24480

aaaccaatcc ccatacaatg cacagtacga tcagtcatga gctgttgtta gtttgccgtt 24540

caggagattt gccagaaacc tggaatgctc accttcaagc attgaaagat ggcctccagg 24600

aaccggctgg atatccaaaa cgcccgcttc agccggccac ccccgcatag ccgaagaaat 24660

ctctgcacct tccgcatgaa agacagacgc cgcaacggaa actggctctg gagtgtagcc 24720

gtcaacggct ttcgcaatgt gtttgtaatt attgaaaagc gtgaggagca cctgaaagtc 24780

ttcccccgtg ttttcggcca tattttgcag gtatttctcc ggcgcgcctt tgggctcagc 24840

actcggcagc tccgccgcga gccccatatc ccgggcaaat ccagcgagaa gcgccttttc 24900

gtgatcatgc ggctggatac gattgtcaat atgggaaagc accgcagggg gataagaatc 24960

gatcaatgtc agtgaggcca attcgccgcc cgaccgttct atctgccgcg ccatttccca 25020

agcgacaata ccgccgcttg accatccggc gagatgaagc ggtgcctgcc cttgatcaaa 25080

ttcaagatca gccagatagg ctgttgcggc atccgggatc gagttccacc gatccagccg 25140

gttcatttcc agaccgagaa tggaaaatct gggatccaga tgtttcatca aggtccggta 25200

acaaagcaac gtcccaactc cgccatgcac cagtacaaga cccggaccag acccagcttg 25260

taaattcacc acagatgaac gattaccttt ggcacgttca atcagcacag cttgatcggc 25320

cactgtcggt gcctggaata gctgcgctac ggacaattca gccccaagcc gcgaacgaat 25380

ttctcctgca aaccggatta acagcagtga atgcgcgccc aattcgaata tgttcgcagt 25440

caccggtact gagggacagt ccaacagttc agcccataag ctggccaata ctttttcgat 25500

cctgctgaga ggaccctccg gtattgatac tgatggagcg ggcgccccgt tcaacgattg 25560

ccgatccagt ttcccggcaa tcgtttgcgg cagagccgtg acaactcgaa tttcacttgg 25620

ccacatgtaa tctggcaaac tgcttttaag cgccctggat atggcagccg gctccagatc 25680

cgggtccgat actgtgacat aggcctgcaa cgtggtatcg ggcttgcgat ccgacaccgt 25740

gaccgcagcc cgcagcaccc cgtcaatccg ctccaaaccg gcttcgacct cggctaactc 25800

gaccctaaaa ccgcgaacat tgacctgatt gtcacgccgg ccaaggaact caagctgtcc 25860

atctgtccgc cagcgcgcca ggtcaccggt tttatacagc cggtctgctt tacctcccgg 25920

ccccgaggaa aaaccgcctt gtttgttctg cgctgcgatg tatccatccg caagaccgac 25980

gccgccgatt gcaagctcac cgatcaatcc ggctggtaaa ggctgatccg caacatctag 26040

cacaaacacg ttttctcctg gcaacggccg gccgatcggc agacgtcttt cgggtccgtc 26100

catttgtgcg cggtaaacaa aagcggtact tccgattgtc gtttctgtcg gaccataaac 26160

attaacaaga gcccgatccg ccaaaggact gtcgcaccag gtgctaaggg tgttttcggt 26220

caaggcctcg cccccggtca caaccgtgcg cagactttgc agcagctgcc agtcatcact 26280

ccgcccaaga tcgcgcagga cttcatccag aaaagcgggc ggcaaatccg caaccgtaac 26340

cgcccagcgc tgcacggcct ctgcaaagtc aagcgcggac cataatcctt cggggcgcat 26400

cacgaccgtg gcgccacgaa ccaacgttgt cagccattgt tcaaaagccg catcgaaact 26460

ggtttctacg aattgcagaa cccggtcctg gtcattgacc gcaaaaaggt ttgccatcgc 26520

ttgaatatga tgagccaggg cgtggtgggg cacttgtacg cctttgggac gccctgatga 26580

tcctgacgtg aataggatat aagcggcagc ggccggatcc tgaatgaccg gcgttggcag 26640

cacgccggcc gtggccttgc tgatttccgt tctctcatcc acgcgcatct gacgaatgct 26700

taacaggctt gccgtctttg catcggtcaa cgcaaggaca ggagctccat cagcgatcat 26760

gtcgtccaac cgtgacgacg actggaccgg cgaaagcggc atgtgcaccg ccccgaccca 26820

ccatgtggct agaaccgcga ccagcgaatt tgcagaacgt gccaaacagc ttgcgaccac 26880

atcacccggc tgaacacccg catcgacaag ccgggcggca aggtcaccag cattctgttc 26940

caatgcagcg tttgtcaaaa cggtatcgcc gcaaatcacc gcaggggcat cgggagccat 27000

ccgcacctga gcgcgccagg ctggaataag cgcttcgtcg ggtgcaggcg gaccgccatg 27060

cccccagtca gtaagcacct catcatccgc acccgccagg gacacatcca ccagagcccc 27120

tccgggatcc gcaaggaaag ttgaaaggac tttttgataa gcatccgcca aagcagaaac 27180

agtatcggat ttgaattgcc tcgcattata ggcaaaccgg caacgcattc cttccggtcc 27240

gggataaacc tccagagcca gatcctgaac gccctgttgg tcaatcccgt caacgactga 27300

gacctccagc gatccgcggt ctgtgttttg gggtccgacc agcgattgaa aagcaaactg 27360

aacccgcggc atcagcaaac ggccggtgcc ggatacttcg cccatctccg acaaaggcaa 27420

atccccgtgc tccagcgcat tcagcattgt ctggcgtgtt tccctcacca agtcgcggat 27480

actgacctga tctgacagtc ggatgcgaag aggcaagaga ttggcgaagt agccgacagt 27540

atgatcgaaa ctgcgatcgg gccggcccaa caccggcaag ccgataagca gatcatggga 27600

ccctgtcaaa cgatgcaaga tcagcacgaa cgcagccatc atgaattgcg ctggcgttgc 27660

cccgtgtgcg gtcgaagctt ctgtaatacg ccgggctgta tccttgtcga tccaaagcac 27720

atgactgccg gcctttgagg cgcactccag gtcagcatcc cagtcccccg gcagacacag 27780

ctcgttatgg ccctcgagct catcacgcca gaaagcacgg atgttggttc cccgttcgct 27840

ggtcaagagg cgttcctgcc agcgctggaa cgcatcaaat gaagacccaa ttgggcgtgg 27900

aaggcgcacg ccctgcagcc gggcttcata gagcctcatt aaatcatcaa tcaggatcat 27960

tgcggattgc ccgtcaaaga cgatgtgatg cacgcaaatg atcaagacat gccggtccgc 28020

cgcctcctgg atcaacaggc ttctgaccaa tggaccattg gtaagatcaa atggcaggcc 28080

tgcgaaggca tgcaattcgt tttcgatcac gctcgcaggc gcgccggaca ggtccaactc 28140

ttcaatggga tacgagattc cgtcctggac aattcgttga ggcattccgc cgttggccgt 28200

gaaaacggag gtgaggactg gatgccgttt aagcagatcc gcgaatgccg cgcgaagcat 28260

gtccttgtcc aggctaccgg ccagccgcaa tgccatcggc acagtgtagc cagcgtcgcc 28320

gggtgtcttc tgatcatgga gccacaatgc aatttgccct ttggtcagcg gcaaagcggt 28380

gttcacggcg tcggaggttc ctggctgcgc atgtttagga ttatccattg gcgcatagcc 28440

gtctttcccg gcaatccggg aaagcagcgt ggccagtgat ttgctttcca tgatgtcgcc 28500

cagaccgacg gttaggccac atcgggcctc caaggcttgg cacagcggca tcaacatcac 28560

ggagttcagc ccgtgatcca acgcagaccg gcgaaagtca atttcctccg gggctatgcg 28620

caggtcgttg atcagataat cccggataca ggtttcgggg tcggtagtgt cagaacgggt 28680

gtctggctct agctgtgata cagcctcgcg cgcatcaatg ccgccgagcc aatagcgcgt 28740

ccggcggaac ggataggccg gcagtgctaa acgctgcgcg ccctcggcct gcagtgggga 28800

ccagttaagt cgtgcaccgt ggacccaggc caccgccagc ttcctcaagt ttcggtggcg 28860

caacaggagt gacactattt ctgcgcctgt cttgcctgtc agcaggccgg aaagggcatc 28920

ttgaccagtc attgtattgc cggtgaccag cccatccgct tccagtcctt cagccagggc 28980

ctccagttgg tgcagcaatg cgggcacatc acgtgaaatc attgccgcac gctgatccag 29040

ctggctgcgg ccggtttgca gggtcaacgc caaatccgcc attcgggtct caggacgggt 29100

ttccagatat gtcttcaacc gtcccgccaa gaccctcaag tccgcttcat cccgggccga 29160

aagcggtatc agatactgat cctgcgcaac tgcggccggc ggcgcacttg ttttgggagg 29220

ttcttccaga accatgcagg catttgtgcc cccggcaccc acggaattca aaatcgcccg 29280

caatggctgg ttcgagcccc cactggccgc atctgaccct atcgggcgag cccaggcttg 29340

caactccgat tgcagccgaa acggcccaga ggaaaaatct agcttagggt tcaacgcgtc 29400

agttccgagt gttggaacca gggtttccgc ttgcatctgc agcacaactt tggccagttg 29460

cgacaagccg gaagcggatt ctgcgtgacc gatattcgat ttgaccgagc caatcgcaca 29520

gaatttctgt tccggcgtca aatcctgaaa ggcttgccga aaggcggcca gttcgatgct 29580

atcgcccatc gccgcgccat ttgctgcagc ttccgcatag gtgatagtgt ttaccggcac 29640

gccagcctgg cggatcgtgt cgccaatcaa tttggcctga gcggcaacac tgggcacacg 29700

gtagccgttg gaccggccgc tgtgattgat cccggtcgac ttgatcagcg ccaggacacg 29760

atcgcctgcc gccactgcat cgtccaacgg ccgcagcagc accgccccca ccccttcagc 29820

cggcaagtac ccgtcgccat cgcggaaact ggtgctgtct cggcgcgacc ctatgaactg 29880

actggctgac agcccgatgt atttctttgg gtggatcgaa acgttgacgc ccccagcaat 29940

tgccgcccgg catgcaccgg cccttaggct ttcgcaagcc atatggatgg cgacgatccc 30000

cgaagagcac atcgtatcca ccgccaagct tgggccattg aggtccagca cgttggagac 30060

acgatttgcg atcgaactcg gtgacgacaa gactgtcaac gcttcgcgca atggatctga 30120

acgaacagcg tgatattgct gggtcataga acccgcaaat acaccgacag cgctctccag 30180

atccacgcgc aacgcaggac ccatgtaacc tgccttttcc atcagggccc aggcggtttc 30240

cagaaacaat cgttcctgcg ggtcgagaag ttcggcttca tccggcgtta tccggaagaa 30300

acgtgcgtca aacccatcca catcggaaag aaaaccaccc catttacatc gggctttgcc 30360

ttcatatgca ccgtctgggt caaacaaaga ttcggcgtcc cagcgatcct tgggcacttc 30420

agtgatactg ttgcgcccat ttacaagatt atcccaaaac tcctccagat cttcggcacc 30480

aggaaaccgt ccttccattg cgataatcgc gatatcaccg gaaccggcag attgcgtgtc 30540

gggtacggcc gcttcagcgc ggaccggttt agcattgttg tcaagaagcg ggtcttcact 30600

cggcgcctga tcttctgccg ttcccccagg agctggttcc agaaggtcca cggttggctc 30660

aggcacatgt aaagcctcca tcagggactg ggatgccaga tctgttaacg cgccggcagc 30720

agcttcaatt gtcggatttt caaaaaacag tgtggccggc aaaggcccgg tcacggtttc 30780

gatcgacgcg gtcagggcca tgattgccac cgaatccacg ccgtagtcca ccaacggaac 30840

atccgcttcc agccgctgcg gcgagatacg caacaccttg gcaagttctt ctgccagata 30900

ctcctctaca gcatcttgca agtggaagct gcttggcggc ggcgcgggtt caggcccagc 30960

gggggcgcca gccggctggc ctgcgtctgc tgctgcgatc aatgccgcca aacggtcacc 31020

gtcgccttcc agaaccatag tttgcggcca tccggccctc acgatcctat ccagagcttc 31080

caatcccctg gctgtggaaa ggggaaccaa tcctgcgccg tcgcgcatcg cattaaccgc 31140

cgcagcgtca agcgtcatgc cgccgtccgc ccagtaaggc cacgctactg aaagagccat 31200

tccccttggc ccgccagggc ttagcgcacg gcggttccgt tcctcgacgt attgatcaag 31260

gtaagcgttg gccgccgcat aatcggcctg gcctggattt cccatcgttc cggcgatgga 31320

cgaaaagaca agaaaaagat ccagatccaa tccgtccgta gcgcggtcaa gattggcaac 31380

acctgttacc tttggcgcaa agactcggcg cagatcttct tcggttttgc gcaagatcaa 31440

cgcatccgac agcacgccgc cacaatgaat aaccccatga agcgatccct gatccgtcgt 31500

ctggcggatc atagaccgga ccgccgctgc atcaccaaga tctgttgcaa gatagtccgc 31560

atgggccccc ttgctccgca gttcttgcag caaagcgttt tgtttgggac cagatgggga 31620

ccggccggtt aaaaccagtg aaacccggga cagtgtctgt gccaaatggc gcgccacaat 31680

ggcgcccagt ccgccgcaac caccgacaat caggtaacgt ccaccttccc tccatccccc 31740

gccgggctgt gcatcggcta cgtcctgttc ctcttgccaa gtcagtgctt gccagcgccc 31800

gtcttttttg cgcaaacgag acttgccggg ccaggcagca acagctttga gatcggcctc 31860

caatggaccg gaggccggat catcggtgtc aaagcacaga acctgacagg tcaaacgtgg 31920

aagttcacgt gccgcgctgt cgagcatgcc ggccaatgct gcgctctgag aataggaagc 31980

cggcaatacc acctgataat gaactttctg atccgagctc tgcagcgcca gttccttcag 32040

atcccgcaac agggccagcg cctggtctgt aaacgtgttg ggatccgctg gatcgctggc 32100

tggaagggca agctgagcgt gctcctgcaa atttctcatt ggcccgatat gagcgacacg 32160

gcgcaaggcc gggtcaatag acggcgctgt cagcggcaag tctttccact gcggacgcaa 32220

caacagcaaa tctgtatgta acaccgaggt gtgcccggtc gatttggctt caagtgctct 32280

ggtttcggtc gtcttggctg ttgttgccgc agtccgcaac gcaatgggtg ctggctgagc 32340

cgtggtatca ggccaataaa tctcgcgtgc aaatggatag gttggcaggc tcagccgccg 32400

cgcttcgccg ccatagattt tccgccaatc gtaaactgta ccttgcatcc agccgtccag 32460

aagaacttcg gccgcaagac catcgggatt ctccactgtt ggattgctga caacccgtgc 32520

acgcccggag cgaaccggac cgtcacgtcc ggccaagaat tggcgtaaat accgtgccaa 32580

ctcctcgaca gtgctgactt gcacgccgat gcggtgcggc attggttcac ggccaacctg 32640

cagggtgtag gccagatcac gcaacgaagt ctccgctggt gcattttcgg cccaatcagc 32700

gagcgcgcag gcataggcct tgagccggtc ttccgccttt gcagacagag tgatcagaac 32760

aggcccataa gaatatggtt cgacggacgg aggggggcag tgttcctcga ctaccaaatg 32820

agcattcgac ccacccgcac cgaaggaaga aaccgcagaa acgcgaggca gtgttttacc 32880

ttcatgcacc ggagcgtccc aggtacgcag gcttgtattc acgcgaaacg gagttgctgc 32940

aaaatcgatg tttgggttga gggtctcagc atgcaaagac ggagcaattt cgccagcctt 33000

gagctgcagg agcactttgg tcagccctgc cagtccggat acggcctcgc catggccgat 33060

attggatttg gctgagccga tccagcacgg cccctccaga accggcccat acccgtcatt 33120

caaacccttg atctcgattg gatcgccgag tttggtgccg gttccgtggg cttcgacata 33180

gccgatggcc cgcgggtcta cgccggcctc cctcagagca cgggcaatga catgatgctg 33240

cgcctctgga ttgggcaccg tatagccgtt ggcgcgccct ccgtggttca gcgcgctccc 33300

cttgatcaca ccataaatat ggtcgccatc cgcctccgcg tctgcaaggc gtttcagcag 33360

cacaacgcct acgccttctg cagggacgta accatcgccc tcacttccga aactttggca 33420

ccgcccattg ctcgaaatga actggccctt gctcaaaagg ctgtatttgt tgggatgcag 33480

attcaggttc acgccgccgg caaacgccat ccggacccgt ccaagagcca gatccgcgca 33540

ggccagatgg atcgccgtaa gtgaactgga gcacatggtg tcaaccgcca tactcggacc 33600

atgcaggttc aaggcatagg acacacgatt ggcaacacct gcataataac tggccgtact 33660

cattggctca cccgccagac tgccttgcaa tccaagaagc tggtattcgc cgtacatgac 33720

acccgcatag acaccaacct gtcccggcag gccatcttcg tccaccgact gggcctggag 33780

atccccaggg cggtaaccgg cgtcttccat tgcggtccag gcatgctcca ggaacaaccg 33840

ctcttgcgga tccatggctt cggccatgcc aggtgaaatg ttgaaaaaca acggatcaaa 33900

ggccgccaca tcatcaataa acccgcccca cttcgaaaag tgagcgtcga tgcggctgcg 33960

gtcggtcgag aagtaatctt gccatttcca ccggtccgcc ggcacttctg taatgccgtc 34020

gcggccgttg cgcagattgt cccaaaagcc agcgatgtcg taggcctgcg gataacgccc 34080

ggcaagacca atcacggcaa tatccaaccc gcccgttttg ggctctgtcc gcggtttggc 34140

cgcggcatca acgctggcag gcgtcccggc cgctccccga cccttccgca caactgtggt 34200

cagcgacggg ccgtgcgcct cgataaagtg gtccaggaca gccccaaggg tctgatgttc 34260

aaaaaagagg gtcttggaaa gcgttccgaa ctctttttcc agaaccgccg tcagttccat 34320

gaccatatgc gagtcgaaac cgtagtactc cagtggttca tccagatcga tttcgtccgg 34380

tggacaggcc aacgcttcag aaagaagccg cttgaaatag gcggcagcag cgtccttcag 34440

gccgtcctgt gccggaacgt tcactggatc ttgagcgccc aaggcttgat gggcgggggt 34500

ctttccggcc tcgggcagcg ctacccgccg ggtggaaaag ccgttaatcc gggtcaagac 34560

ctgccctgac tcatcacaga gggcaatgtc gattttttca atcccgtgcg cggccgaggc 34620

gacacttcgc cgctcaagat gaacccgcat gcggcttttg ttggcggtca gacactgcag 34680

gctttcgatc gcaaagggca gggccaagtc accgctctgc tcttccccgg ccaatccgaa 34740

tccgattgcc gcctgcagag cgccatccat aaggctggga tgcaagacga acggttccac 34800

tgcagatccg caaatctccg gcaaggacaa gtccgccacg acacgcgatc cgtcggagac 34860

cagccaattc aggcattgat gtcctggtcc gtagtgcaaa ccggccgtct caaacagcga 34920

ataaatctcg ttggacggaa tacgccggcc agaggggata gcgtcgttat tgatgatttc 34980

cggcggcact tccggcaggt gcgcgattgc cccgcggcaa tgcaaccgct cacctgaatc 35040

accgtgagac agaatccgga aaggatactc ctgccccgga ccaggagaac ccaaaaccac 35100

ctgcagcgtc tgcggttcgg aaatgaccgc cggctgcacc cagaccacgt ctttcaaggc 35160

aaggtcgcgt gattgcaaat gcaaacaccc ggcgctgcgc gccaattcca gataagccac 35220

acccggaagc accggctgcc cctgtactat atgatcgcgc agaaagaact catctccgga 35280

tagcgaaacc tcaaacaccc catcagactt gcgagtcagc gccatgccgc ttggtaggct 35340

tgtgtccttg atctgcggaa ccgcagctga gggtttcccg ttcaacgtat caaaccagat 35400

gcgttccttt ttgaaggacg tccccggcaa aggcacgcgc cgtagatcgc gtccgtccct 35460

ttcagcctcc caatcatacg ctgcgccgcc aacccaaagc cgcgccagct cttccagagg 35520

cacgtccttc ggagattggg tgaccttgtt gtgtcttctg gttttataag gaacccgtcc 35580

gtgccaaaac ccgtcttgac cggtgaggtt gtcccgggtc gccgctaaga tgcgcaaccg 35640

gtctaccaat tccttcaagg attgcgccgc gaatgcgaca cgttccgtca ttgcatcacg 35700

gcccgcccgc aaggtgaatg cgatgtcccg cagcagcggg gcagcttcca ttccggaatg 35760

ctccggcagc gactgaaacg cgctgcttat ctcccggatg gaaccggcgc gatgcacgag 35820

atcatggtca atggtcaggc cgagaacctt ttccaccgac cggcgcaaca acgggcgatg 35880

caccggttcg acccccagat catcgagttt ggtaagtggt tcgacctcat cgatgtcaat 35940

ttctagaata tcggccagac atgcgcagag tcgggactca atcgttggtt ctaaggcccc 36000

cccggtgttt gcatagggag tcagagcctt tgccaaggcg tctgcgctag ccgcaagccc 36060

ctcacgatcc cgcgccgaca gaacaatcag ttcgggaatc tccggcatgt cagcacgtat 36120

ggtctgtgct ggctcttcca gcaccacatg tgcgtttaca ccgccaaatc cgaatgaact 36180

cacaccggcc cggcgcggga tttcctttcc gacggcatcg accggccgac gccactcctg 36240

cgcctgtggg accaggtaga aagggctatc ctttaatttt agatagggat ttacttcttc 36300

cggcaggctc ggagccaaag tccggttgcg catctgcaac agaactttca aaacacctgc 36360

gacaccggct gccagttcca agtggccgat gtttgttttg accgacccga tcgcacaccg 36420

cgcttcctga ccggcttcaa gagcgtcaaa ggctgtcttc aatccttcga tttcaatggg 36480

gtcaccaagt tcggtacccg tgccatgagc ctccatataa ctcagacttt gaggggcaat 36540

tcctgccctg cgcacggctg tttccaccag cgccgcttgg gcgcgtggat tgggcgccgt 36600

caaggaattc gccttgccgc cgtggttttc ggcgctgccc aagatgatgc cgtggacaaa 36660

atcaccgtcc cgttctgccg cagttagcgg cttgagaaac agcattccga caccttcgcc 36720

gcggccatac ccgtctgcct gagcgctgaa agtcttgcag cggccgtccg gactaagcat 36780

tcccgctttc gaaaagctga tatgcgtttc cgggctgagg acaaggttta cgccgccaac 36840

gattgcctgg ctgcaatcac ctgcccgcat ggcactgatc gcgcggtgca gcgcgaccaa 36900

agcgctggaa caagctgttt ccaccggttc gctggggccg tgcaaatcga gaagataact 36960

tatcctgttc gggccaacag aaccgacaga accggtagag ctgtggctgt caatcccgat 37020

accgttttcg gccatccgtg caccgtaccc agacggggca gtgccaataa tcaccgcagt 37080

gtcgcttccg gccaggcttg acggggcata acctgcatct tcaatagcgc gccagacgta 37140

ctccatgagc aatcgctgcg ccgggtccat caaggccgct tcccgacgtg aaatgccaaa 37200

gtgccgggca tcgaattcag cgatcccatc aatgaagccg gctcggttta catcggtcaa 37260

tccagcggcc ttcaaggcgc gccaatccca acggtcttcg gggatctcac gtaagcacgc 37320

gcggccactg cgcaagtttt cccaaaacgt ttccagatcc ggggcgtctg ggaaacggcc 37380

tgccattcca ataatcgcta tcgcctcggc atccggtgga gaagtcggat cgggctgatc 37440

aggcaaaggt ttttcggtga ttttcgcggt atgcctaacg ggattttccg gaagcaaacc 37500

cgacaagcag ctctcatagg tctgcgccag aaaaccggcc atgtcggcga tagtgacgta 37560

ctcaaagaac acggtcggtg tcaggtccat accgtgggct tcattcagcc ggttggagaa 37620

agtggtcatt gtaatggagt caaagccgag gtccgaccac tccgactcgg catccagatc 37680

ctgccgctcg aaccccatgt gttcagcgat gtgctccaac agcaattctt ctgccgctag 37740

ctgcaggcca tctgactctg ttcgctggga taccggttgc gcgctgacag gcgcggccgg 37800

tggtgtcagt atgtcgtcaa tcgccaactg cgtaccgcac atcaccactt gctgcggccc 37860

gccggacagt agtgctgctt caaattcatc aatgccggcg gctgtcgcca gaacccccaa 37920

gccagtgctt tcctgcatcc tggccaaagc ttcgggtgcc atacgcatgc cgccgtcctg 37980

ccagggaggc caggcgatgt tcagacttac cccgaaccgt tcaccttgag cggctttccg 38040

gctgcgccac agggcaaacg cttccaaaaa cccattcgca gcggcatagt ccgtttgccc 38100

agcgctgccc caaacggcag aagcggaccc gaacgtggca aagaaatcca gcggcagatc 38160

tactgaagcc tgatccagcg cccatgttcc agcaagtttg gcacgcccca ccagatcgaa 38220

atccgcttca gccttgtccg caataaagcc gtcttttaag acccccgcgg catgcaaaat 38280

cccgtcgatg cggccatgac gcgcaacaac cgaacgaacc atggcttgca ccgcatctgg 38340

gtcgcccaag tcacaagagg tgctgtccac ttttagaccc aagtcttgta atcggacgac 38400

gagatccgca tccgccgtgc tgcgcgctgc aaggatcaca gtcgctgcgg aagtttcttg 38460

tgcgatgcgc tctgcaaaac gctgccccaa tccaccggtc ccgccagtga tcagatatat 38520

cccatcatta cgccagggag agccctcgcc ttcaaccttc agtttctccc atcctcgagc 38580

caaaatgccc ttcgatgaca gccggagatg tgatgctcca gtaactcgcg ccgcctgaga 38640

taaaagagca ggaagttcca gagcagccag atctcccggg cattcgacaa gctgggcctg 38700

caaacgggtg gattccttgt tcgctgttgc caccagcccc gccagaccgg aaaacaaacc 38760

cgccgttcca tatgcctcat cagattgcgg caccacaatc tgcaaaaatc ccgtcccttc 38820

gccgagcgtc accgccgcct tgaaatcaga aaagattgtt ttggccgccc gtagatagtc 38880

agccacggca ttaccgctaa cgtgcaccac ccgcgcagtt tcgccagcac ccgaatgtcc 38940

gtgtgccatg ccgcatacaa gctgccgtac agcacttggc gtagccgcgc cgggcgttac 39000

cggatgccag accggccggg cccgcagcac ggtgtcgttt gacgtttcct gcccaagtgc 39060

cggatccagt tcgcggttcg caaatccctg aaggcgcatc accaaccggc catcaggacc 39120

ggtgacgtca agatcaatgc ggggtaggcg cgtgttctgt ggtccaaccc gtacacaaac 39180

acgcagctga tccggtactg tcccgaaaag ttccagagtg cccaactcaa atggcaaaga 39240

ggctgaagaa tccgtgtctt tttccgccaa tcccaaacag gattgaagaa cgcaatcgag 39300

catcgccggg tccagcagaa atccctgatc atccgcttca tcgggccgat tgatttcggc 39360

gtaggcctcg ccgtcgggac cacgccagat ctgctgcaag ccacgatggc tcggtccata 39420

ggaaagacca agttcggaaa agcggttata gcactgtgcc ttatccaaaa ctggcgcggt 39480

agtatttgca ggttcggttg ccggaaccgt ctggccagac ccattgcccg tctctccggg 39540

tcgcactaca ccctggcagt gcagctgcga accgggcatg ctggtgatac gaaactcaac 39600

cgatccatct ggcctaccgg tacaatgcac cgtcagatcc gtggaacctt cggtcacagt 39660

acacggctga acccagacga tcttgtcaaa tcgccaggct tcacggtgag aaacgtccaa 39720

aaactgcgcc gctgctgcgc gcgcgatctc cagataggcc gcgccgggaa gcatggggac 39780

gcccacaaca acatggtcct tcaaaaaccg ttcggcgccg gtcagcgtta gatcataccg 39840

gccttcaccc ggctcgttct tatgtgcggc cagcccgaaa cccgattttt tacgaaacac 39900

cgcagatgag cggcggcgca acggcatttc tccggcaggc gcaggaatcc agcaccggcg 39960

tttttcaaac ggataggcgg gcaggcgcac ttttgccgga cggttttcgt gaagcgcaga 40020

ccagtccaga agagcacccg agacccaggc ctcagccaga tcaggcaagg gctggctcaa 40080

atcggccggt gtcgtttctt cccgggatct gcgcctcgtc ttgacacatc ccttagcaaa 40140

tccggcctga tcaccgtccc gcaatcggcg taacgacgcg accagtgatc caaccgtgtc 40200

tgccacaaac gccagtctaa acgccatcgg gtcacgcccg gtttgcaacg tgtaggcaat 40260

ctgttccaat gagggcagtt catcgcctgc aaatccttcc agatgcgcca gcaaatccaa 40320

gataacttga tcaagctggg cttcggttcg ggctgaaagc gggatcagca taggccgatc 40380

cggcctacct actgcagccg tccttgtttc gggaagatat tcctcaacca cgacatgggc 40440

attcgacccg cctgcgccaa aagaactgac gcctgcacgg cgcggaaagg tctgcccatc 40500

aagcactgga cgcggccaat cactgccctt tcgggatatg aagaaaggcg tctgctccag 40560

cgaaatcagg ggattttggt cttctgaatg cagggttggg aaataacgcc cagaacgcaa 40620

tccaattacc gccttgatca gcccggctat cccggccgct gtttccgcgt ggccgatatt 40680

cgacttgatt gatcccaggc cacaatgcgg cgcgccctcg ggagtcttcc cgagggcgtc 40740

ataaagcgac gtgaatgctt gtttcagccc gttgatttct atcgggtctc ccaactcagt 40800

gccggtgcca tggcactcga tatatccaac cctgcgcgga tctccgcctg cgtggccatg 40860

cgcctccgcg atcaaccggg cctgggcaag tggattggga gctgtcagag acgtcgactg 40920

cccgccgtga ttttcagaag aaccgcggat cactgcgagg attgtatcgc catcacgttc 40980

agcggcagac aatggcttga gcaggactgc gccaacccca tcacctcgga catacccatt 41040

tgcccgggcc gagaacgtct tgcagcggcc atcttcgcag agcatgccga ccttggaata 41100

cataatgtgc atatccggtg tcagcatcag attggcgcca ccggcaatcg ccatctcgca 41160

accttcatgc tgcagggcca gcaccgcgcg atgcaccgct atgagtgagc tggaacaggc 41220

agtatcgatc acctggctcg gcccggtaat gtccagcatg aatgacaaac gattgggaca 41280

gaacatatgc cccaagctgg tcaaatgaag tgcctcgatt gatcccgccc gatcaatcat 41340

gtgggcgtaa tcctggagat ttacgccgat aaaaaccccg accggacggc cagcgatcga 41400

acttggagca tagcctgctt cgcccagcaa ccggtatgca ctttggataa aaagccggtg 41460

ctggggatcc atcagctccg cctcacgcgg cgacaagcca aaataaagcg gatcgaattg 41520

atctactgcc ggggcgacgc cgccatattt gaccttggta aactcgcctt ttccgggatc 41580

atcatagatt tgccgccagt cccagcgctc ggcaggaatc tctgtaatgc aatcgtctcc 41640

ctgctccagg tgcgactgca actcgcccaa atctgcgctt tgagcgaacc ggccatccat 41700

ggccagaacc gcaatcggtt caaaagcaga cccgctcacg tgtggggttt caactgcccc 41760

catgtcttcc tgatctgtcc ggaattgtcc aggctgcgcc aaagccgcct tcgcgcttgc 41820

aatccaggac gctgcctttt tggatcggga cgctggcact gtacggctcg tctcctttgg 41880

agcacgtttt tcagcacggc gatcaggcaa cgccagcgga ttttgcggag ctttctgaga 41940

ttgaggaacg cgatcagcct cacggcggta gcgtccatcc aagatttgag ccaactcctt 42000

ggcgttcttg gcttcgaaaa agaccgtagg ggcaattgaa acgccgagca tgtccgaaag 42060

ccgtttcatg atctcggtca cgatgatcga atccaccccg aaccgggata acggcgataa 42120

cgtgtcaaaa cggtcggaag gtatcttgag acaggcggcg acaacatcgc ccacagtatc 42180

ttcaaattcc cggccatctg gcaccgcaga ccgggatgtc tcctgccccc ctgccccata 42240

agctcggctt cgatccggcg ttcagcagcg ccggcgcgac cgttgtcggg ttcagtcgtc 42300

atcgagcatc tcccggtaat agcgcgcatg gcggataaat ttccaaaaat caacttccca 42360

agtatgcctg cggctgtcaa cgaagtagtc ctgacccaaa tctggatcat cctgggcttt 42420

cgccgcgaca aacttctgat agccaagggt ttgattttca aaggctctca cgtaactgcg 42480

gacaaattgc ccctgcagac gcattccatc gcccagcccg gccgcagcgt ttacaaagcc 42540

aaaaaagaaa agattgttga ggttgcgtgg aacgatatgg atgaaaagat ctggaattcc 42600

gtctttccag tcgagaatat ccggatcgat aaaggggaaa tgacggtcat agccggtggc 42660

atagacgatt atgtcgatct cagcttcgtg cccgtctttg aaacgcacgg ttagatcatc 42720

gaaacccgcg acatcgccga ccgtggcaat atcgccatgt ccgatatgat aaagtatctg 42780

cgaattcatg atcggatggg cagcgtcaat cgggtgatcc ggcgcaggca aaccgaaatc 42840

ggtgccatcg aacccggcca gcttgaacac tttttggata taggccgagg tttcctcttt 42900

cgaggtgaac ttggtgccga gctgcaacat ccattgcggt gtcggtttgc cgtcgatgaa 42960

tttcggataa tagtggtaac cccggcgtgt gctgtgatgc accgagacag catgatgcac 43020

ggcatccacc gccacgtcgc accctgaatt accagcaccg atcaccagga cccgtttgcc 43080

cgcgatctgt gacgggttct tgtaatcggc tgtgtgcaac acctcccctg aaaaggttcc 43140

cggatacggt ggtttcgggt agtgcggcac ccgctgcgcc ccgttgcaga cagcaacaat 43200

gtcataccgg cgggttgccc ctgtcgacag ctccacattc cagccgtcgc cgtccggttc 43260

gatccaagtg acgccagtat tgcaatgggc gtggtcataa accccaaaat gccgcgcata 43320

ggaccggata tagtccagca tcatcttgtg attggggtag gccggataat gatccggcat 43380

cgggaaatcc ggcacttgtg tattgaactt cggcgaaatc aggtgaagcg agggataagt 43440

tcttccgcag ggcgcatcgg tattccagac accgccaaga tcgctttctt gttcataaag 43500

gtcatagtca atcccgcctt cggacaattc gcgccccaga cctatcccca agggcccgcc 43560

gccaataacg caaaccgaaa gagccgatgc ccgcgttgcc gtcatgcctc aacgccctcc 43620

cattgaatgt tctctggaag cgctccaagg gacagtgaaa actcccgcaa gatcatgagc 43680

ggtgtccctt gcggatcata aacggtgacg tcaacgttca agtatcccgg atccggatcg 43740

gatagacgca ccacttcaaa gtgcacgtcc gaggtcagcg gtgctgtgct tgccagcgtc 43800

atcagcgaag ccggccaagc aacttgcgcg gtctccagat ccgaaaggca ctgcacggaa 43860

ttccagatgg cccgcaagac ccgcacatca aaaactgcgg gtgcagacaa tcctttcatg 43920

ttcccgacaa gccgcccctc atccccgtag agggctgcta ctccctgcgg ggcggaaaca 43980

ggtttgagac cacctcgcaa tcgcggcagc cggacaggtg ccggaaagct ggaacacggt 44040

gcgccggcct gggctaatag ggccagtgcg tcagttgttc cggcggcttc caccgccacg 44100

agcccctgat cggcagacaa gatgcagatt tcgttcggat ccggtcgaat ttcagaactt 44160

tgcggagctc cccagacaat ccgggacagg gtctgaacgt cacggttcag cacatttgat 44220

gcggccccgc gggcggcctc cagcatatcc aaaccaggag agaggtccga aactcccgaa 44280

acgggcggat gcgcaggcgt gtctggctct ggcagtggtt tgacatacgg cccaattgcg 44340

ggggcaggcc gggcctctgg cgcgtcaatc cagcagcgat cgcgttcgaa cacatagccg 44400

ggcagattga tccgccgcag actgcacggg aacagattga cccagggtat cggatgcccc 44460

tgacaaaaga gttcggccaa ttcatgcaga gcttcacggc tctgcgcctt ctccagaagt 44520

ccggaaatct gttgcgacat atccggcaga tcaggttctt ccgggacgtg tccgcggtaa 44580

cctggtgttg aatcaaatgc ttccaactgc cgggcggcat cttgcagatc cttgacgacc 44640

agcgcgagcc tgtgggtgaa tgcatgccga ccggtcaaca gggtcaggga aatggctgcc 44700

agctgttgat ccgccgcctc gggacttttc agataagctg ccaacttgct agccatggct 44760

tgcaaggacg attctgtctt cgccgacaag gaaataacat agttccgctc ctcagacggt 44820

agctgcgcag gcgagtccgg agcatcctcg atcagcagat ttacattggt tccactgatc 44880

ccgaatgcgc tgaccgaaat caggcgactc cggccggcat gcgggcgagg ccaatcgcgg 44940

ctctgagtat tcacataaag cggagttttc tgccatccaa gcattggact gggttggtta 45000

tggttcaggc tggcgggcag acggtcatgc tgcaaagcat gtacagcccc tatggcactg 45060

accagaccag atgccgcgaa cgtgtgaccg aagttaccct tggtcgtggt cacggcaatg 45120

ctgtttggtt cccgttccgc cccggaaaag acatcgcgca gcgcatgggc ttcaaccaaa 45180

tcgcccaatt ctgtgcccgt gccatgggcg atgacccagt cgatttcgtg aggttttact 45240

ccggcctgtg cctggacccg gcgcaacaaa tccacttgtg actgtccgct tggggccgtg 45300

atgccatttg tatggccatc atagttggtg ccgcttgtgc ggatcaccgc ctgtatcggg 45360

tcaccgtcct cacgcgcccg cgccagagat ttcagcacca gtaccgcaac cgcttcgccc 45420

ggaaccatgc cgttggcgcg gacatcgaac gtgtagcatt tgccatctgg cgagagcatg 45480

ccggcttgtc ccatgccgat gtaggcatcc tgcgagacca tcaggttcac cccagcggcc 45540

agtgccacat cgcattcacc tgcgcgcaaa ctctggcagg ccatatgggc ggccatcaat 45600

ccggaggaac aggctgtatt gagggccagt gcgggaccat ccaacccgag aaaatacgat 45660

agccgtgctg ccagaaccgc attatgcgcg cctgtcaggc taatctgatc ggaccgcttt 45720

atgtaatcac tgccatcttc aacgccgaca aaacttccaa cccgttggct ggccaggtgt 45780

tctggaccga gggcggcact ttcgagcgca agccagcttt cctgcagcag gtgacgctgc 45840

cgcggatcca tccgctcagc ctccagcgga gatatttcga aaaacagcgg atcgaactca 45900

ctcagaccgg gaacttgtcc gcaccatctg ctgttggtct tacctggtac cggcggtgtt 45960

ttggcttcgt aaattctgcg ccaatcgaac cgctccgggg tcacttcctc aaccgcctcc 46020

cggccctggt ccagaatatt ccataagcca cctacatcac gcgcgcccgg aaagcggccg 46080

cttgttccaa tgattgcaat tgcatcgtca gaaacagctc tgggctgggc aaatgttcgc 46140

ggctgagtgc tctccggtgt cgttactccc acaccaattt cggacaggtg cgcagcaagc 46200

ttgccaagtg tcgcgtgact gaaaaaaact gatggtgcca agtcgatatc aaagcacgtg 46260

ccaatggacc gggcaaattc tgaaagagcg atggaatcaa atccgaaaga ggcgaggttc 46320

ttatgcgagc caatctctcc cgatgacatt ttcagttgat ccgccgctag agacttcaac 46380

acggtgagaa catcacccgt ctcggcggag ggtttggact tctgcggtgt gccggcaagg 46440

tggtcgagcc gttcggcgtt ccctgaaaga actagggttc gggtccggcc ggtaaagacc 46500

gccgtttcca gcgcctgcat ggcctgttcg ccttccagcg gcacttgacc gctgctcgcc 46560

agatacaggc tctccgactc cgcatcggca agccctctgg cacgccagag cggccattcc 46620

accgccagaa ctggaagcgt ttcgttattg tgctcggctg caaaggcgct ttggaaacga 46680

ttggccattg cataatcgcc tgaccccagg tctcccagca ctgccgagct tgaagaaaag 46740

agacacagga aatcggctcc tgaatttgtc agtacctcat gaaggttctt cgtgccttgc 46800

aatttggggg caagcacact gtcaaacccg gaagccttag cctcaatcag cggagctgcg 46860

ccgcttcttc cggccagatg gaacgctcca tccagtctgt cccaacggga gaaaatttga 46920

tcacgcacag tatgaagtgc ggcgatgtcg gtcacatcgg ctggtagata acaaacatct 46980

gcaccaaggg cgcatagctc atcaatcagc gcccgatcct caggccctcg gccactcagt 47040

acaagccgcg cggacacggt gcgagccagg tgccgcgcca aaactgaccc gaccgccccg 47100

gagccgccga caatccaata aacaccgcga tgccgccacg gagtttgaac atccggcggt 47160

gctttcaacg cccgcgaggc acaaatttgc ctctcttcgc cacgataacg aacacaaaca 47220

ccggctccgg cggtcatttc agcgagcgca tggcgcacca tgacagtcag actggtgccg 47280

ctgccaaaga caatcgacac gttcagatca ggtagtgctg agcggcaaga acgttgcacg 47340

ccaaccaagg catccagcca agcgagatct tcaggagttt ctgcatgacc acatatcatc 47400

aaagactgcg ggcgctgccg gccttgcgcc aacgcttgaa ggaggtggat gattgggccg 47460

gccacgcggt cttcatcccc cagcaacaag agcacatgtg aggctggttc tagccaggac 47520

agcaaccgtg cagctgcctc gctgttttga aggtcttccg gctcgggcgt cagccataag 47580

agatcttccc cagcgttcag gtcggcatcg gccgccgaca tgctttttgg cgccagaacc 47640

agtacccgtc caaccggccc tgaacccggt tccagtaagg gtgacggctc ccattcttcc 47700

gcaaactgac gaactgaagg gagtgcggca gcagcatctg gcacatggag cgcttctggg 47760

ctctctgacc caatccaatg cgttatccgc tcgaacggat agcccggcag ttcgatcctc 47820

cgcccctcac gtttcggcgc cacctgggcc caatccagat cagcgcctgc gacccaagcc 47880

ttcagaactc gagacaactg ccctttggcc agccagactt caatgagatc tggcaagtct 47940

tcagacagtg cgatacctgt gatttcctct gtttcaccca gggtcacatt ttccggaacc 48000

tgcccttgcg caacagtttc aagcaactgg atcgtctcgg tcagactcga tgtttcaaag 48060

gccagacgtg ctggcaaccg cgcccggcca acccgcagcg tgtgcgctac atcgctgaga 48120

cacaaggtgt cctggtttgc ccgcagatgc tgcgcaagat cacctgccat ctgcgcccga 48180

atttcgggtg tgcgcgcaga caatattatg atttcggctt ccgctggcga actgcctggc 48240

aatccaggtt ccgtatcagt cgccggctct tccaatacaa gatgcgcatt cgacccgccg 48300

accccgaagc tgcttaaacc ggcacgtcgc ggtgccgggc ctgacggcca atcgaggctg 48360

ccgcgcacca gagacaaggg agtttcatcc agatccagat agggattggg gtcacgtaga 48420

tgcggatttc ctgcgatccg attgtgtcgg agcatcaaga gcagttttat caatgagaca 48480

acgcctgcag cagcctccgt gtgtccgaca ttcgccttga cggaccccag ccagattggc 48540

ccgtcccggg cgtcgagccc caactccgaa agggcagctt ttaggccgtt gacttcaacc 48600

gggtcgccca actcggttcc ggtgccgtgg gcttcgaaat agccaatcga agccggatcg 48660

atcccggccc tgcgaacgac atcaacaatc agttcttttt gagcagttgc attgggtgcg 48720

gtcggtgagg atgcacgccc gccatgattc tccccactgg cgcgaatgac gccaagcacg 48780

cgatcaccat cacgctgagc atctgcaaga ggtttcaata agaccgcgcc aacaccttcg 48840

gaacgcacat aaccgttcgc acgggcatca aaactcatgc accggccgtc ctcgcttaac 48900

attccggctc ggctggaggc taaagtgatg cgtggtgttg cgagtatgtt taccccgcca 48960

gccagcgcca tgtcgcacat accggccctc aagctttcag tcgcgcggtg aatggcgatc 49020

agcgaagaag agcaagccgt atcgattgtc tcgctcggac cgtgaagatt gaagaaatat 49080

gaggcgcgat tggcaacgag aaaagaaaat ggctctgctg ccgaacgcaa atgcccggcc 49140

tcccgggcct ttgccagaag ttccgaatag tcgcaggtcg caactccggt gaagaccccc 49200

gttcgactgc ccgaaacaga atcgggtgca acacccgcat tttcaagcgt ggcccagaga 49260

gtttcgagca tgagacgtaa ctgcggatcg agcacttcag cttcagcagg cgagatgccg 49320

aagtgtgcgt gatcgaaaca cgccatatcg gcaaggaaac caccccattt cagcgcagat 49380

ttatcttcat cgggaccgct ttgaaatgcg cgccagtccc aacggtctgc cggcacttct 49440

gagataagat cccggcctgc atccagagcg cgccagaacg cgtcaaggct ctgaacccct 49500

ggcagtttcg ctgccatgcc aatcaccgca ataggctcgg ccgtgtccat cccccggttt 49560

accgaagggg ctttgccaat tgaaaccgaa ccgtcgaaac cggcgctgga ccgaaccggc 49620

ttctcctggt ctacaactgc ccgcgctggt gcaggcgatg taacagaaga cggccttttt 49680

tctggctcca gagttacact gtgatccttg gccagcttgt ctgccaaagc cgccagatcg 49740

ggtatctcaa aaaagaccgt cggcattaac cgcaggccaa acgcggaatt cacctcattc 49800

gccagttctg tgaagctgat ggaatcgaaa ccatagtcag atagcggttt gtaccgcgtg 49860

accttttgaa ccgggatatg ctgaactttg gcaaccagat cgcgaagccg ggtctccagc 49920

tctgattgat cagcttgttg ttcaacagcg gcgggctcca aaacgttgtt ccctgccgga 49980

tattcaaatc ccaggaaccg ttcgcgaatt tcctcaggca ggccataggc gacaacgagc 50040

cgggtttcgc cgcttgccag agcacgttcc agcgcctcaa ttcccgtccc atccggcatc 50100

ggcaccattc cggtacctgt ccgcatcata cgggcgtttt catccgtcat cgccatgcca 50160

ccgccttgcc agaggggcca ggcaactgaa agactttggc catggcgttg tccgttcaag 50220

acttggcctt gccgcagttc ggcaaacaca tccagatacg cgttggcgca cgcatagtcc 50280

gcttgcccaa cattccccag tacgccggcg acagaggaac ataacacgaa ggccttgagc 50340

ggcagttcgg ccgtggcttc gtccagcgcc cgggttcccg ccagttttgg agcaagaacg 50400

cgcgccgccg attcttgccc tttatcgcgc aataatccgt cttcaatcag cccagctgca 50460

tggatcaccg catcaagacg gccatgcttc gccaagatgt cccgcgccaa caatgtcgcg 50520

gtactgcaat ctgtgacatc gccttgcaag tagagcgcgc cggtttccgt gagaaatgct 50580

tccgctccgg acggcggtgc cgaacgcccc gtgaggacaa cccgttgtcc ggcagatgca 50640

taatgccttg ccaggatacg cccaatcccg ccaagaccgc cggtgatcca gatcacgtca 50700

ccagcagcga agtatgccgt tcgggaagga agtggaattt cgcggaccca accgttttgt 50760

ggtccgctct ctgtcaatcg ggacaacatg ggcagctgtc ctgagttcaa tacctgcttt 50820

aggcctgacg tcagagcgcg atcagataga cttccaggaa ccagcaccgc ctgcgcacag 50880

ctggcgggat gttcaagacg aaggcaccgc atgaacccag acagcgacga agccagactt 50940

tgatcgggga caatgagcag gaccggccgg gcaccccgta caggatcatt cgattggaca 51000

aacttcagaa tctctgcgaa cgcgttctcg accgtgtcgg acaggacacg gagatccgcg 51060

cccggaaatg ctgcccgcaa cgtggattgc cgatgcgcgt cggtttgcgt cacgaacagc 51120

accggatcca ccggcgcagt accgttcatc agcggtggac tgatttcttg ccagcacgga 51180

cctgcaaaca gcagctgatt ggggcccggc aattgctgct tttcagacca gacaagttct 51240

agaccgcgaa gcgccagaaa gaccgaaccg ttgtcgtcac acagatccaa atcgagagtt 51300

acgcgatccg cccccggtgg gcctttccgt gccgggcgca gatccacaag caccttgtcc 51360

ggcagggtag gggtgaattg cgtcaaagag ccgatcccat aaggcatcgg caaagtggac 51420

tcttctcgct gggtctgaca ccagacgaca gctgccagga gagccccatt cagcactgcc 51480

acgcgccggc gcgcccccat ttctgcggac tgcacccggg caagcgcgcc actcgggcca 51540

ttacgttgct cggccaagct catcagggac gggccgtggg tagactgcaa tacggcatcg 51600

catgcgcggg atgtcagaac gaatggcgtc tccgtccggc gggcgtcgag atctacaggc 51660

ctcgggcgcg tgaaagcagt atctgagccc ttctcatggt ctgcctggca gtaacgtacc 51720

ccatcaagag tgatttccaa ccgcccaccg gtttgttgca atagcgcagt ggcccggccc 51780

tcgttgatac ggagcggttg cggaaagacg atattgcaca gtgcgccgtc gccttcgagg 51840

tccagcagcc ggtcaagaaa gaacgcgacc ggaacaatgc ccgagtggtc tttcaaaaac 51900

gggtcctgcg catccaatgc gatttcagta accgcgggtt tggcaacgct gatgggccgg 51960

gagtacagcc cgcgcatttg caacgctgat gtcccattgg gcaacagaat ttgcaggtcc 52020

accaagccct cgcgccgttg cgccgcgacc agaaccggac cctcccgagc ggggcatgaa 52080

ggtccagcgt ttcaagtgaa aatggcaaag cagccggtgc cgggttattt ggatccgcta 52140

gcgacaatgc cagtgtcgcc tgccaggcgc catcgagaag cgcaattggc ataacaccac 52200

tttccgccgt cccgggcagg ttcaactctg ccagaatttc gtccggcgtt gcccagactc 52260

gtccaatgga ttttagtgcc ggtccatgaa caacacctgc ttcattcaat gcaccgtata 52320

tggcatccac cgccatctca tgggctgaga gccgcgcgcg aattgatggt aaatccaccg 52380

ctggcggagg gccttccaac ggtatcaacc gcccttggtg atgcacctgg ctcgttccgt 52440

ccggcgcaag actggacaac gcgtaggatc cgtcctgatc aaagcttttt gcctcaatct 52500

ccagatccac cggagcctca acggtcagcg gtaccggcca taccaaatcc tcaaaccgcc 52560

agcccgtgtt ccgcgctcct gtcaaccggg ccaaggccaa ggcaggataa gcaacaccgg 52620

gcacgacagg ccggccggca atccggtgat cacgcaacca ggattcttcg ccgttcaagt 52680

ggagtgtatc atgaccggat ttgtccctat cctggtcctg cctatcagat cgccaatacc 52740

gttccttggc gaacggatac ccaggcagat ggcagcgctg tccgcgccac ccctgatgca 52800

gcgcaacgcc ggaccagtcg atcggagcgc ccgcgaccca ggcttccgct tgcatggata 52860

ggacggctgt actagacggc gcttcaggct gcggcccggc acgcgccgtc catttggagg 52920

gcacttcccc tgaccaatct gccgccagtg ttcctgccgc caaaccttta aaacggtcca 52980

acagttcggt ccgggttgtc acaagaaacg ccgcacggca ttccatcgcc atccggccag 53040

tccgcagagt atgtgcaata tccgccagga gcaggtccgg cacattttcg atcttccgtg 53100

ccagagcccc ggcttgcaac tgcaggcgtt ccacatcctt ggccgaaagc aggatcaact 53160

cctgctgcgg gtcgccgacg ctaacagttg gcgaaacccg caattcgggc gcttcctcga 53220

tgacaagatg cgcgttggtt ccgctgtgcc cgaaggaatt taatgccgcc aaaaggggct 53280

ggccatcacg ccgggtccaa tccgacgtct ccgtcaaagg atagaaagga gccccttcca 53340

ggttgatcag cggattgagc gatttaaagt gcctcaactc aggcattttg cggtgtttca 53400

tggccatgag cacggcaatc aacccacaaa cccctgctgc cgcggcgcta tgaccgatat 53460

ggcttttgac acttccaagg gcgcagctgc ctggtgtcaa atcatgcggc tgaaaggcct 53520

tgaccagcgc attcgcttcg accgggtctc ccaatttggt gccggttcca tgggtttcga 53580

catatgaaat ccgccgcgga tctatgtcga aacggctttg gacatcggaa atcagtgccg 53640

cctgagctgc accgctgggc gccgttatac cgttgctggc accatcttga ttggtaccag 53700

aggctcggat gaccccatga atcgggtcac cgtcgtgcac cgccgcagac aggggtttga 53760

gcaccaccat gccggccgct tcggacatca ccatgccgtc cgcttcggca tcgaaagtcc 53820

ggcaatggcc ggtacgggtc agcatctcgg tctgggccag cccgatgaga atgttctcgc 53880

ccatcaccgc gaaggcccca ccagccagcg ccagatcgca ttctccattc cgcaagctct 53940

cgcaagccaa atgcagagcc acaccggaag aagagcaccc tgtgttgacc acataggcag 54000

ggcctttgag atccaggaaa taggatatcc gcgaggcaac aatcgcgtcg gatgccccag 54060

tgaatgtgtc gtgcacatac ccgctgggct cgcacccgac aaagacccct gtgcggcttt 54120

cggccagccc gcccggatcg atcccagcat cttctagggc atgccagctt tccagcagga 54180

ttaggcgctg gtgcggattc atagacgccg cttcacgcgg agataacctg aagaatagcg 54240

gatcaaatgc atcacggtct tcaagtatcc cgccccaacg gcagtaggat tttccaggtt 54300

ctttgtcttg tgacaccttt tcaggacgca tgtaccgccc tggcagcgga accacaggat 54360

ccaccccgtc gatcatattg cgccagagcg tgtcgacgtc agcagcgccg ggaaactgtc 54420

cggccatccc gatgaccgca ataccatcgt cccagcgctc aagtttccgc tgaggatcgg 54480

tagttacctt tggctcaata tctgtttcag acattgcacc cccgacggct ggatggtgtt 54540

gttcctcaat aaagctgcac aaccgtgcca cagtcgtatg atcaaacaaa tcagtggttt 54600

ggagcgtgat gctcagccgc gcaccaattt ctcgaacgaa cccgacaccc aggattgaat 54660

caacgccata atcggagaat ggtacatccg aagcgatctc atcacggtcg atgtccaatg 54720

cggcggccaa ggcgtcttcg atttcggcgc gaattgcttc atttgaaagc agcccgcgac 54780

ctcgtacttg tgtcccgctg tgtatttcct cctccgaaac agaattgtca tctgtcgtgc 54840

cgtgctcaag agggccagga tgtacaacct ccacctcaaa cggctctgac acggcaaccc 54900

ggccatcgct ttggccaact acaatttgct ggcccaaccc atgctgggcc tcggctggaa 54960

actgcacatg ctgcaatccc tccaaagcaa acactgtttc ccaggtttcg ggataaagcc 55020

cggggctgcc gggaatcctg aagtgacggt cttcggccaa tgaccagccg tcgatcaacc 55080

cgaacaggac tgaagcaaaa acagttttgt cgctgatatc attcgcaatg aggacgccgc 55140

cagacttcag caacgctttc gcgttacgga ccgtttcccg tatatcgcgg gtggcgtgca 55200

gcacatttgt tcccagaaca atgtcgtagg ccccaatatc taacccttgg gccgcgggcg 55260

cggcttcgac gttgaaaagt tcgaaacgca tgtagggagc gctttgcccg aaccggcggc 55320

gcgcatgcgt gaagaacgat ttcgacaagt ctgtatagca gtattccgcg attgcttcgg 55380

accagcgggc cagacgcggc accagagtgg ccgtcgttcc gcctgtaccg gctccgatct 55440

ccagaattcg aagttttgcc tcaggatcct gagcacgccg cgcagttatc accgcgtcta 55500

cagtatcggc aacgaccgag ttgaagaagt cgcaaatccg gttgttgcta tacagacctt 55560

cgatcttttc catctttcca gctggaaaga gaatgtccgt cacgagagct tgtcctcgca 55620

ggatttgcgg caaggctttc agacaatctg ttgtcagaat ggcaagaacc cgcgtatccg 55680

gagtctcgag gaaggcttgc tgcgcctttt cccactcggc ccagaccgtg tccggtgaaa 55740

gaagatcatc tcctaggaga gtaacagctc cggccgcatc ccgggagatg ctgccttgtt 55800

cctccagaat gttcagcgct tcgtcccacc acggacggaa tttggccaaa atggcaaatg 55860

tctcgaactc gatcttgcga gacaggcctg gacgatcaaa gacgtccatt ttccgcaatt 55920

gtgccagaag caggcggccc agccactgat ccaatgccgc agcctcgcgt gcaggttccg 55980

gtggcgcttc cctcgtaacg acctggggca ataccggcaa agccgtaccg gacaggggct 56040

tcattcgagg cgtttccaag acggtctcaa tccggtccgg ccgtgttgtt cgactgattg 56100

caatttgcgg ctgcttcatt gcaagggcag tttcaaacag cgccattcca gcttcgggat 56160

cgattgggac aactccgcgc cgggccgcca aagccctcag actgtcagtc acccggacac 56220

cgccgccaat gtcccagtag ccccaattaa caacagtcac tgggcaggag tgtgacctgc 56280

caagcgcaaa ggccgcagcc tccgatgcct ggcatccggc aacataggcg gccatcccgg 56340

ctggttttcc gcatgatgcc agtgacgaaa acagcgctac gaaatctggt gtgggaacgc 56400

ccatcagcgc tttgtccagc gcggaaacaa cattcaggcg ggtcgacagg atatcctgaa 56460

acagagtttc ggacatttcg gcaatcgact tgtcatattc tgcgagggtg gaaacaatta 56520

ccccgtcaag cttctcgtac cggttgcgaa tatccgcgat tgcgtcagcc agctctcccg 56580

ggttgcgggc atcggccgag tgatagctaa cggcaccatc ataggcagcc atattctgtc 56640

ttatctgcgc agaaagtgcc gagcggccca accagacaac ttgcgctgaa acacgttgca 56700

aaagatgcgt ggtccagacc cgtcccagag cgccggcgcc ccctaaaacc aaatagacgc 56760

cattcttccg ataggggatt tccggcggca cctctggtag atcgcaggga atcaggcgcg 56820

gtctcagcca ttgtccctga cgccgggcaa atccaatctg accgccttca agcggcagag 56880

tatcaagcaa gttgggaaac agtggctctg ccgggtgtag atccattgcg cgcaatgtcc 56940

aaccgggcag ttcctgagcc agaaccgcca agcagccttg tattgccgct tgctctggat 57000

cagcgggctc agcgtcaaaa gcaaagccat tccgggtgac gagtgtcaag ttaccagagg 57060

ccggaccggt ttcgatcagc gccttggcaa agcggaaaaa tgttagcgga gccgcccccg 57120

gctctgccaa ccaaaggacc gtcccccagt tttctcttag tttttttggt gcctcgtccg 57180

gcggtacaaa ttgggcatca gggtatgcgt tcgccaattg atcccggctc gcgccagtcg 57240

cgccgattgc caggacaggt ccgatcaacg gggcaggttt gtccgtaggt gaaacacttt 57300

cccaatacgg gctgaacgta acatgttcag ggactggatc aggggcgttg ggattttctg 57360

cgttgtcttc ggtgacaacc tcatcgaacc acaggcggtg ggtatcaaat ggataaagtg 57420

gcaagccaat gcgccgcgcg cccgccattc cagccagcga ggaccaatcg atttcttgcc 57480

cgctaaccca agcctggaca atttcatcca gggtgccgtt attctgagat cgcagccgcg 57540

acgacccgat agcctcttcc cttggcccag tctctgaaag gttgacccgc ccgcgtgcgc 57600

ctttatccgg aatgcccccg tcttcgacaa ttctcagctg cgtcagcaaa tcctgatgat 57660

cctgcaccaa gaatgccgcc cgttcggcca tagcttcgcg ccccgtttga agggttagag 57720

caatgtcgcg caaatcgggc aattctgttc tgctctccag ccaaacgcgg agattacagg 57780

caactttttt cagctgtgac gatgttcgag ccgtaagcgg gatcagaact ggcccggatt 57840

taaacgagcg cggtttggaa ggtgtcgcct gatattcttc gaccaccaca tgtgcattgg 57900

ctccgccggc ccgaaggaag atatgcccgc gcggcgcggc ttgtcgtccg caggtgtcca 57960

ctcggtcaat accgtcggaa ctcgaaacgg ggtgttcccg aagtcaatgg cggggtttac 58020

tgcatctgca tgcaatgagg gtgcgatttg cccagcgcgc atttgcatca gaaccttggt 58080

caagccggcg agacctgcag cggcctccag gtgaccgaca ttggatttca ccgaccccaa 58140

ccagcattgg cctggtaaca cgttacccga agcgaaggct tcgaccagac cgtccacttc 58200

gattggatcc cccaaaggcg ttccggtgcc atgagcctca acatagccga ttgtgtccgc 58260

atctattccg gccttgttca gcgccgaccg aaccagtgcc gcctgcgcac gcgggttggg 58320

cacggtatac ccatgggtgt gcccaccatg gttgaccgca gtggaacgga tcacaccgtg 58380

aattcgatca ccatcctgct ctgcttcaga caggcgtttg agcaccgcgg ccccaacgcc 58440

ttcaccgggg acatacccat ctgcatcagc tccgaaactg cggcaccgtc cactgcgcga 58500

caacatatag gcggaacaca attcagcgta gttggacgaa tgcaggtaca aattgactgc 58560

accagcaatc gcgagattcg tactgcgatc caacagcgcc gcacaggcct ggtggatcgc 58620

cgtcagccct gaagagcaca tggtgtcgat gggcatactg ggcccatgca gatccagaac 58680

gtaagaaacc cgattggcta tggagccaaa agaagtgtgc ggaaaggcca ctttgcctgc 58740

cgcccgctgt gcaggaccgt aaaggtcaaa acctgtcttg gtgacaccgg caaaaacacc 58800

cacattctgg tcgtagtgct ccttcaggtc ctttcgggtc agtgccgcgt cttccagcgc 58860

gtgccagaca cactgcaaaa atattcgttc ttgcgggtcg atatcacgtg cctcacgagg 58920

agacatgttg aagaacaggg gatcgaaatc tgcaaaccct tccaggaaac cgccccactt 58980

ggagtaactt ttcccttgag caacagcccg agtttcatcc ggttcgaaaa aaccatccag 59040

ccgccagcgt tcttccggaa tttcggtgat gcagtcgcgc ccctgcgcca gattctgcca 59100

gaatccctcc agggaatccg atcccggata ccgaccggcg aggccgatga tggcaatgga 59160

ctctgatttc tcagcgcggg catgtgctgg cgaagagatg ctttctgttg cggaaagctg 59220

tgtggtgccg gttggacgga cagaggtggt attcgaattc tgaggcgtta tggctgcagc 59280

ttctttgatc cattcgtgac aggctgcgcc ataggttttt gcaagatgct ccgccaggct 59340

tcggatggtt gagaaccgga acagcagtgt ttgagcgccc ggcccggcca gagattgaag 59400

atcgcgcgcg atccgggtga ttgtgatcga atcgatgccg taatgctgca atggctcaac 59460

cggattgagc gcttcggcat cccgccctag aattggccca ataagggcct ttagccggtg 59520

ctccaggcgc tggggcaaat caccaaccgt gttttgtggc ccactttgtt ttggcccgcc 59580

ggcatccgaa ctcagccaac tcaacgcttt gtcttgattg ccatagaaga cggcagcctc 59640

cgtcagcccc tgctgaagcg cactgtccaa cgccttgagg gcaattccgg caggtatggg 59700

gcaaagtccc gtattctggc gcatggccat ttctgtgtcg gcatccggcg gacgcatgcc 59760

accatcgtcc caaagaggcc agtgcagggc caaactttga ccgaaccgct cgcctgccgc 59820

gacagcctga gcccgtttcc gggcgaaact gtctagaaag ccgtttgcca agcaatatgc 59880

ggcttgtccc gggctcccgc gcaacgtggc aacggacgac gccatcacaa acaggtccaa 59940

atccagacct gctgtggcct ggtccaaagc ccgagcacca atcactttgg gcgctaacat 60000

cgcatcgcat tggcgttcca agtccgaggc cagcaagccg tccccattca cacctgccaa 60060

atgcaatact ccatgcagcg cgccgaattt tttcagaacc tgctggattg cactattcac 60120

ttccccggga ttaccaaggt cgcagcggat aaccgtggca tcacaccctg tatgccttaa 60180

cgaggccaac ctttcgggat caatcgcaga gcgggctaat aaaatcagcc gcgcgccttc 60240

agcggcgtga gcaatgtggc gggccaaatg cagaccgatt ccgcctgcgc cgccactgag 60300

cacataaact cctccggtac gccaggggct ttgcccttcc agcgtaaaca gggtttgcgc 60360

atgccagacc ggagtgagag gtgcgccctc cgtcagctgc cgatgcagcg ggccgtcaaa 60420

attagcctca ctcctcaatg cgccagccaa gtcctgaacc tgtatggcct cagggacttg 60480

taggacttga acgcgcaggt ccgggatctc ctgcgccagg gtggcaaaaa aactggtaca 60540

cccggtcccc gagcgtccaa tacaatctgc aacagtccag ctccaccctc caaagccaga 60600

tcacgggctt tcgccaaaag agcccgcgac aacttcatgt aatgcgacgc cggatcggcc 60660

ccggactcgc cgggcaaatc cgttatccgg gcatctggca gcaattccga caatgtttgc 60720

tggtgctgtc ccagggctcc catgagccaa accttttgga cccctgccgg tgctgatacc 60780

ggtattcgat tcgcgacctg cctatcttgc gtcagcagca ggctttgcat tgagcctgca 60840

gatggctgtg cccccggctt gccgggccaa aagatctcct tggcaaacgg ataagtaggc 60900

aagctcaccc ggcgccttgg cccagtgtgc aattgcgtcc agtcgacttc agtgcctccg 60960

gtccaggctt ccgcgacacg atcaagttgt cgcgttgcca gccagtgctc catcagcaca 61020

ctcatttctt gcgacttgag ttttggcatt gaagccgcgg gctggtcttc gagcaattct 61080

gctgtagaca agcaagcctt caattcagcg cgcagttcat ccagaccgga cacgacaaag 61140

gctttccggt acaccatatg ccggcgcccg gtttgcagtg tgtaggcaat atccgcgagc 61200

ggcgcctccg ccttgtcttc gacaaccgcc aaaagccggg ataaaagctg ccgcaagccg 61260

tcttgcgttc gcgctgaaac cggaacgatc tgcgaagacg gctctgctac cggcgaaacc 61320

ggcatagcag actccggctg gaactcctcg acaatcgcat gagcattggt gccgccaatg 61380

ccaaatgcac tgatccccgc acgtctggga gaacctgagg tttccggcca accctggcga 61440

atggcggcca cctccaatcc ggcatcttca aaatcaattt ccggatttgg cgtttcgaaa 61500

tttatcgagg gcggtatctc accggttttg accgccatga ccgccttgat cagtcccacc 61560

agtccggctg cagtatcaag atggcctatg ttgggtttga gcgaaccaat acgaaccggc 61620

tgcggcgctc ccgcggcgcg gccataaaca gattgaagac caaggatctc gactgggtca 61680

cccagtcggg tgccggtccc atgtgcctcg atatacccaa ttgaagccgg atcaaccttc 61740

gcgctttcga gagcacgccg gattgcttca gactgacctt gcaccgatgg cgcaaagaag 61800

cctgccttat cggccccgtc attgctgata ccaacgccct taatcaatgc gtgaatgtgg 61860

tcgccatcgg cctgggcatc gctgagcctt tttacaagca caacgcccag cccttctcca 61920

gcaacaagtc catcagcttt cgcgtcgaag gcgcggcaat ggccgtcact ggaaacattc 61980

aatccgggct ggtgcaagta tcctgcccct ggcacggcat aaaccgacgc cgctccgatc 62040

aaagctgcgc gggcttcccc ggccaacaat gcctgccggg cttgatgcag ggcaaccaaa 62100

cccgaagaac agttggaatg gactgccatg ctcggcccgg taaggcccaa ctgataggac 62160

agcatggttg gaacagtccc gccctgcccc gcgatccagg cactataaaa ctcatcatca 62220

gacactgcct gacagtcatg cagaagtgtc ttatagtgtc cgtggctcac cgccgtgaaa 62280

acggcggttt ttggtaggct tgcggtgctg tgtccggcct cttccatggc tttccaggcg 62340

tgctgcagca gcaaccggga ttggggatcc atatgaagcg cggcgcgcgc tgaaatgttg 62400

aaaaaccctg gatcgaaaca ggcccgctcg gccaacggaa atgccacagg tacgaaatca 62460

ggttgagaca actgggcgtc cggcacgcca gcggcacgca actcctcagg ggtcaaaacc 62520

tcccgcgcct ctcgcccatc aagcaggttt tgccaaaaac tctgcaaatc caaagcacca 62580

ggcaccgcgc aagacaggcc gatcaccgcc aaaggttcgt cgtccagccg ctgagcaaga 62640

gagggggctg caaaatggtt cagcttcggt gcctcatgcg cagctgtcac ctgtttttgc 62700

gatgccggca ccacatccga tgtgccggcg cccagatgcc tggcttgggc ccggattgtc 62760

ggaaaccgaa acagatcgga tacgcgcaac tccactccaa agcgctcgga aatccgggcc 62820

gccaacactg cggcagttac cgagttgccg cccgcctcga aaaaaccgat gtcccggcca 62880

attccggtac tgtccaacac gtccgaccag agcgccagga cctctttctc aaggtccata 62940

tccggtggac caggctctat ttccggtgag gcagatcgat cgtgacccag atctacttgc 63000

cgggccgcca gcgccatgcg atcgatcttg cccgccggcg ttaacggcag gtttgctaag 63060

gatatgatga gatccggcaa catataagct ggaaggtctt ccctcaaaca tgcacgcaat 63120

tctaccgcgg gaacagcctc tctttctgga acaacatagg ccacaagttg tgcttccggc 63180

ccgcttttgc gcaaaacaac tgcgctctcg cgcagctcct tgtgccgatc cagaacacat 63240

tcgatttctg ccagttcgat gcggtggccg cgcaatttga tctgctggtc acgccggccg 63300

tgatgaatca gaccgcctga cggactccag gaggcgaggt ccccggtttt gtaaagacgc 63360

tctcctgaac ggtacggatg tgcgatgaag gattgcgcgg tgcggtcggc ctgttgccaa 63420

tatccatccg ccaaccccgc cccggagatg tacaattctc cctgttcacc gacaggcaca 63480

agctgcaagt actcatccag aaccagcact tcggtgaagg caatcggcat gccgatcgtg 63540

acggtgtcct ggctgccggt caccgggccg caagtcgacc agattgtggt ttcggtcgga 63600

ccatacatat tccaggcatc aagcttggaa ttctgaaaca agctattcaa acggtccggc 63660

ataggctcac cgccgcacaa ggccttgagg ccgtccggag gctgccaacc agcagcaaag 63720

agcatggtcc aaaccgaggc cgtcgcttgc aagatatcag gctttactcg ggaaatctcc 63780

gacgccaggg catcaggatc ctgggcaatt tcttccggac aaatatgaac cgacccaccg 63840

ctggtaattg gcagcaaaag ctccagcagc gagatatcaa aggcaaacgt ggtcacggct 63900

agaagccggt ctccagtgcc cgctccaggg cgttgcgcca tggcttgcag gaagttcgcc 63960

aaagcccgat gcggaacctg tacccctttt ggacgcccgg tgctgcccga ggtgtagatc 64020

agataggcgg gatcgccgcc cttcagcccg acaggctgcg gttcaggagc gcacgaaagg 64080

gcgtcaaccc taaccatggt gcaatcaggt tcagccagtt gggtcgccat ggcatctgtg 64140

ctgacgtctg ccagtatcgc tcgcggcgca caatcttcca gaatatgtct cagacgcgct 64200

tttggatggg ccggatccaa tgggacaaag actgcccccg cccgcaatgt ccccagaagg 64260

gccgcagaat aattcctcct gcgcccgagg cagagcgcga cacggtcgcc gggacgaact 64320

ccggcctgtt gtatcgccgc cgcgacccgc aagctttcct gatccagctg ctcataagtc 64380

caagcgccat cgcaatcgac aacagctgtc tcagccgaat gcatatcggt ctgcctttgc 64440

acgagctgca tcacggtatc agcactgaac tccggcttag gcccggtgcc ccaggccaga 64500

agtttggcac gatctgaagt gccaacgata tcgaaactgt cgaggttggc ctcaggatcg 64560

gccaacgcct gttgagccaa atttgttagt gcttcaagcc acccctgcac ccgttgttcg 64620

ctataaagat ccgggttgta tttcatgcaa agtgacaacg tgtccgaggt ttcccgtacc 64680

tccagtacca gttcgtattc accctcttgc cgcagatctt cgaccagagt cagatcacct 64740

gtgacctgca atctctggtg aagagcaggc agggcatcat gggaaaatgc gttttgatat 64800

tcaaaagcca cccgaaagac cggcggctca cctggaccgg agcttaatcc cagatcgcga 64860

accatttgcg caaacggata ggcggcgtga tccagggcat cggcaacctc cccctgtaag 64920

tgatatgcga gatcacgcaa tgttcggccg gccaatccct gcatgcgaat cggcagcata 64980

ttaaccaggt atccgacggt ttccgcataa cgtggatcat ggcgcccgtg gtcgggcata 65040

ccgacgatga tatcgtcatc accacttagg cgatgcagca gcgtggcgaa tagcgcgaga 65100

caaagcgatg agagagggca ccgttcagcc cttgaataac tgcgcatcgc gccagccacg 65160

gacgctggca acggtaaggt aagatgcgcc ccttcgaaca accgagctgt gtttcgcggc 65220

ttatccggtg tcagagacag gcacggtaac tgtccttcga gccgcctggc ccaaaaagca 65280

cgggcatcac gcatttcact gccggatgcg gccgccttcg ccgtagcaac aaaagccgcc 65340

tgatcggcac ctttgttcgg caatatggtg gcttcagctc gcaaagattt gcccaattcg 65400

gcgtcatatg cgtccagaaa cgtctgcatg aagagccaaa acgatccacc atcaaagacg 65460

atgtgatgaa atgtaatcaa aaggtaggac ggtgtgccct gttggccgaa gattgttgcc 65520

cggactggaa ggtcacgcgc cagatcaaaa ggagatttcg ccgcatgcct caaggttgca 65580

agagggtctt cctgcggcaa gtcgagctgg cgcacatata aagtggcccc gtggttttca 65640

tcccgcaacg gaccacggcg gccaactcgg aacgtactgg tcagaaccgg atattgaacc 65700

agacatttat tcaaggccga ctgcacggcg gttgtgtcaa acccttcacg gctatgcaaa 65760

cagaccggca ggttatatgc gctggtacca ggctgcgcct gcgcaatggc ccaaagccct 65820

gcctgacctt gcgacaaggg caaatcgcgg gcatgtcccc ggtcttcgca gacctcgacc 65880

gcctgcggct ccggatccac tgccaatgcg gggagttgag ttgtgtaata ctccgctagg 65940

gcatcaatac tctgatgttc catcaggtcg cggccgcgca cagtgatccc gaacgtccgt 66000

gcgacggccc gcaagagctg catagcgaac aaggaatcca caccgaaatc gtagagatgt 66060

tgtttggtat ctatagaggc tgccggcaga tctagtacac cggcaatttg atcaatcaga 66120

aacggtttga tcccgatttg cgctgaggtg tccggcgcgc gctccagaac cggcttcacc 66180

cagtgtggcc ggcaatcaaa tgcgtaaccg ggcaatcgaa tacgccgggc actttgatcc 66240

tcaaggtccg gccaagactg atcgactcca gtcacccaag cgcgagccaa ggcctcaagc 66300

ccggtaactg tttcctcagc ttgtattccg gaccctgccg ttccccgaaa caccggccaa 66360

tccgatgttg cctggcccct tgtttccacc tccaaggcct caatcagggc tgcggtgtct 66420

ggcacaaccc aggcaattct atatgccaag gcgtcgcgcc cctgctgtag ggttttcgcc 66480

acatcacaca accgttcagg ttgttgttgc agatgcttca gaagattagc gatcatccgc 66540

tcaagacttg aaggcgaagc ggctgacaga acgattacct gagggtccgc cggagcgtct 66600

tgaggacgcg caaccgattt gcaaggcggt tcctgcaaca gaatgtgcgc atttacaccg 66660

ctcatcgcat ggcagtgaat tccagcgtga cgcggtgtac cgcttcttgg ccacggtgtg 66720

tcatttaccg ccagggcgca agctgcgcca tcttcgcgga tttcgggatg cacctgatca 66780

aatcctgcaa tgccgaagat gcggtccgct gcgaaactgt ggaccacctt tagcagcgct 66840

gcgagccccg aagcggcttc catgtggcca aaggctggtt tcaacgtact gacgagacac 66900

ttcgcatgag ggccgctgcc cccgcttctt gcccaaagcg cttcattgcc cggttgaagg 66960

attcccattc ggcgatatcc gacagcgggt tccccatgcc ttgcgcttcg atcacgccca 67020

cctgaccagg gccgatacca acgcttcgat aacaatcggc aatcaattcg gcatgacgtg 67080

tcacgctggg ggccgccaat gatgccgcgc cgcggccatt gaaatttacg gaagtctggc 67140

ggatcactgc ataaacgctg tccccgtccg ccacagcctc agacaacggt ttgagcacaa 67200

cgcacagtgc agcctcggca cgcacatgac ctgcggcagt ggcgccaaag ggagaaacct 67260

tgccatccag gctgagttgc ccagtttcgg caaggtgccg gaacggccct ggtgtgagca 67320

tcaaattgac acccgcaaca agcgcctggg aaatttcgcc ctgacgtagg gcctgcactg 67380

cccgatgcag cgccacgccg gcgctggcac attgcgcctc gatcacttcg ctggggccat 67440

caaaatcgta gaagtatgac aggcggttgg ccaagagaca tgattgtgca tatccggcat 67500

ccgggtcatg ccctaggctg gcacaaagcc ggtcatattc gttgtcttga gccgcgacga 67560

aaacaccggt acggctaccc cgtaaattgc gcgatgcgta gcctgcatcg tacattgccc 67620

cgagtgcggc catcagcaac agccgctgtc gcggatccat ctgatccgcc tcacttttcg 67680

ggatgtcgaa aaacccggcg tcaaagccgg ccggatccgg aacgaaaccg ccatagacaa 67740

agggcgcatc ggccgcaggc gccgacaacc gctctccgag tgatctttct gcccgttttt 67800

caataaggca ggcgccggtt tccaacgcag cgtaaaatgc tttcagatcc tcacagccag 67860

gaagcatgcc tgatgcgcca acaatggcaa tcggagcggg ctctcgcgcc gctccgtcat 67920

gatcttgcgg tggagtatta ctaaacttgt cctggcattg catggatgcg aggattgccg 67980

cctcaatttc gttccatgct tcgtcagaat tcatgacacg ctttccatac atcaatattc 68040

aaaaaccgga cacaatcctg gccatcaata gcctgagcaa ggctttttcg cccttgcctc 68100

gcgccgttag ccaagcatct gcctgctacc cagcagtcgc agaattgtgt tgagccgaat 68160

tacaatcggc gggccgtaat catggtgtat ccgaggtttt ctgccatata ttcaaataga 68220

tagtaccagt tgtcgacggc tttttctgcc tgatctccca tgagccggac cacgtcactc 68280

cacttttcct gcacggcttc acgcaacttg gtttccagcc atggcatgac gttttcggaa 68340

atgtcctcaa tgttcagaag ttcaaatccg gcatctgcca tcaaggcggg atagcgatct 68400

tctggaacaa agaccgaatg gatatgctca tggacaaagt ccatgaattc aggtgtcgtg 68460

tgaggcagag ttggcaggtc ggtcaggaca aggcctgcgc cgggtttcaa aagccgggcg 68520

gcttcgccca aagcttctgc atgacccatg tgaaaaatcg attcaaaaaa ccagccgcca 68580

tcaaaactct tgtctggcaa tgggacgctg cgggcatcgg cttgtaaaaa atccaatctg 68640

tcggagaacc ctgcctgtgc cgctttctcg cctgcaatac gatgctggta gccactaatc 68700

gtcactccgg tgacatgaca acttcgagct tgagcaagtt tcaaggcggg atggccaata 68760

ccacaaccca gatcgacaaa ccgttcaccg ggaccaattt cggtccgatc gatcattcga 68820

tgacacatgg cttccgctgc ggcaccgaaa cttgcatccc gactgtcttc gtcccaataa 68880

ccccagtgta agtgttcatc aaacaggatc ggtcccagtc gcagagccgg tgagtcataa 68940

tgatcttcga ccgtatcatt gctagcgccg gtagtctcca aagtactgcg ggacat 68996

<210> 3

<211> 80

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 3

Met Ser Gln Thr Asp Pro Phe Glu Thr Val Lys Arg Asn Val Gln Glu

1 5 10 15

Val Leu Pro Glu Leu Glu Pro Asp Met Ile Gln Pro Glu Ser Ile Leu

20 25 30

Val Asp Leu Gly Ala Asn Ser Val Asp Arg Met Asp Val Ile Thr Leu

35 40 45

Ser Met Glu Asp Met Gly Ile Ala Ile Pro Leu Met Ser Phe Ala Lys

50 55 60

Ala Val Thr Leu Arg Asp Leu Ala Glu Ile Leu Ala Ala Ser Lys Val

65 70 75 80

<210> 4

<211> 425

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 4

Met Asn Thr Ala Gly Ile Glu Ala Val Gly Val Tyr Gly Gly Ser Val

1 5 10 15

Tyr Leu Asp Val Ser Glu Leu Ala Gln Tyr Arg Gly Met Asp Leu Gln

20 25 30

Arg Phe Glu Asn Leu Leu Ile Arg Gln Lys Ser Ala Ala Leu Pro Tyr

35 40 45

Glu Asp Ala Val Ser Leu Gly Val Asn Ala Ala Lys Pro Val Ile Asp

50 55 60

Ala Leu Ser Gln Ala Glu Arg Asp Gln Ile Glu Leu Leu Ile Thr Cys

65 70 75 80

Thr Glu Ser Gly Leu Asp Phe Gly Lys Ser Leu Ser Thr Tyr Ile His

85 90 95

His Tyr Leu Gly Leu Ser Arg Asn Cys Arg Leu Phe Glu Ile Lys Gln

100 105 110

Ala Cys Tyr Ser Gly Thr Ala Gly Tyr Gln Met Ala Leu Asn Phe Ile

115 120 125

Leu Ser Gln Thr Ser Pro Gly Ala Lys Ala Leu Val Val Ala Thr Asp

130 135 140

Leu Ser Arg Val Leu Val Asp Glu Thr Ser Asp Glu Leu Thr Met Asp

145 150 155 160

Trp Glu Tyr Phe Glu Pro Ser Gly Gly Ala Gly Ala Val Ala Leu Leu

165 170 175

Val Ser Asp Gln Pro Arg Ile Phe Gln Ser Asp Ile Gly Ala Asn Gly

180 185 190

Thr Tyr Cys Phe Glu Val Met Asp Thr Cys Arg Pro Met Pro Asp Ser

195 200 205

Glu Ala Gly Asp Ser Asp Leu Ser Leu Leu Ser Tyr Leu Asp Cys Cys

210 215 220

Glu Gln Ser Phe Ala Ala Tyr Arg Ala Arg Val Glu Gly Val Ser Tyr

225 230 235 240

Gln Asp Ser Phe Asn Tyr Leu Ala Phe His Thr Pro Phe Gly Gly Met

245 250 255

Val Lys Gly Ala His Arg His Met Met Arg Arg Leu Leu Arg Ser Arg

260 265 270

Pro Asp Glu Ile Asp Val Asp Phe Glu Thr Arg Val Ala Pro Gly Leu

275 280 285

Arg Leu Cys Gln Arg Ile Gly Asn Ile Met Gly Ala Thr Val Leu Leu

290 295 300

Ser Leu Thr Gly Ala Val Leu Tyr Gly Asp Tyr Arg Thr Pro Gln Arg

305 310 315 320

Ile Gly Cys Phe Ser Tyr Gly Ser Gly Cys Ala Ser Glu Phe Tyr Ser

325 330 335

Gly Val Ser Thr Ala Asp Gly Gln Arg Arg Leu Gln Asp Ala Pro Ile

340 345 350

Gln Lys Ala Leu Asp Leu Arg His Lys Leu Thr Met Pro Gln Tyr Glu

355 360 365

Ala Leu Leu Glu Gly Cys Lys Ala Val Pro Phe Gly Thr Arg Asn His

370 375 380

Gln Pro Asp Leu Asp Gln Val Pro Asp Met Lys Ser Cys Ile Ala Asp

385 390 395 400

Gln Ser Ala Gln Leu Gly Tyr Gln Arg Leu Phe Leu Lys Glu Ile Lys

405 410 415

Asn Phe His Arg Glu Tyr Asp Val Leu

420 425

<210> 5

<211> 1166

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 5

Met Thr Gly Cys Gln Ser Lys Arg Ala Gly Leu Ser Pro Leu Ala Leu

1 5 10 15

Leu Leu Asn Ala Ala Gly Arg Gly Leu Phe Pro Ala Ala Gly Val Thr

20 25 30

Phe Arg Pro Asp Cys Arg Ala Glu Asp Leu Glu Ala Ser Leu Glu Pro

35 40 45

Ala Asp Phe Asn Ile Arg Pro Ala Ala Val Asp Asp Ile Asp Thr Leu

50 55 60

His Met Leu Glu Thr Val Cys Trp Pro Lys Glu Leu Gln Thr Pro Thr

65 70 75 80

Lys Thr Leu Ala Ser Arg Val Ala Ile Asp Pro Asn Gly Gln Leu Val

85 90 95

Leu Thr Leu Asp Gly Ser Pro Cys Gly Val Ile Tyr Ser Gln Arg Ile

100 105 110

Asn Ser Val Glu Ala Leu Thr Ser Ser Asp Met Asp Lys Val Asp Ser

115 120 125

Leu Arg Asp Pro Ser Gly Ser Ile Leu His Phe Leu Ala Ile Asn Ile

130 135 140

Leu Pro Ser Val Gln Asp Arg Gly Leu Gly Asp Ala Leu Leu Glu Phe

145 150 155 160

Ile Leu His Tyr Ala Ala Leu Ala Pro Gly Ile Lys Ser Ala Ala Ala

165 170 175

Val Thr Leu Cys Arg Asp Phe Thr Gly Arg Thr Leu Ser Asp Leu Asn

180 185 190

Glu Tyr Leu Arg Arg Lys Thr Pro Leu Gly Thr Val Ala Asp Pro Val

195 200 205

Leu Arg Phe His Glu Leu His Gly Gly Arg Ile Gln His Pro Val Pro

210 215 220

Asn Tyr Arg Ala Arg Asp Thr Arg Asn Leu Gly Ala Gly Val Leu Val

225 230 235 240

Thr Tyr Asp Leu Asn Lys Arg Arg Arg Ser His Ala Pro Gln Pro Arg

245 250 255

Gln Lys Ile Ala Arg Thr Asp Ile Ala Asn Arg Val Asn Ser Ala Ile

260 265 270

Arg Ser Ala Leu Gly Ser Ser Ser Asp Gln Phe Glu Lys Asp Thr Pro

275 280 285

Leu Ile Ser Met Gly Leu Asp Ser Ala Ala Ile Leu Gly Leu Ala Asp

290 295 300

Cys Leu Gln Ala Glu Cys Gly Ser Thr Leu Thr Ala Ala Gln Leu Phe

305 310 315 320

Lys His Asn Thr Ala Glu Lys Ile Ile Ala Phe Leu His Asn Glu Leu

325 330 335

Pro Ser Ser Gly Leu Ser Lys Pro Thr Leu Leu Pro Ala Gln Thr Ser

340 345 350

Cys Pro Ala Asp Gly Gly Ser Asp Gln Ser Val Ala Ile Ile Gly Val

355 360 365

Ser Leu Arg Met Pro Gly Gly Ile Glu Thr Pro Gln Ala Leu Trp Glu

370 375 380

Leu Leu Asp Leu Gly Gly Thr Val Ile Thr Pro Val Pro Ser Asp Arg

385 390 395 400

Trp Ser Trp Pro Asp Gly Phe Arg Pro Gln Gly Ala Ala Tyr Gly Gly

405 410 415

Phe Leu Gln Asp Pro Ala Arg Phe Asp Ala Ala Phe Phe Arg Ile Ser

420 425 430

Pro His Glu Ala Glu Ala Met Asp Pro Gln Gln Arg Ile Leu Leu Glu

435 440 445

Leu Ala Trp His Gly Leu Glu Asp Ala Gly Leu Ser Ala Thr Lys Leu

450 455 460

Ala Gly Ser Ser Thr Gly Val Phe Val Gly Ala Ser Gly Ser Asp Tyr

465 470 475 480

Gln Arg Ala Met Asp Ala Ala Gly Val Pro Val Gln Pro His His Ser

485 490 495

Thr Gly Ala Ala Leu Ser Val Ile Ala Asn Arg Leu Ser Tyr Ala Leu

500 505 510

Asp Phe Thr Gly Pro Ser Leu Val Val Asp Thr Ala Cys Ser Ser Ser

515 520 525

Leu Val Ala Val His Gln Ala Val Ala Ala Leu Gln Glu Arg Thr Cys

530 535 540

Gly Leu Ala Leu Ala Ala Gly Ile Asn Leu Ile Leu His Pro Ala Thr

545 550 555 560

Ser Gln Ala Tyr Gln Ser Ala Gly Met Leu Ser Pro Ser Gly Leu Cys

565 570 575

Arg Ser Phe Gly Ser Gly Ala Asp Gly Tyr Val Arg Ser Glu Gly Ala

580 585 590

Val Leu Leu Val Leu Lys Pro Leu Ala Gln Ala Leu Ala Glu Gly Cys

595 600 605

Arg Val His Ala Val Ile Arg Gly Ser Ala Cys Asn His Gly Gly Met

610 615 620

Thr Ser Gly Leu Thr Val Pro Ser Pro Asp Lys Gln Thr Glu Leu Leu

625 630 635 640

Ser Ala Ala Trp His Asn Ala Asp Ile Lys Pro Ala Asp Leu Asp Tyr

645 650 655

Leu Glu Ala His Gly Thr Gly Thr Lys Leu Gly Asp Pro Ile Glu Ile

660 665 670

Glu Gly Met Lys Thr Ala Leu Ala Glu Phe Asp Asp Ser Gln Pro Asn

675 680 685

Pro Pro Glu Gln His Ala Cys Leu Thr Gly Ser Val Lys Ser Asn Leu

690 695 700

Gly His Leu Glu Ala Ala Ala Gly Leu Ala Gly Leu Cys Lys Val Met

705 710 715 720

Leu Ala Leu Arg His Glu Arg Leu Pro Ala Ser Leu Asn Ala Ser Pro

725 730 735

Gln Asn Pro Glu Ile Ser Leu Asn Gly Ser Asn Leu Ala Ile Ala Asp

740 745 750

Thr Ala Arg Asp Trp Pro Lys Gly Asn Arg Pro Arg Ile Ser Gly Val

755 760 765

Ser Ser Phe Gly Ser Gly Gly Thr Asn Ala His Ile Val Val Ala Glu

770 775 780

Pro Pro Asp Ala Pro Asp Gly Val Ile Asp Thr Gly Pro Gln Leu Phe

785 790 795 800

Val Leu Ser Ala Asn Thr Pro Glu Arg Leu Met Ala Leu Ala Val His

805 810 815

Trp Gln Glu Trp Leu Lys Lys Gln Pro His Asp Leu Asn Ile Pro Ala

820 825 830

Leu Cys His Ala Ser Arg His Arg Arg Ala Ala Leu Pro Ala Arg Phe

835 840 845

Ala Thr Lys Val Ser Ser Arg Ala Asp Leu Glu Lys Ala Leu His Gln

850 855 860

Ala Ala Gln Lys Asn Pro Ala Ser Ser Gln Ala Lys Pro Lys Phe Leu

865 870 875 880

Glu His Leu Lys Gly Asp Ala Gly Gln Ala Phe Leu Gln Ala Leu Ala

885 890 895

Lys Glu Gly Asp Leu Ser Ala Leu Ala Asp Leu Trp Cys Ala Gly Val

900 905 910

Pro Val Asp Trp Ser Leu Ile Asp Ser Thr Pro Pro Glu Gln Pro Val

915 920 925

Pro Trp Ile Asp Leu Pro Leu Tyr Pro Phe Asp Lys Thr Arg Phe Trp

930 935 940

Ala Leu Gly Lys Ala Pro Ala Val Pro Gln Asp Arg Ala Ala Ala Thr

945 950 955 960

Ala Glu Leu Tyr Ala Pro Val Trp Gln Glu Leu Ala Ala Ser Lys Thr

965 970 975

Gln Met Pro Glu Pro Asp Leu Leu Ser Gly Pro Phe Ala Leu Lys Ala

980 985 990

Ala Gln Leu Leu Lys Leu Asp Pro Ser Glu Ser Arg Asn Ser Glu Thr

995 1000 1005

Asn Ala Ile Gly Glu Asn Met His Val Leu Trp Ser Ser Ala Pro Arg

1010 1015 1020

Pro Ser Asp Ser Gly Glu Thr Leu Glu Glu Phe Arg Glu Phe Gln Asp

1025 1030 1035 1040

Phe Val Ala Gly Leu Pro Arg Gln Leu Ser Arg Leu Arg Leu Thr Val

1045 1050 1055

Val Thr Trp Asn Gly Gln Ala Val Tyr Gly Asn Glu Pro Val Asp Ala

1060 1065 1070

Glu Ala Ala Ala Ile Ser Ala Phe Thr His Val Leu Ala Gln Glu Lys

1075 1080 1085

Pro Glu Trp Asp Ile Arg Thr Phe Asp Leu Asp Ser Cys Asp Pro Pro

1090 1095 1100

Ser Trp Ser Ser Leu Ala Glu Ser Asn Glu Thr Arg Ser Ala Val Arg

1105 1110 1115 1120

Ala Gly Lys Ala Tyr Gly Leu Arg Leu Ala Met Ala Asp Pro Leu Pro

1125 1130 1135

Asp Thr Gly Gln Ser His Leu Arg Glu Asp Gly Val Tyr Val Val Ile

1140 1145 1150

Gly Gly Ala Gly Ala Leu Ala Arg Pro Gly Val Lys Arg Phe

1155 1160 1165

<210> 6

<211> 3219

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 6

Met Ile His Ala Ile Thr Gly Pro Ser Asp Gln Pro Ile Leu Asp Ser

1 5 10 15

Glu Pro Glu Asn Leu Thr Arg Val Met Ala Ala Lys Thr His Gly Leu

20 25 30

Ile Gln Thr Ala His Thr Phe Ala Ala Leu Asp Leu Asp Phe Phe Leu

35 40 45

Val Phe Ser Ser Ile Ile Ser Leu Glu Gln Pro Gly Gly Phe Gly Gly

50 55 60

Tyr Ala Ala Ser Cys Ala Phe Ala Asp Ala Phe Val Arg Gly Leu Asp

65 70 75 80

Ser Gln Thr Pro Tyr Pro Val Arg Cys Leu Asn Trp Gly His Trp Asp

85 90 95

Val Gly Val Ala Arg Asn Leu Pro Glu Ala Thr Lys Ile Arg Leu Asp

100 105 110

Asn Ala Gly Val Val Pro Ile Thr Ala Gln Asp Ala Leu Lys His Cys

115 120 125

Asp Thr Ala Leu Asn Ala Pro Leu Pro Gln Leu Ala Ile Leu Lys Trp

130 135 140

Asn Asp Pro Ala Arg His Pro Leu Val Asp Ser Gln Val His Met Arg

145 150 155 160

Leu Ser Arg Lys Ala Pro Ala Arg Ser Leu Pro Ala Ala Thr Asn Glu

165 170 175

Leu Asn Thr Arg Leu Gln Glu Ile Glu Arg His Gly Leu Phe Ala His

180 185 190

Pro Glu Leu Glu Ala Ala Leu Pro Gly Ala Ile Ala Ala Glu Leu Asp

195 200 205

Arg His Gly Leu Arg Thr Ser Leu Pro Asp Thr Ala Pro Trp Tyr Leu

210 215 220

Arg Arg Trp His Lys Ala Thr Lys Arg Leu Leu Ala Gln Gly Asn Thr

225 230 235 240

Gly Glu Asn Trp Asp Ala Thr Ala Arg Arg Leu Arg Ala Asp Ala Asp

245 250 255

Leu Ala Pro Ala Ile Asn Leu Val Thr Ala Cys Leu Ala Arg Leu His

260 265 270

Glu Val Leu Thr Gly Gln Thr Pro Ala Thr Asp Val Leu Phe Pro Gly

275 280 285

Ala Ser Leu Asp Leu Leu Glu Pro Val Tyr Arg Gly Thr Ala Ser Ala

290 295 300

Asp Leu Leu Asn Asp Val Leu Ala Asp Thr Leu Ala Glu Thr Leu Arg

305 310 315 320

Ala Asp Leu Arg Asp Gln Pro Glu Asn Thr Ser Leu Arg Val Leu Glu

325 330 335

Ile Gly Ala Gly Thr Gly Gly Thr Thr Ala Arg Val Leu Pro Cys Leu

340 345 350

Ser Glu Leu Ala Gly Gln Ile Glu Thr Tyr Asp Tyr Thr Asp Leu Ser

355 360 365

Arg Ala Phe Leu Gln His Ala Gln Gln Ala Phe Ala Pro Ser Ala Pro

370 375 380

Phe Leu Lys Ser Leu Arg Phe Asp Val Glu Lys Ser Pro Glu Ser Gln

385 390 395 400

Gly Leu Gln Pro Gly Ser Tyr Asp Ala Val Leu Ala Thr Asn Val Leu

405 410 415

His Ala Thr Pro Asp Ile Arg Gln Thr Leu Arg His Thr His Ala Leu

420 425 430

Leu Lys Pro Gly Gly Val Leu Leu Leu Asn Glu Ile Val Thr Pro Ser

435 440 445

Val Phe Ala His Ala Thr Phe Gly Leu Leu Glu Gly Trp Trp Lys Ser

450 455 460

Cys Asp Pro Gly Leu Arg His Pro Asp Thr Pro Leu Leu Ser Ala Glu

465 470 475 480

Ser Trp Glu Lys Leu Leu Leu Ala Asn Gly Phe Thr Ala Val Glu Met

485 490 495

Leu Leu Asn Ser Ser Thr Ala Leu Gly Gln Gln Val Phe Ala Ala Arg

500 505 510

Ser Asp Gly Cys Phe Glu Tyr Arg Lys Ala Glu Ile Asp Thr Thr Arg

515 520 525

Arg Gln Pro Glu Thr Leu Glu Pro Arg Ile Leu Lys Asn Thr Val Ser

530 535 540

Glu Leu Pro Leu Glu Asp Leu Glu Asn Pro Gln Ala Ala Ala Ala Arg

545 550 555 560

Leu Leu Thr Glu Ile Val Ala Ser Ala Leu Gln Ile Thr Glu Asp Gln

565 570 575

Leu Asp Pro Trp Thr Pro Leu Gly Asp Tyr Gly Leu Asp Ser Ile Leu

580 585 590

Asn Ala Gln Val Thr Ala Arg Leu Arg Glu Leu Val Pro Asp Leu Asp

595 600 605

Thr Thr Phe Leu Tyr Gln Tyr Gln Thr Ile Ala Asp Leu Ser Gln Ala

610 615 620

Leu Val Gln Lys His Pro Glu Ala Phe Glu Gln Ile Gly His Thr Thr

625 630 635 640

Cys Gly Glu Ala Asp Val Ala Ser Pro Ser Thr Val Ser Ala Ser Lys

645 650 655

Arg Thr Ala Gly Asn Glu Gln Gln Asp Ile Ala Ile Val Gly Met Ser

660 665 670

Phe Arg Phe Pro Lys Ala Asp Thr Pro Glu Glu Phe Trp Thr Leu Leu

675 680 685

Ser Gln Gly Gln Ser Ala Val Thr Glu Ile Pro Pro Asp Arg Trp Gln

690 695 700

Leu Asp Gly Phe Tyr Glu Ser Asp Pro Asp Lys Ala Val Asp Gly Trp

705 710 715 720

Lys Ser Tyr Ser Lys Trp Gly Ala Phe Leu Glu Arg Val Thr Ala Phe

725 730 735

Asp Pro Leu Phe Phe Gly Ile Asn Pro Lys Glu Ala Ala Ala Ile Asp

740 745 750

Pro Gln Glu Arg Leu Phe Leu Gln Thr Ala Trp Ala Ala Leu Glu Asp

755 760 765

Ala Gly Phe Pro Arg Gln Arg Leu Ala Asp Glu Leu Ala Arg Ser Val

770 775 780

Gly Val Phe Val Gly Ile Thr Arg Thr Gly Phe Asp Leu Phe Gly Pro

785 790 795 800

Asp Leu Trp Gln Ala Gly Gln Lys Val Tyr Pro His Thr Ser Phe Ser

805 810 815

Ser Ala Ala Asn Arg Leu Ser Trp Phe Leu Asp Ala Asp Gly Pro Ser

820 825 830

Met Pro Val Asp Thr Met Cys Ser Ser Ser Leu Thr Ala Leu His Gln

835 840 845

Ala Cys Ala Ser Leu Lys Thr Gly Glu Cys Arg Leu Ala Ile Ala Gly

850 855 860

Gly Val Asn Leu Phe Leu His Pro Thr Ser Tyr Ile Gly Leu Ser Ala

865 870 875 880

Met Arg Met Leu Ser Pro Asp Gly Arg Cys Ser Ser Phe Gly Ala Gly

885 890 895

Gly Asn Gly Phe Val Pro Gly Glu Gly Val Ala Ala Leu Val Leu Arg

900 905 910

Pro Leu Ala Glu Ala Gln Ala Ala Gly Asp Gln Val Ile Gly Val Ile

915 920 925

Arg Gly Ser Ala Val Asn His Gly Gly Arg Thr Asn Gly Phe Thr Val

930 935 940

Pro Asn Pro Arg Ala Gln Ser Ser Leu Val Arg Glu Ala Met Ser Arg

945 950 955 960

Ala Gly Leu Glu Pro Gly Gln Ile Ser Tyr Leu Glu Ala His Gly Thr

965 970 975

Gly Thr Glu Met Gly Asp Pro Ile Glu Ile Thr Gly Leu Thr Glu Ala

980 985 990

Phe Ala Gly Arg Glu Gln Gly Leu Ala Pro Cys Ala Ile Gly Ser Ile

995 1000 1005

Lys Thr Asn Ile Gly His Leu Glu Ala Thr Ala Gly Leu Ala Gly Val

1010 1015 1020

Ile Lys Val Leu Leu Gln Met Arg His Arg Gln Ile Val Pro Ser Leu

1025 1030 1035 1040

His Ser Ser Ser Leu Asn Pro Lys Ile Asp Phe Glu His Ala Pro Phe

1045 1050 1055

Arg Val Ala Gln Asp Leu Thr Pro Trp Ser Pro Ala Lys Gly Arg Arg

1060 1065 1070

Ile Ala Gly Val Ser Ser Phe Gly Ala Gly Gly Thr Asn Ala His Val

1075 1080 1085

Ile Leu Glu Glu Ala Pro Asp Ile Pro Glu Lys Ser Ala Thr Asp Pro

1090 1095 1100

Ala Pro Asn Glu Pro Ile Ala Leu Val Leu Ser Ala His Asp Glu Pro

1105 1110 1115 1120

Arg Leu Arg Ala Tyr Ala Ala Arg Leu Ala Lys Phe Leu Thr Ser Pro

1125 1130 1135

Asn Ala Pro Pro Leu Ala Leu Ala Ala Gln Ser Leu Gln Leu Gly Arg

1140 1145 1150

Glu Pro Met Arg His Arg Met Ala Ala Val Val Ser Asp Lys Ala Gln

1155 1160 1165

Ala Val Ala Val Leu Gln Ala Val Ala Glu Asn Arg Pro Leu Pro Asp

1170 1175 1180

Lys Thr Phe Leu Arg Asp Thr Arg Arg Tyr Lys Gly Gln Cys Pro Ser

1185 1190 1195 1200

Ser Val Glu Ser Glu Asp Leu Gly Glu Leu Thr Asp Ala Trp Ser Lys

1205 1210 1215

Gly Ser Lys Ile Asp Trp Ala Lys Leu His Gln Arg Arg Gln Thr Val

1220 1225 1230

Ser Leu Pro Thr Tyr Pro Phe Asp Glu Lys Pro Tyr Trp Phe Ala Asp

1235 1240 1245

Thr Ala Pro Val Gly Gly Pro Met Asp Val Pro Ser Ser Glu Asp Ala

1250 1255 1260

Phe Arg Glu Leu Lys Pro Ala Ser Arg Pro Ser Pro Val Arg Arg Thr

1265 1270 1275 1280

Leu Pro Arg Leu Asp Thr Ala Pro Ala Gln Phe Glu Pro His Arg Arg

1285 1290 1295

Ser Gln Lys Leu Arg Leu Ser Ser Leu Asn Pro Ala Ser Glu Thr Pro

1300 1305 1310

Pro Ala Glu Ile Glu Leu Asp Ile Asn Gly Ile Gly Arg Val Arg Leu

1315 1320 1325

Glu Pro Ala Ser Pro Pro Pro Asn Leu Ser Thr Gly Asn Ala Met Lys

1330 1335 1340

Val Leu Val Val Glu Gly Leu Gln His Trp Asn Gly Asp Arg Leu Gly

1345 1350 1355 1360

Leu Leu His Glu Leu Asp Gln Leu Ser Gln Pro Val Ile Leu Thr Val

1365 1370 1375

Ser Ala Ser Ser Leu Pro Pro Ile Pro Asp Thr Leu Leu Thr Ala Pro

1380 1385 1390

Ala Phe Glu Gln Ala Gln Glu Met Ala Asn Ala Thr Ala Arg Cys Pro

1395 1400 1405

Ala Ala Thr Leu Ala Thr Leu Lys Asn His Ile Arg Asn Gln Pro Ser

1410 1415 1420

Trp Pro Asp Ile Ala Gly Ile Pro Ala Glu Trp Met Ala Gly Ser Gly

1425 1430 1435 1440

Trp Pro Val Ser Ser Pro Glu Pro Ala Pro Ser Gly Gly Ala Ile Pro

1445 1450 1455

Leu Gln Ser Glu Val Val Gln Leu His Asp Met Gly Gly Gly Val Ala

1460 1465 1470

Gln Ile Thr Met Ala Glu Arg Asp Ala Gln Asn Thr Phe Thr Pro Ala

1475 1480 1485

Phe Val Thr Gly Val Leu Glu Ala Phe Asp Lys Val Glu Ser Ser Ala

1490 1495 1500

Ala Phe Lys Val Val Val Leu Thr Gly Tyr Glu Ala Tyr Phe Ala Cys

1505 1510 1515 1520

Gly Gly Thr Arg Glu Gly Leu Leu Ala Ile Gln Asn Gly Gln Ala Arg

1525 1530 1535

Phe Thr Asp Glu Gln Ser Tyr Ala Arg Pro Leu Arg Cys Pro Ile Pro

1540 1545 1550

Val Ile Ala Ala Met Gln Gly His Gly Ile Gly Ala Gly Trp Ala Met

1555 1560 1565

Gly Leu Tyr Cys Asp Leu Ala Ile Tyr Ser Glu Glu Ser Cys Tyr Gln

1570 1575 1580

Ser Pro Tyr Met Leu Tyr Gly Phe Thr Pro Gly Ala Gly Ala Thr Thr

1585 1590 1595 1600

Leu Phe Pro Ala Arg Leu Gly Arg Gln Leu Ala Asn Glu Ile Leu Phe

1605 1610 1615

Thr Ala Gln Ser Phe Pro Gly His Ile Leu Ala Gln Lys Gly Leu Thr

1620 1625 1630

Ala Pro Val Leu Pro Arg Glu Glu Val Leu Pro Gln Ala His Ala Leu

1635 1640 1645

Ala Arg Ser Ile Ala Gln Asn Pro Arg Glu Thr Leu Met Ala Arg Lys

1650 1655 1660

Ser Thr Gln Thr Ala Glu Phe Leu His Met Leu Pro Arg Leu Phe Glu

1665 1670 1675 1680

Ala Glu Leu Ala Leu His Glu Ser Thr Phe Val Gly Asn Ser Asp Val

1685 1690 1695

Leu Glu Gln Ile Ser Glu His Phe Ala Asp Lys Gln Met Thr Gln Lys

1700 1705 1710

Pro Gly Ala Ser Gln Lys Glu Ala Arg Asn Thr Ser Ala Leu Lys Thr

1715 1720 1725

Gln Leu Arg Met Met Leu Ala Glu Glu Leu Asp Ile Pro Pro Asp Arg

1730 1735 1740

Ile Asp Asp Asp Thr Pro Phe Val Asp Leu Gly Leu Glu Ser Ile Ala

1745 1750 1755 1760

Ala Val Ile Trp Val Arg Lys Ile Gly Glu Glu Leu Gly Ala Gln Ile

1765 1770 1775

Gly Ala Thr Ser Val Tyr Ser His Pro Asn Leu Ala Ala Phe Thr Glu

1780 1785 1790

Leu Val Ala Glu Lys Gly Gly Gln Leu Ala Glu Ala Val Asn Lys Thr

1795 1800 1805

Thr Ala Pro Pro Ser Glu Pro Pro Lys Ala Ala Ile Pro Ala Asp Pro

1810 1815 1820

Glu Glu Arg Leu Leu Pro Ser Asp Ser Ser Asp Leu Phe Val Trp Leu

1825 1830 1835 1840

Gln Ala Ser Leu Glu Thr Glu Leu Ser Ile Pro Ser Gly Thr Leu Asp

1845 1850 1855

Pro Asp Arg Pro Phe Val Glu Leu Gly Leu Asp Ser Val Thr Ala Val

1860 1865 1870

Thr Trp Ile Arg Gln Val Asn Asp Ala Leu Gly Thr Lys Glu Thr Gly

1875 1880 1885

Thr Val Val Tyr His His Thr Asn Leu Thr Glu Leu Ala Ala Tyr Leu

1890 1895 1900

Ala Gly Ile Ala Gly Lys Thr Pro Thr Thr Arg Thr Thr Ser Leu Pro

1905 1910 1915 1920

Tyr Lys Leu Glu Ala Pro Val Arg Ser Ala Leu Pro Arg Leu Glu Asn

1925 1930 1935

Leu Ala Pro Phe Gln Asp Glu Arg Pro Gly Ile Ala Ile Val Gly Met

1940 1945 1950

Ala Gly Arg Phe Pro Glu Ala Pro Asn Val Ser Ser Phe Trp Gln Asn

1955 1960 1965

Val Leu Ala Gly Arg Asp Cys Val Tyr Glu Ile Pro Ala Thr Arg Trp

1970 1975 1980

Ser Ile Asp Ala Tyr Tyr Asp Pro Asp Arg Gln Ala Pro Gly Lys Thr

1985 1990 1995 2000

Val Cys Arg Arg Met Gly Ala Ile Glu Asp Ile Asp Ala Phe Asp Ser

2005 2010 2015

Leu Phe Phe Gly Ile Ser Pro Ala Glu Ala Glu Leu Met Asp Pro Gln

2020 2025 2030

Gln Arg Leu Phe Leu Glu Thr Ala Trp Glu Ala Ile Glu Asp Ala Gly

2035 2040 2045

His Ala Pro Ser Thr Leu Ala Gly Thr Arg Cys Gly Leu Phe Val Gly

2050 2055 2060

Thr Glu Asn Gly Asp Tyr Ala Arg Ile Ala Gly Asp Ala Lys Pro Glu

2065 2070 2075 2080

Ala Leu Ala Leu Thr Gly Arg Ser Val Ala Met Leu Pro Ala Arg Ala

2085 2090 2095

Ala Tyr Ala Leu Asp Leu Gln Gly Pro Cys Leu Ala Ile Asp Thr Ala

2100 2105 2110

Cys Ser Ala Ser Leu Val Ala Ile Ala Gln Ala Cys Ala Ser Leu His

2115 2120 2125

Asp Arg His Cys Asp Ser Ala Leu Ala Gly Gly Val Asn Val Leu Thr

2130 2135 2140

Gly Pro Glu Ile His Val Ala Met Ser His Ala Gly Met Leu Ser Pro

2145 2150 2155 2160

Ser Gly Lys Cys Asn Ser Phe Asp Ser Arg Ala Asp Gly Phe Val Pro

2165 2170 2175

Gly Glu Gly Val Gly Ala Leu Leu Leu Lys Arg Leu Glu Asp Ala Gln

2180 2185 2190

Ala Asn Gly Asp Asp Val Tyr Ala Val Ile Arg Gly Trp Gly Val Asn

2195 2200 2205

Gln Asp Gly Arg Thr Asn Gly Ile Thr Ala Pro Asn Pro Ala Ala Gln

2210 2215 2220

Thr Arg Leu Gln Thr Glu Leu Tyr His Arg Phe His Ile Asp Pro Ala

2225 2230 2235 2240

Arg Ile Gly Met Val Glu Ala His Gly Thr Gly Thr Ala Leu Gly Asp

2245 2250 2255

Pro Ile Glu Val Glu Ala Leu Lys Arg Ser Phe Ala Gln Phe Thr Asp

2260 2265 2270

Arg Lys Asn Tyr Cys Ala Leu Gly Ser Val Lys Ser Asn Ile Gly His

2275 2280 2285

Leu Ala Thr Ala Ala Gly Val Ala Gly Ala Ile Lys Ala Thr Leu Ala

2290 2295 2300

Leu Lys His Arg Lys Ile Pro Ala Ser Ile His His Asp Gln Leu Asn

2305 2310 2315 2320

Pro His Ile Asp Leu Lys Asp Ala Pro Phe Tyr Val Pro Arg Thr Ala

2325 2330 2335

Ala Asp Trp Thr Ala Gly Pro Asp Ala Pro Gln Tyr Ala Ala Val Ser

2340 2345 2350

Ser Phe Gly Tyr Ser Gly Thr Asn Ala His Leu Val Leu Glu Ala Ala

2355 2360 2365

Pro Ala Arg Pro Val Pro Val Thr Gln Thr Gln Ala Val Ile Val Pro

2370 2375 2380

Val Ser Ala Arg Ser Leu Glu Cys Leu Thr Glu Ala Val Thr Arg Leu

2385 2390 2395 2400

Ser Thr Tyr Leu Gly Thr Gly Ala Gly Gln Thr Val Pro Leu Ala Asp

2405 2410 2415

Leu Ala Leu Thr Tyr Gln Thr Gly Arg Asp Thr Phe Asp Gln Arg Val

2420 2425 2430

Ala Phe Leu Ala Asp Ser His Asp Ser Leu Arg Ala Gly Leu Glu Gln

2435 2440 2445

Phe Leu Asn Glu Pro Glu His Ala Gly Gly Val Val Tyr Ser Asn Asp

2450 2455 2460

Met Pro Pro Thr Leu Arg Asp Thr Ala Thr Ala Trp Ile Glu Gly Lys

2465 2470 2475 2480

Thr Ile Ala Trp Pro Val Val Ala Gly Ala Ser Arg Arg His Gly Cys

2485 2490 2495

Pro Thr Tyr Pro Phe Ala Lys Glu Arg His Trp Val Ser Asp Ala Pro

2500 2505 2510

Val Glu Leu Pro Glu Ala Ala Pro Ile Pro Ser Lys Glu Thr Pro Leu

2515 2520 2525

Gln Pro Glu Ala Glu Asp Thr Ala Val Asp Pro Asp Trp Arg Glu Arg

2530 2535 2540

Leu Lys Gln Arg Phe Ala Arg Pro Ile Thr Leu Leu Ser Asp Asp Pro

2545 2550 2555 2560

Lys Trp Ile Gly Ser Met Ala Ser Leu Leu Ser Ala Leu Gly Ala Ala

2565 2570 2575

Pro Gly Gly Pro Gly Gln Pro Asp Leu Arg Ile Lys Ser Asn Leu Arg

2580 2585 2590

Glu Ala Glu Gly Ser Val Phe Cys Asp Thr His Leu Gly Thr Arg Leu

2595 2600 2605

Pro Gly Asn Glu Gln Val Asp Leu Leu Ile Leu Thr Glu Leu Pro Ser

2610 2615 2620

Asp Pro Gly Leu Ile Pro Gln His Ala Leu Ile Val Ser Asp Asp Asn

2625 2630 2635 2640

Arg Asp Asp Ile Glu Ser His Cys Gln Arg Leu Ile Gln Glu Trp Leu

2645 2650 2655

Arg Leu Glu Pro Asp Gly Ser Lys Asp Thr Leu His Val Gln Phe Arg

2660 2665 2670

Asn Gly Arg Arg Leu Val Ala Ala Lys Pro Leu Asp Pro Ala Asp Gly

2675 2680 2685

Ala Cys Ile Leu Arg Lys Thr Trp Gln Arg Thr Pro Leu Ala Asp Gln

2690 2695 2700

Lys Thr Ala Pro Ser Asp Lys Asn Val Cys Leu Ile Gly Arg Gly Pro

2705 2710 2715 2720

Lys Phe Glu Ala Leu Ala Ser Gly Leu Glu Ala His Phe Gln Ser Val

2725 2730 2735

Thr Leu Arg Asp Thr Pro Pro Glu Gly Ala Met Ala Ala Trp Asp Val

2740 2745 2750

Phe Ile Asp Ala Ala Ala Leu Thr Glu Val Arg Asp Asn Asp Pro Asp

2755 2760 2765

Asp Pro Asp Arg Arg His Trp Ile Gln Ser Leu Met Arg Glu Gly Arg

2770 2775 2780

Asp Leu Asn Leu Leu His Leu Thr Cys Asp Val Ile Pro Phe Arg Ser

2785 2790 2795 2800

Val Ser Arg Asn Leu Ala Gly Ala Arg Gln Ala Gly Leu Val Lys Asn

2805 2810 2815

Leu Arg Ala Glu Tyr Arg Phe Ala Glu Ser Arg Trp Leu Asp Leu Asp

2820 2825 2830

Met Ala Gln Val Ala Asp Thr Ala Gly Leu Ala Lys Leu Ile Ala Ala

2835 2840 2845

Glu Cys Ala Ser Ala Gly Pro Val Ser Glu Val Cys Tyr Arg Gly Gly

2850 2855 2860

Ala Arg Phe Ala Pro Val Leu Glu Ala Pro Glu Pro Val Ala Ser Pro

2865 2870 2875 2880

Ser Val His Leu Asn Ala Glu Gly Leu Tyr Leu Ile Ser Gly Gly Thr

2885 2890 2895

Arg Gly Val Gly Leu Thr Leu Ala Gln Asp Leu Ala Ala Gln Gly Ala

2900 2905 2910

Arg His Leu Ala Leu Ile Gly Glu Thr Pro Leu Pro Pro Met Gln Asp

2915 2920 2925

Trp Pro Ser Leu Ile Ala Ala Ala Asp Thr Pro Ala Glu Ile Arg Ser

2930 2935 2940

Gln Leu Ser Ile Leu Gln Ala Leu Ser Asp Gln Leu Glu Thr Leu Glu

2945 2950 2955 2960

Ile Leu His Ala Cys Val Ser Asp Ala Ala Lys Val Ser Ala Trp Leu

2965 2970 2975

Ser Ser Leu Arg Lys Arg Gly Leu Pro Leu Ser Gly Val Ile His Ala

2980 2985 2990

Ala Gly Arg Tyr Ser Glu Val Asp Pro Pro Gly Phe Ala Ala Lys Ser

2995 3000 3005

Ala Asp His Met Arg Ala Val Leu Thr Ala Lys Ala Asp Gly Leu Glu

3010 3015 3020

Thr Leu His Ser Leu Thr Lys Asn Asp Pro Leu Ser Phe Leu Leu Val

3025 3030 3035 3040

Leu Thr Ser Ile Thr Gly Leu Val Pro His Phe Ala Arg Gly Ala Leu

3045 3050 3055

Asp Tyr Ala Met Ala Asn Ala Tyr Ala Asp Leu Phe Ala Ala Lys Ala

3060 3065 3070

His Glu Leu Asp Gly Gly Arg Thr Arg Ser Thr Ile Leu Ser Asp Trp

3075 3080 3085

Thr Gln Ser Gly Ala Phe Cys Arg Val Arg Pro Glu Lys Ala Lys Ser

3090 3095 3100

Val Gln Lys Asn Phe Asp Gln Ile Gly Leu Lys Thr Leu Ser Asp Ala

3105 3110 3115 3120

Glu Gly Cys Ala Leu Ile Arg Arg Ala Leu Ser Pro Thr Ala Glu Thr

3125 3130 3135

Gly Thr Ile Leu Gly Leu Ile Ala Glu Asp Arg Phe Ala Ala Ala Arg

3140 3145 3150

Pro Gly Leu Leu Leu Ala Gly Thr Leu Asn Asp Glu Ala Leu Asp Met

3155 3160 3165

Asn Thr Gln Leu Ala Arg Trp Glu Lys Ile Arg Ser Arg Gly Asp Leu

3170 3175 3180

Val Thr Ile Glu Asp Val Thr Ser Val Ile Gly Leu Glu Gln Ile Arg

3185 3190 3195 3200

Glu Leu Pro Pro Arg Lys Cys Phe Ala Ser Thr Gly Ser Cys Leu Ala

3205 3210 3215

Pro Leu Lys

<210> 7

<211> 97

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 7

Met Leu Arg Leu His Arg Ile Met Leu Gly Pro Thr Glu Val Val Pro

1 5 10 15

Pro Glu Ala Glu Asp Glu Ser Leu Pro Asp Met Ile Ala Gly Ile Val

20 25 30

Cys Asn Val Leu Lys Leu Lys Glu Ile Asp His Asn Thr Pro Leu Gln

35 40 45

Asn Tyr Gly Leu Asp Ser Ile Ser Gly Met Ile Leu Ser Thr Arg Leu

50 55 60

Glu Ile Ala Leu Asp Met Thr Val Asp Pro Arg Thr Leu Ile Asp His

65 70 75 80

Pro Ser Ile Ala Ala Leu Ser Ala Tyr Ile Gln Lys Ala Arg Glu Ala

85 90 95

Ala

<210> 8

<211> 373

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 8

Met Ser Gln Ser Ile Glu Glu Leu Leu Gly Val Asp Thr Leu Pro Lys

1 5 10 15

Pro Ser Arg Arg Gln Asn Met Arg Phe Ser Cys Leu Phe Phe Ser Asp

20 25 30

Val Arg Thr Asp Ile Ser Tyr Ala Glu Lys Tyr Arg Phe Leu Gly Asp

35 40 45

Val Thr Arg Phe Ala Asp Gln Thr Gly Phe Glu Ala Val Tyr Phe Pro

50 55 60

Glu Arg His Phe His Glu Phe Gly Ser Val Phe Ala Asn Pro Ala Ile

65 70 75 80

Ala Ala Ala His Leu Ile Pro Gln Thr Gln Asn Ile Arg Phe Arg Thr

85 90 95

Ala Gly Val Thr Ile Pro Leu His His Pro Ala Glu Ile Val Glu Trp

100 105 110

Trp Ala Met Asn Asp Val Leu Ser Gly Gly Arg Val Asp Leu Gly Phe

115 120 125

Gly Ser Gly Trp Ala Lys Gly Asp Phe Ile Tyr Ala Pro Glu Asn Phe

130 135 140

Glu Asp Arg Arg Lys Ile Cys Ser Asp Gly Ile Glu Thr Ile Lys Arg

145 150 155 160

Leu Trp Arg Gly Glu Thr Leu Ala Phe Pro Gly Pro Gly Gly Asp Val

165 170 175

Val Asp Ile Thr Val Tyr Pro Arg Pro Ile Gln Ser Asp Leu Ala Val

180 185 190

Trp Leu Leu Ile Thr Gln Asn Glu Asp Ala Phe Ile His Ala Gly Lys

195 200 205

Met Gly Tyr Asn Val Phe Thr Met Leu Tyr Gly Thr Asn Leu Glu Asn

210 215 220

Leu Ser Gln Lys Ile Ala Leu Tyr Arg Lys Ala Arg Gln Glu Ala Gly

225 230 235 240

His Asp Pro Val Ser Gly Arg Val Thr Leu Thr Leu His Thr Leu Leu

245 250 255

Leu Asp Thr Met Asp Ser Val Leu Ala Ala Ile Glu Val Pro Phe Arg

260 265 270

Gln Tyr Ile Gln Ser Ser Leu Asn Ala His Val Asn Ala Gly Ala Val

275 280 285

Thr Gly Ala Ser Ala Asp Leu Ser Asp Ala Asp Arg Ala Lys Val Leu

290 295 300

Asp Tyr Ala Tyr Gln Arg Tyr Val Arg Thr Gly Ala Leu Phe Gly Thr

305 310 315 320

Pro Asp Thr Ala Lys Asp Met Val Asp Glu Val Ile Ala Ala Asp Val

325 330 335

Asp Glu Ile Ala Cys Leu Met Asp Phe Gly Ala Asp Tyr Asp Ile Val

340 345 350

Arg His Gly Phe Thr His Leu Ala Gln Leu Ala Gln His Tyr Ser Ser

355 360 365

Pro Leu Leu Thr Pro

370

<210> 9

<211> 318

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 9

Met Ala Ser Glu Leu Lys Asp Leu Arg Gln Arg Leu Val Asp Arg Leu

1 5 10 15

Ser Ala Thr Val Glu Gln Lys Ile Ser Ser Ile Gly Tyr Val Pro Glu

20 25 30

Asp Leu Val Arg Ile Ala Gly Ser Gly Val Pro Ala Glu Pro Ser His

35 40 45

Asp Glu Val Tyr Lys Ala Pro Glu Asp Leu Lys Glu Ala Ile Asn Glu

50 55 60

His Tyr Asp Phe Ser Phe Tyr Ala Arg Glu Thr Ile Trp Ala Asp Met

65 70 75 80

Leu Ala Gly Thr His Phe Arg Asn Ile Gly Tyr Trp Asp Ala Asn Thr

85 90 95

Glu Ser Leu Asp Gln Ala Gly Arg Asn Leu Gln Asp Gln Leu Leu Ala

100 105 110

Leu Leu Pro Gln Lys Thr Gly Arg Ile Leu Asp Val Ala Cys Gly Met

115 120 125

Gly Ala Ser Thr Lys Arg Leu Leu Asp Thr Tyr Arg Pro Glu Asp Val

130 135 140

Trp Ala Ile Asn Ile Ser Ala Lys Gln Ile Glu Thr Thr Ser Gln Asn

145 150 155 160

Ala Pro Gly Cys Asn Ala Gln Val Met Ser Ala Thr Glu Met Thr Phe

165 170 175

Glu Asp Asn Phe Phe Asp Ala Val Glu Cys Ile Glu Ala Ala Phe His

180 185 190

Phe Asp Thr Arg Arg Lys Phe Leu Glu Asp Thr Leu Arg Ile Leu Lys

195 200 205

Pro Gly Gly Arg Leu Val Met Ser Asp Val Leu Met Thr Ser Gly Ala

210 215 220

Arg Leu Glu Gln Tyr Pro Val Phe Pro Asn Pro Glu Asn His Ile Ala

225 230 235 240

Thr Ile Glu Asp Tyr Lys Ser Val Leu Glu Glu Ile Gly Tyr Glu Asn

245 250 255

Ile Thr Ile Ser Asp Glu Arg Asn Asn Ile Trp Lys Ser His Phe Met

260 265 270

Ala Thr Thr Asn Arg Ile His Glu Gly Phe Leu Ala Arg Lys Tyr Asn

275 280 285

Ile Val Glu Val Thr Asp Met Ile Trp Thr Tyr Tyr Glu Leu Asp Ala

290 295 300

Ile Thr Gly Pro Cys Pro Ile Leu Gly Ala Ser Lys Pro Arg

305 310 315

<210> 10

<211> 414

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 10

Met Ser Val Pro Glu Glu Thr Asp Thr Asp Trp Trp Thr Met Leu Ala

1 5 10 15

Asp Pro Asp Phe Leu Ala Asp Pro His Asp Arg Leu Asp Val Leu Arg

20 25 30

Ala Glu Asn Pro Ile His Phe Asp Pro Ala Ser Gly Cys Tyr Phe Ile

35 40 45

Leu Gly His Ala Glu Phe Ser Glu Ala Met Arg Asn Lys Ala Ile Gly

50 55 60

Arg Asp Ser Arg Asn Trp Lys Gly Gly Trp His Ser Asp Pro Gly Phe

65 70 75 80

Arg Glu Arg Asp Pro Val Ala Phe Arg Leu Phe Ser Leu Phe Gln Pro

85 90 95

Gln Met Ile Asn Val Asp Gly Ile Asp His Ala Arg Met Arg Gly Val

100 105 110

Tyr Glu Pro Ala Phe Arg Ala Gln Ala Val Ala Gln Leu Glu Gly Met

115 120 125

Val Arg Glu Glu Thr Glu Arg Leu Ile Ala Ala Leu Pro Ser Asp Gly

130 135 140

Arg Pro Val Asn Leu Ile Asp Ala Tyr Ala Gln Pro Met Pro Leu Asn

145 150 155 160

Val Leu Cys Arg Leu Phe Asp Ile Pro Arg Asp Met Ala Asp Thr Val

165 170 175

Ser Asp Trp Ser Lys Lys Leu Ile Gln Ile Gly Asp Leu Met Leu Thr

180 185 190

Asp Gln Gln Lys Ser Asp Gly Leu Glu Ala Leu Thr Ala Phe Lys Ser

195 200 205

Tyr Leu Arg Glu Gln Leu Ser Val Ser Ser Thr Gly Thr Glu Gly Ser

210 215 220

Leu Met Arg Leu Ala Leu Gln Gly Leu Asp Asn Gly Thr Leu Asp Glu

225 230 235 240

Glu Glu Thr Leu Thr Asn Leu Val Ala Leu Leu Ile Ala Gly His Glu

245 250 255

Thr Thr Val Thr Leu Ile Gly Ile Gly Leu Lys Leu Leu Leu Glu His

260 265 270

Pro Lys Glu Met Glu Arg Leu Arg Ala Gln Pro Asp Leu Ala Arg Asn

275 280 285

Ala Ala Asp Glu Thr Leu Arg Tyr Asp Pro Gly Gly Asn Phe Leu Leu

290 295 300

Arg Val Ala Ala Gln Ser Cys Glu Ile Gly Gly Val Lys Ile Pro Gln

305 310 315 320

Gly Ala Pro Val Ile Gly Leu Leu Arg Ala Thr Asn Arg Asp Pro Ala

325 330 335

Arg Phe Lys Asp Pro His Arg Phe Asp Ile Thr Arg Thr Gly Asn Ala

340 345 350

His His Thr Phe Gly Gly Gly Ala His Phe Cys Leu Gly Ala Pro Leu

355 360 365

Ala Arg Met Glu Gly Arg Leu Ala Phe Gln Cys Leu Leu Ser Ala Phe

370 375 380

Ala Asp Ile Glu Leu Gln Glu Pro Pro Arg Trp Leu Asn Met Gly Thr

385 390 395 400

Asn Ala Arg Ser Leu Glu Ser Leu Ile Val Thr Leu Lys Arg

405 410

<210> 11

<211> 455

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 11

Met Ile Ala Ala Gly His Leu Gly Ser Ala Ala Phe Arg Asp Asp Tyr

1 5 10 15

Gly Val Ser His Ala Tyr Met Ala Gly Ala Met Val Lys Gly Ile Ala

20 25 30

Ser Ala Asp Leu Val Ile Arg Met Ala Gln Ala Arg Leu Leu Ala Ile

35 40 45

Tyr Gly Ser Gly Gly Val Pro Ile Glu Asp Ala Ala Val Gln Ile Arg

50 55 60

Arg Ile Lys Glu Thr Val Pro Pro Gly Ser Val Phe Gly Val Asn Val

65 70 75 80

Leu Ala Asp Pro Leu His Pro Arg Arg Glu Met Leu Met Val Asp Arg

85 90 95

Leu Leu Gln Leu Gly Ile Arg Val Ile Glu Ala Ser Ala Phe Met Glu

100 105 110

Val Thr Glu Ala Leu Val Lys Tyr Arg Leu Lys Gly Ala Lys Leu Arg

115 120 125

Asp Gly Ala Leu Asp Val Pro Asn Arg Val Phe Ala Lys Val Ser His

130 135 140

Pro Gly Val Ala Ser Ala Phe Leu Ala Pro Ala Thr Pro Glu Leu Ile

145 150 155 160

Gln Arg Leu Leu Ser Gln Gly Leu Ile Thr Glu Glu Glu Ala Ser Leu

165 170 175

Ala Pro Gly Ile Pro Val Ala Ser Asp Leu Thr Val Glu Ala Asp Ser

180 185 190

Gly Gly His Thr Asp Arg Gly Val Thr Ser Ala Leu Leu Pro Ala Met

195 200 205

Ile Ala Leu Arg Asp Ala Gln Gln Ala Gln His Ser Phe Ala Gln Pro

210 215 220

Ser Arg Val Gly Ser Ala Gly Gly Ile Gly Thr Pro Gln Ala Ala Ala

225 230 235 240

Thr Ala Phe Leu Leu Gly Ala Asp Tyr Ile Ala Thr Gly Ser Ile Asn

245 250 255

Gln Cys Thr Pro Glu Ala Gly Thr Ser Glu Ala Val Lys Glu Val Leu

260 265 270

Gln Arg Thr Gly Val Gln Asp Thr Ala Tyr Ala Pro Ala Gly Asp Met

275 280 285

Phe Glu Leu Gly Ala Lys Val Gln Val Leu Lys Lys Gly Leu Leu Phe

290 295 300

Pro Ala Arg Ala Asn Lys Leu Tyr Asp Leu Trp Arg Ala His Pro Gly

305 310 315 320

Leu Glu Ala Leu Pro Val Ala Ile Arg Lys Glu Ile Glu Asp Lys Tyr

325 330 335

Phe Arg Arg Ser Phe Glu Asp Val Tyr Ala Glu Thr Arg Ser Phe Tyr

340 345 350

Asp Lys Ala Ala Pro Glu Glu Ile Glu Arg Ala Glu Arg Asn Pro Lys

355 360 365

Val Lys Met Ala Leu Ile Phe Arg Trp Tyr Phe Ile His Ser Met Arg

370 375 380

Leu Ala Leu Ala Gly Glu Thr Gly Gln Lys Thr Asp Trp Gln Val Tyr

385 390 395 400

Cys Gly Pro Ala Leu Gly Ala Phe Asn Thr Tyr Val Ala Gly Thr Asp

405 410 415

Leu Glu Lys Trp Gln Asn Arg His Val Asp Tyr Ile Gly Leu His Leu

420 425 430

Met Asp Gln Thr Ala Ser Tyr Leu Gly Ala Gln Phe Asn Ala Leu Arg

435 440 445

Gln Thr Gly Thr Ala Leu Ser

450 455

<210> 12

<211> 337

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 12

Met Asn Ala Phe Ser His Pro Trp Pro Thr Asp Leu Ala Pro Asp Pro

1 5 10 15

Val Ile Trp Met Phe Ala Gly Gln Gly Ala Gln Tyr Phe Gln Met Gly

20 25 30

Arg Gly Leu Tyr Asp Ala His Pro Val Phe Arg Ala Ser Met Leu Arg

35 40 45

Met Glu Glu Ala Leu Gln Pro Tyr Leu Asp His Pro Val Thr Asp Val

50 55 60

Leu Tyr Asp Asp Phe Ala His Val Gly Asp Thr Phe Asp Gln Leu Thr

65 70 75 80

Asp Thr His Pro Ala Leu Phe Met Val Gln Val Ala Leu Ala Glu Thr

85 90 95

Leu Ile Ala Glu Gly Leu Pro Lys Pro Asn Leu Leu Leu Gly Val Ser

100 105 110

Leu Gly Glu Tyr Val Ala Ala Ala Val Ser Gly Ala Ile Ser Pro Glu

115 120 125

Glu Val Leu Pro Ala Leu Leu Arg Gln Ala Trp Thr Ile Gln Ser Lys

130 135 140

Ala Glu Pro Gly Ala Met Leu Met Val Leu Asp Asp Leu Ala Gln Phe

145 150 155 160

Glu Ala Asp Pro Ile Tyr Arg Arg Gly Ser Ser Glu Leu Ala Gly Val

165 170 175

Val Phe Asp Arg Cys Phe Val Ile Thr Gly Pro Thr Asn Gly Ile Asn

180 185 190

Asp Ile Ala Asp Asp Leu Arg Ala Arg Asp Ile Ser His His Arg Leu

195 200 205

Pro Val Arg Tyr Ala Phe His Gly Ser Gly Ile Glu Ala Ile Glu Thr

210 215 220

Ser Phe Arg Ala Ala Leu Arg Ala Phe Ser Trp Gly Ala Ala Gln Ile

225 230 235 240

Pro Val Ile Gly Ala Ser Asp Gly Thr Gly Arg Pro Phe Asp Pro Val

245 250 255

Glu Arg Asp Trp Trp Lys Val Val Arg Gly Pro Ile Arg Leu His Glu

260 265 270

Thr Leu Leu Ala Leu Asn Ala Gln Tyr Pro Lys Ala Thr Tyr Ile Asp

275 280 285

Cys Gly Pro Ala Gly Asn Leu Arg Thr Ala Cys Leu Tyr Gly Leu Gly

290 295 300

Asp Asp Leu Arg Ala Arg Ser Phe Ala Val Met Thr Pro Phe Gly Ala

305 310 315 320

Asp Thr Gln Asn Leu Ser Ala Leu Lys Asn His Leu Gly Glu Ala Val

325 330 335

Gly

<210> 13

<211> 375

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 13

Met Lys Ala Phe Leu Phe Pro Gly Gln Gly Ser Gln His Ile Gly Met

1 5 10 15

Gly Glu Gly Leu Phe Glu Arg Tyr Ser Glu Met Thr Glu Ala Ala Asp

20 25 30

Thr Val Leu Gly Tyr Ser Ile Ala Asp Leu Cys Leu Arg Asp Pro Asp

35 40 45

Lys Gln Leu Thr Gln Thr Glu Phe Thr Gln Pro Ala Leu Phe Val Val

50 55 60

Asn Ala Met Met Ala Arg Ala Gln Gln Asp Asp Ser Gly Ala Pro Asp

65 70 75 80

Ile Ala Ala Gly His Ser Val Gly Glu Tyr Asn Ala Leu His Gln Ala

85 90 95

Gly Val Val Asn Phe Glu Asp Gly Leu Arg Leu Val Gln Lys Arg Gly

100 105 110

Ala Leu Met Ser Thr Ala Pro Lys Gly Gly Met Ala Ala Val Ile Gly

115 120 125

Leu Thr Pro Asp Arg Ile Ala Thr Val Leu Gln Asp Asn Gly Phe Ala

130 135 140

Ser Ile Asp Val Ala Asn Leu Asn Ser Asp Lys Gln Thr Ile Ile Ser

145 150 155 160

Gly Leu Ile Glu Asp Ile Ser Ala Val Glu Pro Phe Phe Ser Asp Ala

165 170 175

Gly Ala Met Tyr Ile Pro Leu Asn Val Ser Gly Ala Phe His Ser Arg

180 185 190

Tyr Met Ala Pro Val Gln Glu Glu Phe Glu Ala Phe Leu Gly Glu Phe

195 200 205

Arg Phe Glu Ala Pro Gly Ile Pro Val Ile Ala Asn Val Asp Ala Arg

210 215 220

Pro Tyr Gln Asp Gly Cys Thr Ala Gln Met Leu Ala Gln Gln Leu Thr

225 230 235 240

Ser Pro Val Arg Trp Gln Glu Ser Ile Gly Tyr Met Leu Asn Leu Gly

245 250 255

Val Gly His Phe Phe Glu Thr Gly Pro Gly Asn Val Leu Ser Lys Leu

260 265 270

Val Ala Gly Ile Arg Lys Gln His Val Val Thr Pro Val Glu Thr Glu

275 280 285

Leu Pro Pro Gln Ala Gly Ser Pro Pro Val Leu Gln Glu Glu Thr Gln

290 295 300

Ala Gln Glu Ala Lys Thr Pro Val Gln Ile Val Glu Asp Trp Asn Thr

305 310 315 320

Gln His Ser Ala Gly Ile Asp Val Gln Val Asn Gly Tyr Asp Gly Val

325 330 335

Met Lys Thr Arg Ser Glu Ala Ile Leu Leu Phe Gly His Arg Pro Ala

340 345 350

Val Tyr Met Glu Gly Tyr Ser Gly Tyr Phe Ala Leu Ser Asp Val Thr

355 360 365

Pro Ile Glu Ala Gln Leu Ser

370 375

<210> 14

<211> 245

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 14

Met Leu Ser Pro Leu Ser Ile Thr Gln Asn Gly Arg Ser Ser Thr Leu

1 5 10 15

Trp Phe Asp Arg Pro Glu Ser Gly Asn Thr Ile Thr Glu Ala Leu Val

20 25 30

Glu Asp Ala His Ala Ala Leu Asp Arg Ala Glu Glu Ala Gly Cys Thr

35 40 45

Ala Ile Ile Leu Arg Gly Ser Gln Thr Val Phe Cys Thr Gly Ala Asp

50 55 60

Phe Gly Gly Gly Asp Pro Val Asp Pro Glu Arg Leu Tyr His Leu Trp

65 70 75 80

Glu Arg Leu Ala Leu Gly Pro Phe Val Ser Leu Ser Val Val Glu Gly

85 90 95

Gln Ala Thr Ala Gly Gly Ile Gly Phe Val Ala Ala Ser Asp Met Val

100 105 110

Leu Ala Gly Pro Asp Ala Arg Phe Thr Leu Pro Glu Leu Leu Phe Gly

115 120 125

Leu His Pro Ala Cys Val Leu Pro Phe Leu Thr Arg Arg Ile Gly Ala

130 135 140

His Ala Ala Ser Tyr Leu Thr Leu Ser Thr Gln Ser Ile Asn Ala Glu

145 150 155 160

Gln Ala Leu Ser Leu His Leu Val Asp Ser Ile Leu Pro Glu Ile Glu

165 170 175

Leu Gly Leu Ala Gln His Ile Arg Arg Ile Glu Arg Leu Asp Pro Gln

180 185 190

Ala Ile Arg Arg Phe Lys Ala Tyr Arg Ala Asp Leu Asp Lys Ser Leu

195 200 205

Gly Gln Ser Arg Asp Lys Ala Ile Ala Glu Asn Arg Ser Leu Phe Gly

210 215 220

Asp Ser Ser Ile Arg Ala Asn Leu Gln Arg Tyr Ala Thr Glu Gln Lys

225 230 235 240

Phe Pro Trp Glu Leu

245

<210> 15

<211> 411

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 15

Met Thr Asp Arg Thr Val His Cys Met Gly Ile Gly Leu Ala Cys Gly

1 5 10 15

Tyr Gly Phe Gly Lys Ser Ser Ala Leu Gln Gly Val Leu Thr Gly Lys

20 25 30

Asn Leu Phe Arg Pro Leu Glu Arg Glu Gly Arg Gln Val Ala Gly Asn

35 40 45

Pro Pro Phe Ile Gly Ile Glu Leu Pro Asp Ser Val Pro Gln Val Leu

50 55 60

Ser Arg Arg Ala Ser Arg Thr Thr Gly Leu Thr Gly Gln Val Cys Ala

65 70 75 80

Ala Val Ala Ala Glu Ala Trp Gln Asp Ala Gly Phe Gly Asp Pro Gly

85 90 95

Glu His Arg Leu Ser Gly Arg Thr Gly Val Ile Leu Gly Gly Ser Asn

100 105 110

Leu Gln Ser Arg Glu Met Glu Leu Ile Arg Asn Lys Leu Leu Asn Thr

115 120 125

Ser Pro Asn Leu Ala Pro Pro Arg Leu Gly His Ser Phe Leu Asp Thr

130 135 140

Asp Val Ala Ala Leu Ile Ser Glu Glu Leu Val Leu Asp Gly Pro Ile

145 150 155 160

Met Ser Val Gly Gly Ala Ser Ala Ser Gly Ala Leu Ala Val His Leu

165 170 175

Ala Ala Ala Ala Ile Arg Ser Gly Glu Leu Asp Ile Cys Leu Val Ile

180 185 190

Gly Pro Leu Gln Asp Met Ser Trp Leu Glu Leu Gln Ala Leu Arg Asn

195 200 205

Leu Gly Ala Met Gly Pro His Leu Ser Asp Glu Ser Gly Asp Leu Met

210 215 220

Pro Glu Pro Arg Cys Arg Pro Phe Asp Ala Ala Gly Thr Gly Phe Leu

225 230 235 240

Phe Gly Glu Ser Ala Ala Ala Leu Val Leu Ala Arg Ser Asp Leu Gly

245 250 255

Pro Gln Ser Tyr Gly Arg Ile Ser Gly Leu Gly Arg Val Gln Ala Gln

260 265 270

Thr Arg Gly Pro Glu Pro Ser Gln Asn Ala Leu Gln Glu Ala Ile Thr

275 280 285

Ala Ala Leu Thr Asp Ala Gly Ile Pro Pro Ser Ser Leu Asp Phe Ile

290 295 300

Ser Ala His Ala Thr Gly Thr Pro Arg Gly Asp Ala Ala Glu Ala Gln

305 310 315 320

Ala Leu Val Ala Gln Leu Leu Asn Ser Val His Val Thr Ala Pro Lys

325 330 335

Ser Ala Leu Gly His Gly Val Ala Ala Ala Gly Ala Val Glu Ile Ala

340 345 350

Leu Ala Phe Leu Gln Met Glu Ala Gly Gln Ile Ala Pro Ile His Gly

355 360 365

Leu Val Gln Pro Thr Leu Pro Asp Leu Asn Tyr Val Leu Asp Asn Pro

370 375 380

Glu Ser Gly Arg Phe Asn Ser Ala Met Cys Leu Ser Ser Gly Phe Gly

385 390 395 400

Gly Phe Asn Leu Ala Thr Val Leu Ser Ser Asp

405 410

<210> 16

<211> 5897

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 16

Met Pro Asp Gly Arg Glu Phe Glu Asp Thr Val Gly Asp Val Val Ala

1 5 10 15

Ala Cys Leu Lys Ile Pro Ser Asp Arg Phe Asp Thr Leu Ser Pro Leu

20 25 30

Ser Arg Phe Gly Val Asp Ser Ile Ile Val Thr Glu Ile Met Lys Arg

35 40 45

Leu Ser Asp Met Leu Gly Val Ser Ile Ala Pro Thr Val Phe Phe Glu

50 55 60

Ala Lys Asn Ala Lys Glu Leu Ala Gln Ile Leu Asp Gly Arg Tyr Arg

65 70 75 80

Arg Glu Ala Asp Arg Val Pro Gln Ser Gln Lys Ala Pro Gln Asn Pro

85 90 95

Leu Ala Leu Pro Asp Arg Arg Ala Glu Lys Arg Ala Pro Lys Glu Thr

100 105 110

Ser Arg Thr Val Pro Ala Ser Arg Ser Lys Lys Ala Ala Ser Trp Ile

115 120 125

Ala Ser Ala Lys Ala Ala Leu Ala Gln Pro Gly Gln Phe Arg Thr Asp

130 135 140

Gln Glu Asp Met Gly Ala Val Glu Thr Pro His Val Ser Gly Ser Ala

145 150 155 160

Phe Glu Pro Ile Ala Val Leu Ala Met Asp Gly Arg Phe Ala Gln Ser

165 170 175

Ala Asp Leu Gly Glu Leu Gln Ser His Leu Glu Gln Gly Asp Asp Cys

180 185 190

Ile Thr Glu Ile Pro Ala Glu Arg Trp Asp Trp Arg Gln Ile Tyr Asp

195 200 205

Asp Pro Gly Lys Gly Glu Phe Thr Lys Val Lys Tyr Gly Gly Val Ala

210 215 220

Pro Ala Val Asp Gln Phe Asp Pro Leu Tyr Phe Gly Leu Ser Pro Arg

225 230 235 240

Glu Ala Glu Leu Met Asp Pro Gln His Arg Leu Phe Ile Gln Ser Ala

245 250 255

Tyr Arg Leu Leu Gly Glu Ala Gly Tyr Ala Pro Ser Ser Ile Ala Gly

260 265 270

Arg Pro Val Gly Val Phe Ile Gly Val Asn Leu Gln Asp Tyr Ala His

275 280 285

Met Ile Asp Arg Ala Gly Ser Ile Glu Ala Leu His Leu Thr Ser Leu

290 295 300

Gly His Met Phe Cys Pro Asn Arg Leu Ser Phe Met Leu Asp Ile Thr

305 310 315 320

Gly Pro Ser Gln Val Ile Asp Thr Ala Cys Ser Ser Ser Leu Ile Ala

325 330 335

Val His Arg Ala Val Leu Ala Leu Gln His Glu Gly Cys Glu Met Ala

340 345 350

Ile Ala Gly Gly Ala Asn Leu Met Leu Thr Pro Asp Met His Ile Met

355 360 365

Tyr Ser Lys Val Gly Met Leu Cys Glu Asp Gly Arg Cys Lys Thr Phe

370 375 380

Ser Ala Arg Ala Asn Gly Tyr Val Arg Gly Asp Gly Val Gly Ala Val

385 390 395 400

Leu Leu Lys Pro Leu Ser Ala Ala Glu Arg Asp Gly Asp Thr Ile Leu

405 410 415

Ala Val Ile Arg Gly Ser Ser Glu Asn His Gly Gly Gln Ser Thr Ser

420 425 430

Leu Thr Ala Pro Asn Pro Leu Ala Gln Ala Arg Leu Ile Ala Glu Ala

435 440 445

His Gly His Ala Gly Gly Asp Pro Arg Arg Val Gly Tyr Ile Glu Cys

450 455 460

His Gly Thr Gly Thr Glu Leu Gly Asp Pro Ile Glu Ile Asn Gly Leu

465 470 475 480

Lys Gln Ala Phe Thr Ser Leu Tyr Asp Ala Leu Gly Lys Thr Pro Glu

485 490 495

Gly Ala Pro His Cys Gly Leu Gly Ser Ile Lys Ser Asn Ile Gly His

500 505 510

Ala Glu Thr Ala Ala Gly Ile Ala Gly Leu Ile Lys Ala Val Ile Gly

515 520 525

Leu Arg Ser Gly Arg Tyr Phe Pro Thr Leu His Ser Glu Asp Gln Asn

530 535 540

Pro Leu Ile Ser Leu Glu Gln Thr Pro Phe Phe Ile Ser Arg Lys Gly

545 550 555 560

Ser Asp Trp Pro Arg Pro Val Leu Asp Gly Gln Thr Phe Pro Arg Arg

565 570 575

Ala Gly Val Ser Ser Phe Gly Ala Gly Gly Ser Asn Ala His Val Val

580 585 590

Val Glu Glu Tyr Leu Pro Glu Thr Arg Thr Ala Ala Val Gly Arg Pro

595 600 605

Asp Arg Pro Met Leu Ile Pro Leu Ser Ala Arg Thr Glu Ala Gln Leu

610 615 620

Asp Gln Val Ile Leu Asp Leu Leu Ala His Leu Glu Gly Phe Ala Gly

625 630 635 640

Asp Glu Leu Pro Ser Leu Glu Gln Ile Ala Tyr Thr Leu Gln Thr Gly

645 650 655

Arg Asp Pro Met Ala Phe Arg Leu Ala Phe Val Ala Asp Thr Val Gly

660 665 670

Ser Leu Val Ala Ser Leu Arg Arg Leu Arg Asp Gly Asp Gln Ala Gly

675 680 685

Phe Ala Lys Gly Cys Val Lys Thr Arg Arg Arg Ser Arg Glu Glu Thr

690 695 700

Thr Pro Ala Asp Leu Ser Gln Pro Leu Pro Asp Leu Ala Glu Ala Trp

705 710 715 720

Val Ser Gly Ala Leu Leu Asp Trp Ser Ala Leu His Glu Asn Arg Pro

725 730 735

Ala Lys Val Arg Leu Pro Ala Tyr Pro Phe Glu Lys Arg Arg Cys Trp

740 745 750

Ile Pro Ala Pro Ala Gly Glu Met Pro Leu Arg Arg Arg Ser Ser Ala

755 760 765

Val Phe Arg Lys Lys Ser Gly Phe Gly Leu Ala Ala His Lys Asn Glu

770 775 780

Pro Gly Glu Gly Arg Tyr Asp Leu Thr Leu Thr Gly Ala Glu Arg Phe

785 790 795 800

Leu Lys Asp His Val Val Val Gly Val Pro Met Leu Pro Gly Ala Ala

805 810 815

Tyr Leu Glu Ile Ala Arg Ala Ala Ala Ala Gln Phe Leu Asp Val Ser

820 825 830

His Arg Glu Ala Trp Arg Phe Asp Lys Ile Val Trp Val Gln Pro Cys

835 840 845

Thr Val Thr Glu Gly Ser Thr Asp Leu Thr Val His Cys Thr Gly Arg

850 855 860

Pro Asp Gly Ser Val Glu Phe Arg Ile Thr Ser Met Pro Gly Ser Gln

865 870 875 880

Leu His Cys Gln Gly Val Val Arg Pro Gly Glu Thr Gly Asn Gly Ser

885 890 895

Gly Gln Thr Val Pro Ala Thr Glu Pro Ala Asn Thr Thr Ala Pro Val

900 905 910

Leu Asp Lys Ala Gln Cys Tyr Asn Arg Phe Ser Glu Leu Gly Leu Ser

915 920 925

Tyr Gly Pro Ser His Arg Gly Leu Gln Gln Ile Trp Arg Gly Pro Asp

930 935 940

Gly Glu Ala Tyr Ala Glu Ile Asn Arg Pro Asp Glu Ala Asp Asp Gln

945 950 955 960

Gly Phe Leu Leu Asp Pro Ala Met Leu Asp Cys Val Leu Gln Ser Cys

965 970 975

Leu Gly Leu Ala Glu Lys Asp Thr Asp Ser Ser Ala Ser Leu Pro Phe

980 985 990

Glu Leu Gly Thr Leu Glu Leu Phe Gly Thr Val Pro Asp Gln Leu Arg

995 1000 1005

Val Cys Val Arg Val Gly Pro Gln Asn Thr Arg Leu Pro Arg Ile Asp

1010 1015 1020

Leu Asp Val Thr Gly Pro Asp Gly Arg Leu Val Met Arg Leu Gln Gly

1025 1030 1035 1040

Phe Ala Asn Arg Glu Leu Asp Pro Ala Leu Gly Gln Glu Thr Ser Asn

1045 1050 1055

Asp Thr Val Leu Arg Ala Arg Pro Val Trp His Pro Val Thr Pro Gly

1060 1065 1070

Ala Ala Thr Pro Ser Ala Val Arg Gln Leu Val Cys Gly Met Ala His

1075 1080 1085

Gly His Ser Gly Ala Gly Glu Thr Ala Arg Val Val His Val Ser Gly

1090 1095 1100

Asn Ala Val Ala Asp Tyr Leu Arg Ala Ala Lys Thr Ile Phe Ser Asp

1105 1110 1115 1120

Phe Lys Ala Ala Val Thr Leu Gly Glu Gly Thr Gly Phe Leu Gln Ile

1125 1130 1135

Val Val Pro Gln Ser Asp Glu Ala Tyr Gly Thr Ala Gly Leu Phe Ser

1140 1145 1150

Gly Leu Ala Gly Leu Val Ala Thr Ala Asn Lys Glu Ser Thr Arg Leu

1155 1160 1165

Gln Ala Gln Leu Val Glu Cys Pro Gly Asp Leu Ala Ala Leu Glu Leu

1170 1175 1180

Pro Ala Leu Leu Ser Gln Ala Ala Arg Val Thr Gly Ala Ser His Leu

1185 1190 1195 1200

Arg Leu Ser Ser Lys Gly Ile Leu Ala Arg Gly Trp Glu Lys Leu Lys

1205 1210 1215

Val Glu Gly Glu Gly Ser Pro Trp Arg Asn Asp Gly Ile Tyr Leu Ile

1220 1225 1230

Thr Gly Gly Thr Gly Gly Leu Gly Gln Arg Phe Ala Glu Arg Ile Ala

1235 1240 1245

Gln Glu Thr Ser Ala Ala Thr Val Ile Leu Ala Ala Arg Ser Thr Ala

1250 1255 1260

Asp Ala Asp Leu Val Val Arg Leu Gln Asp Leu Gly Leu Lys Val Asp

1265 1270 1275 1280

Ser Thr Ser Cys Asp Leu Gly Asp Pro Asp Ala Val Gln Ala Met Val

1285 1290 1295

Arg Ser Val Val Ala Arg His Gly Arg Ile Asp Gly Ile Leu His Ala

1300 1305 1310

Ala Gly Val Leu Lys Asp Gly Phe Ile Ala Asp Lys Ala Glu Ala Asp

1315 1320 1325

Phe Asp Leu Val Gly Arg Ala Lys Leu Ala Gly Thr Trp Ala Leu Asp

1330 1335 1340

Gln Ala Ser Val Asp Leu Pro Leu Asp Phe Phe Ala Thr Phe Gly Ser

1345 1350 1355 1360

Ala Ser Ala Val Trp Gly Ser Ala Gly Gln Thr Asp Tyr Ala Ala Ala

1365 1370 1375

Asn Gly Phe Leu Glu Ala Phe Ala Leu Trp Arg Ser Arg Lys Ala Ala

1380 1385 1390

Gln Gly Glu Arg Phe Gly Val Ser Leu Asn Ile Ala Trp Pro Pro Trp

1395 1400 1405

Gln Asp Gly Gly Met Arg Met Ala Pro Glu Ala Leu Ala Arg Met Gln

1410 1415 1420

Glu Ser Thr Gly Leu Gly Val Leu Ala Thr Ala Ala Gly Ile Asp Glu

1425 1430 1435 1440

Phe Glu Ala Ala Leu Leu Ser Gly Gly Pro Gln Gln Val Val Met Cys

1445 1450 1455

Gly Thr Gln Leu Ala Ile Asp Asp Ile Leu Thr Pro Pro Ala Ala Pro

1460 1465 1470

Val Ser Ala Gln Pro Val Ser Gln Arg Thr Glu Ser Asp Gly Leu Gln

1475 1480 1485

Leu Ala Ala Glu Glu Leu Leu Leu Glu His Ile Ala Glu His Met Gly

1490 1495 1500

Phe Glu Arg Gln Asp Leu Asp Ala Glu Ser Glu Trp Ser Asp Leu Gly

1505 1510 1515 1520

Phe Asp Ser Ile Thr Met Thr Thr Phe Ser Asn Arg Leu Asn Glu Ala

1525 1530 1535

His Gly Met Asp Leu Thr Pro Thr Val Phe Phe Glu Tyr Val Thr Ile

1540 1545 1550

Ala Asp Met Ala Gly Phe Leu Ala Gln Thr Tyr Glu Ser Cys Leu Ser

1555 1560 1565

Gly Leu Leu Pro Glu Asn Pro Val Arg His Thr Ala Lys Ile Thr Glu

1570 1575 1580

Lys Pro Leu Pro Asp Gln Pro Asp Pro Thr Ser Pro Pro Asp Ala Glu

1585 1590 1595 1600

Ala Ile Ala Ile Ile Gly Met Ala Gly Arg Phe Pro Asp Ala Pro Asp

1605 1610 1615

Leu Glu Thr Phe Trp Glu Asn Leu Arg Ser Gly Arg Ala Cys Leu Arg

1620 1625 1630

Glu Ile Pro Glu Asp Arg Trp Asp Trp Arg Ala Leu Lys Ala Ala Gly

1635 1640 1645

Leu Thr Asp Val Asn Arg Ala Gly Phe Ile Asp Gly Ile Ala Glu Phe

1650 1655 1660

Asp Ala Arg His Phe Gly Ile Ser Arg Arg Glu Ala Ala Leu Met Asp

1665 1670 1675 1680

Pro Ala Gln Arg Leu Leu Met Glu Tyr Val Trp Arg Ala Ile Glu Asp

1685 1690 1695

Ala Gly Tyr Ala Pro Ser Ser Leu Ala Gly Ser Asp Thr Ala Val Ile

1700 1705 1710

Ile Gly Thr Ala Pro Ser Gly Tyr Gly Ala Arg Met Ala Glu Asn Gly

1715 1720 1725

Ile Gly Ile Asp Ser His Ser Ser Thr Gly Ser Val Gly Ser Val Gly

1730 1735 1740

Pro Asn Arg Ile Ser Tyr Leu Leu Asp Leu His Gly Pro Ser Glu Pro

1745 1750 1755 1760

Val Glu Thr Ala Cys Ser Ser Ala Leu Val Ala Leu His Arg Ala Ile

1765 1770 1775

Ser Ala Met Arg Ala Gly Asp Cys Ser Gln Ala Ile Val Gly Gly Val

1780 1785 1790

Asn Leu Val Leu Ser Pro Glu Thr His Ile Ser Phe Ser Lys Ala Gly

1795 1800 1805

Met Leu Ser Pro Asp Gly Arg Cys Lys Thr Phe Ser Ala Gln Ala Asp

1810 1815 1820

Gly Tyr Gly Arg Gly Glu Gly Val Gly Met Leu Phe Leu Lys Pro Leu

1825 1830 1835 1840

Thr Ala Ala Glu Arg Asp Gly Asp Phe Val His Gly Ile Ile Leu Gly

1845 1850 1855

Ser Ala Glu Asn His Gly Gly Lys Ala Asn Ser Leu Thr Ala Pro Asn

1860 1865 1870

Pro Arg Ala Gln Ala Ala Leu Val Glu Thr Ala Val Arg Arg Ala Gly

1875 1880 1885

Ile Ala Pro Gln Ser Leu Ser Tyr Met Glu Ala His Gly Thr Gly Thr

1890 1895 1900

Glu Leu Gly Asp Pro Ile Glu Ile Glu Gly Leu Lys Thr Ala Phe Asp

1905 1910 1915 1920

Ala Leu Glu Ala Gly Gln Glu Ala Arg Cys Ala Ile Gly Ser Val Lys

1925 1930 1935

Thr Asn Ile Gly His Leu Glu Leu Ala Ala Gly Val Ala Gly Val Leu

1940 1945 1950

Lys Val Leu Leu Gln Met Arg Asn Arg Thr Leu Ala Pro Ser Leu Pro

1955 1960 1965

Glu Glu Val Asn Pro Tyr Leu Lys Leu Lys Asp Ser Pro Phe Tyr Leu

1970 1975 1980

Val Pro Gln Ala Gln Glu Trp Arg Arg Pro Val Asp Ala Val Gly Lys

1985 1990 1995 2000

Glu Ile Pro Arg Arg Ala Gly Val Ser Ser Phe Gly Phe Gly Gly Val

2005 2010 2015

Asn Ala His Val Val Leu Glu Glu Pro Ala Gln Thr Ile Arg Ala Asp

2020 2025 2030

Met Pro Glu Ile Pro Glu Leu Ile Val Leu Ser Ala Arg Asp Arg Glu

2035 2040 2045

Gly Leu Ala Ala Ser Ala Asp Ala Leu Ala Lys Ala Leu Thr Pro Tyr

2050 2055 2060

Ala Asn Thr Gly Gly Ala Leu Glu Pro Thr Ile Glu Ser Arg Leu Cys

2065 2070 2075 2080

Ala Cys Leu Ala Asp Ile Leu Glu Ile Asp Ile Asp Glu Val Glu Pro

2085 2090 2095

Leu Thr Lys Leu Asp Asp Leu Gly Val Glu Pro Val His Arg Pro Leu

2100 2105 2110

Leu Arg Arg Ser Val Glu Lys Val Leu Gly Leu Thr Ile Asp His Asp

2115 2120 2125

Leu Val His Arg Ala Gly Ser Ile Arg Glu Ile Ser Ser Ala Phe Gln

2130 2135 2140

Ser Leu Pro Glu His Ser Gly Met Glu Ala Ala Pro Leu Leu Arg Asp

2145 2150 2155 2160

Ile Ala Phe Thr Leu Arg Ala Gly Arg Asp Ala Met Thr Glu Arg Val

2165 2170 2175

Ala Phe Ala Ala Gln Ser Leu Lys Glu Leu Val Asp Arg Leu Arg Ile

2180 2185 2190

Leu Ala Ala Thr Arg Asp Asn Leu Thr Gly Gln Asp Gly Phe Trp His

2195 2200 2205

Gly Arg Val Pro Tyr Lys Thr Arg Arg His Asn Lys Val Thr Gln Ser

2210 2215 2220

Pro Lys Asp Val Pro Leu Glu Glu Leu Ala Arg Leu Trp Val Gly Gly

2225 2230 2235 2240

Ala Ala Tyr Asp Trp Glu Ala Glu Arg Asp Gly Arg Asp Leu Arg Arg

2245 2250 2255

Val Pro Leu Pro Gly Thr Ser Phe Lys Lys Glu Arg Ile Trp Phe Asp

2260 2265 2270

Thr Leu Asn Gly Lys Pro Ser Ala Ala Val Pro Gln Ile Lys Asp Thr

2275 2280 2285

Ser Leu Pro Ser Gly Met Ala Leu Thr Arg Lys Ser Asp Gly Val Phe

2290 2295 2300

Glu Val Ser Leu Ser Gly Asp Glu Phe Phe Leu Arg Asp His Ile Val

2305 2310 2315 2320

Gln Gly Gln Pro Val Leu Pro Gly Val Ala Tyr Leu Glu Leu Ala Arg

2325 2330 2335

Ser Ala Gly Cys Leu His Leu Gln Ser Arg Asp Leu Ala Leu Lys Asp

2340 2345 2350

Val Val Trp Val Gln Pro Ala Val Ile Ser Glu Pro Gln Thr Leu Gln

2355 2360 2365

Val Val Leu Gly Ser Pro Gly Pro Gly Gln Glu Tyr Pro Phe Arg Ile

2370 2375 2380

Leu Ser His Gly Asp Ser Gly Glu Arg Leu His Cys Arg Gly Ala Ile

2385 2390 2395 2400

Ala His Leu Pro Glu Val Pro Pro Glu Ile Ile Asn Asn Asp Ala Ile

2405 2410 2415

Pro Ser Gly Arg Arg Ile Pro Ser Asn Glu Ile Tyr Ser Leu Phe Glu

2420 2425 2430

Thr Ala Gly Leu His Tyr Gly Pro Gly His Gln Cys Leu Asn Trp Leu

2435 2440 2445

Val Ser Asp Gly Ser Arg Val Val Ala Asp Leu Ser Leu Pro Glu Ile

2450 2455 2460

Cys Gly Ser Ala Val Glu Pro Phe Val Leu His Pro Ser Leu Met Asp

2465 2470 2475 2480

Gly Ala Leu Gln Ala Ala Ile Gly Phe Gly Leu Ala Gly Glu Glu Gln

2485 2490 2495

Ser Gly Asp Leu Ala Leu Pro Phe Ala Ile Glu Ser Leu Gln Cys Leu

2500 2505 2510

Thr Ala Asn Lys Ser Arg Met Arg Val His Leu Glu Arg Arg Ser Val

2515 2520 2525

Ala Ser Ala Ala His Gly Ile Glu Lys Ile Asp Ile Ala Leu Cys Asp

2530 2535 2540

Glu Ser Gly Gln Val Leu Thr Arg Ile Asn Gly Phe Ser Thr Arg Arg

2545 2550 2555 2560

Val Ala Leu Pro Glu Ala Gly Lys Thr Pro Ala His Gln Ala Leu Gly

2565 2570 2575

Ala Gln Asp Pro Val Asn Val Pro Ala Gln Asp Gly Leu Lys Asp Ala

2580 2585 2590

Ala Ala Ala Tyr Phe Lys Arg Leu Leu Ser Glu Ala Leu Ala Cys Pro

2595 2600 2605

Pro Asp Glu Ile Asp Leu Asp Glu Pro Leu Glu Tyr Tyr Gly Phe Asp

2610 2615 2620

Ser His Met Val Met Glu Leu Thr Ala Val Leu Glu Lys Glu Phe Gly

2625 2630 2635 2640

Thr Leu Ser Lys Thr Leu Phe Phe Glu His Gln Thr Leu Gly Ala Val

2645 2650 2655

Leu Asp His Phe Ile Glu Ala His Gly Pro Ser Leu Thr Thr Val Val

2660 2665 2670

Arg Lys Gly Arg Gly Ala Ala Gly Thr Pro Ala Ser Val Asp Ala Ala

2675 2680 2685

Ala Lys Pro Arg Thr Glu Pro Lys Thr Gly Gly Leu Asp Ile Ala Val

2690 2695 2700

Ile Gly Leu Ala Gly Arg Tyr Pro Gln Ala Tyr Asp Ile Ala Gly Phe

2705 2710 2715 2720

Trp Asp Asn Leu Arg Asn Gly Arg Asp Gly Ile Thr Glu Val Pro Ala

2725 2730 2735

Asp Arg Trp Lys Trp Gln Asp Tyr Phe Ser Thr Asp Arg Ser Arg Ile

2740 2745 2750

Asp Ala His Phe Ser Lys Trp Gly Gly Phe Ile Asp Asp Val Ala Ala

2755 2760 2765

Phe Asp Pro Leu Phe Phe Asn Ile Ser Pro Gly Met Ala Glu Ala Met

2770 2775 2780

Asp Pro Gln Glu Arg Leu Phe Leu Glu His Ala Trp Thr Ala Met Glu

2785 2790 2795 2800

Asp Ala Gly Tyr Arg Pro Gly Asp Leu Gln Ala Gln Ser Val Asp Glu

2805 2810 2815

Asp Gly Leu Pro Gly Gln Val Gly Val Tyr Ala Gly Val Met Tyr Gly

2820 2825 2830

Glu Tyr Gln Leu Leu Gly Leu Gln Gly Ser Leu Ala Gly Glu Pro Met

2835 2840 2845

Ser Thr Ala Ser Tyr Tyr Ala Gly Val Ala Asn Arg Val Ser Tyr Ala

2850 2855 2860

Leu Asn Leu His Gly Pro Ser Met Ala Val Asp Thr Met Cys Ser Ser

2865 2870 2875 2880

Ser Leu Thr Ala Ile His Leu Ala Cys Ala Asp Leu Ala Leu Gly Arg

2885 2890 2895

Val Arg Met Ala Phe Ala Gly Gly Val Asn Leu Asn Leu His Pro Asn

2900 2905 2910

Lys Tyr Ser Leu Leu Ser Lys Gly Gln Phe Ile Ser Ser Asn Gly Arg

2915 2920 2925

Cys Gln Ser Phe Gly Ser Glu Gly Asp Gly Tyr Val Pro Ala Glu Gly

2930 2935 2940

Val Gly Val Val Leu Leu Lys Arg Leu Ala Asp Ala Glu Ala Asp Gly

2945 2950 2955 2960

Asp His Ile Tyr Gly Val Ile Lys Gly Ser Ala Leu Asn His Gly Gly

2965 2970 2975

Arg Ala Asn Gly Tyr Thr Val Pro Asn Pro Glu Ala Gln His His Val

2980 2985 2990

Ile Ala Arg Ala Leu Arg Glu Ala Gly Val Asp Pro Arg Ala Ile Gly

2995 3000 3005

Tyr Val Glu Ala His Gly Thr Gly Thr Lys Leu Gly Asp Pro Ile Glu

3010 3015 3020

Ile Lys Gly Leu Asn Asp Gly Tyr Gly Pro Val Leu Glu Gly Pro Cys

3025 3030 3035 3040

Trp Ile Gly Ser Ala Lys Ser Asn Ile Gly His Gly Glu Ala Val Ser

3045 3050 3055

Gly Leu Ala Gly Leu Thr Lys Val Leu Leu Gln Leu Lys Ala Gly Glu

3060 3065 3070

Ile Ala Pro Ser Leu His Ala Glu Thr Leu Asn Pro Asn Ile Asp Phe

3075 3080 3085

Ala Ala Thr Pro Phe Arg Val Asn Thr Ser Leu Arg Thr Trp Asp Ala

3090 3095 3100

Pro Val His Glu Gly Lys Thr Leu Pro Arg Val Ser Ala Val Ser Ser

3105 3110 3115 3120

Phe Gly Ala Gly Gly Ser Asn Ala His Leu Val Val Glu Glu His Cys

3125 3130 3135

Pro Pro Pro Ser Val Glu Pro Tyr Ser Tyr Gly Pro Val Leu Ile Thr

3140 3145 3150

Leu Ser Ala Lys Ala Glu Asp Arg Leu Lys Ala Tyr Ala Cys Ala Leu

3155 3160 3165

Ala Asp Trp Ala Glu Asn Ala Pro Ala Glu Thr Ser Leu Arg Asp Leu

3170 3175 3180

Ala Tyr Thr Leu Gln Val Gly Arg Glu Pro Met Pro His Arg Ile Gly

3185 3190 3195 3200

Val Gln Val Ser Thr Val Glu Glu Leu Ala Arg Tyr Leu Arg Gln Phe

3205 3210 3215

Leu Ala Gly Arg Asp Gly Pro Val Arg Ser Gly Arg Ala Arg Val Val

3220 3225 3230

Ser Asn Pro Thr Val Glu Asn Pro Asp Gly Leu Ala Ala Glu Val Leu

3235 3240 3245

Leu Asp Gly Trp Met Gln Gly Thr Val Tyr Asp Trp Arg Lys Ile Tyr

3250 3255 3260

Gly Gly Glu Ala Arg Arg Leu Ser Leu Pro Thr Tyr Pro Phe Ala Arg

3265 3270 3275 3280

Glu Ile Tyr Trp Pro Asp Thr Thr Ala Gln Pro Ala Pro Ile Ala Leu

3285 3290 3295

Arg Thr Ala Ala Thr Thr Ala Lys Thr Thr Glu Thr Arg Ala Leu Glu

3300 3305 3310

Ala Lys Ser Thr Gly His Thr Ser Val Leu His Thr Asp Leu Leu Leu

3315 3320 3325

Leu Arg Pro Gln Trp Lys Asp Leu Pro Leu Thr Ala Pro Ser Ile Asp

3330 3335 3340

Pro Ala Leu Arg Arg Val Ala His Ile Gly Pro Met Arg Asn Leu Gln

3345 3350 3355 3360

Glu His Ala Gln Leu Ala Leu Pro Ala Ser Asp Pro Ala Asp Pro Asn

3365 3370 3375

Thr Phe Thr Asp Gln Ala Leu Ala Leu Leu Arg Asp Leu Lys Glu Leu

3380 3385 3390

Ala Leu Gln Ser Ser Asp Gln Lys Val His Tyr Gln Val Val Leu Pro

3395 3400 3405

Ala Ser Tyr Ser Gln Ser Ala Ala Leu Ala Gly Met Leu Asp Ser Ala

3410 3415 3420

Ala Arg Glu Leu Pro Arg Leu Thr Cys Gln Val Leu Cys Phe Asp Thr

3425 3430 3435 3440

Asp Asp Pro Ala Ser Gly Pro Leu Glu Ala Asp Leu Lys Ala Val Ala

3445 3450 3455

Ala Trp Pro Gly Lys Ser Arg Leu Arg Lys Lys Asp Gly Arg Trp Gln

3460 3465 3470

Ala Leu Thr Trp Gln Glu Glu Gln Asp Val Ala Asp Ala Gln Pro Gly

3475 3480 3485

Gly Gly Trp Arg Glu Gly Gly Arg Tyr Leu Ile Val Gly Gly Cys Gly

3490 3495 3500

Gly Leu Gly Ala Ile Val Ala Arg His Leu Ala Gln Thr Leu Ser Arg

3505 3510 3515 3520

Val Ser Leu Val Leu Thr Gly Arg Ser Pro Ser Gly Pro Lys Gln Asn

3525 3530 3535

Ala Leu Leu Gln Glu Leu Arg Ser Lys Gly Ala His Ala Asp Tyr Leu

3540 3545 3550

Ala Thr Asp Leu Gly Asp Ala Ala Ala Val Arg Ser Met Ile Arg Gln

3555 3560 3565

Thr Thr Asp Gln Gly Ser Leu His Gly Val Ile His Cys Gly Gly Val

3570 3575 3580

Leu Ser Asp Ala Leu Ile Leu Arg Lys Thr Glu Glu Asp Leu Arg Arg

3585 3590 3595 3600

Val Phe Ala Pro Lys Val Thr Gly Val Ala Asn Leu Asp Arg Ala Thr

3605 3610 3615

Asp Gly Leu Asp Leu Asp Leu Phe Leu Val Phe Ser Ser Ile Ala Gly

3620 3625 3630

Thr Met Gly Asn Pro Gly Gln Ala Asp Tyr Ala Ala Ala Asn Ala Tyr

3635 3640 3645

Leu Asp Gln Tyr Val Glu Glu Arg Asn Arg Arg Ala Leu Ser Pro Gly

3650 3655 3660

Gly Pro Arg Gly Met Ala Leu Ser Val Ala Trp Pro Tyr Trp Ala Asp

3665 3670 3675 3680

Gly Gly Met Thr Leu Asp Ala Ala Ala Val Asn Ala Met Arg Asp Gly

3685 3690 3695

Ala Gly Leu Val Pro Leu Ser Thr Ala Arg Gly Leu Glu Ala Leu Asp

3700 3705 3710

Arg Ile Val Arg Ala Gly Trp Pro Gln Thr Met Val Leu Glu Gly Asp

3715 3720 3725

Gly Asp Arg Leu Ala Ala Leu Ile Ala Ala Ala Asp Ala Gly Gln Pro

3730 3735 3740

Ala Gly Ala Pro Ala Gly Pro Glu Pro Ala Pro Pro Pro Ser Ser Phe

3745 3750 3755 3760

His Leu Gln Asp Ala Val Glu Glu Tyr Leu Ala Glu Glu Leu Ala Lys

3765 3770 3775

Val Leu Arg Ile Ser Pro Gln Arg Leu Glu Ala Asp Val Pro Leu Val

3780 3785 3790

Asp Tyr Gly Val Asp Ser Val Ala Ile Met Ala Leu Thr Ala Ser Ile

3795 3800 3805

Glu Thr Val Thr Gly Pro Leu Pro Ala Thr Leu Phe Phe Glu Asn Pro

3810 3815 3820

Thr Ile Glu Ala Ala Ala Gly Ala Leu Thr Asp Leu Ala Ser Gln Ser

3825 3830 3835 3840

Leu Met Glu Ala Leu His Val Pro Glu Pro Thr Val Asp Leu Leu Glu

3845 3850 3855

Pro Ala Pro Gly Gly Thr Ala Glu Asp Gln Ala Pro Ser Glu Asp Pro

3860 3865 3870

Leu Leu Asp Asn Asn Ala Lys Pro Val Arg Ala Glu Ala Ala Val Pro

3875 3880 3885

Asp Thr Gln Ser Ala Gly Ser Gly Asp Ile Ala Ile Ile Ala Met Glu

3890 3895 3900

Gly Arg Phe Pro Gly Ala Glu Asp Leu Glu Glu Phe Trp Asp Asn Leu

3905 3910 3915 3920

Val Asn Gly Arg Asn Ser Ile Thr Glu Val Pro Lys Asp Arg Trp Asp

3925 3930 3935

Ala Glu Ser Leu Phe Asp Pro Asp Gly Ala Tyr Glu Gly Lys Ala Arg

3940 3945 3950

Cys Lys Trp Gly Gly Phe Leu Ser Asp Val Asp Gly Phe Asp Ala Arg

3955 3960 3965

Phe Phe Arg Ile Thr Pro Asp Glu Ala Glu Leu Leu Asp Pro Gln Glu

3970 3975 3980

Arg Leu Phe Leu Glu Thr Ala Trp Ala Leu Met Glu Lys Ala Gly Tyr

3985 3990 3995 4000

Met Gly Pro Ala Leu Arg Val Asp Leu Glu Ser Ala Val Gly Val Phe

4005 4010 4015

Ala Gly Ser Met Thr Gln Gln Tyr His Ala Val Arg Ser Asp Pro Leu

4020 4025 4030

Arg Glu Ala Leu Thr Val Leu Ser Ser Pro Ser Ser Ile Ala Asn Arg

4035 4040 4045

Val Ser Asn Val Leu Asp Leu Asn Gly Pro Ser Leu Ala Val Asp Thr

4050 4055 4060

Met Cys Ser Ser Gly Ile Val Ala Ile His Met Ala Cys Glu Ser Leu

4065 4070 4075 4080

Arg Ala Gly Ala Cys Arg Ala Ala Ile Ala Gly Gly Val Asn Val Ser

4085 4090 4095

Ile His Pro Lys Lys Tyr Ile Gly Leu Ser Ala Ser Gln Phe Ile Gly

4100 4105 4110

Ser Arg Arg Asp Ser Thr Ser Phe Arg Asp Gly Asp Gly Tyr Leu Pro

4115 4120 4125

Ala Glu Gly Val Gly Ala Val Leu Leu Arg Pro Leu Asp Asp Ala Val

4130 4135 4140

Ala Ala Gly Asp Arg Val Leu Ala Leu Ile Lys Ser Thr Gly Ile Asn

4145 4150 4155 4160

His Ser Gly Arg Ser Asn Gly Tyr Arg Val Pro Ser Val Ala Ala Gln

4165 4170 4175

Ala Lys Leu Ile Gly Asp Thr Ile Arg Gln Ala Gly Val Pro Val Asn

4180 4185 4190

Thr Ile Thr Tyr Ala Glu Ala Ala Ala Asn Gly Ala Ala Met Gly Asp

4195 4200 4205

Ser Ile Glu Leu Ala Ala Phe Arg Gln Ala Phe Gln Asp Leu Thr Pro

4210 4215 4220

Glu Gln Lys Phe Cys Ala Ile Gly Ser Val Lys Ser Asn Ile Gly His

4225 4230 4235 4240

Ala Glu Ser Ala Ser Gly Leu Ser Gln Leu Ala Lys Val Val Leu Gln

4245 4250 4255

Met Gln Ala Glu Thr Leu Val Pro Thr Leu Gly Thr Asp Ala Leu Asn

4260 4265 4270

Pro Lys Leu Asp Phe Ser Ser Gly Pro Phe Arg Leu Gln Ser Glu Leu

4275 4280 4285

Gln Ala Trp Ala Arg Pro Ile Gly Ser Asp Ala Ala Ser Gly Gly Ser

4290 4295 4300

Asn Gln Pro Leu Arg Ala Ile Leu Asn Ser Val Gly Ala Gly Gly Thr

4305 4310 4315 4320

Asn Ala Cys Met Val Leu Glu Glu Pro Pro Lys Thr Ser Ala Pro Pro

4325 4330 4335

Ala Ala Val Ala Gln Asp Gln Tyr Leu Ile Pro Leu Ser Ala Arg Asp

4340 4345 4350

Glu Ala Asp Leu Arg Val Leu Ala Gly Arg Leu Lys Thr Tyr Leu Glu

4355 4360 4365

Thr Arg Pro Glu Thr Arg Met Ala Asp Leu Ala Leu Thr Leu Gln Thr

4370 4375 4380

Gly Arg Ser Gln Leu Asp Gln Arg Ala Ala Met Ile Ser Arg Asp Val

4385 4390 4395 4400

Pro Ala Leu Leu His Gln Leu Glu Ala Leu Ala Glu Gly Leu Glu Ala

4405 4410 4415

Asp Gly Leu Val Thr Gly Asn Thr Met Thr Gly Gln Asp Ala Leu Ser

4420 4425 4430

Gly Leu Leu Thr Gly Lys Thr Gly Ala Glu Ile Val Ser Leu Leu Leu

4435 4440 4445

Arg His Arg Asn Leu Arg Lys Leu Ala Val Ala Trp Val His Gly Ala

4450 4455 4460

Arg Leu Asn Trp Ser Pro Leu Gln Ala Glu Gly Ala Gln Arg Leu Ala

4465 4470 4475 4480

Leu Pro Ala Tyr Pro Phe Arg Arg Thr Arg Tyr Trp Leu Gly Gly Ile

4485 4490 4495

Asp Ala Arg Glu Ala Val Ser Gln Leu Glu Pro Asp Thr Arg Ser Asp

4500 4505 4510

Thr Thr Asp Pro Glu Thr Cys Ile Arg Asp Tyr Leu Ile Asn Asp Leu

4515 4520 4525

Arg Ile Ala Pro Glu Glu Ile Asp Phe Arg Arg Ser Ala Leu Asp His

4530 4535 4540

Gly Leu Asn Ser Val Met Leu Met Pro Leu Cys Gln Ala Leu Glu Ala

4545 4550 4555 4560

Arg Cys Gly Leu Thr Val Gly Leu Gly Asp Ile Met Glu Ser Lys Ser

4565 4570 4575

Leu Ala Thr Leu Leu Ser Arg Ile Ala Gly Lys Asp Gly Tyr Ala Pro

4580 4585 4590

Met Asp Asn Pro Lys His Ala Gln Pro Gly Thr Ser Asp Ala Val Asn

4595 4600 4605

Thr Ala Leu Pro Leu Thr Lys Gly Gln Ile Ala Leu Trp Leu His Asp

4610 4615 4620

Gln Lys Thr Pro Gly Asp Ala Gly Tyr Thr Val Pro Met Ala Leu Arg

4625 4630 4635 4640

Leu Ala Gly Ser Leu Asp Lys Asp Met Leu Arg Ala Ala Phe Ala Asp

4645 4650 4655

Leu Leu Lys Arg His Pro Val Leu Thr Ser Val Phe Thr Ala Asn Gly

4660 4665 4670

Gly Met Pro Gln Arg Ile Val Gln Asp Gly Ile Ser Tyr Pro Ile Glu

4675 4680 4685

Glu Leu Asp Leu Ser Gly Ala Pro Ala Ser Val Ile Glu Asn Glu Leu

4690 4695 4700

His Ala Phe Ala Gly Leu Pro Phe Asp Leu Thr Asn Gly Pro Leu Val

4705 4710 4715 4720

Arg Ser Leu Leu Ile Gln Glu Ala Ala Asp Arg His Val Leu Ile Ile

4725 4730 4735

Cys Val His His Ile Val Phe Asp Gly Gln Ser Ala Met Ile Leu Ile

4740 4745 4750

Asp Asp Leu Met Arg Leu Tyr Glu Ala Arg Leu Gln Gly Val Arg Leu

4755 4760 4765

Pro Arg Pro Ile Gly Ser Ser Phe Asp Ala Phe Gln Arg Trp Gln Glu

4770 4775 4780

Arg Leu Leu Thr Ser Glu Arg Gly Thr Asn Ile Arg Ala Phe Trp Arg

4785 4790 4795 4800

Asp Glu Leu Glu Gly His Asn Glu Leu Cys Leu Pro Gly Asp Trp Asp

4805 4810 4815

Ala Asp Leu Glu Cys Ala Ser Lys Ala Gly Ser His Val Leu Trp Ile

4820 4825 4830

Asp Lys Asp Thr Ala Arg Arg Ile Thr Glu Ala Ser Thr Ala His Gly

4835 4840 4845

Ala Thr Pro Ala Gln Phe Met Met Ala Ala Phe Val Leu Ile Leu His

4850 4855 4860

Arg Leu Thr Gly Ser His Asp Leu Leu Ile Gly Leu Pro Val Leu Gly

4865 4870 4875 4880

Arg Pro Asp Arg Ser Phe Asp His Thr Val Gly Tyr Phe Ala Asn Leu

4885 4890 4895

Leu Pro Leu Arg Ile Arg Leu Ser Asp Gln Val Ser Ile Arg Asp Leu

4900 4905 4910

Val Arg Glu Thr Arg Gln Thr Met Leu Asn Ala Leu Glu His Gly Asp

4915 4920 4925

Leu Pro Leu Ser Glu Met Gly Glu Val Ser Gly Thr Gly Arg Leu Leu

4930 4935 4940

Met Pro Arg Val Gln Phe Ala Phe Gln Ser Leu Val Gly Pro Gln Asn

4945 4950 4955 4960

Thr Asp Arg Gly Ser Leu Glu Val Ser Val Val Asp Gly Ile Asp Gln

4965 4970 4975

Gln Gly Val Gln Asp Leu Ala Leu Glu Val Tyr Pro Gly Pro Glu Gly

4980 4985 4990

Met Arg Cys Arg Phe Ala Tyr Asn Ala Arg Gln Phe Lys Ser Asp Thr

4995 5000 5005

Val Ser Ala Leu Ala Asp Ala Tyr Gln Lys Val Leu Ser Thr Phe Leu

5010 5015 5020

Ala Asp Pro Gly Gly Ala Leu Val Asp Val Ser Leu Ala Gly Ala Asp

5025 5030 5035 5040

Asp Glu Val Leu Thr Asp Trp Gly His Gly Gly Pro Pro Ala Pro Asp

5045 5050 5055

Glu Ala Leu Ile Pro Ala Trp Arg Ala Gln Val Arg Met Ala Pro Asp

5060 5065 5070

Ala Pro Ala Val Ile Cys Gly Asp Thr Val Leu Thr Asn Ala Ala Leu

5075 5080 5085

Glu Gln Asn Ala Gly Asp Leu Ala Ala Arg Leu Val Asp Ala Gly Val

5090 5095 5100

Gln Pro Gly Asp Val Val Ala Ser Cys Leu Ala Arg Ser Ala Asn Ser

5105 5110 5115 5120

Leu Val Ala Val Leu Ala Thr Trp Trp Val Gly Ala Val His Met Pro

5125 5130 5135

Leu Ser Pro Val Gln Ser Ser Ser Arg Leu Asp Asp Met Ile Ala Asp

5140 5145 5150

Gly Ala Pro Val Leu Ala Leu Thr Asp Ala Lys Thr Ala Ser Leu Leu

5155 5160 5165

Ser Ile Arg Gln Met Arg Val Asp Glu Arg Thr Glu Ile Ser Lys Ala

5170 5175 5180

Thr Ala Gly Val Leu Pro Thr Pro Val Ile Gln Asp Pro Ala Ala Ala

5185 5190 5195 5200

Ala Tyr Ile Leu Phe Thr Ser Gly Ser Ser Gly Arg Pro Lys Gly Val

5205 5210 5215

Gln Val Pro His His Ala Leu Ala His His Ile Gln Ala Met Ala Asn

5220 5225 5230

Leu Phe Ala Val Asn Asp Gln Asp Arg Val Leu Gln Phe Val Glu Thr

5235 5240 5245

Ser Phe Asp Ala Ala Phe Glu Gln Trp Leu Thr Thr Leu Val Arg Gly

5250 5255 5260

Ala Thr Val Val Met Arg Pro Glu Gly Leu Trp Ser Ala Leu Asp Phe

5265 5270 5275 5280

Ala Glu Ala Val Gln Arg Trp Ala Val Thr Val Ala Asp Leu Pro Pro

5285 5290 5295

Ala Phe Leu Asp Glu Val Leu Arg Asp Leu Gly Arg Ser Asp Asp Trp

5300 5305 5310

Gln Leu Leu Gln Ser Leu Arg Thr Val Val Thr Gly Gly Glu Ala Leu

5315 5320 5325

Thr Glu Asn Thr Leu Ser Thr Trp Cys Asp Ser Pro Leu Ala Asp Arg

5330 5335 5340

Ala Leu Val Asn Val Tyr Gly Pro Thr Glu Thr Thr Ile Gly Ser Thr

5345 5350 5355 5360

Ala Phe Val Tyr Arg Ala Gln Met Asp Gly Pro Glu Arg Arg Leu Pro

5365 5370 5375

Ile Gly Arg Pro Leu Pro Gly Glu Asn Val Phe Val Leu Asp Val Ala

5380 5385 5390

Asp Gln Pro Leu Pro Ala Gly Leu Ile Gly Glu Leu Ala Ile Gly Gly

5395 5400 5405

Val Gly Leu Ala Asp Gly Tyr Ile Ala Ala Gln Asn Lys Gln Gly Gly

5410 5415 5420

Phe Ser Ser Gly Pro Gly Gly Lys Ala Asp Arg Leu Tyr Lys Thr Gly

5425 5430 5435 5440

Asp Leu Ala Arg Trp Arg Thr Asp Gly Gln Leu Glu Phe Leu Gly Arg

5445 5450 5455

Arg Asp Asn Gln Val Asn Val Arg Gly Phe Arg Val Glu Leu Ala Glu

5460 5465 5470

Val Glu Ala Gly Leu Glu Arg Ile Asp Gly Val Leu Arg Ala Ala Val

5475 5480 5485

Thr Val Ser Asp Arg Lys Pro Asp Thr Thr Leu Gln Ala Tyr Val Thr

5490 5495 5500

Val Ser Asp Pro Asp Leu Glu Pro Ala Ala Ile Ser Arg Ala Leu Lys

5505 5510 5515 5520

Ser Ser Leu Pro Asp Tyr Met Trp Pro Ser Glu Ile Arg Val Val Thr

5525 5530 5535

Ala Leu Pro Gln Thr Ile Ala Gly Lys Leu Asp Arg Gln Ser Leu Asn

5540 5545 5550

Gly Ala Pro Ala Pro Ser Val Ser Ile Pro Glu Gly Pro Leu Ser Arg

5555 5560 5565

Ile Glu Lys Val Leu Ala Ser Leu Trp Ala Glu Leu Leu Asp Cys Pro

5570 5575 5580

Ser Val Pro Val Thr Ala Asn Ile Phe Glu Leu Gly Ala His Ser Leu

5585 5590 5595 5600

Leu Leu Ile Arg Phe Ala Gly Glu Ile Arg Ser Arg Leu Gly Ala Glu

5605 5610 5615

Leu Ser Val Ala Gln Leu Phe Gln Ala Pro Thr Val Ala Asp Gln Ala

5620 5625 5630

Val Leu Ile Glu Arg Ala Lys Gly Asn Arg Ser Ser Val Val Asn Leu

5635 5640 5645

Gln Ala Gly Ser Gly Pro Gly Leu Val Leu Val His Gly Gly Val Gly

5650 5655 5660

Thr Leu Leu Cys Tyr Arg Thr Leu Met Lys His Leu Asp Pro Arg Phe

5665 5670 5675 5680

Ser Ile Leu Gly Leu Glu Met Asn Arg Leu Asp Arg Trp Asn Ser Ile

5685 5690 5695

Pro Asp Ala Ala Thr Ala Tyr Leu Ala Asp Leu Glu Phe Asp Gln Gly

5700 5705 5710

Gln Ala Pro Leu His Leu Ala Gly Trp Ser Ser Gly Gly Ile Val Ala

5715 5720 5725

Trp Glu Met Ala Arg Gln Ile Glu Arg Ser Gly Gly Glu Leu Ala Ser

5730 5735 5740

Leu Thr Leu Ile Asp Ser Tyr Pro Pro Ala Val Leu Ser His Ile Asp

5745 5750 5755 5760

Asn Arg Ile Gln Pro His Asp His Glu Lys Ala Leu Leu Ala Gly Phe

5765 5770 5775

Ala Arg Asp Met Gly Leu Ala Ala Glu Leu Pro Ser Ala Glu Pro Lys

5780 5785 5790

Gly Ala Pro Glu Lys Tyr Leu Gln Asn Met Ala Glu Asn Thr Gly Glu

5795 5800 5805

Asp Phe Gln Val Leu Leu Thr Leu Phe Asn Asn Tyr Lys His Ile Ala

5810 5815 5820

Lys Ala Val Asp Gly Tyr Thr Pro Glu Pro Val Ser Val Ala Ala Ser

5825 5830 5835 5840

Val Phe His Ala Glu Gly Ala Glu Ile Ser Ser Ala Met Arg Gly Trp

5845 5850 5855

Pro Ala Glu Ala Gly Val Leu Asp Ile Gln Pro Val Pro Gly Gly His

5860 5865 5870

Leu Ser Met Leu Glu Gly Glu His Ser Arg Phe Leu Ala Asn Leu Leu

5875 5880 5885

Asn Gly Lys Leu Thr Thr Ala His Asp

5890 5895

<210> 17

<211> 437

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 17

Met Thr Ala Thr Arg Ala Ser Ala Leu Ser Val Cys Val Ile Gly Gly

1 5 10 15

Gly Pro Leu Gly Ile Gly Leu Gly Arg Glu Leu Ser Glu Gly Gly Ile

20 25 30

Asp Tyr Asp Leu Tyr Glu Gln Glu Ser Asp Leu Gly Gly Val Trp Asn

35 40 45

Thr Asp Ala Pro Cys Gly Arg Thr Tyr Pro Ser Leu His Leu Ile Ser

50 55 60

Pro Lys Phe Asn Thr Gln Val Pro Asp Phe Pro Met Pro Asp His Tyr

65 70 75 80

Pro Ala Tyr Pro Asn His Lys Met Met Leu Asp Tyr Ile Arg Ser Tyr

85 90 95

Ala Arg His Phe Gly Val Tyr Asp His Ala His Cys Asn Thr Gly Val

100 105 110

Thr Trp Ile Glu Pro Asp Gly Asp Gly Trp Asn Val Glu Leu Ser Thr

115 120 125

Gly Ala Thr Arg Arg Tyr Asp Ile Val Ala Val Cys Asn Gly Ala Gln

130 135 140

Arg Val Pro His Tyr Pro Lys Pro Pro Tyr Pro Gly Thr Phe Ser Gly

145 150 155 160

Glu Val Leu His Thr Ala Asp Tyr Lys Asn Pro Ser Gln Ile Ala Gly

165 170 175

Lys Arg Val Leu Val Ile Gly Ala Gly Asn Ser Gly Cys Asp Val Ala

180 185 190

Val Asp Ala Val His His Ala Val Ser Val His His Ser Thr Arg Arg

195 200 205

Gly Tyr His Tyr Tyr Pro Lys Phe Ile Asp Gly Lys Pro Thr Pro Gln

210 215 220

Trp Met Leu Gln Leu Gly Thr Lys Phe Thr Ser Lys Glu Glu Thr Ser

225 230 235 240

Ala Tyr Ile Gln Lys Val Phe Lys Leu Ala Gly Phe Asp Gly Thr Asp

245 250 255

Phe Gly Leu Pro Ala Pro Asp His Pro Ile Asp Ala Ala His Pro Ile

260 265 270

Met Asn Ser Gln Ile Leu Tyr His Ile Gly His Gly Asp Ile Ala Thr

275 280 285

Val Gly Asp Val Ala Gly Phe Asp Asp Leu Thr Val Arg Phe Lys Asp

290 295 300

Gly His Glu Ala Glu Ile Asp Ile Ile Val Tyr Ala Thr Gly Tyr Asp

305 310 315 320

Arg His Phe Pro Phe Ile Asp Pro Asp Ile Leu Asp Trp Lys Asp Gly

325 330 335

Ile Pro Asp Leu Phe Ile His Ile Val Pro Arg Asn Leu Asn Asn Leu

340 345 350

Phe Phe Phe Gly Phe Val Asn Ala Ala Ala Gly Leu Gly Asp Gly Met

355 360 365

Arg Leu Gln Gly Gln Phe Val Arg Ser Tyr Val Arg Ala Phe Glu Asn

370 375 380

Gln Thr Leu Gly Tyr Gln Lys Phe Val Ala Ala Lys Ala Gln Asp Asp

385 390 395 400

Pro Asp Leu Gly Gln Asp Tyr Phe Val Asp Ser Arg Arg His Thr Trp

405 410 415

Glu Val Asp Phe Trp Lys Phe Ile Arg His Ala Arg Tyr Tyr Arg Glu

420 425 430

Met Leu Asp Asp Asp

435

<210> 18

<211> 2764

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 18

Met Lys Asp His Ser Gly Ile Val Pro Val Ala Phe Phe Leu Asp Arg

1 5 10 15

Leu Leu Asp Leu Glu Gly Asp Gly Ala Leu Cys Asn Ile Val Phe Pro

20 25 30

Gln Pro Leu Arg Ile Asn Glu Gly Arg Ala Thr Ala Leu Leu Gln Gln

35 40 45

Thr Gly Gly Arg Leu Glu Ile Thr Leu Asp Gly Val Arg Tyr Cys Gln

50 55 60

Ala Asp His Glu Lys Gly Ser Asp Thr Ala Phe Thr Arg Pro Arg Pro

65 70 75 80

Val Asp Leu Asp Ala Arg Arg Thr Glu Thr Pro Phe Val Leu Thr Ser

85 90 95

Arg Ala Cys Asp Ala Val Leu Gln Ser Thr His Gly Pro Ser Leu Met

100 105 110

Ser Leu Ala Glu Gln Arg Asn Gly Pro Ser Gly Ala Leu Ala Arg Val

115 120 125

Gln Ser Ala Glu Met Gly Ala Arg Arg Arg Val Ala Val Leu Asn Gly

130 135 140

Ala Leu Leu Ala Ala Val Val Trp Cys Gln Thr Gln Arg Glu Glu Ser

145 150 155 160

Thr Leu Pro Met Pro Tyr Gly Ile Gly Ser Leu Thr Gln Phe Thr Pro

165 170 175

Thr Leu Pro Asp Lys Val Leu Val Asp Leu Arg Pro Ala Arg Lys Gly

180 185 190

Pro Pro Gly Ala Asp Arg Val Thr Leu Asp Leu Asp Leu Cys Asp Asp

195 200 205

Asn Gly Ser Val Phe Leu Ala Leu Arg Gly Leu Glu Leu Val Trp Ser

210 215 220

Glu Lys Gln Gln Leu Pro Gly Pro Asn Gln Leu Leu Phe Ala Gly Pro

225 230 235 240

Cys Trp Gln Glu Ile Ser Pro Pro Leu Met Asn Gly Thr Ala Pro Val

245 250 255

Asp Pro Val Leu Phe Val Thr Gln Thr Asp Ala His Arg Gln Ser Thr

260 265 270

Leu Arg Ala Ala Phe Pro Gly Ala Asp Leu Arg Val Leu Ser Asp Thr

275 280 285

Val Glu Asn Ala Phe Ala Glu Ile Leu Lys Phe Val Gln Ser Asn Asp

290 295 300

Pro Val Arg Gly Ala Arg Pro Val Leu Leu Ile Val Pro Asp Gln Ser

305 310 315 320

Leu Ala Ser Ser Leu Ser Gly Phe Met Arg Cys Leu Arg Leu Glu His

325 330 335

Pro Ala Ser Cys Ala Gln Ala Val Leu Val Pro Gly Ser Leu Ser Asp

340 345 350

Arg Ala Leu Thr Ser Gly Leu Lys Gln Val Leu Asn Ser Gly Gln Leu

355 360 365

Pro Met Leu Ser Arg Leu Thr Glu Ser Gly Pro Gln Asn Gly Trp Val

370 375 380

Arg Glu Ile Pro Leu Pro Ser Arg Thr Ala Tyr Phe Ala Ala Gly Asp

385 390 395 400

Val Ile Trp Ile Thr Gly Gly Leu Gly Gly Ile Gly Arg Ile Leu Ala

405 410 415

Arg His Tyr Ala Ser Ala Gly Gln Arg Val Val Leu Thr Gly Arg Ser

420 425 430

Ala Pro Pro Ser Gly Ala Glu Ala Phe Leu Thr Glu Thr Gly Ala Leu

435 440 445

Tyr Leu Gln Gly Asp Val Thr Asp Cys Ser Thr Ala Thr Leu Leu Ala

450 455 460

Arg Asp Ile Leu Ala Lys His Gly Arg Leu Asp Ala Val Ile His Ala

465 470 475 480

Ala Gly Leu Ile Glu Asp Gly Leu Leu Arg Asp Lys Gly Gln Glu Ser

485 490 495

Ala Ala Arg Val Leu Ala Pro Lys Leu Ala Gly Thr Arg Ala Leu Asp

500 505 510

Glu Ala Thr Ala Glu Leu Pro Leu Lys Ala Phe Val Leu Cys Ser Ser

515 520 525

Val Ala Gly Val Leu Gly Asn Val Gly Gln Ala Asp Tyr Ala Cys Ala

530 535 540

Asn Ala Tyr Leu Asp Val Phe Ala Glu Leu Arg Gln Gly Gln Val Leu

545 550 555 560

Asn Gly Gln Arg His Gly Gln Ser Leu Ser Val Ala Trp Pro Leu Trp

565 570 575

Gln Gly Gly Gly Met Ala Met Thr Asp Glu Asn Ala Arg Met Met Arg

580 585 590

Thr Gly Thr Gly Met Val Pro Met Pro Asp Gly Thr Gly Ile Glu Ala

595 600 605

Leu Glu Arg Ala Leu Ala Ser Gly Glu Thr Arg Leu Val Val Ala Tyr

610 615 620

Gly Leu Pro Glu Glu Ile Arg Glu Arg Phe Leu Gly Phe Glu Tyr Pro

625 630 635 640

Ala Gly Asn Asn Val Leu Glu Pro Ala Ala Val Glu Gln Gln Ala Asp

645 650 655

Gln Ser Glu Leu Glu Thr Arg Leu Arg Asp Leu Val Ala Lys Val Gln

660 665 670

His Ile Pro Val Gln Lys Val Thr Arg Tyr Lys Pro Leu Ser Asp Tyr

675 680 685

Gly Phe Asp Ser Ile Ser Phe Thr Glu Leu Ala Asn Glu Val Asn Ser

690 695 700

Ala Phe Gly Leu Arg Leu Met Pro Thr Val Phe Phe Glu Ile Pro Asp

705 710 715 720

Leu Ala Ala Leu Ala Asp Lys Leu Ala Lys Asp His Ser Val Thr Leu

725 730 735

Glu Pro Glu Lys Arg Pro Ser Ser Val Thr Ser Pro Ala Pro Ala Arg

740 745 750

Ala Val Val Asp Gln Glu Lys Pro Val Arg Ser Ser Ala Gly Phe Asp

755 760 765

Gly Ser Val Ser Ile Gly Lys Ala Pro Ser Val Asn Arg Gly Met Asp

770 775 780

Thr Ala Glu Pro Ile Ala Val Ile Gly Met Ala Ala Lys Leu Pro Gly

785 790 795 800

Val Gln Ser Leu Asp Ala Phe Trp Arg Ala Leu Asp Ala Gly Arg Asp

805 810 815

Leu Ile Ser Glu Val Pro Ala Asp Arg Trp Asp Trp Arg Ala Phe Gln

820 825 830

Ser Gly Pro Asp Glu Asp Lys Ser Ala Leu Lys Trp Gly Gly Phe Leu

835 840 845

Ala Asp Met Ala Cys Phe Asp His Ala His Phe Gly Ile Ser Pro Ala

850 855 860

Glu Ala Glu Val Leu Asp Pro Gln Leu Arg Leu Met Leu Glu Thr Leu

865 870 875 880

Trp Ala Thr Leu Glu Asn Ala Gly Val Ala Pro Asp Ser Val Ser Gly

885 890 895

Ser Arg Thr Gly Val Phe Thr Gly Val Ala Thr Cys Asp Tyr Ser Glu

900 905 910

Leu Leu Ala Lys Ala Arg Glu Ala Gly His Leu Arg Ser Ala Ala Glu

915 920 925

Pro Phe Ser Phe Leu Val Ala Asn Arg Ala Ser Tyr Phe Phe Asn Leu

930 935 940

His Gly Pro Ser Glu Thr Ile Asp Thr Ala Cys Ser Ser Ser Leu Ile

945 950 955 960

Ala Ile His Arg Ala Thr Glu Ser Leu Arg Ala Gly Met Cys Asp Met

965 970 975

Ala Leu Ala Gly Gly Val Asn Ile Leu Ala Thr Pro Arg Ile Thr Leu

980 985 990

Ala Ser Ser Arg Ala Gly Met Leu Ser Glu Asp Gly Arg Cys Met Ser

995 1000 1005

Phe Asp Ala Arg Ala Asn Gly Tyr Val Arg Ser Glu Gly Val Gly Ala

1010 1015 1020

Val Leu Leu Lys Pro Leu Ala Asp Ala Gln Arg Asp Gly Asp Arg Val

1025 1030 1035 1040

Leu Gly Val Ile Arg Ala Ser Gly Glu Asn His Gly Gly Arg Ala Ser

1045 1050 1055

Ser Pro Thr Ala Pro Asn Ala Thr Ala Gln Lys Glu Leu Ile Val Asp

1060 1065 1070

Val Val Arg Arg Ala Gly Ile Asp Pro Ala Ser Ile Gly Tyr Phe Glu

1075 1080 1085

Ala His Gly Thr Gly Thr Glu Leu Gly Asp Pro Val Glu Val Asn Gly

1090 1095 1100

Leu Lys Ala Ala Leu Ser Glu Leu Gly Leu Asp Ala Arg Asp Gly Pro

1105 1110 1115 1120

Ile Trp Leu Gly Ser Val Lys Ala Asn Val Gly His Thr Glu Ala Ala

1125 1130 1135

Ala Gly Val Val Ser Leu Ile Lys Leu Leu Leu Met Leu Arg His Asn

1140 1145 1150

Arg Ile Ala Gly Asn Pro His Leu Arg Asp Pro Asn Pro Tyr Leu Asp

1155 1160 1165

Leu Asp Glu Thr Pro Leu Ser Leu Val Arg Gly Ser Leu Asp Trp Pro

1170 1175 1180

Ser Gly Pro Ala Pro Arg Arg Ala Gly Leu Ser Ser Phe Gly Val Gly

1185 1190 1195 1200

Gly Ser Asn Ala His Leu Val Leu Glu Glu Pro Ala Thr Asp Thr Glu

1205 1210 1215

Pro Gly Leu Pro Gly Ser Ser Pro Ala Glu Ala Glu Ile Ile Ile Leu

1220 1225 1230

Ser Ala Arg Thr Pro Glu Ile Arg Ala Gln Met Ala Gly Asp Leu Ala

1235 1240 1245

Gln His Leu Arg Ala Asn Gln Asp Thr Leu Cys Leu Ser Asp Val Ala

1250 1255 1260

His Thr Leu Arg Val Gly Arg Ala Arg Leu Pro Ala Arg Leu Ala Phe

1265 1270 1275 1280

Glu Thr Ser Ser Leu Thr Glu Thr Ile Gln Leu Leu Glu Thr Val Ala

1285 1290 1295

Gln Gly Gln Val Pro Glu Asn Val Thr Leu Gly Glu Thr Glu Glu Ile

1300 1305 1310

Thr Gly Ile Ala Leu Ser Glu Asp Leu Pro Asp Leu Ile Glu Val Trp

1315 1320 1325

Leu Ala Lys Gly Gln Leu Ser Arg Val Leu Lys Ala Trp Val Ala Gly

1330 1335 1340

Ala Asp Leu Asp Trp Ala Gln Val Ala Pro Lys Arg Glu Gly Arg Arg

1345 1350 1355 1360

Ile Glu Leu Pro Gly Tyr Pro Phe Glu Arg Ile Thr His Trp Ile Gly

1365 1370 1375

Ser Glu Ser Pro Glu Ala Leu His Val Pro Asp Ala Ala Ala Ala Leu

1380 1385 1390

Pro Ser Val Arg Gln Phe Ala Glu Glu Trp Glu Pro Ser Pro Leu Leu

1395 1400 1405

Glu Pro Gly Ser Gly Pro Val Gly Arg Val Leu Val Leu Ala Pro Lys

1410 1415 1420

Ser Met Ser Ala Ala Asp Ala Asp Leu Asn Ala Gly Glu Asp Leu Leu

1425 1430 1435 1440

Trp Leu Thr Pro Glu Pro Glu Asp Leu Gln Asn Ser Glu Ala Ala Ala

1445 1450 1455

Arg Leu Leu Ser Trp Leu Glu Pro Ala Ser His Val Leu Leu Leu Leu

1460 1465 1470

Gly Asp Glu Asp Arg Val Ala Gly Pro Ile Ile His Leu Leu Gln Ala

1475 1480 1485

Leu Ala Gln Gly Arg Gln Arg Pro Gln Ser Leu Met Ile Cys Gly His

1490 1495 1500

Ala Glu Thr Pro Glu Asp Leu Ala Trp Leu Asp Ala Leu Val Gly Val

1505 1510 1515 1520

Gln Arg Ser Cys Arg Ser Ala Leu Pro Asp Leu Asn Val Ser Ile Val

1525 1530 1535

Phe Gly Ser Gly Thr Ser Leu Thr Val Met Val Arg His Ala Leu Ala

1540 1545 1550

Glu Met Thr Ala Gly Ala Gly Val Cys Val Arg Tyr Arg Gly Glu Glu

1555 1560 1565

Arg Gln Ile Cys Ala Ser Arg Ala Leu Lys Ala Pro Pro Asp Val Gln

1570 1575 1580

Thr Pro Trp Arg His Arg Gly Val Tyr Trp Ile Val Gly Gly Ser Gly

1585 1590 1595 1600

Ala Val Gly Ser Val Leu Ala Arg His Leu Ala Arg Thr Val Ser Ala

1605 1610 1615

Arg Leu Val Leu Ser Gly Arg Gly Pro Glu Asp Arg Ala Leu Ile Asp

1620 1625 1630

Glu Leu Cys Ala Leu Gly Ala Asp Val Cys Tyr Leu Pro Ala Asp Val

1635 1640 1645

Thr Asp Ile Ala Ala Leu His Thr Val Arg Asp Gln Ile Phe Ser Arg

1650 1655 1660

Trp Asp Arg Leu Asp Gly Ala Phe His Leu Ala Gly Arg Ser Gly Ala

1665 1670 1675 1680

Ala Pro Leu Ile Glu Ala Lys Ala Ser Gly Phe Asp Ser Val Leu Ala

1685 1690 1695

Pro Lys Leu Gln Gly Thr Lys Asn Leu His Glu Val Leu Thr Asn Ser

1700 1705 1710

Gly Ala Asp Phe Leu Cys Leu Phe Ser Ser Ser Ser Ala Val Leu Gly

1715 1720 1725

Asp Leu Gly Ser Gly Asp Tyr Ala Met Ala Asn Arg Phe Gln Ser Ala

1730 1735 1740

Phe Ala Ala Glu His Asn Asn Glu Thr Leu Pro Val Leu Ala Val Glu

1745 1750 1755 1760

Trp Pro Leu Trp Arg Ala Arg Gly Leu Ala Asp Ala Glu Ser Glu Ser

1765 1770 1775

Leu Tyr Leu Ala Ser Ser Gly Gln Val Pro Leu Glu Gly Glu Gln Ala

1780 1785 1790

Met Gln Ala Leu Glu Thr Ala Val Phe Thr Gly Arg Thr Arg Thr Leu

1795 1800 1805

Val Leu Ser Gly Asn Ala Glu Arg Leu Asp His Leu Ala Gly Thr Pro

1810 1815 1820

Gln Lys Ser Lys Pro Ser Ala Glu Thr Gly Asp Val Leu Thr Val Leu

1825 1830 1835 1840

Lys Ser Leu Ala Ala Asp Gln Leu Lys Met Ser Ser Gly Glu Ile Gly

1845 1850 1855

Ser His Lys Asn Leu Ala Ser Phe Gly Phe Asp Ser Ile Ala Leu Ser

1860 1865 1870

Glu Phe Ala Arg Ser Ile Gly Thr Cys Phe Asp Ile Asp Leu Ala Pro

1875 1880 1885

Ser Val Phe Phe Ser His Ala Thr Leu Gly Lys Leu Ala Ala His Leu

1890 1895 1900

Ser Glu Ile Gly Val Gly Val Thr Thr Pro Glu Ser Thr Gln Pro Arg

1905 1910 1915 1920

Thr Phe Ala Gln Pro Arg Ala Val Ser Asp Asp Ala Ile Ala Ile Ile

1925 1930 1935

Gly Thr Ser Gly Arg Phe Pro Gly Ala Arg Asp Val Gly Gly Leu Trp

1940 1945 1950

Asn Ile Leu Asp Gln Gly Arg Glu Ala Val Glu Glu Val Thr Pro Glu

1955 1960 1965

Arg Phe Asp Trp Arg Arg Ile Tyr Glu Ala Lys Thr Pro Pro Val Pro

1970 1975 1980

Gly Lys Thr Asn Ser Arg Trp Cys Gly Gln Val Pro Gly Leu Ser Glu

1985 1990 1995 2000

Phe Asp Pro Leu Phe Phe Glu Ile Ser Pro Leu Glu Ala Glu Arg Met

2005 2010 2015

Asp Pro Arg Gln Arg His Leu Leu Gln Glu Ser Trp Leu Ala Leu Glu

2020 2025 2030

Ser Ala Ala Leu Gly Pro Glu His Leu Ala Ser Gln Arg Val Gly Ser

2035 2040 2045

Phe Val Gly Val Glu Asp Gly Ser Asp Tyr Ile Lys Arg Ser Asp Gln

2050 2055 2060

Ile Ser Leu Thr Gly Ala His Asn Ala Val Leu Ala Ala Arg Leu Ser

2065 2070 2075 2080

Tyr Phe Leu Gly Leu Asp Gly Pro Ala Leu Ala Leu Asn Thr Ala Cys

2085 2090 2095

Ser Ser Gly Leu Met Ala Ala His Met Ala Cys Gln Ser Leu Arg Ala

2100 2105 2110

Gly Glu Cys Asp Val Ala Leu Ala Ala Gly Val Asn Leu Met Val Ser

2115 2120 2125

Gln Asp Ala Tyr Ile Gly Met Gly Gln Ala Gly Met Leu Ser Pro Asp

2130 2135 2140

Gly Lys Cys Tyr Thr Phe Asp Val Arg Ala Asn Gly Met Val Pro Gly

2145 2150 2155 2160

Glu Ala Val Ala Val Leu Val Leu Lys Ser Leu Ala Arg Ala Arg Glu

2165 2170 2175

Asp Gly Asp Pro Ile Gln Ala Val Ile Arg Thr Ser Gly Thr Asn Tyr

2180 2185 2190

Asp Gly His Thr Asn Gly Ile Thr Ala Pro Ser Gly Gln Ser Gln Val

2195 2200 2205

Asp Leu Leu Arg Arg Val Gln Ala Gln Ala Gly Val Lys Pro His Glu

2210 2215 2220

Ile Asp Trp Val Ile Ala His Gly Thr Gly Thr Glu Leu Gly Asp Leu

2225 2230 2235 2240

Val Glu Ala His Ala Leu Arg Asp Val Phe Ser Gly Ala Glu Arg Glu

2245 2250 2255

Pro Asn Ser Ile Ala Val Thr Thr Thr Lys Gly Asn Phe Gly His Thr

2260 2265 2270

Phe Ala Ala Ser Gly Leu Val Ser Ala Ile Gly Ala Val His Ala Leu

2275 2280 2285

Gln His Asp Arg Leu Pro Ala Ser Leu Asn His Asn Gln Pro Ser Pro

2290 2295 2300

Met Leu Gly Trp Gln Lys Thr Pro Leu Tyr Val Asn Thr Gln Ser Arg

2305 2310 2315 2320

Asp Trp Pro Arg Pro His Ala Gly Arg Ser Arg Leu Ile Ser Val Ser

2325 2330 2335

Ala Phe Gly Ile Ser Gly Thr Asn Val Asn Leu Leu Ile Glu Asp Ala

2340 2345 2350

Pro Asp Ser Pro Ala Gln Leu Pro Ser Glu Glu Arg Asn Tyr Val Ile

2355 2360 2365

Ser Leu Ser Ala Lys Thr Glu Ser Ser Leu Gln Ala Met Ala Ser Lys

2370 2375 2380

Leu Ala Ala Tyr Leu Lys Ser Pro Glu Ala Ala Asp Gln Gln Leu Ala

2385 2390 2395 2400

Ala Ile Ser Leu Thr Leu Leu Thr Gly Arg His Ala Phe Thr His Arg

2405 2410 2415

Leu Ala Leu Val Val Lys Asp Leu Gln Asp Ala Ala Arg Gln Leu Glu

2420 2425 2430

Ala Phe Asp Ser Thr Pro Gly Tyr Arg Gly His Val Pro Glu Glu Pro

2435 2440 2445

Asp Leu Pro Asp Met Ser Gln Gln Ile Ser Gly Leu Leu Glu Lys Ala

2450 2455 2460

Gln Ser Arg Glu Ala Leu His Glu Leu Ala Glu Leu Phe Cys Gln Gly

2465 2470 2475 2480

His Pro Ile Pro Trp Val Asn Leu Phe Pro Cys Ser Leu Arg Arg Ile

2485 2490 2495

Asn Leu Pro Gly Tyr Val Phe Glu Arg Asp Arg Cys Trp Ile Asp Ala

2500 2505 2510

Pro Glu Ala Arg Pro Ala Pro Ala Ile Gly Pro Tyr Val Lys Pro Leu

2515 2520 2525

Pro Glu Pro Asp Thr Pro Ala His Pro Pro Val Ser Gly Val Ser Asp

2530 2535 2540

Leu Ser Pro Gly Leu Asp Met Leu Glu Ala Ala Arg Gly Ala Ala Ser

2545 2550 2555 2560

Asn Val Leu Asn Arg Asp Val Gln Thr Leu Ser Arg Ile Val Trp Gly

2565 2570 2575

Ala Pro Gln Ser Ser Glu Ile Arg Pro Asp Pro Asn Glu Ile Cys Ile

2580 2585 2590

Leu Ser Ala Asp Gln Gly Leu Val Ala Val Glu Ala Ala Gly Thr Thr

2595 2600 2605

Asp Ala Leu Ala Leu Leu Ala Gln Ala Gly Ala Pro Cys Ser Ser Phe

2610 2615 2620

Pro Ala Pro Val Arg Leu Pro Arg Leu Arg Gly Gly Leu Lys Pro Val

2625 2630 2635 2640

Ser Ala Pro Gln Gly Val Ala Ala Leu Tyr Gly Asp Glu Gly Arg Leu

2645 2650 2655

Val Gly Asn Met Lys Gly Leu Ser Ala Pro Ala Val Phe Asp Val Arg

2660 2665 2670

Val Leu Arg Ala Ile Trp Asn Ser Val Gln Cys Leu Ser Asp Leu Glu

2675 2680 2685

Thr Ala Gln Val Ala Trp Pro Ala Ser Leu Met Thr Leu Ala Ser Thr

2690 2695 2700

Ala Pro Leu Thr Ser Asp Val His Phe Glu Val Val Arg Leu Ser Asp

2705 2710 2715 2720

Pro Asp Pro Gly Tyr Leu Asn Val Asp Val Thr Val Tyr Asp Pro Gln

2725 2730 2735

Gly Thr Pro Leu Met Ile Leu Arg Glu Phe Ser Leu Ser Leu Gly Ala

2740 2745 2750

Leu Pro Glu Asn Ile Gln Trp Glu Gly Val Glu Ala

2755 2760

<210> 19

<211> 1949

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 19

Met Pro Asp Leu Arg Asp Ile Ala Leu Thr Leu Gln Thr Gly Arg Glu

1 5 10 15

Ala Met Ala Glu Arg Ala Ala Phe Leu Val Gln Asp His Gln Asp Leu

20 25 30

Leu Thr Gln Leu Arg Ile Val Glu Asp Gly Gly Ile Pro Asp Lys Gly

35 40 45

Ala Arg Gly Arg Val Asn Leu Ser Glu Thr Gly Pro Arg Glu Glu Ala

50 55 60

Ile Gly Ser Ser Arg Leu Arg Ser Gln Asn Asn Gly Thr Leu Asp Glu

65 70 75 80

Ile Val Gln Ala Trp Val Ser Gly Gln Glu Ile Asp Trp Ser Ser Leu

85 90 95

Ala Gly Met Ala Gly Ala Arg Arg Ile Gly Leu Pro Leu Tyr Pro Phe

100 105 110

Asp Thr His Arg Leu Trp Phe Asp Glu Val Val Thr Glu Asp Asn Ala

115 120 125

Glu Asn Pro Asn Ala Pro Asp Pro Val Pro Glu His Val Thr Phe Ser

130 135 140

Pro Tyr Trp Glu Ser Val Ser Pro Thr Asp Lys Pro Ala Pro Leu Ile

145 150 155 160

Gly Pro Val Leu Ala Ile Gly Ala Thr Gly Ala Ser Arg Asp Gln Leu

165 170 175

Ala Asn Ala Tyr Pro Asp Ala Gln Phe Val Pro Pro Asp Glu Ala Pro

180 185 190

Lys Lys Leu Arg Glu Asn Trp Gly Thr Val Leu Trp Leu Ala Glu Pro

195 200 205

Gly Ala Ala Pro Leu Thr Phe Phe Arg Phe Ala Lys Ala Leu Ile Glu

210 215 220

Thr Gly Pro Ala Ser Gly Asn Leu Thr Leu Val Thr Arg Asn Gly Phe

225 230 235 240

Ala Phe Asp Ala Glu Pro Ala Asp Pro Glu Gln Ala Ala Ile Gln Gly

245 250 255

Cys Leu Ala Val Leu Ala Gln Glu Leu Pro Gly Trp Thr Leu Arg Ala

260 265 270

Met Asp Leu His Pro Ala Glu Pro Leu Phe Pro Asn Leu Leu Asp Thr

275 280 285

Leu Pro Leu Glu Gly Gly Gln Ile Gly Phe Ala Arg Arg Gln Gly Gln

290 295 300

Trp Leu Arg Pro Arg Leu Ile Pro Cys Asp Leu Pro Glu Val Pro Pro

305 310 315 320

Glu Ile Pro Tyr Arg Lys Asn Gly Val Tyr Leu Val Leu Gly Gly Ala

325 330 335

Gly Ala Leu Gly Arg Val Trp Thr Thr His Leu Leu Gln Arg Val Ser

340 345 350

Ala Gln Val Val Trp Leu Gly Arg Ser Ala Leu Ser Ala Gln Ile Arg

355 360 365

Gln Asn Met Ala Ala Tyr Asp Gly Ala Val Ser Tyr His Ser Ala Asp

370 375 380

Ala Arg Asn Pro Gly Glu Leu Ala Asp Ala Ile Ala Asp Ile Arg Asn

385 390 395 400

Arg Tyr Glu Lys Leu Asp Gly Val Ile Val Ser Thr Leu Ala Glu Tyr

405 410 415

Asp Lys Ser Ile Ala Glu Met Ser Glu Thr Leu Phe Gln Asp Ile Leu

420 425 430

Ser Thr Arg Leu Asn Val Val Ser Ala Leu Asp Lys Ala Leu Met Gly

435 440 445

Val Pro Thr Pro Asp Phe Val Ala Leu Phe Ser Ser Leu Ala Ser Cys

450 455 460

Gly Lys Pro Ala Gly Met Ala Ala Tyr Val Ala Gly Cys Gln Ala Ser

465 470 475 480

Glu Ala Ala Ala Phe Ala Leu Gly Arg Ser His Ser Cys Pro Val Thr

485 490 495

Val Val Asn Trp Gly Tyr Trp Asp Ile Gly Gly Gly Val Arg Val Thr

500 505 510

Asp Ser Leu Arg Ala Leu Ala Ala Arg Arg Gly Val Val Pro Ile Asp

515 520 525

Pro Glu Ala Gly Met Ala Leu Phe Glu Thr Ala Leu Ala Met Lys Gln

530 535 540

Pro Gln Ile Ala Ile Ser Arg Thr Thr Arg Pro Asp Arg Ile Glu Thr

545 550 555 560

Val Leu Glu Thr Pro Arg Met Lys Pro Leu Ser Gly Thr Ala Leu Pro

565 570 575

Val Leu Pro Gln Val Val Thr Arg Glu Ala Pro Pro Glu Pro Ala Arg

580 585 590

Glu Ala Ala Ala Leu Asp Gln Trp Leu Gly Arg Leu Leu Leu Ala Gln

595 600 605

Leu Arg Lys Met Asp Val Phe Asp Arg Pro Gly Leu Ser Arg Lys Ile

610 615 620

Glu Phe Glu Thr Phe Ala Ile Leu Ala Lys Phe Arg Pro Trp Trp Asp

625 630 635 640

Glu Ala Leu Asn Ile Leu Glu Glu Gln Gly Ser Ile Ser Arg Asp Ala

645 650 655

Ala Gly Ala Val Thr Leu Leu Gly Asp Asp Leu Leu Ser Pro Asp Thr

660 665 670

Val Trp Ala Glu Trp Glu Lys Ala Gln Gln Ala Phe Leu Glu Thr Pro

675 680 685

Asp Thr Arg Val Leu Ala Ile Leu Thr Thr Asp Cys Leu Lys Ala Leu

690 695 700

Pro Gln Ile Leu Arg Gly Gln Ala Leu Val Thr Asp Ile Leu Phe Pro

705 710 715 720

Ala Gly Lys Met Glu Lys Ile Glu Gly Leu Tyr Ser Asn Asn Arg Ile

725 730 735

Cys Asp Phe Phe Asn Ser Val Val Ala Asp Thr Val Asp Ala Val Ile

740 745 750

Thr Ala Arg Arg Ala Gln Asp Pro Glu Ala Lys Leu Arg Ile Leu Glu

755 760 765

Ile Gly Ala Gly Thr Gly Gly Thr Thr Ala Thr Leu Val Pro Arg Leu

770 775 780

Ala Arg Trp Ser Glu Ala Ile Ala Glu Tyr Cys Tyr Thr Asp Leu Ser

785 790 795 800

Lys Ser Phe Phe Thr His Ala Arg Arg Arg Phe Gly Gln Ser Ala Pro

805 810 815

Tyr Met Arg Phe Glu Leu Phe Asn Val Glu Ala Ala Pro Ala Ala Gln

820 825 830

Gly Leu Asp Ile Gly Ala Tyr Asp Ile Val Leu Gly Thr Asn Val Leu

835 840 845

His Ala Thr Arg Asp Ile Arg Glu Thr Val Arg Asn Ala Lys Ala Leu

850 855 860

Leu Lys Ser Gly Gly Val Leu Ile Ala Asn Asp Ile Ser Asp Lys Thr

865 870 875 880

Val Phe Ala Ser Val Leu Phe Gly Leu Ile Asp Gly Trp Ser Leu Ala

885 890 895

Glu Asp Arg His Phe Arg Ile Pro Gly Ser Pro Gly Leu Tyr Pro Glu

900 905 910

Thr Trp Glu Thr Val Phe Ala Leu Glu Gly Leu Gln His Val Gln Phe

915 920 925

Pro Ala Glu Ala Gln His Gly Leu Gly Gln Gln Ile Val Val Gly Gln

930 935 940

Ser Asp Gly Arg Val Ala Val Ser Glu Pro Phe Glu Val Glu Val Val

945 950 955 960

His Pro Gly Pro Leu Glu His Gly Thr Thr Asp Asp Asn Ser Val Ser

965 970 975

Glu Glu Glu Ile His Ser Gly Thr Gln Val Arg Gly Arg Gly Leu Leu

980 985 990

Ser Asn Glu Ala Ile Arg Ala Glu Ile Glu Asp Ala Leu Ala Ala Ala

995 1000 1005

Leu Asp Ile Asp Arg Asp Glu Ile Ala Ser Asp Val Pro Phe Ser Asp

1010 1015 1020

Tyr Gly Val Asp Ser Ile Leu Gly Val Gly Phe Val Arg Glu Ile Gly

1025 1030 1035 1040

Ala Arg Leu Ser Ile Thr Leu Gln Thr Thr Asp Leu Phe Asp His Thr

1045 1050 1055

Thr Val Ala Arg Leu Cys Ser Phe Ile Glu Glu Gln His His Pro Ala

1060 1065 1070

Val Gly Gly Ala Met Ser Glu Thr Asp Ile Glu Pro Lys Val Thr Thr

1075 1080 1085

Asp Pro Gln Arg Lys Leu Glu Arg Trp Asp Asp Gly Ile Ala Val Ile

1090 1095 1100

Gly Met Ala Gly Gln Phe Pro Gly Ala Ala Asp Val Asp Thr Leu Trp

1105 1110 1115 1120

Arg Asn Met Ile Asp Gly Val Asp Pro Val Val Pro Leu Pro Gly Arg

1125 1130 1135

Tyr Met Arg Pro Glu Lys Val Ser Gln Asp Lys Glu Pro Gly Lys Ser

1140 1145 1150

Tyr Cys Arg Trp Gly Gly Ile Leu Glu Asp Arg Asp Ala Phe Asp Pro

1155 1160 1165

Leu Phe Phe Arg Leu Ser Pro Arg Glu Ala Ala Ser Met Asn Pro His

1170 1175 1180

Gln Arg Leu Ile Leu Leu Glu Ser Trp His Ala Leu Glu Asp Ala Gly

1185 1190 1195 1200

Ile Asp Pro Gly Gly Leu Ala Glu Ser Arg Thr Gly Val Phe Val Gly

1205 1210 1215

Cys Glu Pro Ser Gly Tyr Val His Asp Thr Phe Thr Gly Ala Ser Asp

1220 1225 1230

Ala Ile Val Ala Ser Arg Ile Ser Tyr Phe Leu Asp Leu Lys Gly Pro

1235 1240 1245

Ala Tyr Val Val Asn Thr Gly Cys Ser Ser Ser Gly Val Ala Leu His

1250 1255 1260

Leu Ala Cys Glu Ser Leu Arg Asn Gly Glu Cys Asp Leu Ala Leu Ala

1265 1270 1275 1280

Gly Gly Ala Phe Ala Val Met Gly Glu Asn Ile Leu Ile Gly Leu Ala

1285 1290 1295

Gln Thr Glu Met Leu Thr Arg Thr Gly His Cys Arg Thr Phe Asp Ala

1300 1305 1310

Glu Ala Asp Gly Met Val Met Ser Glu Ala Ala Gly Met Val Val Leu

1315 1320 1325

Lys Pro Leu Ser Ala Ala Val His Asp Gly Asp Pro Ile His Gly Val

1330 1335 1340

Ile Arg Ala Ser Gly Thr Asn Gln Asp Gly Ala Ser Asn Gly Ile Thr

1345 1350 1355 1360

Ala Pro Ser Gly Ala Ala Gln Ala Ala Leu Ile Ser Asp Val Gln Ser

1365 1370 1375

Arg Phe Asp Ile Asp Pro Arg Arg Ile Ser Tyr Val Glu Thr His Gly

1380 1385 1390

Thr Gly Thr Lys Leu Gly Asp Pro Val Glu Ala Asn Ala Leu Val Lys

1395 1400 1405

Ala Phe Gln Pro His Asp Leu Thr Pro Gly Ser Cys Ala Leu Gly Ser

1410 1415 1420

Val Lys Ser His Ile Gly His Ser Ala Ala Ala Ala Gly Val Cys Gly

1425 1430 1435 1440

Leu Ile Ala Val Leu Met Ala Met Lys His Arg Lys Met Pro Glu Leu

1445 1450 1455

Arg His Phe Lys Ser Leu Asn Pro Leu Ile Asn Leu Glu Gly Ala Pro

1460 1465 1470

Phe Tyr Pro Leu Thr Glu Thr Ser Asp Trp Thr Arg Arg Asp Gly Gln

1475 1480 1485

Pro Leu Leu Ala Ala Leu Asn Ser Phe Gly His Ser Gly Thr Asn Ala

1490 1495 1500

His Leu Val Ile Glu Glu Ala Pro Glu Leu Arg Val Ser Pro Thr Val

1505 1510 1515 1520

Ser Val Gly Asp Pro Gln Gln Glu Leu Ile Leu Leu Ser Ala Lys Asp

1525 1530 1535

Val Glu Arg Leu Gln Leu Gln Ala Gly Ala Leu Ala Arg Lys Ile Glu

1540 1545 1550

Asn Val Pro Asp Leu Leu Leu Ala Asp Ile Ala His Thr Leu Arg Thr

1555 1560 1565

Gly Arg Met Ala Met Glu Cys Arg Ala Ala Phe Leu Val Thr Thr Arg

1570 1575 1580

Thr Glu Leu Leu Asp Arg Phe Lys Gly Leu Ala Ala Gly Thr Leu Ala

1585 1590 1595 1600

Ala Asp Trp Ser Gly Glu Val Pro Ser Lys Trp Thr Ala Arg Ala Gly

1605 1610 1615

Pro Gln Pro Glu Ala Pro Ser Ser Thr Ala Val Leu Ser Met Gln Ala

1620 1625 1630

Glu Ala Trp Val Ala Gly Ala Pro Ile Asp Trp Ser Gly Val Ala Leu

1635 1640 1645

His Gln Gly Trp Arg Gly Gln Arg Cys His Leu Pro Gly Tyr Pro Phe

1650 1655 1660

Ala Lys Glu Arg Tyr Trp Arg Ser Asp Arg Gln Asp Gln Asp Arg Asp

1665 1670 1675 1680

Lys Ser Gly His Asp Thr Leu His Leu Asn Gly Glu Glu Ser Trp Leu

1685 1690 1695

Arg Asp His Arg Ile Ala Gly Arg Pro Val Val Pro Gly Val Ala Tyr

1700 1705 1710

Pro Ala Leu Ala Leu Ala Arg Leu Thr Gly Ala Arg Asn Thr Gly Trp

1715 1720 1725

Arg Phe Glu Asp Leu Val Trp Pro Val Pro Leu Thr Val Glu Ala Pro

1730 1735 1740

Val Asp Leu Glu Ile Glu Ala Lys Ser Phe Asp Gln Asp Gly Ser Tyr

1745 1750 1755 1760

Ala Leu Ser Ser Leu Ala Pro Asp Gly Thr Ser Gln Val His His Gln

1765 1770 1775

Gly Arg Leu Ile Pro Leu Glu Gly Pro Pro Pro Ala Val Asp Leu Pro

1780 1785 1790

Ser Ile Arg Ala Arg Leu Ser Ala His Glu Met Ala Val Asp Ala Ile

1795 1800 1805

Tyr Gly Ala Leu Asn Glu Ala Gly Val Val His Gly Pro Ala Leu Lys

1810 1815 1820

Ser Ile Gly Arg Val Trp Ala Thr Pro Asp Glu Ile Leu Ala Glu Leu

1825 1830 1835 1840

Asn Leu Pro Gly Thr Ala Glu Ser Gly Val Met Pro Ile Ala Leu Leu

1845 1850 1855

Asp Gly Ala Trp Gln Ala Thr Leu Ala Leu Ser Leu Ala Asp Pro Asn

1860 1865 1870

Asn Pro Ala Pro Ala Ala Leu Pro Phe Ser Leu Glu Thr Leu Asp Leu

1875 1880 1885

His Ala Pro Leu Gly Arg Val Arg Phe Trp Ser Arg Arg Asn Gly Ala

1890 1895 1900

Arg Ala Trp Trp Thr Cys Lys Phe Cys Cys Pro Met Gly His Gln Arg

1905 1910 1915 1920

Cys Lys Cys Ala Gly Cys Thr Pro Gly Pro Ser Ala Leu Pro Asn Pro

1925 1930 1935

Arg Leu Leu Lys Ser His Trp Met Arg Arg Thr Arg Phe

1940 1945

<210> 20

<211> 875

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 20

Met Ala Gly Ala Leu Arg Ser Glu Ala Asn Phe Asp Gly Pro Leu His

1 5 10 15

Arg Gln Leu Thr Glu Gly Ala Pro Leu Thr Pro Val Trp His Ala Gln

20 25 30

Thr Leu Phe Thr Leu Glu Gly Gln Ser Pro Trp Arg Thr Gly Gly Val

35 40 45

Tyr Val Leu Ser Gly Gly Ala Gly Gly Ile Gly Leu His Leu Ala Arg

50 55 60

His Ile Ala His Ala Ala Glu Gly Ala Arg Leu Ile Leu Leu Ala Arg

65 70 75 80

Ser Ala Ile Asp Pro Glu Arg Leu Ala Ser Leu Arg His Thr Gly Cys

85 90 95

Asp Ala Thr Val Ile Arg Cys Asp Leu Gly Asn Pro Gly Glu Val Asn

100 105 110

Ser Ala Ile Gln Gln Val Leu Lys Lys Phe Gly Ala Leu His Gly Val

115 120 125

Leu His Leu Ala Gly Val Asn Gly Asp Gly Leu Leu Ala Ser Asp Leu

130 135 140

Glu Arg Gln Cys Asp Ala Met Leu Ala Pro Lys Val Ile Gly Ala Arg

145 150 155 160

Ala Leu Asp Gln Ala Thr Ala Gly Leu Asp Leu Asp Leu Phe Val Met

165 170 175

Ala Ser Ser Val Ala Thr Leu Arg Gly Ser Pro Gly Gln Ala Ala Tyr

180 185 190

Cys Leu Ala Asn Gly Phe Leu Asp Ser Phe Ala Arg Lys Arg Ala Gln

195 200 205

Ala Val Ala Ala Gly Glu Arg Phe Gly Gln Ser Leu Ala Leu His Trp

210 215 220

Pro Leu Trp Asp Asp Gly Gly Met Arg Pro Pro Asp Ala Asp Thr Glu

225 230 235 240

Met Ala Met Arg Gln Asn Thr Gly Leu Cys Pro Ile Pro Ala Gly Ile

245 250 255

Ala Leu Lys Ala Leu Asp Ser Ala Leu Gln Gln Gly Leu Thr Glu Ala

260 265 270

Ala Val Phe Tyr Gly Asn Gln Asp Lys Ala Leu Ser Trp Leu Ser Ser

275 280 285

Asp Ala Gly Gly Pro Lys Gln Ser Gly Pro Gln Asn Thr Val Gly Asp

290 295 300

Leu Pro Gln Arg Leu Glu His Arg Leu Lys Ala Leu Ile Gly Pro Ile

305 310 315 320

Leu Gly Arg Asp Ala Glu Ala Leu Asn Pro Val Glu Pro Leu Gln His

325 330 335

Tyr Gly Ile Asp Ser Ile Thr Ile Thr Arg Ile Ala Arg Asp Leu Gln

340 345 350

Ser Leu Ala Gly Pro Gly Ala Gln Thr Leu Leu Phe Arg Phe Ser Thr

355 360 365

Ile Arg Ser Leu Ala Glu His Leu Ala Lys Thr Tyr Gly Ala Ala Cys

370 375 380

His Glu Trp Ile Lys Glu Ala Ala Ala Ile Thr Pro Gln Asn Ser Asn

385 390 395 400

Thr Thr Ser Val Arg Pro Thr Gly Thr Thr Gln Leu Ser Ala Thr Glu

405 410 415

Ser Ile Ser Ser Pro Ala His Ala Arg Ala Glu Lys Ser Glu Ser Ile

420 425 430

Ala Ile Ile Gly Leu Ala Gly Arg Tyr Pro Gly Ser Asp Ser Leu Glu

435 440 445

Gly Phe Trp Gln Asn Leu Ala Gln Gly Arg Asp Cys Ile Thr Glu Ile

450 455 460

Pro Glu Glu Arg Trp Arg Leu Asp Gly Phe Phe Glu Pro Asp Glu Thr

465 470 475 480

Arg Ala Val Ala Gln Gly Lys Ser Tyr Ser Lys Trp Gly Gly Phe Leu

485 490 495

Glu Gly Phe Ala Asp Phe Asp Pro Leu Phe Phe Asn Met Ser Pro Arg

500 505 510

Glu Ala Arg Asp Ile Asp Pro Gln Glu Arg Ile Phe Leu Gln Cys Val

515 520 525

Trp His Ala Leu Glu Asp Ala Ala Leu Thr Arg Lys Asp Leu Lys Glu

530 535 540

His Tyr Asp Gln Asn Val Gly Val Phe Ala Gly Val Thr Lys Thr Gly

545 550 555 560

Phe Asp Leu Tyr Gly Pro Ala Gln Arg Ala Ala Gly Lys Val Ala Phe

565 570 575

Pro His Thr Ser Phe Gly Ser Ile Ala Asn Arg Val Ser Tyr Val Leu

580 585 590

Asp Leu His Gly Pro Ser Met Pro Ile Asp Thr Met Cys Ser Ser Gly

595 600 605

Leu Thr Ala Ile His Gln Ala Cys Ala Ala Leu Leu Asp Arg Ser Thr

610 615 620

Asn Leu Ala Ile Ala Gly Ala Val Asn Leu Tyr Leu His Ser Ser Asn

625 630 635 640

Tyr Ala Glu Leu Cys Ser Ala Tyr Met Leu Ser Arg Ser Gly Arg Cys

645 650 655

Arg Ser Phe Gly Ala Asp Ala Asp Gly Tyr Val Pro Gly Glu Gly Val

660 665 670

Gly Ala Ala Val Leu Lys Arg Leu Ser Glu Ala Glu Gln Asp Gly Asp

675 680 685

Arg Ile His Gly Val Ile Arg Ser Thr Ala Val Asn His Gly Gly His

690 695 700

Thr His Gly Tyr Thr Val Pro Asn Pro Arg Ala Gln Ala Ala Leu Val

705 710 715 720

Arg Ser Ala Leu Asn Lys Ala Gly Ile Asp Ala Asp Thr Ile Gly Tyr

725 730 735

Val Glu Ala His Gly Thr Gly Thr Pro Leu Gly Asp Pro Ile Glu Val

740 745 750

Asp Gly Leu Val Glu Ala Phe Ala Ser Gly Asn Val Leu Pro Gly Gln

755 760 765

Cys Trp Leu Gly Ser Val Lys Ser Asn Val Gly His Leu Glu Ala Ala

770 775 780

Ala Gly Leu Ala Gly Leu Thr Lys Val Leu Met Gln Met Arg Ala Gly

785 790 795 800

Gln Ile Ala Pro Ser Leu His Ala Asp Ala Val Asn Pro Ala Ile Asp

805 810 815

Phe Gly Asn Thr Pro Phe Arg Val Pro Thr Val Leu Thr Glu Trp Thr

820 825 830

Pro Ala Asp Asp Lys Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Pro

835 840 845

Ala Glu Pro Met His Met Trp Trp Ser Lys Asn Ile Arg Arg His Leu

850 855 860

Pro Asn Arg Ala Arg Leu Asn Pro Gly Gln Phe

865 870 875

<210> 21

<211> 2142

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 21

Met Glu Ala Ala Ser Gly Leu Ala Ala Leu Leu Lys Val Val His Ser

1 5 10 15

Phe Ala Ala Asp Arg Ile Phe Gly Ile Ala Gly Phe Asp Gln Val His

20 25 30

Pro Glu Ile Arg Glu Asp Gly Ala Ala Cys Ala Leu Ala Val Asn Asp

35 40 45

Thr Pro Trp Pro Arg Ser Gly Thr Pro Arg His Ala Gly Ile His Cys

50 55 60

His Ala Met Ser Gly Val Asn Ala His Ile Leu Leu Gln Glu Pro Pro

65 70 75 80

Cys Lys Ser Val Ala Arg Pro Gln Asp Ala Pro Ala Asp Pro Gln Val

85 90 95

Ile Val Leu Ser Ala Ala Ser Pro Ser Ser Leu Glu Arg Met Ile Ala

100 105 110

Asn Leu Leu Lys His Leu Gln Gln Gln Pro Glu Arg Leu Cys Asp Val

115 120 125

Ala Lys Thr Leu Gln Gln Gly Arg Asp Ala Leu Ala Tyr Arg Ile Ala

130 135 140

Trp Val Val Pro Asp Thr Ala Ala Leu Ile Glu Ala Leu Glu Val Glu

145 150 155 160

Thr Arg Gly Gln Ala Thr Ser Asp Trp Pro Val Phe Arg Gly Thr Ala

165 170 175

Gly Ser Gly Ile Gln Ala Glu Glu Thr Val Thr Gly Leu Glu Ala Leu

180 185 190

Ala Arg Ala Trp Val Thr Gly Val Asp Gln Ser Trp Pro Asp Leu Glu

195 200 205

Asp Gln Ser Ala Arg Arg Ile Arg Leu Pro Gly Tyr Ala Phe Asp Cys

210 215 220

Arg Pro His Trp Val Lys Pro Val Leu Glu Arg Ala Pro Asp Thr Ser

225 230 235 240

Ala Gln Ile Gly Ile Lys Pro Phe Leu Ile Asp Gln Ile Ala Gly Val

245 250 255

Leu Asp Leu Pro Ala Ala Ser Ile Asp Thr Lys Gln His Leu Tyr Asp

260 265 270

Phe Gly Val Asp Ser Leu Phe Ala Met Gln Leu Leu Arg Ala Val Ala

275 280 285

Arg Thr Phe Gly Ile Thr Val Arg Gly Arg Asp Leu Met Glu His Gln

290 295 300

Ser Ile Asp Ala Leu Ala Glu Tyr Tyr Thr Thr Gln Leu Pro Ala Leu

305 310 315 320

Ala Val Asp Pro Glu Pro Gln Ala Val Glu Val Cys Glu Asp Arg Gly

325 330 335

His Ala Arg Asp Leu Pro Leu Ser Gln Gly Gln Ala Gly Leu Trp Ala

340 345 350

Ile Ala Gln Ala Gln Pro Gly Thr Ser Ala Tyr Asn Leu Pro Val Cys

355 360 365

Leu His Ser Arg Glu Gly Phe Asp Thr Thr Ala Val Gln Ser Ala Leu

370 375 380

Asn Lys Cys Leu Val Gln Tyr Pro Val Leu Thr Ser Thr Phe Arg Val

385 390 395 400

Gly Arg Arg Gly Pro Leu Arg Asp Glu Asn His Gly Ala Thr Leu Tyr

405 410 415

Val Arg Gln Leu Asp Leu Pro Gln Glu Asp Pro Leu Ala Thr Leu Arg

420 425 430

His Ala Ala Lys Ser Pro Phe Asp Leu Ala Arg Asp Leu Pro Val Arg

435 440 445

Ala Thr Ile Phe Gly Gln Gln Gly Thr Pro Ser Tyr Leu Leu Ile Thr

450 455 460

Phe His His Ile Val Phe Asp Gly Gly Ser Phe Trp Leu Phe Met Gln

465 470 475 480

Thr Phe Leu Asp Ala Tyr Asp Ala Glu Leu Gly Lys Ser Leu Arg Ala

485 490 495

Glu Ala Thr Ile Leu Pro Asn Lys Gly Ala Asp Gln Ala Ala Phe Val

500 505 510

Ala Thr Ala Lys Ala Ala Ala Ser Gly Ser Glu Met Arg Asp Ala Arg

515 520 525

Ala Phe Trp Ala Arg Arg Leu Glu Gly Gln Leu Pro Cys Leu Ser Leu

530 535 540

Thr Pro Asp Lys Pro Arg Asn Thr Ala Arg Leu Phe Glu Gly Ala His

545 550 555 560

Leu Thr Leu Pro Leu Pro Ala Ser Val Ala Gly Ala Met Arg Ser Tyr

565 570 575

Ser Arg Ala Glu Arg Cys Pro Leu Ser Ser Leu Cys Leu Ala Leu Phe

580 585 590

Ala Thr Leu Leu His Arg Leu Ser Gly Asp Asp Asp Ile Ile Val Gly

595 600 605

Met Pro Asp His Gly Arg His Asp Pro Arg Tyr Ala Glu Thr Val Gly

610 615 620

Tyr Leu Val Asn Met Leu Pro Ile Arg Met Gln Gly Leu Ala Gly Arg

625 630 635 640

Thr Leu Arg Asp Leu Ala Tyr His Leu Gln Gly Glu Val Ala Asp Ala

645 650 655

Leu Asp His Ala Ala Tyr Pro Phe Ala Gln Met Val Arg Asp Leu Gly

660 665 670

Leu Ser Ser Gly Pro Gly Glu Pro Pro Val Phe Arg Val Ala Phe Glu

675 680 685

Tyr Gln Asn Ala Phe Ser His Asp Ala Leu Pro Ala Leu His Gln Arg

690 695 700

Leu Gln Val Thr Gly Asp Leu Thr Leu Val Glu Asp Leu Arg Gln Glu

705 710 715 720

Gly Glu Tyr Glu Leu Val Leu Glu Val Arg Glu Thr Ser Asp Thr Leu

725 730 735

Ser Leu Cys Met Lys Tyr Asn Pro Asp Leu Tyr Ser Glu Gln Arg Val

740 745 750

Gln Gly Trp Leu Glu Ala Leu Thr Asn Leu Ala Gln Gln Ala Leu Ala

755 760 765

Asp Pro Glu Ala Asn Leu Asp Ser Phe Asp Ile Val Gly Thr Ser Asp

770 775 780

Arg Ala Lys Leu Leu Ala Trp Gly Thr Gly Pro Lys Pro Glu Phe Ser

785 790 795 800

Ala Asp Thr Val Met Gln Leu Val Gln Arg Gln Thr Asp Met His Ser

805 810 815

Ala Glu Thr Ala Val Val Asp Cys Asp Gly Ala Trp Thr Tyr Glu Gln

820 825 830

Leu Asp Gln Glu Ser Leu Arg Val Ala Ala Ala Ile Gln Gln Ala Gly

835 840 845

Val Arg Pro Gly Asp Arg Val Ala Leu Cys Leu Gly Arg Arg Arg Asn

850 855 860

Tyr Ser Ala Ala Leu Leu Gly Thr Leu Arg Ala Gly Ala Val Phe Val

865 870 875 880

Pro Leu Asp Pro Ala His Pro Lys Ala Arg Leu Arg His Ile Leu Glu

885 890 895

Asp Cys Ala Pro Arg Ala Ile Leu Ala Asp Val Ser Thr Asp Ala Met

900 905 910

Ala Thr Gln Leu Ala Glu Pro Asp Cys Thr Met Val Arg Val Asp Ala

915 920 925

Leu Ser Cys Ala Pro Glu Pro Gln Pro Val Gly Leu Lys Gly Gly Asp

930 935 940

Pro Ala Tyr Leu Ile Tyr Thr Ser Gly Ser Thr Gly Arg Pro Lys Gly

945 950 955 960

Val Gln Val Pro His Arg Ala Leu Ala Asn Phe Leu Gln Ala Met Ala

965 970 975

Gln Arg Pro Gly Ala Gly Thr Gly Asp Arg Leu Leu Ala Val Thr Thr

980 985 990

Phe Ala Phe Asp Ile Ser Leu Leu Glu Leu Leu Leu Pro Ile Thr Ser

995 1000 1005

Gly Gly Ser Val His Ile Cys Pro Glu Glu Ile Ala Gln Asp Pro Asp

1010 1015 1020

Ala Leu Ala Ser Glu Ile Ser Arg Val Lys Pro Asp Ile Leu Gln Ala

1025 1030 1035 1040

Thr Ala Ser Val Trp Thr Met Leu Phe Ala Ala Gly Trp Gln Pro Pro

1045 1050 1055

Asp Gly Leu Lys Ala Leu Cys Gly Gly Glu Pro Met Pro Asp Arg Leu

1060 1065 1070

Asn Ser Leu Phe Gln Asn Ser Lys Leu Asp Ala Trp Asn Met Tyr Gly

1075 1080 1085

Pro Thr Glu Thr Thr Ile Trp Ser Thr Cys Gly Pro Val Thr Gly Ser

1090 1095 1100

Gln Asp Thr Val Thr Ile Gly Met Pro Ile Ala Phe Thr Glu Val Leu

1105 1110 1115 1120

Val Leu Asp Glu Tyr Leu Gln Leu Val Pro Val Gly Glu Gln Gly Glu

1125 1130 1135

Leu Tyr Ile Ser Gly Ala Gly Leu Ala Asp Gly Tyr Trp Gln Gln Ala

1140 1145 1150

Asp Arg Thr Ala Gln Ser Phe Ile Ala His Pro Tyr Arg Ser Gly Glu

1155 1160 1165

Arg Leu Tyr Lys Thr Gly Asp Leu Ala Ser Trp Ser Pro Ser Gly Gly

1170 1175 1180

Leu Ile His His Gly Arg Arg Asp Gln Gln Ile Lys Leu Arg Gly His

1185 1190 1195 1200

Arg Ile Glu Leu Ala Glu Ile Glu Cys Val Leu Asp Arg His Lys Glu

1205 1210 1215

Leu Arg Glu Ser Ala Val Val Leu Arg Lys Ser Gly Pro Glu Ala Gln

1220 1225 1230

Leu Val Ala Tyr Val Val Pro Glu Arg Glu Ala Val Pro Ala Val Glu

1235 1240 1245

Leu Arg Ala Cys Leu Arg Glu Asp Leu Pro Ala Tyr Met Leu Pro Asp

1250 1255 1260

Leu Ile Ile Ser Leu Ala Asn Leu Pro Leu Thr Pro Ala Gly Lys Ile

1265 1270 1275 1280

Asp Arg Met Ala Leu Ala Ala Arg Gln Val Asp Leu Gly His Asp Arg

1285 1290 1295

Ser Ala Ser Pro Glu Ile Glu Pro Gly Pro Pro Asp Met Asp Leu Glu

1300 1305 1310

Lys Glu Val Leu Ala Leu Trp Ser Asp Val Leu Asp Ser Thr Gly Ile

1315 1320 1325

Gly Arg Asp Ile Gly Phe Phe Glu Ala Gly Gly Asn Ser Val Thr Ala

1330 1335 1340

Ala Val Leu Ala Ala Arg Ile Ser Glu Arg Phe Gly Val Glu Leu Arg

1345 1350 1355 1360

Val Ser Asp Leu Phe Arg Phe Pro Thr Ile Arg Ala Gln Ala Arg His

1365 1370 1375

Leu Gly Ala Gly Thr Ser Asp Val Val Pro Ala Ser Gln Lys Gln Val

1380 1385 1390

Thr Ala Ala His Glu Ala Pro Lys Leu Asn His Phe Ala Ala Pro Ser

1395 1400 1405

Leu Ala Gln Arg Leu Asp Asp Glu Pro Leu Ala Val Ile Gly Leu Ser

1410 1415 1420

Cys Ala Val Pro Gly Ala Leu Asp Leu Gln Ser Phe Trp Gln Asn Leu

1425 1430 1435 1440

Leu Asp Gly Arg Glu Ala Arg Glu Val Leu Thr Pro Glu Glu Leu Arg

1445 1450 1455

Ala Ala Gly Val Pro Asp Ala Gln Leu Ser Gln Pro Asp Phe Val Pro

1460 1465 1470

Val Ala Phe Pro Leu Ala Glu Arg Ala Cys Phe Asp Pro Gly Phe Phe

1475 1480 1485

Asn Ile Ser Ala Arg Ala Ala Leu His Met Asp Pro Gln Ser Arg Leu

1490 1495 1500

Leu Leu Gln His Ala Trp Lys Ala Met Glu Glu Ala Gly His Ser Thr

1505 1510 1515 1520

Ala Ser Leu Pro Lys Thr Ala Val Phe Thr Ala Val Ser His Gly His

1525 1530 1535

Tyr Lys Thr Leu Leu His Asp Cys Gln Ala Val Ser Asp Asp Glu Phe

1540 1545 1550

Tyr Ser Ala Trp Ile Ala Gly Gln Gly Gly Thr Val Pro Thr Met Leu

1555 1560 1565

Ser Tyr Gln Leu Gly Leu Thr Gly Pro Ser Met Ala Val His Ser Asn

1570 1575 1580

Cys Ser Ser Gly Leu Val Ala Leu His Gln Ala Arg Gln Ala Leu Leu

1585 1590 1595 1600

Ala Gly Glu Ala Arg Ala Ala Leu Ile Gly Ala Ala Ser Val Tyr Ala

1605 1610 1615

Val Pro Gly Ala Gly Tyr Leu His Gln Pro Gly Leu Asn Val Ser Ser

1620 1625 1630

Asp Gly His Cys Arg Ala Phe Asp Ala Lys Ala Asp Gly Leu Val Ala

1635 1640 1645

Gly Glu Gly Leu Gly Val Val Leu Val Lys Arg Leu Ser Asp Ala Gln

1650 1655 1660

Ala Asp Gly Asp His Ile His Ala Leu Ile Lys Gly Val Gly Ile Ser

1665 1670 1675 1680

Asn Asp Gly Ala Asp Lys Ala Gly Phe Phe Ala Pro Ser Val Gln Gly

1685 1690 1695

Gln Ser Glu Ala Ile Arg Arg Ala Leu Glu Ser Ala Lys Val Asp Pro

1700 1705 1710

Ala Ser Ile Gly Tyr Ile Glu Ala His Gly Thr Gly Thr Arg Leu Gly

1715 1720 1725

Asp Pro Val Glu Ile Leu Gly Leu Gln Ser Val Tyr Gly Arg Ala Ala

1730 1735 1740

Gly Ala Pro Gln Pro Val Arg Ile Gly Ser Leu Lys Pro Asn Ile Gly

1745 1750 1755 1760

His Leu Asp Thr Ala Ala Gly Leu Val Gly Leu Ile Lys Ala Val Met

1765 1770 1775

Ala Val Lys Thr Gly Glu Ile Pro Pro Ser Ile Asn Phe Glu Thr Pro

1780 1785 1790

Asn Pro Glu Ile Asp Phe Glu Asp Ala Gly Leu Glu Val Ala Ala Ile

1795 1800 1805

Arg Gln Gly Trp Pro Glu Thr Ser Gly Ser Pro Arg Arg Ala Gly Ile

1810 1815 1820

Ser Ala Phe Gly Ile Gly Gly Thr Asn Ala His Ala Ile Val Glu Glu

1825 1830 1835 1840

Phe Gln Pro Glu Ser Ala Met Pro Val Ser Pro Val Ala Glu Pro Ser

1845 1850 1855

Ser Gln Ile Val Pro Val Ser Ala Arg Thr Gln Asp Gly Leu Arg Gln

1860 1865 1870

Leu Leu Ser Arg Leu Leu Ala Val Val Glu Asp Lys Ala Glu Ala Pro

1875 1880 1885

Leu Ala Asp Ile Ala Tyr Thr Leu Gln Thr Gly Arg Arg His Met Val

1890 1895 1900

Tyr Arg Lys Ala Phe Val Val Ser Gly Leu Asp Glu Leu Arg Ala Glu

1905 1910 1915 1920

Leu Lys Ala Cys Leu Ser Thr Ala Glu Leu Leu Glu Asp Gln Pro Ala

1925 1930 1935

Ala Ser Met Pro Lys Leu Lys Ser Gln Glu Met Ser Val Leu Met Glu

1940 1945 1950

His Trp Leu Ala Thr Arg Gln Leu Asp Arg Val Ala Glu Ala Trp Thr

1955 1960 1965

Gly Gly Thr Glu Val Asp Trp Thr Gln Leu His Thr Gly Pro Arg Arg

1970 1975 1980

Arg Val Ser Leu Pro Thr Tyr Pro Phe Ala Lys Glu Ile Phe Trp Pro

1985 1990 1995 2000

Gly Lys Pro Gly Ala Gln Pro Ser Ala Gly Ser Met Gln Ser Leu Leu

2005 2010 2015

Leu Thr Gln Asp Arg Gln Val Ala Asn Arg Ile Pro Val Ser Ala Pro

2020 2025 2030

Ala Gly Val Gln Lys Val Trp Leu Met Gly Ala Leu Gly Gln His Gln

2035 2040 2045

Gln Thr Leu Ser Glu Leu Leu Pro Asp Ala Arg Ile Thr Asp Leu Pro

2050 2055 2060

Gly Glu Ser Gly Ala Asp Pro Ala Ser His Tyr Met Lys Leu Ser Arg

2065 2070 2075 2080

Ala Leu Leu Ala Lys Ala Arg Asp Leu Ala Leu Glu Gly Gly Ala Gly

2085 2090 2095

Leu Leu Gln Ile Val Leu Asp Ala Arg Gly Pro Gly Val Pro Val Phe

2100 2105 2110

Leu Pro Pro Trp Arg Arg Arg Ser Arg Thr Cys Ala Phe Lys Ser Tyr

2115 2120 2125

Lys Ser Leu Arg Pro Tyr Arg Phe Arg Thr Trp Leu Ala His

2130 2135 2140

<210> 22

<211> 377

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 22

Met Asn Ser Asp Glu Ala Trp Asn Glu Ile Glu Ala Ala Ile Leu Ala

1 5 10 15

Ser Met Gln Cys Gln Asp Lys Phe Ser Asn Thr Pro Pro Gln Asp His

20 25 30

Asp Gly Ala Ala Arg Glu Pro Ala Pro Ile Ala Ile Val Gly Ala Ser

35 40 45

Gly Met Leu Pro Gly Cys Glu Asp Leu Lys Ala Phe Tyr Ala Ala Leu

50 55 60

Glu Thr Gly Ala Cys Leu Ile Glu Lys Arg Ala Glu Arg Ser Leu Gly

65 70 75 80

Glu Arg Leu Ser Ala Pro Ala Ala Asp Ala Pro Phe Val Tyr Gly Gly

85 90 95

Phe Val Pro Asp Pro Ala Gly Phe Asp Ala Gly Phe Phe Asp Ile Pro

100 105 110

Lys Ser Glu Ala Asp Gln Met Asp Pro Arg Gln Arg Leu Leu Leu Met

115 120 125

Ala Ala Leu Gly Ala Met Tyr Asp Ala Gly Tyr Ala Ser Arg Asn Leu

130 135 140

Arg Gly Ser Arg Thr Gly Val Phe Val Ala Ala Gln Asp Asn Glu Tyr

145 150 155 160

Asp Arg Leu Cys Ala Ser Leu Gly His Asp Pro Asp Ala Gly Tyr Ala

165 170 175

Gln Ser Cys Leu Leu Ala Asn Arg Leu Ser Tyr Phe Tyr Asp Phe Asp

180 185 190

Gly Pro Ser Glu Val Ile Glu Ala Gln Cys Ala Ser Ala Gly Val Ala

195 200 205

Leu His Arg Ala Val Gln Ala Leu Arg Gln Gly Glu Ile Ser Gln Ala

210 215 220

Leu Val Ala Gly Val Asn Leu Met Leu Thr Pro Gly Pro Phe Arg His

225 230 235 240

Leu Ala Glu Thr Gly Gln Leu Ser Leu Asp Gly Lys Val Ser Pro Phe

245 250 255

Gly Ala Thr Ala Ala Gly His Val Arg Ala Glu Ala Ala Leu Cys Val

260 265 270

Val Leu Lys Pro Leu Ser Glu Ala Val Ala Asp Gly Asp Ser Val Tyr

275 280 285

Ala Val Ile Arg Gln Thr Ser Val Asn Phe Asn Gly Arg Gly Ala Ala

290 295 300

Ser Leu Ala Ala Pro Ser Val Thr Arg His Ala Glu Leu Ile Ala Asp

305 310 315 320

Cys Tyr Arg Ser Val Gly Ile Gly Pro Gly Gln Val Gly Val Ile Glu

325 330 335

Ala Gln Gly Met Gly Asn Pro Leu Ser Asp Ile Ala Glu Trp Glu Ser

340 345 350

Phe Asn Arg Ala Met Lys Arg Phe Gly Gln Glu Ala Gly Ala Ala Ala

355 360 365

Leu Met Arg Ser Val Ser Ser Val Arg

370 375

<210> 23

<211> 278

<212> БЕЛОК

<213> Labrenzia sp. PHM005

<400> 23

Met Ser Arg Ser Thr Leu Glu Thr Thr Gly Ala Ser Asn Asp Thr Val

1 5 10 15

Glu Asp His Tyr Asp Ser Pro Ala Leu Arg Leu Gly Pro Ile Leu Phe

20 25 30

Asp Glu His Leu His Trp Gly Tyr Trp Asp Glu Asp Ser Arg Asp Ala

35 40 45

Ser Phe Gly Ala Ala Ala Glu Ala Met Cys His Arg Met Ile Asp Arg

50 55 60

Thr Glu Ile Gly Pro Gly Glu Arg Phe Val Asp Leu Gly Cys Gly Ile

65 70 75 80

Gly His Pro Ala Leu Lys Leu Ala Gln Ala Arg Ser Cys His Val Thr

85 90 95

Gly Val Thr Ile Ser Gly Tyr Gln His Arg Ile Ala Gly Glu Lys Ala

100 105 110

Ala Gln Ala Gly Phe Ser Asp Arg Leu Asp Phe Leu Gln Ala Asp Ala

115 120 125

Arg Ser Val Pro Leu Pro Asp Lys Ser Phe Asp Gly Gly Trp Phe Phe

130 135 140

Glu Ser Ile Phe His Met Gly His Ala Glu Ala Leu Gly Glu Ala Ala

145 150 155 160

Arg Leu Leu Lys Pro Gly Ala Gly Leu Val Leu Thr Asp Leu Pro Thr

165 170 175

Leu Pro His Thr Thr Pro Glu Phe Met Asp Phe Val His Glu His Ile

180 185 190

His Ser Val Phe Val Pro Glu Asp Arg Tyr Pro Ala Leu Met Ala Asp

195 200 205

Ala Gly Phe Glu Leu Leu Asn Ile Glu Asp Ile Ser Glu Asn Val Met

210 215 220

Pro Trp Leu Glu Thr Lys Leu Arg Glu Ala Val Gln Glu Lys Trp Ser

225 230 235 240

Asp Val Val Arg Leu Met Gly Asp Gln Ala Glu Lys Ala Val Asp Asn

245 250 255

Trp Tyr Tyr Leu Phe Glu Tyr Met Ala Glu Asn Leu Gly Tyr Thr Met

260 265 270

Ile Thr Ala Arg Arg Leu

275

<---

1. Соединение общей формулы I или его стереоизомер

I

где:

R1 выбран из водорода и незамещенного C1-C6 алкила;

R2 и R3, каждый независимо, выбран из водорода и –C(=O)Ra;

R4 выбран из водорода и -C(=O)Ra;

Ra представляет собой незамещенный C1-C6 алкил.

2. Соединение по п.1, также имеющее общую формулу III или его стереоизомер

III

где R1, R2, R3 и R4 имеют значения, определенные для формулы I в п.1.

3. Соединение по п.1 или 2, где R1 выбран из водорода и метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.

4. Соединение по п.3, где R1 выбран из водорода и метила.

5. Соединение по любому из предшествующих пунктов, где R2 выбран из водорода и –C(=O)Ra, где Ra выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.

6. Соединение по п.5, где R2 выбран из водорода и ацетила.

7. Соединение по любому из предшествующих пунктов, где R3 и R4 независимо выбраны из водорода и –C(=O)Ra, где Ra в каждом случае независимо выбран из метила, этила, н-пропила, изопропила, н-бутила, трет-бутила, втор-бутила и изобутила.

8. Соединение по п.7, где R3 и R4 независимо выбраны из водорода и ацетила.

9. Соединение по п.1 формулы:

, или или его стереоизомер.

10. Соединение по п.9 формулы:

или

или его стереоизомер.

11. Фармацевтическая композиция для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы, содержащая терапевтически эффективное количество соединения, определенного в любом из предшествующих пунктов, или его стереоизомер и фармацевтически приемлемый носитель или разбавитель.

12. Соединение, определенное в любом из пп.1-10, или его стереоизомер, или композиция, определенная в п.11, для применения для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы.

13. Применение соединения, определенного в любом из пп.1-10 или его стереоизомера при получении лекарственного средства для лечения злокачественного новообразования, выбранного из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы.

14. Способ лечения пациента, а именно человека, страдающего злокачественным новообразованием, выбранным из рака легких, рака толстой кишки, рака молочной железы и рака поджелудочной железы, который включает введение страдающему человеку, нуждающемуся в этом, терапевтически эффективного количества соединения, определенного в любом из пп.1-10 или его стереоизомера.

15. Способ получения соединения формулы II или его стереоизомера

,

где

R1 выбран из водорода и незамещенного C1-C6 алкила;

R2, и R3, каждый независимо, выбран из водорода и –C(=O)Ra;

R4 выбран из водорода и -C(=O)Ra;

Ra представляет собой незамещенный C1-C6 алкил;

где способ включает стадии:

- культивирование штамма PHM005 морских бактерий дикого типа или их мутантов в соответствующих условиях для продуцирования соединений 1 и/или 2 формулы:

, ;

- выделение соединений 1 или 2; и, при необходимости,

- превращение соединений 1 или 2 в другое соединение формулы II.

16. Способ по п.15, где соединение формулы II имеет также формулу IV

IV

или его стереоизомер;

где R1, R2, R3, и R4 имеют значения, определенные для формулы II в п.15.



 

Похожие патенты:

Изобретение относится к соединениям или их фармацевтически приемлемым солям, которые обладают модулирующей активностью в отношении GPR17. В формуле I-2 X1 обозначает N или C(R7), Х2 обозначает NH, S или О, Х3 обозначает N или C(R12), R2 выбран из водорода и галогена, R4 выбран из водорода и галогена, R5 выбран из группы, включающей водород, галоген, C1-C6-алкил и т.д., R6 выбран из группы, включающей водород, галоген, цианогруппу, азидогруппу и т.д., R7, если присутствует, выбран из группы, включающей водород, галоген, цианогруппу, C1-C6-алкил, C1-C6-алкоксигруппу, C1-C6-алкилсульфонил, C1-C6-алкилсульфинил и т.д., R8 выбран из группы, включающей водород, галоген, цианогруппу и т.д., R9 выбран из группы, включающей водород, галоген, C1-C6-алкил, C1-C6-алкоксигруппу и т.д., R10 выбран из группы, включающей водород, галоген, C1-C6-алкил, С1-С6-алкоксигруппу, С2-С6-алкенил, С2-С6-алкинил, цианогруппу и т.д., R11 выбран из группы, включающей водород, галоген, цианогруппу, С1-С6-алкил и т.д., R12, если присутствует, выбран из водорода, С1-С6-алкоксигруппы и галогена, при условии, что (a) по меньшей мере один из R5, R6 и R7, если R7 присутствует, и (b) по меньшей мере один из R8, R10 и R11 отличается от водорода.

Изобретение относится к соединению, представленному формулой III или IV, и к его фармацевтически приемлемой соли, где X1 представляет собой N; X3 представляет собой S; pp представляет собой 1; R11 независимо для каждого случая, когда он присутствует, выбран из группы, состоящей из водорода и галогена; R31 выбран из группы, состоящей из водорода и галогена; L1 представляет собой C3-6 циклоалкилен или C3-6циклоалкилен-C1-4алкилен; R44 представляет собой 5-членный гетероарил, содержащий один, два или три гетероатома, каждый из которых выбран из O, N и S; причем гетероарил может быть необязательно замещен одним или двумя заместителями, каждый из которых независимо выбран из Rgg; Rgg для каждого случая, когда он присутствует, выбран из группы, состоящей из галогена, циано, гетероцикла, выбранного из азетидинила, оксетанила и диоксидотиетанила, C1-6 алкила, причем C1-6 алкил может быть необязательно замещены одним заместителем, выбранным из Rjj; и гетероцикл необязательно замещен одним заместителем, выбранным из Rll; Rjj для каждого случая, когда он присутствует, выбран из группы, состоящей из гидроксила, C1-6 алкокси (необязательно замещенного одним заместителем, выбранным из Rkk), C3-6 циклоалкокси и -S(O)w-C1-3 алкила, где w равен 2; Rkk для каждого случая, когда он присутствует, выбран из группы, состоящей из галогена, C3-6 циклоалкила, оксетанила и азетидинила (необязательно замещенного C1-6 алкилом); Rll для каждого случая, когда он присутствует, выбран из группы, состоящей из C1-6 алкила (необязательно замещенного одним, двумя или тремя заместителями, каждый из которых независимо выбран из галогена и C3-6 циклоалкила) и пиперидинила (необязательно замещенного одним заместителем, выбранным из C1-6 алкила).

Настоящее изобретение относится к соединению, представленному формулой I: Iили его фармацевтически приемлемой соли, гдеR1 представлен формулой: где представляет собой моноциклическую С6 арильную или 5-7-членную гетероарильную группу, содержащую 1-2 гетероатома, выбранных из N, O или S; каждый А независимо представляет собой необязательно фторированный C1-8 алкил, необязательно фторированный C1-8 алкокси, необязательно фторированный C3-8 циклоалкил, -CF3 или галоген; n равен 1 или 2; где первый заместитель А расположен орто к точке присоединения от изображенного пиразольного кольца; R2 представляет собой C3-8 алкил, C1-8 алкил-C3-8 циклоалкил, C3-8 циклоалкил или С6-10 арил, замещенный C1-8 алкил; R4 представляет собой необязательно фторированный C1-8 алкил, C1-8 алкил-С6 арил, C1-8 алкил-C3-8 циклоалкил, C1-8 алкил-5-14-членный гетероарил, где гетероарил содержит от 1 до 4 гетероатомов, выбранных из N, O или S, или (CH2)xNR7R8; R5 представляет собой необязательно замещенный C1-8 алкил, C1-8 алкиламино, C1-8 алкиламидо, C2-8 алкил-С6 арил, C1-8 алкил-C3-8 циклоалкил, C1-8 алкил-5-14-членный гетероарил, где гетероарил содержит от 1 до 4 гетероатомов, выбранных из N, O или S, C1-8 алкилтетразол-5-он, (CH2)xNR7R8, (CH2)xOR7, (CH2)xCONR7R8, (CH2)xCOR7, (CH2)xxCO2R7; R6 представляет собой Н или каждый из R7 и R8 независимо представляет собой H, C1-8 алкил-5-14-членный гетероарил, C3-8 циклоалкил, -(CH2)xCO2R9 или 5-17-членный гетероарил, где гетероарил содержит от 1 до 4 гетероатомов, выбранных из N, O, S; или R7 и R8 вместе образуют 3-9-членное кольцо, которое может содержать один или два гетероатома, выбранных из N или O; или R9 представляет собой Н или C1-8 алкил; каждый х независимо равен 0, 1, 2, 3, 4, 5, 6, 7 или 8; и каждый хх независимо равен 0, 1, 2, 3, 4, 5, 6, 7 или 8.

Изобретение относится к соединению формулы (I), в котором R1 и R2 независимо выбраны из группы, состоящей из водорода и C1-С3алкила; X представляет собой O(R3) или N(R4R5); R3 представляет собой С1-С4алкил; R4 и R5 независимо выбраны из группы, состоящей из водорода и С1-С4алкила; Y представляет собой О; Z выбран из группы, состоящей из связи, СН2, СН2-СН2, СН2-СН2-СН2, (O)-СН2, СН(СН3)2-СН2 и кислорода; каждый из A1-А4 независимо выбран из группы, состоящей из связи, CR8=CR8 и S, где A1-А4 вместе с атомами, к которым они присоединены, образуют фенильное кольцо или гетероарильное кольцо, такое как тиенил; и каждый R8 независимо выбран из группы, состоящей из водорода, С1-С4алкила, С1-С4алкокси и С1-С4галогеналкила; или две группы R8 образуют диоксолановое кольцо.

Изобретение относится к 3,3'-[(гексано-1,6-диилбис(азанедиил)]бис-(7-гидрокси-6-метоксикарбонил-2-оксо-2H-хромену) структурной формулы (I). Технический результат – получено новое соединение кумаринового ряда, обладающее антибактериальной активностью в отношении культур клеток условно-патогенных бактерий штаммов Staphylococcus aureus, Bacillus cereus и Escherichia coli и свойством ингибитора образования биопленки указанными штаммами бактерий, которое может найти применение в медицине.

Настоящее изобретение относится к соединению формулы (I) или его фармацевтически приемлемой соли, а также к конкретному феноксиметильному производному или его фармацевтически приемлемой соли, обладающим способностью ингибировать АТХ, к содержащей их фармацевтической композиции, к их применению и к способу ингибирования АТХ В формуле I W выбран из кольцевых систем А, В, С, D и Е: где RA, RB, RC, RC1, RD1, RD4, A1-A6 являются такими, как определено в формуле изобретения.

Изобретение относится к соединению формулы (I) или его фармацевтически приемлемой соли: где R1 представляет собой H; X характеризуется формулой (a) или формулой (b): где каждый из R2A, R2B, R2C и R2D независимо представляет собой водород или галоген; каждый из R3, R4, R6 и R7 независимо представляет собой водород или галоген; R5, в каждом случае, независимо представляет собой C1-C3алкил; X1A представляет собой O или CH2; X1B представляет собой O или CH2; Y представляет собой -G1 или Y характеризуется формулой (c), (d), (e), (f) или (g): где G1 представляет собой фенил или 5-6-членный моноциклический гетероарил, содержащий 1-3 гетероатома, выбранных из группы, состоящей из S и N, каждый из которых необязательно замещен 1, 2 или 3 независимо выбранными Rp-группами; при этом каждая Rp независимо представляет собой C1-C6алкил, галоген, C1-C6галогеналкил, G2, -C(O)NRARB или -NRARB; причем RA, в каждом случае, независимо представляет собой водород; RB, в каждом случае, независимо представляет собой C1-C6алкил, который необязательно замещен 1 или 2 -OH; и G2 представляет собой фенил, 4-8-членный гетероцикл, содержащий 1-2 гетероатома, выбранных из группы, состоящей из N и O, или 5-членный моноциклический гетероарил, содержащий 1-2 гетероатома, выбранных из группы, состоящей из S и N; каждый из которых необязательно замещен 1, 2 или 3 независимо выбранными Rq-группами; X2 представляет собой O или N(R2x), при этом R2x представляет собой водород; X3 представляет собой N или CH; X4-X5 представляет собой N=C, C(R4x)=C или C(R4x)2-C(R5x), при этом каждый из R4x и R5x, в каждом случае, независимо представляет собой водород; R8-группы представляют собой необязательные заместители при бензольном кольце и каждая независимо представляет собой галоген, C1-C3алкокси или C1-C3галогеналкокси; m равняется 0, 1 или 2; G3 представляет собой -(C1-C3алкиленил)-ORg, -(C1-C3алкиленил)-GB, фенил, циклоалкил, 5-6-членный моноциклический гетероцикл, содержащий 1-4 атома N, или 5-6-членный моноциклический гетероарил, содержащий 1-2 гетероатома, выбранных из группы, состоящей из S и N; при этом каждый из фенила, циклоалкила, 5-6-членного моноциклического гетероцикла и моноциклического гетероарила необязательно замещен 1 или 2 независимо выбранными Rs-группами; GB представляет собой пиридазин, необязательно замещенный 1 независимо выбранной Rs-группой; R9 представляет собой C1-C3алкил или фенил; n равняется 1; R10 представляет собой C1-C6алкил, замещенный 1, 2 или 3 заместителями, независимо выбранными из группы, состоящей из OH и 2,2-диметил-1,3-диоксолан-4-ила; или R10 представляет собой фенил, при этом фенил необязательно замещен 1 независимо выбранной Rv-группой; R11 представляет собой галоген, C1-C3алкил или G4, при этом G4 представляет собой C3-C6циклоалкил или фенил; при этом каждый G4 необязательно замещен 1 независимо выбранной Rw-группой; R12 представляет собой необязательные заместители бензольного кольца и каждый независимо представляет собой галоген; p равняется 0 или 1; R13 представляет собой водород или C1-C6алкил, который замещен 1 или 2 заместителями, независимо выбранными из группы, состоящей из -CN, 2,2-диметил-1,3-диоксолан-4-ила, -OR13a и -O-бензила, при этом R13a, в каждом случае, независимо представляет собой водород; каждый из R14 и R15 независимо представляет собой C1-C3алкил или R14 и R15, взятые вместе с атомом углерода, к которому они прикреплены, образуют C3-C6циклоалкил или 4-6-членный моноциклический гетероцикл, содержащий один гетероатом, выбранный из группы, состоящей из атома кислорода; R16 представляет собой -OH или C1-C6алкил, необязательно замещенный 1 или 2 заместителями, независимо выбранными из группы, состоящей из -ORj, -O-бензила; Rq представляет собой галоген, C1-C6галогеналкил, -CN, -ORx, -OC(O)Ry, -S(O)2Rx, -S(O)2N(Rx)2, -C(O)ORx, -C(O)N(Rx)2, -C(O)N(Rx)S(O)2Ry, G2A или C1-C6алкил, который необязательно замещен 1 или 2 заместителями, независимо выбранными из группы, состоящей из -CN, -ORx и G2A; Rx, в каждом случае, независимо представляет собой водород, C1-C6алкил или G2A; Ry, в каждом случае, независимо представляет собой C1-C6алкил; G2A, в каждом случае, независимо представляет собой фенил или C3-C6циклоалкил; каждый из которых необязательно замещен 1 Rz-группой; Rs, в каждом случае, независимо представляет собой C2-C6алкенил, галоген, оксо, -ORh, -C(O)Rj, -C(O)ORj, -C(O)O(бензил), -C(O)N(Rj)2, -C(O)N(Rm)(Rn), -N(Rj)C(O)O(Rk), G3A или C1-C6алкил, который необязательно замещен 1 или 2 заместителями, независимо выбранными из группы, состоящей из -ORj, -S(O)2Rj, -N(Rj)2 и G3A; G3A, в каждом случае, независимо представляет собой фенил или 5-6-членный моноциклический гетероцикл, содержащий 1-2 гетероатома, выбранных из группы, состоящей из O и N; при этом каждый G3A необязательно замещен 1 или 2 Rc-группами; Rg представляет собой водород или бензил или Rg представляет собой C2-C6алкил, который замещен 1 или 2 -ORj; Rh представляет собой бензил или Rh представляет собой C2-C6алкил, который замещен 1 или 2 -ORj; Rm представляет собой G3B или C1-C6алкил, который замещен 1 или 2 заместителями, независимо выбранными из группы, состоящей из -ORj, -S(O)2Rj, -C(O)N(Rj)2 и G3B; Rn представляет собой водород, C1-C6алкил, бензил или -(C2-C6алкиленил)-ORj; или Rm и Rn, взятые вместе с атомом азота, к которому они прикреплены, образуют 4-7-членный моноциклический гетероцикл, содержащий 1-2 гетероатома, выбранных из группы, состоящей из O и N, при этом 4-7-членный моноциклический гетероцикл необязательно замещен 1 или 2 независимо выбранными Rc-группами; G3B, в каждом случае, независимо представляет собой фенил, 5-6-членный моноциклический гетероцикл, содержащий 1 гетероатом, выбранный из группы, состоящей из S и N, или 4-9-членный циклоалкил, каждый из которых необязательно замещен 1 или 2 независимо выбранными Rc-группами; каждый из Rc, Ru, Rv, Rw и Rz, в каждом случае, независимо представляет собой галоген, оксо, -ORj, -S(O)2N(Rj)2, -C(O)Rj, -C(O)ORj или C1-C6алкил, который необязательно замещен 1 или 2 заместителями, независимо выбранными из группы, состоящей из -ORj; Rj, в каждом случае, независимо представляет собой водород или C1-C6алкил; и Rk, в каждом случае, независимо представляет собой C1-C6алкил.

Настоящее изобретение относится к сульфонилмочевинам формулы (II) или их фармацевтически приемлемым солям: где А, В, D и Е независимо выбраны из С, N, О и S, но по меньшей мере один из них представляет собой С и по меньшей мере один из них представляет собой N; каждая пунктирная линия может обозначать связь; каждый случай R6 независимо выбран из группы, состоящей из водорода, галогенида, циано, C1-С6 алкила, С1-С6 алкиламино, C1-C6 алкилгидрокси, С3-С6 циклоалкила, алкилфенила, фенила, бензила, C1-C6 сложного эфира, С2-С6 алкенила, С1-С6 трифторалкила и С1-С6 алкокси, каждый из которых может быть необязательно замещенным, по необходимости, где любой необязательный заместитель независимо выбран из группы, состоящей из С1-10 алкила; С3-6 циклоалкила; гидроксиалкила; С1-10 алкокси; С2-10 алкенила; С2-10 алкинила; С6-C12 арила; арилокси; гетероарила, содержащего от одного до четырех гетероатомов, выбранных из N, О и S; гетероциклила, имеющего от 5 до 8 атомов в кольце, и из этих атомов от 1 до 4 являются гетероатомами, выбранными из N, О и S; гало; гидроксила; галогенированного алкила; амино; алкиламино; ариламино; ацила; амидо; CN; NO2; N3; СН2ОН; CONH2; CONR24R25; CO2R24; CH2OR24; NHCOR24; NHCO2R24; С1-3 алкилтио; сульфата; сульфоновой кислоты; эфиров сульфокислот; фосфоновой кислоты; фосфата; фосфоната; моно-, ди- или трифосфатных эфиров; тритила; монометокситритила; R24SO; R24SO2; CF3S; CF3SO2; и триалкилсилила; где R24 и R25 - каждый независимо выбран из Н и С1-10 алкила; и R2 выбран из 2,6-диалкилфенила, 2,6-диалкил-4-галофенила, 2,6-дициклоалкилфенила, 2,6-дициклоалкил-4-галофенила, и: где каждый случай Y независимо выбран из С, N, S и О, который может быть необязательно замещенным, по необходимости, где любой необязательный заместитель независимо выбран из группы, состоящей из С1-10 алкила; С3-6 циклоалкила; гидроксиалкила; С1-10 алкокси; С2-10 алкенила; С2-10 алкинила; C6-C12 арила; арилокси; гетероарила, содержащего от одного до четырех гетероатомов, выбранных из N, О и S; гетероциклила, имеющего от 5 до 8 атомов в кольце, и из этих атомов от 1 до 4 являются гетероатомами, выбранными из N, О и S; гало; гидроксила; галогенированного алкила; амино; алкиламино; ариламино; ацила; амидо; CN; NO2; N3; СН2ОН; CONH2; CONR24R25; CO2R24; CH2OR24; NHCOR24; NHCO2R24; C1-3 алкилтио; сульфата; сульфоновой кислоты; эфиров сульфокислот; фосфоновой кислоты; фосфата; фосфоната; моно-, ди- или трифосфатных эфиров; тритила; монометокситритила; R24SO; R24SO2; CF3S; CF3SO2; и триалкилсилила; где R24 и R25 каждый независимо выбран из Н и С1-10 алкила; и R5 выбран из группы, состоящей из водорода, гало, циано, амида, сульфонамида, ацила, гидроксила, C1-C6 алкила, С1-С6-галоалкила, С3-С5 циклоалкила и С1-С6 алкокси, все из которых могут быть необязательно замещены, по необходимости, гало, циано или C1-С6 алкокси, проявляющим полезную активность в ингибировании активации инфламмасомы NLRP3.

Настоящее изобретение относится к бензо-N-гидроксиамидным соединениям формулы (I), их фармацевтически приемлемым солям или изомерам, обладающим ингибирующей активностью в отношении пролиферации опухолевых клеток, а также к фармацевтической композиции на их основе. Соединения могут найти применение для лечения опулевых заболеваний, в частности колоректального рака или гематологических злокачественных заболеваний.

Изобретение относится к области органической химии, а именно к неконденсированным производным пиридина формулы Ib-iii и к его фармацевтически приемлемой соли или дейтерированному производному любого из них, где кольцо B представляет собой C6-C10 арильное кольцо или C3-C10 гетероарильное или гетероциклическое кольцо, в котором какой-либо из от 1 до 4 атомов кольца необязательно представляет собой O, S, N или NR; кольцо C представляет собой C3-C14 гетероарильное или гетероциклическое кольцо, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой N, O или S, и где один атом азота на кольце C является точкой присоединения к пиридиновому кольцу; и R1 представляет собой галоген; CN; F5S; SiR3; OH; NRR; C1-C6 алкил или фторалкил; C1-C6 алкокси или фторалкокси; C2-C6 алкенил; C2-C6 алкинил; (C1-C9 алкилен)-R4, где до четырех звеньев СН2 независимо заменены на O, CO, S, SO, SO2 или NR; C6-C10 арил; C3-C10 гетероарильное или гетероциклическое кольцо, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой О, S, N или NR; или C3-C10 циклоалкил; R2 представляет собой галоген; OH; NRR; азид; CN; CO2R; C1-C6 алкил или фторалкил; C1-C6 алкокси или фторалкокси; C2-C6 алкенил; C2-C6 алкинил; C6-C10 арил; C3-C13 гетероарильное или гетероциклическое кольцо, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой О, S, N или NR; C3-C10 циклоалкил; или (C1-C9 алкилен)-R4, где до четырех звеньев СН2 независимо заменены на O, CO, S, SO, SO2 или NR; или две группы R2, взятые вместе, могут образовывать группу =CH2 или =O; R3 представляет собой галоген; CN; CO2R; C1-C6 алкил или фторалкил; C2-C6 алкенил; C2-C6 алкинил; C1-C6 алкокси или фторалкокси; или C6-C10 арил; C3-C10 гетероарильное или гетероциклическое кольцо, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой О, S, N или NR; C3-C10 циклоалкил; или (C1-C9 алкилен)-R4, где до четырех звеньев СН2 независимо заменены на O, CO, S, SO, SO2 или NR; или две группы R3, взятые вместе, могут образовывать группу =CH2 или =O; R4 представляет собой H; азид; CF3; CHF2; OR; CCH; CO2R; OH; C6-C10 арил, C3-C10 гетероарил или гетероциклоалкил, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой О, S, N или NR; C3-C10 циклоалкил; NRR, NRCOR, CONRR, CN, галоген или SO2R; R независимо представляет собой H; OH; CO2H; CO2C1-C6 алкил; C1-C6 алкил; C2-C6 алкенил; C2-C6 алкинил; C6-C10 арил; C3-C10 гетероарил или гетероциклоалкил, в котором любые из от 1 до 4 кольцевых атомов независимо представляют собой О, S, N или NR; или C3-C10 циклоалкил; n и p равно 0, 1, 2 или 3; q равно 0, 1, 2, 3, 4 или 5; где каждая из конкретных групп для переменных R1-R4 необязательно может быть замещена одной или несколькими группами, выбранными из галогена, фосфо, OH, циклоалкила, гетероциклоалкила, арила, гетероарила, фторалкила, алкила, алкенила, алкинила, нитро, CN, гидроксила и (C1-C9 алкилен)-E, где до 4 звеньев CH2 независимо заменены на O, S, SO2, SO, CO, NH, N-алкил, N-алкенил или N-алкинил, и E представляет собой H, арил, циклоалкил, гетероциклоалкил, гетероарил, алкокси, CN или CF3, кроме того, где каждый из арила, циклоалкила, гетероциклоалкила и гетероарила необязательно замещен одной или несколькими группами, выбранными из галогена, алкила, амино, CN, алкенила, алкинила и алкокси; и когда две алкокси группы связаны с одним и тем же атомом или соседними атомами, две алкокси группы могут образовывать кольцо вместе с атомом(ами), с которым(ми) они связаны; и где «амино» относится к группе NH2, которая необязательно замещена одной или двумя группами, независимо выбранными из алкила, циклоалкила и гетероциклоалкила.

Изобретение относится к ветеринарии. Способ лечения неоперабельного плоскоклеточного рака ротовой полости у кошек включает пероральное введение 1 раз в день ежедневно с интервалом 22-26 часов пожизненно Петкам в дозе 0,05-0,2 мг/кг веса тела животного.
Наверх