Снижение табак-специфичных нитрозаминов в растениях



Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
Снижение табак-специфичных нитрозаминов в растениях
C12N15/8218 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2735254:

ФИЛИП МОРРИС ПРОДАКТС С.А. (CH)

Изобретение относится к области биохимии, в частности к мутантной растительной клетке табака для снижения уровней нитратов в мутантном растении табака, а также к растению табака, его части, растительному материалу табака, а также к табачной композиции, содержащей вышеуказанную клетку. Также раскрыт способ снижения содержания нитратов, по меньшей мере, в части растения табака, включающий введения в геном растения табака одной или несколько мутаций в пределах, по меньшей мере, одного аллеля члена семейства CLC хлоридных каналов, а также способ получения высушенного растительного материала табака, предпочтительно высушенных листьев, со сниженными в нем уровнями 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанона (NNK). Изобретение также относится к полинуклеотидной конструкции для снижения уровней нитратов в растении табака, а также к вектору для снижения уровней нитратов в растении табака, содержащему вышеуказанную конструкцию. Изобретение позволяет эффективно получать растение табака со сниженными уровнями нитратов. 9 н. и 4 з.п. ф-лы, 6 ил., 2 табл., 9 пр.

 

ОБЛАСТЬ ТЕХНИКИ

В настоящем изобретении раскрыты новые полинуклеотидные последовательности генов, кодирующих членов семейства CLC хлоридных каналов из растений рода Nicotiana, и их варианты, гомологи, фрагменты и мутанты. Также раскрыты полипептидные последовательности и их варианты, гомологи, фрагменты и мутанты. Также раскрыта модификация экспрессии одного или нескольких из этих генов или активности белка, кодируемого ими, для модулирования уровней табак-специфичных нитрозаминов (TSNA) в растении или его составной части.

УРОВЕНЬ ТЕХНИКИ

Табак-специфичные нитрозамины (TSNA) образуются главным образом во время сушки и первичной переработки табачных листьев. Сушка табака представляет собой процесс физических и биохимических изменений, которые выявляют аромат и вкус каждой разновидности табака. Считается, что количество TSNA в высушенном табачном листе зависит от накопления нитритов, которые накапливаются во время смерти растительной клетки и образуются во время сушки при восстановлении нитратов в приближающихся к анаэробным (дефицит кислорода) условиях окружающей среды. Восстановление нитратов до нитритов, как полагают, происходит под действием бактерий на поверхности листа в анаэробных условиях, и это восстановление особенно выражено при определенных условиях. После того, как образуются нитриты, эти соединения, как полагают, соединяются с различными алкалоидами табака, в том числе, пиридин-содержащими соединениями, с образованием нитрозаминов.

Четыре основных TSNA, то есть те, присутствие которых, как правило, обнаруживается в самых высоких концентрациях, это N-нитрозоникотин (NNN); 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK), N-нитрозоанабазин (NAB) и N-нитрозоанатабин (NAT). Второстепенные соединения, то есть те, которые, как правило, обнаруживаются на значительно более низких уровнях, чем основные TSNA, включают в себя 4-(метилнитрозамино)-4-(3-пиридил)бутаналь (NNA), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанол (NNAL), 4-(метилнитрозамино)-4-(3-пиридил)-1-бутанол (изо-NNAL) и 4-(метилнитрозамино)-4-(3-пиридил)-1-масляную кислоту (изо-NNAC). Сообщалось, что по меньшей мере NNN и NNK являются канцерогенными при применении в отношении животных в лабораторных исследованиях.

Снижение концентрации соединений, ответственных за нитрозирование алкалоидов до TSNA, может привести к снижению уровня TSNA в высушенных листьях. Основным нитрозирующим средством в табачных листьях является нитрит (NO2-), образуемый в результате восстановления свободного нитрата (NO3-) в ферментативной реакции, возможно, катализируемой бактериями во время сушки. Исследования с использованием удобрений, изменяющих уровни нитрата в растениях табака Burley, приводили к различным уровням TSNA в высушенных листьях и дыме. Нитраты являются основным источником азота, доступным в почве. В растениях они поглощаются эпидермальными клетками корней и транспортируются по всему растению, первоначально, с восстановлением до нитритов, которые в дальнейшем восстанавливаются до аммиака и затем ассимилируются в аминокислотах. К сожалению, ограничение азота во время роста табака Burley приводит к неблагоприятным агрономическим фенотипам, таким как низкий выход биомассы и задержка созревания растений и, следовательно, не является коммерчески выгодным подходом к снижению уровней TSNA. Попытка управлять накоплением нитратов в табачном листе представляет собой серьезную проблему.

В WO 98/58555 описана обработка табачных листьев до или во время дымовой сушки в микроволновой печи для снижения TSNA. В патенте США №5810020 описан способ удаления TSNA из табака путем контакта табачного материала с улавливающим поглотителем, где улавливающий поглотитель содержит выбранный комплекс переходного металла, который легко нитрозируется с образованием нитрозильного комплекса с небольшим кинетическим или термодинамическим барьером. В патенте США №6202649 описан способ по существу предотвращения образования TSNA путем, среди прочего, сушки табака в контролируемой среде, имеющей достаточный воздушный поток, чтобы по существу предотвратить анаэробные условия в непосредственной близости от табачного листа. Контролируемую среду обеспечивают путем управления одним или несколькими параметрами сушки, такими как воздушный поток, влажность и температура. Однако такие способы, как эти, могут добавить значительную стоимость и время к производству табака и, следовательно, с меньшей вероятностью будут приняты в табачной промышленности. Таким образом, остается потребность в эффективном и относительно недорогом способе снижения TSNA.

Молекулярные способы снижения уровней TSNA в растениях весьма желательны, поскольку они не требуют дорогих и зачастую комплексных способов для достижения сниженных уровней TSNA. Один из таких молекулярных подходов раскрыт в WO 2011/088180. Раскрыты композиции и способы для ингибирования экспрессии или функции полипептидов корень-специфической никотиндеметилазы, которые участвуют в метаболическом превращении никотина в норникотин в корнях растений табака. Раскрыта генная последовательность гена никотиндеметилазы CYP82E10. Было обнаружено, что снижение экспрессии этого гена снижает уровни NNN в высушенных табачных листьях. Хотя могут быть получены сниженные уровни NNN, существует более чем один TSNA, являющийся, как сообщалось, канцерогенным, который все еще останется в модифицированных растениях. Другие гены никотиндеметилазы включают в себя CYP82E4 и CYP82E5, которые участвуют в превращении никотина в норникотин и описаны в WO 2006091194, WO 2008070274 и WO 2009064771.

Существует постоянная потребность в данной области в разработке молекулярных стратегий для снижения уровней TSNA в высушенных табачных листьях. Настоящее изобретение направлено на решение этой потребности.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Авторы настоящего изобретения клонировали новые гены, кодирующие различных членов семейства CLC хлоридных каналов из растений, принадлежащих к роду Nicotiana, и обозначили как CLC-Nt2 и NtCLCe. Две копии ортологичного гена, происходящего от двух предков, N.tomentosiformis и N.sylvestris, встречаются в Nicotiana tabacum и обозначены в данном документе как CLC-Nt2-t и CLC-Nt2-s или NtCLCe-t и NtCLCe-s, соответственно. Полинуклеотидные последовательности этих генов изложены в SEQ ID NO: 1-4, 10 и 11 и полипептидные последовательности этих генов изложены в SEQ ID NO: 5-7 и 12-14. При снижении экспрессии этих генов в растениях табака обнаружено снижение уровня нитратов в растениях. В частности, обнаружено снижение уровня нитратов в зеленых листьях. Общее содержание TSNA после сушки листьев у этих растений снижено. Это означает, что низкие уровни нитратов могут вызвать образование более низких уровней TSNA в высушенном растительном материале, таком как высушенные листья. Авторы настоящего изобретения неожиданно обнаружили, что снижение по меньшей мере NNK обнаружено в высушенном растительном материале растений как NtCLCe-RNAi, так и CLC-Nt2-RNAi. Наблюдалось также снижение общего содержания TSNA. Снижение экспрессии NtCLCe и/или CLC-M2, таким образом, способствует снижению уровня нитратов в табачных листьях. После сушки может снизиться по меньшей мере NNK и, необязательно, другие TSNA, которые могут включать в себя NNN, или NAB, или NAT, или комбинацию двух или более из них. Кроме того, внешний вид растений по существу не изменен, что является важным критерием для принятия промышленностью и для максимизации урожайности растений и тому подобного. Кроме того, уровни биомассы по существу не изменены, что является еще одним важным критерием для принятия промышленностью и для максимизации урожайности растений и тому подобного. Настоящее изобретение может, таким образом, быть особенно полезным для модулирования (например, увеличения или уменьшения) уровня нитратов или общих TSNA в растениях, включая по меньшей мере NNK. В частности, настоящее изобретение может быть особенно полезным в комбинации с другими способами, которые способны снизить уровни TSNA. Таким образом, может быть желательно в некоторых вариантах осуществления снизить экспрессию одного или нескольких полинуклеотидов, описанных в данном документе, вместе со снижением экспрессии одного или нескольких генов никотиндеметилазы в растении табака. Эта комбинация, как ожидается, будет снижать уровни по меньшей мере NNK и NNN в высушенном растительном материале, что будет весьма желательно, поскольку сообщалось, что как NNK, так и NNN являются канцерогенными при применении у животных в лабораторных исследованиях. Табачные изделия, полученные из растений табака, описанных в данном документе, могут найти применение в способах для снижения потенциала канцерогенности этих табачных изделий и снижения воздействия на человека канцерогенных нитрозаминов. Мутанты полипептидных последовательностей, описанных в данном документе, которые могут модулировать содержание нитратов в растениях, также описаны.

АСПЕКТЫ И ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ

Аспекты и варианты осуществления настоящего изобретения изложены в прилагаемой формуле изобретения.

В первом аспекте описана мутантная, не встречающаяся в природе или трансгенная растительная клетка, содержащая: (i) полинуклеотид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептид, кодируемый полинуклеотидом, изложенным в (i); (iii) полипептид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; или (iv) конструкцию, вектор или вектор экспрессии, содержащий выделенный полинуклеотид, изложенный в (i), и где экспрессию или активность полинуклеотида или полипептида модулируют по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, модулируют по сравнению с контрольным растением, содержащим контрольную растительную клетку. Путем снижения экспрессии одного или нескольких генов в растениях табака могут быть снижены уровни нитратов. Общее содержание TSNA и/или уровни NNK могут быть снижены в высушенном растительном материале.

В одном варианте осуществления указанная мутантная, не встречающаяся в природе или трансгенная растительная клетка содержит одну или несколько мутаций в раскрытых полипептидах и полинуклеотидах, которые снижают уровень нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку. Мутация (мутации) может включать в себя мутацию по типу замены в положении G163 из SEQ ID NO: 5.

В одном варианте осуществления указанная мутантная, не встречающаяся в природе или трансгенная растительная клетка содержит одну или несколько мутаций в раскрытых полипептидах и полинуклеотидах, которые увеличивают уровень нитратов в мутантном, не встречающемся в природе или трансгенном растении, содержащем мутантную, не встречающуюся в природе или трансгенную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку. Мутация (мутации) может включать в себя мутацию по типу замены в положении Р143 из SEQ ID NO: 13.

В дополнительном аспекте описано мутантное, не встречающееся в природе или трансгенное растение или его составная часть, содержащая растительную клетку, описанную в данном документе.

В дополнительном аспекте описан способ модулирования содержания по меньшей мере нитратов (например, 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK)) в растении или его составной части, включающий этапы: (а) модулирования экспрессии или активности: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; (b) измерение содержания по меньшей мере нитратов (например, NNK) по меньшей мере в части мутантного, не встречающегося е природе или трансгенного растения, полученного на этапе (а); и (с) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание по меньшей мере нитратов (например, NNK) изменено по сравнению с контрольным растением, в котором экспрессию или активность полинуклеотида или полипептида, изложенного в (а), не модулировали.

В дополнительном аспекте описан способ модулирования содержания по меньшей мере нитратов (например, 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK)) в растении или его составной части, включающий этапы: (а) модулирования экспрессии или активности: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; (b) измерение содержания по меньшей мере нитратов (например, NNK) по меньшей мере в части мутантного, не встречающегося в природе или трансгенного растения, полученного на этапе (а); и (с) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание по меньшей мере нитратов (например, NNK) изменено по сравнению с контрольным растением, в котором экспрессию или активность полинуклеотида или полипептида, изложенного в (а), не модулировали.

Соответственно, содержание нитратов например, NNK) и/или общее содержание TSNA и/или содержание никотина модулируют в растении, таком как высушенный растительный материал.

Соответственно, содержание NNN является по существу таким же, как в контрольном растении.

Соответственно, составная часть растения представляет собой лист, соответственно, высушенный лист или высушенный табак.

В дополнительном аспекте описано растение или его составная часть, полученная или получаемая способами, описанными в данном документе.

В дополнительном аспекте описано мутантное, не встречающееся в природе или трансгенное растение, в котором содержание NNK составляет приблизительно 110 нг/г или менее, необязательно, где содержание нитратов составляет приблизительно 7 мг/г или менее. Соответственно, растение находится в виде высушенного растительного материала.

В дополнительном аспекте описано мутантное растение, в котором содержание нитратов составляет приблизительно 6 мг/г или менее и содержание никотина составляет приблизительно 13 мг/г или менее.

Соответственно, экспрессию: (i) полинуклеотида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептида, кодируемого полинуклеотидом, изложенным в (i); или (iii) полипептида, содержащего, состоящего или состоящего по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 модулируют по сравнению с контрольным растением.

В дополнительном аспекте описан растительный материал, в том числе биомасса, семена, стебли или листья растений, описанных в данном документе.

В дополнительном аспекте описано табачное изделие, содержащее растительную клетку, по меньшей мере часть растения или растительный материал, описанный в данном документе.

В дополнительном аспекте описан способ получения высушенного растительного материала, такого как листья, со сниженными уровнями NNK в них, включающий этапы: (а) обеспечения по меньшей мере части растения или растительного материала, описанного в данном документе; (b) необязательно, сбор растительного материала с растения и (с) сушку растительного материала в течение периода времени, достаточного для снижения в нем по меньшей мере уровней NNK.

В дополнительном аспекте описан выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 99,1% идентичности последовательности с SEQ ID NO: 1, или 97,1% идентичности последовательности с SEQ ID NO: 2, или 63% идентичности последовательности с SEQ ID NO: 3, или 61% идентичности последовательности с SEQ ID NO: 4, или 60% идентичности последовательности с SEQ ID NO: 10, или 60% идентичности последовательности с SEQ ID NO: 11.

В дополнительном аспекте описан выделенный полипептид, кодируемый полинуклеотидом(-ами), описанным в данном документе.

В дополнительном аспекте описан выделенный полипептид, содержащий, состоящий или состоящий по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 99,1% идентичности последовательности с SEQ ID NO: 5, или по меньшей мере 98,1% идентичности последовательности с SEQ ID NO: 6, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 7, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 12, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 13, или по меньшей мере 60% идентичности последовательности с SEQ ID NO: 14.

В дополнительном аспекте описана конструкция, вектор или вектор экспрессии, содержащий один или более выделенных полинуклеотидов, описанных в данном документе.

В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций в: (i) полинуклеотиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептиде, кодируемом полинуклеотидом, изложенным в (i); или (iii) полипептиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; и где указанная одна или несколько мутаций модулируют экспрессию или активность полинуклеотида или полипептида по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном растении, содержащем мутантную растительную клетку, модулируют по сравнению с контрольным растением.

В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций в: (i) полинуклеотиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11; (ii) полипептиде, кодируемом полинуклеотидом, изложенным в (i); или (iii) полипептиде, содержащем, состоящем или состоящем по существу из последовательности, кодирующей член семейства CLC хлоридных каналов, и имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14; и где указанная одна или несколько мутаций модулируют экспрессию или активность полинуклеотида или полипептида по сравнению с контрольным растением, содержащим контрольную растительную клетку, и где уровни нитратов в мутантном растении, содержащем мутантную растительную клетку, модулируют по сравнению с контрольным растением.

В дополнительном аспекте обеспечен способ снижения канцерогенного потенциала табачного изделия, при этом указанный способ включает получение указанного табачного изделия из растения табака или части растения или его потомства, как описано в данном документе.

В дополнительном аспекте описано использование конструкции, описанной в данном документе, в способе изготовления растений, имеющих модулированные уровни нитратов и/или NNK и/или общих TSNA относительно контрольного растения.

В дополнительном аспекте описано использование полинуклеотида или полипептида, описанного в данном документе, для модулирования уровней нитратов и/или NNK и/или общих TSNA в растении относительно контрольного растения.

В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций, которые уменьшают уровень нитратов в мутантном растении, содержащем мутантную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку, где указанная мутация (мутации) включает в себя мутацию по типу замены в положении G163 из SEQ ID NO: 5.

В дополнительном аспекте описана мутантная растительная клетка, содержащая одну или несколько мутаций, которые уменьшают уровень нитратов в мутантном растении, содержащем мутантную растительную клетку, по сравнению с контрольным растением, содержащим контрольную растительную клетку, где указанная мутация (мутации) включает в себя мутацию по типу замены в положении Р143 из SEQ ID NO: 13.

В дополнительном аспекте раскрыта полипептидная последовательность, содержащая или состоящая из последовательности, изложенной в SEQ ID NO: 5, с мутацией по типу замены в положении G163, соответственно, G163R.

В дополнительном аспекте раскрыта полипептидная последовательность, содержащая или состоящая из последовательности, изложенной в SEQ ID NO: 13, с мутацией по типу замены в положении Р143, соответственно, P143L.

В дополнительном аспекте мутантные полипептиды, как описано в данном документе, раскрыты.

Каждый из вариантов осуществления, обсуждаемых выше, раскрыт в виде вариантов осуществления каждого из аспектов настоящего изобретения. Предполагаются комбинации одного или нескольких вариантов осуществления.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фигура 1: Полуколичественная ПЦР в реальном времени трех представителей линий NtCLCe-RNAi (дорожки 1, 2 и 3), wt (дорожки 4, 5 и 6) и линий CLC-Nt2-RNAi (дорожки 7, 8 и 9), показывающая экспрессию транскриптов тубулина (ген «домашнего хозяйства»), NtCLCe и CLC-Nt2.

Фигура 2: Анализ уровня никотина и нитратов в зеленых листьях растений wt (n=11), NtCLCe-RNAi (n=5) и CLC-Nt2-RNAi (n=5) (А); общее содержание TSNA в соответствующих листьях после процесса теневой сушки. В этом эксперименте растения выращивали в 3-литровых горшках, и самое высокое общее значение TSNA соответствует 200 нг/г.

Фигура 3: Анализ уровня никотина, нитратов в зеленых листьях (А), вес листьев (В) и количество листьев (С) растений wt (n=4), NtCLCe-RNAi и CLC-Nt2-RNAi (n=8), лишенных одновременно транскриптов CLC-Nt2 и NtCLCe (линии CLC-RNAi). Листья собрали через 10 недель роста в 10-литровых горшках в контролируемых тепличных условиях. В данном эксперименте максимальные значения для никотина и нитратов составили 29,6 и 6,4 мг/г, соответственно.

Фигура 4: Процентное содержание NNK в листьях теневой сушки растений wt, NtCLCe-RNAi и CLC-Nt2-RNAi после выращивания в 10-литровых горшках, как показано на Фигуре 3. В данном эксперименте самое высокое значение NNK соответствовало 108 нг/г.

Фигура 5: Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных растений G163R CLCNt2-s. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений G163R CLCNt2-s (треугольник) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре. Раннее утро = 8:00-9:00; середина утра = 9:30-10:30; позднее утро = 11:00-12:00.

Фигура 6: Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных растений P143L NtCLCe-t. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений P143L NtCLCe-t (квадрат) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре. Раннее утро = 8:00-9:00; середина утра = 9:30-10:30; позднее утро = 11:00-12:00.

ОПРЕДЕЛЕНИЯ

Техническим терминам и выражениям, используемым в пределах объема данной заявки, следует придавать значение, которое обычно применяется к ним е данной области биологии растений и молекулярной биологии. Все нижеследующие определения терминов применяют ко всему содержанию данной заявки. Слово «содержащий» не исключает другие элементы или этапы и неопределенный артикль не исключает множество. Один этап может выполнять функции нескольких признаков, определенных в формуле изобретения. Термины «приблизительно», «по существу» и «примерно» в контексте данного цифрового значения или диапазона относятся к значению или диапазону, который находится в пределах 20%, в пределах 10%, или в пределах 5%, 4%, 3%, 2% или 1% от заданного значения или диапазона.

Термин «выделенный» относится к любому объекту, который взят из его естественной среды, но этот термин не подразумевает какой-либо степени очистки.

«Вектор экспрессии» представляет собой средство доставки нуклеиновой кислоты, которое содержит комбинацию компонентов нуклеиновой кислоты для обеспечения экспрессии нуклеиновой кислоты. Подходящие векторы экспрессии включают в себя эписомы, способные к экстра-хромосомной репликации, такие как кольцевые плазмиды из двухцепочечной нуклеиновой кислоты; линеаризованные плазмиды из двухцепочечной нуклеиновой кислоты и другие функционально эквивалентные векторы экспрессии любого происхождения. Вектор экспрессии содержит по меньшей мере промотор, расположенный выше по цепи и функционально связанный с нуклеиновой кислотой, конструкции нуклеиновых кислот или конъюгат нуклеиновых кислот, как определено ниже.

Термин «конструкция» относится к двухцепочечному фрагменту рекомбинантной нуклеиновой кислоты, содержащему один или несколько полинуклеотидов. Конструкция содержит «матричную цепь», основания которой спарены с комплементарной «смысловой или кодирующей цепью». Данная конструкция может быть встроена в вектор в двух возможных ориентациях, либо в той же (или смысловой) ориентации, или в обратной (или антисмысловой) ориентации по отношению к ориентации промотора, расположенного в векторе, таком как вектор экспрессии.

«Вектор» относится к средству доставки нуклеиновой кислоты, которое содержит комбинацию компонентов нуклеиновой кислоты для обеспечения транспорта нуклеиновой кислоты, конструкций нуклеиновых кислот и конъюгатов нуклеиновых кислот и тому подобного. Подходящие векторы включают в себя эписомы, способные к экстра-хромосомной репликации, такие как кольцевые плазмиды из двухцепочечной нуклеиновой кислоты; линеаризованные плазмиды из двухцепочечной нуклеиновой кислоты и другие векторы любого происхождения.

«Промотор» относится к элементу/последовательности нуклеиновой кислоты, как правило расположенной выше по цепи и функционально связанной с фрагментом двухцепочечной ДНК. Промоторы могут быть получены целиком из областей вблизи нативного представляющего интерес гена, или могут состоять из разных элементов, полученных из различных нативных промоторов или сегментов синтетической ДНК.

Термины «гомология, идентичность или сходство» относятся к степени сходства последовательностей между двумя полипептидами или между двумя молекулами нуклеиновых кислот, сравниваемых путем выравнивания последовательностей. Степень гомологии между двумя отдельными сравниваемыми последовательностями нуклеиновых кислот является функцией количества идентичных или совпадающих нуклеотидов в сопоставимых положениях. Процент идентичности может быть определен путем визуального осмотра и математических расчетов. В качестве альтернативы, процент идентичности двух последовательностей нуклеиновых кислот можно определить путем сравнения информации о последовательностях с использованием компьютерной программы, такой как ClustalW, BLAST, FASTA или Smith-Waterman. Можно использовать параметры по умолчанию для данных программ.

Термин «растение» относится к любому растению на любой стадии его жизненного цикла или развития и его потомству. В одном варианте осуществления растение представляет собой «растение табака», которое относится к растению, принадлежащему к роду Nicotiana. Предпочтительные виды растения табака описаны в данном документе.

«Растительная клетка» относится к структурной и физиологической единице растения. Растительная клетка может находиться в виде протопласта без клеточной стенки, выделенной отдельной клетки или культивируемой клетки, или как часть более организованной единицы, такой как, помимо прочего, растительная ткань, растительный орган или целое растение.

Термин «растительный материал» относится к любой твердой, жидкой или газообразной композиции, или их комбинации, получаемой из растения, включая биомассу, листья, стебли, корни, цветки или части цветка, плоды, пыльцу, яйцеклетки, зиготы, семена, черенки, секреты, экстракты, клеточные или тканевые культуры, или любые другие части или продукты растения. В одном варианте осуществления растительный материал содержит или состоит из биомассы, стеблей, семян или листьев. В другом варианте осуществления растительный материал содержит или состоит из листьев.

Термин «разновидность» относится к популяции растений, которые разделяют постоянные характеристики, отделяющие их от других растений того же вида. Имея один или несколько отличительных признаков, разновидность дополнительно характеризуется очень небольшим общим варьированием между особями в пределах этой разновидности. Разновидность часто продается на коммерческой основе.

Термин «линия» или «линия разведения», используемый в данном документе, обозначает группу растений, которые используют во время селекции растений. Линия отличается от разновидности, поскольку демонстрирует небольшую вариабельность между особями по одному или нескольким представляющим интерес признакам, хотя может присутствовать некоторая вариабельность между особями по другим признакам.

Термин «модулирование» может относиться к снижению, ингибированию, увеличению или иному влиянию на экспрессию или активность полипептида. Этот термин может также относиться к снижению, ингибированию, увеличению или иному влиянию на активность гена, кодирующего полипептид, которое может включать в себя, помимо прочего, модулирование транскрипционной активности.

Термин «снижение» или «сниженный», используемый в данном документе, относится к снижению от приблизительно 10% до приблизительно 99%, или снижению от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100% или более от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.

Термин «ингибировать» или «ингибирование», используемый в данном документе, относится к снижению от приблизительно 98% до приблизительно 100%, или снижению от по меньшей мере 98%, по меньшей мере 99%, но в особенности 100% от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.

Термин «увеличение» или «увеличенный», используемый в данном документе, относится к увеличению от приблизительно 5% до приблизительно 99%, или увеличению от по меньшей мере 5%, по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, или по меньшей мере 100% или более от количества или активности, такой как, помимо прочего, полипептидная активность, транскрипционная активность и экспрессия белка.

Термин «контроль» в контексте контрольного растения означает растение или растительную клетку, в которой не была модифицирована экспрессия или активность фермента (например, увеличена или снижена), и поэтому он может обеспечить сравнение с растением, в котором была модифицирована экспрессия или активность фермента. Контрольное растение может содержать пустой вектор. Контрольное растение или растительная клетка может соответствовать растению дикого типа или растительной клетке дикого типа.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В одном варианте осуществления предусмотрен выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из полинуклеотидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с любой из последовательностей, описанных в данном документе, включая любой из полинуклеотидов, показанный в списке последовательностей. Соответственно, выделенный полинуклеотид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% или 100% идентичности последовательности с ним.

В другом варианте осуществления предусмотрен выделенный полинуклеотид, содержащий, состоящий или состоящий по существу из полинуклеотидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с SEQ ID NO: l, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11. Соответственно, выделенный полинуклеотид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрены полинуклеотиды, содержащие, состоящие или состоящие по существу из полинуклеотидов со значительной гомологией (то есть, сходством последовательности) или значительной идентичностью с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрены полинуклеотидные варианты, которые имеют по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8% или 99,9% идентичности последовательности с последовательностью SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрены фрагменты SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 и фрагменты SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 со значительной гомологией (то есть, сходством последовательности) или значительной идентичностью с ними, которые имеют по меньшей мере приблизительно 60%, 61%, 62%, 63%, 64%, 65%, 66%, 61%, 68%, 69%, 70%, 15%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с соответствующими фрагментами из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрены полинуклеотиды, содержащие достаточную или значительную степень идентичности или сходства с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11, которые кодируют полипептид, функционирующий в качестве члена семейства CLC хлоридных каналов.

В другом варианте осуществления предусмотрен полимер из полинуклеотидов; который содержит, состоит или состоит по существу из полинуклеотида, обозначенного в данном документе как SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

Соответственно, полинуклеотиды, описанные в данном документе, кодируют членов семейства CLC хлоридных каналов. CLC составляют семейство потенциалозависимых каналов. В растениях хлоридные каналы способствуют ряду специфических растительных функций, таких как регуляция тургора, устьичное движение, перенос питательных веществ и/или устойчивость к металлам и тому подобное. Нитрат/протонный антипортер AtCLCa опосредует накопление нитратов в растительных вакуолях (см. Nature (2006) 442 (7105): 939-42). В данной публикации показано, что AtClCa функционирует как обменник 2NO3-/1H+, который способен накапливать нитраты в вакуоли с использованием электрофизиологических подходов. Подобный подход можно использовать при испытании активности транспорта нитратов у CLC-Nt2. Solute transporters in plant thylakoid membranes: Key players during photosynthesis and light stress by Spetea C, Schoefs B. Communicative & Integrative Biology. 2010; 3(2)122-129 and Monachello et al, New Phytol. 2009; 183(1): 88-94 раскрывают, что AtClCe no прогнозам будет участвовать в транслокации нитритов из стромы в просвет тилакоида, перенимая их от транспортера нитритов оболочки хлоропластов. Способы, описанные там для измерения этой активности, можно использовать для измерения активности NtCLCe.

Комбинации из SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11 также предполагаются. Эти комбинации включают в себя различные комбинации из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11, включая комбинацию SEQ ID NO: 1 и SEQ ID NO: 2; комбинацию SEQ ID NO: 1 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1 и SEQ ID NO: 10; комбинацию SEQ ID NO: 1 и SEQ ID NO: 11; комбинацию SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 2 и SEQ ID NO: 4; комбинацию SEQ ID NO: 2 и SEQ ID NO: 10; комбинацию SEQ ID NO: 2 и SEQ ID NO: 11; комбинацию SEQ ID NO: 3 и SEQ ID NO: 4, комбинацию SEQ ID NO: 3 и SEQ ID NO: 10; комбинацию SEQ ID NO: 3 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1, SEQ ID NO: 3 и SEQ ID NO: 4; комбинацию SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; или комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 3 SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 10 и SEQ ID NO: 11; комбинацию SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 и SEQ ID NO: 4; или комбинацию SEQ ID NO: 1, SEQ ID NO: 2 и SEQ ID NO: 3 и т.д.

Полинуклеотид, описанный в данном документе, может включать в себя полимер нуклеотидов, который может быть немодифицированной или модифицированной дезоксирибонуклеиновой кислотой (ДНК) или рибонуклеиновой кислотой (РНК). Соответственно, полинуклеотид может быть, без ограничения, геномной ДНК, комплементарной ДНК (кДНК), иРНК или антисмысловой РНК или их фрагментом(-ами). Кроме того, полинуклеотид может быть одноцепочечной или двухцепочечной ДНК, ДНК, которая является смесью одноцепочечных и двухцепочечных областей, гибридной молекулой, содержащей ДНК и РНК, или гибридной молекулой со смесью одноцепочечных и двухцепочечных областей или их фрагментом(-ами). Кроме того, полинуклеотид может быть составлен из трехцепочечных областей, содержащих ДНК, РНК или обе, или их фрагмент(ы). Полинуклеотид может содержать одно или несколько модифицированных оснований, таких как фосфотиоаты, и может представлять собой пептидную нуклеиновую кислоту. Как правило, полинуклеотиды могут быть собраны из выделенных или клонированных фрагментов кДНК, геномной ДНК, олигонуклеотидов или отдельных нуклеотидов, или комбинации вышеперечисленного. Хотя полинуклеотидные последовательности, описанные в данном документе, представлены в виде последовательностей ДНК, последовательности включают в себя их соответствующие последовательности РНК и их комплементарные (например, полностью комплементарные) последовательности ДНК или РНК, в том числе, их обратно комплементарные цепи.

Полинуклеотид, описанный в данном документе, обычно содержит фосфодиэфирные связи, хотя в некоторых случаях включены полинуклеотидные аналоги, которые могут иметь альтернативные основы, содержащие, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи; и пептидные полинуклеотидные основы и связи. Другие аналоги полинуклеотидов включают в себя полинуклеотиды с положительно заряженными основами, неионными основами и безрибозными основами. Модификации рибозо-фосфатной основы можно сделать по целому ряду причин, например, для увеличения стабильности и периода полураспада таких молекул в физиологических средах или в качестве зондов на биочипе. Можно изготовить смеси природных полинуклеотидов и аналогов; в качестве альтернативы, можно изготовить смеси разных полинуклеотидных аналогов и смеси природных полинуклеотидов и аналогов.

Известно множество полинуклеотидных аналогов, включая, например, фосфороамидатные, фосфоротиоатные, фосфородитиоатные или О-метилфосфороамидитные связи и пептидные полинуклеотидные основы и связи. Другие аналоги полинуклеотидов включают в себя полинуклеотиды с положительно заряженными основами, неионными основами и безрибозными основами. Полинуклеотиды, содержащие один или несколько

карбоциклических Сахаров, также включены.

Другие аналоги включают в себя пептидные полинуклеотиды, которые представляют собой пептидные полинуклеотидные аналоги. Эти основы являются по существу неионными в нейтральных условиях в отличие от высоко заряженной фосфодиэфирной основы природных полинуклеотидов. Это может привести к преимуществам. Во-первых, пептидная полинуклеотидная основа может проявлять улучшенную кинетику гибридизации. Пептидные полинуклеотиды имеют большие изменения температуры плавления для несоответствующих по сравнению с прекрасно соответствующими парами оснований. ДНК и РНК, как правило, проявляют 2-4°С понижения температуры плавления из-за внутреннего несоответствия. С неионной пептидной полинуклеотидной основой падение составляет ближе к 7-9°С. Подобным образом, из-за их неионной природы гибридизация оснований, присоединенных к этим основам, является относительно нечувствительной к концентрации солей. Кроме того, пептидные полинуклеотиды могут не разлагаться или разлагаться в меньшей степени клеточными ферментами, и, таким образом, могут быть более стабильными.

Среди применений раскрытых полинуклеотидов и их фрагментов находится использование фрагментов в качестве зондов в анализах с гибридизацией нуклеиновых кислот или праймеров для использования в анализах с амплификацией нуклеиновых кислот. Такие фрагменты обычно содержат по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более смежных нуклеотидов из последовательности ДНК. В других вариантах осуществления фрагмент ДНК содержит по меньшей мере приблизительно 10, 15, 20, 30, 40, 50 или 60 или более смежных нуклеотидов из последовательности ДНК. Таким образом, в одном аспекте также обеспечен способ обнаружения полинуклеотида, кодирующего член семейства CLC хлоридных каналов, включающий использование зондов или праймеров или обоих из них.

Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий описаны в Sambrook J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). Используя знания о генетическом коде в комбинации с аминокислотными последовательностями, описанными в данном документе, можно получить наборы вырожденных олигонуклеотидов. Такие олигонуклеотиды пригодны в качестве праймеров, например, в полимеразных цепных реакциях (ПЦР), с помощью которых выделяют и амплифицируют фрагменты ДНК. В определенных вариантах осуществления вырожденные праймеры можно использовать в качестве зондов для генетических библиотек. Такие библиотеки будут включать в себя, помимо прочего, библиотеки кДНК, геномные библиотеки и даже электронные библиотеки меток экспрессируемых последовательностей или ДНК. Гомологичные последовательности, выявленные этим способом, будут затем использованы в качестве зондов для идентификации гомологов последовательностей, выявленных в данном документе.

Кроме того, потенциал использования имеют полинуклеотиды и олигонуклеотиды (например, праймеры или зонды), которые гибридизируются в условиях пониженной жесткости, как правило, в условиях средней жесткости, и обычно, в условиях высокой жесткости с полинуклеотидом(-ами), описанным в данном документе. Основные параметры, влияющие на выбор условий гибридизации, и руководство для разработки подходящих условий изложены в Sambrook J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) и могут быть легко определены обычными специалистами в данной области на основе, например, длины или композиции оснований полинуклеотида.

Один из путей достижения умеренно жестких условий включает в себя использование раствора предварительного отмывания, содержащего 5х стандартный цитрат натрия, 0,5% додецилсульфата натрия, 1,0 мМ этилендиаминтетрауксусной кислоты (рН 8,0), буфера гибридизации с приблизительно 50% формамида, 6х стандартного цитрата натрия и температуры гибридизации приблизительно 55°С (или других подобных растворов гибридизации, таких как содержащий приблизительно 50% формамида с температурой гибридизации около 42°С) и условий отмывания с приблизительно 60°С в 0,5х стандартного цитрата натрия, 0,1% додецилсульфат натрия. Как правило, условия высокой жесткости определяются как условия гибридизации, как описано выше, но с отмыванием при примерно 68°С, 0,2х стандартный цитрат натрия, 0,1% додецилсульфат натрия. SSPE (1x SSPE представляет собой 0,15 М хлорида натрия, 10 мМ фосфата натрия, 1,25 мМ этилендиаминтетрауксусной кислоты, рН 7,4) может быть заменен на стандартный цитрат натрия (1х стандартный цитрат натрия представляет собой 0,15 М хлорида натрия и 15 мМ цитрата натрия) в буферах гибридизации и отмывания; омывание выполняют в течение 15 минут после завершения гибридизации. Следует понимать, что температуру отмывания и концентрацию солей отмывания можно скорректировать по мере необходимости для достижения требуемой степени жесткости с применением основных принципов, которые регулируют реакции гибридизации и стабильность двойной спирали, как это известно специалистам в данной области и дополнительно описано ниже (см., например, Sambrook, J., Е.F. Fritsch и Т. Maniatis (1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). При гибридизации полинуклеотида с целевым полинуклеотидом с неизвестной последовательностью длина гибрида предполагается такой, как у гибридизируемого полинуклеотида. Когда гибридизируют полинуклеотиды с известными последовательностями, длина гибрида может быть определена путем выравнивания последовательностей полинуклеотидов и идентификации области или областей с оптимальной комплементарностью последовательности. Температура гибридизации для гибридов, которые предположительно составят менее чем 50 пар оснований в длину, должна быть на 5-10°С меньше, чем температура плавления гибрида, где температуру плавления определяют в соответствии со следующими уравнениями. Для гибридов менее 18 пар оснований в длину температура плавления (°С) = 2(количество оснований А+Т) + 4(количество оснований G+C). Для гибридов свыше 18 пар оснований в длину температура плавления (°С)=81,5+16,6(log10[Na+])+0,41(%G+C)-(600/N), где N - количество оснований в гибриде и [Na+] - концентрация ионов натрия в буфере гибридизации ([Na+] для 1х стандартный цитрат натрия = 0,165М). Как правило, каждый такой гибридизируемый полинуклеотид имеет длину, которая составляет по меньшей мере 25% (обычно, по меньшей мере 50%, 60% или 70%, и наиболее часто, по меньшей мере 80%) от длины полинуклеотида, с которым он гибридизируется, и имеет по меньшей мере 60% идентичности последовательности (например, по меньшей мере 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100%) с полинуклеотидом, с которым он гибридизируется.

Как будет понятно специалисту в данной области, линейная ДНК имеет две возможные ориентации: направление 5-3' и направление 3'-5'. Например, если эталонная последовательность расположена в направлении 5'-3', и если вторая последовательность расположена в направлении 5'-3' в той же полинуклеотидной молекуле/цепи, то эталонная последовательность и вторая последовательность ориентированы в одном направлении или имеют одинаковую ориентацию. Как правило, последовательность промотора и представляющий интерес ген, находящийся под контролем данного промотора, расположены в одинаковой ориентации. Однако если по отношению к эталонной последовательности, расположенной в направлении 5'-3', вторая последовательность расположена в направлении 3'-5' в той же полинуклеотидной молекуле/цепи, тогда эталонная последовательность и вторая последовательность ориентированы в антисмысловом направлении или имеют антисмысловую ориентацию. Две последовательности, имеющие антисмысловые ориентации по отношению друг к другу, могут быть альтернативно описаны как имеющие одинаковую ориентацию, если эталонная последовательность (направление 5'-3') и обратно комплементарная последовательность эталонной последовательности (эталонной последовательности, расположенной в 5'-3') расположены в пределах одной полинуклеотидной молекулы/цепи. Последовательности, изложенные в данном документе, показаны в направлении 5'-3'.

Рекомбинантные конструкции, предусмотренные в данном документе, могут быть использованы для трансформации растений или растительных клеток для того, чтобы модулировать уровни экспрессии или активности белка. Рекомбинантная полинуклеотидная конструкция может содержать полинуклеотид, кодирующий один или несколько полинуклеотидов, описанных в данном документе, функционально связанный с регуляторной областью, подходящим для экспрессии полипептида в растении или растительной клетке. Таким образом, полинуклеотид может содержать кодирующую последовательность, которая кодирует полипептид, описанный в данном документе. Растения, в которых модулируют уровни экспрессии или активности белка, могут включать в себя мутантные растения, не встречающиеся в природе растения, трансгенные растения, искусственные растения или созданные методами генной инженерии растения. Соответственно, трансгенное растение содержит геном, который был изменен с помощью стабильной интеграции рекомбинантной ДНК. Рекомбинантная ДНК включает в себя ДНК, которая была создана методами генной инженерии и сконструирована за пределами клетки, и включает в себя ДНК, содержащую природную ДНК или кДНК или синтетическую ДНК. Трансгенное растение может включать в себя растение, регенерированное из первоначально трансформированной растительной клетки, и потомство трансгенных растений от более поздних поколений, или гибриды трансформированного растения. Соответственно, трансгенная модификация изменяет экспрессию или активность полинуклеотида или полипептида, описанного в данном документе, по сравнению с контрольным растением.

Полипептид, кодируемый рекомбинантным полинуклеотидом, может быть нативным полипептидом, или может быть гетерологичным по отношению к клетке. В некоторых случаях рекомбинантная конструкция содержит полинуклеотид, который модулирует экспрессию, функционально связанный с регуляторной областью. Примеры подходящих регуляторных областей описаны в данном документе.

Также предусмотрены векторы, содержащие рекомбинантные полинуклеотидные конструкции, такие как те, которые описаны в данном документе. Подходящие основы для векторов включают в себя, например, те, которые обычно используют в данной области, такие как плазмиды, вирусы, искусственные хромосомы, искусственные хромосомы бактерий, искусственные хромосомы дрожжей или искусственные хромосомы бактериофагов. Подходящие векторы экспрессии включают в себя, без ограничения, плазмиды и вирусные векторы, полученные из, например, бактериофага, бакуловирусов и ретровирусов. Многочисленные векторы и системы экспрессии являются доступными для приобретения.

Векторы могут также включать в себя, например, репликаторы, области крепления каркаса или маркеры. Маркерный ген может придавать селектируемый фенотип растительной клетке. Например, маркер может придать биоцидную устойчивость, такую как устойчивость к антибиотику (например, к канамицину, G418, блеомицину или гигромицину), или к гербициду (например, к глифосату, хлорсульфурону или фосфинотрицину). Кроме того, вектор экспрессии может включать в себя последовательность метки, предназначенную для облегчения манипуляций или обнаружения (например, очистки или локализации) экспрессированного полипептида. Последовательности меток, такие как последовательности люциферазы, бета-глюкуронидазы, зеленого флуоресцентного белка, глутатион S-трансферазы, полигистидина, с-myc или гемагглютинина, как правило, экспрессируются в виде слияния с кодируемым полипептидом. Такие метки могут быть вставлены в любом месте в пределах полипептида, в том числе на карбоксильном или амино-конце.

Растение или растительную клетку можно трансформировать путем интегрирования рекомбинантного полинуклеотида в ее геном с получением стабильной трансформации. Растение или растительная клетка, описанная в данном документе, может быть стабильно трансформированной. Стабильно трансформированные клетки, как правило, сохраняют введенный полинуклеотид с каждым клеточным делением. Растение или растительную клетку также можно временно трансформировать таким образом, что рекомбинантный полинуклеотид не интегрирован в ее геном. Временно трансформированные клетки, как правило, теряют весь или некоторую часть введенного рекомбинантного полинуклеотида с каждым клеточным делением, так что введенный рекомбинантный полинуклеотид нельзя обнаружить в дочерних клетках после достаточного числа клеточных делений.

Существует ряд способов, доступных в данной области для трансформации растительной клетки, все из которых охвачены в данном документе, в том числе, биолистика, методики генной пушки, Agrobacterium-опосредованная трансформация, опосредованная вирусным вектором трансформация и электропорация. Система Agrobacterium для интеграции чужеродной ДНК в хромосомы растений была тщательно изучена, модифицирована и использована для генной инженерии растений. Голые молекулы рекомбинантной ДНК, содержащие последовательности ДНК, соответствующие исследуемому очищенному белку табака, функционально связанные в смысловой или антисмысловой ориентации с регуляторными последовательностями, соединяют с соответствующими последовательностями Т-ДНК с помощью обычных способов. Их вводят в протопласты табака при помощи метода с полиэтиленгликолем или методом электропорации, оба из которых являются стандартными. В качестве альтернативы, такие векторы, содержащие молекулы рекомбинантной ДНК, кодирующие исследуемый очищенный белок табака, вводят в живые клетки Agrobacterium, которые затем переносят ДНК в растительные клетки табака. Трансформацию с помощью голой ДНК без сопутствующих векторных последовательностей Т-ДНК можно выполнить посредством слияния протопластов табака с ДНК-содержащими липосомами или посредством электропорации. Голую ДНК, не сопровождаемую векторными последовательностями Т-ДНК, также можно использовать для трансформации клеток табака с помощью инертных, высокоскоростных микрочастиц.

Если клетку или культивируемую ткань используют в качестве реципиентной ткани для трансформации, растения можно регенерировать из трансформированных культур, при желании, с помощью методик, известных специалистам в данной области.

Выбор регуляторных областей, которые будут включены в рекомбинантную конструкцию, зависит от нескольких факторов, в том числе, помимо прочего, от эффективности, селективности, индуцибельности, желаемого уровня экспрессии и клеточной или тканевой предпочтительности экспрессии. Обычным делом для специалиста в данной области является модулирование экспрессии кодирующей последовательности путем соответствующего выбора и размещения регуляторных областей по отношению к кодирующей последовательности. Транскрипцию полинуклеотида можно модулировать подобным образом. Некоторые подходящие регуляторные области инициируют транскрипцию исключительно или преимущественно в определенных типах клеток. Способы идентификации и установления характеристик регуляторных областей в растительной геномной ДНК хорошо известны в данной области.

Подходящие промоторы включают в себя тканеспецифичные промоторы, распознаваемые тканеспецифичными факторами, присутствующими в разных тканях или типах клеток (например, корень-специфичные промоторы, побег-специфичные промоторы, ксилема-специфичные промоторы), или присутствующими на различных стадиях развития, или присутствующими в ответ на разные условия окружающей среды. Подходящие промоторы включают в себя конститутивные промоторы, которые могут быть активированы в большинстве типов клеток, не требуя специфических индукторов. Примеры подходящих промоторов для управления получением полипептидов при РНКи включают в себя промотор 35S вируса мозаики цветной капусты (CaMV/35S), SSU, OCS, lib4, usp, STLS1, В33, nos или промоторы гена убиквитина или гена фазеолина. Специалисты в данной области способны генерировать множество вариантов рекомбинантных промоторов.

Тканеспецифичные промоторы представляют собой элементы управления транскрипцией, которые активны только в определенных клетках или тканях в определенное время в ходе развития растений, например, в вегетативных тканях или репродуктивных тканях. Тканеспецифичная экспрессия может быть выгодной, например, когда экспрессия полинуклеотидов в определенных тканях является предпочтительной. Примеры тканеспецифичных промоторов под управлением развития включают в себя промоторы, которые могут инициировать транскрипцию только (или в основном только) в определенных тканях, таких как вегетативные ткани, например, корни или листья, или репродуктивные ткани, такие как плоды, семяпочки, семена, пыльца, тычинки, цветы или любая эмбриональная ткань. Репродуктивные тканеспецифичные промоторы могут быть, например, пыльник-специфичными, семяпочкаспецифичными, эмбриоспецифичными, эндосперм-специфичными, интегумент-специфичными, специфичными для семян и кожуры семян, специфичными для пыльцы, лепесток-специфичными, чашелистик-специфичными или их комбинациями.

Подходящие лист-специфичные промоторы включают в себя промотор пируватортофосфатдикиназы (PPDK) из растения С4 (кукуруза), промотор cab-mlCa+2 из кукурузы, промотор родственных myb генов из Arabidopsis thaliana (Atmyb5), промоторы рибулозобифосфаткарбоксилазы (RBCS) (например, гены томата RBCS1, RBCS2 и RBCS3A, экспрессируемые в листьях и выращенных на свету саженцах, RBCS1 и RBCS2, экспрессируемые в развивающихся плодах томата, или промотор рибулозобифосфаткарбоксилазы, экспрессируемый на высоких уровнях почти исключительно в мезофильных клетках листовых пластинок и листовых пазух).

Подходящие специфичные для старения промоторы включают в себя промотор томата, активный во время созревания плодов, старения и опадания листьев, промотор гена кукурузы, кодирующего цистеиновую протеазу. Можно использовать подходящие пыльник-специфичные промоторы. Можно выбрать подходящие предпочтительные для корней промоторы, известные специалистам в данной области. Подходящие предпочтительные для семян промоторы включают в себя как семяспецифичные промоторы (промоторы, активные в процессе развития семян, такие как промоторы запасаемых белков семян), так и промоторы прорастающих семян (промоторы, активные во время прорастания семян). Такие предпочтительные для семян промоторы включают в себя, помимо прочего, промотор гена Ciml (цитокинин-индуцированное сообщение); cZ19B1 (зеин 19 кДа кукурузы); milps (миоинозитол-1-фосфатсинтаза); mZE40-2, также известный как Zm-40; nuclc и celA (целлюлозосинтаза). Промотор гена гамма-зеина представляет собой эндосперм-специфичный промотор. Промотор гена Glob-1 представляет собой эмбриоспецифичный промотор. Для двудольных семяспецифичные промоторы включают в себя, помимо прочего, промотор гена бета-фазеолина фасоли, гена напина, гена β-конглицинина, гена лектина сои, гена круциферина и т.п. Для однодольных семяспецифичные промоторы включают в себя, помимо прочего, промотор гена зеина 15 кДа кукурузы, промотор гена зеина 22 кДа, промотор гена зеина 27 кДа, промотор гена g-зеина, промотор гена гамма-зеина 27 кДа (такой как промотор gzw64A, см. инвентарный номер S78780 в Genbank), промотор гена waxy, промотор гена shrunken 1, промотор гена shrunken 2, промотор гена глобулина 1 (см. инвентарный номер L22344 в Genbank), промотор гена Itp2, промотор гена cim1, промоторы генов end1 и end2 кукурузы, промотор гена nuc1, промотор гена Zm40, промотор гена eep1 и еер2; промотор гена lec1, промотор гена тиоредоксина Н; промотор гена mlip15, промотор гена PCNA2 и промотор гена shrunken-2.

Примеры индуцибельных промоторов включают в себя промоторы, реагирующие на нападение патогена, анаэробные условия, повышенную температуру, свет, засуху, холодную температуру или высокую концентрацию солей. Патоген-индуцибельные промоторы включают в себя промоторы связанных с патогенезом белков (белки PR), которые индуцируются после инфицирования патогеном (например, белки PR, белки SAR, бета-1,3-глюканаза, хитиназа).

В дополнение к растительным промоторам можно получить другие подходящие промоторы бактериального происхождения (например, промотор гена октопинсинтазы, промотор гена нопалинсинтазы и другие промоторы, полученные из Ti плазмид), или их можно получить из вирусных промоторов (например, 35S и 19S РНК промоторы вируса мозаики цветной капусты (CaMV), конститутивные промоторы вируса табачной мозаики, промоторы 19S и 35S вируса мозаики цветной капусты (CaMV) или промотор 35S вируса мозаики норичника).

В другом аспекте предусмотрен выделенный полипептид, содержащий, состоящий или состоящий по существу из полипептидной последовательности, имеющей по меньшей мере 60% идентичности последовательности с любой из последовательностей, описанных в данном документе, включая любые полипептиды, приведенные в перечне последовательностей. Соответственно, выделенный полипептид содержит, состоит или состоит по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%. 65%. 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с ним.

В одном варианте осуществления предусмотрен полипетид, кодируемый SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрен выделенный полипептид, содержащий, состоящий или состоящий по существу из последовательности, имеющей по меньшей мере 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14.

В другом варианте осуществления предусмотрен полипептидный вариант, содержащий, состоящий или состоящий по существу из аминокислотной последовательности, кодируемой полинуклеотидным вариантом с по меньшей мере приблизительно 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8% или 99,9% идентичности последовательности с SEQ ID NO: 1, или SEQ ID NO: 2, или SEQ ID NO: 3, или SEQ ID NO: 4, или SEQ ID NO: 10, или SEQ ID NO: 11.

В другом варианте осуществления предусмотрены фрагменты полипептида SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 и фрагменты SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, которые имеют по меньшей мере приблизительно 60%, 65%, 70%, 75%, 80%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99%,99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% или 100% идентичности последовательности с соответствующими фрагментами из SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, соответственно.

Полипептид также включает в себя последовательности, содержащие достаточный или существенный процент идентичности или сходства с SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 для функционирования в качестве члена семейства CLC хлоридных каналов. Данные фрагменты полипептида(-ов) как правило сохраняют некоторую или всю активность последовательности полной длины.

Полипептиды также включают в себя мутантов, полученных путем введения любого типа изменений (например, инсерции, делеции или замены аминокислот; изменения состояний гликозилирования, изменения, которые влияют на повторную укладку или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно спроектированы или легко выделены при условии, что они сохраняют некоторую или всю свою функциональность или активность в качестве члена семьи CLC хлоридных каналов.

Полипептиды могут быть в линейной форме или циклизованными с использованием известных способов.

Полипептид, кодируемый SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, который имеет 100% идентичности последовательности с ним, или полипептид, содержащий, состоящий или состоящий по существу из последовательности, изложенной в SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14, который имеет 100% идентичности последовательности с ним, также раскрыт.

Различные комбинации SEQ ID NO: 5, или SEQ ID NO: 6, или SEQ ID NO: 7, или SEQ ID NO: 12, или SEQ ID NO: 13, или SEQ ID NO: 14 также предполагаются. Эти комбинации включают в себя любые комбинации из SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 или SEQ ID NO: 14, включая комбинацию SEQ ID NO: 5 и SEQ ID NO: 6; комбинацию SEQ ID NO: 5 и SEQ ID NO: 7; комбинацию SEQ ID NO: 6 и SEQ ID NO: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID N: 7; комбинацию SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 6, SEQ ID NO: 7 SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14; комбинацию SEQ ID NO: 5, SEQ ID NO: 6 и SEQ ID NO: 7, SEQ ID NO: 12, SEQ ID NO: 13 и SEQ ID NO: 14 и т.д.

Полипептиды включают в себя варианты, полученные путем введения любого типа изменений (например, инсерции, делеции или замены аминокислот; изменения состояний гликозилирования, изменения, которые влияют на повторную укладку или изомеризацию, трехмерные структуры или состояния самоассоциации), которые могут быть намеренно спроектированы или легко выделены. Делеция относится к удалению одной или нескольких аминокислот из белка. Инсерция относится к одному или нескольким аминокислотным остаткам, вводимым в заранее определенное место в полипептиде. Инсерции могут содержать инсерции внутри последовательности одной или нескольких аминокислот. Замена относится к замещению аминокислот полипептида другими аминокислотами, имеющими подобные свойства (такие как подобная гидрофобность, гидрофильность, антигенность, склонность к образованию или разрыву а-спиральных структур или β-складчатых структур). Аминокислотные замены происходят, как правило, по отдельным остаткам, но могут быть сгруппированы в зависимости от функциональных ограничений, накладываемых на полипептид, и могут варьироваться от приблизительно 1 до приблизительно 10 аминокислот. Аминокислотные замены являются предпочтительно консервативными аминокислотными заменами, как описано ниже. Аминокислотные замены, делеции и/или инсерции можно выполнить с использованием методик пептидного синтеза, таких как твердофазный пептидный синтез, или с помощью манипулирования с рекомбинантной ДНК. Способы манипулирования последовательностями ДНК с получением вариантов белка с заменой, инсерцией или делецией хорошо известны в данной области. Вариант может иметь изменения, которые производят молчащее изменение и приводят к функционально эквивалентному белку. Преднамеренные аминокислотные замены можно сделать на основе сходства полярности, заряда, растворимости, гидрофобности, гидрофильности и амфипатической природы остатков до тех пор, пока вторичная связывающую активность вещества сохраняется. Например, отрицательно заряженные аминокислоты включают в себя аспарагиновую кислоту и глутаминовую кислоту; положительно заряженные аминокислоты включают лизин и аргинин и аминокислоты с незаряженными полярными головными группами, имеющие подобные значения гидрофильности, включают в себя лейцин, изолейцин, валин, глицин, аланин, аспарагин, глутамин, серии, треонин, фенилаланин и тирозин. Консервативные замены можно сделать, например, в соответствии с приведенной ниже Таблицей. Аминокислоты в одном и том же блоке во втором столбце и предпочтительно в одной и той же строке в третьем столбце можно заменить друг на друга:

Полипептид может быть зрелым белком или незрелым белком, или белком, полученным из незрелого белка. Полипептиды могут быть в линейной форме или циклизованными с использованием известных способов. Полипептиды, как правило, содержат по меньшей мере 10, по меньшей мере 20, по меньшей мере 30, или по меньшей мере 40 смежных аминокислот.

Мутантные варианты полипептида можно использовать для создания мутантных, не встречающихся в природе или трансгенных растений (например, мутантных, не встречающихся в природе, трансгенных, искусственных или созданных методами генной инженерии), содержащих один или несколько мутантных вариантов полипептида. Соответственно, мутантные варианты полипептида сохраняют активность немутантного полипептида. Активность мутантного варианта полипептида может быть выше, ниже или приблизительно такой же, как немутированного полипептида.

Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут включать в себя искусственные мутации или синтетические мутации, или созданные методами генной инженерии мутации. Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут быть мутациями, которые получены или являются получаемыми посредством процесса, который включает в себя манипуляционный этап in vitro или in vivo. Мутации в нуклеотидных последовательностях и полипептидах, описанных в данном документе, могут быть мутациями, которые получены или являются получаемыми посредством процесса, который включает в себя вмешательство человека.

Примеры мутаций в полипептидных последовательностях, описанных в данном документе, показаны в Таблице 1. Соответственно, дополнительный аспект относится к мутантным полипептидам, как изложено в Таблице 1.

Мутация (мутации) может модулировать активность кодируемого полипептида. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень нитратов в растении модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень нитратов в растении увеличивается или уменьшается. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень NNK в растении, таком как высушенный растительный материал, модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что уровень NNK в растении, таком как высушенный растительный материал, увеличивается или уменьшается. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что общий уровень TSNA в растении, таком как высушенный растительный материал, модулируется. Мутация (мутации) может модулировать активность кодируемого полипептида таким образом, что общий уровень TSNA в растении, таком как высушенный растительный материал, увеличивается или уменьшается.

В одном варианте осуществления SEQ ID NO: 5 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 503, 471, 659, 566, 637, 597, 711, 135, 151, 690, 737, 135, 163, 480, 520, 514, 518, 476, 739, 517, 585 или 677 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делению, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из G503E, G471R, V659I, S566N, P637S, А597Т, P711L, G135R, A151V, G690D, G737R, G135R, G163R, P480S, S520F, А514Т, A518V, G476E, R739S, G517E, E585K или V677I или комбинации из двух или более из них.

В одном варианте осуществления SEQ ID NO: 6 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 514, 537, 593, 749, 524, 408, 503, 547, 691, 478, 749, 713, 550, 586, 670, 678, 631, 657, 737, 525, 597, 674 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из А514Т, L537F, R593I, А749Т, G524D, S408F, G503R, P547S, G691D, A478V, A749V, T713I, M550I, P586S, R670K, R678K, D631N, L657F, G737R, S525L, А597Т, E674K или комбинации из двух или более из них.

В одном варианте осуществления SEQ ID NO: 7 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 21, 58, 141, 175, 5, 34, 124, 40, 8, 35, 30, 177, 42, 88, 155, 158, 170, 174, 126 или 131 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из E21K, L58F, P141S, G175E, S5N, A34V, M124I, L40F, D8N, C35Y, A30V, A177V, G42D, G88D, G155R, D158N, A170V, A174V, A126V или G131R или комбинации двух или более из них.

Последовательность, показанная в SEQ ID NO: 12, соответствует последовательности, показанной в SEQ ID NO: 7, с дополнительными 88 аминокислотами на 5'-конце. SEQ ID NO: 12 может включать в себя такие же соответствующие мутации, как и SEQ ID NO: 7. SEQ ID NO: 12 может включать в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 109, 146, 229, 263, 93, 122, 212, 128, 96, 123, 118, 265, 130, 176, 243, 246, 258, 262, 214, или 219 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из E109K, L146F, P229S, G263E, S93N, A122V, M212I, L128F, D96N, C123Y, A118V, A265V, G130D, G176D, G243R, D246N, A258V, A262V, A214V или G219R или комбинации двух или более из них.

В одном варианте осуществления SEQ ID NO: 13 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 184, 89, 166, 18, 76, 173, 143, 1, 4, 154, 89, 128, 137 или 181 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из P184S, G89D, K166N, G18R, G76R, G173R, P143L, M1I, S4N, V154I, G89D, A128V, S137F или G181S или комбинации двух или более из них.

Последовательность, показанная в SEQ ID NO: 14, соответствует последовательности, показанной в SEQ ID NO: 13, с дополнительными 88 аминокислотами на 5'-конце. В одном варианте осуществления SEQ ID NO: 14 включает в себя одну или несколько мутаций в аминокислотных положениях, выбранных из группы, состоящей из 272, 177, 254, 106, 164, 261, 231, 89, 92, 242, 177, 269 или 225 или комбинации двух или более из них. Тип мутации (мутаций) в этом положении может представлять собой делецию, инсерцию, замену или миссенс-мутацию или их комбинацию. Мутация (мутации) может быть гетерозиготной или гомозиготной мутацией, соответственно, гомозиготной мутацией. В одном варианте осуществления мутация (мутации) представляет собой мутацию по типу замены. В одном варианте осуществления мутация (мутации) по типу замены выбрана из группы, состоящей из P272S, G177D, K254N, G106R, G164R, G261R, P231L, M89I, S92N, V242I, G177D, A269V, S225F или G269S или комбинации двух или более из них.

Соответственно, мутация представляет собой мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация представляет собой гомозиготную мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация представляет собой мутацию по типу замены. Соответственно, мутация по типу замены представляет собой мутацию G163R. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении G163R. Если полипептид, содержащий данную мутацию, экспрессируется в мутантном растении, уровень нитратов в мутантном растении становится ниже, чем в контрольном растении, в период раннего утра или в середине утра. Соответствующие мутации можно выполнить в SEQ ID NO: 14, которая соответствует последовательности SEQ ID NO: 7 с дополнительными аминокислотами на ее 5'-конце.

Соответственно, мутация представляет собой мутацию в положении G163 из SEQ ID NO: 5. Соответственно, мутация по типу замены представляет собой G163R. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении G163R. Данная мутация может уменьшать уровень нитратов в мутантном растении, содержащем данную мутацию. Гомозиготное мутантное G163R растение табака имеет сниженный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов снижается с приблизительно 11 мг/г в контрольном растении до приблизительно 6 мг/г в мутантном растении. Уровень нитратов продолжает уменьшаться в середине утра. Уровень нитратов снижается с приблизительно 7 мг/г в контрольном растении до приблизительно 4,5 мг/г в мутантном растении. К позднему утру уровень нитратов увеличился в мутантном растении по сравнению с серединой утра и достигает уровня нитратов, присутствующих ранним утром. Для контроля уровень нитратов в контрольном растении продолжает уменьшаться. К позднему утру уровень нитратов увеличивается до приблизительно 6 мг/г в мутантном растении и уменьшается до приблизительно 3 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра. Уровень никотина меняется от приблизительно 13 мг/г до приблизительно 11 мг/г для мутантного растения и от приблизительно 9 мг/г до приблизительно 13 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.

Соответственно, мутация представляет собой мутацию в положении Р143 из SEQ ID NO: 13. Соответственно, мутация по типу замены представляет собой P143L. Соответственно, мутация представляет собой гомозиготную мутацию по типу замены в положении P143L. Данная мутация может увеличивать уровень нитратов в мутантном растении, содержащем данную мутацию. Гомозиготное мутантное P143L растение табака имеет увеличенный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов увеличивается с приблизительно 7 мг/г в контрольном растении до приблизительно 14 мг/г в мутантном растении. Уровень нитратов уменьшается в середине утра в мутантном растении и несколько увеличивается в контрольном растении. Уровень нитратов в мутантном растении снижен до приблизительно 9 мг/г и уровень нитратов в контрольном растении увеличивается до приблизительно 9 мг/г.К позднему утру уровень нитратов продолжил уменьшаться в мутантном растении по сравнению с серединой утра. Для контроля уровень нитратов в контрольном растении уменьшается. К позднему утру уровень нитратов уменьшается до приблизительно 2 мг/г в мутантном растении и уменьшается до приблизительно 4 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра для каждого из мутантного и контрольного растений. Уровень никотина меняется от приблизительно 20 мг/г до приблизительно 24 мг/г для мутантного растения и от приблизительно 15 мг/г до приблизительно 17 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.

Суточная регуляция метаболизма нитратов известна и интенсивно исследуется (см. Stitt & Krapp Plant, Cell and Environment 22, 583-621 (1999)). В богатых азотом растениях уровень транскрипта для нитратредуктаз является высоким в конце ночи, резко падает в течение дня и восстанавливается в течение ночи. Активность NIA увеличивается в три раза в первой половине светового периода, уменьшается в течение второй половины светового периода и остается низкой в течение ночи. Увеличение активности NIA после освещения происходит в результате увеличения количества белка NIA.

Также является раскрытым способ модулирования уровня нитратов, общего содержания TSNA или NNK в растении табака или в части этого растения, при этом указанный способ включает этапы: (i) введения в геном указанного растения одной или нескольких мутаций в пределах по меньшей мере одного аллеля одной или нескольких полинуклеотидных последовательностей, описанных в данном документе; и (ii) получение мутантного растения, в котором указанная мутация модулирует экспрессию указанных полинуклеотидных последовательностей или активность полипептида, кодируемого ими, по сравнению с контролем, и растение табака или часть этого растения имеет модулированный уровень нитратов и/или общего содержания TSNA и/или NNK. В определенных вариантах осуществления растение табака или часть этого растения представляет собой высушенный растительный материал.

Способы получения мутантов хорошо известны в данной области и могут включать в себя мутагенез с использованием экзогенно добавленных химических веществ, таких как мутагенные, тератогенные или канцерогенные органические соединения, например этилметансульфонат (EMS), которые производят случайные мутации в генетическом материале. В качестве дополнительного примера способ может включать в себя один или несколько этапов генной инженерии, таких как один или несколько этапов генной инженерии, которые описаны в данном документе, или их комбинации. В качестве дополнительного примера способ может включать в себя один или несколько этапов скрещивания растений. Также может быть использован TILLING, как описано в другом месте данного документа.

Полипептид можно получить путем культивирования трансформированных или рекомбинантных клеток-хозяев в условиях культивирования, подходящих для экспрессии полипептида. Полученный экспрессированный полипептид затем можно очистить от такой культуры с помощью известных способов очистки. Очистка полипептида может включать в себя аффинную колонку, содержащую средства, которые связываются с полипептидом; один или несколько этапов колонки с такими аффинными смолами; один или несколько этапов с участием гидрофобной хроматографии или иммуноаффинную хроматографию. В качестве альтернативы, полипептид можно также экспрессировать в форме, которая будет облегчать очистку. Например, его можно экспрессировать в виде полипептида слияния, такого как с мальтозосвязывающий полипептид, глутатион-5-трансферазой или тиоредоксином. Наборы для экспрессии и очистки полипептидов слияния являются доступными для приобретения. Полипептид можно пометить эпитопом и затем очистить с использованием специфического антитела, направленного к такому эпитопу. Один или несколько этапов жидкостной хроматографии, такой как обращенно-фазовая высокоэффективная жидкостная хроматография, можно использовать для дополнительной очистки полипептида. Некоторые или все из вышеуказанных этапов очистки в различных комбинациях можно использовать для обеспечения по существу гомогенного рекомбинантного полипептида. Очищенный таким образом полипептид может быть по существу свободным от других полипептидов и определен в данном документе как «по существу очищенный полипептид»; такие очищенные полипептиды включают полипептиды, фрагменты, варианты и т.п. Экспрессию, выделение и очистку полипептидов и фрагментов можно выполнить при помощи любой подходящей методики, в том числе, помимо прочего, способами, описанными в данном документе.

Кроме того, можно использовать аффинную колонку, такую как с моноклональным антителом, сгенерированным против полипептидов, для аффинной очистки экспрессированных полипептидов. Эти полипептиды можно удалить из аффинной колонки с помощью общепринятых методик, например, в элюирующем буфере с высоким содержанием солей с последующим диализованием в буфер с низким содержанием солей для использования, или посредством изменения рН или других компонентов в зависимости от используемой аффинной матрицы, или путем конкурентного удаления с помощью естественного субстрата аффинного фрагмента.

Полипептид можно также получить с помощью известных общепринятых методов химического синтеза. Способы конструирования полипептидов или их фрагментов синтетическими средствами известны специалистам в данной области. Синтетически сконструированные полипептидные последовательности в силу разделения первичных, вторичных или третичных структурных или конформационных характеристик с нативными полипептидами могут обладать биологическими свойствами, общими с ними, включая биологическую активность.

Термин «не встречающийся в природе», используемый в данном документе, описывает объект (например, полинуклеотид, генетическую мутацию, полипептид, растение, растительную клетку и растительный материал), который не образован естественным путем или не существует в природе. Такие не встречающиеся в природе объекты или искусственные объекты можно изготовить, синтезировать, инициировать, модифицировать, подвергнуть вмешательству или манипуляции способами, описанными в данном документе, или которые известны в данной области. Такие не встречающиеся в природе объекты или искусственные объекты можно изготовить, синтезировать, инициировать, модифицировать, подвергнуть вмешательству или манипуляции человеком. Таким образом, в качестве примера, не встречающееся в природе растение, не встречающаяся в природе растительная клетка или не встречающийся в природе растительный материал можно изготовить с использованием традиционных методик селекции растений, таких как обратное скрещивание, или путем генетических манипуляционных технологий, таких как антисмысловая РНК, интерферирующая РНК, мегануклеаза и т.п. В качестве дополнительного примера, не встречающееся в природе растение, не встречающаяся в природе растительная клетка или не встречающийся в природе растительный материал можно изготовить с использованием интрогрессии или путем передачи одной или нескольких генетических мутаций (например, одного или нескольких полиморфизмов) из первого растения или растительной клетки во второе растение или растительную клетку (которые сами по себе могут быть встречающимися в природе), таким образом, что полученное растение, растительная клетка или растительный материал или их потомство содержит генетическую конструкцию (например, геном, хромосому или ее сегмент), который не образован естественным путем, или который не существует в природе. Полученное растение, растительная клетка или растительный материал, таким образом, является искусственным или не встречающимся в природе. Соответственно, искусственное или не встречающееся в природе растение или растительную клетку можно изготовить путем модификации генетической последовательности в первом встречающемся в природе растении или растительной клетке, даже если полученная генетическая последовательность встречается в природе во втором растении или растительной клетке, которая содержит другой генетический фон из первого растения или растительной клетки. В определенных вариантах осуществления мутация не является встречающейся в природе мутацией, которая существует в природе в нуклеотидной последовательности или полипептиде, таких как ген или белок.

Различия в генетическом фоне можно обнаружить по фенотипическим различиям или с помощью методик молекулярной биологии, известных в данной области, таких как секвенирование нуклеиновых кислот, наличие или отсутствие генетических маркеров (например, маркеров микросателлитной РНК).

Также предусмотрены антитела, которые являются иммунореактивными по отношению к полипептидам, описанным в данном документе. Полипептиды, фрагменты, варианты, полипептиды слияния и т.п., изложенные в данном документе, можно использовать в качестве «иммуногенов» при получении антител, иммунореактивных по отношению к ним. Такие антитела могут специфически связываться с полипептидом через антиген-связывающие активные центры антитела. Специфически связывающимися антителами являются те, которые будут специфически распознавать и связываться с полипептидом, гомологами и вариантами, но не с другими молекулами. В одном варианте осуществления антитела являются специфичными для полипептидов, имеющих аминокислотную последовательность, изложенную в данном документе, и не проявляют перекрестной реактивности с другими полипептидами.

Более конкретно, полипептиды, фрагмент, варианты, полипептиды слияния и т.п. содержат антигенные детерминанты или эпитопы, которые вызывают образование антител. Данные антигенные детерминанты или эпитопы могут быть линейными или конформационными (прерывистыми). Линейные эпитопы состоят из одного отрезка аминокислот полипептида, тогда как конформационные или прерывистые эпитопы состоят из аминокислотных отрезков из различных областей полипептидной цепи, которые были приведены в непосредственную близость при сворачивании полипептида. Эпитопы можно выявить любыми способами, известными в данной области. Кроме того, эпитопы из полипептидов можно использовать в качестве исследовательских реагентов, в анализах и для очистки специфически связывающихся антител от веществ, таких как поликлональные сыворотки или супернатанты из культивируемых гибридом. Такие эпитопы или их варианты можно получить с использованием методик, известных в данной области, например, путем твердофазного синтеза, химического или ферментативного расщепления полипептида, или с помощью технологии рекомбинантной ДНК.

Как поликлональные, так и моноклональные антитела против полипептидов можно получить с помощью общеизвестных методик. Клеточные линии гибридом, которые продуцируют моноклональные антитела, специфичные для полипептидов, также предполагаются в данном документе. Такие гибридомы можно получить и выявить с помощью общеизвестных методик. Для получения антител различных животных-хозяев можно иммунизировать инъекцией с полипептидом, его фрагментом, вариантом или мутантами. Такие животные-хозяева могут включать, помимо прочего, кроликов, мышей и крыс, к примеру. Различные адъюванты можно использовать для увеличения иммунологического ответа. В зависимости от вида хозяина такие адъюванты включают, помимо прочего, адъюванты Фрейнда (полные и неполные), минеральные гели, такие как гидроксид алюминия, поверхностно-активные вещества, такие как лизолецитин, плюрониловые полиолы, полианионы, пептиды, масляные эмульсии, гемоцианин лимфы улитки, динитрофенол и потенциально полезные человеческие адъюванты, такие как BCG (бацилла Кальметта-Герена) и Corynebacterium parvum. Моноклональные антитела можно выделить общепринятыми методиками. Такие моноклональные антитела могут быть иммуноглобулинами любого класса, в том числе IgG, IgM, IgE, IgA, IgD, и любого их подкласса.

Антитела можно также использовать в анализах для обнаружения присутствия полипетидов или фрагментов либо in vitro, либо in vivo. Антитела можно также использовать для очистки полипептидов или фрагментов с помощью иммуноаффинной хроматографии.

Композиции, которые могут модулировать экспрессию или активность одного или нескольких полинуклеотидов или полипептидов, описанных в данном документе (или любой их комбинации, описанной в данном документе), включают, помимо прочего, специфичные для последовательности полинуклеотиды, которые могут препятствовать транскрипции одного или более эндогенного гена(-ов); специфичные для последовательности полинуклеотиды, которые могут препятствовать трансляции транскриптов РНК (например, двухцепочечные РНК, миРНК, рибозимы); специфичные для последовательности полинуклеотиды, которые могут препятствовать стабильности одного или нескольких белков; специфичные для последовательности полинуклеотиды, которые могут препятствовать ферментативной активности одного или нескольких белков или активности связывания одного или нескольких белков с соответствующими субстратами или регуляторными белками; антитела, которые проявляют специфичность в отношении одного или нескольких белков; низкомолекулярные соединения, которые могут препятствовать стабильности одного или нескольких белков или ферментативной активности одного или нескольких белков или активности связывания одного или нескольких белков; белки цинковых пальцев, которые связывают один или несколько полинуклеотидов; и мегануклеазы, которые имеют активность по отношению к одному или нескольким полинуклеотидам. Технологии редактирования гена, генетические технологии редактирования и технологии редактирование генома хорошо известны в данной области.

Один из способов редактирования гена предусматривает использование подобных активатору транскрипции эффекторных нуклеаз (TALEN), вызывающих двухцепочечные разрывы, на которые клетка может отвечать с привлечением механизмов репарации. Сращивание негомологичных концов повторно соединяет ДНК с обеих сторон двухцепочечного разрыва, где очень мало или отсутствует перекрывание последовательности для отжига. Этот механизм репарации вызывает ошибки в геноме посредством инсерции или делеции, либо хромосомной перестройки. Любые такие ошибки могут сделать генные продукты, закодированные в этом месте, не функциональными.

Другой способ редактирования гена предусматривает использование бактериальной системы CRISPR/Cas. Бактерии и археи проявляют хромосомные элементы, названные кластеризованными с регулярными интервалами короткими палиндромными повторами (CRISPR), которые являются частью адаптивной иммунной системы, защищающей от вторжения вирусной и плазмидной ДНК. В системах CRISPR II типа, CRISPR РНК (crPHK) функционирует с транс-активирующей crPHK (tracrPHK) и CRISPR-ассоциированными (Cas) белками с внесением двухцепочечных разрывов в целевую ДНК. Целевое расщепление с помощью Cas9 требует спаривания оснований между crPHK и tracrPHK, а также спаривание оснований между crPHK и целевой ДНК. Целевое распознавание облегчается наличием короткого мотива, названного прилегающим к протоспейсеру мотивом (РАМ), который соответствует последовательности NGG. Данную систему можно использовать для редактирования генома. Cas9 обычно программируется двойной РНК, состоящей из crPHK и tracrPHK. Тем не менее, основные компоненты этих РНК могут быть объединены в единую гибридную «руководящую РНК» для нацеливания Cas9. Использование некодирующего РНК-ориентира с нацеливанием ДНК для сайт-специфического расщепления обещает быть значительно более простым, чем существующие технологии, такие как TALEN. Использование стратегии CRISPR/Cas с перенацеливанием нуклеазного комплекса требует всего лишь введения новой последовательности РНК и нет необходимости в перестройке специфичности факторов транскрипции белка. Антисмысловая технология представляет собой другой известный способ, который можно использовать для модулирования экспрессии полипептида. Полинуклеотид гена, который должен быть репрессирован, клонируют и функционально связывают с регуляторной областью и последовательностью терминации транскрипции, так что антисмысловая цепь РНК транскрибируется. Затем рекомбинантную конструкцию трансформируют в растения и получают антисмысловую цепь РНК. Полинуклеотид не обязательно является полной последовательностью гена, который должен быть репрессирован, но как правило будет по существу комплементарным по меньшей мере части смысловой цепи гена, который должен быть репрессирован.

Полинуклеотид можно транскрибировать в рибозим или каталитическую РНК, которая влияет на экспрессию иРНК. Рибозимы можно спроектировать для специфического спаривания с практически любой целевой РНК и расщепления фосфодиэфирной основы в определенном месте, тем самым функционально инактивируя целевую РНК. Гетерологичные полинуклеотиды могут кодировать рибозимы, спроектированные для расщепления конкретных транскриптов иРНК, таким образом предотвращая экспрессию полипептида. Рибозимы типа hammerhead пригодны для разрушения конкретных иРНК, хотя можно использовать различные рибозимы, которые расщепляют иРНК с сайт-специфическим распознаванием последовательностей. Рибозимы типа hammerhead расщепляют иРНК в местах, диктуемых фланкирующими областями, которые формируют комплементарные пары оснований с целевой иРНК. Единственным требованием является то, что целевая РНК должна содержать нуклеотидную последовательность 5'-UG-3'. Конструирование и производство рибозимов типа hammerhead известно в данной области. Последовательности рибозимов типа hammerhead можно встроить в стабильную РНК, такую как транспортная РНК (тРНК) для увеличения эффективности расщепления in vivo.

В одном варианте осуществления специфичный для последовательности полинуклеотид, который может препятствовать трансляции транскрипта(-ов) РНК, представляет собой интерферирующую РНК. РНК-интерференция или РНК-сайленсинг представляет собой эволюционно консервативный процесс, в котором конкретные иРНК могут быть нацелены для ферментативной деградации. Двухцепочечную РНК (двухцепочечная РНК) вводят или производят в клетке (например, двухцепочечный РНК-вирус или полинуклеотиды интерферирующей РНК) для инициации пути интерферирующей РНК. Двухцепочечную РНК можно преобразовать в несколько двойных спиралей малых интерферирующих РНК 21-23 п.о. в длину с помощью РНКазы III, которая представляет собой специфичную для двухцепочечной РНК эндонуклеазу. Малые интерферирующие РНК можно впоследствии распознать РНК-индуцированными комплексами сайленсинга, которые способствуют раскручиванию малых интерферирующих РНК с помощью АТФ-зависимого процесса. Раскрученная антисмысловая цепь малой интерферирующей РНК направляет активированные РНК-индуцированные комплексы сайленсинга к нацеленной иРНК, содержащей последовательность, комплементарную антисмысловой цепи малой интерферирующей РНК. Нацеленная иРНК и антисмысловая цепь могут образовывать А-форму спирали, и большую бороздку А-формы спирали можно распознать активированными РНК-индуцированными комплексами сайленсинга. Целевую иРНК можно расщепить с помощью активированных РНК-индуцированных комплексов сайленсинга в одном сайте, определенном сайтом связывания 5'-конца цепи малой интерферирующей РНК. Активированные РНК-индуцированные комплексы сайленсинга могут рециркулировать для катализа еще одного акта расщепления.

Векторы экспрессии интерферирующей РНК могут содержать конструкции интерферирующей РНК, кодирующие полинуклеотиды интерферирующей РНК, которые проявляют активность РНК-интерференции путем снижения уровня экспрессии иРНК, пре-иРНК или родственных вариантов РНК. Векторы экспрессии могут содержать промотор, расположенный выше по цепи и функционально связанный с конструкцией интерферирующей РНК, как дополнительно описано в данном документе. Векторы экспрессии интерферирующей РНК могут содержать подходящий минимальный основной промотор, представляющую интерес конструкцию интерферирующей РНК, расположенную выше по цепи (5') регуляторную область, расположенную ниже по цепи(3') регуляторную область, в том числе, сигналы терминации транскрипции и полиаденилирования, и другие последовательности, известные специалистам в данной области, такие как различные маркеры отбора.

Полинуклеотиды можно получить в различных формах, в том числе в виде двухцепочечных структур (то есть, двухцепочечную молекулу РНК, содержащую антисмысловую цепь и комплементарную ей смысловую цепь), двухцепочечных шпилькообразных структур или одноцепочечных структур (то есть, молекула ssRNA, содержащая только антисмысловую цепь). Структуры могут содержать вторичную структуру двойной спирали, асимметричной двойной спирали, шпильки или асимметричной шпильки, имеющую самокомплементарную смысловую и антисмысловую цепи. Двухцепочечную интерферирующую РНК можно ферментативно превратить в двухцепочечные малые интерферирующие РНК. Одну из цепей двойной спирали малой интерферирующей РНК можно отжечь с комплементарной последовательностью в целевой иРНК и родственных вариантах РНК. Двойные спирали из малой интерферирующей РНК/иРНК распознаются РНК-индуцированными комплексами сайленсинга, которые могут расщепить РНК в нескольких сайтах зависимым от последовательности образом, приводя к распаду целевой иРНК и родственных вариантов РНК.

Молекулы двухцепочечной РНК могут включать молекулы малой интерферирующей РНК, собранные из одного олигонуклеотида в структуре стебель-петля, где самокомплементарные смысловая и антисмысловая области молекулы малой интерферирующей РНК соединены с помощью основанного на полинуклеотидах или не основанного на полинуклеотидах линкера(-ов), а также кольцевую одноцепочечную РНК, имеющую две или более петлевые структуры и стебель, содержащий самокомплементарные смысловую и антисмысловую цепи, где кольцевую РНК можно обработать либо in vivo, или in vitro с генерированием активной молекулы малой интерферирующей РНК, способной опосредовать интерферирование РНК.

Также предполагается использование молекул малой шпилечной РНК. Они содержат специфичную антисмысловую последовательность в дополнение к обратно комплементарной (смысловой) последовательности, как правило, отделенной спейсером или последовательностью петли. Расщепление спейсера или петли обеспечивает молекулу одноцепочечной РНК и ее обратно комплементарную цепь, так что их можно отжечь с образованием двухцепочечной молекулы РНК (необязательно, с дополнительными этапами обработки, которые могут привести к добавлению или удалению одного, двух, трех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих цепей). Спейсер может иметь достаточную длину, чтобы позволить отжиг антисмысловой и смысловой последовательностей и образование двухцепочечной структуры (или стебля) до расщепления спейсера (и, необязательно, последующих этапов обработки, которые могут привести к добавлению или удалению одного, двух, трех, четырех или более нуклеотидов с 3'-конца или 5'-конца одной или обеих цепей). Спейсерная последовательность представляет собой, как правило, неродственную нуклеотидную последовательность, которая находится между двух комплементарных областей нуклеотидной последовательности, которая при отжиге в двухцепочечный полинуклеотид содержит малую шпилечную РНК. Спейсерная последовательность обычно содержит от приблизительно 3 до приблизительно 100 нуклеотидов.

Любой представляющий интерес полинуклеотид РНК можно получить путем выбора подходящей композиции последовательности, размера петли и длины стебля для получения двойной спирали шпильки. Подходящий диапазон для проектирования длины стебля двойной спирали шпильки включает в себя длину стебля по меньшей мере приблизительно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов, например, приблизительно 14-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов, приблизительно 200-300 нуклеотидов, приблизительно 300-400 нуклеотидов, приблизительно 400-500 нуклеотидов, приблизительно 500-600 нуклеотидов и приблизительно 600-700 нуклеотидов. Подходящий диапазон для проектирования длины петли двойной спирали шпильки включает в себя длину петли приблизительно 4-25 нуклеотидов, приблизительно 25-50 нуклеотидов или длиннее, если длина стебля двойной спирали шпильки является значительной. В определенных вариантах осуществления молекула двухцепочечной РНК или ssPHK составляет от приблизительно 15 до приблизительно 40 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 15 до приблизительно 35 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 17 до приблизительно 30 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 19 до приблизительно 25 нуклеотидов в длину. В другом варианте осуществления молекула малой интерферирующей РНК представляет собой молекулу двухцепочечной РНК или ssPHK от приблизительно 21 до приблизительно 23 нуклеотидов в длину. В определенных вариантах осуществления структуры шпильки с областями двойной спирали длиннее, чем 21 нуклеотид, могут способствовать эффективному направленному к малой интерферирующей РНК сайленсингу вне зависимости от последовательности и длины петли. Примеры последовательностей для РНК-интерференции изложены в SEQ ID NO: 8, или SEQ ID NO: 9.

Целевая последовательность иРНК составляет, как правило, от приблизительно 14 до приблизительно 50 нуклеотидов в длину. Целевую иРНК можно, таким образом, проверить на наличие областей от приблизительно 14 до приблизительно 50 нуклеотидов в длину, которые предпочтительно соответствуют следующим критериям для целевой последовательности: соотношение A+T/G+C от приблизительно 2:1 до приблизительно 1:2; динуклеотид АА или динуклеотид СА на 5'-конце целевой последовательности; последовательность из по меньшей мере 10 смежных нуклеотидов, уникальных для целевой иРНК (то есть, последовательность не присутствует в других последовательностях иРНК из этого же растения); и нет «полос» из более чем трех смежных гуаниновых (G) нуклеотидов или более чем трех смежных цитозиновых (С) нуклеотидов. Данные критерии можно оценить с помощью различных методик, известных в данной области, например, компьютерные программы, такие как BLAST, можно использовать для поиска общедоступных баз данных, чтобы определить, является ли выбранная целевая последовательность уникальной для целевой иРНК. В качестве альтернативы, можно выбрать целевую последовательность (и спроектировать последовательность малой интерферирующей РНК) с помощью доступного для приобретения компьютерного программного обеспечения (например, OligoEngine, Target Finder и Design Tool для малых интерферирующих РНК, которые являются доступными для приобретения).

В одном варианте осуществления выбраны целевые последовательности иРНК, которые составляют от приблизительно 14 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше, В другом варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 16 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше. В дополнительном варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 19 до приблизительно 30 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше. В другом варианте осуществления выбраны целевые последовательности, которые составляют от приблизительно 19 до приблизительно 25 нуклеотидов в длину и соответствуют одному или нескольким критериям, указанным выше.

В примерном варианте осуществления молекулы малой интерферирующей РНК содержат специфическую антисмысловую последовательность, которая комплементарна по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более смежным нуклеотидам из любой из описанных в данном документе полинуклеотидных последовательностей.

Специфическая антисмысловая последовательность, содержащаяся в молекуле малой интерферирующей РНК, может быть идентичной или по существу идентичной комплементарной цепи целевой последовательности. В одном варианте осуществления специфическая антисмысловая последовательность, содержащаяся в молекуле малой интерферирующей РНК, является по меньшей мере приблизительно на 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичной комплементарной цепи последовательности целевой РНК. Способы определения идентичности последовательности известны в данной области, и ее можно определить, например, с помощью программы BLASTN программного обеспечения Computer Group (GCG) Университета штата Висконсин, или предоставленной на веб-сайте NCBI.

Специфическая антисмысловая последовательность из молекул малой интерферирующей РНК может проявлять изменчивость по различиям (например, по нуклеотидной замене, в том числе, транзицию или трансверсию) в одном, двух, трех, четырех или более нуклеотидах из последовательности целевой иРНК. Если такие нуклеотидные замены находятся в антисмысловой цепи молекулы двухцепочечной РНК, комплементарный нуклеотид в смысловой цепи, с которым замещенный нуклеотид, как правило, должен образовывать водородные связи при спаривании оснований, может быть или может не быть соответственно замещенным. Молекулы двухцепочечной РНК, в которых одна или несколько нуклеотидных замен происходят в смысловой последовательности, но не в антисмысловой цепи, также предполагаются. Если антисмысловая последовательность из молекулы малой интерферирующей РНК содержит одно или несколько несовпадений между нуклеотидной последовательностью малой интерферирующей РНК и целевой нуклеотидной последовательностью, как описано выше, эти несоответствия можно найти на 3'-конце, 5'-конце, или в центральной части антисмысловой последовательности.

В другом варианте осуществления молекулы малой интерферирующей РНК содержат специфичную антисмысловую последовательность, которая способна селективно гибридизироваться в жестких условиях с частью встречающегося в природе целевого гена или целевой иРНК. Как известно специалистам в данной области, вариации жесткости условий гибридизации могут быть достигнуты путем изменения времени, температуры или концентрации растворов, используемых для этапов гибридизации и отмывания. Подходящие условия могут также частично зависеть от конкретных используемых нуклеотидных последовательностей, например, последовательности целевой иРНК или гена.

Одним из способов индукции сайленсинга двухцепочечной РНК в растениях является трансформация генной конструкцией, производящей шпилечную РНК (см. Smith et al. (2000) Nature, 407, 319-320). Такие конструкции содержат инвертированные области последовательности целевого гена, отделенные соответствующим спейсером. Вставка функциональной растительной интронной области в качестве спейсерного фрагмента дополнительно увеличивает эффективность индукции сайленсинга гена из-за генерации шпилечной РНК, сплайсированной с интроном (Wesley et al. (2001) Plant J., 27, 581-590). Соответственно, длина стебля составляет приблизительно от 50 нуклеотидов до приблизительно 1 тысячи нуклеотидов в длину. Способы получения шпилечной РНК, сплайсированной с интроном, хорошо описаны в данной области (см., например, Bioscience, Biotechnology, and Biochemistry (2008) 72, 2, 615-617).

Молекулы интерферирующей РНК, имеющие двуспиральную или двухцепочечную структуру, например, двухцепочечная РНК или малая шпилечная РНК, могут иметь «тупые» концы, или могут иметь 3' или 5' «липкие» концы. Использованный в данном документе «липкий конец» относится к неспаренному нуклеотиду или нуклеотидам, которые выступают из двуспиральной структуры, если 3'-конец одной цепи РНК выходит за пределы 5'-конца другой цепи (3' липкий конец), или наоборот (5' липкий конец). Нуклеотиды, содержащие липкие концы, могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. В одном варианте осуществления по меньшей мере одна цепь молекулы интерферирующей РНК имеет 3' липкий конец от приблизительно 1 до приблизительно 6 нуклеотидов в длину. В других вариантах осуществления 3' липкий конец составляет от приблизительно 1 до приблизительно 5 нуклеотидов, от приблизительно 1 до приблизительно 3 нуклеотидов и от приблизительно 2 до приблизительно 4 нуклеотидов в длину.

Если молекула интерферирующей РНК содержит 3' липкий конец с одного конца молекулы, другой конец может быть с тупыми концами, или также иметь липкий конец (5' или 3'). Если молекула интерферирующей РНК содержит липкий конец с обоих концов молекулы, длина липких концов может быть одинаковой или разной. В одном варианте осуществления молекула интерферирующей РНК содержит 3' липкие концы от приблизительно 1 до приблизительно 3 нуклеотидов на обоих концах молекулы. В дополнительном варианте осуществления молекула интерферирующей РНК представляет собой двухцепочечную РНК, имеющую 3' липкий конец из 2 нуклеотидов с обоих концов молекулы. В еще одном варианте осуществления нуклеотиды, включающие в себя липкий конец интерферирующей РНК, представляют собой динуклеотиды ТТ или динуклеотиды UU.

При определении процентной идентичности молекулы интерферирующей РНК, содержащей один или несколько липких концов, с последовательностью целевой иРНК, липкий конец (концы) может учитываться или не учитываться. Например, нуклеотиды с 3' липкого конца и вплоть до 2 нуклеотидов с 5'- или 3'-конца двойной цепи могут быть модифицированы без существенной потери активности молекулы малой интерферирующей РНК.

Молекулы интерферирующей РНК могут содержать одну или несколько структур 5' или 3'-кэпа. Молекула интерферирующей РНК может содержать структуру кэпа на 3'-конце смысловой цепи, антисмысловой цепи или как смысловой, так и антисмысловой цепи; или с 5'-конца смысловой цепи, антисмысловой цепи или как смысловой, так и антисмысловой цепи молекулы интерферирующей РНК. В качестве альтернативы, молекула интерферирующей РНК может содержать структуру кэпа как с 3'-конца, так и с 5'-конца молекулы интерферирующей РНК. Термин «структура кэпа» относится к химической модификации, встроенной с любого конца олигонуклеотида, которая защищает молекулу от расщепления эндонуклеазой и может также облегчать доставку или локализацию внутри клетки.

Другой модификацией, применяемой к молекулам интерферирующей РНК, является химическое связывание с молекулой интерферирующей РНК одного или нескольких фрагментов или конъюгатов, которые повышают активность, клеточное распределение, клеточный захват, биодоступность или стабильность молекулы интерферирующей РНК. Полинуклеотиды можно синтезировать или модифицировать с помощью способов, хорошо обоснованных в данной области. Химические модификации могут включать, помимо прочего, 2'-модификации, введение неприродных оснований, ковалентное присоединение лиганда и замещение фосфатных связей тиофосфатными связями. В данном варианте осуществления целостность двуспиральной структуры усиливают с помощью по меньшей мере одной и, как правило, двух химических связей. Химическое связывание может достигаться с помощью любого из множества хорошо известных методик, например, путем введения ковалентных, ионных или водородных связей; гидрофобных взаимодействий, Ван-дер-Ваальсовых или стекинговых взаимодействий; посредством металл-ионной координации или благодаря использованию пуриновых аналогов.

Нуклеотиды на одной или обеих из двух одинарных цепей можно модифицировать для модулирования активации клеточных ферментов, таких как, например, без ограничения, определенные нуклеазы. Методики для снижения или ингибирования активации клеточных ферментов известны в данной области и включают, помимо прочего, 2'-аминомодификации, 2'-фтормодификации, 2'-алкилмодификации, модификации незаряженной основой, морфолиновые модификации, 2'-O-метилмодификации и фосфорамидат. Таким образом, по меньшей мере одну 2'-гидроксильную группу нуклеотидов на двухцепочечной РНК замещают химической группой. Также, по меньшей мере один нуклеотид можно модифицировать с образованием закрытого нуклеотида. Такой закрытый нуклеотид содержит метиленовый или этиленовый мостик, который соединяет 2'-кислород рибозы с 4'-углеродом рибозы. Введение закрытого нуклеотида в олигонуклеотид улучшает аффиность к комплементарной последовательности и увеличивает температуру плавления на несколько градусов.

Можно конъюгировать лиганды с молекулой интерферирующей РНК, например, для повышения в отношении нее клеточной абсорбции. В определенных вариантах осуществления гидрофобный лиганд конъюгируют с молекулой для облегчения прямого прохождения сквозь клеточную мембрану. Данные подходы использованы для облегчения прохождения в клетку антисмысловых олигонуклеотидов. В определенных случаях конъюгация катионного лиганда с олигонуклеотидами часто приводит к улучшенной устойчивости к нуклеазам. Типичные примеры катионных лигандов включают пропиламмоний и диметилпропиламоний. Антисмысловые олигонуклеотиды могут сохранять свою высокую аффинность связывания с иРНК, когда катионный лиганд рассредоточен по всему олигонуклеотиду.

Молекулы и полинуклеотиды, описанные в данном документе, можно получить с помощью хорошо известных методик твердофазного синтеза. Любые другие средства для такого синтеза, известные в данной области, можно использовать дополнительно или в качестве альтернативы.

«Targeted Induced Local Lesions In Genomes» (нацеленные индуцированные локальные повреждения в геноме, TILLING) представляет собой еще одну технологию мутагенеза, которую можно использовать для создания и/или идентификации полинуклеотидов, кодирующих полипептиды с модифицированной экспрессией и/или активностью. TILLING также позволяет отбор растений, несущих такие мутации. В TILLING комбинируют мутагенез высокой плотности со способами высокопроизводительного скрининга. Способы для проведения TILLING хорошо известны в данной области (см. McCallum et al, (2000) Nat Biotechnol 18: 455-457 и Stemple (2004) Nat Rev Genet 5(2): 145-50).

Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или конструкций интерферирующей РНК, которые содержат один или несколько полинуклеотидов, описанных в данном документе.

Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или одну или несколько конструкций интерферирующей РНК, описанных в данном документе.

Различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или одну или несколько конструкций интерферирующей РНК, кодирующих один или несколько полинуклеотидов интерферирующей РНК, описанных в данном документе, которые способны к самоотжигу с образованием структуры шпильки, в которых конструкция содержит (а) один или несколько полинуклеотидов, описанных в данном документе; (b) вторую последовательность, кодирующую спейсерный элемент, который образует петлю структуры шпильки; и (с) третью последовательность, содержащую обратно комплементарную

последовательность первой последовательности, расположенную в той же ориентации, как и первая последовательность, где вторая последовательность расположена между первой последовательностью и третьей последовательностью и вторая последовательность функционально связана с первой последовательностью и третьей последовательностью.

Раскрытые последовательности можно использовать для конструирования различных полинуклеотидов, которые не образуют структуры шпильки. Например, двухцепочечную РНК можно образовать посредством (1) транскрибирования первой цепи ДНК путем функционального связывания с первым промотором и (2) транскрибирования обратно комплементарной последовательности фрагмента ДНК первой цепи путем функционального связывания со вторым промотором. Каждую цепь полинуклеотида можно транскрибировать из одного вектора экспрессии, или из разных векторов экспрессии. Двойную спираль РНК, имеющую активность РНК-интерференции, можно ферментативно превратить в малые интерферирующие РНК для модулирования уровней РНК.

Таким образом, различные варианты осуществления направлены на векторы экспрессии, содержащие один или несколько полинуклеотидов или конструкций интерферирующей РНК, описанных в данном документе, кодирующих полинуклеотиды интерферирующей РНК, способные к самоотжигу, в которых конструкция содержит (а) один или несколько полинуклеотидов, описанных в данном документе; и (b) вторую последовательность, содержащую комплементарную (например, обратно комплементарную) последовательность первой последовательности, расположенную в той же ориентации, что и первая последовательность.

Предусмотрены различные композиции и способы для модулирования уровней эндогенной экспрессии одного или нескольких полипептидов, описанных в данном документе (или любой их комбинации, описанной в данном документе) путем стимулирования косупрессии экспрессии гена. Феномен косупрессии возникает как результат введения множества копий трансгена в растительную клетку-хозяина. Интеграция множества копий трансгена может приводить к модулированию экспрессии трансгена и нацеленного эндогенного гена. Степень косупрессии зависит от степени идентичности последовательности между трансгеном и нацеленным эндогенным геном. Сайленсинг как эндогенного гена, так и трансгена может происходить из-за обширного метилирования подавляемых локусов (то есть, эндогенного промотора и эндогенного представляющего интерес гена), что может нарушать транскрипцию. В качестве альтернативы, в некоторых случаях косупрессия эндогенного гена и трансгена может происходить посредством пост-транскрипционного сайленсинга гена, при котором транскрипты могут быть получены, но повышенные уровни расщепления препятствуют накоплению транскриптов. Механизм косупрессии посредством пост-транскрипционного сайленсинга генов, как полагают, напоминает РНК-интерференцию в том, что РНК, по-видимому, важна как инициатор и мишень в этих процессах, и может быть опосредован, по меньшей мере частично, с помощью того же молекулярного механизма, возможно, через РНК-направляемое расщепление иРНК.

Косупрессию нуклеиновых кислот можно достичь путем введения множества копий нуклеиновой кислоты или ее фрагментов в качестве трансгенов в геном представляющего интерес растения. Растение-хозяина можно

трансформировать вектором экспрессии, содержащим промотор, функционально связанный с такой нуклеиновой кислотой или ее фрагментами. Различные варианты осуществления направлены на векторы экспрессии для способствования косупрессии эндогенных генов, содержащих промотор, функционально связанный с полинуклеотидом.

Различные варианты осуществления направлены на способы модулирования уровня экспрессии одного или более полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе) путем введения множества копий полинуклеотида (полинуклеотидов) в геном растения (табака), включающие: трансформирование растительной клетки-хозяина вектором экспрессии, который содержит промотор, функционально связанный с полинуклеотидом.

Различные композиции и способы предусмотрены для модулирования уровня экспрессии эндогенного гена путем модулирования трансляции иРНК. Растительную клетку-хозяина (табака) можно трансформировать вектором экспрессии, содержащим: промотор, функционально связанный с полинуклеотидом, расположенным в антисмысловой ориентации по отношению к промотору для обеспечения возможности экспрессии полинуклеотидов РНК, имеющих последовательность, комплементарную участку иРНК.

Различные векторы экспрессии для модулирования трансляции иРНК могут содержать: промотор, функционально связанный с полинуклеотидом, в антисмысловой ориентации по отношению к промотору. Длина полинуклеотидов антисмысловой РНК может варьировать и составлять от приблизительно 15-20 нуклеотидов, приблизительно 20-30 нуклеотидов, приблизительно 30-50 нуклеотидов, приблизительно 50-75 нуклеотидов, приблизительно 75-100 нуклеотидов, приблизительно 100-150 нуклеотидов, приблизительно 150-200 нуклеотидов и приблизительно 200-300 нуклеотидов.

Способы получения мутантных полинуклеотидов и полипептидов также предусмотрены. Любое представляющее интерес растение, в том числе растительную клетку или растительный материал, можно генетически модифицировать различными способами, известными для индукции мутагенеза, в том числе сайт-направленный мутагенез, олигонуклеотид-направленный мутагенез, химически индуцированный мутагенез, индуцированный облучением мутагенез, мутагенез с использованием модифицированных оснований, мутагенез с использованием содержащей разрывы двуспиральной ДНК, мутагенез двухцепочечных разрывов, мутагенез с использованием дефицитных по репарации штаммов хозяев, мутагенез посредством общего генного синтеза, перетасовка ДНК и другие эквивалентные способы.

В качестве альтернативы, гены можно нацелить для инактивации путем введения транспозонов (например, IS-элементов) в геномы представляющих интерес растений. Данные мобильные генетические элементы можно ввести путем полового перекрестного опыления и инсерционных мутантов можно проверить на потерю активности белка. Разрушенный ген родительского растения можно ввести в другие растения путем скрещивания родительского растения с растением, не подвергнутым индуцированному транспозоном мутагенезу, например, путем полового перекрестного опыления. Можно использовать любые стандартные методики селекции, известные специалистам в данной области. В одном варианте осуществления один или несколько генов можно инактивировать путем инсерции одного или нескольких транспозонов. Мутации могут привести к гомозиготному разрушению одного или нескольких генов, к гетерозиготному разрушению одного или нескольких генов, или к комбинации гомозиготных и гетерозиготных разрушений, если разрушен более чем один ген. Подходящие перемещающиеся элементы включают в себя ретротранспозоны, ретропозоны и SINE-подобные элементы. Такие способы известны специалистам в данной области.

В качестве альтернативы, гены можно нацелить для инактивации путем введения рибозимов, полученных из ряда малых кольцевых РНК, которые способны к саморасщеплению и репликации в растениях. Данные РНК могут реплицироваться либо самостоятельно (РНК вироида), или с вспомогательным вирусом (сателлитные РНК). Примеры подходящих РНК включают полученные из вироида солнечной пятнистости авокадо и сателлитные РНК, полученные из вируса кольцевой пятнистости табака, вируса временной полосатости люцерны, вируса бархатной пятнистости табака, вируса пятнистости Solanum nodiflorum к вируса пятнистости клевера подземного. Различные специфичные к целевой РНК рибозимы известны специалистам в данной области.

В некоторых вариантах осуществления экспрессию полипептида модулируют нетрансгенными средствами, такими как создание мутации в гене. Способы, с помощью которых вводят случайную мутацию в генную последовательность, могут включать химический мутагенез, мутагенез EMS и радиационный мутагенез. Способы, с помощью которых вводят одну или несколько нацеленных мутаций в клетку, включают, помимо прочего, технологию редактирования генома, в частности, мутагенез, опосредованный нуклеазой цинкового пальца, TILLING (нацеленные индуцированные локальные повреждения в геноме), гомологичную рекомбинацию, олигонуклеотид-направленный мутагенез и мутагенез, опосредованный мегануклеазой.

Некоторые неоганичивающие примеры мутаций представляют собой делеции, инсерции и миссенс-мутации по меньшей мере одного нуклеотида, однонуклеотидные полиморфизмы и простую повторяющуюся последовательность. После мутации можно провести скрининг для выявления мутаций, которые создают ранние стоп-кодоны или другим образом нефункциональные гены. После мутации можно провести скрининг для выявления мутаций, которые создают функциональные гены, способные экспрессироваться на повышенных уровнях. Скриниг мутантов можно выполнить путем секвенирования, или с использованием одного или нескольких зондов или праймеров, специфичных для данного гена или белка. Можно также создать в полинуклеотидах конкретные мутации, которые приводят к модулированию экспрессии гена, модулированию стабильности иРНК или модулированию стабильности белка. Такие растения названы в данном документе как «не встречающиеся в природе» или «мутантные» растения. Как правило, мутантные или не встречающиеся в природе растения будут включать в себя по меньшей мере часть чужеродной или синтетической или искусственной нуклеиновой кислоты (например, ДНК или РНК), которая не представлена в растении до манипулирования им. Чужеродная нуклеиновая кислота может быть одним нуклеотидом, двумя или более нуклеотидами, двумя или более смежными нуклеотидами или двумя или более несмежными нуклеотидами, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 или 1500 более смежными или несмежными нуклеотидами.

Мутантные или не встречающиеся в природе растения могут иметь любую комбинацию одной или нескольких мутаций, которая приводит к модулированию уровней белка. Например, мутантные или не встречающиеся в природе растения могут иметь одну мутацию в одном гене; несколько мутаций в одном гене; одну мутацию в двух или более, или трех или более генах; или несколько мутаций в двух или более, или трех или более генах. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций в конкретной области гена(-оз), например, в области гена, которая кодирует активный сайт белка или его часть. В качестве дополнительного примера, мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций в области вне одного или более гена(-ов), например, в области выше по цепи или ниже по цепи гена, который он регулирует, при условии, что они модулируют активность или экспрессию гена(-ов). Элементы, расположенные выше по цепи, могут включать в себя промоторы, энхансеры или транскрипционные факторы. Некоторые элементы, такие как энхансеры, могут располагаться выше по цепи или ниже по цепи гена, который они регулируют. Элемент(ы) не обязательно расположен рядом с геном, который он регулирует, поскольку некоторые элементы, как было обнаружено, расположены на несколько тысяч пар оснований выше по цепи или ниже по цепи гена, который они регулируют. Мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций, расположенных в первых 100 нуклеотидах гена(-ов), в первых 200 нуклеотидах гена(-ов), в первых 300 нуклеотидах гена(-ов), в первых 400 нуклеотидах гена(-ов), в первых 500 нуклеотидах гена(-ов), в первых 600 нуклеотидах гена(-ов), в первых 700 нуклеотидах гена(-ов), в первых 800 нуклеотидах гена(-ов), в первых 900 нуклеотидах гена(-ов), в первой 1000 нуклеотидов гена(-ов), в первых 1100 нуклеотидах гена(-ов), в первых 1200 нуклеотидах гена(-ов), в первых 1300 нуклеотидах гена(-ов), в первых 1400 нуклеотидах гена(-ов) или в первых 1500 нуклеотидах гена(-ов). Мутантные или не встречающиеся в природе растения могут иметь одну или несколько мутаций, расположенных в первом, втором, третьем, четвертом, пятом, шестом, седьмом, восьмом, девятом, десятом; одиннадцатом, двенадцатом, тринадцатом, четырнадцатом или пятнадцатом наборе из 100 нуклеотидов гена(-ов) или их комбинации. Раскрыты мутантные или не встречающиеся в природе растения (например, мутантные, не встречающиеся в природе или трансгенные растения и тому подобное, как описано в данном документе), содержащие варианты мутантного полипептида.

В одном варианте осуществления семена растений подвергают мутагенезу и затем выращивают из них мутантные растения первого поколения. Затем растениям первого поколения позволяют самоопылиться и из семян от растений первого поколения выращивают растения второго поколения, которые затем проверяют на мутации в их локусах. Не смотря на то, что подвергнутый мутации растительный материал можно проверить на мутации, преимуществом скрининга растений второго поколения является то, что все соматические мутации соответствуют зародышевым мутациям. Специалисту в данной области будет понятно, что различный растительный материал, в том числе, помимо прочего, семена, пыльцу, растительные ткани или растительные клетки, можно подвергнуть мутагенезу для того, чтобы создать мутантные растения. Однако тип растительного материала, подвергнутого мутагенезу, может иметь значение, когда растительную нуклеиновую кислоту проверяют на мутации. Например, когда пыльцу подвергают мутагенезу до опыления не подвергнутого мутагенезу растения, из семян, полученных при этом опылении, выращивают растения первого поколения. Каждая клетка растений первого поколения будет содержать мутации, созданные в пыльце; таким образом, эти растения первого поколения можно затем проверить на мутации вместо того, чтобы ждать появления второго поколения.

Мутагены, которые создают главным образом точечные мутации и короткие делеции, инсерции, трансверсии и/или транзиции, включая химические мутагены и облучение, можно использовать для создания мутаций. Мутагены включают, помимо прочего, этилметансульфонат, метилметансульфонат, N-этил-N-нитрозомочевину, триэтилмеламин, N-метил-N-нитрозомочевину, прокарбазин, хлорамбуцил, циклофосфамид, диэтилсульфат, мономер акриламида, мельфалан, азотистый иприт, винкристин, диметилнитрозамин, N-метил-N'-нитро-нитрозогуанидин, нитрозогуанидин, 2-аминопурин, 7,12 диметил-бенз(а)антрацен, этиленоксид, гексаметилфосфорамид, бисульфан, диэпоксиалканы (диэпоксиоктан, диэпоксибутан и т.п.), 2-метокси-6-хлор-9[3-(этил-2-хлорэтил)аминопропиламино]акридина дигидрохлорид и формальдегид.

Спонтанные мутации в локусе, которые могут не быть непосредственно вызванными мутагеном, также предполагаются при условии, что они приводят к желаемому фенотипу. Подходящие мутагенные средства могут также включать в себя, например, ионизирующее излучение, например, рентгеновское излучение, гамма-излучение, излучение быстрых нейтронов и ультрафиолетовое излучение. Любой способ подготовки растительной нуклеиновой кислоты, известный специалистам в данной области, можно использовать для подготовки растительной нуклеиновой кислоты для скрининга мутаций.

Подготовленную нуклеиновую кислоту из отдельных растений, растительных клеток или растительного материала можно необязательно объединить для того, чтобы ускорить скрининг на мутации в популяции растений, происходящих из подвергнутых мутагенезу растительных тканей, клеток или материала. Можно проверить одно или несколько следующих поколений растений, растительных клеток или растительного материала. Размер необязательно объединенной группы зависит от чувствительности используемого способа скрининга.

После того, как образцы нуклеиновых кислот необязательно объединили, их можно подвергнуть методикам полинуклеотид-специфичной амплификации, таким как полимеразная цепная реакция. Любой один или несколько праймеров или зондов, специфичных для гена или последовательности, непосредственно примыкающей к гену, можно использовать для амплификации последовательностей в необязательно объединенном образце нуклеиновых кислот. Соответственно, один или несколько праймеров или зондов проектируют для амплификации областей локуса, в которых с наибольшей вероятностью возникают пригодные мутации. Наиболее предпочтительно праймер проектируют для обнаружения мутаций в областях полинуклеотида. Дополнительно, предпочтительным для праймера(-ов) и зонда(-ов) было бы избегать известных полиморфных сайтов для того, чтобы облегчить скрининг точечных мутаций. Для облегчения обнаружения продуктов амплификации один или несколько праймеров или зондов можно пометить с использованием любого общепринятого способа нанесения метки. Праймер(ы) или зонд(ы) можно спроектировать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области.

Для облегчения обнаружения продуктов амплификации праймер(ы) или зонд(ы) можно пометить с использованием любого общепринятого способа нанесения метки. Их можно спроектировать на основе последовательностей, описанных в данном документе, с помощью способов, которые хорошо известны в данной области.

Полиморфизмы можно идентифицировать с помощью средств, известных в данной области, и некоторых из описанных в литературе.

В дополнительном аспекте предусмотрен способ получения мутантного растения. Способ включает получение по меньшей мере одной клетки растения, содержащей ген, кодирующий функциональный полинуклеотид, описанный в данном документе (или любую из комбинацию, описанную в данном документе). Далее, эту по меньшей мере одну клетку растения обрабатывают в условиях, эффективных для модулирования активности полинуклеотида(-ов). описанного в данном документе. По меньшей мере одну мутантную растительную клетку затем размножают в мутантное растение, где мутантное растение имеет модулированный уровень описанного полипептида(-ов) (или любой их комбинации, описанной в данном документе) по сравнению с уровнем у контрольного растения. В одном варианте осуществления данного способа изготовления мутантного растения этап обработки включает подвергание по меньшей мере одной клетки воздействию химического мутагенного средства, как описано выше по цепи, и в условиях, эффективных для получения по меньшей мере одной мутантной растительной клетки. В другом варианте осуществления данного способа этап обработки включает подвергание по меньшей мере одной клетки воздействию источника излучения в условиях, эффективных для получения по меньшей мере одной мутантной растительной клетки. Термин «мутантное растение» включает мутантные растения, в которых генотип модифицирован по сравнению с контрольным растением, соответственно, с помощью средств помимо генной инженерии и генетической модификации.

В определенных вариантах осуществления мутантное растение, мутантная растительная клетка или мутантный растительный материал может содержать одну или несколько мутаций, которые встречаются в природе в другом растении, растительной клетке или растительном материале и предоставляют желаемый признак. Эту мутацию можно встроить (например, путем интрогрессии) в другое растение, растительную клетку или растительный материал (например, растение, растительную клетку или растительный материал с другим генетическим фоном относительно растения, из которого получили мутацию) для предоставления ему признака. Таким образом, в качестве примера, мутацию, которая встречается в природе в первом растении, можно ввести во второе растение, например, второе растение с другим генетическим фоном относительно первого растения. Специалист в данной области, таким образом, способен вести поиск и идентифицировать растение, несущее естественным образом в своем геноме один или несколько мутантных аллелей генов, описанных в данном документе, которые предоставляют желаемый признак. Мутантный аллель(-и), который встречается в природе, можно перенести во второе растение различными способами, включая селекцию, обратное скрещивание и интрогрессию с получением линий, разновидностей или гибридов, которые имеют одну или несколько мутаций в генах, описанных в данном документе. Растения, демонстрирующие желаемый признак, можно отобрать из пула мутантных растений. Соответственно, отбор выполняют с использованием сведений о нуклеиновых кислотах, описанных в данном документе. В результате можно провести отбор генетического признака по сравнению с контролем. Такой скрининговый подход может включать применение общепринятых методик амплификации и/или гибридизации нуклеиновых кислот, как обсуждается в данном документе. Таким образом, дополнительный аспект настоящего изобретения относится к способу идентификации мутантного растения, который включает этапы: (а) получения образца, содержащего нуклеиновую кислоту из растения; и (b) определения последовательности нуклеиновых кислот полинуклеотида, где различие в последовательности полинуклеотида по сравнению с полинуклеотидной последовательностью контрольного растения свидетельствует, что указанное растение является мутантным растением. В другом аспекте предусмотрен способ идентификации мутантного растения, которое накапливает сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из растения, подлежащего скринингу; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе; и (с) определения (i) содержания нитратов и/или (ii) по меньшей мере содержания NNK в указанном растении. Соответственна содержание по меньшей мере NNK и/или нитратов определяют в зеленых листьях. В другом аспекте предусмотрен способ получения мутантного растения, которое имеет сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе, которые приводят к сниженным уровням по меньшей мере NNK и/или нитратов; и (с) перенос одной или нескольких мутаций во второе растение. Соответственно, содержание NNK и/или нитратов определяют в зеленых листьях. Мутацию (мутации) можно перенести во второе растение с помощью различных способов, которые известны в данной области, например, с помощью генной инженерии, генетической манипуляции, интрогрессии, селекции растений, обратного скрещивания и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение имеет другой генетический фон относительно первого растения. В другом аспекте предусмотрен способ получения мутантного растения, которое имеет сниженные уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением, включающий этапы: (а) получения образца из первого растения; (b) определения того, содержит ли указанный образец одну или несколько мутаций в одном или нескольких полинуклеотидах, описанных в данном документе, которые приводят к сниженным уровням по меньшей мере NNK и/или нитратов; и (с) интрогрессии одной или нескольких мутаций из первого растения во второе растение. Соответственно, содержание NNK и/или нитратов определяют в зеленых листьях. В одном варианте осуществления этап интрогрессии включает в себя селекцию растений, необязательно включая обратное скрещивание и т.п. В одном варианте осуществления первое растение является встречающимся в природе растением. В одном варианте осуществления второе растение имеет другой генетический фон относительно первого растения. В одном варианте осуществления первое растение не представляет собой сорт или элитный сорт. В одном варианте осуществления второе растение представляет собой сорт или элитный сорт. Следующий аспект относится к мутантному растению (включая мутантное растение сорта или элитного сорта), полученное или получаемое с помощью способов, описанных в данном документе. В определенных вариантах осуществления «мутантные растения» могут иметь одну или несколько мутаций, локализованных только в конкретной области растения, например, в последовательности одного или более полинуклеотида(-ов), описанного в данном документе. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения будет такой же или по существу такой же, как у растения до мутагенеза.

В определенных вариантах осуществления «мутантные растения» могут иметь одну или несколько мутаций, локализованных в более чем одной области растения, например, в последовательности одного или нескольких полинуклеотидов, описанных в данном документе, и в одном или нескольких дополнительных областях генома. Согласно данному варианту осуществления остальная геномная последовательность мутантного растения не будет такой же или не будет по существу такой же, как у растения до мутагенеза. В определенных вариантах осуществления мутантные растения могут не иметь одну или несколько мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более экзонах полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в одном или более, двух или более, трех или более, четырех или более или пяти или более интронах полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в промоторе полинуклеотида(-ов),' описанного в данном документе; или могут не иметь одну или несколько мутаций в 3'-нетранслируемой области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в 3'-нетранслируемой области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в кодирующей области полинуклеотида(-ов), описанного в данном документе; или могут не иметь одну или несколько мутаций в некодирующей области полинуклеотида(-ов), описанного в данном документе; или любую комбинацию двух или более, трех или более, четырех или более, пяти или более или шести или более из их частей.

В следующем аспекте предусмотрен способ идентификации растения, растительной клетки или растительного материала, содержащего мутацию в гене, кодирующем полинуклеотид, описанный в данном документе, включающий: (а) подвергание растения, растительной клетки или растительного материала мутагенезу; (b) получение образца нуклеиновой кислоты из указанного растения, растительной клетки или растительного материала или их потомков; и (с) определение последовательности нуклеиновых кислот гена, кодирующего полинуклеотид, описанный в данном документе, или его вариантов или фрагментов, где различие в указанной последовательности свидетельствует об одной или нескольких мутациях в ней.

Белки цинкового пальца можно использовать для модулирования экспрессии или активности одного или нескольких полинуклеотидов, описанных в данном документе. В различных вариантах осуществления последовательность геномной ДНК, содержащую часть или всю кодирующую последовательность полинуклеотида, модифицируют путем мутагенеза, опосредованного нуклеазой цинкового пальца. В последовательности геномной ДНК проводят поиск уникального сайта связывания белка цинкового пальца. В качестве альтернативы, в последовательности геномной ДНК проводят поиск двух уникальных сайтов связывания белка цинкового пальца, где оба сайта находятся на противоположных цепях и близко друг к другу, например, 1, 2, 3, 4, 5, 6 или более пар оснований в сторону. Соответственно, предусмотрены белки цинкового пальца, которые связываются с полинуклеотидами.

Белок цинкового пальца можно сконструировать для распознавания выбранного целевого сайта в гене. Белок цинкового пальца может содержать любую комбинацию мотивов, полученных из природных ДНК-связывающих доменов цинкового пальца и неприродных ДНК-связывающих доменов цинкового пальца путем усечения или расширения или процесса сайт-направленного мутагенеза в сочетании со способом отбора, таким как, помимо прочего, отбор фагового дисплея, бактериальный двугибридный отбор или бактериальный одногибридный отбор. Термин «неприродный ДНК-связывающий домен цинкового пальца» относится к ДНК-связывающему домену цинкового пальца, который связывает последовательность из трех пар оснований в целевой нуклеиновой кислоте и который не происходит из клетки или организма, содержащего нуклеиновую кислоту, которая должна быть модифицирована. Способы проектирования белка цинкового пальца, который связывает специфические нуклеиновые последовательности, являющиеся уникальными для целевого гена, известны в данной области.

Нуклеазу цинкового пальца можно сконструировать путем изготовления слияния между первым полинуклеотидом, кодирующим белок цинкового пальца, который связывается с полинуклеотидом, и вторым полинуклеотидом, кодирующим неспецифическую эндонуклеазу, такую как, помимо прочего, эндонуклеаза типа IIS. Белок слияния между белком цинкового пальца и нуклеазой может содержать спейсер, состоящий из двух пар оснований или, в качестве альтернативы, спейсер, состоящий из трех, четырех, пяти, шести, семи или более пар оснований. В различных вариантах осуществления нуклеаза цинкового пальца вводит двухцепочечный разрыв в регуляторную область, кодирующую область или некодирующую область последовательности геномной ДНК полинуклеотида и приводит к снижению уровня экспрессии полинуклеотида или снижению активности белка, кодируемого им. Расщепление с помощью нуклеаз цинкового пальца часто приводит к делеции ДНК в сайте расщепления с последующей репарацией ДНК путем сращивания негомологичных концов.

В других вариантах осуществления белок цинкового пальца можно выбрать для связывания с регуляторной последовательностью полинуклеотида. Более конкретно, регуляторная последовательность может содержать сайт инициации транскрипции, стартовый кодон, область экзона, границу раздела экзон-интрон, терминатор или стоп-кодон. Соответственно, данное изобретение предусматривает мутантное, не встречающееся в природе или трансгенное растение или растительную клетку, полученную с помощью мутагенеза, опосредованного нуклеазой цинкового пальца, вблизи от или в одном или нескольких полинуклеотидах, описанных в данном документе, и способы изготовления такого растения или растительной клетки с помощью мутагенеза, опосредованного нуклеазой цинкового пальца. Способы доставки белка цинкового пальца и нуклеазы цинкового пальца в растение табака подобны описанным ниже для доставки мегануклеазы.

В другом аспекте описаны способы получения мутантных, не встречающихся в природе или трансгенных или другим образом генетически модифицированных растений с использованием мегануклеаз, таких как I-CreI. Встречающиеся в природе мегануклеазы, а также рекомбинантные мегануклеазы можно использовать для того, чтобы специфически вызвать двухцепочечный разрыв в одном сайте или в относительно небольшом числе сайтов в геномной ДНК растения с разрушением одного или нескольких полинуклеотидов, описанных в данном документе. Мегануклеаза может быть сконструированной мегануклеазой с измененными свойствами распознавания ДНК. Белки мегануклеаз можно доставить в растительные клетки с помощью ряда различных механизмов, известных в данной области.

Настоящее изобретение охватывает использование мегануклеаз для инактивации полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, описанной в данном документе), в растительной клетке или растении. В частности, настоящее изобретение предусматривает способ инактивации полинуклеотида в растении с помощью мегануклеазы, включающий: (а) получение растительной клетки, содержащей полинуклеотид, описанный в данном документе; (b) введение мегануклеазы или конструкции, кодирующей мегануклеазу, в указанную растительную клетку и (с) предоставление возможности мегануклеазе по существу инактивировать полинуклеотид(ы)

Мегануклеазы можно использовать для расщепления сайтов распознавания мегануклеазы в кодирующих областях полинуклеотида. Такое расщепление часто приводит к делеции ДНК в сайте распознавания мегануклеазы с последующей репарацией мутагенной ДНК путем сращивания негомологичных концов. Такие мутации в кодирующей последовательности гена являются, как правило, достаточными для инактивации гена. Этот способ модификации растительной клетки включает, во-первых, доставку кассеты экспрессии мегануклеазы в растительную клетку с помощью подходящего способа трансформации. Для достижения максимальной эффективности желательно связать кассету экспрессии мегануклеазы с селектируемым маркером и отобрать успешно трансформированные клетки в присутствии средства отбора. Этот подход приведет к интеграции кассеты экспрессии мегануклеазы в геном, что, однако, может быть нежелательным, если растение, скорее всего, потребует нормативного утверждения. В таких случаях кассету экспрессии мегануклеазы (и связанный селектируемый маркерный ген) можно выделить из последующих поколений растения с использованием традиционных методик селекции. В качестве альтернативы, растительные клетки можно изначально трансформировать кассетой экспрессии мегануклеазы без селектируемого маркера и можно вырастить на средах без средства отбора. В таких условиях часть обработанных клеток приобретет кассету экспрессии мегануклеазы и будет экспрессировать сконструированную мегануклеазу временно без интеграции кассеты экспрессии мегануклеазы в геном. Поскольку это не приводит к эффективности трансформации, последняя методика трансформации требует скрининга большего количества обработанных клеток для получения желаемой модификации генома. Описанный выше подход можно также применить для модификации растительной клетки при использовании белка цинкового пальца или нуклеазы цинкового пальца.

После доставки кассеты экспрессии мегануклеазы растительные клетки выращивают, изначально, в условиях, которые являются типичными для конкретной процедуры трансформации, которую использовали. Это может означать, что трансформированные клетки растут на средах при температуре ниже 26°С, часто в темноте. Такие стандартные условия можно использовать в течение периода времени, предпочтительно 1-4 дня, чтобы позволить растительной клетке восстановиться после процесса трансформации. В любой момент после этого начального периода восстановления температуру роста можно поднять для стимулирования активности сконструированной мегануклеазы относительно расщепления и мутирования сайта распознавания мегануклеазы.

Для определенных применений может быть желательным точно удалить полинуклеотид из генома растения. В таких применениях можно использовать пару сконструированных мегануклеаз, каждая из которых расщепляет сайт распознавания мегануклеазы по обе стороны от предполагаемой делеции. Также можно использовать эффекторные нуклеазы TAL (TALEN), которые способны распознавать и связываться с геном и вводить двухцепочечный разрыв в геном. Таким образом, в другом аспекте предполагаются способы получения мутантных, не встречающихся в природе или трансгенных или другим образом генетически модифицированных растений, описанных в данном документе, с помощью эффекторных нуклеаз TAL.

Растения, пригодные для использования в генетической модификации, включают, помимо прочего, однодольные и двудольные растения и системы растительных клеток, в том числе виды из одного из следующих семейств: Acanthaceae, Alliaceae, Alstroemeriaceae, Amaryllidaceae, Apocynaceae, Arecaceae. Asteraceae, Berberidaceae, Bixaceae, Brassicaceae, Bromeliaceae, Cannabaceae, Caryophyllaceae, Cephalotaxaceae, Chenopodiaceae, Colchicaceae, Cucurbitaceae, Dioscoreaceae, Ephedraceae, Erythroxylaceae, Euphorbiaceae, Fabaceae, Lamiaceae, Linaceae, Lycopodiaceae, Malvaceae, Melanthiaceae, Musaceae, Myrtaceae, Nyssaceae, Papaveraceae, Pinaceae, Plantaginaceae, Poaceae, Rosaceae, Rubiaceae, Salicaceae, Sapindaceae, Solanaceae, Taxaceae, Theaceae или Vitaceae.

Подходящие виды могут включать членов рода Abelmoschus, Abies, Acer, Agrostis, Allium, Alstroemeria, Ananas, Andrographis, Andropogon, Artemisia, Arundo, Atropa, Berberis, Beta, Bixa, Brassica, Calendula, Camellia, Camptotheca, Cannabis, Capsicum, Carthamus, Catharanthus, Cephalotaxus, Chrysanthemum, Cinchona, Citrullus, Coffea, Colchicum, Coleus, Cucumis, Cucurbita, Cynbdon, Datura, Dianthus, Digitalis, Dioscorea, Elaeis, Ephedra, Erianthus, Erythroxylum, Eucalyptus, Festuca, Fragaria, Galanthus, Glycine, Gossypium, Helianthus, Hevea, Hordeum, Hyoscyamus, Jatropha, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Lycopodium, Manihot, Medicago, Mentha, Miscanthus, Musa, Nicotiana, Oryza, Panicum, Papaver, Parthenium, Pennisetum, Petunia, Phalaris, Phleum, Pinus, Poa, Poinsettia, Populus, Rauwolfia, Ricinus, Rosa, Saccharum, Salix, Sanguinaria, Scopolia, Secale, Solanum, Sorghum, Spartina, Spinacea, Tanacetum, Taxus, Theobroma, Triticosecale, Triticum, Uniola, Veratrum, Vinca, Vitis и Zea.

Подходящие виды могут включать Panicum spp., Sorghum spp., Miscanthus spp., Saccharum spp., Erianthus spp., Populus spp., Andropogon gerardii (бородач), Pennisetum purpureum (слоновая трава), Phalaris arundinacea (двукисточник тростниковидный), Cynodon dactylon (свинорой пальчатый), Festuca arundinacea (овсяница тростниковая), Spartina pectinata (травянистое растение рода Spartina), Medicago sativa (люцерна), Arundo donax (арундо тростниковый), Secale cereale (рожь), Salix spp.(ива), Eucalyptus spp.(эвкалипт), Triticosecale (тритикале), бамбук, Helianthus annuus (подсолнечник), Carthamus tinctorius (сафлор), Jatropha curcas (ятрофа), Ricinus communis (клещевина), Elaeis guineensis (масличная пальма), Linum usitatissimum (лен), Brassica juncea, Beta vulgaris (сахарная свекла), Manihot esculenta (маниок), Lycopersicon esculentum (томат), Lactuca sativa (латук), Musyclise alca (банан), Solanum tuberosum (картофель), Brassica oleracea (брокколи, цветная капуста, брюссельская капуста), Camellia sinensis (чай), Fragaria ananassa (земляника), Theobroma cacao (какао), Coffe81ycliseca (кофе), Vitis vinifera (виноград), Ananas comosus (ананас), Capsicum annum (горький и сладкий перец), Allium сера (лук), Cucumis melo (дыня), Cucumis sativus (огурец), Cucurbita maxima (тыква гигантская), Cucurbita moschata (тыква мускатная), Spinacea oleracea (шпинат), Citrullus lanatus (арбуз), Abelmoschus esculentus (бамия), Solanum melongena (баклажан), Rosa spp.(роза), Dianthus caryophyllus (гвоздика), Petunia spp.(петуния), Poinsettia pulcherrima (пуансеттия), Lupinus albus (люпин), Uniola paniculata (овес), полевица (Agrostis spp.), Populus tremuloides (тополь осинообразный), Pinus spp.(сосна), Abies spp: (пихта), Acer spp.(клен), Hordeum vulgare (ячмень), Poa pratensis (мятлик), Lolium spp.(плевел) и Phleum pratense (тимофеевка), Panicum virgatum (просо), Sorghu82yclise82or (сорго, суданская трава), Miscanthus giganteus (мискантус), Saccharum sp.(сахарный тростник), Populus balsamifera (тополь), Zea mays (кукуруза), Glycine max (соя), Brassica napus (канола), Triticum aestivum (пшеница), Gossypium hirsutum (хлопок), Oryza sativa (рис), Helianthus annuus (подсолнечник), Medicago sativa (люцерна), Beta vulgaris (сахарная свекла) или Pennisetum glaucum (просо жемчужное).

Различные варианты осуществления направлены на мутантные растения табака, не встречающиеся в природе растения табака или трансгенные растения табака, модифицированные для модулирования уровней экспрессии гена, в результате чего получают растение, например, растение табака, в котором уровень экспрессии полипептида модулируют в тканях растения, представляющего интерес, по сравнению с контрольным растением. Раскрытые композиции и способы можно применить к любому виду рода Nicotiana, в том числе N.rustica и N.tabacum (например, LA В21, LN KY171, TI 1406, Basma, Galpao, Perique, Beinhart 1000-1 и Petico). Другие виды включают N.acaulis, N46yclise4646ta, N82yclise4646ta var. multiflora, N46yclise46na, N.alata, N.amplexicaulis, N.arentsii, N46yclise4646ta, N.benavidesii, N.benthamiana, N.bigelovii, N.bonariensis, N.cavicola, N.clevelandii, N.cordifolia, N.corymbosa, N.debneyi, N.excelsior, N.forgetiana, N.fragrans, N.glauca, N.glutinosa, N.goodspeedii, N.gossei, N.hybrid, N.ingulba, N.kawakamii, N.knightiana, N.langsdorffii, N.linearis, N.longiflora, N46yclise46ma, N.megalosiphon, N.miersii, N.noctiflora, N.nudicaulis, N.obtusifolia, N.occidentalis, N.occidentalis subsp. hesperis, N.otophora, N.paniculata, N.pauciflora, N.petunioides, N.plumbaginifolia, N.quadrivalvis, N.raimondii, N.repanda, N.rosulata, N.rosulata subsp.ingulba, N.rotundifolia, N.setchellii, N.simulans, N.solanifolia, N.spegazzinii, N.stocktonii, N.suaveolens, N.sylvestris, N.thyrsiflora, N.tomentosa, N.tomentosiformis, N.trigonophylla, N.umbratica, N46yclise46ta, N.velutina, N.wigandioides и N. x sanderae.

Использование сортов табака и элитных сортов табака также предполагается в данном документе. Трансгенное, не встречающееся в природе или мутантное растение, следовательно, может быть разновидностью табака или элитным сортом табака, который содержит один или несколько трансгенов или одну или несколько генетических мутаций или их комбинацию. Генетическая мутация (мутации) (например, один или несколько полиморфизмов) может быть мутацией, которая не существует в природе в отдельной разновидности табака или сорте табака (например, элитном сорте табака), или может быть генетической мутацией (мутациями), которая существует в природе при условии, что мутация не существует в природе в отдельной разновидности табака или сорте табака (например, в элитном сорте табака).

Особенно пригодные разновидности Nicotiana tabacum включают тип табака Burley, темный тип, тип дымовой сушки и тип Oriental. Неограничивающими примерами разновидностей и сортов являются: BD 64, СС 101, СС 200, СС 27, СС 301, СС 400, СС 500, СС 600, СС 700, СС 800, СС 900, Coker 176, Coker 319, Coker 371 Gold, Coker 48, CD 263, DF911, DT 538 LC Galpao tobacco, GL 26H, GL 350, GL 600, GL 737, GL 939, GL 973, HB 04P, HB 04P LC, HB3307PLC, Hybrid 403LC, Hybrid 404LC, Hybrid 501 LC, K 149, K 326, K 346, K 358, K394, K 399, K 730, KDH 959, KT 200, KT204LC, KY10, KY14, KY 160, KY 17, KY 171, KY 907, KY907LC, KTY14xL8 LC, Little Crittenden, McNair 373, McNair 944, msKY 14xL8, Narrow Leaf Madole, Narrow Leaf Madole LC, NBH 98, N-126, N-777LC, N-7371LC, NC 100, NC 102, NC 2000, NC 291, NC 297, NC 299, NC 3, NC 4, NC 5, NC 6, NC7, NC 606, NC 71, NC 72, NC 810, NC BH 129, NC 2002, Neal Smith Madole, OXFORD 207, PD 7302 LC, PD 7309 LC, PD 7312 LC' «Periq'e» tobacco, PVH03, PVH09, PVH19, PVH50, PVH51, R 610, R 630, R 7-11, R 7-12, RG 17, RG 81, RG H51, RGH 4, RGH 51, RS 1410, Speight 168, Speight 172, Speight 179, Speight 210, Speight 220, Speight 225, Speight 227, Speight 234, Speight G-28, Speight G-70, Speight H-6, Speight H20, Speight NF3, TI 1406, TI 1269, TN 86, TN86LC, TN 90, TN 97, TN97LC, TN D94, TN D950, TR (Tom Rosson) Madole, VA 309, VA359, AA 37-1, В 13P, Xanthi Mitchell-Мог), Bel-W3, 79-615, Samsun Holmes NN, Hybrid 49 номер 2 KTRDC, Burley 21, KY 8959, KY 9, MD 609, PG 01, PG 04, PO1, PO2, РО3, RG 11, RG 8, VA 509, AS44, Banket A1, Basma Drama B84/31, Basma I Zichna ZP4/B, Basma Xanthi BX 2A, Batek, Besuki Jember, C104, Coker 347, Criollo Misionero, Delcrest, Djebel 81, DVH 405, Comum, HB04P, Hicks Broadleaf, Kabakulak Elassona, Kutsage E1, LA BU 21, NC 2326, NC 297, PVH 2110, Red Russian, Samsun, Saplak, Simmaba, Talgar 28, Wislica, Yayaldag, Prilep HC-72, Prilep P23, Prilep PB 156/1, Prilep P12-2/1, Yaka JK-48, Yaka JB 125/3, TI-1068, KDH-960, TI-1070, TW136, Basma, TKF 4028, L8, TKF 2002, GR141, Basma xanthi, GR149, GR153, Petit Havana. Разновидности вышеуказанного с низким преобразованием, даже если специально не идентифицированы в данном документе, также рассматриваются.

Варианты осуществления также направлены на композиции и способы получения мутантных растений, не встречающихся в природе растений, гибридных растений и трансгенных растений, которые были модифицированы для модулирования экспрессии или активности полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе). Преимущественно, мутантные растения, не встречающиеся в природе растения, гибридные растения или трансгенные растения, которые получают, могут быть подобными или по существу такими же по общему внешнему виду по сравнению с контрольными растениями. Различные фенотипические характеристики, такие как степень зрелости, количество листьев на растении, высоту стебля, угол врастания листьев, размер листа (ширина и длина), расстояние междоузлия и отношение листовая пластина-главная жилка можно оценить путем полевых наблюдений.

Один аспект относится к семенам мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Предпочтительно, семена представляют собой семена табака. Следующий аспект относится к пыльце или семяпочке мутантного растения, не встречающегося в природе растения, гибридного растения или трансгенного растения, описанного в данном документе. Кроме того, предусмотрено мутантное растение, не встречающееся в природе растение, гибридное растение или трансгенное растение, как описано в данном документе, которое дополнительно содержит нуклеиновую кислоту, предоставляющую мужскую стерильность.

Также предусмотрена тканевая культура возобновляемых клеток мутантного растения, не встречающегося в природе растения, гибридного растения, или трансгенного растения или его части, как описано в данном документе, при этом культура регенерирует растения, способные экспрессировать все морфологические и физиологические родительские характеристики. Регенерируемые клетки включают, помимо прочего, клетки из листьев, пыльцы, зародышей, семядолей, гипокотилей, корней, кончиков корней, пыльников, цветов и их части, семяпочек, побегов, цветоножек, стеблей, сердцевины и семенных коробочек или каллюса или протопластов, полученных из них.

Одним объектом является получение мутантного, трансгенного или не встречающегося в природе растения или его части, которая проявляет модулированные (например, сниженные) уровни TSNA в растительном материале, например, в высушенных листьях. Соответственно, мутантные, трансгенные или не встречающиеся в природе растения или их части, которые проявляют модулированные (например, сниженные) уровни по меньшей мере NNK и/или нитратов по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же. В определенных вариантах осуществления уровень по меньшей мере NNN, NAB и NAT будет по существу тем же. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAB будет снижен по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAT будет снижен по сравнению с контрольным растением. В определенных вариантах осуществления уровень по меньшей мере NNN будет по существу тем же, а уровень NAT и NAB будет снижен по сравнению с контрольным растением. Содержание никотина в мутантных, трансгенных или не встречающихся в природе растениях или их частях может быть по существу тем же по сравнению с контрольным или дикого типа растением или может быть ниже, чем в контрольном растении или растении дикого типа. Соответственно, мутантные, трансгенные или не встречающиеся в природе растения или их части имеют по существу тот же внешний вид, что и контрольное растение.

Четыре основных TSNA, те, присутствие которых, как правило, обнаруживается в самых высоких концентрациях, представляют собой N-нитрозоникотин (NNN), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанон (NNK), N-нитрозоанабазин (NAB) и N-нитрозоанатабин (NAT). Второстепенные соединения, те, которые, как правило, обнаруживаются на значительно более низких уровнях, чем основные TSNA, включают 4-(метилнитрозамино)-4-(3-пиридил)бутаналь (NNA), 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанол (NNAL), 4-(метилнитрозамино)4-(3-пиридил)-1-бутанол (изо-NNAL) и 4-(метилнитрозамино)-4-(3-пиридил)-1-масляная кислота (изо-NNAC). Сообщалось, что по меньшей мере NNN и NNK являются канцерогенными при применении в отношении животных в лабораторных исследованиях.

Соответственно, в данном документе описаны мутантные, трансгенные или не встречающиеся в природе растения или их части или растительные клетки, которые обладают модулированными (например, сниженными) уровнями по меньшей мере NNK и/или нитратов по сравнению с контрольными клетками или контрольными растениями. В определенных вариантах осуществления уровень NNN будет по существу тем же. Мутантные, трансгенные или не встречающиеся в природе растения или растительные клетки были модифицированы для модулирования (например, снижения) синтеза или активности одного или нескольких полипептидов, описанных в данном документе, путем модулирования экспрессии одной или нескольких соответствующих полинуклеотидных последовательностей, описанных в данном документе. Соответственно, модулированные уровни по меньшей мере NNK и/или нитратов наблюдаются по меньшей мере в зеленых листьях, соответственно, в высушенных листьях. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, может быть модулирован (например, снижен). В определенных вариантах осуществления уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, может быть модулирован (например, снижен).

Дополнительный аспект относится к мутантному, не встречающемуся в природе или трансгенному растению или клетке, где экспрессия или активность одного или нескольких полипептидов, описанных в данном документе, модулирована (например, снижена) и часть растения (например, зеленые листья, соответственно, высушенные листья или высушенный табак) имеет сниженные уровни нитратов и/или по меньшей мере NNK по меньшей мере на 5% по сравнению с контрольным растением, в котором экспрессия или активность указанного полипептида(-ов) не была модулирована. В определенных вариантах осуществления уровень NNN будет по существу тем же. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень общих TSNA в растении, например, в зеленых листьях, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%, и уровень никотина в растении, например, в зеленых листьях, соответственно, в высушенных листьях или высушенном табаке, также может быть модулирован (например, снижен), например, по меньшей мере на приблизительно 5%.

Еще один следующий аспект относится к высушенному растительному материалу, такому как высушенный лист или высушенный табак, полученному или получаемому из мутантного, не встречающегося в природе или трансгенного растения или клетки, где экспрессия одного или нескольких полинуклеотидов, описанных в данном документе, или активность белка, кодируемого ими, снижена и где уровень нитратов и/или NNK снижен по меньшей мере на 5% по сравнению с контрольным растением. В определенных вариантах осуществления уровень NNN будет по существу тем же.

Еще один следующий аспект относится к мутантному, не встречающемуся в природе или трансгенному высушенному растительному материалу, такому как лист или высушенный табак, который имеет уровни нитратов и/или NNK, сниженные по меньшей мере на 5% по сравнению с контрольным растением. В определенных вариантах осуществления уровень NNN будет по существу тем же. В определенных вариантах осуществления уровень общих TSNA в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень никотина в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5%. В определенных вариантах осуществления уровень общих TSNA в высушенном растительном материале также может быть снижен, например, по меньшей мере на приблизительно 5% и уровень никотина в высушенном растительном материале также может быть снижен по меньшей мере на приблизительно 5%.

В еще одном дополнительном аспекте предусмотрено мутантное, не встречающееся в природе или трансгенное растение или растительная клетка, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным растением или растением дикого типа и где (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно 110 нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.

В еще одном дополнительном аспекте предусмотрен мутантный, не встречающийся в природе или трансгенный лист, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным листом или листом дикого типа и где (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно ПО нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.

В еще одном следующем аспекте предусмотрен мутантный, не встречающийся в природе или трансгенный высушенный растительный материал, например, высушенный лист или высушенный табак, где экспрессия одного или нескольких полипептидов, описанных в данном документе, снижена по сравнению с контрольным растительным материалом или высушенным растительным материалом дикого типа и где: (i) содержание нитратов составляет приблизительно 7 мг/г или менее, например, приблизительно 6,9 мг/г или менее, приблизительно 6,8 мг/г или менее, приблизительно 6,7 мг/г или менее, приблизительно 6,6 мг/г или менее, приблизительно 6,5 мг/г или менее, приблизительно 6,4 мг/г или менее, приблизительно 6,3 мг/г или менее, приблизительно 6,2 мг/г или менее, приблизительно 6,1 мг/г или менее или приблизительно 6 мг/г или менее; и (ii) содержание NNK составляет приблизительно 110 нг/г или менее, например, приблизительно 109 нг/г или менее, приблизительно 108 нг/г или менее, приблизительно 107 нг/г или менее, приблизительно 106 нг/г или менее, приблизительно 105 нг/г или менее, приблизительно 104 нг/г или менее, приблизительно 103 нг/г или менее, приблизительно 102 нг/г или менее, приблизительно 101 нг/г или менее или приблизительно 100 нг/г или менее. В определенных вариантах осуществления уровень никотина составляет приблизительно 30 мг/г или менее, например, приблизительно 29,9 мг/г или менее, приблизительно 29,8 мг/г или менее, приблизительно 29,7 мг/г или менее, приблизительно 29,6 мг/г или менее, приблизительно 29,5 мг/г или менее, приблизительно 29,4 мг/г или менее, приблизительно 29,3 мг/г или менее, приблизительно 29,2 мг/г или менее, приблизительно 29,1 мг/г или менее или приблизительно 29 мг/г или менее. В определенных вариантах осуществления общее содержание TSNA составляет приблизительно 250 нг/г или менее, например, приблизительно 240 нг/г или менее, приблизительно 230 нг/г или менее, приблизительно 220 нг/г или менее, приблизительно 210 нг/г или менее, приблизительно 200 нг/г или менее, приблизительно 190 нг/г или менее, приблизительно 180 нг/г или менее, приблизительно 170 нг/г или менее, приблизительно 160 нг/г или менее или приблизительно 150 нг/г или менее.

Соответственно, внешний вид указанного растения или его части (например, листа) является по существу таким же, как у контрольного растения. Соответственно, растение представляет собой растение табака.

Варианты осуществления также направлены на композиции и способы для получения мутантных, не встречающихся в природе или трансгенных растений, которые были модифицированы для модулирования экспрессии или активности одного или нескольких полинуклеотидов или полипептидов, описанных в данном документе, которые могут в результате дать растения или составные части растения (например, листья, такие как зеленые листья или высушенные листья, или табак) с модулированными уровнями нитратов и/или NNK и/или NNN и/или TSNA и/или никотина по сравнению с контрольным растением.

Преимущественно, мутантные, не встречающиеся в природе или трансгенные растения, которые получены по способам, описанным в данном документе, являются подобными или по существу такими же по внешнему виду, как контрольные растения. В одном варианте осуществления вес листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления количество листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления вес листьев и количество листьев мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. В одном варианте осуществления высота стебля мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных' растений через, например, один, два или три или более месяцев после пересадки в поле или через 10, 20, 30 или 36 или более дней после вершкования. Например, высота стебля мутантных, не встречающихся в природе или трансгенных растений составляет не меньше, чем высота стебля контрольных растений. В другом варианте осуществления содержание хлорофилла в мутантных, не встречающихся в природе или трансгенных растениях является по существу таким же, как у контрольных растений. В другом варианте осуществления высота стебля мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных растений, и содержание хлорофилла в мутантных, не встречающихся в природе или трансгенных растениях является по существу таким же, как у контрольных растений. В других вариантах осуществления размер или форма или количество или окраска листьев мутантных, не встречающихся в природе или трансгенных растений является по существу такой же, как у контрольных растений. Соответственно, растение представляет собой растение табака.

В другом аспекте предусмотрен способ модулирования (например, снижения) количества нитратов и/или по меньшей мере NNK по меньшей мере в части растения (например, в листьях, таких как высушенные листья, или в табаке), включающий этапы: (i) модулирования (например, снижения) экспрессии или активности одного или нескольких полипептидов, описанных в данном документе (или любой их комбинации, как описано в данном документе), соответственно, где полипептид(ы) кодируется соответствующей полинуклеотидной последовательностью, описанной в данном документе; (ii) измерения содержания нитратов и/или по меньшей мере NNK по меньшей мере в части (например, в листьях, таких как высушенные листья, или в табаке) мутантного, не встречающегося в природе или трансгенного растения, полученного на этапе (i); и (iii) идентификации мутантного, не встречающегося в природе или трансгенного растения, в котором содержание нитратов и/или по меньшей мере NNK было модулировано (например, снижено) по сравнению с контрольным растением. Соответственно, внешний вид указанного мутантного, не встречающегося в природе или трансгенного растения является по существу таким же, как у контрольного растения. Соответственно, растение представляет собой растение табака.

В другом аспекте предусмотрен способ модулирования (например, снижения) количества нитратов и/или по меньшей мере NNK по меньшей мере в части высушенного растительного материала, такого как высушенный лист, включающий этапы: (i) модулирования (например, снижения) экспрессии или активности одного или нескольких полипептидов (или любой их комбинации, как описано в данном документе), соответственно, где полипептид(ы) кодируется соответствующей полинуклеотидной последовательностью, описанной в данном документе; (ii) сбора растительного материала, такого как один или несколько листьев, и сушка в течение периода времени; (iii) измерения содержания нитратов и/или по меньшей мере NNK в по меньшей мере части растительного материала, полученного на этапе (ii); и (iv) идентификации высушенного растительного материала, в котором содержание нитратов и/или по меньшей мере NNK было модулировано (например, снижено) по сравнению с контрольным растением.

Увеличение экспрессии по сравнению с контрольным растением может составить от приблизительно 5% до приблизительно 100%, или увеличение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, такое как 200% или 300% или более, которое включает в себя увеличение транскрипционной активности или экспрессии белка или обеих.

Увеличение активности по сравнению с растением контрольного типа может составить от приблизительно 5% до приблизительно 100%, или увеличение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100% или более, такое как 200% или 300% или более.

Снижение экспрессии по сравнению с контрольным растением может составить от приблизительно 5% до приблизительно 100%, или снижение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%, которое включает в себя снижение транскрипционной активности или экспрессии белка или обеих.

Снижение активности по сравнению с растением контрольного типа может составить от приблизительно 5% до приблизительно 100%, или снижение от по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 25%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или 100%.

Полинуклеотиды и рекомбинантные конструкции, описанные в данном документе, можно использовать для модулирования экспрессии ферментов, описанных в данном документе, в видах растений, представляющих интерес, соответственно, в табаке.

Ряд способов на основе полинуклеотидов можно использовать для увеличения экспрессии генов в растениях. В качестве примера, можно получить конструкцию, вектор или вектор экспрессии, совместимый с растением, которое должно быть трансформировано, который содержит представляющий интерес ген вместе с расположенным выше по цепи промотором, способным к избыточной экспрессии гена в растении. Примеры промоторов описаны в данном документе. После трансформации и при росте в соответствующих условиях промотор может управлять экспрессией для того, чтобы модулировать (например, снижать) уровни данного фермента в растении или в конкретной его ткани. В одном иллюстративном варианте осуществления создают вектор, несущий один или несколько полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе) для избыточной экспрессии гена в растении. Вектор несет соответствующий промотор, такой как промотор 35S вируса мозаики цветной капусты CaMV, выше по цепи трансгена, управляющего его конститутивной экспрессией во всех тканях растения. Вектор также несет ген устойчивости к антибиотику для того, чтобы предоставить отбор трансформированных каллюсов и клеточных линий.

Различные варианты осуществления, таким образом, направлены на способы модулирования (например, снижения) уровня экспрессии одного или нескольких полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе), путем включения множества копий полинуклеотида в геном растения, включающие: трансформацию растительной клетки-хозяина вектором экспрессии, который содержит промотор, функционально связанный с одним или несколькими полинуклеотидами, описанными в данном документе. Полипептид, кодируемый рекомбинантным полинуклеотидом, может быть нативным полипептидом, или может быть гетерологичным по отношению к клетке.

Растение табака, несущее мутантный аллель одного или нескольких полинуклеотидов, описанных в данном документе (или любую их комбинацию, как описано в данном документе) можно использовать в программе селекции растений для создания пригодных линий, разновидностей и гибридов. В частности, мутантный аллель интрогрессируют в коммерчески важные разновидности, описанные выше. Таким образом, предусмотрены способы селекции растений, которые включают скрещивание мутантного растения, не встречающегося в природе растения или трансгенного растения, как описано в данном документе, с растением, содержащим другие генетические особенности. Способ может дополнительно включать скрещивание потомства растения с другим растением и, необязательно, повторное скрещивание до тех пор, пока не будет получено потомство с желаемыми генетическими признаками или генетическим фоном. Одной из целей, которой служат такие способы селекции, является введение желаемого генетического признака в другие разновидности, селекционные линии, гибриды или сорта, особенно те, которые имеют коммерческий интерес. Другой целью является облегчение укладки генетических модификаций различных генов в каждых отдельных разновидности, линии, гибриде или сорте растения. Предполагаются внутривидовые, а также межвидовые скрещивания. Растения потомства, которое возникает из таких скрещиваний, также названные линиями селекции, являются примерами не встречающихся в природе растений по настоящему изобретению.

В одном варианте осуществления предусмотрен способ получения не встречающегося в природе растения табака, включающий: (а) скрещивание мутантного или трансгенного растения табака со вторым растением табака с получением семян потомства табака; (b) выращивание семян потомства табака в условиях роста растений с получением не встречающегося в природе растения табака. Способ может дополнительно включать: (с) скрещивание предыдущего поколения не встречающегося в природе растения табака с самим собою или с другим растением табака с получением семян потомства табака; (d) выращивание семян потомства табака с этапа (с) в условиях роста растений с получением дополнительных не встречающихся в природе растений табака; и (е) повторение этапов скрещивания и выращивания (с) и (d) множество раз с созданием дополнительных поколений не встречающихся в природе растений табака. Способ может необязательно включать перед этапом (а) этап получения родительского растения, которое содержит охарактеризованные генетические особенности и которое не идентично мутантному или трансгенному растению, В некоторых вариантах осуществления в зависимости от программы селекции этапы скрещивания и выращивания повторяют от 0 до 2 раз, от 0 до 3 раз, от 0 до 4 раз, 0 до 5 раз, от 0 до 6 раз, от 0 до 7 раз, от 0 до 8 раз, от 0 до 9 раз или от 0 до 10 раз для того, чтобы создать поколения не встречающихся в природе растений табака. Обратное скрещивание является примером такого способа, в котором потомство скрещивают с одним из его родителей или с другим растением, генетически подобным его родителю, для получения потомства растения в следующем поколении, которое имеет генетические особенности, более близкие к одному из родителей. Методики селекции растений, в частности селекции растений табака, хорошо известны и могут быть использованы в способах по настоящему изобретению. В настоящем изобретении дополнительно предусмотрены не встречающиеся в природе растения табака, полученные с помощью этих способов. Определенные варианты осуществления исключают этап выбора растения.

В некоторых вариантах осуществления способов, описанных в данном документе, линии, полученные в результате селекции и скрининга вариантных генов, оценивают в поле с использованием стандартных полевых процедур. Контрольные генотипы, в том числе исходных не подвергнутых мутагенезу родителей, включены и места посадки растений расположены в поле согласно схеме рандомизированных полных блоков или согласно другому соответствующему планированию поля. Для табака используют стандартные агрономические методы, например, табак собирают, взвешивают и отбирают образцы для химического и другого общепринятого тестирования до и во время сушки. Статистический анализ данных выполняют для подтверждения подобия выбранных линий с родительской линией. Цитогенетические анализы выбранных растений необязательно выполняют для подтверждения взаимосвязей набора хромосом и конъюгации хромосом.

ДНК-фингерпринтинг, однонуклеотидный полиморфизм, микросателлитные маркеры или подобные технологии можно использовать в программе селекции с выбором с помощью маркера (MAS) для переноса или разведения мутантных аллелей гена в других растениях табака, как описано в данном документе. Например, селекционер может создать разделяющиеся популяции при гибридизации генотипа, содержащего мутантный аллель, с агрономически желаемым генотипом. Растения из F2 или обратно скрещенных поколений можно подвергнуть скринингу с использованием маркера, полученного из геномной последовательности или ее фрагмента, с использованием одной из методик, перечисленных в данном документе. Растения, идентифицированные как обладающие мутантным аллелем, можно подвергнуть обратному скрещиванию или самоопылению для создания второй популяции, подлежащей скринингу. В зависимости от предполагаемого способа наследования или используемой технологии MAS может быть необходимо самоопылять выбранные растения перед каждым циклом обратного скрещивания для облегчения обнаружения необходимых отдельных растений. Обратное скрещивание или другую процедуру селекции можно повторять до тех пор, пока необходимый фенотип рекуррентного родителя не восстановится.

Согласно настоящему раскрытию в программе селекции успешные скрещивания дают растения F1, которые являются фертильными. Выбранные растения F1 можно скрестить с одним из родителей, и растения первого поколения обратного скрещивания самоопылить с получением популяции, которую снова подвергают скринингу на экспрессию вариантного гена (например, нулевой версии гена). Процесс обратного скрещивания, самоопыления и скрининга повторяют, например, по меньшей мере 4 раза до тех пор, пока при окончательном скрининге не получат растение, которое является фертильным и достаточно подобным рекуррентному родителю. Это растение, при желании, самоопыляют и потомство затем подвергают скринингу снова, чтобы подтвердить, что растение демонстрирует экспрессию вариантного гена. В некоторых вариантах осуществления популяцию растений в поколении F2 подвергают скринингу на наличие экспрессии вариантного гена, например, растение, которое не экспрессирует полипептид из-за отсутствия гена, идентифицируют согласно стандартным способам, например, с помощью метода ПЦР с использованием праймеров, основанных на информации о последовательности нуклеотидов для полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, описанной в данном документе).

Гибридные разновидности табака можно получить путем предотвращения самоопыления женских родительских растений (то есть, семена родителей) первой разновидности, позволяя пыльце с мужских родительских растений второй разновидности оплодотворить женские родительские растения, и позволяя образовать гибридные F1 семена на женских растениях. Самоопыление женских растений можно предотвратить путем кастрации цветков на ранней стадии развития цветка. В качестве альтернативы, образование пыльцы на женских родительских растениях можно предотвратить, используя какую-либо форму мужской стерильности. Например, мужскую стерильность можно получить с помощью цитоплазматической мужской стерильности (CMS) или трансгенной мужской стерильности, где трансген ингибирует микроспорогенез и/или образование пыльцы, или вызывает самонесовместимость. Женские родительские растения, содержащие CMS, особенно пригодны. В вариантах осуществления, в которых женские родительские растения имеют CMS, пыльцу собирают с мужских фертильных растений и наносят вручную на рыльца женских родительских растений с CMS и собирают полученные семена F1.

Разновидности и линии, описанные в данном документе, можно использовать для образования простых гибридов F1 табака. В таких вариантах осуществления растения родительских разновидностей можно выращивать по существу в гомогенно соединенных популяциях для облегчения естественного перекрестного опыления с мужских родительских растений на женские родительские растения. Семена F1, образованные на женских родительских растениях, избирательно собирают с помощью обычных средств. Можно также вырастить две разновидности родительского растения в массе и собрать смесь гибридных F1 семян, образованных на женской особи, и семян, образованных на мужской особи в результате самоопыления. В качестве альтернативы, можно осуществить трехлинейное скрещивание, где простой гибрид F1 используют в качестве женской особи и скрещивают с другой мужской особью. В качестве другой альтернативы, можно создать гибриды двойного скрещивания, где потомство F1 двух разных простых гибридов скрещивают само с собой.

Популяцию мутантных, не встречающихся в природе или трансгенных растений можно подвергнуть скринингу или отбору тех членов популяции, которые имеют желаемый признак или фенотип. Например, популяцию потомства линии с одной трансформацией можно подвергнуть скринингу на те растения, которые имеют желаемый уровень экспрессии или активности полипептида(-ов), кодируемого с ее помощью. Физические и биохимические способы можно использовать для выявления уровней экспрессии или активности. Они включают Саузерн-анализ или ПЦР-амплификацию для обнаружения полинуклеотида; Нозерн-блоттинг, защиту от РНКазы S1, удлинение праймера, или ПЦР-амплификацию в реальном времени для обнаружения РНК-транскриптов; ферментативные анализы для обнаружения ферментативной или рибозимной активности полипептидов и полинуклеотидов; и гель-электрофорез белков, Вестерн-блоттинг, иммунопреципитацию и иммуноферментные анализы для обнаружения полипептидов. Другие методики, такие как гибридизация in situ-, ферментативное окрашивание и иммуноокрашивание и ферментативный анализ также можно использовать для обнаружения присутствия или экспрессии или активности полипептидов или полинуклеотидов.

В данном документе описаны мутантные, не встречающиеся в природе или трансгенные растительные клетки и растения, содержащие один или несколько рекомбинантных полинуклеотидов, одну или несколько полинуклеотидных конструкций, одну или несколько двухцепочечных РНК, один или несколько конъюгатов или один или несколько векторов/векторов экспрессии.

Без ограничения, растения, описанные в данном документе, можно модифицировать для других целей либо до, либо после того, как экспрессия или активность была модулирована в соответствии с настоящим изобретением. Одна или несколько следующих генетических модификаций могут присутствовать в мутантных, не встречающихся в природе или трансгенных растениях. В одном варианте осуществления один или несколько генов, которые участвуют в превращении промежуточных азотистых продуктов метаболизма, модифицируют с получением в результате растений или частей растений (таких как листья или табак), которые в высушенном состоянии производят более низкие уровни по меньшей мере одного табак-специфичного нитрозамина, чем контрольные растения или их части. Неограничивающие примеры генов, которые можно модифицировать, включают гены, кодирующие никотиндеметилазу, такие как CYP82E4, CYP82E5 и CYP82E10, которые участвуют в превращении никотина в норникотин и описаны в WO 2006091194, WO 2008070274, WO 2009064771 и PCT/US2011/021088. В другом варианте осуществления один или несколько генов, которые участвуют в поглощений тяжелых металлов или транспорте тяжелых металлов, модифицируют с получением в результате растений или частей растений (таких как листья), имеющих более низкое содержание тяжелых металлов, чем у контрольных растений или их частей без модификации (модификаций). Неограничивающие примеры включают гены из семейства белков, ассоциированных с множественной лекарственной устойчивостью, семейства посредников катионной диффузии (CDF), семейства Zrt-, Irt-подобных белков (ZIP), семейства катионообменников (САХ), семейства транспортеров меди (СОРТ), семейства АТФаз тяжелых металлов Р-типа (например, НМА, как описано в WO 2009074325), семейства гомологов белков, ассоциированных с естественной устойчивостью макрофагов (NRAMP) и семейства транспортеров АТФ-связывающей кассеты (ABC) (например, MRP, описанных в WO 2012/028309, которые участвуют в транспорте тяжелых металлов, таких как кадмий. Термин тяжелый металл, использованный в данном документе, включает в себя переходные металлы. Примеры других модификаций включают устойчивость к гербицидам, например, глифосат является активным ингредиентом многих гербицидов широкого спектра действия. Устойчивые к глифосату трансгенные растения были разработаны путем переноса гена aroA (глифосат EPSP синтетаза из Salmonella typhimurium и E.coli). Устойчивые к сульфонилмочевине растения были получены путем трансформации мутантного гена ALS (ацетолактатсинтетаза) из Arabidopsis. Белок ОВ фотосистемы II из мутантного Amaranthus hybridus был перенесен в растения с получением атразин-устойчивых трансгенных растений; и бромоксинил-устойчивые трансгенные растения получены путем встраивания гена bxn из бактерии Klebsiella pneumoniae. Другие примеры модификаций приводят к получению растений, которые устойчивы к насекомым. Токсин Bacillus thuringiensis (Bt) может обеспечить эффективный путь задержки появления Bt-устойчивых вредителей, как недавно показано на брокколи, где пирамидальные cry1Ac и cry1C гены Bt контролировали капустную моль, устойчивую к любому одному белку, и существенно задерживали развитие устойчивых насекомых. Другая иллюстративная модификация приводит к получению растений, которые устойчивы к заболеваниям, вызванным патогенами (например, вирусами, бактериями, грибами). Были сконструированы растения, экспрессирующие ген Ха21 (устойчивость к бактериальному некрозу) с растениями, экспрессирующими одновременно ген слияния Bt и ген хитиназы (устойчивость к желтому стеблевому пилильщику и устойчивость к шипоуске злаковой). Другая иллюстративная модификация приводит к измененной репродуктивной способности, такой как мужская стерильность. Другая иллюстративная модификация приводит к получению растений, которые устойчивы к абиотическому стрессу (например, засуха, температура, соленость), и устойчивые трансгенные растения были получены путем переноса ацилглицеролфосфатного фермента из Arabidopsis; гены, кодирующие маннитолдегидрогеназу и сорбитолдегидрогеназу, которые участвуют в синтезе маннитола и сорбитола, улучшают устойчивость к засухе. Другая иллюстративная модификация приводит к получению растений, производящих белки, которые могут иметь благоприятные иммуногенные свойства при использовании у человека. Например, растения, способные продуцировать белки, которые, по существу, не имеют альфа-1,3-связанных остатков фукозы, бета-1,2-связанных остатков ксилозы или обоих в своих N-гликанах, могут быть полезны. Другие иллюстративные модификации могут приводить к получению растений с улучшенным накоплением белков и масел, растений с повышенной эффективностью фотосинтеза, растений с длительным сроком хранения, растений с повышенным содержанием углеводов и растений, устойчивых к грибам; растений, кодирующих фермент, участвующий в биосинтезе алкалоидов. Трансгенные растения, в которых экспрессия S-аденозил-L-метионин (SAM) и/или цистатионин гаммасинтазы (CGS) была модулирована, также рассматриваются.

Один или несколько таких признаков можно интрогрессировать в мутантные, не встречающиеся в природе или трансгенные растения табака из другого сорта табака или можно непосредственно трансформировать в нем. Интрогрессию признака(-ов) в мутантные, не встречающиеся в природе или трансгенные растения табака по настоящему изобретению можно достичь любым способом селекции растений, известным в данной области, например, селекцией по потомству, обратным скрещиванием, двойной гаплоидной селекцией и тому подобным (см. Wernsman Е.А. и Rufty R.С. 1987. Chapter Seventeen. Tobacco. Pages 669-698 в: Cultivar Development. Crop Species. W.H. Fehr (ed.), MacMillan Publishing Co, Inc., New York, N.Y. 761 pp.). Методики на основе молекулярной биологии, описанные выше, в частности, RFLP и микросателлитные маркеры, можно использовать при таком обратном скрещивании для выявления потомства с высокой степенью генетической идентичности с рекуррентным родителем. Это позволяет ускорить производство разновидностей табака, имеющих по меньшей мере 90%, предпочтительно, по меньшей мере 95%, более предпочтительно, по меньшей мере 99% генетической идентичности с рекуррентным родителем, еще более предпочтительно, генетически идентичных с рекуррентным родителем и дополнительно включающих признак(и), интрогрессированный от донорского родителя. Такое определение генетической идентичности можно проводить на основе молекулярных маркеров, известных в данной области.

Последнее поколение обратного скрещивания можно подвергнуть самоопылению с получением потомства чистого разведения для переносимой нуклеиновой кислоты (кислот). Полученные растения обычно имеют практически все морфологические и физиологические характеристики мутантных, не встречающихся в природе или трансгенных растений табака по настоящему изобретению в дополнение к перенесенному признаку(-ам) (например, один или несколько признаков одного гена). Точный протокол обратного скрещивания будет зависеть от изменяемого признака для определения соответствующего протокола испытаний. Хотя способы обратного скрещивания упрощаются, если переносимый признак представляет собой доминантный аллель, рецессивный аллель также можно перенести. В данном случае может быть необходимо ввести тест потомства с определением успешности переноса желаемого признака.

Различные варианты осуществления предусматривают мутантные растения, не встречающиеся в природе растения или трансгенные растения, а также биомассу, в которой уровень экспрессии полинуклеотида (или любой их комбинации, как описано в данном документе) модулируют для модулирования в них содержания нитратов и/или по меньшей мере NNK.

Части таких растений, в частности растений табака, и более конкретно, листовую пластинку и среднюю жилку растений табака, можно включить в, или использовать при изготовлении различных продуктов потребления, включая, помимо прочего, материалы, образующие аэрозоль, устройства, образующие аэрозоль, курительные изделия, изделия для курения, бездымные продукты и табачные изделия. Примеры материалов, образующих аэрозоль, включают, помимо прочего, табачные композиции, табачные изделия, табачный экстракт, резаный табак, резаный наполнитель, высушенный табак, взорванный табак, гомогенизированный табак, восстановленный табак и трубочный табак.

Курительные изделия и изделия для курения являются, как правило, устройствами, образующими аэрозоль. Примеры курительных изделий и изделий для курения включают, помимо прочего, сигареты, сигариллы и сигары. Примеры бездымных продуктов включают в себя жевательный табак и нюхательный табак. В определенных устройствах, образующих аэрозоль, вместо сгорания, табачная композиция или другой материал, образующий аэрозоль, нагревают с помощью одного или нескольких электрических нагревательных элементов с получением аэрозоля. В другом типе нагреваемого устройства, образующего аэрозоль, аэрозоль получают путем перемещения тепла от горючего топливного элемента или источника тепла к физически отделенному материалу, образующему аэрозоль, который может быть расположен внутри, вокруг или ниже по потоку относительно источника тепла. Бездымные табачные изделия и различные табак-содержащие материалы, образующие аэрозоль, могут содержать табак в любом виде, в том числе в виде высушенных частиц, кусков, гранул, порошков или суспензии, нанесенной на, смешанной с, окруженной или иным образом комбинированной с другими ингредиентами в любом формате, таком как хлопья, пленки, таблетки, пена или шарики. Используемый в данном документе термин «дым» используют для описания типа аэрозоля, который получен с помощью курительных изделий, таких как сигареты, или при сжигании материала, образующего аэрозоль.

В одном варианте осуществления предусмотрен высушенный растительный материал из мутантных, трансгенных и не встречающихся в природе растений табака, описанных в данном документе. Способы сушки зеленых табачных листьев известны специалистам в данной области и включают, без ограничения, теневую сушку, огневую сушку, дымовую сушку и вяление. Способ сушки зеленых табачных листьев зависит от типа собранного табака. Например, табак Virginia flue (светлый) как правило высушен дымовой сушкой, Burley и некоторые темные разновидности обычно высушены теневой сушкой, и трубочный табак, жевательный табак и нюхательный табак обычно высушены огневой сушкой.

В другом варианте осуществления описаны табачные изделия, включая табаксодержащие материалы, образующие аэрозоль, содержащие растительный материал, такой как листья, предпочтительно, высушенные листья, из мутантных растений табака, трансгенных растений табака или не встречающихся в природе растений табака, описанных в данном документе. Табачные изделия, описанные в данном документе, могут быть смешанными табачными изделиями, которые могут дополнительно содержать немодифицированный табак.

Количество NNK в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.

Количество NNN в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.

Количество нитратов в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.

Количество никотина в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов. Количество никотина в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть приблизительно таким же по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.

Количество общих TSNA в этих изделиях для курения и бездымных продуктах и их аэрозолях может быть по меньшей мере приблизительно на 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% и 100% ниже, например, приблизительно на 200% или 300% ниже, по сравнению с продуктами потребления, полученными из не мутантных, не встречающихся в природе или не трансгенных аналогов.

Мутантные, не встречающиеся в природе или трансгенные растения могут иметь другие виды использования, например, в сельском хозяйстве. Например, мутантные, не встречающиеся в природе или трансгенные растения, описанные в данном документе, можно использовать для изготовления корма для животных и продуктов питания для человека.

В настоящем изобретении также предусмотрены способы получения семян, включающие выращивание мутантного растения, не встречающегося в природе растения или трансгенного растения, описанного в данном документе, и сбор семян культурных растений. Семена растений, описанных в данном документе, можно довести до кондиции и упаковать в упаковочный материал с помощью средств, известных в данной области, с образованием промышленного изделия. Упаковочный материал, такой как бумага или ткань, хорошо известен в данной области. Упаковка семян может иметь этикетку, например, метку или этикетку, прикрепленную к упаковочному материалу, этикетку, напечатанную на упаковке, которая описывает природу семян в ней.

Композиции, способы и наборы для генотипирования растений для идентификации, выбора или селекции могут включать в себя средства обнаружения присутствия полинуклеотида (или любой их комбинации, как описано в данном документе) в образце полинуклеотида. Соответственно, описана композиция, содержащая один или несколько праймеров для специфической амплификации по меньшей мере части одного или нескольких полинуклеотидов и, необязательно, один или несколько зондов и, необязательно, один или несколько реагентов для проведения амплификации или обнаружения.

Соответственно, раскрыты ген-специфичные олигонуклеотидные праймеры или зонды, содержащие приблизительно 10 или более смежных нуклеотидов, соответствующих полинуклеотиду(-ам), описанному в данном документе. Указанные праймеры или зонды могут содержать или состоять из приблизительно 15, 20, 25, 30, 40, 45 или 50 или более смежных нуклеотидов. которые гибридизируются (например, специфически гибридизируются) с полинуклеотидом(-ами), описанным в данном документе. В некоторых вариантах осуществления праймеры или зонды могут содержать или состоять из приблизительно 10-50 смежных нуклеотидов, приблизительно 10-40 смежных нуклеотидов, приблизительно 10-30 смежных нуклеотидов или приблизительно 15-30 смежных нуклеотидов, которые можно использовать в зависимых от последовательности способах идентификации гена (например, Саузерн-гибридизация) или выделения (например, гибридизация in situ бактериальных колоний или бляшек бактериофага) или обнаружения гена (например, в виде одного или нескольких праймеров амплификации при амплификации и обнаружении нуклеиновой кислоты). Один или несколько специфических праймеров или зондов можно спроектировать и использовать для амплификации и обнаружения части или всего полинуклеотида(-ов). В качестве конкретного примера, два праймера можно использовать в протоколе полимеразной цепной реакции для амплификации фрагмента нуклеиновой кислоты, кодирующего нуклеиновую кислоту, такую как ДНК или РНК. Полимеразную цепную реакцию можно также выполнить с использованием одного праймера, который получен из последовательности нуклеиновой кислоты, и второго праймера, который гибридизируется с последовательностью выше по цепи или ниже по цепи последовательности нуклеиновой кислоты, такой как последовательность промотора, 3'-конец прекурсора иРНК или последовательность, полученная из вектора. Примеры термических и изотермических методик, пригодных для амплификации полинуклеотидов in vitro, хорошо известны в данной области. Образец может происходить или его можно получить из растения, растительной клетки или растительного материала или табачного изделия, изготовленного из растения, растительной клетки или растительного материала, как описано в данном документе.

В следующем аспекте предусмотрен способ обнаружения полинуклеотида(-ов), описанного в данном документе (или любой их комбинации, как описано в данном документе) в образце, включающий этапы: (а) получения образца, содержащего, или предположительно содержащего, полинуклеотид; (b) контакта указанного образца с одним или несколькими праймерами или одним либо несколькими зондами для специфического определения по меньшей мере части полинуклеотида(-ов) и (с) обнаружение присутствия продукта амплификации, где присутствие продукта амплификации свидетельствует о присутствии полинуклеотида(-ов) в образце. В следующем аспекте также предусмотрено использование одного или нескольких праймеров или зондов для специфического обнаружения по меньшей мере части полинуклеотида(-ов). Также предусмотрены наборы для обнаружения по меньшей мере части полинуклеотида(-ов), которые содержат один из несколько праймеров или зондов для специфического обнаружения по меньшей мере части полинуклеотида(-ов). Набор может содержать реагенты для амплификации полинуклеотида, например ПЦР, или реагенты для технологии обнаружения гибридизации зонда, такой как Саузерн-блоттинг, Нозерн-блоттинг, гибридизация in situ или микрочип. Набор может содержать реагенты для технологии обнаружения связывания антител, такой как Вестерн-блоттинг, ELISA, SELDI масс-спектрометрия или тест-полоски. Набор может содержать' реагенты для секвенирования ДНК. Набор может содержать реагенты и инструкции для определения содержания нитратов и/или содержания по меньшей мере NNK, и/или содержания NNN, и/или содержания никотина, и/или общего содержания TSNA. Соответственно, набор содержит реагенты и инструкции для определения содержания нитратов и/или содержания по меньшей мере NNK, и/или содержания никотина и/или содержания NNN и/или общего содержания TSNA в растительном материале, высушенном растительном материале или в высушенных листьях.

В некоторых вариантах осуществления набор может содержать инструкции для одного или нескольких описанных способов. Описанные наборы могут быть полезны для определения генетической идентичности, филогенетических исследований, генотипирования, гаплотипирования, анализа родословной или селекции растений, в частности, с количественной оценкой кодоминантных признаков.

В настоящем изобретении также предусмотрен способ генотипирования растения, растительной клетки или растительного материала, включающий полинуклеотид, как описано в данном документе. Генотипирование обеспечивает средства различения гомологов пары хромосом и может быть использовано для различения сегрегантов в популяции растений. Молекулярные способы с маркерами можно использовать для филогенетических исследований, характеризующих генетические связи между разновидностями сельскохозяйственных культур, выявления гибридов или соматических гибридов, локализации хромосомных сегментов, влияющих на моногенные признаки, клонирования на основе генетических карт и изучения количественного наследования. Конкретный способ генотипирования может использовать любое количество аналитических методик с молекулярным маркером, включая полиморфизмы длины фрагмента амплификации (AFLP). AFLP являются продуктом аллельных различий между фрагментами амплификации, вызванных изменчивостью нуклеотидной последовательности. Таким образом, настоящее изобретение дополнительно предусматривает средства отслеживания разделения одного или нескольких генов или нуклеиновых кислот, а также хромосомных последовательностей, генетически связанных с этими генами или нуклеиновыми кислотами, с использованием таких методик, как анализ AFLP.

В одном варианте осуществления также предусмотрен высушенный растительный материал из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Например, способы сушки табачных листьев известны специалистам в данной области и включают без ограничения теневую сушку, огневую сушку, дымовую сушку и вяление. Способ сушки зеленых табачных листьев зависит от типа собранного табака. Например, табак Virginia flue (светлый) как правило высушен дымовой сушкой, Burley и некоторые темные разновидности обычно высушены теневой сушкой, и трубочный табак, жевательный табак и нюхательный табак обычно высушены огневой сушкой.

В другом варианте осуществления описаны табачные изделия, включая табачные изделия, содержащие растительный материал, такой как листья, соответственно, высушенный растительный материал, такой как высушенные листья, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе, или которые получены по способам, описанным в данном документе. Табачные изделия, описанные в данном документе, могут дополнительно содержать немодифицированный табак.

В другом варианте осуществления описаны табачные изделия, содержащие растительный материал, предпочтительно листья, такие как высушенные листья, из мутантных, трансгенных и не встречающихся в природе растений, описанных в данном документе. Например, растительный материал можно добавить к внутренней или наружной части табачного изделия, так что при сжигании высвобождается желаемый аромат. Табачное изделие по этому варианту осуществления может даже представлять собой немодифицированный табак или модифицированный табак. Табачное изделие по этому варианту осуществления может даже быть получено из мутантного, трансгенного или не встречающегося в природе растения, которое имеет модификации в одном или нескольких генах, отличающихся от генов, раскрытых в данном документе.

Настоящее изобретение дополнительно описано в Примерах ниже, которые предусмотрены для более детального описания настоящего изобретения. Эти примеры, в которых изложен предпочтительный режим, предполагаемый в настоящее время для выполнения настоящего изобретения, предназначены для иллюстрации, а не для ограничения настоящего изобретения.

ПРИМЕРЫ

Пример 1: Идентификация NtCLCe-s последовательностей

Для идентификации NtCLCe-s обнаруживают родственные транскрипты в листьях N. tabacum с помощью анализа ПЦР в реальном времени и наличие потенциально совпадающих EST-контигов (NtCLCe-s: NCBI_43350-v4ctg-in). Данные из выполненного на заказ биочипа экзонов табака от Affymetrix (зонды последовательностей из NtPMIa1g22230e1-st) используют для подтверждения того, что NtCLCe-s одинаково экспрессируется в корнях, зеленых и стареющих листьях N. tabacum. Кроме того, обнаружено, что стресс от холода и сильный кадмиевый стресс не влияет на уровни экспрессии NtCLCe-s, тем самым свидетельствуя, что NtCLCe-s конститутивно экспрессируется в органах корней и листьев табака. Конститутивная экспрессия NtCLCe может коррелировать с сохранением ее основной клеточной роли в пластидах, которые предположительно связаны с метаболическими путями усвоения азота. Согласно программному обеспечению WoLFPSORT, NtCLCe-s с высокой степенью прогнозируется как мембранный белок пластид. Исследования RNAseq подтверждают наличие транскрипта в его предке N. sylvestris.

Пример 2: Идентификация NtCLCe-t последовательностей

Для идентификации NtCLCe-t обнаруживают родственные транскрипты в листьях N. tabacum с помощью анализа ПЦР в реальном времени и наличие соответствующих EST-контигов. Исследования RNAseq подтверждают наличие транскрипта в предке N. tomentosiformis, таким образом предполагая, что экспрессия копии NtCLCe-t возможно утрачена в N. tabacum после введения аллотетрапоидного состояния, возможно из-за разрушения и/или перегруппировки гена.

Пример 3: Экспрессия NtCLCe-s или NtCLCe-t в листьях N. tabacum

Оба гена CLC-Nt2-s и CLC-Nt2-t экспрессируются в листьях N. tabacum, как определено по наличию обоих транскриптов в листьях N. tabacum (исследования с выполненным на заказ биочипом экзонов табака, подтвержденные с помощью ПЦР в реальном времени) и соответствующих EST-контигов (CLC-Nt2-s: MIRA_20760-v4ctg-in; CLC-Nt2-t: NCBI_56794-v4ctg-in). Кроме того, исследования RNAseq подтверждают наличие соответствующих транскриптов в двух предках N. sylvestris и N. tomentosiformis.

При более внимательном рассмотрении транскриптомных данных от биочипа экзонов табака со специфичными зондами для CLC-Nt2-t и CLC-Nt2-s, NtPMIa1g19904e2-st и NtPMIa1g50210e2-st, соответственно, обнаружено, что обе копии дифференцированно экспрессируются в N. tabacum. CLC-Nt2-s слабо экспрессируется в корне Burley (TN90) и CLC-Nt2-t является чувствительной к суточному ритму. Оба гена экспрессируются в корне и листьях табака дымовой сушки и нечувствительны к обработке кадмием.

Пример 4: Сайленсинг экспрессии CLC-Nt2-t в N. tabacum

Фрагмент ДНК (SEQ ID NO: 8), выявленный в кодирующей последовательности CLC-Nt2 и фланкирующем интроне (100% идентичности с CLC-Nt2-s и 97% идентичности с CLC-Nt2-t) в N. tabacum (Hicks broadleaf), клонируют для того, чтобы выключить обе копии CLC-Nt2 в табаке с использованием подхода РНКи. Соответствующий фрагмент ДНК встраивают в вектор Gateway pB7GWIWG2(II) с помощью исходного вектора в точности так, как подробно описано производителем (Invitrogen). Данный вектор содержит промотор для конститутивной экспрессии (промотор 35S вируса мозаики цветной капусты CaMV) трансгена во всех тканях растения и ген кап для устойчивости к антибиотику канамицину. Затем конструкцию встраивают в геном табака Burley Kentucky 14 (KY14) с помощью Agrobacterium tumefasciens с использованием классической процедуры листового диска. Из каллюсов регенерируют отдельные линии. Отбор трансгенных линий выполняют с помощью ПЦР выделенной геномной ДНК из проростков. РНКи-сайленсинг линий ТО отслеживают с помощью ПЦР в реальном времени с использованием специфичных праймеров, фланкирующих вставку, использованную для сайленсинга, и выращивают для получения семян. Семена Т1 собирают, проращивают на агаровых пластинках и отслеживают точно как проростки Т0. Позитивные растения выращивают в горшках и культивируют в теплице. Во время сбора (10 недельные растения) один лист с середины стебля отбирают и подвергают определению нитратов с использованием либо набора для колориметрического анализа нитратов (Cayman, США), или Skalar. Все оставшиеся листья высушивают растение за растением в небольшом экспериментальном амбаре для теневой сушки в течение двух месяцев с использованием стандартных способов, которые известны в данной области. После сушки листья каждого растения собирают и подвергают анализу TSNA.

Пример 5: Сайленсинг экспрессии NtCLCe в N. tabacum

Фрагмент ДНК (SEQ ID NO: 9), выявленный в кодирующей последовательности NtCLCe, клонируют для выключения обеих копий NtCLCe с использованием подхода РНКи. Затем соответствующий фрагмент ДНК встраивают в вектор Gateway pB7GWIWG2(II) с помощью исходного вектора в точности так, как подробно описано производителем (Invitrogen). Данный вектор содержит промотор для конститутивной экспрессии (промотор 35S вируса мозаики цветной капусты CaMV) трансгена во всех тканях растения и ген kan для устойчивости к антибиотику канамицину. Затем конструкцию встраивают в геном табака Burley Kentucky 14 (KY14) с помощью Agrobacterium tumefasciens с использованием классической процедуры листового диска. Из каллюсов регенерируют отдельные линии. Выбор на агаровых пластинках выполняют с помощью ПЦР на выделенной геномной ДНК из проростков. РНКи-сайленсинг линий Т0 затем отслеживают с помощью ПЦР в реальном времени с использованием специфичных праймеров, фланкирующих вставку, использованную для сайленсинга, и выращивают для получения семян. Семена Т1 собирают, проращивают на агаровых пластинках и отслеживают точно как проростки Т0. Позитивные растения выращивают в горшках и культивируют в теплице. Во время сбора (10-недельные растения) один лист с середины стебля отбирают и подвергают определению нитратов с использованием либо набора для колориметрического анализа нитратов (Cayman, США), или Skalar. Оставшиеся листья высушивают растение за растением в небольшом экспериментальном амбаре для теневой сушки в течение двух месяцев с использованием стандартных способов, которые известны в данной области. После сушки листья каждого растения собирают и подвергают анализу TSNA.

Пример 6: Анализ TSNA в растениях CLC-NT2-RNAi и NtCLCe-RNAi

Выполняют выбор растений CLC-NT2-RNAi и NtCLCe-RNAi с использованием ПЦР геномной ДНК для выявления трансгенных вставок с последующей ПЦР в реальном времени кДНК (полученной из выделенной общей РНК). Как показано на Фигуре 1 (анализ полуколичественной ПЦР в реальном времени), гены CLC-Nt2 или NtCLCe, как обнаружено, полностью или частично выключены в зеленых листьях растений CLC-Nt2-RNAi и NtCLCe-RNAi Т1 по сравнению с растениями дикого типа (показано три типичных растения). Интересно, что в обоих растениях с РНКи гены NtCLCe и CLC-Nt2 выключены независимо от использованной конструкции, таким образом, предполагая возможное перекрестное регулирование между этими двумя генами в листьях. В первом эксперименте проростки Т1 выращивают в небольших горшках (3-литровых горшках) после прорастания. Во время сбора (10 недель после высадки рассады) наблюдают снижение нитратов в зеленых листьях (середина стебля) как CLC-Nt2-RNAi, так и NtCLCe-RNAi, однако снижение нитратов является существенно (Р<0,01) более эффективным в растениях NtCLCe-RNAi (~95%) по сравнению с растениями CLC-Nt2 (приблизительно на 5%, см. Фигуру 2А). Снижение никотина также наблюдается в обоих трансгенных растениях при сравнении с растениями wt (~35%). Данное снижение никотина означает, что NtCLCe и CLC-Nt2 воздействуют на перераспределение нитратов в корнях при определенных условиях роста, которые влияют на синтез никотина. Общие TSNA (NNN, NNK, NAT (N9-нитрозоанатабин) и NAB (N9-нитрозоанабазин) определяют в обоих растениях CLC-RNAi после сушки (см. Фигуру 2В). NNK, NNN, NAB и NAT доступны для приобретения и могут быть использованы в качестве эталонных стандартов. Стандартные способы анализа NNK, NNN, NAB и NAT известны в данной области (см., например, Nicotine & Tobacco Research (2006) 2: 309-313). Можно использовать сверхэффективную жидкостную хроматографию - тандемную масс-спектрометрию (UPLC-MS/MS). Способы для измерения никотина также известны в данной области (см., например, International Journal of Cancer (2005); 116: 16-19). Данные указывают, что сильное снижение уровней нитратов предотвращает образование TSNA в высушенных листьях, что может иметь место, поскольку нитраты являются основным источником нитрозирующего средства в листьях, способствуя образованию TSNA. Снижение нитратов, обнаруженное в растениях CLC-Nt2-RNAi, не приводит к такому сильному эффекту относительно TSNA по сравнению с растениями NtCLCe-RNAi.

Для предотвращения любых стрессовых условий для роста корней предыдущий эксперимент повторили с использованием 10-литровых горшков. При таких условиях растения табака дикого типа накапливают приблизительно в пять раз больше никотина по сравнению с предыдущим экспериментом. Растения NtCLCe-RNAi и CLC-Nt2-RNAi демонстрируют сниженную экспрессию генов при точно таком же отборе, как описано ранее. Поскольку большинство трансгенных растений с обеими конструкциями показали сниженную экспрессию NtCLCe и CLC-Nt2 (см. Фигуру 1), растения с РНКи, демонстрирующие сниженную экспрессию обоих CLC, сгруппировали вместе (растения CLC-RNAi) и подвергли анализам на никотин и нитраты (см. Фигуру 3А). Снижение никотина, наблюдаемое в первых экспериментах в растениях CLC-RNAi, не обнаружено в этом эксперименте, подтверждая тем самым, что ограничение развития корней при использовании небольших горшков может вызывать дополнительное снижение никотина как в NtCLCe-RNAi, так и в CLC-Nt2-RNAi растениях по сравнению с растениями дикого типа (сравнить Фигуры 2А и 3А). Однако нитраты были все еще существенно снижены (>40%) в обоих растениях CLC-RNAi по сравнению с растениями дикого типа, подтверждая таким образом, что снижение экспрессии NtCLCe и CLC-Nt2 приводит к уменьшению содержания нитратов в табачных листьях. При таких условиях роста трансгенные растения не показали никаких фенотипических различий по сравнению с растениями wt, как можно увидеть при сравнении общего веса листьев и числа листьев (см. Фигуры 3В и 3С).

Анализ на TSNA в этих растениях показал, что NNN не снижен в листьях теневой сушки по сравнению с растениями дикого типа. Однако снижение NNK на 24 и 10%) наблюдается в растениях NtCLCe-RNAi и CLC-Nt2-RNAi по сравнению с растениями дикого типа (см. Фигуру 4). Снижение NNK является более существенным в растениях NtCLCe-RNAi (Р<0,01), чем в CLC-Nt2-RNAi, подтверждая тем самым данные, полученные в первом эксперименте для общих TSNA (см. Фигуру 2).

Хотя трансгенные растения и растения дикого типа не выросли в полевых условиях и не высушены в классических амбарах для теневой сушки табака, наши данные показали, что ограничение экспрессии NtCLCe (NtCLCe-s) и CLC-Nt2 (s и t копий) способствует эффективному снижению нитратов в табачных листьях. После сушки TSNA (NNK), как обнаружено, снижены в листьях, указывая, что снижение содержания нитратов в зеленых листьях как поставщика нитрозирующих средств во время сушки будет эффективно способствовать снижению образования TSNA в соответствующих высушенных листьях. Это снижение может способствовать по меньшей мере 20% снижению NNK.

Пример 7: Этилметансульфонатный мутагенез CLC-Nt2-s, CLC-Nt2-t, NtCLCe-s или NtCLCe-t в N. tabacum

Семена МО Nicotiana tabacum АА37 обрабатывают этилметансульфонатом (EMS) при различных концентрациях и времени воздействия для того, чтобы создать популяцию растений со случайными точечными мутациями. Кривую гибели оценивают у поколения M1 для каждой обработки вместе с летальностью, фертильностью и степенью химеризма. Растения M1 подвергают самооплодотворению с образованием семейств семян М2, чтобы позволить получение рецессивных аллелей в виде гомозигот и получение летальных аллелей в виде гетерозигот. Геномную ДНК от 8 растений М2 на каждое семейство подвергнутой EMS-мутагенезу популяции извлекают и подвергают скринингу на мутанты, тогда как растительный материал М2 и семена М3 собирают и сохраняют для будущих анализов. Для выявления и характеристики мутантных вариантов образцы геномной ДНК от растений М2 объединяют в группы и подвергают скринингу путем секвенирования фрагментов нацеленного гена. Фрагменты целевого гена амплифицируют с использованием праймеров, показанных в Таблице 2. Производят поиск мутаций в целевых генах путем секвенирования отдельных фрагментов ДНК. Различные мутанты показаны в Таблице 1.

Пример 8: Анализ выращенного в поле гомозиготного мутантного G163R CLCNt2-s растения табака

Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных G163R CLCNt2-s растений табака показан в Фигуре 5. Цельные листья собирают с середины стебля гомозиготных мутантных G163R CLCNt2-s растений табака (треугольник) и внесегрегантных дикого типа (ромб) растений табака, выращенных в поле в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигурах.

Результаты этого эксперимента показывают, что гомозиготное мутантное G163R CLCNt2-s растение табака имеет сниженный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов снижается с приблизительно 11 мг/г в контрольном растении до приблизительно 6 мг/г в мутантном растении. Уровень нитратов продолжает уменьшаться в середине утра. Уровень нитратов снижается с приблизительно 7 мг/г в контрольном растении до приблизительно 4,5 мг/г в мутантном растении. К позднему утру уровень нитратов увеличился в мутантном растении по сравнению с серединой утра и достигает уровня нитратов, присутствующих ранним утром. Для контроля уровень нитратов в контрольном растении продолжает уменьшаться. К позднему утру уровень нитратов увеличивается до приблизительно 6 мг/г в мутантном растении и уменьшается до приблизительно 3 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра. Уровень никотина меняется от приблизительно 13 мг/г до приблизительно 11 мг/г для мутантного растения и от приблизительно 9 мг/г до приблизительно 13 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.

Пример 9: Анализ выращенного в поле гомозиготного мутантного P143L NtCLCe-t растения табака.

Временной ряд уровней нитратов и никотина в зеленых листьях от выращенных в поле мутантных P143L NtCLCe-t растений показан на Фигуре 6. Цельные листья собирают с середины стебля выращенных в поле гомозиготных растений P143L NtCLCe-t (квадрат) и внесегрегантных растений дикого типа (ромб), растущих в режиме Burley. Образцы собирают в три различных момента времени в течение утра (раннее, середина и позднее) и лиофилизируют. Измельченный материал листовой пластинки анализируют на содержание нитратов и никотина. N=4-8 отдельных растений. Стандартное отклонение указано на Фигуре.

Результаты этого эксперимента показывают, что гомозиготное мутантное P143L NtCLCe-t растение табака имеет увеличенный уровень нитратов ранним утром по сравнению с контрольным растением. Уровень нитратов увеличивается с приблизительно 7 мг/г в контрольном растении до приблизительно 14 мг/г в мутантном растении. Уровень нитратов уменьшается в середине утра в мутантном растении и несколько увеличивается в контрольном растении. Уровень нитратов в мутантном растении снижен до приблизительно 9 мг/г и уровень нитратов в контрольном растении увеличивается до приблизительно 9 мг/г.К позднему утру уровень нитратов продолжил уменьшаться в мутантном растении по сравнению с серединой утра. Для контроля уровень нитратов в контрольном растении уменьшается. К позднему утру уровень нитратов уменьшается до приблизительно 2 мг/г в мутантном растении и уменьшается до приблизительно 4 мг/г в контрольном растении. Уровень никотина остается до некоторой степени подобным в течение утра для каждого из мутантного и контрольного растений. Уровень никотина меняется от приблизительно 20 мг/г до приблизительно 24 мг/г для мутантного растения и от приблизительно 15 мг/г до приблизительно 17 мг/г для контрольного растения. Результат по никотину указывает, что метаболизм мутантного растения является нормальным. Уровни биомассы для мутантного и контрольного растения также являются сопоставимыми.

Любая публикация, которая процитирована или описана в данном документе, предоставляет соответствующую информацию, раскрытую до даты подачи настоящей заявки. Заявления, сделанные в данном документе, не должны быть истолкованы как допущение того, что авторы настоящего изобретения не имеют право датировать более ранним числом такие раскрытия. Все публикации, упомянутые в вышеприведенном описании, включены в данный документ с помощью ссылки. Различные модификации и вариации настоящего изобретения будут очевидны специалистам в данной области без отступления от объема и сущности настоящего изобретения. Несмотря на то, что настоящее изобретение было описано в связи с конкретными предпочтительными вариантами осуществления, следует понимать, что настоящее изобретение, как заявлено, не должно быть неправомерно ограничено такими конкретными вариантами осуществления. Действительно, различные модификации описанных способов осуществления изобретения, которые очевидны специалистам в клеточной, молекулярной биологии и биологии растений или в смежных областях, предназначены, чтобы быть в пределах объема прилагаемой формулы изобретения.

ПОСЛЕДОВАТЕЛЬНОСТИ

CLC-Nt2-s соответствует полипептидной последовательности, показанной в SEQ ID NO:5, которая кодируется SEQ ID NO:1

CLC-Nt2-t соответствует последовательности, показанной в SEQ ID NO:6, которая кодируется SEQ ID NO:2

NtCLCe-s соответствует последовательности, показанной в SEQ ID NO:7, которая кодируется SEQ ID NO:3

NtCLCe-t соответствует последовательности, показанной в SEQ ID NO:13, которая кодируется SEQ ID NO:4

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> ФИЛИП МОРРИС ПРОДАКТС С.А.

<120> СНИЖЕНИЕ ТАБАК-СПЕЦИФИЧНЫХ НИТРОЗАМИНОВ В РАСТЕНИЯХ

<130> P4064PC00

<140> PCT/EP2013/077532

<141> 2013-12-19

<150> EP 12198966.9

<151> 2012-12-21

<160> 181

<170> PatentIn version 3.3

<210> 1

<211> 4141

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of CLC-Nt2 from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris

<400> 1

atggaggagc caactcgatt agtagaagaa gcaacgatta ataacatgga cggacaacag 60

aatgaagaag aaagagatcc agagagcaat tcactgcatc agcctcttct caagagaaac 120

agaacactat catccagtcc atttgccttg gttggagcta aggtctccca catcgaaagt 180

ttggattatg agtaagaaca actaataatc ttatcataga tcaagtatag cttttcttta 240

cttgtgcatt aaaagggcca acagaaattg gatgtcctaa ttgtgtgtgt ctgttttagg 300

atcaacgaga atgatctctt caagcatgac tggagaagga gatctagagt tcaagtatta 360

cagtatgtgt tcttgaaatg gacactggca tttttggtcg gcctgcttac aggagttaca 420

gccaccctca tcaatcttgc aatcgaaaac atggctggtt acaaacttcg agctgttgtg 480

aactatatcg aggatagaag gtaggtgatg ttttccctat gatcaacaat tcataaatgc 540

ttccagaagt cttactactg attcttcaat acgataccac tagctaatga ctaagaacaa 600

gaccaaagat cacttatttg acttgaatta tgttattgat ttattcataa ttgagattgt 660

aacaatggtt acaggtacct tatgggattt gcatattttg cgggtgctaa ttttgtgctc 720

actttgatag ctgcccttct ctgcgtgtgc tttgcaccta ctgctgcagg gcctggaatt 780

cctgaaatca aagcttatct caacggtgta gatactccca atatgtatgg agcaaccaca 840

ctttttgtca aggtgcgtca cacacccaat tttatcagtg ctggcaattc agatagcagg 900

cagattataa cgccatcagt atagtattga gattctgtcg aaccagatgt ataaatagat 960

agaatagcag caaataacac atttttatct tagtcgtgat ggcacctaat ccgacccgct 1020

agataagcca aatacaatca acacatattt atggaattca atctcatttg ggaagtgatc 1080

tctatctttc agtaatcaga taggaagtgg tttaagaata aaaagagaat tttagaatcg 1140

aatgcactca tccagcgagg aagatccatc agtggtatct aatttactct tgaacttcca 1200

gcagttcaat cctttggtac cgtcactgta acttgttttt ttcaatcttt gtgactaaca 1260

tggaagggag gaaaatcctg actttcagtg attttcctcg cttacagtga aagtcaggat 1320

atagcttcgg tgagactcag cttatatgtc ttaattgaat atgctatttg ttgactaaca 1380

tggatttgcc ctatcatgaa aatgaaggaa gcgccaaaaa tacatatact taaacagggg 1440

cggacccaag tggtgagaag tgggttcaac tgaacccgct tcgtcaaaaa aatactgtgt 1500

atatgtataa attatggcta aagcaaggta aattttgtat agaaataagc ttatgttagt 1560

tatggacttc tcctgggtcc gctactgtac ttaaaagcac atacgaagag atacacaaac 1620

taagggcaaa ggttcataat ttaaggcagt tgtgtccaga agaacaaatt ttgcttgcat 1680

gttgcagtgt gaatttaaca ataaaagaat tatgatcgca aatttccact tgtaattgta 1740

ctataagatt ctaaattttg agagatttga catgtttgct ttccctttga ctgaatcgta 1800

aaagtgaaag tgaagttcat cagaagtaga ttatgatact taccaacccc tttttccctt 1860

aaacaatctt taatctgttc actcacagat cattggaagc attgcagcag tttctgctag 1920

cttagacctt ggaaaagaag ggccattggt tcacattggc gcttgctttg cttccttact 1980

aggtcaaggt ggtccagata attaccggct caggtggcgt tggctccgtt acttcaacaa 2040

cgatcgggac aggcgagatc ttatcacatg tgggtcatca tcaggtgtgt gtgctgcttt 2100

ccgttctcca gtaggtggtg tcctatttgc tttagaggaa gtggcaacat ggtggagaag 2160

tgcactcctc tggagaactt tcttcagcac ggcagttgtg gtggtgatac tgagggcctt 2220

cattgaatac tgcaaatctg gcaactgtgg actttttgga agaggagggc ttatcatgtt 2280

tgatgtgagt ggtgtcagtg ttagctacca tgttgtggac atcatccctg ttgtagtgat 2340

tggaatcata ggcggacttt tgggaagcct ctacaatcat gtcctccaca aaattctgag 2400

gctctacaat ctgatcaacg agtaagcacc tactcttcca cattcccaac tggatcatca 2460

aacattcagt tggttctcta tattttaaag gcaatgcata tccacacaaa aatgagctta 2520

cttggattag aatcatcttg agacattgat ccaactgtct tgcatctttt taagtttaaa 2580

tcctaattcc tatccaaaca tggccttctt atcacattta actgccaaaa aaaaagggaa 2640

aactatagat gcaaaatcct gactttcaat ctttgatcct tttttatctt gcaggaaggg 2700

aaaactacat aaggttcttc tcgctctgag tgtctccctt ttcacctcca tttgcatgta 2760

tggacttcct tttttggcca aatgcaagcc ttgtgatcca tcacttcccg ggtcttgtcc 2820

tggtactgga gggacaggaa acttcaagca gttcaactgc ccagacggct attacaatga 2880

tcttgctact cttctcctta caaccaacga tgatgcagtc cgaaacattt tctccataaa 2940

cactcccggt gaattccaag ttatgtctct tattatctac ttcgttctgt attgcatatt 3000

gggactcatc acttttggga ttgctgtgcc atctggtctc ttccttccaa tcatcctcat 3060

gggttcagct tatggtcgct tgcttgccat tgccatggga tcttatacaa aaattgatcc 3120

agggctgtat gcggttctcg gagcagcttc ccttatggct ggttcaatga gaatgactgt 3180

ttctctttgc gtcatatttc ttgagctaac aaacaatctt ctccttctgc caataacaat 3240

gctggttctt ctaattgcca aaagtgtagg agactgcttc aacctaagta tttatgaaat 3300

aatattggag ctgaaaggtc tacctttcct ggatgccaac ccggagccat ggatgagaaa 3360

tatcactgct ggtgagcttg ctgatgtaaa gccaccagta gttacactct gtggagttga 3420

gaaggtggga cgtatcgtag aggccttgaa gaacaccaca tataacggat tccctgtcgt 3480

cgatgaagga gtagtgccac cggtgggtct gccagttggg gcaactgaat tgcacggtct 3540

tgtcctaaga actcaccttc ttttggttct caagaaaaag tggttccttc atgaaagacg 3600

gaggacagag gagtgggaag tgagagagaa attcacctgg attgatttag ctgagagggg 3660

cggtaagatc gaagatgtgt tagttacaaa ggatgaaatg gagatgtatg tcgatttgca 3720

tcccctgact aacacaaccc cttatactgt ggtagaaagc ttgtcagtgg ctaaggcaat 3780

ggtgcttttc aggcaggtgg ggctccgcca catgctcatt gtacccaaat accaagcagc 3840

aggggtgaga ttataagcaa atttcagtta tttttcttat gcaaatatct ccctcctatc 3900

atagtataaa gatgcacaga aatagtcata tggtaatata agcacttgtt tagaataatt 3960

ataggtggca aagttatttt acattagaag tgataaaagc attacttaca tcacacttgt 4020

gctccttttg taggtatctc ctgtggtggg aatcttgacc aggcaagact tgagagccca 4080

caacattttg agtgtcttcc ctcatctgga gaagtcaaaa agcggtaaaa aggggaactg 4140

a 4141

<210> 2

<211> 3781

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of CLC-Nt2 from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis

<400> 2

atggaggagc caactcgatt agtagaagaa gcaacgatta ataacatgga cagacaacag 60

aatgaagaag aaagagatcc agagagcaat tcactgcatc agcctctcct caagagaaac 120

agaacactat catccagtcc atttgccttg gttggagcta aggtctccca tattgaaagt 180

ttagactatg agtaagaaca actaataatc ttatctttag atcaagtata gcttttcttt 240

ataaatgggc caacagaaat tggatgtcct aattttgtgt atctgcttta ggatcaacga 300

gaatgatctc ttcaagcatg actggagaag aagatccaga gttcaagtat tacagtatgt 360

attcttgaaa tggacactgg catttttggt cgggcttctt acaggagtga cagcctccct 420

tatcaatctt gcaatcgaaa acattgctgg ctacaaactt agagctgttg tgaactatat 480

cgaggataga aggttggtga tgttttccct atgatcagca attcataaag gctactataa 540

ttcttcaata tgattccact agctaatgac taagaacaag atcaaagatc acttatttga 600

cttgaattat gttattgatt tgttcataat tgagattgta acaatggtta caggtacctt 660

gtgggatttg catattttgc gggtgctaat tttgtgctca ctttgatagc tgcccttctc 720

tgcgtgtgtt ttgcgcctac tgctgcaggg cctggaattc ctgaaatcaa agcttatctc 780

aacggtgtag atactcccaa catgtacgga gcaaccacac tttttgtcaa ggtgcgtcac 840

gcacccaatt ttatcagtgc tggcaattca ggtagcaggc agattataac gccatcagta 900

tagtattgag atcctgttga cctagatgta taaatagaaa gaatagcagc aaataacaca 960

tttttagcct acatatttat ggaattcaat ctcatttggg aagtgatatc tatctttcag 1020

taatcagata ggaagttgtt taagaataaa aagagaattt tatcgaatgc actcatccag 1080

caaggaagat ccatcagtgg tatctaatct actcttgaac ttccagtagt tcaatccttt 1140

ggtactgtca ctgtaacttg ttttctcatc caccattaaa atacaatagc ttccatgaga 1200

ctcagcttat atgtctcaat tgaatatgct atttggtgac taacatgaat ttgccctatc 1260

atgaaaataa atggaagtga caaaaataca tatacttaaa agcacatatg tagagacacg 1320

cagactaagg gcaaaggttc acaattttaa ggcagttgtg tccagaagaa caaatgaaga 1380

attatgatca caaatttcca cttgtaattg tactataaaa tttttaattt tgagagattc 1440

tgacatgttt gctttccctt tgattgaatc gtaaaagtga aagtgaagtt catcagaagt 1500

agattatgat acttaccaac tcctttttcc ccctaaacaa tctttaatct cttcacttac 1560

agatcattgg aagcattgca gcagtttctg ctagcttaga ccttggaaaa gaagggccgt 1620

tggttcacat tggcgcttgt tttgcttcct tactaggtca aggtggtcca gataattacc 1680

ggctcaaatg gcgctggctc cgttacttca acaacgatcg ggacaggcga gatctcatca 1740

catgtgggtc atcatcaggt gtgtgtgctg ctttccgttc tccagtaggt ggtgtcctat 1800

ttgctttaga ggaagtggca acatggtgga gaagtgcact cctctggaga actttcttca 1860

gcacggcagt tgtggtggtg atactgaggg ccttcataga atactgcaaa tctggctact 1920

gtggactttt tggaagagga gggcttatca tgtttgatgt gagtggtgtc agtgttagct 1980

accatgttgt ggacatcatc cctgttgttg tgattggaat cataggcgga cttttgggaa 2040

gcctctacaa ttgtgtcctc cacaaagttc tgaggctcta caatctcatc aacgagtaag 2100

caccaactct tccacattcc caactggatc atcaaacatt cagttggttc tctatattta 2160

aaaggcaatg catatccaca caaaaatgag cttacttgga ttagaatcat cttgagacat 2220

tgatccaact gccttgcatc tttttaagtt tgaatcccaa ttcctatcca aacatggtct 2280

ttttatcaca tttaactgcc aaaaaaagtt actctataga tgtaaaatcc tgactttcaa 2340

actttgatcc ttttttatct tgcaggaagg gaaaactaca taaggttctt ctcgctctga 2400

gcgtctccct tttcacctcc atttgcatgt atggacttcc ttttttggcc aaatgcaagc 2460

cttgtgattc atcacttcaa gggtcttgtc ctggcactgg aggtacagga aacttcaagc 2520

agttcaactg ccctgacggc tattacaatg atctcgctac tcttctcctt acaaccaacg 2580

atgatgcagt ccgaaacatt ttctccataa acactcccgg tgaattccat gttacgtctc 2640

ttattatcta cttcgttctg tattgtatct tgggactcat cacttttggg attgctgtgc 2700

catctggtct cttccttcca atcatcctca tgggttcagc ttatggtcgc ttgcttgcca 2760

ttgccatggg atcttataca aaaattgatc cagggctgta tgccgttctg ggagcagctt 2820

cccttatggc tggttcaatg agaatgactg tttctctttg cgtcatattt cttgagctaa 2880

caaacaatct tctccttctg ccaataacaa tgctggttct tctaattgcc aaaagtgtag 2940

gagactgctt taacctaagt atttatgaaa taatattgga actgaaaggt ctacctttcc 3000

tggatgccaa cccggagcca tggatgagaa atatcactgc tggtgagctt gctgatgtaa 3060

agccaccagt agttacactt tgtggagttg agaaggtggg acgtatcgtc gaggtcttga 3120

agaacaccac atataacgga ttccctgtcg tcgatgaagg agtggtgcca ccggtgggtc 3180

tgccagttgg ggcaactgaa ttgcacggtc ttgtcctaag aactcacctt cttttggttc 3240

tcaagaaaaa gtggttcctt aatgaaagac gaaggacaga ggagtgggaa gtgagagaga 3300

aattcacctg gattgattta gctgagaggg gcggtaagat cgaagatgtg gtagttacga 3360

aggatgaaat ggagatgtat gtcgatttgc atcccctgac taacacaacc ccttatactg 3420

tggtagaaag cttgtcagtg gctaaggcaa tggtgctttt caggcaggtg gggctccgcc 3480

acatgctcat tgtacccaaa taccaagcag caggggtgag attataagca aatttcagtt 3540

attattctta tgcaaatatc tccctcctat catagtatta agatgcacag aaatagtcat 3600

atcgtggcaa agttatttta cgttagtaag tgataaaagc attacttaca tcacacttgt 3660

gctccttttg taggtatctc cggtggtggg aatcttgacc aggcaagact tgagagccca 3720

caacattttg agtgtcttcc ctcatctgga gaagtcaaaa agcggtaaaa aggggaactg 3780

a 3781

<210> 3

<211> 44278

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; one start codon

<400> 3

atgaatcacg gaagttgttg ggtcgtcatc caaattgctg gccttgggct cgacgaccat 60

ctcttcctcc gggacgttcc tctgacggaa acattgaaaa agaacaagat atgtgcgaca 120

gcagcaaagt cgatagtgat agtggcatcc agataggatc tctgctcgag gaagttatcc 180

cacaaggcaa taataccgct ataatctcgg cttgctttgt tggcctcttc accggtatca 240

gtgtcgtgct tttcaacgct gcggtacgtg cgctataggt ctttcatttc tcttttcatg 300

tactattcct ccttacttac ttggcctcag tcaatcagcc ccctgcctac tttaaattat 360

tgtacatttt atcagaggag tgtcctatac atcaaattca cataacttag taaaatatgc 420

tgatattctg aattttaaac ttaccagctt agaacatcca ggttagttca gaaacagata 480

atctaaattg gtctcattta taagtcattt tgttattcaa gacatacaat ttggctcttg 540

ataaaagatt atgcagcgcc cgatgattac ctaatattta tcagcaaccc atgtaattta 600

acaatattgt caccatataa aagagaactg aagagaatgt tcaatttgtg gtcatataac 660

ggatatctcc cttggttagg ttcatgaaat acgtgatctt tgttgggatg gaattccata 720

tcgagctgcc tcagaggagc ccattggagt acattggcaa cgtgtaatct tagtaccagc 780

ttgtggcggt ttggtagtca gctttttgaa tgccttccga gccactctgg aggtttcaac 840

tgaaggaagt tggacatcat ctgttaaatc tgtattggaa ccagttttga agacaatggc 900

cgcttgtgtc acattaggaa ctgggaattc cttaggacca gaaggcccta gtgttgaaat 960

tggcacatct gttgccaagg gagttggagc tctgcttgat aaaggtggtc gtagaaagct 1020

gtcactcaag gctgctggat cagctgctgg aatcgcttct ggtttgttcc ccatattatt 1080

cttggttctg aaccatacat ggtacatttt ccttataatt acatgtagcc tgttgtatgc 1140

tttcctcttt cccgggaagc ctttttgtaa atacaagtgt gtttgcactc aaaccaataa 1200

actgtaaaaa aggtgaactc cttaagcaag caaaagcatt agaaatgtaa actagacata 1260

tttctcagat tgagagtctg agagattaga acacgagtgt ttccattaga gagagaaaag 1320

agacttctag atatttctat tatctctgta agagtgaatc cgttcctata caaaaaatag 1380

gccttcatta aatacaagct tgggctgggt actactgggc caaagtaaaa aataaaaaga 1440

atcacccact atcaaatggg cctagtctaa caaccccctt caagctggag ggtgacacaa 1500

cccctagctt gcgaatatga aaatgatgag caggcccaag taacactttg gtaagaacat 1560

caaccacttg agaagcactg gagttgtgaa atagactgat caggccattc ccaagcttgc 1620

cacaaacaaa atgacagtcc agcttaatgt gtttagtgcg ttcatggaaa acttggtttt 1680

ttgcaatgtg gacttcctga ttatcacaaa ataaaggaac aggtaaagaa ggagaaactc 1740

caatatcaga caataatttg gtgagccaag acacctctgc aacagcctta ctcatggacc 1800

tatactcagc ttcaattgat gatagtgaga caacaggttg cttctttgat ttccagctca 1860

ccaagctgcc ccccaagaaa aatacaaaaa ccagtgacag acctgcggct gtctgggcaa 1920

gaagcccaat cactgcacaa taaagctgca aagacaagtc tggagagtta ttgcggaaga 1980

ttccaaagtc aaaagtgccc ttgaggtatc ttagcaagtg cagggcagcc tgcatgttag 2040

gaacacaggg agactgcata aactgactca gatgctgaac aacaaaacta aggtcaggcc 2100

ttgtgcgtat caaaaagttt agcttgtgca ttagactcct gtactcttca ggcctgggca 2160

aaggagtgcc aatcttagct tttaacttca cattcaattc aagggggcaa gtgacagaag 2220

agcaattcga ggaatgaaaa tcagccagca aatcatgaat gaactttttc tgatgaagaa 2280

gaaccccaga atcagtgtat aaaacctcaa tgctaaggaa gtaattaaga gagcccatgt 2340

ccttaatctt gaactggtca ctgagaaagg acttcaaagc agccaattca gctagatcac 2400

acctagtcaa tatgatatca ttcacataga caaccaagat gaccaaggaa tccctagaac 2460

ccttggtaaa aatagagaaa tcattcaagg aacgagagaa gccattagag cacaaggctt 2520

gagataattt agcatactat tgtcttgaag ccagtcttaa accataaaga gacttctgga 2580

gtttgcatac taaaggagca gaagaagagt gaggaacagt taggcccggt ggcagcttca 2640

tgaatacctc ctcatcaagg tccccatgta agaagacatt attcacatct agttgaaaga 2700

ggggccagtg ttgtttaaca gctacaacaa taagagtttt gacaatagac atattgacca 2760

caggagaaaa agtttcatta aagtcaatac cctcaacttg agtgacctag ctttatatct 2820

ctcaatactt tcattagccc tatatttaac cttgtatacc cacttacaac tagtaggttt 2880

cttgccagga ggcaattcaa caatgtccca agttctgttg gcatccaagg cctcaaattc 2940

acatctcatg gctgcctgcc attcaggaac agctgcaacc tgagagtaag aataaggctc 3000

aggaacatga agttgactaa gagaaggagc attagaaata gatctggagg gaggaggaga 3060

agaagtggag gtgcagacat aactcttgag atagttggtt ggattgtgtg gcacggaaga 3120

tcttctcaaa gcaggaggag gtacaagaga gttagaataa tgagaaggag aagagatgga 3180

agtgggaaca gagaagattg agaagcagta gaaggagaaa gtgaaggaga tgaaggagag 3240

gaagaagacg gaaaggaaca ttcatcaaaa caagcagaaa agggaaaggg gaagacttga 3300

ggtactacat gagaggattg aaagaaagga aaaatggtgt tcataaaaaa tgacatcttt 3360

tgatacaaaa caggtgttat tctgaagatt aaggcgcttg tagccctttt tggcaaaagg 3420

gtagccaatg aaaacacaag gaagggacct aggatgaaat ttgttttgtg aggggtggtg 3480

acagttgagt aacagaggca cccaaaagct ctaaggtggt gataagtagg gtggaagaat 3540

gaagcaattc atagggactt ttgtgattaa gaagaggaaa aggaaatctg ttaattaaat 3600

atgtggcagt taaaaagcag tcaccccaaa atttaagtgg tagatgagac tgaaacataa 3660

gtgacctagc agtctctagt aaatttctgt gttctctttc tacaatacca ttttattggg 3720

gggtgtgagg acaggaggtt tggtgtacta tccctttttc tgaaaagaaa aggcaaccag 3780

aagaactaga tcccagttcc aaagcattat cactcctaac agtttgaact ttagattgga 3840

attgggtttc aaccatagca atgaaaacct tgagcaaatc aaaggcattg cggcacccat 3900

taaatgtgtc caagtagccc tagagtagtc atctacaatg gttaaaaaat acctagaacc 3960

attataggta ggagtagaat agggtcacca agtatttatg tgtattagct gaaaaggctg 4020

ggtggagtga atagaactat cagggaagga caacctggtc tgcctcgcta aaggacaaac 4080

cggactagtg aatgaccgtt tggaagacag tttgcaatta agaccagaaa tgcatttcat 4140

tttatagaag ggaatatggc caagtttgta atgccaaaca acatcatctt tattcacatt 4200

atgcaaagca gtactagtat ttacaattgg agtatcatca ggtacagaaa taggagcaga 4260

aactgaatta agcaaacaag aaataaggaa attagaaaga ggtaaaggag atgatgttgg 4320

aggcctggca ttctgaaata gtttgtagag tccattgtcc aatctaccaa gaaccactgg 4380

cttcctcact gaagggccct gtagggtaca agtagccttg gtaaattgta caatatcatc 4440

atcatgggaa agtaatttgt acacaaagat gagattatat tgaaaactag gaatatagag 4500

cacattataa agaatcaagt cagggaacaa ggctaaggaa ccaatattag tgaccttaac 4560

cttataccca ttaggaaggg agacaaggta tggtacagga agtgtttgaa cattaaaaaa 4620

acaaatgttt aagggaggtc atgtggtcag atgcccaggg tctattactc aaactacact 4680

atctatcata gtcagcataa atgcaccata agacaaccct tgtgaggtaa taactcacca 4740

gcaaagttgg tagaagcaag atagttggtt gaagaagtag atgatgctga tgaagacagt 4800

tgagattgtt gaagtaacat tagctgagaa tattggttct tggtaagacc aggaactgga 4860

taggactgtt caggagcaga ggtaccttca ggaccagctg acattgcaga accaccagag 4920

gtatccacct cagcatgggc aacagacctt ctgggaggaa gagatctatt tgacttgaaa 4980

tttggaggaa agccattgag cttatagcac ttatcaatgc tatgtccggg tttcttacaa 5040

tagtagacat gtgaagctca aaagatccct tagaggtagt accggacctt tgaggttcaa 5100

aatttatttt aggagaggga ggaggcctgg atacaccaac actgaaagaa gcagaatttg 5160

aggcatattg agttctagca aaaatttgtc tttgcttctc atcagatagc aaaatcccat 5220

atacattacc aatggaaggt aagggcttca tcatgatgat gttgcttctt gtttggacat 5280

aagtatcatt cagtcccata aagaactggt agaccttttg ttccctgtct tcagcagatt 5340

tacccccaca agtacacatt caaactctcc cggcagacaa agatgcaata tcatcccata 5400

gtcgtttaat tttgttgaaa tatgatgcta tgtccatgga cccttgggaa atatgagcca 5460

gttccttctt tagctcaaag atcctagtac ctctcttcta actcagtcca aatattctta 5520

gcaaactcag agtattcaac actcttggat atttccttgt acatagagtt agtcaaccaa 5580

gagaccacaa ggtcattgca acgttaccac tgtctggcta gaggagaacc ttcaggaggt 5640

ctgtgagaag taccattaat gaaatctagc ttgttacgaa tagacaaggc aactaggaca 5700

ttacgtctcc aattgccata acagcttcca tcaaaaggac cggaaactaa ggaagttccc 5760

agcacgtctg atggatggac atataagggg cgacagggat gggtataatc atcttcatgg 5820

aaaattaggc gtaagggagt agaagaagtc gcatcagcac tggtgttatt atcatttgcc 5880

atttttttca acagattgtc aatcaaccaa cacaatacag atacacatat atagattgtg 5940

agaaagcacg agagaaaaat ctatattatt gatattctat ttaattataa tacaatgagc 6000

cctatttata caatacatat catactccta ttctatgtgg gactaggact aattcatatt 6060

atgtacataa ctatctaaca ctccccctca agccggtgca tacaaatcat atgtaccgaa 6120

cttgttacat atgtaactaa tacaaggacc agtaaggaac ttggtgaaaa tatctgcaaa 6180

ctgatcattt gacttcacaa actttgtagc aatatctcat gagagtatct tttctctgac 6240

gaaatgacaa ttaatctcaa tgtgtttagt tctctcatga aacaccggat ttgatgctat 6300

atgaatggca gcttggttat cacacatcag ttccatcttg ctgacctcac caaatttcaa 6360

ctaattaagt aaatgtttga tccaaactag ctcacaagtt gtcacagcca ttgctcgata 6420

ttctgcttct gcactagacc gagcaaccac attttgtttc ttgctcttcc aagacaccta 6480

attacctcct actaaaacac aatatccaga cgtagaacat ctgtcaaaag gtgatcctgc 6540

ctagccagca tttgagtacc caacaatttg ctcatggcct cgatcttcaa acaataatct 6600

gttacctgga gctgatttta tatatcgaag aatgcagaca actgcatccc aatgactatc 6660

acaaggagaa tccaagaact gacttaccac actcactgga aaggaaatat caggtctaat 6720

cactgtgagg taatttaatt taccaaccag ccgcctatat ctagcaggat cgctaagcgg 6780

ctccccctgt cctggtagaa gtttagaatt ccgatccata ggagtgtcaa taggtctaca 6840

acgtgtcatt cctgtctcct caagaatgtc taaggcatac ttcctttgtg agataacaat 6900

acatgtgcta gactaagcga cctcaatacc tagaaaatac tttaatctgc ccagatcctt 6960

agtctgaaag tgctgaaaga gatgttgttt caacttagta ataccatctt gatcattgcc 7020

ggtaataaca atattatcaa cataaaccac cagataaata ctaagatttg aagaagaatg 7080

ccgataaaac acagagtgat cagcttcact acgagtcatg ccgaactctt gaataactgt 7140

gctgaactta ccaaaccagg ctcgaggaga ctgttttaga ccatagaggg accgacgcaa 7200

ccgacataca aggccactag actccccctg agcaacaaaa ccaggtggtt gctccatata 7260

aacttcacct caaggtcacc acgaagaaaa gcattcttaa tgtccaactg atagagaggc 7320

caatggagaa caacaaccat ggatagaaaa aggcggactg atgctatttt agccacagga 7380

gagaaagtat cactgtaatc aagcccaaat atctgagtat accctttggc aacaagacga 7440

gccttaagtc gatcaacctg gccatctgga ccaactttga ctgcatacac ccaacgacaa 7500

ccaacaataa atttacccga aggaagagga acaaactccc aagtaccact cgtatgtaaa 7560

gcagacatct cgtcaatcat agcctgtcac caccctagat gagacagtgc ttcacctgga 7620

tggaaataga ggacaaagat gatacaaatg cacaataggg tgatgacaga cgatggtaac 7680

ttaaaccgac ataatgggga ttagcattta gtgtagaccg ttcacctttc cggagtgcaa 7740

tcaattgact aagaggagac aagtccgcag tattagcagg atcaggtgca ggacgtgaat 7800

cagctgggcc tgatgctggg cgcggacgac gatgataagt taggagtggt agagctgtag 7860

aaggttgaac tggactaggc agtggaactg aagctatatg tggtggaact ggagctatag 7920

gtggtggagc tggagctgta ggtgaagatg aatgggagat agtgactgaa tctccaaaag 7980

atggaactgg tagcacctca gatatatcta agtgattacc tggactggtg aagtatgatt 8040

gggtttcaaa gaaggtaaca tcagcagaca taaggtacca cctgaggtca ggagaatagc 8100

atcgatatcc cttttgtgtt ctcgagtaac ccaaaaatac gcacttaaga gcacgaggag 8160

ctaatttatc ttttcttgga gtaaggttat gaacaaaaca cgtgctccca aaggcacggg 8220

gtggaagaga gaacaaaggt aagtggggaa acaagacaga gaatggaact tgattctgga 8280

tagctgaaga tggcatacga ttaataagat agcaagatgt aagaactgca tccccccaaa 8340

aacgcaacgg aacgtgagat tgtatgagta aggtacgagc agtttcaata agatgtctat 8400

tctttctttc agctacccga ttttgttggg atgtgtatgg acaagatgtt ttatgaataa 8460

tcccatgaga gttcataaac tgttgaaatg ggaaagacaa atactctaag gcattatcac 8520

tacgaaatat gcggatagaa accccaaatt gattttgaat ttcagcgtgg aaggtctgga 8580

aagtagaaaa caactcagat cgatttttta tcaaaaatat ccaagtgcac ctgtaataat 8640

catcaatgaa actgacaaag tagcggaatc ccaaggtaga actgacctga ctaggacccc 8700

aaacatctga atggactaaa gtaaaaggtg actgactctg ctcgattatc aagacggcga 8760

gggaaatggg agcacgtatg cttaccgagc tgacatgact cacactctag agtggacaag 8820

tgagataaac cagataccat tttttgaagt tttgacaaac tgggatgtcc caaccgttta 8880

tgtaatagat ctggtgaatc agtaacagga caagttgttg aagaaagaca agatgtaagt 8940

ccatgtgatt ttgcaagaat aaggtagtaa aatccattta attcacgccc ggtaccaatg 9000

atccgccctg tactgcgttc ctgtataaaa acaaggtcat caagaaataa aacagagcat 9060

ttaagtgatt tggctaagcg actaacggct atgagattaa aaagactaac gagaacataa 9120

agaactgaat ctaaaggtaa ggaaggaagt ggacttactt ggcttattcc agttgccatg 9180

gtttgagact cgttatccat tgtgactgtt gggagtgatt gagaatatga aatagtaatg 9240

aaaagagatt tgttaccaaa aatatgatca gatgcacctg aatcaatgac ccaagactca 9300

gaggttgaag attgggagac acaagtcaca ctactatctg tttgagcaac ggaagctatc 9360

cctgaagatg tttgtttaca tgttttgaac tgaaggaact caatataatc cggtagagaa 9420

accatccaac tcttcgtagt attggattcc attttgctac aaccaatttc tcaaattctt 9480

gattacaact tgtgtggtta accttggaat gccaaatcag aacacccctt tttttttttt 9540

ggaaaacatt gttcactcgc tggaaaataa aaaaggttgc cggaatttga tgaaacttga 9600

atagaccgac tcggaataat gtcctaagaa ggctgtccaa aaggagtttt gtcagaaact 9660

gaccagaagg aggtccacgc accggcgcgt ggacagatct cgccgaaaaa aaaaatcact 9720

ttggttggcg cgtgatggcg cgtgggtggg gtttttccgg tcgggttttg tggggtttgc 9780

tcccccggag atggagaaca ctgtggtggt gttggtttat gcacaacact ggtaaaaagt 9840

ggttttgatg cgaacagcta ctcaggtcac caaaaaattg cacggtgacg actgatttct 9900

tcccggatgt cgttggaatg acgcacaacg ataattatct caccaatgct ctgataccat 9960

gtgagaaagt acgggagaaa aatctatatt attgatattc tatttaatta taatacaatg 10020

agccctattt ataagactag gattaattca tattatgtac ataactatct aacatagatc 10080

aaataggcat gcaattcaca ataatggtga ataaaatgat acgaagttac ccagctcttt 10140

tcgcgatcga aaaggagaaa atagccttca atcacaaacg agaaagaaga atctccggct 10200

tgacagtaga cgacttcgaa accctagctc gagatgaaaa ccacaaaatc cccaaatcac 10260

attaccaacc aaacaatttg agatcacaaa tgttgaatat gtgagaatcc gactaagaaa 10320

tcaacaaaaa atcaatagaa atggttgaag aataccgact tgaaccctaa atgagtcaga 10380

catcacctag aatgaaatac accttcgaaa ttgacgaaaa caggaccggt tgaaagcgga 10440

gaacgtgcca tagaaggatc tacgctctga taccatgtaa acttgacata cttctcagat 10500

tgagagtctg agagattaga aaacgagtgt ttccattaga aagagagaaa agagacttct 10560

agatatttcg attatctgtg taaaaatgaa tccgttccta tacaaaaatt aggccttcat 10620

taaatacaag attcggccgg gtattactgg cccaaagtaa aatataaaaa gaatcaccca 10680

ctatcaaatg ggcctagtct aacaagaaaa ccaacaaata gtcccccccc ccccccccaa 10740

aagataccac tgaaatgaca ccgggtgccc aaaaataaag cagcttactt cttgactttg 10800

agaggaactg caatccttat cggtttgaga ggaactgcaa tcagctataa gtagcttatt 10860

aatttccagt gcctgcattc tgccaagtac tatgatatat ttctgaagct ttgtttcccc 10920

agttcctttt tcagacgttt gctgtcaata aagttgagcc agccaacttg gctcccacaa 10980

gctactaatt ttgtccaagc ttactctatg ggagaagtta aatttcccaa attccttgag 11040

cggaaaatga aaaatggact caaagtgtca tattatgcaa ctatctaaag aaaaatactc 11100

aattgaagtt tagataagaa aagtgaatgt atattgatgt agtctccgtt aggtgagaag 11160

cgtatcactt acccagcaac atatggacct aacattttac tagtgaagtt ttcacattgt 11220

atcaaaagct caacaaacgg aaaggtgact aatcctaaaa tgttatttca catatatggg 11280

cacacggttt gtcaaccttc tcatacgtgc attatttgtt ctctatcttt ctatttcatc 11340

cgatataacc aatcgttatt gtaaattcta taatgcctgt ggttactttt gtctttagtg 11400

acaaatgaca tttaggataa ccatgtagtt attgacttat ttcacttgag gtctcttcca 11460

attatgtagt agtagagtgt tgagatatgg atatgttacc ttctaaaaaa aagagtgtag 11520

agatgcggat agtttgctag ctggcttttg tctcccttca agttgaatta gcaaaagctt 11580

gtctcataag ttggatagct agacaagaaa aactccaaat tactttatgt agagtattct 11640

taagcttgag tcgcgagttg gaaactggaa ttatgtaaaa aaacctggaa ttatttggtt 11700

gagcctgctt tttagttttg tcaatatttc cagtatctaa cccaacatgt ttagagtgat 11760

tcccggagag cctcagtaca aggcatttgc agagtcttta tgagagtcca ggaaggggca 11820

cacattctgt agaggtatag tcttgtcctt attttcaggg ttgaactagt tctttagaag 11880

ttacctaggc ttcctaattt ccaaatttct gccaggtcct tttttggtga agtacttgaa 11940

gtttaataaa tcaaatttta atttctaaca tatcctgaga aatttattca caaattcaac 12000

tggtgacttc tgatgcagaa acataagcaa ctgcttatgg gttcatatgt tcctgcaatt 12060

ttattgttga catggattgg cttcatatgg ttttgttcct gcaattttat cgctgacact 12120

aatcctttca tatggtttta tgtggagtgt taaatagagg ttaagagaca agaagaggct 12180

gaaaaaggtg ggcagttcat ttgttagtag actactctat ttactaagag atatgatgtc 12240

ccatacatta ctcgaattgg ctccgaatcc agattccact tctttgccga gtttccttat 12300

tgtacatagt tcgactcgtc aagggaaatt cacttccttt gactgaataa tgctagtttg 12360

agtagtacct tacattaaat ggaccattta gttctatcta cttgatagaa tagactggtc 12420

atcaactagt tgcaaataca atgacaactt tgccatgttt gcagagtcac ctgatgaaga 12480

agtacctcaa ttagtagaac atttcttgaa tgttctacag tattctctat gcctacatga 12540

ccacatcact tttccttttg cgttgtgaga acttgaactt ggtgagcggg ggttccccag 12600

gaatggcatc ttgatggcag atgaccattc tgtccttgtc ttagctaatg cttcttgcat 12660

tgcctcacta gatttattat acctttaaaa aatgtttgcc attgttctgc cataatagaa 12720

ggatgtaccc agctggtgct tcaaaactaa tgaaatgctt tacaattgtc gagtcctaaa 12780

ggatgatttg tggaatcaga tctcaaacaa ttctttttga ggaagaaaaa taccaaaggt 12840

tttttctgtt tgttggaaga ttaaaaatcc tttaaatggt aaagatttat gaacttaatt 12900

cagcgttttt gtggccattg ctggaaaaga gaaaaaacaa tggcacttct tcgagtttgc 12960

ttatccaaaa aaaagaagaa gagaatgtca cgtaatgcaa tttcatctta ggaaactttg 13020

caggagaaaa gcaagagtga taaaacagaa ctatttgttt tttttaacaa gttgttgtga 13080

cctatttctt gtcattctta tttgctaata agctaatgta ctatagttcc tgtactatgg 13140

tttgttttga cttaatacgg ggatgttcaa tgagcatttt cttgtttttt ctgctttcag 13200

catctgctgc cttacaggaa ttcattttct ggaaatttac ttcttgttct gctaacattt 13260

tcctgttata tcttgtcagt cattttctct ccatggttat actgtttgtg tcactttaaa 13320

ctctccttgt tttctacttt aaaggattta atgctgctgt cgggggctgt ttctttgctg 13380

tggaatctgt gttatggcca tcacctgcag agtcctcctt gtccttaaca aatacgactt 13440

caatggttat tctcagtgct gttatagctt ctgtagtctc agaaattggt cttggctctg 13500

aacctgcatt tgcggtccca ggatatgatt ttcgtacacc tactggtaat tttggacttc 13560

tttctcgagt ttgattctta aatacaattg tacccgtcac ttacagcaac aactacattt 13620

caacagctag ttggggttgg ctacacagat catcactatc catttcaatt catttagtcc 13680

catttctttc gaatattgag tactttggga ttctataata tcaaggttct ttatattttc 13740

tactttgacg tacaaatctc taaatagatt aaagaagact cctagagaca ctggcctaat 13800

gcaaatgtac caccatgaat aaactttaat ctgaaatagc tggtatctta tataaggacc 13860

cttagcttta attgtgttct atattgatct tttgggacaa cttccttcca atattatgtc 13920

ttacttatac agttatactt atccttaagc cttactcttt agagtggtta tccctaattc 13980

aagcttttgt tggcaccata gctagtttgg ttctaagtaa aaagttactc tttagagtgg 14040

taactttttg tcaattttct tagtgaaaat ataacctctg tgacaaatct accaagtata 14100

aatccaattt ggttctatgt catccttgta gtttatccaa gtcaatgctc catcactctt 14160

acaaaggttc atcgtatgac taatcttttt tggagaaagg taacagtttg tattgataat 14220

aagatcagcg ccaggttggt cattagtgct aatagctgta cgtacaactc caaaagagca 14280

aaagacaagc acctgatgta aggtaaatta caagctgcct ataaaatcta tcaggtgtcc 14340

tatctcacta aacatttctt gtttacacca aaaaaataaa acaaggaaag acaatccatc 14400

ttaatcttct gaatggagtt tctttttcct tcaaaacatc tggagttcct tccgttccat 14460

gcaatccacc atatacaagc tgggatgatt ttccatttgt ctttatccat ttcttctacc 14520

aattcccttc caattgatta gaagttccaa tgtggttcta gatatgaccc aattaactcc 14580

caacagataa aagaagatgt gccacggatt tgtagtgatt ctgcaatgta ggaacaagtg 14640

agcattactt tctacttcct gtccacaaag aaaacatctt gagcaaatct ggaaacctct 14700

tctttgtaag ttatcatgtg ttaaacatgc ctttttcacc accaaccaga caaaacatga 14760

tactttggga ggagttttaa ccctccaaat gtgtttccaa ggccacacct cagttgttga 14820

aacattagga tgtagagtcc agtatgctct tttactgaaa atgcaccttt tctattcagc 14880

ttttaaacta ctttatctat ggtctgtgat gtacccttga aaggttcaag agtttggagg 14940

aagatagaaa ctctgtttat ctcccaatca tccaaagatc ttctaaagtt ccagctccat 15000

ccttgtgagc tccagactga cttaccaatg cttggctttg aagacttaga gagaataagt 15060

caggaaaata tctttcaacc ttccttgccc tatccggtga tcttcccaaa aagatgtctg 15120

caacccattg ccaatattga tcttgatatt gctactgaaa gatttctttt ggtggcagga 15180

ttactctcat taacaatgta cttgacaatc tccatacata ctaatgtctc tttaccctct 15240

tgccattaag gttgtaaaga gacttgtcaa attaagaaaa ggtttcctat ggaactgttt 15300

caaggaagga acctcctttc ctttggtcaa gtggagttaa gtcatataat ctaggaagtg 15360

gaggcttggg tatgaaatag ctgcaaatac agaaaaggag catcttattt aaatgatcac 15420

ggaaatgtgc ccaaaacttt aaatatctgc acagcatatg gttgtagcaa aatttgaatc 15480

ttcctgtcaa tggtgctcat gtccagtgaa tacccctgat ggtgaaagtg tcctgaaggg 15540

aagcaggaac ttattggaag aattggcatc taacactcag cttttcggtg ggtcatagcc 15600

cattgaaaat tgagtgccca gatttatata gttttgctct aaactgacga tgcagttgca 15660

caacatacga caaactaagg tgggacatca tcttcttcgg aaggaatttt gaggattaag 15720

agatagagtg gttgattcag ttgcaaatga agcttcaagg gttcaatatc atccaggaga 15780

caccggattc tgatagataa aacaacagaa agatgagcac tactttgtta ggcttgttac 15840

aagttgctat cgtctttctt atctcggtac acaatttaga tttgggaact tagttggaaa 15900

agcagagtgg ttgtttttgt gaatagcatc agacaaagct tctgagctgg tacgacagaa 15960

aactcaacag ggagaataga agactgtggt tcacaatttc tgcatgcatc ttgtaggtta 16020

tttggtgggt aaattattta atgttttgaa gggaaggtag aacatgttca taggcttaga 16080

ttcaaatgtt tgtatttttt tggctctttg gtgagagatg ctgaacgtaa atgacatagg 16140

cagctgacta taatttctca gctccttgct ttttaaattg acaggcactg atatgtacat 16200

gtgaacatcc aacacttttg tggtgccgtt ccgatgaata aagaacatta atcacttact 16260

gatcaggagt aatagtttag gagttctaga atttttgtac ataaaatgaa ccaaaaagaa 16320

gatcggaatg agaacatgtt tctttttttg ttttttcttt ttcgtgaaaa cttcaataac 16380

acttctgata gaatagctag gtccatttga attcctttgg agacccttac acaaccaatg 16440

aatgacaagt atagcatttc taactccctc ccacacgtat aacccagatt ttagggttta 16500

gatgtggatc tgatttgacc ttattgcctt tttttgtttt tgttcttttt gaagtagaga 16560

gtgaggaggc tcaacaatta attcggctca acgggctaat gattggactt acatgctacg 16620

acaatgttag gagagagaga gagagagaga agcccagagc agttacatga gttaagaaag 16680

agaagtccaa agcgatagaa tatgaagaga gaaagcggtt gtgctaacag gctccctgaa 16740

gtttggctct gagcatccaa ctcaaaacct taaggcaatg agtagagtag cccaggacca 16800

tttaaattgc tgttgaaaac cttacacaac caataaggga acaagtgtaa cattctctta 16860

caaccctacc gtcttataag tcagtgctct aatttagcat aaaatcaaag tgaggcgatc 16920

tacaatgaaa tgaagtaaat aactgataaa tacaaagaat gttaattctc caatatagcc 16980

tgaatgttcc cagaacaaaa taaactagtc tcaggattta tcattaacat gatgttcctc 17040

ttattttgag tgattaggaa ggttaatcaa ggtataaatt ctttctaatt tgtatcgtct 17100

agaattattt atctaacaaa ttttcagatt accggttcaa aagaggaata tattttgcat 17160

acaacgttac cataccttac aaaagggaga tgaacatttt tttattttat tattgtcctt 17220

tttttcaatt agggattatg cagtcttcct ccacgtgata ttactcttag aatcacgttt 17280

ttgtcattgc tattacttaa tgtggtaagt acaaatgtgt tttgaactct ttttggtatg 17340

taatattgag ttaatttttg gtttccattt cagagctgcc gctttatctt ctgctgggca 17400

tcttttgtgg cttagtttca gtggcattat caagttgtac atcatttatg ctgcaaatag 17460

tggaaaatat tcaaacgacc agcggcatgc caaaagcagc ttttcctgtc ctgggtggtc 17520

ttctggttgg gctggtagct ttagcatatc ctgaaatcct ttaccagggt tttgagaatg 17580

ttaatatttt gctagaatct cgcccactag tgaaaggcct ctccgctgat ctgttgctcc 17640

agcttgtagc tgtcaaaata gtaacaactt cattatgtcg agcctctgga ttggttggag 17700

gctactatgc accatctcta ttcatcggtg ctgctactgg aactgcatat gggaaaattg 17760

ttagctacat tatctctcat gctgatccaa tctttcatct ttccatcttg gaagttgcat 17820

ccccacaagc atatggcctg gtatgaattt gtcttttgtt agaagtagca ttacatatct 17880

ggataagtga gttttttatt attgaaaagt aataacagga gagcaagaga atatagcacc 17940

caaatctact tctttcctct cttctattct tctgaaattc aaggtccttt aactcctcca 18000

cggcctgtct agttattgat cctgtagact taattcacat aggtttagga cattcaagtt 18060

tatccaaact tcgtgaaaag gtttctaatt tttttacatt acagtatgag tcgtgtctac 18120

ttgagaaaca tatcactcca tgtttctata gagtctgttt tctcctcagt ttattttgat 18180

atatggggtc ctattaagac agttcaacct tggattttca ttatttttgt tgtttcattg 18240

ataattattc aagatgtact tggattttct taacaagaga tagttctcag ttgttttttg 18300

tgttcctaag tttttgtgct gcaatacaaa attagtttga tgtctctatt tgcatttttc 18360

ccaatgataa tgccttagaa tattttcttc tcggtttcag tagcttatga tttctttaga 18420

aactctctat cagaaatctc aactgagata gatgagagga agaataagca tatcattgag 18480

acggctcgta cccttctcat tcagtcccct gtcaagctta gtttcttggg cgatgcagtt 18540

tcacgtcctt tgattagatt aattggatgc ctcatctgct atccaaaatc agattcaact 18600

ttcgatattg tttcctcgct tacctttata ctctctttcc ctcgagtctt tgggagcaca 18660

tgttttgttc aataacatag ctcctggaaa gtgaccagcg caaccgacaa gcaaggcctt 18720

cttaatatag aaggagggca tatgctattc tagccacgag ggagaaagta atattgtaat 18780

caaacccaaa tatctgagta taacctttgg caatggcgat caatttgatt atatggacca 18840

actttgccta catataccca ccgatagatt tacggggagg tagagaaata agctcccaag 18900

taccactaat atgtaaagca gacatctctt tgatcatagc ctgtccttgt ggacataggg 18960

atagaaattg aggactaaga tgacacaaaa gcataatgct gtgatgataa acgatgataa 19020

ctcaaatcaa tatgatgggg atgggaatta agagtggatt gaatatcttt gcggaatgtg 19080

attggtagac taggaggaga caagtccgca ataggtaaaa gatccagtac atggaatgaa 19140

tcttctggac atgatgttgg actgacgtca atgataagtc aagagtggtg gagttgcaga 19200

acatggaact ggagctgtag gtgacataat cgaagttgta gggggtggag ctatagagga 19260

aggtgaagga gagatagtga ctgaatctcc aaaatatgaa accggtaata cctcaaaaaa 19320

tgtctaagag atcatttgga cctatgaagt atggttgcgt tttaaagaag gtaacatcag 19380

cagacataag gtaccgcgga aagtcaggtg aataacattg atatccttgt tgcgtcctcg 19440

agtaacttag aaatacatat ttgagagcac ggggagctaa cttatctttt ctggagtaag 19500

gttataaaaa aacacatgct cccatagaca cgaggtggaa gagagaaagg tgagtgggga 19560

aacaagacag agtatgaaac ttgattcttg atagttgaag atggcataca attaataaga 19620

caataggatg tgagaactgt atccccacgt aaacacaaca gaacatgaga ttgtacgagt 19680

tgggtatgag cagtctcaat gagataccta ttcttccttt cagctatccc attttattga 19740

gatgtgtatg gacaaaatat ttgatgtatg atcctatgag agttcatgaa ctgctgaaat 19800

ggagaagaca aatactctgg ggcattatca ctatgaaatg tgcggttaga aaccccaaat 19860

tgattttgga tttcagagtg aaaggtctga aaaatagaga ccaactcaga ttgatttttc 19920

atgagaaata tccaagtgga cttggaataa tcatcaatga aactgacaaa gtagcagaat 19980

tccaaggtag aactaactcg acaaggacct caaacatctg aatggactaa agtgaaaggt 20040

gactctattc gattatcaag acaccgagga aaatgagagc gagtatgcct tctgagcgga 20100

tatgactgac gctctagagt ggacaagtga gacaaaccag gtaccatttt ctgaagttct 20160

gataaattgg gatgtcctaa ccgtttatgt aataaatctg gtggatcagt aaaaggacaa 20220

gctgtaaggg gacaaaaata ccaaatattt ccagaagatg gcaaactaca acagaagaag 20280

caactacatt aacaggctca ggatatgtga tgaaatgagg acaaagagtt gatcaagaag 20340

gagattctgg aattctacca gaacttatat agtgaaaatg aaccgtggag gcccagtgca 20400

aattttgaag gcatctcctc actaagcata gaagagaaga actagttgga agctccattt 20460

gaagaaatag aggtgcttga agctttgaaa tcatgtgccc ctgataaagc accaggtcca 20520

gacggcttca ccatggcttt ctttcagaaa aattgggata ctcttaaaat ggacatcatg 20580

gccgcactta atcactttca ccagagctgt cacatggtta gggcttgcaa tgccaccttc 20640

atcgccttaa ttccaaagaa aaagggtgct atggagctca gagactacag atctattgac 20700

aaactagtct cgggggaaca aaatgctttc atcaagaaca ggcacatcac tgatgcttcc 20760

ttgattgcca gtgaagtgct ggattggaga atgaaaagtg gaaaaccagg cgtgttgtgc 20820

aaactggaca ttgaaaaggc ttttgatcaa ttaagatggt cttacctcat gagtatcttg 20880

aggcagatgg ctttggggag aaatggataa gatggataaa ctattgcatt tcaactgtca 20940

agaactctgt tttggtgaat agtggcccga ccggtttttt ctcctgccaa aagggcctaa 21000

ggcaggggat ctcctctccc ctttcctatt cattttggcg atggaaggac tcactaaaat 21060

gttggagaag gctaagcaac tacaatggat acaaggcttt caggtgggaa ggaatcctgc 21120

cagctcagtt acagtatccc atctactctt tgcggatgat actcttattt tttgtggtac 21180

tgagagatca caagcacgaa atctcaacct gacgctgatg atcttcgagg cactatcagg 21240

actccacaac aatatgataa agagcatcat ataccctgtg aatgcagtcc ccaacataca 21300

ggagctagca gacatcctat gctgcaaaac agatactttc ccaacatatc ttggacttcc 21360

cttgggagct aaattcaaat caaaagaagt ttggaatgga gtcctagaga agtttgaaaa 21420

gaggcttgcg acttggcgaa tgcaatacct ctccatcggt ggcaagttaa ctttaatcaa 21480

tagtgtactg gacagtcttc ctacatacca catgtctttg ttcccaattc caatctcagt 21540

cctaaagcag atggacaaac tcagaaggaa gttcttacgg gaaggatgca gcaaaacaca 21600

caaatttcca ctagtgaaat gactcaaggt aactcaacca aaattcaaag gaggcttgag 21660

catcagggat ctacaagcac acaacaaagc tatgctctta aaatggctct ggagatatgg 21720

acaggaggaa tctaggctat ggaaggacat catagttgct aaatatggag cacacaatca 21780

ctggtgttcc aagaaaacaa acactcctta tggagttggt ctgtggaaga acatcagcaa 21840

ccactgggat gaattcttcc aaaatgtaac tttcaaagtt gggaatggaa ctcgtattaa 21900

gttttggaag gatagatggc tcggaaatac acctttgaaa gacatgtttc ccggtatgta 21960

tcagattgcc ttgaccaaag actccactgt tgctcaaaat agagacaatg gcacttggtg 22020

cccattttca gaagaaattt gcaggattgg gaggtcaaca gcctactcac aatgttaagc 22080

tccctagaag gtcataatat cgaagatcaa cagcctgaca aacttatttg gggaaattct 22140

gagagaggca agtacacagt caaagaatga tacattcacc tctgtgacca gaatccaata 22200

atagataact agccatggaa acacatctgg agaactgaag tgcctaccaa ggtgacttgc 22260

ttcacatggt tgactctaaa tggggcatgt ctcactcaag acaacttaat caagaggaat 22320

atcatactag ttaatagatg ctacatgtgc caacaacagt cagaaagtgt aaaccaccta 22380

ttcctccact gctcagttgc aaaagacatt tggaacttct tctacactac ctttggtctg 22440

aaatgggtta tgccacaatc aacaaagcaa gcttttgaaa gttggtattt ttggagagtt 22500

gacaaatcca tcaaaaaaat ctggaaaacg gtgccggctg catttttttg gtgtatttgg 22560

aaagaaagga accgaagatg ttttgatgac atattaactc cactctactc cctcaaggct 22620

gcgtgtttag ttaacttatt tagttttgtg gattttatta gctccctgat agtagcatag 22680

gcttttgtaa atggagctaa ttatcctatc tcttttgtac tctttgcatc ttcttgatgc 22740

cttttaatga atctaattta cttcataaaa aataaaagga caagttgttg aaggaggaaa 22800

agatgtgagt ccatgtgatt tagcaaggat aaggtactaa agtccatttg attcacgccc 22860

ggtaccaatg atccatcccg cattgcattc ctgtattaaa acagagtcat caagaaataa 22920

aatagagcaa ataagtgatt ggccaaacga ctagtggata tgagattaaa aggactatcg 22980

ggaacataaa gaactgaatt caaaggtaag gaaggaagtg gactagctta acctattcca 23040

gttgccatgg tttgagaata gttggccatt gtgactgttg gaagtgattg agagtaagaa 23100

atagtagtga aaagagattt gttaccagaa atataatcag atgcaactga atcaataacc 23160

taagagtcgg aaaaagaaac acaagtcatg ttattacctg tttgaacaat agaagttatc 23220

tccgaagagg attatttaca tgttttgtac tgatggaact caatataagc cgataaagaa 23280

accatccgga tattcaaagt attggatcaa cagcttataa gccaaaagca tccgatacga 23340

gtgccattat aatggatcaa gagagatcaa acaacaaatc accaaatatc ataaacaacc 23400

aagaatctcg ctggaatgtg aacaaagatt gaaaaacaac aatgtagctc gccaaaaatg 23460

tgcaaagtga tcgaaaaata ttgaatcgtg agtggagaga aataggagct tcaatcgacc 23520

cacacagtac caaaaaatcc aaaaacggtt gtcggagctc aagaaagttg tcaaaaagta 23580

tattgtatgc ttcgaaagta gccgaaaaag gttggaagtg ggatgtgtca actccgaatt 23640

atgatacgag caccacagaa gatcaatttg tgtcaaaact accgaaaaaa atacttcaca 23700

ccccgacgcg tggagtactc gctcgttgga acccttgctg ccaacgtcgc atgtaggatc 23760

agttttcgaa gaatcttatt ggggtttggt cgccggacga tgtcggatct tgtggtgccg 23820

ttggaattcg cacaaccctg aaggaaaaga aggttacaca aatcagatct gaaagtcacc 23880

gaaaagacac atggcgattg acttttttgt ctcagatgtt tctcaccgtc gctctgatac 23940

cagttgttgg gctcaactcg tttgaagata ctcttaacat agtgtgatat tgtccctttt 24000

ggaatgtgag tcatcttagc tcggtaagca tactcgctct tccaactagc ccgaagatac 24060

ttttaacaga gtgtaatatt atctgctttg agccaagctg gcgcggtttt catcaaaaga 24120

cctcatacta ttaaaagatc catacacctt atatgtaggc ttctaagttg ctcggacacg 24180

ggtgcgagta cccgacacag gtgcaaatct agaggtcaga tcctttaaaa tgtaaattct 24240

aagatttggg gatacgaatc ctagtacgga tacgggtgcg aggatccgat taaaaataat 24300

tcaaaaaaat aagaaaataa aaaagtctct aaattatgtg aaattttgtg gaataactac 24360

gtatagcttg taaagtgtgg atttattttt tattctcaag ttgtagataa gtaaatgatt 24420

gatttcctag ataaggtatg ttattttctt caaatttacc ctagtttggt tcgaatttcg 24480

ggaaattgta tcttgtctcg aatttttcct tctgtcctga ttaaactact caaaatcgtc 24540

tgaccagatc cggtacggat cccataccca catccacact agtgtcgtgt ggacaagggt 24600

gcggcaccta aacttccgtg taggagcaat ttaggtaggc tcctaatctt ttcagctatt 24660

aatgtgggac ttttacgcac ctctatcaaa ttccccaata aactaagttt cacgtggtcc 24720

atcatcgcaa tccacgggtc tcttcctcta gttaagtccc acatggccca ttaccatgat 24780

ccacgggtca attttcgtga ttcatcgtgt gccacccaca tcgttagtat ttatggtaac 24840

taaagtacgc aactagcttt tgcttgtgag cgtgtctcca agctcgtaaa ggtaagaaaa 24900

ccgagccgca tattccatca ctctatcatc accatactcg tcccgcgaaa cttgtaagat 24960

aaaggtggct ggttggtcag ttgaactacc tcagagtgac ttggtatagt atttcctttc 25020

ttgtgaatat ttaactcaat tatggactct ctgtgtgata gtcattgaga gccattttct 25080

atatagccgg tgcacacaaa tcatatgtac caagcttgtt atatatgtaa ctaatacgag 25140

gaccagtgaa ggactcggtg aaaatatctg caatctggtc attcgacata caaggccaat 25200

agactcccca gcaataaaat cagggggttg ctgataaata gaattggccg aaatgttgcc 25260

agaaaaattt gaaaatagtg agactaagcc gaattctaca ctacaaaata ggttttaaaa 25320

cacaaccaga aaacaaaaac ttttttggaa attactgttc acatcgaaaa aataaaagtt 25380

gtcagaattt gatgtaattt atatggatag gctcgtaatc actggacgag taagttgtcc 25440

tgaagaagtt ttgtcaaaag gtggccggaa tggctcacac atgccggaaa acttattgta 25500

gctcgccgga accctagttc tggcggtgcg tagaggcgtg tgactttctg ccagactgat 25560

tgactgtggt ttgtcgcctg acttttccta acaagatggt agtattggtt ttcgcacaac 25620

aattaccgat gaggagataa cgcaaatcaa tcttgagtcg tcaatcggaa agacgcacgg 25680

tggctgactt tctatttaga tgggactgga atttctggag tttaatcgca caagcgtttt 25740

ggatctgatg gtaatactgg tatgcacagt accactgtag cagtgatgaa ccctcaaaat 25800

aagacaaagt tgccagaaaa ttgcacggcg atgagatctt tcttccggat gtcaccggaa 25860

tgacgcacaa cgataatttc tcactgaagc tctgacacca tgtgagaata cacgggagaa 25920

aaatctattt ttattaacaa tgatacaatg agccctatat ataatacata ttctactcta 25980

ctacatatgg gaatagggca tattttactc ctactacata tgagactagg actatttaca 26040

cataactatc taacaagggc tatatctcag atttatgaga atatctaccc aacgacccag 26100

agagacgagc ctaatcattt tgcagtggca cagactataa caacaaaaaa cctactcata 26160

atggttaaac caactgatta agatgcttac aggactatct tgagaaatgt acatattata 26220

tagatgcttg agttgcgtcc caatcctaaa tagaagcttt tattcgtaag caagaaggga 26280

agcagcttta cttgagccaa tagctttcaa ggtgcatgtt gtcacaccaa ggacatccag 26340

aatttgattt tatagtggga atatcgttta aagataaaaa agatagcgtg cagaagattg 26400

catacattag agatgcaaaa tacggaatac ccatactccc agataatgca gtatgccttt 26460

tgcatgacct actggttgaa tggaagcacc tggtgaattt actaggtgtg ttagtgattt 26520

ctgctgcttc cttccccttt ctaaactgca tactatctaa aatgttaggg gggcagaagc 26580

ccagtcaatc tgactaggtg atgttagtgg tttccgcttc ttcctcccac ttctaaatgc 26640

gtactttctc aaatttagga gcatagaaac ttaagcagct gcctacctga ggagttgcat 26700

gggaacataa gagaatagac tttacctgtc atattttcca taccttagtt aattacagtg 26760

ttatcctgat aatgatctgt tttctggatc taggctgaat cgagattcaa tcgcttttgg 26820

ttgaaaggat gctgctacag atccttagtt tacatcattt tggttcttat tctataagta 26880

cttcccctat caactacttc cttctttttt cttaggttat ttgcctcttt aggttgtttg 26940

gaaggaaagg aacagtagat gttttgatgg aatagcaact ccaaaccact tccttaaggc 27000

taatatcctg attggccaag tttctccaaa gtccaaaaca cttttttttt ccttcaaaaa 27060

agtacctttt tttttcaaag ttgaggtgtt tggccaagct tttggaagga aaaaaagtgt 27120

ttttgagtag aagcagatgc tcttgagaag cagaagaagt agcttcttcc cggaagcact 27180

tttgagaaaa ataaatttag aaacactttt taaaagcttg gccaaacact aattgctgct 27240

taaaagtatt ttcagattta ttagacaaac acaaactgct tctcaccaaa aatacttttt 27300

tgaaaagtac ttttcaaaca aagcactttt caaaataagt tttttagaag cttggctaaa 27360

caggctataa atgtctttta tttttacagc tggagtaccc taacacctgt aaattcccct 27420

atacattttt ttcgactttg gtagctcatt aaccctagta taggactctt tgttttggag 27480

ctagcaaact cttttgtttt cctatttttg catcttcttg gtgccattta taatatctct 27540

tcaccaaaaa aaaaaagttc ccaaactatg actaccttga gttggtcaaa gcataaccaa 27600

agcatgggca caccagtgtt tgcgtgaatt ttatggatgt tccttacctt tatccttctg 27660

tgcttatgta gcatctgtct tggtcaatct tttctgaagt ctatattgta tttctgtgtt 27720

gcaacatgag tttactgtta atcttactgt ttgacctcaa ttttgggttc tttttgattt 27780

tggaagacat cgtttaacag gttggcatgg ctgctactct tgctggtgtc tgtcaggtgc 27840

ctctcactgc ggttttgctt ctctttgaac tgacacagga ttatcggata gttctgcccc 27900

tcttgggagc tgtggggttg tcttcttggg ttacatctgg acaaacaagg aaaagtgtag 27960

tgaaggatag agaaaaacta aaagatgcaa gagcccacat gatgcagcga caaggaactt 28020

ctttctccaa catttctagt ttaacttatt cttcaggttc accttcacag aaagagagta 28080

acctctgcaa acttgagagt tccctctgtc tttatgaatc tgatgatgaa gaaaatgatt 28140

tggcaaggac aattctagtt tcacaggcaa tgagaacacg atatgtgaca gttctaatga 28200

gcaccttgct aatggagacc atatccctca tgctagctga gaagcaatct tgtgcaataa 28260

tagttgatga aaataatttt ctcattggtc tgctgacact tggtgatatc cagaattaca 28320

gcaagttgcc aagaacagag ggcaatttcc aggaggtagc ttcttggtac atttcaatat 28380

tcttaactga tgaaaaaata agggaaattg atctagcatg aaatgaagct aattataagt 28440

tttacacagt agaactggta aaacagggtt ggctggatat ttctttgttg aatttttagg 28500

attatatata ttgttttagt tttgtaggtt gttttctgat gtgctttttg actcggcaga 28560

atcttaagat gaaatggaag gttgtatcat caaatgttaa ataagggaat atgtgacttt 28620

caaagttaag cacggagtat tttggagtca atagttactt cctgaatctt ttaggatgga 28680

ggagacagtt tctataggaa taggaaaagg ggacctgatt tcattatttg tgtgtatata 28740

catttgttat ctgaattcgc attactttct aacaaccaac aaaaggaaag tggacattca 28800

atttgagccg gagggagaaa atttaactag aaaatgacct ggccgtgaaa taaaattatt 28860

gatccgtcct ttaactagtt ttcatggatt gcctccttgc ggatgatttt tccaaccggt 28920

agaactactg ttagtcgtcc aaattctgac cccctactat gaataaaaat gtattagtaa 28980

gtttagtggg taatctcctt gagaaataaa ggaacaggag aaatatttta ttgatatatg 29040

ctaagtgttt tacaatagcc ctatttatat acaatgttta cataaaccta aagccttcta 29100

tataaatgtg ggacactata catgaactaa ctctaacact atccctcaag ctagtgcata 29160

taaattatat atatgcttgt tacatatata attaatttct ctactttttg gtatacttct 29220

tgtatacggg agttatctcc cttttgatta atacaattta ccttatcaaa aaaaaattaa 29280

tacgaggacc agtgagggac ttggtgaaaa tatctgcaag ttgatcattt gacttctcaa 29340

actttgtaac aatatctcct gagaatcttc tctctcgtga agtgacagtc aatctcagtg 29400

tgtttggtcc tctcatggaa cactggattt gatgcaatat gaaggacaac ttgattatca 29460

cacacaagtt ccatctgact gattgctcca aattttaatt atttgagcaa ttgtttgatc 29520

caaactagct cacatggtgc aagagtcatg actcgatatt cggcttctgc gctagatcga 29580

gcaactacat tctgtttctt gcttttccga gagacaaatt acctcctatt aaaacacaat 29640

atccagatac gtaacgtcta tcagaaggtg accctgccca attagcatct gtgcgtccaa 29700

caatatgctc atggcatcga tcttcgaata ttagtcattt gtctggagct gattttatat 29760

aacgaacaat gcgaacaact gcatcccaat gactatcgca aggaaattcc ataaactgac 29820

ttacaacact cacaggaaat aaaatatcag gtctagtaat tatgaggtaa ttcaattttc 29880

caaccaggcg cctatatttt gcaggattgc taagaggctc ccccctatcc tggcagaagc 29940

ttagcattcg gattcataag agtatcaata gttctgcagc ccattattca tgtctcctca 30000

agaatgtcta aagcatactt cctttgcgaa ataacaacct gaactagacc gagcgacctc 30060

aatacctaca aagtacttca atctgctaag gtcgttagtc tggaagtgtt gaaagtgatg 30120

ttgtttcaaa ttagtaatac catcctgatc attgcgagta ataacaatat catcaacata 30180

aaccaccaga taaatacaga gattaggagc agaatgccga taaaatacag agtgatcagc 30240

ttcactatta gtcatgccaa attcccgaat aattgtcctg aacttacgaa actaggctcg 30300

acgagattgt tttaaaccat agagacttgc ataagtgaca tacaatacct ctagactccc 30360

cttgagcaac aaaaccaagt ggttgctcca tattaacttt atcctcaaga tcaccatgga 30420

gaaaggcatt ctttatgtcc aactgataaa gaggccaatg atgaacaata gccatggaca 30480

ggaaaaggcg aacagatacg actttagcca cgggagaaaa gtgtcattat tatcaagccc 30540

aaatagctga gtatatcctt ttgcaatcag acgagccttg agccaatcaa cctggccatc 30600

caggtagact ttgactgcat aaacccaacg acaaccaaca gtagacttac ttgaaggaag 30660

agaacaaact cccatgtacc actcactcac atgtaaagca aacatctcgt caatcatagc 30720

ctgtcgccat cctggatgag atagtgcctc acctgtaaac ttaggaatgg aaacagtgga 30780

caaagatgat acaaaatcat aatagggtga tgagatgcgg tgataactta aaccaacata 30840

atggggacta ggattaagtt tggatcatac accctttcga agtgcaatca gtggactagg 30900

aggagccaag tccgcactag acgtggatga caatgataag tcaagagtgg tggcctcgtg 30960

gttggagatg taggatgagc aactgtagac tcctcagaag tcggtatagg taggagtacc 31020

tgtgatgttg atgtggattt aagaggagga acaatagatt cctcacaagt agatacaggt 31080

aagacctcag atatatcaag atgattagat gaagtaaagt aaggttgaga ctcaaaaaat 31140

gtgacatcga ctgacataag atatctacga agatcaggtg agtagcagcg ataccccttt 31200

tgaacccgag aatagccaag aaagacacac ctgagaacac aaggagctat tttatctttt 31260

tcaggagcta agttatgaac aaatgtactc cttaaaacac taggaggaaa gagtataaag 31320

atgacctagg gaacaatact gagtgtggaa actgattcta gatggaagat gaaggcatcc 31380

gattaattaa gtaacaggtt gtaagaactg catcgtccca aaaacgttgt ggaacatagg 31440

actgaatgag aagtgtgcga gcagttttaa tgagatacct attctttctc tctactaccc 31500

tataatgttg aggagtatac agacatagga taatattttg agaagtcata aactattgaa 31560

actaagagaa tacatatttt aaggcattat cactacgaaa agcgaataaa aacaccaagc 31620

ggagttttaa tttcagcata aaaactctag aatattgaaa acaactcaaa acgatctttc 31680

atttggaaaa tccaaataca tcttgagtaa tcattaatga aactaacaaa atccaaatct 31740

taaggttgtg actctactaa gaccccatat atcataatga actaaagaca aaacagactc 31800

tacacgactc ttagcacgac gtgaaaatgt agctcgaata tatttcccaa gttgacacga 31860

atcacaatct aatgtggaca aaccagacac catcttctga agcttggata aactcggatg 31920

tcctaaacgt ttgtgaatta ggtctagagg atctgtagtt ggacatgttg tagagggatt 31980

gagtgagtta agatagtcaa ggtcttgtga ttcacgccat gtgccaatcg tctgtaccgt 32040

actgcggtcc tgcatagtaa aagaatcatc aataaaatat atatcacaat ggaattcacg 32100

agtcaaatga ctaacagatg cgagattaaa ggacaaccgg ggacataaaa aatagaatct 32160

aaagtgacag aggacatgtg attagcttgt ccaactcctt ttgcttttgt ttagacttca 32220

tttgctaaag tatcattggg aagagattgt gaataaacaa ttatttgaca aaagtgacat 32280

attaccactg gggtatcaag ttgcttagtc atactaagaa tgtttgggag agggtggtgg 32340

aagtgagggt aaggaggaca gtgtctctat ccgagaacca gttcggattc atgcatgatc 32400

gttcaactgc ggaagctatc cgtcttatta ggaggctggt ggaacagtac aaggatagga 32460

agaaggattt gcacatgatg tttacctaga gtaagcgtat gacaaggtcc ctaaggaggt 32520

tccttggaga tgtcagaagg ttaaaggtgt tccggtagca tatactaggg tgatgaagga 32580

catgtatgat ggagctaaga ctcgggttag gacaatggaa agagactcta agcattgttt 32640

ggttgttatg gggttacagt aaggatctac gctcaaaccg ttcttatttg ccttggcgat 32700

ggacgcatta acgtaccata ttcagggaga tgtgccatgg tgtatgttat tcgcggatga 32760

tatagttctg attgatgaga cgcgaggcgg tgttaacgag aggttggggg tttggagaca 32820

gacccttgaa tttaaaggtt tcaagttgag caggactaag acagaatact tggaatgtaa 32880

gttcagcgac gtgacggagg aagctgacat ggacgcgagg cttgattcat aagtcatccc 32940

caagagagga agtttcaagt atcttgagtc agttatacag ggagaagatg gggagattga 33000

caaggatgtc acgcaccgta ttaagggcgg ggtggatgaa atggaggtta gcattcggta 33060

tcttttgtca caagaatgtg ccaccaaaac ttaaaggtaa gttctataga gcggtggtta 33120

gaccaaccat gttgtatggg gcagagtgtt ggccagtcaa gaattctcat atctagaaga 33180

tgaaagtagc agaaatgaga atgttgagac ggatatgcgg gcatactacg ttggaagatt 33240

aagaatgaaa atatttgggt gaaggtgggc gtggccccat ggaagttgtg cccaccatta 33300

aagactgcta tctgaaaact aattctttgg gcccaaacat tctggcccaa agtacctcgt 33360

gaataataat attgagctca tgtctgacat gttggaagag gagttactag caaacactta 33420

tacacctatg ttggtaacac aattgaagaa ctacgaaaaa cactcttctg caaaggaaaa 33480

tgagaagaag aagaagaaga agacgaagaa gaaggatgat gcaatgatca ttgaagaaaa 33540

aggagagcag gaggacccat ctaaacttac aaagtctaga ggaagaggag gacccagagt 33600

ttgatgcttc cctctgggta caccaaaaca tcgtcaaact taggcaagga gtttggggta 33660

aacattcagg ggtgtgagaa ggaagctttg gagcttttcg taaaattaca actagaggca 33720

taaaaaaaaa aaaggcaatc caggcatgga ggtgacaacc ttcgaaaaga aagggattca 33780

aagaactgaa agggctggat ttttggagta acttcaagag taatagaaca agaagtaggg 33840

ggttgcatta ttatcaaaga tcaatgaaga ttaacattga agaagtggga aatccaaaaa 33900

gactccaccg agaaggatga tgcaatgatc attgaagaaa aaggagagca tgagaaaaaa 33960

cccgtagaaa ttgacagcac tcacacacaa taagacgaga taataaagta gtgagttggc 34020

caattgaaga agctttacct cttaacttac aaagtctaga ggaagaggag gacccagagt 34080

ttgatgcttc cctctgggta caccaaaaca tcgtcaaact taggcaagga gtttggggta 34140

aactttcagg ggtgtgagaa ggatgttttg gagcttttca taaaattata acaagaggca 34200

tgggaaaaaa aaggaaatcc aggcatgcag gtgacaaaac cttccaaaag aaagggactg 34260

gaagaactga aagggctgga tttttggcgt aacttcaaga gtaataggac aagaagtacg 34320

ggattgcatt attatcaaag atcaatgaag attaacattg tatcatggaa tgtcaggggg 34380

ttaaatcgac atagaaaaag aatgttgatt aggagtttaa ttcataggtg gaaagcagat 34440

gttttctgtt tccaagattc aaaattaaaa ggggacatta gggagtttat aagagaacta 34500

tgggcaaata ggtggtttaa atatgcacag ttggaggcta gtgggcctag agggggtatt 34560

attgtcttat gggatagtaa aattggggag ggggagatca gcagcctgag ctcctattct 34620

gttacttgta aatttatagg taaaactcag gagtatactt ggaatttatc cactgtatac 34680

gctccaaatg atagggagga aaggaaagaa gtatggtggg aattagcagg tgccagggga 34740

atttttatgg accttgggta atttctgggg atttcaatac tgtgaggtac ccaccagaga 34800

aaaagaatta cagcaaaatc actagagcaa taaatgaatt ctcataattt attgaagata 34860

tggaactggt ggatctacaa cttgcaggag gaagttacac ttggaggaca ggagatagac 34920

atgtgataac agctagactg gataggttct tggtttttat ggattggaat gagagcatca 34980

gaaacaccaa gcaatcagtt ctccattgaa ttacctctga ccattcccct gtgatgcttc 35040

aatgtggtaa ccggtaccct gtcaaatcct attacaagtt tgagaattgg tggctggaaa 35100

cagagggctt caaagaaagg attaaagtct ggtggagctc ttttgcttgt gaaggaagac 35160

gtgactttat tctggctttc aaacttaaag catcgaagga aaaaattgaa gaaatggagt 35220

aaatctattc aaggaaactt ggagatgcag aaattgagta ttcttagtca acttgcagaa 35280

ctagaagaga cacatgatca aaggagcctt actgaagaag aaatacacac taaatatgca 35340

gtctatggag tttggggaga ttgcaaaaca tgaggaggtg gcttggagac aaagatctag 35400

ggctctttgg ttgaaagaag ggacaaaaac atcaattttt tcctcaaaat tgcaagtgca 35460

cataggaaat acaataacat agaccaactg ttacttgaag gaaaatttgt ggcgaatcca 35520

acatacataa caaataatat tggtacattt tatcaaaaac tatatataaa gattgctaga 35580

ggacaatctt atgttgcaaa gtcttttcga agcttaggaa atttgggata gtgtcaggca 35640

tgtgaaaggg ataaagcacc tggacctgag aactgggagg tgataaacac ggatatgata 35700

gctgcagttc tttgttcatg gaatgtttga ggaaagcttt aatgttacct ttgtggtatt 35760

gattcctaag aagatggaag ctaaggaata gaaggacttt aggcctatta tgataggcaa 35820

tgtgtacaag atcttgatag aaagacttaa gaaattggtg aacaagttgg tgaagggtca 35880

acggatgact tttattaaag gtagacagat aatggatgtt gttctaattg ccaaatgaat 35940

gtgtagatgc aagaacaaag gcgagaaacc tacaatacta tgcaaactag atattgagaa 36000

ggcatatgac catctaaatt ggaactttct attggaatcg ctgatgagga tgggctttgg 36060

tgtaagatgg gtcagctgga tcaaattctg catcagcaca atgaaattct caattttgat 36120

aaatgtttca ccagtaggtt tcttcccttc tcagagggat ttgagacagg gtgatccact 36180

atctcctttt attattcatt agtgctatgg gaggcttaaa tgatatgtta aagactactc 36240

aagataacaa ctgcatacgg ggttttaagg tgaagtccag ggcagacagt actattgaga 36300

tttttcatct tcgatatgca gatgacgcac ttatgttctg tgaggttgac aatgaacaat 36360

tgaaagtgct gaaggtgatc ttcattctgt ttgaagccac atctgtatta caaattaact 36420

ggaatgaaag ctttatctat ctagttaatg aggtaactaa gatccacttt ttggttggaa 36480

tcctagaagg taaaattggg gaattgccta cagttatttg gggatgccat gggggccaag 36540

agcaatttta aggggatttg gactagggtc gtagagatat gtgaaaaaat tttaacaaac 36600

tggaagagtt agtatttatc cttaagggac aaactaatac taatcaattc tatacttgat 36660

gattttccta cttacatgat gttcctcttc tcaatccatg tgaatgttgt gaagagaata 36720

tataccctta gaaggaactt cctatgggga ggaaactatg acaaggaaag atctatttgg 36780

tcaaatggaa gtctctcaca gtcagcaaga agtaagagtg ttttggaatc aagaattgga 36840

gaattcagaa ccaaagtttg atgatgaagt ggctatggag atttactaca gaagaacatt 36900

gtttgtggaa agaggtgatc atggagaagt atggcataga agataaacgg ataacaaagt 36960

ctgtaaatag atcttatgga gttagtcgat ggaaatccat cagggaccta tagcttcagc 37020

tcttgaataa gtccaaattc tgaataggaa atggattgaa aatatctttt tggaaggata 37080

attggctaac caaggaactt tgaaacaact ctttcttgac atttacattc caaatcaaca 37140

gcataaagca ataatagtag aattatgggc taatcaaggt tggaatctca catacagaag 37200

actatcaaaa gacccggaga ttggcaggtc aacagagttc aaaggcactt tggaacaatt 37260

taaagaggtc tatacttcta tagactattt gacttggcaa gggaagttta ttgttaattc 37320

agcctataag gaattcaact tctcagctaa ctggattggt tgttggccat agaagttgat 37380

ttggaaagtt aaaattcctt atagagttgc ttgtttctct tggcttttgg ctaaagaggc 37440

agttctgacg catgataatc taaccaagag agattaccat ttatgttcaa gatgttattt 37500

atgtgaagag caggcagaga caaccaatcc actttttttt gcattgtaag ttcactgcag 37560

ttatggagga ttttcattag tttaaagggt atcatgtggg ctatgcgtag aagtatacct 37620

gaagttctag catactggaa aaaagaaaga aatctttcca attataaaaa gagatggagg 37680

attatcctag cttgcatctg gtggaccatt tgggaagaaa gaaatcaaag atgcttcaaa 37740

gataaatcag tcatattcag ataattaaaa tgaagtggct agtcttgttt tatttttggt 37800

gttaagtgtt agatagttat gtattatgta taagttgtct agtcccacat tggaacggga 37860

gtaatatgta ctatgtagag tatagctata aataggactt cttgtacttt attgtagaga 37920

atatattaat aatatatttt tcccgtgttg tctcacatgg tatcagagaa accgtgagat 37980

atcagtcgtt gtgaaaaata ccagcggctt cgggaagaaa aaaatcaatc aactgctagg 38040

tatattagtc ttcggcgacc gatccattaa atttctctgg caaagaacca ctcatgggcc 38100

ctcacgcgcc caccgaaaga aatatttccg gcgaggttcc aatttcatgc gcccgcgcgt 38160

gaggcagttt ccggtcaaat tttgacaaag gtcctttttg acagtttgtt caccctgtaa 38220

ttcccagtct atccatcatt ttttttattt cgatcacttc gcaatttctc gggcagctac 38280

agtgattttt ccggcagaag cggtgtttcc tttgcctgct tcagcgagat acagttgatt 38340

atttctatta tttgtttcta gacctctctc caatccaacg atgtctttgg aatttgatgt 38400

atttggttct gaaaacacga gttctagaaa gtcaagcttc atgattactt tagagccatt 38460

aatggggagt tcaaactatt tagcttgggt ttcctctgtt gaattgtggt gtaaaggtca 38520

aggtgttcga gatcacttaa tcaaaaaggc tagtgagggc tgtgaaaagg tcaatttaag 38580

cagtttatga cgtctgtata ccactcagca gaataggata gcaaagaaag aatatgcaca 38640

tcattgagac tgctcgcaca cttctcattg agtctcacgt tctgctacat tttctgagcg 38700

atgcagttct aacggcttgt tatttgatta atcggatgcc tttatcttcc atccagaatc 38760

agattctgca gttagtattg ttttctcagt cacccttata cttttttcgt cctcgtgctt 38820

ttgggagcat gtgtttgttc ataacttagc tcccgaaaaa aataagttag ctcctcgtgc 38880

tctcaagtgt gtcttccttg gatattcccg agtttaaaag tgatattgtt gctactcacc 38940

tgatcgtagg taccttatgt cagttgatgt tgcatttttt gagtctagac cttactttac 39000

ctcttctgac caccttgata tatatatgag gtcttaccta taccgactct tgaggggttt 39060

actatagctc ctcctctaca tactgagcca cagaaatctt actcatacct accattgggg 39120

aatctagtgt tgctcctcct agatccccag ctacaggaac acttttaact tatcgtcgtc 39180

gtccgcgccc agcatcatgt ccagctgatt cacgttctgc acctgctcct actgcggact 39240

agtctcatcc taatctacca attgcacttc ggaaaggtat atagtccaca cttaatccta 39300

atccatatta tgtcggtttg agttatcatc gtgtcatcac ctcattatgc ttttataact 39360

tctttgtcca ctgtttcaat tcataagttt acaggtgaag cactgtcaca tccaggatgg 39420

caacatgcta tgattgacga gatgtctgct ttacatacga gtagtacttg tgaacttgtt 39480

cctcttcctt caggcaaatc tactgttggt tatcgttggg tttatgccgt caaagttggt 39540

ccagatgacc agattgccaa agggtatagt caaatatttg gggcttggtt acagtgatat 39600

tttctctccc gtggctaaaa taccatcagt tcatctcttt atatccatgg ttgttgttcg 39660

tcattggcat ctctatcagt ttgacattaa gaatgttttt cttcacagtg agattgagga 39720

tgaagtttat atgaattaac cacctaattt tgttgcttag ggggagtcta gtggctttgt 39780

atgttggttg cctcagacgc tctatggtct aaagtaatct cctcgagcct tgtttagtaa 39840

gttgagcaca gttattcggg aatttggcca actcgtagtg aagcttatca ctttgtgctt 39900

tattggcatt ttacttcaaa tctctgtatt tatttggtgg tttatgttga cgatattgtt 39960

attaccggca atgaacagga tggtattact gagttgaagc aacatctctt tcagcacttt 40020

tagactaagg atctgagtag attgaagtat tttttaggta ttgtgattgc tcagtctagc 40080

ttaggttttg ttatttcaca ttggaagtag aaaaacttca atcatttttc tttatttgaa 40140

aggaagaaaa aaaaggtaat atctagacct aaatattaat ctgaagacaa gtgaggcttg 40200

ctcagttggt aaaagcacct ccacctacga tcgttaggtc ctgggttcga gtcaccatgg 40260

aggggaagtg tggaaacact atagatcctc ctaatttggg agggggaaaa aaatattaat 40320

ctgaattgac atgaatctca atgacaatga ccaacgattt cctgcaattc ttttcagtat 40380

ggaatgaata aaaaatcaag ctacaagtct ctattaaacg aaatgcacta acagggatca 40440

ctctcaagaa aggaagtggt tttggttgtt gttattccag gttggataaa tcactttctt 40500

tataaatatc ataaaagaca agggctttct tgcttcagca catgtgggaa atgccggggg 40560

gcttggctgg taccaagctc gagcggtctt tctatctttt tggattgcat gcccaaggca 40620

atgctttttg tagattggga tggattgatc ttcgcagaag tatgctttag acattcttga 40680

ggagacagga atgacggatt gtagacccat tgacacacct atggatccaa atgccacact 40740

tctaccagga tagggggagc ctcttagtga tcctgcaaga tataggcggc tggttggcaa 40800

gttgaattac ctcacagtaa ctagacctta tatatccttt cctgtgagtg ttgtaagtca 40860

gtttatggac tctccttgtg atagtcattg ggatgtggtt ttccgaattc ttcgatataa 40920

aatcagctcc aagcaaagaa ctgttgttcg aggatcgagg cccatgagca gatgttgatt 40980

gggcacgatc accttctaat agacattcta tatctggata ttgtatgtta ataggagtta 41040

atttggtgtc ttggaagatc aagacgtaaa atgtagttga tcggtctagt gcggaagcaa 41100

ataatcgagc aattgttatg gtaacacgtg agctagtttg gatcaaacaa ctgctcaaag 41160

aattgaaatt tggagaaatt gatggaacca gtgtgtaata atcaagcagc tcttcatatt 41220

gcgtcaaatc cggtgttcca tgacagaatt aaacacattg agattgactc tcactttgcc 41280

ggagaaaaga tactctcagg agataccgtt acaaagattg tgaagtcgaa tgatcagctt 41340

agagatattt ttaccaagtc ccttgctggt cctcgtatta gttatatttg tagcaaactc 41400

ggtatatatg atttatatgc accaacttaa gggagagtgt gagatagtta tgtacaacaa 41460

aatacccggt ataatcccac aagtggggta tggagggtag tgtatacgta gagcttaccc 41520

ttaccctgtg aaggtagaga agctgtttcc aaataccctc ggctccagta caaatgaaaa 41580

ggagcagtag caacaagcag taacaacaat gatatagtaa aataactgaa gaaagaaata 41640

acatgtagac atataactcc actaacaaac atgcaaggtt aatactattg ccacgagaat 41700

ggcaaaggaa tgttagatag ttatgtatta tatgtatatt aatagtctag tctcacgttg 41760

gaataggagt aatatgtact atgtagagta tagctataac taggacttct tgtaatatat 41820

tgcatagaga tatcaataat atatttttcc tgtgctttct cacgtaaagg aatgtaatgt 41880

acttagaaga tcatgaatct atctttgatg ttttagacac ctcgtgagaa cacaaaggtt 41940

taggaacttt attgtgttct ttgtaattat gggtgactgc caatatgtta ccttttcata 42000

aaaatgatta tttggccatt ggattagttt caacagcctc tctgcccctc cgggtagggg 42060

taaggtctgc gtacatatta ccctctccag accccacttg tgggattata ctgggttgtt 42120

gttgttgttg ttgtggatta gtttcaacaa ttttgatagt tcttttattt gaatcaaact 42180

actcattcac atggattttg tatcgtatca ttgagttaaa aaaattggtt ttgctaattt 42240

atcctcatgt ataacaacta cctatttttc aatatattgg attcaggagc ttgtagtagc 42300

tggagtttgc tcttcaaagg gcaataagtg ccgggtatca tgcacagtga ctccaaatac 42360

agatctcctt tctgctctaa ctcttatgga gaaacatgat ctaagtcagc tacctgttat 42420

actaggggac gtggaggatg aaggcatcca tcctgtgggc attttggaca gagaatgcat 42480

caatgtagct tgcaggtttt tgacattcaa cttttacttc aaagatataa tgctttctgg 42540

aaccattgat gataaaatat gcaagaaact tgtgcagaag tcgcacttta ctatcgatta 42600

ccagataaag ttacttatca agaagtcaaa tatattgaac atatttctct aaaacacttt 42660

gactggactg taagcagaaa cttactaaag taggtcgtaa gaaatggttt gatagggaaa 42720

tcaccatcta cacttaaaag agttgtgtga atttgaattc ttaaagcatg tgaaagttat 42780

aaaaacttgt tattatctaa gcatctgaag cattttggcc atccaaagga tcaaaaatag 42840

gaaataattt catttgtaca atgaactccc tgcacaaatt ctcacactag gtgtattctc 42900

tattcatcac tagcactaca tgtgtcacta cgaatcatat acaataaatc tttgtaacat 42960

aaaagacgac acataatatg gaagtaagcc gagtatacaa gggaagtttc atcattacgg 43020

tgagcttttt ataagataat caagttttac tggaaaaggg caaaaactct cccgtataga 43080

agtataccaa aaagtagaat accttacaaa aatatgattt tctatgaaca acaccctatc 43140

ttctatactt gtagggatct catcggggca ccaaaaagag ataaagggat aagaggcttt 43200

tcctcaaatg tacaaaatcc ttctctattc cttcaaaagc tctcctattt ctctctctgc 43260

acactgtcca cataagttca atggagcaac atccacgccc tgtgtcttct tttccgtctt 43320

ctataggtcc agctgaacat ggcttctttg actgagtgtg gcatcaacgt tgaagaccaa 43380

accatcccag tacttccaac cacaaacgag acactatatg acaatttaga agaagatgat 43440

tcacatcttc tcccgaacat ttacacataa aacaccagct gatacatgta atcttcctct 43500

tcctcaaatt atcagccgtc aggatcaccc gtctcgtagc taactaggtg aagaagcaca 43560

cctttctcga aaacctcagg atccatacag agagatatgg aaaagctgat tcctccatgc 43620

ccagaagctt ctcataataa gacttaacaa agaaacacca ctacttcccc ccccccccaa 43680

aaaaaaaaaa tctccataca tcgactttca tgtgtaattc ttgttcgtga aacgacccaa 43740

tcaacctttg gcacaaatct cccagtcttg cgagttcctc ctaaacttca aatcacaatg 43800

aacttctcca ccttgtagcc tccgtgtccc ttggactggc aactcctttg gcatgaaact 43860

ttgtacatat taggagatgt gatactcaaa gtgttgttcc tgcaccaatt gtacccccaa 43920

aaaacttacc atgctcccat cacctaacat tgaatgatac gttccaaaat cttcgcactc 43980

cttcaagaaa cttttccgta ggccccaccc ataagggagt gtgatttttt ttgctctcca 44040

tcccctctcc aagaatccat tccctaaacc actgcaggac actttaacaa tcactatgtc 44100

actttttcta ctagttctac attgagtgat atcttgatgt cattgaaatg cctctggaaa 44160

atcttcttct catctaaaag aacacttgtt tgccttttga atccccctct aacattttct 44220

atgtttcatt catctttggt ggaacagagc attagcaact agagaacagc tttgctag 44278

<210> 4

<211> 36700

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; one start codon

<400> 4

atgaatcacg aaagttgttg ggtcgtcatc caaattgctg gccttgggct cgacgaccat 60

ctcttcctcc gggacgttcc tgtgacggaa acattgaaaa agaacaagat atgtgcgaca 120

gcagcaaaga cgatagtgat agtgatagtg gtatccagat aggatctctg ctcgaggaag 180

ttatcccaca aggcaataat accgctataa tctcggcttg ctttgttggc ctcttcaccg 240

gtatcagtgt cgtgcttttc aacgctgcgg taagtgcgct ataggtcttt catttctctt 300

ttcatctact attctccctt acttacttgg cctcagtcaa tcagccccct gcctacttta 360

aattattgta caatttatca gaggagtatc ctatacatca aattcacata acttagtaaa 420

atatgctgac attctgaatt ttaaccttac cagcttagaa catccaggct agttcagaaa 480

cagataatct aaattggcct catttataag tcattttgtt aatcaagaca tacaatttgg 540

ctcttgataa aagattatgc agcgcccgat gataacctaa tatttatcag caacccatat 600

gtcactttct tttgtttaaa tgctctccca tgtaatttaa caatattgtc accatacaaa 660

agagaactga agtgaatgtt ccatttgtgg tcatataacg gatatctccc ttggttaggt 720

tcatgaaata cgtgatcttt gttgggatgg aattccatat cgagctgcct cagaggagcc 780

cattggagta cattggcaac gtgtaatctt agtaccagct tgtggcggtt tggtagtcag 840

ctttttgaat gccttccgag ccactctgga ggtttcaact gaagaaagtt ggacatcatc 900

tgttaaatct gtgttggggc cagttttgaa gacaatggcc gcttgtgtca cattaggaac 960

tgggaattcc ttaggaccag aaggccctag tgttgaaatt ggtacatctg ttgccaaggg 1020

agttggagct ctgcttgata aaggtggtcg tagaaagctg tcactcaagg ctgctggatc 1080

agctgctgga atcgcttctg gtttgttccc catattattc ttggttctga accatacatg 1140

gtacattttc cttataatta catgtagcct gttgtatgct ttcctctttc ctgggaagcc 1200

tttctgtaaa tgcaaatgtg tttgcactca aaccaataaa ctgtaaaaac agtgaacccc 1260

ttgagcaagc aaaagcacta gaaaaccaac aaatagatcc cccccccaag ataccagtga 1320

aatgacaccg ggtgacccaa aaataaagca gcttacatct tgactttgag aggaactgca 1380

atcagctata agtaggttat taatttccag tgcctgcatt ctgcccaagt actatgatat 1440

atttctgaag ctttgtttcc ccagttcctt tttcagacgt ttgctgtcaa taaagttgag 1500

ccagccaact tggttcccac aagctactaa ttttgtccaa gcttactcta tgggagaagt 1560

taaatttccc aaattccttg agcagaaaat gaaaaatgaa ctcaaagtgt catattaggc 1620

aactatctaa agaaaaatac ttaattgaag tttagataag aaaagtgaat atatattgat 1680

gtagtctccg ttaggtgaga agcgcatcac ttacccagca acatatggac ctaaaattta 1740

ctagtgaact tttcacattg tatcaaaagc tcaacaaaca gaaagatgac tagtcctaaa 1800

atgttatttc acatcaacct tatcatacgt gcattatttg ttctctatat ttctatttca 1860

tccgatataa ccaatcgtca ttgtaaattc tataatgcct gtggttactt ttgtctttag 1920

tgacaaatga catttaggct aaccatgtag ttattgactg atttcgcttg acgtctcttc 1980

caattatgta gtagtagagt gttgagatat ggatatgtta ccttctaaaa aaaaagagtg 2040

ttgagatgcg gatggtttgc tagctggctt ttgtctccct tcaagttgaa ttagcaaaag 2100

caatgtctca taagttggat agctagacaa gaaaaactcc aaattacttt atgtagagta 2160

ttcttaagct tgagtcgcga gttggaaatt ggaattatgt aaaaaaacct ggaattattt 2220

ggttgagcct gctttttatt tttgtcaata tttccagtat ctaacccaac atgtttagag 2280

caattcccag agagcctcaa tacgaggcat ttgcagagtc tttatgagag tccaggaagg 2340

ggcacacact gtagaggtat agtgttgtcc ttattttttt ttttttgata aggtaagatt 2400

ttattaaaag gtaccaagat ggtgcaaaat tacaaacatc caaactaata caacaaagca 2460

actacattcc tcctagctcc tctagaaaat tcatatattg ttccatattt ttcattacat 2520

gtcttttaca ccagaaatac aagtttaata agcatctgtt tttaatcctg gatacatgct 2580

gcctttcccc ttcaaagcaa atcctgtttc tttccaacca tattgtccag aacacacata 2640

gaggaattgt tcttcatact atctgttgac tctttgccac tttttgttgt tgccatgtct 2700

ccaacaaact ttacactggc aggcattgcc cacttgacat catatatatt taggaagagc 2760

taccaacact gctttgccac tttgaaatgg atgattagat ggttgactgt ttctgcctct 2820

tcttcacaca tgtaacaccg gttacataga gcaaaacctc tcttctgcaa gttctcctga 2880

gttagaaaag cttcctttgc tccaatccaa ccaaaacggg ctactttaat aagtgctttt 2940

gacttccata ttgctttcca tggccaattt gactgataaa gcccttgtag tttttgtaac 3000

aagctataac aactgctgac tgtgaaaata ccatcattac ttgctgccca gattaatgag 3060

tctctcctgt tttcctccaa tctaacatta ttcaataact gcatcaattg ggaaaattca 3120

tcaacttccc agtcattgag gcccctcttg aagattagct gccagccggt gcttgaatag 3180

aagtctaaca ctcttccatt tttgttaata gagcagctat atagaccagg aaactttgat 3240

ctaagacttc cattttccaa ccacatatca gaccaaaaca gggtattatt accatttcca 3300

agtttcagtt tcacaaactg actatattta ttccaaagat tactaattgt gctccaaact 3360

cccccttttg aagaagattg aattgaacga ggagcccaca tgtccttcat accatacttg 3420

gcatctatca cctttttcca taatctattc ccatcataat tatatctcca tagccattta 3480

aataaaagac ttttgttatg catctttaga ttcctcactc ctaatccccc tctttctttt 3540

tttttcatca cctcttgcca tttgaccaag tgaaatttct tgttatcatt attaccttcc 3600

cacaaaaatt tattcctcat agtattcaat tttttctcca ctgatgttgg cattttaacg 3660

agagatatta gataagtagg tataccatcc atcacactat tgaccagtgt aagcctacca 3720

ccaagagata aatattgtct tttccatgac accagtttac tgctacatct atccaagacc 3780

ccctgccaca tctttgcatc attctttttt gctccaagtg gtaggcccag ataggtggat 3840

ggtagctgct ccactttaca acccaaaaca tctgccagat catcaataca atgctcggca 3900

ttaatactaa acacattact ctttgccaag ttcactttca atcccgagac agcttcaaaa 3960

gctagtagta ctcctatgag gtgtaagagt tgctcttttt cagcttcaca taatatcaat 4020

gtatcatcag catagagtat gtgtgagaaa tacagttctt ccccctctct ttttctaatt 4080

ttcaatcctc taatccaccc taacttttct gcttttaaaa gcattctgct aaagatttcc 4140

atcaccaaca aaaataaata gggggatatt ggatccccct gtcttaaccc cctctgagaa 4200

ttaaagtatc tatgtggact cccattaatt aaaactgaga agctaattga ggatatgcag 4260

aattttatcc acccaatcca tctttcccca aaattcgtat gtttcatcag atttaacaga 4320

catgaccaat ttacatgatc ataagccttt tccacgtcaa gtttgcaggc caccccttta 4380

atcttcctct tgaatagata ttcaagacac tcattagcta ccatagcagc atcaataaat 4440

tgccttcctc ttacaaaggc attctgatta tctaatatca attttcctat caccatcttt 4500

aatctttcag ctatcgactt tgcaattatt ttatagacac tgcccaacaa gctgataggt 4560

ctaaaatctt tcacttccgc tgcccccttt ttcttaggaa taagagcaat gaaaattgag 4620

tttaggctct tagtcttgtc cttattttca gggttgaact agttctttag aagtttccta 4680

ggcttcctaa tttccaaagt tctgccaggt ccttttctag tgaagtactt gaagtttaat 4740

aaatcaaatt ttaatttcta acatatcccg agaaattcat tcacaaattc aactggtgac 4800

ttctgatgca gaaacataag caactgctta tgggttcata tgttcctgca attttattgt 4860

tgacatggat tggcttcata tggttttgtt cctgcaattt tatcgctgac actaatcctt 4920

tcatatggtt ttatgtgggg tggtaaatag aggttaagag acaagaagag gctggaaaag 4980

gtgggcagtt catttgttag tagactactc tatttactaa gagatatgat gtcccataca 5040

ttactcgaat tggctccaaa tacagattcc acttctttgt cgagtttcct tattgtacag 5100

agttcgactc gtcaagggaa attcacttcc tttgactgaa taatgctagt ttgagtagta 5160

ccttaaatta aatggaccat ttaattctat ctacttgata gaatagactg gtcatcaact 5220

agttgcaaat ataatgacaa ctccgccatg tttgcagagt cacctgatga agaagtacct 5280

caattagtag accatttctt gaatgttcta cagtattctc tatgcctaca tgaccacatc 5340

acttttcctt ttgcgttgtg agaacttgaa cttggtgagc gggggttccc caggaatggc 5400

atcttggtgg cagatgacca ttctgtcctt atcttagcta atgcttcttg gattgcctca 5460

ctagatttat tataccttta ataaatgttt gccattgttc tgccataata gagggatgta 5520

cctagctggt gcttcacatc acatagtcca aaactaatga aatgctttac aattgtcgag 5580

tactaaagga tgatttgtgg aatcagatct caaacaattt attttgagga agaaaaatac 5640

caaaggtttt ttctgtttgt tggaagatta aaaatccttt aaaaggtaaa gatttatgaa 5700

cttaattcag catttttgtg gccattgctg aaaaagagaa aacaatggca cttattcgag 5760

tttgcttatc caaaaaaaaa gaagaagaga atgtcacgta atgcaatttc atcttaggaa 5820

actttgcagg agaaaagcaa gagtgataaa acagaactat ttgttttttt gataagttgt 5880

tgtgacctat ttctttgtca ttcttatttg ctaataagct aatgtaccct gtactatggt 5940

tgttttgact taatccgggg atgttcagtg agcattttct tgttttttct gctgtcagca 6000

tctgctgcct tacaggaatt cattttctgg aaatttactt cttgttctgc taacattttc 6060

ctgttatatc ttgtcagtca ttttctctcc atggttatac tgtttgtgtc actttgaaac 6120

tctccttgtt ttctacttta aaggatttaa tgctgctgtc gggggctgtt tctttgctgt 6180

ggaatctgtg ttatggccat cacctgcaga gtcctccttg tacttgacaa atacgacttc 6240

aatggttatt ctcagtgctg ttatagcttc tgtagtctca gaaattggtc ttggctctga 6300

acctgcattt gcagttccag gatatgattt ccgtacacct actggtaatt ttggacttct 6360

ttctcgagtt tgattcttaa atacaattgt acccgtcact tacagcaaca acaactacat 6420

ttcaacagct agttggggtt ggctacacag atcatcacta tccatttcaa tttctttagt 6480

cccatttctt tcgaatattc agtactttgg gattctctat tatcagaggt tctctttatt 6540

ttctactttg acgtacaaat ctctaaatag attaaagaag actcctagag acactggcct 6600

aatgcaaatg taccaccatg aataaacctt aatctgaaat agctggtatc gtatataaga 6660

acctttagct ttaattgtgt tctatattga tcttttggga caacttccgt ccaataatat 6720

tatgtcttac ttatacagtt atacttatcc ttaaacttta ctctttagag tggttatccg 6780

tagttcaagc ttttgttggc accatagcta gtttggttct tagtaaaaag ttactcttta 6840

gagtggtaac tttttgtcaa ttttcttagt gaaaatataa cctctgtgac aaatctacca 6900

agtataaatc caatatggtt ctgtgtcata cttgtagttt atccaagtct atgctccatc 6960

actcttacaa aggctcatcg tatgactaat tttttttgag aaaggtaaca gtttgtattg 7020

ataataagat cagcgccagg ttagtcatta gtgctaatag ctgtatgtac aactccaaaa 7080

gagcaaaaga caagcacctg gtgtaacgta aattacaagc tgcctataaa atctatcagg 7140

tctcctacct cactaaacat ttcttgttta caccaaaaaa ataaaacaag gaaagacaat 7200

ccatcttaat cttctgaatg gagtttcttt tgccttcaaa catctcgagt tcctttcgtt 7260

ccatgcaatc caccatatac aagctgggat gcttttccat ttgtctttat ccattttttc 7320

taccaattcc cttccaattg actagaagtt ccaatgtggt tctagatatg acccaattaa 7380

ctcccaacat ataaaagaac atgttccacg gatttgtagt gattctgcaa tgtaggaaca 7440

agtgagcatt actttctact tcctgtccac aaagaaaaca tcttgagcaa atctggaaac 7500

ctcttctttg taagttatca tgtgttaaac atgctttttt accactaacc agacaaaaca 7560

tgatactttg ggaggagttt taaccctcca aatgtgtttc caaggccaca cctcagtcat 7620

tgaaacatta tgatttagag tccagtatgc atcttttact gaaaatgcac ctttgctatt 7680

cagcttccaa actattttat ctatggtctt gttagtttac agctatgtat atagtgtagt 7740

cttgtcccac attggaatag gagtagtatg tccttgtata gtatagctat aaataaggac 7800

ctcttgtatt gtattgaaca tccaatatca ataacatatt ttctcccgtg ctttctcaca 7860

tggtatcaga gcaattgtga gagatttatc gctgcgcata aattccagcg actccgggaa 7920

gagaaatcag tcaccggaag tctttttccg acgactcttt caaggttgtt tgcgtttgct 7980

ttataaatcc aacactacca caagagtaat cactgtccgg cgaccaaacc ccagtaaaaa 8040

tctccggcag cagcctcctc acgccaccag aagctcacgc gccggcgcgt acgaccactt 8100

ccgtccattt tttgaaaaac ttccttcaga acagttgggt cgcctggtaa ttcctatcct 8160

acccctactg ttttcatttc attccgacca ctttgagttt tttccggctg ctacagtact 8220

attccggcag ctatagtact attccgacaa ctacagtaag attccggctg ctacagtatt 8280

tcattattct gtttttgtgt ttccttactc tgtttcagtg gattacaatt gattctttct 8340

cttatttggt aataatttgc aacaatgtct atgggatttg atgtttttgg gtctagaaac 8400

atgagttctg gaagctctag tgttattatt acctcagaac cttaaatggg aggttcaaac 8460

tacttagctt gggcttcatc tgtcgagttg tggtgtagag gccaaggtgt tcaagatcat 8520

ctaatcaaac cgtctagcga aggagatgaa aaggcaataa cactttggac aaaaatcgat 8580

gctcagttat gtagcatctt gtggcgatct attgattcca agttgatgcc cttgtttcgt 8640

ccattcctga catgttattt ggtttgggca aaggcacaca ccttatacac taatgacata 8700

tctcgcttct atgatgtgat atcgcggatg acaaactgaa agaagcaaga attagatatg 8760

tctacttact tgggtcaagt acaagcaatc atgggggaat ttgagaagtt gatgccagtt 8820

tctgctagtg ttgaaaaaca acaagagcag cgacaaaaga tgtttctcgc tcttaccctc 8880

gctgaacttc ctaatgatct tgattcagta cgcgaccata ttttagctag tccgactgtc 8940

ccgacagttg atgaattatt ctctcgatta ctccgccttg ctgtagcacc aagtcaccca 9000

gtgatctcat cacagatact tgattcctct gttcttgcat cccagacaat ggatgttcgg 9060

gcatctcaaa ctatggagca tagacgagga ggaggtcgtt ttggaagatc tagacccaag 9120

tgttcttatt gtcacaaact tggacacact cgtgaaatgt gttattcctt acatggtcgt 9180

ccacccaaaa atgcttacat tgctcagacc gagactccag gtaaccaggg attttcttta 9240

tctaaagaag aatataatga actccttcag tatcgaacaa gtaagcagac atctccacaa 9300

gtagcctcag ttgcttagac tgatacttct tttactggta atttttttgc ttgtgtttcc 9360

cagtctagca ctcttggccc atgggtcatg gactcaggcg cttctgatca catctctggt 9420

aatatatcac ttttgttaaa tattgtatat tcatagtctc ttcccattgt tactttagcc 9480

aatggatgtc aaattacggc aaaaggagtt ggacaagcta atcccttgtc ttctatcacc 9540

ctagattctg ttctttatgt ccctggctgt ctttttcgtc ttgcatctgt tagtcgtttg 9600

actcgtgccc tccattgtgg tatatatttt attgacgatt cttttattat gcaggactgc 9660

agtacgggac agacaattgg tggaggacgt gaatcagaag gcctttacta ccttaactca 9720

cccagtcctt ccacaacatg tctggttaca gatcctccag atctaatcca cagacgttta 9780

ggacatccga gtttatccaa acttcagaag atggtgccta gtttatctag tttgtctaca 9840

ttagattgtg agtcgtgtca gcttgggaaa catacccgag cctccttttc gcgtagtgtt 9900

gagagtcttg catagtctgc cttctcctta gttcattctg atatatgggg tcctagtaga 9960

gtaagttcaa ccttgggatt tcgttatttt gttagtttca ttgatgatta ttcaagatgt 10020

acttggcttt tcttaatgaa agaccgttct gagttatttt ctatattcca gagtttctgt 10080

gctgaaatga aaaaccaatt tggtgtttct attcgcattt ttcgcagtga taatgcctta 10140

gaatatttat cttttcaatt tcagcagttt atgacttctc aaggaattat tcatcagaca 10200

tcttgtcctt atacccctca acaaaatggg gttgctgaga gaaagaatag gcaccttatt 10260

gagattgctc gcacacttct aattgaatct cgtgttccgt tgcgtttttg gggcgatgca 10320

gtgctcacaa cttgttattt gattaatcgg atgccttcat ctcccatcaa ggatcagatt 10380

ccacattcag tattgtttcc ccagtcaccc ttatactctc ttccaccccg tatttttgga 10440

agcacgtgtt ttgttcataa cttagcccct gggaaagata agttagctct tcgtgctctc 10500

aagtgtgtct tccttggtta ttctcgtgtt cagaagggat atcgttatta ttctccagat 10560

cttcgtaggt accttatgtc agctgacgtc acattttttg agtctaaacc tttctttact 10620

tttgctgacc accatgatat atctgaggtc ttacctatac cgacctttga ggagtttact 10680

atagctcctc ctccaccttc gaccacagag gtttcatcca taccagccgt tgaggagtct 10740

agtgttgttc ctcgtagttc cccagccaca ggaacaccac tcttgactta tcatcatcgt 10800

tcgcgcccta catcgggccc aactggttct cgtcctgcac ctgacccttc tcctgctgcg 10860

gaccctgctc ctagtacact gattgcactt cggaaaggta tacgaaccat acttaaccct 10920

aatcctcatt atgtcggttt gagttatcat cgtctgtcat ttccccatta tgcttttata 10980

tcttctttga actcggtttc catccctaag tctacaggtg aaacgttgtc tcacccagga 11040

tggcgacagg ctatgagtga cgagatgtct gctttacata caagtggtac ttgggagctt 11100

gttcctcttc cctcaggtaa atctactgtt ggttgtcgtt gggtttatgc agtcaaagtt 11160

ggtcccgatg gccagattga tcgacttaag gcccgtcttg ttgccaaagg atatactcag 11220

atatttgggc tcgattacag tgataccttc tctcccgtgg ctaaagtggc ttcagtccgt 11280

ctttttctat ccatggctgc ggttcgtcat tggcccctct atcagctgaa cactaagaat 11340

gccttttttc acggtgatct tgaggatgag gtttatatag agcaaccacc tggttttgtt 11400

gctcaggagg gggtctcgtg gccttgtatg tcgcttgcgt cggtcacttt atggtctaaa 11460

gcagtctcct agagcctggt ttggtaagtt cagcacggtt atccaggagt ttggcatgac 11520

tcgtagtgaa gctgatcact ctgtgtttta tcggcaccct gttgacattc cgatggatcc 11580

gaattctaaa cttatgccag gacaggggga gccgcttagc gatcctgcaa gctataggcg 11640

gctggttgga aaattaaatt atctcacagt gactagaccc gatatttctt atcctgtaag 11700

tgttgtgagt cgatttatga attctccctg tgatagtcat tgggttgcag ttgtccgcat 11760

tattcggtat ataaaatcgg ctccaggcaa agggttactg tttgaggatc aaggtcatga 11820

gcagatcgtt ggatactcag atgctgattg ggcaggatca ccttctgata gacgttctac 11880

gtctggatgt tgtgttttag taggaggcaa tttggtgtct tggaagagca agaaacagaa 11940

tgtagttgct cggtctagtg cagaagcaga atatcgagca atggctatgg caacatatga 12000

gctagtctcg accaaacaat tgctcaagga gttgaaattt ggtgaaatca atcggatgga 12060

acttgtgtgc gataatcaag ctgcccttca tattgcatca aatccggtgt tccatgagag 12120

aactaaacac attgagattg attgtcactt cgtcagagaa aagatacttt caggagagat 12180

tgctacaaag tttgtgaggt cgaatgatca acttgcagat attttcacca agtctctcac 12240

tggtcctcgt attggttata tatgtaacaa gctcggtaca tatgatttgt atgcaccggc 12300

ttgaggggga gtgttagttt acagctatgt atatagtgta gtcttgtctc acattggaat 12360

aggagtagta tgtccttgta tagtatagct ataaataaga cagtactaac gtcccttttg 12420

ccgggggttc tgcatcttta aatagatgca cgtggttcca tagcagaccg tgttgatcac 12480

agatcgtgct gcatcctctt cccagcggac tcggtgagcc cctcttgtat tgtattgaac 12540

atccaatatc aataacatat tttctctcgt gctttctcac aggtctgtga tgtacccttg 12600

aaaggttcaa gagtttggag gaagatagaa actctgttta tctcccaatc atccaaagat 12660

cttctaaagt tccagttcca tccttgtgag ctccagactg acttaccaat gcttggcttt 12720

gaagacttag agagaataag tcaggaaaaa tctttcaacc ttccttgccc tatccggtga 12780

tcttcccaaa aagatgtctt caacccattg ccaacattga tcctgatatt gctactgaaa 12840

gatttctttt ggtggcagga ttactctcat taacaatgta cttgacaatc tccatacata 12900

cgaatgtctc tttaccctct tgccattaag gttgtaaaga gacttgtcaa attaagaaga 12960

ggtttcctat ggaactgttt caaggaagga acctcctttc ctttggtcaa gtggagttaa 13020

gtcatataat ctaggaagtg gagacttggg tataaaatag ctgcaactac agaaaaggag 13080

catcttattt aaatgatcac gcaaatgtgc ccaaaacttt aaatatctgc ggagcatatg 13140

gttgtagcaa aatttgaatc ttccggtcaa tgttgctcat gtccagtgaa tacccctgat 13200

ggtgaaagtg tcctgaaggg aagcaggaac ttattggagg aattggcatt taacactcag 13260

catttcgtta ggtcatagcc cgctgaaaat tgagtgccca gatttatata gttttgctct 13320

aaactgacga tgcagttgca caacatacga caaactaagg tgggacatct tcttcggaag 13380

gaattttgag gattaagaga tagagtggtt gattcagttg caaatgaagc ttcaagggtt 13440

caatatcatc caggagacac cggattctga tagataaaac aacagaaaga tgaacactac 13500

tttgttaggc ttgttacaag ttgctatcgt ctttcttatc tcggcacaca atttagattt 13560

gggaacttat ttggaaaata gagtggttgt ttttgtgaat agcatcagac aaagcttctg 13620

agctggtacg acagaaaact caacagggag aataaaagac tgtggttcac gatttctgca 13680

tgcatcttgt aggttatttg gtgggtaaaa tatttaatgt tttgaaggga aggtagaaca 13740

tgttcatagg cttagattca aatgtttgta tttttttggc tctttggtga gagatgctga 13800

atgtaaatga cataggcagc tgactataat ttctcagctc cttgcttttt aaattggcag 13860

gcactgatat gtacatgtga acatccaaca cttttgtggt gccgttccga tgaataaagc 13920

acattaatca cttactgatc aggagtaata gtttaggagt tctagaattt ttgtacataa 13980

aatgaaccaa aaagaatatc ggaatgagaa catgtttctt tttttgtttc ttctttttcg 14040

tacaaatttc aataacactt ctgatagaat agctaggtcc atttgaattc ctttggagac 14100

ccttacacaa ccaatgaatg gcaagtatag cattttctaa caccctccca catgtataat 14160

ccagttttta gggtttagat gtggatttga tttgacctta ttgccttttt ttgtttttgt 14220

tctttttgaa gtagagagtg aggaggctca caacgacggg ctacgtagag cgagattaat 14280

tcggctcaac gggctaatga ttggacttac atgctacaac aatgttagga gaaagagaga 14340

gagagagaga gaagcccaga gcagttccac gagttaagaa agagaagtcc aaagcgattg 14400

aatatgaaga gagaaagcgg ttgtgctaac aggctccctc aagtttggct ctgagcatcc 14460

aactcaaaac cttaaggcaa tgagtagagt agcccaggac catttaaact cctgttgaaa 14520

accttacaca accaataagg gaacaagtgt aacattctct tacaacccta ccgtcttata 14580

agtcagggct ctaatttagc ataaaatcaa agtgaggcga tctactatga aatgaagaaa 14640

ataactgata aatataaaga atgttaattc tcccatatag cctgaatgtt cccagaacaa 14700

aataaattag tctcatgatt tatcattaac atgatgttcc tcttattttg agtgattagg 14760

aaggttaatc aaggagtaaa ttctttctaa tttgtatcgt ctagaattat ttgtctaaca 14820

aattttcaga ttaccggtga tcaaaagagg aaaatatttt gcatacaacg ttaccatacc 14880

ttacaaaagg gcgatgaaca tttttttatt ttattattgt cctttttttc aattaggggt 14940

tatgcagtct tcctccacgt gatattactc ttagaatcac gtttttgtca ttgctattac 15000

ttactgtggt aagtacaaat gtgttttgaa ctctttttgg tatgtattat tgagttaatt 15060

tttcgtttcc atttcagagc tgccgcttta tcttctgctg ggcatctttt gtggcttagt 15120

ttcagtggca ttatcaagtt gtacatcatt tatgctgcaa atagtggaaa atattcaaat 15180

gaccagcggc atgccaaaag cagcttttcc tgtcctgggc ggtcttctgg ttgggctggt 15240

agctttagca tatcctgaaa tcctttacca gggttttgag aatgttaata ttctgctaga 15300

atctcgccca ctagtgaaag gcctctccgc tgatctgttg ctccagcttg tagctgtcaa 15360

aatagtaaca acttcattat gccgagcctc tggattggtt ggaggctact atgcgccatc 15420

tctattcatc ggtgctgcta ctggaactgc atatgggaaa attgttagct acattatctc 15480

tcatgctgat ccaatctttc atctttccat cttggaagtt gcatccccac aagcttatgg 15540

cctggtatga atttgtcttt tgttagaagt agcattacat atctggataa gtgagttttt 15600

tattattgaa aagtaataac aggagaacaa gagaatatat cacccaaatc tacttctttc 15660

ctctcttcta ttcttctgaa attcaaggtc ctttaactcc tccacagtct gtctagttat 15720

tgatcctgta gacttaattc acataggttt aggacattcg agtttatcca aacttcatga 15780

aaaggtttct aattttttta cattacatta tgagtcgtgt ctacttgaga aacatatcac 15840

tccatgtttc tatagtctgt tttctcctta gtttattctg atatgtgggg tcctattaag 15900

tcagttcaac cttgtatttt cattattttt gcagtatcat tgataattat tcaagatgta 15960

cttggatttt ctttacaaga gatagttctc agttgttttt tgtgttccta agtttttatg 16020

ctgcaataca aaattggttt gatgtctcta tttgcatttt tcccaatgat aatgccttag 16080

aatattttct tttccgtttc agtagcttat tatttcttta ggaactcttt atcagaaatc 16140

tcaactgaga tagatgagag gaagaataag catatcattg gtctcattca gtcccctgtc 16200

aagcttagtt tcttgagcga tgcggtttca cgtcctttta ttagattaat tggatgcctc 16260

atctgctatc caaaatcagt taactttcga tattgtttcc tcgcttacct ttatactctc 16320

tttccctcga gtctttggga gcacatgttt tgttcaataa catagctcct ggaaagtgac 16380

cagcgcaacc gacaaacaag gccttcttaa tgtagaaggt ggacatatgc tattctagcc 16440

acgggaaaga aagtaatatt gtaatcaaac ccaaatatct gagtataacc tttggcaatg 16500

gcgatcaatt tgattatatg gaccaacttt gcctgcatat acccaccgac aaccaataat 16560

agatttaccg ggaggtagag aaacaagctc ccaaatacca ctaatatgta aagcagatat 16620

atctctgatc atagcttgtc cttgtggaca tagggataga aattaaggac aaagatgaca 16680

caaaagcata atgcggtgat gataaacgat gataactcaa atcaatataa tggggatggg 16740

gattgagagt ggatcgaata tctttgcgga atgcgattgg tagactagga ggagagaagt 16800

ctgtggacat gatgttggac tgagatcaat aataagtcaa gaatggtgga gctacagaac 16860

atggaactgg agctgtaggt gacataatcg gagctgtagg aggtggagct atagaggaag 16920

gtgaaggaga gatagcgact gaatctccaa aagatgaaac cggtaatacc tcaaaaaatg 16980

tctaagagat catttggacc tatgaagtat gattgcgttt ttaaaaaggt aacatcataa 17040

ggtcaggtga ataacattga tatccccgtt gcatcctcga gtaacttaga aatatacatt 17100

tgagagcacg gagagctaac ttatcttttc tggagcaagg ttgtaaacaa aacacgtgct 17160

cccaaagaca cgaggtggaa gagagaaagg tgagtgggga aacaagacag aggatgaaac 17220

ttgactcttg atagttgaag atgacataca attaataaga caataggatg tgagatccaa 17280

tgacagttct catgaactgc tgaaatggag aagacaaata ctctggggcg ttatcactac 17340

gaaatgtgca gttagaaacc ccaaattgat tttggatttc agtgtggaag gtctaaaaaa 17400

tagagaacaa ctcagattga tttttcatca agaatatcca agtggacttg gaataatcat 17460

caatgaaact gacaaagtag cggaattcca aggtagaact aacccgacaa ggaccccaaa 17520

catctgaatg gactaaagtg aaaggtaact ctacccgatt atcaggatgt cgagggaaat 17580

gagagtgagt atgccttctg agcggatatg actcacgctc tagagtggac aagtgagaca 17640

aacgaggtac tattttctaa agttctgata aattgggatg tcctaactgt atatgtaata 17700

aatctggtgg atcagtaaaa ggacaagctg tagggggaaa aaaataccaa atatttccag 17760

aagatggcaa actacaacag aagatgcaac tgcattaaca tgctcaggat aggtgatgaa 17820

atcattgagg acaaagagtt gatcaagaag gagattctgg aattttacca gaacttatat 17880

agtgaaaatg aaccctggag gcgcagtgca aatttcgaag acatctcctc actaagcata 17940

gaagagaaga actggttgga agctccattt gtagaaatag aggtgcttga agctttgaaa 18000

tcatgtgccc cttataaagc accaggtcca gaaggcttca ctatggattt ctttcagaaa 18060

aattgggata ctcttaaaac agacatcatg gctgcactta atcattttca ccagagctgt 18120

cacatggtta gggcttgcaa tgccaccttc attgccctaa ttccaaagaa aaatggtgct 18180

atggagctca gagactacag acctattagc ttgacaggta ttgtatacaa attggtttca 18240

aagattttag cagagaggct caagaaggta attgacaaac tagtctcggg ggaacaaaat 18300

gctttcatca agaacaggca gatcactgat gcttccttga ttgccaatga agtgctggat 18360

tggagaatga aaagtggaga accaggcgtg ttgtgcaaac tggacattaa aaaggctttt 18420

gatcaattaa gctggtctta cctcatgagt atcttgaggc agatgggctt tggggagaaa 18480

tggagaagat ggataaacta ttgcatttca actgtcaagt actctgtttt ggtgaatagg 18540

gacccaatcg gttttttctc cccccaaaag ggcctaaggc agggggatcc cctctccccc 18600

ttcctattca ttctggcgat ggaaggactc actaaaatgt tggagaaggc taagcaactg 18660

caatggatac aaggctttca ggtgggaagg aatcctgcca gctcagttac agtatctcat 18720

ctactctttg cggatgatac tcttattttc tgtggtactg agagatcaca agcacgaaat 18780

ctcaacctga cactgatgat cttcgaggca ctatcaggac tccacatcaa tatgataaag 18840

agcatcatat accctgtgaa tgcagtcccc aacatacaag agctagcaga catcctatgc 18900

cgcaaaacag acactttccc aaccacatat cttggacttc ccttgggagc taaattcaaa 18960

tcaaaagaag tttggaatgg agtcctagag aagtttgaaa agaggcttgc gacttggcaa 19020

atgcaatacc tccccatggg tggcaggtta actttaatca atagtgtact ggacagtctt 19080

cccacatacc acatatcttt gttcccaatt ccaatctcag tcctaaagca gatggacaaa 19140

ctcagaagga agttcttatg ggaaggatgc agcaaaacac acaaatttcc actagtgaaa 19200

tggctgaagg taactcaacc aaaattcaaa ggagtcttgg gaatcaggga tgctatgctc 19260

ttaaaatggc tctggagata tggacaggag gaatctaggc tatggaagga catcatattt 19320

gctaaatatg gagcacacaa ccactggtgt tccaagaaaa caaactctcc ttatggagtt 19380

ggtctgtgga agaacatcag caaccactgg gatgaattct tccaaaatgt aactttcaaa 19440

gttgggaatg taactcgtat aagttttgga aggatagatg gcttggaaat acacctttga 19500

aagacatgtt tcccagtatg tatcagattg ccgtgaccaa agactccact gttgctcata 19560

atagaaacaa tgacacttgg tacccacttt tcagaagaaa tttgcaggat tgggaggtca 19620

acaacctact cacaatgtta agctccctag aatgtcataa cattgaagat caacaacctg 19680

acaaacttat ttgggaaaat tctaagagag gcaagtacac agtcaaagaa tgatacattc 19740

acctctgtga ccagaatcca atatataact ggccatggaa acatatctgg agaactaaag 19800

tgcctaccaa gatgacttgc ttcacatgat tgtctctaaa tggggcctgt ctcactcaag 19860

acaacttaat caagaggaac atcatataag ttaatagatg ctacatgtgc caacaacagt 19920

cagaaagtgt aaagcactta ttccttcact gctcagttgc aaaagaaatt tggaacttct 19980

tctacactac ctttggtcta aaatgggtta tgccacaatc aactaagcaa gcttttgaaa 20040

gttggtattt ttggagagtt gataaatcca ttagaaaaat ctggaaaatg gtgtcggccg 20100

caagtttttg gtgtatttgg aaagaaagga actgaagatg ttttgatggc atatcaactc 20160

cactcaaggc tgcgtgttta gttaacttat tttgctggaa ctatctcacc cctgttaata 20220

gtgctgatac ttctgtggat ttcattagcc ccctgatagt agcataggct tttgtaaatg 20280

gagctaatta tcctttctct tttgtactct ttgcatcttc ttgatgcctt ttaatgaatc 20340

taatttactt catcaaaaag aaaatgacaa gttgttgaag gaggaaaaga tgtgagtcca 20400

tgtgatttag caaggataag gtactaaagt ccatttgatt cacgtccggt accaatgatc 20460

cgtctcgtgc tgcattcctg tattaaaaca gagtcatcaa gaaataaaat agagcaaata 20520

agtgattggc caagcgacta gtggatatga gattaaaagg actatgggga acataaaaaa 20580

ctgaattcaa aggtaaggaa ggaagtggac tagcttaacc tattctagtt gccatggttt 20640

gagaatcgtt ggccattgtg actattggaa gtgattgaga gtaagaaata gtagtgaaag 20700

gagatttgtt acccgaaata taattagatg cacctgaatc aatgacccaa aagtcggaag 20760

aagaggaaac acaagtcacg ctattacctg tttgaacaat agagattagt ttggatcaaa 20820

tagttgtata gagaactgaa atttggagaa atcaatcata tagaacttgt atgtgattat 20880

tgttgccctt tatattgcgt caaatcctaa aacacattga gattaactgc cacttatcac 20940

agaaaagata ttctctagag acattgttac aatttcatga agtcaagtaa ttagcttgaa 21000

catatcttca gcaagtccct cgtcagtcct catattagtt acatttgtaa caatgtcggt 21060

acataagact tataagcacc agtttgagga ggagtggtag agagttgatg tacatagtta 21120

aagtagatat acttacactt agtgttatgt aaagagtgga tataaaaagg gatcagcata 21180

agacaattgt cttcgcgcgt cttaacattt ttttcctgtc tttatttctc tcatggtatc 21240

agataaccta tctctatctt ggtttaccca atggttggcc cccatattgt attagccatg 21300

ctccagttga ctaggcttgg acgggcagag gtgttaaatt atcccatatt ggttgaaaga 21360

atgagctatt gtctccttat atggtcttag acaattctcc aactcatgag atattttgtt 21420

ttggctgagt tagccctaag gtttattttt tgtcatattc tttaacctta tggcaatgct 21480

tgtacacgga aaaaccggag tgcaagactt aaattaggag aaggaaacta ttgaaggtga 21540

ggaacttaaa gggttgtgag aatacacggg agaaaaaaat cttaatacta tctagtggcc 21600

ttgtatatca aatgatcagc ttgcaaatat tttcaccaag tccctcactg gtcctcgtat 21660

tagttacata tgtaacaagt tcggtatata tgatttgtat gcaccggctt gaggttatgc 21720

atattctatt cctcctacta tatatgtgac taggaaatat tttactccta ctgcatatgg 21780

gactaggact atttacacat aactatctaa cattcccctc aagccagtgc acacaagtca 21840

tatgtaccga gcttgttaca tatgtaacta atacgaggac cagtgaggga tttagtaaaa 21900

atatctgcaa gctggtcatt cgacatacaa ggccactaga ctccccccga gcaacaaaac 21960

caggtggttg ctgataaaca gaaactggcc gaaaagttgc cggaaaaatt tgaaaatagt 22020

gagactaagc cgaattctac actacaaaat aggttctaaa acaccaccag aaaacaaaaa 22080

cttttctaga aattactctt cacaccggaa aaaataaaag ttgtcagaat ttgatgtaat 22140

ttatatagat aggttcggaa tcactggagg agtaagttgt cccgaagaag ttttgtcaaa 22200

aagtggccgg aatggctcac atgcgccgga aaacttactg tagctcgcag gaaccctagt 22260

tctggcggtg cgtggaggcg cgtgacttaa gattaagatg cttacaggac tatcttgaga 22320

aatatacata ttatatagac gcttgagttg cttcccaatc ctaaatagaa gcttttattc 22380

gtaggcaaga agggaagcag ctttacttga gccaatagct ttcaaggtgc acgttgtcac 22440

accaaggaca tccagaattt gattttatag ggggtgtgag aaagcacggg agaaaatatg 22500

ttattgatat ttggataata aatacaatac aagaggtccc tatttatagc tatacactac 22560

aaggagatat tactcctctt ccaatgtggg acaagaatac actatacata tctgtaaact 22620

aacactcccc ctcaagtcgg tgcatacaca tcatatgtac cgatcttgtt acacatgtag 22680

ctaatacgag aaccaataag agacttagtg aaaatatctg ctagttgatc attcgacttt 22740

acaaactttg taacaatatc tcctgaaagt attttttctc tgacaaagtg acagtcgatc 22800

tcaatgtgtt tagtcctctc atggaacacc ggatttgaca caatatgaag agtagcttgg 22860

ttatcacaca ttagttccat cttgctgatt tctccgaatt ttaactcctt gagcaactgc 22920

ttgacccaaa ataactcaca cgtcgtcata gccatggccc gatattcggc ttcggcgcta 22980

gatcgagcaa ctacattctg tttcttgctc ttccacgaga ccaaattacc tcctactaga 23040

acacaatatc cagacataga acgtctatca aaaggtgatc ttgcccaatc agcatctgtg 23100

tacccaacaa tctgctcgtg gccttgatcc tcgaatagta atcctttgcc cggagctgac 23160

tttatatacc gaagaatgcg aacaactgca tcccagtgac tatcacaggg agaatccata 23220

aactgactta caacactcac cggaaaagaa atgtcaggtc tagtcactgt gaggtaattc 23280

aatttgccaa ccaacctcct atatctcgta gggtctctaa gaggctcccc ctgtccaggc 23340

agaagcttag cattcagatc cataggagag tcaataggtc tgcaacccat cattccagtc 23400

tcctcaagaa tgtctaagac atacttccgc tgtgaaataa caatacctga gctagactga 23460

gcgacctcaa tacctaaaaa atacttcaat ctgcccagat ccttagtctg gaagtgctga 23520

aagagatgtt gcttcagatt agtaatacca tcctgatcat tgccagtaat aacaatatca 23580

tcaacataaa tcactagata aatacacaga ttaggagcag aatgccgata aaacacagag 23640

tgatcagcct cactacgagt cataccgaac tcctgaataa ttgtgctgaa cttaccaaac 23700

caagctcgag gggactgttt caaaccatat agtgacctgc gcaatctgca cacacaacca 23760

ttaaactccc ctaagcaaca aaaccaggtg gttgctccat ataaacttct tcctcaagat 23820

cactgtggag aaaagcattc ttaatgtcta actgataaag aggccaatga cgtacaacag 23880

ccatggacaa aaagagacga acagatgcta ctttagccac gggagagaac atatcactat 23940

aatcaagccc aaaaatctga gtatatcctt ttgcaacaag acgagcctta aaccgatcaa 24000

cctggccatc cggaccgact ttgactgcat aaacccaacg acaaccaaca gtagacttac 24060

ctgcaggaag aggaacaagc tcccaagtgc aactcgcatg taaagcagac atctcgtcaa 24120

tcatagcatg tcgccatcct ggatgagata gtgcctcacc tgtagactta gggatagaaa 24180

cagtggacaa agaagatata aaagcataat gaggtgacga cagacgatga taacttaaac 24240

cgacatagtg gggattagga ttaagtgtgg atcatacacc tttgcggagt gcaattggtt 24300

gactaagagg agacaagtcc gcagtaggtg cagaatctga tgcggggcgt gaatcacctg 24360

ggcctgatgc tggatatgga cgacgatgat aagtcaagag tggtggagct gccgaaggtt 24420

gaactggatt atgtggagga actggagcta taggtggtgg agctacaact ggagctgtag 24480

gtggtggaac tagagtaact gaatctccaa aagatgaaac tggtagtacc tcagaaatat 24540

ctaagtgatg acctgaacct gtgaagtatg attgggtttc aaagaaggta acatcagcag 24600

acataaggta ctgctggagg ttaggagagt agcatcgata ccccttttgt gttctcgaga 24660

aacctagaaa tacgcactta agagcacgag gagctaactt atccgttcct ggaataaggt 24720

tatgcacaaa acaagtgctt ccaaagatac gaggtggaag agagaacaaa ggtaagtggt 24780

aaaacatgac agagaatgga acttggttct ggatagctga tgatgtcata cgattaataa 24840

gatagcaaga tgtaagaact gtatccccca aaaacgcaac ggagcatgag attgtatgag 24900

tagggtacga gcagtttcaa taaaatgtct attctttctt tcagctaccc cattttgttg 24960

agatgtgtac agacaagatg tttgatgaat aatcccatga gatttcataa actgctgaaa 25020

tggggaagac aaatactctc gggcattatc actacgaaat gtgcgaatag aaaccccaaa 25080

ttgattttga atttcagcgt ggaaggtctg gaaaatagaa aacagctcag atcgattttt 25140

tatcaaaaat atccaagtgc acctggaata atcatcaatg aaactgacaa aatagcagaa 25200

tcccaaggtg gaactgaccc gactaggacc ccaaacatct gaatggacta aagtaaaagg 25260

tgactctgct cgattatcaa gacgcctaag gaaatgggag cgagtatgct taccgagctg 25320

acatgactca cactctagag ctgacaagtg agataaacca gataccattt tctgaagttt 25380

tgacaaactg ggatgtccca accgtttatg taataaatct ggtgaatcag taacaggaca 25440

tattgtagat ggaagacaag atgcgagtcc atgtatttag caaggataag gtaataaagt 25500

ccgtttgatt cacgcccggt accaatgatc cgccccgtac tgcgttcttg tataaaaaca 25560

tggtcatcaa gaaataaaat aacgcattta agtgatttgg ctaagcgact aacaactatg 25620

agattaaaag gactattgcg aacataaagg actgaatcta aaggtaagga agaaagtggg 25680

cttgcttgac ctattgcagt tgccatggtt tgagacccat tggctattgt gacttttgga 25740

aaagattgag aatacgaaat agtagtgaaa agagatttgt taccagaaat atgatctgat 25800

gcacctgaat caatgaccca agactcagag gatgaagatt gggaaaaaca agtcacgcta 25860

ttacctgttt gaacaacaga agctatctca gaagatgtct gcttacatgc tttgtactaa 25920

aggaactcaa tataatctgc taaagaaacc atccgactat tcaaagcatc ggttcccatg 25980

tcgctacaat ttgtagtagt agggttaact tgaaatagtg gaaataagta actccggtga 26040

gaaaactgaa gaaatagctt gaaaacactg tttacaacag taaaaacaga acactgttct 26100

gcgccggaat ctactgtagc tgacggaaaa actcaaagta gtcggaatga aacgaaaaac 26160

agtaggggta ggatcggaat taccaggcga cccaactatt ctgaaggaag tttttcaaaa 26220

aatggccgga agtggtcgta cgtgtcggcg cgtgagctca cgcgcgtgag cttctggtgg 26280

cgcgtggagg cgcgtgagga ggctgctgcc ggagattttc actggggttt ggtcgccgga 26340

cagtgactac tcttgtggta gtgttggatt ttgcacaaca ctgacggaga taaagcagac 26400

gcaaacagcc ttgaaaaagt cgccggaaaa gacttccggt gactgatttc tcttcctgga 26460

atcgctggaa tttatgcaca gcgataaatc tctcacaatt gctctgatac catgtgagaa 26520

agcatgggag aaaatatgtt attgatattt ggataataaa tacaatacaa gaggtcccta 26580

tttatagcta tacactacaa ggagatatta cttctcttcc aatgtgggac aaaaatacac 26640

tatacatatc tgtaaactaa caaggggaat atcgtttaaa gataaaaaag atagcgtgca 26700

gaagattgca tacattagag atgcaaaata cagaataccc atactcccag ataatgcagt 26760

atgccttttg catgacccac tggttgaatg gaagcacctg gtcaatttac taggtgtgtt 26820

agtgattttt gctgcttcct tcccctttct aaactacata ctatctaaaa tgttaggggg 26880

acagaagccc agtcaatctg actaggtgat gttagtggtt tccgcttctt tctcccactt 26940

ctaaatgcgt actttctcaa atttaggagc atagaaactt aagcagctgc ctacctgagg 27000

aggtgcatgg gaacataaga gaatagactt tacctgtcat attttccata ccttagttaa 27060

ttacagtgtt atcctgataa tgatctgttt tctgtatcta ggctgaatcg agattcaatc 27120

gcttttggct gaaaggatgc tgctacagat ccttagttta catcattgtg gttcttattc 27180

tataagtact tcccctatca actacttcct tcttttttct taggttattt gcctcttagg 27240

ttgtttgcaa ggaaaggaac aatagatgtt ttgatggaat agcaactcca aaccacttcc 27300

ttaaggctaa tatactgttt ggccaagctt cttcaaagtc caaagccctt ttttgtcttc 27360

aaaaaagtat ctttttttcc caaagttgag gtgtttggcc aaacttttgg aaggaaaaaa 27420

aagtgctttt gagtaaagca gaagctcttg agaagtagaa aaagtagttt tttcccggaa 27480

gcattttttt gaaaagcact tttgagaaaa ataaacttag aaacactttt taaaagtttg 27540

gccaaacact aattgctgct taaaagtgtt tttcagattt attagccaaa cacaaactgc 27600

ttctcaccaa aagtactttt ttgaaaaata cttttttgaa aagtgatttt caaacaaagc 27660

acttttcaaa ataagtttat tttagaagct tgtcaaccgg ctataaatgt cttttatttt 27720

tacagctaga gtaccctaac acctgtaaat tcccctagac atttttttcg actttgttag 27780

ctcattaacc ctagtatagg actctttgtt ttggagctag caaactcttt tgttttccta 27840

tttttgcatc ttcttggtgc catttataat atctcttact tcaccaaaaa aaataagttc 27900

ccaaaatatg actaccttga gttggccaaa gcataaccaa agcttgggca caccagtgtt 27960

tgcgtgaatt ttatggatgt tccttacctt tatccttctg tgcttatgta gcatctgtct 28020

tggttaatct tttctgaagt ctatagtgta tttctgtgtt gcaacatgag tttactgtca 28080

atcttactgt ttgacctcaa ttttgggttc tttttgattt tgaaagacat cgtttaacag 28140

gttggcatgg ctgctactct tgctggtgtc tgtcaggtgc ctctcactgc tgttttgctt 28200

ctctttgaac tgacacagaa ttatcggata gttctgcccc tcttgggagc tgtggggttg 28260

tcttcttggg ttacatctgg acaaacaagg aaaagtgtag tgaaggatag agaaagacta 28320

aaagatgcaa gagcccacat gatgcagcga caaggaactt ctttctccaa catttctagt 28380

ttaacttatt cttcaggtgt gaaaccttca cagaaagaga gtaacctatg caaacttgag 28440

agttccctct gtctttatga atctgatgat gaagaaaatg atttggcaag gacaattcta 28500

gtttcacagg caatgagaac acgatatgtg acagttctaa tgagcacctt gctaacggag 28560

accatatccc tcatgctagc tgagaagcaa tcttgtgcaa taatagttga tgaaaataat 28620

tttctcattg gtctgctgac acttagtgat atccagaatt acagcaagtt gccaagagca 28680

gagggcaatt tccaggaggt agcttcttgg tacatttcaa tattcttaac tgatgaaaaa 28740

ataagggaaa ttgatctagc atgaaattaa gctaattata agttttacac tgtagaactg 28800

gtaaaacagg gttggctgga tatttctttg ttgaattttt aggattatat gtattgtttt 28860

agttttgtag gttgttttct gatgtgcttt ttgacttggc agaatcttaa gatgaaatgg 28920

aaggtgttta accaaaaaat agaattttca gtcaaagcct atatttagaa gaaaacgggt 28980

tattgataac caagttttac tttacttccc caacaatcta tttggtaaat agcaaaagta 29040

atgcgtatgt gagaaagcac gggagaaaat atattattga tattagatat tcaatataat 29100

acaagaggtc ctacacatca tatagctata gtctacaaac tacatattac tctcattcca 29160

atgtgggact acacataact aacactcccc ctcaagccgg tgcatacata tcatatgtac 29220

cgagcttgtt acacatgtaa ctaatacgag aaccagtaag agacttagtg aaaatatctg 29280

ctagttgatc atttgacttt acaaactttg taaaaatatc tcctgaaagt attttttctc 29340

tgacaaagta acagtcgatc tcaatgtgtt tagtcctctc atggaatagc ggatttgacg 29400

caatatgaag agcagcttgg ttatcacaca ccagttccat cttgctgatt tctccaaact 29460

ttaactcctt gagcaactgc ttgacccaaa ctaactctca cgttgccata gccattgccc 29520

gatattcgac gtcggcgcca gatcgagcaa ctacattctg tttcttgctc ttccacgaga 29580

ccaaattacc tcctactaga acacaatatc caggcgtaga acgtctatca aaaggtgatc 29640

ctgcccaatc agcatttgtg tacccaacaa tttgctcgtg gcctcgatcc tcgagtagta 29700

atcctttgct tggagatgac tttatatacc gaagaatgcg aacaactgca tcccagtgac 29760

tatcacaggg agaatccata aactgactta caacactcac cggaaaagaa atgtcaggtc 29820

tagtcactgt gaggtaattc aatttgccaa ccaacctcct atatctcgta gggtctctaa 29880

gaggctcccc gtgtctaggc agaagcttag cattcggatc cataagagag tcaataggtc 29940

tgtaacccat cattccagtc tcctcaaaaa tgtctaaggc ataattccgc tgtgaaataa 30000

caatacctga gctagactga ggcactgagc aacctcaata cctagaaaat acttcaatct 30060

gcccagatcc ttagtctgga agtgctgaaa gagatgttgc ttcagattag taatatcatc 30120

ctgatcattg ccagtaataa caatatcatc aacataaacc actagataaa tacacagatt 30180

aggagtaaag tgccgataaa acacagagag atcagcctca ctacgagtca tggcgaactc 30240

ctgaataatt atgctgaact taccaaacca agctcgaggg gactgtttca aaccatataa 30300

tgacctgcac aatctacaca cacaaccatt aaactccccc tgagcaacaa aaccaggtgg 30360

ttactccata taaacttctt cctcaagatc accgtggaga aaagcattct taatgtctaa 30420

ctgataaaga ggccaatgac gtacaacagc catggacaaa aagagacgaa caaatgctat 30480

tttagccacg ggagagaaag tatcactata atcaagccca aaaatctgag tatatccttt 30540

tgcaacaaga cgagccttaa gccgatcaac ctggccatcc gggccgactt tgaccgcata 30600

aacctaatga caaccaacat tagacttacc tgcaggaaga ggaacaagct cccaagtgcc 30660

actcgcatgt aaagcagaca tctcgtcaat catagcatgt cgccatcctg gatgagatag 30720

tgcctcacct gtagacttag ggatagaaac agtggacaaa gaagatataa aagcataatg 30780

aggtgatgac acacgatgat gacttaaacc gacatagtgg ggattaggat tacgtgtgga 30840

tcgtacgcct ttgcggagtg caattggttg actaagagga gacaagatcg tagtaggtgc 30900

agaatctgat gcagggcgtg aatcacttgg gcatgatgtt ggatgtggac gacgatgata 30960

agtcaagagt ggtggagctg cagaaggttg aactggatta tgtggaggaa ctggaggtgg 31020

agctacaact ggagctgtag gtggtggaac tggagctata agtggtggag ctacaactgg 31080

agctggagat gtagaggaag atgaatgaga gatagtgact gaatctccaa aaaataaaat 31140

tggtagtacc tcagaaatat ctaagtgatg acatgaacct gtgaagtatg attgagtttc 31200

aaagaaggta acatcagcgg acataaggta ccgctgaagg tcaagagagt agcatcgata 31260

ccccttttgt gttctcgagt aacctagaaa tacgcactta agagcacgag gagctaactt 31320

atctgttcct ggagtaaggt tatggacaaa acaagtgatt ccaaagatac agggtggaag 31380

agagaacaaa ggtaagtggg gaaacatgac aaagaatgga acttggtttt ggataactga 31440

agatggcata cgattaataa gatagcaaga tataagaact gcatcccccc aaaaacgaaa 31500

cggagcatga gattgtatga gtagggtacg agcaatttca ataagatgtc tattttttct 31560

ttcagctacc ccattttgtt gagatgtgta cagacaagat gtttgatgaa taatcccatg 31620

agatttcata aactgctgaa atggggaaga caaatactct cgggcattat cactaggaaa 31680

tgtgcgaata gaaaccccaa attgattttg aatttttagc gtggaaggtc tggaaaaata 31740

gaaaacaact cagatcgatt ttttatcaaa aatatccaag tgcaccttga ataatcatca 31800

attattcaat aaaactgaca aagtagcaga atcccaaggt ggaactgacc cgactaggac 31860

cccaaacatt tgagaatgga ctaaagtaaa aggtgactct gcttgattat caagacgccg 31920

agggaaatgg aagcgagtat gcttatcgaa ctgacatgac tcacactcta gagctgacaa 31980

gtgagataaa ccagatacca ttttatgaag ttttgacaaa ttgggatgtc ccgaccgttt 32040

atgtaataaa tttggtgtat tagtaacagg acaagttgtt gaaggaagac aagatgtgag 32100

tccgtgtgat ttagcaagga taaggtaata aagtccgttt gattcacgtc cggtaccaat 32160

aattcgtccc gtactgcgtt cctgtataaa aacatggtca tcaagaaata aaacaacgca 32220

tttaagtgat ttggctaagc gactaatagt tatgagatta aaaggactat tgggaacata 32280

aatgactgaa tataaaggta aggaaggaag tgagcttgct tgacttattg ttgttgccat 32340

tgtttgagac ctattggcca ttgtgactct tgaaagagat tgaaaatacg aaatagtagt 32400

gaaaagagat ttgttaccag aaatatgatc tgatgcacct gaatcaatga cccaaaactc 32460

agatgatgaa gattgggaga aacaagtcac gctattacct gtttaaacaa cagaagctat 32520

cacagaagat gtctgcttac atgctttgta ccgaaggaac tcaatataat ctgctaaaga 32580

aaccatccga ctattcaaag tatcggttcc catgtcgcta caatttgtag taataggatg 32640

gatagactcg gaaaattgta aagttatcgg aatttgtcgt aaccaggatc gagcaagctg 32700

tcttgaagaa atggtttcaa aaaatgtccg gaaaggtcac ttttacgccg gaaaaatata 32760

aaaatggtcg aaatttgatt tgaattagat gggtaggctc ggaattgtga ggagagcaga 32820

ctgtcctgaa gaagcttaat gaaaaaatgg ccggaaagtg gccggaaccc tcgccgtaaa 32880

agttgttacc ggcgcgtgaa ggcgcgtggc attttttctg ccagataaat tttcaggggt 32940

tggtcgtcgg agggtgatcc cttgtggtgg tgttggtttt tgcacaatac cgacaggcct 33000

taggtcaccc gaaaatttgc acgatgacta agttctttct tcccggttaa cgctggaatg 33060

acgcacatcg atcttttctc actaatgcta tgataccatg tgagaaagca cgggagaaaa 33120

tatattattg atattagata ctcaatataa tacaagaggt catatttata gctatagtct 33180

acaaagtaca tattactctc attcaaatgt gggactacac ataactaaca acgtaaatta 33240

acaaagagaa ataaggaatg taacaacagt caatccctaa aatcaaggta gaaaactttg 33300

ataaagcaga gaattataga atgtatttca gtagtacttg gaacttgtcc ttacaaataa 33360

aattctttat ccttatatag gggcgtacaa tcataacatt tttcgcactt aattcgaatt 33420

cattatgagc attaattgta ttgattgccc gttatcatag ataaccataa ctgacgtatt 33480

tgtaactata aatgccttat aacggctctg attccccttc cttatttact tctggtttgt 33540

gtatctttcc ttctttttag cctttattca ttcagttctc gcctcttctt tgacaactgt 33600

caagcccgat cctctgttct gtactgtctc gtgggtgttt cccccgtacc ttccttatat 33660

tcttaattct gttaattgag agtgtcactt gtcactatgc cattgttcca cgcgtcatgt 33720

ttcatccacg tgtaatatct tttttccacc aatacagata atcccccact ttctgaatat 33780

tctcaactga atattcgggt aagtttttat ggcgggaatt ctttgccgtc gtttttcgag 33840

tatcatcgtg tcatcttcag aaccgatgtg acgtacgtca cgtctattta atgcctatgc 33900

caggtggctt ctatcgattg gctctgcagt tttttagcgc tttttagggt ttttcagcgg 33960

ctgcgtcagt cacgaagtga cggttccatt atgacgcttc ataatgacta actttaatga 34020

tggtcgtgtc ttcttattaa tacttcattc ctttttgatc tcttggagtc ttccttcttc 34080

agtatccacc acattacttc tttgtatttc tgcatcttct ctttgatatt cctttggaca 34140

atcatgtctt cttctacacc agacccccgt aaggttgtga ttgttgacga acttgatctt 34200

tctactgctc ctactagaag taggagaggt ggtagacttc gtagtcttgg ttcactatct 34260

aatcgtggtt cttcttccca gggtagtgct gctaagccat cttcttctag acctagggct 34320

cctttaaccc ctagatcttc ttctaggaat agagatttaa atgatccagt gcgcgaacct 34380

acagttgcag agattgttcc tcaagaattt tcttttgtaa ctgaccgtga aaccataagg 34440

aatcaaattt cttctatagc ctccctcaat accgctaacc tttatccaag tttaatcagt 34500

aatggtcttc tctcccgggt tcgaagagaa tattactgaa accagatttc ccaattttag 34560

tccctggtgc caaccagaga attactccat accatgttgg tttttccttt gtttacacct 34620

acccttttac tttagggttc aaaccaccta ttgaaccagt aatcattgaa ttctgtcgtt 34680

atttcaacgt gtgtcttggc cagattgacc acatagtatg gagggctgtt catgccttcg 34740

ttatttatca gatttggttt ccatgccttt cacttttcag cacttgcttc atctctactc 34800

ccctaaattg tttcgtgaag tagtttttac tctcgtggct agaagtaaga gagtgttggt 34860

tagccttgaa gacgattggg accgtggctg gtacgctcgt tttgttgctg ctcccactag 34920

tgcattagtg ggtgaagaaa atatgccttt cccggagaaa tggaactttg cacgtaagct 34980

ttcttctcct cttttttttt gtcttaaaaa aactccatgt aatcatatac ccacttcttc 35040

agcaactatg gaagtttttt atgcttgggt agaaaagatg ttaactgctg cgcctatgga 35100

gaaaagatcc tggaaatact tttctcaaag atttggttgg aaagtgaaga cgcacggtac 35160

tttttacctt cattgttttt ccttttctct tccttgtttg ttcaatgatt tctcatcctt 35220

cccttttttt ttactagggt ttccgattcg tggtattagt cccgcgtctg ttccatcaac 35280

taggctttcc gtgattcttg ttcaggaaag aattttaagt gcttcttctt caaaaaggaa 35340

aactgacgga gcccgtggct ctgatgacga agaagaaaca gaggagggtt ctttggtgcg 35400

aaggtcacgc gtcaggagac gcgtggtttc tgatgatgaa actactcctt ctcatgaccc 35460

tctatctagt tcaatccctt ttagactcac ggatgagcta gagagtaccc ctttagtgat 35520

ttcttatgat gatgctgttg atccccctcc aagttctgtt gatagattgt ttgctcatgg 35580

cttcgagggt gatgaagttt tgggcctgtt tctgaagaat tgccccttgc ttcccttcca 35640

gtttcagttt tcattaaccc ttccgtgtcc ttacctgatg atactcctgt tgttattctc 35700

gtggctgctt ctactccgtc atctattccc gtgactgctt ctcatgcaga ggccaaacct 35760

tctagcagca gaagggcaat gaaaagagtt gttgttgagg ttcctgaagg tgagaactta 35820

ttaagaaaat ccggtcaagc cgacgtgtag ttgaaaccta tgctcggccc cgtagagaag 35880

aagaagttag aaagccatag ctcactcact ttaatgaatg atatcgttca ttcttccttg 35940

aaagtacaag cttaattata tttcctttct tttctctttc ttattcataa ctcttcctcc 36000

ttttttgcag atcaacttga ttggcacaga gcttatgaaa agagtttctc aggcggaccg 36060

gcaagttata gatttgcgca ccgaggctga taactggaag gaacaattcg aaggtcttca 36120

attggaaaaa gaggttccgg cggaagagaa gaatgctttg gaacaacaga tgagagtgat 36180

tgcctctgaa ttagcagttg aaaaagcttc ctcgagccag gttggaaagg ataagtatat 36240

acttgaatcc tcctttgctg aacaactttc caaggcaact gaagaaataa ggagtttgaa 36300

ggaactcctt aatcaaaaag aggtttatgc gagagaattg gttcaaacac ttactcaagt 36360

tcaggaagat ctccgtgcct ctacttataa gattcagttc ttggaaagtt ctctcgcttc 36420

tttgaagaca gcttacgatg cctctgaagc agaaaaagaa gagctgagag ctgagattta 36480

ccagtgggag aaggattatg agattctcga ggataatcta tcgttggatg taagttgggc 36540

tttcttaaac actcgtctcg agactctagt tgaagccaac catgagggtt ttgaccttaa 36600

tgctgagatt gctaaggcta aagaagcaat tgataaaact cagcaacgtc aaatcttttc 36660

ctcacctgaa gacgaaggtc ccgaaggtga tggagattga 36700

<210> 5

<211> 786

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of CLC-Nt2 from Nicotiana tabacum, translated from SEQ ID NO:1 of PCT/EP2013/077532

<400> 5

Met Glu Glu Pro Thr Arg Leu Val Glu Glu Ala Thr Ile Asn Asn Met

1 5 10 15

Asp Gly Gln Gln Asn Glu Glu Glu Arg Asp Pro Glu Ser Asn Ser Leu

20 25 30

His Gln Pro Leu Leu Lys Arg Asn Arg Thr Leu Ser Ser Ser Pro Phe

35 40 45

Ala Leu Val Gly Ala Lys Val Ser His Ile Glu Ser Leu Asp Tyr Glu

50 55 60

Ile Asn Glu Asn Asp Leu Phe Lys His Asp Trp Arg Arg Arg Ser Arg

65 70 75 80

Val Gln Val Leu Gln Tyr Val Phe Leu Lys Trp Thr Leu Ala Phe Leu

85 90 95

Val Gly Leu Leu Thr Gly Val Thr Ala Thr Leu Ile Asn Leu Ala Ile

100 105 110

Glu Asn Met Ala Gly Tyr Lys Leu Arg Ala Val Val Asn Tyr Ile Glu

115 120 125

Asp Arg Arg Tyr Leu Met Gly Phe Ala Tyr Phe Ala Gly Ala Asn Phe

130 135 140

Val Leu Thr Leu Ile Ala Ala Leu Leu Cys Val Cys Phe Ala Pro Thr

145 150 155 160

Ala Ala Gly Pro Gly Ile Pro Glu Ile Lys Ala Tyr Leu Asn Gly Val

165 170 175

Asp Thr Pro Asn Met Tyr Gly Ala Thr Thr Leu Phe Val Lys Ile Ile

180 185 190

Gly Ser Ile Ala Ala Val Ser Ala Ser Leu Asp Leu Gly Lys Glu Gly

195 200 205

Pro Leu Val His Ile Gly Ala Cys Phe Ala Ser Leu Leu Gly Gln Gly

210 215 220

Gly Pro Asp Asn Tyr Arg Leu Arg Trp Arg Trp Leu Arg Tyr Phe Asn

225 230 235 240

Asn Asp Arg Asp Arg Arg Asp Leu Ile Thr Cys Gly Ser Ser Ser Gly

245 250 255

Val Cys Ala Ala Phe Arg Ser Pro Val Gly Gly Val Leu Phe Ala Leu

260 265 270

Glu Glu Val Ala Thr Trp Trp Arg Ser Ala Leu Leu Trp Arg Thr Phe

275 280 285

Phe Ser Thr Ala Val Val Val Val Ile Leu Arg Ala Phe Ile Glu Tyr

290 295 300

Cys Lys Ser Gly Asn Cys Gly Leu Phe Gly Arg Gly Gly Leu Ile Met

305 310 315 320

Phe Asp Val Ser Gly Val Ser Val Ser Tyr His Val Val Asp Ile Ile

325 330 335

Pro Val Val Val Ile Gly Ile Ile Gly Gly Leu Leu Gly Ser Leu Tyr

340 345 350

Asn His Val Leu His Lys Ile Leu Arg Leu Tyr Asn Leu Ile Asn Glu

355 360 365

Lys Gly Lys Leu His Lys Val Leu Leu Ala Leu Ser Val Ser Leu Phe

370 375 380

Thr Ser Ile Cys Met Tyr Gly Leu Pro Phe Leu Ala Lys Cys Lys Pro

385 390 395 400

Cys Asp Pro Ser Leu Pro Gly Ser Cys Pro Gly Thr Gly Gly Thr Gly

405 410 415

Asn Phe Lys Gln Phe Asn Cys Pro Asp Gly Tyr Tyr Asn Asp Leu Ala

420 425 430

Thr Leu Leu Leu Thr Thr Asn Asp Asp Ala Val Arg Asn Ile Phe Ser

435 440 445

Ile Asn Thr Pro Gly Glu Phe Gln Val Met Ser Leu Ile Ile Tyr Phe

450 455 460

Val Leu Tyr Cys Ile Leu Gly Leu Ile Thr Phe Gly Ile Ala Val Pro

465 470 475 480

Ser Gly Leu Phe Leu Pro Ile Ile Leu Met Gly Ser Ala Tyr Gly Arg

485 490 495

Leu Leu Ala Ile Ala Met Gly Ser Tyr Thr Lys Ile Asp Pro Gly Leu

500 505 510

Tyr Ala Val Leu Gly Ala Ala Ser Leu Met Ala Gly Ser Met Arg Met

515 520 525

Thr Val Ser Leu Cys Val Ile Phe Leu Glu Leu Thr Asn Asn Leu Leu

530 535 540

Leu Leu Pro Ile Thr Met Leu Val Leu Leu Ile Ala Lys Ser Val Gly

545 550 555 560

Asp Cys Phe Asn Leu Ser Ile Tyr Glu Ile Ile Leu Glu Leu Lys Gly

565 570 575

Leu Pro Phe Leu Asp Ala Asn Pro Glu Pro Trp Met Arg Asn Ile Thr

580 585 590

Ala Gly Glu Leu Ala Asp Val Lys Pro Pro Val Val Thr Leu Cys Gly

595 600 605

Val Glu Lys Val Gly Arg Ile Val Glu Ala Leu Lys Asn Thr Thr Tyr

610 615 620

Asn Gly Phe Pro Val Val Asp Glu Gly Val Val Pro Pro Val Gly Leu

625 630 635 640

Pro Val Gly Ala Thr Glu Leu His Gly Leu Val Leu Arg Thr His Leu

645 650 655

Leu Leu Val Leu Lys Lys Lys Trp Phe Leu His Glu Arg Arg Arg Thr

660 665 670

Glu Glu Trp Glu Val Arg Glu Lys Phe Thr Trp Ile Asp Leu Ala Glu

675 680 685

Arg Gly Gly Lys Ile Glu Asp Val Leu Val Thr Lys Asp Glu Met Glu

690 695 700

Met Tyr Val Asp Leu His Pro Leu Thr Asn Thr Thr Pro Tyr Thr Val

705 710 715 720

Val Glu Ser Leu Ser Val Ala Lys Ala Met Val Leu Phe Arg Gln Val

725 730 735

Gly Leu Arg His Met Leu Ile Val Pro Lys Tyr Gln Ala Ala Gly Val

740 745 750

Ser Pro Val Val Gly Ile Leu Thr Arg Gln Asp Leu Arg Ala His Asn

755 760 765

Ile Leu Ser Val Phe Pro His Leu Glu Lys Ser Lys Ser Gly Lys Lys

770 775 780

Gly Asn

785

<210> 6

<211> 786

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of CLC-Nt2 from Nicotiana tabacum, translated from SEQ ID NO: 2 of PCT/EP2013/077532

<400> 6

Met Glu Glu Pro Thr Arg Leu Val Glu Glu Ala Thr Ile Asn Asn Met

1 5 10 15

Asp Arg Gln Gln Asn Glu Glu Glu Arg Asp Pro Glu Ser Asn Ser Leu

20 25 30

His Gln Pro Leu Leu Lys Arg Asn Arg Thr Leu Ser Ser Ser Pro Phe

35 40 45

Ala Leu Val Gly Ala Lys Val Ser His Ile Glu Ser Leu Asp Tyr Glu

50 55 60

Ile Asn Glu Asn Asp Leu Phe Lys His Asp Trp Arg Arg Arg Ser Arg

65 70 75 80

Val Gln Val Leu Gln Tyr Val Phe Leu Lys Trp Thr Leu Ala Phe Leu

85 90 95

Val Gly Leu Leu Thr Gly Val Thr Ala Ser Leu Ile Asn Leu Ala Ile

100 105 110

Glu Asn Ile Ala Gly Tyr Lys Leu Arg Ala Val Val Asn Tyr Ile Glu

115 120 125

Asp Arg Arg Tyr Leu Val Gly Phe Ala Tyr Phe Ala Gly Ala Asn Phe

130 135 140

Val Leu Thr Leu Ile Ala Ala Leu Leu Cys Val Cys Phe Ala Pro Thr

145 150 155 160

Ala Ala Gly Pro Gly Ile Pro Glu Ile Lys Ala Tyr Leu Asn Gly Val

165 170 175

Asp Thr Pro Asn Met Tyr Gly Ala Thr Thr Leu Phe Val Lys Ile Ile

180 185 190

Gly Ser Ile Ala Ala Val Ser Ala Ser Leu Asp Leu Gly Lys Glu Gly

195 200 205

Pro Leu Val His Ile Gly Ala Cys Phe Ala Ser Leu Leu Gly Gln Gly

210 215 220

Gly Pro Asp Asn Tyr Arg Leu Lys Trp Arg Trp Leu Arg Tyr Phe Asn

225 230 235 240

Asn Asp Arg Asp Arg Arg Asp Leu Ile Thr Cys Gly Ser Ser Ser Gly

245 250 255

Val Cys Ala Ala Phe Arg Ser Pro Val Gly Gly Val Leu Phe Ala Leu

260 265 270

Glu Glu Val Ala Thr Trp Trp Arg Ser Ala Leu Leu Trp Arg Thr Phe

275 280 285

Phe Ser Thr Ala Val Val Val Val Ile Leu Arg Ala Phe Ile Glu Tyr

290 295 300

Cys Lys Ser Gly Tyr Cys Gly Leu Phe Gly Arg Gly Gly Leu Ile Met

305 310 315 320

Phe Asp Val Ser Gly Val Ser Val Ser Tyr His Val Val Asp Ile Ile

325 330 335

Pro Val Val Val Ile Gly Ile Ile Gly Gly Leu Leu Gly Ser Leu Tyr

340 345 350

Asn Cys Val Leu His Lys Val Leu Arg Leu Tyr Asn Leu Ile Asn Glu

355 360 365

Lys Gly Lys Leu His Lys Val Leu Leu Ala Leu Ser Val Ser Leu Phe

370 375 380

Thr Ser Ile Cys Met Tyr Gly Leu Pro Phe Leu Ala Lys Cys Lys Pro

385 390 395 400

Cys Asp Ser Ser Leu Gln Gly Ser Cys Pro Gly Thr Gly Gly Thr Gly

405 410 415

Asn Phe Lys Gln Phe Asn Cys Pro Asp Gly Tyr Tyr Asn Asp Leu Ala

420 425 430

Thr Leu Leu Leu Thr Thr Asn Asp Asp Ala Val Arg Asn Ile Phe Ser

435 440 445

Ile Asn Thr Pro Gly Glu Phe His Val Thr Ser Leu Ile Ile Tyr Phe

450 455 460

Val Leu Tyr Cys Ile Leu Gly Leu Ile Thr Phe Gly Ile Ala Val Pro

465 470 475 480

Ser Gly Leu Phe Leu Pro Ile Ile Leu Met Gly Ser Ala Tyr Gly Arg

485 490 495

Leu Leu Ala Ile Ala Met Gly Ser Tyr Thr Lys Ile Asp Pro Gly Leu

500 505 510

Tyr Ala Val Leu Gly Ala Ala Ser Leu Met Ala Gly Ser Met Arg Met

515 520 525

Thr Val Ser Leu Cys Val Ile Phe Leu Glu Leu Thr Asn Asn Leu Leu

530 535 540

Leu Leu Pro Ile Thr Met Leu Val Leu Leu Ile Ala Lys Ser Val Gly

545 550 555 560

Asp Cys Phe Asn Leu Ser Ile Tyr Glu Ile Ile Leu Glu Leu Lys Gly

565 570 575

Leu Pro Phe Leu Asp Ala Asn Pro Glu Pro Trp Met Arg Asn Ile Thr

580 585 590

Ala Gly Glu Leu Ala Asp Val Lys Pro Pro Val Val Thr Leu Cys Gly

595 600 605

Val Glu Lys Val Gly Arg Ile Val Glu Val Leu Lys Asn Thr Thr Tyr

610 615 620

Asn Gly Phe Pro Val Val Asp Glu Gly Val Val Pro Pro Val Gly Leu

625 630 635 640

Pro Val Gly Ala Thr Glu Leu His Gly Leu Val Leu Arg Thr His Leu

645 650 655

Leu Leu Val Leu Lys Lys Lys Trp Phe Leu Asn Glu Arg Arg Arg Thr

660 665 670

Glu Glu Trp Glu Val Arg Glu Lys Phe Thr Trp Ile Asp Leu Ala Glu

675 680 685

Arg Gly Gly Lys Ile Glu Asp Val Val Val Thr Lys Asp Glu Met Glu

690 695 700

Met Tyr Val Asp Leu His Pro Leu Thr Asn Thr Thr Pro Tyr Thr Val

705 710 715 720

Val Glu Ser Leu Ser Val Ala Lys Ala Met Val Leu Phe Arg Gln Val

725 730 735

Gly Leu Arg His Met Leu Ile Val Pro Lys Tyr Gln Ala Ala Gly Val

740 745 750

Ser Pro Val Val Gly Ile Leu Thr Arg Gln Asp Leu Arg Ala His Asn

755 760 765

Ile Leu Ser Val Phe Pro His Leu Glu Lys Ser Lys Ser Gly Lys Lys

770 775 780

Gly Asn

785

<210> 7

<211> 665

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; one start codon, translated from SEQ ID NO: 3 of PCT/EP2013/077532

<400> 7

Met Cys Asp Ser Ser Lys Val Asp Ser Asp Ser Gly Ile Gln Ile Gly

1 5 10 15

Ser Leu Leu Glu Glu Val Ile Pro Gln Gly Asn Asn Thr Ala Ile Ile

20 25 30

Ser Ala Cys Phe Val Gly Leu Phe Thr Gly Ile Ser Val Val Leu Phe

35 40 45

Asn Ala Ala Val His Glu Ile Arg Asp Leu Cys Trp Asp Gly Ile Pro

50 55 60

Tyr Arg Ala Ala Ser Glu Glu Pro Ile Gly Val His Trp Gln Arg Val

65 70 75 80

Ile Leu Val Pro Ala Cys Gly Gly Leu Val Val Ser Phe Leu Asn Ala

85 90 95

Phe Arg Ala Thr Leu Glu Val Ser Thr Glu Gly Ser Trp Thr Ser Ser

100 105 110

Val Lys Ser Val Leu Glu Pro Val Leu Lys Thr Met Ala Ala Cys Val

115 120 125

Thr Leu Gly Thr Gly Asn Ser Leu Gly Pro Glu Gly Pro Ser Val Glu

130 135 140

Ile Gly Thr Ser Val Ala Lys Gly Val Gly Ala Leu Leu Asp Lys Gly

145 150 155 160

Gly Arg Arg Lys Leu Ser Leu Lys Ala Ala Gly Ser Ala Ala Gly Ile

165 170 175

Ala Ser Gly Phe Asn Ala Ala Val Gly Gly Cys Phe Phe Ala Val Glu

180 185 190

Ser Val Leu Trp Pro Ser Pro Ala Glu Ser Ser Leu Ser Leu Thr Asn

195 200 205

Thr Thr Ser Met Val Ile Leu Ser Ala Val Ile Ala Ser Val Val Ser

210 215 220

Glu Ile Gly Leu Gly Ser Glu Pro Ala Phe Ala Val Pro Gly Tyr Asp

225 230 235 240

Phe Arg Thr Pro Thr Glu Leu Pro Leu Tyr Leu Leu Leu Gly Ile Phe

245 250 255

Cys Gly Leu Val Ser Val Ala Leu Ser Ser Cys Thr Ser Phe Met Leu

260 265 270

Gln Ile Val Glu Asn Ile Gln Thr Thr Ser Gly Met Pro Lys Ala Ala

275 280 285

Phe Pro Val Leu Gly Gly Leu Leu Val Gly Leu Val Ala Leu Ala Tyr

290 295 300

Pro Glu Ile Leu Tyr Gln Gly Phe Glu Asn Val Asn Ile Leu Leu Glu

305 310 315 320

Ser Arg Pro Leu Val Lys Gly Leu Ser Ala Asp Leu Leu Leu Gln Leu

325 330 335

Val Ala Val Lys Ile Val Thr Thr Ser Leu Cys Arg Ala Ser Gly Leu

340 345 350

Val Gly Gly Tyr Tyr Ala Pro Ser Leu Phe Ile Gly Ala Ala Thr Gly

355 360 365

Thr Ala Tyr Gly Lys Ile Val Ser Tyr Ile Ile Ser His Ala Asp Pro

370 375 380

Ile Phe His Leu Ser Ile Leu Glu Val Ala Ser Pro Gln Ala Tyr Gly

385 390 395 400

Leu Val Gly Met Ala Ala Thr Leu Ala Gly Val Cys Gln Val Pro Leu

405 410 415

Thr Ala Val Leu Leu Leu Phe Glu Leu Thr Gln Asp Tyr Arg Ile Val

420 425 430

Leu Pro Leu Leu Gly Ala Val Gly Leu Ser Ser Trp Val Thr Ser Gly

435 440 445

Gln Thr Arg Lys Ser Val Val Lys Asp Arg Glu Lys Leu Lys Asp Ala

450 455 460

Arg Ala His Met Met Gln Arg Gln Gly Thr Ser Phe Ser Asn Ile Ser

465 470 475 480

Ser Leu Thr Tyr Ser Ser Gly Ser Pro Ser Gln Lys Glu Ser Asn Leu

485 490 495

Cys Lys Leu Glu Ser Ser Leu Cys Leu Tyr Glu Ser Asp Asp Glu Glu

500 505 510

Asn Asp Leu Ala Arg Thr Ile Leu Val Ser Gln Ala Met Arg Thr Arg

515 520 525

Tyr Val Thr Val Leu Met Ser Thr Leu Leu Met Glu Thr Ile Ser Leu

530 535 540

Met Leu Ala Glu Lys Gln Ser Cys Ala Ile Ile Val Asp Glu Asn Asn

545 550 555 560

Phe Leu Ile Gly Leu Leu Thr Leu Gly Asp Ile Gln Asn Tyr Ser Lys

565 570 575

Leu Pro Arg Thr Glu Gly Asn Phe Gln Glu Glu Leu Val Val Ala Gly

580 585 590

Val Cys Ser Ser Lys Gly Asn Lys Cys Arg Val Ser Cys Thr Val Thr

595 600 605

Pro Asn Thr Asp Leu Leu Ser Ala Leu Thr Leu Met Glu Lys His Asp

610 615 620

Leu Ser Gln Leu Pro Val Ile Leu Gly Asp Val Glu Asp Glu Gly Ile

625 630 635 640

His Pro Val Gly Ile Leu Asp Arg Glu Cys Ile Asn Val Ala Cys Arg

645 650 655

Ala Leu Ala Thr Arg Glu Gln Leu Cys

660 665

<210> 8

<211> 408

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: RNAi sequence used to silence CLC-Nt2

<400> 8

gtcatcatca ggtgtgtgtg ctgctttccg ttctccagta ggtggtgtcc tatttgcttt 60

agaggaagtg gcaacatggt ggagaagtgc actcctctgg agaactttct tcagcacggc 120

agttgtggtg gtgatactga gggccttcat tgaatactgc aaatctggca actgtggact 180

ttttggaaga ggagggctta tcatgtttga tgtgagtggt gtcagtgtta gctaccatgt 240

tgtggacatc atccctgttg tagtgattgg aatcataggc ggacttttgg gaagcctcta 300

caatcatgtc ctccacaaaa ttctgaggct ctacaatctg atcaacgaga agggaaaact 360

acataaggtt cttctcgctc tgagtgtctc ccttttcacc tccatttg 408

<210> 9

<211> 282

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: RNAi sequence used to silence CLCe

<400> 9

gaaatccttt accagggttt tgagaatgtt aatattctgc tagaatctcg cccactagtg 60

aaaggcctct ccgctgatct gttgctccag cttgtagctg tcaaaatagt aacaacttca 120

ttatgccgag cctctggatt ggttggaggc tactatgcgc catctctatt catcggtgct 180

gctactggaa ctgcatatgg gaaaattgtt agctacatta tctctcatgc tgatccaatc 240

tttcatcttt ccatcttgga agttgcatcc ccacaagctt at 282

<210> 10

<211> 44432

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; two start codons

<400> 10

atgattagcg gccaaaacac tgtgctgcac aatcctccta attcgctctt caattcctta 60

tctcctcgcc atatctgtat atctttctgt aacgacaaag ctttaaaaaa gtcagtcacg 120

cactccgccc ctcggtttgc tcgtctgtta aacaatgaat cacggaagtt gttgggtcgt 180

catccaaatt gctggccttg ggctcgacga ccatctcttc ctccgggacg ttcctctgac 240

ggaaacattg aaaaagaaca agatatgtgc gacagcagca aagtcgatag tgatagtggc 300

atccagatag gatctctgct cgaggaagtt atcccacaag gcaataatac cgctataatc 360

tcggcttgct ttgttggcct cttcaccggt atcagtgtcg tgcttttcaa cgctgcggta 420

cgtgcgctat aggtctttca tttctctttt catgtactat tcctccttac ttacttggcc 480

tcagtcaatc agccccctgc ctactttaaa ttattgtaca ttttatcaga ggagtgtcct 540

atacatcaaa ttcacataac ttagtaaaat atgctgatat tctgaatttt aaacttacca 600

gcttagaaca tccaggttag ttcagaaaca gataatctaa attggtctca tttataagtc 660

attttgttat tcaagacata caatttggct cttgataaaa gattatgcag cgcccgatga 720

ttacctaata tttatcagca acccatgtaa tttaacaata ttgtcaccat ataaaagaga 780

actgaagaga atgttcaatt tgtggtcata taacggatat ctcccttggt taggttcatg 840

aaatacgtga tctttgttgg gatggaattc catatcgagc tgcctcagag gagcccattg 900

gagtacattg gcaacgtgta atcttagtac cagcttgtgg cggtttggta gtcagctttt 960

tgaatgcctt ccgagccact ctggaggttt caactgaagg aagttggaca tcatctgtta 1020

aatctgtatt ggaaccagtt ttgaagacaa tggccgcttg tgtcacatta ggaactggga 1080

attccttagg accagaaggc cctagtgttg aaattggcac atctgttgcc aagggagttg 1140

gagctctgct tgataaaggt ggtcgtagaa agctgtcact caaggctgct ggatcagctg 1200

ctggaatcgc ttctggtttg ttccccatat tattcttggt tctgaaccat acatggtaca 1260

ttttccttat aattacatgt agcctgttgt atgctttcct ctttcccggg aagccttttt 1320

gtaaatacaa gtgtgtttgc actcaaacca ataaactgta aaaaaggtga actccttaag 1380

caagcaaaag cattagaaat gtaaactaga catatttctc agattgagag tctgagagat 1440

tagaacacga gtgtttccat tagagagaga aaagagactt ctagatattt ctattatctc 1500

tgtaagagtg aatccgttcc tatacaaaaa ataggccttc attaaataca agcttgggct 1560

gggtactact gggccaaagt aaaaaataaa aagaatcacc cactatcaaa tgggcctagt 1620

ctaacaaccc ccttcaagct ggagggtgac acaaccccta gcttgcgaat atgaaaatga 1680

tgagcaggcc caagtaacac tttggtaaga acatcaacca cttgagaagc actggagttg 1740

tgaaatagac tgatcaggcc attcccaagc ttgccacaaa caaaatgaca gtccagctta 1800

atgtgtttag tgcgttcatg gaaaacttgg ttttttgcaa tgtggacttc ctgattatca 1860

caaaataaag gaacaggtaa agaaggagaa actccaatat cagacaataa tttggtgagc 1920

caagacacct ctgcaacagc cttactcatg gacctatact cagcttcaat tgatgatagt 1980

gagacaacag gttgcttctt tgatttccag ctcaccaagc tgccccccaa gaaaaataca 2040

aaaaccagtg acagacctgc ggctgtctgg gcaagaagcc caatcactgc acaataaagc 2100

tgcaaagaca agtctggaga gttattgcgg aagattccaa agtcaaaagt gcccttgagg 2160

tatcttagca agtgcagggc agcctgcatg ttaggaacac agggagactg cataaactga 2220

ctcagatgct gaacaacaaa actaaggtca ggccttgtgc gtatcaaaaa gtttagcttg 2280

tgcattagac tcctgtactc ttcaggcctg ggcaaaggag tgccaatctt agcttttaac 2340

ttcacattca attcaagggg gcaagtgaca gaagagcaat tcgaggaatg aaaatcagcc 2400

agcaaatcat gaatgaactt tttctgatga agaagaaccc cagaatcagt gtataaaacc 2460

tcaatgctaa ggaagtaatt aagagagccc atgtccttaa tcttgaactg gtcactgaga 2520

aaggacttca aagcagccaa ttcagctaga tcacacctag tcaatatgat atcattcaca 2580

tagacaacca agatgaccaa ggaatcccta gaacccttgg taaaaataga gaaatcattc 2640

aaggaacgag agaagccatt agagcacaag gcttgagata atttagcata ctattgtctt 2700

gaagccagtc ttaaaccata aagagacttc tggagtttgc atactaaagg agcagaagaa 2760

gagtgaggaa cagttaggcc cggtggcagc ttcatgaata cctcctcatc aaggtcccca 2820

tgtaagaaga cattattcac atctagttga aagaggggcc agtgttgttt aacagctaca 2880

acaataagag ttttgacaat agacatattg accacaggag aaaaagtttc attaaagtca 2940

ataccctcaa cttgagtgac ctagctttat atctctcaat actttcatta gccctatatt 3000

taaccttgta tacccactta caactagtag gtttcttgcc aggaggcaat tcaacaatgt 3060

cccaagttct gttggcatcc aaggcctcaa attcacatct catggctgcc tgccattcag 3120

gaacagctgc aacctgagag taagaataag gctcaggaac atgaagttga ctaagagaag 3180

gagcattaga aatagatctg gagggaggag gagaagaagt ggaggtgcag acataactct 3240

tgagatagtt ggttggattg tgtggcacgg aagatcttct caaagcagga ggaggtacaa 3300

gagagttaga ataatgagaa ggagaagaga tggaagtggg aacagagaag attgagaagc 3360

agtagaagga gaaagtgaag gagatgaagg agaggaagaa gacggaaagg aacattcatc 3420

aaaacaagca gaaaagggaa aggggaagac ttgaggtact acatgagagg attgaaagaa 3480

aggaaaaatg gtgttcataa aaaatgacat cttttgatac aaaacaggtg ttattctgaa 3540

gattaaggcg cttgtagccc tttttggcaa aagggtagcc aatgaaaaca caaggaaggg 3600

acctaggatg aaatttgttt tgtgaggggt ggtgacagtt gagtaacaga ggcacccaaa 3660

agctctaagg tggtgataag tagggtggaa gaatgaagca attcataggg acttttgtga 3720

ttaagaagag gaaaaggaaa tctgttaatt aaatatgtgg cagttaaaaa gcagtcaccc 3780

caaaatttaa gtggtagatg agactgaaac ataagtgacc tagcagtctc tagtaaattt 3840

ctgtgttctc tttctacaat accattttat tggggggtgt gaggacagga ggtttggtgt 3900

actatccctt tttctgaaaa gaaaaggcaa ccagaagaac tagatcccag ttccaaagca 3960

ttatcactcc taacagtttg aactttagat tggaattggg tttcaaccat agcaatgaaa 4020

accttgagca aatcaaaggc attgcggcac ccattaaatg tgtccaagta gccctagagt 4080

agtcatctac aatggttaaa aaatacctag aaccattata ggtaggagta gaatagggtc 4140

accaagtatt tatgtgtatt agctgaaaag gctgggtgga gtgaatagaa ctatcaggga 4200

aggacaacct ggtctgcctc gctaaaggac aaaccggact agtgaatgac cgtttggaag 4260

acagtttgca attaagacca gaaatgcatt tcattttata gaagggaata tggccaagtt 4320

tgtaatgcca aacaacatca tctttattca cattatgcaa agcagtacta gtatttacaa 4380

ttggagtatc atcaggtaca gaaataggag cagaaactga attaagcaaa caagaaataa 4440

ggaaattaga aagaggtaaa ggagatgatg ttggaggcct ggcattctga aatagtttgt 4500

agagtccatt gtccaatcta ccaagaacca ctggcttcct cactgaaggg ccctgtaggg 4560

tacaagtagc cttggtaaat tgtacaatat catcatcatg ggaaagtaat ttgtacacaa 4620

agatgagatt atattgaaaa ctaggaatat agagcacatt ataaagaatc aagtcaggga 4680

acaaggctaa ggaaccaata ttagtgacct taaccttata cccattagga agggagacaa 4740

ggtatggtac aggaagtgtt tgaacattaa aaaaacaaat gtttaaggga ggtcatgtgg 4800

tcagatgccc agggtctatt actcaaacta cactatctat catagtcagc ataaatgcac 4860

cataagacaa cccttgtgag gtaataactc accagcaaag ttggtagaag caagatagtt 4920

ggttgaagaa gtagatgatg ctgatgaaga cagttgagat tgttgaagta acattagctg 4980

agaatattgg ttcttggtaa gaccaggaac tggataggac tgttcaggag cagaggtacc 5040

ttcaggacca gctgacattg cagaaccacc agaggtatcc acctcagcat gggcaacaga 5100

ccttctggga ggaagagatc tatttgactt gaaatttgga ggaaagccat tgagcttata 5160

gcacttatca atgctatgtc cgggtttctt acaatagtag acatgtgaag ctcaaaagat 5220

cccttagagg tagtaccgga cctttgaggt tcaaaattta ttttaggaga gggaggaggc 5280

ctggatacac caacactgaa agaagcagaa tttgaggcat attgagttct agcaaaaatt 5340

tgtctttgct tctcatcaga tagcaaaatc ccatatacat taccaatgga aggtaagggc 5400

ttcatcatga tgatgttgct tcttgtttgg acataagtat cattcagtcc cataaagaac 5460

tggtagacct tttgttccct gtcttcagca gatttacccc cacaagtaca cattcaaact 5520

ctcccggcag acaaagatgc aatatcatcc catagtcgtt taattttgtt gaaatatgat 5580

gctatgtcca tggacccttg ggaaatatga gccagttcct tctttagctc aaagatccta 5640

gtacctctct tctaactcag tccaaatatt cttagcaaac tcagagtatt caacactctt 5700

ggatatttcc ttgtacatag agttagtcaa ccaagagacc acaaggtcat tgcaacgtta 5760

ccactgtctg gctagaggag aaccttcagg aggtctgtga gaagtaccat taatgaaatc 5820

tagcttgtta cgaatagaca aggcaactag gacattacgt ctccaattgc cataacagct 5880

tccatcaaaa ggaccggaaa ctaaggaagt tcccagcacg tctgatggat ggacatataa 5940

ggggcgacag ggatgggtat aatcatcttc atggaaaatt aggcgtaagg gagtagaaga 6000

agtcgcatca gcactggtgt tattatcatt tgccattttt ttcaacagat tgtcaatcaa 6060

ccaacacaat acagatacac atatatagat tgtgagaaag cacgagagaa aaatctatat 6120

tattgatatt ctatttaatt ataatacaat gagccctatt tatacaatac atatcatact 6180

cctattctat gtgggactag gactaattca tattatgtac ataactatct aacactcccc 6240

ctcaagccgg tgcatacaaa tcatatgtac cgaacttgtt acatatgtaa ctaatacaag 6300

gaccagtaag gaacttggtg aaaatatctg caaactgatc atttgacttc acaaactttg 6360

tagcaatatc tcatgagagt atcttttctc tgacgaaatg acaattaatc tcaatgtgtt 6420

tagttctctc atgaaacacc ggatttgatg ctatatgaat ggcagcttgg ttatcacaca 6480

tcagttccat cttgctgacc tcaccaaatt tcaactaatt aagtaaatgt ttgatccaaa 6540

ctagctcaca agttgtcaca gccattgctc gatattctgc ttctgcacta gaccgagcaa 6600

ccacattttg tttcttgctc ttccaagaca cctaattacc tcctactaaa acacaatatc 6660

cagacgtaga acatctgtca aaaggtgatc ctgcctagcc agcatttgag tacccaacaa 6720

tttgctcatg gcctcgatct tcaaacaata atctgttacc tggagctgat tttatatatc 6780

gaagaatgca gacaactgca tcccaatgac tatcacaagg agaatccaag aactgactta 6840

ccacactcac tggaaaggaa atatcaggtc taatcactgt gaggtaattt aatttaccaa 6900

ccagccgcct atatctagca ggatcgctaa gcggctcccc ctgtcctggt agaagtttag 6960

aattccgatc cataggagtg tcaataggtc tacaacgtgt cattcctgtc tcctcaagaa 7020

tgtctaaggc atacttcctt tgtgagataa caatacatgt gctagactaa gcgacctcaa 7080

tacctagaaa atactttaat ctgcccagat ccttagtctg aaagtgctga aagagatgtt 7140

gtttcaactt agtaatacca tcttgatcat tgccggtaat aacaatatta tcaacataaa 7200

ccaccagata aatactaaga tttgaagaag aatgccgata aaacacagag tgatcagctt 7260

cactacgagt catgccgaac tcttgaataa ctgtgctgaa cttaccaaac caggctcgag 7320

gagactgttt tagaccatag agggaccgac gcaaccgaca tacaaggcca ctagactccc 7380

cctgagcaac aaaaccaggt ggttgctcca tataaacttc acctcaaggt caccacgaag 7440

aaaagcattc ttaatgtcca actgatagag aggccaatgg agaacaacaa ccatggatag 7500

aaaaaggcgg actgatgcta ttttagccac aggagagaaa gtatcactgt aatcaagccc 7560

aaatatctga gtataccctt tggcaacaag acgagcctta agtcgatcaa cctggccatc 7620

tggaccaact ttgactgcat acacccaacg acaaccaaca ataaatttac ccgaaggaag 7680

aggaacaaac tcccaagtac cactcgtatg taaagcagac atctcgtcaa tcatagcctg 7740

tcaccaccct agatgagaca gtgcttcacc tggatggaaa tagaggacaa agatgataca 7800

aatgcacaat agggtgatga cagacgatgg taacttaaac cgacataatg gggattagca 7860

tttagtgtag accgttcacc tttccggagt gcaatcaatt gactaagagg agacaagtcc 7920

gcagtattag caggatcagg tgcaggacgt gaatcagctg ggcctgatgc tgggcgcgga 7980

cgacgatgat aagttaggag tggtagagct gtagaaggtt gaactggact aggcagtgga 8040

actgaagcta tatgtggtgg aactggagct ataggtggtg gagctggagc tgtaggtgaa 8100

gatgaatggg agatagtgac tgaatctcca aaagatggaa ctggtagcac ctcagatata 8160

tctaagtgat tacctggact ggtgaagtat gattgggttt caaagaaggt aacatcagca 8220

gacataaggt accacctgag gtcaggagaa tagcatcgat atcccttttg tgttctcgag 8280

taacccaaaa atacgcactt aagagcacga ggagctaatt tatcttttct tggagtaagg 8340

ttatgaacaa aacacgtgct cccaaaggca cggggtggaa gagagaacaa aggtaagtgg 8400

ggaaacaaga cagagaatgg aacttgattc tggatagctg aagatggcat acgattaata 8460

agatagcaag atgtaagaac tgcatccccc caaaaacgca acggaacgtg agattgtatg 8520

agtaaggtac gagcagtttc aataagatgt ctattctttc tttcagctac ccgattttgt 8580

tgggatgtgt atggacaaga tgttttatga ataatcccat gagagttcat aaactgttga 8640

aatgggaaag acaaatactc taaggcatta tcactacgaa atatgcggat agaaacccca 8700

aattgatttt gaatttcagc gtggaaggtc tggaaagtag aaaacaactc agatcgattt 8760

tttatcaaaa atatccaagt gcacctgtaa taatcatcaa tgaaactgac aaagtagcgg 8820

aatcccaagg tagaactgac ctgactagga ccccaaacat ctgaatggac taaagtaaaa 8880

ggtgactgac tctgctcgat tatcaagacg gcgagggaaa tgggagcacg tatgcttacc 8940

gagctgacat gactcacact ctagagtgga caagtgagat aaaccagata ccattttttg 9000

aagttttgac aaactgggat gtcccaaccg tttatgtaat agatctggtg aatcagtaac 9060

aggacaagtt gttgaagaaa gacaagatgt aagtccatgt gattttgcaa gaataaggta 9120

gtaaaatcca tttaattcac gcccggtacc aatgatccgc cctgtactgc gttcctgtat 9180

aaaaacaagg tcatcaagaa ataaaacaga gcatttaagt gatttggcta agcgactaac 9240

ggctatgaga ttaaaaagac taacgagaac ataaagaact gaatctaaag gtaaggaagg 9300

aagtggactt acttggctta ttccagttgc catggtttga gactcgttat ccattgtgac 9360

tgttgggagt gattgagaat atgaaatagt aatgaaaaga gatttgttac caaaaatatg 9420

atcagatgca cctgaatcaa tgacccaaga ctcagaggtt gaagattggg agacacaagt 9480

cacactacta tctgtttgag caacggaagc tatccctgaa gatgtttgtt tacatgtttt 9540

gaactgaagg aactcaatat aatccggtag agaaaccatc caactcttcg tagtattgga 9600

ttccattttg ctacaaccaa tttctcaaat tcttgattac aacttgtgtg gttaaccttg 9660

gaatgccaaa tcagaacacc cctttttttt ttttggaaaa cattgttcac tcgctggaaa 9720

ataaaaaagg ttgccggaat ttgatgaaac ttgaatagac cgactcggaa taatgtccta 9780

agaaggctgt ccaaaaggag ttttgtcaga aactgaccag aaggaggtcc acgcaccggc 9840

gcgtggacag atctcgccga aaaaaaaaat cactttggtt ggcgcgtgat ggcgcgtggg 9900

tggggttttt ccggtcgggt tttgtggggt ttgctccccc ggagatggag aacactgtgg 9960

tggtgttggt ttatgcacaa cactggtaaa aagtggtttt gatgcgaaca gctactcagg 10020

tcaccaaaaa attgcacggt gacgactgat ttcttcccgg atgtcgttgg aatgacgcac 10080

aacgataatt atctcaccaa tgctctgata ccatgtgaga aagtacggga gaaaaatcta 10140

tattattgat attctattta attataatac aatgagccct atttataaga ctaggattaa 10200

ttcatattat gtacataact atctaacata gatcaaatag gcatgcaatt cacaataatg 10260

gtgaataaaa tgatacgaag ttacccagct cttttcgcga tcgaaaagga gaaaatagcc 10320

ttcaatcaca aacgagaaag aagaatctcc ggcttgacag tagacgactt cgaaacccta 10380

gctcgagatg aaaaccacaa aatccccaaa tcacattacc aaccaaacaa tttgagatca 10440

caaatgttga atatgtgaga atccgactaa gaaatcaaca aaaaatcaat agaaatggtt 10500

gaagaatacc gacttgaacc ctaaatgagt cagacatcac ctagaatgaa atacaccttc 10560

gaaattgacg aaaacaggac cggttgaaag cggagaacgt gccatagaag gatctacgct 10620

ctgataccat gtaaacttga catacttctc agattgagag tctgagagat tagaaaacga 10680

gtgtttccat tagaaagaga gaaaagagac ttctagatat ttcgattatc tgtgtaaaaa 10740

tgaatccgtt cctatacaaa aattaggcct tcattaaata caagattcgg ccgggtatta 10800

ctggcccaaa gtaaaatata aaaagaatca cccactatca aatgggccta gtctaacaag 10860

aaaaccaaca aatagtcccc cccccccccc ccaaaagata ccactgaaat gacaccgggt 10920

gcccaaaaat aaagcagctt acttcttgac tttgagagga actgcaatcc ttatcggttt 10980

gagaggaact gcaatcagct ataagtagct tattaatttc cagtgcctgc attctgccaa 11040

gtactatgat atatttctga agctttgttt ccccagttcc tttttcagac gtttgctgtc 11100

aataaagttg agccagccaa cttggctccc acaagctact aattttgtcc aagcttactc 11160

tatgggagaa gttaaatttc ccaaattcct tgagcggaaa atgaaaaatg gactcaaagt 11220

gtcatattat gcaactatct aaagaaaaat actcaattga agtttagata agaaaagtga 11280

atgtatattg atgtagtctc cgttaggtga gaagcgtatc acttacccag caacatatgg 11340

acctaacatt ttactagtga agttttcaca ttgtatcaaa agctcaacaa acggaaaggt 11400

gactaatcct aaaatgttat ttcacatata tgggcacacg gtttgtcaac cttctcatac 11460

gtgcattatt tgttctctat ctttctattt catccgatat aaccaatcgt tattgtaaat 11520

tctataatgc ctgtggttac ttttgtcttt agtgacaaat gacatttagg ataaccatgt 11580

agttattgac ttatttcact tgaggtctct tccaattatg tagtagtaga gtgttgagat 11640

atggatatgt taccttctaa aaaaaagagt gtagagatgc ggatagtttg ctagctggct 11700

tttgtctccc ttcaagttga attagcaaaa gcttgtctca taagttggat agctagacaa 11760

gaaaaactcc aaattacttt atgtagagta ttcttaagct tgagtcgcga gttggaaact 11820

ggaattatgt aaaaaaacct ggaattattt ggttgagcct gctttttagt tttgtcaata 11880

tttccagtat ctaacccaac atgtttagag tgattcccgg agagcctcag tacaaggcat 11940

ttgcagagtc tttatgagag tccaggaagg ggcacacatt ctgtagaggt atagtcttgt 12000

ccttattttc agggttgaac tagttcttta gaagttacct aggcttccta atttccaaat 12060

ttctgccagg tccttttttg gtgaagtact tgaagtttaa taaatcaaat tttaatttct 12120

aacatatcct gagaaattta ttcacaaatt caactggtga cttctgatgc agaaacataa 12180

gcaactgctt atgggttcat atgttcctgc aattttattg ttgacatgga ttggcttcat 12240

atggttttgt tcctgcaatt ttatcgctga cactaatcct ttcatatggt tttatgtgga 12300

gtgttaaata gaggttaaga gacaagaaga ggctgaaaaa ggtgggcagt tcatttgtta 12360

gtagactact ctatttacta agagatatga tgtcccatac attactcgaa ttggctccga 12420

atccagattc cacttctttg ccgagtttcc ttattgtaca tagttcgact cgtcaaggga 12480

aattcacttc ctttgactga ataatgctag tttgagtagt accttacatt aaatggacca 12540

tttagttcta tctacttgat agaatagact ggtcatcaac tagttgcaaa tacaatgaca 12600

actttgccat gtttgcagag tcacctgatg aagaagtacc tcaattagta gaacatttct 12660

tgaatgttct acagtattct ctatgcctac atgaccacat cacttttcct tttgcgttgt 12720

gagaacttga acttggtgag cgggggttcc ccaggaatgg catcttgatg gcagatgacc 12780

attctgtcct tgtcttagct aatgcttctt gcattgcctc actagattta ttataccttt 12840

aaaaaatgtt tgccattgtt ctgccataat agaaggatgt acccagctgg tgcttcaaaa 12900

ctaatgaaat gctttacaat tgtcgagtcc taaaggatga tttgtggaat cagatctcaa 12960

acaattcttt ttgaggaaga aaaataccaa aggttttttc tgtttgttgg aagattaaaa 13020

atcctttaaa tggtaaagat ttatgaactt aattcagcgt ttttgtggcc attgctggaa 13080

aagagaaaaa acaatggcac ttcttcgagt ttgcttatcc aaaaaaaaga agaagagaat 13140

gtcacgtaat gcaatttcat cttaggaaac tttgcaggag aaaagcaaga gtgataaaac 13200

agaactattt gtttttttta acaagttgtt gtgacctatt tcttgtcatt cttatttgct 13260

aataagctaa tgtactatag ttcctgtact atggtttgtt ttgacttaat acggggatgt 13320

tcaatgagca ttttcttgtt ttttctgctt tcagcatctg ctgccttaca ggaattcatt 13380

ttctggaaat ttacttcttg ttctgctaac attttcctgt tatatcttgt cagtcatttt 13440

ctctccatgg ttatactgtt tgtgtcactt taaactctcc ttgttttcta ctttaaagga 13500

tttaatgctg ctgtcggggg ctgtttcttt gctgtggaat ctgtgttatg gccatcacct 13560

gcagagtcct ccttgtcctt aacaaatacg acttcaatgg ttattctcag tgctgttata 13620

gcttctgtag tctcagaaat tggtcttggc tctgaacctg catttgcggt cccaggatat 13680

gattttcgta cacctactgg taattttgga cttctttctc gagtttgatt cttaaataca 13740

attgtacccg tcacttacag caacaactac atttcaacag ctagttgggg ttggctacac 13800

agatcatcac tatccatttc aattcattta gtcccatttc tttcgaatat tgagtacttt 13860

gggattctat aatatcaagg ttctttatat tttctacttt gacgtacaaa tctctaaata 13920

gattaaagaa gactcctaga gacactggcc taatgcaaat gtaccaccat gaataaactt 13980

taatctgaaa tagctggtat cttatataag gacccttagc tttaattgtg ttctatattg 14040

atcttttggg acaacttcct tccaatatta tgtcttactt atacagttat acttatcctt 14100

aagccttact ctttagagtg gttatcccta attcaagctt ttgttggcac catagctagt 14160

ttggttctaa gtaaaaagtt actctttaga gtggtaactt tttgtcaatt ttcttagtga 14220

aaatataacc tctgtgacaa atctaccaag tataaatcca atttggttct atgtcatcct 14280

tgtagtttat ccaagtcaat gctccatcac tcttacaaag gttcatcgta tgactaatct 14340

tttttggaga aaggtaacag tttgtattga taataagatc agcgccaggt tggtcattag 14400

tgctaatagc tgtacgtaca actccaaaag agcaaaagac aagcacctga tgtaaggtaa 14460

attacaagct gcctataaaa tctatcaggt gtcctatctc actaaacatt tcttgtttac 14520

accaaaaaaa taaaacaagg aaagacaatc catcttaatc ttctgaatgg agtttctttt 14580

tccttcaaaa catctggagt tccttccgtt ccatgcaatc caccatatac aagctgggat 14640

gattttccat ttgtctttat ccatttcttc taccaattcc cttccaattg attagaagtt 14700

ccaatgtggt tctagatatg acccaattaa ctcccaacag ataaaagaag atgtgccacg 14760

gatttgtagt gattctgcaa tgtaggaaca agtgagcatt actttctact tcctgtccac 14820

aaagaaaaca tcttgagcaa atctggaaac ctcttctttg taagttatca tgtgttaaac 14880

atgccttttt caccaccaac cagacaaaac atgatacttt gggaggagtt ttaaccctcc 14940

aaatgtgttt ccaaggccac acctcagttg ttgaaacatt aggatgtaga gtccagtatg 15000

ctcttttact gaaaatgcac cttttctatt cagcttttaa actactttat ctatggtctg 15060

tgatgtaccc ttgaaaggtt caagagtttg gaggaagata gaaactctgt ttatctccca 15120

atcatccaaa gatcttctaa agttccagct ccatccttgt gagctccaga ctgacttacc 15180

aatgcttggc tttgaagact tagagagaat aagtcaggaa aatatctttc aaccttcctt 15240

gccctatccg gtgatcttcc caaaaagatg tctgcaaccc attgccaata ttgatcttga 15300

tattgctact gaaagatttc ttttggtggc aggattactc tcattaacaa tgtacttgac 15360

aatctccata catactaatg tctctttacc ctcttgccat taaggttgta aagagacttg 15420

tcaaattaag aaaaggtttc ctatggaact gtttcaagga aggaacctcc tttcctttgg 15480

tcaagtggag ttaagtcata taatctagga agtggaggct tgggtatgaa atagctgcaa 15540

atacagaaaa ggagcatctt atttaaatga tcacggaaat gtgcccaaaa ctttaaatat 15600

ctgcacagca tatggttgta gcaaaatttg aatcttcctg tcaatggtgc tcatgtccag 15660

tgaatacccc tgatggtgaa agtgtcctga agggaagcag gaacttattg gaagaattgg 15720

catctaacac tcagcttttc ggtgggtcat agcccattga aaattgagtg cccagattta 15780

tatagttttg ctctaaactg acgatgcagt tgcacaacat acgacaaact aaggtgggac 15840

atcatcttct tcggaaggaa ttttgaggat taagagatag agtggttgat tcagttgcaa 15900

atgaagcttc aagggttcaa tatcatccag gagacaccgg attctgatag ataaaacaac 15960

agaaagatga gcactacttt gttaggcttg ttacaagttg ctatcgtctt tcttatctcg 16020

gtacacaatt tagatttggg aacttagttg gaaaagcaga gtggttgttt ttgtgaatag 16080

catcagacaa agcttctgag ctggtacgac agaaaactca acagggagaa tagaagactg 16140

tggttcacaa tttctgcatg catcttgtag gttatttggt gggtaaatta tttaatgttt 16200

tgaagggaag gtagaacatg ttcataggct tagattcaaa tgtttgtatt tttttggctc 16260

tttggtgaga gatgctgaac gtaaatgaca taggcagctg actataattt ctcagctcct 16320

tgctttttaa attgacaggc actgatatgt acatgtgaac atccaacact tttgtggtgc 16380

cgttccgatg aataaagaac attaatcact tactgatcag gagtaatagt ttaggagttc 16440

tagaattttt gtacataaaa tgaaccaaaa agaagatcgg aatgagaaca tgtttctttt 16500

tttgtttttt ctttttcgtg aaaacttcaa taacacttct gatagaatag ctaggtccat 16560

ttgaattcct ttggagaccc ttacacaacc aatgaatgac aagtatagca tttctaactc 16620

cctcccacac gtataaccca gattttaggg tttagatgtg gatctgattt gaccttattg 16680

cctttttttg tttttgttct ttttgaagta gagagtgagg aggctcaaca attaattcgg 16740

ctcaacgggc taatgattgg acttacatgc tacgacaatg ttaggagaga gagagagaga 16800

gagaagccca gagcagttac atgagttaag aaagagaagt ccaaagcgat agaatatgaa 16860

gagagaaagc ggttgtgcta acaggctccc tgaagtttgg ctctgagcat ccaactcaaa 16920

accttaaggc aatgagtaga gtagcccagg accatttaaa ttgctgttga aaaccttaca 16980

caaccaataa gggaacaagt gtaacattct cttacaaccc taccgtctta taagtcagtg 17040

ctctaattta gcataaaatc aaagtgaggc gatctacaat gaaatgaagt aaataactga 17100

taaatacaaa gaatgttaat tctccaatat agcctgaatg ttcccagaac aaaataaact 17160

agtctcagga tttatcatta acatgatgtt cctcttattt tgagtgatta ggaaggttaa 17220

tcaaggtata aattctttct aatttgtatc gtctagaatt atttatctaa caaattttca 17280

gattaccggt tcaaaagagg aatatatttt gcatacaacg ttaccatacc ttacaaaagg 17340

gagatgaaca tttttttatt ttattattgt cctttttttc aattagggat tatgcagtct 17400

tcctccacgt gatattactc ttagaatcac gtttttgtca ttgctattac ttaatgtggt 17460

aagtacaaat gtgttttgaa ctctttttgg tatgtaatat tgagttaatt tttggtttcc 17520

atttcagagc tgccgcttta tcttctgctg ggcatctttt gtggcttagt ttcagtggca 17580

ttatcaagtt gtacatcatt tatgctgcaa atagtggaaa atattcaaac gaccagcggc 17640

atgccaaaag cagcttttcc tgtcctgggt ggtcttctgg ttgggctggt agctttagca 17700

tatcctgaaa tcctttacca gggttttgag aatgttaata ttttgctaga atctcgccca 17760

ctagtgaaag gcctctccgc tgatctgttg ctccagcttg tagctgtcaa aatagtaaca 17820

acttcattat gtcgagcctc tggattggtt ggaggctact atgcaccatc tctattcatc 17880

ggtgctgcta ctggaactgc atatgggaaa attgttagct acattatctc tcatgctgat 17940

ccaatctttc atctttccat cttggaagtt gcatccccac aagcatatgg cctggtatga 18000

atttgtcttt tgttagaagt agcattacat atctggataa gtgagttttt tattattgaa 18060

aagtaataac aggagagcaa gagaatatag cacccaaatc tacttctttc ctctcttcta 18120

ttcttctgaa attcaaggtc ctttaactcc tccacggcct gtctagttat tgatcctgta 18180

gacttaattc acataggttt aggacattca agtttatcca aacttcgtga aaaggtttct 18240

aattttttta cattacagta tgagtcgtgt ctacttgaga aacatatcac tccatgtttc 18300

tatagagtct gttttctcct cagtttattt tgatatatgg ggtcctatta agacagttca 18360

accttggatt ttcattattt ttgttgtttc attgataatt attcaagatg tacttggatt 18420

ttcttaacaa gagatagttc tcagttgttt tttgtgttcc taagtttttg tgctgcaata 18480

caaaattagt ttgatgtctc tatttgcatt tttcccaatg ataatgcctt agaatatttt 18540

cttctcggtt tcagtagctt atgatttctt tagaaactct ctatcagaaa tctcaactga 18600

gatagatgag aggaagaata agcatatcat tgagacggct cgtacccttc tcattcagtc 18660

ccctgtcaag cttagtttct tgggcgatgc agtttcacgt cctttgatta gattaattgg 18720

atgcctcatc tgctatccaa aatcagattc aactttcgat attgtttcct cgcttacctt 18780

tatactctct ttccctcgag tctttgggag cacatgtttt gttcaataac atagctcctg 18840

gaaagtgacc agcgcaaccg acaagcaagg ccttcttaat atagaaggag ggcatatgct 18900

attctagcca cgagggagaa agtaatattg taatcaaacc caaatatctg agtataacct 18960

ttggcaatgg cgatcaattt gattatatgg accaactttg cctacatata cccaccgata 19020

gatttacggg gaggtagaga aataagctcc caagtaccac taatatgtaa agcagacatc 19080

tctttgatca tagcctgtcc ttgtggacat agggatagaa attgaggact aagatgacac 19140

aaaagcataa tgctgtgatg ataaacgatg ataactcaaa tcaatatgat ggggatggga 19200

attaagagtg gattgaatat ctttgcggaa tgtgattggt agactaggag gagacaagtc 19260

cgcaataggt aaaagatcca gtacatggaa tgaatcttct ggacatgatg ttggactgac 19320

gtcaatgata agtcaagagt ggtggagttg cagaacatgg aactggagct gtaggtgaca 19380

taatcgaagt tgtagggggt ggagctatag aggaaggtga aggagagata gtgactgaat 19440

ctccaaaata tgaaaccggt aatacctcaa aaaatgtcta agagatcatt tggacctatg 19500

aagtatggtt gcgttttaaa gaaggtaaca tcagcagaca taaggtaccg cggaaagtca 19560

ggtgaataac attgatatcc ttgttgcgtc ctcgagtaac ttagaaatac atatttgaga 19620

gcacggggag ctaacttatc ttttctggag taaggttata aaaaaacaca tgctcccata 19680

gacacgaggt ggaagagaga aaggtgagtg gggaaacaag acagagtatg aaacttgatt 19740

cttgatagtt gaagatggca tacaattaat aagacaatag gatgtgagaa ctgtatcccc 19800

acgtaaacac aacagaacat gagattgtac gagttgggta tgagcagtct caatgagata 19860

cctattcttc ctttcagcta tcccatttta ttgagatgtg tatggacaaa atatttgatg 19920

tatgatccta tgagagttca tgaactgctg aaatggagaa gacaaatact ctggggcatt 19980

atcactatga aatgtgcggt tagaaacccc aaattgattt tggatttcag agtgaaaggt 20040

ctgaaaaata gagaccaact cagattgatt tttcatgaga aatatccaag tggacttgga 20100

ataatcatca atgaaactga caaagtagca gaattccaag gtagaactaa ctcgacaagg 20160

acctcaaaca tctgaatgga ctaaagtgaa aggtgactct attcgattat caagacaccg 20220

aggaaaatga gagcgagtat gccttctgag cggatatgac tgacgctcta gagtggacaa 20280

gtgagacaaa ccaggtacca ttttctgaag ttctgataaa ttgggatgtc ctaaccgttt 20340

atgtaataaa tctggtggat cagtaaaagg acaagctgta aggggacaaa aataccaaat 20400

atttccagaa gatggcaaac tacaacagaa gaagcaacta cattaacagg ctcaggatat 20460

gtgatgaaat gaggacaaag agttgatcaa gaaggagatt ctggaattct accagaactt 20520

atatagtgaa aatgaaccgt ggaggcccag tgcaaatttt gaaggcatct cctcactaag 20580

catagaagag aagaactagt tggaagctcc atttgaagaa atagaggtgc ttgaagcttt 20640

gaaatcatgt gcccctgata aagcaccagg tccagacggc ttcaccatgg ctttctttca 20700

gaaaaattgg gatactctta aaatggacat catggccgca cttaatcact ttcaccagag 20760

ctgtcacatg gttagggctt gcaatgccac cttcatcgcc ttaattccaa agaaaaaggg 20820

tgctatggag ctcagagact acagatctat tgacaaacta gtctcggggg aacaaaatgc 20880

tttcatcaag aacaggcaca tcactgatgc ttccttgatt gccagtgaag tgctggattg 20940

gagaatgaaa agtggaaaac caggcgtgtt gtgcaaactg gacattgaaa aggcttttga 21000

tcaattaaga tggtcttacc tcatgagtat cttgaggcag atggctttgg ggagaaatgg 21060

ataagatgga taaactattg catttcaact gtcaagaact ctgttttggt gaatagtggc 21120

ccgaccggtt ttttctcctg ccaaaagggc ctaaggcagg ggatctcctc tcccctttcc 21180

tattcatttt ggcgatggaa ggactcacta aaatgttgga gaaggctaag caactacaat 21240

ggatacaagg ctttcaggtg ggaaggaatc ctgccagctc agttacagta tcccatctac 21300

tctttgcgga tgatactctt attttttgtg gtactgagag atcacaagca cgaaatctca 21360

acctgacgct gatgatcttc gaggcactat caggactcca caacaatatg ataaagagca 21420

tcatataccc tgtgaatgca gtccccaaca tacaggagct agcagacatc ctatgctgca 21480

aaacagatac tttcccaaca tatcttggac ttcccttggg agctaaattc aaatcaaaag 21540

aagtttggaa tggagtccta gagaagtttg aaaagaggct tgcgacttgg cgaatgcaat 21600

acctctccat cggtggcaag ttaactttaa tcaatagtgt actggacagt cttcctacat 21660

accacatgtc tttgttccca attccaatct cagtcctaaa gcagatggac aaactcagaa 21720

ggaagttctt acgggaagga tgcagcaaaa cacacaaatt tccactagtg aaatgactca 21780

aggtaactca accaaaattc aaaggaggct tgagcatcag ggatctacaa gcacacaaca 21840

aagctatgct cttaaaatgg ctctggagat atggacagga ggaatctagg ctatggaagg 21900

acatcatagt tgctaaatat ggagcacaca atcactggtg ttccaagaaa acaaacactc 21960

cttatggagt tggtctgtgg aagaacatca gcaaccactg ggatgaattc ttccaaaatg 22020

taactttcaa agttgggaat ggaactcgta ttaagttttg gaaggataga tggctcggaa 22080

atacaccttt gaaagacatg tttcccggta tgtatcagat tgccttgacc aaagactcca 22140

ctgttgctca aaatagagac aatggcactt ggtgcccatt ttcagaagaa atttgcagga 22200

ttgggaggtc aacagcctac tcacaatgtt aagctcccta gaaggtcata atatcgaaga 22260

tcaacagcct gacaaactta tttggggaaa ttctgagaga ggcaagtaca cagtcaaaga 22320

atgatacatt cacctctgtg accagaatcc aataatagat aactagccat ggaaacacat 22380

ctggagaact gaagtgccta ccaaggtgac ttgcttcaca tggttgactc taaatggggc 22440

atgtctcact caagacaact taatcaagag gaatatcata ctagttaata gatgctacat 22500

gtgccaacaa cagtcagaaa gtgtaaacca cctattcctc cactgctcag ttgcaaaaga 22560

catttggaac ttcttctaca ctacctttgg tctgaaatgg gttatgccac aatcaacaaa 22620

gcaagctttt gaaagttggt atttttggag agttgacaaa tccatcaaaa aaatctggaa 22680

aacggtgccg gctgcatttt tttggtgtat ttggaaagaa aggaaccgaa gatgttttga 22740

tgacatatta actccactct actccctcaa ggctgcgtgt ttagttaact tatttagttt 22800

tgtggatttt attagctccc tgatagtagc ataggctttt gtaaatggag ctaattatcc 22860

tatctctttt gtactctttg catcttcttg atgcctttta atgaatctaa tttacttcat 22920

aaaaaataaa aggacaagtt gttgaaggag gaaaagatgt gagtccatgt gatttagcaa 22980

ggataaggta ctaaagtcca tttgattcac gcccggtacc aatgatccat cccgcattgc 23040

attcctgtat taaaacagag tcatcaagaa ataaaataga gcaaataagt gattggccaa 23100

acgactagtg gatatgagat taaaaggact atcgggaaca taaagaactg aattcaaagg 23160

taaggaagga agtggactag cttaacctat tccagttgcc atggtttgag aatagttggc 23220

cattgtgact gttggaagtg attgagagta agaaatagta gtgaaaagag atttgttacc 23280

agaaatataa tcagatgcaa ctgaatcaat aacctaagag tcggaaaaag aaacacaagt 23340

catgttatta cctgtttgaa caatagaagt tatctccgaa gaggattatt tacatgtttt 23400

gtactgatgg aactcaatat aagccgataa agaaaccatc cggatattca aagtattgga 23460

tcaacagctt ataagccaaa agcatccgat acgagtgcca ttataatgga tcaagagaga 23520

tcaaacaaca aatcaccaaa tatcataaac aaccaagaat ctcgctggaa tgtgaacaaa 23580

gattgaaaaa caacaatgta gctcgccaaa aatgtgcaaa gtgatcgaaa aatattgaat 23640

cgtgagtgga gagaaatagg agcttcaatc gacccacaca gtaccaaaaa atccaaaaac 23700

ggttgtcgga gctcaagaaa gttgtcaaaa agtatattgt atgcttcgaa agtagccgaa 23760

aaaggttgga agtgggatgt gtcaactccg aattatgata cgagcaccac agaagatcaa 23820

tttgtgtcaa aactaccgaa aaaaatactt cacaccccga cgcgtggagt actcgctcgt 23880

tggaaccctt gctgccaacg tcgcatgtag gatcagtttt cgaagaatct tattggggtt 23940

tggtcgccgg acgatgtcgg atcttgtggt gccgttggaa ttcgcacaac cctgaaggaa 24000

aagaaggtta cacaaatcag atctgaaagt caccgaaaag acacatggcg attgactttt 24060

ttgtctcaga tgtttctcac cgtcgctctg ataccagttg ttgggctcaa ctcgtttgaa 24120

gatactctta acatagtgtg atattgtccc ttttggaatg tgagtcatct tagctcggta 24180

agcatactcg ctcttccaac tagcccgaag atacttttaa cagagtgtaa tattatctgc 24240

tttgagccaa gctggcgcgg ttttcatcaa aagacctcat actattaaaa gatccataca 24300

ccttatatgt aggcttctaa gttgctcgga cacgggtgcg agtacccgac acaggtgcaa 24360

atctagaggt cagatccttt aaaatgtaaa ttctaagatt tggggatacg aatcctagta 24420

cggatacggg tgcgaggatc cgattaaaaa taattcaaaa aaataagaaa ataaaaaagt 24480

ctctaaatta tgtgaaattt tgtggaataa ctacgtatag cttgtaaagt gtggatttat 24540

tttttattct caagttgtag ataagtaaat gattgatttc ctagataagg tatgttattt 24600

tcttcaaatt taccctagtt tggttcgaat ttcgggaaat tgtatcttgt ctcgaatttt 24660

tccttctgtc ctgattaaac tactcaaaat cgtctgacca gatccggtac ggatcccata 24720

cccacatcca cactagtgtc gtgtggacaa gggtgcggca cctaaacttc cgtgtaggag 24780

caatttaggt aggctcctaa tcttttcagc tattaatgtg ggacttttac gcacctctat 24840

caaattcccc aataaactaa gtttcacgtg gtccatcatc gcaatccacg ggtctcttcc 24900

tctagttaag tcccacatgg cccattacca tgatccacgg gtcaattttc gtgattcatc 24960

gtgtgccacc cacatcgtta gtatttatgg taactaaagt acgcaactag cttttgcttg 25020

tgagcgtgtc tccaagctcg taaaggtaag aaaaccgagc cgcatattcc atcactctat 25080

catcaccata ctcgtcccgc gaaacttgta agataaaggt ggctggttgg tcagttgaac 25140

tacctcagag tgacttggta tagtatttcc tttcttgtga atatttaact caattatgga 25200

ctctctgtgt gatagtcatt gagagccatt ttctatatag ccggtgcaca caaatcatat 25260

gtaccaagct tgttatatat gtaactaata cgaggaccag tgaaggactc ggtgaaaata 25320

tctgcaatct ggtcattcga catacaaggc caatagactc cccagcaata aaatcagggg 25380

gttgctgata aatagaattg gccgaaatgt tgccagaaaa atttgaaaat agtgagacta 25440

agccgaattc tacactacaa aataggtttt aaaacacaac cagaaaacaa aaactttttt 25500

ggaaattact gttcacatcg aaaaaataaa agttgtcaga atttgatgta atttatatgg 25560

ataggctcgt aatcactgga cgagtaagtt gtcctgaaga agttttgtca aaaggtggcc 25620

ggaatggctc acacatgccg gaaaacttat tgtagctcgc cggaacccta gttctggcgg 25680

tgcgtagagg cgtgtgactt tctgccagac tgattgactg tggtttgtcg cctgactttt 25740

cctaacaaga tggtagtatt ggttttcgca caacaattac cgatgaggag ataacgcaaa 25800

tcaatcttga gtcgtcaatc ggaaagacgc acggtggctg actttctatt tagatgggac 25860

tggaatttct ggagtttaat cgcacaagcg ttttggatct gatggtaata ctggtatgca 25920

cagtaccact gtagcagtga tgaaccctca aaataagaca aagttgccag aaaattgcac 25980

ggcgatgaga tctttcttcc ggatgtcacc ggaatgacgc acaacgataa tttctcactg 26040

aagctctgac accatgtgag aatacacggg agaaaaatct atttttatta acaatgatac 26100

aatgagccct atatataata catattctac tctactacat atgggaatag ggcatatttt 26160

actcctacta catatgagac taggactatt tacacataac tatctaacaa gggctatatc 26220

tcagatttat gagaatatct acccaacgac ccagagagac gagcctaatc attttgcagt 26280

ggcacagact ataacaacaa aaaacctact cataatggtt aaaccaactg attaagatgc 26340

ttacaggact atcttgagaa atgtacatat tatatagatg cttgagttgc gtcccaatcc 26400

taaatagaag cttttattcg taagcaagaa gggaagcagc tttacttgag ccaatagctt 26460

tcaaggtgca tgttgtcaca ccaaggacat ccagaatttg attttatagt gggaatatcg 26520

tttaaagata aaaaagatag cgtgcagaag attgcataca ttagagatgc aaaatacgga 26580

atacccatac tcccagataa tgcagtatgc cttttgcatg acctactggt tgaatggaag 26640

cacctggtga atttactagg tgtgttagtg atttctgctg cttccttccc ctttctaaac 26700

tgcatactat ctaaaatgtt aggggggcag aagcccagtc aatctgacta ggtgatgtta 26760

gtggtttccg cttcttcctc ccacttctaa atgcgtactt tctcaaattt aggagcatag 26820

aaacttaagc agctgcctac ctgaggagtt gcatgggaac ataagagaat agactttacc 26880

tgtcatattt tccatacctt agttaattac agtgttatcc tgataatgat ctgttttctg 26940

gatctaggct gaatcgagat tcaatcgctt ttggttgaaa ggatgctgct acagatcctt 27000

agtttacatc attttggttc ttattctata agtacttccc ctatcaacta cttccttctt 27060

ttttcttagg ttatttgcct ctttaggttg tttggaagga aaggaacagt agatgttttg 27120

atggaatagc aactccaaac cacttcctta aggctaatat cctgattggc caagtttctc 27180

caaagtccaa aacacttttt ttttccttca aaaaagtacc tttttttttc aaagttgagg 27240

tgtttggcca agcttttgga aggaaaaaaa gtgtttttga gtagaagcag atgctcttga 27300

gaagcagaag aagtagcttc ttcccggaag cacttttgag aaaaataaat ttagaaacac 27360

tttttaaaag cttggccaaa cactaattgc tgcttaaaag tattttcaga tttattagac 27420

aaacacaaac tgcttctcac caaaaatact tttttgaaaa gtacttttca aacaaagcac 27480

ttttcaaaat aagtttttta gaagcttggc taaacaggct ataaatgtct tttattttta 27540

cagctggagt accctaacac ctgtaaattc ccctatacat ttttttcgac tttggtagct 27600

cattaaccct agtataggac tctttgtttt ggagctagca aactcttttg ttttcctatt 27660

tttgcatctt cttggtgcca tttataatat ctcttcacca aaaaaaaaaa gttcccaaac 27720

tatgactacc ttgagttggt caaagcataa ccaaagcatg ggcacaccag tgtttgcgtg 27780

aattttatgg atgttcctta cctttatcct tctgtgctta tgtagcatct gtcttggtca 27840

atcttttctg aagtctatat tgtatttctg tgttgcaaca tgagtttact gttaatctta 27900

ctgtttgacc tcaattttgg gttctttttg attttggaag acatcgttta acaggttggc 27960

atggctgcta ctcttgctgg tgtctgtcag gtgcctctca ctgcggtttt gcttctcttt 28020

gaactgacac aggattatcg gatagttctg cccctcttgg gagctgtggg gttgtcttct 28080

tgggttacat ctggacaaac aaggaaaagt gtagtgaagg atagagaaaa actaaaagat 28140

gcaagagccc acatgatgca gcgacaagga acttctttct ccaacatttc tagtttaact 28200

tattcttcag gttcaccttc acagaaagag agtaacctct gcaaacttga gagttccctc 28260

tgtctttatg aatctgatga tgaagaaaat gatttggcaa ggacaattct agtttcacag 28320

gcaatgagaa cacgatatgt gacagttcta atgagcacct tgctaatgga gaccatatcc 28380

ctcatgctag ctgagaagca atcttgtgca ataatagttg atgaaaataa ttttctcatt 28440

ggtctgctga cacttggtga tatccagaat tacagcaagt tgccaagaac agagggcaat 28500

ttccaggagg tagcttcttg gtacatttca atattcttaa ctgatgaaaa aataagggaa 28560

attgatctag catgaaatga agctaattat aagttttaca cagtagaact ggtaaaacag 28620

ggttggctgg atatttcttt gttgaatttt taggattata tatattgttt tagttttgta 28680

ggttgttttc tgatgtgctt tttgactcgg cagaatctta agatgaaatg gaaggttgta 28740

tcatcaaatg ttaaataagg gaatatgtga ctttcaaagt taagcacgga gtattttgga 28800

gtcaatagtt acttcctgaa tcttttagga tggaggagac agtttctata ggaataggaa 28860

aaggggacct gatttcatta tttgtgtgta tatacatttg ttatctgaat tcgcattact 28920

ttctaacaac caacaaaagg aaagtggaca ttcaatttga gccggaggga gaaaatttaa 28980

ctagaaaatg acctggccgt gaaataaaat tattgatccg tcctttaact agttttcatg 29040

gattgcctcc ttgcggatga tttttccaac cggtagaact actgttagtc gtccaaattc 29100

tgacccccta ctatgaataa aaatgtatta gtaagtttag tgggtaatct ccttgagaaa 29160

taaaggaaca ggagaaatat tttattgata tatgctaagt gttttacaat agccctattt 29220

atatacaatg tttacataaa cctaaagcct tctatataaa tgtgggacac tatacatgaa 29280

ctaactctaa cactatccct caagctagtg catataaatt atatatatgc ttgttacata 29340

tataattaat ttctctactt tttggtatac ttcttgtata cgggagttat ctcccttttg 29400

attaatacaa tttaccttat caaaaaaaaa ttaatacgag gaccagtgag ggacttggtg 29460

aaaatatctg caagttgatc atttgacttc tcaaactttg taacaatatc tcctgagaat 29520

cttctctctc gtgaagtgac agtcaatctc agtgtgtttg gtcctctcat ggaacactgg 29580

atttgatgca atatgaagga caacttgatt atcacacaca agttccatct gactgattgc 29640

tccaaatttt aattatttga gcaattgttt gatccaaact agctcacatg gtgcaagagt 29700

catgactcga tattcggctt ctgcgctaga tcgagcaact acattctgtt tcttgctttt 29760

ccgagagaca aattacctcc tattaaaaca caatatccag atacgtaacg tctatcagaa 29820

ggtgaccctg cccaattagc atctgtgcgt ccaacaatat gctcatggca tcgatcttcg 29880

aatattagtc atttgtctgg agctgatttt atataacgaa caatgcgaac aactgcatcc 29940

caatgactat cgcaaggaaa ttccataaac tgacttacaa cactcacagg aaataaaata 30000

tcaggtctag taattatgag gtaattcaat tttccaacca ggcgcctata ttttgcagga 30060

ttgctaagag gctcccccct atcctggcag aagcttagca ttcggattca taagagtatc 30120

aatagttctg cagcccatta ttcatgtctc ctcaagaatg tctaaagcat acttcctttg 30180

cgaaataaca acctgaacta gaccgagcga cctcaatacc tacaaagtac ttcaatctgc 30240

taaggtcgtt agtctggaag tgttgaaagt gatgttgttt caaattagta ataccatcct 30300

gatcattgcg agtaataaca atatcatcaa cataaaccac cagataaata cagagattag 30360

gagcagaatg ccgataaaat acagagtgat cagcttcact attagtcatg ccaaattccc 30420

gaataattgt cctgaactta cgaaactagg ctcgacgaga ttgttttaaa ccatagagac 30480

ttgcataagt gacatacaat acctctagac tccccttgag caacaaaacc aagtggttgc 30540

tccatattaa ctttatcctc aagatcacca tggagaaagg cattctttat gtccaactga 30600

taaagaggcc aatgatgaac aatagccatg gacaggaaaa ggcgaacaga tacgacttta 30660

gccacgggag aaaagtgtca ttattatcaa gcccaaatag ctgagtatat ccttttgcaa 30720

tcagacgagc cttgagccaa tcaacctggc catccaggta gactttgact gcataaaccc 30780

aacgacaacc aacagtagac ttacttgaag gaagagaaca aactcccatg taccactcac 30840

tcacatgtaa agcaaacatc tcgtcaatca tagcctgtcg ccatcctgga tgagatagtg 30900

cctcacctgt aaacttagga atggaaacag tggacaaaga tgatacaaaa tcataatagg 30960

gtgatgagat gcggtgataa cttaaaccaa cataatgggg actaggatta agtttggatc 31020

atacaccctt tcgaagtgca atcagtggac taggaggagc caagtccgca ctagacgtgg 31080

atgacaatga taagtcaaga gtggtggcct cgtggttgga gatgtaggat gagcaactgt 31140

agactcctca gaagtcggta taggtaggag tacctgtgat gttgatgtgg atttaagagg 31200

aggaacaata gattcctcac aagtagatac aggtaagacc tcagatatat caagatgatt 31260

agatgaagta aagtaaggtt gagactcaaa aaatgtgaca tcgactgaca taagatatct 31320

acgaagatca ggtgagtagc agcgataccc cttttgaacc cgagaatagc caagaaagac 31380

acacctgaga acacaaggag ctattttatc tttttcagga gctaagttat gaacaaatgt 31440

actccttaaa acactaggag gaaagagtat aaagatgacc tagggaacaa tactgagtgt 31500

ggaaactgat tctagatgga agatgaaggc atccgattaa ttaagtaaca ggttgtaaga 31560

actgcatcgt cccaaaaacg ttgtggaaca taggactgaa tgagaagtgt gcgagcagtt 31620

ttaatgagat acctattctt tctctctact accctataat gttgaggagt atacagacat 31680

aggataatat tttgagaagt cataaactat tgaaactaag agaatacata ttttaaggca 31740

ttatcactac gaaaagcgaa taaaaacacc aagcggagtt ttaatttcag cataaaaact 31800

ctagaatatt gaaaacaact caaaacgatc tttcatttgg aaaatccaaa tacatcttga 31860

gtaatcatta atgaaactaa caaaatccaa atcttaaggt tgtgactcta ctaagacccc 31920

atatatcata atgaactaaa gacaaaacag actctacacg actcttagca cgacgtgaaa 31980

atgtagctcg aatatatttc ccaagttgac acgaatcaca atctaatgtg gacaaaccag 32040

acaccatctt ctgaagcttg gataaactcg gatgtcctaa acgtttgtga attaggtcta 32100

gaggatctgt agttggacat gttgtagagg gattgagtga gttaagatag tcaaggtctt 32160

gtgattcacg ccatgtgcca atcgtctgta ccgtactgcg gtcctgcata gtaaaagaat 32220

catcaataaa atatatatca caatggaatt cacgagtcaa atgactaaca gatgcgagat 32280

taaaggacaa ccggggacat aaaaaataga atctaaagtg acagaggaca tgtgattagc 32340

ttgtccaact ccttttgctt ttgtttagac ttcatttgct aaagtatcat tgggaagaga 32400

ttgtgaataa acaattattt gacaaaagtg acatattacc actggggtat caagttgctt 32460

agtcatacta agaatgtttg ggagagggtg gtggaagtga gggtaaggag gacagtgtct 32520

ctatccgaga accagttcgg attcatgcat gatcgttcaa ctgcggaagc tatccgtctt 32580

attaggaggc tggtggaaca gtacaaggat aggaagaagg atttgcacat gatgtttacc 32640

tagagtaagc gtatgacaag gtccctaagg aggttccttg gagatgtcag aaggttaaag 32700

gtgttccggt agcatatact agggtgatga aggacatgta tgatggagct aagactcggg 32760

ttaggacaat ggaaagagac tctaagcatt gtttggttgt tatggggtta cagtaaggat 32820

ctacgctcaa accgttctta tttgccttgg cgatggacgc attaacgtac catattcagg 32880

gagatgtgcc atggtgtatg ttattcgcgg atgatatagt tctgattgat gagacgcgag 32940

gcggtgttaa cgagaggttg ggggtttgga gacagaccct tgaatttaaa ggtttcaagt 33000

tgagcaggac taagacagaa tacttggaat gtaagttcag cgacgtgacg gaggaagctg 33060

acatggacgc gaggcttgat tcataagtca tccccaagag aggaagtttc aagtatcttg 33120

agtcagttat acagggagaa gatggggaga ttgacaagga tgtcacgcac cgtattaagg 33180

gcggggtgga tgaaatggag gttagcattc ggtatctttt gtcacaagaa tgtgccacca 33240

aaacttaaag gtaagttcta tagagcggtg gttagaccaa ccatgttgta tggggcagag 33300

tgttggccag tcaagaattc tcatatctag aagatgaaag tagcagaaat gagaatgttg 33360

agacggatat gcgggcatac tacgttggaa gattaagaat gaaaatattt gggtgaaggt 33420

gggcgtggcc ccatggaagt tgtgcccacc attaaagact gctatctgaa aactaattct 33480

ttgggcccaa acattctggc ccaaagtacc tcgtgaataa taatattgag ctcatgtctg 33540

acatgttgga agaggagtta ctagcaaaca cttatacacc tatgttggta acacaattga 33600

agaactacga aaaacactct tctgcaaagg aaaatgagaa gaagaagaag aagaagacga 33660

agaagaagga tgatgcaatg atcattgaag aaaaaggaga gcaggaggac ccatctaaac 33720

ttacaaagtc tagaggaaga ggaggaccca gagtttgatg cttccctctg ggtacaccaa 33780

aacatcgtca aacttaggca aggagtttgg ggtaaacatt caggggtgtg agaaggaagc 33840

tttggagctt ttcgtaaaat tacaactaga ggcataaaaa aaaaaaaggc aatccaggca 33900

tggaggtgac aaccttcgaa aagaaaggga ttcaaagaac tgaaagggct ggatttttgg 33960

agtaacttca agagtaatag aacaagaagt agggggttgc attattatca aagatcaatg 34020

aagattaaca ttgaagaagt gggaaatcca aaaagactcc accgagaagg atgatgcaat 34080

gatcattgaa gaaaaaggag agcatgagaa aaaacccgta gaaattgaca gcactcacac 34140

acaataagac gagataataa agtagtgagt tggccaattg aagaagcttt acctcttaac 34200

ttacaaagtc tagaggaaga ggaggaccca gagtttgatg cttccctctg ggtacaccaa 34260

aacatcgtca aacttaggca aggagtttgg ggtaaacttt caggggtgtg agaaggatgt 34320

tttggagctt ttcataaaat tataacaaga ggcatgggaa aaaaaaggaa atccaggcat 34380

gcaggtgaca aaaccttcca aaagaaaggg actggaagaa ctgaaagggc tggatttttg 34440

gcgtaacttc aagagtaata ggacaagaag tacgggattg cattattatc aaagatcaat 34500

gaagattaac attgtatcat ggaatgtcag ggggttaaat cgacatagaa aaagaatgtt 34560

gattaggagt ttaattcata ggtggaaagc agatgttttc tgtttccaag attcaaaatt 34620

aaaaggggac attagggagt ttataagaga actatgggca aataggtggt ttaaatatgc 34680

acagttggag gctagtgggc ctagaggggg tattattgtc ttatgggata gtaaaattgg 34740

ggagggggag atcagcagcc tgagctccta ttctgttact tgtaaattta taggtaaaac 34800

tcaggagtat acttggaatt tatccactgt atacgctcca aatgataggg aggaaaggaa 34860

agaagtatgg tgggaattag caggtgccag gggaattttt atggaccttg ggtaatttct 34920

ggggatttca atactgtgag gtacccacca gagaaaaaga attacagcaa aatcactaga 34980

gcaataaatg aattctcata atttattgaa gatatggaac tggtggatct acaacttgca 35040

ggaggaagtt acacttggag gacaggagat agacatgtga taacagctag actggatagg 35100

ttcttggttt ttatggattg gaatgagagc atcagaaaca ccaagcaatc agttctccat 35160

tgaattacct ctgaccattc ccctgtgatg cttcaatgtg gtaaccggta ccctgtcaaa 35220

tcctattaca agtttgagaa ttggtggctg gaaacagagg gcttcaaaga aaggattaaa 35280

gtctggtgga gctcttttgc ttgtgaagga agacgtgact ttattctggc tttcaaactt 35340

aaagcatcga aggaaaaaat tgaagaaatg gagtaaatct attcaaggaa acttggagat 35400

gcagaaattg agtattctta gtcaacttgc agaactagaa gagacacatg atcaaaggag 35460

ccttactgaa gaagaaatac acactaaata tgcagtctat ggagtttggg gagattgcaa 35520

aacatgagga ggtggcttgg agacaaagat ctagggctct ttggttgaaa gaagggacaa 35580

aaacatcaat tttttcctca aaattgcaag tgcacatagg aaatacaata acatagacca 35640

actgttactt gaaggaaaat ttgtggcgaa tccaacatac ataacaaata atattggtac 35700

attttatcaa aaactatata taaagattgc tagaggacaa tcttatgttg caaagtcttt 35760

tcgaagctta ggaaatttgg gatagtgtca ggcatgtgaa agggataaag cacctggacc 35820

tgagaactgg gaggtgataa acacggatat gatagctgca gttctttgtt catggaatgt 35880

ttgaggaaag ctttaatgtt acctttgtgg tattgattcc taagaagatg gaagctaagg 35940

aatagaagga ctttaggcct attatgatag gcaatgtgta caagatcttg atagaaagac 36000

ttaagaaatt ggtgaacaag ttggtgaagg gtcaacggat gacttttatt aaaggtagac 36060

agataatgga tgttgttcta attgccaaat gaatgtgtag atgcaagaac aaaggcgaga 36120

aacctacaat actatgcaaa ctagatattg agaaggcata tgaccatcta aattggaact 36180

ttctattgga atcgctgatg aggatgggct ttggtgtaag atgggtcagc tggatcaaat 36240

tctgcatcag cacaatgaaa ttctcaattt tgataaatgt ttcaccagta ggtttcttcc 36300

cttctcagag ggatttgaga cagggtgatc cactatctcc ttttattatt cattagtgct 36360

atgggaggct taaatgatat gttaaagact actcaagata acaactgcat acggggtttt 36420

aaggtgaagt ccagggcaga cagtactatt gagatttttc atcttcgata tgcagatgac 36480

gcacttatgt tctgtgaggt tgacaatgaa caattgaaag tgctgaaggt gatcttcatt 36540

ctgtttgaag ccacatctgt attacaaatt aactggaatg aaagctttat ctatctagtt 36600

aatgaggtaa ctaagatcca ctttttggtt ggaatcctag aaggtaaaat tggggaattg 36660

cctacagtta tttggggatg ccatgggggc caagagcaat tttaagggga tttggactag 36720

ggtcgtagag atatgtgaaa aaattttaac aaactggaag agttagtatt tatccttaag 36780

ggacaaacta atactaatca attctatact tgatgatttt cctacttaca tgatgttcct 36840

cttctcaatc catgtgaatg ttgtgaagag aatatatacc cttagaagga acttcctatg 36900

gggaggaaac tatgacaagg aaagatctat ttggtcaaat ggaagtctct cacagtcagc 36960

aagaagtaag agtgttttgg aatcaagaat tggagaattc agaaccaaag tttgatgatg 37020

aagtggctat ggagatttac tacagaagaa cattgtttgt ggaaagaggt gatcatggag 37080

aagtatggca tagaagataa acggataaca aagtctgtaa atagatctta tggagttagt 37140

cgatggaaat ccatcaggga cctatagctt cagctcttga ataagtccaa attctgaata 37200

ggaaatggat tgaaaatatc tttttggaag gataattggc taaccaagga actttgaaac 37260

aactctttct tgacatttac attccaaatc aacagcataa agcaataata gtagaattat 37320

gggctaatca aggttggaat ctcacataca gaagactatc aaaagacccg gagattggca 37380

ggtcaacaga gttcaaaggc actttggaac aatttaaaga ggtctatact tctatagact 37440

atttgacttg gcaagggaag tttattgtta attcagccta taaggaattc aacttctcag 37500

ctaactggat tggttgttgg ccatagaagt tgatttggaa agttaaaatt ccttatagag 37560

ttgcttgttt ctcttggctt ttggctaaag aggcagttct gacgcatgat aatctaacca 37620

agagagatta ccatttatgt tcaagatgtt atttatgtga agagcaggca gagacaacca 37680

atccactttt ttttgcattg taagttcact gcagttatgg aggattttca ttagtttaaa 37740

gggtatcatg tgggctatgc gtagaagtat acctgaagtt ctagcatact ggaaaaaaga 37800

aagaaatctt tccaattata aaaagagatg gaggattatc ctagcttgca tctggtggac 37860

catttgggaa gaaagaaatc aaagatgctt caaagataaa tcagtcatat tcagataatt 37920

aaaatgaagt ggctagtctt gttttatttt tggtgttaag tgttagatag ttatgtatta 37980

tgtataagtt gtctagtccc acattggaac gggagtaata tgtactatgt agagtatagc 38040

tataaatagg acttcttgta ctttattgta gagaatatat taataatata tttttcccgt 38100

gttgtctcac atggtatcag agaaaccgtg agatatcagt cgttgtgaaa aataccagcg 38160

gcttcgggaa gaaaaaaatc aatcaactgc taggtatatt agtcttcggc gaccgatcca 38220

ttaaatttct ctggcaaaga accactcatg ggccctcacg cgcccaccga aagaaatatt 38280

tccggcgagg ttccaatttc atgcgcccgc gcgtgaggca gtttccggtc aaattttgac 38340

aaaggtcctt tttgacagtt tgttcaccct gtaattccca gtctatccat catttttttt 38400

atttcgatca cttcgcaatt tctcgggcag ctacagtgat ttttccggca gaagcggtgt 38460

ttcctttgcc tgcttcagcg agatacagtt gattatttct attatttgtt tctagacctc 38520

tctccaatcc aacgatgtct ttggaatttg atgtatttgg ttctgaaaac acgagttcta 38580

gaaagtcaag cttcatgatt actttagagc cattaatggg gagttcaaac tatttagctt 38640

gggtttcctc tgttgaattg tggtgtaaag gtcaaggtgt tcgagatcac ttaatcaaaa 38700

aggctagtga gggctgtgaa aaggtcaatt taagcagttt atgacgtctg tataccactc 38760

agcagaatag gatagcaaag aaagaatatg cacatcattg agactgctcg cacacttctc 38820

attgagtctc acgttctgct acattttctg agcgatgcag ttctaacggc ttgttatttg 38880

attaatcgga tgcctttatc ttccatccag aatcagattc tgcagttagt attgttttct 38940

cagtcaccct tatacttttt tcgtcctcgt gcttttggga gcatgtgttt gttcataact 39000

tagctcccga aaaaaataag ttagctcctc gtgctctcaa gtgtgtcttc cttggatatt 39060

cccgagttta aaagtgatat tgttgctact cacctgatcg taggtacctt atgtcagttg 39120

atgttgcatt ttttgagtct agaccttact ttacctcttc tgaccacctt gatatatata 39180

tgaggtctta cctataccga ctcttgaggg gtttactata gctcctcctc tacatactga 39240

gccacagaaa tcttactcat acctaccatt ggggaatcta gtgttgctcc tcctagatcc 39300

ccagctacag gaacactttt aacttatcgt cgtcgtccgc gcccagcatc atgtccagct 39360

gattcacgtt ctgcacctgc tcctactgcg gactagtctc atcctaatct accaattgca 39420

cttcggaaag gtatatagtc cacacttaat cctaatccat attatgtcgg tttgagttat 39480

catcgtgtca tcacctcatt atgcttttat aacttctttg tccactgttt caattcataa 39540

gtttacaggt gaagcactgt cacatccagg atggcaacat gctatgattg acgagatgtc 39600

tgctttacat acgagtagta cttgtgaact tgttcctctt ccttcaggca aatctactgt 39660

tggttatcgt tgggtttatg ccgtcaaagt tggtccagat gaccagattg ccaaagggta 39720

tagtcaaata tttggggctt ggttacagtg atattttctc tcccgtggct aaaataccat 39780

cagttcatct ctttatatcc atggttgttg ttcgtcattg gcatctctat cagtttgaca 39840

ttaagaatgt ttttcttcac agtgagattg aggatgaagt ttatatgaat taaccaccta 39900

attttgttgc ttagggggag tctagtggct ttgtatgttg gttgcctcag acgctctatg 39960

gtctaaagta atctcctcga gccttgttta gtaagttgag cacagttatt cgggaatttg 40020

gccaactcgt agtgaagctt atcactttgt gctttattgg cattttactt caaatctctg 40080

tatttatttg gtggtttatg ttgacgatat tgttattacc ggcaatgaac aggatggtat 40140

tactgagttg aagcaacatc tctttcagca cttttagact aaggatctga gtagattgaa 40200

gtatttttta ggtattgtga ttgctcagtc tagcttaggt tttgttattt cacattggaa 40260

gtagaaaaac ttcaatcatt tttctttatt tgaaaggaag aaaaaaaagg taatatctag 40320

acctaaatat taatctgaag acaagtgagg cttgctcagt tggtaaaagc acctccacct 40380

acgatcgtta ggtcctgggt tcgagtcacc atggagggga agtgtggaaa cactatagat 40440

cctcctaatt tgggaggggg aaaaaaatat taatctgaat tgacatgaat ctcaatgaca 40500

atgaccaacg atttcctgca attcttttca gtatggaatg aataaaaaat caagctacaa 40560

gtctctatta aacgaaatgc actaacaggg atcactctca agaaaggaag tggttttggt 40620

tgttgttatt ccaggttgga taaatcactt tctttataaa tatcataaaa gacaagggct 40680

ttcttgcttc agcacatgtg ggaaatgccg gggggcttgg ctggtaccaa gctcgagcgg 40740

tctttctatc tttttggatt gcatgcccaa ggcaatgctt tttgtagatt gggatggatt 40800

gatcttcgca gaagtatgct ttagacattc ttgaggagac aggaatgacg gattgtagac 40860

ccattgacac acctatggat ccaaatgcca cacttctacc aggatagggg gagcctctta 40920

gtgatcctgc aagatatagg cggctggttg gcaagttgaa ttacctcaca gtaactagac 40980

cttatatatc ctttcctgtg agtgttgtaa gtcagtttat ggactctcct tgtgatagtc 41040

attgggatgt ggttttccga attcttcgat ataaaatcag ctccaagcaa agaactgttg 41100

ttcgaggatc gaggcccatg agcagatgtt gattgggcac gatcaccttc taatagacat 41160

tctatatctg gatattgtat gttaatagga gttaatttgg tgtcttggaa gatcaagacg 41220

taaaatgtag ttgatcggtc tagtgcggaa gcaaataatc gagcaattgt tatggtaaca 41280

cgtgagctag tttggatcaa acaactgctc aaagaattga aatttggaga aattgatgga 41340

accagtgtgt aataatcaag cagctcttca tattgcgtca aatccggtgt tccatgacag 41400

aattaaacac attgagattg actctcactt tgccggagaa aagatactct caggagatac 41460

cgttacaaag attgtgaagt cgaatgatca gcttagagat atttttacca agtcccttgc 41520

tggtcctcgt attagttata tttgtagcaa actcggtata tatgatttat atgcaccaac 41580

ttaagggaga gtgtgagata gttatgtaca acaaaatacc cggtataatc ccacaagtgg 41640

ggtatggagg gtagtgtata cgtagagctt acccttaccc tgtgaaggta gagaagctgt 41700

ttccaaatac cctcggctcc agtacaaatg aaaaggagca gtagcaacaa gcagtaacaa 41760

caatgatata gtaaaataac tgaagaaaga aataacatgt agacatataa ctccactaac 41820

aaacatgcaa ggttaatact attgccacga gaatggcaaa ggaatgttag atagttatgt 41880

attatatgta tattaatagt ctagtctcac gttggaatag gagtaatatg tactatgtag 41940

agtatagcta taactaggac ttcttgtaat atattgcata gagatatcaa taatatattt 42000

ttcctgtgct ttctcacgta aaggaatgta atgtacttag aagatcatga atctatcttt 42060

gatgttttag acacctcgtg agaacacaaa ggtttaggaa ctttattgtg ttctttgtaa 42120

ttatgggtga ctgccaatat gttacctttt cataaaaatg attatttggc cattggatta 42180

gtttcaacag cctctctgcc cctccgggta ggggtaaggt ctgcgtacat attaccctct 42240

ccagacccca cttgtgggat tatactgggt tgttgttgtt gttgttgtgg attagtttca 42300

acaattttga tagttctttt atttgaatca aactactcat tcacatggat tttgtatcgt 42360

atcattgagt taaaaaaatt ggttttgcta atttatcctc atgtataaca actacctatt 42420

tttcaatata ttggattcag gagcttgtag tagctggagt ttgctcttca aagggcaata 42480

agtgccgggt atcatgcaca gtgactccaa atacagatct cctttctgct ctaactctta 42540

tggagaaaca tgatctaagt cagctacctg ttatactagg ggacgtggag gatgaaggca 42600

tccatcctgt gggcattttg gacagagaat gcatcaatgt agcttgcagg tttttgacat 42660

tcaactttta cttcaaagat ataatgcttt ctggaaccat tgatgataaa atatgcaaga 42720

aacttgtgca gaagtcgcac tttactatcg attaccagat aaagttactt atcaagaagt 42780

caaatatatt gaacatattt ctctaaaaca ctttgactgg actgtaagca gaaacttact 42840

aaagtaggtc gtaagaaatg gtttgatagg gaaatcacca tctacactta aaagagttgt 42900

gtgaatttga attcttaaag catgtgaaag ttataaaaac ttgttattat ctaagcatct 42960

gaagcatttt ggccatccaa aggatcaaaa ataggaaata atttcatttg tacaatgaac 43020

tccctgcaca aattctcaca ctaggtgtat tctctattca tcactagcac tacatgtgtc 43080

actacgaatc atatacaata aatctttgta acataaaaga cgacacataa tatggaagta 43140

agccgagtat acaagggaag tttcatcatt acggtgagct ttttataaga taatcaagtt 43200

ttactggaaa agggcaaaaa ctctcccgta tagaagtata ccaaaaagta gaatacctta 43260

caaaaatatg attttctatg aacaacaccc tatcttctat acttgtaggg atctcatcgg 43320

ggcaccaaaa agagataaag ggataagagg cttttcctca aatgtacaaa atccttctct 43380

attccttcaa aagctctcct atttctctct ctgcacactg tccacataag ttcaatggag 43440

caacatccac gccctgtgtc ttcttttccg tcttctatag gtccagctga acatggcttc 43500

tttgactgag tgtggcatca acgttgaaga ccaaaccatc ccagtacttc caaccacaaa 43560

cgagacacta tatgacaatt tagaagaaga tgattcacat cttctcccga acatttacac 43620

ataaaacacc agctgataca tgtaatcttc ctcttcctca aattatcagc cgtcaggatc 43680

acccgtctcg tagctaacta ggtgaagaag cacacctttc tcgaaaacct caggatccat 43740

acagagagat atggaaaagc tgattcctcc atgcccagaa gcttctcata ataagactta 43800

acaaagaaac accactactt cccccccccc ccaaaaaaaa aaaatctcca tacatcgact 43860

ttcatgtgta attcttgttc gtgaaacgac ccaatcaacc tttggcacaa atctcccagt 43920

cttgcgagtt cctcctaaac ttcaaatcac aatgaacttc tccaccttgt agcctccgtg 43980

tcccttggac tggcaactcc tttggcatga aactttgtac atattaggag atgtgatact 44040

caaagtgttg ttcctgcacc aattgtaccc ccaaaaaact taccatgctc ccatcaccta 44100

acattgaatg atacgttcca aaatcttcgc actccttcaa gaaacttttc cgtaggcccc 44160

acccataagg gagtgtgatt ttttttgctc tccatcccct ctccaagaat ccattcccta 44220

aaccactgca ggacacttta acaatcacta tgtcactttt tctactagtt ctacattgag 44280

tgatatcttg atgtcattga aatgcctctg gaaaatcttc ttctcatcta aaagaacact 44340

tgtttgcctt ttgaatcccc ctctaacatt ttctatgttt cattcatctt tggtggaaca 44400

gagcattagc aactagagaa cagctttgct ag 44432

<210> 11

<211> 36854

<212> DNA

<213> Nicotiana tabacum

<220>

<223> DNA sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; two start codons

<400> 11

atgattagcg gccaaaacac cgtgctgcac catcctccta attcgctctt caattcctta 60

tctcctcgcc atatctgtgt atctttctgt aacgacaaag ctttaaaaaa gtcagtcacg 120

cactccgccc ctcggtttgc tcgtctgtta aacaatgaat cacgaaagtt gttgggtcgt 180

catccaaatt gctggccttg ggctcgacga ccatctcttc ctccgggacg ttcctgtgac 240

ggaaacattg aaaaagaaca agatatgtgc gacagcagca aagacgatag tgatagtgat 300

agtggtatcc agataggatc tctgctcgag gaagttatcc cacaaggcaa taataccgct 360

ataatctcgg cttgctttgt tggcctcttc accggtatca gtgtcgtgct tttcaacgct 420

gcggtaagtg cgctataggt ctttcatttc tcttttcatc tactattctc ccttacttac 480

ttggcctcag tcaatcagcc ccctgcctac tttaaattat tgtacaattt atcagaggag 540

tatcctatac atcaaattca cataacttag taaaatatgc tgacattctg aattttaacc 600

ttaccagctt agaacatcca ggctagttca gaaacagata atctaaattg gcctcattta 660

taagtcattt tgttaatcaa gacatacaat ttggctcttg ataaaagatt atgcagcgcc 720

cgatgataac ctaatattta tcagcaaccc atatgtcact ttcttttgtt taaatgctct 780

cccatgtaat ttaacaatat tgtcaccata caaaagagaa ctgaagtgaa tgttccattt 840

gtggtcatat aacggatatc tcccttggtt aggttcatga aatacgtgat ctttgttggg 900

atggaattcc atatcgagct gcctcagagg agcccattgg agtacattgg caacgtgtaa 960

tcttagtacc agcttgtggc ggtttggtag tcagcttttt gaatgccttc cgagccactc 1020

tggaggtttc aactgaagaa agttggacat catctgttaa atctgtgttg gggccagttt 1080

tgaagacaat ggccgcttgt gtcacattag gaactgggaa ttccttagga ccagaaggcc 1140

ctagtgttga aattggtaca tctgttgcca agggagttgg agctctgctt gataaaggtg 1200

gtcgtagaaa gctgtcactc aaggctgctg gatcagctgc tggaatcgct tctggtttgt 1260

tccccatatt attcttggtt ctgaaccata catggtacat tttccttata attacatgta 1320

gcctgttgta tgctttcctc tttcctggga agcctttctg taaatgcaaa tgtgtttgca 1380

ctcaaaccaa taaactgtaa aaacagtgaa ccccttgagc aagcaaaagc actagaaaac 1440

caacaaatag atcccccccc caagatacca gtgaaatgac accgggtgac ccaaaaataa 1500

agcagcttac atcttgactt tgagaggaac tgcaatcagc tataagtagg ttattaattt 1560

ccagtgcctg cattctgccc aagtactatg atatatttct gaagctttgt ttccccagtt 1620

cctttttcag acgtttgctg tcaataaagt tgagccagcc aacttggttc ccacaagcta 1680

ctaattttgt ccaagcttac tctatgggag aagttaaatt tcccaaattc cttgagcaga 1740

aaatgaaaaa tgaactcaaa gtgtcatatt aggcaactat ctaaagaaaa atacttaatt 1800

gaagtttaga taagaaaagt gaatatatat tgatgtagtc tccgttaggt gagaagcgca 1860

tcacttaccc agcaacatat ggacctaaaa tttactagtg aacttttcac attgtatcaa 1920

aagctcaaca aacagaaaga tgactagtcc taaaatgtta tttcacatca accttatcat 1980

acgtgcatta tttgttctct atatttctat ttcatccgat ataaccaatc gtcattgtaa 2040

attctataat gcctgtggtt acttttgtct ttagtgacaa atgacattta ggctaaccat 2100

gtagttattg actgatttcg cttgacgtct cttccaatta tgtagtagta gagtgttgag 2160

atatggatat gttaccttct aaaaaaaaag agtgttgaga tgcggatggt ttgctagctg 2220

gcttttgtct cccttcaagt tgaattagca aaagcaatgt ctcataagtt ggatagctag 2280

acaagaaaaa ctccaaatta ctttatgtag agtattctta agcttgagtc gcgagttgga 2340

aattggaatt atgtaaaaaa acctggaatt atttggttga gcctgctttt tatttttgtc 2400

aatatttcca gtatctaacc caacatgttt agagcaattc ccagagagcc tcaatacgag 2460

gcatttgcag agtctttatg agagtccagg aaggggcaca cactgtagag gtatagtgtt 2520

gtccttattt tttttttttt gataaggtaa gattttatta aaaggtacca agatggtgca 2580

aaattacaaa catccaaact aatacaacaa agcaactaca ttcctcctag ctcctctaga 2640

aaattcatat attgttccat atttttcatt acatgtcttt tacaccagaa atacaagttt 2700

aataagcatc tgtttttaat cctggataca tgctgccttt ccccttcaaa gcaaatcctg 2760

tttctttcca accatattgt ccagaacaca catagaggaa ttgttcttca tactatctgt 2820

tgactctttg ccactttttg ttgttgccat gtctccaaca aactttacac tggcaggcat 2880

tgcccacttg acatcatata tatttaggaa gagctaccaa cactgctttg ccactttgaa 2940

atggatgatt agatggttga ctgtttctgc ctcttcttca cacatgtaac accggttaca 3000

tagagcaaaa cctctcttct gcaagttctc ctgagttaga aaagcttcct ttgctccaat 3060

ccaaccaaaa cgggctactt taataagtgc ttttgacttc catattgctt tccatggcca 3120

atttgactga taaagccctt gtagtttttg taacaagcta taacaactgc tgactgtgaa 3180

aataccatca ttacttgctg cccagattaa tgagtctctc ctgttttcct ccaatctaac 3240

attattcaat aactgcatca attgggaaaa ttcatcaact tcccagtcat tgaggcccct 3300

cttgaagatt agctgccagc cggtgcttga atagaagtct aacactcttc catttttgtt 3360

aatagagcag ctatatagac caggaaactt tgatctaaga cttccatttt ccaaccacat 3420

atcagaccaa aacagggtat tattaccatt tccaagtttc agtttcacaa actgactata 3480

tttattccaa agattactaa ttgtgctcca aactccccct tttgaagaag attgaattga 3540

acgaggagcc cacatgtcct tcataccata cttggcatct atcacctttt tccataatct 3600

attcccatca taattatatc tccatagcca tttaaataaa agacttttgt tatgcatctt 3660

tagattcctc actcctaatc cccctctttc tttttttttc atcacctctt gccatttgac 3720

caagtgaaat ttcttgttat cattattacc ttcccacaaa aatttattcc tcatagtatt 3780

caattttttc tccactgatg ttggcatttt aacgagagat attagataag taggtatacc 3840

atccatcaca ctattgacca gtgtaagcct accaccaaga gataaatatt gtcttttcca 3900

tgacaccagt ttactgctac atctatccaa gaccccctgc cacatctttg catcattctt 3960

ttttgctcca agtggtaggc ccagataggt ggatggtagc tgctccactt tacaacccaa 4020

aacatctgcc agatcatcaa tacaatgctc ggcattaata ctaaacacat tactctttgc 4080

caagttcact ttcaatcccg agacagcttc aaaagctagt agtactccta tgaggtgtaa 4140

gagttgctct ttttcagctt cacataatat caatgtatca tcagcataga gtatgtgtga 4200

gaaatacagt tcttccccct ctctttttct aattttcaat cctctaatcc accctaactt 4260

ttctgctttt aaaagcattc tgctaaagat ttccatcacc aacaaaaata aataggggga 4320

tattggatcc ccctgtctta accccctctg agaattaaag tatctatgtg gactcccatt 4380

aattaaaact gagaagctaa ttgaggatat gcagaatttt atccacccaa tccatctttc 4440

cccaaaattc gtatgtttca tcagatttaa cagacatgac caatttacat gatcataagc 4500

cttttccacg tcaagtttgc aggccacccc tttaatcttc ctcttgaata gatattcaag 4560

acactcatta gctaccatag cagcatcaat aaattgcctt cctcttacaa aggcattctg 4620

attatctaat atcaattttc ctatcaccat ctttaatctt tcagctatcg actttgcaat 4680

tattttatag acactgccca acaagctgat aggtctaaaa tctttcactt ccgctgcccc 4740

ctttttctta ggaataagag caatgaaaat tgagtttagg ctcttagtct tgtccttatt 4800

ttcagggttg aactagttct ttagaagttt cctaggcttc ctaatttcca aagttctgcc 4860

aggtcctttt ctagtgaagt acttgaagtt taataaatca aattttaatt tctaacatat 4920

cccgagaaat tcattcacaa attcaactgg tgacttctga tgcagaaaca taagcaactg 4980

cttatgggtt catatgttcc tgcaatttta ttgttgacat ggattggctt catatggttt 5040

tgttcctgca attttatcgc tgacactaat cctttcatat ggttttatgt ggggtggtaa 5100

atagaggtta agagacaaga agaggctgga aaaggtgggc agttcatttg ttagtagact 5160

actctattta ctaagagata tgatgtccca tacattactc gaattggctc caaatacaga 5220

ttccacttct ttgtcgagtt tccttattgt acagagttcg actcgtcaag ggaaattcac 5280

ttcctttgac tgaataatgc tagtttgagt agtaccttaa attaaatgga ccatttaatt 5340

ctatctactt gatagaatag actggtcatc aactagttgc aaatataatg acaactccgc 5400

catgtttgca gagtcacctg atgaagaagt acctcaatta gtagaccatt tcttgaatgt 5460

tctacagtat tctctatgcc tacatgacca catcactttt ccttttgcgt tgtgagaact 5520

tgaacttggt gagcgggggt tccccaggaa tggcatcttg gtggcagatg accattctgt 5580

ccttatctta gctaatgctt cttggattgc ctcactagat ttattatacc tttaataaat 5640

gtttgccatt gttctgccat aatagaggga tgtacctagc tggtgcttca catcacatag 5700

tccaaaacta atgaaatgct ttacaattgt cgagtactaa aggatgattt gtggaatcag 5760

atctcaaaca atttattttg aggaagaaaa ataccaaagg ttttttctgt ttgttggaag 5820

attaaaaatc ctttaaaagg taaagattta tgaacttaat tcagcatttt tgtggccatt 5880

gctgaaaaag agaaaacaat ggcacttatt cgagtttgct tatccaaaaa aaaagaagaa 5940

gagaatgtca cgtaatgcaa tttcatctta ggaaactttg caggagaaaa gcaagagtga 6000

taaaacagaa ctatttgttt ttttgataag ttgttgtgac ctatttcttt gtcattctta 6060

tttgctaata agctaatgta ccctgtacta tggttgtttt gacttaatcc ggggatgttc 6120

agtgagcatt ttcttgtttt ttctgctgtc agcatctgct gccttacagg aattcatttt 6180

ctggaaattt acttcttgtt ctgctaacat tttcctgtta tatcttgtca gtcattttct 6240

ctccatggtt atactgtttg tgtcactttg aaactctcct tgttttctac tttaaaggat 6300

ttaatgctgc tgtcgggggc tgtttctttg ctgtggaatc tgtgttatgg ccatcacctg 6360

cagagtcctc cttgtacttg acaaatacga cttcaatggt tattctcagt gctgttatag 6420

cttctgtagt ctcagaaatt ggtcttggct ctgaacctgc atttgcagtt ccaggatatg 6480

atttccgtac acctactggt aattttggac ttctttctcg agtttgattc ttaaatacaa 6540

ttgtacccgt cacttacagc aacaacaact acatttcaac agctagttgg ggttggctac 6600

acagatcatc actatccatt tcaatttctt tagtcccatt tctttcgaat attcagtact 6660

ttgggattct ctattatcag aggttctctt tattttctac tttgacgtac aaatctctaa 6720

atagattaaa gaagactcct agagacactg gcctaatgca aatgtaccac catgaataaa 6780

ccttaatctg aaatagctgg tatcgtatat aagaaccttt agctttaatt gtgttctata 6840

ttgatctttt gggacaactt ccgtccaata atattatgtc ttacttatac agttatactt 6900

atccttaaac tttactcttt agagtggtta tccgtagttc aagcttttgt tggcaccata 6960

gctagtttgg ttcttagtaa aaagttactc tttagagtgg taactttttg tcaattttct 7020

tagtgaaaat ataacctctg tgacaaatct accaagtata aatccaatat ggttctgtgt 7080

catacttgta gtttatccaa gtctatgctc catcactctt acaaaggctc atcgtatgac 7140

taattttttt tgagaaaggt aacagtttgt attgataata agatcagcgc caggttagtc 7200

attagtgcta atagctgtat gtacaactcc aaaagagcaa aagacaagca cctggtgtaa 7260

cgtaaattac aagctgccta taaaatctat caggtctcct acctcactaa acatttcttg 7320

tttacaccaa aaaaataaaa caaggaaaga caatccatct taatcttctg aatggagttt 7380

cttttgcctt caaacatctc gagttccttt cgttccatgc aatccaccat atacaagctg 7440

ggatgctttt ccatttgtct ttatccattt tttctaccaa ttcccttcca attgactaga 7500

agttccaatg tggttctaga tatgacccaa ttaactccca acatataaaa gaacatgttc 7560

cacggatttg tagtgattct gcaatgtagg aacaagtgag cattactttc tacttcctgt 7620

ccacaaagaa aacatcttga gcaaatctgg aaacctcttc tttgtaagtt atcatgtgtt 7680

aaacatgctt ttttaccact aaccagacaa aacatgatac tttgggagga gttttaaccc 7740

tccaaatgtg tttccaaggc cacacctcag tcattgaaac attatgattt agagtccagt 7800

atgcatcttt tactgaaaat gcacctttgc tattcagctt ccaaactatt ttatctatgg 7860

tcttgttagt ttacagctat gtatatagtg tagtcttgtc ccacattgga ataggagtag 7920

tatgtccttg tatagtatag ctataaataa ggacctcttg tattgtattg aacatccaat 7980

atcaataaca tattttctcc cgtgctttct cacatggtat cagagcaatt gtgagagatt 8040

tatcgctgcg cataaattcc agcgactccg ggaagagaaa tcagtcaccg gaagtctttt 8100

tccgacgact ctttcaaggt tgtttgcgtt tgctttataa atccaacact accacaagag 8160

taatcactgt ccggcgacca aaccccagta aaaatctccg gcagcagcct cctcacgcca 8220

ccagaagctc acgcgccggc gcgtacgacc acttccgtcc attttttgaa aaacttcctt 8280

cagaacagtt gggtcgcctg gtaattccta tcctacccct actgttttca tttcattccg 8340

accactttga gttttttccg gctgctacag tactattccg gcagctatag tactattccg 8400

acaactacag taagattccg gctgctacag tatttcatta ttctgttttt gtgtttcctt 8460

actctgtttc agtggattac aattgattct ttctcttatt tggtaataat ttgcaacaat 8520

gtctatggga tttgatgttt ttgggtctag aaacatgagt tctggaagct ctagtgttat 8580

tattacctca gaaccttaaa tgggaggttc aaactactta gcttgggctt catctgtcga 8640

gttgtggtgt agaggccaag gtgttcaaga tcatctaatc aaaccgtcta gcgaaggaga 8700

tgaaaaggca ataacacttt ggacaaaaat cgatgctcag ttatgtagca tcttgtggcg 8760

atctattgat tccaagttga tgcccttgtt tcgtccattc ctgacatgtt atttggtttg 8820

ggcaaaggca cacaccttat acactaatga catatctcgc ttctatgatg tgatatcgcg 8880

gatgacaaac tgaaagaagc aagaattaga tatgtctact tacttgggtc aagtacaagc 8940

aatcatgggg gaatttgaga agttgatgcc agtttctgct agtgttgaaa aacaacaaga 9000

gcagcgacaa aagatgtttc tcgctcttac cctcgctgaa cttcctaatg atcttgattc 9060

agtacgcgac catattttag ctagtccgac tgtcccgaca gttgatgaat tattctctcg 9120

attactccgc cttgctgtag caccaagtca cccagtgatc tcatcacaga tacttgattc 9180

ctctgttctt gcatcccaga caatggatgt tcgggcatct caaactatgg agcatagacg 9240

aggaggaggt cgttttggaa gatctagacc caagtgttct tattgtcaca aacttggaca 9300

cactcgtgaa atgtgttatt ccttacatgg tcgtccaccc aaaaatgctt acattgctca 9360

gaccgagact ccaggtaacc agggattttc tttatctaaa gaagaatata atgaactcct 9420

tcagtatcga acaagtaagc agacatctcc acaagtagcc tcagttgctt agactgatac 9480

ttcttttact ggtaattttt ttgcttgtgt ttcccagtct agcactcttg gcccatgggt 9540

catggactca ggcgcttctg atcacatctc tggtaatata tcacttttgt taaatattgt 9600

atattcatag tctcttccca ttgttacttt agccaatgga tgtcaaatta cggcaaaagg 9660

agttggacaa gctaatccct tgtcttctat caccctagat tctgttcttt atgtccctgg 9720

ctgtcttttt cgtcttgcat ctgttagtcg tttgactcgt gccctccatt gtggtatata 9780

ttttattgac gattctttta ttatgcagga ctgcagtacg ggacagacaa ttggtggagg 9840

acgtgaatca gaaggccttt actaccttaa ctcacccagt ccttccacaa catgtctggt 9900

tacagatcct ccagatctaa tccacagacg tttaggacat ccgagtttat ccaaacttca 9960

gaagatggtg cctagtttat ctagtttgtc tacattagat tgtgagtcgt gtcagcttgg 10020

gaaacatacc cgagcctcct tttcgcgtag tgttgagagt cttgcatagt ctgccttctc 10080

cttagttcat tctgatatat ggggtcctag tagagtaagt tcaaccttgg gatttcgtta 10140

ttttgttagt ttcattgatg attattcaag atgtacttgg cttttcttaa tgaaagaccg 10200

ttctgagtta ttttctatat tccagagttt ctgtgctgaa atgaaaaacc aatttggtgt 10260

ttctattcgc atttttcgca gtgataatgc cttagaatat ttatcttttc aatttcagca 10320

gtttatgact tctcaaggaa ttattcatca gacatcttgt ccttataccc ctcaacaaaa 10380

tggggttgct gagagaaaga ataggcacct tattgagatt gctcgcacac ttctaattga 10440

atctcgtgtt ccgttgcgtt tttggggcga tgcagtgctc acaacttgtt atttgattaa 10500

tcggatgcct tcatctccca tcaaggatca gattccacat tcagtattgt ttccccagtc 10560

acccttatac tctcttccac cccgtatttt tggaagcacg tgttttgttc ataacttagc 10620

ccctgggaaa gataagttag ctcttcgtgc tctcaagtgt gtcttccttg gttattctcg 10680

tgttcagaag ggatatcgtt attattctcc agatcttcgt aggtacctta tgtcagctga 10740

cgtcacattt tttgagtcta aacctttctt tacttttgct gaccaccatg atatatctga 10800

ggtcttacct ataccgacct ttgaggagtt tactatagct cctcctccac cttcgaccac 10860

agaggtttca tccataccag ccgttgagga gtctagtgtt gttcctcgta gttccccagc 10920

cacaggaaca ccactcttga cttatcatca tcgttcgcgc cctacatcgg gcccaactgg 10980

ttctcgtcct gcacctgacc cttctcctgc tgcggaccct gctcctagta cactgattgc 11040

acttcggaaa ggtatacgaa ccatacttaa ccctaatcct cattatgtcg gtttgagtta 11100

tcatcgtctg tcatttcccc attatgcttt tatatcttct ttgaactcgg tttccatccc 11160

taagtctaca ggtgaaacgt tgtctcaccc aggatggcga caggctatga gtgacgagat 11220

gtctgcttta catacaagtg gtacttggga gcttgttcct cttccctcag gtaaatctac 11280

tgttggttgt cgttgggttt atgcagtcaa agttggtccc gatggccaga ttgatcgact 11340

taaggcccgt cttgttgcca aaggatatac tcagatattt gggctcgatt acagtgatac 11400

cttctctccc gtggctaaag tggcttcagt ccgtcttttt ctatccatgg ctgcggttcg 11460

tcattggccc ctctatcagc tgaacactaa gaatgccttt tttcacggtg atcttgagga 11520

tgaggtttat atagagcaac cacctggttt tgttgctcag gagggggtct cgtggccttg 11580

tatgtcgctt gcgtcggtca ctttatggtc taaagcagtc tcctagagcc tggtttggta 11640

agttcagcac ggttatccag gagtttggca tgactcgtag tgaagctgat cactctgtgt 11700

tttatcggca ccctgttgac attccgatgg atccgaattc taaacttatg ccaggacagg 11760

gggagccgct tagcgatcct gcaagctata ggcggctggt tggaaaatta aattatctca 11820

cagtgactag acccgatatt tcttatcctg taagtgttgt gagtcgattt atgaattctc 11880

cctgtgatag tcattgggtt gcagttgtcc gcattattcg gtatataaaa tcggctccag 11940

gcaaagggtt actgtttgag gatcaaggtc atgagcagat cgttggatac tcagatgctg 12000

attgggcagg atcaccttct gatagacgtt ctacgtctgg atgttgtgtt ttagtaggag 12060

gcaatttggt gtcttggaag agcaagaaac agaatgtagt tgctcggtct agtgcagaag 12120

cagaatatcg agcaatggct atggcaacat atgagctagt ctcgaccaaa caattgctca 12180

aggagttgaa atttggtgaa atcaatcgga tggaacttgt gtgcgataat caagctgccc 12240

ttcatattgc atcaaatccg gtgttccatg agagaactaa acacattgag attgattgtc 12300

acttcgtcag agaaaagata ctttcaggag agattgctac aaagtttgtg aggtcgaatg 12360

atcaacttgc agatattttc accaagtctc tcactggtcc tcgtattggt tatatatgta 12420

acaagctcgg tacatatgat ttgtatgcac cggcttgagg gggagtgtta gtttacagct 12480

atgtatatag tgtagtcttg tctcacattg gaataggagt agtatgtcct tgtatagtat 12540

agctataaat aagacagtac taacgtccct tttgccgggg gttctgcatc tttaaataga 12600

tgcacgtggt tccatagcag accgtgttga tcacagatcg tgctgcatcc tcttcccagc 12660

ggactcggtg agcccctctt gtattgtatt gaacatccaa tatcaataac atattttctc 12720

tcgtgctttc tcacaggtct gtgatgtacc cttgaaaggt tcaagagttt ggaggaagat 12780

agaaactctg tttatctccc aatcatccaa agatcttcta aagttccagt tccatccttg 12840

tgagctccag actgacttac caatgcttgg ctttgaagac ttagagagaa taagtcagga 12900

aaaatctttc aaccttcctt gccctatccg gtgatcttcc caaaaagatg tcttcaaccc 12960

attgccaaca ttgatcctga tattgctact gaaagatttc ttttggtggc aggattactc 13020

tcattaacaa tgtacttgac aatctccata catacgaatg tctctttacc ctcttgccat 13080

taaggttgta aagagacttg tcaaattaag aagaggtttc ctatggaact gtttcaagga 13140

aggaacctcc tttcctttgg tcaagtggag ttaagtcata taatctagga agtggagact 13200

tgggtataaa atagctgcaa ctacagaaaa ggagcatctt atttaaatga tcacgcaaat 13260

gtgcccaaaa ctttaaatat ctgcggagca tatggttgta gcaaaatttg aatcttccgg 13320

tcaatgttgc tcatgtccag tgaatacccc tgatggtgaa agtgtcctga agggaagcag 13380

gaacttattg gaggaattgg catttaacac tcagcatttc gttaggtcat agcccgctga 13440

aaattgagtg cccagattta tatagttttg ctctaaactg acgatgcagt tgcacaacat 13500

acgacaaact aaggtgggac atcttcttcg gaaggaattt tgaggattaa gagatagagt 13560

ggttgattca gttgcaaatg aagcttcaag ggttcaatat catccaggag acaccggatt 13620

ctgatagata aaacaacaga aagatgaaca ctactttgtt aggcttgtta caagttgcta 13680

tcgtctttct tatctcggca cacaatttag atttgggaac ttatttggaa aatagagtgg 13740

ttgtttttgt gaatagcatc agacaaagct tctgagctgg tacgacagaa aactcaacag 13800

ggagaataaa agactgtggt tcacgatttc tgcatgcatc ttgtaggtta tttggtgggt 13860

aaaatattta atgttttgaa gggaaggtag aacatgttca taggcttaga ttcaaatgtt 13920

tgtatttttt tggctctttg gtgagagatg ctgaatgtaa atgacatagg cagctgacta 13980

taatttctca gctccttgct ttttaaattg gcaggcactg atatgtacat gtgaacatcc 14040

aacacttttg tggtgccgtt ccgatgaata aagcacatta atcacttact gatcaggagt 14100

aatagtttag gagttctaga atttttgtac ataaaatgaa ccaaaaagaa tatcggaatg 14160

agaacatgtt tctttttttg tttcttcttt ttcgtacaaa tttcaataac acttctgata 14220

gaatagctag gtccatttga attcctttgg agacccttac acaaccaatg aatggcaagt 14280

atagcatttt ctaacaccct cccacatgta taatccagtt tttagggttt agatgtggat 14340

ttgatttgac cttattgcct ttttttgttt ttgttctttt tgaagtagag agtgaggagg 14400

ctcacaacga cgggctacgt agagcgagat taattcggct caacgggcta atgattggac 14460

ttacatgcta caacaatgtt aggagaaaga gagagagaga gagagaagcc cagagcagtt 14520

ccacgagtta agaaagagaa gtccaaagcg attgaatatg aagagagaaa gcggttgtgc 14580

taacaggctc cctcaagttt ggctctgagc atccaactca aaaccttaag gcaatgagta 14640

gagtagccca ggaccattta aactcctgtt gaaaacctta cacaaccaat aagggaacaa 14700

gtgtaacatt ctcttacaac cctaccgtct tataagtcag ggctctaatt tagcataaaa 14760

tcaaagtgag gcgatctact atgaaatgaa gaaaataact gataaatata aagaatgtta 14820

attctcccat atagcctgaa tgttcccaga acaaaataaa ttagtctcat gatttatcat 14880

taacatgatg ttcctcttat tttgagtgat taggaaggtt aatcaaggag taaattcttt 14940

ctaatttgta tcgtctagaa ttatttgtct aacaaatttt cagattaccg gtgatcaaaa 15000

gaggaaaata ttttgcatac aacgttacca taccttacaa aagggcgatg aacatttttt 15060

tattttatta ttgtcctttt tttcaattag gggttatgca gtcttcctcc acgtgatatt 15120

actcttagaa tcacgttttt gtcattgcta ttacttactg tggtaagtac aaatgtgttt 15180

tgaactcttt ttggtatgta ttattgagtt aatttttcgt ttccatttca gagctgccgc 15240

tttatcttct gctgggcatc ttttgtggct tagtttcagt ggcattatca agttgtacat 15300

catttatgct gcaaatagtg gaaaatattc aaatgaccag cggcatgcca aaagcagctt 15360

ttcctgtcct gggcggtctt ctggttgggc tggtagcttt agcatatcct gaaatccttt 15420

accagggttt tgagaatgtt aatattctgc tagaatctcg cccactagtg aaaggcctct 15480

ccgctgatct gttgctccag cttgtagctg tcaaaatagt aacaacttca ttatgccgag 15540

cctctggatt ggttggaggc tactatgcgc catctctatt catcggtgct gctactggaa 15600

ctgcatatgg gaaaattgtt agctacatta tctctcatgc tgatccaatc tttcatcttt 15660

ccatcttgga agttgcatcc ccacaagctt atggcctggt atgaatttgt cttttgttag 15720

aagtagcatt acatatctgg ataagtgagt tttttattat tgaaaagtaa taacaggaga 15780

acaagagaat atatcaccca aatctacttc tttcctctct tctattcttc tgaaattcaa 15840

ggtcctttaa ctcctccaca gtctgtctag ttattgatcc tgtagactta attcacatag 15900

gtttaggaca ttcgagttta tccaaacttc atgaaaaggt ttctaatttt tttacattac 15960

attatgagtc gtgtctactt gagaaacata tcactccatg tttctatagt ctgttttctc 16020

cttagtttat tctgatatgt ggggtcctat taagtcagtt caaccttgta ttttcattat 16080

ttttgcagta tcattgataa ttattcaaga tgtacttgga ttttctttac aagagatagt 16140

tctcagttgt tttttgtgtt cctaagtttt tatgctgcaa tacaaaattg gtttgatgtc 16200

tctatttgca tttttcccaa tgataatgcc ttagaatatt ttcttttccg tttcagtagc 16260

ttattatttc tttaggaact ctttatcaga aatctcaact gagatagatg agaggaagaa 16320

taagcatatc attggtctca ttcagtcccc tgtcaagctt agtttcttga gcgatgcggt 16380

ttcacgtcct tttattagat taattggatg cctcatctgc tatccaaaat cagttaactt 16440

tcgatattgt ttcctcgctt acctttatac tctctttccc tcgagtcttt gggagcacat 16500

gttttgttca ataacatagc tcctggaaag tgaccagcgc aaccgacaaa caaggccttc 16560

ttaatgtaga aggtggacat atgctattct agccacggga aagaaagtaa tattgtaatc 16620

aaacccaaat atctgagtat aacctttggc aatggcgatc aatttgatta tatggaccaa 16680

ctttgcctgc atatacccac cgacaaccaa taatagattt accgggaggt agagaaacaa 16740

gctcccaaat accactaata tgtaaagcag atatatctct gatcatagct tgtccttgtg 16800

gacataggga tagaaattaa ggacaaagat gacacaaaag cataatgcgg tgatgataaa 16860

cgatgataac tcaaatcaat ataatgggga tggggattga gagtggatcg aatatctttg 16920

cggaatgcga ttggtagact aggaggagag aagtctgtgg acatgatgtt ggactgagat 16980

caataataag tcaagaatgg tggagctaca gaacatggaa ctggagctgt aggtgacata 17040

atcggagctg taggaggtgg agctatagag gaaggtgaag gagagatagc gactgaatct 17100

ccaaaagatg aaaccggtaa tacctcaaaa aatgtctaag agatcatttg gacctatgaa 17160

gtatgattgc gtttttaaaa aggtaacatc ataaggtcag gtgaataaca ttgatatccc 17220

cgttgcatcc tcgagtaact tagaaatata catttgagag cacggagagc taacttatct 17280

tttctggagc aaggttgtaa acaaaacacg tgctcccaaa gacacgaggt ggaagagaga 17340

aaggtgagtg gggaaacaag acagaggatg aaacttgact cttgatagtt gaagatgaca 17400

tacaattaat aagacaatag gatgtgagat ccaatgacag ttctcatgaa ctgctgaaat 17460

ggagaagaca aatactctgg ggcgttatca ctacgaaatg tgcagttaga aaccccaaat 17520

tgattttgga tttcagtgtg gaaggtctaa aaaatagaga acaactcaga ttgatttttc 17580

atcaagaata tccaagtgga cttggaataa tcatcaatga aactgacaaa gtagcggaat 17640

tccaaggtag aactaacccg acaaggaccc caaacatctg aatggactaa agtgaaaggt 17700

aactctaccc gattatcagg atgtcgaggg aaatgagagt gagtatgcct tctgagcgga 17760

tatgactcac gctctagagt ggacaagtga gacaaacgag gtactatttt ctaaagttct 17820

gataaattgg gatgtcctaa ctgtatatgt aataaatctg gtggatcagt aaaaggacaa 17880

gctgtagggg gaaaaaaata ccaaatattt ccagaagatg gcaaactaca acagaagatg 17940

caactgcatt aacatgctca ggataggtga tgaaatcatt gaggacaaag agttgatcaa 18000

gaaggagatt ctggaatttt accagaactt atatagtgaa aatgaaccct ggaggcgcag 18060

tgcaaatttc gaagacatct cctcactaag catagaagag aagaactggt tggaagctcc 18120

atttgtagaa atagaggtgc ttgaagcttt gaaatcatgt gccccttata aagcaccagg 18180

tccagaaggc ttcactatgg atttctttca gaaaaattgg gatactctta aaacagacat 18240

catggctgca cttaatcatt ttcaccagag ctgtcacatg gttagggctt gcaatgccac 18300

cttcattgcc ctaattccaa agaaaaatgg tgctatggag ctcagagact acagacctat 18360

tagcttgaca ggtattgtat acaaattggt ttcaaagatt ttagcagaga ggctcaagaa 18420

ggtaattgac aaactagtct cgggggaaca aaatgctttc atcaagaaca ggcagatcac 18480

tgatgcttcc ttgattgcca atgaagtgct ggattggaga atgaaaagtg gagaaccagg 18540

cgtgttgtgc aaactggaca ttaaaaaggc ttttgatcaa ttaagctggt cttacctcat 18600

gagtatcttg aggcagatgg gctttgggga gaaatggaga agatggataa actattgcat 18660

ttcaactgtc aagtactctg ttttggtgaa tagggaccca atcggttttt tctcccccca 18720

aaagggccta aggcaggggg atcccctctc ccccttccta ttcattctgg cgatggaagg 18780

actcactaaa atgttggaga aggctaagca actgcaatgg atacaaggct ttcaggtggg 18840

aaggaatcct gccagctcag ttacagtatc tcatctactc tttgcggatg atactcttat 18900

tttctgtggt actgagagat cacaagcacg aaatctcaac ctgacactga tgatcttcga 18960

ggcactatca ggactccaca tcaatatgat aaagagcatc atataccctg tgaatgcagt 19020

ccccaacata caagagctag cagacatcct atgccgcaaa acagacactt tcccaaccac 19080

atatcttgga cttcccttgg gagctaaatt caaatcaaaa gaagtttgga atggagtcct 19140

agagaagttt gaaaagaggc ttgcgacttg gcaaatgcaa tacctcccca tgggtggcag 19200

gttaacttta atcaatagtg tactggacag tcttcccaca taccacatat ctttgttccc 19260

aattccaatc tcagtcctaa agcagatgga caaactcaga aggaagttct tatgggaagg 19320

atgcagcaaa acacacaaat ttccactagt gaaatggctg aaggtaactc aaccaaaatt 19380

caaaggagtc ttgggaatca gggatgctat gctcttaaaa tggctctgga gatatggaca 19440

ggaggaatct aggctatgga aggacatcat atttgctaaa tatggagcac acaaccactg 19500

gtgttccaag aaaacaaact ctccttatgg agttggtctg tggaagaaca tcagcaacca 19560

ctgggatgaa ttcttccaaa atgtaacttt caaagttggg aatgtaactc gtataagttt 19620

tggaaggata gatggcttgg aaatacacct ttgaaagaca tgtttcccag tatgtatcag 19680

attgccgtga ccaaagactc cactgttgct cataatagaa acaatgacac ttggtaccca 19740

cttttcagaa gaaatttgca ggattgggag gtcaacaacc tactcacaat gttaagctcc 19800

ctagaatgtc ataacattga agatcaacaa cctgacaaac ttatttggga aaattctaag 19860

agaggcaagt acacagtcaa agaatgatac attcacctct gtgaccagaa tccaatatat 19920

aactggccat ggaaacatat ctggagaact aaagtgccta ccaagatgac ttgcttcaca 19980

tgattgtctc taaatggggc ctgtctcact caagacaact taatcaagag gaacatcata 20040

taagttaata gatgctacat gtgccaacaa cagtcagaaa gtgtaaagca cttattcctt 20100

cactgctcag ttgcaaaaga aatttggaac ttcttctaca ctacctttgg tctaaaatgg 20160

gttatgccac aatcaactaa gcaagctttt gaaagttggt atttttggag agttgataaa 20220

tccattagaa aaatctggaa aatggtgtcg gccgcaagtt tttggtgtat ttggaaagaa 20280

aggaactgaa gatgttttga tggcatatca actccactca aggctgcgtg tttagttaac 20340

ttattttgct ggaactatct cacccctgtt aatagtgctg atacttctgt ggatttcatt 20400

agccccctga tagtagcata ggcttttgta aatggagcta attatccttt ctcttttgta 20460

ctctttgcat cttcttgatg ccttttaatg aatctaattt acttcatcaa aaagaaaatg 20520

acaagttgtt gaaggaggaa aagatgtgag tccatgtgat ttagcaagga taaggtacta 20580

aagtccattt gattcacgtc cggtaccaat gatccgtctc gtgctgcatt cctgtattaa 20640

aacagagtca tcaagaaata aaatagagca aataagtgat tggccaagcg actagtggat 20700

atgagattaa aaggactatg gggaacataa aaaactgaat tcaaaggtaa ggaaggaagt 20760

ggactagctt aacctattct agttgccatg gtttgagaat cgttggccat tgtgactatt 20820

ggaagtgatt gagagtaaga aatagtagtg aaaggagatt tgttacccga aatataatta 20880

gatgcacctg aatcaatgac ccaaaagtcg gaagaagagg aaacacaagt cacgctatta 20940

cctgtttgaa caatagagat tagtttggat caaatagttg tatagagaac tgaaatttgg 21000

agaaatcaat catatagaac ttgtatgtga ttattgttgc cctttatatt gcgtcaaatc 21060

ctaaaacaca ttgagattaa ctgccactta tcacagaaaa gatattctct agagacattg 21120

ttacaatttc atgaagtcaa gtaattagct tgaacatatc ttcagcaagt ccctcgtcag 21180

tcctcatatt agttacattt gtaacaatgt cggtacataa gacttataag caccagtttg 21240

aggaggagtg gtagagagtt gatgtacata gttaaagtag atatacttac acttagtgtt 21300

atgtaaagag tggatataaa aagggatcag cataagacaa ttgtcttcgc gcgtcttaac 21360

atttttttcc tgtctttatt tctctcatgg tatcagataa cctatctcta tcttggttta 21420

cccaatggtt ggcccccata ttgtattagc catgctccag ttgactaggc ttggacgggc 21480

agaggtgtta aattatccca tattggttga aagaatgagc tattgtctcc ttatatggtc 21540

ttagacaatt ctccaactca tgagatattt tgttttggct gagttagccc taaggtttat 21600

tttttgtcat attctttaac cttatggcaa tgcttgtaca cggaaaaacc ggagtgcaag 21660

acttaaatta ggagaaggaa actattgaag gtgaggaact taaagggttg tgagaataca 21720

cgggagaaaa aaatcttaat actatctagt ggccttgtat atcaaatgat cagcttgcaa 21780

atattttcac caagtccctc actggtcctc gtattagtta catatgtaac aagttcggta 21840

tatatgattt gtatgcaccg gcttgaggtt atgcatattc tattcctcct actatatatg 21900

tgactaggaa atattttact cctactgcat atgggactag gactatttac acataactat 21960

ctaacattcc cctcaagcca gtgcacacaa gtcatatgta ccgagcttgt tacatatgta 22020

actaatacga ggaccagtga gggatttagt aaaaatatct gcaagctggt cattcgacat 22080

acaaggccac tagactcccc ccgagcaaca aaaccaggtg gttgctgata aacagaaact 22140

ggccgaaaag ttgccggaaa aatttgaaaa tagtgagact aagccgaatt ctacactaca 22200

aaataggttc taaaacacca ccagaaaaca aaaacttttc tagaaattac tcttcacacc 22260

ggaaaaaata aaagttgtca gaatttgatg taatttatat agataggttc ggaatcactg 22320

gaggagtaag ttgtcccgaa gaagttttgt caaaaagtgg ccggaatggc tcacatgcgc 22380

cggaaaactt actgtagctc gcaggaaccc tagttctggc ggtgcgtgga ggcgcgtgac 22440

ttaagattaa gatgcttaca ggactatctt gagaaatata catattatat agacgcttga 22500

gttgcttccc aatcctaaat agaagctttt attcgtaggc aagaagggaa gcagctttac 22560

ttgagccaat agctttcaag gtgcacgttg tcacaccaag gacatccaga atttgatttt 22620

atagggggtg tgagaaagca cgggagaaaa tatgttattg atatttggat aataaataca 22680

atacaagagg tccctattta tagctataca ctacaaggag atattactcc tcttccaatg 22740

tgggacaaga atacactata catatctgta aactaacact ccccctcaag tcggtgcata 22800

cacatcatat gtaccgatct tgttacacat gtagctaata cgagaaccaa taagagactt 22860

agtgaaaata tctgctagtt gatcattcga ctttacaaac tttgtaacaa tatctcctga 22920

aagtattttt tctctgacaa agtgacagtc gatctcaatg tgtttagtcc tctcatggaa 22980

caccggattt gacacaatat gaagagtagc ttggttatca cacattagtt ccatcttgct 23040

gatttctccg aattttaact ccttgagcaa ctgcttgacc caaaataact cacacgtcgt 23100

catagccatg gcccgatatt cggcttcggc gctagatcga gcaactacat tctgtttctt 23160

gctcttccac gagaccaaat tacctcctac tagaacacaa tatccagaca tagaacgtct 23220

atcaaaaggt gatcttgccc aatcagcatc tgtgtaccca acaatctgct cgtggccttg 23280

atcctcgaat agtaatcctt tgcccggagc tgactttata taccgaagaa tgcgaacaac 23340

tgcatcccag tgactatcac agggagaatc cataaactga cttacaacac tcaccggaaa 23400

agaaatgtca ggtctagtca ctgtgaggta attcaatttg ccaaccaacc tcctatatct 23460

cgtagggtct ctaagaggct ccccctgtcc aggcagaagc ttagcattca gatccatagg 23520

agagtcaata ggtctgcaac ccatcattcc agtctcctca agaatgtcta agacatactt 23580

ccgctgtgaa ataacaatac ctgagctaga ctgagcgacc tcaataccta aaaaatactt 23640

caatctgccc agatccttag tctggaagtg ctgaaagaga tgttgcttca gattagtaat 23700

accatcctga tcattgccag taataacaat atcatcaaca taaatcacta gataaataca 23760

cagattagga gcagaatgcc gataaaacac agagtgatca gcctcactac gagtcatacc 23820

gaactcctga ataattgtgc tgaacttacc aaaccaagct cgaggggact gtttcaaacc 23880

atatagtgac ctgcgcaatc tgcacacaca accattaaac tcccctaagc aacaaaacca 23940

ggtggttgct ccatataaac ttcttcctca agatcactgt ggagaaaagc attcttaatg 24000

tctaactgat aaagaggcca atgacgtaca acagccatgg acaaaaagag acgaacagat 24060

gctactttag ccacgggaga gaacatatca ctataatcaa gcccaaaaat ctgagtatat 24120

ccttttgcaa caagacgagc cttaaaccga tcaacctggc catccggacc gactttgact 24180

gcataaaccc aacgacaacc aacagtagac ttacctgcag gaagaggaac aagctcccaa 24240

gtgcaactcg catgtaaagc agacatctcg tcaatcatag catgtcgcca tcctggatga 24300

gatagtgcct cacctgtaga cttagggata gaaacagtgg acaaagaaga tataaaagca 24360

taatgaggtg acgacagacg atgataactt aaaccgacat agtggggatt aggattaagt 24420

gtggatcata cacctttgcg gagtgcaatt ggttgactaa gaggagacaa gtccgcagta 24480

ggtgcagaat ctgatgcggg gcgtgaatca cctgggcctg atgctggata tggacgacga 24540

tgataagtca agagtggtgg agctgccgaa ggttgaactg gattatgtgg aggaactgga 24600

gctataggtg gtggagctac aactggagct gtaggtggtg gaactagagt aactgaatct 24660

ccaaaagatg aaactggtag tacctcagaa atatctaagt gatgacctga acctgtgaag 24720

tatgattggg tttcaaagaa ggtaacatca gcagacataa ggtactgctg gaggttagga 24780

gagtagcatc gatacccctt ttgtgttctc gagaaaccta gaaatacgca cttaagagca 24840

cgaggagcta acttatccgt tcctggaata aggttatgca caaaacaagt gcttccaaag 24900

atacgaggtg gaagagagaa caaaggtaag tggtaaaaca tgacagagaa tggaacttgg 24960

ttctggatag ctgatgatgt catacgatta ataagatagc aagatgtaag aactgtatcc 25020

cccaaaaacg caacggagca tgagattgta tgagtagggt acgagcagtt tcaataaaat 25080

gtctattctt tctttcagct accccatttt gttgagatgt gtacagacaa gatgtttgat 25140

gaataatccc atgagatttc ataaactgct gaaatgggga agacaaatac tctcgggcat 25200

tatcactacg aaatgtgcga atagaaaccc caaattgatt ttgaatttca gcgtggaagg 25260

tctggaaaat agaaaacagc tcagatcgat tttttatcaa aaatatccaa gtgcacctgg 25320

aataatcatc aatgaaactg acaaaatagc agaatcccaa ggtggaactg acccgactag 25380

gaccccaaac atctgaatgg actaaagtaa aaggtgactc tgctcgatta tcaagacgcc 25440

taaggaaatg ggagcgagta tgcttaccga gctgacatga ctcacactct agagctgaca 25500

agtgagataa accagatacc attttctgaa gttttgacaa actgggatgt cccaaccgtt 25560

tatgtaataa atctggtgaa tcagtaacag gacatattgt agatggaaga caagatgcga 25620

gtccatgtat ttagcaagga taaggtaata aagtccgttt gattcacgcc cggtaccaat 25680

gatccgcccc gtactgcgtt cttgtataaa aacatggtca tcaagaaata aaataacgca 25740

tttaagtgat ttggctaagc gactaacaac tatgagatta aaaggactat tgcgaacata 25800

aaggactgaa tctaaaggta aggaagaaag tgggcttgct tgacctattg cagttgccat 25860

ggtttgagac ccattggcta ttgtgacttt tggaaaagat tgagaatacg aaatagtagt 25920

gaaaagagat ttgttaccag aaatatgatc tgatgcacct gaatcaatga cccaagactc 25980

agaggatgaa gattgggaaa aacaagtcac gctattacct gtttgaacaa cagaagctat 26040

ctcagaagat gtctgcttac atgctttgta ctaaaggaac tcaatataat ctgctaaaga 26100

aaccatccga ctattcaaag catcggttcc catgtcgcta caatttgtag tagtagggtt 26160

aacttgaaat agtggaaata agtaactccg gtgagaaaac tgaagaaata gcttgaaaac 26220

actgtttaca acagtaaaaa cagaacactg ttctgcgccg gaatctactg tagctgacgg 26280

aaaaactcaa agtagtcgga atgaaacgaa aaacagtagg ggtaggatcg gaattaccag 26340

gcgacccaac tattctgaag gaagtttttc aaaaaatggc cggaagtggt cgtacgtgtc 26400

ggcgcgtgag ctcacgcgcg tgagcttctg gtggcgcgtg gaggcgcgtg aggaggctgc 26460

tgccggagat tttcactggg gtttggtcgc cggacagtga ctactcttgt ggtagtgttg 26520

gattttgcac aacactgacg gagataaagc agacgcaaac agccttgaaa aagtcgccgg 26580

aaaagacttc cggtgactga tttctcttcc tggaatcgct ggaatttatg cacagcgata 26640

aatctctcac aattgctctg ataccatgtg agaaagcatg ggagaaaata tgttattgat 26700

atttggataa taaatacaat acaagaggtc cctatttata gctatacact acaaggagat 26760

attacttctc ttccaatgtg ggacaaaaat acactataca tatctgtaaa ctaacaaggg 26820

gaatatcgtt taaagataaa aaagatagcg tgcagaagat tgcatacatt agagatgcaa 26880

aatacagaat acccatactc ccagataatg cagtatgcct tttgcatgac ccactggttg 26940

aatggaagca cctggtcaat ttactaggtg tgttagtgat ttttgctgct tccttcccct 27000

ttctaaacta catactatct aaaatgttag ggggacagaa gcccagtcaa tctgactagg 27060

tgatgttagt ggtttccgct tctttctccc acttctaaat gcgtactttc tcaaatttag 27120

gagcatagaa acttaagcag ctgcctacct gaggaggtgc atgggaacat aagagaatag 27180

actttacctg tcatattttc cataccttag ttaattacag tgttatcctg ataatgatct 27240

gttttctgta tctaggctga atcgagattc aatcgctttt ggctgaaagg atgctgctac 27300

agatccttag tttacatcat tgtggttctt attctataag tacttcccct atcaactact 27360

tccttctttt ttcttaggtt atttgcctct taggttgttt gcaaggaaag gaacaataga 27420

tgttttgatg gaatagcaac tccaaaccac ttccttaagg ctaatatact gtttggccaa 27480

gcttcttcaa agtccaaagc ccttttttgt cttcaaaaaa gtatcttttt ttcccaaagt 27540

tgaggtgttt ggccaaactt ttggaaggaa aaaaaagtgc ttttgagtaa agcagaagct 27600

cttgagaagt agaaaaagta gttttttccc ggaagcattt ttttgaaaag cacttttgag 27660

aaaaataaac ttagaaacac tttttaaaag tttggccaaa cactaattgc tgcttaaaag 27720

tgtttttcag atttattagc caaacacaaa ctgcttctca ccaaaagtac ttttttgaaa 27780

aatacttttt tgaaaagtga ttttcaaaca aagcactttt caaaataagt ttattttaga 27840

agcttgtcaa ccggctataa atgtctttta tttttacagc tagagtaccc taacacctgt 27900

aaattcccct agacattttt ttcgactttg ttagctcatt aaccctagta taggactctt 27960

tgttttggag ctagcaaact cttttgtttt cctatttttg catcttcttg gtgccattta 28020

taatatctct tacttcacca aaaaaaataa gttcccaaaa tatgactacc ttgagttggc 28080

caaagcataa ccaaagcttg ggcacaccag tgtttgcgtg aattttatgg atgttcctta 28140

cctttatcct tctgtgctta tgtagcatct gtcttggtta atcttttctg aagtctatag 28200

tgtatttctg tgttgcaaca tgagtttact gtcaatctta ctgtttgacc tcaattttgg 28260

gttctttttg attttgaaag acatcgttta acaggttggc atggctgcta ctcttgctgg 28320

tgtctgtcag gtgcctctca ctgctgtttt gcttctcttt gaactgacac agaattatcg 28380

gatagttctg cccctcttgg gagctgtggg gttgtcttct tgggttacat ctggacaaac 28440

aaggaaaagt gtagtgaagg atagagaaag actaaaagat gcaagagccc acatgatgca 28500

gcgacaagga acttctttct ccaacatttc tagtttaact tattcttcag gtgtgaaacc 28560

ttcacagaaa gagagtaacc tatgcaaact tgagagttcc ctctgtcttt atgaatctga 28620

tgatgaagaa aatgatttgg caaggacaat tctagtttca caggcaatga gaacacgata 28680

tgtgacagtt ctaatgagca ccttgctaac ggagaccata tccctcatgc tagctgagaa 28740

gcaatcttgt gcaataatag ttgatgaaaa taattttctc attggtctgc tgacacttag 28800

tgatatccag aattacagca agttgccaag agcagagggc aatttccagg aggtagcttc 28860

ttggtacatt tcaatattct taactgatga aaaaataagg gaaattgatc tagcatgaaa 28920

ttaagctaat tataagtttt acactgtaga actggtaaaa cagggttggc tggatatttc 28980

tttgttgaat ttttaggatt atatgtattg ttttagtttt gtaggttgtt ttctgatgtg 29040

ctttttgact tggcagaatc ttaagatgaa atggaaggtg tttaaccaaa aaatagaatt 29100

ttcagtcaaa gcctatattt agaagaaaac gggttattga taaccaagtt ttactttact 29160

tccccaacaa tctatttggt aaatagcaaa agtaatgcgt atgtgagaaa gcacgggaga 29220

aaatatatta ttgatattag atattcaata taatacaaga ggtcctacac atcatatagc 29280

tatagtctac aaactacata ttactctcat tccaatgtgg gactacacat aactaacact 29340

ccccctcaag ccggtgcata catatcatat gtaccgagct tgttacacat gtaactaata 29400

cgagaaccag taagagactt agtgaaaata tctgctagtt gatcatttga ctttacaaac 29460

tttgtaaaaa tatctcctga aagtattttt tctctgacaa agtaacagtc gatctcaatg 29520

tgtttagtcc tctcatggaa tagcggattt gacgcaatat gaagagcagc ttggttatca 29580

cacaccagtt ccatcttgct gatttctcca aactttaact ccttgagcaa ctgcttgacc 29640

caaactaact ctcacgttgc catagccatt gcccgatatt cgacgtcggc gccagatcga 29700

gcaactacat tctgtttctt gctcttccac gagaccaaat tacctcctac tagaacacaa 29760

tatccaggcg tagaacgtct atcaaaaggt gatcctgccc aatcagcatt tgtgtaccca 29820

acaatttgct cgtggcctcg atcctcgagt agtaatcctt tgcttggaga tgactttata 29880

taccgaagaa tgcgaacaac tgcatcccag tgactatcac agggagaatc cataaactga 29940

cttacaacac tcaccggaaa agaaatgtca ggtctagtca ctgtgaggta attcaatttg 30000

ccaaccaacc tcctatatct cgtagggtct ctaagaggct ccccgtgtct aggcagaagc 30060

ttagcattcg gatccataag agagtcaata ggtctgtaac ccatcattcc agtctcctca 30120

aaaatgtcta aggcataatt ccgctgtgaa ataacaatac ctgagctaga ctgaggcact 30180

gagcaacctc aatacctaga aaatacttca atctgcccag atccttagtc tggaagtgct 30240

gaaagagatg ttgcttcaga ttagtaatat catcctgatc attgccagta ataacaatat 30300

catcaacata aaccactaga taaatacaca gattaggagt aaagtgccga taaaacacag 30360

agagatcagc ctcactacga gtcatggcga actcctgaat aattatgctg aacttaccaa 30420

accaagctcg aggggactgt ttcaaaccat ataatgacct gcacaatcta cacacacaac 30480

cattaaactc cccctgagca acaaaaccag gtggttactc catataaact tcttcctcaa 30540

gatcaccgtg gagaaaagca ttcttaatgt ctaactgata aagaggccaa tgacgtacaa 30600

cagccatgga caaaaagaga cgaacaaatg ctattttagc cacgggagag aaagtatcac 30660

tataatcaag cccaaaaatc tgagtatatc cttttgcaac aagacgagcc ttaagccgat 30720

caacctggcc atccgggccg actttgaccg cataaaccta atgacaacca acattagact 30780

tacctgcagg aagaggaaca agctcccaag tgccactcgc atgtaaagca gacatctcgt 30840

caatcatagc atgtcgccat cctggatgag atagtgcctc acctgtagac ttagggatag 30900

aaacagtgga caaagaagat ataaaagcat aatgaggtga tgacacacga tgatgactta 30960

aaccgacata gtggggatta ggattacgtg tggatcgtac gcctttgcgg agtgcaattg 31020

gttgactaag aggagacaag atcgtagtag gtgcagaatc tgatgcaggg cgtgaatcac 31080

ttgggcatga tgttggatgt ggacgacgat gataagtcaa gagtggtgga gctgcagaag 31140

gttgaactgg attatgtgga ggaactggag gtggagctac aactggagct gtaggtggtg 31200

gaactggagc tataagtggt ggagctacaa ctggagctgg agatgtagag gaagatgaat 31260

gagagatagt gactgaatct ccaaaaaata aaattggtag tacctcagaa atatctaagt 31320

gatgacatga acctgtgaag tatgattgag tttcaaagaa ggtaacatca gcggacataa 31380

ggtaccgctg aaggtcaaga gagtagcatc gatacccctt ttgtgttctc gagtaaccta 31440

gaaatacgca cttaagagca cgaggagcta acttatctgt tcctggagta aggttatgga 31500

caaaacaagt gattccaaag atacagggtg gaagagagaa caaaggtaag tggggaaaca 31560

tgacaaagaa tggaacttgg ttttggataa ctgaagatgg catacgatta ataagatagc 31620

aagatataag aactgcatcc ccccaaaaac gaaacggagc atgagattgt atgagtaggg 31680

tacgagcaat ttcaataaga tgtctatttt ttctttcagc taccccattt tgttgagatg 31740

tgtacagaca agatgtttga tgaataatcc catgagattt cataaactgc tgaaatgggg 31800

aagacaaata ctctcgggca ttatcactag gaaatgtgcg aatagaaacc ccaaattgat 31860

tttgaatttt tagcgtggaa ggtctggaaa aatagaaaac aactcagatc gattttttat 31920

caaaaatatc caagtgcacc ttgaataatc atcaattatt caataaaact gacaaagtag 31980

cagaatccca aggtggaact gacccgacta ggaccccaaa catttgagaa tggactaaag 32040

taaaaggtga ctctgcttga ttatcaagac gccgagggaa atggaagcga gtatgcttat 32100

cgaactgaca tgactcacac tctagagctg acaagtgaga taaaccagat accattttat 32160

gaagttttga caaattggga tgtcccgacc gtttatgtaa taaatttggt gtattagtaa 32220

caggacaagt tgttgaagga agacaagatg tgagtccgtg tgatttagca aggataaggt 32280

aataaagtcc gtttgattca cgtccggtac caataattcg tcccgtactg cgttcctgta 32340

taaaaacatg gtcatcaaga aataaaacaa cgcatttaag tgatttggct aagcgactaa 32400

tagttatgag attaaaagga ctattgggaa cataaatgac tgaatataaa ggtaaggaag 32460

gaagtgagct tgcttgactt attgttgttg ccattgtttg agacctattg gccattgtga 32520

ctcttgaaag agattgaaaa tacgaaatag tagtgaaaag agatttgtta ccagaaatat 32580

gatctgatgc acctgaatca atgacccaaa actcagatga tgaagattgg gagaaacaag 32640

tcacgctatt acctgtttaa acaacagaag ctatcacaga agatgtctgc ttacatgctt 32700

tgtaccgaag gaactcaata taatctgcta aagaaaccat ccgactattc aaagtatcgg 32760

ttcccatgtc gctacaattt gtagtaatag gatggataga ctcggaaaat tgtaaagtta 32820

tcggaatttg tcgtaaccag gatcgagcaa gctgtcttga agaaatggtt tcaaaaaatg 32880

tccggaaagg tcacttttac gccggaaaaa tataaaaatg gtcgaaattt gatttgaatt 32940

agatgggtag gctcggaatt gtgaggagag cagactgtcc tgaagaagct taatgaaaaa 33000

atggccggaa agtggccgga accctcgccg taaaagttgt taccggcgcg tgaaggcgcg 33060

tggcattttt tctgccagat aaattttcag gggttggtcg tcggagggtg atcccttgtg 33120

gtggtgttgg tttttgcaca ataccgacag gccttaggtc acccgaaaat ttgcacgatg 33180

actaagttct ttcttcccgg ttaacgctgg aatgacgcac atcgatcttt tctcactaat 33240

gctatgatac catgtgagaa agcacgggag aaaatatatt attgatatta gatactcaat 33300

ataatacaag aggtcatatt tatagctata gtctacaaag tacatattac tctcattcaa 33360

atgtgggact acacataact aacaacgtaa attaacaaag agaaataagg aatgtaacaa 33420

cagtcaatcc ctaaaatcaa ggtagaaaac tttgataaag cagagaatta tagaatgtat 33480

ttcagtagta cttggaactt gtccttacaa ataaaattct ttatccttat ataggggcgt 33540

acaatcataa catttttcgc acttaattcg aattcattat gagcattaat tgtattgatt 33600

gcccgttatc atagataacc ataactgacg tatttgtaac tataaatgcc ttataacggc 33660

tctgattccc cttccttatt tacttctggt ttgtgtatct ttccttcttt ttagccttta 33720

ttcattcagt tctcgcctct tctttgacaa ctgtcaagcc cgatcctctg ttctgtactg 33780

tctcgtgggt gtttcccccg taccttcctt atattcttaa ttctgttaat tgagagtgtc 33840

acttgtcact atgccattgt tccacgcgtc atgtttcatc cacgtgtaat atcttttttc 33900

caccaataca gataatcccc cactttctga atattctcaa ctgaatattc gggtaagttt 33960

ttatggcggg aattctttgc cgtcgttttt cgagtatcat cgtgtcatct tcagaaccga 34020

tgtgacgtac gtcacgtcta tttaatgcct atgccaggtg gcttctatcg attggctctg 34080

cagtttttta gcgcttttta gggtttttca gcggctgcgt cagtcacgaa gtgacggttc 34140

cattatgacg cttcataatg actaacttta atgatggtcg tgtcttctta ttaatacttc 34200

attccttttt gatctcttgg agtcttcctt cttcagtatc caccacatta cttctttgta 34260

tttctgcatc ttctctttga tattcctttg gacaatcatg tcttcttcta caccagaccc 34320

ccgtaaggtt gtgattgttg acgaacttga tctttctact gctcctacta gaagtaggag 34380

aggtggtaga cttcgtagtc ttggttcact atctaatcgt ggttcttctt cccagggtag 34440

tgctgctaag ccatcttctt ctagacctag ggctccttta acccctagat cttcttctag 34500

gaatagagat ttaaatgatc cagtgcgcga acctacagtt gcagagattg ttcctcaaga 34560

attttctttt gtaactgacc gtgaaaccat aaggaatcaa atttcttcta tagcctccct 34620

caataccgct aacctttatc caagtttaat cagtaatggt cttctctccc gggttcgaag 34680

agaatattac tgaaaccaga tttcccaatt ttagtccctg gtgccaacca gagaattact 34740

ccataccatg ttggtttttc ctttgtttac acctaccctt ttactttagg gttcaaacca 34800

cctattgaac cagtaatcat tgaattctgt cgttatttca acgtgtgtct tggccagatt 34860

gaccacatag tatggagggc tgttcatgcc ttcgttattt atcagatttg gtttccatgc 34920

ctttcacttt tcagcacttg cttcatctct actcccctaa attgtttcgt gaagtagttt 34980

ttactctcgt ggctagaagt aagagagtgt tggttagcct tgaagacgat tgggaccgtg 35040

gctggtacgc tcgttttgtt gctgctccca ctagtgcatt agtgggtgaa gaaaatatgc 35100

ctttcccgga gaaatggaac tttgcacgta agctttcttc tcctcttttt ttttgtctta 35160

aaaaaactcc atgtaatcat atacccactt cttcagcaac tatggaagtt ttttatgctt 35220

gggtagaaaa gatgttaact gctgcgccta tggagaaaag atcctggaaa tacttttctc 35280

aaagatttgg ttggaaagtg aagacgcacg gtacttttta ccttcattgt ttttcctttt 35340

ctcttccttg tttgttcaat gatttctcat ccttcccttt ttttttacta gggtttccga 35400

ttcgtggtat tagtcccgcg tctgttccat caactaggct ttccgtgatt cttgttcagg 35460

aaagaatttt aagtgcttct tcttcaaaaa ggaaaactga cggagcccgt ggctctgatg 35520

acgaagaaga aacagaggag ggttctttgg tgcgaaggtc acgcgtcagg agacgcgtgg 35580

tttctgatga tgaaactact ccttctcatg accctctatc tagttcaatc ccttttagac 35640

tcacggatga gctagagagt acccctttag tgatttctta tgatgatgct gttgatcccc 35700

ctccaagttc tgttgataga ttgtttgctc atggcttcga gggtgatgaa gttttgggcc 35760

tgtttctgaa gaattgcccc ttgcttccct tccagtttca gttttcatta acccttccgt 35820

gtccttacct gatgatactc ctgttgttat tctcgtggct gcttctactc cgtcatctat 35880

tcccgtgact gcttctcatg cagaggccaa accttctagc agcagaaggg caatgaaaag 35940

agttgttgtt gaggttcctg aaggtgagaa cttattaaga aaatccggtc aagccgacgt 36000

gtagttgaaa cctatgctcg gccccgtaga gaagaagaag ttagaaagcc atagctcact 36060

cactttaatg aatgatatcg ttcattcttc cttgaaagta caagcttaat tatatttcct 36120

ttcttttctc tttcttattc ataactcttc ctcctttttt gcagatcaac ttgattggca 36180

cagagcttat gaaaagagtt tctcaggcgg accggcaagt tatagatttg cgcaccgagg 36240

ctgataactg gaaggaacaa ttcgaaggtc ttcaattgga aaaagaggtt ccggcggaag 36300

agaagaatgc tttggaacaa cagatgagag tgattgcctc tgaattagca gttgaaaaag 36360

cttcctcgag ccaggttgga aaggataagt atatacttga atcctccttt gctgaacaac 36420

tttccaaggc aactgaagaa ataaggagtt tgaaggaact ccttaatcaa aaagaggttt 36480

atgcgagaga attggttcaa acacttactc aagttcagga agatctccgt gcctctactt 36540

ataagattca gttcttggaa agttctctcg cttctttgaa gacagcttac gatgcctctg 36600

aagcagaaaa agaagagctg agagctgaga tttaccagtg ggagaaggat tatgagattc 36660

tcgaggataa tctatcgttg gatgtaagtt gggctttctt aaacactcgt ctcgagactc 36720

tagttgaagc caaccatgag ggttttgacc ttaatgctga gattgctaag gctaaagaag 36780

caattgataa aactcagcaa cgtcaaatct tttcctcacc tgaagacgaa ggtcccgaag 36840

gtgatggaga ttga 36854

<210> 12

<211> 753

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. sylvestris; two start codons, translated from SEQ ID NO: 10 of PCT/EP2013/077532

<400> 12

Met Ile Ser Gly Gln Asn Thr Val Leu His Asn Pro Pro Asn Ser Leu

1 5 10 15

Phe Asn Ser Leu Ser Pro Arg His Ile Cys Ile Ser Phe Cys Asn Asp

20 25 30

Lys Ala Leu Lys Lys Ser Val Thr His Ser Ala Pro Arg Phe Ala Arg

35 40 45

Leu Leu Asn Asn Glu Ser Arg Lys Leu Leu Gly Arg His Pro Asn Cys

50 55 60

Trp Pro Trp Ala Arg Arg Pro Ser Leu Pro Pro Gly Arg Ser Ser Asp

65 70 75 80

Gly Asn Ile Glu Lys Glu Gln Asp Met Cys Asp Ser Ser Lys Val Asp

85 90 95

Ser Asp Ser Gly Ile Gln Ile Gly Ser Leu Leu Glu Glu Val Ile Pro

100 105 110

Gln Gly Asn Asn Thr Ala Ile Ile Ser Ala Cys Phe Val Gly Leu Phe

115 120 125

Thr Gly Ile Ser Val Val Leu Phe Asn Ala Ala Val His Glu Ile Arg

130 135 140

Asp Leu Cys Trp Asp Gly Ile Pro Tyr Arg Ala Ala Ser Glu Glu Pro

145 150 155 160

Ile Gly Val His Trp Gln Arg Val Ile Leu Val Pro Ala Cys Gly Gly

165 170 175

Leu Val Val Ser Phe Leu Asn Ala Phe Arg Ala Thr Leu Glu Val Ser

180 185 190

Thr Glu Gly Ser Trp Thr Ser Ser Val Lys Ser Val Leu Glu Pro Val

195 200 205

Leu Lys Thr Met Ala Ala Cys Val Thr Leu Gly Thr Gly Asn Ser Leu

210 215 220

Gly Pro Glu Gly Pro Ser Val Glu Ile Gly Thr Ser Val Ala Lys Gly

225 230 235 240

Val Gly Ala Leu Leu Asp Lys Gly Gly Arg Arg Lys Leu Ser Leu Lys

245 250 255

Ala Ala Gly Ser Ala Ala Gly Ile Ala Ser Gly Phe Asn Ala Ala Val

260 265 270

Gly Gly Cys Phe Phe Ala Val Glu Ser Val Leu Trp Pro Ser Pro Ala

275 280 285

Glu Ser Ser Leu Ser Leu Thr Asn Thr Thr Ser Met Val Ile Leu Ser

290 295 300

Ala Val Ile Ala Ser Val Val Ser Glu Ile Gly Leu Gly Ser Glu Pro

305 310 315 320

Ala Phe Ala Val Pro Gly Tyr Asp Phe Arg Thr Pro Thr Glu Leu Pro

325 330 335

Leu Tyr Leu Leu Leu Gly Ile Phe Cys Gly Leu Val Ser Val Ala Leu

340 345 350

Ser Ser Cys Thr Ser Phe Met Leu Gln Ile Val Glu Asn Ile Gln Thr

355 360 365

Thr Ser Gly Met Pro Lys Ala Ala Phe Pro Val Leu Gly Gly Leu Leu

370 375 380

Val Gly Leu Val Ala Leu Ala Tyr Pro Glu Ile Leu Tyr Gln Gly Phe

385 390 395 400

Glu Asn Val Asn Ile Leu Leu Glu Ser Arg Pro Leu Val Lys Gly Leu

405 410 415

Ser Ala Asp Leu Leu Leu Gln Leu Val Ala Val Lys Ile Val Thr Thr

420 425 430

Ser Leu Cys Arg Ala Ser Gly Leu Val Gly Gly Tyr Tyr Ala Pro Ser

435 440 445

Leu Phe Ile Gly Ala Ala Thr Gly Thr Ala Tyr Gly Lys Ile Val Ser

450 455 460

Tyr Ile Ile Ser His Ala Asp Pro Ile Phe His Leu Ser Ile Leu Glu

465 470 475 480

Val Ala Ser Pro Gln Ala Tyr Gly Leu Val Gly Met Ala Ala Thr Leu

485 490 495

Ala Gly Val Cys Gln Val Pro Leu Thr Ala Val Leu Leu Leu Phe Glu

500 505 510

Leu Thr Gln Asp Tyr Arg Ile Val Leu Pro Leu Leu Gly Ala Val Gly

515 520 525

Leu Ser Ser Trp Val Thr Ser Gly Gln Thr Arg Lys Ser Val Val Lys

530 535 540

Asp Arg Glu Lys Leu Lys Asp Ala Arg Ala His Met Met Gln Arg Gln

545 550 555 560

Gly Thr Ser Phe Ser Asn Ile Ser Ser Leu Thr Tyr Ser Ser Gly Ser

565 570 575

Pro Ser Gln Lys Glu Ser Asn Leu Cys Lys Leu Glu Ser Ser Leu Cys

580 585 590

Leu Tyr Glu Ser Asp Asp Glu Glu Asn Asp Leu Ala Arg Thr Ile Leu

595 600 605

Val Ser Gln Ala Met Arg Thr Arg Tyr Val Thr Val Leu Met Ser Thr

610 615 620

Leu Leu Met Glu Thr Ile Ser Leu Met Leu Ala Glu Lys Gln Ser Cys

625 630 635 640

Ala Ile Ile Val Asp Glu Asn Asn Phe Leu Ile Gly Leu Leu Thr Leu

645 650 655

Gly Asp Ile Gln Asn Tyr Ser Lys Leu Pro Arg Thr Glu Gly Asn Phe

660 665 670

Gln Glu Glu Leu Val Val Ala Gly Val Cys Ser Ser Lys Gly Asn Lys

675 680 685

Cys Arg Val Ser Cys Thr Val Thr Pro Asn Thr Asp Leu Leu Ser Ala

690 695 700

Leu Thr Leu Met Glu Lys His Asp Leu Ser Gln Leu Pro Val Ile Leu

705 710 715 720

Gly Asp Val Glu Asp Glu Gly Ile His Pro Val Gly Ile Leu Asp Arg

725 730 735

Glu Cys Ile Asn Val Ala Cys Arg Ala Leu Ala Thr Arg Glu Gln Leu

740 745 750

Cys

<210> 13

<211> 818

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; one start codon, translated from SEQ ID NO: 4 of PCT/EP2013/077532

<400> 13

Met Cys Asp Ser Ser Lys Asp Asp Ser Asp Ser Asp Ser Gly Ile Gln

1 5 10 15

Ile Gly Ser Leu Leu Glu Glu Val Ile Pro Gln Gly Asn Asn Thr Ala

20 25 30

Ile Ile Ser Ala Cys Phe Val Gly Leu Phe Thr Gly Ile Ser Val Val

35 40 45

Leu Phe Asn Ala Ala Val His Glu Ile Arg Asp Leu Cys Trp Asp Gly

50 55 60

Ile Pro Tyr Arg Ala Ala Ser Glu Glu Pro Ile Gly Val His Trp Gln

65 70 75 80

Arg Val Ile Leu Val Pro Ala Cys Gly Gly Leu Val Val Ser Phe Leu

85 90 95

Asn Ala Phe Arg Ala Thr Leu Glu Val Ser Thr Glu Glu Ser Trp Thr

100 105 110

Ser Ser Val Lys Ser Val Leu Gly Pro Val Leu Lys Thr Met Ala Ala

115 120 125

Cys Val Thr Leu Gly Thr Gly Asn Ser Leu Gly Pro Glu Gly Pro Ser

130 135 140

Val Glu Ile Gly Thr Ser Val Ala Lys Gly Val Gly Ala Leu Leu Asp

145 150 155 160

Lys Gly Gly Arg Arg Lys Leu Ser Leu Lys Ala Ala Gly Ser Ala Ala

165 170 175

Gly Ile Ala Ser Gly Phe Asn Ala Ala Val Gly Gly Cys Phe Phe Ala

180 185 190

Val Glu Ser Val Leu Trp Pro Ser Pro Ala Glu Ser Ser Leu Tyr Leu

195 200 205

Thr Asn Thr Thr Ser Met Val Ile Leu Ser Ala Val Ile Ala Ser Val

210 215 220

Val Ser Glu Ile Gly Leu Gly Ser Glu Pro Ala Phe Ala Val Pro Gly

225 230 235 240

Tyr Asp Phe Arg Thr Pro Thr Glu Leu Pro Leu Tyr Leu Leu Leu Gly

245 250 255

Ile Phe Cys Gly Leu Val Ser Val Ala Leu Ser Ser Cys Thr Ser Phe

260 265 270

Met Leu Gln Ile Val Glu Asn Ile Gln Met Thr Ser Gly Met Pro Lys

275 280 285

Ala Ala Phe Pro Val Leu Gly Gly Leu Leu Val Gly Leu Val Ala Leu

290 295 300

Ala Tyr Pro Glu Ile Leu Tyr Gln Gly Phe Glu Asn Val Asn Ile Leu

305 310 315 320

Leu Glu Ser Arg Pro Leu Val Lys Gly Leu Ser Ala Asp Leu Leu Leu

325 330 335

Gln Leu Val Ala Val Lys Ile Val Thr Thr Ser Leu Cys Arg Ala Ser

340 345 350

Gly Leu Val Gly Gly Tyr Tyr Ala Pro Ser Leu Phe Ile Gly Ala Ala

355 360 365

Thr Gly Thr Ala Tyr Gly Lys Ile Val Ser Tyr Ile Ile Ser His Ala

370 375 380

Asp Pro Ile Phe His Leu Ser Ile Leu Glu Val Ala Ser Pro Gln Ala

385 390 395 400

Tyr Gly Leu Val Gly Met Ala Ala Thr Leu Ala Gly Val Cys Gln Val

405 410 415

Pro Leu Thr Ala Val Leu Leu Leu Phe Glu Leu Thr Gln Asn Tyr Arg

420 425 430

Ile Val Leu Pro Leu Leu Gly Ala Val Gly Leu Ser Ser Trp Val Thr

435 440 445

Ser Gly Gln Thr Arg Lys Ser Val Val Lys Asp Arg Glu Arg Leu Lys

450 455 460

Asp Ala Arg Ala His Met Met Gln Arg Gln Gly Thr Ser Phe Ser Asn

465 470 475 480

Ile Ser Ser Leu Thr Tyr Ser Ser Gly Val Lys Pro Ser Gln Lys Glu

485 490 495

Ser Asn Leu Cys Lys Leu Glu Ser Ser Leu Cys Leu Tyr Glu Ser Asp

500 505 510

Asp Glu Glu Asn Asp Leu Ala Arg Thr Ile Leu Val Ser Gln Ala Met

515 520 525

Arg Thr Arg Tyr Val Thr Val Leu Met Ser Thr Leu Leu Thr Glu Thr

530 535 540

Ile Ser Leu Met Leu Ala Glu Lys Gln Ser Cys Ala Ile Ile Val Asp

545 550 555 560

Glu Asn Asn Phe Leu Ile Gly Leu Leu Thr Leu Ser Asp Ile Gln Asn

565 570 575

Tyr Ser Lys Leu Pro Arg Ala Glu Gly Asn Phe Gln Glu Ile Asn Leu

580 585 590

Ile Gly Thr Glu Leu Met Lys Arg Val Ser Gln Ala Asp Arg Gln Val

595 600 605

Ile Asp Leu Arg Thr Glu Ala Asp Asn Trp Lys Glu Gln Phe Glu Gly

610 615 620

Leu Gln Leu Glu Lys Glu Val Pro Ala Glu Glu Lys Asn Ala Leu Glu

625 630 635 640

Gln Gln Met Arg Val Ile Ala Ser Glu Leu Ala Val Glu Lys Ala Ser

645 650 655

Ser Ser Gln Val Gly Lys Asp Lys Tyr Ile Leu Glu Ser Ser Phe Ala

660 665 670

Glu Gln Leu Ser Lys Ala Thr Glu Glu Ile Arg Ser Leu Lys Glu Leu

675 680 685

Leu Asn Gln Lys Glu Val Tyr Ala Arg Glu Leu Val Gln Thr Leu Thr

690 695 700

Gln Val Gln Glu Asp Leu Arg Ala Ser Thr Tyr Lys Ile Gln Phe Leu

705 710 715 720

Glu Ser Ser Leu Ala Ser Leu Lys Thr Ala Tyr Asp Ala Ser Glu Ala

725 730 735

Glu Lys Glu Glu Leu Arg Ala Glu Ile Tyr Gln Trp Glu Lys Asp Tyr

740 745 750

Glu Ile Leu Glu Asp Asn Leu Ser Leu Asp Val Ser Trp Ala Phe Leu

755 760 765

Asn Thr Arg Leu Glu Thr Leu Val Glu Ala Asn His Glu Gly Phe Asp

770 775 780

Leu Asn Ala Glu Ile Ala Lys Ala Lys Glu Ala Ile Asp Lys Thr Gln

785 790 795 800

Gln Arg Gln Ile Phe Ser Ser Pro Glu Asp Glu Gly Pro Glu Gly Asp

805 810 815

Gly Asp

<210> 14

<211> 906

<212> PRT

<213> Nicotiana tabacum

<220>

<223> Protein sequence of NtCLCe from Nicotiana tabacum; sequence originating from the ancestor N. tomentosiformis; two start codons, translated from SEQ ID NO: 11 of PCT/EP2013/077532

<400> 14

Met Ile Ser Gly Gln Asn Thr Val Leu His His Pro Pro Asn Ser Leu

1 5 10 15

Phe Asn Ser Leu Ser Pro Arg His Ile Cys Val Ser Phe Cys Asn Asp

20 25 30

Lys Ala Leu Lys Lys Ser Val Thr His Ser Ala Pro Arg Phe Ala Arg

35 40 45

Leu Leu Asn Asn Glu Ser Arg Lys Leu Leu Gly Arg His Pro Asn Cys

50 55 60

Trp Pro Trp Ala Arg Arg Pro Ser Leu Pro Pro Gly Arg Ser Cys Asp

65 70 75 80

Gly Asn Ile Glu Lys Glu Gln Asp Met Cys Asp Ser Ser Lys Asp Asp

85 90 95

Ser Asp Ser Asp Ser Gly Ile Gln Ile Gly Ser Leu Leu Glu Glu Val

100 105 110

Ile Pro Gln Gly Asn Asn Thr Ala Ile Ile Ser Ala Cys Phe Val Gly

115 120 125

Leu Phe Thr Gly Ile Ser Val Val Leu Phe Asn Ala Ala Val His Glu

130 135 140

Ile Arg Asp Leu Cys Trp Asp Gly Ile Pro Tyr Arg Ala Ala Ser Glu

145 150 155 160

Glu Pro Ile Gly Val His Trp Gln Arg Val Ile Leu Val Pro Ala Cys

165 170 175

Gly Gly Leu Val Val Ser Phe Leu Asn Ala Phe Arg Ala Thr Leu Glu

180 185 190

Val Ser Thr Glu Glu Ser Trp Thr Ser Ser Val Lys Ser Val Leu Gly

195 200 205

Pro Val Leu Lys Thr Met Ala Ala Cys Val Thr Leu Gly Thr Gly Asn

210 215 220

Ser Leu Gly Pro Glu Gly Pro Ser Val Glu Ile Gly Thr Ser Val Ala

225 230 235 240

Lys Gly Val Gly Ala Leu Leu Asp Lys Gly Gly Arg Arg Lys Leu Ser

245 250 255

Leu Lys Ala Ala Gly Ser Ala Ala Gly Ile Ala Ser Gly Phe Asn Ala

260 265 270

Ala Val Gly Gly Cys Phe Phe Ala Val Glu Ser Val Leu Trp Pro Ser

275 280 285

Pro Ala Glu Ser Ser Leu Tyr Leu Thr Asn Thr Thr Ser Met Val Ile

290 295 300

Leu Ser Ala Val Ile Ala Ser Val Val Ser Glu Ile Gly Leu Gly Ser

305 310 315 320

Glu Pro Ala Phe Ala Val Pro Gly Tyr Asp Phe Arg Thr Pro Thr Glu

325 330 335

Leu Pro Leu Tyr Leu Leu Leu Gly Ile Phe Cys Gly Leu Val Ser Val

340 345 350

Ala Leu Ser Ser Cys Thr Ser Phe Met Leu Gln Ile Val Glu Asn Ile

355 360 365

Gln Met Thr Ser Gly Met Pro Lys Ala Ala Phe Pro Val Leu Gly Gly

370 375 380

Leu Leu Val Gly Leu Val Ala Leu Ala Tyr Pro Glu Ile Leu Tyr Gln

385 390 395 400

Gly Phe Glu Asn Val Asn Ile Leu Leu Glu Ser Arg Pro Leu Val Lys

405 410 415

Gly Leu Ser Ala Asp Leu Leu Leu Gln Leu Val Ala Val Lys Ile Val

420 425 430

Thr Thr Ser Leu Cys Arg Ala Ser Gly Leu Val Gly Gly Tyr Tyr Ala

435 440 445

Pro Ser Leu Phe Ile Gly Ala Ala Thr Gly Thr Ala Tyr Gly Lys Ile

450 455 460

Val Ser Tyr Ile Ile Ser His Ala Asp Pro Ile Phe His Leu Ser Ile

465 470 475 480

Leu Glu Val Ala Ser Pro Gln Ala Tyr Gly Leu Val Gly Met Ala Ala

485 490 495

Thr Leu Ala Gly Val Cys Gln Val Pro Leu Thr Ala Val Leu Leu Leu

500 505 510

Phe Glu Leu Thr Gln Asn Tyr Arg Ile Val Leu Pro Leu Leu Gly Ala

515 520 525

Val Gly Leu Ser Ser Trp Val Thr Ser Gly Gln Thr Arg Lys Ser Val

530 535 540

Val Lys Asp Arg Glu Arg Leu Lys Asp Ala Arg Ala His Met Met Gln

545 550 555 560

Arg Gln Gly Thr Ser Phe Ser Asn Ile Ser Ser Leu Thr Tyr Ser Ser

565 570 575

Gly Val Lys Pro Ser Gln Lys Glu Ser Asn Leu Cys Lys Leu Glu Ser

580 585 590

Ser Leu Cys Leu Tyr Glu Ser Asp Asp Glu Glu Asn Asp Leu Ala Arg

595 600 605

Thr Ile Leu Val Ser Gln Ala Met Arg Thr Arg Tyr Val Thr Val Leu

610 615 620

Met Ser Thr Leu Leu Thr Glu Thr Ile Ser Leu Met Leu Ala Glu Lys

625 630 635 640

Gln Ser Cys Ala Ile Ile Val Asp Glu Asn Asn Phe Leu Ile Gly Leu

645 650 655

Leu Thr Leu Ser Asp Ile Gln Asn Tyr Ser Lys Leu Pro Arg Ala Glu

660 665 670

Gly Asn Phe Gln Glu Ile Asn Leu Ile Gly Thr Glu Leu Met Lys Arg

675 680 685

Val Ser Gln Ala Asp Arg Gln Val Ile Asp Leu Arg Thr Glu Ala Asp

690 695 700

Asn Trp Lys Glu Gln Phe Glu Gly Leu Gln Leu Glu Lys Glu Val Pro

705 710 715 720

Ala Glu Glu Lys Asn Ala Leu Glu Gln Gln Met Arg Val Ile Ala Ser

725 730 735

Glu Leu Ala Val Glu Lys Ala Ser Ser Ser Gln Val Gly Lys Asp Lys

740 745 750

Tyr Ile Leu Glu Ser Ser Phe Ala Glu Gln Leu Ser Lys Ala Thr Glu

755 760 765

Glu Ile Arg Ser Leu Lys Glu Leu Leu Asn Gln Lys Glu Val Tyr Ala

770 775 780

Arg Glu Leu Val Gln Thr Leu Thr Gln Val Gln Glu Asp Leu Arg Ala

785 790 795 800

Ser Thr Tyr Lys Ile Gln Phe Leu Glu Ser Ser Leu Ala Ser Leu Lys

805 810 815

Thr Ala Tyr Asp Ala Ser Glu Ala Glu Lys Glu Glu Leu Arg Ala Glu

820 825 830

Ile Tyr Gln Trp Glu Lys Asp Tyr Glu Ile Leu Glu Asp Asn Leu Ser

835 840 845

Leu Asp Val Ser Trp Ala Phe Leu Asn Thr Arg Leu Glu Thr Leu Val

850 855 860

Glu Ala Asn His Glu Gly Phe Asp Leu Asn Ala Glu Ile Ala Lys Ala

865 870 875 880

Lys Glu Ala Ile Asp Lys Thr Gln Gln Arg Gln Ile Phe Ser Ser Pro

885 890 895

Glu Asp Glu Gly Pro Glu Gly Asp Gly Asp

900 905

<210> 15

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 15

ctctgctcga g 11

<210> 16

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 16

aagttatccc a 11

<210> 17

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 17

aatacgtgat 10

<210> 18

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 18

tttgttggga 10

<210> 19

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 19

accagaaggc 10

<210> 20

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 20

ctagtgttga 10

<210> 21

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 21

aatcgcttct 10

<210> 22

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 22

tgcgacagca 10

<210> 23

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 23

caaagtcgat a 11

<210> 24

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 24

tataatctcg g 11

<210> 25

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 25

ttgctttgtt 10

<210> 26

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 26

tgaagacaat 10

<210> 27

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 27

gccgcttgtg 10

<210> 28

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 28

gctttgttgg c 11

<210> 29

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 29

tcttcaccgg 10

<210> 30

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 30

agatatgtgc 10

<210> 31

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 31

acagcagcaa 10

<210> 32

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 32

aatctcggct t 11

<210> 33

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 33

ctttgttggc c 11

<210> 34

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 34

caataatacc g 11

<210> 35

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 35

tataatctcg g 11

<210> 36

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 36

gctggaatcg 10

<210> 37

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 37

ttctggtttg t 11

<210> 38

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 38

ctcttcaccg 10

<210> 39

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 39

tatcagtgtc 10

<210> 40

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 40

ccagcttgtg 10

<210> 41

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 41

cggtttggta g 11

<210> 42

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 42

ccaagggagt t 11

<210> 43

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 43

gagctctgct 10

<210> 44

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 44

agctctgctt 10

<210> 45

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 45

ataaaggtgg t 11

<210> 46

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 46

ctcaaggctg 10

<210> 47

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 47

tggatcagct g 11

<210> 48

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 48

tggatcagct g 11

<210> 49

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 49

tggaatcgct t 11

<210> 50

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 50

gacaatggcc g 11

<210> 51

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 51

ttgtgtcaca 10

<210> 52

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 52

gtgtcacatt a 11

<210> 53

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 53

gaactgggaa 10

<210> 54

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 54

ctggtttgtt c 11

<210> 55

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 55

ccatattatt c 11

<210> 56

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 56

accagcttgt g 11

<210> 57

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 57

cggtttggta g 11

<210> 58

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 58

ggtcgtagaa a 11

<210> 59

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 59

ctgtcactca a 11

<210> 60

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 60

gtatccagat a 11

<210> 61

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 61

gatctctgct 10

<210> 62

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 62

ggagcccatt 10

<210> 63

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 63

gagtacattg g 11

<210> 64

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 64

tcaaggctgc t 11

<210> 65

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 65

gatcagctgc 10

<210> 66

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 66

accagaaggc c 11

<210> 67

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 67

tagtgttgaa at 12

<210> 68

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 68

aacaagatat 10

<210> 69

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 69

tgcgacagca g 11

<210> 70

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 70

atgtgcgaca 10

<210> 71

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 71

cagcaaagac ga 12

<210> 72

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 72

cccttggtta g 11

<210> 73

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 73

ttcatgaaat a 11

<210> 74

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 74

cggtttggta 10

<210> 75

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 75

gacaatggcc g 11

<210> 76

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 76

ttgtgtcaca t 11

<210> 77

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 77

aactgggaat t 11

<210> 78

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 78

cttaggacca 10

<210> 79

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 79

gaatcgcttc t 11

<210> 80

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 80

gtttgttccc 10

<210> 81

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 81

cattgccatg g 11

<210> 82

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 82

atcttataca 10

<210> 83

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 83

attgcatatt g 11

<210> 84

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 84

gactcatcac t 11

<210> 85

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 85

ccttcttttg 10

<210> 86

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 86

ttctcaagaa a 11

<210> 87

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 87

cttcaaccta a 11

<210> 88

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 88

tatttatgaa 10

<210> 89

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 89

gagtagtgcc a 11

<210> 90

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 90

cggtgggtct 10

<210> 91

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 91

ctggtgagct t 11

<210> 92

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 92

ctgatgtaaa g 11

<210> 93

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 93

gatttgcatc 10

<210> 94

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 94

cctgactaac 10

<210> 95

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 95

gtaccttatg 10

<210> 96

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 96

gatttgcata 10

<210> 97

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 97

tttgatagct g 11

<210> 98

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 98

ccttctctgc g 11

<210> 99

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 99

agctgagagg g 11

<210> 100

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 100

cggtaagatc 10

<210> 101

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 101

tcaggcaggt g 11

<210> 102

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 102

ggctccgcca 10

<210> 103

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 103

gtaccttatg 10

<210> 104

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 104

gatttgcata 10

<210> 105

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 105

ctactgctgc a 11

<210> 106

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 106

ggcctggaat t 11

<210> 107

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 107

gattgctgtg 10

<210> 108

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 108

catctggtct c 11

<210> 109

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 109

cggagcagct t 11

<210> 110

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 110

ccttatggct 10

<210> 111

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 111

cagggctgta t 11

<210> 112

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 112

cggttctcgg 10

<210> 113

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 113

ggttctcgga g 11

<210> 114

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 114

agcttccctt a 11

<210> 115

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 115

catcactttt g 11

<210> 116

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 116

gtggggctcc 10

<210> 117

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 117

ccacatgctc 10

<210> 118

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 118

tgcggttctc g 11

<210> 119

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 119

agcagcttcc 10

<210> 120

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 120

atgccaaccc g 11

<210> 121

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 121

agccatggat g 11

<210> 122

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 122

aggagtggga a 11

<210> 123

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 123

tgagagagaa a 11

<210> 124

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 124

cagggctgta t 11

<210> 125

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 125

ccgttctggg a 11

<210> 126

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 126

gcgtcatatt t 11

<210> 127

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 127

ttgagctaac a 11

<210> 128

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 128

gccatggatg a 11

<210> 129

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 129

aaatatcact 10

<210> 130

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 130

caaataccaa 10

<210> 131

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 131

cagcaggggt g 11

<210> 132

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 132

cttatggctg 10

<210> 133

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 133

ttcaatgaga a 11

<210> 134

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 134

cacttcaagg gt 12

<210> 135

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 135

ttgtcctggc a 11

<210> 136

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 136

cattgccatg 10

<210> 137

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 137

gatcttatac a 11

<210> 138

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 138

ttctccttct g 11

<210> 139

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 139

caataacaat gc 12

<210> 140

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 140

gctgagaggg 10

<210> 141

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 141

cggtaagatc ga 12

<210> 142

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 142

tttgggattg 10

<210> 143

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 143

tgtgccatct g 11

<210> 144

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 144

ctccgccaca tg 12

<210> 145

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 145

tcattgtacc 10

<210> 146

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 146

gcatcccctg a 11

<210> 147

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 147

taacacaacc c 11

<210> 148

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 148

caataacaat 10

<210> 149

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 149

ctggttcttc 10

<210> 150

<211> 12

<212> DNA

<213> Nicotiana tabacum

<400> 150

gccaacccgg ag 12

<210> 151

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 151

catggatgag a 11

<210> 152

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 152

ccttaatgaa a 11

<210> 153

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 153

acgaaggaca 10

<210> 154

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 154

gtgggaagtg a 11

<210> 155

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 155

agagaaattc 10

<210> 156

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 156

tccctgtcgt c 11

<210> 157

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 157

atgaaggagt g 11

<210> 158

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 158

gaactcacct t 11

<210> 159

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 159

ttttggttct c 11

<210> 160

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 160

caggcaggtg 10

<210> 161

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 161

ggctccgcca c 11

<210> 162

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 162

atggctggtt 10

<210> 163

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 163

aatgagaatg a 11

<210> 164

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 164

tggtgagctt 10

<210> 165

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 165

ctgatgtaaa g 11

<210> 166

<211> 10

<212> DNA

<213> Nicotiana tabacum

<400> 166

aaggacagag 10

<210> 167

<211> 11

<212> DNA

<213> Nicotiana tabacum

<400> 167

agtgggaagt g 11

<210> 168

<211> 21

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 168

tatctcctcg ccatatctgt a 21

<210> 169

<211> 22

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 169

gtgcaaacac acttgtattt ac 22

<210> 170

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 170

accatctctt cctccggga 19

<210> 171

<211> 23

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 171

tataggatac tcctctgata aat 23

<210> 172

<211> 23

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 172

ttgtacaatt tatcagagga gta 23

<210> 173

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 173

ttggtttgag tgcaaacaca 20

<210> 174

<211> 22

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 174

actatatcga ggatagaagg ta 22

<210> 175

<211> 23

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 175

tatctattta tacatctggt tcg 23

<210> 176

<211> 20

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 176

cttgtgatcc atcacttccc 20

<210> 177

<211> 23

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 177

tatgactatt tctgtgcatc ttt 23

<210> 178

<211> 22

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 178

gccttgtgat tcatcacttc aa 22

<210> 179

<211> 23

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 179

tatgactatt tctgtgcatc tta 23

<210> 180

<211> 19

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Forward primer

<400> 180

ggttcttctc gctctgagc 19

<210> 181

<211> 22

<212> DNA

<213> Artificial sequence

<220>

<223> Synthetic sequence: Reverse primer

<400> 181

aacgtaaaat aactttgcca cg 22

<---

1. Мутантная растительная клетка табака для снижения уровней нитратов в мутантном растении табака, где мутантная растительная клетка табака содержит одну или несколько мутацию в

(i) полинуклеотиде, содержащем последовательность, кодирующую член семейства CLC хлоридных каналов и имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 1;

(ii) полипептиде, кодируемом полинуклеотидом, представленным в (i); или

(iii) полипептиде члена семейства CLC хлоридных каналов, содержащем последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 5;

и где одна или несколько мутаций согласно (i)-(iii) содержит мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5;

и где экспрессия или активность члена семейства CLC хлоридных каналов снижена по сравнению с растительной клеткой табака дикого типа, в которой экспрессия или активность члена семейства CLC хлоридных каналов не была снижена;

уровни нитратов в мутантном растении табака, содержащем мутантную растительную клетку табака, снижены по сравнению с растением табака дикого типа, содержащим растительную клетку табака дикого типа; и

уровни табак-специфичных нитрозаминов (TSNA) в высушенном мутантном растении табака, содержащем мутантную растительную клетку табака, снижены по сравнению с высушенным растением табака дикого типа, содержащим растительную клетку табака дикого типа.

2. Мутантное растение табака для получения годных к потреблению табачных изделий, содержащее мутантную растительную клетку табака по п. 1.

3. Часть мутантного растения табака по п. 2 для получения годных к потреблению табачных изделий, где указанная часть содержит мутантную растительную клетку табака по п. 1.

4. Способ снижения содержания нитратов по меньшей мере в части растения табака, включающий этапы:

(a) введения в геном растения табака одной или несколько мутаций в пределах по меньшей мере одного аллеля члена семейства CLC хлоридных каналов, включающий:

(i) полинуклеотид, содержащий последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 1;

(ii) полипептид, кодируемый полинуклеотидом, представленным в (i); или

(iii) полипептид, содержащий последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 5;

и где одна или несколько мутаций согласно (i)-(iii) содержит мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5;

(b) получения мутантного растения табака согласно (a), в котором указанная мутация снижает экспрессию или активность члена семейства CLC хлоридных каналов по сравнению с растением табака дикого ипа, в котором экспрессия или активность члена семейства CLC хлоридных каналов не была снижена.

5. Способ по п. 4, где содержание 4-(метилнитрозамино)-1-(3-пиридил)-1-бутанона (NNK) и/или содержание никотина снижают в мутантном растении табака и/или где содержание N-нитрозоникотина (NNN) является по существу таким же, как в растении табака дикого типа, в котором экспрессия или активность полинуклеотида или полипептида не была снижена.

6. Способ по п. 4 или 5, где часть растения табака представляет собой лист, соответственно высушенный лист.

7. Мутантное растение табака по п. 2, где содержание 4-(метилнитрозамино)-1-(3- пиридил)-1-бутанона (NNK) составляет приблизительно 110 нг/г или менее, необязательно, где содержание нитратов составляет приблизительно 7 мг/г или менее.

8. Растительный материал табака для получения годных к потреблению табачных изделий, включающий биомассу, семена, стебель или листья, содержащий мутантную растительную клетку табака по п. 1.

9. Табачная композиция для снижения уровней нитрозаминов (TSNA), поглощаемых потребителями, где табачное изделие содержит мутантную растительную клетку табака по п. 1, по меньшей мере часть мутантного растения табака по п. 2 или растительный материал табака по п. 8.

10. Способ получения высушенного растительного материала табака, предпочтительно высушенных листьев, со сниженными в нем уровнями 4-(метилнитрозамино)-1-(3- пиридил)-1-бутанона (NNK), включающий этапы:

(а) получения по меньшей мере части мутантного растения табака по п. 2 или 7 или растительного материала табака по п. 8;

(b) необязательно сбора с него растительного материала табака и

(c) сушки растительного материала табака в течение периода времени, подходящего для данного типа табака.

11. Полинуклеотидная конструкция для снижения уровней нитратов в растении табака, содержащая последовательность, кодирующую член семейства CLC хлоридных каналов и имеющую последовательность, представленную в SEQ ID NO: 1, и содержащая мутацию замены в положении, соответствующем G163 последовательности SEQ ID NO: 5.

12. Вектор для снижения уровней нитратов в растении табака, содержащий полинуклеотидную конструкцию по п. 11.

13. Вектор экспрессии для снижения уровней нитратов в растении табака, содержащий полинуклеотидную конструкцию по п. 11.



 

Похожие патенты:

Изобретение относится к генной инженерии. Предложен способ введения биаллельной модификации в целевой геномный локус с использованием системы CRISPR/Cas9, включающий введение Cas9, двух гидовых РНК и нацеливающего вектора, содержащего полинуклеотидную вставку, фланкированную 5' гомологичным плечом, которое гибридизуется с целевой 5'-последовательностью в пределах целевого геномного локуса, и 3' гомологичным плечом, которое гибридизуется с целевой 3'-последовательностью в пределах целевого геномного локуса.

Группа изобретений относится к соединениям и композициям, которые представляют собой специфический ингибитор ANGPTL3, а также к способу для снижения экспрессии мРНК и белка ANGPTL3 у животного.

Изобретение относится к области биохимии, в частности к мутантной клетке растения табака, имеющей сниженный уровень норникотина по сравнению с клеткой растения табака дикого типа, а также к растению табака, растительному материалу и табачной композиции, содержащей вышеуказанную клетку.

Изобретение относится к биотехнологии, молекулярной биологии, генетической инженерии и медицине. Описан искусственнй ген, используемый для создания вакцины против коронавируса SARS-CoV-2, кодирующий искусственный белок-иммуноген, представляющий собой бицистронную структуру, состоящую из последовательностей рецептор-связывающего домена (RBD) гликопротеина S коронавируса SARS-CoV-2, гетерологического сигнального пептида гемагглютинина (HA) вируса гриппа А, линкера, P2A-пептида для расщепления полипротеина во время трансляции и гликопротеина G с мутацией M(1)>P(1), предотвращающей альтернативную инициацию трансляции, представленных в SEQ ID NO:1, длиной 2355 п.н.

Изобретение относится к биотехнологии, в частности к генетической инженерии, и может быть использовано для выявления генетического материала (РНК) коронавирусов человека SARS и 2019-nCoV в клинических образцах.

Настоящее изобретение относится к области биотехнологии, конкретно к способу получения условно активных белков. Изобретение позволяет методами генной инженерии получить терапевтические и диагностические молекулы белков, которые более активны при абберантном условии, чем при нормальном физиологическом условии.

Изобретение относится к области биохимии, в частности комплексу для повышения термостойкости у растения, содержащему активазу Rubisco (RCA) из Oryza australiensis и рибулозо-1,5-бифосфаткарбоксилазу/оксигеназу (Rubisco) из растения, отличного от O.

Изобретение относится к области биотехнологии. В настоящем описании описаны ранпирназа и амфиназа, композиции, содержащие ранпирназу и/или амфиназу, а также способы и применения для лечения вирусного конъюнктивита, эпидемического кератоконъюнктивита и/или фарингоконъюнктивальной лихорадки, уменьшения или подавления уровня вируса или титра вируса, уменьшения или подавления репликации вируса, уменьшения или подавления синтеза белка, уменьшения или подавления уровня тРНК, уменьшения или подавления уровня индуцирующей воспаление молекулы и/или индуцирующего воспаление простагландина, стимуляции или улучшения сигнала пути рецептора, активируемого пролифератором пероксисом (PPAR), содействия установлению изменения фенотипа M1 в М2, модуляции Th1- и Th2-цитокинов и/или уменьшения или подавления сигнала NFκB-пути с применением ранпирназы, амфиназы или композиции, содержащей ранпирназу и/или амфиназу.

Изобретение относится к биотехнологии, в частности к новому промотору, к вектору, содержащему этот промотор, к микроорганизму, содержащему этот промотор или вектор, и к способу получения целевого продукта с использованием этого микроорганизма.

Изобретение относится к биотехнологии. Описана группа изобретений, включающая применение состава в качестве лизирующего агента содержащихся в цельной крови клеток, в качестве средства для стабилизации общей РНК в цельной крови и для выделения РНК посредством адсорбции из смеси цельной крови с составом адсорбентом для нуклеиновых кислот и способ выделения всей РНК из цельной крови.

Изобретение относится к области биохимии, в частности к рекомбинантному полипептиду PtIP-96, обладающему инсектицидной активностью против совки кукурузной (Helicoverpa zea).
Наверх