Направляемая рнк регуляция транскрипции



Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
Направляемая рнк регуляция транскрипции
C12N15/111 - Получение мутаций или генная инженерия; ДНК или РНК, связанные с генной инженерией, векторы, например плазмиды или их выделение, получение или очистка; использование их хозяев (мутанты или микроорганизмы, полученные генной инженерией C12N 1/00,C12N 5/00,C12N 7/00; новые виды растений A01H; разведение растений из тканевых культур A01H 4/00; новые виды животных A01K 67/00; использование лекарственных препаратов, содержащих генетический материал, который включен в клетки живого организма, для лечения генетических заболеваний, для генной терапии A61K 48/00 пептиды вообще C07K)

Владельцы патента RU 2756865:

ПРЕЗИДЕНТ ЭНД ФЭЛЛОУЗ ОФ ХАРВАРД КОЛЛИДЖ (US)

Изобретение относится к области биотехнологии, в частности к способам изменения ДНК целевой нуклеиновой кислоты в клетке, предусматривающим введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или более РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты, и введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом или ДНК-связывающий белок-никазу из системы CRISPR типа II. Также раскрыты клетки для направляемого РНК основанного на Cas редактирования генома. Изобретение позволяет эффективно осуществлять изменение ДНК целевой нуклеиновой кислоты в клетке. 6 н. и 34 з.п. ф-лы, 21 ил., 2 табл., 17 пр.

 

Данные о родственных заявках

Настоящая заявка претендует на приоритет по предварительной заявке на патент США No. 61/830,787, поданной 4 июня 2013 г., которая включена сюда путем ссылки во всей полноте на все случаи.

Заявление о правительственных интересах

Настоящее изобретение было совершено при поддержке правительства по гранту No. Р50 HG005550 от Национальных институтов здравоохранения и DE-FG02-02ER63445 от Министерства энергетики США. Правительство имеет определенные права на это изобретение.

Уровень техники

Бактериальные и архейные системы CRISPR-Cas зависят от коротких направляющих РНК, которые в комплексе с белками Сas направляют деградацию комплементарных последовательностей, присутствующих в проникающей чужеродной нуклеиновой кислоте. См. Deltcheva Е. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNAse III. Nature 471, 602-607 (2011); Gasiunas G, Barrangou R., Horvath P. & Siksnys V. Cas9-rRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the USA 109, E2579-2586 (2012); Jinek M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Research 39, 9275-9282 (2011); и Bhaya D., Davison M. & Barrangou R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual Review of Genetics 45, 273-297 (2011). Недавняя реконструкция системы CRISPR S. pyogenes II-го типа in vitro показала, что crPHK ("CRISPR-РНК"), слитая с обычной транс-кодируемой tracr-РНК ("транс-активирующая CRISPR-РНК"), достаточна для того, чтобы направить белок Cas9 на специфичное к последовательности расщепление целевых последовательностей ДНК, соответствующих этой cr-РНК. Экспрессия направляющей РНК (gRNA, гидРНК), гомологичной сайту мишени, приводит к привлечению Cas9 и деградации ДНК мишени. См. Н. Deveau et al. Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008).

Сущность изобретения

Различные аспекты настоящего изложения касаются комплекса из направляющей РНК, ДНК-связывающего белка и последовательности двухцепочечной ДНК-мишени. Согласно некоторым аспектам, ДНК-связывающие белки в рамках настоящего изобретения включают белок, образующий комплекс с направляющей РНК, причем направляющая РНК направляет комплекс на последовательность двухцепочечной ДНК. при этом комплекс связывается с этой последовательностью ДНК. Этот аспект настоящего изобретения может быть назван совместной локализацией РНК и ДНК-связывающего белка на или с двухцепочечной ДНК. Таким образом, комплекс ДНК-связывающего белка с направляющей РНК можно использовать для локализации регулирующего транскрипцию белка или домена на ДНК мишени с тем, чтобы регулировать экспрессию целевой ДНК.

Согласно некоторым аспектам, предусмотрен способ модулирования экспрессии целевой нуклеиновой кислоты в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей одну или несколько РНК (рибонуклеиновых кислот), комплементарных ДНК (дезоксирибонуклеиновой кислоте), причем ДНК включает целевую нуклеиновую кислоту, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей РНК-направляемый безнуклеазный ДНК-связывающий белок, который связывается с ДНК и направляется одной или несколькими РНК, введение в клетку третьей чужеродной нуклеиновой кислоты, кодирующей регулирующий транскрипцию белок или домен, причем одна или несколько РНК, РНК-направляемый безнуклеазный ДНК-связывающий белок и регулирующий транскрипцию белок или домен экспрессируются, при этом одна или несколько РНК, РНК-направляемый безнуклеазный ДНК-связывающий белок и регулирующий транскрипцию белок или домен совместно локализуются на ДНК, а регулирующий транскрипцию белок или домен регулирует экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая РНК-направляемый безнуклеазный ДНК-связывающий белок, также кодирует регулирующий транскрипцию белок или домен, слитый с РНК-направляемым безнуклеазным ДНК-связывающим белком. Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая одну или несколько РНК, также кодирует мишень РНК-связывающего домена, а чужеродная нуклеиновая кислота, кодирующая регулирующий транскрипцию белок или домен, также кодирует РНК-связывающий домен, слитый с регулирующим транскрипцию белком или доменом.

Согласно одному аспекту, клетка представлена эукариотической клеткой. Согласно одному аспекту, клетка представлена клеткой дрожжей, клеткой растений или клеткой животных. Согласно одному аспекту, клетка представлена клеткой млекопитающих.

Согласно одному аспекту, РНК содержит от 10 до 500 нуклеотидов. Согласно одному аспекту, РНК содержит от 20 до 100 нуклеотидов.

Согласно одному аспекту, регулирующий транскрипцию белок или домен является активатором транскрипции. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты для лечения заболевания или болезненного состояния. Согласно одному аспекту, целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

Согласно одному аспекту, одна или несколько РНК представлены направляющей РНК. Согласно одному аспекту, одна или несколько РНК представляют собой слияния tracr-РНК и cr-РНК. Согласно одному аспекту, направляющая РНК включает в себя последовательность спейсера и последовательность, гибридизующуюся с tracr (tracr mate). Направляющая РНК также может включать в себя последовательность tracr, часть которой гибридизуется с последовательностью tracr mate. Направляющая РНК также может включать в себя последовательность линкерной нуклеиновой кислоты, которая связывает последовательность tracr mate и последовательность tracr, что приводит к слиянию tracr-РНК и cr-РНК. Последовательность спейсера связывается с целевой ДНК, как-то посредством гибридизации.

Согласно одному аспекту, направляющая РНК включает в себя усеченную последовательность спейсера. Согласно одному аспекту, направляющая РНК включает в себя усеченную последовательность спейсера, укороченную на 1 основание на 5'-конце последовательности спейсера. Согласно одному аспекту, направляющая РНК включает в себя усеченную последовательность спейсера, укороченную на 2 основания на 5'-конце последовательности спейсера. Согласно одному аспекту, направляющая РНК включает в себя усеченную последовательность спейсера, укороченную на 3 основания на 5'-конце последовательности спейсера. Согласно одному аспекту, направляющая РНК включает в себя усеченную последовательность спейсера, укороченную на 4 основания на 5'-конце последовательности спейсера. Соответственно, последовательность спейсера может быть укорочена на 1-4 основания на 5'-конце последовательности спейсера.

Согласно некоторым воплощениям, последовательность спейсера может содержать от 16 до 20 нуклеотидов, гибридизующихся с последовательностью целевой нуклеиновой кислоты. Согласно некоторым воплощениям, последовательность спейсера может содержать примерно 20 нуклеотидов, гибридизующихся с последовательностью целевой нуклеиновой кислоты.

Согласно некоторым аспектам, последовательность линкерной нуклеиновой кислоты может содержать от 4 до 6 нуклеотидов.

Согласно некоторым аспектам, последовательность tracr может содержать от 60 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 64 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 65 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 66 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 67 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 68 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 69 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 70 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 80 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 90 до 500 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 100 до 500 нуклеотидов.

Согласно некоторым аспектам, последовательность tracr может содержать от 60 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 64 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 65 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 66 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 67 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 68 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 69 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 70 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 80 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 90 до 200 нуклеотидов. Согласно некоторым аспектам, последовательность tracr может содержать от 100 до 200 нуклеотидов.

Типичная направляющая РНК представлена на фиг. 5В.

Согласно одному аспекту, ДНК представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

Согласно некоторым аспектам, предусмотрен способ модулирования экспрессии целевой нуклеиновой кислоты в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей одну или несколько РНК (рибонуклеиновых кислот), комплементарных ДНК (дезоксирибонуклеиновой кислоте), причем ДНК включает целевую нуклеиновую кислоту, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей РНК-направляемый безнуклеазный ДНК-связывающий белок из системы CRISP II типа, который связывается с ДНК и направляется одной или несколькими РНК, введение в клетку третьей чужеродной нуклеиновой кислоты, кодирующей регулирующий транскрипцию белок или домен, причем одна или несколько РНК, РНК-направляемый безнуклеазный ДНК-связывающий белок и регулирующий транскрипцию белок или домен экспрессируются, при этом одна или несколько РНК, РНК-направляемый безнуклеазный ДНК-связывающий белок и регулирующий транскрипцию белок или домен совместно локализуются на ДНК, а регулирующий транскрипцию белок или домен регулирует экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая РНК-направляемый безнуклеазный ДНК-связывающий белок из системы CRISP II типа, также кодирует регулирующий транскрипцию белок или домен, слитый с РНК-направляемым безнуклеазным ДНК-связывающим белком из системы CRISP II типа. Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая одну или несколько РНК, также кодирует мишень РНК-связывающего домена, а чужеродная нуклеиновая кислота, кодирующая регулирующий транскрипцию белок или домен, также кодирует РНК-связывающий домен, слитый с регулирующим транскрипцию белком или доменом.

Согласно одному аспекту, клетка представлена эукариотической клеткой. Согласно одному аспекту, клетка представлена клеткой дрожжей, клеткой растений или клеткой животных. Согласно одному аспекту, клетка представлена клеткой млекопитающих.

Согласно одному аспекту, РНК содержит от 10 до 500 нуклеотидов. Согласно одному аспекту, РНК содержит от 20 до 100 нуклеотидов.

Согласно одному аспекту, регулирующий транскрипцию белок или домен является активатором транскрипции. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты для лечения заболевания или болезненного состояния. Согласно одному аспекту, целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

Согласно одному аспекту, одна или несколько РНК представлены направляющей РНК. Согласно одному аспекту, одна или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

Согласно одному аспекту, ДНК представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

Согласно одному аспекту, предусмотрен способ модулирования экспрессии целевой нуклеиновой кислоты в клетке, предусматривающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей одну или несколько РНК (рибонуклеиновых кислот), комплементарных ДНК (дезоксирибонуклеиновой кислоте), причем ДНК включает целевую нуклеиновую кислоту, введение второй чужеродной нуклеиновой кислоты, кодирующей безнуклеазный белок Cas9, который связывается с ДНК и направляется одной или несколькими РНК, и введение в клетку третей чужеродной нуклеиновой кислоты, кодирующей регулирующий транскрипцию белок или домен, при этом одна или несколько РНК, безнуклеазный белок Cas9, и регулирующий транскрипцию белок или домен экспрессируются, и регулирующий транскрипцию белок или домен совместно локализуются на ДНК, а регулирующий транскрипцию белок или домен регулирует экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая безнуклеазный белок Cas9, также кодирует регулирующий транскрипцию белок или домен, слитый с безнуклеазным белком Cas9. Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая одну или несколько РНК, также кодирует мишень РНК-связывающего домена, а чужеродная нуклеиновая кислота, кодирующая регулирующий транскрипцию белок или домен, также кодирует РНК-связывающий домен, слитый с регулирующим транскрипцию белком или доменом.

Согласно одному аспекту, клетка представлена эукариотической клеткой. Согласно одному аспекту, клетка представлена клеткой дрожжей, клеткой растений или клеткой животных. Согласно одному аспекту, клетка представлена клеткой млекопитающих.

Согласно одному аспекту, РНК содержит от 10 до 500 нуклеотидов. Согласно одному аспекту, РНК содержит от 20 до 100 нуклеотидов.

Согласно одному аспекту, регулирующий транскрипцию белок или домен является активатором транскрипции. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты для лечения заболевания или болезненного состояния. Согласно одному аспекту, целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

Согласно одному аспекту, одна или несколько РНК представлены направляющей РНК. Согласно одному аспекту, одна или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

Согласно одному аспекту, ДНК представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

Согласно одному аспекту, предусмотрена клетка, содержащая первую чужеродную нуклеиновую кислоту, кодирующую одну или несколько РНК, комплементарных ДНК, причем ДНК включает целевую нуклеиновую кислоту, вторую чужеродную нуклеиновую кислоту, кодирующую РНК-направляемый безнуклеазный ДНК-связывающий белок, и третью чужеродную нуклеиновую кислоту, кодирующую регулирующий транскрипцию белок или домен, при этом одна или несколько РНК, РНК-направляемый безнуклеазный ДНК-связывающий белок и регулирующий транскрипцию белок или домен входят в состав комплекса совместной локализации для целевой нуклеиновой кислоты.

Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая РНК-направляемый безнуклеазный ДНК-связывающий белок, также кодирует регулирующий транскрипцию белок или домен, слитый с РНК-направляемым безнуклеазным ДНК-связывающим белком. Согласно одному аспекту, чужеродная нуклеиновая кислота, кодирующая одну или несколько РНК, также кодирует мишень РНК-связывающего домена, а чужеродная нуклеиновая кислота, кодирующая регулирующий транскрипцию белок или домен, также кодирует РНК-связывающий домен, слитый с регулирующим транскрипцию белком или доменом.

Согласно одному аспекту, клетка представлена эукариотической клеткой. Согласно одному аспекту, клетка представлена клеткой дрожжей, клеткой растений или клеткой животных. Согласно одному аспекту, клетка представлена клеткой млекопитающих.

Согласно одному аспекту, РНК содержит от 10 до 500 нуклеотидов. Согласно одному аспекту, РНК содержит от 20 до 100 нуклеотидов.

Согласно одному аспекту, регулирующий транскрипцию белок или домен является активатором транскрипции. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты. Согласно одному аспекту, регулирующий транскрипцию белок или домен усиливает экспрессию целевой нуклеиновой кислоты для лечения заболевания или болезненного состояния. Согласно одному аспекту, целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

Согласно одному аспекту, одна или несколько РНК представлены направляющей РНК. Согласно одному аспекту, одна или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

Согласно одному аспекту, ДНК представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

Согласно некоторым аспектам, РНК-направляемый безнуклеазный ДНК-связывающий белок представлен РНК-направляемым безнуклеазным ДНК-связывающим белком системы CRISPR II-го типа. Согласно некоторым аспектам, РНК-направляемый безнуклеазный ДНК-связывающий белок представляет собой безнуклеазный белок Cas9.

Согласно некоторым аспектам, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов (nicks).

Согласно одному аспекту, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу системы CRISPR II-го типа, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза системы CRISPR II-го типа экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза системы CRISPR II-го типа локализуется совместно с двумя или несколькими РНК на целевой нуклеиновой кислоте - ДНК и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов (nicks).

Согласно одному аспекту, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один белок-никаза Cas9 экспрессируются, при этом по меньшей мере один белок-никаза Cas9 локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов (nicks).

В соответствии со способами изменения целевой нуклеиновой кислоты входящей в состав ДНК, два или несколько соседних одноцепочечных разрывов находятся на одной той же нити двухцепочечной ДНК. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на одной и той же нити двухцепочечной ДНК, что приводит к гомологичной рекомбинации. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и смещены относительно друг друга. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы. Согласно одному аспекту, два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов. Согласно одному аспекту, способ дополнительно включает введение в клетку третьей чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, при этом два или несколько одноцепочечных разрывов приводят к гомологичной рекомбинации целевой нуклеиновой кислоты с последовательностью донорной нуклеиновой кислоты.

Согласно одному аспекту, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов, причем эти два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к фрагментации целевой нуклеиновой кислоты, тем самым предотвращая экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу системы CRISPR II-го типа, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза системы CRISPR II-го типа экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза системы CRISPR II-го типа локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов, причем эти два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к фрагментации целевой нуклеиновой кислоты, тем самым предотвращая экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, предусмотрен способ изменения целевой нуклеиновой кислоты входящей в состав ДНК в клетке, включающий введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом, который направляется двумя или несколькими РНК, причем эти две или несколько РНК и по меньшей мере один белок-никаза Cas9 экспрессируются, при этом по меньшей мере один белок-никаза Cas9 локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрывов, причем эти два или несколько соседних одноцепочечных разрывов находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к фрагментации целевой нуклеиновой кислоты, тем самым предотвращая экспрессию целевой нуклеиновой кислоты.

Согласно одному аспекту, предусмотрены клетки, содержащие первую чужеродную нуклеиновую кислоту, кодирующую две или несколько РНК, причем каждая РНК комплементарна к области ДНК прилегающей к целевой нуклеиновой кислоте, и вторую чужеродную нуклеиновую кислоту, кодирующую по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу, при этом две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза входят в состав комплекса совместной локализации для ДНК целевой нуклеиновой кислоты.

Согласно одному аспекту, РНК-направляемый ДНК-связывающий белок-никаза представлен РНК-направляемым ДНК-связывающим белком никазы из системы CRISPR II-го типа. Согласно одному аспекту, РНК-направляемый ДНК-связывающий белок-никаза представлен белком никазы Cas9 с одним неактивным нуклеазным доменом.

Согласно одному аспекту, клетка представлена эукариотической клеткой. Согласно одному аспекту, клетка представлена клеткой дрожжей, клеткой растений или клеткой животных. Согласно одному аспекту, клетка представлена клеткой млекопитающих.

Согласно одному аспекту, РНК содержит от 10 до 500 нуклеотидов. Согласно одному аспекту, РНК содержит от 20 до 100 нуклеотидов.

Согласно одному аспекту, целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

Согласно одному аспекту, две или несколько РНК представлены направляющей РНК. Согласно одному аспекту, две или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

Согласно одному аспекту, ДНК представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

Другие признаки и преимущества определенных воплощений настоящего изобретения станут более понятными из нижеследующего описания воплощений и их чертежей, а также из формулы изобретения.

Краткое описание фигур

Патент или патентная заявка содержит рисунки, выполненные в цвете. Копии этого патента или публикации патентной заявки с цветными рисунками будут предоставляться Ведомством по запросу при оплате необходимой пошлины. Вышеизложенные и другие признаки и преимущества настоящих воплощений станут более понятными из нижеследующего подробного описания воплощений вместе с прилагаемыми рисунками.

На фиг. 1А и фиг. 1В представлены схемы РНК-направляемой активации транскрипции. На фиг. 1С представлено схематическое изображение конструкции-репортера. На фиг. 1D (1D-1 и 1D-2) представлены данные, свидетельствующие, что слитые белки Cas9N-VP64 проявляют РНК-направляемую активацию транскрипции при измерении методами сортировки клеток с активируемой флуоресценцией(FACS) и иммунофлуоресценции (IF). На фиг. 1E (1Е-1 и 1Е-2) представлены данные оценки методом FACS и IF, свидетельствующие о специфичной к последовательности гидРНК активации транскрипции репортерными конструкциями в присутствии Cas9N, VP64 MS2 и гидРНК, несущей соответствующие сайты связывания аптамера MS2. На фиг. 1F представлены данные, свидетельствующие об индукции транскрипции под действием индивидуальных гидРНК и множественных гидРНК.

На фиг. 2А представлена методология оценки ландшафта нацеливания у комплексов Cas9-гидРНК и TALEs. На фиг. 2В представлены данные, показывающие, что комплекс Cas9-гидРНК допускает в среднем 1-3 мутации в последовательностях своих мишеней. На фиг. 2С представлены данные, показывающие, что комплекс Cas9-гидРНК почти нечувствителен к точечным мутациям, за исключением тех, которые локализуются в последовательности РАМ. На фиг. 2D представлены данные в виде термограммы (heat-plot), показывающие, что введение несоответствия по 2 основаниям существенно ухудшает активность комплекса Cas9-гидРНК. На фиг. 2Е представлены данные, показывающие, что 18-мер TALE допускает в среднем 1-2 мутации в последовательности своей мишени. На фиг. 2F приведены данные, показывающие, что 18-мер TALE, аналогично комплексам Cas9-гидРНК, почти нечувствителен к несоответствию по 1 основанию у своей мишени. На фиг. 2G представлены данные в виде термограммы, показывающие, что введение несоответствия по 2 основаниям существенно ухудшает активность 18-мера TALE.

На фиг. 3А представлено схематическое изображение структуры направляющих РНК. На фиг. 3В представлены данные, показывающие частоту негомологичного соединения концов для смещенных одноцепочечных разрывов, образующих (неспаренные) свисающие 5'-концы, и смещенных одноцепочечных разрывов, образующих свисающие 3'-концы. На фиг. 3С представлены данные, показывающие частоту в % нацеливания для смещенных одноцепочечных разрывов, образующих свисающие 5'-концы, и смещенных одноцепочечных разрывов, образующих свисающие 3'-концы.

На фиг. 4А схематически представлен координирующий металл остаток в RuvC из PDB ID: 4EP4 (синий) в положении D7 (слева), схема эндонуклеазных доменов HNH из PDB IDs: 3M7K (оранжевый) и 4H9D (голубой), включая координированный ион Mg (серый шар) и ДНК из 3M7K (фиолетовая) (посредине), и список проанализированых мутантов (справа). На фиг. 4В представлены данные, показывающие отсутствие заметной нуклеазной активности у мутантов Cas9 m3 и m4, а также соответствующих слияний их с VP64. На фиг. 4С представлен вид данных из фиг. 4В при более высоком разрешении.

На фиг. 5А представлена схема метода гомологичной рекомбинации для определения активности Cas9-гидРНК. На фиг. 5В (5В-1 и 5-В2) представлены направляющие РНК со вставками случайных последовательностей и частота гомологичной рекомбинации.

На фиг. 6А представлена схема направляющих РНК для гена ОСТ4. На фиг. 6В представлена активация транскрипции для конструкции репортера промотор-люцифераза. На фиг. 6С представлена активация транскрипции по данным количественного метода ПЦР эндогенных генов.

На фиг. 7А представлена схема направляющих РНК для гена REX1. На фиг. 7В представлена активация транскрипции для конструкции репортера промотор-люцифераза. На фиг. 7С представлена активация транскрипции по данным количественного метода ПЦР эндогенных генов.

На фиг. 8А схематически представлена блок-схема анализа специфичности высокого уровня для расчета нормированных уровней экспрессии. На фиг. 8В представлены данные по распределению сайтов связывания в зависимости от числа несоответствий, генерируемых в смещенной библиотеке конструкций. Слева: теоретическое распределение. Справа: фактическое распределение в реальной библиотеке конструкций TALE. На фиг. 8С представлены данные о распределении тегов, агрегированных с сайтами связывания, в зависимости от числа несоответствий. Слева: фактическое распределение в положительном контрольном образце. Справа: фактическое распределение в образце, в котором был индуцирован не контрольный TALE.

На фиг. 9А представлены данные по анализу ландшафта нацеливания у комплекса Cas9-гидРНК, свидетельствующие о допустимости 1-3 мутаций в последовательности его мишени. На фиг. 9В представлены данные по анализу ландшафта нацеливания у комплекса Cas9-гидРНК, свидетельствующие о допустимости точечных мутаций, за исключением тех, которые локализованы в последовательности РАМ. На фиг. 9С представлены данные в виде термограммы по анализу ландшафта нацеливания у комплекса Cas9-гидРНК, показывающие, что введение несоответствия по 2 основаниям существенно ухудшает активность. На фиг. 9D представлены данные анализа опосредованной нуклеазой HR, подтверждающие, что предполагаемый РАМ для Cas9 S. pyogenes представлен не только NGG, но и NAG.

На фиг. 10А (10А-1 и 10А-2) представлены данные анализа опосредованной нуклеазой гомологичной рекомбинации, подтверждающие, что 18-меры TALE допускают множественные мутации в последовательности своей мишени. На фиг. 10В представлены данные по анализу ландшафта нацеливания у TALEs 3 разных размеров (18-мера, 14-мера и 10-мера). На фиг. 10С представлены данные для 10-мера TALE, показывающие несоответствия с разрешением почти в 1 основание. На фиг. 10D представлены данные в виде термограммы t для 10-мера TALE, показывающие несоответствия с разрешением почти в 1 основание.

На фиг. 11А представлены разработанные направляющие РНК. На фиг. 11В представлена частота негомологичного соединения концов для различных направляющих РНК.

На фиг. 12А изображен ген Sox2. На фиг. 12В изображен ген Nanog.

На фигурах 13A-13F изображен ландшафт нацеливания двух дополнительных комплексов Cas9-гидРНК.

На фиг. 14А оттображен профиль специфичности двух гидРНК (дикого типа (SEQ ID NO: 88) и мутантов (SEQ ID NOs: 89-90). Различия в последовательности выделены красным цветом. На фигурах 14В и 14С показано, что данный анализ был специфичен для гидРНК, которую оценивали (другое изображение данных с фигуры 13D).

На фигурах 15A-15D изображена гидРНК2 (Фигуры 15А и 15В (15В-1 и 15В-2)) и гидРНК3 (фигуры 15С и 15D(15D-1 и 15D-2)), которые несут одиночные мутации или мутации по два основания (выделенные красным) в последовательности спейсера по сравнению с мишенью. Представлены последовательности SEQ ID NO: 91-131.

На фигурах 16A-16D представлен нуклеазный анализ двух независимых гидРНК, где анализировали гидРНК1 (фигуры 16А и 16В (16В-1 и 16В-2)) и гидРНК3 (фигуры 16С и 16D (16D-1 и 16D-2)), которые усечены с 5' конца своего спейсера. Представлены последовательности SEQ ID NOs: 66, 185-186 и 133-140.

На фигурах 17А-17В изображен опосредованный нуклеазой анализ HR, где показано, что РАМ у S. pyogenes Cas9 представлена NGG а также NAG. Представлены последовательности SEQ ID NOs: 67-69 и 141.

На фигурах 18А-18В изображен опосредованный нуклеазой анализ HR, где было подтверждено, что 18-мер TALE невосприимчив в множественным мутациям в своей последовательности-мишени. Представлены последовательности SEQ ID NOs: 70-73.

На фигурах 19А, 19В (19В-1 и 19В-2) и 19С (19С-1 и 19С-2) показано сравнение специфичности мономера TALE против специфичности белка TALE. Представлены последовательности SEQ ID NOs: 142-150.

На фигурах 20А-20В приведены данные, касающиеся смещенных одноцепочечных разрывов. Представлены последовательности SEQ ID NOs: 151-158.

На фигурах 21А-21С приведены данные, касающиеся смещенных одноцепочечных разрывов и профилей NHEJ. Представлены последовательности SEQ ID NOs: 159-184 и 187.

Раскрытие сущности изобретения

Воплощения настоящего изобретения основываются на использовании ДНК-связывающих белков для совместной локализации регулирующих транскрипцию белков или доменов на ДНК таким образом, чтобы управлять целевой нуклеиновой кислотой. Такие ДНК-связывающие белки хорошо известны специалистам в данной области и их используют для связывания ДНК в различных целях. Такие ДНК-связывающие белки могут быть природного происхождения. ДНК-связывающие белки, входящие в объем настоящего изобретения, включают такие, которые могут направляться РНК, именуемой здесь направляющей РНК. Согласно этому аспекту, направляющая РНК и РНК-направляемый ДНК-связывающий белок образуют совместно локализуемый комплекс на ДНК. Согласно некоторым аспектам, ДНК-связывающий белок может представлять собой безнуклеазный ДНК-связывающий белок. Согласно этому аспекту, безнуклеазный ДНК-связывающий белок может быть результатом изменения или модификации ДНК-связывающего белка, обладающего нуклеазной активностью. Такие ДНК-связывающие белки, обладающие нуклеазной активностью, известны специалистам и включают ДНК-связывающие белки природного происхождения, обладающие нуклеазной активностью, как-то белки Cas9, присутствующие, к примеру, в системах CRISPR II-го типа. Такие белки Cas9 и системы CRISPR II-го типа хорошо описаны в данной области. Напр., см. Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477, которая включена сюда путем ссылки во всей полноте, включая всю дополнительную информацию.

Типичные ДНК-связывающие белки, обладающие нуклеазной активностью, функционируют для надрезания или разрезания двухцепочечной ДНК. Такая нуклеазная активность может быть следствием того, что ДНК-связывающий белок содержит одну или несколько полипептидных последовательностей, проявляющих нуклеазную активность. Такие типичные ДНК-связывающие белки могут содержать два отдельных нуклеазных домена, причем каждый домен отвечает за разрезание или надрезание определенной нити двухцепочечной ДНК. Типичные полипептидные последовательности, обладающие нуклеазной активностью, известны специалистам и включают нуклеазный домен MCRA-HNH и нуклеазный домен типа RuvC. Соответственно, примерами ДНК-связывающих белков служат те, которые по своей природе содержат один или несколько нуклеазных доменов MCRA-HNH и нуклеазных доменов типа RuvC. Согласно некоторым аспектам, ДНК-связывающий белок подвергается модификации или иным изменениям для инактивации нуклеазной активности. Такие изменения или модификации включают изменения одной или нескольких аминокислот для инактивации нуклеазной активности или нуклеазного домена. Такие модификации включают удаление полипептидной последовательности или полипептидных последовательностей, проявляющих нуклеазную активность, т.е. нуклеазного домена, с тем чтобы в ДНК-связывающем белке отсутствовала полипептидная последовательность или полипептидные последовательности, проявляющие нуклеазную активность, т.е. нуклеазный домен. Другие модификации для инактивации нуклеазной активности станут понятными специалистам в данной области на основе настоящего описания. Соответственно, безнуклеазный ДНК-связывающий белок включает полипептидные последовательности, подвергнутые модификации для инактивации нуклеазной активности, или же удаление полипептидной последовательности или последовательностей для инактивации нуклеазной активности. Безнуклеазный ДНК-связывающий белок сохраняет способность к связыванию с ДНК, даже если нуклеазная активность была инактивирована. Соответственно, ДНК-связывающий белок включает полипептидную последовательность или последовательности, необходимые для связывания с ДНК, но может отсутствовать одна или несколько или же все нуклеазные последовательности, проявляющие нуклеазную активность. Соответственно, ДНК-связывающий белок включает полипептидную последовательность или последовательности, необходимые для связывания с ДНК, но у одной или нескольких или же всех нуклеазных последовательностей может быть инактивирована нуклеазная активность.

Согласно одному аспекту, ДНК-связывающий белок, содержащий два или несколько нуклеазных доменов, может быть модифицирован или изменен так, чтобы инактивировать все нуклеазные домены, кроме одного. Такой модифицированный или измененный ДНК-связывающий белок именуется ДНК-связывающим белком-никазой, если этот ДНК-связывающий белок разрезает или надрезает только одну нить двухцепочечной ДНК. А если он направляется на ДНК с помощью РНК, то такой ДНК-связывающий белок-никаза именуется РНК-направляемым ДНК-связывающим белком-никазой.

Типичным ДНК-связывающим белком является РНК-направляемый ДНК-связывающий белок системы CRISPR II-го типа, у которого отсутствует нуклеазная активность. Типичным ДНК-связывающим белком является безнуклеазный белок Cas9. Типичным ДНК-связывающим белком является белок-никаза Cas9.

У S. pyogenes Cas9 создает двухцепочечный разрыв с тупыми концами за 3 п. о. до примыкающего к протоспейсеру мотива (РАМ) с помощью процесса, опосредованного двумя каталитическими доменами в этом белке: доменом HNH, который расщепляет комплементарную нить ДНК, и доменом типа RuvC, который расщепляет некомплементарную нить. См. Jinke et al., Science 337, 816-821 (2012), включенную сюда путем ссылки во всей полноте. Белки Cas9, как известно, существуют во многих системах CRISPR II-го типа, включая следующие, приведенные в дополнительной информации к Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477: Methanococcus maripaludis C7; Corynebacterium diphtheriae; Corynebacterium efficiens YS-314; Corynebacterium glutamicum ATCC 13032 Kitasato; Corynebacterium glutamicum ATCC 13032 Bielefeld; Corynebacterium glutamicum R; Corynebacterium kroppenstedtii DSM 44385; Mycobacterium abscessus ATCC 19977; Nocardia farcinica IFM10152; Rhodococcus erythropolis PR4; Rhodococcus jostii RHA1; Rhodococcus opacus B4 uid36573; Acidothermus cellulolyticus 11B; Arthrobacter chlorophenolicus A6; Kribbella flavida DSM 17836 uid43465; Thermomonospora curvata DSM 43183; Bifidobacterium dentium Bdl; Bifidobacterium longum DJO10A; Slackia heliotrinireducens DSM 20476; Persephonella marina EX HI; Bacteroides fragilis NCTC 9434; Capnocytophaga ochracea DSM 7271; Flavobacterium psychrophilum JIP02 86; Akkermansia muciniphila ATCC BAA 835; Roseiflexus castenholzii DSM 13941; Roseiflexus RSI; Synechocystis PCC6803; Elusimicrobium minutum Peil91; uncultured Termite group 1 bacterium phylotype Rs D17; Fibrobacter succinogenes S85; Bacillus cereus ATCC 10987; Listeria innocua; Lactobacillus casei; Lactobacillus rhamnosus GG; Lactobacillus salivarius UCC118; Streptococcus agalactiae A909; Streptococcus agalactiae NEM316; Streptococcus agalactiae 2603; Streptococcus dysgalactiae equisimilis GGS 124; Streptococcus equi zooepidemicus MGCS10565; Streptococcus gallolyticus UCN34 uid46061; Streptococcus gordonii Challis subst. CHI; Streptococcus mutans NN2025 uid46353; Streptococcus mutans; Streptococcus pyogenes Ml GAS; Streptococcus pyogenes MGAS5005; Streptococcus pyogenes MGAS2096; Streptococcus pyogenes MGAS9429; Streptococcus pyogenes MGAS 10270; Streptococcus pyogenes MGAS6180; Streptococcus pyogenes MGAS315; Streptococcus pyogenes SSI-1; Streptococcus pyogenes MGAS10750; Streptococcus pyogenes NZ131; Streptococcus thermophiles CNRZ1066; Streptococcus thermophiles LMD-9; Streptococcus thermophiles LMG 18311; Clostridium botulinum A3 Loch Maree; Clostridium botulinum В Eklund 17B; Clostridium botulinum Ba4 657; Clostridium botulinum F Langeland; Clostridium cellulolyticum H10; Finegoldia magna ATCC 29328; Eubacterium rectale ATCC 33656; Mycoplasma gallisepticum; Mycoplasma mobile 163K; Mycoplasma penetrans; Mycoplasma synoviae 53; Streptobacillus moniliformis DSM 12112; Bradyrhizobium BTAil; Nitrobacter hamburgensis XI4; Rhodopseudomonas palustris BisB18; Rhodopseudomonas palustris BisB5; Parvibaculum lavamentivorans DS-1; Dinoroseobacter shibae DFL 12; Gluconacetobacter diazotrophicus Pal 5 FAPERJ; Gluconacetobacter diazotrophicus Pal 5 JGI; Azospirillum B510 uid46085; Rhodospirillum rubrum ATCC 11170; Diaphorobacter TPSY uid29975; Verminephrobacter eiseniae EF01-2; Neisseria meningitides 053442; Neisseria meningitides alphal4; Neisseria meningitides Z2491; Desulfovibrio salexigens DSM 2638; Campylobacter jejuni doylei 269 97; Campylobacter jejuni 81116; Campylobacter jejuni; Campylobacter lari RM2100; Helicobacter hepaticus; Wolinella succinogenes; Tolumonas auensis DSM 9187; Pseudoalteromonas atlantica T6c; Shewanella pealeana ATCC 700345; Legionella pneumophila Paris; Actinobacillus succinogenes 130Z; Pasteurella multocida; Francisella tularensis novicida U112; Francisella tularensis holarctica; Francisella tularensis FSC 198; Francisella tularensis tularensis; Francisella tularensis WY96-3418; и Treponema denticola ATCC 35405. Соответственно, аспекты настоящего изобретения направлены на белок Cas9, присутствующий в системе CRISPR II-го типа, который стал безнуклеазным или который стал никазой, как описано здесь.

Белок Cas9 может упоминаться специалистами в литературе как Csnl. Последовательность белка Cas9 S. pyogenes, который является предметом описанных здесь экспериментов, представлена ниже. См. Deltcheva et al., Nature 471, 602-607 (2011), которая включена сюда путем ссылки во всей полноте.

Согласно некоторым аспектам описанных здесь способов РНК-направляемой регуляции генома, Cas9 подвергается изменениям для снижения, существенного снижения или устранения нуклеазной активности. Согласно одному аспекту, нуклеазная активность Cas9 уменьшается, существенно уменьшается или инактивируется путем изменения нуклеазного домена RuvC или нуклеазного домена HNH. Согласно одному аспекту, инактивируется нуклеазный домен RuvC. Согласно одному аспекту, инактивируется нуклеазный домен HNH. Согласно одному аспекту, инактивируется нуклеазный домен RuvC и нуклеазный домен HNH. Согласно другому аспекту, предусматриваются белки Cas9, у которых инактивирован нуклеазный домен RuvC и нуклеазный домен HNH. Согласно другому аспекту, предусматриваются безнуклеазные белки Cas9, у которых инактивирован нуклеазный домен RuvC и нуклеазный домен HNH. Согласно другому аспекту, предусматривается никаза Cas9, у которой инактивирован либо нуклеазный домен RuvC, либо нуклеазный домен HNH, при этом оставшийся нуклеазный домен остается активным для нуклеазной активности. Таким образом, разрезается или надрезается только одна нить двухцепочечной ДНК.

Согласно другому аспекту, предусматриваются безнуклеазные белки Cas9, у которых одна или несколько аминокислот у Cas9 изменяются или же удаляются для получения безнуклеазных белков Cas9. Согласно одному аспекту, аминокислоты включают D10 и Н840. См. Jinke et al., Science 337, 816-821 (2012). Согласно другому аспекту, аминокислоты включают D839 и N863. Согласно одному аспекту, одна или несколько или все аминокислоты D10, Н840, Н863 и D839 заменяются такой аминокислотой, которая снижает, существенно снижает или устраняет нуклеазную активность. Согласно одному аспекту, одна или несколько или все аминокислоты D10, Н840, Н863 и D839 заменяются на аланин. Согласно одному аспекту, белок Cas9, у которого одна или несколько или все аминокислоты D10, Н840, D839 и Н863 заменены такой аминокислотой, которая снижает, существенно снижает или устраняет нуклеазную активность, типа аланина, именуется безнуклеазным Cas9 или Cas9N и проявляет сниженную или отсутствующую нуклеазную активность, или же нуклеазная активность отсутствует или практически отсутствует на уровне предела обнаружения. Согласно этому аспекту, нуклеазная активность у Cas9N может не обнаруживаться известными методами, т.е. она ниже предела обнаружения известными методами.

Согласно одному аспекту, безнуклеазный белок Cas9 охватывает и его гомологи и ортологи, которые сохраняют способность белка к связыванию с ДНК и способность направляться РНК. Согласно одному аспекту, безнуклеазный белок Cas9 включает последовательность, приведенную для природного Cas9 из S. pyogenes, у которой одна или несколько или все аминокислоты D10, Н840, Н863 и D839 заменены на аланин, а также последовательности белков, которые по меньшей мере на 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98% или 99% гомологичны этой последовательности и являются ДНК-связывающими белками типа РНК-направляемых ДНК-связывающих белков.

Согласно одному аспекту, безнуклеазный белок Cas9 включает последовательность, приведенную для природного Cas9 из S. pyogenes, за исключением последовательности нуклеазного домена RuvC и нуклеазного домена HNH, а также последовательности белков, которые по меньшей мере на 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98% или 99% гомологичны этой последовательности и являются ДНК-связывающими белками типа РНК-направляемых ДНК-связывающих белков. Таким образом, аспекты настоящего изобретения включают последовательность белка, отвечающую за связывание с ДНК, к примеру, для совместной локализации с направляющей РНК и связывание с ДНК, и белковые последовательности, гомологичные ей, но не обязательно включают белковые последовательности нуклеазного домена RuvC и нуклеазного домена HNH (если только они не нужны для связывания ДНК), поскольку эти домены могут быть инактивированы или удалены из последовательности природного белка Cas9 для получения безнуклеазного белка Cas9.

В целях настоящего изобретения, на фиг. 4А представлены координирующие металл остатки в структурах известных белков, гомологичных Cas9. Остатки пронумерованы согласно их положению в последовательности Cas9. Слева: структура RuvC, PDB ID: 4ЕР4 (синий), положение D7, которое соответствует D10 в последовательности Cas9, выделено в положениях, координирующих ион Mg. Посредине: структуры эндонуклеазных доменов HNH у PDB ID: 3M7K (оранжевый) и 4H9D (голубой), включая скоординированный ион Mg (серый шар) и ДНК из 3M7K (фиолетовый). Остатки D92 и N113 в 3M7K и позиции D53 и N77 в 4H9D, которые гомологичны по последовательности аминокислотам D839 и N863 в Cas9, представлены в виде палочек. Справа: список мутантов, полученных и проанализированных на нуклеазную активность: Cas9 дикого типа; Cas9m1, у которого D10 заменен на аланин; Cas9m2, у которого D10 и Н840 заменены на аланин; Cas9m3, У которого D10, Н840 и D839 заменены на аланин; и Cas9m4, у которого D10, Н840, D839 и N863 заменены на аланин.

Как видно из фиг. 4В, мутанты Cas9: m3 и m4, а также соответствующие им слияния с VP64 не проявляли заметной нуклеазной активности по результатам глубокого секвенирования локуса мишени. На графиках представлена частота мутаций в зависимости от положения в геноме, а красными линиями отмечена мишень гидРНК. На фиг. 4С представлены данные из фиг. 4В при более высоком разрешении, которые подтверждают, что мутационный ландшафт проявляет сравнимый с немодифицированными локусами профиль.

Согласно одному аспекту, предусмотрена сконструированная система Cas9-гидРНК, которая позволяет осуществлять РНК-направляемую регуляцию генома в клетках человека путем привязывания доменов активации транскрипциио к безнуклеазному Cas9 либо к направляющей РНК. Согласно одному аспекту настоящего изобретения, один или несколько регулирующих транскрипцию белков или доменов (данные термины применяются взаимозаменяемо) присоединяются или иным образом соединяются с безнуклеазным Cas9 либо с одной или несколькими направляющими РНК (гидРНК). Регулирующие транскрипцию домены соответствуют локусам мишени. Соответственно, аспекты настоящего изобретения включают способы и материалы для локализации регулирующих транскрипцию доменов на локусах мишенях путем слияния, соединения или присоединения таких доменов к Cas9N либо к гидРНК.

Согласно одному аспекту, предусмотрен слитый с Cas9N белок, способный активировать транскрипцию. Согласно одному аспекту, к С-концу Cas9N присоединяется, сливается, соединяется или иным образом прикрепляется домен активации VP64 (см. Zhang et al., Nature Biotechnology 29,149-153 (2011), которая включена сюда путем ссылки во всей полноте). Согласно одному способу, регулирующий транскрипцию домен доставляется на сайт целевой геномной ДНК белком Cas9N. Согласно одному способу, слитый с регулирующим транскрипцию доменом Cas9N поступает внутрь клетки вместе с одной или несколькими направляющими РНК. Cas9N со слитым с ним регулирующим транскрипцию доменом связывается на или возле целевой геномной ДНК. Одна или несколько направляющих РНК связываются на или возле целевой геномной ДНК. Регулирующий транскрипцию домен регулирует экспрессию гена-мишени. Согласно одному конкретному аспекту, слитый белок Cas9N-VP64 в сочетании с гидРНК, воздействующей на последовательности вблизи от промотора, активируют транскрипцию репортерных конструкций, тем самым проявляется РНК-направляемая активация транскрипции.

Согласно одному аспекту, предусмотрен слитый с гидРНК белок, способный активировать транскрипцию. Согласно одному аспекту, к гидРНК присоединяется, сливается, соединяется или иным образом прикрепляется домен активации VP64. Согласно одному способу, регулирующий транскрипцию домен попадает на сайт целевой геномной ДНК при помощи гидРНК. Согласно одному способу, соединенная с регулирующим транскрипцию доменом гидРНК поступает внутрь клетки вместе с белком Cas9N. Cas9N связывается на или возле целевой геномной ДНК. Одна или несколько направляющих РНК со слитым с ними регулирующим транскрипцию белком или доменом связываются на или возле целевой геномной ДНК. Регулирующий транскрипцию домен регулирует экспрессию гена-мишени. Согласно одному конкретному аспекту, белок Cas9N-VP64 и гидРНК, соединенная с регулирующим транскрипцию доменом, активируют транскрипцию репортерных конструкций, тем самым проявляется РНК-направляемая активация транскрипции.

Были сконструированы составные гидРНК, способные регулировать транскрипцию, путем определения тех участков гидРНК, которые допускают изменения, путем вставки случайных последовательностей в гидРНК и анализа функции Cas9. Направляющие РНК, несущие вставки случайных последовательностей либо на 5'-конце участка cr-РНК, либо на 3'-конце участка tracr-РНК в химерной гидРНК, сохраняют функциональность, тогда как вставки в каркасный участок tracr-РНК химерной гидРНК ведут к потере функции. См. фиг. 5А-В, на которой суммированы данные по устойчивости гидРНК к случайным вставкам оснований. На фиг. 5А представлена схема метода гомологичной рекомбинации (HR) для определения активности Cas9-гидРНК. Как видно из фиг. 5В, направляющие РНК, несущие вставки случайных последовательностей либо на 5'-конце участка cr-РНК, либо на 3'-конце участка tracr-РНК в химерной гидРНК, сохраняют функциональность, тогда как вставки в каркасный участок tracr-РНК химерной гидРНК ведут к потере функции. Точки вставки в последовательность гидРНК обозначены в виде красных нуклеотидов. Не придерживаясь какой-либо научной теории, повышение активности при случайных вставках оснований на 5'-конце может быть обусловлено увеличением периода полужизни у более длинной гидРНК.

Для присоединения VP64 к гидРНК пришивали две копии области стебель-петля РНК, связывающей белок оболочки бактериофага MS2, к 3'-концу гидРНК. См. Fusco et al., Current Biology: CB13, 161-167 (2003), которая включена сюда путем ссылки во всей полноте. Эти химерные гидРНК экспрессировали вместе со слитым с Cas9N белком VP64 MS2. В присутствии всех 3 компонентов наблюдалась активация специфичной к последовательности транскрипции из репортерных конструкций.

На фиг. 1А представлена схема РНК-направляемой активации транскрипции. Как видно из фиг. 1А, для получения слитого с Cas9N белка, способного активировать транскрипцию, к С-концу Cas9N непосредственно пришивали домен активации VP64. Как видно из фиг. 1В, для получения составной гидРНК, способной активировать транскрипцию, к 3'-концу гидРНК пришивали две копии области стебель-петля РНК, связывающей белок оболочки бактериофага MS2. Эти химерные гидРНК экспрессировали вместе со слитым с Cas9N белком VP64 MS2. На фиг. 1С представлена схема репортерных конструкций, используемых для анализа активации транскрипции. Два репортера несут разные сайты-мишени для гидРНК и одинаковый контрольный сайт-мишень TALE-TF. Как видно из фиг 1D, слитый белок Cas9N-VP64 проявляет РНК-направляемую активацию транскрипции при измерении методами сортировки клеток с активируемой флуоресценцией (FACS) и иммунофлуоресценции (IF). В то время, как контрольный TALE-TF активирует оба репортера, слитый белок Cas9N-VP64 активирует репортеры специфичным к последовательности гидРНК образом. Как видно из фиг. 1Е, специфичная к последовательности гидРНК активация транскрипции у репортерных конструкций наблюдалась методами FACS и IF только в присутствии всех 3 компонентов: Cas9N, VP64 MS2 и гидРНК, несущей соответствующие сайты связывания аптамера MS2.

Согласно некоторым аспектам, предусмотрены способы регуляции эндогенных генов с помощью Cas9N, одной или нескольких гидРНК и регулирующего транскрипцию белка или домена. Согласно одному аспекту, эндогенным геном может быть любой желательный ген, именуемый здесь геном-мишенью. Согласно одному типичному аспекту, подлежащие регуляции гены включают ZFP42 (REX1),и POU5F1 (OUT4), которые оба являются жестко регулируемыми генами, участвующими в поддержании плюрипотентности. Как видно из фиг. 1F, для гена REX1 было разработано 10 гидРНК, направленных на отрезок ДНК в ~5 т.п.о. перед сайтом инициации транскрипции (сверхчувствительные к ДНКазе сайты выделены зеленым цветом). Активацию транскрипции анализировали либо с помощью репортерной конструкции промотор-люцифераза (см. Takahashi et al., Cell, 131: 861-872 (2007), которая включена сюда путем ссылки во всей полноте), либо непосредственно методом кПЦР эндогенных генов.

Фиг. 6А-С касается РНК-направляемой регуляции ОСТ4 с помощью Cas9N-VP64. Как видно из фиг. 6А, для гена ОСТ4 было разработано 21 гидРНК, направленных на отрезок ДНК в ~5 т.п.о. перед сайтом инициации транскрипции. Сверхчувствительные к ДНКазе сайты выделены зеленым цветом. На фиг. 6В представлена активация транскрипции с помощью репортерной конструкции промотор-люцифераза. На фиг. 6С представлена активация транскрипции анализируемая непосредственно методом кПЦР эндогенных генов. В то время, как введение индивидуальных гидРНК умеренно стимулировало транскрипцию, несколько гидРНК действовали синергически, вызывая устойчивую многократную активацию транскрипции.

Фиг. 7А-С касается РНК-направляемой регуляции REX1 с помощью Cas9N, VP64 MS2 и гидРНК + аптамер 2X-MS2. Как видно из фиг. 7А, для гена REX1 было разработано 10 гидРНК, направленных на отрезок ДНК в ~5 т.п.о. перед сайтом инициации транскрипции. Сверхчувствительные к ДНКазе сайты выделены зеленым цветом. На фиг. 7В представлена активация транскрипции с помощью репортерной конструкции промотор-люцифераза. На фиг. 7С представлена активация транскрипции непосредственно методом кПЦР эндогенных генов. В то время, как введение индивидуальных гидРНК умеренно стимулировало транскрипцию, несколько гидРНК действовали синергически, вызывая устойчивую многократную активацию транскрипции. В одном аспекте, отсутствие аптамеров 2X-MS2 на гидРНК не вызывает активации транскрипции. См. Maeder et al., Nature Methods 10, 243-245 (2013); и Perez-Pinera et al., Nature Methods 10, 239-242 (2013); каждая из которых включена сюда путем ссылки во всей полноте.

Соответственно, способы направлены на использование множественных направляющих РНК с белком Cas9N и регулирующим транскрипцию белком или доменом для регуляции экспрессии гена-мишени.

Оба подхода и с Cas9, и с пришиванием гидРНК оказались эффективными, причем первый из них проявляет в ~1,5-2 раза большую активность. Это различие, вероятно, связано с необходимостью сборки 2-компонентного, в отличие от 3-компонентного комплекса. Тем не менее, метод пришивания гидРНК в принципе позволяет рекрутировать различные эффекторные домены различными гидРНК, если только каждая из гидРНК использует другую взаимодействующую пару РНК-белок. См. Karyer-Bibens et al. Biology of the Cell / Under the Auspices of the European Cell Biology Organization 100, 125-138 (2008), которая включена сюда путем ссылки во всей полноте. Согласно одному аспекту настоящего изобретения, различные гены-мишени можно регулировать с помощью специфичных направляющих РНК и общего белка Cas9N, т.е. одного и того же или близкого белка Cas9N для различных генов-мишеней. Согласно одному аспекту, предусмотрены способы мультиплексной регуляции генов с помощью одного и того же или близкого белка Cas9N.

Способы настоящего изобретения также направлены на редактирование генов-мишеней с помощью описанных здесь белков Cas9N и направляющих РНК, чтобы обеспечить мультиплексную генетическую и эпигенетическую инженерию клеток человека. Поскольку таргетинг Cas9-гидРНК является спорным вопросом (см. Jiang et al., Nature Biotechnology 31, 233-239 (2013), которая включена сюда путем ссылки во всей полноте), то предусмотрены способы углубленного изучения сродства Cas9 для очень большого ряда вариантов последовательностей мишеней. Соответственно, аспекты настоящего изобретения обеспечивают прямое высокопроизводительное изучение нацеливания Cas9 в клетках человека, при этом избегая осложнений, вызванных токсичностью разрезанной дцДНК и репарацией мутагенных повреждений, возникающих при тестировании на специфичность с помощью нативного Cas9, обладающего нуклеазной активностью.

Другие аспекты настоящего изобретения направлены на использование ДНК-связывающих белков или систем вообще для регуляции транскрипции генов-мишеней. Специалист в данной области легко сможет установить типичные ДНК-связывающие системы, исходя из настоящего описания. Такие ДНК-связывающие системы могут и не обладать такой нуклеазной активностью, как у природного белка Cas9. Соответственно, у таких ДНК-связывающих систем и не нужно инактивировать нуклеазную активность. Одной из типичных ДНК-связывающих систем является TALE. В качестве инструмента редактирования генома обычно используются димеры TALE-FokI, а для регулирования генома очень эффективными оказались слияния TALE-VP64. Согласно одному аспекту, специфичность TALE оценивали по методологии, представленной на фиг. 2А. Создавали библиотеку конструкций, в которой каждый элемент библиотеки содержит минимальный промотор для экспрессии флуоресцентного белка dTomato. После сайта инициации транскрипции m вставлен рандомизованный тег транскрипта в 24 п.о. (A/C/G), а перед промотором располагаются два TF-связывающих сайта: один - это постоянная последовательность ДНК, общая для всех элементов библиотеки, а второй - переменная, несущая "смещенную" библиотеку сайтов связывания, которая разработана так, чтобы она охватывала большую коллекцию последовательностей, содержащую много комбинаций мутаций относительно целевой последовательности, с которой должен связываться программируемый комплекс нацеливания на ДНК. Это осуществляется с помощью вырожденных олигонуклеотидов, составленных так, чтобы нуклеотиды в каждом положении находились с определенной частотой, а именно целевой нуклеотид в последовательности встречался с частотой 79%, а каждый из остальных нуклеотидов - с частотой 7%. См. Patwardhan et al., Nature Biotechnology 30, 265-270 (2012), которая включена сюда путем ссылки во всей полноте. Затем библиотеку репортеров секвенировали, чтобы выявить связь между метками транскрипта dTomato в 24 п.о. и соответствующим "смещенным" целевым сайтом элемента библиотеки. Большое разнообразие меток транскриптов гарантирует, что общие метки между различными мишенями будут встречаться крайне редко, а "смещенность" целевых последовательностей означает, что сайты с небольшим числом мутаций будут связаны с большим количеством меток, чем сайты с большим числом мутаций. Далее стимулируют транскрипцию генов репортеров dTomato либо контрольным TF, который связывается с общим сайтом ДНК, или целевым TF, который должен связываться с целевым сайтом. В каждом образце измеряют содержание каждой экспрессированной метки транскрипта путем секвестрования РНК у стимулированных клеток, которое затем сопоставляют с соответствующими сайтами связывания с помощью установленной ранее таблицы соответствия. Как ожидается, контрольный TF будет стимулировать всех представителей библиотеки одинаково, так как его сайт связывания является общим для всех элементов библиотеки, тогда как целевой TF должен сдвинуть распределение экспрессируемых элементов в сторону тех, на которые он преимущественно воздействует. Это предположение используется на стадии 5 при вычислении нормализованного уровня экспрессии для каждого сайта связывания путем деления уровня метки, полученного для целевого TF, на уровень, полученный для контрольного TF.

Как видно из фиг. 2В, ландшафт нацеливания у комплекса Cas9-гидРНК свидетельствует, что он допускает в среднем 1-3 мутации в последовательностях своих мишеней. Как видно из фиг. 2С, комплекс Cas9-гидРНК также почти нечувствителен к точечным мутациям, за исключением тех, которые локализуются в последовательности РАМ. А именно, эти данные показывают, что предполагаемый РАМ для Cas9 S. pyogenes представлен не только NGG, но и NAG. Как видно из фиг. 2D, введение несоответствия по 2 основаниям существенно ухудшает активность комплекса Cas9-гидРНК, но только тогда, когда они локализуются на 8-10 оснований ближе к 3'-концу последовательности мишени гидРНК (на термограмме позиции в последовательности мишени отмечены как 1-23, начиная с 5'-конца).

Мутационную толерантность у другого широко используемого инструмента для редактирования генома, доменов TALE, определяли описанным здесь методом анализа транскрипционной специфичности. Как видно из фиг. 2Е, данные по взаимодействию TALE с мишенью для 18-мера TALE показывают, что он допускает в среднем 1-2 мутации в последовательности своей мишени и не способен активировать большую часть вариантов с несоответствием по 3 основаниям у своих мишеней. Как видно из фиг. 2F, 18-мер TALE, аналогично комплексам Cas9-гидРНК, почти нечувствителен к несоответствию по 1 основанию у своей мишени. Как видно из фиг. 2G, введение несоответствия по 2 основаниям существенно ухудшает активность 18-мера TALE. Активность TALE более чувствительна к несоответствиям ближе к 5'-концу последовательности своей мишени (на графике термограмме позиции в последовательности мишени отмечены как 1-18, начиная с 5'-конца).

Эти результаты были подтверждены нуклеазным методом в целенаправленных экспериментах, которые являются предметом фиг. 10А-С, направленных на изучение ландшафта нацеливания у TALEs различного размера. Как видно из фиг. 10А, методом анализа опосредованной нуклеазой HR было подтверждено, что 18-меры TALE допускают множественные мутации в последовательности своих мишеней. Как видно из фиг. 10В, анализировали ландшафт нацеливания у TALEs 3 разных размеров (18-мера, 14-мера и 10-мера) с помощью методики, описанной на фиг. 2. Более короткие TALEs (14-мер и 10-мер) более специфичны с точки зрения нацеливания, но также снижается активность почти на порядок. Как видно из фиг. 10С и 10D, 10-мер TALE проявляет разрешение несоответствий почти в одно основание, теряя почти всю активность в отношении мишеней, несущих 2 несоответствия (на графике термограмме позиции в последовательности мишени отмечены как 1-10, начиная с 5-конца). В целом эти данные означают, что разработка более коротких TALEs может давать более высокую специфичность в применении к геномной инженерии, тогда как при нуклеазном применении TALEs возникает необходимость в димеризации Fokl, чтобы избежать эффекта промашки. См. Kim et al., Proceedings of the National Academy of Sciences of the USA 93, 1156-1160 (1996); и Pattanayak et al., Nature Methods 8, 765-770 (2011); каждая из которых включена сюда путем ссылки во всей полноте.

Фиг. 8А-С касается последовательности операций при анализе специфичности высокого уровня для расчета нормированных уровней экспрессии, которая проиллюстрирована примерами из экспериментальных данных. Как видно из фиг. 8А, создаются библиотеки конструкций со смещенным распределением последовательностей сайтов связывания и рандомизованными последовательностями тегов в 24 п.о., которые будут включены в транскрипты генов-репортеров (сверху). Транскрибируемые теги сильно вырождены с тем, чтобы они соответствовали связывающим последовательностям Cas9 или TALE по принципу многие-к-одному. Библиотеки конструкций секвенируют (3-й уровень, слева), чтобы установить, какие теги встречаются вместе с сайтами связывания, получая таблицу соответствия между сайтами связывания и транскрибируемыми тегами (4-й уровень, слева). Можно одновременно секвенировать несколько библиотек конструкций, построенных для различных сайтов связывания, используя библиотечные штрихкоды (обозначенные здесь светло-голубым и светло-желтым цветом; уровни 1-4, слева). Библиотеки конструкций затем трансфецируют в популяции клеток и в образцах популяций индуцируют комплект различных Cas9/гидРНК или факторов транскрипции TALEs (2-й уровень, справа). Один образец всегда индуцируется с помощью фиксированного активатора TALE, нацеленного на фиксированную последовательность сайта связывания в данной конструкции (верхний уровень, зеленая рамка); этот образец служит в качестве положительного контроля (зеленый образец, также указан знаком +). Затем секвенируют и анализируют кДНК, полученные из молекул-репортеров мРНК в индуцированных образцах, чтобы получить число тегов для каждого тега в образце (3-й и 4-й уровень, справа). Как и при секвенировании библиотек конструкций, секвенируют и анализируют вместе несколько образцов, включая положительный контроль, прибавляя к ним штрихкоды образцов. Здесь светло-красным цветом обозначен один не контрольный образец, который секвенировали и анализировали вместе с положительным контролем (зеленый). Поскольку при каждом секвенировании проявляются только транскрибируемые теги, а не сайты связывания у конструкций, то затем для подсчета общего числа тегов, экспрессированных из каждого сайта связывания в каждом образце (5-й уровень), используется таблица соответствия между сайтами связывания и тегами, полученная при секвенировании библиотек конструкций. Затем числа для каждого образца без положительного контроля преобразуются в нормированные уровни экспрессии для каждого сайта связывания путем деления их на числа, полученные в образце положительного контроля. Примеры графиков нормированных уровней экспрессии от количества несоответствий представлены на фиг. 2В и 2Е и на фиг. 9А и фиг. 10В. На этой общей блок-схеме не представлено несколько уровней фильтрования для ошибочных тегов, для не связанных с библиотекой конструкций тегов и для тегов, явно связанных с несколькими сайтами связывания. На фиг. 8В представлен пример по распределению процента сайтов связывания в зависимости от числа несоответствий, генерируемых в смещенной библиотеке конструкций. Слева: теоретическое распределение. Справа: фактическое распределение в реальной библиотеке конструкций TALE. На фиг. 8С представлен пример по распределению процента тегов, агрегированных с сайтами связывания, в зависимости от числа несоответствий. Слева: фактическое распределение в положительном контрольном образце. Справа: фактическое распределение в образце, в котором был индуцирован не контрольный TALE. Поскольку положительный контрольный TALE связывается с фиксированным сайтом в конструкции, то распределение числа агрегированных тегов точно отражает распределение сайтов связывания на фиг. 8В, тогда как в не контрольном образце TALE распределение сдвигается влево, потому что сайты с меньшим числом несоответствий индуцируют более высокие уровни экспрессии. Внизу: вычисление относительного соотношения между ними путем деления числа тегов, полученного для целевого TF, на число, полученное для контрольного TF, дает средний уровень экспрессии в зависимости от количества мутаций в целевом сайте (мишени).

Эти результаты также подтверждаются данными по специфичности, полученными с использованием другого комплекса Cas9-гидРНК. Как видно из фиг. 9А, другой комплекс Cas9-гидРНК допускает 1-3 мутации в последовательности своей мишени. Как видно из фиг. 9В, этот комплекс Cas9-гидРНК также почти нечувствителен к точечным мутациям, за исключением тех, которые локализованы в последовательности РАМ. Как видно из фиг. 9С, введение несоответствия по 2 основаниям существенно ухудшает активность (на термограмме позиции в последовательности мишени отмечены как 1-23, начиная с 5'-конца). Как видно из фиг. 9D, методом анализа опосредованной нуклеазой HR подтверждается, что предполагаемый РАМ для Cas9 S. pyogenes представлен не только NGG, но и NAG.

Согласно некоторым аспектам, специфичность связывания повышается в соответствии с описанными здесь способами. Поскольку синергия между несколькими комплексами является фактором при активации генов мишени под действием Cas9N-VP64, то регуляция транскрипции с применением Cas9N, естественно, будет весьма специфичной, так как отдельные случаи связывания вне мишени должны иметь минимальное влияние. Согласно одному аспекту, в способах редактирования генома используются смещенные надрезы (off-set nicks). Большая часть одноцепочечных разрывов редко приводит к случаям NHEJ (см. Certo et al., Nature Methods 8, 671-676 (2011), которая включена сюда путем ссылки во всей полноте), тем самым сводя к минимуму эффекты надреза вне мишени. Напротив, использование смещенных одноцепочечных разрывов для получения двухцепочечных разрывов (DSBs) очень эффективно вызывает разрушение гена. Согласно некоторым аспектам, свисающие 5'-концы вызывают более значительные события NHEJ, чем свисающие 3'-концы. Точно так же, свисающие 3'-концы благоприятствуют событиям HR перед NHEJ, хотя общее количество случаев HR существенно ниже, чем при образовании свисающих 5'-концов. Соответственно, предусмотрены способы использования одноцепочечных разрывов для гомологичной рекомбинации и смещенных одноцепочечных разрывов для получения двухцепочечных разрывов, чтобы свести к минимуму эффекты активности Cas9-гидРНК вне мишени.

Фиг. 3А-С касается мультиплексного применения смещенных одноцепочечных разрывов и способов уменьшения связывания вне мишени с помощью направляющих РНК. Как видно из фиг. 3А, для одновременного анализа событий HR и NHEJ после введения прицельных одноцепочечных разрывов или разрывов использовали репортер "светофор". При репарации расщепленной ДНК по механизму HDR (направляемая гомологией репарация) восстанавливается последовательность GFP, тогда как мутагенное NHEJ вызывает сдвиг рамки считывания, при этом GFP выходит из рамки считывания, а нижележащая последовательность mCherry попадает в рамку. Для анализа составляли 14 гидРНК, охватывающих отрезок ДНК в 200 п.о.: 7 для смысловой нити (U1-7) и 7 для антисмысловой (D1-7). С помощью мутанта Cas9D10A, который надрезает комплементарную нить, использовали различные двусторонние комбинации гидРНК для получения целого ряда запрограммированных свисающих 5'- или 3'-концов (отмечены сайты надреза для всех 14 гидРНК). Как видно из фиг. 3В, использование смещенных одноцепочечных разрывов для создания двухцепочечных разрывов (DSBs) очень эффективно вызывает разрушение гена. А именно, смещенные надрезы, образующие свисающие 5'-концы, дают больше случаев NHEJ, чем свисающие 3'-концы. Как видно из фиг. 3С, образование свисающих 3'-концов благоприятствует преобладанию HR перед NHEJ, но общее количество случаев HR существенно ниже, чем при образовании свисающих 5'-концов.

Фиг. 11А-В касается NHEJ, опосредованного никазой Cas9D10A. Как видно из фиг. 11А, для анализа событий NHEJ после введения прицельных одноцепочечных разрывов или двухцепочечных разрывов использовали репортер "светофор". Вкратце, если репарация разрывов при расщеплении ДНК идет по механизму мутагенного NHEJ. то OFF при трансляции выходит из рамки считывания, а нижележащая последовательность mCherry попадает в рамку, издавая красную флуоресценцию. Составляли 14 гидРНК, охватывающих отрезок ДНК в 200 п. о.: 7 для смысловой нити (U1-7) и 7 для антисмысловой (D1-7). Как видно из фиг. 11В, оказалось, что, в отличие от Cas9 дикого типа, который образует DSBs и дает хорошее NHEJ по всем мишеням, большинство одноцепочечных разрывов (с помощью мутанта Cas9D10A) редко приводят к событиям NHEJ. Все 14 сайтов располагаются на непрерывном отрезке ДНК в 200 п.о., причем наблюдались более чем 10-кратные различия по эффективности нацеливания.

Согласно некоторым аспектам, здесь описаны способы модулирования экспрессии целевой нуклеиновой кислоты в клетках, которые включают введение в клетки одной или нескольких, двух или нескольких либо множества чужеродных нуклеиновых кислот. Чужеродные нуклеиновые кислоты, введенные в клетки, кодируют направляющую РНК или направляющие РНК, безнуклеазный белок или белки Cas9 и регулирующий транскрипцию белок или домен. Направляющая РНК, безнуклеазный белок Cas9 и регулирующий транскрипцию белок или домен все вместе именуются комплексом совместной локализации, как этот термин понимается специалистами в данной области, в той степени, что направляющая РНК, безнуклеазный белок Cas9 и регулирующий транскрипцию белок или домен связываются с ДНК и регулируют экспрессию целевой нуклеиновой кислоты. Согласно некоторым другим аспектам, чужеродные нуклеиновые кислоты, введенные в клетки, кодируют направляющую РНК или направляющые РНК и белок никазы Cas9. Направляющая РНК и белок никазы Cas9 все вместе именуются комплексом совместной локализации, как этот термин понимается специалистами в данной области, в той степени, что направляющая РНК и белок никазы Cas9 связываются с ДНК и делают надрезы целевой нуклеиновой кислоты.

Клетки по настоящему изобретению включают любые клетки, в которые можно вводить и экспрессировать чужеродные нуклеиновые кислоты, как описано здесь. Следует иметь в виду, что основные концепции настоящего изобретения, описанного здесь, не ограничиваются типом клеток. Клетки по настоящему изобретению включают эукариотические клетки, прокариотические клетки, клетки животных, растительные клетки, грибковые клетки, архейные клетки, эубактериальные клетки и др. Клетки включают такие эукариотические клетки, как дрожжевые клетки, растительные клетки и клетки животных. Предпочтительными клетками являются клетки млекопитающих. Кроме того, клетки включают такие клетки, у которых была бы выгодна или желательна регуляция целевой нуклеиновой кислоты. Такие клетки могут включать клетки, которые дефектны по экспрессии определенного белка, что ведет к заболеванию или болезненному состоянию. Такие заболевания или болезненные состояния хорошо известны специалистам. В соответствии с настоящим изобретением, на нуклеиновую кислоту, отвечающую за экспрессию определенного белка, можно воздействовать описанными здесь способами и активатором транскрипции, что ведет к повышающей регуляции целевой нуклеиновой кислоты и экспрессии соответствующего конкретного белка. Таким образом, описанные здесь способы обеспечивают терапевтическое лечение.

Целевые нуклеиновые кислоты включают такие последовательности нуклеиновой кислоты, для регуляции или надреза которых может применяться комплекс совместной локализации, как описано здесь. Целевые нуклеиновые кислоты включают гены. В целях настоящего изобретения ДНК, как-то двухцепочечная ДНК, может включать в себя целевую нуклеиновую кислоту, а комплекс совместной локализации может связываться или иным образом совместно локализироваться на ДНК на или вблизи или возле целевой нуклеиновой кислоты, причем таким образом, чтобы комплекс совместной локализации мог оказывать желательный эффект на целевую нуклеиновую кислоту. Такие целевые нуклеиновые кислоты могут включать в себя эндогенные (или природные) нуклеиновые кислоты и экзогенные (или чужеродные) нуклеиновые кислоты. Исходя из настоящего изобретения, специалист легко сможет установить или разработать такие направляющые РНК и белки Cas9, которые совместно локализуются на ДНК, включая целевую нуклеиновую кислоту. Также специалист легко сможет установить регулирующие транскрипцию белки или домены, которые точно так же совместно локализуются на ДНК, включая целевую нуклеиновую кислоту. ДНК означает геномную ДНК, митохондриальную ДНК, вирусную ДНК или экзогенную ДНК.

Чужеродные нуклеиновые кислоты (то есть те, что не входят в состав природных нуклеиновых кислот в клетке) можно вводить в клетки любым методом, известным специалистам для такого введения. Такие способы включают трансфекцию, трансдукцию, вирусную трансдукцию, микроинъекцию, липофекцию, нуклеофекцию, бомбардировку наночастицами, трансформацию, конъюгацию и др. Специалисты смогут легко понять и адаптировать такие методы, используя легко определимые литературные источники.

Регулирующие транскрипцию белки или домены, которые являются активаторами транскрипции, включают VP16 и VP64 и другие, легко определяемые специалистами в данной области на основании настоящего описания.

Заболевания или болезненные состояния представляет собой те, которые характеризуются аномальной потерей экспрессии определенного белка. Такие заболевания или болезненные состояния можно лечить посредством повышающей регуляции конкретного белка. Соответственно, предусмотрены способы лечения заболеваний или болезненных состояний, где совместная локализация комплекс, в которых описанный здесь комплекс совместной локализации связывается или иным образом ассоциируется с ДНК, включая целевую нуклеиновую кислоту, а активатор транскрипции из комплекса совместной локализации усиливает экспрессию целевой нуклеиновой кислоты. Например, повышающая регуляция PRDM16 и других генов, вызывающих дифференцировку и усиление метаболизма бурого жира, может применяться для лечения метаболического синдрома или ожирения. Активация противовоспалительных генов применима при аутоиммунных и сердечно-сосудистых заболеваниях. Активация генов-супрессоров опухолей применима при лечении рака. Специалисты в данной области смогут легко установить такие заболевания и болезненные состояния на основании настоящего описания.

Следующие примеры приводятся в качестве репрезентативных для настоящего изобретению. Эти примеры не должны истолковываться как ограничивающие объем настоящего изобретения, поскольку эти и другие эквивалентные воплощения станут очевидными в свете настоящего описания, рисунков и прилагаемой формулы изобретения.

ПРИМЕРЫ

Пример I. Мутанты Cas9

Проводили поиск последовательностей, гомологичных Cas9 с известной структурой, для выявления таких возможных мутаций у Cas9, которые могли бы устранить естественную активность его доменов RuvC и HNH. Используя HHpred (адрес в интернете: toolkit.tuebingen.mpg.de/hhpred), вводили полную последовательность Cas9 для поиска по всей базе данных Protein Data Bank (января 2013 г.). Этот поиск выдал две разные эндонуклеазы HNH со значительной гомологией последовательности к домену HNH у Cas9; а именно Pad и предполагаемые эндонуклеазы (PDB IDs: 3M7K и 4H9D, соответственно). Эти белки изучали, чтобы найти остатки, участвующие в координировании иона магния. Затем соответствующие остатки были идентифицированы при выравнивании их последовательностей с Cas9. В каждой структуре были идентифицированы две координирующие Mg боковые цепи, которые выравнивались с аминокислотами одного и того же типа у Cas9. Это D92 и N113 у 3M7K и D53 и N77 у 4H9D. Эти остатки соответствуют D839 и N863 у Cas9. Также сообщалось, что у Pad мутации остатков D92 и N113 на аланин делают нуклеазу каталитически дефектной. Мутации D839A и N863A у Cas9 были сделаны на основе этого анализа. Кроме того, HHpred также предсказывает гомологию между Cas9 и N-концом RuvC Thermus thermophilus (PDB ID: 4EP4). Это выравнивание последовательностей охватывает приведенную ранее мутацию D10A, которая устраняет функцию домена RuvC у Cas9. Чтобы проверить, что это правильная мутация, определяли связывающие металл остатки, как и ранее. У 4ЕР4 остаток D7 помогает координировать ион магния. Это положение в последовательности обладает гомологией, соответствующей D10 у Cas9, подтверждая, что эта мутация способствует устранению связывания металла, а тем самым и каталитической активности домена RuvC у Cas9.

Пример II. Конструирование плазмид

Мутантов Cas9 получали с помощью набора QuikChange (Agilent Technologies). Конструкции, экспрессирующие целевые гидРНК, либо (1) заказывали непосредственно в виде индивидуальных gBlocks у фирмы ГОТ и клонировали в вектор pCR-BluntII-TOPO (Invitrogen); либо (2) синтезировали по заказу на фирме Genewiz; либо (3) собирали из олигонуклеотидов методом Gibson assembly в клонирующий вектор для гидРНК (плазмида #41824). Векторы для анализа репортера HR с разорванным GFP конструировали путем слияния методом ПЦР-сборки (assembly PCR) последовательности GFP, несущей стоп-кодон, а соответствующие фрагменты собирали в лентивектор EGIP фирмы Addgene (плазмида #26777). Эти лентивекторы затем использовали для получения стабильных линий репортера GFP. TALE-нуклеазы (TALENs), используемые в данном исследовании, конструировали по стандартным методикам. См. Sanjana et al., Nature Protocols 7, 171-192 (2012), которая включена сюда путем ссылки во всей полноте. Слияние Cas9N с VP64 из MS2 проводили по стандартным методикам слияния методом ПЦР. Конструкции промотор-люцифераза для ОСТ4 и REX1 получали из фирмы Addgene (плазмида # 17221 и плазмида #17222).

Пример III. Культивирование и трансфекция клеток

Клетки НЕК 293Т культивировали в модифицированной Дюльбекко среде Игла (DMEM, Invitrogen) с высоким содержанием глюкозы и с добавлением 10% фетальной бычьей сыворотки (FBS, Invitrogen), пенициллина/стрептомицина (pen/strep, Invitrogen) и заменимых аминокислот (NEAA, Invitrogen). Клетки содержали при 37°С и 5% СО2 в увлажненном инкубаторе.

Трансфекции для нуклеазных методов проводили следующим образом: 0,4×106 клеток трансфецировали 2 мкг плазмиды Cas9, 2 мкг гидРНК и/или 2 мкг плазмиды с донорской ДНК с помощью Lipofectamine 2000 в соответствии с методикой производителя. Через 3 дня после трансфекции клетки собирали и либо анализировали методом FACS, либо экстрагировали геномную ДНК из ~1×106 клеток с помощью набора DNAeasy (Qiagen) для непосредственного анализа геномных разрывов. Для этого проводили ПЦР для амплификации целевого участка, используя геномную ДНК, полученную из клеток, а ампликоны подвергали глубокому секвенированию на MiSeq Personal Sequencer (Illumina) с охватом >200000 раз. Данные по секвенированию подвергали анализу для оценки эффективности NHEJ.

Трансфекции для анализа активации транскрипции: 0,4×106 клеток трансфецировали (1) 2 мкг плазмиды Cas9N-VP64, 2 мкг гидРНК и/или 0,25 мкг репортерной конструкции; или (2) 2 мкг плазмиды Cas9N, 2 мкг VP64 MS2, 2 мкг гидРНК-аптамер 2X-MS2 и/или 0,25 мкг репортерной конструкции. Через 24-48 ч после трансфекции клетки собирали и анализировали методом FACS или методом иммунофлуоресценции либо экстрагировали из них тотальную РНК, а затем анализировали методом ОТ-ПЦР. При этом использовали стандартные зонды TaqMan фирмы Invitrogen для ОСТ4 и REX1, а нормирование для каждого образца выполняли по GAPDH.

Трансфекции для анализа активации транскрипции на профиль специфичности комплексов Cas9-гидРНК и TALEs: 0,4×106 клеток трансфецировали (1) 2 мкг плазмиды Cas9N-VP64, 2 мкг гидРНК и 0,25 мкг репортерной библиотеки; или (2) 2 мкг плазмиды TALE-TF и 0,25 мкг репортерной библиотеки; или (3) 2 мкг плазмиды контроль-TF и 0,25 мкг репортерной библиотеки. Клетки собирали через 24 ч после трансфекции (чтобы избежать стимуляции репортеров, находящихся в режиме насыщения). Экстрагирование тотальной РНК проводили с помощью набора RNAeasy-plus (Qiagen), а стандартный ОТ-ПЦР выполняли с помощью Superscript-III (Invitrogen). Библиотеки для секвенирования следующего поколения получали методом прицельной ПЦР-амплификации транскриптов с тегами.

Пример IV. Вычисления и анализ последовательности для расчета уровней экспрессии репортеров Cas9-TF и TALE-TF

На фиг. 8А схематически представлена блок-схема высокого уровня для этого процесса, а здесь приводятся дополнительные подробности. Подробнее насчет состава библиотек конструкций см. фиг. 8А (уровень 1) и 8В.

Секвенирование. Для экспериментов с Cas9, последовательности из библиотеки конструкций (фиг. 8А, уровень 3, слева) и последовательности кДНК генов-репортеров (фиг. 8А, уровень 3, справа) получали в виде перекрывающихся парных конечных прочтений в 150 п.о. на приборе Illumina MiSeq, тогда как для экспериментов с TALE соответствующие последовательности получали в виде неперекрывающихся парных конечных прочтений в 51 п.о. на приборе Illumina HiSeq.

Обработка последовательностей из библиотеки конструкций. Выравнивание. Для экспериментов с Cas9, для выравнивания парных прочтений с комплектом контрольных последовательностей в 250 п.о., что соответствует 234 п.о. из конструкций, фланкированных парами штрихкодов библиотеки по 8 п.о., использовали Novoalign V2.07.17 (сайт в интернете: novocraft.com/main/index/php) (см. фиг. 8А, 3-й уровень, слева). У контрольных последовательностей, вводимых в Novoalign, вырожденные участки сайта связывания Cas9 в 23 п.о. и вырожденные участки тегов транскриптов в 24 п.о. (фиг. 8А, первый уровень) приводятся как Ns, а штрихкоды библиотеки конструкций приводятся в явном виде. Для экспериментов с TALE использовали те же методики, за исключением того, что контрольные последовательности были длиной в 203 п.о., а вырожденные участки сайта связывания были длиной в 18 п.о., а не 23 п.о. Проверка достоверности. На выходе из Novoalign получали файлы, в которых прочтения слева и справа для каждой пары прочтений индивидуально выравнивались с контрольными последовательностями. Только те пары прочтений, в которых оба прочтения выравнивались с эталонной последовательностью, подвергали дополнительным условиям проверки, и сохраняли только те пары прочтений, которые удовлетворяли всем этим условиям. Условия достоверности включали: (i) каждый из двух штрихкодов библиотеки конструкций должен выравниваться по крайней мере по 4 позициям со штрихкодом контрольной последовательности, и оба штрихкода должны выравниваться с парой штрихкодов для той же библиотеки конструкций; (ii) все основания, выравнивающиеся с N-участками контрольной последовательности, должны быть обозначены Novoalign как А, С, G или Т. Обратите внимание, что ни для экспериментов с Cas9, ни с TALE, прочтения слева и справа не перекрывались в контрольном N-участке, так что возможность неоднозначного обозначения Novoalign этих N-оснований не возникала; (iii) точно так же, в этих участках не должны появляться выявляемые Novoalign вставки или делеции; (iv) не должно быть Т в участках тегов транскриптов (так как эти случайные последовательности создавались только из А, С и G). Пары прочтений, у которых любое из этих условий нарушалось, собирали в файл отклоненных пар прочтений. Эти проверки на достоверность выполнялись при помощи пользовательских скриптов Perl.

Обработка последовательностей кДНК гена репортера в индуцированных образцах. Выравнивание. Сначала использовали SeqPrep (загруженный из сайта в интернете github.com/jstjohn/SeqPrep) для слияния перекрывающихся пар прочтений в один общий сегмент в 79 п.о., после чего использовали Novoalign (версия выше) для выравнивания этих общих сегментов по 79 п.о. в виде единого неспаренного прочтения с комплектом контрольных последовательностей (см. фиг. 8А, 3-й уровень, слева), в котором (как и при секвенировании библиотеки конструкций) вырожденные участки тегов транскриптов в 24 п.о. приводятся как Ns, а штрихкоды библиотеки конструкций приводятся в явном виде. И для TALE, и для Cas9 участки последовательностей кДНК соответствовали одним и тем же участкам кДНК в 63 п.о., фланкированным парами последовательностей штрихкодов образца по 8 п.о.

Проверка применимости. Применяли те же условия достоверности, что и при секвенировании библиотеки конструкций (см. выше), за исключением того, что: (а) вследствие предварительного слияния SeqPrep пар прочтений, при проверке на достоверность не нужны были фильтры на однозначное выравнивание обоих прочтений из одной пары прочтений, а только на однозначное выравнивание слившихся прочтений; (b) при прочтении последовательностей кДНК встречались только теги транскриптов, поэтому проверка на достоверность проводилась только по этим участкам тегов из контрольных последовательностей, а не по отдельным участкам сайтов связывания.

Составление таблицы соответствия между сайтами связывания и тегами транскриптов. Для составления этих таблиц по проверенным последовательностям библиотеки конструкций (фиг. 8А, 4-й уровень, слева) использовали пользовательский скрипт Perl. Хотя последовательности тегов в 24 п.о., состоящие из оснований А, Си G, должны быть практически уникальными по всей библиотеке конструкций (вероятность общности =~2,8×10-11), однако в самом начале анализ соответствия между сайтами связывания и тегами показал, что довольно значительная доля последовательностей тегов на самом деле является общей для нескольких последовательностей сайтов связывания, что может быть вызвано в основном сочетанием ошибок в последовательности сайтов связывания или ошибок в синтезе олигонуклеотидов, используемых для получения библиотек конструкций. Наряду с совместным использованием тегов, теги, оказавшиеся связанными с сайтами связывания в проверенных парах прочтений, также могли оказаться в файле отклоненных пар прочтений библиотеки конструкций, если не было ясно, из-за несоответствия штрихкодов, из какой библиотеки конструкций они могут быть. Наконец, сами последовательности тегов могут содержать ошибки в последовательности. Чтобы разобраться с этими источниками ошибок, теги классифицировали по трем атрибутам: (i) надежный или ненадежный, где ненадежный означает то, что тег может находиться в файле отклоненных пар прочтений библиотеки конструкций; (ii) совместный или не совместный, где совместный означает то, что тег оказался связан с последовательностями нескольких сайтов связывания; и (iii) 2+ или только 1, где 2+ означает то, что тег встречался по крайней мере дважды среди проверенных последовательностей библиотеки конструкций и поэтому считается, что он вряд ли содержит ошибки последовательности. Сочетание этих трех критериев дает 8 классов тегов, связанных с каждым сайтом связывания, причем самый надежный (но наименее распространенный) класс включает только теги типа надежный, не совместный, 2+; а наименее надежный (но самый распространенный) класс включает все теги, независимо от надежности, совместного использования или встречаемости.

Расчет нормированных уровней экспрессии. Для выполнения операций, указанных на фиг. 8А, уровни 5-6, использовали пользовательский код Perl. Во-первых, для каждого сайта связывания суммировали число тегов, полученное для каждого индуцированного образца, используя таблицу соответствия между сайтами связывания и тегами транскриптов, составленную ранее для библиотеки конструкций (см. фиг. 8С). Затем для каждого образца суммарное число тегов по каждому сайту связывания делили на суммарное число тегов для положительного контрольного образца, получая нормированные уровни экспрессии. Дополнительные соображения, касающиеся этих расчетов, включают:

1). У каждого образца среди проверенных на достоверность последовательностей кДНК генов встречалось подмножество "новых" тегов, которые не встречались в таблице соответствия между сайтами связывания и тегами транскриптов. Эти теги не учитывали при последующих вычислениях.

2). Суммирование числа тегов, описанное выше, проводили для каждого из описанных выше 8 классов тегов в таблице соответствия между сайтами связывания и тегами транскриптов. Поскольку сайты связывания в библиотеках конструкций часто были "смещенными", чтобы получить последовательности, близкие к центральной последовательности, а последовательности с большим количеством несоответствий встречались редко, то сайты связывания с немногими несоответствиями при суммировании обычно давали большое число тегов, тогда как сайты связывания со многими несоответствиями давали меньшее число тегов. Поэтому, хотя вообще-то было желательно использовать самый надежный класс тегов, однако оценка сайтов связывания с двумя и более несоответствиями могла бы основываться на небольшом числе тегов на 1 сайт связывания, что сделает надежные числа и соотношения менее достоверными статистически, даже если сами теги и были бы более надежными. В таких случаях использовали все теги. Некоторая компенсация за это вытекает из того факта, что количество отдельных суммарных чисел тегов для n позиций с несоответствиями возрастает вместе с количеством комбинаций этих позиций (равным которое резко возрастает с увеличением n; поэтому средние значения суммарного числа тегов для различного количества n несоответствий (приведенные на фиг. 2В, 2Е и на фиг. 9А и 10В) основываются на статистически очень большой совокупности суммарных чисел тегов для n≥2.

3). Наконец, сайт связывания, встроенный в библиотеки конструкций TALE, составлял 18 п.о., и таблица соответствия тегов составлялась на основе этих последовательностей в 18 п.о., но некоторые эксперименты проводились с TALEs, запрограммированными на связывание с центральными участками в 14 п. о. или 10 п. о. в пределах сайта связывания в 18 п.о. у конструкций. При вычислении уровней экспрессии для этих TALEs, теги суммировали по сайтам связывания, исходя из соответствующих участков сайтов связывания в 18 п.о. в таблице соответствия, при этом несоответствия у сайтов связывания за пределами этого участка не учитывали.

Пример V. РНК-направляемая регуляция SOX2 и NANOG с помощью Cas9N-VP64 Описанный здесь подход с пришиванием s(одиночная)-гидРНК (модифицированная аптамером одиночная направляющая РНК) позволяет рекрутировать различные эффекторные домены при помощи различных sгидРНК, если только каждая одиночная-гидРНК использует другую взаимодействующую пару РНК-белок, что позволяет мультиплексную регуляцию генов с помощью одного и того же белка Cas9N. Для генов SOX2 (фиг. 12А) и NANOG (фиг. 12В) составляли 10 гидРНК, нацеленных на отрезок ДНК в ~1 т.п.о. впереди от сайта инициации транскрипции. Гиперчувствительные к ДНКазе сайты выделены зеленым цветом. Определяли активация транскрипции методом кПЦР эндогенных генов. В обоих случаях, в то время как введение отдельных гидРНК умеренно стимулировало транскрипцию, несколько гидРНК действовали синергически, вызывая сильную многократную активацию транскрипции. Данные в виде среднего ±SEM (n=3). Как видно из фиг. 12А-В, два других гена, SOX2 и NANOG, тоже регулировались с помощью sгидPHКs, нацеленных на отрезок ДНК в ~1 т.п.о. перед промотором. Нацеленные проксимально к сайту инициации транскрипции одиночные-гидРНК вызывали сильную активацию генов.

Пример VI. Оценка ландшафта нацеливания у комплексов Cas9-гидРНК

Используя подход, представленный на фиг. 2, анализировали ландшафт нацеливания у двух дополнительных комплексов Cas9-гидРНК (фиг. 13А-С и фиг. 13D-F). Эти две гидРНК имеют очень разные профили специфичности, причем гидРНК2 допускает до 2-3 несоответствий, а гидРНК3-только 1. Эти аспекты отражены на графиках с несоответствием и по одному основанию (фиг. 13В, 13Е), и по двум основаниям (фиг. 13С, 13F). На фиг. 13С и 13F неспаренные пары оснований, для которых было недостаточно данных для расчета нормированного уровня экспрессии, обозначены как серые блоки, содержащие "×", тогда как, чтобы улучшить отображение данных, неспаренные пары, у которых нормированные уровни экспрессии представляют собой выбросы, превышающие верхнюю часть цветовой гаммы, обозначены как желтые блоки, содержащие звездочки "*". Символы статистической значимости: *** для р<0,0005/n, ** для р<0,005/n, * для р<0,05/n, n.s. (не значимо) для р≥0,05/n, где n - количество сравнений (см. табл. 2).

Пример VII. Проверка специфичности в анализе репортеров

Как видно из фиг. 14А-С, данные по специфичности получали с использованием двух разных комплексов sгидPHК:Cas9. Было подтверждено, что анализ является специфичным для исследуемых sгидРНК, поскольку соответствующая мутантная гидРНК была неспособна стимулировать репортерную библиотеку. Фиг. 14А. Профиль специфичности двух гидРНК (дикого типа и мутанта; различия в последовательностях выделены красным цветом) оценивали с помощью репортерной библиотеки, созданной по последовательности мишени гидРНК дикого типа. Фиг. 14 В. Было подтверждено, что данный анализ является специфичным для исследуемой гидРНК оценивается (данные взяты из графика на фиг. 13D), поскольку соответствующая мутантная гидРНК была неспособна стимулировать репортерную библиотеку. Символы статистической значимости: *** для р<0,0005/n, ** для р<0,005/n, * для р<0,05/n, n.s. (не значимо) для р≥0,05/n, где n - количество сравнений (см. табл. 2). Различные гидРНК могут иметь разные профили специфичности (фиг. 13А, 13D), в частности, гидРНК2 допускает до 3 несоответствий, а гидРНК3-только 1. Наибольшая чувствительность к несоответствиям приходится на 3'-конец спейсера, хотя несоответствия в других позициях также оказывали влияние на активность.

Пример VIII. Проверка, несоответствия в гидРНК по одному и двум основаниям

Как видно из фиг. 15A-D, прицельные эксперименты подтверждают, что при несоответствии по одному основанию в пределах 12 п.о. от 3'-конца спейсера в исследуемых sгидРНК сохраняется заметная успешность нацеливания. Однако несоответствия по 2 основаниям в этом участке приводят к значительной потере активности. Используя нуклеазный метод, исследовали 2 независимые гидРНК: гидРНК2 (фиг. 15А-В) и гидРНК3 (фиг. 15C-D), несущие несоответствия по одному или двум основаниям (выделены красным цветом) в последовательности спейсера в отношении мишени. Было подтверждено, что при несоответствии по одному основанию в пределах 12 п.о. от 3'-конца спейсера в исследуемых гидРНК сохраняется заметная успешность нацеливания, однако несоответствия по 2 основаниям в этом участке приводят к быстрой потере активности. Эти результаты также подчеркивают различия в профилях специфичности между различными гидРНК в соответствии с результатами на фиг. 13. Данные в виде среднего ±SEM (n=3).

Пример IX. Проверка, 5'-усечения гидРНК

Как видно из фиг. 16A-D, усечения в 5'-части спейсера позволяют сохранить активность одниночной-гидРНК. Используя нуклеазный метод, исследовали 2 независимые гидРНК: гидРНК 1 (фиг. 16А-В) и гидРНК 3 (фиг. 16C-D), несущие усечения на 5-конце спейсера. Как оказалось, 5'-усечения в 1-3 п. о. хорошо переносятся, но более крупные делеции приводят к потере активности. Данные в виде среднего ±SEM (n=3).

Пример X. Проверка, РАМ у S. pyogenes

Как видно из фиг. 17А-В, используя метод опосредованной нуклеазой HR, было подтверждено, что РАМ для Cas9 S. pyogenes представлен не только NGG, но и NAG. Данные в виде среднего ±SEM (n=3). Согласно дополнительному исследованию, просканировали созданный набор примерно из 190 тысяч мишеней Cas9 в экзонах человека, у которых не было других NGG-мишеней с общими последними 13 нуклеотидами в целевой последовательности, на наличие альтернативных NAG-сайтов или NGG-сайтов с несоответствием в первых 13 нт. Как оказалось, только 0,4% не имеют таких альтернативных мишеней.

Пример XI. Проверка, мутации TALE

Используя метод опосредованной нуклеазой HR (фиг. 18А-В), подтвердили, что 18-меры TALE допускают множественные мутации в последовательности своей мишени. Как видно из фиг. 18А-В, некоторые мутации посреди мишени приводят к повышению активности TALE, как установлено в прицельных экспериментах нуклеазным методом.

Пример XII. Специфичность мономеров TALE или специфичность белка TALE

Чтобы выяснить роль индивидуальных вариабельных би-остатков из повторов (repeat variable diresidue, RVD), подтвердили, что выбор RVDs вносит вклад в специфичность к основаниям, но специфичность TALE также является функцией энергии связывания всего белка в целом. На фиг. 19А-С представлено сравнение специфичности мономеров TALE со специфичностью всего белка TALE. Фиг. 19А. Используя модификацию подхода, описанного на фиг. 2, анализировали ландшафт нацеливания у двух 14-меров TALE-TF, несущих последовательный набор из 6 NI-повторов или 6 NH-повторов. При таком подходе создается редуцированная библиотека репортеров, несущих вырожденную последовательность 6-мера посредине, которая используется для анализа специфичности TALE-TF. Фиг. 19В-С. В обоих случаях оказалось, что ожидаемая последовательность мишени является обогащенной (т.е. она несет 6 А для NI-повторов и 6 G для NH-повторов). Каждый из этих TALEs все еще допускает 1-2 несоответствия в последовательности центрального 6-мера мишени. Хотя выбор мономеров действительно вносит вклад в специфичность к основаниям, но специфичность TALE также является функцией энергии связывания всего белка в целом. Согласно одному аспекту, короткие сконструированные TALEs или TALEs, несущие сочетания мономеров с высоким и низким сродством, дают большую специфичность в применении к генной инженерии, а димеризация FokI в применении к нуклеазе позволяет еще больше уменьшить эффекты промашки при использовании коротких TALEs.

Пример XIII. Смещенные надрезы, нативный локус

На фиг. 20А-В представлены данные, касающиеся смещенных одноцепочечных разрывов (off-set nicking). В контексте редактирования генома смещенные надрезы создаются для получения двухцепочечных разрывов (DSBs). Большая часть надрезов не вызывает опосредованных негомологичным соединением концов (NHEJ) вставок или делеций (indels), поэтому при образовании смещенных одноцепочечных разрывов отдельные случаи одноцепочечных разрывов вне мишени, скорее всего, будут давать очень низкий уровень вставок или делеций (indels). Образование смещенных одноцепочечных разрывов для получения DSBs эффективно вызывает разрушение генов как во встроенных локусах репортеров, так и в нативном геномном локусе AAVS1. Фиг. 20А. Нативный локус AAVS1, на который нацелены 8 гидРНК, охватывающих отрезок ДНК в 200 п. о.: 4 на смысловую нить (s1-4) и 4 на антисмысловую нить (as1-4). Используя мутанта Cas9D10A, который надрезает комплементарную нить, создавали различные двусторонние комбинации гидРНК, чтобы получить целый ряд запрограммированных свисающих 5'- или 3'-концов. Фиг. 20В. Используя метод на основе секвенирования по Сэнгеру, оказалось, что в то время, как одиночные гидРНК не вызывают заметных случаев NHEJ, создание смещенных одноцепочечных разрывов для получения DSBs очень эффективно вызывает разрушение генов. А именно, смещенные надрезы, дающие свисающие 5'-концы, дают больше случаев NHEJ, чем свисающие 3'-концы. Количество клонов для секвенирования по Сэнгеру приведено над столбиками, а прогнозируемая длина свисающих концов указана под соответствующими надписями на оси х.

Пример XIV. Смещенные надрезы, профили NHEJ

Фиг. 21А-С касается смещенных одноцепочечных разрывов и профилей NHEJ. Представлены репрезентативные результаты секвенирования по Сэнгеру для трех различных комбинаций смещенных одноцепочечных разрывов, а положения таргетинговых гидРНК выделены рамками. Далее, в соответствии со стандартной моделью опосредованной гомологичной рекомбинацией (HR) репарации, создание свисающих 5'-концов посредством смещенных одноцепочечных разрывов вызывает гораздо больше случаев NHEJ, чем у свисающих 3'-концов (фиг. 3В). Наряду со стимуляцией NHEJ, при создании свисающих 5'-концов наблюдалась сильная индукция HR. Создание свисающих 3'-концов не вызывало улучшения степени HR (фиг. 3С).

Пример XV. Мишени гидРНК для регуляции эндогенных генов

В табл. 1 приведены мишени в промоторах REX1, ОСТ4, SOX2 и NANOG, использовавшиеся в экспериментах по опосредованной Cas9-гидРНК активации.

Пример XVI. Сводка по статистическому анализу данных по специфичности Cas9-гидРНКиТАLЕ

Таблица 2(a). р-значения для сравнения нормированных уровней экспрессии при связывании активаторов TALE и Cas9-VP64 с последовательностями мишеней с определенным количеством мутаций в сайте мишени. Нормированные уровни экспрессии приведены в виде ящичковых диаграмм на фигурах, указанных в столбце "Фигура", где рамочками представлено распределение этих уровней по числу несоответствий у сайта мишени, р-значения рассчитывали по t-критерию для каждой последовательной пары чисел несоответствий в каждой ящичковой диаграмме, причем t-критерии были либо для одной выборки, либо для двух выборок (см. Методы). Статистическую значимость определяли по скорректированным по Бонферрони пороговым р-значениям, причем коррекция основывалась на количестве сравнений в пределах каждой ящичковой диаграммы. Символы статистической значимости: *** для р<0,0005/n, ** для р<0,005/n, * для р<0,05/n, n.s. (не значимо) для р≥0,05/n, где n - количество сравнений.

Таблица 2(b). Статистические характеристики области "ядра" на фиг. 2D. Величина log10(значения р) показывает степень разделения между уровнями экспрессии при связывании Cas9N-VP64 + гидРНК с последовательностями мишеней с двумя мутациями для тех пар позиций, которые мутированы в пределах предполагаемой области ядра на 3'-конце сайта мишени в 20 п. о. по сравнению со всеми остальными парами позиций. Наибольшее разделение, засвидетельствованное наибольшими величинами -log10(значения р) (выделены выше), приходится на последние 8-9 п.о. сайта мишени. Эти позиции можно интерпретировать как означающие начало области ядра этого сайта мишени. См. раздел "Статистическая характеристика области ядра" в Методах насчет информации о том, как рассчитывали р-значения.

Пример XVII. Последовательности белков и РНК в примерах

А. Последовательности конструкций активаторов Cas9N--VP64 на основе мутанта m4, представленные ниже. Были созданы 3 версии в формате слитых белков Cas9m4VP64 и Cas9m4VP64N, проявляющих самую высокую активность. Также были составлены соответствующие векторы для мутантов m3 и m2 (фиг. 4А) (выделены домены NLS и VP64).

>Cas9m4VP64

В. Последовательности конструкций MS2-активаторов и соответствующего базового вектора для гидРНК с доменами аптамера 2Х MS2, представленные ниже (выделены домены NLS, VP64, спейсер для гидРНК и область стебелек-петля MS2-связывающей РНК). Были созданы 3 версии активаторов в формате слитого белка MS2VP64N, проявляющие самую высокую активность.

>MS2VP64N

С. Последовательности репортеров активации транскрипции по флуоресценции dTomato, представленные ниже (выделены последовательности мишени контрольного TF IScel, мишеней для гидРНК, промотора minCMV и тега FLAG + dTomato).

>TF-репортер 1

D. Общий формат библиотек репортеров, используемых для анализа специфичности TALE и Cas9-гидРНК, которые представлены ниже (выделены последовательности мишени для контрольного TF IScel, сайта мишени для гидРНК/TALE (23 п.о. для гидРНК и 18 п.о. для TALE), промотора minCMV, "штрихкода" РНК и dTomato).

>Библиотеки репортеров для специфичности

--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

SEQUENCE LISTING

<110> President and Fellows of Harvard College

<120> RNA-Guided Transcriptional Regulation

<130> 010498.00503

<140> PCT/US14/040868

<141> 2014-06-04

<150> US 61/830787

<151> 2013-06-04

<160> 184

<170> PatentIn version 3.5

<210> 1

<211> 1368

<212> PRT

<213> Streptococcus pyogenes

<400> 1

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 2

<211> 4332

<212> DNA

<213> Artificial

<220>

<223> VP64-activator construct

<400> 2

gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60

gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120

gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180

gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240

atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300

cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360

tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420

aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480

gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540

agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600

aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660

tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720

ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780

gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840

ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900

gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960

gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020

gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080

tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140

atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200

ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260

ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320

aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380

aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440

gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500

gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560

acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620

ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680

gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740

gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800

aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860

attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920

tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980

tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040

atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100

gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160

agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220

cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280

atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340

gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400

cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460

ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520

gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580

agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640

atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700

aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760

aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820

atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880

aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940

aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000

aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060

aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120

tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180

aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240

gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300

gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360

ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420

gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480

agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540

atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600

cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660

gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720

gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780

gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840

agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900

gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960

ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020

acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080

agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140

gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200

ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260

tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320

aactctagat ga 4332

<210> 3

<211> 4365

<212> DNA

<213> Artificial

<220>

<223> VP64-activator construct

<400> 3

gccaccatgc ccaagaagaa gaggaaggtg ggaaggggga tggacaagaa gtactccatt 60

gggctcgcta tcggcacaaa cagcgtcggc tgggccgtca ttacggacga gtacaaggtg 120

ccgagcaaaa aattcaaagt tctgggcaat accgatcgcc acagcataaa gaagaacctc 180

attggcgccc tcctgttcga ctccggggag acggccgaag ccacgcggct caaaagaaca 240

gcacggcgca gatatacccg cagaaagaat cggatctgct acctgcagga gatctttagt 300

aatgagatgg ctaaggtgga tgactctttc ttccataggc tggaggagtc ctttttggtg 360

gaggaggata aaaagcacga gcgccaccca atctttggca atatcgtgga cgaggtggcg 420

taccatgaaa agtacccaac catatatcat ctgaggaaga agcttgtaga cagtactgat 480

aaggctgact tgcggttgat ctatctcgcg ctggcgcata tgatcaaatt tcggggacac 540

ttcctcatcg agggggacct gaacccagac aacagcgatg tcgacaaact ctttatccaa 600

ctggttcaga cttacaatca gcttttcgaa gagaacccga tcaacgcatc cggagttgac 660

gccaaagcaa tcctgagcgc taggctgtcc aaatcccggc ggctcgaaaa cctcatcgca 720

cagctccctg gggagaagaa gaacggcctg tttggtaatc ttatcgccct gtcactcggg 780

ctgaccccca actttaaatc taacttcgac ctggccgaag atgccaagct tcaactgagc 840

aaagacacct acgatgatga tctcgacaat ctgctggccc agatcggcga ccagtacgca 900

gacctttttt tggcggcaaa gaacctgtca gacgccattc tgctgagtga tattctgcga 960

gtgaacacgg agatcaccaa agctccgctg agcgctagta tgatcaagcg ctatgatgag 1020

caccaccaag acttgacttt gctgaaggcc cttgtcagac agcaactgcc tgagaagtac 1080

aaggaaattt tcttcgatca gtctaaaaat ggctacgccg gatacattga cggcggagca 1140

agccaggagg aattttacaa atttattaag cccatcttgg aaaaaatgga cggcaccgag 1200

gagctgctgg taaagcttaa cagagaagat ctgttgcgca aacagcgcac tttcgacaat 1260

ggaagcatcc cccaccagat tcacctgggc gaactgcacg ctatcctcag gcggcaagag 1320

gatttctacc cctttttgaa agataacagg gaaaagattg agaaaatcct cacatttcgg 1380

ataccctact atgtaggccc cctcgcccgg ggaaattcca gattcgcgtg gatgactcgc 1440

aaatcagaag agaccatcac tccctggaac ttcgaggaag tcgtggataa gggggcctct 1500

gcccagtcct tcatcgaaag gatgactaac tttgataaaa atctgcctaa cgaaaaggtg 1560

cttcctaaac actctctgct gtacgagtac ttcacagttt ataacgagct caccaaggtc 1620

aaatacgtca cagaagggat gagaaagcca gcattcctgt ctggagagca gaagaaagct 1680

atcgtggacc tcctcttcaa gacgaaccgg aaagttaccg tgaaacagct caaagaagac 1740

tatttcaaaa agattgaatg tttcgactct gttgaaatca gcggagtgga ggatcgcttc 1800

aacgcatccc tgggaacgta tcacgatctc ctgaaaatca ttaaagacaa ggacttcctg 1860

gacaatgagg agaacgagga cattcttgag gacattgtcc tcacccttac gttgtttgaa 1920

gatagggaga tgattgaaga acgcttgaaa acttacgctc atctcttcga cgacaaagtc 1980

atgaaacagc tcaagaggcg ccgatataca ggatgggggc ggctgtcaag aaaactgatc 2040

aatgggatcc gagacaagca gagtggaaag acaatcctgg attttcttaa gtccgatgga 2100

tttgccaacc ggaacttcat gcagttgatc catgatgact ctctcacctt taaggaggac 2160

atccagaaag cacaagtttc tggccagggg gacagtcttc acgagcacat cgctaatctt 2220

gcaggtagcc cagctatcaa aaagggaata ctgcagaccg ttaaggtcgt ggatgaactc 2280

gtcaaagtaa tgggaaggca taagcccgag aatatcgtta tcgagatggc ccgagagaac 2340

caaactaccc agaagggaca gaagaacagt agggaaagga tgaagaggat tgaagagggt 2400

ataaaagaac tggggtccca aatccttaag gaacacccag ttgaaaacac ccagcttcag 2460

aatgagaagc tctacctgta ctacctgcag aacggcaggg acatgtacgt ggatcaggaa 2520

ctggacatca atcggctctc cgactacgac gtggctgcta tcgtgcccca gtcttttctc 2580

aaagatgatt ctattgataa taaagtgttg acaagatccg ataaagctag agggaagagt 2640

gataacgtcc cctcagaaga agttgtcaag aaaatgaaaa attattggcg gcagctgctg 2700

aacgccaaac tgatcacaca acggaagttc gataatctga ctaaggctga acgaggtggc 2760

ctgtctgagt tggataaagc cggcttcatc aaaaggcagc ttgttgagac acgccagatc 2820

accaagcacg tggcccaaat tctcgattca cgcatgaaca ccaagtacga tgaaaatgac 2880

aaactgattc gagaggtgaa agttattact ctgaagtcta agctggtctc agatttcaga 2940

aaggactttc agttttataa ggtgagagag atcaacaatt accaccatgc gcatgatgcc 3000

tacctgaatg cagtggtagg cactgcactt atcaaaaaat atcccaagct tgaatctgaa 3060

tttgtttacg gagactataa agtgtacgat gttaggaaaa tgatcgcaaa gtctgagcag 3120

gaaataggca aggccaccgc taagtacttc ttttacagca atattatgaa ttttttcaag 3180

accgagatta cactggccaa tggagagatt cggaagcgac cacttatcga aacaaacgga 3240

gaaacaggag aaatcgtgtg ggacaagggt agggatttcg cgacagtccg gaaggtcctg 3300

tccatgccgc aggtgaacat cgttaaaaag accgaagtac agaccggagg cttctccaag 3360

gaaagtatcc tcccgaaaag gaacagcgac aagctgatcg cacgcaaaaa agattgggac 3420

cccaagaaat acggcggatt cgattctcct acagtcgctt acagtgtact ggttgtggcc 3480

aaagtggaga aagggaagtc taaaaaactc aaaagcgtca aggaactgct gggcatcaca 3540

atcatggagc gatcaagctt cgaaaaaaac cccatcgact ttctcgaggc gaaaggatat 3600

aaagaggtca aaaaagacct catcattaag cttcccaagt actctctctt tgagcttgaa 3660

aacggccgga aacgaatgct cgctagtgcg ggcgagctgc agaaaggtaa cgagctggca 3720

ctgccctcta aatacgttaa tttcttgtat ctggccagcc actatgaaaa gctcaaaggg 3780

tctcccgaag ataatgagca gaagcagctg ttcgtggaac aacacaaaca ctaccttgat 3840

gagatcatcg agcaaataag cgaattctcc aaaagagtga tcctcgccga cgctaacctc 3900

gataaggtgc tttctgctta caataagcac agggataagc ccatcaggga gcaggcagaa 3960

aacattatcc acttgtttac tctgaccaac ttgggcgcgc ctgcagcctt caagtacttc 4020

gacaccacca tagacagaaa gcggtacacc tctacaaagg aggtcctgga cgccacactg 4080

attcatcagt caattacggg gctctatgaa acaagaatcg acctctctca gctcggtgga 4140

gacagcaggg ctgaccccaa gaagaagagg aaggtggagg ccagcggttc cggacgggct 4200

gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 4260

cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 4320

gcccttgatg atttcgacct ggacatgctg attaactcta gatga 4365

<210> 4

<211> 4425

<212> DNA

<213> Artificial

<220>

<223> VP64-activator construct

<400> 4

gccaccatgg acaagaagta ctccattggg ctcgctatcg gcacaaacag cgtcggctgg 60

gccgtcatta cggacgagta caaggtgccg agcaaaaaat tcaaagttct gggcaatacc 120

gatcgccaca gcataaagaa gaacctcatt ggcgccctcc tgttcgactc cggggagacg 180

gccgaagcca cgcggctcaa aagaacagca cggcgcagat atacccgcag aaagaatcgg 240

atctgctacc tgcaggagat ctttagtaat gagatggcta aggtggatga ctctttcttc 300

cataggctgg aggagtcctt tttggtggag gaggataaaa agcacgagcg ccacccaatc 360

tttggcaata tcgtggacga ggtggcgtac catgaaaagt acccaaccat atatcatctg 420

aggaagaagc ttgtagacag tactgataag gctgacttgc ggttgatcta tctcgcgctg 480

gcgcatatga tcaaatttcg gggacacttc ctcatcgagg gggacctgaa cccagacaac 540

agcgatgtcg acaaactctt tatccaactg gttcagactt acaatcagct tttcgaagag 600

aacccgatca acgcatccgg agttgacgcc aaagcaatcc tgagcgctag gctgtccaaa 660

tcccggcggc tcgaaaacct catcgcacag ctccctgggg agaagaagaa cggcctgttt 720

ggtaatctta tcgccctgtc actcgggctg acccccaact ttaaatctaa cttcgacctg 780

gccgaagatg ccaagcttca actgagcaaa gacacctacg atgatgatct cgacaatctg 840

ctggcccaga tcggcgacca gtacgcagac ctttttttgg cggcaaagaa cctgtcagac 900

gccattctgc tgagtgatat tctgcgagtg aacacggaga tcaccaaagc tccgctgagc 960

gctagtatga tcaagcgcta tgatgagcac caccaagact tgactttgct gaaggccctt 1020

gtcagacagc aactgcctga gaagtacaag gaaattttct tcgatcagtc taaaaatggc 1080

tacgccggat acattgacgg cggagcaagc caggaggaat tttacaaatt tattaagccc 1140

atcttggaaa aaatggacgg caccgaggag ctgctggtaa agcttaacag agaagatctg 1200

ttgcgcaaac agcgcacttt cgacaatgga agcatccccc accagattca cctgggcgaa 1260

ctgcacgcta tcctcaggcg gcaagaggat ttctacccct ttttgaaaga taacagggaa 1320

aagattgaga aaatcctcac atttcggata ccctactatg taggccccct cgcccgggga 1380

aattccagat tcgcgtggat gactcgcaaa tcagaagaga ccatcactcc ctggaacttc 1440

gaggaagtcg tggataaggg ggcctctgcc cagtccttca tcgaaaggat gactaacttt 1500

gataaaaatc tgcctaacga aaaggtgctt cctaaacact ctctgctgta cgagtacttc 1560

acagtttata acgagctcac caaggtcaaa tacgtcacag aagggatgag aaagccagca 1620

ttcctgtctg gagagcagaa gaaagctatc gtggacctcc tcttcaagac gaaccggaaa 1680

gttaccgtga aacagctcaa agaagactat ttcaaaaaga ttgaatgttt cgactctgtt 1740

gaaatcagcg gagtggagga tcgcttcaac gcatccctgg gaacgtatca cgatctcctg 1800

aaaatcatta aagacaagga cttcctggac aatgaggaga acgaggacat tcttgaggac 1860

attgtcctca cccttacgtt gtttgaagat agggagatga ttgaagaacg cttgaaaact 1920

tacgctcatc tcttcgacga caaagtcatg aaacagctca agaggcgccg atatacagga 1980

tgggggcggc tgtcaagaaa actgatcaat gggatccgag acaagcagag tggaaagaca 2040

atcctggatt ttcttaagtc cgatggattt gccaaccgga acttcatgca gttgatccat 2100

gatgactctc tcacctttaa ggaggacatc cagaaagcac aagtttctgg ccagggggac 2160

agtcttcacg agcacatcgc taatcttgca ggtagcccag ctatcaaaaa gggaatactg 2220

cagaccgtta aggtcgtgga tgaactcgtc aaagtaatgg gaaggcataa gcccgagaat 2280

atcgttatcg agatggcccg agagaaccaa actacccaga agggacagaa gaacagtagg 2340

gaaaggatga agaggattga agagggtata aaagaactgg ggtcccaaat ccttaaggaa 2400

cacccagttg aaaacaccca gcttcagaat gagaagctct acctgtacta cctgcagaac 2460

ggcagggaca tgtacgtgga tcaggaactg gacatcaatc ggctctccga ctacgacgtg 2520

gctgctatcg tgccccagtc ttttctcaaa gatgattcta ttgataataa agtgttgaca 2580

agatccgata aagctagagg gaagagtgat aacgtcccct cagaagaagt tgtcaagaaa 2640

atgaaaaatt attggcggca gctgctgaac gccaaactga tcacacaacg gaagttcgat 2700

aatctgacta aggctgaacg aggtggcctg tctgagttgg ataaagccgg cttcatcaaa 2760

aggcagcttg ttgagacacg ccagatcacc aagcacgtgg cccaaattct cgattcacgc 2820

atgaacacca agtacgatga aaatgacaaa ctgattcgag aggtgaaagt tattactctg 2880

aagtctaagc tggtctcaga tttcagaaag gactttcagt tttataaggt gagagagatc 2940

aacaattacc accatgcgca tgatgcctac ctgaatgcag tggtaggcac tgcacttatc 3000

aaaaaatatc ccaagcttga atctgaattt gtttacggag actataaagt gtacgatgtt 3060

aggaaaatga tcgcaaagtc tgagcaggaa ataggcaagg ccaccgctaa gtacttcttt 3120

tacagcaata ttatgaattt tttcaagacc gagattacac tggccaatgg agagattcgg 3180

aagcgaccac ttatcgaaac aaacggagaa acaggagaaa tcgtgtggga caagggtagg 3240

gatttcgcga cagtccggaa ggtcctgtcc atgccgcagg tgaacatcgt taaaaagacc 3300

gaagtacaga ccggaggctt ctccaaggaa agtatcctcc cgaaaaggaa cagcgacaag 3360

ctgatcgcac gcaaaaaaga ttgggacccc aagaaatacg gcggattcga ttctcctaca 3420

gtcgcttaca gtgtactggt tgtggccaaa gtggagaaag ggaagtctaa aaaactcaaa 3480

agcgtcaagg aactgctggg catcacaatc atggagcgat caagcttcga aaaaaacccc 3540

atcgactttc tcgaggcgaa aggatataaa gaggtcaaaa aagacctcat cattaagctt 3600

cccaagtact ctctctttga gcttgaaaac ggccggaaac gaatgctcgc tagtgcgggc 3660

gagctgcaga aaggtaacga gctggcactg ccctctaaat acgttaattt cttgtatctg 3720

gccagccact atgaaaagct caaagggtct cccgaagata atgagcagaa gcagctgttc 3780

gtggaacaac acaaacacta ccttgatgag atcatcgagc aaataagcga attctccaaa 3840

agagtgatcc tcgccgacgc taacctcgat aaggtgcttt ctgcttacaa taagcacagg 3900

gataagccca tcagggagca ggcagaaaac attatccact tgtttactct gaccaacttg 3960

ggcgcgcctg cagccttcaa gtacttcgac accaccatag acagaaagcg gtacacctct 4020

acaaaggagg tcctggacgc cacactgatt catcagtcaa ttacggggct ctatgaaaca 4080

agaatcgacc tctctcagct cggtggagac agcagggctg accccaagaa gaagaggaag 4140

gtggaggcca gcggttccgg acgggctgac gcattggacg attttgatct ggatatgctg 4200

ggaagtgacg ccctcgatga ttttgacctt gacatgcttg gttcggatgc ccttgatgac 4260

tttgacctcg acatgctcgg cagtgacgcc cttgatgatt tcgacctgga catgctgatt 4320

aactctagag cggccgcaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 4380

aaggtagatc caaaaaagaa gagaaaggta gatacggccg catag 4425

<210> 5

<211> 587

<212> DNA

<213> Artificial

<220>

<223> MS2-activator construct

<400> 5

ccaccatggg acctaagaaa aagaggaagg tggcggccgc ttctagaatg gcttctaact 60

ttactcagtt cgttctcgtc gacaatggcg gaactggcga cgtgactgtc gccccaagca 120

acttcgctaa cgggatcgct gaatggatca gctctaactc gcgttcacag gcttacaaag 180

taacctgtag cgttcgtcag agctctgcgc agaatcgcaa atacaccatc aaagtcgagg 240

tgcctaaagg cgcctggcgt tcgtacttaa atatggaact aaccattcca attttcgcca 300

cgaattccga ctgcgagctt attgttaagg caatgcaagg tctcctaaaa gatggaaacc 360

cgattccctc agcaatcgca gcaaactccg gcatctacga ggccagcggt tccggacggg 420

ctgacgcatt ggacgatttt gatctggata tgctgggaag tgacgccctc gatgattttg 480

accttgacat gcttggttcg gatgcccttg atgactttga cctcgacatg ctcggcagtg 540

acgcccttga tgatttcgac ctggacatgc tgattaactc tagatga 587

<210> 6

<211> 681

<212> DNA

<213> Artificial

<220>

<223> MS2-activator construct

<400> 6

gccaccatgg gacctaagaa aaagaggaag gtggcggccg cttctagaat ggcttctaac 60

tttactcagt tcgttctcgt cgacaatggc ggaactggcg acgtgactgt cgccccaagc 120

aacttcgcta acgggatcgc tgaatggatc agctctaact cgcgttcaca ggcttacaaa 180

gtaacctgta gcgttcgtca gagctctgcg cagaatcgca aatacaccat caaagtcgag 240

gtgcctaaag gcgcctggcg ttcgtactta aatatggaac taaccattcc aattttcgcc 300

acgaattccg actgcgagct tattgttaag gcaatgcaag gtctcctaaa agatggaaac 360

ccgattccct cagcaatcgc agcaaactcc ggcatctacg aggccagcgg ttccggacgg 420

gctgacgcat tggacgattt tgatctggat atgctgggaa gtgacgccct cgatgatttt 480

gaccttgaca tgcttggttc ggatgccctt gatgactttg acctcgacat gctcggcagt 540

gacgcccttg atgatttcga cctggacatg ctgattaact ctagagcggc cgcagatcca 600

aaaaagaaga gaaaggtaga tccaaaaaag aagagaaagg tagatccaaa aaagaagaga 660

aaggtagata cggccgcata g 681

<210> 7

<211> 557

<212> DNA

<213> Artificial

<220>

<223> MS2-activator construct

<220>

<221> misc_feature

<222> (320)..(339)

<223> wherein N is G, A, T or C

<400> 7

tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60

gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120

gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180

tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240

gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300

tggaaaggac gaaacaccgn nnnnnnnnnn nnnnnnnnng ttttagagct agaaatagca 360

agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgctctgc 420

aggtcgactc tagaaaacat gaggatcacc catgtctgca gtattcccgg gttcattaga 480

tcctaaggta cctaattgcc tagaaaacat gaggatcacc catgtctgca ggtcgactct 540

agaaattttt tctagac 557

<210> 8

<211> 882

<212> DNA

<213> Artificial

<220>

<223> Activation reporter construct

<400> 8

tagggataac agggtaatag tgtcccctcc accccacagt ggggcgaggt aggcgtgtac 60

ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120

gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180

gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240

tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300

acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360

ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420

gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480

gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540

aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600

atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660

atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720

tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780

atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840

caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882

<210> 9

<211> 882

<212> DNA

<213> Artificial

<220>

<223> Activation reporter construct

<400> 9

tagggataac agggtaatag tggggccact agggacagga ttggcgaggt aggcgtgtac 60

ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120

gccaccatgg actacaagga tgacgacgat aaaacttccg gtggcggact gggttccacc 180

gtgagcaagg gcgaggaggt catcaaagag ttcatgcgct tcaaggtgcg catggagggc 240

tccatgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc 300

acccagaccg ccaagctgaa ggtgaccaag ggcggccccc tgcccttcgc ctgggacatc 360

ctgtcccccc agttcatgta cggctccaag gcgtacgtga agcaccccgc cgacatcccc 420

gattacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 480

gacggcggtc tggtgaccgt gacccaggac tcctccctgc aggacggcac gctgatctac 540

aaggtgaaga tgcgcggcac caacttcccc cccgacggcc ccgtaatgca gaagaagacc 600

atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 660

atccaccagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagaccatc 720

tacatggcca agaagcccgt gcaactgccc ggctactact acgtggacac caagctggac 780

atcacctccc acaacgagga ctacaccatc gtggaacagt acgagcgctc cgagggccgc 840

caccacctgt tcctgtacgg catggacgag ctgtacaagt aa 882

<210> 10

<211> 912

<212> DNA

<213> Artificial

<220>

<223> Specificity reporter library

<220>

<221> misc_feature

<222> (22)..(44)

<223> wherein N is G, A, T or C

<220>

<221> misc_feature

<222> (154)..(177)

<223> wherein N is G, A, T or C

<400> 10

tagggataac agggtaatag tnnnnnnnnn nnnnnnnnnn nnnncgaggt aggcgtgtac 60

ggtgggaggc ctatataagc agagctcgtt tagtgaaccg tcagatcgcc tggagaattc 120

gccaccatgg actacaagga tgacgacgat aaannnnnnn nnnnnnnnnn nnnnnnnact 180

tccggtggcg gactgggttc caccgtgagc aagggcgagg aggtcatcaa agagttcatg 240

cgcttcaagg tgcgcatgga gggctccatg aacggccacg agttcgagat cgagggcgag 300

ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac caagggcggc 360

cccctgccct tcgcctggga catcctgtcc ccccagttca tgtacggctc caaggcgtac 420

gtgaagcacc ccgccgacat ccccgattac aagaagctgt ccttccccga gggcttcaag 480

tgggagcgcg tgatgaactt cgaggacggc ggtctggtga ccgtgaccca ggactcctcc 540

ctgcaggacg gcacgctgat ctacaaggtg aagatgcgcg gcaccaactt cccccccgac 600

ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct ccaccgagcg cctgtacccc 660

cgcgacggcg tgctgaaggg cgagatccac caggccctga agctgaagga cggcggccac 720

tacctggtgg agttcaagac catctacatg gccaagaagc ccgtgcaact gcccggctac 780

tactacgtgg acaccaagct ggacatcacc tcccacaacg aggactacac catcgtggaa 840

cagtacgagc gctccgaggg ccgccaccac ctgttcctgt acggcatgga cgagctgtac 900

aagtaagaat tc 912

<210> 11

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 11

ctggcggatc actcgcggtt agg 23

<210> 12

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 12

cctcggcctc caaaagtgct agg 23

<210> 13

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 13

acgctgattc ctgcagatca ggg 23

<210> 14

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 14

ccaggaatac gtatccacca ggg 23

<210> 15

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 15

gccacaccca agcgatcaaa tgg 23

<210> 16

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 16

aaataataca ttctaaggta agg 23

<210> 17

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 17

gctactgggg aggctgaggc agg 23

<210> 18

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 18

tagcaataca gtcacattaa tgg 23

<210> 19

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 19

ctcatgtgat ccccccgtct cgg 23

<210> 20

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 20

ccgggcagag agtgaacgcg cgg 23

<210> 21

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 21

ttccttccct ctcccgtgct tgg 23

<210> 22

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 22

tctctgcaaa gcccctggag agg 23

<210> 23

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 23

aatgcagttg ccgagtgcag tgg 23

<210> 24

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 24

cctcagcctc ctaaagtgct ggg 23

<210> 25

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 25

gagtccaaat cctctttact agg 23

<210> 26

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 26

gagtgtctgg atttgggata agg 23

<210> 27

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 27

cagcacctca tctcccagtg agg 23

<210> 28

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 28

tctaaaaccc agggaatcat ggg 23

<210> 29

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 29

cacaaggcag ccagggatcc agg 23

<210> 30

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 30

gatggcaagc tgagaaacac tgg 23

<210> 31

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 31

tgaaatgcac gcatacaatt agg 23

<210> 32

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 32

ccagtccaga cctggccttc tgg 23

<210> 33

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 33

cccagaaaaa cagaccctga agg 23

<210> 34

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 34

aagggttgag cacttgttta ggg 23

<210> 35

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 35

atgtctgagt tttggttgag agg 23

<210> 36

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 36

ggtcccttga aggggaagta ggg 23

<210> 37

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 37

tggcagtcta ctcttgaaga tgg 23

<210> 38

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 38

ggcacagtgc cagaggtctg tgg 23

<210> 39

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 39

taaaaataaa aaaactaaca ggg 23

<210> 40

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 40

tctgtggggg acctgcactg agg 23

<210> 41

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 41

ggccagaggt caaggctagt ggg 23

<210> 42

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 42

cacgaccgaa acccttctta cgg 23

<210> 43

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 43

gttgaatgaa gacagtctag tgg 23

<210> 44

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 44

taagaacaga gcaagttacg tgg 23

<210> 45

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 45

tgtaaggtaa gagaggagag cgg 23

<210> 46

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 46

tgacacacca actcctgcac tgg 23

<210> 47

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 47

tttacccact tccttcgaaa agg 23

<210> 48

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 48

gtggctggca ggctggctct ggg 23

<210> 49

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 49

ctcccccggc ctcccccgcg cgg 23

<210> 50

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 50

caaaacccgg cagcgaggct ggg 23

<210> 51

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 51

aggagccgcc gcgcgctgat tgg 23

<210> 52

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 52

cacacacacc cacacgagat ggg 23

<210> 53

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 53

gaagaagcta aagagccaga ggg 23

<210> 54

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 54

atgagaattt caataacctc agg 23

<210> 55

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 55

tcccgctctg ttgcccaggc tgg 23

<210> 56

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 56

cagacaccca ccaccatgcg tgg 23

<210> 57

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 57

tcccaattta ctgggattac agg 23

<210> 58

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 58

tgatttaaaa gttggaaacg tgg 23

<210> 59

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 59

tctagttccc cacctagtct ggg 23

<210> 60

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 60

gattaactga gaattcacaa ggg 23

<210> 61

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target probe

<400> 61

cgccaggagg ggtgggtcta agg 23

<210> 62

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Reporter construct

<400> 62

gtcccctcca ccccacagtg ggg 23

<210> 63

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Reporter construct

<400> 63

ggggccacta gggacaggat tgg 23

<210> 64

<211> 71

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 64

taatactttt atctgtcccc tccaccccac agtggggcca ctagggacag gattggtgac 60

agaaaagccc c 71

<210> 65

<211> 20

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 65

ggggccacta gggacaggat 20

<210> 66

<211> 80

<212> RNA

<213> Artificial

<220>

<223> Guide RNA

<400> 66

guuuuagagc uagaaauagc aaguuaaaau aaggcuagcu uguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 67

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 67

gtcccctcca ccccacagtg cag 23

<210> 68

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 68

gtcccctcca ccccacagtg caa 23

<210> 69

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 69

gtcccctcca ccccacagtg cgg 23

<210> 70

<211> 52

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 70

tgtcccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52

<210> 71

<211> 52

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 71

tgtccccccc accccacagt ggggccacta gggacaggat tggtgacaga aa 52

<210> 72

<211> 52

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 72

aaaaccctcc accccacagt ggggccacta gggacaggat tggtgacaga aa 52

<210> 73

<211> 52

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 73

tgtcccctcc ttttttcagt ggggccacta gggacaggat tggtgacaga aa 52

<210> 74

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 74

caccggggtg gtgcccatcc tgg 23

<210> 75

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 75

ggtgcccatc ctggtcgagc tgg 23

<210> 76

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 76

cccatcctgg tcgagctgga cgg 23

<210> 77

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 77

ggccacaagt tcagcgtgtc cgg 23

<210> 78

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 78

cgcaaataag agctcaccta cgg 23

<210> 79

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 79

ctgaagttca tctgcaccac cgg 23

<210> 80

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 80

ccggcaagct gcccgtgccc tgg 23

<210> 81

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 81

gaccaggatg ggcaccaccc cgg 23

<210> 82

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 82

gccgtccagc tcgaccagga tgg 23

<210> 83

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 83

ggccggacac gctgaacttg tgg 23

<210> 84

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 84

taacagggta atgtcgaggc cgg 23

<210> 85

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 85

aggtgagctc ttatttgcgt agg 23

<210> 86

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 86

cttcagggtc agcttgccgt agg 23

<210> 87

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 87

gggcacgggc agcttgccgg tgg 23

<210> 88

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 88

gagatgatcg ccccttcttc tgg 23

<210> 89

<211> 20

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 89

gagatgatcg ccccttcttc 20

<210> 90

<211> 20

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 90

gtgatgaccg gccgttcttc 20

<210> 91

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 91

gtcccctcca ccccacagtg ggg 23

<210> 92

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 92

gagatgatcg cccgttcttc tgg 23

<210> 93

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 93

guccccucca ccccacagug 20

<210> 94

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 94

guccccucca ccccacaguc 20

<210> 95

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 95

guccccucca ccccacagag 20

<210> 96

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 96

guccccucca ccccacacug 20

<210> 97

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 97

guccccucca ccccacugug 20

<210> 98

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 98

guccccucca ccccagagug 20

<210> 99

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 99

guccccucca ccccucagug 20

<210> 100

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 100

guccccucca cccgacagug 20

<210> 101

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 101

guccccucca ccgcacagug 20

<210> 102

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 102

guccccucca cgccacagug 20

<210> 103

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 103

guccccucca gcccacagug 20

<210> 104

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 104

guccccuccu ccccacagug 20

<210> 105

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 105

guccccucga ccccacagug 20

<210> 106

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 106

guccccucca ccccacagac 20

<210> 107

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 107

guccccucca ccccacucug 20

<210> 108

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 108

guccccucca ccccugagug 20

<210> 109

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 109

guccccucca ccggacagug 20

<210> 110

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 110

guccccucca ggccacagug 20

<210> 111

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 111

guccccucgu ccccacagug 20

<210> 112

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 112

ggggccacta gggacaggat ggg 23

<210> 113

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 113

gagaugaucg ccccuucuuc 20

<210> 114

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 114

gagaugaucg ccccuucuug 20

<210> 115

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 115

gagaugaucg ccccuucuac 20

<210> 116

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 116

gagaugaucg ccccuucauc 20

<210> 117

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 117

gagaugaucg ccccuuguuc 20

<210> 118

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 118

gagaugaucg ccccuacuuc 20

<210> 119

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 119

gagaugaucg ccccaucuuc 20

<210> 120

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 120

gagaugaucg cccguucuuc 20

<210> 121

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 121

gagaugaucg ccgcuucuuc 20

<210> 122

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 122

gagaugaucg cgccuucuuc 20

<210> 123

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 123

gagaugaucg gcccuucuuc 20

<210> 124

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 124

gagaugaucc ccccuucuuc 20

<210> 125

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 125

gagaugaugg ccccuucuuc 20

<210> 126

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 126

gagaugaucg ccccuucuag 20

<210> 127

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 127

gagaugaucg ccccuugauc 20

<210> 128

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 128

gagaugaucg ccccaacuuc 20

<210> 129

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 129

gagaugaucg ccgguucuuc 20

<210> 130

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 130

gagaugaucg ggccuucuuc 20

<210> 131

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 131

gagaugaugc ccccuucuuc 20

<210> 132

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 132

gagatgatcg ccccttcttc tgg 23

<210> 133

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 133

ggggccacua gggacaggau 20

<210> 134

<211> 19

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 134

gggccacuag ggacaggau 19

<210> 135

<211> 18

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 135

ggccacuagg gacaggau 18

<210> 136

<211> 17

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 136

gccacuaggg acaggau 17

<210> 137

<211> 20

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 137

gagaugaucg ccccuucuuc 20

<210> 138

<211> 18

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 138

gaugaucgcc ccuucuuc 18

<210> 139

<211> 15

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 139

gaucgccccu ucuuc 15

<210> 140

<211> 11

<212> RNA

<213> Artificial

<220>

<223> RNA target sequence

<400> 140

gccccuucuu c 11

<210> 141

<211> 21

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 141

gtcccctcca ccccacagtg c 21

<210> 142

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<220>

<221> misc_feature

<222> (5)..(10)

<223> wherein N id G, A, T or C

<400> 142

tgtcnnnnnn accc 14

<210> 143

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 143

tgtcaaaaaa accc 14

<210> 144

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 144

tgtcgggggg accc 14

<210> 145

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 145

tgtcaaaaaa accc 14

<210> 146

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 146

tgtcgggggg accc 14

<210> 147

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 147

tgtccccccc accc 14

<210> 148

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 148

tgtctttttt accc 14

<210> 149

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 149

tgtccccccc accc 14

<210> 150

<211> 14

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 150

tgtctttttt accc 14

<210> 151

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 151

ggatcctgtg tccccgagct ggg 23

<210> 152

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 152

gttaatgtgg ctctggttct ggg 23

<210> 153

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 153

ggggccacta gggacaggat tgg 23

<210> 154

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 154

cttcctagtc tcctgatatt ggg 23

<210> 155

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 155

tggtcccagc tcggggacac agg 23

<210> 156

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 156

agaaccagag ccacattaac cgg 23

<210> 157

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 157

gtcaccaatc ctgtccctag tgg 23

<210> 158

<211> 23

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 158

agacccaata tcaggagact agg 23

<210> 159

<211> 75

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 159

gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggctc 60

tggttctggg tactt 75

<210> 160

<211> 69

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 160

gggatcctgt gtccccgagc tgggaccacc ttatattccc agggccggtt aatgtggttc 60

tgggtactt 69

<210> 161

<211> 113

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 161

gggatcctgt gtccccgagc tgggaccacc ttatattccc agggcagggc cggttggacc 60

accttatatt cccagggcag ggccggttaa tgtggctctg gttctgggta ctt 113

<210> 162

<211> 34

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 162

gggatcctgt gtccccgtct ggttctgggt actt 34

<210> 163

<211> 47

<212> DNA

<213> Artificial

<220>

<223> Target oligoncleotide sequence

<400> 163

gggatcctgt gtccccgagc tgggaccacc ttatattctg ggtactt 47

<210> 164

<211> 17

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 164

gggatcctgt ggtactt 17

<210> 165

<211> 93

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 165

agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60

ggggccacta gggacaggat tggtgacaga aaa 93

<210> 166

<211> 83

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 166

agggccggtt aatgaatgtg gctctggttc tgggtacttt tatctgtccc ctccacccca 60

cagtggggcc actagacaga aaa 83

<210> 167

<211> 76

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 167

agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccccag tggggccact 60

gattggtgac agaaaa 76

<210> 168

<211> 29

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 168

agggccggtt caggattggt gacagaaaa 29

<210> 169

<211> 34

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 169

agggccggtt aatgtggcga ttggtgacag aaaa 34

<210> 170

<211> 63

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 170

agggccggtt aatgtggctc tggttctggg tacttttatc tgtccccgat tggtgacaga 60

aaa 63

<210> 171

<211> 84

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 171

agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccacagt 60

ggggacagga ttggtgacag aaaa 84

<210> 172

<211> 27

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 172

agggccggtt aatgtggtga cagaaaa 27

<210> 173

<211> 105

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 173

agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accccagggg 60

acagtctgtc ccctccaccc cagggacagg attggtgaca gaaaa 105

<210> 174

<211> 80

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 174

agggccggtt aatgtggctc tggttctggg tacttttatc tgtcccctcc accactaggg 60

acaggattgg tgacagaaaa 80

<210> 175

<211> 53

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 175

cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatac ccc 53

<210> 176

<211> 22

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 176

cccacagtgg ggccactacc cc 22

<210> 177

<211> 96

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 177

cccacagtgg ggccactagt agaaaagccc catccttagg cctcccccat ccttaggcct 60

cctccttcct agtctcctga tattgggtct aacccc 96

<210> 178

<211> 94

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 178

cccacagtgg ggccactagg gacaggattg gtgacagaaa agccccatcc ttaggcctcc 60

tccttcctag tctcctgata ttgggtctaa cccc 94

<210> 179

<211> 62

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 179

cccacagtgg ggccaccctt aggcctcctc cttcctagtc tcctgatatt gggtctaacc 60

cc 62

<210> 180

<211> 38

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 180

cccacagtgg ggccactagt gatattgggt ctaacccc 38

<210> 181

<211> 94

<212> DNA

<213> Artificial

<220>

<223> target oligonucleotide sequence

<400> 181

cccacagtgg ggccactagg gacaggattg gtgacaaaaa agccccatcc ttacgcctcc 60

tccttcctag tctcctgata ttgggtctaa cccc 94

<210> 182

<211> 65

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 182

cccacagtgg ggccactagg gacaggcctc ctccttccta gtctcctgat attgggtcta 60

acccc 65

<210> 183

<211> 102

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 183

cccacagtgg ggccactagg gacaggggga caggattggt gacagaaaag ccccatcctt 60

aggcctcctc cttcctagtc tcctgatatt gggtctaacc cc 102

<210> 184

<211> 76

<212> DNA

<213> Artificial

<220>

<223> Target oligonucleotide sequence

<400> 184

cccacaggat tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga 60

tattgggtct aacccc 76

<---

1. Способ изменения ДНК целевой нуклеиновой кислоты в клетке, включающий:

введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или более РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты,

введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом, который направляется двумя или более РНК,

причем эти две или более РНК и по меньшей мере один белок-никаза Cas9 экспрессируются, при этом по меньшей мере один белок-никаза Cas9 локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрыва,

где клетка не является клеткой зародышевой линии человека.

2. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на одной и той же нити двухцепочечной ДНК.

3. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на одной и той же нити двухцепочечной ДНК, что приводит к гомологичной рекомбинации.

4. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК.

5. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы.

6. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов.

7. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и смещены относительно друг друга.

8. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы.

9. Способ по п. 1, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов.

10. Способ по п. 1, дополнительно включающий введение в клетку третьей чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, при этом два или несколько одноцепочечных разрыва приводят к гомологичной рекомбинации целевой нуклеиновой кислоты с последовательностью донорной нуклеиновой кислоты.

11. Клетка для направляемого РНК основанного на Cas редактирования генома, где клетка содержит:

первую чужеродную нуклеиновую кислоту, кодирующую две или более РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты, и

вторую чужеродную нуклеиновую кислоту, кодирующую по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом, причем две или несколько РНК и по меньшей мере один белок-никаза Cas9 входят в состав комплекса совместной локализации для ДНК целевой нуклеиновой кислоты.

12. Клетка по п. 11, при этом клетка является эукариотической клеткой.

13. Клетка по п. 11, при этом клетка является клеткой дрожжей, клеткой растений или клеткой животных.

14. Клетка по п. 11, при этом РНК содержит от 10 до 500 нуклеотидов.

15. Клетка по п. 11, при этом РНК содержит от 20 до 100 нуклеотидов.

16. Клетка по п. 11, при этом целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

17. Клетка по п. 11, при этом одна или несколько РНК представлены направляющей РНК.

18. Клетка по п. 11, при этом две или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

19. Клетка по п. 11, при этом ДНК целевой нуклеиновой кислоты представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

20. Способ изменения ДНК целевой нуклеиновой кислоты в клетке, включающий:

введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты,

введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один белок-никазу Cas9 с одним неактивным нуклеазным доменом, который направляется двумя или несколькими РНК,

причем эти две или несколько РНК и по меньшей мере один белок-никаза Cas9 экспрессируются, при этом по меньшей мере один белок-никаза Cas9 локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрыва,

причем эти два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к фрагментации целевой нуклеиновой кислоты, тем самым предотвращая экспрессию целевой нуклеиновой кислоты,

где клетка не является клеткой зародышевой линии человека.

21. Способ изменения ДНК целевой нуклеиновой кислоты в клетке, включающий:

введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или несколько РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты,

введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу из системы CRISPR типа II,

причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрыва,

где клетка не является клеткой зародышевой линии человека.

22. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на одной и той же нити двухцепочечной ДНК.

23. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на одной и той же нити двухцепочечной ДНК, что приводит к гомологичной рекомбинации.

24. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК.

25. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы.

26. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов.

27. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и смещены относительно друг друга.

28. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы.

29. Способ по п. 21, при этом два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК, смещены относительно друг друга и создают двухцепочечные разрывы, что приводит к негомологичному соединению концов.

30. Способ по п. 21, дополнительно включающий введение в клетку третьей чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, при этом два или несколько одноцепочечных разрыва приводят к гомологичной рекомбинации целевой нуклеиновой кислоты с последовательностью донорной нуклеиновой кислоты.

31. Клетка для направляемого РНК основанного на Cas редактирования генома, где клетка содержит:

первую чужеродную нуклеиновую кислоту, кодирующую две или несколько РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты, и

вторую чужеродную нуклеиновую кислоту, кодирующую по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу из системы CRISPR типа II, причем две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза входят в состав комплекса совместной локализации для ДНК целевой нуклеиновой кислоты.

32. Клетка по п. 31, при этом клетка является эукариотической клеткой.

33. Клетка по п. 31, при этом клетка является клеткой дрожжей, клеткой растений или клеткой животных.

34. Клетка по п. 31, при этом РНК содержит от 10 до 500 нуклеотидов.

35. Клетка по п. 31, при этом РНК содержит от 20 до 100 нуклеотидов.

36. Клетка по п. 31, при этом целевая нуклеиновая кислота связана с заболеванием или болезненным состоянием.

37. Клетка по п. 31, при этом две или несколько РНК представлены направляющей РНК.

38. Клетка по п. 31, при этом две или несколько РНК представляют собой слияния tracr-РНК и cr-РНК.

39. Клетка по п. 31, при этом ДНК целевой нуклеиновой кислоты представлена геномной ДНК, митохондриальной ДНК, вирусной ДНК либо экзогенной ДНК.

40. Способ изменения ДНК целевой нуклеиновой кислоты в клетке, включающий:

введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей две или более РНК, причем каждая РНК комплементарна к сайту, прилегающему к ДНК целевой нуклеиновой кислоты,

введение в клетку второй чужеродной нуклеиновой кислоты, кодирующей по меньшей мере один РНК-направляемый ДНК-связывающий белок-никазу из системы CRISPR типа II,

причем эти две или несколько РНК и по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза экспрессируются, при этом по меньшей мере один РНК-направляемый ДНК-связывающий белок-никаза локализуется совместно с двумя или несколькими РНК на ДНК целевой нуклеиновой кислоты и надрезает ДНК целевой нуклеиновой кислоты, в результате чего образуются два или несколько соседних одноцепочечных разрыва,

причем эти два или несколько соседних одноцепочечных разрыва находятся на разных нитях двухцепочечной ДНК и создают двухцепочечные разрывы, что приводит к фрагментации целевой нуклеиновой кислоты, тем самым предотвращая экспрессию целевой нуклеиновой кислоты,

где клетка не является клеткой зародышевой линии человека.



 

Похожие патенты:

Изобретение относится к биотехнологии, а именно к способам молекулярно-генетического типирования штаммов возбудителей инфекционных заболеваний, которые используются при микробиологическом и молекулярно-генетическом мониторинге штаммов F. tularensis, циркулирующих на различных территориях, с целью их дифференциации.

Изобретение относится к области биотехнологии и диагностической медицины. У пациента осуществляют сбор крови и мочи, выделение свободной цирДНК из плазмы, суммарной цирДНК из супернатанта крови, внДНК из супернатанта мочи, модификацию цирДНК и внДНК бисульфитом натрия.

Группа изобретений относится к области молекулярных вычислительных устройств. Предложено молекулярное вычислительное устройство (варианты), способ проведения вычислений с помощью устройства, фармацевтическая формуляция, содержащая устройства, а также применение фармацевтической формуляции для регуляции экспрессии гена.

Изобретение относится к биотехнологии и медицине и может быть использовано в кардиологии, ангиологии, кардиохирургии, терапии, реабилитологии. Определяют концентрацию цитомегаловирусной ДНК на 1 мл плазмы крови методом полимеразной цепной реакции (ПЦР) с гибридизационно-флуоресцентной детекцией продуктов амплификации в режиме «реального времени» (Real-time).

Группа изобретений относится к биотехнологии. Предложена рекомбинантная секретируемая термостабильная β-глюканаза, включающая последовательность кодирующей части гена β-глюканазы семейства 12 из штамма Thielavia terrestris ВКПМ F-144 и имеющая последовательность SEQ ID NO 2.

Настоящее изобретение относится к области биотехнологии, конкретно к получению мутеинов липокалина человека, которые специфически связывают глипикан-3 (GPC3), и может быть использовано в медицине для лечения рака, клетки которого экспрессируют GPC3. Мутантный липокалин получают на основе зрелого ассоциированного с желатиназой нейтрофилов липокалина человека (hNGAL).

Изобретение относится к медицинской биотехнологии. Изобретение представляет собой способ определения генотипа человека, связанный с быстрым и медленным ацетилированием ксенобиотиков.

Изобретение относится к биотехнологии и представляет собой способ идентификации полиморфизмов p.Cys1079Gly и p.Cys1079Phe медь-транспортной АТФазы человека. Способ заключается в генотипировании соответствующих однонуклеотидных полиморфизмов в 14 экзоне гена АТФазы человека ATP7В (миссенс мутации) c.3235T>G и c.3236G>T методом полимеразной цепной реакции и полиморфизма длин рестрикционных фрагментов (ГЩР-ПДРФ) с использованием прямого праймера 5'-ACAAGACTGGCАССАТТАСССА-3' и обратного праймера 5'-ACGCCCAAGTCCACGTAACTCTGTA-3 Настоящее изобретение представляет простой способ идентификации полиморфизмов p.Cysl079Gly и p.Cysl079Phe медь-транспортной АТФазы человека и может быть использовано в медицине при диагностике предрасположенности к болезни Паркинсона (БП) и болезни Вильсона (БВ) для выбора предиктивной терапии.

Изобретение относится к области биотехнологии, в частности к клетке растения табака, придающей измененный вкусовой профиль высушенному растительному материалу табака, содержащему указанную клетку, а также к растению, растительному материалу и табачной композиции, содержащим вышеуказанную клетку. Также раскрыт способ получения растения табака с повышенными уровнями протеазы, а также способ получения растения табака с пониженными уровнями протеазы.

Настоящее изобретение относится к области иммунологии. Предложен способ улучшения фармакокинетики антитела, включающий замену по меньшей мере одной аминокислоты вариабельной области указанного антитела на гистидин.

Изобретение относится к конъюгату общей формулы (I), который применяется для доставки лекарственного вещества через биологическую мембрану. 20 пр., 57 ил..
Наверх