Векторная система на основе аденоассоциированного вируса

Авторы патента:

МАКЛАРЕН, Роберт (GB)

МАККЛЕМЕНТС, Мишелль (GB)

C12N15/86 - вирусные векторы

C07K14/705 - рецепторы; клеточные антигены; клеточные поверхностные детерминаторы

A61K9/0048 - Медицинские препараты, характеризуемые специальными физическими формами (препараты, содержащие радиоактивные вещества A61K 51/12)

A61K48/00 - Лекарственные препараты, содержащие генетический материал, который включен в клетки живого организма для лечения генетических заболеваний; для генной терапии

A61K38/177 - Лекарственные препараты, содержащие пептиды (пептиды, содержащие бета-лактамовые кольца A61K 31/00; циклические дипептиды, не имеющие в молекуле какой-либо другой пептидной связи кроме формирующей их ядро, наприме

A61K35/761 - Лекарственные препараты, содержащие вещества или продукты реакции неизвестного строения

Владельцы патента RU 2765826:

ОХФОРД ЮНИВЕРСИТИ ИННОВЕЙШН ЛИМИТЕД (GB)

Изобретение относится к биотехнологии. Описана векторная система на основе аденоассоциированного вируса (AAV) для экспрессии белка АТФ-связывающей кассеты, подсемейство A, члена 4 (ABCA4) человека в клетке-мишени, содержащая первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты; где первая последовательность нуклеиновой кислоты содержит 5′-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3′-концевую часть CDS ABCA4, и 5′-концевая часть и 3′-концевая часть вместе включают целую CDS ABCA4; где первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3597 SEQ ID NO: 1 или SEQ ID NO: 2; где вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 3806-6926 SEQ ID NO: 1 или SEQ ID NO: 2; где каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты содержит область перекрывания последовательностей друг с другом; и где область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1 или SEQ ID NO: 2. Настоящее изобретение также относится к применению векторных систем AAV в профилактике или лечении заболевания, отличающегося деградацией клеток сетчатки, предпочтительно, болезни Штаргардта. Изобретение расширяет арсенал средств лечения заболеваний, отличающихся деградацией клеток сетчатки. 12 н. и 10 з.п. ф-лы, 12 ил., 6 пр.

ОБЛАСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к векторным системам на основе аденоассоциированного вируса (AAV) и векторам AAV для экспрессии белка ABCA4 человека в клетке-мишени. Векторные системы AAV и векторы AAV по изобретению можно использовать в профилактике или лечении заболеваний, ассоциированных с деградацией клеток сетчатки, таких как болезнь Штаргардта.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

Болезнь Штаргардта является наследственным заболеванием сетчатки, которое может приводить к слепоте по причине деструкции светочувствительных фоторецепторных клеток в глазу. Заболевание, как правило, дебютирует в детском возрасте, приводя к слепоте у молодых людей.

Наиболее распространенной формой болезни Штаргардта является рецессивное нарушение, связанное с мутациями в гене, кодирующем белок АТФ-связывающей кассеты, подсемейство A, члена 4 (ABCA4). ABCA4 является крупным трансмембранным белком, играющим роль в кругообороте светочувствительных пигментов в клетках сетчатки. При болезни Штаргардта мутации в гене ABCA4 приводят к отсутствию функционального белка ABCA4 в клетках сетчатки. Это, в свою очередь, приводит к образованию и накоплению бисретиноидных побочных продуктов, что приводит к образованию токсических гранул липофусцина в клетках пигментного эпителия сетчатки (RPE). Это вызывает деградацию и конечную деструкцию клеток RPE, что приводит к утрате фоторецепторных клеток, вызывающей прогрессирующую потерю зрения и, в конечном итоге, слепоту.

Генная терапия является перспективным направлением лечения болезни Штаргардта. Целью является коррекция недостаточности, лежащей в основе заболевания, с использованием вектора для встраивания функционального гена ABCA4 в пораженные фоторецепторные клетки и, таким образом, восстановления функции ABCA4.

Векторы, полученные из аденоассоциированного вируса (AAV), в настоящее время находятся на стадии исследования с целью генной терапии сетчатки. AAV является небольшим вирусом, имеющим очень низкую иммуногенность и не ассоциированным с каким-либо известным заболеванием человека. Отсутствие ассоциированного с ним воспалительного ответа означает, что AAV не вызывает повреждение сетчатки при инъекции в глаз.

Однако размер капсида AAV накладывает ограничение на количество ДНК, которую можно в него упаковывать. Размер генома AAV составляет приблизительно 4,7 тысяч пар нуклеотидов (т.п.н.), и полагают, что соответствующий верхний предел размера для упаковки ДНК в AAV составляет приблизительно 5 т.п.н. (Wu et al., Molecular Therapy, vol. 18, No. 1, Jan 2010). Размер кодирующей последовательности гена ABCA4 составляет приблизительно 6,8 т.п.н. (с дополнительными генетическими элементами, необходимыми для экспрессии гена), что делает ее слишком большой для включения в стандартный вектор AAV.

Исследуют ряд подходов для преодоления этого верхнего предела размера и экспрессии крупных генов, таких как ABCA4, с векторов AAV. Эти подходы включают подходы с использованием вектора "большого размера" и подходы с использованием "двойного" вектора.

Векторы "большого размера"

Предпринят ряд попыток включения в векторы AAV генов значительно большего размера, чем нативный геном в 4,7 т.п.н., с некоторым успехом при трансдукции клеток-мишеней. В качестве примера, Allocca et al. (J. Clin. Invest. vol.118, No. 5, мая 2008) получали векторы AAV большого размера, в которые упаковывали гены ABCA4 мыши и MYO7A человека, и демонстрировали экспрессию белка после трансдукции клеток сетчатки мыши. Однако, хотя Allocca et al. предположили, что конкретные капсиды AAV могут включать до 8,9 т.п.н., последующие исследования показали, что подход с использованием вектора "большого размера" фактически не позволяет преодолевать верхний предел размера при упаковке, но скорее приводит к укорачиванию трансгена случайным образом, что приводит к получению гетерогенной популяции векторов AAV, каждый из которых содержит фрагмент трансгена (Dong et al., Molecular Therapy, vol. 18, No. 1, Jan 2010). Полагают, что часть векторов большого размера в указанной популяции упаковывает достаточно крупные фрагменты трансгена большого размера таким образом, что существуют области перекрывания между фрагментами, что позволяет им повторно собираться в полноразмерный ген после трансдукции клетки-мишени. Однако этот способ является непредсказуемым и неэффективным, демонстрирует отсутствие контроля упаковки и последующую неудачу рекомбинации, что представляет собой существенное препятствие для последовательного, определимого успеха.

"Двойные" векторы

Альтернативным подходом является получение двойных векторных систем, в которых трансген с пределом более приблизительно 5 т.п.н. разделяют приблизительно пополам на два отдельных вектора определенной последовательности: "вышележащий" вектор, содержащий 5'-часть трансгена, и "нижележащий" вектор, содержащий 3'-часть трансгена. Трансдукция клетки-мишени с использованием вышележащих и нижележащих векторов позволяет полноразмерному трансгену повторно собираться из двух фрагментов с использованием различных внутриклеточных механизмов.

В так называемом походе "транс-сплайсирующегося" двойного вектора сигнал донора сплайсинга помещают на 3'-конец вышележащего фрагмента трансгена и сигнал акцептора сплайсинга помещают на 5'-конец нижележащего фрагмента трансгена. После трансдукции клетки-мишени с использованием двойных векторов последовательности инвертированных концевых повторов (ITR), присутствующие в геноме AAV, опосредуют конкатемеризацию фрагментов трансгена по принципу "голова-хвост", и транс-сплайсинг транскриптов приводит к продукции полноразмерной последовательности мРНК, что делает возможной экспрессию полноразмерного белка.

В альтернативной двойной векторной системе используют подход с "перекрыванием". В перекрывающейся двойной векторной системе часть кодирующей последовательности на 3'-конце вышележащей части кодирующей последовательности перекрывается с гомологичной последовательностью на 5'-конце нижележащей части кодирующей последовательности. После трансдукции клетки-мишени с использованием вышележащих и нижележащих векторов гомологичная рекомбинация между вышележащими и нижележащими частями кодирующей последовательности делает возможным восстановление полноразмерного трансгена, с которого может транскрибироваться соответствующая мРНК и может экспрессироваться полноразмерный белок.

В WO 2014/170480 описывают получение двойной векторной системы AAV, кодирующей белок ABCA4 человека.

Таким образом, в этой области существует потребность в альтернативных и/или улучшенных векторных системах AAV, кодирующих белок ABCA4 и пригодных для использования в генной терапии.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Настоящее изобретение направлено на решение указанных выше проблем, существующих в этой области, посредством получения векторных систем на основе аденоассоциированного вируса (AAV), как описано в формуле изобретения.

Преимущественно, векторная система AAV по изобретению ассоциирована с неожиданно высокими уровнями экспрессии полноразмерного белка ABCA4 в трансдуцированных клетках с ограниченной продукцией нежелательных укороченных фрагментов ABCA4.

В одном из аспектов изобретение относится к векторной системе AAV для экспрессии белка ABCA4 человека в клетке-мишени, векторной системе AAV, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты; где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности (CDS) ABCA4, и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3597 SEQ ID NO: 1; где вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующих нуклеотидам 3806-6926 SEQ ID NO: 1; где каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты содержит область перекрывания последовательностей друг с другом; и где область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1.

Область перекрывания последовательностей может составлять от 20 до 550 нуклеотидов в длину; предпочтительно - от 50 до 250 нуклеотидов в длину; более предпочтительно - от 175 до 225 нуклеотидов в длину; и наиболее предпочтительно - от 195 до 215 нуклеотидов в длину.

Область перекрывания последовательностей также может содержать по меньшей мере приблизительно 50 смежных нуклеотидов из последовательности нуклеиновой кислоты, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1; предпочтительно - по меньшей мере приблизительно 75 смежных нуклеотидов; более предпочтительно - по меньшей мере приблизительно 100 смежных нуклеотидов; даже более предпочтительно - по меньшей мере приблизительно 150 смежных нуклеотидов; и наиболее предпочтительно - по меньшей мере приблизительно 200 смежных нуклеотидов.

В одном из вариантов осуществления первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 105-3597 SEQ ID NO: 1. В одном из вариантов осуществления вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 3806-6926 SEQ ID NO: 1.

В одном из вариантов осуществления первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 105-3597 SEQ ID NO: 2. В одном из вариантов осуществления вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 3806-6926 SEQ ID NO: 2.

В одном из вариантов осуществления область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, состоящей из нуклеотидов 3598-3805 SEQ ID NO: 1. В одном из вариантов осуществления область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, состоящей из нуклеотиды 3598-3805 SEQ ID NO: 2.

В одном из вариантов осуществления область перекрывания последовательностей содержит по меньшей мере приблизительно 50 смежных нуклеотидов из последовательности нуклеиновой кислоты, состоящей из нуклеотиды 3598-3805 SEQ ID NO: 1; предпочтительно - по меньшей мере приблизительно 75 смежных нуклеотидов; более предпочтительно - по меньшей мере приблизительно 100 смежных нуклеотидов; даже более предпочтительно - по меньшей мере приблизительно 150 смежных нуклеотидов; и наиболее предпочтительно - по меньшей мере приблизительно 200 смежных нуклеотидов. В одном из вариантов осуществления область перекрывания последовательностей содержит по меньшей мере приблизительно 50 смежных нуклеотидов из последовательности нуклеиновой кислоты, состоящей из нуклеотиды 3598-3805 SEQ ID NO: 2; предпочтительно - по меньшей мере приблизительно 75 смежных нуклеотидов; более предпочтительно - по меньшей мере приблизительно 100 смежных нуклеотидов; даже более предпочтительно - по меньшей мере приблизительно 150 смежных нуклеотидов; и наиболее предпочтительно - по меньшей мере приблизительно 200 смежных нуклеотидов.

В одном из вариантов осуществления первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3805 SEQ ID NO: 1; и вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 3598-6926 SEQ ID NO: 1.

В одном из вариантов осуществления первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 105-3805 SEQ ID NO: 1; и вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 3598-6926 SEQ ID NO: 1.

В одном из вариантов осуществления первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 105-3805 SEQ ID NO: 2; и вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, состоящую из нуклеотидов 3598-6926 SEQ ID NO: 2.

Первый вектор AAV может содержать промотор GRK1, функционально связанный с 5'-концевой частью кодирующей последовательности ABCA4 (CDS).

Первая последовательность нуклеиновой кислоты может содержать нетранслируемую область (UTR), локализованную выше 5'-концевой части кодирующей последовательности ABCA4 (CDS).

Вторая последовательность нуклеиновой кислоты может содержать посттранскрипционный чувствительный элемент (PRE); предпочтительно - посттранскрипционный чувствительный элемент вируса гепатита сурков (WPRE).

Вторая последовательность нуклеиновой кислоты может содержать последовательность полиаденилирования бычьего гормона роста (bGH).

В другом аспекте изобретение относится к способу экспрессии белка ABCA4 человека в клетке-мишени, включающему стадии: трансдукции клетки-мишени с использованием первого вектора AAV и второго вектора AAV, как определено выше, таким образом, что функциональный белок ABCA4 экспрессируется в клетке-мишени.

В дополнительном аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 5'-концевую часть CDS ABCA4, где 5'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 105-3805 SEQ ID NO: 1. В одном из вариантов осуществления этот вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9. В одном из вариантов осуществления 5'-концевая часть CDS ABCA4 состоит из нуклеотидов 105-3805 SEQ ID NO: 1. В одном из вариантов осуществления 5'-концевая часть CDS ABCA4 состоит из нуклеотидов 105-3805 SEQ ID NO: 2.

В дополнительном аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 3'-концевую часть CDS ABCA4, где 3'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 3598-6926 SEQ ID NO: 1. В одном из вариантов осуществления этот вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10. В одном из вариантов осуществления 3'-концевая часть CDS ABCA4 состоит из нуклеотидов 3598-6926 SEQ ID NO: 1. В одном из вариантов осуществления 3'-концевая часть CDS ABCA4 состоит из нуклеотидов 3598-6926 SEQ ID NO: 2.

В другом аспекте изобретение относится к нуклеиновой кислоте, содержащей первую последовательность нуклеиновой кислоты, как определено выше.

В другом аспекте изобретение относится к нуклеиновой кислоте, содержащей вторую последовательность нуклеиновой кислоты, как определено выше.

Изобретение также относится к нуклеиновой кислоте, содержащей последовательность нуклеиновой кислоты SEQ ID NO: 9, и нуклеиновой кислоте, содержащей последовательность нуклеиновой кислоты SEQ ID NO: 10.

В дополнительном аспекте изобретение относится к набору, содержащему векторную систему AAV, как описано выше, или вышележащий вектор AAV и нижележащий вектор AAV, как описано выше.

Изобретение также относится к набору, содержащему нуклеиновую кислоту, содержащую первую последовательность нуклеиновой кислоты, и нуклеиновую кислоту, содержащую вторую последовательность нуклеиновой кислоты, как описано выше, или нуклеиновую кислоту, содержащую последовательность нуклеиновой кислоты SEQ ID NO: 9, и нуклеиновую кислоту, содержащую последовательность нуклеиновой кислоты SEQ ID NO: 10, как описано выше.

В еще одном дополнительном аспекте изобретение относится к фармацевтической композиции, содержащей векторную систему AAV, как описано выше, и фармацевтически приемлемый эксципиент.

В дополнительном аспекте изобретение относится к векторной системе AAV, как описано выше, набору, как описано выше, или фармацевтической композиции, как описано выше, для применения в профилактике или лечении заболевания, отличающегося деградацией клеток сетчатки; предпочтительно, для применения в профилактике или лечении болезни Штаргардта.

В другом аспекте изобретение относится к способу профилактики или лечения заболевания, отличающегося деградацией клеток сетчатки, такого как болезнь Штаргардта, включающему введение нуждающемуся в этом индивидууму эффективного количества векторной системы AAV, как описано выше, набору, как описано выше, или фармацевтической композиции, как описано выше.

В другом аспекте изобретение относится к векторной системе AAV для экспрессии белка ABCA4 человека в клетке-мишени, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты; где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где первая последовательность нуклеиновой кислоты содержит последовательность, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 105-3597 SEQ ID NO: 1; где вторая последовательность нуклеиновой кислоты содержит последовательность, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 3806-6926 SEQ ID NO: 1; где каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты содержит область перекрывания последовательностей друг с другом; и где область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, имеющей по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 3598-3805 SEQ ID NO: 1.

В другом аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 5'-концевую часть CDS ABCA4, где 5'-концевая часть CDS ABCA4 состоит из последовательности, имеющей по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 105-3805 SEQ ID NO: 1.

В другом аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 3'-концевую часть CDS ABCA4, где 3'-концевая часть CDS ABCA4 состоит из последовательности, имеющей по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 3598-6926 SEQ ID NO: 1.

В другом аспекте изобретение относится к векторной системе AAV для экспрессии белка ABCA4 человека в клетке-мишени, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты; где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где первая последовательность нуклеиновой кислоты содержит последовательность, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 105-3597 SEQ ID NO: 2; где вторая последовательность нуклеиновой кислоты содержит последовательность, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 3806-6926 SEQ ID NO: 2; где каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты содержит область перекрывания последовательностей друг с другом; и где область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, имеющей по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8, 99,9 или 100%) идентичности последовательности по отношению к нуклеотидам 3598-3805 SEQ ID NO: 2.

Изобретение также относится к нуклеиновой кислоте, содержащей последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности по отношению к SEQ ID NO: 9, и нуклеиновой кислоте, содержащей последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности по отношению к SEQ ID NO: 10.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фигура 1. Структуры вышележащего и нижележащего трансгенов, комбинируемых с образованием полного трансгена ABCA4.

Фигура 2. Определение белка ABCA4 в сетчатках Abca4^-/- через 6 недель после инъекции с использованием варианта двойного вектора C (5'C) и без (C) дополнительной последовательности UTR. Единицы соответствуют кратному повышению относительно образцов KO без инъекции. Планки погрешностей соответствуют SEM. Односторонний ANOVA, ретроспективный анализ с использованием критерия Тьюки, p=**0,009.

Фигура 3. Представление CDS ABCA4, содержащейся в вышележащем и нижележащем трансгенах, составляющих перекрывающиеся варианты A, B, C, D, E, F и X. (a) Определение белка ABCA4 после трансдукции с использованием различных вариантов векторов с зонами перекрывания in vitro и (b) in vivo. Единицы соответствуют кратному повышению относительно необработанных образцов (-=необработанные клетки HEK293T; KO=сетчатки Abca4^-/- без инъекции). Планки погрешностей соответствуют SEM. Односторонний ANOVA и ретроспективный анализ с использованием критерия Тьюки показали, что in vitro с помощью вариантов B и C двойного вектора получали значимо больше белка ABCA4, чем во всех других образцах, но не наблюдали значимых различий между B и C. In vivo с помощью варианта C двойного вектора получали значимо больше белка ABCA4, чем в случае всех других вариантов (за исключением B).

Фигура 4. (a) Укороченные варианты белка ABCA4, определимые в клетках HEK293T, обработанных нерекомбинировавшими нижележащими векторами; (b) укороченный и полноразмерный белок ABCA4, определяемый в образцах сетчатки Abca4^-/-, в которую инъецировали двойной вектор 5'B или 5'C; (c) в таблице представлена процентная доля полноразмерного ABCA4, присутствующего в общей популяции белков ABCA4, определяемого посредством вестерн-блоттинга сетчатки, подвергнутой инъекции; (d) различия в кратном изменении экспрессии ABCA4 между сетчаткой, подвергнутой инъекции варианта перекрывания C двойного вектора, и сетчаткой, подвергнутой инъекции варианта перекрывания B двойного вектора, на уровне транскрипта и белка. Планки погрешностей соответствуют SEM.

Фигура 5. a) Перекрывающаяся последовательность C с кодонами AUG не в рамке считывания перед кодоном AUG в рамке считывания; b) прогнозируемые вторичные структуры перекрывающихся зон C и B.

Фигура 6. Окрашивание на ABCA4 (зеленый) во внешних сегментах фоторецепторных клеток в сетчатке Abca4^-/-, собранной через 6 недель после инъекции. Метки окрашивания HCN1 (красный) во внутренних сегментах. Пример окрашивания на локализацию нативного Abca4 в сетчатке WT также включен вместе с доказательством отсутствия окрашивания в сетчатке Abca4^-/- без инъекции.

Фигура 7. Окрашивание на Abca4/ABCA4 (зеленый) и Hcn1 (красный) в глазах дикого типа (WT) и Abca4^-/-.

Фигура 8. Окрашивание на Abca4/ABCA4 (зеленый) и родопсин (красный) во внешних сегментах фоторецепторных клеток в глазах дикого типа (WT) и Abca4^-/-.

Фигура 9. Апикальное окрашивание RPE на Abca4/ABCA4 (зеленый) и родопсин (красный) в глазах дикого типа (WT) и Abca4^-/-.

Фигура 10. Диаграмма примера перекрывающихся векторов.

Фигура 11. На левой стороне диаграммы представлен нормальный ретиноидный цикл. Образование бисретиноидов и A2E, повышенное у мышей с недостаточностью Abca4 и людей, представлено справа. Молекулы, показанные в рамках на правой стороне диаграммы, оценивали у мышей Abca4^-/- (пример 6.)

Фигура 12. Уровни бисретиноидов и изоформ A2E в парных глазах 13 мышей Abca4^-/-, которым проводили инъекцию имитации или средства. Наблюдали значительное снижение уровней бисретиноидов и A2E между глазами, в которые вводили имитацию и средство (p=0,017, F=5,849). Кроме того, для всех измерений бисретиноидов и A2E наименьшие уровни наблюдали в глазах, в которые вводили двойной вектор (пример 6.)

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

SEQ ID NO: 1: последовательность нуклеиновой кислоты ABCA4 человека. SEQ ID NO: 1 идентична референсной последовательности NCBI NM_000350.2.

SEQ ID NO: 2: вариант последовательности нуклеиновой кислоты ABCA4 человека. SEQ ID NO: 2 идентична SEQ ID NO: 1 за исключением следующих мутаций: нуклеотид 1640 G>T, нуклеотид 5279 G>A, нуклеотид 6173 T>C.

SEQ ID NO: 3: Пример последовательности вышележащего вектора, содержащего ITR, промотор, CDS, ITR.

SEQ ID NO: 4: Пример последовательности нижележащего вектора, содержащего ITR, CDS, посттранскрипционный чувствительный элемент, последовательность полиаденилирования, ITR.

SEQ ID NO: 5: Последовательность промотора GRK1.

SEQ ID NO: 6: Последовательность UTR.

SEQ ID NO: 7: Посттранскрипционный чувствительный элемент вируса гепатита сурков.

SEQ ID NO: 8: Последовательность полиаденилирования бычьего гормона роста.

SEQ ID NO: 9: Пример частичной последовательности вышележащего вектора, содержащего промотор, CDS.

SEQ ID NO: 10: Пример частичной последовательности нижележащего вектора, содержащего CDS, посттранскрипционный чувствительный элемент, последовательность полиаденилирования.

ПОДРОБНОЕ ОПИСАНИЕ

Вирусные векторы получают из вирусов дикого типа, модифицированных с использованием технологий рекомбинантных нуклеиновых кислот для встраивания ненативной последовательности нуклеиновой кислоты (или трансгена) в вирусный геном. Способность вирусов направленно воздействовать и инфицировать конкретные клетки используют для доставки трансгена в клетку-мишень, что приводит к экспрессии гена и продукции кодируемого продукта гена.

Настоящее изобретение относится к векторам, полученным из аденоассоциированного вируса (AAV).

В первом аспекте изобретение относится к векторной системе на основе аденоассоциированного вируса (AAV) для экспрессии белка ABCA4 человека в клетке-мишени, векторной системе AAV, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты; где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3597 SEQ ID NO: 1; где вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 3806-6926 SEQ ID NO: 1; где каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты содержит область перекрывания последовательностей друг с другом; и где область перекрывания последовательностей содержит по меньшей мере приблизительно 20 смежных нуклеотидов из последовательности нуклеиновой кислоты, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1.

Векторы AAV, в целом, хорошо известны в этой области, и специалисту в этой области будут знакомы общие способы, подходящие для их получения, из общих знаний в этой области. Специалисту в этой области будут известны способы, подходящие для встраивания интересующей последовательности нуклеиновой кислоты в геном вектора AAV.

Термин "векторная система AAV" используют для обозначения того, что первый и второй векторы AAV должны действовать совместно взаимодополняющим образом.

Первый и второй векторы AAV векторной системы AAV по изобретению вместе кодируют целый трансген ABCA4. Таким образом, для экспрессии кодируемого трансгена ABCA4 в клетке-мишени необходима трансдукция клетки-мишени с использованием первого (вышележащего) и второго (нижележащего) векторов.

Векторы AAV векторной системы AAV по изобретению, как правило, находятся в форме частиц AAV (также обозначаемых как вирионы). Частица AAV содержит белковую оболочку (капсид), окружающую кор нуклеиновой кислоты, являющейся геномом AAV. Настоящее изобретение также включает последовательности нуклеиновой кислоты, кодирующие геномы вектора AAV векторной системы AAV, представленной в настоящем описании.

SEQ ID NO: 1 является последовательностью нуклеиновой кислоты ABCA4 человека, соответствующей референсной последовательности NCBI NM_000350.2. SEQ ID NO: 1 идентична референсной последовательности NCBI NM_000350.2. Кодирующая последовательность ABCA4 охватывает нуклеотиды 105-6926 SEQ ID NO: 1.

Первый вектор AAV содержит первую последовательность нуклеиновой кислоты, содержащую 5'-концевую часть CDS ABCA4. 5'-концевая часть CDS ABCA4 является частью CDS ABCA4, включающей ее 5'-конец. Т.к. она является лишь частью CDS, 5'-концевая часть CDS ABCA4 не является полноразмерной (т.е. не является целой) CDS ABCA4. Таким образом, первая последовательность нуклеиновой кислоты (и, таким образом, первый вектор AAV) не содержит полноразмерную CDS ABCA4.

Второй вектор AAV содержит вторую последовательность нуклеиновой кислоты, содержащую 3'-концевую часть CDS ABCA4. 3'-концевая часть CDS ABCA4 является частью CDS ABCA4, включающей ее 3'-конец. Т.к. она является лишь частью CDS, 3'-концевая часть CDS ABCA4 не является полноразмерной (т.е. не является целой) CDS ABCA4. Таким образом, вторая последовательность нуклеиновой кислоты (и, таким образом, второй вектор AAV) не содержит полноразмерную CDS ABCA4.

5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4 (с областью перекрывания последовательностей, как описано ниже). Таким образом, полноразмерная CDS ABCA4 содержится в векторной системе AAV по изобретению разделенной между первым и вторым векторами AAV, и она может повторно собираться в клетке-мишени после трансдукции клетки-мишени с использованием первого и второго векторов AAV.

Первая последовательность нуклеиновой кислоты, как описано выше, содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3597 SEQ ID NO: 1. CDS ABCA4 начинается с нуклеотида 105 SEQ ID NO: 1.

Вторая последовательность нуклеиновой кислоты, как описано выше, содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 3806-6926 SEQ ID NO: 1.

Для включения целой CDS ABCA4 каждая из первой и второй последовательности нуклеиновой кислоты дополнительно содержит, по меньшей мере, часть CDS ABCA4, соответствующую нуклеотидам 3598-3805 SEQ ID NO: 1, таким образом, что когда первую и вторую последовательности нуклеиновой кислоты выравнивают, включенной оказывается вся CDS ABCA4, соответствующая нуклеотидам 3598-3805 SEQ ID NO: 1. Таким образом, при выравнивании первая и вторая последовательности нуклеиновой кислоты вместе включают целую CDS ABCA4.

Кроме того, первая и вторая последовательности нуклеиновой кислоты содержат область перекрывания последовательностей, что делает возможной восстановление целой CDS ABCA4 как части полноразмерного трансгена внутри клетки-мишени, трансдуцированной с использованием первого и второго векторов AAV по изобретению.

Если первую и вторую последовательности нуклеиновой кислоты выравнивают друг с другом, область на 3'-конце первой последовательности нуклеиновой кислоты перекрывается с соответствующей областью на 5'-конце второй последовательности нуклеиновой кислоты. Таким образом, и первая, и вторая последовательности нуклеиновой кислоты содержат часть CDS ABCA4, образующую область перекрывания последовательностей.

Авторы настоящего изобретения обнаружили, что особенно предпочтительные результаты получают, когда область перекрывания между первой и второй последовательностями нуклеиновой кислоты содержит по меньшей мере приблизительно 20 смежных нуклеотидов из части CDS ABCA4, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1.

Область перекрывания может распространяться выше и/или ниже указанных 20 смежных нуклеотидов. Таким образом, область перекрывания может составлять более 20 нуклеотидов в длину.

Область перекрывания может содержать нуклеотиды выше положения, соответствующего нуклеотиду 3598 SEQ ID NO: 1. Альтернативно или дополнительно, область перекрывания может содержать нуклеотиды ниже положения, соответствующего нуклеотиду 3805 SEQ ID NO: 1.

Альтернативно, область перекрывания последовательностей нуклеиновой кислоты может содержаться в части CDS ABCA4, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1.

Таким образом, в одном из вариантов осуществления область перекрывания последовательностей нуклеиновой кислоты составляет от 20 до 550 нуклеотидов в длину; предпочтительно - от 50 до 250 нуклеотиды в длину; предпочтительно - от 175 до 225 нуклеотидов в длину; предпочтительно - от 195 до 215 нуклеотидов в длину.

В одном из вариантов осуществления область перекрывания последовательностей нуклеиновой кислоты содержит по меньшей мере приблизительно 50 смежных нуклеотидов из последовательности нуклеиновой кислоты, соответствующей нуклеотидам 3598-3805 SEQ ID NO: 1; предпочтительно - по меньшей мере приблизительно 75 смежных нуклеотидов; предпочтительно - по меньшей мере приблизительно 100 смежных нуклеотидов; предпочтительно - по меньшей мере приблизительно 150 смежных нуклеотидов; предпочтительно - по меньшей мере приблизительно 200 смежных нуклеотидов; предпочтительно - все 208 смежных нуклеотидов.

В предпочтительном варианте осуществления область перекрывания последовательностей нуклеиновой кислоты начинается с нуклеотида, соответствующего нуклеотиду 3598 SEQ ID NO: 1. Термин "начинается" означает, что область перекрывания последовательностей нуклеиновой кислоты расположена в 5'-3' направлении, начиная с нуклеотида, соответствующего нуклеотиду 3598 SEQ ID NO: 1. Таким образом, в предпочтительном варианте осуществления самый близкий к 5'-концу нуклеотид области перекрывания последовательностей нуклеиновой кислоты соответствует нуклеотиду 3598 SEQ ID NO: 1.

В дополнительном предпочтительном варианте осуществления область перекрывания последовательностей нуклеиновой кислоты между первой последовательностью нуклеиновой кислоты и второй последовательностью нуклеиновой кислоты в векторе соответствует нуклеотидам 3598-3805 SEQ ID NO: 1.

Дополнительным преимуществом настоящего изобретения является то, что конструирование двойных векторов AAV, содержащих область перекрывания последовательностей нуклеиновой кислоты, как описано выше, успешно может снижать уровень трансляции нежелательных укороченных пептидов ABCA4.

Проблема трансляции укороченных пептидов ABCA4 может возникнуть при использовании двойных векторных систем AAV, если трансляция инициируется с транскриптов мРНК, полученных только с нижележащего вектора. В связи с этим, ITR AAV, такие как 5' ITR AAV2, могут иметь промоторную активность; это, а также наличие в нижележащем векторе WPRE bGH последовательностей полиаденилирования (как описано ниже) может приводить к образованию стабильных транскриптов мРНК из нерекомбинировавших нижележащих векторов. CDS ABCA4 дикого типа несет множество кодонов AUG в рамке считывания в своей нижележащей части, которые нельзя заменить другими кодонами без изменения аминокислотной последовательности. Это создает возможность трансляции стабильных транскриптов, что приводит к наличию укороченных пептидов ABCA4.

В предпочтительных вариантах осуществления изобретения, где область перекрывания последовательностей нуклеиновой кислоты начинается с нуклеотида, соответствующего нуклеотиду 3598 SEQ ID NO: 1, начальная последовательность зоны перекрывания включает кодон AUG (инициаторный) не в рамке считывания в хорошем контексте (касающемся потенциальной консенсусной последовательности Козак) перед кодоном AUG в рамке считывания в более слабом контексте для инициации аппарата трансляции для инициации трансляции только нерекомбинировавших нижележащих транскриптов с участка не в рамке считывания. В особенно предпочтительных вариантах осуществления изобретения есть всего четыре кодона AUG не в рамке считывания в различных контекстах перед AUG в рамке считывания. Все из них будут транслироваться до стоп-кодона в пределах 10 аминокислот, таким образом, предотвращая трансляцию нежелательных укороченных пептидов ABCA4.

Предпочтительно, первая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 105-3805 SEQ ID NO: 1, и вторая последовательность нуклеиновой кислоты содержит последовательность смежных нуклеотидов, соответствующую нуклеотидам 3598-6926 SEQ ID NO: 1, включая, таким образом, особенно предпочтительную область перекрывания последовательностей нуклеиновой кислоты, как описано выше.

Таким образом, в предпочтительном варианте осуществления 5'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 105-3805 SEQ ID NO: 1, и 3'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 3598-6926 SEQ ID NO: 1.

В дополнительном предпочтительном варианте осуществления 5'-концевая часть CDS ABCA4 состоит из нуклеотидов 105-3805 SEQ ID NO: 1, и 3'-концевая часть CDS ABCA4 состоит из нуклеотидов 3598-6926 SEQ ID NO: 1.

Таким образом, в предпочтительном варианте осуществления изобретение относится к векторной системе AAV для экспрессии белка ABCA4 человека в клетке-мишени, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты, где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где 5'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 105-3805 SEQ ID NO: 1, и где 3'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 3598-6926 SEQ ID NO: 1.

В дополнительном предпочтительном варианте осуществления изобретение относится к векторной системе AAV для экспрессии белка ABCA4 человека в клетке-мишени, векторной системе AAV, содержащей первый вектор AAV, содержащий первую последовательность нуклеиновой кислоты, и второй вектор AAV, содержащий вторую последовательность нуклеиновой кислоты, где первая последовательность нуклеиновой кислоты содержит 5'-концевую часть кодирующей последовательности ABCA4 (CDS), и вторая последовательность нуклеиновой кислоты содержит 3'-концевую часть CDS ABCA4, и 5'-концевая часть и 3'-концевая часть вместе включают целую CDS ABCA4; где 5'-концевая часть CDS ABCA4 состоит из нуклеотидов 105-3805 SEQ ID NO: 1, и где 3'-концевая часть CDS ABCA4 состоит из нуклеотидов 3598-6926 SEQ ID NO: 1.

В соответствии с термином "состоит из", в вариантах осуществления, где 5'-концевая часть CDS ABCA4 и 3'-концевая часть CDS ABCA4 состоят из конкретных последовательностей смежных нуклеотидов, как описано выше, каждая из первой последовательности нуклеиновой кислоты и второй последовательности нуклеиновой кислоты не содержит какую-либо дополнительную CDS ABCA4.

Как правило, каждый из первого вектора AAV и второго вектора AAV содержит 5'- и 3'-инвертированные концевые повторы (ITR).

Как правило, геном AAV природного серотипа, изолята или клады AAV содержит по меньшей мере одну последовательность инвертированного концевого повтора (ITR). Последовательность ITR действует в цис-положении, предоставляя функциональный участок начала репликации и делая возможной интеграцию и эксцизию вектора из генома клетки. Считают, что ITR AAV способствуют образованию конкатемеров в ядре инфицированной AAV клетки, например, после преобразования одноцепочечного вектора ДНК в двухцепочечную ДНК под действием ДНК-полимераз клетки-хозяина. Образование таких эписомных конкатемеров может защищать конструкцию вектора в течение жизни клетки-хозяина, таким образом, делая возможной длительную экспрессию трансгена in vivo.

Таким образом, в одном из вариантов осуществления ITR являются ITR AAV (т.е. последовательностями ITR, полученными из последовательностей ITR, обнаруживаемых в геноме AAV).

Первый и второй векторы AAV векторной системы AAV по изобретению вместе содержат все компоненты, необходимые для повторной сборки полностью функционального трансгена ABCA4 в клетке-мишени после трансдукции с использованием обоих векторов. Специалисту в этой области будут известны дополнительные генетические элементы, общеупотребительные для обеспечения экспрессии трансгена в клетке, трансдуцированной с использованием вирусного вектора. Их можно обозначать как последовательности контроля экспрессии. Таким образом, векторы AAV вирусной векторной системы AAV по изобретению, как правило, содержат последовательности контроля экспрессии (например, содержат последовательность промотора), функционально связанные с нуклеотидными последовательностями, кодирующими трансген ABCA4.

5'-последовательности контроля экспрессии локализуются в первом ("вышележащем") векторе AAV вирусной векторной системы, в то время как 3'-последовательности контроля экспрессии локализуются во втором ("нижележащем") векторе AAV вирусной векторной системы.

Таким образом, первый вектор AAV, как правило, содержит промотор, функционально связанный с 5'-концевой частью CDS ABCA4. В связи с природой промотора необходимо, чтобы он локализовался в 5'-направлении относительно CDS ABCA4, таким образом, он локализуется в первом векторе AAV.

Можно использовать любой подходящий промотор, выбор которого может осуществлять специалист в этой области. Последовательность промотора может являться конститутивно активной (т.е. функциональной в любых условиях клетки-хозяина) или, альтернативно, она может являться активной только в конкретных условиях клетки-хозяина, таким образом, делая возможной направленную экспрессию трансгена в конкретном типе клеток (например, тканеспецифический промотор). Промотор может проявлять индуцируемую экспрессию в ответ на присутствие другого фактора, например, фактора, присутствующего в клетке-хозяине. В любом случае, если вектор вводят для терапии, предпочтительно, промотор должен быть функциональным в условиях клетки-мишени.

В некоторых вариантах осуществления предпочтительно, чтобы промотор проявлял специфическую экспрессию в клетках сетчатки, чтобы позволить трансгену экспрессироваться только в популяциях клеток сетчатки. Таким образом, экспрессия с промотора может являться специфической в отношении клеток сетчатки, например ограниченной только клетками нейросенсорной части сетчатки и пигментного эпителия сетчатки.

Примером промотора, пригодного для использования в настоящем изобретении, является промотор бета-актина курицы (CBA), необязательно, в комбинации с энхансерным элементом цитомегаловируса (CMV). Другим примером промотора для использования в изобретении является гибридный промотор CBA/CAG, например, промотор, используемый в экспрессирующей кассете rAVE (GeneDetect.com).

Примеры промоторов на основе последовательностей человека, которые будут индуцировать специфическую в отношении сетчатки экспрессию генов, включают родопсинкиназу в случае палочек и колбочек, PR2.1 в случае только колбочек, и RPE65 в случае пигментного эпителия сетчатки.

Авторы настоящего изобретения обнаружили, что особенно предпочтительных уровней экспрессии генов можно достигать с использованием промотора GRK1. Таким образом, в предпочтительном варианте осуществления промотор является промотором родопсинкиназы человека (GRK1).

Последовательность промотора GRK1 по изобретению может составлять 199 нуклеотидов в длину и содержать нуклеотиды -112-+87 гена GRK1. В предпочтительном варианте осуществления промотор содержит последовательность нуклеиновой кислоты SEQ ID NO: 5 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4 или 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

Первый вектор AAV может содержать нетранслируемую область (UTR), локализованную между промотором и вышележащей последовательностью нуклеиновой кислоты ABCA4 (т.е. 5'-UTR).

Можно использовать любую подходящую последовательность UTR, выбор которой может осуществлять специалист в этой области.

UTR может содержать один или несколько из следующих элементов: фрагмент интрона 1 β-актина (CBA) Gallus gallus, фрагмент интрона 2 β-глобина (RBG) Oryctolagus cuniculus и фрагмент экзона 3 β-глобина Oryctolagus cuniculus.

UTR может содержать консенсусную последовательность Козак. Можно использовать любую подходящую консенсусная последовательность Козак, выбор которой может осуществлять специалист в этой области.

В предпочтительном варианте осуществления UTR содержит последовательность нуклеиновой кислоты, определенную в SEQ ID NO: 6, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

UTR SEQ ID NO: 6 составляет 186 нуклеотиды в длину и включает фрагмент интрона 1 β-актина (CBA) Gallus gallus (с прогнозируемым донорным участком для сплайсинга), фрагмент интрона 2 β-глобина (RBG) Oryctolagus cuniculus (включая спрогнозированную точку ветвления и акцепторный участок для сплайсинга) и фрагмент экзона 3 β-глобина Oryctolagus cuniculus непосредственно перед консенсусной последовательностью Козак.

Авторы настоящего изобретения неожиданно обнаружили, что наличие UTR, как описано выше, в частности, последовательности UTR, определенной в SEQ ID NO: 6, или ее варианта, имеющего по меньшей мере 90% идентичности последовательности, успешно повышает выход трансляции трансгена ABCA4.

Второй ("нижележащий") вектор AAV векторной системы AAV по изобретению может содержать посттранскрипционный чувствительный элемент (также известный как посттранскрипционный регуляторный элемент) или PRE. Можно использовать любой подходящий PRE, выбор которого может осуществлять специалист в этой области. Присутствие подходящего PRE может повышать экспрессию трансгена ABCA4.

В предпочтительном варианте осуществления PRE является PRE вируса гепатита сурков (WPRE). В особенно предпочтительном варианте осуществления WPRE имеет последовательность, определенную в SEQ ID NO: 7, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

Второй вектор AAV может содержать последовательность полиаденилирования, локализованную в 3'-направлении относительно нижележащей последовательности нуклеиновой кислоты ABCA4. Можно использовать любую подходящую последовательность полиаденилирования, выбор которой может осуществлять специалист в этой области.

В предпочтительном варианте осуществления последовательность полиаденилирования является последовательностью полиаденилирования бычьего гормона роста (bGH). В особенно предпочтительном варианте осуществления последовательность полиаденилирования bGH имеет последовательность, определенную в SEQ ID NO: 8, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В предпочтительном варианте осуществления векторной системы AAV по изобретению первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9, и второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10.

В другом предпочтительном варианте осуществления векторной системы AAV по изобретению первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 3, и второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 4.

Векторная система AAV по изобретению подходит для экспрессии белка ABCA4 человека в клетке-мишени.

Таким образом, в одном из аспектов изобретение относится к способу экспрессии белка ABCA4 человека в клетке-мишени, включающему стадии: трансдукции клетки-мишени с использованием первого вектора AAV и второго вектора AAV, как описано выше, таким образом, что функциональный белок ABCA4 экспрессируется в клетке-мишени.

Для экспрессии белка ABCA4 человека необходимо трансдуцировать клетку-мишень с использованием первого вектора AAV и второго вектора AAV; однако, порядок не важен. Таким образом, клетку-мишень можно трансдуцировать с использованием первого вектора AAV и второго вектора AAV в любом порядке (первого вектора AAV, а затем второго вектора AAV, или второго вектора AAV, а затем первого вектора AAV) или одновременно.

Способы трансдукции клеток-мишеней с использованием векторов AAV известны в этой области и знакомы специалисту в этой области.

Клетка-мишень, предпочтительно, является клеткой глаза, предпочтительно, клеткой сетчатки (например, нейрональной фоторецепторной клеткой, палочковой клеткой, колбочковой клеткой или клеткой пигментного эпителия сетчатки).

Настоящее изобретение также относится к первому вектору AAV, как определено выше. Настоящее изобретение также относится ко второму вектору AAV, как определено выше.

В другом аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 5'-концевую часть CDS ABCA4, где 5'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 105-3805 SEQ ID NO: 1. Таким образом, этот вектор AAV не содержит какую-либо дополнительную CDS ABCA4 помимо указанной последовательности смежных нуклеотидов.

Первый вектор AAV может содержать 5'- и 3'-ITR, предпочтительно, ITR AAV; промотор, предпочтительно, промотор GRK1; и/или UTR; указанные элементы расположены относительно векторной системы AAV по изобретению, как описано выше.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9 при условии, что нуклеотид в положении, соответствующем нуклеотиду 1640 SEQ ID NO: 1, представляет собой G, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 3.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 3 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 3 при условии, что нуклеотид в положении, соответствующем нуклеотиду 1640 SEQ ID NO: 1, представляет собой G, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В другом аспекте изобретение относится к вектору AAV, содержащему последовательность нуклеиновой кислоты, содержащую 3'-концевую часть CDS ABCA4, где 3'-концевая часть CDS ABCA4 состоит из последовательности смежных нуклеотидов, соответствующей нуклеотидам 3598-6926 SEQ ID NO: 1. Таким образом, этот вектор AAV не содержит какую-либо дополнительную CDS ABCA4 помимо указанной последовательности смежных нуклеотидов.

Второй вектор может содержать 5'- и 3'-ITR, предпочтительно, ITR AAV; PRE, предпочтительно, WPRE; и/или последовательность полиаденилирования, предпочтительно, последовательность полиаденилирования bGH; указанные элементы расположены, как описано выше, в отношении векторной системы AAV по изобретению.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10 при условии, что нуклеотид в положении, соответствующем нуклеотиду 5279 SEQ ID NO: 1, представляет собой G, и нуклеотид в положении, соответствующем нуклеотиду 6173 SEQ ID NO: 1, представляет собой T, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 4.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 4 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

В одном из вариантов осуществления второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 4 при условии, что нуклеотид в положении, соответствующем нуклеотиду 5279 SEQ ID NO: 1, представляет собой G, и нуклеотид в положении, соответствующем нуклеотиду 6173 SEQ ID NO: 1, представляет собой T, или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

Изобретение также относится к нуклеиновым кислотам, содержащим последовательности нуклеиновой кислоты, описанные выше.

Изобретение также относится к геному вектора AAV, получаемому из вектора AAV, как описано выше.

Изобретение также относится к набору, содержащему первый вектор AAV и второй вектор AAV, как описано выше. Векторы AAV можно предоставлять в наборах в форме частиц AAV.

Изобретение также относится к фармацевтической композиции, содержащей векторную систему AAV, как описано выше, и фармацевтически приемлемый эксципиент.

Векторную систему AAV по изобретению, набор по изобретению, и фармацевтическую композицию по изобретению можно использовать в генной терапии. Например, векторную систему AAV по изобретению, набор по изобретению и фармацевтическую композицию по изобретению можно использовать в профилактике или лечении заболевания.

Для применения по настоящему изобретению для профилактики или лечения заболевания необходимо введение первого вектора AAV и второго вектора AAV в клетку-мишень для обеспечения экспрессии белка ABCA4.

Предпочтительно, заболевание, подлежащее профилактике или лечению, отличается деградацией клеток сетчатки. Примером такого заболевания является болезнь Штаргардта. Таким образом, первый и второй векторы AAV по изобретению можно вводить в глаз пациента, предпочтительно, в ткань сетчатки глаза, таким образом, что функциональный ABCA4 белок экспрессируется для компенсации мутаций, присутствующих при заболевании.

Векторы AAV по изобретению можно составлять в виде фармацевтических композиций или лекарственных средств.

Пример векторной системы AAV по изобретению содержит первый вектор AAV и второй вектор AAV; где первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9; и второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10.

Дополнительный пример векторной системы AAV по изобретению содержит первый вектор AAV и второй вектор AAV; где первый вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 9 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности; и второй вектор AAV содержит последовательность нуклеиновой кислоты SEQ ID NO: 10 или ее вариант, имеющий по меньшей мере 90% (например, по меньшей мере 90, 95, 96, 97, 98, 99, 99,1, 99,2, 99,3, 99,4, 99,5, 99,6, 99,7, 99,8 или 99,9%) идентичности последовательности.

Настоящее изобретение также можно осуществлять, если в качестве референсной последовательности используют SEQ ID NO: 2 вместо SEQ ID NO: 1.

В связи с этим, SEQ ID NO: 2 является идентичной SEQ ID NO: 1 за исключением следующих мутаций: нуклеотид 1640 G>T, нуклеотид 5279 G>A, нуклеотид 6173 T>C. Эти мутации не изменяют кодируемую аминокислотную последовательность, и, таким образом, белок ABCA4, кодируемый SEQ ID NO: 2, идентичен белку ABCA4, кодируемому SEQ ID NO: 1.

Таким образом, в альтернативных вариантах осуществления изобретения указанные выше ссылки на SEQ ID NO: 1 можно заменять ссылками на SEQ ID NO: 2.

Соответствие последовательностей

В рамках изобретения термин "соответствующий" при использовании в отношении нуклеотидов в указанной последовательности нуклеиновой кислоты определяет положения нуклеотидов со ссылкой на конкретную SEQ ID NO. Однако когда делают такую ссылку, следует понимать, что изобретение не ограничено конкретной последовательностью, приведенной в конкретной упомянутой SEQ ID NO, а включает вариант последовательности. Нуклеотиды, соответствующие положениям нуклеотидов в SEQ ID NO: 1, легко можно определять посредством выравнивания последовательностей, например, с использованием программ для выравнивания последовательностей, хорошо известных в этой области. В связи с этим, специалисту в этой области будет понятно, что вырожденная природа генетического кода означает, что в последовательности нуклеиновой кислоты, кодирующей указанный полипептид, могут присутствовать изменения, не изменяющие аминокислотную последовательность кодируемого полипептида. Таким образом, предусматривают идентификацию положений нуклеотидов в других кодирующих последовательностях ABCA4 (т.е. нуклеотидов в положениях, которые специалист в этой области будет считать соответствующими положениям, идентифицированным, например, в SEQ ID NO: 1).

В качестве примера, SEQ ID NO: 2 идентична SEQ ID NO: 1 за исключением трех конкретных мутаций, как описано выше (эти три мутации не изменяют аминокислотную последовательность кодируемого полипептида ABCA4). В этом случае, специалист в этой области будет, таким образом, считать, что указанное положение нуклеотида в SEQ ID NO: 2 соответствует эквивалентному пронумерованному положению нуклеотида в SEQ ID NO: 1.

Векторы AAV

Вирусные векторы по изобретению являются векторами на основе аденоассоциированного вируса (AAV). Вектор AAV по изобретению может находиться в форме зрелой частицы или вириона AAV или, т.е. нуклеиновой кислоты, окруженной белковым капсидом AAV.

Вектор AAV может содержать геном AAV или его производное.

Геном AAV представляет собой полинуклеотидную последовательность, кодирующую функции, необходимые для продукции частицы AAV. Эти функции включают функции, выполняемые в цикле репликации и упаковки AAV в клетке-хозяине, включая инкапсидирование генома AAV в частицу AAV. Природные AAV являются дефектными по репликации, и для них необходимы хелперные функции в транс-положении для осуществления цикла репликации и упаковки. Таким образом, геном AAV вектора по изобретению, как правило, является дефектным по репликации.

Геном AAV может находиться в одноцепочечной форме, как положительной, так и отрицательной, или альтернативно в двухцепочечной форме. Использование двухцепочечной формы позволяет обходить стадию репликации ДНК в клетке-мишени и, таким образом, может повышать экспрессию трансгена.

Геном AAV вектора по изобретению, как правило, находится в одноцепочечной форме.

Геном AAV можно получать из любого природного серотипа, изолята или клады AAV. Таким образом, геном AAV может являться полным геномом природного AAV. Как известно специалисту, AAV, встречающиеся в природе, можно классифицировать в соответствии с различными биологическими системами.

Как правило, AAV обозначают в соответствии с их серотипом. Серотип соответствует варианту подвида AAV, который, вследствие своего профиля экспрессии поверхностных антигенов капсида, имеет различную реактивность, которую можно использовать для различения его и другого варианта подвида. Как правило, вирус, имеющий конкретный серотип AAV, по существу, не реагирует перекрестно с нейтрализующими антителами, специфичными для любого другого серотипа AAV.

Серотипы AAV включают AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 и AAV11, а также рекомбинантные серотипы, такие как Rec2 и Rec3, недавно идентифицированные в головном мозге приматов. Любой из этих серотипов AAV можно использовать в изобретении. Таким образом, в одном из вариантов осуществления изобретения вектор AAV по изобретению можно получать из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, Rec2 или Rec3 AAV.

Обзоры серотипов AAV можно найти в Choi et al. (2005) Curr. Gene Ther. 5: 299-310 и Wu et al. (2006) Molecular Therapy 14: 316-27. Последовательности геномов AAV или элементов геномов AAV, включая последовательности ITR, гены rep или cap, можно получать из следующих последовательностей с регистрационными номерами из полногеномных последовательностей AAV: аденоассоциированный вирус 1 NC_002077, AF063497; аденоассоциированный вирус 2 NC_001401; аденоассоциированный вирус 3 NC_001729; аденоассоциированный вирус 3B NC_001863; аденоассоциированный вирус 4 NC_001829; аденоассоциированный вирус 5 Y18065, AF085716; аденоассоциированный вирус 6 NC_001862; AAV птиц ATCC VR-865 AY186198, AY629583, NC_004828; AAV птиц, штамм DA-1 NC_006263, AY629583; бычий AAV NC_005889, AY388617.

AAV также можно обозначать в терминах клад или клонов. Это относится к филогенетической взаимосвязи природных AAV и, как правило, к филогенетической группе AAV, которые можно отслеживать до общего предка, и они включают всех его потомков. Кроме того, AAV можно обозначать в терминах конкретного изолята, т.е. генетического изолята конкретного AAV, обнаруживаемого в природе. С помощью термина "генетический изолят" описывают популяцию AAV, подвергнутых ограниченному генетическому смешиванию с другими природными AAV, таким образом, определяя популяцию, узнаваемо отличающуюся на генетическом уровне.

Специалист в этой области может выбирать подходящий серотип, кладу, клон или изолят AAV для использования в изобретении на основе общих знаний. Например, показано, что с помощью капсида AAV5 эффективно трансдуцировали колбочковые фоторецепторы приматов, о чем свидетельствует успешная коррекция наследственного дефекта цветного зрения (Mancuso et al. (2009) Nature 461: 784-7).

Серотип AAV определяет тканеспецифичность инфекции (или тропизм) вируса AAV. Таким образом, предпочтительными серотипами AAV для использования в AAV, вводимых пациентам по изобретению, являются серотипы, имеющие природный тропизм к клеткам-мишеням в глазу или высокую эффективность их инфицирования. В одном из вариантов осуществления серотипами AAV для использования в изобретении являются серотипы, инфицирующие клетки нейросенсорной части сетчатки, пигментный эпителий сетчатки и/или хориоидеи.

Как правило, геном AAV природного серотипа, изолята или клады AAV содержит по меньшей мере одну последовательность инвертированного концевого повтора (ITR). Последовательность ITR действует в цис-положении, предоставляя функциональный участок начала репликации и делая возможной интеграцию и эксцизию вектора из генома клетки. Геном AAV, как правило, также содержит упаковывающие гены, такие как гены rep и/или cap, кодирующие упаковывающие функции частицы AAV. Ген rep кодирует один или несколько белков Rep78, Rep68, Rep52 и Rep40 или их вариантов. Ген cap кодирует один или несколько белков капсида, таких как VP1, VP2 и VP3 или их варианты. Эти белки составляют капсид частицы AAV. Варианты капсида описаны ниже.

Промотор будет функционально связан с каждым из упаковывающих генов. Конкретные примеры таких промоторов включают промоторы p5, p19 и p40 (Laughlin et al. (1979) Proc. Natl. Acad. Sci. USA 76: 5567-5571). Например, промоторы p5 и p19, как правило, используют для экспрессии гена rep, в то время как промотор p40, как правило, используют для экспрессии гена cap.

Таким образом, геном AAV, используемый в векторе по изобретению, может представлять собой полный геном природного AAV. Например, вектор, содержащий полный геном AAV, можно использовать для получения вектора AAV in vitro. Однако, хотя такой вектор, в принципе, можно вводить пациентам, это редко будет осуществлено на практике. Предпочтительно, геном AAV будут дериватизировать в целях введения пациентам. Такая дериватизация является стандартом в этой области, и настоящее изобретение относится к применению любого известного производного генома AAV и производным, которые можно получать способами, известными в этой области. Дериватизация генома AAV и капсида AAV описана в Coura and Nardi (2007) Virology Journal 4: 99, и Choi et al. и Wu et al., упомянутых выше.

Производные генома AAV включают любые укороченные или модифицированные формы генома AAV, делающие возможной экспрессию трансгена с вектора по изобретению in vivo. Как правило, можно значительно укорачивать геном AAV для включения минимальной вирусной последовательности, сохраняющей указанную выше функцию. В целях безопасности предпочтительно снижать риск рекомбинации вектора с вирусом дикого типа, а также избегать запуска клеточного иммунного ответа на присутствие вирусных белков в клетке-мишени.

Как правило, производное генома AAV будет включать по меньшей мере одну последовательность инвертированного концевого повтора (ITR), предпочтительно, несколько ITR, например, два или более ITR. Один или несколько ITR можно получать из геномов AAV, имеющих разные серотипы, или он может являться химерным или мутантным ITR. Предпочтительным мутантом ITR является ITR, имеющий делецию trs (участка концевого разрешения). Эта делеция делает возможной непрерывную репликацию генома с образованием одноцепочечного генома, содержащего кодирующую и комплементарную последовательности, т.е. самокомплементарный геном AAV. Это позволяет обходить репликацию ДНК в клетке-мишени и, таким образом, повышать экспрессию трансгена.

Включение одного или нескольких ITR является предпочтительным для облегчения образования конкатемеров вектора по изобретению в ядре клетки-хозяина, например, после преобразования одноцепочечного вектора ДНК в двухцепочечную ДНК под действием ДНК-полимераз клетки-хозяина. Образование таких эписомных конкатемеров защищает конструкцию вектора в течение жизни клетки-хозяина, таким образом, делая возможной длительную экспрессию трансгена in vivo.

В предпочтительных вариантах осуществления элементы ITR будут единственными последовательностями, сохраненными в производном из нативного генома AAV. Таким образом, производное, предпочтительно, не будет включать гены rep и/или cap нативного генома и любые другие последовательности нативного генома. Это является предпочтительным по причинам, описанным выше, а также для снижения вероятности интеграции вектора в геном клетки-хозяина. Кроме того, снижение размера генома AAV делает возможной повышенную гибкость при встраивании других элементов последовательности (таких как регуляторные элементы) в вектор в дополнение к трансгену.

Таким образом, в производном по изобретению могут быть удалены следующие части: одна последовательность инвертированного концевого повтора (ITR), гены репликации (rep) и капсида (cap). Однако в некоторых вариантах осуществления производные могут дополнительно включать один или несколько генов rep и/или cap или другие вирусные последовательности генома AAV. Природный AAV с высокой частотой интегрируется в конкретный участок на хромосоме 19 человека и демонстрирует незначительную частоту случайно интеграции, таким образом, в терапевтических условиях сохранение способности к интеграции вектора может быть допустимым.

Если производное содержит белки капсида, т.е. VP1, VP2 и/или VP3, производное может являться химерным, перетасованным или капсид-модифицированным производным одного или нескольких природных AAV. В частности, настоящее изобретение относится к получению последовательностей белков капсида различных серотипов, клад, клонов или изолятов AAV в одном векторе (т.е. псевдотипированном векторе).

Химерные, перетасованные или капсид-модифицированные производные, как правило, будут выбирать так, чтобы обеспечивать одну или несколько желаемых функций вирусного вектора. Таким образом, эти производные могут демонстрировать повышенную эффективность доставки генов, сниженную иммуногенность (гуморальную или клеточную), измененный диапазон тропизма и/или улучшенный таргетинг конкретного типа клеток по сравнению с вектором AAV, содержащим природный геном AAV, такой как геном AAV2. Повышенная эффективность доставки генов может реализоваться посредством улучшенного связывания рецептора или корецептора на поверхности клетки, улучшенной интернализации, улучшенного транспорта внутри клетки и в ядро, улучшенного "раздевания" вирусной частицы и улучшенного преобразования одноцепочечного генома в двухцепочечную форму. Повышенная эффективность также может относиться к измененному диапазону тропизма или таргетингу конкретной популяции клеток, таким образом, что доза вектора не рассредотачивается при введении в ткани, для которых она не предназначена.

Химерные белки капсида включают белки, полученные посредством рекомбинации между двумя или более кодирующими последовательностями капсида природных серотипов AAV. Это можно осуществлять например с помощью подхода спасения маркера, при котором неинфекционные последовательности капсида одного серотипа котрансфицируют с последовательностями капсида другого серотипа, и направленную селекцию используют для селекции последовательностей капсида, обладающих желаемыми свойствами. Последовательности капсида других серотипов можно изменять посредством гомологичной рекомбинации в клетке для получения новых химерных белков капсида.

Химерные белки капсида также включают белки, полученные посредством конструирования последовательностей белков капсида для переноса конкретных доменов белков капсида, поверхностных петель или конкретных аминокислотных остатков между двумя или более белками капсида, например, между двумя или более белками капсида разных серотипов.

Перетасованные или химерные белки капсида также можно получать посредством перестановки ДНК или подверженной ошибкам ПЦР. Гибридные гены капсида AAV можно получать посредством случайной фрагментации последовательностей родственных генов AAV, например, генов, кодирующих белки капсида множества различных серотипов, а затем повторной сборки фрагментов в самопраймирующейся полимеразной реакции, которая также может вызывать кроссинговеры в областях гомологии последовательностей. Библиотеку гибридных генов AAV, полученных, таким образом, посредством перетасовки генов капсида нескольких серотипов, можно подвергать скринингу для идентификации вирусных клонов, имеющих желаемые функции. Аналогично, подверженную ошибкам ПЦР можно использовать для случайного мутагенеза генов капсида AAV для получения разнообразной библиотеки вариантов, которые затем можно подвергать селекции на желаемое свойство.

Последовательности генов капсида также можно генетически модифицировать для встраивания конкретных делеций, замен или инсерций относительно нативной последовательности дикого типа. В частности, гены капсида можно модифицировать посредством инсерции последовательности неродственного белка или пептида в открытой рамке считывания кодирующей последовательности капсида или на N- и/или C-конце кодирующей последовательности капсида.

Неродственный белок или пептид, предпочтительно, может являться белком или пептидом, действующим в качестве лиганда для конкретного типа клеток, таким образом, придавая свойство улучшенного связывания с клеткой-мишенью или улучшая специфичность таргетинга вектора в отношении конкретной популяции клеток. Неродственный белок также может являться белком, способствующим очистке вирусной частицы как части способа получения, т.е. эпитопной или аффинной меткой. Участок инсерции, как правило, будут выбирать таким образом, чтобы не мешать другим функциям вирусной частицы, например, интернализации, транспорту вирусной частицы. Специалист в этой области может идентифицировать подходящие участки для инсерции, используя общие знания. Конкретные участки описывают в Choi et al., упомянутой выше.

Изобретение дополнительно включает предоставление последовательностей генома AAV в ином порядке и конфигурации, чем в нативном геноме AAV. Изобретение также относится к замене одной или нескольких последовательностей или генов AAV последовательностями из другого вируса или химерными генами, состоящими из последовательностей из нескольких вирусов. Такие химерные гены могут состоять из последовательностей из двух или более родственных вирусных белков других видов вирусов.

Векторы AAV по изобретению включают транскапсидированные формы, где геном AAV или производное, содержащие ITR одного серотипа, упаковывают в капсид другого серотипа. Векторы AAV по изобретению также включают мозаичные формы, где смесь немодифицированных белков капсида двух или более разных серотипов составляет вирусный капсид. Вектор AAV также может включать химически модифицированные формы, несущие лиганды, адсорбированные на поверхности капсида. Например, такие лиганды могут включать антитела для таргетинга конкретного рецептора поверхности клетки.

Таким образом, например, векторы AAV по изобретению включают векторы с геномом AAV2 и белками капсида AAV2 (AAV2/2), векторы с геномом AAV2 и белками капсида AAV5 (AAV2/5) и векторы с геномом AAV2 и белками капсида AAV8 (AAV2/8).

Вектор AAV по изобретению может содержать мутантный белок капсида AAV. В одном из вариантов осуществления вектор AAV по изобретению содержит мутантный белок капсида AAV8. Предпочтительно, мутантный белок капсида AAV8 является белком капсида AAV8 Y733F.

Способы введения

Вирусные векторы по изобретению можно вводить в глаз индивидуума посредством субретинальной, прямой ретинальной или интравитреальной инъекции.

Специалисту в этой области будут известны субретинальные, прямые ретинальные или интравитреальные инъекции, и он будет способен их осуществлять.

Субретинальная инъекция

Субретинальные инъекции являются инъекциями в субретинальное пространство, т.е. под нейросенсорную часть сетчатки. При субретинальной инъекции инъецируемый материал направляют в слои фоторецепторных клеток и клеток пигментного эпителия сетчатки (RPE) и создают пространство между ними.

Если инъекцию осуществляют посредством небольшой ретинотомии, может происходить отслоение сетчатки. Отслоившийся индуцированный слой сетчатки, образованный инъецируемым материалом, обозначают как "пузырь".

Отверстие, образующееся при субретинальной инъекции, должно быть достаточно небольшим, чтобы после введения инъецируемый раствор не затекал обратно в полость стекловидного тела в большом количестве. Такой обратный ток может стать проблемой при инъекции лекарственного средства, т.к. эффекты лекарственного средства будут направлены вне целевой зоны. Предпочтительно, при инъекции создают самовосстанавливающееся отверстие в нейросенсорной части сетчатки, т.е. после удаления инъекционной иглы отверстие, проделанное иглой, затягивается таким образом, что очень мало инъецируемого материала вытекает через отверстие или он, по существу, не вытекает.

Для облегчения этого действия коммерчески доступный специальные иглы для субретинальных инъекций (например, игла для субретинальных инъекций DORC 41G Teflon, Dutch Ophthalmic Research Center International BV, Zuidland, The Netherlands). Они являются иглами, созданными для осуществления субретинальных инъекций.

Если при инъекции не происходит повреждение сетчатки, и при условии, что используют достаточно небольшую иглу, по существу, весь инъецируемый материал остается между отслоившейся нейросенсорной частью сетчатки и RPE в месте локализованного отслоения сетчатки (т.е. не вытекает в полость стекловидного тела). Фактически, типичное существование пузыря в течение короткого периода времени свидетельствует о том, что, как правило, происходит небольшое истечение инъецируемого материала в стекловидное тело. Пузырь может рассасываться в течение более длительного периода времени с абсорбцией инъецируемого материала.

Перед операцией можно осуществлять визуализацию глаза, в частности, сетчатки, например, с использованием оптической когерентной томографии.

Двухстадийная субретинальная инъекция

Векторы AAV по изобретению можно вводить с повышенной точностью и безопасностью с использованием двухстадийного способа, при котором локализованного отслоения сетчатки достигают посредством субретинальной инъекции первого раствора. Первый раствор не содержит вектор. Затем вторую субретинальную инъекцию используют для доставки лекарственного средства, содержащего вектор, в субретинальную жидкость пузыря, полученного посредством первой субретинальной инъекции. Т.к. инъекцию, с помощью которой доставляют лекарственное средство, не используют для отслаивания сетчатки, на этой второй стадии можно инъецировать конкретный объем раствора.

Вектор AAV по изобретению можно доставлять посредством:

(a) введения раствора индивидууму посредством субретинальной инъекции в количестве, эффективном для, по меньшей мере, частичного отслаивания сетчатки для получения субретинального пузыря, где раствор не содержит вектор; и

(b) введения композиции лекарственного средства посредством субретинальной инъекции в пузырь, полученный на стадии (a), где лекарственное средство содержит вектор.

Объем раствора, инъецируемого на стадии (a) для, по меньшей мере, частичного отслаивания сетчатки, может составлять, например, приблизительно 10-1000 мкл, например, приблизительно 50-1000, 100-1000, 250-1000, 500-1000, 10-500, 50-500, 100-500, 250-500 мкл. Объем может составлять, например, 10 приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 мкл.

Объем композиции лекарственного средства, инъецируемый на стадии (b), может составлять, например, приблизительно 10-500 мкл, например, приблизительно 50-500, 100-500, 200-500, 300-500, 400-500, 50-250, 100-250, 200-250 или 50-150 мкл. Объем может составлять, например, 10 приблизительно 50, 100, 150, 200, 250, 300, 350, 400, 450 или 500 мкл. Предпочтительно, объем композиции лекарственного средства, инъецируемый на стадии (b), составляет 100 мкл. Более крупные объемы могут повышать риск растяжения сетчатки, в то время как меньшие объемы может быть трудно увидеть.

Раствор, несодержащий лекарственное средство (т.е. "первый раствор" на стадии (a)) можно составлять аналогично раствору, несодержащему лекарственное средство, как описано ниже. Предпочтительный раствор, несодержащий лекарственное средство, является сбалансированным физиологическим раствором (BSS) или схожим буферным раствором, совпадающим по pH и осмоляльности с субретинальным пространством.

Визуализация сетчатки при хирургическом вмешательстве

В конкретных условиях, например, при дегенерации сетчатки терминальной стадии, определение сетчатки затруднено, т.к. она является тонкой, прозрачной и ее трудно увидеть на фоне разрушенного и сильно пигментированного эпителия, на котором она находится. Использование синего витального красителя (например, Brilliant Peel^®, Geuder; MembraneBlue-Dual^®, Dorc) может облегчать идентификацию отверстия в сетчатке, сделанного для отслаивания сетчатки (т.е. на стадии (a) в двухстадийном способе субретинальной инъекции по изобретению) таким образом, что лекарственное средство можно вводить через то же отверстие без риска его вытекания обратно в полость стекловидного тела.

Использование синего витального красителя также позволяет идентифицировать любые области сетчатки, в которых есть утолщенная внутренняя пограничная мембрана или эпиретинальная мембрана, т.к. инъекция через любую из этих структур будет препятствовать хорошему доступу в субретинальное пространство. Кроме того, сокращение любой из этих структур в промежуточный послеоперационный период может приводить к растяжению отверстия в сетчатке, что может приводить к вытеканию лекарственного средства обратно в полость стекловидного тела.

Фармацевтические композиции и инъецируемые растворы

Векторы AAV и векторную систему AAV по изобретению можно составлять в фармацевтических композициях. Эти композиции могут содержать, в дополнение к лекарственному средству, фармацевтически приемлемый носитель, дилюент, эксципиент, буфер, стабилизатор или другие материалы, хорошо известные в этой области. Такие материалы должны быть нетоксичными и не должны нарушать эффективность активного ингредиента. Конкретную природу носителя или другого материала может определять специалист в этой области в соответствии с путем введения, например, субретинальной, прямой ретинальной или интравитреальной инъекции.

Фармацевтическая композиция, как правило, находится в жидкой форме. Жидкие фармацевтические композиции, как правило, включают жидкий носитель, такой как вода, нефтепродукт, животные или растительные масла, минеральное масло или синтетическое масло. Можно включать физиологический раствор, хлорид магния, декстрозу или раствор другого сахарида, или гликоли, такие как этиленгликоль, пропиленгликоль или полиэтиленгликоль. В некоторых случаях можно использовать поверхностно-активное вещество, такое как 0,001% плюрониловая кислота (PF68).

В случае инъекции в очаг повреждения, активный ингредиент может находиться в форме водного раствора, не являющегося пирогенным, и имеет подходящий pH, изотоничность и стабильность. Специалист в этой области может получать подходящие растворы с использованием, например, изотонических наполнителей, таких как хлорид натрия для инъекций, раствор Рингера для инъекций или лактат Рингера для инъекций. При необходимости, можно включать консерванты, стабилизаторы, буферы, антиоксиданты и/или другие добавки.

В случае отсроченного высвобождения, лекарственное средство можно включать в фармацевтическую композицию, составленную для замедленного высвобождения, такую как микрокапсулы, полученные из биосовместимых полимеров, или липосомные системы носителей, известными в этой области способами.

Способ лечения

Следует понимать, что все ссылки на лечение в настоящем описании включают излечивающее, паллиативное и профилактическое лечение; кроме того, в контексте изобретения ссылки на профилактику, как правило, связаны с профилактическим лечением. Лечение также может включать прекращение прогрессирования тяжести заболевания.

Лечение млекопитающих, особенно людей, является предпочтительным. Однако в объем изобретения входит лечение и человека, и животных.

Варианты, производные, аналоги, гомологи и фрагменты

В дополнение к конкретным белкам и нуклеотидам, упомянутым в настоящем описании, изобретение также относится к применению их вариантов, производных, аналогов, гомологов и фрагментов.

В контексте изобретения вариант любой указанной последовательности является последовательностью, в которой конкретную последовательность остатков (остатков аминокислот или нуклеиновых кислот) модифицируют таким образом, что рассматриваемый полипептид или полинуклеотид, по существу, сохраняет свою функцию. Вариант последовательности можно получать посредством добавления, делеции, замены, модификации и/или изменения по меньшей мере одного остатка, присутствующего в природном белке.

В рамках изобретения термин "производное" в отношении белков или полипептидов по изобретению включает любую замену, изменение, модификацию, делецию и/или добавление одного (или нескольких) аминокислотных остатков в последовательности при условии, что полученный белок или полипептид, по существу, сохраняет по меньшей мере одну из своих эндогенных функций.

В рамках изобретения термин "аналог" в отношении полипептидов или полинуклеотидов включает любой миметик, т.е. химическое соединение, обладающее по меньшей мере одной из эндогенных функций полипептидов или полинуклеотидов, которые оно имитирует.

Как правило, можно осуществлять замены аминокислот, например, от 1, 2 или 3 до 10 или 20 замен при условии, что модифицированная последовательность, по существу, сохраняет необходимую активность или способность. Замены аминокислот могут включать использование неприродных аналогов.

Белки, используемые в изобретении, также могут иметь делеции, инсерции или замены аминокислотных остатков, приводящие к "молчащим" изменениям и функционально эквивалентному белку. Преднамеренные замены аминокислот можно осуществлять с учетом сходства полярности, заряда, растворимости, гидрофобности, гидрофильности и/или амфипатической природы остатков при условии, что эндогенная функция сохраняется. Например, отрицательно заряженные аминокислоты включают аспарагиновую кислоту и глутаминовую кислоту; положительно заряженные аминокислоты включают лизин и аргинин; и аминокислоты с незаряженными полярными концевыми группами, имеющие схожие значения гидрофильности, включают аспарагин, глутамин, серин, треонин и тирозин.

Можно осуществлять консервативные замены, например, в соответствии с таблицей, представленной ниже. Аминокислоты в одном блоке во второй колонке и, предпочтительно, в одной строке в третьей колонке можно заменять друг другом:

Алифатические	Неполярные	G A P
		I L V
	Полярные - незаряженные	C S T M
		N Q
	Полярные - заряженные	D E
		K R H
Ароматические		F W Y

В рамках изобретения термин "гомолог" означает вещество, имеющее конкретную гомологию с аминокислотной последовательностью дикого типа и нуклеотидной последовательностью дикого типа. Термин "гомология" можно приравнять к термину "идентичность".

Гомологичная последовательность может включать аминокислотную последовательность, которая может являться по меньшей мере на 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85% или 90% идентичной, предпочтительно - по меньшей мере на 95% или 97% или 99% идентичной рассматриваемой последовательности. Как правило, гомологи будут содержать те же активные центры и т.д., что и рассматриваемая аминокислотная последовательность. Хотя гомологию также можно рассматривать в терминах сходства (т.е. аминокислотные остатки, имеющие схожие химические свойства/функции), в контексте изобретения предпочтительно выражать гомологию в терминах идентичности последовательности.

Гомологичная последовательность может включать нуклеотидную последовательность, которая может являться по меньшей мере на 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85% или 90% идентичной, предпочтительно - по меньшей мере на 95% или 97% или 99% идентичной рассматриваемой последовательности. Хотя гомологию также можно рассматривать в терминах сходства, в контексте изобретения предпочтительно выражать гомологию в терминах идентичности последовательности.

Предпочтительно, ссылка на последовательность, имеющую процент идентичности по отношению к любой из SEQ ID NO, приведенной в настоящем описании, относится к последовательности, имеющей указанный процент идентичности по всей длине SEQ ID NO, на которую ссылаются.

Сравнения гомологии можно осуществлять визуально или, чаще, с помощью доступных программ для сравнения последовательностей. С помощью этих коммерчески доступных компьютерных программ можно вычислять процент гомологии или идентичности между двумя или более последовательностями.

Процент гомологии можно вычислять для смежных последовательностей, т.е. одну последовательность выравнивают относительно другой последовательности и каждую аминокислоту в одной последовательности напрямую сравнивают с соответствующей аминокислотой в другой последовательности, один остаток за один раз. Это называют выравниванием "без пропусков". Как правило, такое выравнивание без пропусков осуществляют только в отношении относительно небольшого количества остатков.

Хотя этот способ является очень простым и последовательным, с помощью него нельзя учитывать, например, в ином случае идентичную пару последовательностей, одна инсерция или делеция в нуклеотидной последовательности может приводить к тому, что последующие кодоны будут выбиваться из выравнивания, таким образом, потенциально приводя к значительному снижению процента гомологии при осуществлении глобального выравнивания. Таким образом, большинство способов сравнения последовательностей созданы для осуществления оптимального выравнивания, при котором учитывают возможные инсерции и делеции без ненадлежащего штрафа в отношении общих баллов гомологии. Этого достигают посредством включения "пропусков" при выравнивании последовательностей, чтобы попытаться максимизировать локальную гомологию.

Однако, с помощью этих более сложных способов "штраф за пропуск" приписывают каждому пропуску, возникающему при выравнивании, таким образом, что для того же количества идентичных аминокислот при выравнивании последовательностей с наименьшими возможными пропусками, отражающими более высокое родство между двумя сравниваемыми последовательностями, будут достигать более высоких баллов, чем при большом количестве пропусков. Как правило, используют "аффинные штрафы за пропуски", приводящие к вычитанию большого количества баллов за существование пропуска и меньшего количества за каждый последующий остаток в пропуске. Это является наиболее общеупотребительной системой балльной оценки пропусков. Высокие штрафы за пропуски, разумеется, будут приводить к оптимизированному выравниванию с меньшим количеством пропусков. В большинстве программ для выравнивания допускают модификацию штрафов за пропуски. Однако при использовании такого программного обеспечения для сравнения последовательностей предпочтительно использовать значения по умолчанию. Например, при использовании пакета программ GCG Wisconsin Bestfit штраф за пропуск по умолчанию для аминокислотных последовательностей составляет -12 для пропуска и -4 для каждого удлинения.

Таким образом, для вычисления максимального процента гомологии сначала необходимо осуществление оптимального выравнивания с учетом штрафов за пропуски. Подходящей компьютерной программой для осуществления такого выравнивания является пакет программ GCG Wisconsin Bestfit (University of Wisconsin, U.S.A.; Devereux et al. (1984) Nucleic Acids Res. 12: 387). Неограничивающие примеры другого программного обеспечения, с помощью которого можно осуществлять сравнение последовательностей, включают пакет BLAST (см. Ausubel et al. (1999) там же - Ch. 18), FASTA (Atschul et al. (1990) J. Mol. Biol. 403-410) и пакет инструментов для сравнения GENEWORKS. BLAST и FASTA доступны для поиска офлайн и онлайн (см. Ausubel et al. (1999) там же, стр. с 7-58 по 7-60). Однако в некоторых случаях предпочтительно использовать программу GCG Bestfit. Для сравнения белковых и нуклеотидных последовательностей также доступен другой инструмент под названием BLAST 2 Sequences (см. FEMS Microbiol. Lett. (1999) 174: 247-50; FEMS Microbiol. Lett. (1999) 177: 187-8).

Хотя конечный процент гомологии можно измерять в терминах идентичности, само выравнивание, как правило, не основано на сравнении пар по принципу "все или ничего". Вместо этого, как правило, используют масштабированную матрицу для балльной оценки сходства, с помощью которой приписывают баллы каждому попарному сравнению с учетом химического сходства или эволюционного расстояния. Примером такой общеупотребительной матрицы является матрица BLOSUM62 - матрица по умолчанию в пакете программ BLAST. В программах GCG Wisconsin, как правило, используют общедоступные значения по умолчанию или специальную таблицу сравнения символов, если ее поставляют (см. руководство пользователя). В некоторых случаях, предпочтительно использовать общедоступные значения по умолчанию для пакета GCG или, в случае другого программного обеспечения, матрицу по умолчанию, такую как BLOSUM62.

После достижения оптимального выравнивания с помощью программного обеспечения можно вычислять процент гомологии, предпочтительно, процент идентичности последовательности. Как правило, это осуществляют с помощью программного обеспечения как часть сравнения последовательностей и получают числовой результат.

"Фрагменты" также являются вариантами, и термин, как правило, относится к выбранной области полипептида или полинуклеотида, представляющего интерес функционально или, например, в анализе. Таким образом, термин "фрагмент" относится к аминокислотной последовательности или последовательности нуклеиновой кислоты, являющейся частью полноразмерного полипептида или полинуклеотида.

Такие варианты можно получать стандартными способами рекомбинантной ДНК, такими как сайт-специфический мутагенез. Если необходимо сделать инсерции, можно получать синтетическую ДНК, кодирующую инсерцию вместе с 5'- и 3'-фланкирующими областями, соответствующими природной последовательности с любой стороны от участка инсерции. Фланкирующие области будут содержать подходящие участки рестрикции, соответствующие участкам в природной последовательности таким образом, что последовательность можно расщеплять с использованием подходящих ферментов и можно лигировать синтетическую ДНК в участок расщепления. Затем ДНК экспрессируют по изобретению для получения кодируемого белка. Эти способы представляют собой исключительно иллюстрации многочисленных стандартных способов, известных в этой области для манипуляции с последовательностями ДНК, и также можно использовать другие известные способы.

Оптимизация кодонов

Настоящее изобретение относится к кодон-оптимизированным вариантам последовательностей нуклеиновой кислоты, представленных в настоящем описании.

При оптимизации кодонов используют преимущество избыточности генетического кода, чтобы изменять нуклеотидную последовательность с сохранением той же аминокислотной последовательности кодируемого белка.

Как правило, оптимизацию кодонов осуществляют для облегчения повышения или снижения экспрессии кодируемого белка. Это осуществляют посредством адаптации использования кодонов в нуклеотидной последовательности к конкретному типу клеток, таким образом, используя преимущество клеточного индекса случайности использования синонимичных кодонов, соответствующего случайности относительного избытка конкретных тРНК в типе клеток. Изменяя кодоны в нуклеотидной последовательности таким образом, что их адаптируют для соответствия относительному избытку соответствующих тРНК, можно повышать экспрессию. И наоборот, можно снижать экспрессию, выбирая кодоны, для которых, как известно, соответствующие тРНК редки в конкретном типе клеток.

Способы оптимизации кодонов в последовательностях нуклеиновой кислоты известны в этой области и будут знакомы специалисту в этой области.

ПОСЛЕДОВАТЕЛЬНОСТИ

SEQ ID NO: 1

AGGACACAGCGTCCGGAGCCAGAGGCGCTCTTAACGGCGTTTATGTCCTTTGCTGTCTGAGGGGCCTCAGCTCTGACCAATCTGGTCTTCGTGTGGTCATTAGCATGGGCTTCGTGAGACAGATACAGCTTTTGCTCTGGAAGAACTGGACCCTGCGGAAAAGGCAAAAGATTCGCTTTGTGGTGGAACTCGTGTGGCCTTTATCTTTATTTCTGGTCTTGATCTGGTTAAGGAATGCCAACCCGCTCTACAGCCATCATGAATGCCATTTCCCCAACAAGGCGATGCCCTCAGCAGGAATGCTGCCGTGGCTCCAGGGGATCTTCTGCAATGTGAACAATCCCTGTTTTCAAAGCCCCACCCCAGGAGAATCTCCTGGAATTGTGTCAAACTATAACAACTCCATCTTGGCAAGGGTATATCGAGATTTTCAAGAACTCCTCATGAATGCACCAGAGAGCCAGCACCTTGGCCGTATTTGGACAGAGCTACACATCTTGTCCCAATTCATGGACACCCTCCGGACTCACCCGGAGAGAATTGCAGGAAGAGGAATACGAATAAGGGATATCTTGAAAGATGAAGAAACACTGACACTATTTCTCATTAAAAACATCGGCCTGTCTGACTCAGTGGTCTACCTTCTGATCAACTCTCAAGTCCGTCCAGAGCAGTTCGCTCATGGAGTCCCGGACCTGGCGCTGAAGGACATCGCCTGCAGCGAGGCCCTCCTGGAGCGCTTCATCATCTTCAGCCAGAGACGCGGGGCAAAGACGGTGCGCTATGCCCTGTGCTCCCTCTCCCAGGGCACCCTACAGTGGATAGAAGACACTCTGTATGCCAACGTGGACTTCTTCAAGCTCTTCCGTGTGCTTCCCACACTCCTAGACAGCCGTTCTCAAGGTATCAATCTGAGATCTTGGGGAGGAATATTATCTGATATGTCACCAAGAATTCAAGAGTTTATCCATCGGCCGAGTATGCAGGACTTGCTGTGGGTGACCAGGCCCCTCATGCAGAATGGTGGTCCAGAGACCTTTACAAAGCTGATGGGCATCCTGTCTGACCTCCTGTGTGGCTACCCCGAGGGAGGTGGCTCTCGGGTGCTCTCCTTCAACTGGTATGAAGACAATAACTATAAGGCCTTTCTGGGGATTGACTCCACAAGGAAGGATCCTATCTATTCTTATGACAGAAGAACAACATCCTTTTGTAATGCATTGATCCAGAGCCTGGAGTCAAATCCTTTAACCAAAATCGCTTGGAGGGCGGCAAAGCCTTTGCTGATGGGAAAAATCCTGTACACTCCTGATTCACCTGCAGCACGAAGGATACTGAAGAATGCCAACTCAACTTTTGAAGAACTGGAACACGTTAGGAAGTTGGTCAAAGCCTGGGAAGAAGTAGGGCCCCAGATCTGGTACTTCTTTGACAACAGCACACAGATGAACATGATCAGAGATACCCTGGGGAACCCAACAGTAAAAGACTTTTTGAATAGGCAGCTTGGTGAAGAAGGTATTACTGCTGAAGCCATCCTAAACTTCCTCTACAAGGGCCCTCGGGAAAGCCAGGCTGACGACATGGCCAACTTCGACTGGAGGGACATATTTAACATCACTGATCGCACCCTCCGCCTGGTCAATCAATACCTGGAGTGCTTGGTCCTGGATAAGTTTGAAAGCTACAATGATGAAACTCAGCTCACCCAACGTGCCCTCTCTCTACTGGAGGAAAACATGTTCTGGGCCGGAGTGGTATTCCCTGACATGTATCCCTGGACCAGCTCTCTACCACCCCACGTGAAGTATAAGATCCGAATGGACATAGACGTGGTGGAGAAAACCAATAAGATTAAAGACAGGTATTGGGATTCTGGTCCCAGAGCTGATCCCGTGGAAGATTTCCGGTACATCTGGGGCGGGTTTGCCTATCTGCAGGACATGGTTGAACAGGGGATCACAAGGAGCCAGGTGCAGGCGGAGGCTCCAGTTGGAATCTACCTCCAGCAGATGCCCTACCCCTGCTTCGTGGACGATTCTTTCATGATCATCCTGAACCGCTGTTTCCCTATCTTCATGGTGCTGGCATGGATCTACTCTGTCTCCATGACTGTGAAGAGCATCGTCTTGGAGAAGGAGTTGCGACTGAAGGAGACCTTGAAAAATCAGGGTGTCTCCAATGCAGTGATTTGGTGTACCTGGTTCCTGGACAGCTTCTCCATCATGTCGATGAGCATCTTCCTCCTGACGATATTCATCATGCATGGAAGAATCCTACATTACAGCGACCCATTCATCCTCTTCCTGTTCTTGTTGGCTTTCTCCACTGCCACCATCATGCTGTGCTTTCTGCTCAGCACCTTCTTCTCCAAGGCCAGTCTGGCAGCAGCCTGTAGTGGTGTCATCTATTTCACCCTCTACCTGCCACACATCCTGTGCTTCGCCTGGCAGGACCGCATGACCGCTGAGCTGAAGAAGGCTGTGAGCTTACTGTCTCCGGTGGCATTTGGATTTGGCACTGAGTACCTGGTTCGCTTTGAAGAGCAAGGCCTGGGGCTGCAGTGGAGCAACATCGGGAACAGTCCCACGGAAGGGGACGAATTCAGCTTCCTGCTGTCCATGCAGATGATGCTCCTTGATGCTGCTGTCTATGGCTTACTCGCTTGGTACCTTGATCAGGTGTTTCCAGGAGACTATGGAACCCCACTTCCTTGGTACTTTCTTCTACAAGAGTCGTATTGGCTTGGCGGTGAAGGGTGTTCAACCAGAGAAGAAAGAGCCCTGGAAAAGACCGAGCCCCTAACAGAGGAAACGGAGGATCCAGAGCACCCAGAAGGAATACACGACTCCTTCTTTGAACGTGAGCATCCAGGGTGGGTTCCTGGGGTATGCGTGAAGAATCTGGTAAAGATTTTTGAGCCCTGTGGCCGGCCAGCTGTGGACCGTCTGAACATCACCTTCTACGAGAACCAGATCACCGCATTCCTGGGCCACAATGGAGCTGGGAAAACCACCACCTTGTCCATCCTGACGGGTCTGTTGCCACCAACCTCTGGGACTGTGCTCGTTGGGGGAAGGGACATTGAAACCAGCCTGGATGCAGTCCGGCAGAGCCTTGGCATGTGTCCACAGCACAACATCCTGTTCCACCACCTCACGGTGGCTGAGCACATGCTGTTCTATGCCCAGCTGAAAGGAAAGTCCCAGGAGGAGGCCCAGCTGGAGATGGAAGCCATGTTGGAGGACACAGGCCTCCACCACAAGCGGAATGAAGAGGCTCAGGACCTATCAGGTGGCATGCAGAGAAAGCTGTCGGTTGCCATTGCCTTTGTGGGAGATGCCAAGGTGGTGATTCTGGACGAACCCACCTCTGGGGTGGACCCTTACTCGAGACGCTCAATCTGGGATCTGCTCCTGAAGTATCGCTCAGGCAGAACCATCATCATGTCCACTCACCACATGGACGAGGCCGACCTCCTTGGGGACCGCATTGCCATCATTGCCCAGGGAAGGCTCTACTGCTCAGGCACCCCACTCTTCCTGAAGAACTGCTTTGGCACAGGCTTGTACTTAACCTTGGTGCGCAAGATGAAAAACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCCAAATAAGAACTTCAAGCACAGAGCATATGCCAGCCTTTTCAGAGAGCTGGAGGAGACGCTGGCTGACCTTGGTCTCAGCAGTTTTGGAATTTCTGACACTCCCCTGGAAGAGATTTTTCTGAAGGTCACGGAGGATTCTGATTCAGGACCTCTGTTTGCGGGTGGCGCTCAGCAGAAAAGAGAAAACGTCAACCCCCGACACCCCTGCTTGGGTCCCAGAGAGAAGGCTGGACAGACACCCCAGGACTCCAATGTCTGCTCCCCAGGGGCGCCGGCTGCTCACCCAGAGGGCCAGCCTCCCCCAGAGCCAGAGTGCCCAGGCCCGCAGCTCAACACGGGGACACAGCTGGTCCTCCAGCATGTGCAGGCGCTGCTGGTCAAGAGATTCCAACACACCATCCGCAGCCACAAGGACTTCCTGGCGCAGATCGTGCTCCCGGCTACCTTTGTGTTTTTGGCTCTGATGCTTTCTATTGTTATCCCTCCTTTTGGCGAATACCCCGCTTTGACCCTTCACCCCTGGATATATGGGCAGCAGTACACCTTCTTCAGCATGGATGAACCAGGCAGTGAGCAGTTCACGGTACTTGCAGACGTCCTCCTGAATAAGCCAGGCTTTGGCAACCGCTGCCTGAAGGAAGGGTGGCTTCCGGAGTACCCCTGTGGCAACTCAACACCCTGGAAGACTCCTTCTGTGTCCCCAAACATCACCCAGCTGTTCCAGAAGCAGAAATGGACACAGGTCAACCCTTCACCATCCTGCAGGTGCAGCACCAGGGAGAAGCTCACCATGCTGCCAGAGTGCCCCGAGGGTGCCGGGGGCCTCCCGCCCCCCCAGAGAACACAGCGCAGCACGGAAATTCTACAAGACCTGACGGACAGGAACATCTCCGACTTCTTGGTAAAAACGTATCCTGCTCTTATAAGAAGCAGCTTAAAGAGCAAATTCTGGGTCAATGAACAGAGGTATGGAGGAATTTCCATTGGAGGAAAGCTCCCAGTCGTCCCCATCACGGGGGAAGCACTTGTTGGGTTTTTAAGCGACCTTGGCCGGATCATGAATGTGAGCGGGGGCCCTATCACTAGAGAGGCCTCTAAAGAAATACCTGATTTCCTTAAACATCTAGAAACTGAAGACAACATTAAGGTGTGGTTTAATAACAAAGGCTGGCATGCCCTGGTCAGCTTTCTCAATGTGGCCCACAACGCCATCTTACGGGCCAGCCTGCCTAAGGACAGGAGCCCCGAGGAGTATGGAATCACCGTCATTAGCCAACCCCTGAACCTGACCAAGGAGCAGCTCTCAGAGATTACAGTGCTGACCACTTCAGTGGATGCTGTGGTTGCCATCTGCGTGATTTTCTCCATGTCCTTCGTCCCAGCCAGCTTTGTCCTTTATTTGATCCAGGAGCGGGTGAACAAATCCAAGCACCTCCAGTTTATCAGTGGAGTGAGCCCCACCACCTACTGGGTGACCAACTTCCTCTGGGACATCATGAATTATTCCGTGAGTGCTGGGCTGGTGGTGGGCATCTTCATCGGGTTTCAGAAGAAAGCCTACACTTCTCCAGAAAACCTTCCTGCCCTTGTGGCACTGCTCCTGCTGTATGGATGGGCGGTCATTCCCATGATGTACCCAGCATCCTTCCTGTTTGATGTCCCCAGCACAGCCTATGTGGCTTTATCTTGTGCTAATCTGTTCATCGGCATCAACAGCAGTGCTATTACCTTCATCTTGGAATTATTTGAGAATAACCGGACGCTGCTCAGGTTCAACGCCGTGCTGAGGAAGCTGCTCATTGTCTTCCCCCACTTCTGCCTGGGCCGGGGCCTCATTGACCTTGCACTGAGCCAGGCTGTGACAGATGTCTATGCCCGGTTTGGTGAGGAGCACTCTGCAAATCCGTTCCACTGGGACCTGATTGGGAAGAACCTGTTTGCCATGGTGGTGGAAGGGGTGGTGTACTTCCTCCTGACCCTGCTGGTCCAGCGCCACTTCTTCCTCTCCCAATGGATTGCCGAGCCCACTAAGGAGCCCATTGTTGATGAAGATGATGATGTGGCTGAAGAAAGACAAAGAATTATTACTGGTGGAAATAAAACTGACATCTTAAGGCTACATGAACTAACCAAGATTTATCCAGGCACCTCCAGCCCAGCAGTGGACAGGCTGTGTGTCGGAGTTCGCCCTGGAGAGTGCTTTGGCCTCCTGGGAGTGAATGGTGCCGGCAAAACAACCACATTCAAGATGCTCACTGGGGACACCACAGTGACCTCAGGGGATGCCACCGTAGCAGGCAAGAGTATTTTAACCAATATTTCTGAAGTCCATCAAAATATGGGCTACTGTCCTCAGTTTGATGCAATTGATGAGCTGCTCACAGGACGAGAACATCTTTACCTTTATGCCCGGCTTCGAGGTGTACCAGCAGAAGAAATCGAAAAGGTTGCAAACTGGAGTATTAAGAGCCTGGGCCTGACTGTCTACGCCGACTGCCTGGCTGGCACGTACAGTGGGGGCAACAAGCGGAAACTCTCCACAGCCATCGCACTCATTGGCTGCCCACCGCTGGTGCTGCTGGATGAGCCCACCACAGGGATGGACCCCCAGGCACGCCGCATGCTGTGGAACGTCATCGTGAGCATCATCAGAGAAGGGAGGGCTGTGGTCCTCACATCCCACAGCATGGAAGAATGTGAGGCACTGTGTACCCGGCTGGCCATCATGGTAAAGGGCGCCTTTCGATGTATGGGCACCATTCAGCATCTCAAGTCCAAATTTGGAGATGGCTATATCGTCACAATGAAGATCAAATCCCCGAAGGACGACCTGCTTCCTGACCTGAACCCTGTGGAGCAGTTCTTCCAGGGGAACTTCCCAGGCAGTGTGCAGAGGGAGAGGCACTACAACATGCTCCAGTTCCAGGTCTCCTCCTCCTCCCTGGCGAGGATCTTCCAGCTCCTCCTCTCCCACAAGGACAGCCTGCTCATCGAGGAGTACTCAGTCACACAGACCACACTGGACCAGGTGTTTGTAAATTTTGCTAAACAGCAGACTGAAAGTCATGACCTCCCTCTGCACCCTCGAGCTGCTGGAGCCAGTCGACAAGCCCAGGACTGATCTTTCACACCGCTCGTTCCTGCAGCCAGAAAGGAACTCTGGGCAGCTGGAGGCGCAGGAGCCTGTGCCCATATGGTCATCCAAATGGACTGGCCAGCGTAAATGACCCCACTGCAGCAGAAAACAAACACACGAGGAGCATGCAGCGAATTCAGAAAGAGGTCTTTCAGAAGGAAACCGAAACTGACTTGCTCACCTGGAACACCTGATGGTGAAACCAAACAAATACAAAATCCTTCTCCAGACCCCAGAACTAGAAACCCCGGGCCATCCCACTAGCAGCTTTGGCCTCCATATTGCTCTCATTTCAAGCAGATCTGCTTTTCTGCATGTTTGTCTGTGTGTCTGCGTTGTGTGTGATTTTCATGGAAAAATAAAATGCAAATGCACTCATCACAAA

SEQ ID NO: 2

AGGACACAGCGTCCGGAGCCAGAGGCGCTCTTAACGGCGTTTATGTCCTTTGCTGTCTGAGGGGCCTCAGCTCTGACCAATCTGGTCTTCGTGTGGTCATTAGCATGGGCTTCGTGAGACAGATACAGCTTTTGCTCTGGAAGAACTGGACCCTGCGGAAAAGGCAAAAGATTCGCTTTGTGGTGGAACTCGTGTGGCCTTTATCTTTATTTCTGGTCTTGATCTGGTTAAGGAATGCCAACCCGCTCTACAGCCATCATGAATGCCATTTCCCCAACAAGGCGATGCCCTCAGCAGGAATGCTGCCGTGGCTCCAGGGGATCTTCTGCAATGTGAACAATCCCTGTTTTCAAAGCCCCACCCCAGGAGAATCTCCTGGAATTGTGTCAAACTATAACAACTCCATCTTGGCAAGGGTATATCGAGATTTTCAAGAACTCCTCATGAATGCACCAGAGAGCCAGCACCTTGGCCGTATTTGGACAGAGCTACACATCTTGTCCCAATTCATGGACACCCTCCGGACTCACCCGGAGAGAATTGCAGGAAGAGGAATACGAATAAGGGATATCTTGAAAGATGAAGAAACACTGACACTATTTCTCATTAAAAACATCGGCCTGTCTGACTCAGTGGTCTACCTTCTGATCAACTCTCAAGTCCGTCCAGAGCAGTTCGCTCATGGAGTCCCGGACCTGGCGCTGAAGGACATCGCCTGCAGCGAGGCCCTCCTGGAGCGCTTCATCATCTTCAGCCAGAGACGCGGGGCAAAGACGGTGCGCTATGCCCTGTGCTCCCTCTCCCAGGGCACCCTACAGTGGATAGAAGACACTCTGTATGCCAACGTGGACTTCTTCAAGCTCTTCCGTGTGCTTCCCACACTCCTAGACAGCCGTTCTCAAGGTATCAATCTGAGATCTTGGGGAGGAATATTATCTGATATGTCACCAAGAATTCAAGAGTTTATCCATCGGCCGAGTATGCAGGACTTGCTGTGGGTGACCAGGCCCCTCATGCAGAATGGTGGTCCAGAGACCTTTACAAAGCTGATGGGCATCCTGTCTGACCTCCTGTGTGGCTACCCCGAGGGAGGTGGCTCTCGGGTGCTCTCCTTCAACTGGTATGAAGACAATAACTATAAGGCCTTTCTGGGGATTGACTCCACAAGGAAGGATCCTATCTATTCTTATGACAGAAGAACAACATCCTTTTGTAATGCATTGATCCAGAGCCTGGAGTCAAATCCTTTAACCAAAATCGCTTGGAGGGCGGCAAAGCCTTTGCTGATGGGAAAAATCCTGTACACTCCTGATTCACCTGCAGCACGAAGGATACTGAAGAATGCCAACTCAACTTTTGAAGAACTGGAACACGTTAGGAAGTTGGTCAAAGCCTGGGAAGAAGTAGGGCCCCAGATCTGGTACTTCTTTGACAACAGCACACAGATGAACATGATCAGAGATACCCTGGGGAACCCAACAGTAAAAGACTTTTTGAATAGGCAGCTTGGTGAAGAAGGTATTACTGCTGAAGCCATCCTAAACTTCCTCTACAAGGGCCCTCGGGAAAGCCAGGCTGACGACATGGCCAACTTCGACTGGAGGGACATATTTAACATCACTGATCGCACCCTCCGCCTTGTCAATCAATACCTGGAGTGCTTGGTCCTGGATAAGTTTGAAAGCTACAATGATGAAACTCAGCTCACCCAACGTGCCCTCTCTCTACTGGAGGAAAACATGTTCTGGGCCGGAGTGGTATTCCCTGACATGTATCCCTGGACCAGCTCTCTACCACCCCACGTGAAGTATAAGATCCGAATGGACATAGACGTGGTGGAGAAAACCAATAAGATTAAAGACAGGTATTGGGATTCTGGTCCCAGAGCTGATCCCGTGGAAGATTTCCGGTACATCTGGGGCGGGTTTGCCTATCTGCAGGACATGGTTGAACAGGGGATCACAAGGAGCCAGGTGCAGGCGGAGGCTCCAGTTGGAATCTACCTCCAGCAGATGCCCTACCCCTGCTTCGTGGACGATTCTTTCATGATCATCCTGAACCGCTGTTTCCCTATCTTCATGGTGCTGGCATGGATCTACTCTGTCTCCATGACTGTGAAGAGCATCGTCTTGGAGAAGGAGTTGCGACTGAAGGAGACCTTGAAAAATCAGGGTGTCTCCAATGCAGTGATTTGGTGTACCTGGTTCCTGGACAGCTTCTCCATCATGTCGATGAGCATCTTCCTCCTGACGATATTCATCATGCATGGAAGAATCCTACATTACAGCGACCCATTCATCCTCTTCCTGTTCTTGTTGGCTTTCTCCACTGCCACCATCATGCTGTGCTTTCTGCTCAGCACCTTCTTCTCCAAGGCCAGTCTGGCAGCAGCCTGTAGTGGTGTCATCTATTTCACCCTCTACCTGCCACACATCCTGTGCTTCGCCTGGCAGGACCGCATGACCGCTGAGCTGAAGAAGGCTGTGAGCTTACTGTCTCCGGTGGCATTTGGATTTGGCACTGAGTACCTGGTTCGCTTTGAAGAGCAAGGCCTGGGGCTGCAGTGGAGCAACATCGGGAACAGTCCCACGGAAGGGGACGAATTCAGCTTCCTGCTGTCCATGCAGATGATGCTCCTTGATGCTGCTGTCTATGGCTTACTCGCTTGGTACCTTGATCAGGTGTTTCCAGGAGACTATGGAACCCCACTTCCTTGGTACTTTCTTCTACAAGAGTCGTATTGGCTTGGCGGTGAAGGGTGTTCAACCAGAGAAGAAAGAGCCCTGGAAAAGACCGAGCCCCTAACAGAGGAAACGGAGGATCCAGAGCACCCAGAAGGAATACACGACTCCTTCTTTGAACGTGAGCATCCAGGGTGGGTTCCTGGGGTATGCGTGAAGAATCTGGTAAAGATTTTTGAGCCCTGTGGCCGGCCAGCTGTGGACCGTCTGAACATCACCTTCTACGAGAACCAGATCACCGCATTCCTGGGCCACAATGGAGCTGGGAAAACCACCACCTTGTCCATCCTGACGGGTCTGTTGCCACCAACCTCTGGGACTGTGCTCGTTGGGGGAAGGGACATTGAAACCAGCCTGGATGCAGTCCGGCAGAGCCTTGGCATGTGTCCACAGCACAACATCCTGTTCCACCACCTCACGGTGGCTGAGCACATGCTGTTCTATGCCCAGCTGAAAGGAAAGTCCCAGGAGGAGGCCCAGCTGGAGATGGAAGCCATGTTGGAGGACACAGGCCTCCACCACAAGCGGAATGAAGAGGCTCAGGACCTATCAGGTGGCATGCAGAGAAAGCTGTCGGTTGCCATTGCCTTTGTGGGAGATGCCAAGGTGGTGATTCTGGACGAACCCACCTCTGGGGTGGACCCTTACTCGAGACGCTCAATCTGGGATCTGCTCCTGAAGTATCGCTCAGGCAGAACCATCATCATGTCCACTCACCACATGGACGAGGCCGACCTCCTTGGGGACCGCATTGCCATCATTGCCCAGGGAAGGCTCTACTGCTCAGGCACCCCACTCTTCCTGAAGAACTGCTTTGGCACAGGCTTGTACTTAACCTTGGTGCGCAAGATGAAAAACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCCAAATAAGAACTTCAAGCACAGAGCATATGCCAGCCTTTTCAGAGAGCTGGAGGAGACGCTGGCTGACCTTGGTCTCAGCAGTTTTGGAATTTCTGACACTCCCCTGGAAGAGATTTTTCTGAAGGTCACGGAGGATTCTGATTCAGGACCTCTGTTTGCGGGTGGCGCTCAGCAGAAAAGAGAAAACGTCAACCCCCGACACCCCTGCTTGGGTCCCAGAGAGAAGGCTGGACAGACACCCCAGGACTCCAATGTCTGCTCCCCAGGGGCGCCGGCTGCTCACCCAGAGGGCCAGCCTCCCCCAGAGCCAGAGTGCCCAGGCCCGCAGCTCAACACGGGGACACAGCTGGTCCTCCAGCATGTGCAGGCGCTGCTGGTCAAGAGATTCCAACACACCATCCGCAGCCACAAGGACTTCCTGGCGCAGATCGTGCTCCCGGCTACCTTTGTGTTTTTGGCTCTGATGCTTTCTATTGTTATCCCTCCTTTTGGCGAATACCCCGCTTTGACCCTTCACCCCTGGATATATGGGCAGCAGTACACCTTCTTCAGCATGGATGAACCAGGCAGTGAGCAGTTCACGGTACTTGCAGACGTCCTCCTGAATAAGCCAGGCTTTGGCAACCGCTGCCTGAAGGAAGGGTGGCTTCCGGAGTACCCCTGTGGCAACTCAACACCCTGGAAGACTCCTTCTGTGTCCCCAAACATCACCCAGCTGTTCCAGAAGCAGAAATGGACACAGGTCAACCCTTCACCATCCTGCAGGTGCAGCACCAGGGAGAAGCTCACCATGCTGCCAGAGTGCCCCGAGGGTGCCGGGGGCCTCCCGCCCCCCCAGAGAACACAGCGCAGCACGGAAATTCTACAAGACCTGACGGACAGGAACATCTCCGACTTCTTGGTAAAAACGTATCCTGCTCTTATAAGAAGCAGCTTAAAGAGCAAATTCTGGGTCAATGAACAGAGGTATGGAGGAATTTCCATTGGAGGAAAGCTCCCAGTCGTCCCCATCACGGGGGAAGCACTTGTTGGGTTTTTAAGCGACCTTGGCCGGATCATGAATGTGAGCGGGGGCCCTATCACTAGAGAGGCCTCTAAAGAAATACCTGATTTCCTTAAACATCTAGAAACTGAAGACAACATTAAGGTGTGGTTTAATAACAAAGGCTGGCATGCCCTGGTCAGCTTTCTCAATGTGGCCCACAACGCCATCTTACGGGCCAGCCTGCCTAAGGACAGGAGCCCCGAGGAGTATGGAATCACCGTCATTAGCCAACCCCTGAACCTGACCAAGGAGCAGCTCTCAGAGATTACAGTGCTGACCACTTCAGTGGATGCTGTGGTTGCCATCTGCGTGATTTTCTCCATGTCCTTCGTCCCAGCCAGCTTTGTCCTTTATTTGATCCAGGAGCGGGTGAACAAATCCAAGCACCTCCAGTTTATCAGTGGAGTGAGCCCCACCACCTACTGGGTAACCAACTTCCTCTGGGACATCATGAATTATTCCGTGAGTGCTGGGCTGGTGGTGGGCATCTTCATCGGGTTTCAGAAGAAAGCCTACACTTCTCCAGAAAACCTTCCTGCCCTTGTGGCACTGCTCCTGCTGTATGGATGGGCGGTCATTCCCATGATGTACCCAGCATCCTTCCTGTTTGATGTCCCCAGCACAGCCTATGTGGCTTTATCTTGTGCTAATCTGTTCATCGGCATCAACAGCAGTGCTATTACCTTCATCTTGGAATTATTTGAGAATAACCGGACGCTGCTCAGGTTCAACGCCGTGCTGAGGAAGCTGCTCATTGTCTTCCCCCACTTCTGCCTGGGCCGGGGCCTCATTGACCTTGCACTGAGCCAGGCTGTGACAGATGTCTATGCCCGGTTTGGTGAGGAGCACTCTGCAAATCCGTTCCACTGGGACCTGATTGGGAAGAACCTGTTTGCCATGGTGGTGGAAGGGGTGGTGTACTTCCTCCTGACCCTGCTGGTCCAGCGCCACTTCTTCCTCTCCCAATGGATTGCCGAGCCCACTAAGGAGCCCATTGTTGATGAAGATGATGATGTGGCTGAAGAAAGACAAAGAATTATTACTGGTGGAAATAAAACTGACATCTTAAGGCTACATGAACTAACCAAGATTTATCCAGGCACCTCCAGCCCAGCAGTGGACAGGCTGTGTGTCGGAGTTCGCCCTGGAGAGTGCTTTGGCCTCCTGGGAGTGAATGGTGCCGGCAAAACAACCACATTCAAGATGCTCACTGGGGACACCACAGTGACCTCAGGGGATGCCACCGTAGCAGGCAAGAGTATTTTAACCAATATTTCTGAAGTCCATCAAAATATGGGCTACTGTCCTCAGTTTGATGCAATCGATGAGCTGCTCACAGGACGAGAACATCTTTACCTTTATGCCCGGCTTCGAGGTGTACCAGCAGAAGAAATCGAAAAGGTTGCAAACTGGAGTATTAAGAGCCTGGGCCTGACTGTCTACGCCGACTGCCTGGCTGGCACGTACAGTGGGGGCAACAAGCGGAAACTCTCCACAGCCATCGCACTCATTGGCTGCCCACCGCTGGTGCTGCTGGATGAGCCCACCACAGGGATGGACCCCCAGGCACGCCGCATGCTGTGGAACGTCATCGTGAGCATCATCAGAGAAGGGAGGGCTGTGGTCCTCACATCCCACAGCATGGAAGAATGTGAGGCACTGTGTACCCGGCTGGCCATCATGGTAAAGGGCGCCTTTCGATGTATGGGCACCATTCAGCATCTCAAGTCCAAATTTGGAGATGGCTATATCGTCACAATGAAGATCAAATCCCCGAAGGACGACCTGCTTCCTGACCTGAACCCTGTGGAGCAGTTCTTCCAGGGGAACTTCCCAGGCAGTGTGCAGAGGGAGAGGCACTACAACATGCTCCAGTTCCAGGTCTCCTCCTCCTCCCTGGCGAGGATCTTCCAGCTCCTCCTCTCCCACAAGGACAGCCTGCTCATCGAGGAGTACTCAGTCACACAGACCACACTGGACCAGGTGTTTGTAAATTTTGCTAAACAGCAGACTGAAAGTCATGACCTCCCTCTGCACCCTCGAGCTGCTGGAGCCAGTCGACAAGCCCAGGACTGATCTTTCACACCGCTCGTTCCTGCAGCCAGAAAGGAACTCTGGGCAGCTGGAGGCGCAGGAGCCTGTGCCCATATGGTCATCCAAATGGACTGGCCAGCGTAAATGACCCCACTGCAGCAGAAAACAAACACACGAGGAGCATGCAGCGAATTCAGAAAGAGGTCTTTCAGAAGGAAACCGAAACTGACTTGCTCACCTGGAACACCTGATGGTGAAACCAAACAAATACAAAATCCTTCTCCAGACCCCAGAACTAGAAACCCCGGGCCATCCCACTAGCAGCTTTGGCCTCCATATTGCTCTCATTTCAAGCAGATCTGCTTTTCTGCATGTTTGTCTGTGTGTCTGCGTTGTGTGTGATTTTCATGGAAAAATAAAATGCAAATGCACTCATCACAAA

SEQ ID NO: 3

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGGTACCGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGGTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTACCACCATGGGCTTCGTGAGACAGATACAGCTTTTGCTCTGGAAGAACTGGACCCTGCGGAAAAGGCAAAAGATTCGCTTTGTGGTGGAACTCGTGTGGCCTTTATCTTTATTTCTGGTCTTGATCTGGTTAAGGAATGCCAACCCGCTCTACAGCCATCATGAATGCCATTTCCCCAACAAGGCGATGCCCTCAGCAGGAATGCTGCCGTGGCTCCAGGGGATCTTCTGCAATGTGAACAATCCCTGTTTTCAAAGCCCCACCCCAGGAGAATCTCCTGGAATTGTGTCAAACTATAACAACTCCATCTTGGCAAGGGTATATCGAGATTTTCAAGAACTCCTCATGAATGCACCAGAGAGCCAGCACCTTGGCCGTATTTGGACAGAGCTACACATCTTGTCCCAATTCATGGACACCCTCCGGACTCACCCGGAGAGAATTGCAGGAAGAGGAATACGAATAAGGGATATCTTGAAAGATGAAGAAACACTGACACTATTTCTCATTAAAAACATCGGCCTGTCTGACTCAGTGGTCTACCTTCTGATCAACTCTCAAGTCCGTCCAGAGCAGTTCGCTCATGGAGTCCCGGACCTGGCGCTGAAGGACATCGCCTGCAGCGAGGCCCTCCTGGAGCGCTTCATCATCTTCAGCCAGAGACGCGGGGCAAAGACGGTGCGCTATGCCCTGTGCTCCCTCTCCCAGGGCACCCTACAGTGGATAGAAGACACTCTGTATGCCAACGTGGACTTCTTCAAGCTCTTCCGTGTGCTTCCCACACTCCTAGACAGCCGTTCTCAAGGTATCAATCTGAGATCTTGGGGAGGAATATTATCTGATATGTCACCAAGAATTCAAGAGTTTATCCATCGGCCGAGTATGCAGGACTTGCTGTGGGTGACCAGGCCCCTCATGCAGAATGGTGGTCCAGAGACCTTTACAAAGCTGATGGGCATCCTGTCTGACCTCCTGTGTGGCTACCCCGAGGGAGGTGGCTCTCGGGTGCTCTCCTTCAACTGGTATGAAGACAATAACTATAAGGCCTTTCTGGGGATTGACTCCACAAGGAAGGATCCTATCTATTCTTATGACAGAAGAACAACATCCTTTTGTAATGCATTGATCCAGAGCCTGGAGTCAAATCCTTTAACCAAAATCGCTTGGAGGGCGGCAAAGCCTTTGCTGATGGGAAAAATCCTGTACACTCCTGATTCACCTGCAGCACGAAGGATACTGAAGAATGCCAACTCAACTTTTGAAGAACTGGAACACGTTAGGAAGTTGGTCAAAGCCTGGGAAGAAGTAGGGCCCCAGATCTGGTACTTCTTTGACAACAGCACACAGATGAACATGATCAGAGATACCCTGGGGAACCCAACAGTAAAAGACTTTTTGAATAGGCAGCTTGGTGAAGAAGGTATTACTGCTGAAGCCATCCTAAACTTCCTCTACAAGGGCCCTCGGGAAAGCCAGGCTGACGACATGGCCAACTTCGACTGGAGGGACATATTTAACATCACTGATCGCACCCTCCGCCTTGTCAATCAATACCTGGAGTGCTTGGTCCTGGATAAGTTTGAAAGCTACAATGATGAAACTCAGCTCACCCAACGTGCCCTCTCTCTACTGGAGGAAAACATGTTCTGGGCCGGAGTGGTATTCCCTGACATGTATCCCTGGACCAGCTCTCTACCACCCCACGTGAAGTATAAGATCCGAATGGACATAGACGTGGTGGAGAAAACCAATAAGATTAAAGACAGGTATTGGGATTCTGGTCCCAGAGCTGATCCCGTGGAAGATTTCCGGTACATCTGGGGCGGGTTTGCCTATCTGCAGGACATGGTTGAACAGGGGATCACAAGGAGCCAGGTGCAGGCGGAGGCTCCAGTTGGAATCTACCTCCAGCAGATGCCCTACCCCTGCTTCGTGGACGATTCTTTCATGATCATCCTGAACCGCTGTTTCCCTATCTTCATGGTGCTGGCATGGATCTACTCTGTCTCCATGACTGTGAAGAGCATCGTCTTGGAGAAGGAGTTGCGACTGAAGGAGACCTTGAAAAATCAGGGTGTCTCCAATGCAGTGATTTGGTGTACCTGGTTCCTGGACAGCTTCTCCATCATGTCGATGAGCATCTTCCTCCTGACGATATTCATCATGCATGGAAGAATCCTACATTACAGCGACCCATTCATCCTCTTCCTGTTCTTGTTGGCTTTCTCCACTGCCACCATCATGCTGTGCTTTCTGCTCAGCACCTTCTTCTCCAAGGCCAGTCTGGCAGCAGCCTGTAGTGGTGTCATCTATTTCACCCTCTACCTGCCACACATCCTGTGCTTCGCCTGGCAGGACCGCATGACCGCTGAGCTGAAGAAGGCTGTGAGCTTACTGTCTCCGGTGGCATTTGGATTTGGCACTGAGTACCTGGTTCGCTTTGAAGAGCAAGGCCTGGGGCTGCAGTGGAGCAACATCGGGAACAGTCCCACGGAAGGGGACGAATTCAGCTTCCTGCTGTCCATGCAGATGATGCTCCTTGATGCTGCTGTCTATGGCTTACTCGCTTGGTACCTTGATCAGGTGTTTCCAGGAGACTATGGAACCCCACTTCCTTGGTACTTTCTTCTACAAGAGTCGTATTGGCTTGGCGGTGAAGGGTGTTCAACCAGAGAAGAAAGAGCCCTGGAAAAGACCGAGCCCCTAACAGAGGAAACGGAGGATCCAGAGCACCCAGAAGGAATACACGACTCCTTCTTTGAACGTGAGCATCCAGGGTGGGTTCCTGGGGTATGCGTGAAGAATCTGGTAAAGATTTTTGAGCCCTGTGGCCGGCCAGCTGTGGACCGTCTGAACATCACCTTCTACGAGAACCAGATCACCGCATTCCTGGGCCACAATGGAGCTGGGAAAACCACCACCTTGTCCATCCTGACGGGTCTGTTGCCACCAACCTCTGGGACTGTGCTCGTTGGGGGAAGGGACATTGAAACCAGCCTGGATGCAGTCCGGCAGAGCCTTGGCATGTGTCCACAGCACAACATCCTGTTCCACCACCTCACGGTGGCTGAGCACATGCTGTTCTATGCCCAGCTGAAAGGAAAGTCCCAGGAGGAGGCCCAGCTGGAGATGGAAGCCATGTTGGAGGACACAGGCCTCCACCACAAGCGGAATGAAGAGGCTCAGGACCTATCAGGTGGCATGCAGAGAAAGCTGTCGGTTGCCATTGCCTTTGTGGGAGATGCCAAGGTGGTGATTCTGGACGAACCCACCTCTGGGGTGGACCCTTACTCGAGACGCTCAATCTGGGATCTGCTCCTGAAGTATCGCTCAGGCAGAACCATCATCATGTCCACTCACCACATGGACGAGGCCGACCTCCTTGGGGACCGCATTGCCATCATTGCCCAGGGAAGGCTCTACTGCTCAGGCACCCCACTCTTCCTGAAGAACTGCTTTGGCACAGGCTTGTACTTAACCTTGGTGCGCAAGATGAAAAACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCCATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

SEQ ID NO: 4

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATAACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCCAAATAAGAACTTCAAGCACAGAGCATATGCCAGCCTTTTCAGAGAGCTGGAGGAGACGCTGGCTGACCTTGGTCTCAGCAGTTTTGGAATTTCTGACACTCCCCTGGAAGAGATTTTTCTGAAGGTCACGGAGGATTCTGATTCAGGACCTCTGTTTGCGGGTGGCGCTCAGCAGAAAAGAGAAAACGTCAACCCCCGACACCCCTGCTTGGGTCCCAGAGAGAAGGCTGGACAGACACCCCAGGACTCCAATGTCTGCTCCCCAGGGGCGCCGGCTGCTCACCCAGAGGGCCAGCCTCCCCCAGAGCCAGAGTGCCCAGGCCCGCAGCTCAACACGGGGACACAGCTGGTCCTCCAGCATGTGCAGGCGCTGCTGGTCAAGAGATTCCAACACACCATCCGCAGCCACAAGGACTTCCTGGCGCAGATCGTGCTCCCGGCTACCTTTGTGTTTTTGGCTCTGATGCTTTCTATTGTTATCCCTCCTTTTGGCGAATACCCCGCTTTGACCCTTCACCCCTGGATATATGGGCAGCAGTACACCTTCTTCAGCATGGATGAACCAGGCAGTGAGCAGTTCACGGTACTTGCAGACGTCCTCCTGAATAAGCCAGGCTTTGGCAACCGCTGCCTGAAGGAAGGGTGGCTTCCGGAGTACCCCTGTGGCAACTCAACACCCTGGAAGACTCCTTCTGTGTCCCCAAACATCACCCAGCTGTTCCAGAAGCAGAAATGGACACAGGTCAACCCTTCACCATCCTGCAGGTGCAGCACCAGGGAGAAGCTCACCATGCTGCCAGAGTGCCCCGAGGGTGCCGGGGGCCTCCCGCCCCCCCAGAGAACACAGCGCAGCACGGAAATTCTACAAGACCTGACGGACAGGAACATCTCCGACTTCTTGGTAAAAACGTATCCTGCTCTTATAAGAAGCAGCTTAAAGAGCAAATTCTGGGTCAATGAACAGAGGTATGGAGGAATTTCCATTGGAGGAAAGCTCCCAGTCGTCCCCATCACGGGGGAAGCACTTGTTGGGTTTTTAAGCGACCTTGGCCGGATCATGAATGTGAGCGGGGGCCCTATCACTAGAGAGGCCTCTAAAGAAATACCTGATTTCCTTAAACATCTAGAAACTGAAGACAACATTAAGGTGTGGTTTAATAACAAAGGCTGGCATGCCCTGGTCAGCTTTCTCAATGTGGCCCACAACGCCATCTTACGGGCCAGCCTGCCTAAGGACAGGAGCCCCGAGGAGTATGGAATCACCGTCATTAGCCAACCCCTGAACCTGACCAAGGAGCAGCTCTCAGAGATTACAGTGCTGACCACTTCAGTGGATGCTGTGGTTGCCATCTGCGTGATTTTCTCCATGTCCTTCGTCCCAGCCAGCTTTGTCCTTTATTTGATCCAGGAGCGGGTGAACAAATCCAAGCACCTCCAGTTTATCAGTGGAGTGAGCCCCACCACCTACTGGGTAACCAACTTCCTCTGGGACATCATGAATTATTCCGTGAGTGCTGGGCTGGTGGTGGGCATCTTCATCGGGTTTCAGAAGAAAGCCTACACTTCTCCAGAAAACCTTCCTGCCCTTGTGGCACTGCTCCTGCTGTATGGATGGGCGGTCATTCCCATGATGTACCCAGCATCCTTCCTGTTTGATGTCCCCAGCACAGCCTATGTGGCTTTATCTTGTGCTAATCTGTTCATCGGCATCAACAGCAGTGCTATTACCTTCATCTTGGAATTATTTGAGAATAACCGGACGCTGCTCAGGTTCAACGCCGTGCTGAGGAAGCTGCTCATTGTCTTCCCCCACTTCTGCCTGGGCCGGGGCCTCATTGACCTTGCACTGAGCCAGGCTGTGACAGATGTCTATGCCCGGTTTGGTGAGGAGCACTCTGCAAATCCGTTCCACTGGGACCTGATTGGGAAGAACCTGTTTGCCATGGTGGTGGAAGGGGTGGTGTACTTCCTCCTGACCCTGCTGGTCCAGCGCCACTTCTTCCTCTCCCAATGGATTGCCGAGCCCACTAAGGAGCCCATTGTTGATGAAGATGATGATGTGGCTGAAGAAAGACAAAGAATTATTACTGGTGGAAATAAAACTGACATCTTAAGGCTACATGAACTAACCAAGATTTATCCAGGCACCTCCAGCCCAGCAGTGGACAGGCTGTGTGTCGGAGTTCGCCCTGGAGAGTGCTTTGGCCTCCTGGGAGTGAATGGTGCCGGCAAAACAACCACATTCAAGATGCTCACTGGGGACACCACAGTGACCTCAGGGGATGCCACCGTAGCAGGCAAGAGTATTTTAACCAATATTTCTGAAGTCCATCAAAATATGGGCTACTGTCCTCAGTTTGATGCAATCGATGAGCTGCTCACAGGACGAGAACATCTTTACCTTTATGCCCGGCTTCGAGGTGTACCAGCAGAAGAAATCGAAAAGGTTGCAAACTGGAGTATTAAGAGCCTGGGCCTGACTGTCTACGCCGACTGCCTGGCTGGCACGTACAGTGGGGGCAACAAGCGGAAACTCTCCACAGCCATCGCACTCATTGGCTGCCCACCGCTGGTGCTGCTGGATGAGCCCACCACAGGGATGGACCCCCAGGCACGCCGCATGCTGTGGAACGTCATCGTGAGCATCATCAGAGAAGGGAGGGCTGTGGTCCTCACATCCCACAGCATGGAAGAATGTGAGGCACTGTGTACCCGGCTGGCCATCATGGTAAAGGGCGCCTTTCGATGTATGGGCACCATTCAGCATCTCAAGTCCAAATTTGGAGATGGCTATATCGTCACAATGAAGATCAAATCCCCGAAGGACGACCTGCTTCCTGACCTGAACCCTGTGGAGCAGTTCTTCCAGGGGAACTTCCCAGGCAGTGTGCAGAGGGAGAGGCACTACAACATGCTCCAGTTCCAGGTCTCCTCCTCCTCCCTGGCGAGGATCTTCCAGCTCCTCCTCTCCCACAAGGACAGCCTGCTCATCGAGGAGTACTCAGTCACACAGACCACACTGGACCAGGTGTTTGTAAATTTTGCTAAACAGCAGACTGAAAGTCATGACCTCCCTCTGCACCCTCGAGCTGCTGGAGCCAGTCGACAAGCCCAGGACTGAAAGCTTATCGATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCATGCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

SEQ ID NO: 5

GGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGG

SEQ ID NO: 6

GTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTACCACCATGG

SEQ ID NO: 7

ATCGATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCC

SEQ ID NO: 8

CGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGG

SEQ ID NO: 9

GGTACCGGGCCCCAGAAGCCTGGTGGTTGTTTGTCCTTCTCAGGGGAAAAGTGAGGCGGCCCCTTGGAGGAAGGGGCCGGGCAGAATGATCTAATCGGATTCCAAGCAGCTCAGGGGATTGTCTTTTTCTAGCACCTTCTTGCCACTCCTAAGCGTCCTCCGTGACCCCGGCTGGGATTTAGCCTGGTGCTGTGTCAGCCCCGGGTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTACCACCATGGGCTTCGTGAGACAGATACAGCTTTTGCTCTGGAAGAACTGGACCCTGCGGAAAAGGCAAAAGATTCGCTTTGTGGTGGAACTCGTGTGGCCTTTATCTTTATTTCTGGTCTTGATCTGGTTAAGGAATGCCAACCCGCTCTACAGCCATCATGAATGCCATTTCCCCAACAAGGCGATGCCCTCAGCAGGAATGCTGCCGTGGCTCCAGGGGATCTTCTGCAATGTGAACAATCCCTGTTTTCAAAGCCCCACCCCAGGAGAATCTCCTGGAATTGTGTCAAACTATAACAACTCCATCTTGGCAAGGGTATATCGAGATTTTCAAGAACTCCTCATGAATGCACCAGAGAGCCAGCACCTTGGCCGTATTTGGACAGAGCTACACATCTTGTCCCAATTCATGGACACCCTCCGGACTCACCCGGAGAGAATTGCAGGAAGAGGAATACGAATAAGGGATATCTTGAAAGATGAAGAAACACTGACACTATTTCTCATTAAAAACATCGGCCTGTCTGACTCAGTGGTCTACCTTCTGATCAACTCTCAAGTCCGTCCAGAGCAGTTCGCTCATGGAGTCCCGGACCTGGCGCTGAAGGACATCGCCTGCAGCGAGGCCCTCCTGGAGCGCTTCATCATCTTCAGCCAGAGACGCGGGGCAAAGACGGTGCGCTATGCCCTGTGCTCCCTCTCCCAGGGCACCCTACAGTGGATAGAAGACACTCTGTATGCCAACGTGGACTTCTTCAAGCTCTTCCGTGTGCTTCCCACACTCCTAGACAGCCGTTCTCAAGGTATCAATCTGAGATCTTGGGGAGGAATATTATCTGATATGTCACCAAGAATTCAAGAGTTTATCCATCGGCCGAGTATGCAGGACTTGCTGTGGGTGACCAGGCCCCTCATGCAGAATGGTGGTCCAGAGACCTTTACAAAGCTGATGGGCATCCTGTCTGACCTCCTGTGTGGCTACCCCGAGGGAGGTGGCTCTCGGGTGCTCTCCTTCAACTGGTATGAAGACAATAACTATAAGGCCTTTCTGGGGATTGACTCCACAAGGAAGGATCCTATCTATTCTTATGACAGAAGAACAACATCCTTTTGTAATGCATTGATCCAGAGCCTGGAGTCAAATCCTTTAACCAAAATCGCTTGGAGGGCGGCAAAGCCTTTGCTGATGGGAAAAATCCTGTACACTCCTGATTCACCTGCAGCACGAAGGATACTGAAGAATGCCAACTCAACTTTTGAAGAACTGGAACACGTTAGGAAGTTGGTCAAAGCCTGGGAAGAAGTAGGGCCCCAGATCTGGTACTTCTTTGACAACAGCACACAGATGAACATGATCAGAGATACCCTGGGGAACCCAACAGTAAAAGACTTTTTGAATAGGCAGCTTGGTGAAGAAGGTATTACTGCTGAAGCCATCCTAAACTTCCTCTACAAGGGCCCTCGGGAAAGCCAGGCTGACGACATGGCCAACTTCGACTGGAGGGACATATTTAACATCACTGATCGCACCCTCCGCCTTGTCAATCAATACCTGGAGTGCTTGGTCCTGGATAAGTTTGAAAGCTACAATGATGAAACTCAGCTCACCCAACGTGCCCTCTCTCTACTGGAGGAAAACATGTTCTGGGCCGGAGTGGTATTCCCTGACATGTATCCCTGGACCAGCTCTCTACCACCCCACGTGAAGTATAAGATCCGAATGGACATAGACGTGGTGGAGAAAACCAATAAGATTAAAGACAGGTATTGGGATTCTGGTCCCAGAGCTGATCCCGTGGAAGATTTCCGGTACATCTGGGGCGGGTTTGCCTATCTGCAGGACATGGTTGAACAGGGGATCACAAGGAGCCAGGTGCAGGCGGAGGCTCCAGTTGGAATCTACCTCCAGCAGATGCCCTACCCCTGCTTCGTGGACGATTCTTTCATGATCATCCTGAACCGCTGTTTCCCTATCTTCATGGTGCTGGCATGGATCTACTCTGTCTCCATGACTGTGAAGAGCATCGTCTTGGAGAAGGAGTTGCGACTGAAGGAGACCTTGAAAAATCAGGGTGTCTCCAATGCAGTGATTTGGTGTACCTGGTTCCTGGACAGCTTCTCCATCATGTCGATGAGCATCTTCCTCCTGACGATATTCATCATGCATGGAAGAATCCTACATTACAGCGACCCATTCATCCTCTTCCTGTTCTTGTTGGCTTTCTCCACTGCCACCATCATGCTGTGCTTTCTGCTCAGCACCTTCTTCTCCAAGGCCAGTCTGGCAGCAGCCTGTAGTGGTGTCATCTATTTCACCCTCTACCTGCCACACATCCTGTGCTTCGCCTGGCAGGACCGCATGACCGCTGAGCTGAAGAAGGCTGTGAGCTTACTGTCTCCGGTGGCATTTGGATTTGGCACTGAGTACCTGGTTCGCTTTGAAGAGCAAGGCCTGGGGCTGCAGTGGAGCAACATCGGGAACAGTCCCACGGAAGGGGACGAATTCAGCTTCCTGCTGTCCATGCAGATGATGCTCCTTGATGCTGCTGTCTATGGCTTACTCGCTTGGTACCTTGATCAGGTGTTTCCAGGAGACTATGGAACCCCACTTCCTTGGTACTTTCTTCTACAAGAGTCGTATTGGCTTGGCGGTGAAGGGTGTTCAACCAGAGAAGAAAGAGCCCTGGAAAAGACCGAGCCCCTAACAGAGGAAACGGAGGATCCAGAGCACCCAGAAGGAATACACGACTCCTTCTTTGAACGTGAGCATCCAGGGTGGGTTCCTGGGGTATGCGTGAAGAATCTGGTAAAGATTTTTGAGCCCTGTGGCCGGCCAGCTGTGGACCGTCTGAACATCACCTTCTACGAGAACCAGATCACCGCATTCCTGGGCCACAATGGAGCTGGGAAAACCACCACCTTGTCCATCCTGACGGGTCTGTTGCCACCAACCTCTGGGACTGTGCTCGTTGGGGGAAGGGACATTGAAACCAGCCTGGATGCAGTCCGGCAGAGCCTTGGCATGTGTCCACAGCACAACATCCTGTTCCACCACCTCACGGTGGCTGAGCACATGCTGTTCTATGCCCAGCTGAAAGGAAAGTCCCAGGAGGAGGCCCAGCTGGAGATGGAAGCCATGTTGGAGGACACAGGCCTCCACCACAAGCGGAATGAAGAGGCTCAGGACCTATCAGGTGGCATGCAGAGAAAGCTGTCGGTTGCCATTGCCTTTGTGGGAGATGCCAAGGTGGTGATTCTGGACGAACCCACCTCTGGGGTGGACCCTTACTCGAGACGCTCAATCTGGGATCTGCTCCTGAAGTATCGCTCAGGCAGAACCATCATCATGTCCACTCACCACATGGACGAGGCCGACCTCCTTGGGGACCGCATTGCCATCATTGCCCAGGGAAGGCTCTACTGCTCAGGCACCCCACTCTTCCTGAAGAACTGCTTTGGCACAGGCTTGTACTTAACCTTGGTGCGCAAGATGAAAAACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCC

SEQ ID NO: 10

ACATCCAGAGCCAAAGGAAAGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCACGTCGATGACCTAACTCCAGAACAAGTCCTGGATGGGGATGTAAATGAGCTGATGGATGTAGTTCTCCACCATGTTCCAGAGGCAAAGCTGGTGGAGTGCATTGGTCAAGAACTTATCTTCCTTCTTCCAAATAAGAACTTCAAGCACAGAGCATATGCCAGCCTTTTCAGAGAGCTGGAGGAGACGCTGGCTGACCTTGGTCTCAGCAGTTTTGGAATTTCTGACACTCCCCTGGAAGAGATTTTTCTGAAGGTCACGGAGGATTCTGATTCAGGACCTCTGTTTGCGGGTGGCGCTCAGCAGAAAAGAGAAAACGTCAACCCCCGACACCCCTGCTTGGGTCCCAGAGAGAAGGCTGGACAGACACCCCAGGACTCCAATGTCTGCTCCCCAGGGGCGCCGGCTGCTCACCCAGAGGGCCAGCCTCCCCCAGAGCCAGAGTGCCCAGGCCCGCAGCTCAACACGGGGACACAGCTGGTCCTCCAGCATGTGCAGGCGCTGCTGGTCAAGAGATTCCAACACACCATCCGCAGCCACAAGGACTTCCTGGCGCAGATCGTGCTCCCGGCTACCTTTGTGTTTTTGGCTCTGATGCTTTCTATTGTTATCCCTCCTTTTGGCGAATACCCCGCTTTGACCCTTCACCCCTGGATATATGGGCAGCAGTACACCTTCTTCAGCATGGATGAACCAGGCAGTGAGCAGTTCACGGTACTTGCAGACGTCCTCCTGAATAAGCCAGGCTTTGGCAACCGCTGCCTGAAGGAAGGGTGGCTTCCGGAGTACCCCTGTGGCAACTCAACACCCTGGAAGACTCCTTCTGTGTCCCCAAACATCACCCAGCTGTTCCAGAAGCAGAAATGGACACAGGTCAACCCTTCACCATCCTGCAGGTGCAGCACCAGGGAGAAGCTCACCATGCTGCCAGAGTGCCCCGAGGGTGCCGGGGGCCTCCCGCCCCCCCAGAGAACACAGCGCAGCACGGAAATTCTACAAGACCTGACGGACAGGAACATCTCCGACTTCTTGGTAAAAACGTATCCTGCTCTTATAAGAAGCAGCTTAAAGAGCAAATTCTGGGTCAATGAACAGAGGTATGGAGGAATTTCCATTGGAGGAAAGCTCCCAGTCGTCCCCATCACGGGGGAAGCACTTGTTGGGTTTTTAAGCGACCTTGGCCGGATCATGAATGTGAGCGGGGGCCCTATCACTAGAGAGGCCTCTAAAGAAATACCTGATTTCCTTAAACATCTAGAAACTGAAGACAACATTAAGGTGTGGTTTAATAACAAAGGCTGGCATGCCCTGGTCAGCTTTCTCAATGTGGCCCACAACGCCATCTTACGGGCCAGCCTGCCTAAGGACAGGAGCCCCGAGGAGTATGGAATCACCGTCATTAGCCAACCCCTGAACCTGACCAAGGAGCAGCTCTCAGAGATTACAGTGCTGACCACTTCAGTGGATGCTGTGGTTGCCATCTGCGTGATTTTCTCCATGTCCTTCGTCCCAGCCAGCTTTGTCCTTTATTTGATCCAGGAGCGGGTGAACAAATCCAAGCACCTCCAGTTTATCAGTGGAGTGAGCCCCACCACCTACTGGGTAACCAACTTCCTCTGGGACATCATGAATTATTCCGTGAGTGCTGGGCTGGTGGTGGGCATCTTCATCGGGTTTCAGAAGAAAGCCTACACTTCTCCAGAAAACCTTCCTGCCCTTGTGGCACTGCTCCTGCTGTATGGATGGGCGGTCATTCCCATGATGTACCCAGCATCCTTCCTGTTTGATGTCCCCAGCACAGCCTATGTGGCTTTATCTTGTGCTAATCTGTTCATCGGCATCAACAGCAGTGCTATTACCTTCATCTTGGAATTATTTGAGAATAACCGGACGCTGCTCAGGTTCAACGCCGTGCTGAGGAAGCTGCTCATTGTCTTCCCCCACTTCTGCCTGGGCCGGGGCCTCATTGACCTTGCACTGAGCCAGGCTGTGACAGATGTCTATGCCCGGTTTGGTGAGGAGCACTCTGCAAATCCGTTCCACTGGGACCTGATTGGGAAGAACCTGTTTGCCATGGTGGTGGAAGGGGTGGTGTACTTCCTCCTGACCCTGCTGGTCCAGCGCCACTTCTTCCTCTCCCAATGGATTGCCGAGCCCACTAAGGAGCCCATTGTTGATGAAGATGATGATGTGGCTGAAGAAAGACAAAGAATTATTACTGGTGGAAATAAAACTGACATCTTAAGGCTACATGAACTAACCAAGATTTATCCAGGCACCTCCAGCCCAGCAGTGGACAGGCTGTGTGTCGGAGTTCGCCCTGGAGAGTGCTTTGGCCTCCTGGGAGTGAATGGTGCCGGCAAAACAACCACATTCAAGATGCTCACTGGGGACACCACAGTGACCTCAGGGGATGCCACCGTAGCAGGCAAGAGTATTTTAACCAATATTTCTGAAGTCCATCAAAATATGGGCTACTGTCCTCAGTTTGATGCAATCGATGAGCTGCTCACAGGACGAGAACATCTTTACCTTTATGCCCGGCTTCGAGGTGTACCAGCAGAAGAAATCGAAAAGGTTGCAAACTGGAGTATTAAGAGCCTGGGCCTGACTGTCTACGCCGACTGCCTGGCTGGCACGTACAGTGGGGGCAACAAGCGGAAACTCTCCACAGCCATCGCACTCATTGGCTGCCCACCGCTGGTGCTGCTGGATGAGCCCACCACAGGGATGGACCCCCAGGCACGCCGCATGCTGTGGAACGTCATCGTGAGCATCATCAGAGAAGGGAGGGCTGTGGTCCTCACATCCCACAGCATGGAAGAATGTGAGGCACTGTGTACCCGGCTGGCCATCATGGTAAAGGGCGCCTTTCGATGTATGGGCACCATTCAGCATCTCAAGTCCAAATTTGGAGATGGCTATATCGTCACAATGAAGATCAAATCCCCGAAGGACGACCTGCTTCCTGACCTGAACCCTGTGGAGCAGTTCTTCCAGGGGAACTTCCCAGGCAGTGTGCAGAGGGAGAGGCACTACAACATGCTCCAGTTCCAGGTCTCCTCCTCCTCCCTGGCGAGGATCTTCCAGCTCCTCCTCTCCCACAAGGACAGCCTGCTCATCGAGGAGTACTCAGTCACACAGACCACACTGGACCAGGTGTTTGTAAATTTTGCTAAACAGCAGACTGAAAGTCATGACCTCCCTCTGCACCCTCGAGCTGCTGGAGCCAGTCGACAAGCCCAGGACTGAAAGCTTATCGATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCATGCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGG

ПРИМЕРЫ

Пример 1. Получение вышележащего и нижележащего векторов AAV

Для получения указанного вектора AAV необходимы три плазмиды: pTransgene, pRepCap и pHelper. pTransgene содержит вышележащий или нижележащий трансген ABCA4, как подробно описано ниже (с подтверждением целостности ITR). pRepCap содержит гены rep и cap из генома AAV. Гены rep получают из генома AAV2, в то время как гены cap будут варьироваться в зависимости от требований к серотипу. pHelper содержит необходимые аденовирусные гены, необходимые для успешного получения AAV. Плазмиды комплексируют с полиэтиленимином (PEI) для получения тройной смеси для трансфекции, используемой для клеток HEK293T. Через три дня после трансфекции клетки собирают и лизируют. Лизат обрабатывают бензоназой и очищают перед нанесением на градиент йодиксанола, состоящий из фаз 15%, 25%, 40% и 60%. Образцы в градиенте центрифугируют при 59000 об./мин в течение 1 часа 30 минут, а затем отбирают фракцию 40%. Затем эту фазу AAV очищают и концентрируют с использованием фильтров Amicon Ultra 100K. После этой стадии получают 100-200 мкл очищенного AAV в PBS.

Пример 2. Структура примеров векторов AAV

Вышележащий вектор

Этот вектор содержит промотор, нетранслируемую область (UTR) и вышележащий сегмент CDS ABCA4 с ITR AAV2 на каждом конце трансгена (фигура 1). ABCA4 экспрессируют в фоторецепторных клетках сетчатки и, таким образом, включают промоторный элемент родопсинкиназы человека (GRK1). Конкретная последовательность промотора GRK1, содержащегося в вышележащем векторе, является такой, как описано Khani et al. (Investigative Ophthalmology и Visual Science, 48(9), 3954-3961, 2007), содержащей нуклеотиды -112-+87 гена GRK1 и используемой в доклинических исследованиях для генной терапии, направленной на фоторецепторные клетки.

После 199 нуклеотидов промотора GRK1 следует нетранслируемая область (UTR) из 186 нуклеотидов. Эту нуклеотидную последовательность выбирали из более крупной UTR (443 нуклеотидов), содержащейся в векторе REP1 для клинического исследования (MacLaren et al., 2014). В частности, выбранная последовательность включает фрагмент интрона 1 β-актина (CBA) Gallus gallus (с прогнозируемым донорным участком для сплайсинга), фрагмент интрона 2 β-глобина (RBG) Oryctolagus cuniculus (включая спрогнозированную точку ветвления и акцепторный участок для сплайсинга) и фрагмент экзона 3 β-глобина Oryctolagus cuniculus непосредственно перед консенсусной последовательностью Козак, что приводит к получению CDS ABCA4. Этот фрагмент UTR добавляют к исходному промоторному элементу GRK1 для повышения выхода трансляции (Rafiq et al., 1997; Chatterjee et al., 2009). Сам по себе промотор GRK1 демонстрирует очень хорошую экспрессию генов в фоторецепторных клетках, что позволяет предполагать отсутствие основных признаков ингибирования экспрессии.

Сравнение сетчаток Abca4^-/-, в которые инъецировали двойной вектор, показало, что значительно больше белка ABCA4 образовывалось в глазах, в случае которых вышележащий вектор содержал элемент GRK1.5'UTR, по сравнению с промоторным элементом GRK1 в отдельности (фигура 2).

После консенсусной последовательности Козак в вышележащем векторе следует CDS ABCA4 с нуклеотидами 1-3701 (105-3805 в референсном файле NCBI NM_000350). Конечные 208 нуклеотидов CDS ABCA4 образуют первые 208 нуклеотидов CDS, содержащихся в нижележащем векторе, и служат в качестве зоны перекрывания. Фрагмент кодирующей последовательности, содержащийся в вышележащем векторе, совпадает с референсной последовательностью NM_000350, за исключением замены основания в нуклеотиде 1536 (NM_000350, 1640) G>T. Оно является третьим основанием кодона, и его замена не приводит к изменению аминокислотной последовательности. CDS ABCA4 является укороченной в области экзона 25 с 3'-ITR ниже ее.

Нижележащий вектор

Этот вектор содержит нижележащий сегмент CDS ABCA4, посттранскрипционный чувствительный элемент вируса гепатита сурков (WPRE) и сигнал полиаденилирования бычьего гормона роста (поли-A bGH) с ITR AAV2 на каждом конце трансгена (фигура 1). CDS ABCA4 начинается ниже 5'-ITR в положении 3494 (NM_000350, 3598) и продолжается до стоп-кодона в положении 6822 (NM_000350, 6926). Первые 208 нуклеотидов CDS ABCA4 являются такими же, как и конечные 208 нуклеотидов CDS ABCA4, содержащихся в вышележащем векторе, и они служат в качестве зоны перекрывания между трансгенами. Фрагмент кодирующей последовательности, содержащийся в нижележащем векторе, совпадает с референсной последовательностью NM_000350, за исключением замены основания в нуклеотиде 5175 (NM_000350, 5279) G>A и 6069 (NM_000350, 6173) T>C. Эти замены расположены в третьем основании кодона и не приводят к изменению аминокислотной последовательности.

Участок рестрикции HindIII отделяет стоп-кодон CDS ABCA4 от WPRE. Этот элемент составляет 593 нуклеотидов в длину и соответствует WPRE с инактивированным антигеном X, содержащемуся в векторе REP1 для клинического исследования. Участок рестрикции SphI отделяет WPRE от поли-A-сигнала bGH, составляющего 269 нуклеотидов в длину и соответствующего поли-A-сигналу bGH, присутствующему в векторе REP1 для клинического исследования. 3'-ITR расположен ниже поли-A-сигнала.

Известно, что 5'-ITR AAV2 имеет промоторную активность, и с использованием WPRE и поли-A-сигнала bGH в нижележащем трансгене будут получать стабильные транскрипты из нерекомбинировавших нижележащих векторов. CDS ABCA4 дикого типа, содержащаяся в нижележащем трансгене, содержит множество кодонов AUG в рамке считывания, которые нельзя заменить другими кодонами без изменения аминокислотной последовательности. Это делает возможной трансляцию со стабильных транскриптов, что приводит к наличию укороченных пептидов ABCA4, определяемых посредством вестерн-блоттинга (фигура 4a). Начальную последовательность выбранной зоны перекрывания тщательно выбирают так, чтобы она включала кодон AUG не в рамке считывания в хорошем контексте (что касается потенциальной консенсусной последовательности Козак) перед кодоном AUG в рамке считывания в более слабом контексте (фигура 5a) для активации аппарата трансляции для инициации с использованием участка не в рамке считывания. Есть всего четыре кодона AUG не в рамке считывания в различных контекстах перед AUG в рамке считывания. Все из них будут приводить к трансляции до стоп-кодона в пределах 10 аминокислот. Наличие этих кодонов AUG не в рамке считывания может предотвращать трансляцию укороченных белков ABCA4 с нерекомбинировавших нижележащих трансгенов.

Пример 3. Оценка зон перекрывания

Оптимальную зону перекрывания определяли после оценок in vitro и in vivo шести вариантов перекрывания (фигуры 3a и 3b, соответственно). Их обозначают как A, B, C, D, E и F, и они представляют собой следующие зоны перекрывания (X соответствует отсутствию перекрывания): A. 1173 нуклеотидов (3259-4430); B. 506 нуклеотидов (3300-3805); C. 208 нуклеотидов (3598-3805); D. 99 нуклеотидов (3707-3805); E. 49 нуклеотидов (3757-3805) и F. 24 нуклеотида (3782-3805). Все нижележащие трансгены для зон перекрывания B-X спарены с одним и тем же вышележащим трансгеном. Варианты перекрывания B и C имели лучшие свойства, чем все другие варианты, или были схожи между собой, но по различным причинам выбирали версию C двойного вектора. Во-первых, по причине ограниченной продукции укороченного ABCA4 с нерекомбинировавших нижележащих трансгенов (фигура 4a). Нерекомбинировавшие нижележащие трансгены с вариантов C, D, E, F и X приводили к значительно сниженным уровням укороченного белка ABCA4, чем версии A или B. В контексте двойного вектора перекрывание C приводит к наименьшей доле укороченного ABCA4 по сравнению с полноразмерным ABCA4 (фигуры 4b и 4c). Это позволяет предполагать, что вариант перекрывания трансгена C не только ограничивает нежелательную экспрессию с нерекомбинировавших трансгенов, но также рекомбинирует с большей эффективностью, чем вариант перекрывания B. Дополнительное доказательство этого получали при сравнении различий кратного изменения транскрипта и кратного изменения белка между сетчатками ABCA4^-/-, в которые инъецировали варианты перекрывания C и B. С помощью праймеров к вышележащей части CDS ABCA4 (таким образом, определяя транскрипты нерекомбинировавших вышележащих трансгенов в дополнение к полноразмерным транскриптам ABCA4 из рекомбинировавших трансгенов) определяли очень высокие уровни транскриптов, присутствующих в сетчатках, в которые инъецировали двойные векторы с вариантами перекрывания B и C. Однако вариант перекрывания C приводил к достижению менее чем половины уровней транскрипта варианта перекрывания B, но в тоже время и к получению в 1,5 раза большего количества белка ABCA4 (фигура 4d). Учитывая, что обоим вариантам перекрывания соответствует один и тот же вышележащий вектор, и они отличаются только последовательностью нижележащего трансгена, предполагают, что зона перекрывания, выбранная для варианта перекрывания C, рекомбинирует с большей эффективностью, чем вариант перекрывания B.

Выбранная зона перекрывания имеет содержание GC-пар 52% и прогнозируемый уровень свободной энергии -19,60 ккал/моль, что приблизительно в три раза меньше значений для зоны перекрывания B в -55,60 ккал/моль (содержание GC-пар 53%), фигура 5b. Это снижение свободной энергии позволяет предполагать, что вторичную структуру, образованную нерекомбинировавшим вариантом перекрывания C, будет разрешить легче, чем в случае варианта перекрывания B, что, как прогнозируют авторы настоящего изобретения, сделает ее более доступной для взаимодействия с зоной перекрывания на противоположном трансгене.

Пример 4. Протоколы экспериментов

Фигура 2.

Мышам Abca4 ^-/- делали субретинальную инъекцию 2 мкл смеси двойных векторов (1:1), вводя 1E+9 копий генома каждого вектора на глаз. Энуклеацию глаза осуществляли через 6 недель после инъекции, иссекая нейросенсорную часть сетчатки из глазного яблока и лизируя ее в буфере RIPA. Ткань гомогенизировали и после центрифугирования выделяли супернатант. Супернатанты смешивали с денатурирующим буфером для внесения и анализировали с помощью 7,5% геля TGX в денатурирующих условиях. Белки переносили на мембрану PVDF и определяли ABCA4 с использованием поликлонального антитела кролика против ABCA4 (Abcam) и Gapdh с использованием моноклонального антитела мыши против GAPDH (Origene). Полосы визуализировали и анализировали с использованием системы визуализации LICOR. Уровни ABCA4 нормализовали по Gapdh для каждого образца, а затем представляли относительно глаз Abca4 ^-/- без инъекций.

Фигура 3a.

Клетки HEK293T использовали для засевания 6-луночных планшетов для культивирования в количестве 2E5 клеток на лунку. Через 24 часа отбирали одну лунку с клетками и осуществляли подсчет. Полученное количество использовали для определения соответствующего количества вектора для внесения в каждую лунку для достижения множественности заражения (MOI) 10000 на вектор. Удаляли среды для культивирования и добавляли AAV в 1 мл среды, несодержащей эмбриональную телячью сыворотку (FBS). Клетки инкубировали в течение одного часа при 37°C перед добавлением 1 мл среды, содержащей 20% FBS. Через 48 часа после трансдукции удаляли среду и добавляли свежую среду, содержащую 10% FBS. Клетки инкубировали в течение еще 48 часов, после чего снова меняли среду. Через 24 часа клетки собирали и трижды промывали холодным PBS с использованием щадящего цикла центрифугирования. После последней промывки удаляли PBS и замораживали клеточный осадок. Клеточный осадок размораживали на льду, а затем лизировали в буфере RIPA. Лизаты обрабатывали так же, как и в случае анализа вестерн-блоттинга образцов сетчатки, описанного выше.

Фигура 3b.

Как для фигуры 2.

Фигура 4a.

Клетки HEK293T использовали для засевания 6-луночных планшетов для культивирования в количестве 1E6 клеток на лунку. Через 24 часа смесь для трансфекции, содержащую 1 мкг плазмиды, комплексированной с реагентом для трансфекции LT1 (GeneFlow), наносили на клетки. Тестируемые плазмиды несли нижележащие трансгены, использованные при получении векторов AAV. Через 48 часов после трансфекции клетки промывали, собирали и оценивали посредством вестерн-блоттинга, как описано выше.

Фигура 4b.

Как для фигуры 2.

Фигура 4d.

Уровни белка ABCA4 получали посредством анализа вестерн-блоттинга, как описано для фигуры 2, и сравнивали кратное изменение в случае обработки двойными векторами с вариантами перекрывания C и B. Для сравнения уровней транскрипта получали образцы ткани в RNAlater (Ambion) и выделяли мРНК с использованием Dynabeads-oligodT mRNA DIRECT (Life Technologies). Синтез кДНК осуществляли с использованием 500 нг мРНК с использованием праймера oligodT и SuperScript III (Life Technologies). Образцы очищали с использованием центрифужных колонок для очистки продуктов ПЦР (QIAGEN) и элюировали в 50 мкл обработанной DEPC воды. Анализировали кДНК посредством qPCR вышележащей части CDS ABCA4. Уровни ABCA4 нормализовали по уровням актина и выражали относительно образцов Abca4 ^-/- без инъекции. Затем сравнивали кратное изменение уровней транскрипта ABCA4 в случае обработки двойными векторами с вариантами перекрывания C и B.

Пример 5. AAV-опосредованная доставка ABCA4 в фоторецепторы мышей Abca4^-/- с использованием стратегии перекрывающихся двойных векторов

Данные, представленные в этом примере, свидетельствуют о том, что экспрессия белка ABCA4 специфически локализовалась во внешних фоторецепторных сегментах в модели мыши Abca4^-/- после субретинальной инъекции системы перекрывающихся двойных векторов по изобретению.

Дизайн и получение трансгена:

Перекрывающиеся трансгены ABCA4 упаковывали в капсиды AAV8 Y733F. Вышележащий трансген содержал промотор родопсинкиназы человека (GRK1) и вышележащую часть кодирующей последовательности ABCA4 (CDS) между инвертированными концевыми повторами (ITR) AAV2. Нижележащий трансген содержал нижележащую часть CDS ABCA4, посттранскрипционный регуляторный элемент вируса гепатита сурков (WPRE) и поли-A-сигнал (pA). Вышележащий и нижележащий трансгены содержали область перекрывания CDS ABCA4.

Инъекции:

Мышам Abac4-/- в возрасте 4-5 недель делали субретинальную инъекцию 2 мкл, содержащих смесь 1:1 вышележащего и нижележащего векторов (1×10¹³ копий генома/мл). Через 6 недель после инъекции глаза собирали для иммуногистохимического анализа (IHC).

Иммуногистохимическое окрашивание:

Целые глазные яблоки с удаленными хрусталиками фиксировали в 4% параформальдегиде (PFA) в течение 20 минут, а затем инкубировали в 30% сахарозе в течение ночи при 4°C. Глаза замораживали в среде для заливки перед получением срезов. Срезы тканей сушили в течение ночи при комнатной температуре, а затем трижды промывали фосфатно-солевым буфером (PBS) в течение 5 минут. Образцы пермеабилизовали с использованием 0,2% Triton-X-100 в течение 20 минут, а затем трижды промывали PBS перед инкубацией с 10% сывороткой осла (DS), 1% бычьим сывороточным альбумином (BSA), 0,1% Triton-X-100 в течение одного часа. Антитела разводили 1/200 в 1% DS, 0,1% BSA, наносили на срезы и оставляли на два часа при комнатной температуре. Определение Abca4/ABCA4 осуществляли с использованием антитела козла против ABCA4 (AntibodiesOnline), активируемый гиперполяризацией управляемый циклическими нуклеотидами канал 1 (Hcn1) определяли с использованием антитела мыши против Hcn1 (Abcam) и родопсин определяли с использованием антитела мыши против 1D4 (Abcam). Срезы трижды промывали 0,05% Tween-20, а затем наносили вторичные антитела (разведенные 1/400) на один час в темноте. Срезы дважды промывали 0,05% Tween-20, затем инкубировали с красителем Хехст (1/1,000) в течение 15 минут. Срезы промывали PBS, затем оставляли сушиться. Среду для заливки против выгорания Diamond наносили на каждый срез и оставляли срезы на ночь перед визуализацией.

Результаты:

Экспрессия ABCA4 локализовалась во внешних сегментах фоторецепторных клеток.

На фигуре 7 показано окрашивание на Abca4/ABCA4 (зеленый) и Hcn1 (красный) в глазах дикого типа (WT) и Abca4^-/-. Глаза WT SVEV 129, глаза Abca4^-/- с инъекцией и без нее окрашивали на маркер внутренних сегментов фоторецепторов Hcn1 и Abca4/ABCA4. При анализе глаз WT и глаз Abca4^-/-, обработанных двойным вектором, выявляли специфическую локализацию Abca4/ABCA4 во внешних сегментах фоторецепторных клеток.

Колокализация ABCA4 и родопсина.

На фигуре 8 показано окрашивание Abca4/ABCA4 (зеленый) и родопсин (красный) во внешних сегментах фоторецепторных клеток в глазах дикого типа (WT) и Abca4^-/-. При анализе глаз WT и глаз Abca4^-/-, обработанных двойными векторами, выявляли колокализацию родопсина и Abca4/ABCA4 во внешних сегментах фоторецепторных клеток.

На фигуре 9 показано апикальное окрашивание RPE на Abca4/ABCA4 (зеленый) и родопсин (красный) в глазах дикого типа (WT) и Abca4^-/-. При анализе глаз WT и глаз Abca4^-/-, обработанных двойными векторами, выявляли колокализацию родопсина и Abca4/ ABCA4 в апикальных областях клеток RPE, как предполагают, происходящую от отшелушивающихся дисков внешних сегментов. В глазах Abca4^-/-, не обработанных двойными векторами, наблюдали только окрашивание на родопсин в апикальной области клеток RPE. На изображении A в рамке представлен профиль экспрессии в трансдуцированных клетках RPE, свидетельствующий о диффузном профиле окрашивания в отличие от окрашивания Abca4/ABCA4/rho. На изображении B подтверждено отсутствие экспрессии RPE при использовании промотора GRK1.

Выводы:

Оптимизированную систему перекрывающихся двойных векторов можно использовать для достижения экспрессии ABCA4 в фоторецепторных клетках, в которых он транспортируется в желаемые структуры внешних сегментов на уровне, определимом посредством IHC.

Пример 6. Оценка бисретиноидов/A2E у мышей Abca4^-/-, которым вводили двойные векторы

В модели Abca4^-/- мыши наблюдают повышение уровней бисретиноидов и A2E с возрастом по сравнению с мышами дикого типа. Однако в отличие от людей повышение бисретиноидов не достигает уровня, необходимого, чтобы вызвать какую-либо значительную дегенерацию сетчатки. Это позволяет предполагать, что в глазу мышей с недостаточностью Abca4 могут существовать другие компенсаторные механизмы. В сетчатке дикого типа Abca4 облегчает движение ретиналя из мембран дисков внешних сегментов фоторецепторных клеток для рециклинга. В случае отсутствия функционального Abca4, как в модели мыши Abca4^-/-, ретиналь сохраняется в мембранах дисков внешних сегментов, где он подвергается биохимическим изменениям в различные формы бисретиноидов (фигура 11). Фоторецепторные клетки постоянно генерируют новые диски внешних сегментов, и при этом происходит движение более старых, более дистальных дисков в сторону клеток RPE, которые затем подвергают их деградации посредством фагоцитоза. У мыши с недостаточностью Abca4 фагоцитируемые диски содержат повышенные уровни бисретиноидов. Далее в клетках RPE они преобразуются в изоформы A2E, накопление которых приводит к образованию липофусцина. Таким образом, хотя накопления бисретиноидов у мыши с недостаточностью Abca4 недостаточно, чтобы вызвать дегенерацию сетчатки, несмотря на это можно количественно анализировать образующиеся повышенные уровни выше базового уровня и, таким образом, получать биомаркер функции Abca4.

Бисретиноидные соединения и A2E можно точно измерять посредством высокоэффективной жидкостной хроматографии (ВЭЖХ). Таким образом, мерой терапевтической эффективности у мышей, подвергнутых генной терапии ABCA4, будет достижение снижения уровней бисретиноидов и A2E по сравнению с необработанными глазами. Однако есть два фактора, которые необходимо учитывать. В первом случае, для клинического применения необходимо использовать кодирующую последовательность ABCA4 человека и промотор фоторецепторов человека, и маловероятно, что это будет так же эффективно у мышей. Кроме того, измерения посредством ВЭЖХ осуществляют на целом глазу, а не только области, подвергнутой воздействию вектора при субретинальной инъекции. Таким образом, маловероятно, что при общем снижении бисретиноидов у мышей с недостаточностью Abca4 будут достигнуты уровни дикого типа. Вторым фактором является субретинальная инъекция, что может приводить к повреждению дисков внешних сегментов. Т.к. эти структуры богаты бисретиноидами, эффекты генной терапии ABCA4 необходимо сравнивать со схожей ложной инъекцией. Теоретически, для этого необходимо использовать противоположный глаз той же мыши для контроля размера глаза и воздействия света в течение жизни, что также может влиять на накопление бисретиноидов.

По этой причине авторы настоящего изобретения сравнивали уровни бисретиноидов/A2E в когорте мышей Abca4^-/-, которым делали ложную инъекцию в один глаз и схожую лечебную инъекцию в противоположный глаз. В каждый глаз с ложной инъекцией вводили вышележащий вектор с той же общей дозой AAV, которую вводили в парный глаз, в который вводили двойные векторы. Таким образом, в оба глаза каждой мыши делали субретинальную инъекцию 2 мкл, получая пузырь, содержащий 2×10¹⁰ геномных частиц вектора AAV.

Всего 13 нокаутным по Abca4 мышам в возрасте 4-5 недель делали инъекцию и собирали глаза через 3 месяца после инъекции. Проводили адаптацию мышей в темноте в течение 16 часов перед получением ткани, которое проводили в темноте при тусклом красном освещении. Затем целые глаза анонимизировали и в замороженном виде доставляли в Jules Stein Eye Institute для анализа бисретиноидов/A2E с использованием описанного анализа ВЭЖХ. Каждый целый глаз отбирали и обрабатывали без диссекции. После оценки посредством ВЭЖХ всех 26 глаз раскрывали их обозначения и сравнивали уровни бисретиноидов/A2E в каждом обработанном глазу с парным глазом, в который делали ложную инъекцию. С помощью двухстороннего ANOVA определяли, что лечение имело достоверный эффект в отношении уровней бисретиноидов/A2E с наблюдаемым снижением в глазах, в которые вводили двойные векторы, по сравнением с парными глазами, в которые делали ложную инъекцию (p=0,0171), фигура 12.

Все публикации, упомянутые в представленном выше описании, включены в настоящее описание в качестве ссылок. Специалистам в этой области будут очевидны различные модификации и изменения описанных продуктов, систем, применения и способов по изобретению без отклонения от объема и сущности изобретения. Хотя изобретение описано в контексте конкретных предпочтительных вариантов осуществления, следует понимать, что изобретение не должно быть ограничено такими конкретными вариантами осуществления. Фактически, различные модификации описанных способов осуществления изобретения, очевидные специалистам в биохимии, биотехнологии или родственных областях, предназначены для включения в объем формулы изобретения.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Oxford University Innovation Limited

<120> ВЕКТОРНАЯ СИСТЕМА НА ОСНОВЕ АДЕНОАССОЦИИРОВАННОГО ВИРУСА

<130> P107080PCT

<150> GB 1610448.1

<151> 2016-06-15

<150> GB 1707261.2

<151> 2017-05-05

<160> 11

<170> PatentIn version 3.5

<210> 1

<211> 7326

<212> ДНК

<213> Homo sapiens

<400> 1

aggacacagc gtccggagcc agaggcgctc ttaacggcgt ttatgtcctt tgctgtctga 60

ggggcctcag ctctgaccaa tctggtcttc gtgtggtcat tagcatgggc ttcgtgagac 120

agatacagct tttgctctgg aagaactgga ccctgcggaa aaggcaaaag attcgctttg 180

tggtggaact cgtgtggcct ttatctttat ttctggtctt gatctggtta aggaatgcca 240

acccgctcta cagccatcat gaatgccatt tccccaacaa ggcgatgccc tcagcaggaa 300

tgctgccgtg gctccagggg atcttctgca atgtgaacaa tccctgtttt caaagcccca 360

ccccaggaga atctcctgga attgtgtcaa actataacaa ctccatcttg gcaagggtat 420

atcgagattt tcaagaactc ctcatgaatg caccagagag ccagcacctt ggccgtattt 480

ggacagagct acacatcttg tcccaattca tggacaccct ccggactcac ccggagagaa 540

ttgcaggaag aggaatacga ataagggata tcttgaaaga tgaagaaaca ctgacactat 600

ttctcattaa aaacatcggc ctgtctgact cagtggtcta ccttctgatc aactctcaag 660

tccgtccaga gcagttcgct catggagtcc cggacctggc gctgaaggac atcgcctgca 720

gcgaggccct cctggagcgc ttcatcatct tcagccagag acgcggggca aagacggtgc 780

gctatgccct gtgctccctc tcccagggca ccctacagtg gatagaagac actctgtatg 840

ccaacgtgga cttcttcaag ctcttccgtg tgcttcccac actcctagac agccgttctc 900

aaggtatcaa tctgagatct tggggaggaa tattatctga tatgtcacca agaattcaag 960

agtttatcca tcggccgagt atgcaggact tgctgtgggt gaccaggccc ctcatgcaga 1020

atggtggtcc agagaccttt acaaagctga tgggcatcct gtctgacctc ctgtgtggct 1080

accccgaggg aggtggctct cgggtgctct ccttcaactg gtatgaagac aataactata 1140

aggcctttct ggggattgac tccacaagga aggatcctat ctattcttat gacagaagaa 1200

caacatcctt ttgtaatgca ttgatccaga gcctggagtc aaatccttta accaaaatcg 1260

cttggagggc ggcaaagcct ttgctgatgg gaaaaatcct gtacactcct gattcacctg 1320

cagcacgaag gatactgaag aatgccaact caacttttga agaactggaa cacgttagga 1380

agttggtcaa agcctgggaa gaagtagggc cccagatctg gtacttcttt gacaacagca 1440

cacagatgaa catgatcaga gataccctgg ggaacccaac agtaaaagac tttttgaata 1500

ggcagcttgg tgaagaaggt attactgctg aagccatcct aaacttcctc tacaagggcc 1560

ctcgggaaag ccaggctgac gacatggcca acttcgactg gagggacata tttaacatca 1620

ctgatcgcac cctccgcctg gtcaatcaat acctggagtg cttggtcctg gataagtttg 1680

aaagctacaa tgatgaaact cagctcaccc aacgtgccct ctctctactg gaggaaaaca 1740

tgttctgggc cggagtggta ttccctgaca tgtatccctg gaccagctct ctaccacccc 1800

acgtgaagta taagatccga atggacatag acgtggtgga gaaaaccaat aagattaaag 1860

acaggtattg ggattctggt cccagagctg atcccgtgga agatttccgg tacatctggg 1920

gcgggtttgc ctatctgcag gacatggttg aacaggggat cacaaggagc caggtgcagg 1980

cggaggctcc agttggaatc tacctccagc agatgcccta cccctgcttc gtggacgatt 2040

ctttcatgat catcctgaac cgctgtttcc ctatcttcat ggtgctggca tggatctact 2100

ctgtctccat gactgtgaag agcatcgtct tggagaagga gttgcgactg aaggagacct 2160

tgaaaaatca gggtgtctcc aatgcagtga tttggtgtac ctggttcctg gacagcttct 2220

ccatcatgtc gatgagcatc ttcctcctga cgatattcat catgcatgga agaatcctac 2280

attacagcga cccattcatc ctcttcctgt tcttgttggc tttctccact gccaccatca 2340

tgctgtgctt tctgctcagc accttcttct ccaaggccag tctggcagca gcctgtagtg 2400

gtgtcatcta tttcaccctc tacctgccac acatcctgtg cttcgcctgg caggaccgca 2460

tgaccgctga gctgaagaag gctgtgagct tactgtctcc ggtggcattt ggatttggca 2520

ctgagtacct ggttcgcttt gaagagcaag gcctggggct gcagtggagc aacatcggga 2580

acagtcccac ggaaggggac gaattcagct tcctgctgtc catgcagatg atgctccttg 2640

atgctgctgt ctatggctta ctcgcttggt accttgatca ggtgtttcca ggagactatg 2700

gaaccccact tccttggtac tttcttctac aagagtcgta ttggcttggc ggtgaagggt 2760

gttcaaccag agaagaaaga gccctggaaa agaccgagcc cctaacagag gaaacggagg 2820

atccagagca cccagaagga atacacgact ccttctttga acgtgagcat ccagggtggg 2880

ttcctggggt atgcgtgaag aatctggtaa agatttttga gccctgtggc cggccagctg 2940

tggaccgtct gaacatcacc ttctacgaga accagatcac cgcattcctg ggccacaatg 3000

gagctgggaa aaccaccacc ttgtccatcc tgacgggtct gttgccacca acctctggga 3060

ctgtgctcgt tgggggaagg gacattgaaa ccagcctgga tgcagtccgg cagagccttg 3120

gcatgtgtcc acagcacaac atcctgttcc accacctcac ggtggctgag cacatgctgt 3180

tctatgccca gctgaaagga aagtcccagg aggaggccca gctggagatg gaagccatgt 3240

tggaggacac aggcctccac cacaagcgga atgaagaggc tcaggaccta tcaggtggca 3300

tgcagagaaa gctgtcggtt gccattgcct ttgtgggaga tgccaaggtg gtgattctgg 3360

acgaacccac ctctggggtg gacccttact cgagacgctc aatctgggat ctgctcctga 3420

agtatcgctc aggcagaacc atcatcatgt ccactcacca catggacgag gccgacctcc 3480

ttggggaccg cattgccatc attgcccagg gaaggctcta ctgctcaggc accccactct 3540

tcctgaagaa ctgctttggc acaggcttgt acttaacctt ggtgcgcaag atgaaaaaca 3600

tccagagcca aaggaaaggc agtgagggga cctgcagctg ctcgtctaag ggtttctcca 3660

ccacgtgtcc agcccacgtc gatgacctaa ctccagaaca agtcctggat ggggatgtaa 3720

atgagctgat ggatgtagtt ctccaccatg ttccagaggc aaagctggtg gagtgcattg 3780

gtcaagaact tatcttcctt cttccaaata agaacttcaa gcacagagca tatgccagcc 3840

ttttcagaga gctggaggag acgctggctg accttggtct cagcagtttt ggaatttctg 3900

acactcccct ggaagagatt tttctgaagg tcacggagga ttctgattca ggacctctgt 3960

ttgcgggtgg cgctcagcag aaaagagaaa acgtcaaccc ccgacacccc tgcttgggtc 4020

ccagagagaa ggctggacag acaccccagg actccaatgt ctgctcccca ggggcgccgg 4080

ctgctcaccc agagggccag cctcccccag agccagagtg cccaggcccg cagctcaaca 4140

cggggacaca gctggtcctc cagcatgtgc aggcgctgct ggtcaagaga ttccaacaca 4200

ccatccgcag ccacaaggac ttcctggcgc agatcgtgct cccggctacc tttgtgtttt 4260

tggctctgat gctttctatt gttatccctc cttttggcga ataccccgct ttgacccttc 4320

acccctggat atatgggcag cagtacacct tcttcagcat ggatgaacca ggcagtgagc 4380

agttcacggt acttgcagac gtcctcctga ataagccagg ctttggcaac cgctgcctga 4440

aggaagggtg gcttccggag tacccctgtg gcaactcaac accctggaag actccttctg 4500

tgtccccaaa catcacccag ctgttccaga agcagaaatg gacacaggtc aacccttcac 4560

catcctgcag gtgcagcacc agggagaagc tcaccatgct gccagagtgc cccgagggtg 4620

ccgggggcct cccgcccccc cagagaacac agcgcagcac ggaaattcta caagacctga 4680

cggacaggaa catctccgac ttcttggtaa aaacgtatcc tgctcttata agaagcagct 4740

taaagagcaa attctgggtc aatgaacaga ggtatggagg aatttccatt ggaggaaagc 4800

tcccagtcgt ccccatcacg ggggaagcac ttgttgggtt tttaagcgac cttggccgga 4860

tcatgaatgt gagcgggggc cctatcacta gagaggcctc taaagaaata cctgatttcc 4920

ttaaacatct agaaactgaa gacaacatta aggtgtggtt taataacaaa ggctggcatg 4980

ccctggtcag ctttctcaat gtggcccaca acgccatctt acgggccagc ctgcctaagg 5040

acaggagccc cgaggagtat ggaatcaccg tcattagcca acccctgaac ctgaccaagg 5100

agcagctctc agagattaca gtgctgacca cttcagtgga tgctgtggtt gccatctgcg 5160

tgattttctc catgtccttc gtcccagcca gctttgtcct ttatttgatc caggagcggg 5220

tgaacaaatc caagcacctc cagtttatca gtggagtgag ccccaccacc tactgggtga 5280

ccaacttcct ctgggacatc atgaattatt ccgtgagtgc tgggctggtg gtgggcatct 5340

tcatcgggtt tcagaagaaa gcctacactt ctccagaaaa ccttcctgcc cttgtggcac 5400

tgctcctgct gtatggatgg gcggtcattc ccatgatgta cccagcatcc ttcctgtttg 5460

atgtccccag cacagcctat gtggctttat cttgtgctaa tctgttcatc ggcatcaaca 5520

gcagtgctat taccttcatc ttggaattat ttgagaataa ccggacgctg ctcaggttca 5580

acgccgtgct gaggaagctg ctcattgtct tcccccactt ctgcctgggc cggggcctca 5640

ttgaccttgc actgagccag gctgtgacag atgtctatgc ccggtttggt gaggagcact 5700

ctgcaaatcc gttccactgg gacctgattg ggaagaacct gtttgccatg gtggtggaag 5760

gggtggtgta cttcctcctg accctgctgg tccagcgcca cttcttcctc tcccaatgga 5820

ttgccgagcc cactaaggag cccattgttg atgaagatga tgatgtggct gaagaaagac 5880

aaagaattat tactggtgga aataaaactg acatcttaag gctacatgaa ctaaccaaga 5940

tttatccagg cacctccagc ccagcagtgg acaggctgtg tgtcggagtt cgccctggag 6000

agtgctttgg cctcctggga gtgaatggtg ccggcaaaac aaccacattc aagatgctca 6060

ctggggacac cacagtgacc tcaggggatg ccaccgtagc aggcaagagt attttaacca 6120

atatttctga agtccatcaa aatatgggct actgtcctca gtttgatgca attgatgagc 6180

tgctcacagg acgagaacat ctttaccttt atgcccggct tcgaggtgta ccagcagaag 6240

aaatcgaaaa ggttgcaaac tggagtatta agagcctggg cctgactgtc tacgccgact 6300

gcctggctgg cacgtacagt gggggcaaca agcggaaact ctccacagcc atcgcactca 6360

ttggctgccc accgctggtg ctgctggatg agcccaccac agggatggac ccccaggcac 6420

gccgcatgct gtggaacgtc atcgtgagca tcatcagaga agggagggct gtggtcctca 6480

catcccacag catggaagaa tgtgaggcac tgtgtacccg gctggccatc atggtaaagg 6540

gcgcctttcg atgtatgggc accattcagc atctcaagtc caaatttgga gatggctata 6600

tcgtcacaat gaagatcaaa tccccgaagg acgacctgct tcctgacctg aaccctgtgg 6660

agcagttctt ccaggggaac ttcccaggca gtgtgcagag ggagaggcac tacaacatgc 6720

tccagttcca ggtctcctcc tcctccctgg cgaggatctt ccagctcctc ctctcccaca 6780

aggacagcct gctcatcgag gagtactcag tcacacagac cacactggac caggtgtttg 6840

taaattttgc taaacagcag actgaaagtc atgacctccc tctgcaccct cgagctgctg 6900

gagccagtcg acaagcccag gactgatctt tcacaccgct cgttcctgca gccagaaagg 6960

aactctgggc agctggaggc gcaggagcct gtgcccatat ggtcatccaa atggactggc 7020

cagcgtaaat gaccccactg cagcagaaaa caaacacacg aggagcatgc agcgaattca 7080

gaaagaggtc tttcagaagg aaaccgaaac tgacttgctc acctggaaca cctgatggtg 7140

aaaccaaaca aatacaaaat ccttctccag accccagaac tagaaacccc gggccatccc 7200

actagcagct ttggcctcca tattgctctc atttcaagca gatctgcttt tctgcatgtt 7260

tgtctgtgtg tctgcgttgt gtgtgatttt catggaaaaa taaaatgcaa atgcactcat 7320

cacaaa 7326

<210> 2

<211> 7326

<212> ДНК

<213> Homo sapiens

<400> 2